JP2023145655A - ブロックベース予測 - Google Patents

ブロックベース予測 Download PDF

Info

Publication number
JP2023145655A
JP2023145655A JP2023125709A JP2023125709A JP2023145655A JP 2023145655 A JP2023145655 A JP 2023145655A JP 2023125709 A JP2023125709 A JP 2023125709A JP 2023125709 A JP2023125709 A JP 2023125709A JP 2023145655 A JP2023145655 A JP 2023145655A
Authority
JP
Japan
Prior art keywords
prediction
vector
matrix
predetermined
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023125709A
Other languages
English (en)
Inventor
ファフ・ヨナサン
Pfaff Jonathan
ヒンツ・トビアス
Hinz Tobias
ヘレ・フィリップ
Helle Philipp
マークル・フィリップ
Merkle Philipp
スタレンバーガー・ビョルン
Stallenberger Bjoern
シェーファー・ミヒャエル
Schaefer Michael
ブロス・ベンジャミン
Bross Benjamin
ヴィンケン・マーティン
Winken Martin
シークマン・ミシャ
Siekmann Mischa
シュヴァルツ・ハイコー
Schwarz Heiko
マルペ・デトレフ
Marpe Detlev
ヴィーガンド・トーマス
Wiegand Thomas
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of JP2023145655A publication Critical patent/JP2023145655A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • G06F17/156Correlation function computation including computation of convolution operations using a domain transform, e.g. Fourier transform, polynomial transform, number theoretic transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/483Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Nonlinear Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Error Detection And Correction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】予測ベクトルを決定するための有利な方法及び装置を提供する。【解決手段】複数の参照サンプル171、172を使用してピクチャ10の所定のブロック18を予測する装置1000であって、複数の参照サンプルからサンプル値ベクトル400を形成100し、サンプル値ベクトル400から、所定の可逆線形変換403によってサンプル値ベクトル400がマッピングされるさらなるベクトル402を導出し、予測ベクトル406を取得するために、さらなるベクトル402と所定の予測行列405との間の行列ベクトル積404を計算し、予測ベクトル406に基づいて所定のブロック18のサンプルを予測する。【選択図】図8

Description

本出願は、ブロックベース予測の分野に関する。実施形態は、予測ベクトルを決定するための有利な方法に関する。
今日、異なるブロックベースのイントラ予測モードおよびインター予測モードが存在する。予測対象ブロックに隣接するサンプルまたは他のピクチャから取得されたサンプルは、予測対象ブロックの予測信号を決定するために行列乗算を行うことができるサンプルベクトルを形成することができる。
行列乗算は、好ましくは整数演算で実行されるべきであり、何らかの機械学習ベースの訓練アルゴリズムによって導出された行列が行列乗算に使用されるべきである。
しかしながら、そのような訓練アルゴリズムは、通常、浮動小数点精度で与えられる行列のみをもたらす。したがって、これらの整数演算を使用して行列乗算が十分に近似されるように整数演算を指定すること、および/または計算効率の改善を達成すること、および/または実装に関して予測をより効果的にすることが課題に直面している。
これは、本出願の独立請求項の主題によって達成される。
本発明にかかるさらなる実施形態は、本出願の従属請求項の主題によって定義される。
本発明の第1の態様によれば、本出願の発明者らは、符号化器または復号器によって予測ベクトルを決定しようとするときに遭遇する1つの問題が、所定のブロックの予測ベクトルを計算するために整数演算を使用しない可能性であることを認識した。本出願の第1の態様によれば、この困難さは、サンプル値ベクトルが予測ベクトルを計算する行列ベクトル積に直接適用されないように、サンプル値ベクトルから、サンプル値ベクトルが所定の可逆線形変換によってマッピングされるさらなるベクトルを導出することによって解消される。代わりに、予測ベクトルを計算するために、さらなるベクトルと所定の予測行列との間で行列ベクトル積が計算される。さらなるベクトルは、例えば、整数演算および/または固定小数点演算を使用する装置によって所定のブロックのサンプルが予測されることができるように導出される。これは、サンプル値ベクトルの成分が相関しており、それによって、例えば、整数行列および/または固定点値を有する行列および/または予測量子化誤差が小さい行列を所定の予測行列として使用することを可能にする主に小さいエントリを有するさらなるベクトルを取得するために、有利な所定の可逆線形変換が使用されることができるという考えに基づく。
したがって、本出願の第1の態様によれば、複数の参照サンプルを使用してピクチャの所定のブロックを予測するための装置は、複数の参照サンプルからサンプル値ベクトルを形成するように構成される。参照サンプルは、例えば、イントラ予測における所定のブロックに隣接するサンプル、または、インター予測における別のピクチャのサンプルである。実施形態によれば、例えば、縮小された数の値を有するサンプル値ベクトルを取得するために平均化することによって、参照サンプルが縮小されることができる。さらにまた、装置は、サンプル値ベクトルから、サンプル値ベクトルが所定の可逆線形変換によってマッピングされるさらなるベクトルを導出し、予測ベクトルを取得するために、さらなるベクトルと所定の予測行列との間の行列ベクトル積を計算し、予測ベクトルに基づいて所定のブロックのサンプルを予測するように構成される。さらなるベクトルに基づいて、所定のブロックのサンプルの予測は、所定のブロックの予測サンプルを取得するために、サンプル値ベクトルと行列との間の直接行列ベクトル積の整数近似を表すことができる。
サンプル値ベクトルと行列との間の直接行列ベクトル積は、さらなるベクトルと第2の行列との間の第2の行列ベクトル積に等しくすることができる。第2の行列および/または行列は、例えば、機械学習予測行列である。実施形態によれば、第2の行列は、所定の予測行列および整数行列に基づくことができる。第2の行列は、例えば、所定の予測行列と整数行列との和に等しい。換言すれば、さらなるベクトルと第2の行列との間の第2の行列ベクトル積は、さらなるベクトルと所定の予測行列との間の行列ベクトル積、および整数行列とさらなるベクトルとの間のさらなる行列ベクトル積によって表されることができる。整数行列は、例えば、所定の列iが1からなり、列i≠iが0の行列である。したがって、第1および/または第2の行列ベクトル積の良好な整数近似および/または良好な固定小数点値近似が装置によって達成されることができる。これは、さらなるベクトルが主に小さな値を含み、第1および/または第2の行列ベクトル積の近似における可能な量子化誤差の僅かな影響をもたらすため、所定の予測行列が量子化されることができる、または既に量子化された行列であるという考えに基づく。
実施形態によれば、所定の予測ベクトルと整数行列との和を乗算する可逆線形変換は、機械学習予測行列の量子化バージョンに対応することができる。整数行列は、例えば、所定の列iが1からなり、列i≠iが0の行列である。
実施形態によれば、可逆線形変換は、さらなるベクトルの所定の成分がaになり、所定の成分を除くさらなるベクトルの他の成分のそれぞれが、サンプル値ベクトルの対応する成分からaを引いたものに等しくなるように定義され、aは所定値である。したがって、小さな値のさらなるベクトルが実現されることができ、所定の予測行列の量子化を可能にし、その結果、所定のブロックの予測サンプルにおける量子化誤差の僅かな影響をもたらす。このさらなるベクトルにより、整数演算および/または固定小数点演算によって所定のブロックのサンプルを予測することが可能である。
実施形態によれば、所定値は、サンプル値ベクトルの成分の算術平均または加重平均などの平均、デフォルト値、ピクチャが符号化されるデータストリーム内でシグナリングされる値、および所定の成分に対応するサンプル値ベクトルの成分のうちの1つである。サンプル値ベクトルは、例えば、複数の参照サンプルによって、または複数の参照サンプルのうちの参照サンプルのグループの平均によって構成される。参照サンプルのグループは、例えば、少なくとも2つの参照サンプル、好ましくは隣接する参照サンプルを含む。
所定値は、例えば、サンプル値ベクトルの一部の成分(例えば、少なくとも2つの構成要素の)またはサンプル値ベクトルの全ての成分の算術平均または加重平均である。これは、サンプル値ベクトルの成分が相関しており、すなわち、成分の値が類似していてもよく、および/または成分の少なくともいくつかが等しい値を有してもよく、それによって、さらなるベクトルの成分がさらなるベクトルの所定の成分に等しくなく、すなわち、i≠iの成分i(iは所定の成分を表す)が、おそらくサンプル値ベクトルの対応する成分よりも小さい絶対値を有するという考えに基づく。したがって、小さな値のさらなるベクトルが実現されることができる。
所定値は、デフォルト値とすることができ、デフォルト値は、例えば、デフォルト値のリストから選択されるか、または全てのブロックサイズ、予測モードなどについて同じである。デフォルト値のリストの成分は、異なるブロックサイズ、予測モード、サンプル値ベクトルサイズ、サンプル値ベクトルの値の平均などに関連付けられることができる。したがって、例えば、所定のブロックに応じて、すなわち所定のブロックに関連付けられた復号または符号化設定に応じて、最適化されたデフォルト値が装置によってデフォルト値のリストから選択される。
あるいは、所定値は、ピクチャが符号化されるデータストリーム内でシグナリングされる値とすることができる。この場合、例えば、符号化装置は所定値を決定する。所定値の決定は、デフォルト値の文脈において上述したのと同じ検討に基づくことができる。
さらなるベクトルの成分は、さらなるベクトルの所定の成分に等しくなく、すなわち、i≠iの成分i(iは所定の成分を表す)は、例えば、デフォルト値またはデータストリーム内でシグナリングされる値を所定値として使用して、サンプル値ベクトルの対応する成分よりも小さい絶対値を有する。
実施形態によれば、所定値は、所定成分に対応するサンプル値ベクトルの成分とすることができる。換言すれば、所定の成分に対応するサンプル値ベクトルの成分の値は、可逆線形変換を適用することによっても変化しない。したがって、所定の成分に対応するサンプル値ベクトルの成分の値は、例えば、さらなるベクトルの所定の成分の値に等しい。
所定の成分は、例えば、デフォルト値として所定値に関して上述したように、デフォルトで選択される。所定の成分が代替手順によって選択されることができることは明らかである。所定の成分は、例えば、所定値と同様に選択される。実施形態によれば、所定の成分は、サンプル値ベクトルの対応する成分の値がサンプル値ベクトルの値の平均に等しいか、またはサンプル値ベクトルの値の平均からの周縁偏差のみを有するように選択される。
実施形態によれば、さらなるベクトルの所定の成分に対応する所定の予測行列の列内の所定の予測行列の行列成分は全て0である。装置は、列、すなわちゼロからなる列を残すことによって所定の予測行列から生じる縮小された予測行列と、所定の成分を残すことによってさらなるベクトルから生じるさらにさらなるベクトルとの間の行列ベクトル積を計算することによって乗算を実行することによって、行列ベクトル積、すなわち、さらなるベクトルと所定の予測行列との間の行列ベクトル積を計算するように構成される。これは、さらなるベクトルの所定の成分が所定値に設定され、サンプル値ベクトルの値が相関する場合、この所定値が所定のブロックの予測信号内のサンプル値に正確にまたは近いという考えに基づく。したがって、所定のブロックのサンプルの予測は、任意選択的に、さらなるベクトルを乗算した所定の予測行列、またはむしろさらにさらなるベクトルを乗算した縮小予測行列、および整数行列に基づいており、その列iは、所定の成分に対応し、その他の列i≠iの全てが0であるものからなり、さらなるベクトルを乗算したものである。換言すれば、例えば所定の可逆線形変換の逆変換によって変換された機械学習予測行列は、さらなるベクトルに基づいて所定の予測行列、またはむしろ縮小予測行列と整数行列に分割されることができる。したがって、予測行列のみが量子化されて、機械学習予測行列および/または変換された機械学習予測行列の整数近似を取得するべきであり、これは、さらに他のベクトルが所定の成分を含まず、他の全ての成分が、機械学習予測行列および/または変換された機械学習予測行列の結果として得られる量子化における量子化誤差の僅かな影響を可能にするサンプル値ベクトルの対応する成分よりもはるかに小さい絶対値を有するために有利である。さらにまた、縮小予測行列およびさらなるベクトルを用いて、予測ベクトルを取得するために実行されるべき乗算が少なくなり、複雑さを低減し、より高い計算効率をもたらす。任意選択的に、所定のブロックのサンプルの予測時に、全ての成分が所定値aであるベクトルが予測ベクトルに追加されることができる。このベクトルは、上述したように、整数行列とさらなる行列との間の行列-ベクトル積によって取得されることができる。
実施形態によれば、さらなるベクトルの所定の成分に対応する所定の予測行列の列内の所定の予測行列の各行列成分を所定の可逆線形変換の1倍で合計することから生じる行列は、機械学習予測行列の量子化バージョンに対応する。さらなるベクトルの所定の成分に対応する所定の予測行列の列内の所定の予測行列の各行列成分を1と合計することは、例えば、変換された機械学習予測行列を表す。変換された機械学習予測行列とは、例えば、所定の可逆線形変換の逆変換によって変換された機械学習予測行列を表す。合計は、整数行列との所定の予測行列の合計に対応することができ、その列が所定の成分に対応するその列iは1からなり、その他の列i≠iの全ては0である。
実施形態によれば、装置は、予測パラメータを使用して所定の予測行列を表し、さらなるベクトルの成分ならびに予測パラメータおよびそれから生じる中間結果に対して乗算および加算を実行することによって行列ベクトル積を計算するように構成される。予測パラメータの絶対値は、nビットの固定小数点数表現によって表すことができ、nは14以下、あるいは10以下、あるいは8以下である。換言すれば、予測パラメータは、さらなるベクトル、所定の予測行列および/または予測ベクトルなどの行列ベクトル積の要素に乗算および/または加算される。乗算および加算演算により、例えば所定の予測行列、予測ベクトル、および/または所定のブロックの予測サンプルの固定小数点フォーマットが取得されることができる。
本発明にかかる実施形態は、予測信号を取得するために、本明細書に記載の実施形態のいずれかにかかる複数の参照サンプルを使用してピクチャの所定のブロックを予測するための装置を備える、ピクチャを符号化するための装置に関する。さらにまた、装置は、予測信号を補正するために所定のブロックの予測残差を符号化するように構成されたエントロピー符号化器を備える。予測信号を取得するための所定のブロックの予測のために、装置は、例えば、複数の参照サンプルからサンプル値ベクトルを形成し、サンプル値ベクトルから、サンプル値ベクトルが所定の可逆線形変換によってマッピングされるさらなるベクトルを導出し、予測ベクトルを取得するために、さらなるベクトルと所定の予測行列との間の行列ベクトル積を計算し、予測ベクトルに基づいて所定のブロックのサンプルを予測するように構成される。
本発明にかかる実施形態は、予測信号を取得するために、本明細書に記載の実施形態のいずれかにかかる複数の参照サンプルを使用してピクチャの所定のブロックを予測するための装置を備える、ピクチャを復号するための装置に関する。さらにまた、装置は、所定のブロックの予測残差を復号するように構成されたエントロピー復号器と、予測残差を使用して予測信号を補正するように構成された予測補正器とを備える。予測信号を取得するための所定のブロックの予測のために、装置は、例えば、複数の参照サンプルからサンプル値ベクトルを形成し、サンプル値ベクトルから、サンプル値ベクトルが所定の可逆線形変換によってマッピングされるさらなるベクトルを導出し、予測ベクトルを取得するために、さらなるベクトルと所定の予測行列との間の行列ベクトル積を計算し、予測ベクトルに基づいて所定のブロックのサンプルを予測するように構成される。
本発明にかかる実施形態は、複数の参照サンプルを使用してピクチャの所定のブロックを予測するための方法であって、複数の参照サンプルからサンプル値ベクトルを形成することと、サンプル値ベクトルから、サンプル値ベクトルが所定の可逆線形変換によってマッピングされるさらなるベクトルを導出することと、予測ベクトルを取得するために、さらなるベクトルと所定の予測行列との間の行列ベクトル積を計算することと、予測ベクトルに基づいて所定のブロックのサンプルを予測することと、を含む、方法に関する。
本発明にかかる実施形態は、ピクチャを符号化するための方法であって、予測信号を得るために、上述した方法にしたがって複数の参照サンプルを使用してピクチャの所定のブロックを予測することと、予測信号を補正するために所定のブロックの予測残差をエントロピー符号化することと、を含む、方法に関する。
本発明にかかる実施形態は、ピクチャを復号するための方法であって、予測信号を得るために、上述の方法の1つにしたがって複数の参照サンプルを使用してピクチャの所定のブロックを予測することと、所定のブロックの予測残差をエントロピー復号することと、予測残差を使用して予測信号を補正することと、を含む、方法に関する。
本発明にかかる実施形態は、ピクチャを符号化するための本明細書に記載の方法を使用して符号化されたピクチャを有するデータストリームに関する。
本発明にかかる実施形態は、コンピュータ上で実行されると、本明細書に記載の実施形態のいずれかの方法を実行するためのプログラムコードを有するコンピュータプログラムに関する。
図面は、必ずしも縮尺通りではなく、代わりに一般に本発明の原理を説明することに重点が置かれている。以下の説明では、本発明の様々な実施形態が、以下の図面を参照して説明される。
データストリームへの符号化の実施形態を示している。 符号化器の実施形態を示している。 ピクチャの再構成の実施形態を示している。 復号器の実施形態を示している。 実施形態にかかる、符号化および/または復号のためのブロックの予測の概略図を示している。 実施形態にかかる、符号化および/または復号のためのブロックの予測のための行列演算を示している。 実施形態にかかる、縮小されたサンプル値ベクトルを有するブロックの予測を示している。 実施形態にかかる、サンプルの補間を使用したブロックの予測を示している。 実施形態にかかる、いくつかの境界サンプルのみが平均化される、サンプル値ベクトルが縮小されたブロックの予測を示している。 実施形態にかかる、4つの境界サンプルのグループが平均化される、縮小されたサンプル値ベクトルを有するブロックの予測を示している。 実施形態にかかるブロックを予測するための装置の概略図を示している。 実施形態にかかる装置によって実行される行列演算を示している。 実施形態にかかる装置によって実行される詳細な行列演算を示している。 実施形態にかかる装置によって実行される詳細な行列演算を示している。 実施形態にかかる、オフセットおよびスケーリングパラメータを使用して装置によって実行される詳細な行列演算を示している。 異なる実施形態にかかる、オフセットおよびスケーリングパラメータを使用して装置によって実行される詳細な行列演算を示している。 実施形態にかかる、所定のブロックを予測するための方法のブロック図を示している。
等しいまたは同等の要素または等しいまたは同等の機能を有する要素は、異なる図で発生する場合であっても、等しいまたは同等の参照符号によって以下の説明で示されている。
以下の説明では、本発明の実施形態のより完全な説明を提供するために、複数の詳細が示されている。しかしながら、本発明の実施形態がこれらの特定の詳細なしで実施されることができることは当業者にとって明らかであろう。他の例では、本発明の実施形態を曖昧にすることを回避するために、周知の構造および装置が詳細ではなくブロック図の形態で示されている。さらに、以下に説明する異なる実施形態の特徴は、特に明記しない限り、互いに組み合わせられることができる。
1 序論
以下では、異なる本発明の例、実施形態および態様を説明する。これらの例、実施形態、および態様の少なくともいくつかは、とりわけ、ビデオコーディングのための、および/または例えば隣接するサンプル縮小を伴う線形もしくはアフィン変換を使用してブロックベースの予測を実行するための、および/または例えばビデオアプリケーションおよび/または仮想現実アプリケーションのためのビデオ配信(例えば、放送、ストリーミング、ファイル再生など)を最適化するための方法および/または装置を指す。
さらに、例、実施形態、および態様は、高効率ビデオコーディング(HEVC)または後継を指すことができる。また、さらなる実施形態、例および態様は、添付の特許請求の範囲によって定義される。
特許請求の範囲によって定義される任意の実施形態、例および態様は、以下の章に記載される詳細(特徴および機能)のいずれかによって補足されることができることに留意されたい。
また、以下の章に記載される実施形態、例、および態様は、個別に使用されることができ、別の章の特徴のいずれか、または特許請求の範囲に含まれる任意の特徴によって補足されることもできる。
また、本明細書に記載の個々の例、実施形態および態様は、個別にまたは組み合わせて使用されることができることに留意されたい。したがって、詳細は、前記例、実施形態および態様のうちの別の1つに詳細を追加することなく、前記個々の態様のそれぞれに追加されることができる。
本開示は、復号および/または符号化システムおよび/または方法の特徴を明示的または暗黙的に説明することにも留意されたい。
さらに、方法に関連して本明細書に開示された特徴および機能は、装置において使用されることもできる。さらにまた、装置に関して本明細書に開示された任意の特徴および機能はまた、対応する方法において使用されることもできる。換言すれば、本明細書に開示された方法は、装置に関して説明された特徴および機能のいずれかによって補足されることができる。
また、本明細書に記載されている特徴および機能のいずれも、「実装代替」のセクションで説明するように、ハードウェアもしくはソフトウェアで、またはハードウェアとソフトウェアの組み合わせを使用して実装されることができる。
さらに、括弧内に記載された特徴のいずれか(「(...)」または「[...]」)は、いくつかの例、実施形態、または態様では任意選択的であるとして見なされることができる。
2 符号化器、復号器
以下では、ブロックベースの予測を使用するときに、より効果的な圧縮を実現するのに役立つことができる様々な例について説明する。いくつかの例は、イントラ予測モードのセットを費やすことによって高い圧縮効率を達成する。後者は、例えばヒューリスティックに設計された他のイントラ予測モードに追加されることも、排他的に提供されることもできる。そして、他の例でさえも、ここで記載される専門分野の双方を利用する。しかしながら、これらの実施形態の振動として、イントラ予測は、代わりに別のピクチャ内の参照サンプルを使用することによってインター予測に変換されることができる。
本出願の以下の例の理解を容易にするために、説明は、本出願のその後に概説される例が構築されることができる、それに適合する可能な符号化器および復号器の提示から始まる。図1は、ピクチャ10をデータストリーム12にブロック単位で符号化するための装置を示している。装置は、参照符号14を使用して示され、静止ピクチャ符号化器またはビデオ符号化器とすることができる。換言すれば、ピクチャ10は、ピクチャ10を含むビデオ16をデータストリーム12に符号化するように符号化器14が構成されている場合、または符号化器14がピクチャ10をデータストリーム12に排他的に符号化することができる場合、ビデオ16からの現在のピクチャとすることができる。
前述のように、符号化器14は、ブロック単位の方法またはブロックベースで符号化を実行する。このため、符号化器14は、ピクチャ10をブロックに細分割し、その符号化器14のユニットは、ピクチャ10をデータストリーム12に符号化する。ピクチャ10のブロック18への可能な細分割の例は、以下により詳細に示されている。一般に、細分割は、行および列に配置されたブロックのアレイなどの一定サイズのブロック18に、またはピクチャ10のピクチャ領域全体からまたはピクチャ10の事前パーティションからツリーブロックのアレイへのマルチツリー再分割を開始する階層的マルチツリー細分割の使用などによる異なるブロックサイズのブロック18に終わる可能性があり、これらの例は、ピクチャ10をブロック18に細分割する他の可能な方法を除外するものとして扱われてはならない。
さらに、符号化器14は、ピクチャ10をデータストリーム12に予測的に符号化するように構成された予測符号化器である。特定のブロック18について、これは、符号化器14がブロック18の予測信号を判定し、予測残差、すなわち、予測信号がブロック18内の実際のピクチャコンテンツから逸脱する予測誤差をデータストリーム12に符号化することを意味する。
符号化器14は、特定のブロック18の予測信号を導出するために、異なる予測モードをサポートすることができる。以下の例で重要である予測モードは、ブロック18の内部が、隣接する、既に符号化されたピクチャ10のサンプルから空間的に予測されるイントラ予測モードである。ピクチャ10のデータストリーム12への符号化、したがって対応する復号手順は、ブロック18の間で定義された特定の符号化順序20に基づくことができる。例えば、符号化順序20は、各行を左から右にトラバースしながら、上から下に行単位などのラスタ走査順序でブロック18をトラバースすることができる。階層的マルチツリーベースの細分割の場合、ラスタ走査の順序は、各階層レベル内で適用されることができ、深さ優先のトラバーサル順序が適用されることができる。すなわち、特定の階層レベルのブロック内のリーフノードは、符号化順序20にしたがって同じ親ブロックを有する同じ階層レベルのブロックに先行することができる。符号化順序20に応じて、ブロック18の隣接する、既に符号化されたサンプルは、通常、ブロック18の1つ以上の側に配置されることができる。本明細書に提示された例の場合、例えば、ブロック18の隣接する、既に符号化されたサンプルは、ブロック18の上部および左側に配置されている。
符号化器14によってサポートされるのは、イントラ予測モードだけでなくてもよい。例えば、符号化器14がビデオ符号化器である場合、符号化器14はまた、ブロック18が以前に符号化されたビデオ16のピクチャから一時的に予測されるインター予測モードをサポートすることができる。そのようなインター予測モードは、ブロック18の予測信号がコピーとして導出される部分の相対的な空間オフセットを示す、そのようなブロック18に対して動きベクトルがシグナリングされる動き補償予測モードとすることができる。追加的または代替的に、符号化器14がマルチビュー符号化器である場合のインター予測モード、またはブロック18の内部が現状のまま、すなわち予測なしで符号化される非予測モードなど、他の非イントラ予測モードも利用可能とすることができる。
本出願の説明をイントラ予測モードに焦点を当てることから始める前に、可能なブロックベースの符号化器のより具体的な例、すなわち、図2に関して説明した、次にそれぞれ図1および図2に適合する復号器の2つの対応する例を提示するような符号化器14の可能な実装について説明する。
図2は、図1の符号化器14の可能な実装、すなわち、符号化器が予測残差を符号化するために変換符号化を使用するように構成されるものを示しているが、これはほぼ例であり、本出願は、その種の予測残差符号化に限定されるものではない。図2によれば、符号化器14は、インバウンド信号、すなわちピクチャ10、またはブロックベースで現在のブロック18から対応する予測信号24を減算して、後に予測残差符号化器28によってデータストリーム12に符号化される予測残差信号26を取得するように構成された減算器22を備える。予測残差符号化器28は、不可逆符号化ステージ28aおよび可逆符号化ステージ28bから構成される。不可逆ステージ28aは、予測残差信号26を受信し、予測残差信号26のサンプルを量子化する量子化器30を備える。既に上述したように、本例は、予測残差信号26の変換符号化を使用し、したがって、不可逆符号化ステージ28aは、残差信号26を提示する変換された係数で行われる量子化器30の量子化によってスペクトル分解されたそのような予測残差26を変換するように、減算器22と量子化器30との間に接続された変換ステージ32を備える。変換は、DCT、DST、FFT、アダマール変換などとすることができる。次に、変換および量子化された予測残差信号34は、量子化予測残差信号34をデータストリーム12にエントロピー符号化するエントロピーコーダである可逆符号化ステージ28bによる可逆符号化を受ける。符号化器14は、変換および量子化された予測残差信号34から、復号器でも利用可能な方法で予測残差信号を再構成するように、量子化器30の出力に接続された予測残差信号再構成ステージ36をさらに備える。すなわち、符号化損失を考慮するのは量子化器30である。この目的のために、予測残差再構成ステージ36は、量子化器30の量子化の逆を実行する逆量子化器38と、それに続く、上述した特定の変換例のいずれかの逆などのスペクトル分解の逆などの変換器32によって実行される変換に対して逆変換を実行する逆変換器40とを備える。符号化器14は、再構成された信号、すなわち再構成されたサンプルを出力するために、逆変換器40によって出力される再構成された予測残差信号と予測信号24とを加算する加算器42を備える。この出力は、符号化器14の予測器44に供給され、予測器44は、それに基づいて予測信号24を判定する。図1に関して既に上述した全ての予測モードをサポートするのは予測器44である。図2はまた、符号化器14がビデオ符号化器である場合、符号化器14はまた、フィルタリングされた後、相互予測ブロックに関して予測器44の参照ピクチャを形成する完全に再構成されたピクチャをフィルタするインループフィルタ46を備えることができることを示している。
既に上述したように、符号化器14は、ブロックベースで動作する。以降の説明では、対象のブロックベースは、ピクチャ10をブロックに細分割したものであり、そのブロックに対して、予測器44または符号化器14によってそれぞれサポートされるセットまたは複数のイントラ予測モードからイントラ予測モードが選択され、選択されたイントラ予測モードは個別に実行される。しかしながら、ピクチャ10が細分割されている他の種類のブロックも同様に存在することがある。例えば、ピクチャ10がインターコード化されているかイントラコード化されているかに関する上記の判定は、粒度で、またはブロック18から逸脱したブロックの単位で行うことができる。例えば、インターモード/イントラモード決定は、ピクチャ10が細分割され、各符号化ブロックが予測ブロックに細分割される符号化ブロックのレベルで実行されることができる。イントラ予測が使用されることが決定された符号化ブロックを有する予測ブロックは、それぞれ、イントラ予測モード決定に細分割される。このため、これらの予測ブロックのそれぞれについて、サポートされているどのイントラ予測モードがそれぞれの予測ブロックに使用されるべきかが決定される。これらの予測ブロックは、ここで関心のあるブロック18を形成する。相互予測に関連する符号化ブロック内の予測ブロックは、予測器44によって異なって扱われるであろう。それらは、動きベクトルを判定し、動きベクトルによって指し示される参照ピクチャ内の位置からこのブロックの予測信号をコピーすることによって、参照ピクチャから相互予測されるであろう。別のブロック細分割は、変換器32および逆変換器40による変換が実行されるユニットでの変換ブロックへの細分割に関係する。変換されたブロックは、例えば、符号化ブロックをさらに再分割した結果とすることができる。当然のことながら、ここに記載されている例は、限定的なものとして扱われるべきではなく、他の例も存在する。完全を期すためだけに、符号化ブロックへの細分割は、例えば、マルチツリー細分割を使用することができ、同様に、予測ブロックおよび/または変換ブロックは、マルチツリー細分割を使用して符号化ブロックをさらに細分割することによって取得されることができることに留意されたい。
図1の符号化器14に適合するブロック単位復号のための復号器54または装置が図3に示されている。この復号器54は、符号化器14とは逆のことを行う。すなわち、データストリーム12からピクチャ10をブロック単位で復号し、この目的のために、複数のイントラ予測モードをサポートする。復号器54は、例えば、残差プロバイダ156を備えることができる。図1に関して上述した他の全ての可能性は、復号器54にも有効である。このため、復号器54は、静止ピクチャ復号器またはビデオ復号器とすることができ、全ての予測モードおよび予測可能性は、復号器54によってもサポートされる。符号化器14と復号器54との相違点は、主に、符号化器14が、例えば、符号化速度および/または符号化歪みに依存することができるいくつかのコスト関数を最小化するためなど、何らかの最適化にしたがって符号化決定を選択または選定するという事実にある。これらの符号化オプションまたは符号化パラメータの1つは、利用可能なまたはサポートされているイントラ予測モードの中からの、現在のブロック18に使用されるイントラ予測モードの選択を含むことができる。次に、選択されたイントラ予測モードは、データストリーム12内の現在のブロック18の符号化器14によってシグナリングされ、復号器54は、ブロック18のデータストリーム12のこのシグナリングを使用して選択をやり直す。同様に、ピクチャ10のブロック18への細分割は、符号化器14内で最適化の対象とすることができ、対応する細分割情報は、データストリーム12内で伝達されることができ、復号器54は、細分割情報に基づいてピクチャ10の細分割をブロック18に回復する。上記を要約すると、復号器54は、ブロックベースで動作する予測復号器とすることができ、イントラ予測モードに加えて、復号器54は、例えば、復号器54がビデオ復号器である場合、相互予測モードなどの他の予測モードをサポートすることができる。復号において、復号器54はまた、図1に関して記載された符号化順序20を使用することができ、この符号化順序20は、符号化器14および復号器54の双方で従われるため、同じ隣接サンプルが、符号化器14および復号器54の双方で現在のブロック18に利用可能である。したがって、不必要な繰り返しを回避するために、符号化器14の動作モードの説明は、例えば、予測に関する限り、および予測残差の符号化が関係する限りなど、ピクチャ10のブロックへの再分割に関する限り、復号器54にも適用されなければならない。相違点は、符号化器14が、最適化によって、いくつかの符号化オプションまたは符号化パラメータおよび信号をデータストリーム12内で選択するか、またはデータストリーム12に挿入するという事実にあり、これらは、再分割など、予測をやり直すために、復号器54によってデータストリーム12から導出される。
図4は、図3の復号器54の可能な実装、すなわち、図2に示されるように、図1の符号化器14の実装に適合するものを示している。図4の符号化器54の多くの要素は、図2の対応する符号化器で発生するものと同じであるため、これらの要素を示すために、アポストロフィを有する同じ参照符号が図4で使用される。特に、加算器42’、オプションのインループフィルタ46’および予測器44’は、それらが図2の符号化器にあるのと同じ方法で予測ループに接続されている。加算器42’に適用される再構成された、すなわち逆量子化および再変換された予測残差信号は、エントロピー符号化器28bのエントロピー符号化を逆にするエントロピー復号器56のシーケンス、続いて符号化側の場合と同じように逆量子化器38’および逆変換器40’から構成される残差信号再構成ステージ36’によって導出される。復号器の出力は、ピクチャ10の再構成である。ピクチャ10の再構成は、加算器42’の出力において直接、あるいは、インループフィルタ46’の出力において利用可能とすることができる。ピクチャ品質を改善するために、ピクチャ10の再構成をいくつかのポストフィルタリングにかけるために、いくつかのポストフィルタが復号器の出力に配置されることができるが、このオプションは図4には示されていない。
繰り返すが、図4に関して、図2に関して上に示した説明は、符号化器が最適化タスクと符号化オプションに関する関連する決定を実行するだけであることを除いて、図4にも有効である。しかしながら、ブロック細分割、予測、逆量子化、および再変換に関する全ての説明は、図4の復号器54についても有効である。
3 ALWIP(アフィン線形加重イントラ予測器)
ALWIPに関するいくつかの非限定的な例は、本明細書で説明される技術を具現化するためにALWIPが必ずしも必要ではない場合であっても、本明細書で説明される。
本出願は、とりわけ、HEVCまたはHEVCの後継などのビデオコーデックで使用可能であるような、ブロック単位のピクチャ符号化のための改良されたブロックベースの予測モードの概念に関する。予測モードは、イントラ予測モードであってもよいが、理論的には、本明細書に記載された概念は、参照サンプルが別のピクチャの一部であるインター予測モードにも変換されることができる。
ハードウェアフレンドリな実装などの効率的な実装を可能にするブロックベースの予測概念が求められている。
この目的は、本出願の独立請求項の主題によって達成される。
イントラ予測モードは、ピクチャおよびビデオの符号化で広く使用されている。ビデオ符号化では、イントラ予測モードは、動き補償予測モードなどの相互予測モードなどの他の予測モードと競合する。イントラ予測モードでは、現在のブロックは、隣接するサンプル、すなわち、符号化器側に関する限り既に符号化され、復号器側に関する限り既に復号されているサンプルに基づいて予測される。隣接するサンプル値が現在のブロックに外挿されて、現在のブロックの予測信号が形成され、予測残差が現在のブロックのデータストリームで送信される。予測信号が優れているほど、予測残差は少なくなり、したがって、予測残差をコード化するために必要なビット数は少なくなる。
効果的であるためには、ブロック単位のピクチャ符号化環境でのイントラ予測のための効果的なフレームワークを形成するために、いくつかの態様が考慮される必要がある。例えば、コーデックでサポートされるイントラ予測モードの数が多いほど、復号器に選択を通知するためのサイド情報レートの消費量が多くなる。一方、サポートされているイントラ予測モードのセットは、良好な予測信号、すなわち、予測残差が低くなる予測信号を提供することができる必要がある。
以下では、比較実施形態または基本例として、データストリームからピクチャをブロック単位で復号するための装置(符号化器または復号器)であって、ピクチャの所定のサイズのブロックに対するイントラ予測信号が、現在のブロックに隣接するサンプルの第1のテンプレートを結局アフィン線形加重予測器(ALWIP)と称されるものとするアフィン線形予測器に適用することによって決定される、少なくとも1つのイントラ予測モードをサポートする装置が開示される。
装置は、以下の特性(同じことが、例えば、プロセッサによって実行されると、プロセッサに、方法を実施させ、および/または装置として動作させる命令を記憶する非一時的記憶ユニットに実装される、方法または別の技術に適用されてもよい)のうちの少なくとも1つを有することができる。
3.1 予測器は、他の予測器と相補的とすることができる。
以下にさらに説明される実施改善の主題を形成することができるイントラ予測モードは、コーデックの他のイントラ予測モードに対して相補的とすることができる。したがって、それらは、HEVCコーデックおよびJEM参照ソフトウェアで定義されたDC予測モード、平面予測モード、または角度予測モードを補完することができる。以降、後者の3種類のイントラ予測モードは、従来のイントラ予測モードと呼ぶものとする。したがって、イントラモードの所与のブロックについて、装置によってサポートされるイントラ予測モードのうちの1つが使用されるべきか否かを示すフラグが復号器によって解析される必要がある。
3.2 2つ以上の提案された予測モード
装置は、2つ以上のALWIPモードを含むことができる。したがって、装置によってサポートされるALWIPモードのうちの1つが使用されるべきであることを復号器が知っている場合、復号器は、装置によってサポートされるALWIPモードのうちのどれが使用されるべきかを示す追加情報を解析する必要がある。
サポートされるモードの信号伝達は、いくつかのALWIPモードの符号化が他のALWIPモードよりも少ないビンを必要とし得るという特性を有することができる。これらのモードのうちのどれがより少ないビンを必要とし、どのモードがより多くのビンを必要とするかは、既に復号されたビットストリームから抽出されることができるか、または事前に固定されることができる情報に依存することができる。
4 いくつかの態様
図2は、データストリーム12からピクチャを復号するための復号器54を示している。復号器54は、ピクチャの所定のブロック18を復号するように構成されることができる。特に、予測器44は、線形またはアフィン線形変換[例えば、ALWIP]を使用して所定のブロック18に隣接するP個の隣接サンプルのセットを所定のブロックのサンプルのQ個の予測値のセットにマッピングするように構成されることができる。
図5に示すように、所定のブロック18は、予測されるQ個の値(これは、演算の終わりに、「予測値」となる)を含む。ブロック18がM行N列を有する場合、Q=M・Nである。ブロック18のQ値は、空間領域(例えば、画素)または変換領域(例えば、DCT、離散ウェーブレット変換など)にあることができる。ブロック18のQ値は、一般にブロック18に隣接する隣接ブロック17a~17cから取得されたP値に基づいて予測されることができる。隣接するブロック17a~17cのP値は、ブロック18に最も近い位置(例えば、隣接する)にあってもよい。隣接ブロック17a~17cのP値は、既に処理および予測されている。P値は、それらをそれらが(いくつかの例では、17’bは使用されない)の一部であるブロックと区別するために、部分17’a~17’cに値として示されている。
図6に示すように、予測を実行するために、P個のエントリを有する第1のベクトル17P(各エントリは、隣接部分17’a~17’cの特定の位置に関連付けられている)、Q個のエントリを有する第2のベクトル18Q(各エントリは、ブロック18の特定の位置に関連付けられている)、およびマッピング行列17M(各行は、ブロック18内の特定の位置に関連付けられ、各列は、隣接部分17’a~17’c内の特定の位置に関連付けられる)で演算することが可能である。したがって、マッピング行列17Mは、所定のモードにしたがって、隣接部分17’a~17’cのP値のブロック18の値への予測を実行する。したがって、マッピング行列17M内のエントリは、重み係数として理解されることができる。以下の記載では、17’a~17’cの代わりに符号17a~17cを使用して境界の隣接部分を参照する。
当該技術分野では、DCモード、平面モード、および65方向予測モードなどのいくつかの従来のモードが知られている。例えば、67個のモードが知られている。
しかしながら、ここでは線形またはアフィン線形変換と呼ばれる異なるモードを利用することも可能であることに留意されたい。線形またはアフィン線形変換は、P・Q個の重み係数を含み、そのうち少なくとも1/4P・Q個の重み係数は、非ゼロの重み値であり、Q個の予測値のそれぞれについて、それぞれの予測値に関する一連のP個の重み係数を含む。系列は、所定のブロックのサンプル間でラスタ走査順序にしたがって上下に配置されると、全方向的に非線形である包絡線を形成する。
隣接する値17’a~17’c(テンプレート)のP個の位置、隣接するサンプル17’a~17’cのQ個の位置、および行列17MのP*Q個の重み係数の値をマッピングすることが可能である。平面は、DC変換のための系列の包絡線の例である(DC変換のための平面である)。包絡線は、明らかに平面であり、したがって、線形またはアフィン線形変換(ALWIP)の定義によって除外される。別の例は、以下の角度モードのエミュレーションをもたらす行列である:包絡線は、ALWIP定義から除外され、平たく言えば、P/Q平面内の方向に沿って上から下に斜めに進む丘のように見える。平面モードおよび65方向予測モードは異なる包絡線を有するが、これは、少なくとも一方向、すなわち、例えば例示されたDCの全ての方向、および例えば角度モードの丘方向において線形である。
逆に、線形またはアフィン変換の包絡線は、全方向的に線形ではない。そのような種類の変換は、状況によっては、ブロック18の予測を実行するために最適とすることができることが理解されている。重み係数の少なくとも1/4が0とは異なる(すなわち、P*Q重み係数の少なくとも25%が0とは異なる)ことが好ましいことに留意されたい。
重み係数は、任意の規則的なマッピング規則にしたがって互いに無関係であってもよい。したがって、行列17Mは、そのエントリの値が明らかな認識可能な関係を有しないようなものであってもよい。例えば、重み係数は、いかなる解析関数または微分関数によっても記述されることができない。
例では、ALWIP変換は、それぞれの予測値に関連する第1の系列の重み係数と、それぞれの予測値以外の予測値に関連する第2の系列の重み係数との間の相互相関の最大値の平均、または後者の系列の反転されたバージョンが、より高い最大値につながるにもかかわらず、所定の閾値(例えば、0.2または0.3または0.35または0.1、例えば、0.05と0.035との間の範囲内の閾値)よりも低くてもよいようなものである。例えば、ALWIP行列17Mの行の結合(i,i)毎に、i行目のP値にi行目のP値を乗算することによって相互相関が算出されることができる。得られた各相互相関について、最大値が取得されることができる。したがって、行列17Mの全体について平均(平均)が取得されることができる(すなわち、全ての組み合わせにおける相互相関の最大値が平均化される)。その後、閾値は、例えば、0.2または0.3または0.35または0.1、例えば、0.05から0.035の間の範囲の閾値であってもよい。
ブロック17a~17cのP個の隣接サンプルは、所定のブロック18の境界(例えば、18c、18a)に沿って延びる一次元経路に沿って配置されてもよい。所定のブロック18のQ個の予測値のそれぞれについて、それぞれの予測値に関連する一連のP個の重み係数は、一次元経路を所定の方向(例えば、左から右、上から下など)に横断するように順序付けられてもよい。
例では、ALWIP行列17Mは、非対角または非ブロック対角であってもよい。
4つの既に予測された隣接サンプルから4×4ブロック18を予測するためのALWIP行列17Mの例は、以下であってもよい:

{ 37,59,77,28},
{ 32,92,85,25},
{ 31,69,100,24},
{ 33,36,106,29},
{ 24,49,104,48},
{ 24,21,94,59},
{ 29,0,80,72},
{ 35,2,66,84},
{ 32,13,35,99},
{ 39,11,34,103},
{ 45,21,34,106},
{ 51,24,40,105},
{ 50,28,43,101},
{ 56,32,49,101},
{ 61,31,53,102},
{ 61,32,54,100}
}。
(ここで、{37,59,77,28}は第1の行である。{32,92,85,25}は第2の行である。{61,32,54,100}は行列17Mの第16の行である。)行列17Mは、寸法16×4を有し、(16*4=64の結果として)64個の重み係数を含む。これは、行列17Mが寸法QxPを有するためであり、ここで、Q=M*Nは、予測対象ブロック18(ブロック18は4×4ブロック)のサンプル数であり、Pは既に予測されたサンプルのサンプル数である。ここで、M=4、N=4、Q=16(M*N=4*4=16の結果として)であり、P=4である。行列は、非対角および非ブロック対角であり、特定の規則によって記述されない。
わかるように、重み係数の1/4未満が0である(上記の行列の場合、64のうちの1つの重み係数が0である)。これらの値によって形成される包絡線は、ラスタ走査順序にしたがって1つ下に配置されると、全方向的に非線形である包絡線を形成する。
上記の説明が主に復号器(例えば、復号器54)を参照して説明されている場合であっても、同じことが符号化器(例えば、符号化器14)において実行されてもよい。
いくつかの例では、(ブロックサイズのセットにおける)各ブロックサイズについて、それぞれのブロックサイズについてのイントラ予測モードの第2のセット内のイントラ予測モードのALWIP変換は、相互に異なる。追加的または代替的に、ブロックサイズのセットにおけるブロックサイズについてのイントラ予測モードの第2のセットのカーディナリティは、一致することができるが、異なるブロックサイズについてのイントラ予測モードの第2のセット内のイントラ予測モードの関連付けられた線形変換またはアフィン線形変換は、スケーリングすることによって、互いに変換不可能とすることができる。
いくつかの例では、ALWIP変換は、それらが従来の変換と「共有するものがない」ように定義されてもよい(例えば、ALWIP変換は、上記のマッピングのうちの1つを介してマッピングされている場合であっても、対応する従来の変換と共有するものが「何もない」とすることができる)。
例では、ALWIPモードは、ルマ成分およびクロマ成分の双方に使用されるが、他の例では、ALWIPモードはルマ成分に使用されるが、クロマ成分には使用されない。
5 符号器の高速化によるアフィン線形加重イントラ予測モード(例えば、試験CE3-1.2.1)
5.1 方法または装置の説明
CE3-1.2.1において試験されたアフィン線形加重イントラ予測(ALWIP)モードは、以下の変更を除いて、試験CE3-2.2.2の下でJVET-L0199において提案されたものと同じとすることができる:
・多重基準線(MRL)イントラ予測、特に符号化器推定およびシグナリングとの整合、すなわち、MRLは、ALWIPと組み合わされず、MRLインデックスの送信は、非ALWIPブロックに制限される。
・サブサンプリングは、全てのブロックW×H≧32×32について必須である(以前は32×32についてオプションであった)。したがって、符号化器における追加の試験およびサブサンプリングフラグの送信は除去されている。
・64×NおよびN×64ブロック(N≦32)のALWIPは、それぞれ32×NおよびN×32にダウンサンプリングし、対応するALWIPモードを適用することによって追加されている。
さらに、試験CE3-1.2.1は、ALWIPについての以下の符号化器最適化を含む:
・結合モード推定:従来のモードおよびALWIPモードは、完全なRD推定のために共有アダマール候補リストを使用する、すなわち、ALWIPモード候補は、アダマールコストに基づいて従来の(およびMRL)モード候補と同じリストに追加される。
・EMTイントラ高速およびPBイントラ高速は、結合モードリストのためにサポートされ、フルRDチェックの数を減らすための追加の最適化を有する。
・利用可能な左および上のブロックのMPMのみが、従来のモードの場合と同じ手法にしたがって、ALWIPのフルRD推定のためのリストに追加される。
5.2 複雑性評価
離散コサイン変換を呼び出す計算を除いて、試験CE3-1.2.1では、予測信号を生成するためにサンプルあたり最大12回の乗算が必要であった。さらに、それぞれ16ビットの合計136492個のパラメータが必要であった。これは、0.273メガバイトのメモリに相当する。
5.3 実験結果
試験の評価は、VTMソフトウェアバージョン3.0.1を用いたイントラ専用(AI)およびランダムアクセス(RA)構成について、共通の試験条件JVET-J1010[2]にしたがって実施された。対応するシミュレーションは、Linux(登録商標) OSおよびGCC 7.2.1コンパイラを備えたIntel Xeonクラスタ(E5-2697A v4、AVX2オン、ターボブーストオフ)上で実行された。
Figure 2023145655000002
Figure 2023145655000003
5.4 複雑度低減を伴うアフィン線形加重イントラ予測(例えば、試験CE3-1.2.2)
CE2で試験された技術は、JVET-L0199[1]に記載されている「アフィン線形イントラ予測」に関連しているが、以下のようにメモリ要件および計算複雑性の点でそれを単純化する:
・全てのブロック形状をカバーする予測行列(例えば、S、S、S、以下も参照されたい)およびバイアスベクトル(例えば、オフセット値を提供するため)の3つの異なるセットのみが存在することができる。結果として、パラメータの数は14400個の10ビット値に低減され、これは、
Figure 2023145655000004
CTUに記憶されるよりもメモリが少ない。
・予測器の入力および出力サイズはさらに低減される。さらに、DCTを介して境界を変換する代わりに、平均化またはダウンサンプリングが境界サンプルに対して実行されることができ、予測信号の生成は、逆DCTの代わりに線形補間を使用することができる。その結果、予測信号を生成するために、サンプル当たり最大4回の乗算が必要となり得る。
6.例
ここでは、ALWIP予測を用いていくつかの予測(例えば、図6に示すように)を実行する方法について説明する。
原則として、図6を参照すると、予測対象のM×Nブロック18のQ=M*N値を取得するために、Q×P ALWIP予測行列17MのQ*PサンプルとP×1 隣接ベクトル17PのPサンプルとの乗算が実行されるべきである。したがって、一般に、予測対象のM×Nブロック18のQ=M*N個の値のそれぞれを取得するためには、少なくともP=M+N個の値の乗算が必要である。
これらの乗算は、極めて望ましくない効果を有する。境界ベクトル17Pの寸法Pは、一般に、予測対象のM×Nブロック18に隣接する(例えば、隣接する)境界サンプル(ビンまたは画素)17a、17cの数M+Nに依存する。これは、予測対象のブロック18のサイズが大きいと、それに応じて境界画素(17a、17c)の数M+Nが大きくなるため、P×1 境界ベクトル17Pの寸法P=M+N、およびQ×P ALWIP予測行列17Mの各行の長さ、ひいては必要な乗算回数が大きくなることを意味する(一般的に言えば、Q=M*N=W*Hであり、式中、W(幅)はNの別の記号であり、H(高さ)はMの別の記号であり、Pは、境界ベクトルがサンプルの1行および/または1列のみによって形成される場合、P=M+N=H+Wである)。
この問題は、一般に、マイクロプロセッサベースのシステム(または他のデジタル処理システム)では、乗算が一般に電力を消費する演算であるという事実によって悪化する。多数のブロックの非常に多数のサンプルに対して行われる多数の乗算は、一般に望ましくない計算電力の浪費を引き起こすと推測されることができる。
したがって、M×Nブロック18を予測するために必要な乗算数Q*Pを低減することが好ましい。
乗算に代わる、処理がより容易な演算を知的に選択することによって、予測対象の各ブロック18の各イントラ予測に必要な計算電力を何らかの形で低減することが可能であることが理解されている。
特に、図7.1~図7.4を参照すると、符号化器または復号器は、
複数の隣接するサンプルと比較して、サンプル数がより少ない縮小されたサンプル値のセットを取得するために、複数の隣接するサンプル(例えば、17a、17c)を縮小すること(例えば、ステップ811において)、(例えば、平均化またはダウンサンプリングによって)と、
縮小されたサンプル値のセットを線形またはアフィン線形変換に供して(例えば、ステップ812において)、所定のブロックの所定のサンプルの予測値を取得することと、
によって、複数の隣接するサンプル(例えば、17a、17c)を使用してピクチャの所定のブロック(例えば、18)を予測することができることが理解されている。
場合によっては、復号器または符号化器はまた、例えば補間によって、所定のサンプルおよび複数の隣接するサンプルの予測値に基づいて、所定のブロックのさらなるサンプルの予測値を導出することができる。したがって、アップサンプリング戦略が取得されることができる。
例では、サンプル数が縮小したサンプルの縮小したセット102(図7.1~7.4)に到達するように、境界17のサンプルに対していくつかの平均を実行する(例えば、ステップ811において)ことが可能である(縮小された数のサンプル102のサンプルの少なくとも一方は、元の境界サンプルの2つのサンプルの平均、または元の境界サンプルの選択であってもよい)。例えば、元の境界がP=M+N個のサンプルを有する場合、サンプルの縮小されたセットは、Pred<Pであるように、Mred<MおよびNred<Nのうちの少なくとも1つである、Pred=Mred+Nredを有することができる。したがって、予測に実際に使用される境界ベクトル17P(例えば、ステップ812bにおいて)は、P×1個のエントリを有さず、Pred<Pである、Pred×1個のエントリを有する。同様に、予測のために選択されたALWIP予測行列17Mは、Q×P寸法を有さず、(Mred<MおよびNred<Nのうちの少なくとも1つである)少なくともPred<Pであることから、行列の要素数が縮小されたQ×Pred(またはQred×Pred、以下を参照)を有する。
いくつかの例(例えば、図7.2、図7.3)では、(ステップ812において)ALWIPによって取得されたブロックが、
Figure 2023145655000005
および/または
Figure 2023145655000006
である、サイズ
Figure 2023145655000007
を有する縮小されたブロックである場合、乗算の回数をさらに減らすことさえ可能である(すなわち、ALWIPによって直接予測されるサンプルは、実際に予測されるブロック18のサンプルの数よりも少ない)。したがって、
Figure 2023145655000008
を設定すると、これは、Q*Pred乗算の代わりにQred*Pred乗算(Qred*Pred<Q*Pred<Q*Pである)を使用することによってALWIP予測を取得する。この乗算は、寸法
Figure 2023145655000009
を有する縮小ブロックを予測する。それにもかかわらず、縮小された
Figure 2023145655000010
予測ブロックから最終的なM×N予測ブロックへのアップサンプリング(例えば、補間によって取得される)を実行する(例えば、後続のステップ813において)ことが可能である。
これらの技術は、行列乗算が縮小された乗算数(Qred*PredまたはQ*Pred)を含む一方で、初期縮小(例えば、平均化またはダウンサンプリング)および最終変換(例えば、補間)の双方が乗算を縮小(さらには回避)することによって実行されることができるため、有利とすることができる。例えば、加算およびシフトなどの非計算電力を必要とするバイナリ演算を採用することによって、ダウンサンプリング、平均化および/または補間が実行されることができる(例えば、ステップ811および/または813において)。
また、加算は、多くの計算労力なしに容易に実行されることができる非常に簡単な演算である。
このシフト演算は、例えば、最終的な予測ブロックを取得するために、2つの境界サンプルを平均化するために、および/または縮小された予測ブロックの(または境界から取得された)2つのサンプル(支持値)を補間するために使用されることができる。(補間のために、2つのサンプル値が必要である。ブロック内では、常に2つの所定値を有するが、ブロックの左および上の境界に沿ったサンプルを補間するために、図7.2のように、1つの所定値のみを有し、したがって、補間のための支持値として境界サンプルを使用する。)
以下のような2段階手順が使用されることができる:
最初に2つのサンプルの値を加算する、
次いで、和の値を半分にする(例えば、右シフトによって)。
あるいは、以下のことが可能である:
サンプルのそれぞれを最初に半分にする(例えば、左シフトによって)、
次いで、2つの半分にされたサンプルの値を加算する。
1つのサンプル量およびサンプルのグループ(例えば、互いに隣接するサンプル)を選択するだけでよいため、ダウンサンプリング(例えば、ステップ811において)の際にさらに容易な演算が実行されることができる。
したがって、ここで、実行されるべき乗算の数を低減するための技術を定義することが可能である。これらの技術のいくつかは、とりわけ、以下の原理のうちの少なくとも1つに基づいてもよい:
実際に予測されるブロック18のサイズがM×Nであっても、(二次元の少なくとも一方において)ブロックが縮小され、縮小されたサイズのQred×Pred
Figure 2023145655000011
、Pred=Nred+Mredであり、
Figure 2023145655000012
および/または
Figure 2023145655000013
および/またはMred<Mおよび/またはNred<Nである)を有するALWIP行列が適用されることができる。したがって、境界ベクトル17Pは、サイズPred×1を有し、Pred<P乗算のみを意味する(Pred=Mred+NredおよびP=M+N)。
red×1境界ベクトル17Pは、例えば、
ダウンサンプリングによって(例えば、境界のいくつかのサンプルのみを選択することによって)、および/または
境界の複数のサンプルを平均することによって(これは、乗算なしで加算およびシフトによって容易に取得されることができる)、
元の境界17から容易に取得されることができる。
追加的または代替的に、予測対象のブロック18の全てのQ=M*N値を乗算によって予測する代わりに、寸法が縮小された縮小ブロック(例えば、
Figure 2023145655000014
である
Figure 2023145655000015
および/または
Figure 2023145655000016
である)のみを予測することが可能である。予測対象のブロック18の残りのサンプルは、例えば、予測対象の残りのQ-Qred値の支持値としてQred個のサンプルを使用する補間によって取得される。
図7.1に示す例によれば、4×4ブロック18(M=4、N=4、Q=M*N=16)が予測されることになり、サンプル17aの近傍17(4つの既に予測されたサンプルを有する垂直行列)および17c(4つの既に予測されたサンプルを有する水平行)は、前の反復で既に予測されている(近傍17aおよび17cは、まとめて17で示されることができる)。先験的に、図5に示す式を使用することにより、予測行列17Mは、Q×P=16×8行列(Q=M*N=4*4およびP=M+N=4+4=8により)であるべきであり、境界ベクトル17Pは、8×1寸法(P=8により)を有するべきである。しかしながら、これは、予測対象の4×4ブロック18の16個のサンプルのそれぞれについて8回の乗算を実行する必要性につながり、したがって、合計で16*8=128回の乗算を実行する必要性につながる。(サンプルあたりの平均乗算回数は、計算複雑度の良好な評価であることに留意されたい。従来のイントラ予測では、サンプルあたり4回の乗算が必要であり、これは関与する計算労力を増加させる。したがって、これをALWIPの上限として使用することが可能であり、複雑さが合理的であり、従来のイントラ予測の複雑さを超えないことを保証する。)
それにもかかわらず、本技術を使用することにより、ステップ811において、予測対象のブロック18に隣接するサンプル17aおよび17cの数をPからPred<Pに減らすことが可能であることが理解されている。特に、2つの水平行および2つの垂直列を有する縮小境界102を取得するために、互いに隣接する境界サンプル(17a、17c)を平均(例えば、図7.1の100において)することが可能であり、したがって、ブロック18としての演算は、2×2ブロック(縮小境界は、平均値によって形成される)であることが理解されている。あるいは、ダウンサンプリングを実行することが可能であり、したがって、行17cに対して2つのサンプルを選択し、列17aに対して2つのサンプルを選択する。したがって、水平行17cは、4つの元のサンプルを有する代わりに、2つのサンプルを有するものとして処理され(例えば、平均化されたサンプル)、元々4つのサンプルを有する垂直列17aは、2つのサンプルを有するものとして処理される(例えば、平均化されたサンプル)。行17cおよび列17aをそれぞれ2つのサンプルのグループ110に細分割した後、単一のサンプルが維持される(例えば、グループ110のサンプルの平均またはグループ110のサンプル間の単純な選択)ことも理解することができる。したがって、4つのサンプル(Mred=2、Nred=2、Pred=Mred+Nred=4、Pred<P)のみを有するセット102によって、サンプル値のいわゆる縮小されたセット102が取得される。
プロセッサレベルで過度に多くの乗算を実行することなく(平均化またはダウンサンプリング100などの)演算を実行することが可能であることが理解されている:ステップ811において実行される平均化またはダウンサンプリング100は、加算およびシフトなどの単純で計算上非電力消費の演算によって簡単に取得されることができる。
この時点で、縮小されたサンプル値のセット102を線形またはアフィン線形(ALWIP)変換19(例えば、図5の行列17Mなどの予測行列を使用する)に供することが可能であることが理解されている。この場合、ALWIP変換19は、4つのサンプル102をブロック18のサンプル値104に直接マッピングする。この場合、補間は不要である。
この場合、ALWIP行列17Mは、寸法Q×Pred=16×4を有する:これは、予測対象のブロック18の全てのQ=16個のサンプルがALWIP乗算によって直接取得される(補間は不要である)という事実にしたがう。
したがって、ステップ812aにおいて、寸法Q×Predを有する適切なALWIP行列17Mが選択される。選択は、例えば、データストリーム12からのシグナリングに少なくとも部分的に基づいてもよい。選択されたALWIP行列17Mはまた、Aで示されることができ、ここで、kは、データストリーム12でシグナリングされることができるインデックスとして理解されることができる(場合によっては、行列はまた、
Figure 2023145655000017
のようにも示される。以下を参照)。選択は、以下のスキームにしたがって実行されてもよい:各寸法(例えば、予測対象のブロック18の高さ/幅の対)について、ALWIP行列17Mは、例えば、3組の行列S、S、Sのうちの1つの中から選択される(3つのセットS、S、Sのそれぞれは、同じ寸法の複数のALWIP行列17Mをグループ化することができ、予測のために選択されるALWIP行列は、それらのうちの1つになる)。
ステップ812bにおいて、選択されたQ×PredALWIP行列17M(Aとしても示される)とPred×1 境界ベクトル17Pとの乗算が実行される。
ステップ812cにおいて、オフセット値(例えば、b)は、例えば、ALWIPによって取得されたベクトル18Qの取得された全ての値104に加算されることができる。オフセット(b、または場合によっては
Figure 2023145655000018
によっても示される、以下を参照)の値は、特定の選択されたALWIP行列(A)に関連付けられてもよく、インデックス(例えば、データストリーム12でシグナリングされてもよい)に基づいてもよい。
したがって、本技術を使用することと本技術を使用しないこととの比較がここで再開される:
本技術を使用しない場合:
寸法M=4、N=4を有するブロックである予測対象のブロック18、
予測対象のQ=M*N=4*4=16個の値、
P=M+N=4+4=8個の境界サンプル
P=予測対象のQ=16個の値のそれぞれについての8回の乗算、
P*Q=8*16=128回の乗算の総数、
本技術を使用する場合、以下を有する:
寸法M=4、N=4を有するブロックである予測対象のブロック18、
最後の予測対象のQ=M*N=4*4=16個の値、
境界ベクトルの縮小寸法:Pred=Mred+Nred=2+2=4、
ALWIPによる予測対象のQ=16個の値のそれぞれについてPred=4回の乗算、
red*Q=4*16=64回の乗算の総数(128の半分!)
乗算回数と取得される最終値の数との比は、Pred*Q/Q=4であり、すなわち、予測対象の各サンプルについてP=8の乗算の半分である!
理解されることができるように、平均化(場合によっては、加算および/またはシフトおよび/またはダウンサンプリング)などの容易で計算的に電力を必要としない演算に依存することによって、ステップ812において適切な値を取得することが可能である。
図7.2を参照すると、予測対象のブロック18は、ここでは64サンプルの8×8ブロック(M=8、N=8)である。ここで、先験的に、予測行列17Mは、サイズQ×P=64×16(Q=M*N=8*8=64、M=8およびN=8により、ならびにP=M+N=8+8=16によりQ=64)を有するべきである。したがって、先験的に、予測対象の8×8ブロック18のQ=64個のサンプルのそれぞれについてP=16回の乗算が必要とされ、8×8ブロック18の全体について64*16=1024回の乗算に到達するであろう!
しかしながら、図7.2からわかるように、境界の16個のサンプルの全てを使用する代わりに、8つの値(例えば、境界の元のサンプル間の水平境界行17cの4つおよび垂直境界列17aの4つ)のみが使用される方法820が提供されることができる。境界行17cからは、8個ではなく4個のサンプルが使用されてもよい(例えば、それらは、2×2の平均および/または2つのうちの1つのサンプルの選択であってもよい)。したがって、境界ベクトルは、P×1=16×1ベクトルではなく、Pred×1=8×1ベクトルのみとなる(Pred=Mred+Nred=4+4)。元のP=16個のサンプルの代わりに、Pred=8個の境界値のみを有するように、水平行17cのサンプルおよび垂直列17aのサンプルを選択または平均(例えば、2×2)して、サンプル値の縮小されたセット102を形成することが可能であることが理解されている。この縮小セット102は、ブロック18の縮小バージョンを取得することを可能にし、縮小バージョンは、(Q=M*N=8*8=64の代わりに)Qred=Mred*Nred=4*4=16個のサンプルを有する。サイズMred×Nred=4×4のブロックを予測するALWIP行列を適用することが可能である。ブロック18の縮小バージョンは、図7.2のスキーム106において灰色で示されたサンプルを含む:灰色の四角で示されたサンプル(サンプル118’および118’’を含む)は、対象とするステップ812で得られたQred=16個の値を有する4×4縮小ブロックを形成する。4×4縮小ブロックは、対象とするステップ812において線形変換19を適用することによって取得されたものである。4×4縮小ブロックの値を取得した後、例えば補間によって残りのサンプル(スキーム106において白色サンプルで示されているサンプル)の値を取得することが可能である。
図7.1の方法810に関して、この方法820は、例えば、予測対象のM×N=8×8ブロック18の残りのQ-Qred=64-16=48サンプル(白色正方形)の予測値を補間によって導出するステップ813をさらに含むことができる。残りのQ-Qred=64-16=48サンプルは、補間(補間はまた、例えば、境界サンプルの値を利用することができる)によって直接取得されたQred=16サンプルから取得されることができる。図7.2からわかるように、サンプル118’および118’’は、(灰色の四角で示すように)ステップ812において取得されているが、サンプル108’(サンプル118’および118’’の中間であり、白色の四角で示される)は、ステップ813においてサンプル118’と118’’との間の補間によって取得される。補間はまた、シフトおよび加算などの平均化のためのものと同様の演算によって取得されることができることが理解されている。したがって、図7.2では、値108’は、一般に、サンプル118’の値とサンプル118’’の値との中間の値として決定されることができる(平均とすることができる)。
補間を実行することによって、ステップ813において、104に示された複数のサンプル値に基づいてM×N=8×8ブロック18の最終バージョンに到達することも可能である。
したがって、本技術を使用することと使用しないこととを比較すると、以下の通りである:
本技術を使用しない場合:
寸法M=8、N=8を有するブロックである予測対象のブロック18、および
予測対象のブロック18のQ=M*N=8*8=64個のサンプル、
境界17のP=M+N=8+8=16個のサンプル、
予測対象のQ=64個の値のそれぞれについてのP=16回の乗算、
P*Q=16*64=1028回の乗算の総数
乗算回数と取得される最終値の数との比は、P*Q/Q=16である
本技術を使用する場合:
寸法M=8、N=8を有する、予測対象のブロック18
最後の予測対象のQ=M*N=8*8=64個の値、
しかしながら、Pred=Mred+Nred、Qred=Mred*Nred、Mred=4、Nred=4を有する、Qred×PredALWIP行列が使用される
red<Pである、境界のPred=Mred+Nred=4+4=8個のサンプル
予測対象の4×4縮小ブロックのQred=16個の値のそれぞれについてPred=8回の乗算(スキーム106では灰色の正方形によって形成される)、
red*Qred=8*16=128回の乗算の総数(1024を大幅に下回る!)
乗算回数と取得されるべき最終値の数との比は、Pred*Qred/Q=128/64=2である(本技術を使用せずに取得された16よりもはるかに少ない!)。
したがって、本明細書に提示される技術は、前の技術よりも8倍電力要求が少ない。
図7.3は、(方法820に基づくことができる)別の例を示し、予測対象のブロック18は、Q=4*8=32個の予測対象のサンプルを有する矩形の4×8ブロック(M=8、N=4)である。境界17は、N=8サンプルの水平行17cと、M=4サンプルの垂直列17aとによって形成される。したがって、先験的に、境界ベクトル17Pは、寸法P×1=12×1を有するが、予測ALWIP行列は、Q×P=32×12行列であるべきであり、したがって、Q*P=32*12=384回の乗算が必要になる。
しかしながら、例えば、水平行17cの少なくとも8つのサンプルを平均化またはダウンサンプリングして、4つのサンプルのみ(例えば、平均化されたサンプル)の縮小された水平行を取得することが可能である。いくつかの例では、垂直列17aは、そのままである(例えば、平均化なし)。合計で、縮小された境界は、寸法Pred=8を有し、Pred<Pである。したがって、境界ベクトル17Pは、寸法Pred×1=8×1を有する。ALWIP予測行列17Mは、寸法M*Nred*Pred=4*4*8=64を有する行列になる。対象とするステップ812において直接取得された(スキーマ107の灰色の列によって形成された)4×4縮小ブロックは、サイズQred=M*Nred=4*4=16サンプルを有する(予測対象の元の4×8ブロック18のQ=4*8=32の代わりに)。縮小された4×4ブロックがALWIPによって取得されると、オフセット値bを加算し(ステップ812c)、ステップ813において補間を実行することが可能である。図7.3のステップ813においてわかるように、縮小された4×4ブロックは、4×8ブロック18に拡張され、ステップ812において取得されなかった値108’は、ステップ812において取得された値118’および118’’(灰色の正方形)を補間することによってステップ813において取得される。
したがって、本技術を使用することと使用しないこととを比較すると、以下の通りである:
本技術を使用しない場合:
寸法M=4、N=8を有するブロックである、予測対象のブロック18
予測対象のQ=M*N=4*8=32個の値、
境界のP=M+N=4+8=12個のサンプル、
予測対象のQ=32個の値のそれぞれについてのP=12回の乗算、
P*Q=12*32=384回の乗算の総数
乗算回数と取得される最終値の数との比は、P*Q/Q=12である
本技術を使用する場合:
寸法M=4、N=8を有するブロックである、予測対象のブロック18
最後の予測対象のQ=M*N=4*8=32個の値、
しかしながら、M=4、Nred=4、Qred=M*Nred=16、Pred=M+Nred=4+4=8である、Qred×Pred=16×8 ALWIP行列が使用されることができる
red<Pである、境界のPred=M+Nred=4+4=8個のサンプル
予測対象の縮小ブロックのQred=16個の値のそれぞれについてPred=8回の乗算、
red*Pred=16*8=128回の乗算の総数(384未満!)
乗算回数と取得されるべき最終値の数との比は、Pred*Qred/Q=128/32=4である(本技術を使用せずに取得された12よりもはるかに少ない!)。
したがって、本技術では、計算労力が1/3に低減される。
図7.4は、寸法M×N=16×16を有する予測対象のブロック18の事例を示し、最後の予測対象のQ=M*N=16*16=256個の値を有し、P=M+N=16+16=32個の境界サンプルを有する。これは、寸法Q×P=256×32を有する予測行列をもたらし、これは、256*32=8192回の乗算を意味する!
しかしながら、方法820を適用することにより、ステップ811において、境界サンプルの数を、例えば32から8に減らす(例えば、平均化またはダウンサンプリングによって)ことが可能であり、例えば、行17aの4つの連続サンプルのグループ120ごとに、単一のサンプル(例えば、4つのサンプルの中から選択されるか、またはサンプルの平均)が残る。また、列17cの連続する4つのサンプルからなるグループごとに、単一のサンプル(例えば、4つのサンプルの中から選択されるか、またはサンプルの平均)が残る。
ここで、ALWIP行列17Mは、Qred×Pred=64×8行列である:これは、それが(8つの平均化されたサンプルまたは32個の境界から選択されたサンプルを使用することによって)Pred=8を選択したという事実、およびステップ812において予測対象の縮小ブロックが8×8ブロック(スキーム109では、灰色の正方形は64である)であるという事実に起因する。
したがって、ステップ812において縮小された8×8ブロックの64個のサンプルが取得されると、ステップ813において、予測対象のブロック18の残りのQ-Qred=256-64=192個の値104を導出することが可能である。
この場合、補間を実行するために、境界列17aの全てのサンプルおよび境界行17cの代替サンプルのみを使用することが選択されている。他の選択が行われてもよい。
本方法では、乗算回数と最終的に取得される値の数との間の比はQred*Pred/Q=8*64/256=2であり、これは、本技術を使用しない各値の32回の乗算よりもはるかに少ない!
したがって、本技術を使用することと使用しないこととを比較すると、以下の通りである:
本技術を使用しない場合:
寸法M=16、N=16を有するブロックである、予測対象のブロック18
予測対象のQ=M*N=16*16=256個の値、
境界のP=M+N=16*16=32個のサンプル、
予測対象のQ=256個の値のそれぞれについてのP=32回の乗算、
P*Q=32*256=8192回の乗算の総数
乗算回数と取得される最終値の数との比は、P*Q/Q=32である
本技術を使用する場合:
寸法M=16、N=16を有するブロックである、予測対象のブロック18
最後の予測対象のQ=M*N=16*16=256個の値、
しかしながら、Mred=4、Nred=4、ALWIPによる予測対象のQred=8*8=64個のサンプル、Pred=Mred+Nred=4+4=8である、Qred×Pred=64×8 ALWIP行列が使用される
red<Pである、境界のPred=Mred+Nred=4+4=8個のサンプル
予測対象の縮小ブロックのQred=64個の値のそれぞれについてPred=8回の乗算、
red*Pred=64*4=256回の乗算の総数(8192未満!)
乗算回数と取得されるべき最終値の数との比は、Pred*Qred/Q=8*64/256=2である(本技術を使用せずに取得された32よりもはるかに少ない!)。
したがって、本技術によって必要とされる計算電力は、従来の技術よりも16倍小さい!
したがって、
複数の隣接するサンプルを縮小して(100、813)、複数の隣接するサンプル(17)と比較して、サンプル数がより少ない縮小されたサンプル値のセット(102)を取得し、
縮小されたサンプル値のセット(102)を線形またはアフィン線形変換(19、17M)に供して、所定のブロック(18)の所定のサンプル(104,118’、188’’)の予測値を取得する(812)
ことによって、隣接する複数のサンプル(17)を使用してピクチャの所定のブロック(18)を予測することが可能である。
特に、複数の隣接サンプルをダウンサンプリングして、複数の隣接サンプル(17)と比較してサンプル数が少ないサンプル値の縮小されたセット(102)を取得することによって、縮小(100、813)を実行することが可能である。
あるいは、複数の隣接サンプルを平均化して、複数の隣接サンプル(17)と比較してサンプル数が少ないサンプル値の縮小されたセット(102)を取得することによって、縮小(100、813)を実行することが可能である。
さらに、所定のサンプル(104,118’、118’’)および複数の隣接サンプル(17)の予測値に基づいて、所定のブロック(18)のさらなるサンプル(108、108’)の予測値を補間によって導出する(813)ことが可能である。
複数の隣接するサンプル(17a、17c)は、所定のブロック(18)の両側(例えば、図7.1~図7.4の右および下に向かって)に沿って一次元に延在してもよい。所定のサンプル(例えば、ステップ812においてALWIPによって取得されたもの)はまた、行および列に配置されてもよく、行および列の少なくとも一方に沿って、所定のサンプルは、所定のブロック18の両側に隣接する所定のサンプル112のサンプル(112)からn番目ごとの位置に配置されてもよい。
複数の隣接サンプル(17)に基づいて、行および列の少なくとも一方のそれぞれに対して位置合わせされた複数の隣接位置のうちの一方(118)の支持値(118)を、行および列の少なくとも一方のそれぞれに対して決定することが可能である。所定のブロック(18)のさらなるサンプル(108、108’)の予測値118を、所定のサンプル(104、118’、118’’)の予測値と、行および列の少なくとも一方に位置合わせされた隣接サンプル(118)の支持値とに基づいて補間によって導出することも可能である。
所定のサンプル(104)は、行に沿って所定のブロック18の両側に隣接するサンプル(112)からn番目ごとの位置に配置されてもよく、所定のサンプルは、列に沿って所定のブロック(18)の両側に隣接する(112)所定のサンプルのサンプル(112)からm番目ごとの位置に配置され、n、m>1である。場合によっては、n=mである(例えば、図7.2および図7.3では、812においてALWIPによって直接取得され、灰色の四角で示されているサンプル104,118’、118’’は、行および列に沿って、ステップ813において続いて取得されたサンプル108、108’に対して交互にされる)。
行(17c)および列(17a)の少なくとも一方に沿って、例えば、各支持値について、それぞれの支持値が決定される隣接サンプル(118)を含む複数の隣接サンプル内の隣接サンプルのグループ(120)をダウンサンプリングまたは平均化(122)することによって、支持値を決定することを実行することが可能であり得る。したがって、図7.4では、ステップ813において、(ステップ812において以前に取得された)所定のサンプル118’’’および隣接するサンプル118の値を支持値として使用することによってサンプル119の値を取得することが可能である。
複数の隣接するサンプルは、所定のブロック(18)の両側に沿って一次元に延在してもよい。複数の隣接サンプル(17)を1つ以上の連続する隣接サンプルのグループ(110)にグループ化し、2つ以上の隣接サンプルを有する1つ以上の隣接サンプルのグループ(110)のそれぞれに対してダウンサンプリングまたは平均化を実行することによって、縮小(811)を実行することが可能であり得る。
例では、線形またはアフィン線形変換は、Pred*QredまたはPred*Q重み係数を含むことができ、Predは、サンプル値の縮小したセット内のサンプル値(102)の数であり、QredまたはQは、所定のブロック(18)内の所定のサンプルの数である。少なくとも1/4のPred*Qredまたは1/4のPred*Q重み係数は、非ゼロの重み値である。Pred*QredまたはPred*Q重み係数は、Q個またはQred個の所定のサンプルのそれぞれについて、それぞれの所定のサンプルに関する一連のPred重み係数を含むことができ、一連の重み係数は、所定のブロック(18)の所定のサンプル間のラスタ走査順序にしたがって上下に配置される場合、全方向的に非線形である包絡線を形成する。Pred*QまたはPred*Qred重み係数は、規則的なマッピング規則を介して互いに無関係であってもよい。それぞれの所定のサンプルに関連する第1の系列の重み係数と、それぞれの所定のサンプル以外の所定のサンプルに関連する第2の系列の重み係数との間の相互相関の最大値の平均、または後者の系列の反転されたものは、より高い最大値をもたらすにもかかわらず、所定の閾値よりも低い。所定の閾値は、0.3[または場合によっては0.2または0.1]とすることができる。Pred個の隣接サンプル(17)は、所定のブロック(18)の両側に沿って延びる一次元経路に沿って配置されてもよく、Q個またはQred個の所定のサンプルのそれぞれについて、それぞれの所定のサンプルに関する一連のPred重み係数は、一次元経路を所定の方向に横断するように順序付けられる。
6.1 方法および装置の説明

Figure 2023145655000019
(Nでも示される)および高さ
Figure 2023145655000020
(Mでも示される)の矩形ブロックのサンプルを予測するために、アフィン線形加重イントラ予測(ALWIP)は、ブロックの左のH個の再構成された隣接する境界サンプルの1つのラインおよびブロックの上の
Figure 2023145655000021
個の再構成された隣接する境界サンプルの1つのラインを入力として取得することができる。再構成されたサンプルが利用できない場合、それらは、従来のイントラ予測で行われるように生成されることができる。
予測信号(例えば、完全なブロック18の値)の生成は、以下の3つのステップのうちの少なくともいくつかに基づくことができる:
1.境界サンプル17のうち、サンプル102(例えば、W=H=4の場合には4つのサンプル、および/または他の場合には8つのサンプル)は、平均化またはダウンサンプリングによって抽出されることができる(例えば、ステップ811)。
2.行列ベクトル乗算とそれに続くオフセットの加算は、平均化されたサンプル(またはダウンサンプリングから残っているサンプル)を入力として実行されることができる。結果は、元のブロック内のサブサンプリングされたサンプルのセット上の縮小された予測信号とすることができる(例えば、ステップ812)。
3.残りの位置の予測信号は、例えばアップサンプリングによって、サブサンプリングされたセット上の予測信号から、例えば線形補間によって生成されることができる(例えば、ステップ813)。
ステップ1.(811)および/または3.(813)のおかげで、行列ベクトル積の計算に必要な乗算の総数は、常に
Figure 2023145655000022
以下であるようなものとすることができる。さらに、境界に対する平均化演算および縮小予測信号の線形補間は、加算およびビットシフトのみを使用して実行される。換言すれば、例では、ALWIPモードにはサンプル当たり最大4回の乗算が必要である。
いくつかの例では、予測信号を生成するために必要な行列(例えば、17M)およびオフセットベクトル(例えば、b)は、例えば、復号器および符号化器の記憶ユニットに記憶されることができる行列のセット(例えば、3セット)、例えば、
Figure 2023145655000023

Figure 2023145655000024
から取得されることができる。
いくつかの例では、セット
Figure 2023145655000025
は、図7.1にかかる技術を実行するために、それぞれが16行および4列と、それぞれがサイズ16の18個のオフセットベクトル
Figure 2023145655000026
{0,...,n-1}とを有することができる
Figure 2023145655000027
(例えば、
Figure 2023145655000028
=16または
Figure 2023145655000029
=18または別の数)行列
Figure 2023145655000030
{0,...,n-1}を含む(例えば、以下からなる)ことができる。このセットの行列およびオフセットベクトルは、サイズ
Figure 2023145655000031
のブロック18について使用される。境界ベクトルがPred=4ベクトルに縮小されると(図7.1のステップ811について)、縮小されたサンプルセット102のPred=4個のサンプルを、予測対象の4×4ブロック18のQ=16個のサンプルに直接マッピングすることが可能である。
いくつかの例では、セット
Figure 2023145655000032
は、図7.2または7.3にかかる技術を実行するために、それぞれが
Figure 2023145655000033
行および8列と、それぞれがサイズ16の18個のオフセットベクトル
Figure 2023145655000034
{0,...,n-1}とを有することができるn(例えば、
Figure 2023145655000035
=8または
Figure 2023145655000036
=18または別の数)行列
Figure 2023145655000037
{0,...,n-1}を含む(例えば、以下からなる)ことができる。このセットSの行列およびオフセットベクトルは、サイズ
Figure 2023145655000038
、4×16、4×32、4×64、16×4、32×4、64×4、8
Figure 2023145655000039
および8
Figure 2023145655000040
のブロックに使用されることができる。さらに、それはまた、
Figure 2023145655000041
を有するサイズ
Figure 2023145655000042
のブロック、すなわち、サイズが4×16または16×4、4×32または32×4および4×64または64×4のブロックにも使用されることができる。16×8行列は、図7.2および図7.3で取得されるように、4×4ブロックであるブロック18の縮小バージョンを指す。
追加的または代替的に、セット
Figure 2023145655000043
は、n(例えば、
Figure 2023145655000044
=6または
Figure 2023145655000045
=18または別の数)個の行列
Figure 2023145655000046
{0,...,n-1}を含む(例えば、からなる)ことができ、そのそれぞれは、64行および8列と、サイズ64の18個のオフセットベクトル
Figure 2023145655000047
{0,...,n-1}とを有することができる。64×8行列は、例えば図7.4において取得されるような8×8ブロックであるブロック18の縮小バージョンを指す。このセットの行列およびオフセットベクトルは、サイズ
Figure 2023145655000048
のブロックに使用されることができる。
これらの行列およびオフセットベクトルのセットまたは一部の行列およびオフセットベクトルは、他の全てのブロック形状に使用されてもよい。
6.2 境界の平均化またはダウンサンプリング
ここでは、ステップ811に関して特徴が提供される。
上記で説明したように、境界サンプル(17a、17c)は、平均化および/またはダウンサンプリング(例えば、P個のサンプルからPred<P個のサンプル)されることができる。
第1のステップでは、入力境界
Figure 2023145655000049
(例えば、17c)および
Figure 2023145655000050
(例えば、17a)は、より小さい境界
Figure 2023145655000051
および
Figure 2023145655000052
に縮小され、縮小されたセット102に到達することができる。ここで、
Figure 2023145655000053
および
Figure 2023145655000054
は、双方とも4×4ブロックの場合は2サンプルからなり、他の場合は双方とも4サンプルからなる。
4×4ブロックの場合、
Figure 2023145655000055

Figure 2023145655000056
を定義することが可能であり、同様に
Figure 2023145655000057
を定義することが可能である。したがって、
Figure 2023145655000058

Figure 2023145655000059

Figure 2023145655000060
Figure 2023145655000061
[1]は、例えばビットシフト演算を使用して取得された平均値である。
他の全ての場合において(例えば、4とは異なるウィザーの幅または高さのブロックについて)、ブロック幅WがW
Figure 2023145655000062
として与えられる場合、
Figure 2023145655000063
について、
Figure 2023145655000064
を定義し、
同様に
Figure 2023145655000065
を定義する。
さらに他の場合では、(例えば、境界サンプルのグループから1つの特定の境界サンプルを選択することによって)境界をダウンサンプリングして、縮小したサンプル数に到達することが可能である。例えば、
Figure 2023145655000066
は、
Figure 2023145655000067
および
Figure 2023145655000068
の中から選択されてもよく、
Figure 2023145655000069
は、
Figure 2023145655000070
および
Figure 2023145655000071
の中から選択されてもよい。同様に
Figure 2023145655000072
を定義することも可能である。
2つの縮小された境界
Figure 2023145655000073
および
Figure 2023145655000074
は、縮小された境界ベクトル
Figure 2023145655000075
(縮小されたセット102に関連付けられている)に連結されてもよく、これもまた17Pで示される。したがって、縮小された境界ベクトル
Figure 2023145655000076
は、形状
Figure 2023145655000077
のブロック(図7.1の例)についてはサイズ4(Pred=4)とすることができ、他の全ての形状のブロック(図7.2~7.4の例)についてはサイズ8(Pred=8)とすることができる。
ここで、
Figure 2023145655000078
(または行列のセットにおける行列の数)である場合、
Figure 2023145655000079
を定義することが可能である。
Figure 2023145655000080
の転置モードに対応する
Figure 2023145655000081
である場合、
Figure 2023145655000082
を定義することが可能である。
したがって、特定の状態(
Figure 2023145655000083
)によれば、出力ベクトルの予測値を異なる走査順序(例えば、1つの走査順序:
Figure 2023145655000084
)に沿って分布させることが可能である。
他の戦略が実行されてもよい。他の例では、モードインデックス「mode」は、必ずしも0から35の範囲内ではない(他の範囲が定義されてもよい)。さらに、3つのセットS、S、Sのそれぞれが18個の行列を有する必要はない(したがって、
Figure 2023145655000085
のような式の代わりに、それぞれ行列S、S、Sの各セットの行列の数である
Figure 2023145655000086

Figure 2023145655000087

Figure 2023145655000088
とすることが可能である)。さらに、セットは、それぞれ異なる数の行列を有することができる(例えば、Sは16個の行列を有し、Sは8個の行列を有し、Sは6個の行列を有することができる)。
モードおよび転置情報は、必ずしも1つの結合されたモードインデックス「mode」として記憶および/または送信されるわけではない。いくつかの例では、転置フラグおよび行列インデックス(Sの場合は0~15、Sの場合は0~7、Sの場合は0~5)として明示的にシグナリングする可能性がある。
場合によっては、転置フラグと行列インデックスとの組み合わせは、セットインデックスとして解釈されてもよい。例えば、転置フラグとして動作する1ビットと、「セットインデックス」としてまとめて示される、行列インデックスを示すいくつかのビットとが存在することができる。
6.3 行列ベクトル乗算による縮小予測信号の生成
ここでは、ステップ812に関して特徴が提供される。
縮小された入力ベクトル
Figure 2023145655000089
(境界ベクトル17P)のうちの1つは、縮小された予測信号
Figure 2023145655000090
を生成することができる。後者の信号は、幅
Figure 2023145655000091
および高さ
Figure 2023145655000092
のダウンサンプリングされたブロック上の信号とすることができる。ここで、
Figure 2023145655000093
および
Figure 2023145655000094
は、以下のように定義されることができる:
Figure 2023145655000095

Figure 2023145655000096
である場合
Figure 2023145655000097
そうでない場合。
縮小された予測信号
Figure 2023145655000098
は、行列ベクトル積を計算してオフセットを加えることによって計算されることができる:
Figure 2023145655000099
ここで、
Figure 2023145655000100
は、他の全ての場合にW=H=4および8列である場合に
Figure 2023145655000101
行および4列を有することができる行列(例えば、予測行列17M)であり、
Figure 2023145655000102
はサイズ
Figure 2023145655000103
からなることができるベクトルである。
Figure 2023145655000104
の場合、Aは4列および16行を有することができ、したがって、その場合には
Figure 2023145655000105
を計算するためにサンプルあたり4回の乗算が必要とされることができる。他の全ての場合において、Aは8列を有することができ、これらの場合において、
Figure 2023145655000106
を有すること、すなわち、これらの場合においても、
Figure 2023145655000107
を計算するためにサンプルあたり最大4回の乗算が必要であることを検証することができる。
行列Aおよびベクトル
Figure 2023145655000108
は、以下のように、セット
Figure 2023145655000109

Figure 2023145655000110
の1つから取得されることができる。
Figure 2023145655000111

Figure 2023145655000112
である場合、全ての他の場合に
Figure 2023145655000113
および
Figure 2023145655000114
である場合、
Figure 2023145655000115
を設定することによってインデックス
Figure 2023145655000116
を定義する。さらに、
Figure 2023145655000117
である場合、
Figure 2023145655000118
とすることができ、その他の場合には
Figure 2023145655000119
とすることができる。次に、
Figure 2023145655000120
または
Figure 2023145655000121
および
Figure 2023145655000122
である場合、
Figure 2023145655000123
および
Figure 2023145655000124
とすることができる。
Figure 2023145655000125
=2および
Figure 2023145655000126
である場合、
Figure 2023145655000127
を、
Figure 2023145655000128
の各行を除外することによって生じ、W=4の場合、ダウンサンプリングされたブロック内の奇数x座標に対応し、またはH=4の場合、ダウンサンプリングされたブロック内の奇数y座標に対応する行列とする。
Figure 2023145655000129
である場合、縮小された予測信号をその転置信号によって置き換える。代替例では、異なる戦略が実行されてもよい。例えば、より大きな行列のサイズを縮小する(「除外する」)代わりに、Wred=4およびHred=4であるSのより小さな行列(idx=1)が使用される。すなわち、そのようなブロックは、ここではSではなくSに割り当てられる。
他の戦略が実行されてもよい。他の例では、モードインデックス「mode」は、必ずしも0から35の範囲内ではない(他の範囲が定義されてもよい)。さらに、3つのセットS、S、Sのそれぞれが18個の行列を有する必要はない(したがって、
Figure 2023145655000130
のような式の代わりに、それぞれ行列S、S、Sの各セットの行列の数である
Figure 2023145655000131

Figure 2023145655000132

Figure 2023145655000133
とすることが可能である)。さらに、セットは、それぞれ異なる数の行列を有することができる(例えば、Sは16個の行列を有し、Sは8個の行列を有し、Sは6個の行列を有することができる)。
6.4 最終予測信号を生成するための線形補間
ここでは、ステップ812に関して特徴が提供される。
大きなブロックにおけるサブサンプリングされた予測信号の補間では、平均化された境界の第2のバージョンが必要とされることができる。すなわち、
Figure 2023145655000134
および
Figure 2023145655000135
である場合、W
Figure 2023145655000136
を書き込み、
Figure 2023145655000137
の場合には、
Figure 2023145655000138
を定義する。
Figure 2023145655000139
および
Figure 2023145655000140
である場合、同様に
Figure 2023145655000141
を定義する。
追加的または代替的に、「ハードダウンサンプリング」を有することが可能であり、ここで、
Figure 2023145655000142
は、
Figure 2023145655000143
に等しい。
また、
Figure 2023145655000144
も同様に定義されることができる。
Figure 2023145655000145
の生成において除外されたサンプル位置において、最終的な予測信号は、
Figure 2023145655000146
からの線形補間によって生じることができる(例えば、図7.2~図7.4の例のステップ813)。いくつかの例では、
Figure 2023145655000147
である場合、この線形補間は不要とすることができる(例えば、図7.1の例)。
線形補間は、以下のように与えられてもよい(他の例も可能である)。
Figure 2023145655000148
であると仮定する。次に、
Figure 2023145655000149
である場合、
Figure 2023145655000150
の垂直アップサンプリングが実行されることができる。その場合、
Figure 2023145655000151
は、以下のように上に1ライン分拡張されることができる。
Figure 2023145655000152
である場合、
Figure 2023145655000153
は幅
Figure 2023145655000154
を有することができ、例えば上記で定義されたように、平均化された境界信号
Figure 2023145655000155
によって上に拡張されることができる。
Figure 2023145655000156
である場合、
Figure 2023145655000157
は幅
Figure 2023145655000158
からなり、例えば上記で定義されたように、平均化された境界信号
Figure 2023145655000159
によって上に拡張される。
Figure 2023145655000160
の第1のラインについて
Figure 2023145655000161
を書き込むことができる。次に、幅
Figure 2023145655000162
および高さ
Figure 2023145655000163
のブロック上の信号
Figure 2023145655000164
は、以下のように与えられることができる。
Figure 2023145655000165
[x][2*y+1]=
Figure 2023145655000166
[x][y]、
Figure 2023145655000167
[x][2*y]=
Figure 2023145655000168
[x][y-1]+
Figure 2023145655000169
[x][y]+1)>>1、
ここで、
Figure 2023145655000170
および
Figure 2023145655000171
である。後者のプロセスは、2
Figure 2023145655000172
red=Hになるまでk回実行されることができる。したがって、H
Figure 2023145655000173
またはH
Figure 2023145655000174
である場合、最大で1回実行されることができる。H
Figure 2023145655000175
である場合、2回実行されることができる。H
Figure 2023145655000176
である場合、3回実行されることができる。次に、垂直アップサンプリングの結果に水平アップサンプリング動作が適用されることができる。後者のアップサンプリング動作は、予測信号の全境界左を使用することができる。最後に、
Figure 2023145655000177
である場合、最初に水平方向に(必要に応じて)アップサンプリングし、次に垂直方向にアップサンプリングすることによって同様に進めることができる。
これは、第1の補間(水平または垂直)に縮小された境界サンプルを使用し、第2の補間(垂直または水平)に元の境界サンプルを使用する補間の例である。ブロックサイズに応じて、第2の補間のみまたは補間なしが必要である。水平補間と垂直補間の双方が必要な場合、順序はブロックの幅と高さに依存する。
しかしながら、異なる技術が実装されてもよく、例えば、元の境界サンプルが第1および第2の補間の双方に使用されてもよく、順序は固定されてもよく、例えば、最初に水平、次に垂直(他の場合には、最初に垂直、次に水平)であってもよい。
したがって、補間順序(水平/垂直)および縮小/元の境界サンプルの使用が変更されることができる。
6.5 ALWIPプロセス全体の例の説明
平均化、行列ベクトル乗算、および線形補間の全プロセスは、図7.1~図7.4の異なる形状について示されている。残りの形状は、図示された事例の1つのように扱われることに留意されたい。
1.
Figure 2023145655000178
ブロックが与えられると、ALWIPは、図7.1の技術を使用して境界の各軸に沿って2つの平均をとることができる。得られた4つの入力サンプルは、行列ベクトル乗算に入力される。行列は、セット
Figure 2023145655000179
から取得される。オフセットを加えた後、これは、16個の最終予測サンプルをもたらすことができる。予測信号の生成には、線形補間は不要である。したがって、サンプルあたり(
Figure 2023145655000180
回の乗算の総数が実行される。例えば、図7.1を参照されたい。
2.
Figure 2023145655000181
ブロックが与えられると、ALWIPは、境界の各軸に沿って4つの平均をとることができる。結果として取得される8つの入力サンプルは、図7.2の技術を使用して、行列ベクトル乗算に入力される。行列は、セット
Figure 2023145655000182
から取得される。これは、予測ブロックの奇数位置に16個のサンプルをもたらす。したがって、サンプルあたり(
Figure 2023145655000183
回の乗算の総数が実行される。オフセットを追加した後、これらのサンプルは、例えば、上境界を使用して垂直に、および例えば、左境界を使用して水平に補間されることができる。例えば、図7.2を参照されたい。
3.
Figure 2023145655000184
ブロックが与えられると、ALWIPは、図7.3の技術を使用することによって、境界の横軸に沿った4つの平均および左境界上の4つの元の境界値をとることができる。得られた8つの入力サンプルは、行列ベクトル乗算に入力される。行列は、セット
Figure 2023145655000185
から取得される。これは、予測ブロックの奇数水平位置および各垂直位置に16個のサンプルをもたらす。したがって、サンプルあたり(
Figure 2023145655000186
回の乗算の総数が実行される。オフセットを追加した後、これらのサンプルは、例えば左境界を使用して水平方向に補間される。例えば、図7.3を参照されたい。
転置された事例はそれに応じて処理される。
4.
Figure 2023145655000187
ブロックが与えられると、ALWIPは、境界の各軸に沿って4つの平均をとることができる。結果として取得される8つの入力サンプルは、図7.2の技術を使用して行列ベクトル乗算に入力される。行列は、セット
Figure 2023145655000188
から取得される。これは、予測ブロックの奇数位置に64個のサンプルをもたらす。したがって、サンプルあたり(
Figure 2023145655000189
回の乗算の総数が実行される。オフセットを追加した後、これらのサンプルは、例えば、上境界を使用して垂直方向に補間され、左境界を使用して水平方向に補間される。例えば、図7.2を参照されたい。例えば、図7.4を参照されたい。
より大きな形状の場合、手順は本質的に同じとすることができ、サンプルあたりの乗算数が2未満であることを確認することは容易である。
W×8ブロックの場合、奇数水平および各垂直位置にサンプルが与えられるため、水平補間のみが必要である。したがって、これらの場合、サンプルあたりせいぜい(
Figure 2023145655000190
回の乗算が実行される。
最後に、W>8であるW×4ブロックについて、
Figure 2023145655000191
を、ダウンサンプリングされたブロックの水平軸に沿った奇数エントリに対応する各行を除外することによって生じる行列とする。したがって、出力サイズは、32とすることができ、ここでも水平補間のみが実行されたままである。サンプルあたりせいぜい(
Figure 2023145655000192
回の乗算が実行されることができる。
転置された事例は、それに応じて処理されることができる。
6.6 必要なパラメータの数および複雑さの評価
全ての可能な提案されたイントラ予測モードに必要なパラメータは、セット
Figure 2023145655000193

Figure 2023145655000194
に属する行列およびオフセットベクトルによって構成されることができる。全ての行列係数およびオフセットベクトルは、10ビット値として記憶されることができる。したがって、上記の説明によれば、それぞれが10ビット精度の合計14400個のパラメータが、提案された方法に必要とされることができる。これは、0.018メガバイトのメモリに対応する。現在、標準4:2:0のクロマサブサンプリングにおけるサイズ
Figure 2023145655000195
のCTUは、それぞれ10ビットの24576個の値からなることが指摘される。したがって、提案されたイントラ予測ツールのメモリ要件は、最後の会議で採用された現在のピクチャ参照ツールのメモリ要件を超えない。また、従来のイントラ予測モードは、部分角度位置を有する角度予測モードのためのPDPCツールまたは4タップ補間フィルタに起因して、サンプルあたり4回の乗算を必要とすることが指摘される。したがって、演算の複雑さに関して、提案された方法は、従来のイントラ予測モードを超えない。
6.7 提案されたイントラ予測モードのシグナリング
ルマブロックについては、例えば35個のALWIPモードが提案されている(他の数のモードが使用されてもよい)。イントラモードの各符号化ユニット(CU)について、ALWIPモードが、対応する予測ユニット(PU)に適用されるべきであるか否かを示すフラグが、ビットストリームで送信される。後者のインデックスの信号伝達は、最初のCE試験と同じ方法でMRLと調和させることができる。ALWIPモードが適用されることになる場合、ALWIPモードのインデックス
Figure 2023145655000196
は、3 MPMSを有するMPMリストを使用してシグナリングされることができる。
ここで、MPMの導出は、以下のように、上および左のPUのイントラモードを用いて行われてもよい。各従来のイントラ予測モード
Figure 2023145655000197
にALWIPモード
Figure 2023145655000198
を割り当てることができるテーブル、例えば3つの固定テーブル
Figure 2023145655000199

Figure 2023145655000200
が存在することができる

Figure 2023145655000201
および高さ
Figure 2023145655000202
の各PUについて、3つのセットのうちのどれからALWIPパラメータが上記のセクション4のように解釈されるべきかを示す
Figure 2023145655000203
を定義およびインデックス付けする。上記の予測ユニット
Figure 2023145655000204
が利用可能であり、現在のPUと同じCTUに属し、イントラモードにある場合、
Figure 2023145655000205
である場合、およびALWIPがALWIPモード
Figure 2023145655000206
によって
Figure 2023145655000207
に適用される場合、
Figure 2023145655000208
とする
上記のPUが利用可能であり、現在のPUと同じCTUに属し、イントラモードにある場合、および従来のイントラ予測モード
Figure 2023145655000209
が上記のPUに適用される場合、
Figure 2023145655000210
とする
他の全ての場合において、
Figure 2023145655000211
とし、
これは、このモードが利用できないことを意味する。同じように、ただし、左PUが現在のPUと同じCTUに属する必要があるという制限なしに、モード
Figure 2023145655000212
を導出する
最後に、3つの固定デフォルトリスト
Figure 2023145655000213

Figure 2023145655000214
が提供され、そのそれぞれは3つの異なるALWIPモードを含む。デフォルトリスト
Figure 2023145655000215
およびモード
Figure 2023145655000216
および
Figure 2023145655000217
のうち、デフォルト値で-1を置換するとともに繰り返しを排除することによって、3つの異なるMPMを構築する。
本明細書に記載の実施形態は、提案されたイントラ予測モードの上述した信号伝達によって限定されない。代替実施形態によれば、MPMおよび/またはマッピングテーブルは、MIP(ALWIP)に使用されない。
6.8 従来のルマイントラ予測モードおよびクロマイントラ予測モードのための適応MPMリスト導出
提案されたALWIPモードは、以下のように従来のイントラ予測モードのMPMベースの符号化と調和されることができる。従来のイントラ予測モードのルマおよびクロマMPMリスト導出プロセスは、固定テーブル
Figure 2023145655000218

Figure 2023145655000219
を使用し、所与のPU上のALWIPモード
Figure 2023145655000220
を従来のイントラ予測モード
Figure 2023145655000221
のうちの1つにマッピングすることができる。
ルマMPMリスト導出の場合、ALWIPモード
Figure 2023145655000222
を使用する隣接ルマブロックに遭遇するときはいつでも、このブロックは、従来のイントラ予測モード
Figure 2023145655000223
を使用しているかのように扱われることができる。クロマMPMリスト導出のために、現在のルマブロックがLWIPモードを使用するときはいつでも、同じマッピングを使用してALWIPモードを従来のイントラ予測モードに変換することができる。
ALWIPモードは、MPMおよび/またはマッピングテーブルを使用することなく、従来のイントラ予測モードと調和させることができることは明らかである。例えば、クロマブロックについて、現在のルマブロックがALWIPモードを使用するときはいつでも、ALWIPモードが平面イントラ予測モードにマッピングされることが可能である。
7 実施効率的な実施形態
以下に説明する実施形態をさらに拡張するための基礎を形成することができるため、上記の例を簡単に要約する。
ピクチャ10の所定のブロック18を予測するために、複数の隣接サンプル17a、cを使用することが使用される。
複数の隣接サンプルの平均化による縮小100は、複数の隣接サンプルと比較してサンプル数が少ない縮小されたサンプル値のセット102を取得するために行われている。この縮小は、本明細書の実施形態では任意であり、以下に言及されるいわゆるサンプル値ベクトルをもたらす。サンプル値の縮小されたセットは、所定のブロックの所定のサンプル104の予測値を取得するために線形またはアフィン線形変換19を受ける。この変換は、後に、機械学習(ML)によって取得され、実装が効率的に実行されるべきである行列Aおよびオフセットベクトルbを使用して示される。
補間により、所定のブロックの別のサンプル108の予測値が、所定のサンプルおよび複数の隣接サンプルの予測値に基づいて導出される。理論的には、アフィン/線形変換の結果は、ブロック18の全てのサンプルが代替実施形態にかかる補間によって取得されることができるように、ブロック18の非フルペルサンプル位置に関連付けられることができると言うべきである。補間も全く必要ないかもしれない。
複数の隣接サンプルは、所定のブロックの両側に沿って一次元に延在してもよく、所定のサンプルは、行および列に配置され、行および列の少なくとも一方に沿って配置され、所定のサンプルは、所定のブロックの両側に隣接する所定のサンプルのサンプル(112)からn番目ごとの位置に配置されてもよい。複数の隣接サンプルに基づいて、行および列の少なくとも一方のそれぞれについて、複数の隣接位置のうちの一方(118)に対する支持値が決定されることができ、これは、行および列の少なくとも一方のそれぞれに位置合わせされ、補間によって、所定のブロックのさらなるサンプル108に対する予測値は、所定のサンプルに対する予測値および行および列の少なくとも一方に位置合わせされた隣接サンプルに対する支持値に基づいて導出されることができる。所定のサンプルは、行に沿って所定のブロックの両側に隣接する所定のサンプルのサンプル112からn番目ごとの位置に配置されてもよく、所定のサンプルは、列に沿って所定のブロックの両側に隣接する所定のサンプルのサンプル112からm番目ごとの位置に配置されてもよく、n、m>1である。n=mであってもよい。行および列の少なくとも一方に沿って、支持値の決定は、各支持値について、それぞれの支持値が決定される隣接サンプル118を含む複数の隣接サンプル内の隣接サンプルのグループ120を平均すること(122)によって行うことができる。複数の隣接サンプルは、所定のブロックの両側に沿って一次元に延在してもよく、縮小は、複数の隣接サンプルを1つ以上の連続する隣接サンプルのグループ110にグループ化し、3つ以上の隣接サンプルを有する1つ以上の隣接サンプルのグループのそれぞれに対して平均化を実行することによって行われてもよい。
所定のブロックについて、予測残差がデータストリーム内で送信されることができる。それは、復号器においてそこから導出されることができ、所定のブロックは、所定のサンプルの予測残差および予測値を使用して再構成されることができる。符号化器では、予測残差が符号化器においてデータストリームに符号化される。
ピクチャは、異なるブロックサイズの複数のブロックに細分割されることができ、これら複数のブロックは、所定のブロックを含む。次に、ブロック18の線形またはアフィン線形変換は、所定のブロックの幅Wおよび高さHに応じて選択され、その結果、所定のブロックの幅Wおよび高さHが幅/高さ対の第1のセット内にある限り、所定のブロックに対して選択された線形またはアフィン線形変換は、線形またはアフィン線形変換の第1のセットから選択され、所定のブロックの幅Wおよび高さHが幅/高さ対の第1のセットとは異なる幅/高さ対の第2のセット内にある限り、線形またはアフィン線形変換の第2のセットが選択される。同様に、後に、アフィン/線形変換が他のパラメータ、すなわちCの重み、ならびに任意選択的にオフセットおよびスケールパラメータによって表されることが明らかになる。
復号器および符号化器は、ピクチャを、所定のブロックを含む異なるブロックサイズの複数のブロックに細分割し、所定のブロックの幅Wおよび高さHに応じて線形またはアフィン線形変換を選択するように構成されることができ、その結果、所定のブロックに対して選択された線形またはアフィン線形変換は、
所定のブロックの幅Wおよび高さHが幅/高さの対の第1のセット内にある限り、線形またはアフィン線形変換の第1のセット、
所定のブロックの幅Wおよび高さHが、幅/高さ対の第1のセットとは異なる幅/高さ対の第2のセット内にある限り、線形またはアフィン線形変換の第2のセット、および
所定のブロックの幅Wおよび高さHが、幅/高さ対の第1および第2のセットとは異なる1つ以上の幅/高さ対の第3のセット内にある限り、線形またはアフィン線形変換の第3のセット、から選択される。
1つ以上の幅/高さ対の第3のセットは、単に1つの幅/高さ対W’、H’を含み、線形またはアフィン線形変換の第1のセット内の各線形またはアフィン線形変換は、N’個のサンプル値を、サンプル位置のW’×H’アレイのW’*H’予測値に変換するためのものである。
第1および第2のセットの幅/高さ対のそれぞれは、WがHに等しくない第1の幅/高さ対W、Hと、H=WおよびW=Hである第2の幅/高さ対W、Hとを含むことができる。
第1および第2のセットの幅/高さ対のそれぞれは、第3の幅/高さ対W、Hをさらに含むことができ、WはHに等しく、H>Hである。
所定のブロックについて、線形またはアフィン線形変換の所定のセットのうちのどの線形またはアフィン線形変換がブロック18に対して選択されるべきかを示すセットインデックスがデータストリーム内で送信されることができる。
複数の隣接サンプルは、所定のブロックの両側に沿って一次元に延在することができ、縮小は、所定のブロックの第1の側に隣接する複数の隣接サンプルの第1のサブセットについて、第1のサブセットを、1つ以上の連続する隣接サンプルの第1のグループ110にグループ化し、所定のブロックの第2の側に隣接する複数の隣接サンプルの第2のサブセットについて、第2のサブセットを、1つ以上の連続する隣接サンプルの第2のグループ110にグループ化し、第1のグループからの第1のサンプル値および第2のグループの第2のサンプル値を取得するために、3つ以上の隣接サンプルを有する1つ以上の隣接サンプルの第1および第2のグループのそれぞれに対して平均化を実行することによって行うことができる。次に、線形またはアフィン線形変換は、線形またはアフィン線形変換の所定のセットからのセットインデックスに応じて選択されることができ、その結果、セットインデックスの2つの異なる状態が、線形またはアフィン線形変換の所定のセットのうちの線形またはアフィン線形変換の1つの選択をもたらし、予測値の出力ベクトルをもたらすために第1のベクトルの形態で2つの異なる状態の第1を仮定するセットインデックスの場合、サンプル値の縮小されたセットは、所定の線形またはアフィン線形変換に供されることができ、出力ベクトルの予測値を第1の走査順序に沿って所定のブロックの所定のサンプルに分配することができ、第2のベクトルの形態で2つの異なる状態の第2を仮定する設定されたインデックスの場合、予測値の出力ベクトルを生成するために、第1のベクトルの第1のサンプル値の1つが入力された成分が第2のベクトルの第2のサンプルの1つに入力され、第1のベクトルの第2のサンプル値の1つが入力された成分が第2のベクトルの第1のサンプルの1つに入力されるように第1および第2のベクトルが異なり、第1の走査順序に対して転置される所定のブロックの所定のサンプルへの第2の走査順序に沿った出力ベクトルの予測値を分配することができる。
線形またはアフィン線形変換の第1のセット内の各線形またはアフィン線形変換は、N個のサンプル値をサンプル位置のw×hアレイについてのw*h個の予測値に変換するためのものとすることができ、線形またはアフィン線形変換の第1のセット内の各線形またはアフィン線形変換は、N個のサンプル値をサンプル位置のw×hアレイについてのw*h個の予測値に変換するためのものであり、第1の幅/高さ対の第1の所定の1つについて、wは第1の所定の幅/高さ対の幅を超えることができ、またはhは第1の所定の幅/高さ対の高さを超えることができ、第1の幅/高さ対の第2の所定の1つについて、wは第2の所定の幅/高さ対の幅を超えることができず、hは第2の所定の幅/高さ対の高さを超えることができない。そして、平均化によって、サンプル値の縮小されたセット(102)を取得するために複数の隣接するサンプルを取得すること(100)は、所定のブロックが第1の所定の幅/高さ対のものである場合、および所定のブロックが第2の所定の幅/高さ対のものである場合、サンプル値の縮小されたセット102がN個のサンプル値を有するように行われてもよく、縮小されたサンプル値のセットを選択された線形またはアフィン線形変換に供することは、所定のブロックが第1の所定の幅/高さ対のものである場合は、wが1つの幅/高さ対の幅を超える場合は幅寸法に沿った、またはhが1つの幅/高さ対の高さを超える場合は高さ寸法に沿ったサンプル位置のw×hアレイのサブサンプリングに関連する選択された線形またはアフィン線形変換の第1のサブ部分のみを使用することによって行われてもよく、所定のブロックが第2の所定の幅/高さ対のものである場合は、選択された線形またはアフィン線形変換を完全に行ってもよい。
線形またはアフィン線形変換の第1のセット内の各線形またはアフィン線形変換は、w=hであるサンプル位置のw×hアレイについてN個のサンプル値をw*h個の予測値に変換するためのものとすることができ、線形またはアフィン線形変換の第2のセット内の各線形またはアフィン線形変換は、w=hであるサンプル位置のw×hアレイについてN個のサンプル値をw*h個の予測値に変換するためのものである。
上述した実施形態は全て、本明細書で以下に説明する実施形態の基礎を形成することができるという点で単なる例示である。すなわち、上記の概念および詳細は、以下の実施形態を理解するのに役立ち、本明細書で後述する実施形態の可能な拡張および補正のリザーバとして役立つ。特に、上述した詳細の多くは、隣接するサンプルの平均化、隣接するサンプルが参照サンプルとして使用されるという事実など、任意選択的である。
より一般的には、本明細書に記載の実施形態は、矩形ブロック上のイントラ予測信号がブロックの左および上の隣接する既に再構成されたサンプルから生成されるなど、矩形ブロック上の予測信号が既に再構成されたサンプルから生成されると仮定する。予測信号の生成は、以下のステップに基づく。
1.しかしながら、説明を他の場所に配置された参照サンプルに転送する可能性を排除することなく、境界サンプルと呼ばれる参照サンプルから、サンプルは平均化によって抽出されることができる。ここで、平均化は、ブロックの左および上の双方の境界サンプルに対して、または両側の一方の境界サンプルに対してのみ実行される。片側で平均化が行われない場合、その側のサンプルは変更されないままである。
2.行列ベクトル乗算が実行され、任意選択的に、その後にオフセットの加算が実行され、行列ベクトル乗算の入力ベクトルは、平均化が左側のみに適用された場合、ブロックの平均化された境界サンプルの左とブロックの上の元の境界サンプルとの連結、または平均化が上側のみに適用された場合、ブロックの元の境界サンプルの左とブロックの上の平均化された境界サンプルとの連結、または平均化がブロックの両側に適用された場合、ブロックの平均化された境界サンプルの左とブロックの上の平均化された境界サンプルとの連結のいずれかである。ここでも、平均化が全く使用されていないものなどの代替例が存在する。
3.行列ベクトル乗算および任意選択のオフセット加算の結果は、任意選択的に、元のブロック内のサブサンプリングされたサンプルのセット上の縮小された予測信号とすることができる。残りの位置における予測信号は、線形補間によってサブサンプリングされたセット上の予測信号から生成されることができる。
ステップ2における行列ベクトル積の計算は、好ましくは整数演算で実行されるべきである。したがって、
Figure 2023145655000224
が行列ベクトル積の入力を示す場合、すなわち、
Figure 2023145655000225
がその後に
Figure 2023145655000226
からブロックの左および上の(平均化された)境界サンプルの連結を示す場合、ステップ2において計算された(縮小された)予測信号は、ビットシフト、オフセットベクトルの加算、および整数との乗算のみを使用して計算されるべきである。理想的には、ステップ2の予測信号は、
Figure 2023145655000227
のように与えられ、ここで、
Figure 2023145655000228
は0とすることができるオフセットベクトルであり、
Figure 2023145655000229
はいくつかの機械学習ベースの訓練アルゴリズムによって導出される。しかしながら、そのような訓練アルゴリズムは、通常、浮動小数点精度で与えられる行列
Figure 2023145655000230
のみをもたらす。したがって、式
Figure 2023145655000231
がこれらの整数演算を使用して十分に近似されるように、前述の意味で整数演算を指定するという問題に直面する。ここで、これらの整数演算は、ベクトル
Figure 2023145655000232
の均一な分布を仮定して式
Figure 2023145655000233
を近似するように必ずしも選択されるのではなく、典型的には、式
Figure 2023145655000234
が近似される入力ベクトル
Figure 2023145655000235
が自然映像信号からの(平均化された)境界サンプルであり、
Figure 2023145655000236
の成分
Figure 2023145655000237
間のいくつかの相関を予測することができることを考慮することに言及することが重要である。
図8は、複数の参照サンプル17を使用してピクチャ10の所定のブロック18を予測するための装置1000の実施形態を示している。複数の参照サンプル17は、所定のブロック18を予測するために装置1000によって使用される予測モードに依存することができる。予測モードが例えばイントラ予測である場合、所定のブロックに隣接する参照サンプル17が使用されることができる。換言すれば、複数の参照サンプル17は、例えば、所定のブロック18の外縁に沿ってピクチャ10内に配置される。例えば、予測モードがインター予測である場合、他のピクチャ10’の参照サンプル17が使用されることができる。
装置1000は、複数の参照サンプル17からサンプル値ベクトル400を形成する100ように構成される。サンプル値ベクトルは、異なる技術によって取得されることができる。サンプル値ベクトルは、例えば、全ての参照サンプル17を含むことができる。任意選択的に、参照サンプルは重み付けされることができる。別の例によれば、サンプル値ベクトル400は、サンプル値ベクトル102について図7.1から図7.4のいずれかに関して説明したように形成されることができる。換言すれば、サンプル値ベクトル400は、平均化またはダウンサンプリングによって形成されることができる。したがって、例えば、参照サンプルのグループが平均化され、値の縮小したセットを有するサンプル値ベクトル400を取得することができる。換言すれば、装置は、例えば、サンプル値ベクトル400の各成分について、複数の参照サンプル17のうちの1つの参照サンプルをサンプル値ベクトルのそれぞれの成分として採用すること、および/またはサンプル値ベクトル400の2つ以上の成分を平均化すること、すなわち、サンプル値ベクトル400のそれぞれの成分を取得するために、複数の参照サンプル17のうちの2つ以上の参照サンプルを平均化することによって、複数の参照サンプル17からサンプル値ベクトル102を形成する100ように構成される。
装置1000は、サンプル値ベクトル400から、サンプル値ベクトル400が所定の可逆線形変換403によってマッピングされるさらなるベクトル402を導出する401ように構成される。さらなるベクトル402は、例えば、整数値および/または固定小数点値のみを含む。可逆線形変換403は、例えば、所定のブロック18のサンプルの予測が整数演算または固定小数点演算によって実行されるように選択される。
さらにまた、装置1000は、さらなるベクトル402と所定の予測行列405との間の行列ベクトル積404を計算して予測ベクトル406を取得し、予測ベクトル406に基づいて所定のブロック18のサンプルを予測するように構成される。有利なさらなるベクトル402に基づいて、所定の予測行列が量子化されて、所定のブロック18の予測サンプルに対する量子化誤差の僅かな影響のみで整数演算および/または固定小数点演算を可能にすることができる。
実施形態によれば、装置1000は、固定小数点演算を使用して行列ベクトル積404を計算するように構成される。あるいは、整数演算が使用されることができる。
実施形態によれば、装置1000は、浮動小数点演算なしで行列ベクトル積404を計算するように構成される。
実施形態によれば、装置1000は、所定の予測行列405の固定小数点数表現を記憶するように構成される。追加的または代替的に、所定の予測行列405の整数表現が記憶されることができる。
実施形態によれば、装置1000は、予測ベクトル406に基づいて所定のブロック18のサンプルを予測する際に、予測ベクトル406に基づいて所定のブロック18の少なくとも1つのサンプル位置を計算するために補間を使用するように構成され、その各成分は、所定のブロック18内の対応する位置に関連付けられる。補間は、図7.1~図7.4に示す実施形態のうちのいずれかに関して説明したように実行されることができる。
図9は、本明細書に記載の発明の概念を示している。所定のブロックのサンプルは、いくつかの機械学習ベースの訓練アルゴリズムによって導出された行列A 1100とサンプル値ベクトル400との間の第1の行列ベクトル積に基づいて予測されることができる。任意選択的に、オフセットb 1110が加算されることができる。この第1の行列ベクトル積の整数近似または固定点近似を達成するために、サンプル値ベクトルは、さらなるベクトル402を決定するために可逆線形変換403を受けることができる。さらなる行列B 1200とさらなるベクトル402との間の第2の行列ベクトル積は、第1の行列ベクトル積の結果に等しくすることができる。
さらなるベクトル402の特徴のために、第2の行列ベクトル積は、所定の予測行列C 405とさらなるベクトル402とさらなるオフセット408との間の行列ベクトル積404によって整数近似されることができる。さらなるベクトル402およびさらなるオフセット408は、整数値または固定小数点値からなることができる。さらなるオフセットの全ての成分は、例えば、同じである。所定の予測行列405は、量子化された行列であってもよく、量子化される行列であってもよい。所定の予測行列405とさらなるベクトル402との間の行列ベクトル積404の結果は、予測ベクトル406として理解されることができる。
以下では、この整数近似に関するさらなる詳細が提供される。
実施形態Iにかかる可能な解決策:平均値の減算および加算
上記のシナリオで使用可能な式
Figure 2023145655000238
の整数近似の1つの可能な組み込みは、サンプル値ベクトル400の第
Figure 2023145655000239
の成分
Figure 2023145655000240
、すなわち
Figure 2023145655000241
の所定の成分1500を、
Figure 2023145655000242
の成分の平均値
Figure 2023145655000243
、すなわち所定値1400で置き換え、他の全ての成分からこの平均値を減算することである。換言すれば、可逆線形変換403は、図10aに示すように、さらなるベクトル402の所定の成分1500がaになり、所定の成分1500を除くさらなるベクトル402の他の成分のそれぞれが、サンプル値ベクトルの対応する成分マイナスaに等しくなるように定義され、aは、例えば、サンプル値ベクトル400の成分の算術平均または加重平均などの平均である所定値1400である。入力に対するこの演算は、特に
Figure 2023145655000244
の寸法
Figure 2023145655000245
が2の累乗である場合に明らかな整数実装を有する可逆変換
Figure 2023145655000246
403によって与えられる。
Figure 2023145655000247
であるため、入力
Figure 2023145655000248
に対してそのような変換を行う場合、行列ベクトル積
Figure 2023145655000249
の整数近似を見つける必要があり、ここで
Figure 2023145655000250
および
Figure 2023145655000251
である。行列ベクトル積
Figure 2023145655000252
は、矩形ブロック、すなわち所定のブロック上の予測を表し、
Figure 2023145655000253
は、そのブロックの(例えば、平均化された)境界サンプルによって構成されるため、
Figure 2023145655000254
の全てのサンプル値が等しい場合、すなわち、全ての
Figure 2023145655000255
について、
Figure 2023145655000256
である場合、予測信号
Figure 2023145655000257
内の各サンプル値は、
Figure 2023145655000258
に近いか、または
Figure 2023145655000259
に正確に等しくなければならないことを予測すべきである。これは、
Figure 2023145655000260
の、すなわちさらなる行列1200の第
Figure 2023145655000261
の列、すなわち所定の成分に対応する列が、1のみからなる列に非常に近いかまたは等しいことを予測すべきであることを意味する。したがって、
Figure 2023145655000262
)である場合、すなわち整数行列1300が、その第
Figure 2023145655000263
の列が1からなり、その他の列の全てが0である行列である場合、
Figure 2023145655000264
である
Figure 2023145655000265
)yと書き込むと、図10bに示すように、
Figure 2023145655000266
の、すなわち所定の予測行列405の第
Figure 2023145655000267
の列は、かなり小さいエントリを有するか、または0であると予測すべきである。さらに、
Figure 2023145655000268
の成分は相関があるため、各
Figure 2023145655000269
について、
Figure 2023145655000270
の第iの成分
Figure 2023145655000271
はxの第iの成分よりも絶対値がはるかに小さいことが多いことを予測することができる。行列
Figure 2023145655000272
は整数行列であるため、
Figure 2023145655000273
の整数近似が与えられる場合、
Figure 2023145655000274
の整数近似が達成され、上記の引数により、
Figure 2023145655000275
の各エントリを適切な方法で量子化することによって生じる量子化誤差は、
Figure 2023145655000276

Figure 2023145655000277
のそれぞれの結果として生じる量子化の誤差に僅かに影響を与えるだけであることを予測することができる。
所定値1400は、必ずしも平均値
Figure 2023145655000278
である必要はない。式
Figure 2023145655000279
の本明細書に記載された整数近似はまた、所定値1400の以下の代替的な定義を用いて達成されることができる:

Figure 2023145655000280
の整数近似の別の可能な組み込みでは、
Figure 2023145655000281
の第
Figure 2023145655000282
の成分
Figure 2023145655000283
は変更されないままであり、同じ値
Figure 2023145655000284
が他の全ての成分から減算される。すなわち、各
Figure 2023145655000285
について
Figure 2023145655000286
および
Figure 2023145655000287
である。換言すれば、所定値1400は、所定の成分1500に対応するサンプル値ベクトル400の成分とすることができる。
あるいは、所定値1400は、デフォルト値、またはピクチャが符号化されたデータストリームでシグナリングされる値である。
所定値1400は、例えば、2bitdepth-1に等しい。この場合、さらなるベクトル402は、i>0の場合、y=2bitdepth-1およびy=x-xによって定義されることができる。
あるいは、所定の成分1500は、所定値1400を減算した定数となる。定数は、例えば、2bitdepth-1に等しい。実施形態によれば、さらなるベクトルy 402の所定の成分
Figure 2023145655000288
1500は、2bitdepth-1マイナス所定の成分1500に対応するサンプル値ベクトル400の成分
Figure 2023145655000289
に等しく、さらなるベクトル402の他の全ての成分は、サンプル値ベクトル400の対応する成分マイナス所定の成分1500に対応するサンプル値ベクトル400の成分に等しい。
例えば、所定値1400は、所定のブロックのサンプルの予測値との偏差が小さいと有利である。
実施形態によれば、装置1000は、複数の可逆線形変換403を含むように構成され、そのそれぞれはさらなるベクトル402の一成分に関連付けられる。さらにまた、装置は、例えば、サンプル値ベクトル400の成分のうちの所定の成分1500を選択し、その所定の成分1500に対応付けられている複数の可逆線形変換のうちの可逆線形変換403を、その所定の可逆線形変換として使用するように構成される。これは、例えば、さらなるベクトル402内の所定の成分の位置に応じて、第iの行、すなわち所定の成分に対応する可逆線形変換403の行の異なる位置に起因する。例えば、さらなるベクトル402の第1の成分、すなわちyが所定の成分である場合、第iの行は、可逆線形変換の第1の行を置き換える。
図10bに示すように、さらなるベクトル402の所定の成分1500に対応する所定の予測行列405の列412、すなわち第iの列内の所定の予測行列C 405の行列成分414は、例えば、全て0である。この場合、装置は、例えば、図10cに示すように、列412を残すことによって所定の予測行列C 405から結果として生じる縮小された予測行列C’ 405と、所定の成分1500を残すことによってさらなるベクトル402から結果として生じるなおさらなるベクトル410との間の行列ベクトル積407を計算することによって乗算を実行することによって行列ベクトル積404を計算するように構成される。したがって、予測ベクトル406がより少ない乗算で計算されることができる。
図9、図10bおよび図10cに示すように、装置1000は、予測ベクトル406に基づいて所定のブロックのサンプルを予測する際に、予測ベクトル406の各成分について、それぞれの成分とa、すなわち所定値1400との和を計算するように構成されることができる。この加算は、図9および図10cに示すように、予測ベクトル406とベクトル409との和によって表されることができ、ベクトル409の全ての成分は、所定値1400に等しい。あるいは、加算は、図10bに示すように、予測ベクトル406と、整数行列M 1300とさらなるベクトル402との間の行列ベクトル積1310との和によって表されることができ、整数行列1300の行列成分は、さらなるベクトル402の所定の成分1500に対応する整数行列1300の列、すなわち第iの列内で1であり、他の全ての成分は、例えば0である。
所定の予測行列405と整数行列1300との合計の結果は、例えば、図9に示すさらなる行列1200に等しいかまたは近似する。
換言すれば、さらなるベクトル402の所定の成分1500に対応する所定の予測行列405の列412、すなわち第iの列内の所定の予測行列C 405の各行列成分を、可逆線形変換403の1(すなわち、行列B)倍と合計して得られる行列、すなわちさらなる行列B 1200は、例えば、図9、図10aおよび図10bに示すように、機械学習予測行列A 1100の量子化バージョンに対応する。第iの列412内の所定の予測行列C 405の各行列成分を1と合計することは、図10bに示すように、所定の予測行列405と整数行列1300との合計に対応することができる。図9に示すように、機械学習予測行列A 1100は、さらなる行列1200の可逆線形変換403の倍の結果に等しくすることができる。これは、
Figure 2023145655000290
に起因する。所定の予測行列405は、例えば、量子化行列、整数行列および/または固定小数点行列であり、これにより、機械学習予測行列A 1100の量子化バージョンが実現されることができる。
整数演算のみを使用した行列乗算
低複雑度実装(スカラ値を加算および乗算する複雑さの観点、ならびにパーテイキング行列のエントリに必要な記憶装置の観点から)では、整数演算のみを使用して行列乗算404を実行することが望ましい。
Figure 2023145655000291
、すなわち、
Figure 2023145655000292
の近似を計算するために、実施形態によれば、整数のみに対する演算を使用して、実数値
Figure 2023145655000293
は、整数値
Figure 2023145655000294
にマッピングされなければならない。これは、例えば、一様スカラ量子化によって、または値
Figure 2023145655000295
間の特定の相関を考慮することによって行うことができる。整数値は、例えば、それぞれが固定数のビットn_bit、例えばn_bits=8で記憶されることができる固定小数点数を表す。
サイズm×nの行列、すなわち所定の予測行列405を有する行列ベクトル積404は、この擬似コードに示すように実行されることができ、ここで、<<,>>は、算術バイナリ左シフト演算および右シフト演算であり、+、-および*は、整数値のみで演算する。
(1)
最終_オフセット=1<<(右_シフト_結果-1);
0...m-1におけるiについて

アキュムレータ=0
0...n-1におけるjについて

アキュムレータ:=アキュムレータ+y[j]*C[i,j]

z[i]=(アキュムレータ+最終_オフセット)>>右_シフト_結果;
ここで、アレイC、すなわち所定の予測行列405は、例えば整数として固定小数点数を記憶する。最終_オフセットの最後の加算および右_シフト_結果による右シフト演算は、出力で必要とされる固定小数点形式を得るために丸めによって精度を低下させる。
Cの整数によって表現可能な実数値の範囲の増加を可能にするために、図11および図12の実施形態に示すように、2つの追加の行列
Figure 2023145655000296
および
Figure 2023145655000297
が使用されることができ、その結果、行列ベクトル積
Figure 2023145655000298

Figure 2023145655000299
の各係数
Figure 2023145655000300
は、
Figure 2023145655000301
によって与えられる。

Figure 2023145655000302
および
Figure 2023145655000303
は、それ自体が整数値である。例えば、これらの整数は、固定数のビット、例えば8ビット、または例えば値
Figure 2023145655000304
を記憶するために使用されるのと同じ数のビットn_bitでそれぞれ記憶することができる固定小数点数を表すことができる。
換言すれば、装置1000は、予測パラメータ、例えば整数値
Figure 2023145655000305
ならびに値
Figure 2023145655000306
および
Figure 2023145655000307
を使用して所定の予測行列405を表し、さらなるベクトル402の成分および予測パラメータおよびそれから生じる中間結果に対して乗算および加算を実行することによって行列ベクトル積404を計算するように構成され、予測パラメータの絶対値は、nビットの固定小数点数表現によって表すことができ、nは14以下、あるいは10以下、あるいは8以下である。例えば、さらなるベクトル402の成分は、予測パラメータと乗算されて、中間結果として積を生成し、これは、加算の影響を受けるか、または加算の加数を形成する。
実施形態によれば、予測パラメータは、それぞれが予測行列の対応する行列成分に関連付けられた重みを含む。換言すれば、所定の予測行列は、例えば、予測パラメータに置き換えられたり、予測パラメータによって表されたりする。重みは、例えば、整数および/または固定点値である。
実施形態によれば、予測パラメータは、1つ以上のスケーリング係数、例えば値scalei,jをさらに含み、そのそれぞれは、所定の予測行列405の1つ以上の対応する行列成分に関連する重み、例えば整数値
Figure 2023145655000308
をスケーリングするための所定の予測行列405の1つ以上の対応する行列成分に関連付けられる。追加的または代替的に、予測パラメータは、1つ以上のオフセット、例えば値offseti,jを含み、そのそれぞれは、所定の予測行列405の1つ以上の対応する行列成分に関連付けられた重み、例えば整数値
Figure 2023145655000309
をオフセットするための所定の予測行列405の1つ以上の対応する行列成分に関連付けられる。
Figure 2023145655000310
および
Figure 2023145655000311
に必要な記憶量を低減するために、それらの値は、インデックスi,jの特定のセットに対して一定であるように選択されることができる。例えば、図11に示すように、それらのエントリは列ごとに一定であってもよく、行ごとに一定であってもよく、全てのi,jについて一定であってもよい。
例えば、好ましい一実施形態では、
Figure 2023145655000312
および
Figure 2023145655000313
は、図12に示すように、ある予測モードの行列の全ての値に対して一定である。したがって、k=0..K-1のK個の予測モードがある場合、モードkの予測を計算するために単一の値
Figure 2023145655000314
および単一の値
Figure 2023145655000315
のみが必要である。
実施形態によれば、
Figure 2023145655000316
および/または
Figure 2023145655000317
は、全ての行列ベースのイントラ予測モードについて一定、すなわち同一である。追加的または代替的に、
Figure 2023145655000318
および/または
Figure 2023145655000319
は、全てのブロックサイズについて一定、すなわち同一であることが可能である。
オフセット表現
Figure 2023145655000320
およびスケール表現
Figure 2023145655000321
を用いて、(1)における計算は、以下のように修正されることができる:
(2)
最終_オフセット=0;
0...n-1におけるiについて

最終_オフセット:=最終_オフセット-y[i];

最終_オフセット*=最終_オフセット*オフセット*スケール;
最終_オフセット+=1<<(右_シフト_結果-1);
0...m-1におけるiについて

アキュムレータ=0
0...n-1におけるjについて

アキュムレータ:=アキュムレータ+y[j]*C[i,j]

z[i]=(アキュムレータ*スケール+最終_オフセット)>>右_シフト_結果;
その解決策から生じる広範な実施形態
上記の解決策は、以下の実施形態を意味する:
1.セクションIに記載されているような予測方法であって、セクションIのステップ2において、関与する行列ベクトル積の整数近似に対して以下が行われる:
Figure 2023145655000322
である、固定
Figure 2023145655000323
について、(平均化された)境界サンプル
Figure 2023145655000324
から、ベクトル
Figure 2023145655000325
が計算され、
Figure 2023145655000326
の場合、
Figure 2023145655000327
であり、
Figure 2023145655000328
であり、
Figure 2023145655000329
は、
Figure 2023145655000330
の平均値を示す。そして、ベクトル
Figure 2023145655000331
は、セクションIのステップ2からの(ダウンサンプリングされた)予測信号
Figure 2023145655000332

Figure 2023145655000333
のように与えられるように行列ベクトル積
Figure 2023145655000334
(の整数実現)の入力として機能する。この式において、
Figure 2023145655000335
は、(ダウンサンプリングされた)予測信号の領域内の各サンプル位置について
Figure 2023145655000336
に等しい信号を示す。(例えば、図10bを参照されたい)
2.セクションIに記載されているような予測方法であって、セクションIのステップ2において、関与する行列ベクトル積の整数近似に対して以下が行われる:
Figure 2023145655000337
である、固定
Figure 2023145655000338
について、(平均化された)境界サンプル
Figure 2023145655000339
から、ベクトル
Figure 2023145655000340
が計算され、
Figure 2023145655000341
の場合、
Figure 2023145655000342
であり、
Figure 2023145655000343
の場合、
Figure 2023145655000344
であり、
Figure 2023145655000345
は、
Figure 2023145655000346
の平均値を示す。そして、ベクトル
Figure 2023145655000347
は、セクションIのステップ2からの(ダウンサンプリングされた)予測信号
Figure 2023145655000348

Figure 2023145655000349
のように与えられるように行列ベクトル積
Figure 2023145655000350
(の整数実現)の入力として機能する。この式において、
Figure 2023145655000351
は、(ダウンサンプリングされた)予測信号の領域内の各サンプル位置について
Figure 2023145655000352
に等しい信号を示す。(例えば、図10cを参照されたい)
3.セクションIに記載されているような予測方法であって、行列ベクトル積
Figure 2023145655000353
の整数実現が、行列ベクトル積
Figure 2023145655000354
内の係数
Figure 2023145655000355
を使用することによって与えられる。(例えば、図11を参照されたい)
4.セクションIに記載されているような予測方法であって、ステップ2は、複数の予測モードが計算されることができるようにK個の行列のうちの1つを使用し、それぞれがk=0...K-1を有する異なる行列
Figure 2023145655000356
を使用し、行列ベクトル積
Figure 2023145655000357
の整数実現は、行列ベクトル積
Figure 2023145655000358
内の係数
Figure 2023145655000359
を使用することによって与えられる。(例えば、図12を参照されたい)
すなわち、本出願の実施形態によれば、符号化器および復号器は、図9を参照して、ピクチャ10の所定のブロック18を予測するために以下のように機能する。予測のために、複数の参照サンプルが使用される。上記概説したように、本出願の実施形態は、イントラ符号化に限定されず、したがって、参照サンプルは、隣接サンプル、すなわちピクチャ10の隣接ブロック18のサンプルに限定されない。特に、参照サンプルは、ブロックの外縁に当接するサンプルなど、ブロック18の外縁に沿って配置されたものに限定されない。しかしながら、この状況は、確かに本出願の一実施形態である。
予測を行うために、参照サンプル17aおよび17cなどの参照サンプルからサンプル値ベクトル400が形成される。可能な形成が上述された。形成は、平均化を含むことができ、それによって形成に寄与する参照サンプル17と比較してサンプル102の数またはベクトル400の成分の数を減らすことができる。形成はまた、上述したように、ブロック18の幅および高さなどのブロック18の寸法またはサイズに何らかの形で依存することができる。
ブロック18の予測を取得するためにアフィンまたは線形変換を受けるべきはこのベクトル400である。異なる命名法が上記で使用されている。最新のものを使用して、オフセットベクトルbとの加算を実行する範囲内で、行列ベクトル積によって行列Aにベクトル400を適用することによって予測を実行することが目的である。オフセットベクトルbは任意である。AまたはAおよびbによって決定されるアフィンまたは線形変換は、符号化器および復号器によって、またはより正確には、既に上述したようにブロック18のサイズおよび寸法に基づいて予測のために決定されることができる。
しかしながら、上記概説した計算効率の改善を達成するために、または予測を実施に関してより効果的にするために、アフィンまたは線形変換は量子化されており、符号化器および復号器、またはその予測器は、アフィン変換の量子化バージョンを表す、上記の方法で適用されたCおよびTを用いて、線形またはアフィン変換を表し、実行するために、上記のCおよびTを使用した。特に、符号化器および復号器内の予測器は、ベクトル400を行列Aに直接適用する代わりに、サンプル値ベクトル400から得られたベクトル402を、所定の可逆線形変換Tを介してマッピングに供することによって適用する。ここで使用される変換Tは、ベクトル400が同じサイズを有する限り同じであり、すなわち、ブロックの寸法、すなわち幅および高さに依存せず、または異なるアフィン/線形変換に対して少なくとも同じである。上記では、ベクトル402は、yで示されている。機械学習によって決定されたアフィン/線形変換を実行するための正確な行列はBであった。しかしながら、正確にBを実行する代わりに、符号化器および復号器における予測は、その近似または量子化バージョンによって行われる。特に、表現は、Cを上記で概説した方法で適切に表すことによって行われ、C+MはBの量子化バージョンを表す。
したがって、符号器および復号器における予測は、ベクトル402と、符号器および復号器において適切に表され記憶された所定の予測行列Cとの間の行列ベクトル積404を上記の方法で計算することによってさらに遂行される。次いで、この行列ベクトル積から生じるベクトル406は、ブロック18のサンプル104を予測するために使用される。上述したように、予測のために、ベクトル406の各成分は、Cの対応する定義を補償するために、408において示されるようにパラメータaとの加算を受けることができる。オフセットベクトルbとのベクトル406の任意選択の加算もまた、ベクトル406に基づくブロック18の予測の導出に含まれることができる。上述したように、ベクトル406の各成分、したがって、ベクトル406の合計の各成分、408において示された全てのaのベクトル、および任意選択のベクトルbは、ブロック18のサンプル104に直接対応し、したがって、サンプルの予測値を示すことができる。ブロックのサンプル104のサブセットのみがそのように予測され、108などのブロック18の残りのサンプルが補間によって導出されることも可能である。
上述したように、aを設定するための異なる実施形態がある。例えば、ベクトル400の成分の算術平均であってもよい。その場合については、図10を参照されたい。可逆線形変換Tは、図10に示すようなものとすることができる。iは、それぞれサンプル値ベクトルおよびベクトル402の所定の成分であり、aで置き換えられる。しかしながら、上記でも示したように、他の可能性もある。しかしながら、Cの表現に関する限り、それは異なって具現化されることができることも上記で示されている。例えば、行列ベクトル積404は、その実際の計算において、より低い次元を有するより小さい行列ベクトル積の実際の計算になることができる。特に、上記のように、Cの定義により、その第iの列412の全体が0になるため、積404の実際の計算は、成分
Figure 2023145655000360
の省略によるベクトル402から生じるベクトル402の縮小バージョンによって、すなわち、この縮小ベクトル410に、第iの列412を除外することによってCから生じる縮小行列C’を乗算することによって行われることができる。
Cの重みまたはC’の重み、すなわちこの行列の成分は、固定小数点数表現で表現および記憶されることができる。しかしながら、これらの重み414はまた、上述したように、異なるスケールおよび/またはオフセットに関連する方法で記憶されてもよい。スケールおよびオフセットは、行列C全体に対して定義されてもよく、すなわち、行列Cまたは行列C’の全ての重み414に対して等しくてもよく、または行列Cおよび行列C’の同じ行の全ての重み414または同じ列の全ての重み414に対してそれぞれ一定または等しくなるように定義されてもよい。これに関して、図11は、行列ベクトル積の計算、すなわち積の結果が、実際には僅かに異なって実行されることができること、すなわち、例えば、スケールとの乗算をベクトル402または404に向かってシフトすることによって実行されることができ、それにより、さらに実行されなければならない乗算の数が低減されることを示している。図12は、上記の計算(2)で行われたように、CまたはC’の全ての重み414に対して1つのスケールおよび1つのオフセットを使用する場合を示している。
実施形態によれば、ピクチャの所定のブロックを予測するための本明細書に記載の装置は、以下の特徴を含む行列ベースのサンプル内予測を使用するように構成されることができる:
装置は、複数の参照サンプル17からサンプル値ベクトルpTemp[x]400を形成するように構成される。pTemp[x]が2*boundarySizeであると仮定すると、pTemp[x]は、例えば、直接コピーによって、またはサブサンプリングもしくはプールによって、所定のブロックの先頭に位置する隣接サンプル、x=0..boundarySize-1を有するredT[x]、続いて所定のブロックの左に位置する隣接サンプル、x=0..boundarySize-1を有するredL[x](例えば、転置=0の場合)によって、または転置処理(例えば、転置=1の場合)の場合にはその逆によってポピュレートされることができる。
x=0..inSize-1の入力値p[x]が導出され、すなわち、装置は、以下のように、サンプル値ベクトルpTemp[x]から、サンプル値ベクトルpTemp[x]が所定の可逆線形変換によってマッピングされるさらなるベクトルp[x]を導出するように、またはより具体的な所定の可逆アフィン線形変換であるように構成される。
-mipSizeIdが2に等しい場合、以下が適用される:
p[x]=pTemp[x+1]-pTemp[0]
-そうでない場合(mipSizeIdが2未満)、以下が適用される:
p[0]=(1<<(BitDepth-1))-pTemp[0]
p[x]=pTemp[x]-pTemp[0] x=1..inSize-1の場合
ここで、変数mipSizeIdは、所定のブロックのサイズを示す。すなわち、本実施形態によれば、サンプル値ベクトルからさらなるベクトルが導出されるために使用する可逆変換は、所定のブロックのサイズに依存する。依存性は、以下にしたがって与えられることができる。
Figure 2023145655000361
predSizeは、所定のブロック内の予測サンプルの数を示し、2*bondarySizeは、サンプル値ベクトルのサイズを示し、inSize、すなわち、inSize=(2*boundarySize)-(mipSizeId==2)?1:0にしたがってさらなるベクトルのサイズに関連する。1:0。より正確には、inSizeは、計算において実際に関与するさらなるベクトルの成分の数を示す。inSizeは、小さいブロックサイズではサンプル値ベクトルのサイズと同じサイズであり、大きいブロックサイズでは1つの成分がより小さい。前者の場合、1つの成分、すなわち、後に計算される行列ベクトル積のように、さらなるベクトルの所定の成分に対応する成分は無視されてもよく、対応するベクトル成分の寄与は、いずれにせよ0になり、したがって実際に計算される必要はない。ブロックサイズへの依存性は、2つの代替例のうちの1つのみが必然的に使用される、すなわちブロックサイズに関係なく使用される代替実施形態の場合には残されることができる(mipSizeIdに対応するオプションが2未満であるか、またはmipSizeIdに対応するオプションが2に等しい)。
換言すれば、所定の可逆線形変換は、例えば、さらなるベクトルpの所定の成分がaになり、他の全ての成分がサンプル値ベクトルマイナスaの成分に対応するように定義され、例えば、a=pTemp[0]である。2に等しいmipSizeIdに対応する第1のオプションの場合、これは容易に見え、さらなるベクトルの別個に形成された成分のみがさらに考慮される。すなわち、第1のオプションの場合、さらなるベクトルは、実際には{p[0...inSize];pTemp[0]}であり、pTemp[0]はaであり、行列ベクトル積をもたらすために行列ベクトル乗算の実際に計算された部分、すなわち乗算の結果は、行列が計算を必要としない0列を有するため、さらなるベクトルおよび行列の対応する列のinSize成分のみに制限される。他の場合には、2よりも小さいmipSizeIdに対応して、p[0]を除くさらなるベクトルの全ての成分として、a=pTemp[0]が選択され、すなわち、所定の成分p[0]を除くさらなるベクトルpの他の成分p[x](x=1..inSize-1の場合)のそれぞれは、サンプル値ベクトルpTemp[x]の対応する成分マイナスaに等しいが、p[0]は、定数マイナスaであるように選択される。次いで、行列ベクトル積が計算される。定数は、表現可能な値の平均、すなわち2x-1(すなわち、1<<(BitDepth-1))であり、xは使用される計算表現のビット深度を示す。p[0]が代わりにpTemp[0]であるように選択された場合、計算された積は、上記のようにp[0]を使用して計算された積(p[0]=(1<<(BitDepth-1))-pTemp[0])から、積、すなわち予測ベクトルに基づいてブロック内部を予測するときに考慮することができる定数ベクトルだけ逸脱することに留意されたい。したがって、値aは、所定値、例えばpTemp[0]である。所定値pTemp[0]は、この場合、例えば、所定の成分p[0]に対応するサンプル値ベクトルpTempの成分である。それは、所定のブロックの左上隅に最も近い、所定のブロックの上または所定のブロックの左に隣接するサンプルとすることができる。
例えばイントラ予測モードを指定するなど、predModeIntraにかかるサンプル内予測プロセスの場合、装置は、例えば、以下のステップを適用するように構成され、例えば、少なくとも第1のステップを実行する:
1.x=0..predSize-1、y=0..predSize-1である行列ベースのイントラ予測サンプルpredMip[x][y]は、以下のように導出される:
-変数modeIdは、predModeIntraと等しく設定される。
-x=0..inSize-1、y=0..predSize*predSize-1の重み行列mWeight[x][y]は、mipSizeIdとmodeIdを入力としてMIP重み行列導出プロセスを呼び出すことによって導出される。
-x=0..predSize-1、y=0..predSize-1である行列ベースのイントラ予測サンプルpredMip[x][y]は、以下のように導出される:
oW=32-32*(
Figure 2023145655000362

predMip[x][y]=(((
Figure 2023145655000363
)+
oW)>>6)+pTemp[0]
換言すれば、装置は、ここでは、アレイpredMip[x][y]をもたらすように所定のブロックの内側に分布するブロック位置{x,y}のアレイに既に割り当てられている予測ベクトルを取得するために、さらなるベクトルp[i]の間の行列ベクトル積、またはmipSizeIdが2に等しい場合、{p[i];pTemp[0]}および所定の予測行列mWeight、またはmipSizeIdが2よりも小さい場合、pの省略された成分に対応する追加のゼロ重み線を有する予測行列mWeightを計算するように構成される。予測ベクトルは、predMip[x][y]の行またはpredMip[x][y]の列の連結にそれぞれ対応する。
実施形態によれば、または異なる解釈によれば、成分(((
Figure 2023145655000364
)+oW)>>6)のみが予測ベクトルとして理解され、装置は、予測ベクトルに基づいて所定のブロックのサンプルを予測する際に、予測ベクトルの各成分について、それぞれの成分とaとの和、例えば、pTemp[0]を計算するように構成される。
装置は、任意選択的に、予測ベクトルに基づいて所定のブロックのサンプルを予測する際に以下のステップ、例えばpredMipまたは((
Figure 2023145655000365
)+oW)>>6をさらに実行するように構成されることができる。
2.x=0..predSize-1、y=0..predSize-1である行列ベースのイントラ予測サンプルpredMip[x][y]は、例えば、以下のようにクリップされる:
predMip[x][y]=Clip1(predMip[x][y])
3.転置が真に等しい場合、x=0..predSize-1、y=0..predSize-1のpredSize×predSizeアレイpredMip[x][y]は、例えば、以下のように転置される:
predTemp[y][x]=predMip[x][y]
predMip=predTemp
4.x=0..nTbW-1、y=0..nTbH-1である予測サンプルpredSamples[x][y]は、例えば、以下のように導出される:
-変換ブロック幅を指定するnTbWがpredSizeよりも大きいか、変換ブロック高さを指定するnTbHがpredSizeよりも大きい場合、MIP予測アップサンプリングプロセスは、入力ブロックサイズpredSize、x=0..predSize-1、y=0..predSize-1を有する行列ベースのイントラ予測サンプルpredMip[x][y]、変換ブロック幅nTbW、変換ブロック高さnTbH、x=0..nTbW-1を有する上位参照サンプルrefT[x]、およびy=0..nTbH-1を有する左参照サンプルrefL[y]を入力として呼び出され、出力は予測サンプルアレイpredSamplesである。
-そうでない場合、x=0..nTbW-1、y=0..nTbH-1であるpredSamples[x][y]は、predMip[x][y]と等しく設定される。
換言すれば、装置は、予測ベクトルpredMipに基づいて所定のブロックのサンプルpredSamplesを予測するように構成される。
図13は、複数の参照サンプルを使用してピクチャの所定のブロックを予測するための方法2000であって、複数の参照サンプルからサンプル値ベクトルを形成すること2100と、サンプル値ベクトルから、サンプル値ベクトルが所定の可逆線形変換によってマッピングされるさらなるベクトルを導出すること2200と、予測ベクトルを取得するために、さらなるベクトルと所定の予測行列との間の行列ベクトル積を計算すること2300と、予測ベクトルに基づいて所定のブロックのサンプルを予測すること2400と、を含む、方法2000を示している。
参考文献
[1]P.Helleら、「Non-linear weighted intra prediction」、JVET-L0199,、マカオ、中国、2018年10月。
[2]F.Bossen、J.Boyce、K.Suehring、X.Li,V.Seregin、「JVET common test conditions and software reference configurations for SDR video」、JVET-K1010、リュブリャナ、スロベニア、2018年7月。
さらなる実施形態および例
一般に、例は、プログラム命令を備えたコンピュータプログラム製品として実装されることができ、プログラム命令は、コンピュータプログラム製品がコンピュータ上で実行されると、方法の1つを実行するために機能する。プログラム命令は、例えば、機械可読媒体に記憶されてもよい。
他の例は、機械可読キャリアに記憶された、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを備える。
したがって、方法の例は、コンピュータプログラムがコンピュータ上で実行されると、本明細書に記載の方法の1つを実行するためのプログラム命令を有するコンピュータプログラムである。
したがって、方法のさらなる例は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムをその上に記録したデータキャリア媒体(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア媒体、デジタル記憶媒体または記録媒体は、無形で一時的な信号ではなく、有形および/または非一時的である。
したがって、方法のさらなる例は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、インターネットなどのデータ通信接続を介して転送されることができる。
さらなる例は、本明細書に記載の方法の1つを実行する処理手段、例えば、コンピュータ、またはプログラマブルロジックデバイスを備える。
さらなる例は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムをその上にインストールしたコンピュータを備える。
さらなる例は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを受信機に(例えば、電子的または光学的に)転送する装置またはシステムを備える。受信機は、例えば、コンピュータ、モバイル装置、メモリ装置などとすることができる。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えることができる。
いくつかの例では、プログラマブルロジックデバイス(例えば、フィールドプログラマブルゲートアレイ)が使用されて、本明細書に記載の方法の機能のいくつかまたは全てを実行することができる。いくつかの例では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法の1つを実行するためにマイクロプロセッサと協働することができる。一般に、方法は、任意の適切なハードウェア装置によって実行されてもよい。
上述した例は、上述した原理の単なる例示である。本明細書に記載された構成および詳細の変更および変形は明らかであろうことが理解される。したがって、本明細書の例の記載および説明として提示された特定の詳細によってではなく、差し迫った特許請求の範囲によって制限されることが意図されている。
等しいまたは同等の要素または等しいまたは同等の機能を有する要素は、異なる図で発生する場合であっても、等しいまたは同等の参照符号によって以下の説明で示されている。

Claims (23)

  1. 複数の参照サンプル(17a、c)を使用してピクチャ(10)の所定のブロック(18)を予測するための装置(1000)であって、
    前記複数の参照サンプル(17a、c)からサンプル値ベクトル(102,400)、pTemp[x]を形成し(100)、
    前記所定のブロックのサイズを示す変数mipSizeIdを取得し、
    inSizeを、さらなるベクトル、p[x]の成分であって、前記さらなるベクトル、p[x]の導出に関わる成分の数として、x=1,2,…,inSizeに対して、前記変数mipSizeIdが2に等しい場合、
    p[x]=pTemp[x+1]-pTemp[0]
    によって、前記変数mipSizeIdが2に等しくない場合、
    p[x]=pTemp[x]-pTemp[0]
    によって、前記サンプル値ベクトル(102、400)、pTemp[x]が所定の可逆線形変換(403)によってマッピングされるさらなるベクトル(402)、p[x]を導出し、
    Figure 2023145655000366
    にしたがって、予測アレイ(406)、predMip[x][y]を取得するために、前記さらなるベクトル(402)、p[x]と所定の予測行列(405)、mWeight[x][y]との間の行列ベクトル積(404)を計算し、
    前記予測アレイ(406)、predMip[x][y]に基づいて前記所定のブロック(18)のサンプルを予測する、ように構成されている、装置(1000)。
  2. 前記所定の可逆線形変換(403)が、
    前記さらなるベクトル(402)の所定の成分(1500)がaとなり、
    前記所定の成分(1500)を除く前記さらなるベクトル(402)の他の成分のそれぞれが、前記サンプル値ベクトル(102,400)の対応する成分マイナスaに等しく、
    式中、aが所定値(1400)である、ように定義される、請求項1に記載の装置(1000)。
  3. 前記所定値(1400)が、
    前記サンプル値ベクトル(102、400)の成分の算術平均または加重平均などの平均、
    デフォルト値、
    前記ピクチャ(10)が符号化されるデータストリームでシグナリングされる値、および
    前記所定の成分(1500)に対応する前記サンプル値ベクトル(102、400)の成分、のうちの1つである、請求項2に記載の装置(1000)。
  4. 前記所定の可逆線形変換(403)が、
    前記さらなるベクトル(402)の所定の成分(1500)がaとなり、
    前記所定の成分(1500)を除く前記さらなるベクトル(402)の他の成分のそれぞれが、前記サンプル値ベクトル(102,400)の対応する成分マイナスaに等しく、
    式中、aが前記サンプル値ベクトル(102、400)の成分の算術平均である、ように定義される、請求項1に記載の装置(1000)。
  5. 前記所定の可逆線形変換(403)が、
    前記さらなるベクトル(402)の所定の成分(1500)がaまたは定数マイナスaとなり、
    前記所定の成分(1500)を除く前記さらなるベクトル(402)の他の成分のそれぞれが、前記サンプル値ベクトル(102、400)の対応する成分マイナスaに等しく、
    aが前記所定の成分(1500)に対応する前記サンプル値ベクトル(102、400)の成分である、ように定義され、
    前記装置(1000)が、
    それぞれが前記さらなるベクトル(402)の一方の成分に関連付けられた複数の可逆線形変換を含み、
    前記サンプル値ベクトル(102、400)の成分から前記所定の成分(1500)を選択し、
    前記所定の可逆線形変換(403)として前記所定の成分(1500)に関連付けられた前記複数の可逆線形変換のうちの前記可逆線形変換を使用する、ように構成されている、請求項1に記載の装置(1000)。
  6. 前記さらなるベクトル(402)の前記所定の成分(1500)に対応する前記所定の予測行列(405)の列内の前記所定の予測行列(405)の行列成分が全て0であり、前記装置(1000)が、
    前記列(412)を除外することによって前記所定の予測行列(405)から結果として生じる縮小予測行列(405)と、前記所定の成分(1500)を除外することによって前記さらなるベクトル(402)から結果として生じるなおさらなるベクトル(410)との間の行列ベクトル積(407)を計算することによって乗算を実行することによって前記行列ベクトル積(404)を計算するように構成されている、請求項2に記載の装置(1000)。
  7. 前記予測アレイ(406)に基づいて前記所定のブロック(18)の前記サンプルを予測する際に、
    前記予測アレイ(406)の各成分について、前記それぞれの成分とaとの和を計算するように構成されている、請求項2に記載の装置(1000)。
  8. 前記さらなるベクトル(402)の前記所定の成分(1500)に対応する前記所定の予測行列(405)の列内の前記所定の予測行列(405)の各行列成分を、前記所定の可逆線形変換(403)の1倍と合計した行列が、機械学習予測行列(1100)の量子化バージョンに対応する、請求項2に記載の装置(1000)。
  9. 前記サンプル値ベクトル(102、400)の各成分について、前記複数の参照サンプル(17a、c)から前記サンプル値ベクトル(102、400)を形成し(100)、
    前記複数の参照サンプル(17a、c)のうちの一方の参照サンプルを前記サンプル値ベクトル(102、400)の前記それぞれの成分として採用し、および/または
    前記サンプル値ベクトル(102、400)の2つ以上の成分を平均化して、前記サンプル値ベクトル(102、400)の前記それぞれの成分を取得する、
    ように構成されている、請求項1に記載の装置(1000)。
  10. 前記複数の参照サンプル(17a、c)が、前記所定のブロック(18)の外縁に沿って前記ピクチャ(10)内に配置される、請求項1に記載の装置(1000)。
  11. 固定小数点演算を使用して前記行列ベクトル積(404)を計算するように構成されている、請求項1に記載の装置(1000)。
  12. 浮動小数点演算を使用せずに前記行列ベクトル積(404)を計算するように構成されている、請求項1に記載の装置(1000)。
  13. 前記所定の予測行列(405)の固定小数点数表現を記憶するように構成されている、請求項1に記載の装置(1000)。
  14. 予測パラメータを使用して前記所定の予測行列(405)を表し、前記さらなるベクトル(402)の前記成分、ならびに前記予測パラメータおよびそれから生じる中間結果に対して乗算および加算を実行することによって前記行列ベクトル積(404)を計算するように構成され、前記予測パラメータの絶対値が、nビットの固定小数点数表現によって表されることができ、nが14以下、あるいは10以下、あるいは8以下である、請求項1に記載の装置(1000)。
  15. 前記予測パラメータが、
    それぞれが前記所定の予測行列(405)の対応する行列成分に関連付けられた重みを含む、請求項14に記載の装置(1000)。
  16. 前記予測パラメータが、
    それぞれが前記所定の予測行列(405)の1つ以上の対応する行列成分に関連付けられた前記重みをスケーリングするために前記所定の予測行列(405)の前記1つ以上の対応する行列成分に関連付けられた1つ以上のスケーリング係数、および/または
    それぞれが前記所定の予測行列(405)の1つ以上の対応する行列成分に関連付けられた前記重みをオフセットするために前記所定の予測行列(405)の前記1つ以上の対応する行列成分に関連付けられた1つ以上のオフセット、をさらに含む、請求項15に記載の装置(1000)。
  17. 前記予測アレイ(406)に基づいて前記所定のブロック(18)の前記サンプルを予測する際に、
    各成分が前記所定のブロック(18)内の対応する位置に関連付けられている前記予測アレイ(406)に基づいて前記所定のブロック(18)の少なくとも1つのサンプル位置を計算するために補間を使用するように構成されている、請求項1に記載の装置(1000)。
  18. ピクチャを符号化するための装置であって、
    予測信号を取得するために、請求項1から17のいずれか一項に記載の複数の参照サンプル(17a、c)を使用して前記ピクチャの所定のブロック(18)を予測するための装置と、
    前記予測信号を補正するために、前記所定のブロックの予測残差を符号化するように構成されたエントロピー符号化器と、を備える、装置。
  19. ピクチャを復号するための装置であって、
    予測信号を取得するために、請求項1から17のいずれか一項に記載の複数の参照サンプル(17a、c)を使用して前記ピクチャの所定のブロック(18)を予測するための装置と、
    前記所定のブロックに対する予測残差を復号するように構成されたエントロピー復号器と、
    前記予測残差を使用して前記予測信号を補正する予測補正器と、を備える、装置。
  20. 複数の参照サンプル(17a、c)を使用してピクチャの所定のブロック(18)を予測するための方法(2000)であって、
    前記複数の参照サンプルからサンプル値ベクトル(102,400)、pTemp[x]を形成すること(2100、100)と、
    前記所定のブロックのサイズを示す変数mipSizeIdを取得することと、
    inSizeを、さらなるベクトル、p[x]の成分であって、前記さらなるベクトル、p[x]の導出に関わる成分の数として、x=1,2,…,inSizeに対して、前記変数mipSizeIdが2に等しい場合、
    p[x]=pTemp[x+1]-pTemp[0]
    によって、前記変数mipSizeIdが2に等しくない場合、
    p[x]=pTemp[x]-pTemp[0]
    によって、前記サンプル値ベクトル、pTemp[x]が所定の可逆線形変換(403)によってマッピングされるさらなるベクトル(402)、p[x]を導出すること(2200)と、
    Figure 2023145655000367
    にしたがって、予測アレイ(406)、predMip[x][y]を取得するために、前記さらなるベクトル(402)、p[x]と所定の予測行列(405)、mWeight[x][y]との間の行列ベクトル積(404)を計算すること(2300)と、
    前記予測アレイ(406)、predMip[x][y]に基づいて前記所定のブロックのサンプルを予測すること(2400)と、を含む、方法(2000)。
  21. ピクチャを符号化するための方法であって、
    予測信号を取得するために、請求項20に記載の方法(2000)にしたがって複数の参照サンプル(17a、c)を使用して前記ピクチャの所定のブロック(18)を予測することと、
    前記予測信号を補正するために、前記所定のブロックの予測残差をエントロピー符号化することと、を含む、方法。
  22. ピクチャを復号するための方法であって、
    予測信号を取得するために、請求項20に記載の方法(2000)に対して複数の参照サンプル(17a、c)を使用して前記ピクチャの所定のブロック(18)を予測することと、
    前記所定のブロックに対する予測残差をエントロピー復号することと、
    前記予測残差を使用して前記予測信号を補正することと、を含む、方法。
  23. コンピュータ上で実行されると、請求項20から22のいずれか一項に記載の方法を実行するためのプログラムコードを有するコンピュータプログラム。
JP2023125709A 2019-05-10 2023-08-01 ブロックベース予測 Pending JP2023145655A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP19173830.1 2019-05-10
EP19173830 2019-05-10
JP2021566185A JP7325540B2 (ja) 2019-05-10 2020-05-11 ブロックベース予測
PCT/EP2020/063018 WO2020229394A1 (en) 2019-05-10 2020-05-11 Matrix-based intra prediction

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021566185A Division JP7325540B2 (ja) 2019-05-10 2020-05-11 ブロックベース予測

Publications (1)

Publication Number Publication Date
JP2023145655A true JP2023145655A (ja) 2023-10-11

Family

ID=66483932

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021566185A Active JP7325540B2 (ja) 2019-05-10 2020-05-11 ブロックベース予測
JP2023125709A Pending JP2023145655A (ja) 2019-05-10 2023-08-01 ブロックベース予測

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021566185A Active JP7325540B2 (ja) 2019-05-10 2020-05-11 ブロックベース予測

Country Status (9)

Country Link
US (1) US20220058239A1 (ja)
EP (1) EP3967037A1 (ja)
JP (2) JP7325540B2 (ja)
KR (1) KR20220013941A (ja)
CN (1) CN114073087A (ja)
BR (1) BR112021022540A2 (ja)
MX (1) MX2021013521A (ja)
TW (2) TWI771679B (ja)
WO (1) WO2020229394A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020207497A1 (en) 2019-04-12 2020-10-15 Beijing Bytedance Network Technology Co., Ltd. Applicability of matrix-based intra prediction
CN113748676B (zh) 2019-04-16 2024-05-10 北京字节跳动网络技术有限公司 帧内编解码模式下的矩阵推导
KR20220002318A (ko) 2019-05-01 2022-01-06 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 필터링을 이용한 행렬 기반 인트라 예측
CN113728647B (zh) 2019-05-01 2023-09-05 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文编码
CN113812155B (zh) * 2019-05-11 2023-10-27 北京字节跳动网络技术有限公司 多种帧间编解码方法之间的交互
SG11202112517QA (en) 2019-05-22 2021-12-30 Beijing Bytedance Network Technology Co Ltd Matrix-based intra prediction using upsampling
KR20220013939A (ko) 2019-05-31 2022-02-04 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 행렬 기반 인트라 예측에서의 제한된 업샘플링 프로세스
EP3963885A4 (en) 2019-06-05 2022-12-14 Beijing Bytedance Network Technology Co., Ltd. DETERMINING CONTEXT FOR MATRIX-BASED INTRAPREDICTION
CN114641997A (zh) 2019-10-28 2022-06-17 北京字节跳动网络技术有限公司 基于颜色分量的语法信令通知和解析
WO2022119301A1 (ko) * 2020-12-01 2022-06-09 현대자동차주식회사 인트라 예측을 이용하는 비디오 코딩 방법 및 장치

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9491460B2 (en) * 2013-03-29 2016-11-08 Qualcomm Incorporated Bandwidth reduction for video coding prediction
TWI557724B (zh) * 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
US10235338B2 (en) * 2014-09-04 2019-03-19 Nvidia Corporation Short stack traversal of tree data structures
US20180115787A1 (en) * 2015-04-12 2018-04-26 Lg Electronics Inc. Method for encoding and decoding video signal, and apparatus therefor
US10425648B2 (en) * 2015-09-29 2019-09-24 Qualcomm Incorporated Video intra-prediction using position-dependent prediction combination for video coding
US10390048B2 (en) * 2016-02-15 2019-08-20 Qualcomm Incorporated Efficient transform coding using optimized compact multi-pass transforms
US11368681B2 (en) * 2016-07-18 2022-06-21 Electronics And Telecommunications Research Institute Image encoding/decoding method and device, and recording medium in which bitstream is stored
CN108289222B (zh) * 2018-01-26 2020-01-14 嘉兴学院 一种基于结构相似度映射字典学习的无参考图像质量评价方法
US11134257B2 (en) 2019-04-04 2021-09-28 Tencent America LLC Simplified signaling method for affine linear weighted intra prediction mode
CN114073081A (zh) 2019-06-25 2022-02-18 弗劳恩霍夫应用研究促进协会 使用基于矩阵的帧内预测和二次变换进行编码
KR20220030918A (ko) 2019-07-10 2022-03-11 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 색 성분 예측 방법, 인코더, 디코더 및 저장 매체

Also Published As

Publication number Publication date
MX2021013521A (es) 2022-01-24
TWI771679B (zh) 2022-07-21
WO2020229394A1 (en) 2020-11-19
TWI816439B (zh) 2023-09-21
TW202101992A (zh) 2021-01-01
KR20220013941A (ko) 2022-02-04
JP7325540B2 (ja) 2023-08-14
US20220058239A1 (en) 2022-02-24
JP2022531902A (ja) 2022-07-12
EP3967037A1 (en) 2022-03-16
TW202315408A (zh) 2023-04-01
CN114073087A (zh) 2022-02-18
BR112021022540A2 (pt) 2021-12-28

Similar Documents

Publication Publication Date Title
JP2023145655A (ja) ブロックベース予測
TWI755665B (zh) 使用具有鄰近取樣縮減的線性或仿射變換的內預測
EP3232664B1 (en) Method for decoding using an interpolation filter
JP7477538B2 (ja) 行列ベースのイントラ予測および二次変換を使用したコーディング
JP7455869B2 (ja) イントラ予測を用いた符号化
US20230188720A1 (en) MIP for All Channels in the Case of 4:4:4-Chroma Format and of Single Tree

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230801