JP2018530968A - 空間イントラ予測のためのヘルパーデータを用いたビデオ符号化 - Google Patents

空間イントラ予測のためのヘルパーデータを用いたビデオ符号化 Download PDF

Info

Publication number
JP2018530968A
JP2018530968A JP2018518710A JP2018518710A JP2018530968A JP 2018530968 A JP2018530968 A JP 2018530968A JP 2018518710 A JP2018518710 A JP 2018518710A JP 2018518710 A JP2018518710 A JP 2018518710A JP 2018530968 A JP2018530968 A JP 2018530968A
Authority
JP
Japan
Prior art keywords
prediction
value
helper
video stream
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018518710A
Other languages
English (en)
Inventor
ヤニ ライネマ
ヤニ ライネマ
アリレザ アミンロウ
アリレザ アミンロウ
Original Assignee
ノキア テクノロジーズ オーユー
ノキア テクノロジーズ オーユー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノキア テクノロジーズ オーユー, ノキア テクノロジーズ オーユー filed Critical ノキア テクノロジーズ オーユー
Publication of JP2018530968A publication Critical patent/JP2018530968A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

ビデオストリームを復号する際、符号化ビデオストリームが、予測モードの標示および1つ以上の予測ヘルパー値の標示と共に受信される。この符号化ビデオストリームを復号する際に、標示された前記予測モードおよび前記予測ヘルパー値に基づいて、少なくとも1つのサンプルそれぞれの予測値が計算される。復号されたビデオストリームは、計算された前記予測値を用いて復号された前記少なくとも1つのサンプルを含み、コンピュータ可読メモリおよびグラフィカルディスプレイの少なくとも1つに出力される。前記ヘルパー値を補助し、予測単位の任意の行または列において非線形の予測値を得られるように、任意の段階関数を用いることができる。エンコーダ側において、当該エンコーダが前記予測ヘルパー値を決定し、それを用いて前記ビデオストリームを符号化し、格納またはデコーダに伝送する。
【選択図】図3

Description

本発明は、デジタルの画像およびビデオの処理、具体的には、そのような画像およびビデオの通信および格納のための符号化および復号に関する。
背景
ここで使用する略語の一覧を、本明細書の末尾に示している。推奨規格ITU-T H.263およびH.264(04/2015)は、ビデオ情報を2段階で符号化する一般的なハイブリッドビデオコーデックを提供している。第1段階で、例えば動き補償手段や空間手段によって、特定のピクチャ領域(「ブロック」と称する)のピクセル値が予測される。動き補償は通常、符号化されるブロックと密接に対応する、先に符号化済みのビデオフレームの1つにある領域を探して示すことを含み、空間手段は通常、特定の方法で符号化されるブロックの周辺のピクセル値を用いることを含む。第2段階で、予測誤差が符号化される。予測誤差とは、ピクセルの予測ブロックとそのピクセルの元のブロックとの間の差である。予測誤差の符号化は、一般的に、例えば、離散コサイン変換(Discrete Cosine Transform:DCT)やその変形などの特定の変換を用いてピクセル値の差を変換し、係数を量子化し、量子化済み係数をエントロピー符号化することによって行われる。量子化処理の忠実性を変えることによって、エンコーダはピクセル表現の正確性(ピクチャ品質)と結果として得られる符号化ビデオ表現のサイズ(ファイルサイズまたは伝送ビットレート)との間のバランスを制御することができる。
別の画像/ビデオ符号化規格として、高効率ビデオ符号化(High Efficiency Video Coding:HEVC)とも呼ばれるITU-T H.265がある。この手法では、方向フィルタリングを用いてフレーム内サンプル予測ブロックを構築し、選択された予測方向を用いて予測対象のサンプルのサンプル位置を参照行に投影し、さらに1次元線形フィルタを適用してサンプルの予測値を補間する。真水平または真垂直の予測方向の場合、ブロック境界の1つが、サンプル勾配ベースフィルタによってさらにフィルタされる。HEVCは、直流(Direct Current:DC)予測モードおよび平面予測モードも定義している。DC予測では、参照サンプルのDC成分を計算し、そのDC成分をブロック内のサンプルの予測に用いる。平面予測では、2つの線形予測の平均を計算し、平坦なサンプル表面を有するブロックを予測する。
前述のことから、空間イントラ予測は一般的に、サンプル予測ブロックをそのブロックの周囲の復号されたサンプルに基づいて作成することが明らかである。この手法では、そのブロック内の特定種類の構造を非常に適切にモデル化できるが、同時に、一部のテクスチャの共通クラスを予測できない。例えば、方向サンプル予測では、サポートされている予測方向に一致する形状を正確にモデル化できるが、参照サンプルから離れるほど予測の信頼性が低下する傾向があり、選択された予測方向に沿って予測誤差が現れ始める。以下により詳細に示すこれらの教示の実施形態において、このような先行技術の欠点などに対応する。
摘要
これらの教示の第1の態様によると、ビデオストリームを符号化する方法が提供される。前記方法は、符号化ビデオストリームと共に、予測モードの標示と1つ以上の予測ヘルパー値の標示を受信することと、前記符号化ビデオストリームを復号する際に、受信した前記予測モードの標示および受信した前記1つ以上の予測ヘルパー値に基づいて、少なくとも1つのサンプルそれぞれの予測値を計算することと、出力される復号されたビデオストリームに、計算された前記予測値を用いて復号された前記少なくとも1つのサンプルを含めて、前記復号されたビデオストリームをコンピュータ可読メモリおよびグラフィカルディスプレイの少なくとも1つへと明確に出力することとを含む。
これらの教示の第2の態様によると、コンピュータプログラム命令を格納するコンピュータ可読メモリが提供される。前記コンピュータプログラム命令は、1つ以上のプロセッサによって実行された場合、ホストデコーダ装置にビデオストリームの復号に向けた動作を実行させる。これに関して、前記動作は、符号化ビデオストリームと共に、予測モードの標示および1つ以上の予測ヘルパー値の標示を受信することと、前記符号化ビデオストリームを復号する際に、受信した前記予測モードの標示および受信した前記1つ以上の予測ヘルパー値に基づいて、少なくとも1つのサンプルそれぞれの予測値を計算することと、出力される復号されたビデオストリームに、計算された前記予測値を用いて復号された前記少なくとも1つのサンプルを含めて、前記復号されたビデオストリームをコンピュータ可読メモリおよびグラフィカルディスプレイの少なくとも1つへと明確に出力することとを含む。
これらの教示の第3の態様によると、ビデオストリームを復号する装置が提供される。前記装置は、コンピュータプログラム命令を格納する少なくとも1つのコンピュータ可読メモリと、少なくとも1つのプロセッサとを備える。前記コンピュータプログラム命令を含む前記コンピュータ可読メモリは、前記少なくとも1つのプロセッサによって、前記装置に以下の動作を実行させる。前記動作は、符号化ビデオストリームと共に、予測モードの標示および1つ以上の予測ヘルパー値の標示を受信することと、前記符号化ビデオストリームを復号する際に、受信した前記予測モードの標示および受信した前記1つ以上の予測ヘルパー値に基づいて、少なくとも1つのサンプルそれぞれの予測値を計算することと、出力される復号されたビデオストリームに、計算された前記予測値を用いて復号された前記少なくとも1つのサンプルを含めて、前記復号されたビデオストリームをコンピュータ可読メモリおよびグラフィカルディスプレイの少なくとも1つへと明確に出力することとを含む。
本発明の前述およびその他の態様を、以下においてより詳細に説明する。
図1は、ビデオ符号化技術において知られるように、ピクセル予測と予測誤差の2段階の処理を用いるビデオエンコーダの概略的ブロック図である。 図2は、ビデオ符号化技術において知られるように、図1の処理によって符号化されたビデオを復号する汎用ビデオデコーダの概略的ブロック図である。 図3Aは、垂直のみの予測方向を用いる符号化単位内の参照サンプルに対応する予測ブロックのサンプル位置に関して図3Bから図3Dで用いる表記法を示す図である。図3Bは、サンプル値予測における従来の手法を説明するために、図3Aの表記法を用いて1つの予測単位を含む符号化単位を示す図である。図3Cは、これらの教示によるサンプル値の線形予測の一例を説明するために、図3Aの表記法を用いて1つの予測単位を含む符号化単位を示す図である。図3Dは、これらの教示によるサンプル値の非線形予測の一例を説明するために、図3Aの表記法を用いて1つの予測単位を含む符号化単位を示す図である。 図4は、これらの教示の例示的実施形態による処理フロー図である。 図5は、これらの教示の特定の態様により実施される、ビデオストリームの符号化および復号に好適な特定の装置やデバイスを示す上位の概略的ブロック図である。
詳細説明
ビデオとは、個々のピクチャまたは画像の連続したストリームであり、ビデオ符号化では、離散した画像セット内の画像の多くに変更がない、またはわずかな変更しかないという事実を利用する。そのため、1つの画像は、対象のピクチャ周囲近傍の連続した他の画像、および同じ画像の他のセクションを参照して構成することができる。多くの場合、ビデオの個々の画像はフレームと呼ばれる。したがって、ビデオ符号化/復号では、1つ以上の他のフレームから対象フレームを予測するフレーム間予測(インター予測)と、対象フレームの1つ以上の他の部分から対象フレームの1つの部分を予測するフレーム内予測(イントラ予測)との両方が用いられる。コーデックとは、一般的に、特定の符号化および復号の手順を実行するソフトウェアを指すが、原則として、コーデックをハードウェア(回路)またはハードウェアとソフトウェアの組合わせとして体現することを妨げるものではない。これらの教示がもたらす、従来のコーデックより有利な点の理解を助けるために、図1に、前述の背景に示したように、また以下にさらに詳細に説明するように、ピクセル予測と予測誤差の2段階の処理を用いる汎用ビデオエンコーダの概略的ブロック図を示している。図1では以下の符号を用いている。
符号化対象の画像
P' 画像ブロックの予測表現
予測誤差信号
D' 再構成された予測誤差信号
I' 仮再構成された画像
R' 最終再構成された画像
T、T−1 変換および逆変換
Q、Q−1 量子化および逆量子化
E エントロピー符号化
RFM 参照フレームメモリ
inter インター予測
intra イントラ予測
MS モード選択
F フィルタリング
ソースピクチャおよび復号されたピクチャはそれぞれ、以下のサンプル配列セットの1つのような1つ以上のサンプル配列を含む。
・ 輝度(Y)のみ(モノクロ)
・ 輝度および2つの色差(YCbCrまたはYCgCo)
・ 緑、青、および赤(GBR、RGBとしても知られる)
・ 他の不特定のモノクロまたは三刺激色サンプリング(例えば、YZX、XYZとしても知られる)を表現する配列
以下において、これらの配列は輝度(すなわちLまたはY)および色差と呼ばれることがある。前述の2つの色差配列は、実際に用いる色表現方法にかかわらず、CbおよびCrと呼ばれることがある。実際に用いる色表現方法は、例えばH.264/AVCおよび/またはHEVCのビデオユーザビリティ情報(Video Usability Information:VUI)シンタックスを用いて、例えば符号化ビットストリームに示すことができる。成分は、1つの配列、または3つのサンプル配列(輝度および2つの色差)のうちの1つからの単一サンプル、またはモノクロフォーマットでピクチャを構成する配列、またはその配列の単一サンプルと定義してもよい。
H.264/AVCおよびHEVCでは、ピクチャはフレームまたはフィールドのいずれでもよい。フレームは輝度サンプルと、場合により対応する色差サンプルとの行列を含む。ソース信号がインターレースされる場合、フィールドは、フレームの交互のサンプル行のセットであり、エンコーダ入力として用いてもよい。色差サンプル配列はなくてもよく(したがってモノクロサンプリングを用いてもよい)、輝度サンプル配列と比較してサブサンプリングしてもよい。色差フォーマットは次のようにまとめられる。
・ モノクロサンプリングでは、サンプル配列が1つだけ存在し、名目上輝度配列と見なされる。
・ 4:2:0サンプリングでは、2つの色差配列の各々が輝度配列の半分の高さと半分の幅を有する。
・ 4:2:2サンプリングでは、2つの色差配列の各々が輝度配列と同じ高さと半分の幅を有する。
・ 4:4:4サンプリングでは、別個の色平面が使用されない場合、2つの色差配列の各々が輝度配列と同じ高さと幅を有する。
・ H.264/AVCおよびHEVCでは、サンプル配列を別個の色平面としてビットストリームに符号化し、そのビットストリームから符号化色平面をそれぞれ別々に復号することができる。別個の色平面が用いられる場合、それらの各々は(エンコーダおよび/またはデコーダによって)モノクロサンプリングのピクチャとして別々に処理される。
色差サブサンプリングが用いられる場合(例えば、4:2:0または4:2:2色差サンプリング)、輝度サンプルに対する色差サンプルの位置は、エンコーダ側で(例えば、前処理ステップや符号化の一部として)決定されてもよい。輝度サンプルの位置に対する色差サンプルの位置は、例えばH.264/AVCやHEVCなどの符号化規格で予め定義されていてもよい。あるいは、例えばH.264/AVCやHEVCのVUIの一部としてビットストリームに示されていてもよい。
パーティショニングとは、1つのセットの各要素が正確にサブセットの1つであるように、そのセットを複数のサブセットに分割することとして定義することができる。
H.264/AVCでは、16×16ブロックの輝度サンプルと、対応する色差サンプルのブロックがマクロブロックである。例えば4:2:0サンプリングパターンでは、マクロブロックは色差成分ごとに8×8ブロックの色差サンプルを含む。H.264/AVCでは、ピクチャは1つ以上のスライスグループにパーティショニングされ、スライスグループは1つ以上のスライスを含む。H.264/AVCでは、スライスは整数のマクロブロックからなり、特定のスライスグループ内でラスタースキャンの順で連続している。
HEVC符号化および/または復号の動作の説明において、次の用語を用いる場合がある。符号化ブロックは、符号化ツリーブロックを複数の符号化ブロックに分割することがパーティショニングであるような、N×Nブロック(Nは任意の値)のサンプルとして定義してもよい。符号化ツリーブロック(Coding Tree Block:CTB)は、ある成分を複数の符号化ツリーブロックに分割することがパーティショニングであるような、N×Nブロック(Nは任意の値)のサンプルとして定義してもよい。符号化ツリー単位(Coding Tree Unit:CTU)は、輝度サンプルの符号化ツリーブロック、3つのサンプル配列を有するピクチャにおける色差サンプルの2つの対応する符号化ツリーブロック、あるいはモノクロピクチャ、またはサンプルの符号化に用いた3つの個別の色平面およびシンタックス構造を用いて符号化されるピクチャのサンプルの符号化ツリーブロックとして定義してもよい。符号化単位(Coding Unit:CU)は、輝度サンプルの符号化ブロック、3つのサンプル配列を有するピクチャにおける色差サンプルの2つの対応する符号化ブロック、あるいはモノクロピクチャ、またはサンプルの符号化に用いた3つの個別の色平面およびシンタックス構造を用いて符号化されるピクチャのサンプルの符号化ブロックとして定義してもよい。
HEVCなどの一部のビデオコーデックでは、ビデオピクチャは、ピクチャ領域を覆う複数の符号化単位(CU)に分割される。CUは1つ以上の予測単位(Prediction Unit:PU)と1つ以上の変換単位(Transform Unit:TU)からなる。PUはCU内のサンプルに対する予測処理を規定し、TUはCUのサンプルに対する予測誤差の符号化処理を規定する。通常CUは、正方形のサンプルブロックからなり、既定されている可能なCUサイズのセットから選択可能なサイズを有する。最大許容サイズのCUは通常は最大符号化単位(Largest Coding Unit:LCU)または符号化ツリー単位(Coding Tree Unit:CTU)と呼ばれ、ビデオピクチャは重なり合わないCTUに分割される。CTUは、例えば、CTUと分割の結果得られるCUを再帰的に分割することによって、さらに小さいCUの組合わせに分割できる。分割の結果得られる各CUは通常、少なくとも1つのPUとそれに関連する少なくとも1つのTUを有する。PUとTUはそれぞれ、予測処理と予測誤差符号化処理の粒度を上げるために、さらに小さい複数のPUとTUに分割できる。各PUは、そのPU内のピクセルに適用される予測の種類を定義する、そのPUに関連した予測情報を持つ。この予測情報は、例えば、インター予測されたPUに対しては動きベクトルの情報、イントラ予測されたPUに対してはイントラ予測の方向情報などである。同様に、各TUは、そのTU内のサンプルに対する予測誤差復号処理を記述する情報に関連付けられる。この情報は、例えばDCT係数情報などを含んでもよい。符号化ビデオを格納および/または伝送する場合、通常、各CUに対して予測誤差符号化が適用されるか否かがCUレベルで伝達される。CUに関連する予測誤差の残差がない場合、そのCUに対するTUが存在しないと見なされる。画像をCUに分割し、CUをPUとTUに分割することは通常、そのビデオを伝送するビットストリーム信号で伝えられる(または、符号化ビデオがコンピュータ可読メモリに格納される場合、そのビデオと共に格納される)。これによってデコーダが、これらの単位から目的の構造を再生できる。
図2は、図1の処理によって符号化されたビデオを復号する汎用ビデオデコーダの概略的ブロック図である。図2では以下の符号を用いている。
P' 画像ブロックの予測表現
D' 再構成された予測誤差信号
I' 仮再構成された画像
R' 最終再構成された画像
−1 逆変換
−1 逆量子化
−1 エントロピー復号
RFM 参照フレームメモリ
P 予測(インターまたはイントラ)
F フィルタリング
デコーダは、エンコーダと同様の予測手段を適用してピクセルブロックの予測表現を形成し、予測誤差の復号を用いることによって、出力ビデオを再構成する。ここで予測表現の形成は、エンコーダが作成し、圧縮表現で格納された動き情報や空間情報を用いて行われ、予測誤差の復号は予測誤差符号化の逆操作であって、空間ピクセル領域で量子化された予測誤差信号を回復するものである。デコーダは、予測手段および予測誤差復号手段の適用後、予測信号と予測誤差信号(ピクセル値)を足し合わせて出力ビデオフレームを形成する。図1のエンコーダと同様に図2のデコーダは、出力ビデオをディスプレイに送る、および/または後続フレーム用の予測参照としてビデオシーケンスに格納する前に、出力ビデオの品質を改善するために追加フィルタリング手段を適用することもできる。
サンプル値予測および変換符号化を用いて符号化サンプル値を示す手法の代わりに、またはそれに加えて、カラーパレットに基づく符号化を用いることができる。パレットに基づく符号化とは、パレットが通常は色および関連するインデックスのセットとして定義され、符号化単位内の各サンプルの値がパレット内のそのインデックスを示すことによって表現される、一群の手法を意味する。パレットに基づく符号化は、比較的少数の色を有する符号化単位内において優れた符号化効率を達成することができる。そのような符号化単位は、例えばテキストおよび/または単純な図形だけを含むコンピュータスクリーンコンテンツを表している画像領域などである。パレット符号化の符号化効率を改善するために、異なる種類のパレットインデックス予測手法を利用でき、あるいはパレットインデックスをランレングス符号化して、より大きい均質な画像領域を効率良く表すようにすることができる。また、CUがそのCU内で繰り返されないサンプル値を含む場合、エスケープ符号化を使用することができる。エスケープ符号化されたサンプルは、どのパレットインデックスも参照することなく伝送される。代わりに、エスケープ符号化されたサンプルごとに、それらの値が個々に示される。
典型的なビデオコーデックでは、動き情報は、動き補償された画像ブロックのそれぞれに関連する動きベクトルで示される。こうした動きベクトルはそれぞれ、(エンコーダ側で)符号化されるピクチャまたは(デコーダ側で)復号されるピクチャの画像ブロックと、先に符号化または復号されたピクチャの1つにおける予測ソースブロックとの間の移動量を表す。動きベクトルを効率良く表現するために、動きベクトルは通常、ブロック固有の予測動きベクトルに関して差動符号化されてもよい。典型的なビデオコーデックにおいて、予測動きベクトルは所定の方法、例えば、隣接ブロックの符号化/復号動きベクトルの中央値を計算することによって生成される。動きベクトル予測を行う別の方法は、時間参照ピクチャにおける隣接ブロックおよび/または同位置のブロックから予測候補のリストを作成し、選択された候補を動きベクトルの予測として信号で伝えるものである。動きベクトルの値の予測に加え、先に符号化/復号されたピクチャの参照インデックスを予測できる。参照インデックスは通常、時間参照ピクチャにおける隣接ブロックおよび/または同位置のブロックから予測される。また、典型的な高効率ビデオコーデックでは、通常、マージング(マージモードと呼ばれる場合もある)と呼ばれる追加的な動き情報符号化/復号機構を用いることができる。この機構では、利用可能な参照ピクチャリストの各々について動きベクトルおよび対応する参照ピクチャインデックスを含む、すべての動きフィールド情報が予測され、いかなる変更/修正も行わずに使用される。同様に、動きフィールド情報の予測は、時間参照ピクチャにおける隣接ブロックおよび/または同位置ブロックの動きフィールド情報を用いて行われ、使用された動きフィールド情報は、利用可能な隣接/同位置ブロックの動きフィールド情報が含まれる動きフィールド候補のリストに信号で伝えられる。
ビデオコーデックは通常、1つのソース画像(片予測)または2つのソース(双予測)からの動き補償予測をサポートする。片予測の場合は単一の動きベクトルが適用される。双予測の場合は2つの動きベクトルが信号で伝えられ、2つのソースからの動き補償予測の平均が取られて最終的なサンプル予測が作成される。重み付け予測の場合、2つの予測の相対荷重を調整できる、あるいは信号で伝えられたオフセットを予測信号に追加できる。
ピクチャ間予測のための動き補償を適用することに加えて、ピクチャ内予測に対し、類似の手法を適用することが可能である。この場合、変位ベクトルは、符号化または復号対象のブロックの予測を形成するために、同じピクチャからサンプルブロックをコピーできる位置を示す。この種のブロック内コピー方法により、フレーム内部にテキストや他の図形などの反復構造が存在する場合に、符号化効率を実質的に改善することができる。
典型的なビデオコーデックにおいて、動き補償後またはイントラ予測後の予測残差は、最初にDCTなどの変換カーネルで変換され、次に符号化される。これは、残差間にもまだ相関があることが多く、こうした変換カーネルが多くの場合でこのような相関を小さくするのに役立ち、より高い効率での符号化を可能にするからである。
典型的なビデオエンコーダは、所望のマクロブロックモードおよび関連する動きベクトルなどの最適符号化モードを探索するために、ラグランジュコスト関数を利用する。この種のコスト関数は、非可逆符号化法による(正確なまたは推定された)画像歪みと、画像領域のピクセル値を表現するのに必要である(正確なまたは推定された)情報量を一緒に固定するために、重み付け係数λを用いる。

C=D+λR (式1)

ここで、Cは最小化すべきラグランジュコスト、
Dはそのモードおよび考慮される動きベクトルによる画像歪み(平均二乗誤差など)、
Rはデコーダで画像ブロックを再構成するために要求されるデータ(候補の動きベクトルを表すためのデータ量を含む)を表すのに必要なビット数である。
スケーラブルビデオ符号化とは、コンテンツに関してビットレート、解像度、またはフレームレートが異なる複数の表現を1つのビットストリームに含めることができるような符号化構造のことである。このような場合、受信器は、例えばディスプレイ装置が対応可能な最高の解像度などの特性に応じて、所望の表現を抽出することができる。あるいは、サーバまたはネットワーク要素が、例えばネットワーク特性や受信器の処理能力などに応じて、受信器に送信するビットストリームの部分を抽出することもできる。スケーラブルビットストリームは、一般的には、利用可能な最低品質ビデオを提供する1つの「基本レイヤ」と、下位レイヤと共に受信され復号されるとビデオ品質を高める1つ以上の「拡張レイヤ」から構成される。拡張レイヤに対する符号化効率を高めるために、そのレイヤの符号化表現は、一般に下位レイヤに依存する。例えば、拡張レイヤの動き情報およびモード情報を下位レイヤから予測することができる。同様に、拡張レイヤ予測を作成するために、下位レイヤのピクセルデータを用いることもできる。
品質スケーラビリティ(信号対ノイズ比またはSNRとも呼ばれる)および/または空間スケーラビリティ対応のスケーラブルビデオコーデックは、次のように実装されてもよい。基本レイヤに対しては、従来の非スケーラブルビデオエンコーダおよびデコーダが使用される。基本レイヤの再構成/復号ピクチャは、拡張レイヤ用の参照ピクチャバッファに含められる。H.264/AVCやHEVC、およびインター予測用参照ピクチャリストを用いる同様のコーデックでは、基本レイヤ復号ピクチャは、拡張レイヤの復号参照ピクチャと同様に、拡張レイヤピクチャの符号化/復号のため、参照ピクチャリストに挿入されてもよい。その結果、エンコーダはインター予測参照として基本レイヤ参照ピクチャを選択し、それを使用していることを、通常、参照ピクチャインデックスによって符号化ビットストリーム内に示すことができる。デコーダは、ビットストリームの例えば参照ピクチャインデックスから、拡張レイヤのインター予測参照として基本レイヤピクチャが使用されることを復号する。復号基本レイヤピクチャは、拡張レイヤの予測参照として使用される場合、レイヤ間参照ピクチャと呼ばれる。
品質スケーラビリティに加え、次のスケーラビリティモードも存在する。
・ 空間スケーラビリティ:基本レイヤピクチャは、拡張レイヤピクチャよりも高い解像度で符号化される。
・ ビット深度スケーラビリティ:基本レイヤピクチャは、(例えば10または12ビットの)拡張レイヤピクチャよりも低いビット深度(例えば8ビット)で符号化される。
・ 色差フォーマットスケーラビリティ:基本レイヤピクチャは、拡張レイヤピクチャ(例えば4:2:0フォーマット)よりも高い色差忠実度(例えば4:4:4の色差フォーマットで符号化される)を提供する。
上記のスケーラビリティ例のすべてにおいて、ビットレートの追加オーバーヘッドを最小にするために、拡張レイヤの符号化に基本レイヤ情報を用いることができる。
スケーラビリティは、2つの基本的な方法で有効化できる。すなわち、スケーラブル表現の下位レイヤからのピクセル値またはシンタックスの予測を行うために新しい符号化モードを導入する方法、または、上位レイヤの参照ピクチャバッファ(復号ピクチャバッファ(Decoded Picture Buffer:DPB)と呼ばれる)に下位レイヤのピクチャを置く方法である。第1の手法は、より融通性が高く、したがって多くの場合においてより優れた符号化効率を提供できる。しかしながら、第2の手法である参照フレームに基づくスケーラビリティは、単一層コーデックに対する変更を最小限にとどめて非常に効率良く実現可能であると同時に、可能な符号化効率向上の大部分を達成できる。基本的に、参照フレームに基づくスケーラビリティコーデックは、外部手段によるDPB管理に対処するだけで、すべての層に同じハードウェアまたはソフトウェア実装を利用することによって実現可能である。
ただし、上記の背景セクションに示したように、従来の空間イントラ予測は一部のテクスチャの共通クラスをあまり適切に予測せず、方向サンプル予測において選択した予測方向に予測誤差が現れることがある。そのような点において、本明細書で説明する符号化/復号技術の利点が最も明白となる。
これらの教示の一態様では、予測サンプル値が予測の方向に変更される。これによってコーデックが、従来の方法よりも複雑なテクスチャを補償できる。この変更は、我々が「ヘルパー標示」と呼ぶものによって可能となり、これによりあるサンプル行または列を参照サンプル行または列から離れるように移動させるときに、例えば予測サンプル値の線形変化を決定できる。図3Cおよび図3Dは、予測ヘルパーのいくつかの例を示している。
これらの教示の別の態様では、予測パフォーマンス改善のために最適化し、予測誤差情報の信号伝達における冗長性を回避するために、予測誤差符号化に変更が加えられる。これは、例えば、残差符号化段階において1つ以上の変換係数行の位置を切り替えることによって達成できる。以下に示すある特定の実施形態において、イントラ予測ヘルパー情報を符号化予測誤差信号に埋め込むことができる。
デコーダ側の観点から、ある特定の実施形態について検討する。この場合、デコーダは次のステップを行うことによって、目的の予測信号(または予測サンプルブロック)を再構成する。
1)予測モードの標示を受信する。
2)1つ以上のイントラ予測ヘルパー値の標示を受信する。
3)前記の予測モードの標示および前記の1つ以上のヘルパー値の標示に基づいて、サンプルの予測値を計算する。
4)任意で、デコーダは、予測誤差の標示を受信し、前記の1つ以上のヘルパー値の標示に基づいて予測誤差符号化手段または復号手段を適用することができる。
この特定の実施形態において、予測ブロック内の各列に1つのヘルパー値h(x)(垂直予測モードの場合)、および予測ブロック内の各行に1つのヘルパー値h(y)(水平予測モードの場合)を用いることができる。ヘルパー値h(x)またはh(y)は、エントロピー符号化手段を用いてビットストリームに量子化され符号化される。これらのヘルパー値は線形に適用され、予測方向に参照サンプルr(x)およびr(y)に蓄積される。
真垂直予測の場合、予測サンプル値p(x,y)は次のように表現できる。

p(x,y)=r(x)+y*h(x) (式2)
より一般的な場合、予測サンプル値p(x,y)は次のように表現できる。

p(x,y)=a*r(x+n)+(1-a)*r(x+n+1)+y*(a*h(x+n)+(1−a)*h(x+n+1)) (式3)

ここで、nは整数であり、
は、サンプル行yを予測する場合の参照サンプルの端数部分を示している(選択した予測方向に基づいて定義される。例えば、H.265/HEVC規格の規定どおり)。
図3Aから図3Dはそれぞれ、最も上の行(網掛け)に沿って参照サンプルr1、r2、r3、およびr4を示し、参照サンプル以外の網掛けされていない残りの行に、予測サンプルを含む予測ブロックを示している。説明を単純にするために、これらの例では、真垂直の予測方向を想定している。すなわち、各予測ブロックが同じ列内の他の参照サンプルだけを参照する。他の実施形態では、任意の予測ブロックが、異なる1つの行内の1つの参照サンプル、異なる1つの列内の1つの参照サンプル、または同じまたは異なる複数の行および/または列内の複数の参照サンプルを参照できる。網掛けされた左側の列も、ラベル付けされていない網掛けボックス内にr0以外の参照サンプルを含むが、これらの例ではどの予測ブロックの参照としても使用されていないのでラベル付けしていない。
通常、図3Aの太枠のボックスをCUと見なしてもよく、その中の破線のボックスをそのCUのPUと見なしてもよい。図3Bから図3Dでは、図3Aに示すものと同じ参照サンプルr1〜r4、CU、およびPUを想定している。図3Bから図3Dにおいて、PU内の個々のボックス/サンプルは、図3Aに示す符号p11、p12、p21などを用いてそれぞれ一意に識別されている。
図3Aに示す符号p11、p12、p21などは、予測ベクトルを表すと見なしてもよい。これらの予測ベクトルは、図3Bから図3Dにおいて異なる値を取る。予測ブロック/PU内の予測サンプルは、予測ベクトルによって標示される参照サンプルを、予測ベクトル値を有するボックスへと方向的にコピーすることによって生成される。図3Bは、従来技術の垂直方向イントラ予測を示し、図3Cおよび図3Dは、垂直方向イントラ予測に関するこれらの教示の2つの単純な実施形態を示している。他の実施形態において、予測ベクトルは、同じ画像フレームの異なるCU内(これもイントラ予測)、または異なるフレームのCU内(インター予測)の1つ以上の参照サンプルを参照できる。
まず、図3Bに示す従来技術の手法について検討する。参照サンプルr1が位置する列内で、すべての予測ベクトルp11、p21、p31、およびp41はそれぞれ、この単純な例における真垂直方向予測の制約を受けて、同じ垂直列内の真上のボックスを指す。予測ベクトルp11は参照サンプルr1を指すため、p11と標示されているボックスにr1がコピーされる。予測ベクトルp21は、その真上でp11と標示されているボックスであって、現在復号処理中である参照サンプルr1のコピーを含むボックスを指すため、p21と標示されているボックスに参照サンプルr1が再度コピーされる。予測ベクトルp31はその真上のボックスを指し、p31と標示されているボックスに参照サンプルr1が同様にコピーされる。このように参照サンプルr1の列が処理される。他の列も、それぞれの参照サンプルr2、r3、およびr4に関して同様である。すなわち、図3Bの予測ブロック/PU(網掛けされていない部分)の各列が、最も上の行内の参照サンプルr1〜r4のコピーとなる。この例は垂直のみの予測方向に制限されているため、従来のHEVC符号化/復号に必要な結果は、図3Bに示すように、予測ブロックのすべての行にわたって同じ列内で参照サンプルが正確に繰り返されることである。これは、従来のビデオ符号化/復号の予測処理における方向バイアスを表している。
図3Cは、大きさが+2の線形予測ヘルパー(概して、ヘルパー情報302)が、参照サンプルr3が整列している列(第3の予測列)に伝達される例を示している。図3Cではヘルパー情報302の他の列にゼロ以外の予測ヘルパー値がないため、これらの列は復号後、図3Bの対応する列と同一になる。一方、第3の予測列にあるゼロ以外のヘルパー値は、真上のブロックの値に+2を加える。予測ベクトルがブロックの上のサンプルを参照し、参照サンプルr3における関連値が87である特定の例を想定すると、図3Cの第3の予測列は以下のように復号される。
図3Cの第3の予測列における後続の行それぞれは、ヘルパー値+2によって真上の行内の対応する値から発散する値を有する。ある特定の例においてサンプル値はピクセルの色やカラーパレットのインデックスであるが、別の実装においてこれらのサンプル値は、デジタル画像を定義する様々なパラメータのいずれかを表してもよい。
図3Dの例を検討すると、ゼロ以外のヘルパー値302は第3の予測列に対するものだけであるという点で図3Cと同様である。ただし図3Dの場合、ヘルパー情報302は大きさが+8であり、図3Cとより明確に区別されるのは、図3Dのヘルパー情報302は段階関数304[0,0,1,1]によって生成されていることである。この特定の例において、段階関数は、選択された列内の最後2つのサンプルにのみ存在する有効なヘルパーの結果によってヘルパー信号302を変調するために用いられる。具体的には、段階関数304の最初の2つのゼロは、図3Dにおいて予測ブロック/PUのp13およびp23の位置に対する+8ヘルパー値を無効にするため、それらの位置に参照サンプルr3が変更なしでコピーされる。段階関数304の次の2つの値は、図3Dにおいて予測ブロック/PUのp33およびp43の位置に対するヘルパー値+8の単位乗数であるため、これらの各位置においてヘルパー値の大きさ+8が、このベクトルが参照するサンプルの大きさに加えられる。予測ベクトルがブロックの上のサンプルを参照し、参照サンプルr3における関連値が87であるという図3Cの想定を同様に用いると、図3Dの第3の予測列は以下のように復号される。
エンコーダはヘルパー値を決定するが、その決定の際にサンプル予測の改善と、ヘルパー値の伝達に必要なビットレートの増加とのバランスを取ってもよい。段階関数はエンコーダによって決定することもできるが、エンコーダ/デコーダ装置の外部で決定することもできる(例えば、任意のコーデックは所定の段階関数を常に用いるが、この段階関数は、デコーダが任意のPUのみ、任意のフレームのみ、またはビデオストリーム全体に適用する異なる段階関数を信号伝達することによって無効にすることができる)。エンコーダが段階関数を決定するときは、デコーダが画像フレームを適切に復号できるように、常にその段階関数を符号化ビットストリームで伝達する必要がある。実際には、エンコーダとデコーダの両方が段階関数の適用方法を共通に認識していれば、段階関数の適用方法は前述の例とは異なってもよい。前述の例では、あるボックス/予測ブロックがその真上の予測ブロックまたは参照サンプルを参照するため、予測ブロックp43の場合、図3Dの段階関数[0,0,1,1]は予測ブロックp33の値にヘルパー値+8を加えた。ただし他の構成において、エンコーダおよびデコーダが元の参照サンプルを指す予測ベクトルを認識できる場合、図3Dに用いたものと同じ段階関数およびヘルパー値によって列3が[87,87,95,95]となる。これは、p43について、予測ブロックp33の値95ではなく参照サンプルr3の値87に+8ヘルパー値が加えられるからである。
この例について図3A、図3B、および図3Dを比較し、垂直のみの予測方向を想定すると、図3Aの従来の符号化ではPUの列内に色勾配が許可されない。ヘルパー情報により、任意の列内において連続的な色勾配が可能になり、ヘルパー情報と段階関数を組み合わせることによってPUの任意の列内において非連続的な色勾配が可能になる。水平のみの予測方向についても同様である。垂直と水平の組合わせの場合、従来の実施では任意のPU位置に対してCUの1つの参照ピクセルしか選択できないため、ある意味で方向バイアスが存在する。ヘルパー情報(段階関数の有無にかかわらず)を用いた符号化の利点によって、従来のビデオ符号化における方向バイアスが大幅に緩和される。このことは、説明を単純にするために前述の例で用いた垂直のみの予測方向という人為的な制約がない場合にも当てはまる。
これらの教示は様々な実装によって体現される。例えば、予測方向を指定する予測モードは様々な方法で示される(例えば、1つの予測サンプルに2つの参照サンプルが用いられる場合、垂直、水平、または組合わせ/マージモード)。図3Cおよび図3Dの例では、4値セットのうち1つの値だけがゼロ以外であるヘルパー値を用いたが、これは説明を単純にし、4×4のPUサイズに合わせたものである。他の実施形態では、ヘルパー値の数は前述の例とは異なってもよく、予測方向(例えば、サンプルベクトルが水平参照サンプルおよび垂直参照サンプルを指す場合、またはサンプルベクトルが2つの参照サンプルの間の参照位置を指す場合、そのサンプルに2つのヘルパー値を用いることができ、それらの参照サンプル両方の値を用いて予測サンプル値が生成される)や予測ブロック/PUサイズなどの異なる態様に依存してもよい。
また、多種多様な方法によってヘルパー値を標示することができる。いくつかの非限定的な例として、ヘルパー値を絶対値として、または前述の図3Cおよび図3Dの例に示すように予測サンプル値に対する差分値として、またはエンコーダおよびデコーダが所定のアルゴリズムに用いる変数のような他のヘルパー値(例えば、標示されたヘルパー値に対する剰余関数)として標示することができる。これらの例のいずれにおいても、絶対ヘルパー値または差分ヘルパー値を個別に符号化することも、一緒に符号化することもできる。一緒に符号化する場合、絶対ヘルパー値または差分ヘルパー値は、例えばDCT、離散サイン変換(Discrete Sign Transform:DST)、Haar(ウェーブレット)変換などの1つ以上の変換を用いて変換符号化することができる。絶対ヘルパー値または差分ヘルパー値は、例えば変換値または非変換値のスカラー量子化などの様々な手法を用いて、エンコーダにおいて量子化およびデコーダにおいて逆量子化できる。量子化と逆量子化の粒度はビデオストリームによって明示的に標示するか、または、例えば予測誤差符号化に用いられる量子化パラメータなどの他の符号化パラメータから導出することもできる。当然のことながら、さらに別の実装において前述のものの組合わせを用いることもできる。
予測ヘルパー値は、図3Cの例に示すように予測サンプルに対して一定に増加する値を予測方向に線形に追加すること、または図3Dの例に示すように、ある値を、ある処理行と別の処理行で異なることができるように非線形に追加することのいずれによっても適用できる。非線形演算の場合、各処理行の値は事前に定義するか、または符号化ビデオを伝搬するビットストリームによって伝達することができる。
予測ヘルパー値は、予測サンプル値がブロックの最終行において変更されているべき量を標示するか、または予測サンプル値が他の行(例えば最初の行)において変更されるべき量を標示することができる。前述の例では、予測ブロック/PUの第3の列のみが予測ヘルパー値によって変更されたが、例えば、同じ予測ヘルパーセット302が水平予測方向モードの標示と共に伝達された場合、示されたPUの第3の行に+2または+8の値が適用されるであろう。
予測ヘルパー値は、予測処理に用いられる参照サンプルの一部または全部に対して標示しても、前述の図3Cおよび図3Dの例のように予測ブロック内の一部のピクセルに対してのみ標示してもよい。予測ヘルパー値を予測ブロック内の一部のピクセルに対して標示する場合、それらのヘルパー値を参照サンプル行に投影し、参照サンプルに対して標示されたように用いてもよい。
近傍ピクセルの統計を、予測ヘルパー値の符号化、および/または予測を改善するために予測ヘルパー値を適用する方法の符号化(例えば、段階関数の符号化)に用いることもできる。例として、近傍ピクセル、または近傍ピクセルに関連付けられた予測ヘルパー値を用いて、予測ヘルパー値のコンテキスト適応的算術符号化に用いるコンテキストを定義できる。場合によっては、予測ヘルパー値を近傍ピクセル値から推測することや、近傍ピクセル値を用いて(例えば、ピクセル近傍におけるサンプル値の局所変更を考慮して)計算することができる。
これらの教示の実際の展開では、予測ヘルパー値が存在する場合の残差符号化動作は、サンプルのブロックに予測ヘルパー値が関連付けられていない場合に用いられる残差符号化動作と異なってもよい。この点について、そのような差異の例として、変換係数符号化を適用できる。変換符号化を適用する方法の1つとして、係数を異なる順序で走査すること、または変換ブロック内の変換係数の一部または全部の位置を交換することがある。例えば、予測誤差符号化においてDSTタイプの変換を行い、予測ヘルパー値を用いる水平予測が選択された場合、順変換出力の第1の列内の係数の大きさは小さくなりがちであり、その場合、係数をエントロピー符号化する前にそれら係数の列を最終列に移動してもよい。変換符号化を適用する別の例では、イントラ予測ヘルパー値が存在する場合、変換係数の算術符号化に専用のコンテキストを指定する。
予測ヘルパー値を標示する特に有利な方法の1つは、予測ヘルパーを予測誤差の信号伝達に埋め込むことである。例えば、いくつかの変換係数を用いて、特定の基底関数の加重の代わりに予測ヘルパー値を格納することができる。この場合、実際の変換係数(例えば、水平または垂直方向におけるDSTの第1の基底関数に関連付けられた変換係数)の1つ以上をゼロに設定でき、関連付けられた方向における予測ヘルパーの値を係数符号化処理に渡すことができる。デコーダ側でも同様に、通常は所定の変換係数に関連付けられる復号値をイントラ予測ヘルパー用の値として割り当てることができ、関連付けられた変換係数をゼロに設定できる。別の例では、イントラ予測ヘルパー値も追加の係数として含むように、符号化または復号される係数の数を、変換自体によって必要とされる数から増やすことができる。
これらの教示の実施形態により、ビデオおよび画像の処理における空間イントラ予測の正確性を改善できる。別の実装のいくつかでは、必要な追加処理の量が従来のイントラ予測技術よりも少なくなるが、ほとんどの実装において、これは実質的な制限となるものではない。専用の画像/ビデオプロセッサが消費者装置に備えられることがかなり一般的になり、最新のスマートフォンなどの多くの携帯装置内にも存在する。そのような携帯装置では、能力やデータ処理量(画像/ビデオ処理を含む)の増大にかかわらず、バッテリ消費がそれほど大きな問題ではなくなっている。
図4は、ビデオストリームを符号化する前述の態様のいくつかをデコーダの観点から要約した処理フロー図である。他の実施形態において、これらの同じ教示を、格納または送信の際に符号化された個々の画像の復号に用いることができるが、これらの教示の活用は、個々の画像/ピクチャよりもビデオストリームの画像においてより大きな利点がある。まずブロック402において、図4の方法を実行するデコーダが符号化ビデオストリームを予測モードの標示および1つ以上の予測ヘルパー値の標示と共に受信する。ブロック404において、符号化ビデオストリームを復号する際に、デコーダは少なくとも1つのサンプルそれぞれの予測値を計算する。この予測値は、受信した予測モードの標示および受信した1つ以上の予測ヘルパー値に基づいて計算される。次にブロック406において、デコーダは、出力される復号されたビデオストリームに、計算された対応する予測値を用いて復号された少なくとも1つのサンプル各々を含めて、復号されたビデオストリームをコンピュータ可読メモリおよびグラフィカルディスプレイの少なくとも1つへと明確に出力する。
前述の例において、ブロック402において標示された予測モードは、図3Cおよび図3Dの例に示す垂直予測モード、水平予測モード、単一のサンプルが2つの異なる参照サンプルを参照する場合などの垂直と水平の組合わせ予測モード、動き情報を含むマクロブロックなどのマージモード、符号化ビデオストリームが基本レイヤと少なくとも1つの拡張レイヤを含む場合などのスケーラブルモード、およびHEVC規格のDCモードと平面モードにすることができる。
前述の実施形態のいずれにおいても、ブロック404で行うような符号化ビデオストリームの復号は、対応するゼロ以外の予測ヘルパー値を有する各サンプルについて、ブロック404で行うような予測値の計算を、予測ヘルパー値を対応する参照サンプル値に適用することによって行うことを含んでもよい。この参照サンプルは、当該サンプルに対して予測方向に沿って配置され、この予測方向は予測モードによって指定される。図3Cおよび図3Dの例において、そのような参照サンプルの位置にあるのはr3である。
さらに、前述の実施形態のいずれにおいても、ブロック402からの1つ以上の予測ヘルパー値の標示は、図3Cおよび図3Dに関して説明したように予測ヘルパー値のセットとして標示できる。この場合、そのようなセットはそれぞれ符号化ビデオストリーム内の符号化単位CUの1つの予測単位PUに対応する。図3Cおよび図3Dにおいて、CUおよびCUに含まれるPUは、そのビデオストリームの1つの画像/フレーム内にある。
図3Dの例は、そのようなビデオストリーム内のセットの少なくとも1つについて、予測単位内の同じ行または同じ列内のセットの少なくとも2つのサンプルに対する予測値は非線形であることを示している。これは、当該少なくとも2つのサンプルが存在する同じ行または同じ列の予測値を計算する際に、共通の予測ヘルパー値に段階関数を適用するためである。この場合、+8が共通予測ヘルパー値である。
図3Cの例は、予測値の計算に段階関数を用いない他のセットそれぞれについて、ゼロ以外の予測ヘルパー値に対応する予測ブロックの任意の行または列に対し、対応するゼロ以外の予測ヘルパー値によって、計算された予測値が予測方向に線形に累積されることを示している。図3Cの例において、線形累積量はPUの連続行ごとに+2である。
これらの技術はインター予測に用いることもできるが、図3Cおよび図3Dの例では、復号されたビデオストリームの同じ画像フレーム内にサンプルとサンプル値があるイントラ予測だけに、予測ヘルパー値が制限される。また、図3Cおよび図3Dの例において、サンプルp11、p12、p21などのそれぞれはピクセルであり、対応する予測ヘルパー値は、参照サンプル(図3Cおよび図3Dにおいてr3)を用いて予測されたサンプルを修正するオフセット値を標示することを説明している。しかしながら予測ヘルパー値は、対応する参照ピクセルを着色するためのカラーパレットの別のインデックスと比較して、対応するピクセルを着色するためのカラーパレットの対応するインデックスを標示することもできる。これは、ヘルパー値自体がパレットカラーインデックスである必要があるというわけではない。標示されたヘルパー値がパレットインデックスに対応する絶対値である実装も可能であるが、予測ヘルパーの値は、参照サンプルr3に実際に用いられるパレットインデックスに対するオフセットとして用いることができる。この場合、このオフセットは、参照サンプルr3のインデックスとの関連から取られる、対応するインデックスを「標示する」。
ストリームビデオは広く普及しており、伝送されたビデオは、コンピュータ可読メモリにビデオを格納するだけの場合よりも高いレベルの圧縮(したがってより多くの符号化)を必要とする場合があるため、前述の説明ではビデオストリームの伝送を想定しているが、これらの教示に従って符号化されるビデオは、ビデオが標示と共に伝送される場合と同様に、図4のブロック402において言及した標示と共に格納されるであろうことに注意されたい。したがってデコーダは、伝送チャネル(有線または無線)を介して符号化ビデオを受信したか、またはユーザがデコーダを含む何らかのホスト装置(ラップトップコンピュータ、カメラ/媒体再生装置、スマートフォンなど)に挿入したメモリスティックから符号化ビデオを読み取ったかにかかわらず、それらの同じ標示を用いることができる。
これらの教示に従って動作するエンコーダは、図4に示す同じステップを基本的に逆の順番で実行してもよい。すなわち、ブロック406において、エンコーダはカメラからライブ録画されたストリームなどのビデオストリームを取得することができる。その後ブロック404において、エンコーダはそのビデオストリームを符号化する際に、1つ以上の予測サンプルについて、予測方向と1つ以上の予測ヘルパー値を用いて予測値を計算する。その後、ブロック402において、エンコーダは符号化ビデオストリームを、予測方向を定義する予測モードの標示と、予測ヘルパー値(単数または複数)の1つ以上の標示と共にメモリまたは伝送用の無線に出力できる。
図5は、これらの教示によるビデオストリームの符号化および復号ための汎用ホスト装置の何らかの構成要素、すなわちエンコーダ装置10およびデコーダ装置20を示す概略図である。符号化ビデオストリームを送信および受信するための無線チャネル11がエンコーダ装置10とデコーダ装置20の間に示されているが、符号化ビデオストリームは、着脱式のメモリカードやメモリスティックなどの物理的メモリを介してエンコーダ装置10からデコーダ装置20へと転送することができる。または、グラフィカルディスプレイインタフェースを有するカメラなどの装置であって、ビデオを記録し、記録されたビデオをメモリに保存する際にそのビデオを符号化し、グラフィカルディスプレイ上で再生するためにメモリ上の符号化ビデオにアクセスする際にその符号化ビデオを復号する、1つの装置があってもよい。また、中間装置があってもよい。例えば、エンコーダ装置10がビデオを符号化および復号し、サーバ、または符号化ビデオをより大規模なビデオライブラリ内に格納およびインデックス化できる他の中央データベースなどの中間装置にそのビデオを提供し、中間装置が、個々のラップトップコンピュータ、スマートフォン、車載ビデオディスプレイ装置などのデコーダ装置20に符号化ビデオを提供する。
エンコーダ装置10は、コンピュータまたはデータプロセッサ(Data Processor:DP)10Aなどのコントローラと、メモリ(MEM)10Bとして体現され、コンピュータ命令のプログラム(PROG)10Cを格納するコンピュータ可読メモリ媒体とを備える。また、エンコーダ装置10は、1つ以上のアンテナを介してデコーダ装置20または中間装置と双方向無線通信するための、無線周波数(Radio Frequency:RF)送信器/受信器の組合わせ10Dなどの好適な無線インタフェースを備えてもよい。エンコーダの処理は、図示のような個別のDPによって、中央演算処理DP10Aによって、またはそれら両方の処理チップもしくはそれら以外の要素も含む何らかの組合わせによって実行されてもよい。
エンコーダ装置10とデコーダ装置20との間の無線リンクは、図示のように直接リンクにすることも、前述のようなインターネット上のサーバなどの中間装置を介することもできる。あるいは、同じく前述したように、異なる装置10、20間で着脱式メモリによって符号化ビデオが移動される場合、またはエンコーダ装置10とデコーダ装置20が同じ装置であって、符号化ビデオが、グラフィカルディスプレイやプロジェクタなどのグラフィカルユーザインタフェースにおいて再生される際に復号されるまでその装置のメモリ内に格納される場合、符号化ビデオの通信用の無線リンクはなくてもよい。
デコーダ装置20も、コンピュータまたはデータプロセッサ(DP)20Aなどのコントローラと、メモリ(MEM)20Bとして体現され、コンピュータ命令のプログラム(PROG)20Cを格納するコンピュータ可読メモリ媒体とを備える。また、デコーダ装置20は、1つ以上のアンテナを介してエンコーダ装置10と通信するための、RF送信器/受信器の組合わせ20Dなどの好適な無線インタフェースを備えてもよい。エンコーダの処理と同様に、デコーダの処理は、図示のような個別のDPによって、中央演算処理DP20Aによって、またはそれら両方の処理チップもしくはそれら以外の要素も含む何らかの組合わせによって実行されてもよい。
PROG10C/20Cの少なくとも1つは、関連付けられたDP10A/20Aによって実行された場合、前述したような本発明の例示的実施形態に従って当該装置が動作することを可能にするプログラム命令を含むと想定される。すなわち、本発明の様々な例示的実施形態は、少なくとも部分的に、エンコーダ装置10のDP10Aまたはデコーダ装置20のDP20Aによって実行可能なコンピュータソフトウェアによって、あるいはハードウェアによって、あるいはソフトウェアとハードウェア(とファームウェア)の組合わせによって実装されてもよい。
コンピュータ可読MEM10B/20Bは、現場の技術環境に適した任意の種類のものであってよい。例えば、半導体ベースのメモリデバイス、フラッシュメモリ、磁気メモリデバイスおよびシステム、光学式メモリデバイスおよびシステム、固定式および着脱式メモリ、電磁気、赤外線、または半導体システムなどの様々な適合するデータ格納技術の1つ以上を用いて実装されてもよい。コンピュータ可読保存媒体/メモリの具体的な例の一部として、1つ以上の配線を含む電気接続、携帯型コンピュータディスケット、ハードディスク、ランダムアクセスメモリ(Random Access Memory:RAM)、読取り専用メモリ(Read-Only Memory:ROM)、消去可能プログラマブル読取り専用メモリ(Erasable Programmable Read-Only Memory:EPROM、またはフラッシュメモリ)、光ファイバ、携帯型コンパクトディスク読取り専用メモリ(Compact Disc Read-Only Memory:CD-ROM)、光学記憶装置、磁気記憶装置、またはそれらの任意の好適な組合わせなどがある。
DP10A/20Aは、現場の技術環境に適した任意の種類のものであってよく、非限定的な例として、1つ以上の汎用コンピュータ、特定用途向けコンピュータ、マイクロプロセッサ、デジタル信号プロセッサ(Digital Signal Processor:DSP)、マルチコアプロセッサアーキテクチャに基づくプロセッサを含んでもよい。無線インタフェース(例えば無線10D/20D)は、現場の技術環境に適した任意の種類のものであってよく、独立した送信器、受信器、送受信器、またはそれらの要素の組合わせなどの任意の好適な通信技術を用いて実装されてもよい。
一般に、エンコーダ装置10および/またはデコーダ装置20の様々な実施形態は、カメラおよび/またはグラフィカルディスプレイを備えたスマートフォン、ビデオ録画および/または再生機能を有するマシン間(Machine-to-Machine:M2M)通信装置や携帯電話や携帯情報端末(Personal Digital Assistant:PDA)、ビデオ録画および/または再生機能を有する携帯型コンピュータ、ビデオ録画および/または再生機能を有するデジタルカメラなどの画像キャプチャ装置、ビデオ録画および/または再生機能を有するゲーム装置、ビデオ録画および/または再生機能を有する音楽ストレージおよび再生機器、ビデオ録画および/または再生機能に対応したインターネット機器、上記の機能の組合わせを内蔵した携帯型ユニットまたは端末などを含むが、この限りではない。上記のいずれも、携帯型装置、ウェアラブル装置、全体または一部が埋め込まれた装置、車載通信装置などとして体現してもよい。
前述の説明はあくまで例示であることを理解されたい。当業者は、様々な代替案や変更を考案可能である。例えば、複数の従属項に記載する特徴は、任意の好適な組合わせで互いに組み合わせることができる。また、前述の異なる実施形態の特徴を選択し、本明細書において他の実施形態とは別途に特に説明していない、ある実施形態へと組み合わせることもできる。したがって本明細書の説明は、添付の特許請求の範囲に該当するすべての代替案、変更、および変形を包含することを意図している。
本明細書および/または図面に用いられる可能性のある略語を以下に定義する。これらの用語は、ITU-TのH.265/HEVC規格に規定されるとおりの通常の意味に従って用いられる。
AC (Alternating Current)交流(DCTの係数)
AVC (Advanced Video Coding)アドバンストビデオ符号化(H.264/AVC規格)
CTU (Coding Tree Unit)符号化ツリー単位
CU (Coding Unit)符号化単位
DCT (Discrete Cosine Transform)離散コサイン変換
DPB (Decoded Picture Buffer)復号ピクチャバッファ
DST (Discrete Sine Transform)離散サイン変換
DC (Direct Current)直流(DCTの係数)
HEVC (High Efficiency Video Coding)高効率ビデオ符号化(H.265/HEVC規格)
LCU (Largest Coding Unit)最大符号化単位
ITU-T (International Telecommunication Union - Telecommunication Standardization sector)国際電気通信連合の電気通信標準化部門
MVC (Multi-view Video Coding)マルチビュービデオ符号化
MVP (Motion Vector Prediction)動きベクトル予測
PU (Prediction Unit)予測単位
SNR (Signal to Noise Ratio)信号対雑音比
SVC (Scalable Video Coding)スケーラブルビデオ符号化
TU (Transform Unit)変換単位

Claims (20)

  1. ビデオストリームを復号する方法であって、
    符号化ビデオストリームと共に、予測モードの標示および1つ以上の予測ヘルパー値の標示を受信することと、
    前記符号化ビデオストリームを復号する際に、受信した前記予測モードの標示および受信した前記1つ以上の予測ヘルパー値に基づいて、少なくとも1つのサンプルそれぞれの予測値を計算することと、
    出力される復号されたビデオストリームに、計算された前記予測値を用いて復号された前記少なくとも1つのサンプルを含めて、前記復号されたビデオストリームをコンピュータ可読メモリおよびグラフィカルディスプレイの少なくとも1つへと明確に出力することと、
    を含む、方法。
  2. 前記予測モードの標示は、垂直予測モード、水平予測モード、垂直と水平の組合わせ予測モード、マージモード、前記符号化ビデオストリームが基本レイヤと少なくとも1つの拡張レイヤを含むスケーラブルモード、直流(Direct Current:DC)モード、および平面モードのうち少なくとも1つを標示する、請求項1に記載の方法。
  3. 前記符号化ビデオストリームを復号することは、対応するゼロ以外の予測ヘルパー値を有する前記各サンプルについて、前記サンプルに対して予測方向に沿って配置される参照サンプルの対応する値に前記予測ヘルパー値を適用することによって、前記予測値を計算することを含み、
    前記予測方向は前記予測モードによって指定される、
    請求項1または2に記載の方法。
  4. 前記1つ以上の予測ヘルパー値の標示は、予測ヘルパー値のセットとして標示され、前記セットはそれぞれ前記符号化ビデオストリーム内の符号化単位の1つの予測単位に対応する、請求項1から3のいずれかに記載の方法。
  5. 前記セットの少なくとも1つについて、前記予測単位内の少なくとも2つのサンプルが存在する同じ行または同じ列の予測値を計算する際に、共通の予測ヘルパー値に段階関数を適用するため、前記セットの前記同じ行または同じ列の前記少なくとも2つのサンプルに対する前記予測値は非線形である、請求項4に記載の方法。
  6. 前記予測値を計算する際に段階関数を用いない他のセットそれぞれについて、ゼロ以外の予測ヘルパー値に対応する予測ブロックの任意の行または列に対し、対応する前記ゼロ以外の予測ヘルパー値によって、計算された前記予測値が前記予測方向に線形に累積される、請求項5に記載の方法。
  7. 前記予測ヘルパー値は、前記サンプルと参照サンプルが前記復号されたビデオストリームの同じ画像フレーム内にあるイントラ予測だけに制限される、請求項1から6のいずれかに記載の方法。
  8. 前記少なくとも1つのサンプルはそれぞれピクセルであり、対応する前記予測ヘルパー値は、対応する参照ピクセルを着色するためのカラーパレットの別のインデックスと比較して、対応する前記ピクセルを着色するための前記カラーパレットの対応するインデックスを標示する、請求項1から7のいずれかに記載の方法。
  9. ビデオストリームを復号する装置であって、
    コンピュータプログラム命令を格納する少なくとも1つのコンピュータ可読メモリと、少なくとも1つのプロセッサとを備え、前記コンピュータプログラム命令を含む前記コンピュータ可読メモリは、前記少なくとも1つのプロセッサによって、少なくとも
    符号化ビデオストリームと共に、予測モードの標示および1つ以上の予測ヘルパー値の標示を受信することと、
    前記符号化ビデオストリームを復号する際に、受信した前記予測モードの標示および受信した前記1つ以上の予測ヘルパー値に基づいて、少なくとも1つのサンプルそれぞれの予測値を計算することと、
    出力される復号されたビデオストリームに、計算された前記予測値を用いて復号された前記少なくとも1つのサンプルを含めて、前記復号されたビデオストリームをコンピュータ可読メモリおよびグラフィカルディスプレイの少なくとも1つへと出力することと、
    を前記装置にさせるように構成される、装置。
  10. 前記予測モードの標示は、垂直予測モード、水平予測モード、垂直と水平の組合わせ予測モード、マージモード、前記符号化ビデオストリームが基本レイヤと少なくとも1つの拡張レイヤを含むスケーラブルモード、直流(Direct Current:DC)モード、および平面モードのうち少なくとも1つを標示する、請求項9に記載の装置。
  11. 前記コンピュータプログラム命令を含む前記コンピュータ可読メモリは、前記少なくとも1つのプロセッサによって、前記装置に前記符号化ビデオストリームを復号させるように構成され、前記符号化ビデオストリームを復号することは、対応するゼロ以外の予測ヘルパー値を有する前記各サンプルについて、
    前記サンプルに対して予測方向に沿って配置される参照サンプルの対応する値に前記予測ヘルパー値を適用して、前記予測値を計算することによって行われ、
    前記予測方向は前記予測モードによって指定される、
    請求項9または10に記載の装置。
  12. 前記1つ以上の予測ヘルパー値の標示は、予測ヘルパー値のセットとして標示され、前記セットはそれぞれ前記符号化ビデオストリーム内の符号化単位の1つの予測単位に対応する、請求項9から11のいずれかに記載の装置。
  13. 前記セットの少なくとも1つについて、前記予測単位内の少なくとも2つのサンプルが存在する同じ行または同じ列の予測値を計算する際に、共通の予測ヘルパー値に段階関数を適用するため、前記セットの前記同じ行または同じ列の前記少なくとも2つのサンプルに対する前記予測値は非線形である、請求項12に記載の装置。
  14. 前記予測値を計算する際に段階関数を用いない他のセットそれぞれについて、ゼロ以外の予測ヘルパー値に対応する予測ブロックの任意の行または列に対し、対応する前記ゼロ以外の予測ヘルパー値によって、計算された前記予測値が前記予測方向に線形に累積される、請求項13に記載の装置。
  15. 前記予測ヘルパー値は、前記サンプルと参照サンプルが前記復号されたビデオストリームの同じ画像フレーム内にあるイントラ予測だけに制限される、請求項9から14のいずれかに記載の装置。
  16. 前記少なくとも1つのサンプルはそれぞれピクセルであり、対応する前記予測ヘルパー値は、対応する参照ピクセルを着色するためのカラーパレットの別のインデックスと比較して、対応する前記ピクセルを着色するための前記カラーパレットの対応するインデックスを標示する、請求項9から15のいずれかに記載の装置。
  17. コンピュータプログラム命令を格納するコンピュータ可読メモリであって、前記コンピュータプログラム命令は、1つ以上のプロセッサによって実行された場合、ホストデコーダ装置にビデオストリームの復号に向けた動作を実行させ、前記動作は、
    符号化ビデオストリームと共に、予測モードの標示および1つ以上の予測ヘルパー値の標示を受信することと、
    前記符号化ビデオストリームを復号する際に、受信した前記予測モードの標示および受信した前記1つ以上の予測ヘルパー値に基づいて、少なくとも1つのサンプルそれぞれの予測値を計算することと、
    出力される復号されたビデオストリームに、計算された前記予測値を用いて復号された前記少なくとも1つのサンプルを含めて、前記復号されたビデオストリームをコンピュータ可読メモリおよびグラフィカルディスプレイの少なくとも1つへと明確に出力することと、
    を含む、コンピュータ可読メモリ。
  18. 前記符号化ビデオストリームを復号することは、対応するゼロ以外の予測ヘルパー値を有する前記各サンプルについて、前記サンプルに対して予測方向に沿って配置される参照サンプルの対応する値に前記予測ヘルパー値を適用することによって、前記予測値を計算することを含み、
    前記予測方向は前記予測モードによって指定される、
    請求項17に記載のコンピュータ可読メモリ。
  19. 前記1つ以上の予測ヘルパー値の標示は、予測ヘルパー値のセットとして標示され、前記セットはそれぞれ前記符号化ビデオストリーム内の符号化単位の1つの予測単位に対応する、請求項17または18に記載のコンピュータ可読メモリ。
  20. 前記セットの少なくとも1つについて、前記予測単位内の少なくとも2つのサンプルが存在する同じ行または同じ列の予測値を計算する際に、共通の予測ヘルパー値に段階関数を適用するため、前記セットの前記同じ行または同じ列の前記少なくとも2つのサンプルに対する前記予測値は非線形である、請求項19に記載のコンピュータ可読メモリ。
JP2018518710A 2015-10-13 2016-10-13 空間イントラ予測のためのヘルパーデータを用いたビデオ符号化 Pending JP2018530968A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/881,493 US9743092B2 (en) 2015-10-13 2015-10-13 Video coding with helper data for spatial intra-prediction
US14/881,493 2015-10-13
PCT/FI2016/050715 WO2017064370A1 (en) 2015-10-13 2016-10-13 Video coding with helper data for spatial intra-prediction

Publications (1)

Publication Number Publication Date
JP2018530968A true JP2018530968A (ja) 2018-10-18

Family

ID=58500286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018518710A Pending JP2018530968A (ja) 2015-10-13 2016-10-13 空間イントラ予測のためのヘルパーデータを用いたビデオ符号化

Country Status (7)

Country Link
US (1) US9743092B2 (ja)
EP (1) EP3363201A4 (ja)
JP (1) JP2018530968A (ja)
KR (1) KR20180069850A (ja)
CN (1) CN108353186A (ja)
PH (1) PH12018500776A1 (ja)
WO (1) WO2017064370A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020010303A (ja) * 2018-07-12 2020-01-16 日本放送協会 符号化装置、復号装置、及びプログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106664414B (zh) * 2014-06-19 2019-07-05 寰发股份有限公司 视频编码中用于单个样本模式的候选生成的方法及装置
CN108810531B (zh) * 2017-05-03 2019-11-19 腾讯科技(深圳)有限公司 视频编码处理方法、装置及电子设备
BR112020010935A2 (pt) * 2017-12-08 2020-11-17 Panasonic Intellectual Property Corporation Of America dispositivo de codificação de imagem, dispositivo de decodificação de imagem, método de codificação de imagem, e método de decodificação de imagem
US10904555B2 (en) * 2018-07-11 2021-01-26 Tencent America LLC Method and apparatus for video coding
WO2020048361A1 (zh) * 2018-09-05 2020-03-12 华为技术有限公司 视频解码方法及视频解码器
CN118018765A (zh) 2018-09-05 2024-05-10 华为技术有限公司 视频解码方法及视频解码器
BR112021004890A2 (pt) * 2018-09-13 2021-06-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. intrapredições ponderadas lineares afins
CN113016185B (zh) 2018-11-17 2024-04-05 北京字节跳动网络技术有限公司 以运动矢量差分模式控制Merge
WO2020125751A1 (en) * 2018-12-21 2020-06-25 Beijing Bytedance Network Technology Co., Ltd. Information signaling in current picture referencing mode
CN113709496B (zh) * 2021-08-24 2024-07-09 天津津航计算技术研究所 基于容错机制的多路视频解码方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009051091A1 (ja) * 2007-10-15 2009-04-23 Nippon Telegraph And Telephone Corporation 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体
WO2014050971A1 (ja) * 2012-09-28 2014-04-03 日本電信電話株式会社 イントラ予測符号化方法、イントラ予測復号方法、イントラ予測符号化装置、イントラ予測復号装置、それらのプログラム並びにプログラムを記録した記録媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1232126C (zh) * 2002-09-30 2005-12-14 三星电子株式会社 图像编码方法和装置以及图像解码方法和装置
JP2013034162A (ja) * 2011-06-03 2013-02-14 Sony Corp 画像処理装置及び画像処理方法
EP2725795B1 (en) * 2011-06-24 2021-04-14 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, image decoding method
US9813727B2 (en) * 2011-06-28 2017-11-07 Samsung Electronics Co., Ltd. Method and apparatus for image encoding and decoding using intra prediction
EP2725794A4 (en) * 2011-06-28 2015-03-04 Samsung Electronics Co Ltd METHOD AND DEVICE FOR PREDICTING THE CHROMINANCE COMPONENT OF AN IMAGE FROM THE LUMINANCE COMPONENT
WO2013066267A1 (en) * 2011-10-31 2013-05-10 Nanyang Technological University Lossless image and video compression
US9654777B2 (en) * 2013-04-05 2017-05-16 Qualcomm Incorporated Determining palette indices in palette-based video coding
CN103248895B (zh) * 2013-05-14 2016-06-08 芯原微电子(北京)有限公司 一种用于hevc帧内编码的快速模式估计方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009051091A1 (ja) * 2007-10-15 2009-04-23 Nippon Telegraph And Telephone Corporation 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体
WO2014050971A1 (ja) * 2012-09-28 2014-04-03 日本電信電話株式会社 イントラ予測符号化方法、イントラ予測復号方法、イントラ予測符号化装置、イントラ予測復号装置、それらのプログラム並びにプログラムを記録した記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020010303A (ja) * 2018-07-12 2020-01-16 日本放送協会 符号化装置、復号装置、及びプログラム
JP7084808B2 (ja) 2018-07-12 2022-06-15 日本放送協会 符号化装置、復号装置、及びプログラム

Also Published As

Publication number Publication date
US9743092B2 (en) 2017-08-22
WO2017064370A1 (en) 2017-04-20
KR20180069850A (ko) 2018-06-25
CN108353186A (zh) 2018-07-31
US20170105003A1 (en) 2017-04-13
PH12018500776A1 (en) 2018-10-15
EP3363201A1 (en) 2018-08-22
EP3363201A4 (en) 2019-03-20

Similar Documents

Publication Publication Date Title
KR102647830B1 (ko) 비디오 코딩을 위한 방법 및 장치
JP2018530968A (ja) 空間イントラ予測のためのヘルパーデータを用いたビデオ符号化
CN112235572B (zh) 视频解码方法和装置以及计算机设备和存储介质
US11095922B2 (en) Geometry transformation-based adaptive loop filtering
CN108632628B (zh) 推导参考预测模式值的方法
RU2668723C2 (ru) Способ и оборудование для кодирования и декодирования видеосигналов
JP2023162214A (ja) コーディングブロックの三角形パーティションのインター予測のための装置および方法
CN111869212A (zh) 小块预测和变换的方法和装置
JP2022521979A (ja) デコーダ側動きベクトル改良に対する制約
KR20210044889A (ko) 히스토리 기반 움직임 정보를 이용한 영상 코딩 방법 및 그 장치
US11496746B2 (en) Machine learning based rate-distortion optimizer for video compression
TW202110178A (zh) 具有可切換濾波器之參考圖像重新取樣
KR20210125088A (ko) 매트릭스 기반 인트라 예측 및 2차 변환 코어 선택을 조화시키는 인코더, 디코더 및 대응 방법
TW202042552A (zh) 用於照明補償之區塊大小限制
KR20220009946A (ko) 적응적 루프 필터들에 대한 클리핑 값 계산의 단순화
JP2022535859A (ja) Mpmリストを構成する方法、クロマブロックのイントラ予測モードを取得する方法、および装置
US20240187594A1 (en) Method And An Apparatus for Encoding and Decoding of Digital Image/Video Material
CN113615173A (zh) 对仿射译码块进行光流预测修正的方法及装置
KR20230150284A (ko) 효율적인 비디오 인코더 아키텍처
KR20230111256A (ko) 비디오 인코딩 및 디코딩 방법과 시스템, 비디오 인코더및 비디오 디코더
RU2819065C2 (ru) Видеокодер, видеодекодер и соответствующий способ
US20240214595A1 (en) Coding enhancement in cross-component sample adaptive offset
KR20240090206A (ko) 영상 부호화/복호화 방법, 비트스트림을 전송하는 방법 및 비트스트림을 저장한 기록 매체
KR20230117614A (ko) 움직임 벡터 차이 제한 방법 및 디바이스
KR20230166899A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180502

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180502

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190612

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200120