JP2021521751A - ビデオ符号化において追加中間候補を有するマージモードの方法及び装置 - Google Patents

ビデオ符号化において追加中間候補を有するマージモードの方法及び装置 Download PDF

Info

Publication number
JP2021521751A
JP2021521751A JP2021512368A JP2021512368A JP2021521751A JP 2021521751 A JP2021521751 A JP 2021521751A JP 2021512368 A JP2021512368 A JP 2021512368A JP 2021512368 A JP2021512368 A JP 2021512368A JP 2021521751 A JP2021521751 A JP 2021521751A
Authority
JP
Japan
Prior art keywords
block
candidate block
candidate
current block
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021512368A
Other languages
English (en)
Other versions
JP7130851B2 (ja
Inventor
イエ,ジン
リィウ,シャン
リ,グォイチュン
シュイ,シアオジョォン
リ,シアン
Original Assignee
テンセント・アメリカ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・アメリカ・エルエルシー filed Critical テンセント・アメリカ・エルエルシー
Publication of JP2021521751A publication Critical patent/JP2021521751A/ja
Application granted granted Critical
Publication of JP7130851B2 publication Critical patent/JP7130851B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本出願はビデオ符号化において追加中間候補を有するマージモードの方法及び装置を開示している。ビデオシーケンスを符号化しまたは復号するためのマージ候補リストを生成する方法及び装置であって、前記方法において、第1候補ブロックを決定し、該第1候補ブロックは現在ブロックのトップエッジの上方にある垂直位置と、現在ブロックの水平中心に隣接する水平位置とを有する。第2候補ブロックを決定し、該第2候補ブロックは現在ブロックの左エッジの左側にある水平位置と、現在ブロックの垂直中心に隣接する垂直位置とを有する。第1候補ブロックと第2候補ブロックによって、マージ候補リストを生成することで、ビデオシーケンスに対して符号化及び復号を行うように許可する。

Description

35U.S.C.§119に基づいて、本願は2018年6月4日にてアメリカ特許商標庁に提出された美国仮出願第62/680.486号の優先権を主張し、開示された全ての内容は本明細書に援用される。
本開示内容は、フレーム間ピクチャ予測符号化に関わるとともに、マージモードに適用される。余分な空間または時間マージ候補によってマージ候補リストを生成し、マージ候補リストの生成を補正する。さらにインデックスマージのシグナリング技術案を提出する。
高効率ビデオ符号化(HEVC)には、フレーム間ピクチャ予測のためのマージモードが導入される。隣接ブロックからの候補動きパラメータのマージ候補リストを生成する。そして、インデックスをシグナリングし、利用対象となる候補を標識する。マージモードはさらに、符号化されたピクチャから取得された候補をリストに含ませることで、時間予測を許可する。図1を参照し、HEVCにおいて、1つ又は複数の空間マージ候補(101)、(102)、(103)、(104)及び/または(105)、2つの時間的コロケーテッドブロック(temporal co-located blocks)から導出された1つの時間マージ候補、及び/または双方向予測候補とゼロ動きベクトル候補との組み合わせが含まれる追加マージ候補に基づき、現在ブロック(100)のマージ候補リストを生成する。
HEVCにおいて、スキップモードは、ブロックにとって動きデータが明示的にシグナリングされず、推定されることで得られて、且つ予測残差がゼロであるように指示するためのモードであり、即ち、変換係数を伝送しない。HEVCにおいて、フレーム間ピクチャ予測スライスにおける各符号化ユニット(CU)の開始箇所で、slip_flagはシグナリングされ、該slip_flagは、CUに1つの予測ユニット(PU)(例えば、2Nx2N)のみが含まれ、マージモードによって動きデータを導出し、及び/またはビットストリームに残差データが存在しないことを暗示する。
共同ビデオ探索チーム(JVET)により研究されたテストモデルソフトウェアとしての共同探索モデル7(JEM7)に、新たなマージ候補が導入される。サブCUモードを追加のマージ候補として、これらのモードをシグナリングするための追加の文法要素を必要としない。2つの追加のマージ候補は、各CUのマージ候補リストに追加されることで、代替時間動きベクトル予測(ATMVP)モードと空間時間動きベクトル予測(STMVP)モードを示す。
シーケンスパラメータセットは、ATMVPモードとSTMVPモードとが有効であることを指示する場合、7つのマージ候補を利用する。追加マージ候補の符号化ロジックとHEVCにおけるマージ候補の符号化ロジックとは同様であり、これは、予測(P)スライスまたは双方向予測(B)スライスにおける各CUに対して、該2つの追加マージ候補にとって、2回のレート歪み(RD)検査を必要とすることを示す。JEM7において、挿入されるマージ候補の順序はA、B、C、D、ATMVP、STMVP、E(リストにおけるマージ候補が6より小さい場合)、時間動きベクトル予測(TMVP)、組み合わせた双方向予測候補とゼロ動きベクトル候補になる。
JEM7において、マージインデックスの全てのバイナリビットはコンテキスト適応バイナリ算術符号化(CABAC)によってコンテキスト符号化を行う。HEVCにおいて、第1のバイナリビットのみに対してコンテキスト符号化を行って、他のバイナリビットに対してコンテキストバイパス符号化を行う。JEMにおいて、マージ候補の最大の数は7である。
図2は、マージ候補リストの生成の例示を示す。例えば、該技術案は8×8ブロックであるステップサイズの大きさで、符号化されたブロックからの候補動きベクトルから、検索する。該技術案は現在ブロック(200)の最も近い空間隣接領域、即ち、隣接するトップ行(201)、左列(202)及び右上隅(203)を、カテゴリ1として定義する。例えば外部領域(現在ブロックの境界からせいぜい3つの8×8ブロックがある)と符号化されたフレームに並置ブロックの他の隣接領域(204)、(205)をカテゴリ2に分類する。リストから、異なる参照フレームに応じて予測された隣接ブロック、またはフレーム内符号化された隣接ブロックを去除する。そして、残りの各参照ブロックに重みを割り当てる。該重みは、現在ブロックまでの距離に関する。
拡張マージモードにおいて、追加のマージ候補は、次の(NEXT)マージ候補の直接的な拡張である。現在ブロックの直ぐ近くにない左、上、左下、右上及び左上候補を検査する。図1は検査される詳しい位置を示す。例示として、マージ候補の最大の数は10であってもよい。
図3は、外部領域からのマージ候補を示す。例えば、図3に示すように、参照ブロックの左上隅から、現在ブロックまでのオフセットは(−96,−96)である。候補(301)、(302)及び(303)に示すように、各候補B(i,j)またはC(i,j)はその前のB候補またはC候補より、垂直方向でのオフセットは16である。候補(304)、(305)及び(306)に示すように、各候補A(i,j)またはD(i,j)はその前のA候補またはD候補より水平方向でのオフセットは16である。候補(307)、(308)及び(309)に示すように、各候補E(i,j)はその前のE候補より水平方向と垂直方向でのオフセットはいずれも16である。内から外へ候補を検査し、候補の順序はA(i,j)、B(i,j)、C(i,j)、D(i,j)及びE(i,j)になる。
本開示内容の1つの態様によれば、ビデオシーケンスを符号化または復号するためのマージ候補リストを生成する方法であって、該方法は、第1候補ブロックを決定し、該第1候補ブロックは現在ブロックのトップエッジの上方にある垂直位置と、現在ブロックの水平中心に隣接する水平位置とを有し、第2候補ブロックを決定し、該第2候補ブロックは現在ブロックの左エッジの左側にある水平位置と、現在ブロックの垂直中心に隣接する垂直位置とを有し、第1候補ブロックと第2候補ブロックを利用して、マージ候補リストを生成することで、ビデオシーケンスに対する符号化または復号を許可する。
本開示内容の1つの態様によれば、ビデオシーケンスを符号化または復号するためのマージ候補リストを生成するための機器であって、前記機器は、プログラムコードを記憶するように配置される少なくとも1つのメモリと、プログラムコードを読み取るとともに、プログラムコードの指示に応じて操作するように配置される少なくとも1つのプロセッサとを備え、該プログラムコードは、前記少なくとも1つのプロセッサに第1候補ブロックを決定させるように配置される第1決定コードであって、該第1候補ブロックは現在ブロックのトップエッジの上方にある垂直位置と、現在ブロックの水平中心に隣接する水平位置とを有する第1決定コードと、前記少なくとも1つのプロセッサに第2候補ブロックを決定させるように配置される第2決定コードであって、該第2候補ブロックは現在ブロックの左エッジの左側にある水平位置と、現在ブロックの垂直中心に隣接する垂直位置とを有する第2決定コードと、前記少なくとも1つのプロセッサに、第1候補ブロックと第2候補ブロックによって、マージ候補リストを生成させることで、ビデオシーケンスに対する符号化または復号を許可するように、配置される生成コードと、を有する。
本開示内容の1つの態様によれば、命令が記憶される非一時的なコンピュータ読み取り可能な媒体であって、前記命令には1つ又は複数の命令が含まれ、前記1つ又は複数の命令は機器の1つ又は複数のプロセッサによって実行されると、前記1つ又は複数のプロセッサに以下の操作を実行させ、第1候補ブロックを決定し、該第1候補ブロックは現在ブロックのトップエッジの上方にある垂直位置と、現在ブロックの水平中心に隣接する水平位置とを有し、第2候補ブロックを決定し、該第2候補ブロックは現在ブロックの左エッジの左側にある水平位置と、現在ブロックの垂直中心に隣接する垂直位置とを有し、第1候補ブロックと第2候補ブロックを利用して、ビデオシーケンスを符号化または復号するためのマージ候補リストを生成することで、ビデオシーケンスに対する符号化または復号を許可する。
以下の詳しい記載及び図面に基づいて、開示されたテーマの他の特徴、性質及び各利点はより明確になり、図面において、
1つの実施例による空間マージ候補の図面である。 1つの実施例によるマージ候補リストを生成する図面である。 1つの実施例による外部領域からのマージ候補の図面である。 1つの実施例による通信システムの簡略化ブロック図である。 1つの実施例によるストリーミング伝送環境の図面である。 1つの実施例によるビデオ復号器のブロック図である。 1つの実施例によるビデオ符号器のブロック図である。 1つの実施例による、マージ候補リストを生成するためのプロセス例示のフローチャートである。 現在ブロックの中間候補をマージ候補リストに追加することを示す図面である。 現在ブロックの中間候補をマージ候補リストに追加することを示す図面である。 1つの実施例による中間候補の追加を示す図面である。 1つの実施例によるコンピュータシステムの図面である。
本明細書に記載のいくつかの実現形態は、改善されたマージ候補リストの生成を許可し、これによって、ビットレートの低減、性能の向上及び他の技術利点をもたらす。
図4は、本開示内容による1つの実施例の通信システム(400)の簡略化ブロック図を示す。通信システム(400)は、ネットワーク(450)を介して互いに接続された少なくとも2つの端末(410〜420)を有する。一方向のデータ伝送について、第1端末(410)はローカル位置でビデオデータを符号化することで、ネットワーク(450)を介して他の端末(420)に伝送することができる。第2端末(420)はネットワーク(450)から他の端末の符号化されたビデオデータを受信し、符号化されたデータを復号するとともに、回復されたビデオデータを表示することができる。一方向のデータ伝送はメディアサービスアプリケーションなどにおいて、よく見られる。
図4は、第2対の端末(430、440)を示し、例えばビデオ会議期間に発生する可能性がある符号化されたビデオの双方向伝送を支持する。データの双方向伝送について、各端末(430、440)はローカル位置でキャプチャされたビデオデータを符号化することで、ネットワーク(450)を介して他の端末に伝送することができる。各端末(430、440)はさらに、他の端末から伝送された、符号化されたビデオデータを受信し、該符号化されたデータを復号するとともに、ローカル表示機器に復元されたビデオデータを表示することができる。
図4において、端末(410〜440)はサーバ、パーソナルコンピュータ及びスマートフォンとして列挙され、本開示内容の原理はこれに限定されない。本開示内容の実施例はラップトップコンピュータ、タブレットコンピューター、メディアプレイヤー及び/または専門ビデオ会議機器に適用される。ネットワーク(450)は、端末(410〜440)の間で符号化されたビデオデータを伝送するための、例えば有線及び/または無線通信ネットワークが含まれる任意の数のネットワークを示す。通信ネットワーク(450)は回路交換及び/またはパケット交換チャネルにおいて、データを交換できる。代表的なネットワークは電気通信ネットワーク、ローカルエリアネットワーク、広域エリアネットワーク及び/またはインターネットを含む。本願の論述の目的から見れば、以下で解釈しない限り、ネットワーク(450)のアーキテクチャ及びトポロジは、本開示内容の操作に対して重要ではない。
開示されたテーマの応用例示として、図5は、ビデオ符号器と復号器とのストリーミング伝送環境における配置を示す。開示されたテーマは例えば、ビデオ会議、デジタルTV、CD、DVD、メモリスティックなどを含むデジタルメディアへの圧縮ビデオの格納などを含む、他のビデオ対応アプリケーションに同様に適用可能である。
ストリーミング伝送システムは、キャプチャサブシステム(513)を有してもよく、該キャプチャサブシステムは、例えば非圧縮のビデオサンプルストリーム(502)を構築するための、デジタル撮影装置のようなビデオソース(501)を有する。符号化されたビデオビットストリームと比較する場合、データ量が多いことを強調するように、サンプルストリーム(502)は太線として描画される。サンプルストリーム(502)は、撮影装置(501)に連結される符号器(503)によって処理される。符号器(503)はハードウェア、ソフトウェアまたはその組み合わせを有することで、以下により詳しく記載される開示のテーマの各態様を実現または実施する。サンプルストリームと比較する場合、データ量が少ないことを強調するように、符号化されたビデオビットストリーム(504)は細線として描画される。符号化されたビデオビットストリーム(504)はストリーミングサーバ(505)に記憶されることで、後で使用される。1つ又は複数のストリーミングクライアント(506、508)はストリーミングサーバ(505)にアクセスして、符号化されたビデオビットストリーム(504)のコピー(507、509)を検索する。クライアント(506)はビデオ復号器(510)を有してもよく、該ビデオ復号器(510)は符号化されたビデオビットストリームの導入コピー(507)を復号するとともに、ディスプレイ(512)または他の表示機器(図示せず)に表示される導出ビデオサンプルストリーム(511)を構築できる。あるストリーミング伝送システムにおいて、ビデオビットストリーム(504、507、509)はあるビデオ符号化/圧縮基準に応じて符号化を行う。これらの基準の例示はITU−T H.265提案書を含む。開発中のものは、非公式に多機能ビデオ符号化(VVC)と呼ばれるビデオ符号化基準がある。開示されたテーマはVVCのコンテキストに適用される。
図6は、本発明の1つの実施例によるビデオ復号器(510)の機能ブロック図である。
受信器(610)は、復号器(510)により復号される1つ又は複数のコーデックビデオシーケンスを受信し、同一実施例または他の実施例において、1回に1つの符号化されたビデオシーケンスを受信し、各符号化されたビデオシーケンスの復号は、他の符号化されたビデオシーケンスと独立する。チャンネル(612)から符号化されたビデオシーケンスを受信し、チャンネル(612)は、該符号化されたビデオデータを記憶するための記憶機器へのハードウェア/ソフトウェアリンクであってもよい。受信器(610)は、符号化されたビデオデータ及び他のデータを受信でき、例えば、それぞれの利用エンティティ(図示せず)の符号化されたオーディオデータ及び/または補助データストリームに転送できる。受信器(610)は符号化されたビデオシーケンスと他のデータとを分割できる。ネットワークのジッタを防止するために、バッファメモリ(615)は受信器(610)とエントロピー復号器/パーサー(620)(以下は「パーサー」と呼ばれる)との間に連結される。受信器(610)は十分な帯域幅及び制御可能性を有する記憶/転送機器、または等時性リアルタイムネットワークからデータを受信する場合、バッファ(615)を必要としないか、またはバッファ(615)が小さくてもよい。例えばインターネットのような最適パケットネットワークで利用するために、バッファ(615)を必要とするかもしれなく、バッファ(615)は相対的に大きく、有利に自己適応の大きさを有してもよい。
ビデオ復号器(510)は、パーサー(620)を有することで、エントロピー符号化されたビデオシーケンスに基づいて符号(621)を再構成する。図6に示すように、これらの符号のカテゴリには、復号器(510)の操作を管理するための情報、及び復号器の構成部分ではないが、復号器に連結されるディスプレイ(512)のような表示機器を制御するための潜在情報が含まれる。(1つ又は複数の)表示機器に用いられる制御情報は、補助強化情報(SEIメッセージ)またはビデオユーザビリティ情報(VUI)パラメータセットセグメント(図示せず)という形式であってもよい。パーサー(620)は受信された、符号化されたビデオシーケンスに対して解析/エントロピー復号を行うことができる。符号化されたビデオシーケンスの符号化は、ビデオ符号化技術または基準に応じて行われて、当業者の既知原理に従い、可変長符号、ハフマン符号(Huffman coding)、コンテキスト感度を有しまたは有していない算術符号を含む。パーサー(620)はグループに対応する少なくとも1つのパラメータに基づき、符号化されたビデオシーケンスから、ビデオ復号器における画素のサブグループにおける少なくとも1つのサブグループのサブグループパラメータセットを抽出する。サブグループには、ピクチャグループ(GOP)、ピクチャ、タイル、スライス、マクロブロック、符号化ユニット(CU)、ブロック、変換ユニット(TU)、予測ユニット(PU)などが含まれる。エントロピー復号器/パーサーはさらに、符号化されたビデオシーケンスから、変換係数、量子化器パラメータ(QP)値、動きベクトルなどのような情報を抽出できる。
パーサー(620)は、バッファ(615)から受信されたビデオシーケンスに対してエントロピー復号/解析操作を実行することで、符号(621)を構築する。パーサー(620)は符号化されたデータを受信し、選択的に特定符号(621)に対して復号を行う。また、パーサー(620)は、特定符号(621)が動き補償予測ユニット(653)、スケーラ/逆変換ユニット(651)、フレーム内予測ユニット(652)またはループフィルタ(656)に提供されるかどうかを決定する。
符号化されたビデオピクチャまたは符号化されたビデオピクチャの一部のタイプ(例えば:フレーム間ピクチャとフレーム内ピクチャ、フレーム間ブロックとフレーム内ブロック)及び他の要因に依存し、符号(621)の再構成は複数の異なるユニットに関わる。どのユニットに関わるか、関わる方式について、パーサー(620)が符号化されたビデオシーケンスから解析したサブグループ制御情報によって制御する。簡潔のために、パーサー(620)と以下の複数のユニットとの間にある、このようなサブグループ制御情報ストリームを記載しない。
既に言及された機能ブロック以外、復号器(510)は概念的以下に記載の複数の機能ユニットに細分される。商業制約で作動する実際の実現方式において、これらのユニットにおける複数のユニットは互いに密接に対話するとともに、少なくとも部分的に互いに集積されてもよい。ただし、開示されたテーマを記載するという目的から見れば、概念的に以下の機能ユニットに細分されることは適切である。
第1ユニットはスケーラ/逆変換ユニット(651)である。スケーラ/逆変換ユニット(651)はパーサー(620)から、(1つ又は複数の)符号(621)としての量子化変換係数及び制御情報を受信し、どんな変換方式を利用するか、ブロックの大きさ、量子化因子、量子化スケーリング行列などを含む。スケーラ/逆変換ユニット(651)はアグリゲーター(655)に入力されるサンプル値が含まれるブロックを出力できる。
ある状況で、スケーラ/逆変換ユニット(651)の出力サンプルはフレーム内符号器ブロックに属してもよく、即ち、前に再構築されたピクチャからの予測性情報を利用しないが、現在ピクチャの前に再構築された部分からの予測性情報のブロックを利用できる。このような予測性情報はフレーム内ピクチャ予測ユニット(652)から提供される。ある状況で、フレーム内ピクチャ予測ユニット(652)は現在(部分的に再構築)ピクチャ(656)から抽出された周辺の再構築された情報によって、再構成中のブロックの大きさ及び形状と同様であるブロックを生成する。ある状況で、アグリゲーター(655)は各サンプルに基づき、フレーム内予測ユニット(652)が生成した予測情報を、スケーラ/逆変換ユニット(651)によって提供された出力サンプル情報に追加する。
他の状況で、スケーラ/逆変換ユニット(651)の出力サンプルはフレーム間符号化と潜在動き補償ブロックに属してもよい。このような状況で、動き補償予測ユニット(653)は参照ピクチャメモリ(657)にアクセスすることで、予測のためのサンプルを抽出できる。該ブロックに属する符号(621)に基づいて抽出されたサンプルに対して動き補償を行った後、これらのサンプルは、アグリゲーター(655)によって、スケーラ/逆変換ユニットの出力に追加される(この場合、残差サンプルまたは残差信号と呼ばれる)ことで、出力サンプル情報を生成する。動き補償予測ユニットが予測サンプルを抽出する参照ピクチャメモリ内のアドレスは、動きベクトルによって制御でき、動きベクトルは符号(621)の形式で、動き補償予測ユニットに用いられ、符号(621)は、例えばX、Y及び参照ピクチャ成分を有してもよい。動き補償はさらに、サブサンプルの正確な動きベクトルを使用する際、参照ピクチャメモリから抽出されたサンプル値の補間、動きベクトル予測メカニズムなどを含んでもよい。
アグリゲーター(655)の出力サンプルは、ループフィルタユニット(656)において、各種のループフィルタリング技術を利用できる。ビデオ圧縮技術はループ内フィルタ技術を含み、ループ内フィルタ技術は、符号化されたビデオシーケンスに含まれるとともに、パーサー(620)からの符号(621)として、ループフィルタユニット(656)のパラメータ制御に使用されるが、ビデオ圧縮技術は、符号化されたピクチャまたは符号化されたビデオシーケンスの(復号の順序で)の前の部分を復号する期間で取得されたメタ情報、及び前に再構築されループフィルタリングを経るサンプル値に応答できる。
ループフィルタユニット(656)の出力は、サンプルストリームであってもよく、該サンプルストリームは表示機器(512)に出力され、参照ピクチャメモリ(656)に記憶されることで、後のフレーム間ピクチャ予測に用いられる。
完全に再構成されると、ある符号化されたピクチャは参照ピクチャとして、後の予測に用いることができる。符号化されたピクチャが完全に再構成され、符号化されたピクチャ(例えばパーサー(620)を介して)が参照ピクチャとして認識されると、現在ピクチャバッファ(656)は参照ピクチャバッファ(657)の一部になり、その後の符号化されたピクチャを再構成する前に、新たな現在ピクチャバッファを改めて割り当てる。
ビデオ復号器(510)は、例えばITU−T H.265提案書の基準における所定ビデオ圧縮技術に基づき、復号操作を実行することができる。符号化されたビデオシーケンスは、ビデオ圧縮技術または基準の文法、及びビデオ圧縮技術または基準に記録されたコンフィグファイルという両者に従うという意味で、符号化されたビデオシーケンスは使用中のビデオ圧縮技術または基準が指定する文法に合わせる。準拠性について、符号化されたビデオシーケンスの複雑度は、ビデオ圧縮技術または基準のレベルによって限定される範囲内にあるように要求する。ある状況で、レベルは最大ピクチャの大きさ、最大フレームレート、最大再構築サンプリングレート(例えば、百万サンプル/秒で測定する)、最大参照ピクチャの大きさを制限する。ある状況で、レベルによる配置される制限は、仮想参照復号器(HRD)の仕様、及び符号化されたビデオシーケンスにおいてシグナリングされたHRDバッファの管理のメタデータを介してさらに限定される。
1つの実施例において、受信器(610)は追加(冗長)データ及び符号化されたビデオを受信できる。追加データは(1つ又は複数の)符号化されたビデオシーケンスの一部として含まれる。追加データはビデオ復号器(510)によって利用されることで、データを適切に復号し、及び/またはオリジナルビデオデータをより正確に再構築することができる。追加データは、例えば時間、空間または信号対雑音比(SNR)強化層、冗長スライス、冗長ピクチャ、前方誤り訂正符号などの形式であってもよい。
図7は、本開示内容による1つの実施例のビデオ符号器(503)の機能ブロック図である。
符号器(503)は、ビデオソース(501)(符号器の一部ではない)からビデオサンプルを受信し、該ビデオソースは符号器(503)によって符号化される(1つ又は複数の)ビデオ画像をキャプチャする。
ビデオソース(501)は、ビデオ符号器(503)によって符号化される、デジタルビデオサンプルストリーム形式であるソースビデオシーケンスを提供し、該デジタルビデオサンプルストリームは、任意の適切なビット深度(例えば、8ビット、10ビット、12ビット…)、任意の色空間(例えば、BT.601 YCrCB、RGB……)、及び任意の適切なサンプリング構成(例えば、YCrCb4:2:0、YCrCb4:4:4)を有してもよい。メディアサービスシステムにおいて、ビデオソース(501)は前に準備されたビデオを記憶するための記憶機器であってもよい。ビデオ会議システムにおいて、ビデオソース(503)はビデオシーケンスとして、ローカル画像情報をキャプチャするための撮影装置であってもよい。ビデオデータは、順序に応じて見る際、動きが付与された複数の単独のピクチャとして提供されてもよい。ピクチャそのものは、空間画素アレイとして組織され、使用中のサンプリング構成、色空間などに依存し、各画素には1つ又は複数のサンプルが含まれてもよい。画素とサンプルとの間の関係は、当業者にとって容易に理解できる。以下の記載はサンプルに着目する。
1つの実施例に基づき、ビデオ符号器(503)は、リアルタイムまたはアプリケーションの必要な任意の他の時間の制約で、ソースビデオシーケンスのピクチャを符号化するとともに、符号化されたビデオシーケンス(743)として圧縮する。適切的な符号化速度で実行することは、コントローラ(750)の1つの機能である。コントローラは以下に記載の他の機能ユニットを制御するとともに、機能で他の機能ユニットに連結される。簡潔のために、該連結を図示していない。コントローラにより配置されるパラメータは、レート制御に関するパラメータ(ピクチャスキップ、量子化器、レート歪み最適化技術のλ値......)、ピクチャの大きさ、ピクチャグループ(GOP)の配置、最大動きベクトルの検索範囲などを含んでもよい。コントローラ(750)は他の適切な機能を有するように配置されてもよく、これらの機能は、あるシステム設計に対して最適化したビデオ符号器(503)に属する。
ビデオ符号器は、当業者が容易に「符号化ループ」として認識できる方式で操作する。非常に簡単な記載として、符号化ループは、符号器(730)の符号化部分(「ソース符号器」と呼ばれる)(符号化対象となる入力ピクチャと(1つ又は複数の)参照ピクチャに基づき符号を構築することを担当する)、符号器(503)に埋め込まれる(ローカル)復号器(733)を有し、該復号器(733)は符号を再構成することで、サンプルデータを構築し、(リモート)復号器も構築される(なぜならば、符号と符号化されたビデオビットストリームとの間の圧縮は、開示されたテーマで考慮されるビデオ圧縮技術において可逆であるからだ)。再構成されたサンプルストリームを参照ピクチャメモリ(734)に入力する。符号ストリームの復号のため、復号器位置(ロカールまたはリモート)と関係がないビット正確結果を発生させるから、参照ピクチャバッファのコンテンツはローカル符号器とリモート符号器との間にもビット正確である。言い換えれば、符号器の予測部分から「見られる」参照ピクチャサンプルは、復号器が復号期間で予測を利用しようとする際に「見られる」サンプル値と完全に同様である。参照ピクチャの同期性のような基本原理(及び、例えばチャンネル誤差から、同期性を維持できない場合に発生するドリフト)は当業者にとって公知である。
「ローカル」復号器(733)の操作は、以上図6を結合し詳しく記載した「リモート」復号器(510)の操作と同様であってもよい。ただし、さらに図7を簡単に参照し、符号は利用可能で、且つエントロピー符号器(745)とパーサー(620)とがロスレスに符号を符号化されたビデオシーケンスに符号化/復号する場合、チャンネル(612)、受信器(610)、バッファ(615)及びパーサー(620)が含まれる復号器(510)のエントロピー復号部分は、ローカル復号器(733)で完全に実現できないおそれがある。
この場合、復号器に存在する解析/エントロピー復号以外の任意の復号器技術も、必然として、基本的に同じ機能という形式で、対応する符号器に存在する。符号器技術と全面的に記載された復号器技術とは反対するから、符号器技術に対する記載を簡略化し得る。ある領域のみに必要で、より詳しい記載は以下で提供される。
ソース符号器(730)の操作の一部として、ソース符号器(730)は動き補償予測符号化を実行し、動き補償予測符号化はビデオシーケンスからの、「参照フレーム」として指定される1つ又は複数の符号化されたフレームを参照することで、入力フレームに対して予測性符号化を行う。該方式で、符号化エンジン(732)は入力フレームの画素ブロックと、入力フレームの(1つ又は複数の)予測参照として選択される(1つ又は複数の)参照フレームの画素ブロックとの間の差に対して符号化を行う。
ローカルビデオ復号器(733)は、ソース符号器(730)によって構築された符号に基づき、参照フレームとして指定できるフレームの符号化されたビデオデータを復号することができる。符号化エンジン(732)の操作は好ましくは非可逆処理である。符号化されたビデオデータがビデオ復号器(図6において図示せず)で復号できると、再構築されたビデオシーケンスは、一般的にある程度誤差を有するソースビデオシーケンスのコピーであってもよい。ローカルビデオ復号器(733)はビデオ復号器が参照フレームに対して実行する復号処理をコピーするとともに、再構築された参照フレームを参照ピクチャキャッシュ(734)に記憶させる。該方式で、ビデオ符号器(503)は再構築された参照ピクチャのコピーをローカル的に記憶し、該コピーは、リモートビデオ復号器によって取得される再構築の参照ピクチャと、共通のコンテンツを有する(伝送誤差がない)。
予測器(735)は、符号化エンジン(732)に対して予測検索を実行することができる。即ち、符号化対象となる新たなフレームに対して、予測器(735)は参照ピクチャメモリ(734)から新たなピクチャとしての適切な予測参照のサンプルデータ(候補参照画素ブロックとして)、またはあるメタデータ例えば参照ピクチャ動きベクトル、ブロック形状などを検索する。予測器(735)はサンプルブロックに基づき、画素ブロックごとに操作することで、適切な予測参照を見つけることができる。ある状況で、予測器(735)によって取得された検索結果に基づき決定されるように、入力ピクチャは参照ピクチャメモリ(734)に記憶された複数の参照ピクチャから取得される予測参照を有してもよい。
コントローラ(750)は、例えばビデオデータを符号化するためのパラメータとサブグループパラメータを配置することを含むビデオ符号器(730)の符号化操作を管理する。
エントロピー符号器(745)において、以上に言及された全ての機能ユニットの出力に対してエントロピー符号化を行う。エントロピー符号器は当業者の既知技術に応じて、例えばハフマン符号、可変長符号、算術符号などによって、符号に対して可逆圧縮を行うことで、各機能ユニットから生成された符号を、符号化されたビデオシーケンスに変換する。
伝送器(740)は、エントロピー符号器(745)によって構築された(1つ又は複数の)符号化されたビデオシーケンスをバッファリングすることで、通信チャンネル(760)を介して伝送するように準備し、該通信チャンネル(760)は符号化されたビデオデータを記憶するための記憶機器へのハードウェア/ソフトウェアリンクであってもよい。伝送器(740)はビデオ符号器(730)からの符号化されたビデオデータと、伝送対象となる他のデータ、例えば符号化されたオーディオデータ及び/または補助データストリーム(ソースを図示せず)とをマージする。
コントローラ(750)は符号器(503)の操作を管理する。符号化期間に、コントローラ(750)は各符号化されたピクチャに特定の符号化されたピクチャタイプを割り当て、該特定の符号化されたピクチャタイプは、相応的なピクチャに適用される符号化技術に影響するおそれがある。例えば、一般的に、ピクチャは以下のフレームタイプのうちの1つとして割り当てられる。
フレーム内ピクチャ(Iピクチャ)であって、シーケンスにおけるいずれの他のピクチャも予測のソースとしていない場合に、符号化及び復号されるピクチャであってもよい。例えば独立復号器リフレッシュピクチャが含まれる異なるタイプのフレーム内ピクチャを許容するビデオコーデックもある。当業者は、Iピクチャの変体及びその相応的な応用、特徴を理解できる。
予測性ピクチャ(Pピクチャ)であって、多くても1つの動きベクトル及び参照インデックスによって各ブロックのサンプル値を予測する場合、フレーム内予測またはフレーム間予測を利用して符号化及び復号を行うピクチャであってもよい。
双方向予測性ピクチャ(Bピクチャ)であって、多くても2つの動きベクトル及び参照インデックスによって、各ブロックのサンプル値を予測する場合、フレーム内予測またはフレーム間予測を利用して符号化及び復号を行うピクチャであってもよい。類似するように、複数の予測性ピクチャは、2つより多い参照ピクチャと関するメタデータを、単一のブロックの再構築に使用できる。
ソースピクチャは一般的に、空間で複数のサンプルブロック(例えば、4×4、8×8、4×8または16×16個のサンプルのブロック)に細分できるとともに、ブロックごとに符号化を行う。これらのブロックは、他の(符号化された)ブロックを参照し、予測性的に符号化を行って、他のブロックはブロックの相応的なピクチャに適用される符号化割当によって決定される。例えば、Iピクチャのブロックに対して非予測符号化を行うか、またはIピクチャのブロックは、同一のピクチャの符号化されたブロックを参照して、予測性符号化(空間予測またはフレーム内予測)を行う。Pピクチャの画素ブロックは、前に符号化された1つの参照ピクチャを参照し、空間予測または時間予測を介して予測性的に符号化を行ってもよい。Bピクチャのブロックは、前に符号化された1つまたは2つの参照ピクチャを参照し、空間予測または時間予測を介して予測性的に符号化を行ってもよい。
ビデオ符号器(503)は例えばITU−T H.265提案書の所定のビデオ符号化技術または基準に基づき符号化操作を実行することができる。その操作において、ビデオ符号器(503)は、入力ビデオシーケンスにおける時間と空間冗長を利用した予測性符号化操作を含む各種の圧縮操作を実行できる。従って、符号化されたビデオデータは、使用のビデオ符号化技術または基準が指定する文法に合う。
1つの実施例において、伝送器(740)は追加データ及び符号化されたビデオを伝送することができる。ソース符号器(730)は符号化されたビデオシーケンスの一部として、このようなデータを含んでもよい。追加データは、時間/空間/SNR強化層、冗長ピクチャ及びスライスのような他の形式の冗長データ、補充強化情報(SEI)メッセージ、ビデオユーザビリティ情報(VUI)パラメータセットセグメントなどを含んでもよい。
本開示内容は、フレーム間ピクチャ予測符号化のための動きベクトル予測を認識する若干の方法に関わる。本開示内容に提出された技術は、マージモード、または差分符号化を有する動きベクトル予測という両者に適用される。以下において、マージモードを利用して詳しく検討する。さらに、拡張マージモードに中間マージ候補を追加することを提出する。本開示内容に提出された方法は、マージ概念を利用する任意のビデオ符号化方法に拡張できる。スキップモードはマージモードを利用して動き情報を導出するから、本開示内容における技術はスキップモードにも適用される。
図8は、中間候補によってマージ候補リストを生成するプロセス800の例示のフローチャートである。いくつかの実現形態において、図8の1つ又は複数の処理ブロックは符号器503によって実行される。いくつかの実現形態において、図8の1つ又は複数の処理ブロックは、符号器503と分割されるか、または符号器503が含まれた他の機器または1組の機器、例えば復号器510によって実行される。
図8に示すように、プロセス800は第1候補ブロックを決定することを含み、該第1候補ブロックは現在ブロックのトップエッジの上方にある垂直位置と、現在ブロックの水平中心に隣接する水平位置とを有する(ブロック810)。
図8にさらに示すように、プロセス800は第2候補ブロックを決定することを含み、該第2候補ブロックは現在ブロックの左エッジの左側にある水平位置と、現在ブロックの垂直中心に隣接する垂直位置とを有する(ブロック820)。
図8にさらに示すように、プロセス800は、第1候補ブロックと第2候補ブロックを利用して、マージ候補リストを生成することで、ビデオシーケンスに対する符号化または復号を許可する(ブロック830)ことを含む。
図8はプロセス800の例示ブロックを示すが、いくつかの実現形態において、図8に示したこれらのブロックに比べると、プロセス800は、追加のブロック、より少ないブロック、異なるブロックまたは別に配置されるブロックを含む。追加または任意選択で、プロセス800の2つ以上のブロックは並行実行されてもよい。
図9は、現在ブロックの中間候補をマージ候補リストに追加することを示す図面である。例えば、マージ候補リストの生成期間に、現在ブロック(900)の中間候補を、マージ候補リストに含ませる。図面に示すように、マージ候補リストの生成期間に、現在ブロック(900)のトップエッジに対して中間にある候補(901)、(902)及び(903)を、マージ候補リストに含ませる。追加または任意選択で、マージ候補リストの生成期間に、現在ブロック(900)の左エッジに対して中間にある候補(904)、(905)及び(906)をマージ候補リストに含ませる。
例示として、WとHとはそれぞれ現在ブロック(900)の幅と高さを示し、現在ブロックの左上の画素の座標を(0,0)にして、Gはグリッドの大きさを示し、隣接していない候補は、各カテゴリにおいて、水平及び/または垂直に分けられたG個の画素になるように配置される。
現在ブロック(800)のトップエッジの上方にある第n(nはゼロに初期化され、nがゼロである場合、トップエッジに最も近接する中間候補である)個の中間候補(901)、(902)及び(903)の左下の画素の座標は以下のように示される。
Figure 2021521751
現在ブロックのトップエッジの上方にある第n(nはゼロに初期化され、nがゼロである場合、左エッジに最も近接する中間候補である)個の中間候補(901)、(902)及び(903)の右上の画素の座標は以下のように示される。
Figure 2021521751
マージ候補リストの生成期間に、これらの中間候補はマージ候補リストの前に含まれる。1つの実施例において、候補をマージ候補リストに含ませる場合、順序はF(i,j)、G(i,j)、A(i,j)、B(i,j)、C(i,j)、D(i,j)、E(i,j)になる。代用案として、これらの中間候補はマージ候補リストの末尾に含まれてもよい。非制限的例示として、マージ候補リストを生成する場合、順序はA(i,j)、B(i,j)、C(i,j)、D(i,j)、E(i,j)、F(i,j)、G(i,j)になってもよい。
他の実施例において、2つの最も近接する隣接中間候補を追加しない。現在ブロック(900)に隣接しない中間候補をマージ候補リストに挿入する。
図10は、現在ブロック中間候補をマージ候補リストに追加することを示す図面である。図10に示すように、マージ候補リストの生成期間に、上方と左上にある中間候補を、マージ候補リストに含ませる。左上と左側にある中間候補もマージ候補リストに含ませる。例えば、図10に示すように、マージ候補リストの生成期間に、現在ブロック(1000)のトップエッジに対して中間にある候補(1001)、(1002)及び(1003)をマージ候補リストに含ませる。また、図10に示すように、マージ候補リストの生成期間に、現在ブロック(1000)の左エッジに対して中間にある候補(1004)、(1005)及び(1006)を、マージ候補リストに含ませる。
例えば、WとHとはそれぞれ現在ブロック(1000)の幅と高さを示し、現在ブロックの左上の画素の座標を(0,0)にして、Gはグリッドの大きさを示し、隣接しない候補は各カテゴリにおいて、水平及び/または垂直に分けられたG個の画素になるように配置される。
現在ブロック(1000)のトップエッジの上方にある第n(nはゼロに初期化され、nがゼロである場合、トップエッジに最も近接する中間候補である)個の中間候補の左下の画素の座標は以下のように示される。
Figure 2021521751

現在ブロックのトップエッジの上方にある第n(nはゼロに初期化され、nがゼロである場合、左エッジに最も近接する中間候補である)個の中間候補の右上の画素の座標は以下のように示される。
Figure 2021521751

中間候補はマージ候補リストの前に含まれる。非制限的例示として、マージ候補リストを生成する場合、順序はF(i,j)、G(i,j)、A(i,j)、B(i,j)、C(i,j)、D(i,j)、E(i,j)になる。代用案として、これらの中間候補はマージ候補リストの末尾に含まれてもよい。例えば、非制限的例示として、順序はA(i,j)、B(i,j)、C(i,j)、D(i,j)、E(i,j)、F(i,j)、G(i,j)になってもよい。
他の実施例において、2つの最も近接する隣接中間候補を追加しない。現在ブロックに隣接しない中間候補をマージ候補リストに挿入する。
他の実施例において、マージ候補リストから、隣接しない上方候補または隣接しない左候補を除去してもよい。上方領域の中間候補を追加する場合、上方にある隣接しない候補を置き換えてもよい。左領域の中間候補を追加する場合、左にある隣接しない候補を置き換えてもよい。
他の実施例において、右上にある隣接しない候補または左下にある隣接しない候補を、中間候補に置き換えてもよい。
参照左位置及び右位置の中間点を算出することで、トップまたは左側の中間候補の位置を決定する。このような中間点を取得した後、中間候補のための参照候補位置に対する選択は、中間点の左手側または右手側にあってもよい。例えば、図11に示すように、A0(N/2)とA0(N/2+1)とは、現在ブロックのトップにある中間点に隣接する2つの隣接ブロックである。この2つの隣接ブロックのうちのいずれかは、中間候補とみなされてもよい。類似するように、中間候補は、左側中間点の真上または真下から選択されてもよい。
図11は、現在ブロック及び空間マージ候補としての周囲にある隣接サブブロックを示す。A00:現在ブロックの左上サブブロックであり、A0n:現在ブロックの上方サブブロック(n=1~(N+M))であり、Lm0:現在ブロックの左サブブロック(m=1~(M+N))である。
前記技術はコンピュータ読み取り可能な命令によってコンピュータソフトウェアとして実現され、物理的に1つ又は複数のコンピュータ読み取り可能な媒体に記憶される。例えば、図12は開示のテーマを実現するためのいくつかの実施形態に適用されるコンピュータシステム1200を示す。
コンピュータソフトウェアは任意の適切なマシンコードまたはコンピュータ言語によって符号化を行って、マシンコードまたはコンピュータ言語は編集、コンパイル、リンクなどのメカニズムを介して命令が含まれるコードを構築し、該命令は1つ又は複数のコンピュータ中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)などによって直接的に実行されるか、または解釈、マイクロコード実行などによって実行される。
前記命令は各種タイプのコンピュータまたはその部材で実行でき、例えばパーソナルコンピュータ、タブレット、サーバ、スマートフォン、ゲーム機器、モノのインターネット機器などを含む。
図12に示すコンピュータシステム(1200)の部材は、本開示内容を実現するための実施例のコンピュータソフトウェアの使用範囲または機能に対して限定せず、本質に例示的である。部材の配置も、コンピュータシステム(1200)の例示性の実施例で示した部材におけるいずれかの部材、またはその組み合わせに関する依存性または要求を有するように解釈されるべきではない。
コンピュータシステム(1200)はいくつかのヒューマンマシンインターフェイス入力機器を含んでもよい。このようなヒューマンマシンインターフェイス入力機器は、人類ユーザの、例えば触覚入力(例えば:キーストローク、スライド、データグローブ移動)、オーディオ入力(例えば:音声、たたき)、視覚入力(例えば:姿勢)、嗅覚入力(図示せず)による1つ以上の入力に応答できる。マンマシンインタフェース機器はさらに、必ずしも人類の意識的な入力に直接的に関していない、ある媒体例えば、オーディオ(例えば:音声、音楽、環境音)、画像(例えば:スキャン画像、静態画像撮影装置から取得された写真画像)、ビデオ(例えば2次元ビデオ、立体ビデオが含まれる3次元ビデオ)をキャプチャできる。
入力ヒューマンマシンインターフェイス機器は、キーボード1201、マウス1202、タッチパッド1203、タッチパネル1210、データグローブ1204、ジョイスティック1205、マイク1206、スキャナ1207、撮影装置1208のうちの1つ又は複数を有してもよい(記載の各々のうちの、1つだけ)。
コンピュータシステム(1200)はさらにマンマシンインタフェース出力機器を有してもよい。このようなマンマシンインタフェース出力機器は、例えば触覚出力、音、光及び匂い/味を介して1つ又は複数の人類ユーザの感覚を刺激できる。このようなマンマシンインタフェース出力機器は触覚出力機器(例えば、タッチパネル(1210)、データグローブ1204またはジョイスティック(1205)による触覚フィードバック、但し入力機器として用いられない触覚フィードバック機器も存在する)、オーディオ出力機器(例えば、スピーカー(1209)、ヘッドフォン(図示せず))、視覚出力機器(例えば、スクリーン(1210)、CRTスクリーン、LCDスクリーン、プラズマスクリーン、OLEDスクリーンを含み、各スクリーンはタッチパネル入力能力、触覚フィードバック能力を有してもよく、有してなくてもよく、そのうちのいくつかは、立体画像出力のような手段で、2次元の視覚を出力または3次元以上の出力を行い、バーチャルリアリティ眼鏡(図示せず)、ホログラフィックディスプレイ及びスモークタンク(図示せず)がある)、プリンター(図示せず)を含む。
コンピュータシステム(1200)はさらに人類がアクセスし得る記憶機器及びその関連する媒体を有してもよく、例えば、CD/DVDなどの媒体(1221)を有するCD/DVD ROM/RW(1220)を含む光学媒体、サムドライブ(1222)、取り外し可能なハードドライブまたはソリッドステートドライブ(1223)、磁気テープとフロッピーディスク(図示せず)のような伝統の磁気媒体、専用ROM/ASIC/PLDに基づく機器、例えばドングル(図示せず)などを含む。
当業者は、現在開示のテーマを結合して、使用される用語「コンピュータ読み取り可能な媒体」には伝送媒体、搬送波または他の瞬間信号が含まれないことを理解できる。
コンピュータシステム(1200)は、さらに1つ又は複数の通信ネットワークのインタフェースを有してもよい。ネットワークは、例えば無線、有線、光学であってもよい。ネットワークはさらに、ローカル、広域、都市用、車両用、工業用、リアルタイム、遅延耐性ネットワークなどであってもよい。ネットワークの例示はイーサネットのようなローカルエリアネットワーク、無線LAN、GSM、3G、4G、5G、LTEなどが含まれたセルラーネットワーク、有線テレビ、衛星テレビ及び地上波テレビが含まれるテレビ有線または無線広域デジタルネットワーク、CANBusが含まれる車両及び工業ネットワークなどを含む。あるネットワークは一般的に、ある汎用データポートまたは周辺バス(1249)(例えば、コンピュータシステム(1200)のUSBポート)に連結される外部ネットワークインタフェースアダプタを必要とし、他のネットワークは一般的に、以下に記載のシステムバス(例えば、PCコンピュータシステムへのイーサネットインタフェース、またはスマートフォンコンピュータシステムへのセルラーネットワークインタフェース)に連結されることで、コンピュータシステム(1200)のコアに集積される。これらのネットワークのうちのいずれかのネットワークを介して、コンピュータシステム(1200)は他のエンティティと通信できる。このような通信は一方向で受信だけ(例えば、放送テレビ)、一方向で送信だけ(例えば、あるCANbus機器へのCANbus)、または双方向である(例えば、ローカルエリアまたは広域デジタルネットワークを介して他のコンピュータシステムへ)。以上に記載のこれらのネットワーク及びネットワークインタフェースのうちの各ネットワーク及びネットワークインタフェースに、特定のプロトコル及びプロトコルスタックを利用できる。
前記ヒューマンマシンインターフェイス機器、人類がアクセスし得る記憶機器及びネットワークインタフェースは、コンピュータシステム1200のコア1240に連結できる。
コア(1240)は1つ又は複数の中央処理ユニット(CPU)(1241)、グラフィック処理ユニット(GPU)(1242)、フィールドプログラム可能なゲートアレイ(FPGA)(1243)という形式の専門プログラム可能な処理ユニット、あるタスクのためのハードウェアアクセラレータ(1244)などを含む。これらの機器は、読み取り専用メモリ(ROM)(1245)、ランダムアクセスメモリ(1246)、内部のユーザがアクセスできないハードディスクドライブ、SSDなどのような内部大容量記憶装置(1247)とともに、システムバス(1248)を介して接続される。あるコンピュータシステムにおいて、1つ又は複数の物理プラグという形式で、システムバス(1248)にアクセスすることで、別のCPU、GPUなどによって拡張できる。周囲機器は直接的または周辺バス(1249)を介してコアのシステムバス(1248)に連結される。周辺バスのアーキテクチャはPCI、USBなどを含む。
CPU(1241)、GPU(1242)、FPGA(1243)及びアクセラレータ(1244)はいくつかの命令を実行でき、これらの命令を組み合わせて、以上に言及されたコンピュータコードを構成する。該コンピュータコードはROM(1245)またはRAM(1246)に記憶される。移行データはRAM(1246)に記憶され、永久データは、例えば内部大容量記憶装置(1247)に記憶されてもよい。キャッシュメモリによってメモリ機器のうちのいずれかのメモリ機器の快速記憶及び検索を実現でき、該キャッシュメモリは1つ又は複数のCPU(1241)、GPU(1242)、大容量記憶装置(1247)、ROM(1245)、RAM(1246)などに密接に関連できる。
コンピュータ読み取り可能な媒体は、コンピュータが実現する各種操作を実行するためのコンピュータコードを有する。媒体とコンピュータコードとは、本開示内容の目的のために、専門に設計され及び構築された媒体とコンピュータコードであってもよいし、またはコンピュータソフトウェアの当業者にとって、公知且つ利用可能なタイプであってもよい。
限定ではなく例示として、アーキテクチャ(1200)を有するコンピュータシステム、特にコア(1240)は、(1つ又は複数)プロセッサ(CPU、GPU、FPGA、アクセラレータなどを含む)が1つ又は複数の有形コンピュータ読み取り可能な媒体に体現されるソフトウェアを実行することで、機能を提供できる。このようなコンピュータ読み取り可能な媒体は、以上に紹介された、ユーザがアクセスし得る大容量記憶装置に関する媒体、及び非一時的なコア(1240)を有する、コア内部大容量記憶装置(1247)またはROM(1245)のような記憶装置であってもよい。本開示内容を実現するための各種実施例のソフトウェアはこのような機器に記憶され、コア(1240)に実行される。特定の需要に応じて、コンピュータ読み取り可能な媒体には1つ又は複数の記憶機器またはチップが含まれてもよい。ソフトウェアはコア(1240)、特にそのうちのプロセッサ(CPU、GPU、FPGAなどが含まれた)に、本明細書に記載の特定プロセスまたは特定プロセスの特定部分を実行させ、RAM(1246)に記憶されるデータ構成を限定すること、及びソフトウェアにより限定されたプロセスに基づき、このようなデータ構成を修正することが含まれる。また或いは代わりとして、コンピュータシステムは、論理的な固定接続または他の方式で回路(例えば、アクセラレータ(1244))に体現されることで機能を提供し、該回路は、ソフトウェアの代わりとして、またはソフトウェアとともに操作することで、本明細書に記載の特定プロセスまたは特定プロセスの特定部分を実行できる。適切な場合、言及のソフトウェアにはロジックが含まれ、逆に、言及ロジックにはソフトウェアが含まれてもよい。適切な場合、言及のコンピュータ読み取り可能な媒体には、実行するためのソフトウェアが記憶される回路(例えば、集積回路(IC))、実行するためのロジックを体現する回路、或いは前記両者が含まれてもよい。本開示内容にはハードウェアとソフトウェアとの任意の適切な組み合わせが含まれる。
本開示内容には若干の例示性の実施例が記載されているが、本開示内容の範囲内にある変更、置き換え及びいろんな置換等価物が存在する。従って、本明細書には明らかに記載されていないが、本開示内容の原理を体現し本開示内容の精神及び範囲内に属する多いシステム及び方法は、当業者にとって想到し得る。
頭字語:
高効率ビデオ符号化(HEVC)
符号化ユニット(CU)
予測ユニット(PU)
共同探索モデル7(JEM7)
共同ビデオ専門家チーム(JVET)
代替時間動きベクトル予測(ATMVP)
空間時間動きベクトル予測(STMVP)
予測(P)スライス
双方向予測(B)スライス
レート歪み(RD)
時間動きベクトル予測(TMVP)
コンテキスト適応バイナリ算術符号化(CABAC)
多機能ビデオ符号化(VVC)
補助強化情報(SEI)

Claims (20)

  1. 機器によって実行される、ビデオシーケンスを符号化または復号するためのマージ候補リストを生成する方法であって、
    第1候補ブロックを決定するステップであって、前記第1候補ブロックは、現在ブロックのトップエッジの上方にある垂直位置と、前記現在ブロックの水平中心に隣接する水平位置とを有する、ステップと、
    第2候補ブロックを決定するステップであって、前記第2候補ブロックは、前記現在ブロックの左エッジの左側にある水平位置と、前記現在ブロックの垂直中心に隣接する垂直位置とを有する、ステップと、
    前記第1候補ブロックと前記第2候補ブロックを利用して、前記マージ候補リストを生成することで、前記ビデオシーケンスに対する符号化または復号を許可するステップと、
    を含む方法。
  2. 前記現在ブロックの幅と前記第1候補ブロックのグリッドの大きさを決定するステップと、
    前記現在ブロックの幅と前記第1候補ブロックのグリッドの大きさに基づき、前記第1候補ブロックを決定するステップと、
    をさらに含む請求項1に記載の方法。
  3. 前記現在ブロックの高さと前記第1候補ブロックのグリッドの大きさを決定するステップと、
    前記現在ブロックの高さと前記第1候補ブロックのグリッドの大きさに基づき、前記第1候補ブロックを決定するステップと、
    をさらに含む請求項1に記載の方法。
  4. 他の第1候補ブロックを決定するステップであって、前記他の第1候補ブロックは、前記現在ブロックのトップエッジの上方にあるとともに、前記第1候補ブロックの上方にある垂直位置と、前記現在ブロックの水平中心に隣接する水平位置とを有する、ステップと、
    他の第2候補ブロックを決定するステップであって、前記他の第2候補ブロックは、前記第2候補ブロックの左エッジの左側にある水平位置と、前記現在ブロックの垂直中心に隣接する垂直位置とを有する、ステップと、
    前記他の第1候補ブロックと前記他の第2候補ブロックを利用して、前記マージ候補リストを生成するステップと、
    をさらに含む請求項1乃至3のいずれか一項に記載の方法。
  5. 他の第1候補ブロックを決定するステップであって、前記他の第1候補ブロックは、前記現在ブロックのトップエッジの上方にあるとともに、前記第1候補ブロックの上方にある垂直位置と、前記現在ブロックの水平中心の左側にある水平位置とを有する、ステップと、
    他の第2候補ブロックを決定するステップであって、前記他の第2候補ブロックは、前記第2候補ブロックの左エッジの左側にある水平位置と、前記現在ブロックの垂直中心の上方にある垂直位置とを有する、ステップと、
    前記他の第1候補ブロックと前記他の第2候補ブロックを利用して、前記マージ候補リストを生成するステップと、
    をさらに含む請求項1乃至3のいずれか一項に記載の方法。
  6. オフセットサーチ範囲を決定するステップと、
    前記オフセットサーチ範囲に基づき、前記現在ブロックのトップエッジの上方にある候補ブロックセットを決定するステップと、
    前記候補ブロックセットを利用して、前記マージ候補リストを生成するステップと、
    をさらに含む請求項1乃至5のいずれか一項に記載の方法。
  7. 前記現在ブロックの水平中心を決定するステップと、
    前記現在ブロックの水平中心に基づき、前記第1候補ブロックを決定するステップであって、前記第1候補ブロックは、前記現在ブロックのトップエッジの上方にある垂直位置と、前記現在ブロックの水平中心に隣接する水平位置とを有し、前記第1候補ブロックの水平位置は、前記現在ブロックの水平中心の右側にあるステップと、
    をさらに含む請求項1に記載の方法。
  8. 前記現在ブロックの水平中心を決定するステップと、
    前記現在ブロックの水平中心に基づき、前記第1候補ブロックを決定するステップであって、前記第1候補ブロックは、前記現在ブロックのトップエッジの上方にある垂直位置と、前記現在ブロックの水平中心に隣接する水平位置とを有し、前記第1候補ブロックの水平位置は、前記現在ブロックの水平中心の左側にあるステップと、
    をさらに含む請求項1に記載の方法。
  9. 前記第1候補ブロックを決定することに基づき、参照候補ブロックを置き換えるステップと、
    前記参照候補ブロックを置き換えることに基づき、前記マージ候補リストを生成するステップと、
    をさらに含む請求項1乃至3、7又は8のいずれか一項に記載の方法。
  10. インデックスをシグナリングするステップと、
    インデックスをシグナリングすることに基づき、前記マージ候補リストから候補ブロックの動きベクトルを決定するステップと、
    前記動きベクトルに基づき前記ビデオシーケンスに対して符号化または復号を行うステップと、
    をさらに含む請求項1乃至9のいずれか一項に記載の方法。
  11. ビデオシーケンスを符号化または復号するためのマージ候補リストを生成するための機器であって、前記機器は、
    プログラムコードを記憶するように配置される少なくとも1つのメモリと、
    前記プログラムコードを読み取るとともに、前記プログラムコードの指示に応じて動作するように配置される少なくとも1つのプロセッサと、を備え、
    前記プログラムコードは、
    前記少なくとも1つのプロセッサに第1候補ブロックを決定させるように配置される第1決定コードであって、前記第1候補ブロックは現在ブロックのトップエッジの上方にある垂直位置と、前記現在ブロックの水平中心に隣接する水平位置とを有する、第1決定コードと、
    前記少なくとも1つのプロセッサに第2候補ブロックを決定させるように配置される第2決定コードであって、前記第2候補ブロックは、前記現在ブロックの左エッジの左側にある水平位置と、前記現在ブロックの垂直中心に隣接する垂直位置とを有する、第2決定コードと、
    前記少なくとも1つのプロセッサに、前記第1候補ブロックと前記第2候補ブロックを利用して、前記マージ候補リストを生成させることで、前記ビデオシーケンスに対する符号化または復号を許可するように配置される、生成コードと、
    を有する、機器。
  12. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、前記現在ブロックの幅と前記第1候補ブロックのグリッドの大きさを決定させるように配置される第3決定コードをさらに有し、
    前記第1決定コードは、前記少なくとも1つのプロセッサに、前記現在ブロックの幅と前記第1候補ブロックのグリッドの大きさに基づき、前記第1候補ブロックを決定させるように配置される、請求項11に記載の機器。
  13. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、前記現在ブロックの高さと前記第1候補ブロックのグリッドの大きさを決定させるように配置される第3決定コードをさらに有し、
    前記第1決定コードは、前記少なくとも1つのプロセッサに、前記現在ブロックの高さと前記第1候補ブロックのグリッドの大きさに基づき、前記第1候補ブロックを決定させるように配置される、請求項11に記載の機器。
  14. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、他の第1候補ブロックを決定させるように配置される第4決定コードであって、前記他の第1候補ブロックは前記現在ブロックのトップエッジの上方にあるとともに、前記第1候補ブロックの上方にある垂直位置と、前記現在ブロックの水平中心に隣接する水平位置とを有する、第4決定コードと、
    前記少なくとも1つのプロセッサに、他の第2候補ブロックを決定させるように配置される第5決定コードであって、前記他の第2候補ブロックは前記第2候補ブロックの左エッジの左側にある水平位置と、前記現在ブロックの垂直中心に隣接する垂直位置とを有する、第5決定コードと、
    をさらに有し、
    前記生成コードは、前記少なくとも1つのプロセッサに、前記他の第1候補ブロックと前記他の第2候補ブロックを利用して前記マージ候補リストを生成させるように配置される、請求項11乃至13のいずれか一項に記載の機器。
  15. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、他の第1候補ブロックを決定させるように配置される第4決定コードであって、前記他の第1候補ブロックは、前記現在ブロックのトップエッジの上方にあるとともに、前記第1候補ブロック上方にある垂直位置と、前記現在ブロックの水平中心の左側にある水平位置とを有する第4決定コードと、
    前記少なくとも1つのプロセッサに、他の第2候補ブロックを決定させるように配置される第5決定コードであって、前記他の第2候補ブロックは、前記第2候補ブロックの左エッジの左側にある水平位置と、前記現在ブロックの垂直中心の上方にある垂直位置とを有する第5決定コードと、
    をさらに有し、
    前記生成コードは、前記少なくとも1つのプロセッサに、前記他の第1候補ブロックと前記他の第2候補ブロックを利用して、前記マージ候補リストを生成させるように配置される、請求項11乃至13のいずれか一項に記載の機器。
  16. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、オフセットサーチ範囲を決定させるように配置される第6決定コードと、
    前記少なくとも1つのプロセッサに、前記オフセットサーチ範囲に基づき、前記現在ブロックのトップエッジの上方にある候補ブロックセットを決定させるように配置される第7決定コードと、
    をさらに有し、
    前記生成コードは、前記少なくとも1つのプロセッサに、前記候補ブロックセットを利用して前記マージ候補リストを生成させるように配置される、請求項11乃至15のいずれか一項に記載の機器。
  17. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、前記現在ブロックの水平中心を決定させるように配置される第3決定コードをさらに有し、
    前記第1決定コードは、前記少なくとも1つのプロセッサに、前記現在ブロックの水平中心に基づき、前記第1候補ブロックを決定させるように配置され、前記第1候補ブロックは、前記現在ブロックのトップエッジの上方にある垂直位置と、前記現在ブロックの水平中心に隣接する水平位置とを有し、前記第1候補ブロックの水平位置は、前記現在ブロックの水平中心の右側にある、請求項11に記載の機器。
  18. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、前記現在ブロックの水平中心を決定させるように配置される第3決定コードをさらに有し、
    前記第1決定コードは、前記少なくとも1つのプロセッサに、前記現在ブロックの水平中心に基づき、前記第1候補ブロックを決定させるように配置され、前記第1候補ブロックは、前記現在ブロックのトップエッジの上方にある垂直位置と、前記現在ブロックの水平中心に隣接する水平位置とを有し、前記第1候補ブロックの水平位置は、前記現在ブロックの水平中心の左側にある、請求項11に記載の機器。
  19. 前記プログラムコードは、
    前記少なくとも1つのプロセッサに、前記第1候補ブロックを決定することに基づき、参照候補ブロックを置き換えさせるように配置される置換コードを有し、
    前記生成コードは、前記少なくとも1つのプロセッサに、前記参照候補ブロックを置き換えることに基づき、前記マージ候補リストを生成させるように配置される、請求項11乃至13、17又は18のいずれか一項に記載の機器。
  20. 機器の1つ又は複数のプロセッサに請求項1乃至10のいずれか一項に記載の方法を実行させるコンピュータプログラム。
JP2021512368A 2018-06-04 2019-05-22 ビデオ符号化において追加中間候補を有するマージモードの方法及び装置 Active JP7130851B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862680486P 2018-06-04 2018-06-04
US62/680,486 2018-06-04
US16/219,533 2018-12-13
US16/219,533 US10587885B2 (en) 2018-06-04 2018-12-13 Method and apparatus for merge mode with additional middle candidates in video coding
PCT/US2019/033443 WO2019236290A1 (en) 2018-06-04 2019-05-22 Method and apparatus for merge mode with additional middle candidates in video coding

Publications (2)

Publication Number Publication Date
JP2021521751A true JP2021521751A (ja) 2021-08-26
JP7130851B2 JP7130851B2 (ja) 2022-09-05

Family

ID=68693405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021512368A Active JP7130851B2 (ja) 2018-06-04 2019-05-22 ビデオ符号化において追加中間候補を有するマージモードの方法及び装置

Country Status (6)

Country Link
US (2) US10587885B2 (ja)
EP (1) EP3804323A4 (ja)
JP (1) JP7130851B2 (ja)
KR (1) KR102496457B1 (ja)
CN (1) CN112806009B (ja)
WO (1) WO2019236290A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110677658B (zh) * 2018-07-01 2022-07-12 北京字节跳动网络技术有限公司 基于优先级的非相邻Merge设计
US10827195B2 (en) * 2018-08-03 2020-11-03 Tencent America LLC Method and apparatus for unifying adjacent merge candidates and non-adjacent merge candidates
US11394990B2 (en) 2019-05-09 2022-07-19 Tencent America LLC Method and apparatus for signaling predictor candidate list size
US11212545B2 (en) 2019-06-07 2021-12-28 Tencent America LLC Method and apparatus for improved implicit transform selection
CN118660158A (zh) 2019-07-11 2024-09-17 腾讯美国有限责任公司 视频编解码的方法和装置
US11616962B2 (en) 2019-07-15 2023-03-28 Tencent America LLC Method and apparatus for video coding
US11375243B2 (en) 2019-07-17 2022-06-28 Tencent America LLC Method and apparatus for video coding
WO2021055126A1 (en) * 2019-09-19 2021-03-25 Alibaba Group Holding Limited Methods for constructing a merge candidate list
US11310511B2 (en) 2019-10-09 2022-04-19 Tencent America LLC Method and apparatus for video coding
CN113438521B (zh) * 2021-05-28 2023-04-18 曙光网络科技有限公司 视频文件生成方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180227593A1 (en) * 2017-02-07 2018-08-09 Mediatek Inc. Adaptive prediction candidate positions for video coding
WO2018231700A1 (en) * 2017-06-13 2018-12-20 Qualcomm Incorporated Motion vector prediction

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4630564B2 (ja) * 2004-03-30 2011-02-09 国立大学法人浜松医科大学 手術支援装置、方法及びプログラム
CN106412602B (zh) * 2010-09-02 2019-11-15 Lg电子株式会社 编码和解码视频的方法和使用该方法的装置
ES2770437T3 (es) * 2011-03-21 2020-07-01 Lg Electronics Inc Método para seleccionar un predictor de vector de movimiento y un dispositivo que lo utiliza
US9485517B2 (en) * 2011-04-20 2016-11-01 Qualcomm Incorporated Motion vector prediction with motion vectors from multiple views in multi-view video coding
US9699456B2 (en) * 2011-07-20 2017-07-04 Qualcomm Incorporated Buffering prediction data in video coding
PL3468197T3 (pl) * 2011-09-09 2022-07-11 Lg Electronics Inc. Sposób predykcji inter i urządzenie do niego
US9736489B2 (en) * 2011-09-17 2017-08-15 Qualcomm Incorporated Motion vector determination for video coding
US8964845B2 (en) * 2011-12-28 2015-02-24 Microsoft Corporation Merge mode for motion information prediction
US20130177083A1 (en) * 2012-01-05 2013-07-11 Qualcomm Incorporated Motion vector candidate index signaling in video coding
US9549180B2 (en) * 2012-04-20 2017-01-17 Qualcomm Incorporated Disparity vector generation for inter-view prediction for video coding
US9350970B2 (en) * 2012-12-14 2016-05-24 Qualcomm Incorporated Disparity vector derivation
US9521389B2 (en) * 2013-03-06 2016-12-13 Qualcomm Incorporated Derived disparity vector in 3D video coding
US10009621B2 (en) * 2013-05-31 2018-06-26 Qualcomm Incorporated Advanced depth inter coding based on disparity of depth blocks
KR102312335B1 (ko) * 2013-12-20 2021-10-13 삼성전자주식회사 휘도 보상을 이용한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
KR101904683B1 (ko) * 2014-12-09 2018-10-04 미디어텍 인크. 비디오 코딩에서 움직임 벡터 예측자 또는 합병 후보를 도출하는 방법
CN108141604B (zh) * 2015-06-05 2022-07-05 杜比实验室特许公司 图像编码和解码方法和图像解码设备
WO2019225994A1 (ko) * 2018-05-24 2019-11-28 주식회사 케이티 비디오 신호 처리 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180227593A1 (en) * 2017-02-07 2018-08-09 Mediatek Inc. Adaptive prediction candidate positions for video coding
WO2018231700A1 (en) * 2017-06-13 2018-12-20 Qualcomm Incorporated Motion vector prediction

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CHIH-WEI HSU, ET AL.: "Description of SDR video coding technology proposal by MediaTek", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-J0018, JPN6021045314, April 2018 (2018-04-01), pages 1 - 12, ISSN: 0004673804 *
GUICHUN LI, XIAOZHONG XU, XIANG LI, AND SHAN LIU: "CE4-related: extension of merge and AMVP candidates for inter prediction", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-K0301-v1, JPN6021045312, July 2018 (2018-07-01), pages 1 - 5, ISSN: 0004754433 *
JICHENG AN, NA ZHANG, XU CHEN, AND JIANHUA ZHENG: "Enhanced Merge Mode based on JEM7.0", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-J0059-v1, JPN6021040049, April 2018 (2018-04-01), pages 1 - 14, ISSN: 0004754432 *
JING YE, XIANG LI, AND SHAN LIU: "Merge mode modification on top of Tencent’s software in response to CfP", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-J0058-v1, JPN6021040046, April 2018 (2018-04-01), pages 1 - 4, ISSN: 0004754431 *
XIANG LI ET AL.: "Description of SDR video coding technology proposal by Tencent", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-J0029-v1, JPN6021040047, April 2018 (2018-04-01), pages 8 - 9, ISSN: 0004754428 *
YI-WEN CHEN ET AL.: "Description of SDR, HDR and 360° video coding technology proposal by Qualcomm and Technicolor - low", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-J0021, JPN6021040048, April 2018 (2018-04-01), pages 15 - 19, ISSN: 0004754430 *

Also Published As

Publication number Publication date
US10587885B2 (en) 2020-03-10
US20200280728A1 (en) 2020-09-03
CN112806009A (zh) 2021-05-14
EP3804323A4 (en) 2022-07-06
JP7130851B2 (ja) 2022-09-05
KR20210006430A (ko) 2021-01-18
EP3804323A1 (en) 2021-04-14
US20190373272A1 (en) 2019-12-05
WO2019236290A1 (en) 2019-12-12
US11394983B2 (en) 2022-07-19
KR102496457B1 (ko) 2023-02-07
CN112806009B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
JP7062788B2 (ja) ビデオを復号する方法、装置およびコンピュータプログラム
JP7026249B2 (ja) 映像復号化のための方法、装置及びコンピュータ・プログラム
JP7057448B2 (ja) ビデオ圧縮における複数ラインのフレーム内予測のための方法および装置
JP7104178B2 (ja) マルチラインフレーム内予測のための方法、装置、及びコンピュータプログラム
JP7112600B2 (ja) 点群解凍用方法、点群圧縮用方法及び装置
JP7130851B2 (ja) ビデオ符号化において追加中間候補を有するマージモードの方法及び装置
JP2022520378A (ja) 参照画像リサンプリングのためのシグナリング
JP2022515031A (ja) ビデオコーディングのための方法、機器及びコンピュータ・プログラム
JP7457170B2 (ja) サブブロックに基づく時間的動きベクトル予測のための方法並びにその機器及びコンピュータプログラム
JP2021519039A (ja) 動画の符号化並びに復号の方法、装置及びコンピュータプログラム
KR20200125733A (ko) 비디오 코딩을 위한 방법 및 장치
JP7420991B2 (ja) ビデオ符号化のための方法、及び装置
JP7080434B2 (ja) サブブロックの動きベクトル予測の方法、並びにその装置及びコンピュータプログラム
JP2021518091A (ja) ビデオ符号化のための方法並びにその装置及びコンピュータプログラム
JP2021520173A (ja) ピクチャの復号のための方法、機器及びコンピュータプログラム
JP2021517410A5 (ja)
CN115529464B (zh) 视频编码、解码的方法、装置、设备和计算机可读介质
JP2021517391A5 (ja)
JP2022512109A (ja) ビデオ復号及び符号化の方法、装置並びにプログラム
JP2021520157A (ja) コーディングブロックフラグと予測モードの改善されたコンテキスト設計のための方法及び装置、並びにコンピュータプログラム
CN113348664B (zh) 视频解码的方法、装置及计算机可读介质
JP2023547170A (ja) 改善されたイントラ予測のための方法および装置
JP7026818B2 (ja) ビデオ符号化で適応的なグリッドサイズを有する拡張マージモードのための方法並びにそのデバイス及びコンピュータプログラム
JP7061680B2 (ja) ビデオ符号化において縮減された前のラインバッファを使用するインター予測の方法及び装置
JP2021517394A5 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220824

R150 Certificate of patent or registration of utility model

Ref document number: 7130851

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150