JP2022008472A - 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置 - Google Patents

低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置 Download PDF

Info

Publication number
JP2022008472A
JP2022008472A JP2021153615A JP2021153615A JP2022008472A JP 2022008472 A JP2022008472 A JP 2022008472A JP 2021153615 A JP2021153615 A JP 2021153615A JP 2021153615 A JP2021153615 A JP 2021153615A JP 2022008472 A JP2022008472 A JP 2022008472A
Authority
JP
Japan
Prior art keywords
motion vector
refinement
refined
image
fractional sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021153615A
Other languages
English (en)
Other versions
JP7330243B2 (ja
Inventor
ギローム ラロシュ,
Laroche Guillaume
パトリス オンノ,
Onno Patrice
ジョナサン タケ,
Taquet Jonathan
クリストフ ジスケ,
Gisquet Christophe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2022008472A publication Critical patent/JP2022008472A/ja
Priority to JP2023120924A priority Critical patent/JP7542118B2/ja
Application granted granted Critical
Publication of JP7330243B2 publication Critical patent/JP7330243B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Figure 2022008472000001
【課題】フレームレートアップコンバージョンモード又はFRUCモードとして、参照されるデコーダ側の動きベクトル導出モードを使用する特定の符号化モードによる符号化又は復号する方法及び装置を提供する。
【解決手段】マージFRUCモードを導出するプロセスは、サブ画素レベルで得られた動きベクトルの精度を高めるための精緻化ステップ614、624を含む。このプロセスは、異なるパターンに従って、得られた動きベクトルの周りの異なるサブピクセル位置の評価を含む。
【効果】既知の精緻化ステップを改善すると共に、テンプレート内のマッチングタイプ及び/又は信号の特性を考慮することによって、符号化効率を改善する。
【選択図】図6

Description

本開示は、ビデオデータを符号化または復号するための方法およびデバイスに関する。より詳細には、本発明がフレームレートアップコンバージョンモード(Frame-Rate Up Conversion)又はFRUCモードとして参照される、デコーダ側動きベクトル導出モードを使用する特定の符号化モードによる符号化に関する。
ビデオデータの予測符号化は、フレームのピクセルのブロックへの分割に基づく。画素の各ブロックについて、予測ブロックが利用可能なデータ内で探索される。予測ブロックは、INTER符号化モードにおいては、現在のブロックとは異なる参照フレームにおけるブロックとなり、INTRA符号化モードにおいては現在のフレーム内の隣接画素から生成される。予測ブロックを決定する異なる方法に従って、異なる符号化モードが定義される。符号化の結果は、予測ブロックと、符号化されるブロックと予測ブロックとの間の差からなる残差ブロックとの指示である。
INTER符号化モードに関して、予測ブロックの指示は、符号化しようとしているブロックの位置に対する予測ブロックの参照画像内の位置を与える動きベクトルである。動きベクトルは、それ自体、動きベクトル予測子(motion vector predictor)に基づいて予測的に符号化される。HEVC (High Efficiency Video Coding)規格は、動きベクトルの予測符号化のためのいくつかの既知の符号化モード、すなわち、AMVP(Advanced Motion Vector Prediction)モード、マージ導出プロセスを定義する。これらのモードは、動きベクトル予測子の候補リストの構築と、エンコードに使用されるこのリスト内の動きベクトル予測子のインデックスのシグナリングとに基づく。典型的には、残差動きベクトルもシグナリングされる。
最近、FRUCと呼ばれる、動きベクトル予測に関する新しい符号化モードが導入された。これは、シグナリングを全く伴わない動きベクトル予測子のデコーダ側導出プロセスを定義する。導出プロセスの結果は、デコーダによるインデックスまたは残差動きベクトルの送信なしに、動きベクトル予測子として使用される。
FRUCマージモードにおける、導出プロセスは、得られた動きベクトルの精度をサブ画素レベルにて高めるための精緻化(refinement)ステップを含む。このプロセスは、異なるパターンに従って、得られた動きベクトルの周りの異なるサブ画素位置の評価することを含む。
本発明は、既知の精緻化ステップを改善するために考案されたものである。そして、本発明は、テンプレート内のマッチングタイプおよび/または信号の特性を考慮することによって、符号化効率を改善することを目的とする。
本発明の第1の態様により提供される、各々が画素のブロックに分割されるフレームを有するビデオデータを符号化または復号する方法は、
画素のブロックごとに、
デコーダ側の動きベクトル導出法によって動き情報を得るモードを用いて動きベクトルの動きベクトルリストを導出することと、
1つの動きベクトルを選択するため、動きベクトルのリストを評価することと、
選択された動きベクトルの近傍のサブ画素位置にて動きベクトルを評価することによって、選択された動きベクトルを精緻化することと
ここで、少なくともいくつかのサブ画素位置は、1/16画素ピクセル以上の解像度で選択される
を有する。
実施形態における、前記選択された動きベクトルを精緻化することは、複数の探索ステップを有し、
この探索ステップの少なくとも1つは、1/16サブ画素以上の解像度でのサブピクセル位置に関与する。
実施形態における、前記複数の探索ステップは、少なくとも3つの連続するステップを含み、
当該3つの連続する探索ステップの各々は、所与の解像度でのサブ画素位置を含み、
最後の2つの探索ステップに関連する各所与の解像度は、前の探索ステップの所与の分解能よりも大きい。
実施形態における、前記複数の探索ステップは、少なくとも、第1のサブ画素解像度で行われるダイヤモンドパターンに基づく探索ステップと、前記第1のサブピクセル解像度よりも高いサブ画素解像度で行われるクロスパターンに基づく2つの探索ステップとを含む。
実施形態における、少なくとも、幾つかの探索ステップは、前記画素のブロックを符号化するために用いるマッチングタイプに依存するサブ画素解像度で行われる。
実施形態における、第1の探索ステップは、1/4サブ画素解像度で行われるダイヤモンドパターンに基づく探索ステップであり、
第2の探索ステップは、1/8サブ画素解像度で行われるクロスパターンに基づく探索ステップであり、
第3の探索ステップは、1/16サブ画素解像度で行われるクロスパターンに基づく探索ステップである。
本発明の他の態様により提供される、各々が画素のブロックに分割されフレームで構成されるビデオデータを符号化又は復号する方法は、
画素のブロックごとに、
デコーダ側の動きベクトル導出法によって動き情報を得るモードを用いて動きベクトルの動きベクトルリストを導出することと、
1つの動きベクトルを選択するため、動きベクトルのリストを評価することと、
選択された動きベクトルの近傍のサブ画素位置にて動きベクトルを評価することによって、選択された動きベクトルを精緻化することと
ここで、サブ画素位置が、少なくとも複数のパターンから選択されたパターンに従って評価され、
ここで、前記複数のパターンは、水平パターン及び垂直パターンを含む
を有する。
実施形態における、前記複数のパターンは、更に、少なくとも斜めパターンを有する。
実施形態における、前記複数のパターンにおけるパターンは、隣接する画素のブロック内で検出されたエッジ方向に基づいて選択される。
実施形態における、前記複数のパターンにおける少なくとも1つのパターンは、1/16サブ画素以上の解像度で定義される。
本発明の他の態様により提供される、各々が画素のブロックに分割されるフレームを有するビデオデータを符号化または復号する方法は、
画素ブロックごとに、
デコーダ側の動きベクトル導出法によって動き情報を得るモードを用いて動きベクトルの動きベクトルリストを導出することと、
1つの動きベクトルを選択するため、動きベクトルのリストを評価することと、
少なくとも近傍の画素のブロックの信号内容に基づき、選択された動きベクトルの近傍のサブ画素位置にて動きベクトルを評価することによって、選択された動きベクトルを精緻化することと
を有する。
実施形態における、前記信号内容は、前記近傍の画素ブロック内の周波数である。
本発明の他の態様により提供される、各々が画素のブロックに分割されるフレームを有するビデオデータを符号化または復号する方法は、
画素ブロックごとに、
デコーダ側の動きベクトル導出法によって動き情報を得るモードを用いて動きベクトルの動きベクトルリストを導出することと、
1つの動きベクトルを選択するため、動きベクトルのリストを評価することと、
ここで、動きベクトルの動きベクトルリストの評価は、画素のブロックの近傍の画素のパターンによって定義されるテンプレートに基づく;
動きベクトルの動きベクトルリストの導出に用いられるテンプレートは、前記テンプレートの信号内容に基づき決定される
を有する。
実施形態における、前記信号内容は、前記テンプレート内の周波数である。
本発明の他の態様により提供されるのは、プログラマブル装置のためのコンピュータプログラム製品であって、前記プログアマブル装置によりロードされ実行されたとき、この発明を実施するための命令シーケンスを有するコンピュータプログラム製品である。
本発明の他の対応により提供されるのは、この発明を実施するためのコンピュータプログラムの命令を格納したコンピュータが読取り可能な記憶媒体である。
本発明の他の態様により提供される、各々が画素のブロックに分割されるフレームを有するビデオデータを復号する復号装置は、
画素のブロックを復号するように構成されるプロセッサを有し、当該プロセッサが、
デコーダ側の動きベクトル導出法によって動き情報を得るモードを用いて動きベクトルの動きベクトルリストを導出し、
1つの動きベクトルを選択するため、動きベクトルのリストを評価し、
選択された動きベクトルの近傍のサブ画素位置にて動きベクトルを評価することによって、選択された動きベクトルを精緻化する、
ここで、少なくともいくつかのサブ画素位置は、1/16画素ピクセル以上の解像度で選択される
ことを特徴とする。
本発明の他の態様により提供される、各々が画素のブロックに分割されるフレームを有するビデオデータを復号する復号装置は、
画素のブロックを復号するように構成されるプロセッサを有し、当該プロセッサが、
デコーダ側の動きベクトル導出法によって動き情報を得るモードを用いて動きベクトルの動きベクトルリストを導出し、
1つの動きベクトルを選択するため、動きベクトルのリストを評価し、
選択された動きベクトルの近傍のサブ画素位置にて動きベクトルを評価することによって、選択された動きベクトルを精緻化する、
ここで、サブ画素位置が、少なくとも複数のパターンから選択されたパターンに従って評価され、
ここで、前記複数のパターンは、水平パターン及び垂直パターンを含む
ことを特徴とする。
本発明の他の態様により提供される、各々が画素のブロックに分割されるフレームを有するビデオデータを復号する復号装置は、
画素のブロックを復号するように構成されるプロセッサを有し、当該プロセッサが、
デコーダ側の動きベクトル導出法によって動き情報を得るモードを用いて動きベクトルの動きベクトルリストを導出し、
1つの動きベクトルを選択するため、動きベクトルのリストを評価し、
少なくとも近傍の画素のブロックの信号内容に基づき、選択された動きベクトルの近傍のサブ画素位置にて動きベクトルを評価することによって、選択された動きベクトルを精緻化することを判定する
ことを特徴とする。
本発明の他の態様により提供される、各々が画素のブロックに分割されるフレームを有するビデオデータを復号する復号装置は、
画素のブロックを復号するように構成されるプロセッサを有し、当該プロセッサが、
デコーダ側の動きベクトル導出法によって動き情報を得るモードを用いて動きベクトルの動きベクトルリストを導出し、
1つの動きベクトルを選択するため、動きベクトルのリストを評価する、
ここで、動きベクトルの動きベクトルリストの評価は、画素のブロックの近傍の画素のパターンによって定義されるテンプレートに基づく;
動きベクトルの動きベクトルリストの導出に用いられるテンプレートは、前記テンプレートの信号内容に基づき決定される
ことを特徴とする。
本発明による方法の少なくとも一部は、コンピュータで実施することができる。したがって、本発明は、全体的にハードウェアの実施形態、全体的にソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、または本明細書ではすべて一般に「回路」、「モジュール」、または「システム」と呼ばれることがあるソフトウェアおよびハードウェアの態様を組み合わせた実施形態の形態をとることができる。さらに、本発明は、媒体に具現化されたコンピュータ使用可能プログラムコードを有する任意の有形の表現媒体に具現化されたコンピュータプログラム製品の形成をとることができる。
本発明はソフトウェアで実施することができるので、本発明は、任意の適切なキャリア媒体上のプログラマブル装置に提供するためのコンピュータ可読コードとして実施することができる。有形の非一時的キャリア媒体は、フロッピー(登録商標)ディスク、CD-ROM、ハードディスクドライブ、磁気テープ装置、またはソリッドステートメモリ装置などの記憶媒体を含むことができる。過渡搬送媒体は、電気信号、電子信号、光信号、音響信号、磁気信号、または電磁信号、例えばマイクロ波またはRF信号などの信号を含むことができる。
ここで、本発明の実施形態を、単なる例として、以下の図面を参照して説明する。
HEVCエンコーダアーキテクチャを示す図。 デコーダの原理を示す図。 FRUCマージモードにおけるテンプレートマッチングおよびバイラテラルマッチングを示す図。 FRUCマージ情報の復号を示す図。 マージモードおよびマージFRUCモードのエンコーダ評価を示す図。 JEMの符号化単位およびサブ符号化単位レベルにおけるマージFRUCモード導出を示す図。 JEMテンプレートマッチング法における現ブロックの周囲のテンプレートを示す図。 動きベクトル精緻化を示す図。 本発明の実施形態における、動きベクトル精緻化の適応サブ画素解像度を示す図。 従来技術及び本発明の一実施形態で得られる結果の例を示す図。 本発明の一実施形態にて利用される、幾つかの動きベクトル精緻化探索形状を示す図。 本発明の一実施形態における、動きベクトル精緻化のための適応探索形状を示す図。 本発明の一実施形態における、適応動きベクトル精緻化を示す図。 本発明の一実施形態における、動きベクトル精緻化のためのテンプレート選択を示す図。 本発明の1以上の実施形態を実施するためのコンピューティングデバイスの概略ブロック図。
図1は、HEVCエンコーダアーキテクチャを示す。ビデオエンコーダでは、オリジナルシーケンス101が、符号化単位(coding unit)と呼ばれる、画素のブロック102に分割される。次に、符号化モードが各ブロックに影響を及ぼされる。HEVCで典型的に使用される符号化モードには、空間予測に基づくモード、すなわちINTRAモード103と、時間予測に基づくモード、すなわち、動き推定104および動き補償105に基づくINTERモードの2つのファミリがある。INTRA符号化単位は、一般に、INTRA予測と呼ばれるプロセスによって、その因果境界における符号化された画素から予測される。
時間的予測は最初に、動き推定ステップ104において、符号化単位に最も近い参照領域を参照フレーム116と呼ばれる、以前のまたは将来のフレームにおいて見つけることからなる。この参照領域は、予測ブロックを構成する。次に、この符号化単位は、予測ブロックを使用して予測され、動き補償ステップ105において残差を計算される。
空間的および時間的予測の両方の場合において、残差は、オリジナルの予測子ブロックから符号化単位を減算することによって計算される。
INTRA予測では、予測方向が符号化される。時間予測では、少なくとも1つの動きベクトルが符号化される。しかしながら、動きベクトル符号化に関連するビットレートコストをさらに低減するために、動きベクトルは直接符号化されない。実際、動きが均一であると仮定すると、動きベクトルを、この動きベクトルとその周囲の動きベクトルとの間の差としてエンコードすることは特に興味深い。例えば、H.264/AVC符号化規格では、動きベクトルが現在のブロックの上および左に位置する3つのブロック間で計算された中央ベクトル(median vector)に関して符号化される。中央ベクトルと現在のブロック動きベクトルとの間で計算された差分(残差動きベクトルとも呼ばれる)のみが、ビットストリームに符号化される。これは、モジュール“Mv予測および符号化”117で処理される。各符号化ベクトルの値は、動きベクトルフィールド118に記憶される。予測に使用される隣接する動きベクトルは、動きベクトルフィールド118から抽出される。
次に、モジュール106において、レート歪み性能を最適化するモードが選択される。冗長性をさらに低減するために、モジュール107内にて、変換、典型的にはDCTが残差ブロックに適用され、そして、モジュール108にて量子化がその係数に適用される。次に、量子化された係数ブロックは、モジュール109において、エントロピー符号化され、その結果がビットストリーム110に挿入される。
次に、エンコーダはモジュール111~116において、将来の動き推定のために、符号化されたフレームのデコードを実行する。これらのステップは、エンコーダおよびデコーダが同じ参照フレームを有することを可能にする。符号化されたフレームを再構成するため、モジュール111にて残差は逆量子化され、モジュール112において逆変換されて、ピクセル領域において“再構成された(reconstructed)”残差を提供する。符号化モード(INTERまたはINTRA)に従って、この残差はINTER予測器114又はINTRA予測器113に加えられる。
次に、この第1の再構成は、モジュール115において、1つまたは複数の種類のポストフィルタリングによってフィルタリングされる。これらのポストフィルタは、符号化及び復号されるループに統合される。エンコーダおよびデコーダ側で同じ参照フレームを使用するために、それらをエンコーダおよびデコーダ側で再構成されたフレームに適用する必要があることを意味する。このポストフィルタリングの目的は、圧縮アーチファクトを除去することである。
図2には、デコーダの原理が示されている。ビデオストリーム201は、まずモジュール202においてエントロピー復号される。次に、残差データは、モジュール203において逆量子化され、モジュール204において逆変換されて、画素値が得られる。モードデータは、また、モードの機能としてエントロピー復号され、INTRAAタイプ復号またはINTERタイプ復号が実行される。INTRAモードの場合は、ビットストリーム205にて特定されるINTRA予測モードの機能としてINTRA予測子が決定される。モードがINTERの場合は、動き情報がビットストリーム202から抽出される。これは、参照フレームインデックスと動きベクトル残差とから構成される。動きベクトル予測子は、動きベクトル210を得るため、動きベクトル残差に加えられる。次に、動きベクトルを使用して、参照フレーム206内の参照領域の位置が突き止められる。なお、動きベクトルフィールドデータ211は、次に復号される動きベクトルの予測に用いるために、復号された動きベクトルで更新される。デコードされたフレームのこの第1の再構成は、エンコーダ側で使用されるのと全く同じポストフィルタでポストフィルタリング207される。デコーダの出力は、圧縮解除されたビデオ209となる。
HEVC規格は3つの異なるINTERモード、すなわち、インターモード、マージモード(Merge mode)、およびマージスキップモード(Merge Skip mode)を使用する。これらのモード間の主な違いは、ビットストリームにおけるデータシグナリングである。動きベクトル符号化の場合、現在のHEVC規格は、その先行技術と比較して、動きベクトル予測のための競合ベースのスキームを含む。インターモードまたはマージモードのそれぞれについて最良の動きベクトル予測子または最良の動き情報を見つけるために、いくつかの候補が符号器側で率歪み基準と競合していることを意味する。最良の予測子または動き情報の最良の候補に対応するインデックスが、ビットストリームに挿入される。デコーダは予測子または候補の同じセットを導出することができ、デコードされたインデックスに従って最良のものを使用することになる。
予測子および候補の導出の設計は、複雑さに大きな影響を与えることなく最良の符号化効率を達成するために非常に重要である。HEVCでは、2つの動きベクトル導出が使用される。1つはインターモード(Advanced Motion Vector Prediction(AMVP))のためのものであり、1つはマージモード(Merge derivation process)のためのものである。
既に述べたように、マージモードの候補(“古典的(classical)”またはスキップ)は、方向、リスト、参照フレーム・インデックス、および動きベクトルの全て動き情報を表す。いくつかの候補が、以下に記載されるマージ導出プロセスによって生成され、それぞれがインデックスを有する。現在のHEVC設計では、両方のマージモードの最大候補は5に等しい。
JEMの現在のバージョンでは、テンプレートマッチングとバイラテラルマッチングの2つのタイプの検索が可能である。図3は、これら2つの方法を示している。バイラテラルマッチング301の原理は、現在の符号化ユニットの動き軌跡に沿って、以下に説明するテンプレートマッチングとの類推によって時にはテンプレートとも呼ばれる、2つのブロック間の最良のマッチングを見つけることである。
テンプレートマッチング302の原理は、現在のブロックの周りの再構成された画素と、評価された動きベクトルによって指し示されるブロックの周りの隣接する画素との間のマッチングコストを計算することによって、現在の符号化単位の動き情報を導出することである。テンプレートは、現在のブロックの周りの隣接画素のパターン、および予測ブロックの周りの隣接画素の対応するパターンに対応する。
両マッチングタイプ(テンプレートまたはバイラテラル)について、計算された異なるマッチングコストが比較されて、最良のマッチングコストが見つけられる。最良の一致を得る動きベクトルまたは動きベクトルの対が、導出された動き情報として選択される。さらなる詳細は、JVET-F1001に見出すことができる。
両マッチング方法は、動き情報全体、動きベクトル、参照フレーム、予測のタイプを導出する可能性を提供する。JEMにおいて“FRUC”と記されている、デコーダ側における動き情報導出は、全てのHEVCインターモード、すなわちAMVP、マージ及びマージスキップに対して適用される。
AMVPの場合、すべての動き情報、すなわち、uniまたはbi予測、参照フレームインデックス、予測子インデックス動きベクトル、および残差動きベクトルがシグナリングされ、FRUC法が適用されて、予測子のリストである場合、第1の予測子に設定される新しい予測子が決定される。従って、それはインデックス0を有する。
マージおよびマージスキップモードの場合、FRUCフラグがCUに対してシグナリングされる。FRUCが偽である場合、マージインデックスがシグナリングされ、通常のマージモードが使用される。FRUCフラグが真であるとき、追加のFRUCモードフラグは、どの方法(双方向マッチングまたはテンプレートマッチング)がブロックの動き情報を導出するために使用されるべきかを示すためにシグナリングされる。なお、バイラテラルマッチングは、Bフレームのみに適用され、Pフレームには適用されない。
マージおよびマージスキップモードの場合、動きベクトルフィールドが、現在のブロックに対して定義される。これは、ベクトルが、現符号化単位よりも小さいサブ符号化単位に対して定義されることを意味する。さらに、古典的なマージに関しては、各リストに対する1つの動きベクトルがブロックに対する動き情報を形成することができる。
図4は、ブロックのマージモードのためのFRUCフラグのシグナリングを示すフローチャートである。ブロックは、HEVC表現による符号化単位または予測単位とすることができる。
第1のステップ401にて、符号化単位がスキップモードに従って符号化されているかどうかを知るために、スキップフラグが復号される。ステップ402のテストで、このフラグが偽であった場合、マージフラグがステップ403にて復号され、ステップ405にてテストされる。符号化単位がスキップまたはマージモードに従って符号化されているとき、マージFRUCフラグがステップ404にて復号される。符号化単位がスキップまたはマージモードに従って符号化されていない場合、ステップ406において、古典的なAMVPインターモードのイントラ予測情報が復号される。ステップ407でのテストで、現在の符号化単位のFRUCフラグが真であり、現在のスライスがBスライスである場合、マッチングモードフラグがステップ408で復号される。なお、FRUCにおけるバイラテラルマッチングは、Bスライスに対してのみ利用可能であることに留意されたい。スライスがBスライスでなく、FRUCが選択されている場合、モードは必然的にテンプレートマッチングであり、マッチングモードフラグは存在しない。符号化単位がFRUCでない場合、ステップ409にて、古典的マージインデックスが復号される。
FRUCマージモードは、エンコーダ側にて、古典的マージモード(および他の可能なマージ)と競合する。図5は、JEMにおける現在の符号化モード評価方法を示す。まず、ステップ501において、HEVCの古典的マージモードが評価される。候補リストは最初に、ステップ50において、元のブロックとリストの各候補との間の単純なSAD(絶対差の和)で評価される。次に、ステップ504~508によって示される、制限された候補のリストの各候補の実レート歪み(rate distortion:RD)コストが評価される。その評価では、ステップ505での残差とのレート歪みと、ステップ506での残差のないレート歪みが評価される。最後に、ステップ509において、最良のマージ候補が決定され、この最良のマージ候補は、残差を有しても有しなくてもよい。
次に、ステップ510~516において、FRUCマージモードが評価される。ステップ510にて、各マッチング方法、すなわち、双方向マッチングおよびテンプレートマッチングについて、ステップ511において、現在のブロックの動きベクトルフィールドが得られ、ステップ512および513において、残差の有る場合と無い場合のフルレート歪みコスト評価が計算される。残差の有無にかかわらず、最良の動きベクトル516が、ステップ515において、これらのレート歪みコストに基づいて決定される。最後に、古典的マージモードとFRUCマージモードとの間の最良のモードが、他のモードの可能な評価の前に、ステップ517において決定される。
図6は、エンコーダ側でのFRUCマージ評価方法を示す。ステップ601にて、各マッチングタイプ、すなわちテンプレートマッチングタイプおよびバイラテラルタイプについて、モジュール61により符号化単位レベルが評価され、続いてモジュール62によってサブ符号化単位レベルが評価される。目標は、現在の符号化単位603内の各サブ符号化単位の動き情報を見つけることである。
モジュール61は、符号化単位レベル評価を処理する。ステップ611において、動き情報のリストが導出される。ステップ612において、このリスト内の各動き情報について、歪みコストが計算され、互いに比較される。テンプレートの最良の動きベクトル、またはバイラテラル613のための最良の組はコストを最小化するものである。次に、動きベクトル精緻化(refinement)ステップ614が適用され、得られた動きベクトルの精度を改善する。FRUC法では、テンプレートマッチング推定のために、古典的離散コサイン変換補間フィルタ(DCTIF)補間フィルタの代わりにバイリニア補間が使用される。これにより、従来のDCTIFのブロック周辺の7画素ではなく、ブロック周辺のメモリアクセスが1画素に削減されます。実際、バイリニア補間フィルタは、一方向のサブ画素値を得るために2画素のみしか必要としない。
動きベクトル精緻化の後、ステップ615において、現在の符号化単位のためのより良好な動きベクトルが得られる。この動きベクトルは、サブ符号化単位レベル評価に使用される。
ステップ602にて、現在の符号化単位は、いくつかのサブ符号化単位に再分割される。サブ符号化単位は、4分木構造における符号化単位の分割深さに依存する正方形ブロックである。その最小サイズは4×4である。
各サブCU(サブ符号化単位)について、サブCUレベル評価モジュール62は、最良の動きベクトルを評価する。ステップ621において、ステップ615においてCUレベルで得られた最良の動きベクトルを含む動きベクトルリストが導出される。ステップ622にて、各動きベクトルに対する歪みコストが評価される。しかし、そのコストは動きベクトルフィールドの発散を回避するため、符号化単位レベルで得られた最良の動きベクトルと現在の動きベクトルとの間の距離を表すコストも含む。最良の動きベクトル623は、最小コストに基づいて得られる。次に、このベクトル623は、ステップ614でのCUレベルで行われたのと同じ方法で、MV精緻化処理624により精緻化される。
プロセスの終わりで、1つのマッチングタイプについて、各サブCUについての動き情報が得られる。エンコーダ側では、両方のマッチングタイプ間の最良のRDコストが比較され、最良のものが選択される。デコーダ側では、この情報はビットストリームからデコードされる(図4のステップ408)。
テンプレートFRUCマッチングモードの場合、テンプレート702,703は、図7の灰色で示されるように、レート歪みコストを推定するために使用されるブロック701まで4行、その左の4列から構成される。2つの全く異なるテンプレート、すなわち、左テンプレート702及び上テンプレート703が用いられる。現在のブロック又はマッチしたブロック701は、歪の判定には利用されない。
図8は、識別されや最良の予測子(613又は623)の周りの追加の探索による、図6の動きベクトル精緻化ステップ614及び624を示す図である。
この方法は、リスト(612または622)内で識別された最良の動きベクトル予測子801を入力として取る。
ステップ802にて、ダイヤモンド探索が1/4画素位置に対応する解像度で適用される。このダイヤモンド探索は、最良のベクトル動きを中心とする1/4画素解像度で、ダイヤグラム81で示されるダイヤモンドパターンに基づくものである。このステップの結果、1/4画素解像度の、新しい最良の動きベクトル803が得られる。
このダイヤモンド探索で得られた最良の動きベクトル位置803は、ステップ804における解像度1/4画素での、クロス探索の中心(クロスパターンに基づくことを意味する)となる。このクロス探索パターンは、最良のベクトル動き803の中心の1/4画素解像度における、ダイヤグラム82で示される。このステップの結果、1/4画素解像度における新しい最良の動きベクトル805が得られる。
この探索ステップ804で得られた新たな最良の動きベクトル位置805は、ステップ806における1/8画素解像度でのクロス探索の中心となる。このステップの結果、1/8画素解像度の新しい最良の動きベクトル807が得られる。ダイヤグラム83は、1/8解像度において、これらの3つの探索ステップにおける、テストされたすべての位置と共に示している。
本発明は、既知の精緻化ステップを改善するための工夫を行う。そして、テンプレート内のマッチングタイプおよび/または信号の特性を考慮することによって、符号化効率を改善することを目的とする。
本発明の一実施形態では、サブ画素精緻化精度が精密化方法の各ステップで増大される。
精緻化ステップは、サブ画素位置における動きベクトルを評価することによって実行される。サブ画素位置は、所与のサブ画素解像度で決定される。サブ画素解像度は、2つの画素間のサブ画素位置の数を決定する。解像度が高いほど、2つの画素間のサブ画素位置の数が多くなる。例えば、1/8画素解像度は、2つの画素間の8つのサブ画素位置に対応する。
図9は、この実施形態を示す。第1のダイヤグラム91は、図8に示される従来技術のパターンの1/16画素解像度で示される。ダイヤグラム92に示されるように、第1のステップは、1/4th画素探索が維持され、次に、クロス探索は8th画素であり、最後のクロス探索は、1/16th画素である。この実施形態は、良好な位置の周りでより正確な位置を得る可能性を提供する。さらに、動きベクトルは、平均して、前のサブ制約よりも初期位置に近くなる。
1つの追加の実施形態では、精緻化がテンプレートマッチングにのみ適用され、バイラテラルマッチングには適用されない。
図10は、これらの実施形態を表すフローチャートである。先のステップで得られた最良の動きベクトル(613又は623)に対応する最良の動きベクトルは、1/4ペル位置でのダイヤモンド探索1002の中心位置として設定される。ダイヤモンド探索1002では、新しい最良の動きベクトル1003を得る。マッチングタイプがテンプレートマッチングの場合、ダイヤモンド探索で得た動きベクトル1003は、新しい動きベクトル1010での結果における1/8th画素精度のクロス探索1009の中心になる。この新たな最良の動きベクトル1010は、最終の最良の動きベクトル1012を得るため、1/16th画素精度でのクロス探索1011の対象となる。
マッチングタイプがテンプレートマッチングではない場合、ステップ1005において、1/4画素での通常のクロス探索が行われ、新しい最良動きベクトル1006が得られ、続いて、1/8画素探索ステップ1007が行われ、最終的な最良の動きベクトル1008が得られる。
本実施形態は、特にユニ予測(uni-prediction)のための符号化効率を改善する。バイ予測(bi-prediction)の場合、2つの同様のブロック間の平均化は、サブ画素解像度の増加に類似することがある。例えば、バイ予測のための両方のブロックが同じ参照フレームに由来し、それらの2つの動きベクトル間の差がより低いサブ画素解像度に等しい場合、バイ予測は、その場合、サブ画素解像度の増加に対応することになる。ユニ予測の場合、2つのブロック間のこの追加の平均化は存在しない。その結果、特に、このより高い解像度がビットストリームにおいてシグナリングされる必要がない場合、ユニ予測のためにサブ画素解像度を増加させることがより重要である。
一実施形態では、ダイヤモンドまたはクロス探索パターンは、水平、斜め、または垂直パターンに置き換えられる。図11は、この実施形態で使用することができる様々なダイヤグラムを示している。ダイヤグラム1101は、1/8画素の水平パターンに従って探索される位置を示す。ダイヤグラム1102は、1/8画素の垂直パターンに従って探索される位置を示す。ダイヤグラム1103は、1/8画素の対角パターンに従って探索された位置を示す。ダイヤグラム1104は、別の1/8画素の対角パターンに従って探索される位置を示す。ダイヤグラム1105は、1/16画素の水平パターンに従って探索される位置を示す。
水平パターンは、水平に整列されたサブ画素位置のパターンである。垂直パターンは、垂直に整列されたサブ画素位置のパターンである。斜めパターンは、斜めに並べられたサブ画素位置のパターンである。
これらのパターンの利点は、ブロックがエッジを含む場合に主に興味深いが、それは予測のためにこのエッジのより良い改良を提供するからである。実際、古典的な動きベクトル推定では、検出されたエッジの垂直軸の中からテストされた追加の位置が選択されると、動きベクトルの精緻化がより高い結果を与える。
図12は、本実施形態によるパターンを選択方法の一例を示す。このフローチャートは例えば、図8のモジュール802、804、806の1つ以上のパターン探索を変更するために使用することができる。マッチングタイプがステップ1201でテストされたテンプレートマッチングである場合、現在のブロックの左テンプレートがステップ1202にて抽出される。次に、ブロックがエッジを含むか否かが判定される。存在する場合には、ステップ1203においてエッジの方向が決定される。例えば、現在のブロック上の勾配を計算して、エッジの存在およびその方向を決定することができる。この「左方向(directionLeft)」が、ステップ1204でのテストで水平である場合、ステップ1205での動きベクトル精緻化のために垂直パターン、例えばパターン1102が選択される。
左テンプレートにエッジがない場合、または識別された方向が水平でない場合、ステップ1206にて、現在のブロックの上テンプレートが抽出される。そして、テンプレートがエッジを含むかどうかが判定され、存在する場合、ステップ1207でその方向が判定される。この「上方向(directionUp)」が、ステップ1208のテストで垂直である場合、ステップ1209で動きベクトル精緻化のために選択されたパターンは、水平パターン、例えばパターン1101または1105となる。そうでなければ、ステップ1210で、初期パターン(81、82、83)が選択される。
なお、左側のブロックが水平エッジを含む場合、このエッジは現在のブロックを通過しなければならないことに留意されたい。同様に、上側のブロックが垂直エッジを含む場合、このエッジは現在のブロックを通過しなければならない。反対に、左ブロックが垂直エッジを含む場合、このエッジは、現在のブロック等を通過すべきではない。
ステップ1201において、マッチングタイプがバイラテラルマッチングであると判定された場合、ステップ1211にて、1つのテンプレートブロックが選択される。次に、ステップ1212にて、テンプレートが方向を含んでいるかどうか、およびテンプレートがどの方向であるかが判定される。この方向が、ステップ1213でのテストで、水平である場合、ステップ1205にて垂直パターンが選択される。方向が、ステップ12147のテストにて垂直である場合、ステップ1209にて水平パターンが選択される。バイラテラルマッチングの場合、対角パターン1103および1104として、いくつかの他の線形パターンを使用することができる。その場合、1212で決定された、エッジの方向に最も垂線形パターンが選択される。ステップ1212でエッジが検出されない場合、初期パターンが維持される。
動きベクトル精密化のためのパターンのこの適応の利点は、パターンがテンプレート内に含まれる信号に適応されるので、符号化効率の改善ことである。
パターンが適合されることもできる。例えば、ダイヤグラム1105は、水平の1/16th画素パターンを示している。ここで、高動きベクトル精度により、最初の動きベクトルの周りにより多くの位置がある。
一実施形態では、テンプレートの信号内容を使用して、動きベクトル精緻化のためにテストされる位置の数を決定する。 たとえば、現在のブロックの周りのテンプレートに高周波が存在することを使用して、精緻化ステップの適用を決定します。 その理由は、十分な高周波が存在しない場合、動きベクトルのサブ画素精緻化は関係ないためである。
図13は、この実施形態の例を示す。
マッチングモードが、ステップ1301でテストされたテンプレートマッチングである場合、左テンプレート、典型的には現在のブロックの隣接する4行がステップ1302で抽出される。次に、ステップ1303において、このブロックが高周波数を含むかどうかが判定される。この決定は、例えば、勾配の合計を閾値と比較することによって得ることができる。この左テンプレートが、ステップ1304のテストで、高周波数を含む場合、図6のステップ614および624に対応する、動きベクトル精緻化ステップ1305が適用される。
左テンプレートが十分に高い頻度を含まない場合、上テンプレートがステップ1306で抽出される。ステップ1307において、抽出されたテンプレートが高頻度を含むかどうかが判定される。そして、ステップ1308でのテストがその場合は、動きベクトル精緻化ステップがステップ1305で適用される。さもなければ、ステップ1309において、動きベクトル精緻化ステップがスキップされる。
ステップ1301において、マッチングタイプがバイラテラルマッチングであると判定された場合、ステップ1310において、1つのテンプレートが抽出される。次に、抽出されたテンプレートが高頻度を含むかどうかが、ステップ1314にて、判定される。抽出されたテンプレートが、ステップ1313でテストにて、高周波数を含まない場合は、ステップ1309で動きベクトル精密化は適用されず、そうでない場合は、ステップ1305で動きベクトル精密化が適用される。
さらに別の実施形態では、テンプレートの信号内容が、テンプレートマッチングタイプFRUC評価のための動きベクトルを決定するために使用される歪み推定のために使用されるテンプレートを決定するために使用される。
図14は、この実施形態を示す。
プロセスはステップ1401から始まる。左テンプレートと上テンプレートがステップ1402、1403で抽出される。抽出されたテンプレートごとに、ステップ1404および1405において、抽出されたテンプレートが高頻度を含むかどうかが判定される。そして、ステップ1406および1407でのテストで、テストされたテンプレートが高周波数を含む場合、それらは、ステップ1408および1409でのFRUC評価における歪み推定のために使用される。両方のテンプレートが高い周波数を含む場合、それらは両方ともFRUC評価に使用される。高い周波数を含むテンプレートがない場合、ステップ1411で、歪み推定に使用される上テンプレートが選択される。
これらの実施形態は全て組み合わせてもよい。
図15は、本発明の1つまたは複数の実施形態を実施するためのコンピューティングデバイス1500の概略ブロック図である。コンピューティングデバイス1500は、マイクロコンピュータ、ワークステーション、または軽量ポータブルデバイスなどの装置とすることができる。コンピューティングデバイス1500は、以下のものが接続された通信バスを備える:
・CPUと呼ばれるマイクロプロセッサのような中央処理装置1501;
・RAMで示されるランダムアクセスメモリ1502;これは本発明の実施形態の方法の実行可能コード、ならびに本発明の実施形態による画像の少なくとも一部を符号化または復号する方法を実施するために必要な変数およびパラメータを記録するように適合されたレジスタを格納するためのものであり、そのメモリ容量は例えば、拡張ポートに接続されたオプショナルなRAMによって拡張することができる。
・ROMで示される読み出し専用メモリ1503;これは本発明の実施形態を実施するためのコンピュータプログラムを記憶するものである。
・ネットワークインタフェース1504;これは、典型的には処理されるデジタルデータが送信または受信される通信ネットワークに接続されるものである。ネットワークインタフェース1504は単一のネットワークインタフェースであってもよく、または異なるネットワークインタフェース(例えば、有線および無線インタフェース、または異なる種類の有線または無線インタフェース)のセットから構成されてもよい。データパケットは、CPU1501で実行されるソフトウェアアプリケーションの制御下で、送信のためにネットワークインタフェースに書き込まれるか、または受信のためにネットワークインタフェースから読み出される。
・ ユーザインタフェース1505;これはユーザからの入力を受信するために、またはユーザに情報を表示するために使用される。
・HDで示されるハードディスク1506;これは、大容量記憶装置として提供されてもよい。
・I/Oモジュール1507;これはビデオソースまたはディスプレイのような外部デバイスから/へデータを受信/送信するために使用されてもよい。
実行可能コードは読み出し専用メモリ1503、ハードディスク1506、または例えばディスクのようなリムーバブルデジタル媒体のいずれかに格納されてもよい。変形例によれば、プログラムの実行可能なコードはハードディスク1506のような通信装置1500の記憶手段の1つに記憶されてから実行されるために、ネットワークインタフェース1504を介して通信ネットワークの手段によって受信されることができる。
中央処理ユニット1501は本発明の実施形態によるプログラムの命令またはソフトウェアコードの一部の実行を制御し、指示するように適合され、命令は、前述の記憶手段のうちの1つに記憶される。CPU1501は、電源投入後、例えばプログラムROM1503やハードディスク(HD)1506からロードされたソフトウェアアプリケーションに関するメインRAMメモリ1502からの指示を実行することができる。このようなソフトウェアアプリケーションは、CPU1501によって実行されると、本発明のフローチャートのステップを実行する。
本発明のアルゴリズムの任意のステップはPC(“パーソナルコンピュータ”)、DSP(“デジタルシグナルプロセッサ”)、またはマイクロコントローラなどのプログラマブルコンピューティングマシンによる命令、またはプログラムのセットの実行によってソフトウェアで実施することができ、あるいは、FPGA(“フィールドプログラマブルゲートアレイ”)またはASIC(“特定用途向け集積回路”)などのマシンまたは専用コンポーネントによってハードウェアで実施することができる。
以上、特定の実施形態を参照して本発明を説明したが、本発明は特定の実施形態に限定されるものではなく、本発明の範囲内にある修正は当業者には明らかであろう。
多くのさらなる修正および変形は単に例として与えられ、添付の特許請求の範囲によってのみ決定される本発明の範囲を限定することを意図しない、前述の例示的な実施形態を参照することにより、当業者に示唆されるのであろう。特に、異なる実施形態からの異なる特徴は、適宜、交換されてもよい。
特許請求の範囲において、単語“備える(comprising)”は他の要素又はステップを排除するものではなく、不定冠詞“a”又は“an”は複数を排除するものではない。異なる特徴が相互に異なる従属請求項に記載されているという単なる事実は、これらの特徴の組み合わせが有利に使用されることができないことを示すものではない。

Claims (18)

  1. 複数のブロックに分割される画像のビデオデータを符号化して、復号方法において復号される符号化データを生成する符号化方法であって、
    符号化対象の画像に含まれる符号化対象のブロックのための第1の動きベクトルであって、前記符号化対象の画像とは異なる第1の画像における第1の領域を指定する第1の動きベクトルと、
    前記符号化対象のブロックのための第2の動きベクトルであって前記符号化対象の画像とは異なる第2の画像における第2の領域を指定する第2の動きベクトルと
    を決定することと、
    少なくとも前記第1の領域及び前記第2の領域のいずれかのサンプルに基づく所定の指標の合計値と、閾値とを比較し、前記第1及び第2の動きベクトルの緻化を行うかを決定することと、
    前記精緻化を行うと決定された場合、分数サンプル精度の精緻化された動きベクトルを生成するため、前記第1及び第2の動きベクトルを精緻化することと、
    前記精緻化が行われた場合精緻化された前記第1及び第2の動きベクトルを用いて前記符号化対象のブロックを符号化することと
    を有し、
    前記精緻化のために、分数サンプル位置を評価するための複数のパターンが、前記符号化方法及び前記復号方法において、利用可能であって、
    前記複数のパターンは、水平パターン及び垂直パターンを含み、
    前記水平パターンにおいて、少なくとも、精緻化対象の第1の画素位置の右の複数の分数サンプル位置、及び、前記第1の画素位置の左の複数の分数サンプル位置が、前記精緻化された動きベクトルにおける水平位置の候補であり、
    前記垂直パターンにおいて、少なくとも、前記第1の画素位置の上の複数の分数サンプル位置、及び、前記第1の画素位置の下の複数の分数サンプル位置が、前記精緻化された動きベクトルの垂直位置の候補である
    を有することを特徴とする符号化方法。
  2. 前記サンプルに基づく前記所定の指標は、前記サンプルに基づく勾配である
    ことを特徴とする請求項1に記載の符号化方法。
  3. 高周波数成分が含まれるかを判定するために、前記所定の指標の合計値と、前記閾値とを比較し、前記精緻化を行うかを決定する
    ことを特徴とする請求項1又は2に記載の符号化方法。
  4. 前記精緻化された動きベクトルは、1/16分数サンプル精度である
    ことを特徴とする請求項1~3のいずれか1項に記載の符号化方法。
  5. 複数のブロックに分割された画像のビデオデータを復号する復号方法であって、
    復号対象の画像に含まれる復号対象のブロックのための第1の動きベクトルであって、前記復号対象の画像とは異なる第1の画像における第1の領域を指定する第1の動きベクトルと、
    前記復号対象のブロックのための第2の動きベクトルであって前記復号対象の画像とは異なる第2の画像における第2の領域を指定する第2の動きベクトルと
    を決定することと、
    少なくとも前記第1領域及び前記第2の領域のいずれかのサンプルに基づく所定の指標の合計値と、閾値とを比較し、前記第1及び第2の動きベクトルの精緻化を、前記復号方法において行うか決定することと、
    前記精緻化を行うと決定された場合、分数サンプル精度の精緻化された動きベクトルを生成するため、前記第1及び第2の動きベクトルを精緻化することと、
    前記精緻化が行われた場合、精緻化された前記第1及び第2の動きベクトルを用いて前記復号対象のブロックを復号することと
    を有し、
    前記精緻化のために、分数サンプル位置を評価するための複数のパターンが、前記復号方法において利用可能であって、
    前記複数のパターンは、水平パターン及び垂直パターンを含み、
    前記水平パターンにおいて、少なくとも、精緻化対象の第1の画素位置の右の複数の分数サンプル位置、及び、前記第1の画素位置の左の複数の分数サンプル位置が、前記精緻化された動きベクトルにおける水平位置の候補であり、
    前記垂直パターンにおいて、少なくとも、前記第1の画素位置の上の複数の分数サンプル位置、及び、前記第1の画素位置の下の複数の分数サンプル位置が、前記精緻化された動きベクトルの垂直位置の候補である
    ことを特徴とする復号方法。
  6. 前記サンプルに基づく前記所定の指標は、前記サンプルに基づく勾配である
    ことを特徴とする請求項5に記載の復号方法。
  7. 高周波数成分が含まれるかを判定するために、前記所定の指標の合計値と、前記閾値とを比較し、前記精緻化を前記復号方法において行うかを決定する
    ことを特徴とする請求項5又は6に記載の復号方法。
  8. 前記精緻化された動きベクトルは、1/16分数サンプル精度である
    ことを特徴とする請求項5~7のいずれか1項に記載の復号方法。
  9. 複数のブロックに分割される画像のビデオデータを符号化して、復号装置において復号される符号化データを生成する符号化装置であって、
    符号化対象の画像に含まれる符号化対象のブロックのための第1の動きベクトルであって、前記符号化対象の画像とは異なる第1の画像における第1の領域を指定する第1の動きベクトルと、
    前記符号化対象のブロックのための第2の動きベクトルであって前記符号化対象の画像とは異なる第2の画像における第2の領域を指定する第2の動きベクトルと
    を決定する第1の決定手段と、
    少なくとも前記第1領域及び前記第2の領域のいずれかのサンプルに基づく所定の指標の合計値と、閾値とを比較し、前記第1及び第2の動きベクトルの精緻化を行うかを決定する第2の決定手段と、
    前記精緻化を行うと決定された場合、分数サンプル精度の精緻化された動きベクトルを生成するため、前記第1及び第2の動きベクトルを精緻化する精緻化手段と、
    前記精緻化が行われた場合精緻化された前記第1及び第2の動きベクトルを用いて前記符号化対象のブロックを符号化する符号化手段と、
    を有し、
    前記精緻化のために、分数サンプル位置を評価するための複数のパターンが、前記符号化装置及び前記復号装置において、利用可能であって、
    前記複数のパターンは、水平パターン及び垂直パターンを含み、
    前記水平パターンにおいて、少なくとも、精緻化対象の第1の画素位置の右の複数の分数サンプル位置、及び、前記第1の画素位置の左の複数の分数サンプル位置が、前記精緻化された動きベクトルにおける水平位置の候補であり、
    前記垂直パターンにおいて、少なくとも、前記第1の画素位置の上の複数の分数サンプル位置、及び、前記第1の画素位置の下の複数の分数サンプル位置が、前記精緻化された動きベクトルの垂直位置の候補である
    ことを特徴とする符号化装置。
  10. 前記サンプルに基づく前記所定の指標は、前記サンプルに基づく勾配である
    ことを特徴とする請求項9に記載の符号化装置。
  11. 前記第2の決定手段は、高周波数成分が含まれるかを判定するために、前記所定の指標の合計値と、前記閾値とを比較し、前記精緻化を行うかを決定する
    ことを特徴とする請求項9又は10に記載の符号化装置。
  12. 前記精緻化された動きベクトルは、1/16分数サンプル精度である
    ことを特徴とする請求項9~11のいずれか1項に記載の符号化装置。
  13. 複数のブロックに分割された画像のビデオデータを復号する復号装置であって、
    復号対象の画像に含まれる復号対象のブロックのための第1の動きベクトルであって、前記復号対象の画像とは異なる第1の画像における第1の領域を指定する第1の動きベクトルと、
    前記復号対象のブロックのための第2の動きベクトルであって前記復号対象の画像とは異なる第2の画像における第2の領域を指定する第2の動きベクトルと
    を決定する第1の決定手段と、
    少なくとも前記第1領域及び前記第2の領域のいずれかのサンプルに基づく所定の指標の合計値と、閾値とを比較し、前記第1及び第2の動きベクトルの精緻化を、前記復号装置において行うか決定する第2の決定手段と、
    前記精緻化を行うと決定された場合、分数サンプル精度の精緻化された動きベクトルを生成するため、前記第1及び第2の動きベクトルを精緻化する精緻化手段と、
    前記精緻化が行われた場合、精緻化された前記第1及び第2の動きベクトルを用いて前記復号対象のブロックを復号する復号手段と
    を有し、
    前記精緻化のために、分数サンプル位置を評価するための複数のパターンが、前記復号装置において利用可能であって、
    前記複数のパターンは、水平パターン及び垂直パターンを含み、
    前記水平パターンにおいて、少なくとも、精緻化対象の第1の画素位置の右の複数の分数サンプル位置、及び、前記第1の画素位置の左の複数の分数サンプル位置が、前記精緻化された動きベクトルにおける水平位置の候補であり、
    前記垂直パターンにおいて、少なくとも、前記第1の画素位置の上の複数の分数サンプル位置、及び、前記第1の画素位置の下の複数の分数サンプル位置が、前記精緻化された動きベクトルの垂直位置の候補である
    ことを特徴とする復号装置。
  14. 前記サンプルに基づく前記所定の指標は、前記サンプルに基づく勾配である
    ことを特徴とする請求項13に記載の復号装置。
  15. 前記第2の決定手段は、高周波数成分が含まれるかを判定するために、前記所定の指標の合計値と、前記閾値とを比較し、前記精緻化を、前記復号装置において行うかを決定する
    ことを特徴とする請求項13又は14に記載の復号装置。
  16. 前記精緻化された動きベクトルは、1/16分数サンプル精度である
    ことを特徴とする請求項13~15のいずれか1項に記載の復号装置。
  17. コンピュータを、請求項9~12のいずれか1項に記載の符号化装置の各手段として機能させることを特徴とするプログラム。
  18. コンピュータを、請求項13~16のいずれか1項に記載の復号装置の各手段として機能させることを特徴とするプログラム。
JP2021153615A 2017-07-04 2021-09-21 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置 Active JP7330243B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023120924A JP7542118B2 (ja) 2017-07-04 2023-07-25 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB1710747.5A GB2564133B (en) 2017-07-04 2017-07-04 Method and apparatus for encoding or decoding video data with sub-pixel motion vector refinement
GB1710747.5 2017-07-04
JP2019563533A JP2020523818A (ja) 2017-07-04 2018-06-27 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置
PCT/EP2018/067197 WO2019007766A1 (en) 2017-07-04 2018-06-27 METHOD AND APPARATUS FOR ENCODING OR DECODING VIDEO DATA WITH SUB-PIXEL MOTION VECTOR DECOMPOSITION

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2019563533A Division JP2020523818A (ja) 2017-07-04 2018-06-27 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023120924A Division JP7542118B2 (ja) 2017-07-04 2023-07-25 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置

Publications (2)

Publication Number Publication Date
JP2022008472A true JP2022008472A (ja) 2022-01-13
JP7330243B2 JP7330243B2 (ja) 2023-08-21

Family

ID=59592616

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2019563533A Pending JP2020523818A (ja) 2017-07-04 2018-06-27 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置
JP2021153615A Active JP7330243B2 (ja) 2017-07-04 2021-09-21 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置
JP2023120924A Active JP7542118B2 (ja) 2017-07-04 2023-07-25 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2019563533A Pending JP2020523818A (ja) 2017-07-04 2018-06-27 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023120924A Active JP7542118B2 (ja) 2017-07-04 2023-07-25 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置

Country Status (8)

Country Link
US (6) US11394997B2 (ja)
EP (2) EP3649784A1 (ja)
JP (3) JP2020523818A (ja)
KR (2) KR102459789B1 (ja)
CN (6) CN116506641A (ja)
GB (1) GB2564133B (ja)
MA (1) MA50939A (ja)
WO (1) WO2019007766A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2563943B (en) 2017-06-30 2021-02-24 Canon Kk Method and apparatus for encoding or decoding video data in FRUC mode with reduced memory accesses
US11750832B2 (en) * 2017-11-02 2023-09-05 Hfi Innovation Inc. Method and apparatus for video coding
SG11202101823XA (en) * 2018-09-19 2021-04-29 Huawei Tech Co Ltd Method for skipping refinement based on patch similarity in bilinear interpolation based decoder-side motion vector refinement
WO2020182216A1 (en) * 2019-03-14 2020-09-17 Mediatek Inc. Methods and apparatuses of video processing with motion refinement and sub-partition base padding
GB2585017A (en) * 2019-06-24 2020-12-30 Canon Kk Video coding and decoding
CN118339832A (zh) * 2021-11-22 2024-07-12 北京达佳互联信息技术有限公司 解码器侧运动信息推导
US20240223776A1 (en) * 2023-01-03 2024-07-04 Alibaba (China) Co., Ltd. Intra template matching prediction mode for motion prediction

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080002772A1 (en) * 2006-06-28 2008-01-03 Hong Kong Applied Science and Technology Research Institute Company Limited Motion vector estimation method
WO2016160605A1 (en) * 2015-03-27 2016-10-06 Qualcomm Incorporated Deriving motion information for sub-blocks in video coding

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6091460A (en) * 1994-03-31 2000-07-18 Mitsubishi Denki Kabushiki Kaisha Video signal encoding method and system
US6992725B2 (en) * 2001-10-22 2006-01-31 Nec Electronics America, Inc. Video data de-interlacing using perceptually-tuned interpolation scheme
EP1578137A2 (en) * 2004-03-17 2005-09-21 Matsushita Electric Industrial Co., Ltd. Moving picture coding apparatus with multistep interpolation process
US8761258B2 (en) * 2005-06-17 2014-06-24 The Hong Kong University Of Science And Technology Enhanced block-based motion estimation algorithms for video compression
US8005308B2 (en) * 2005-09-16 2011-08-23 Sony Corporation Adaptive motion estimation for temporal prediction filter over irregular motion vector samples
US8385419B2 (en) * 2006-04-26 2013-02-26 Altera Corporation Methods and apparatus for motion search refinement in a SIMD array processor
US8036428B2 (en) * 2006-04-28 2011-10-11 Pixart Imaging Inc. Method and apparatus for detecting motion of image in optical navigator
US8355440B2 (en) * 2006-08-07 2013-01-15 Vixs Systems, Inc. Motion search module with horizontal compression preprocessing and methods for use therewith
US8428118B2 (en) * 2006-08-17 2013-04-23 Ittiam Systems (P) Ltd. Technique for transcoding MPEG-2/MPEG-4 bitstream to H.264 bitstream
US8265136B2 (en) * 2007-02-20 2012-09-11 Vixs Systems, Inc. Motion refinement engine for use in video encoding in accordance with a plurality of sub-pixel resolutions and methods for use therewith
US8184704B2 (en) * 2007-12-05 2012-05-22 Advanced Micro Devices, Inc. Spatial filtering of differential motion vectors
CN101686393B (zh) * 2008-09-28 2012-10-17 华为技术有限公司 应用于模板匹配的快速运动搜索方法及装置
US20110176611A1 (en) * 2010-01-15 2011-07-21 Yu-Wen Huang Methods for decoder-side motion vector derivation
US9438925B2 (en) * 2013-12-31 2016-09-06 Vixs Systems, Inc. Video encoder with block merging and methods for use therewith
JPWO2015166639A1 (ja) * 2014-04-28 2017-04-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化方法、復号方法、符号化装置および復号装置
WO2017156669A1 (en) * 2016-03-14 2017-09-21 Mediatek Singapore Pte. Ltd. Methods for motion vector storage in video coding
EP3435673A4 (en) * 2016-03-24 2019-12-25 Intellectual Discovery Co., Ltd. VIDEO SIGNAL ENCODING / DECODING METHOD AND APPARATUS
US10621731B1 (en) * 2016-05-31 2020-04-14 NGCodec Inc. Apparatus and method for efficient motion estimation for different block sizes
US10631002B2 (en) * 2016-09-30 2020-04-21 Qualcomm Incorporated Frame rate up-conversion coding mode
EP3343925A1 (en) * 2017-01-03 2018-07-04 Thomson Licensing Method and apparatus for encoding and decoding motion information
GB2563943B (en) * 2017-06-30 2021-02-24 Canon Kk Method and apparatus for encoding or decoding video data in FRUC mode with reduced memory accesses
US20190215518A1 (en) * 2018-01-10 2019-07-11 Qualcomm Incorporated Histogram of gradient based optical flow
KR20220066045A (ko) * 2019-09-19 2022-05-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩의 스케일링 윈도우

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080002772A1 (en) * 2006-06-28 2008-01-03 Hong Kong Applied Science and Technology Research Institute Company Limited Motion vector estimation method
WO2016160605A1 (en) * 2015-03-27 2016-10-06 Qualcomm Incorporated Deriving motion information for sub-blocks in video coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIANLE CHEN ET AL., ALGORITHM DESCRIPTION OF JOINT EXPLORATION TEST MODEL 6 (JEM 6), JPN6020050114, 31 May 2017 (2017-05-31), pages 17 - 21, ISSN: 0004998569 *

Also Published As

Publication number Publication date
CN116506639A (zh) 2023-07-28
GB2564133A (en) 2019-01-09
EP4152752A1 (en) 2023-03-22
US11394997B2 (en) 2022-07-19
KR102314547B1 (ko) 2021-10-19
MA50939A (fr) 2020-05-13
US20240089497A1 (en) 2024-03-14
CN110710212A (zh) 2020-01-17
JP7542118B2 (ja) 2024-08-29
CN116506641A (zh) 2023-07-28
GB2564133B (en) 2021-03-17
US20240089498A1 (en) 2024-03-14
JP2023139206A (ja) 2023-10-03
CN110710212B (zh) 2023-06-30
US20220368941A1 (en) 2022-11-17
CN116506642A (zh) 2023-07-28
JP2020523818A (ja) 2020-08-06
CN116506640A (zh) 2023-07-28
GB201710747D0 (en) 2017-08-16
KR102459789B1 (ko) 2022-10-28
US20200221121A1 (en) 2020-07-09
WO2019007766A1 (en) 2019-01-10
CN116506638A (zh) 2023-07-28
JP7330243B2 (ja) 2023-08-21
US20240089495A1 (en) 2024-03-14
US20240089496A1 (en) 2024-03-14
KR20200015499A (ko) 2020-02-12
US11849142B2 (en) 2023-12-19
EP3649784A1 (en) 2020-05-13
KR20210126162A (ko) 2021-10-19

Similar Documents

Publication Publication Date Title
JP7330243B2 (ja) 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置
TWI520579B (zh) 支持區塊分割及區塊合併之圖像編碼技術
CN115002478B (zh) 编码或解码视频数据的方法和装置
GB2588563A (en) Method and apparatus for encoding or decoding video data with sub-pixel motion vector refinement
GB2595195A (en) Method and apparatus for encoding or decoding video data with sub-pixel motion vector refinement
GB2595194A (en) Method and apparatus for encoding or decoding video data with sub-pixel motion vector refinement

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230808

R151 Written notification of patent or utility model registration

Ref document number: 7330243

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151