JP5875989B2 - ビデオ・エンコードおよびデコードのための低複雑性テンプレート照合予測のための方法および装置 - Google Patents

ビデオ・エンコードおよびデコードのための低複雑性テンプレート照合予測のための方法および装置 Download PDF

Info

Publication number
JP5875989B2
JP5875989B2 JP2012548962A JP2012548962A JP5875989B2 JP 5875989 B2 JP5875989 B2 JP 5875989B2 JP 2012548962 A JP2012548962 A JP 2012548962A JP 2012548962 A JP2012548962 A JP 2012548962A JP 5875989 B2 JP5875989 B2 JP 5875989B2
Authority
JP
Japan
Prior art keywords
template matching
search
prediction
motion
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012548962A
Other languages
English (en)
Other versions
JP2013517682A5 (ja
JP2013517682A (ja
Inventor
ジォン,ユンフェイ
イン,ペン
リュ,シャオアン
スー,チエン
ソーレ,ジョエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2013517682A publication Critical patent/JP2013517682A/ja
Publication of JP2013517682A5 publication Critical patent/JP2013517682A5/ja
Application granted granted Critical
Publication of JP5875989B2 publication Critical patent/JP5875989B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

関連出願への相互参照
本願は2010年1月19日に出願された米国仮出願第61/296,329号の利益を主張する。この仮出願の内容はここに参照によってその全体において組み込まれる。
技術分野
本願の原理は、概括的にはビデオ・エンコードおよびデコードに、より詳細にはビデオ・エンコードおよびデコードのための複雑さが低下したテンプレート照合予測(template matching prediction)のための方法および装置に関する。
画素より小さなスケールでの動き補償は現在のビデオ・エンコーダおよびデコーダにおいて広く使われている。たとえば、国際標準化機関/国際電気標準会議(ISO/IEC)動画像専門家グループ4(MPEG-4)パート10先進ビデオ符号化(AVC)規格/国際電気通信連合電気通信部門(ITU-T)H.264勧告(以下、「MPGE-4 AVC規格」)では、四分の一画素精度までの動き補償が使われる。そのような方式は本稿では「第一の従来技術のアプローチ」と称する。図1に目を向けると、MPEG-4 AVC規格に基づく4倍の(1/4画素ベクトルのための)フレームのアップサンプリングが概括的に参照符号100で示されている。アップサンプリングは、まず1/2画素生成のために6タップのウィーナー・フィルタを適用し、次いで1/4画素生成のために双線形フィルタを適用することを含む。
ビデオ符号化専門家グループ(VCEG: Video Coding Experts Group)によって提案される第二の従来技術のアプローチは、エイリアシング・アーチファクトをもつシーケンスについて、1/8画素補償を使ってさらに符号化効率を改善することを含む。固定補間フィルタを使うことに加えて、エイリアシング、量子化および動き推定誤差、カメラ雑音などによりよく対処するために、適応的な補間方式が考慮された。適応的な補間方式は、符号化効率を高めるために、各サブ画素位置についてオンザフライで補間フィルタ係数を推定する。あらゆる込み入った補間方式を考慮に入れると、すべての参照フレームを補間して、そのような補間されたフレームをサブ画素精度でデコーダにおいて記憶することは意味をなさない。というのも、補間される必要があるサブ画素位置は若干数だけだからである。そのような方式は、デコーダにおける高いメモリ消費および高い計算量につながる可能性が高い。デコーダにおいてオンザフライで動き補償を実行する一つの方法は、MPEG-4 AVC規格に対するキー・テクノロジー・エリア(KTA: Key Technology Area)ソフトウェア改善によって実行されるところである。
テンプレート照合予測〔テンプレート・マッチング予測〕(TMP: template matching prediction)は、動き/変位情報(motion/displaced information)(動きベクトル(motion vector)、参照インデックス(reference index)および変位したベクトル(displaced vector))の伝送を回避することによって、インター予測およびイントラ予測両方についての符号化効率を稼ぐために使われる技法である。テンプレート照合予測は、ビデオ画像には多数の反復パターンが存在するという想定に基づいている。よって、テンプレート照合は、近隣のピクセルを照合することによって、デコードされた諸ビデオ画像を通じて似通ったパターンを探索する。最終的な予測は、一般に、いくつかの最良マッチの平均である。テンプレート照合は、インター予測およびイントラ予測の両方で使うことができる。しかしながら、テンプレート照合予測の欠点は、エンコーダおよびデコーダの両方で同じ探索を実行する必要があるということである。このように、テンプレート照合予測はデコーダの計算量を有意に高めることがある。
〈インター予測におけるテンプレート照合予測〉
インター予測におけるテンプレート照合予測は、動きベクトルを送ることなくして目標ピクセルを予測する一つの方法である。フレームの目標ブロックが与えられたとき、そのブロックにおけるある目標ピクセルは、参照サンプルの集合から最適ピクセルを見出すことによって決定される。ここで、最適ピクセルの諸隣接ピクセルは、目標ピクセルの諸隣接ピクセルと最高の相関をもつ。目標ピクセルのそうした隣接ピクセルはテンプレート(template)と呼ばれる。従来技術では、テンプレートは通例、目標ピクセルの再構成された周囲のピクセルから取られる。図2に目を向けると、インター予測のためのテンプレート照合予測方式の一例が概括的に参照符号200によって示されている。テンプレート照合予測方式200は、探索領域211、探索領域211内の予測212および予測212に関する近傍213をもつ再構成された参照フレーム210に関わる。テンプレート照合予測方式200はまた、目標ブロック251、目標ブロック251に関するテンプレート252および再構成済みの領域253をもつ現在フレーム250にも関わる。インター予測の場合、テンプレート照合予測プロセスは、デコーダ側における動きベクトル探索と見ることができる。ここでは、テンプレート照合は、伝統的な動き推定技法と非常によく似た仕方で実行される。すなわち、参照フレームにおいてしかるべく変位された、テンプレートの形をした領域についてコスト関数を計算することによって、動きベクトルが評価される。次いで、そのテンプレートについての最良の動きベクトルが、目標エリアを予測するために使われる。再構成または少なくとも予測信号がすでに存在する画像エリアだけが、探索のためにアクセスされる。よって、デコーダは、追加的な副情報なしでも、テンプレート照合プロセスを実行し、目標エリアを予測することができる。
テンプレート照合は、動きベクトルの伝送なしに目標ブロック中のピクセルを予測することができる。テンプレート照合予測の予測パフォーマンスは、目標ブロックとそのテンプレートとの間の相関が高ければ、伝統的なブロック照合方式のパフォーマンスに匹敵することが期待される。従来技術では、テンプレートは、目標ピクセルの再構成済みの空間的な近隣ピクセルから取られている。近隣ピクセルは時に、目標ピクセルとの相関が低い。よって、テンプレート照合予測のパフォーマンスは、伝統的なブロック照合方式より低いことがある。
〈イントラ予測におけるテンプレート照合予測〉
イントラ予測では、テンプレート照合予測は、目標ブロックから遠く離れたピクセルによって予測を生成できるので、利用可能な非局所的な予測アプローチの一つである。イントラ・テンプレート照合においては、テンプレートの定義はインター・テンプレート照合における定義と同様である。しかしながら、一つの違いは、探索範囲が現在画像のデコード済みの部分に限定されるということである。図3に目を向けると、イントラ予測のためのテンプレート照合予測方式の一例が概括的に参照符号300によって示されている。テンプレート照合予測方式300は、画像377のデコード済みの部分310に関わる。画像377のデコード済みの部分310は、探索領域311、探索領域311内の候補予測312および候補予測312に関する近傍313をもつ。テンプレート照合予測方式300はまた、画像377の未デコード部分320にも関わる。画像377の未デコード部分320は、目標ブロック321、目標ブロック321に関するテンプレート322をもつ。簡単のため、以下の記述はイントラ・テンプレート照合に基づくが、インター・テンプレートの対応物にも容易に拡張できることが当業者には理解される。
デコーダにおけるテンプレート照合予測に関する問題は、テンプレート照合はデコーダにおいて探索を実行する必要があり、そのような探索を何の制約条件も要求することなく実行するので、参照フレームのすべてについてサブ画素補間を実行し、サブ画素精度をもつそのような補間されたフレームをデコーダにおいて記憶する必要があるということである。これは、デコーダにおける、たとえばメモリおよび計算量を含む複雑さを著しく高めることがある。
従来技術のこれらおよびその他の欠点および不都合な点が、ビデオ・エンコードおよびデコードのための低複雑性テンプレート照合予測のための方法および装置に向けられる本願の原理によって対処される。
本願の原理のある側面によれば、装置が提供される。本装置は、テンプレート照合予測を使って、画像中の少なくともある画像ブロックをエンコードするビデオ・エンコーダを含む。テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される。
本願の原理のもう一つの側面によれば、ビデオ・エンコーダにおける方法が提供される。本方法は、テンプレート照合予測を使って、画像中の少なくともある画像ブロックをエンコードすることを含む。テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される。
本願の原理のさらにもう一つの側面によれば、装置が提供される。本装置は、テンプレート照合予測を使って、画像中の少なくともある画像ブロックをデコードするビデオ・デコーダを含む。テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される。
本願の原理のさらにもう一つの側面によれば、ビデオ・デコーダにおける方法が提供される。本方法は、テンプレート照合予測を使って、画像中の少なくともある画像ブロックをデコードすることを含む。テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される。
本願の原理のこれらおよびその他の側面、特徴および利点は、付属の図面との関連で読まれるべき、例示的な実施形態の以下の詳細な説明から明白となるであろう。
本願の原理は、以下の例示的な図面に基づいてよりよく理解されうる。
MPEG-4 AVC規格に基づく4倍の(1/4画素ベクトルのための)フレームのアップサンプリングを示す図である。 インター予測についてテンプレート照合予測方式の例を示す図である。 イントラ予測についてテンプレート照合予測方式の例を示す図である。 本願の原理のある実施形態に基づく、本願の原理が適用されうる例示的なビデオ・エンコーダを示すブロック図である。 本願の原理のある実施形態に基づく、本願の原理が適用されうる例示的なビデオ・デコーダを示すブロック図である。 本願の原理のある実施形態に基づく、複雑さが低下したテンプレート照合を使ってピクチャについての画像データをエンコードする例示的な方法を示す流れ図である。 本願の原理のある実施形態に基づく、複雑さが低下したテンプレート照合を使ってピクチャについての画像データをデコードする例示的な方法を示す流れ図である。
本願の原理は、ビデオ・エンコードおよびデコードのための複雑さが低下したテンプレート照合予測のための方法および装置に向けられる。
本記述は、本願の原理を例解する。よって、本稿で明示的に記述や図示がされていなくても、本願の原理を具現し、その精神および範囲内に含まれるさまざまな構成を当業者が考案できるであろうことは理解されるであろう。
本稿で記載されるあらゆる例および条件付きの言辞は、読者が、本発明の原理および当該技術を進歩させる発明者によって寄与される概念を理解するのを支援するという教育目的のために意図されているのであって、そのような個別的に記載されている例および条件に限定することなく解釈されるものである。
さらに、本願の原理の原理、側面および実施形態ならびにその個別的な例を記載する本稿におけるあらゆる陳述は、その構造的および機能的な等価物の両方を包含することが意図されている。さらに、そのような等価物は、現在知られている等価物および将来開発される等価物、すなわち構造にかかわりなく同じ機能を実行する任意の開発された要素の両方を含むことが意図されている。
よって、たとえば、当業者は、本稿に呈示されるブロック図が本願の原理を具現する例示的な回路の概念図を表すものであることを理解するであろう。同様に、フローチャート、流れ図、状態遷移図、擬似コードなどがあったとすると、それらはいずれも、コンピュータ可読媒体において実質的に表現され、コンピュータまたはプロセッサによって実行されうるさまざまなプロセスを表すことが理解されるであろう。これはそのようなコンピュータまたはプロセッサが明示的に示されているかどうかにはよらない。
図面に示されるさまざまな要素の機能は、専用ハードウェアの使用を通じて提供されても、適切なソフトウェアとの関連でソフトウェアを実行することのできるハードウェアの使用を通じて提供されてもよい。プロセッサによって提供されるとき、機能は単一の専用プロセッサによって、単一の共有されるプロセッサによって、あるいは一部が共有されていてもよい複数の個別プロセッサによって提供されうる。さらに、用語「プロセッサ」または「コントローラ」の明示的な使用は、ソフトウェアを実行することのできるハードウェアのみを指すものと解釈されるべきではなく、暗黙的に、限定なしに、デジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェアを記憶するための読み出し専用メモリ(「ROM」)、ランダム・アクセス・メモリ(「RAM」)および不揮発性記憶装置を含みうる。
従来のものおよび/またはカスタムのものを含め他のハードウェアも含まれてもよい。同様に、図面に示されるスイッチがあったとしても、それは単に概念的なものである。その機能はプログラム論理の動作を通じて、専用論理を通じて、プログラム制御と専用論理の相互作用を通じて、あるいはさらに手動で実行されてもよい。特定の技法は、コンテキストからより個別に理解されるように実装者によって選択可能である。
本願の請求項では、特定の機能を実行する手段として表現されたいかなる要素も、その機能を実行するいかなる仕方をも、たとえばa)その機能を実行する回路素子の組み合わせまたはb)任意の形の、したがってファームウェア、マイクロコードなどを含むソフトウェアを、当該機能を実行するためにそのソフトウェアを実行するための適切な回路と組み合わせたものを包含することが意図されている。そのような請求項によって定義される本願の原理は、前記さまざまな記載される手段によって提供される機能性が請求項が記載する仕方で組み合わされ、一緒にされるという事実にある。よって、これらの機能性を提供できる任意の手段が本願で示されている手段と等価であると見なされる。
明細書における本願の原理の「一つの実施形態」または「ある実施形態」またはその変形への言及は、その実施形態との関連で記載されている特定の特徴、構造、特性などが本願の原理の少なくとも一つの実施形態に含まれることを意味する。よって、本明細書を通じた随所に現れる「一つの実施形態では」または「ある実施形態では」といった句の出現は、必ずしもみな同じ実施形態を指すのではない。
たとえば「A/B」「Aおよび/またはB」「AおよびBの少なくとも一つ」の場合のような「/」「および/または」「…の少なくとも一つ」のいずれかの使用は、最初に挙げられるオプション(A)のみの選択、または二番目に挙げられるオプション(B)のみの選択、または両方のオプション(AおよびB)の選択を包含することが意図されている。さらなる例として、「A、Bおよび/またはC」や「A、BおよびCの少なくとも一つ」の場合には、そのような表現は、最初に挙げられるオプション(A)のみの選択、または二番目に挙げられるオプション(B)のみの選択、または三番目に挙げられるオプション(C)のみの選択、または最初と二番目に挙げられるオプション(AおよびB)のみの選択、または最初と三番目に挙げられるオプション(AおよびC)のみの選択、または二番目と三番目に挙げられるオプション(BおよびC)のみの選択、または三つすべてのオプション(AおよびBおよびC)の選択を包含することが意図されている。これは、当業者には明白であろうが、挙げられる項目がいくら多数でも、拡張できる。
また、本稿での用法では、「ピクチャ」および「画像」の語は交換可能に使用され、ビデオ・シーケンスからのスチール画像またはピクチャを指す。知られているように、ピクチャはフレームであってもフィールドであってもよい。
さらに、本稿での用法では、「信号伝達する(signal)」という語は対応するデコーダに何かを示すことをいう。たとえば、エンコーダは、特定の型の探索(整数探索、1/2画素探索または1/4画素探索)および/または探索範囲(近隣の動きベクトル、小さな探索範囲または大きな探索範囲)および/またはフィルタ型(双線形フィルタまたは標準的な動き補償で使われているのと同じ補間フィルタ)を、どの特定の型の探索および/または探索範囲および/またはフィルタ型がエンコーダ側で使われているかをデコーダに知らせるために、信号伝達しうる。このようにして、同じ型の探索および/または探索範囲および/またはフィルタ型がエンコーダ側とデコーダ側の両方で使用されうる。信号伝達は多様な仕方で達成されうることを理解しておくべきである。たとえば、一つまたは複数のシンタックス要素、フラグなどが、対応するデコーダに情報を信号伝達するために使用されうる。
さらに、本稿での用法では、「標準的な動き補償」および「標準的な動き推定」という表現はそれぞれ、(本願の原理ではなく)既存のビデオ符号化規格および/または既存のビデオ符号化勧告に従って実行される動き補償および動き推定をいう。よって、たとえば、「標準的な動き推定」という表現は、たとえばMPEG-4 AVC規格によって実行される従来の動き推定プロセスを指すのに使われることがある。また、「標準的な動き補償」および「通常の動き補償」という表現が本稿では交換可能に使われており、「標準的な動き推定」および「通常の動き推定」という表現が本稿では交換可能に使われていることを注意しておく。知られているように、動き推定は、通例ビデオ・シーケンス中の隣り合うフレームから、ある二次元画像から別の二次元画像への変換を記述する諸動きベクトルを決定するプロセスである。
図4に目を向けると、本願の原理が適用されうる例示的なビデオ・エンコーダが概括的に参照符号400で示されている。ビデオ・エンコーダ400は、組み合わせ器485の非反転入力と信号通信する出力をもつフレーム順序付けバッファ410を含む。組み合わせ器485の出力は、変換器および量子化器425の第一の入力と信号通信で接続されている。変換器および量子化器425の出力は、エントロピー符号化器445の第一の入力および逆変換器および逆量子化器450の第一の入力と信号通信で接続されている。エントロピー符号化器445の出力は、組み合わせ器490の第一の非反転入力と信号通信で接続されている。組み合わせ器490の出力は、出力バッファ435の第一の入力と信号通信で接続されている。
エンコーダ・コントローラ405の第一の出力は、フレーム順序付けバッファ410の第二の入力、逆変換器および逆量子化器450の第二の入力、ピクチャ型決定モジュール415の入力、マクロブロック型(MB型)決定モジュール420の第一の入力、イントラ予測モジュール460の第二の入力、ブロック解除(deblocking)フィルタ465の第二の入力、動き補償器470の第一の入力、動き推定器およびテンプレート照合予測モジュール475の第一の入力および参照ピクチャ・バッファ480の第二の入力と信号通信で接続されている。
エンコーダ・コントローラ405の第二の出力は、補足向上情報(SEI: Supplemental Enhancement Information)挿入器430の第一の入力、変換器および量子化器425の第二の入力、エントロピー符号化器445の第二の入力、出力バッファ435の第二の入力、シーケンス・パラメータ・セット(SPS: Sequence Parameter Set)およびピクチャ・パラメータ・セット(PPS: Picture Parameter Set)挿入器440の入力と信号通信で接続されている。
SEI挿入器430の出力は組み合わせ器490の第二の非反転入力と信号通信で接続されている。
ピクチャ型決定モジュール415の第一の出力は、フレーム順序付けバッファ410の第三の入力と信号通信で接続されている。ピクチャ型決定モジュール415の第二の出力は、マクロブロック型決定モジュール420の第二の入力と信号通信で接続されている。
シーケンス・パラメータ・セット(SPS)およびピクチャ・パラメータ・セット(PPS)挿入器440の出力は、組み合わせ器490の第三の非反転入力と信号通信で接続されている。
逆量子化器および逆変換器450の出力は、組み合わせ器419の第一の非反転入力と信号通信で接続されている。組み合わせ器419の出力は、イントラ予測モジュール460の第一の入力およびブロック解除フィルタ465の第一の入力と信号通信で接続されている。ブロック解除フィルタ465の出力は参照ピクチャ・バッファ480の第一の入力と信号通信で接続されている。参照ピクチャ・バッファ480の出力は、動き推定器およびテンプレート照合予測モジュール475の第二の入力および動き補償器470の第三の入力と信号通信で接続されている。動き推定器およびテンプレート照合予測モジュール475の第一の出力は、動き補償器470の第二の入力と信号通信で接続されている。動き推定器およびテンプレート照合予測モジュール475の第二の出力は、エントロピー符号化器445の第三の入力と信号通信で接続されている。
動き補償器470の出力は、スイッチ497の第一の入力と信号通信で接続されている。イントラ予測モジュール460の出力は、スイッチ497の第二の入力と信号通信で接続されている。マクロブロック型決定モジュール420の出力は、スイッチ497の第三の入力と信号通信で接続されている。スイッチ497の第三の入力は、該スイッチの「データ」入力(制御入力、すなわち第三の入力に対していう)が動き補償器470またはイントラ予測モジュール460によって提供されるべきか否かを決定する。スイッチ497の出力は、組み合わせ器419の第二の非反転入力および組み合わせ器485の反転入力と信号通信で接続されている。
フレーム順序付けバッファ410の第一の入力およびエンコーダ・コントローラ405の入力は、入力ピクチャを受け取るためのエンコーダ400の入力として利用可能である。さらに、補足向上情報(SEI)挿入器430の第二の入力は、メタデータを受け取るためのエンコーダ400の入力として利用可能である。出力バッファ435の出力は、エンコーダ400の出力として、ビットストリームを出力するために利用可能である。
図5に目を向けると、本願の原理が適用されうる例示的なビデオ・デコーダが概括的に参照符号500で示されている。ビデオ・デコーダ500は、エントロピー・デコーダ445の第一の入力と信号通信で接続された出力をもつ。エントロピー・デコーダ545の第一の出力は、逆変換器および逆量子化器550の第一の入力と信号通信で接続されている。逆変換器および逆量子化器550の出力は、組み合わせ器525の第二の非反転入力と信号通信で接続されている。組み合わせ器525の出力は、ブロック解除フィルタ565の第二の入力およびイントラ予測モジュール560の第一の入力と信号通信で接続されている。ブロック解除フィルタ565の第二の出力は、参照ピクチャ・バッファ580の第一の入力と信号通信で接続されている。参照ピクチャ・バッファ580の出力は、動き補償器およびテンプレート照合予測モジュール570の第二の入力と信号通信で接続されている。
エントロピー・デコーダ545の第二の出力は、動き補償器およびテンプレート照合予測モジュール570の第三の入力、ブロック解除フィルタ565の第一の入力およびイントラ予測器560の第三の入力と信号通信で接続されている。エントロピー・デコーダ545の第三の出力は、デコーダ・コントローラ505の入力と信号通信で接続されている。デコーダ・コントローラ505の第一の出力は、エントロピー・デコーダ545の第二の入力と信号通信で接続されている。デコーダ・コントローラ405の第二の出力は、逆変換器および逆量子化器550の第二の入力と信号通信で接続されている。デコーダ・コントローラ505の第三の出力は、ブロック解除フィルタ565の第三の入力と信号通信で接続されている。デコーダ・コントローラ505の第四の出力は、イントラ予測モジュール560の第二の入力、動き補償器およびテンプレート照合予測モジュール570の第一の入力および参照ピクチャ・バッファ580の第二の入力と信号通信で接続されている。
動き補償器およびテンプレート照合予測モジュール570の出力は、スイッチ597の第一の入力と信号通信で接続されている。イントラ予測モジュール560の出力は、スイッチ597の第二の入力と信号通信で接続されている。スイッチ597の出力は、組み合わせ器525の第一の非反転入力と信号通信で接続されている。
入力バッファ510の入力は、デコーダ500の入力として、入力ビットストリームを受け取るために利用可能である。ブロック解除フィルタ565の第一の出力は、デコーダ500の出力として、出力ピクチャを出力するために利用可能である。
ここで、上記のように、本願の原理は、ビデオ・エンコードおよびデコードのための複雑さが低下したテンプレート照合予測のための方法および装置に向けられる。本稿に開示される方法および装置は、同時にテンプレート照合予測の符号化効率を維持しつつ、デコーダの複雑さを低下させることを理解しておくべきである。さらに、本願の原理はエンコーダの複雑さも低下させることができる。上記のように、テンプレート照合予測は、動き/変位情報(動きベクトル、参照インデックスおよび変位ベクトル)の伝送を回避することによって、インター予測およびイントラ予測両方について符号化効率を稼ぐことができる。しかしながら、テンプレート照合予測の欠点は、エンコーダおよびデコーダの両方で同じ探索を実行しなければならないということである。これは、デコーダの複雑さが大幅に増大しうることを意味する。
本願の原理に基づき、我々は、テンプレート照合予測のための対応する設定を制約することによって、テンプレート照合予測を単純化するための方法および装置を開示する。有利なことに、本願の原理に基づくそのような単純化したテンプレート照合予測は、デコーダの複雑さを低下させる。デコードの複雑さ(complexity)は、メモリ消費および計算量(computational complexity)を含む。具体的には、本願の原理のある実施形態では、テンプレート照合予測を、サブ画素精度未満に制限する。もう一つの実施形態では、より少数の探索点を使う(すなわち、より少数の位置を探索する)。さらにもう一つの実施形態では、より単純なサブ画素補間方式を使う。
一般に、本願の原理に基づくテンプレート照合予測は、以下のステップを含むと考えることができる:
(1)TMP探索精度が定義される。
(2)TMP探索精度がフル画素精度より高い場合、エンコーダによって、ルーマ/クロマのサブ画素位置がTMP精度で補間される。
(3)あるフレームのある目標ブロックを与えられて、エンコーダによって、補間されたフレームにおける参照サンプルの集合から、諸最適ピクセルの探索が実行される。ここで、諸最適ピクセルの隣接ピクセルは、目標ピクセルの隣接ピクセルと最高の相関をもつ。
(4)前記諸最適ピクセルが、上記ブロックのテンプレート照合予測として使われる。
第一の実施形態では、我々は、他の通常の動き補償方法より低いサブ画素精度で探索するようテンプレート照合予測を制限することを提案する。この制限は、符号化効率を劣化させない。というのも、我々はテンプレート照合予測から得られたいくつかの最良マッチを平均するが、該平均とサブ画素はエイリアシング軽減において同じような役割を果たすことが見出されたからである。ある実施形態では、エンコーダにおいて、サブ画素位置が、通常の動き探索およびテンプレート照合予測の前に、フレーム全体について補間される。その際、通常の動き探索かテンプレート照合予測かの判断がビットストリームにおいて送られる。デコーダでは、通常の動き探索とテンプレート照合予測のどちらが使われるかに依存して、各目標ブロックについて動き補償がオンザフライで実行されることができる。ある個別的なサブ実施形態では、テンプレート照合予測探索を、フル画素精度でのみ許容されるよう制限する。たとえば、そのような場合、補間精度は(たとえば通常の動き探索によって要求される)サブ画素で実行されることができるが、TMP探索はフル画素グリッドのみに制限されることができる。こうして、あるブロックについてテンプレート照合予測が選択される場合、デコーダにおいて、このブロックについて補間は必要とされない。クロマ解像度がルーマ解像度と同じでない場合、たとえばYUV4:2:0の場合、クロマ動きベクトル(MV: motion vector)はルーマ動きベクトルの半分であり、動きベクトル探索はルーマについてのみ実行される。というのも、クロマ動きベクトルが1/2画素精度の場合については、クロマ動きベクトルを、最も近いフル画素に近似することができるからである。
第二の実施形態では、我々は、テンプレート照合予測を、より少数の探索点に制限することを提案する。ある実施形態では、テンプレート照合予測は、候補位置の集合のみを探索する。候補位置は、(現在のブロックの動きベクトル予測子のような)よく予測された(well predicted)中心をもつ小さな探索範囲内であってもよいし、あるいは空間的/時間的な近隣ピクセルの動きベクトルから導出されてもよい。これは、現在のピクセルは、近隣ピクセルのものに似ている確率が高いという想定に基づいており、テンプレート照合予測は一般にそれらのピクセルをテンプレートとして使う。
第三の実施形態では、我々は、テンプレート照合予測のためにより複雑でないサブ画素補間方法を使うことを提案する。あるサブ実施形態では、ルーマ成分がフル画素精度であり、クロマ成分が1/2画素精度であることを許容する。1/2画素補間のためには、双線形フィルタが使われる。これは、平均とサブ画素がエイリアシング軽減のために似た役割を果たし、よってあまり複雑なサブ画素補間フィルタは必要としないという第一の方式と似た理論に基づいている。
上記の諸方式は、独立してまたは合同して適用できる。さらに、上記の諸方式は、たとえばスライス・ヘッダ、ピクチャ・パラメータ・セット(PPS)、シーケンス・パラメータ・セット(SPS)、ネットワーク抽象化層(NAL: network abstraction layer)ユニット・ヘッダ、補足向上情報(SEI)メッセージなどといった、高レベルのシンタックスで信号伝達されることができる。
〈シンタックス〉
表1は、本願の原理のある実施形態に基づく、スライス・ヘッダのための例示的なシンタックスを示している。
Figure 0005875989
ここで、表1のシンタックス要素の意味について、さらに詳細に下記に記載する。
tmp_search_precision_ind〔テンプレート探索精度指標〕が0に等しいことは、テンプレート照合において整数探索を使うことを指定し、
tmp_search_precision_indが1に等しいことは、テンプレート照合において1/2画素探索を使うことを指定し、
tmp_search_precision_indが2に等しいことは、テンプレート照合において1/4画素探索を使うことを指定する。
tmp_search_candidate_ind〔テンプレート探索候補指標〕が0に等しいことは、テンプレート照合において近隣の動きベクトルのみを使うことを指定し、
tmp_search_candidate_indが1に等しいことは、テンプレート照合のために(現在ブロックの動きベクトル予測子のような)よく予測された中心をもつ、あるいは空間的/時間的な近隣のピクセルの動きベクトルから導かれた探索範囲を使うことを指定する。
tmp_subpel_interp_flag〔テンプレート・サブ画素補間フラグ〕が0に等しいことは、テンプレート照合において双線形フィルタを使うことを指定し、
tmp_subpel_interp_flagが1に等しいことは、通常の動き補償と同じ補間フィルタを使うことを指定する。
一例として、組み合わされたアプローチが使用される。このアプローチでは、YUV4:2:0が考えられ、動きベクトル探索はルーマ成分についてのみ実行される。動きベクトル探索はフル画素精度に限定し、そのような探索を、[−2,2]から定義される探索範囲をもつ小さな窓のみに制約する。探索中心は、MPEG-4 AVC規格において行われているように、現在ブロックの動きベクトル予測子として定義される。クロマ補間については、双線形フィルタがサブ画素補間のために使用される。
図6に目を向けると、複雑さが低下したテンプレート照合を使ってピクチャについての画像データをエンコードする例示的な方法が、概括的に参照符号600によって示されている。方法600は、開始ブロック605を含み、これは制御をループ端ブロック610に渡す。ループ端ブロック610は、各スライスにわたるループを開始し、制御を機能ブロック615に渡す。機能ブロック615は通常のおよびテンプレート照合予測(TMP)探索精度を定義し、制御を機能ブロック620に渡す。機能ブロック620はTMPパラメータをエンコードし、制御を機能ブロック625に渡す。機能ブロック625はルーマ・サブ画素およびクロマ・サブ画素位置を補間し、これをバッファに記憶し、制御をループ端ブロック630に渡す。該ループ端ブロックは各ルーマ/クロマ・ブロックにわたるループを開始し、制御を機能ブロック635および機能ブロック640に渡す。機能ブロック635は通常の動き探索を実行し、制御を機能ブロック636に渡す。機能ブロック636は最良のルーマ動きベクトルを設定し、制御を機能ブロック637に渡す。機能ブロック637はクロマ動きベクトルを計算し、制御を機能ブロック638に渡す。機能ブロック638はRDコストJ1を計算し、制御を機能ブロック650に渡す。機能ブロック640は、ある探索範囲内のテンプレート照合予測探索を実行し、制御を機能ブロック641に渡す。機能ブロック641は、N個の最良の候補を見出し、それらを平均し、制御を機能ブロック642に渡す。機能ブロック642は対応するクロマ動きベクトルを計算し、クロマ成分のN個の最良の候補を平均し、制御を機能ブロック645に渡す。機能ブロック645はRDコストJ2を計算し、制御を判断ブロック650に渡す。判断ブロック650はJ1<J2であるか否かを判定する。もしそうであれば、制御は機能ブロック655に渡される。もしそうでなければ、制御は機能ブロック652に渡される。機能ブロック655はモード情報をエンコードし、制御を機能ブロック660に渡す。機能ブロック660はブロックの動きベクトル(MV)をエンコードし、制御をループ端ブロック670に渡す。機能ブロック652はブロックのモードをエンコードし、制御をループ端ブロック670に渡す。ループ端ブロック670は各ルーマ/クロマ・ブロックについてのループを終了し、制御をループ端ブロック680に渡す。ループ端ブロック680はスライスにわたるループを終了し、制御を機能ブロック699に渡す。
図7に目を向けると、複雑さが低下したテンプレート照合を使ってピクチャについての画像データをデコードする例示的な方法が、概括的に参照符号700によって示されている。方法700は、開始ブロック705を含み、これは制御をループ端ブロック710に渡す。ループ端ブロック710は、各スライスにわたるループを開始し、制御を機能ブロック715に渡す。機能ブロック715はTMPパラメータをデコードし、制御をループ端ブロック720に渡す。ループ端ブロック720は各ルーマ/クロマ・ブロックにわたるループを開始し、制御を機能ブロック730に渡す。機能ブロック730は現在ブロックのモードをデコードし、制御を判断ブロック740に渡す。判断ブロック740は現在のモードがTMPモードか否かを判定する。もしそうであれば、制御は機能ブロック745に渡される。そうでなければ、制御は機能ブロック755に渡される。機能745は、TMP精度がフル画素精度より高い場合に、TMP精度でルーマのサブ画素位置を補間し、制御を機能ブロック750に渡す。機能ブロック750は、ある探索範囲内でTMP動き検索を実行し、制御を機能ブロック770に渡す。機能ブロック770は最良のルーマ動きベクトルを設定し、制御を機能ブロック775に渡す。775はクロマ動きベクトルを計算し、制御を機能ブロック780に渡す。機能ブロック780は、クロマ動きベクトル精度がフル画素精度より高い場合に、クロマのサブ画素位置を補間し、制御をループ端ブロック785に渡す。機能ブロック785は、各ルーマ/クロマ・ブロックについてのループを終了し、制御をループ端ブロック790に渡す。ループ端ブロック790は各スライスにわたるループを終了し、制御を終了ブロック799に渡す。機能ブロック755は動きベクトルをデコードし、制御を機能ブロック760に渡す。機能ブロック760は通常の精度でルーマのサブ画素を補間し、制御を機能ブロック765に渡す。機能ブロック765は通常の動き補償を実行し、制御を機能ブロック770に渡す。
ここで、本発明の多くの付随する利点/特徴のいくつかの記載を与えておく。そのいくつかはすでに上述されている。たとえば、一つの利点/特徴は、テンプレート照合予測を使って、ピクチャにおける少なくともある画像ブロックをエンコードするビデオ・エンコーダを有する装置である。前記テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される、装置。
もう一つの利点/特徴は、上記のようなビデオ・エンコーダを有する装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き推定方法によって使用される精度より低いサブ画素精度に制約することと、前記テンプレート照合予測のために実行される前記テンプレート照合予測動きベクトル探索を、対応するデコーダにおいて要求される動き探索を欠く、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つにおける符号化モードによって使用される精度より低い前記サブ画素精度に制約することと、を含む、装置である。
さらにもう一つの利点/特徴は、上記のような、上記ビデオ・エンコーダを有する装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き推定方法より低いサブ画素精度に制約することと、前記テンプレート照合予測のために実行される前記テンプレート照合予測動きベクトル探索を、対応するデコーダにおいて要求される動き探索を欠く、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つにおける符号化モードによって使用される精度より低い前記サブ画素精度に制約することと、を含む、装置であって、前記テンプレート照合予測動きベクトル探索および前記標準的な動き推定方法のうちのいずれかを実行する前に前記ピクチャの全体についてサブ画素位置が補間され、補間されたサブ画素位置の少なくとも一部が前記テンプレート照合予測動きベクトル探索に使用される、装置である。
さらにもう一つの利点/特徴は、上記のような、上記ビデオ・エンコーダを有する装置であって、前記テンプレート照合予測動きベクトル探索および前記標準的な動き推定方法のうちのいずれかを実行する前に前記ピクチャの全体についてサブ画素位置が補間され、補間されたサブ画素位置の少なくとも一部が前記テンプレート照合予測動きベクトル探索に使用される、装置であって、前記画像ブロックを前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードするか、前記画像ブロックを前記標準的な動き推定方法の結果を使ってエンコードするかの決定がなされ、前記決定の結果が対応するデコーダへの伝送のためにエンコードされる、装置である。
さらに、もう一つの利点/特徴は、上記のようなビデオ・エンコーダを有する装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き推定方法との関連で実行される動き推定方法より少数の位置を探索するよう制約することを含む、装置である。
さらに、もう一つの利点/特徴は、上記のような、上記ビデオ・エンコーダを有する装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き推定方法より少数の位置を探索するよう制約することを含む、装置であって、前記より少数の位置が探索範囲に対応し、前記探索範囲の中心が前記画像ブロックの動きベクトル予測子に対応する、装置である。
また、もう一つの利点/特徴は、上記のような、上記ビデオ・エンコーダを有する装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き推定方法より少数の位置を探索するよう制約することを含む、装置であって、前記より少数の位置が、前記画像ブロックに関して空間的な近隣ピクセルおよび時間的な近隣ピクセルの少なくとも一方の動きベクトルによって決定される、装置である。
さらに、もう一つの利点/特徴は、上記のようなビデオ・エンコーダを有する装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な補間方式に比べ、より複雑でないサブ画素補間方式を、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索のために使うよう制約することを含む、装置である。
さらに、もう一つの利点/特徴は、上記のような、上記ビデオ・エンコーダを有する装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き補償方法によって使用される精度より低いサブ画素精度に制約することと、前記テンプレート照合予測のために実行される前記テンプレート照合予測動きベクトル探索を、対応するデコーダにおいて要求される動き探索を欠く、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つにおける符号化モードによって使用される精度より低い前記サブ画素精度に制約することと、を含む、装置であって、前記画像ブロックのルーマ成分がフル画素精度で補間され、前記画像ブロックのクロマ成分が二分の一画素精度で補間される、装置である。
本願の原理のこれらおよびその他の特徴および利点は、本願の教示に基づいて当業者によって容易に認識されうる。本願の原理の教示がハードウェア、ソフトウェア、ファームウェア、特殊目的プロセッサまたはそれらの組み合わせのさまざまな形で実装されうることは理解されるものである。
最も好ましくは、本願の原理の教示はハードウェアおよびソフトウェアの組み合わせとして実装される。さらに、ソフトウェアは、プログラム記憶ユニット上に具体的に具現されたアプリケーション・プログラムとして実装されてもよい。該アプリケーション・プログラムはいかなる好適なアーキテクチャを有する機械にアップロードされ、該機械によって実行されてもよい。好ましくは、前記機械は、一つまたは複数の中央処理ユニット(「CPU」)、ランダム・アクセス・メモリ(「RAM」)および入出力(「I/O」)インターフェースといったハードウェアをもつコンピュータ・プラットフォーム上で実装される。前記コンピュータ・プラットフォームはまた、オペレーティング・システムおよびマイクロ命令コードをも含みうる。本稿に記載されたさまざまなプロセスおよび機能はマイクロ命令コードの一部もしくはアプリケーション・プログラムの一部またはそれらの任意の組み合わせであってよく、CPUによって実行されてよい。さらに、追加的なデータ記憶ユニットおよび印刷ユニットといったさまざまな他の周辺ユニットがコンピュータ・プラットフォームに接続されていてもよい。
付属の図面に描かれている構成システム・コンポーネントおよび方法のいくつかは好ましくはソフトウェアにおいて実装されるので、システム・コンポーネントまたはプロセス機能ブロックの間の実際の接続は、本願の原理がプログラムされる仕方に依存して異なることがありうる。本稿の教示を与えられれば、当業者は、本願の原理のこれらおよび同様の実装または構成を考えることができるであろう。
本稿では例示的な実施形態が付属の図面を参照して記載されてきたが、本願の原理はそうした厳密な実施形態に限定されるものではなく、本願の原理の範囲や精神から外れることなく当業者がそれにさまざまな変更および修正を実施しうることは理解されるものである。そのようなすべての変更および修正は付属の請求項に記載される本願の原理の範囲内に含まれることが意図されている。
いくつかの付記を記載しておく。
〔付記1〕
テンプレート照合予測を使って、ピクチャにおける少なくともある画像ブロックをエンコードするビデオ・エンコーダを有する装置であって、前記テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される、装置。
〔付記2〕
付記1記載の装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き補償方法によって使用される精度より低いサブ画素精度に制約することと、
前記テンプレート照合予測のために実行される前記テンプレート照合予測動きベクトル探索を、対応するデコーダにおいて要求される動き探索を欠く、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つにおける符号化モードによって使用される精度より低い前記サブ画素精度に制約することと、
を含む、装置。
〔付記3〕
前記テンプレート照合予測動きベクトル探索および前記標準的な動き推定方法のうちのいずれかを実行する前に前記ピクチャの全体についてサブ画素位置が補間され、補間されたサブ画素位置の少なくとも一部が前記テンプレート照合予測動きベクトル探索に使用される、付記2記載の装置。
〔付記4〕
前記画像ブロックを前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードするか、前記画像ブロックを前記標準的な動き推定方法の結果を使ってエンコードするかの決定がなされ、前記決定の結果が対応するデコーダへの伝送のためにエンコードされる、付記3記載の装置。
〔付記5〕
付記1記載の装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き推定方法との関連で実行される動き推定方法より少数の位置を探索するよう制約することを含む、装置。
〔付記6〕
付記5記載の装置であって、前記より少数の位置が探索範囲に対応し、前記探索範囲の中心が前記画像ブロックの動きベクトル予測子に対応する、装置。
〔付記7〕
付記5記載の装置であって、前記より少数の位置が、前記画像ブロックに関して空間的な近隣ピクセルおよび時間的な近隣ピクセルの少なくとも一方の動きベクトルによって決定される、装置。
〔付記8〕
付記1記載の装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な補間方式に比べ、より複雑でないサブ画素補間方式を、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索のために使うよう制約することを含む、装置。
〔付記9〕
前記画像ブロックのルーマ成分がフル画素精度で補間され、前記画像ブロックのクロマ成分が二分の一画素精度で補間される、付記2記載の装置。
〔付記10〕
ビデオ・エンコーダにおける方法であって:
テンプレート照合予測を使って、ピクチャにおける少なくともある画像ブロックをエンコードすること(615、620、640、641、642)を含み、前記テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される(615、625、640)、方法。
〔付記11〕
付記10記載の方法であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き補償方法によって使用される精度より低いサブ画素精度に制約することと、
前記テンプレート照合予測のために実行される前記テンプレート照合予測動きベクトル探索を、対応するデコーダにおいて要求される動き探索を欠く、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つにおける符号化モードによって使用される精度より低い前記サブ画素精度に制約することと(615)、
を含む、方法。
〔付記12〕
前記テンプレート照合予測動きベクトル探索および前記標準的な動き推定方法のうちのいずれかを実行する前に前記ピクチャの全体についてサブ画素位置が補間され(625)、補間されたサブ画素位置の少なくとも一部が前記テンプレート照合予測動きベクトル探索に使用される(640、642)、付記11記載の方法。
〔付記13〕
前記画像ブロックを前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードするか、前記画像ブロックを前記標準的な動き推定方法の結果を使ってエンコードするかの決定がなされ(638、645、650)、前記決定の結果が対応するデコーダへの伝送のためにエンコードされる(655、652)、付記12記載の方法。
〔付記14〕
付記10記載の方法であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き推定方法との関連で実行される動き推定方法より少数の位置を探索するよう制約する(640)ことを含む、方法。
〔付記15〕
付記14記載の方法であって、前記より少数の位置が探索範囲に対応し、前記探索範囲の中心が前記画像ブロックの動きベクトル予測子に対応する(640)、方法。
〔付記16〕
付記14記載の方法であって、前記より少数の位置が、前記画像ブロックに関して空間的な近隣ピクセルおよび時間的な近隣ピクセルの少なくとも一方の動きベクトルによって決定される(640)、方法。
〔付記17〕
付記10記載の方法であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な補間方式に比べ、より複雑でないサブ画素補間方式を、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索のために使うよう制約する(625)ことを含む、方法。
〔付記18〕
前記画像ブロックのルーマ成分がフル画素精度で補間され、前記画像ブロックのクロマ成分が二分の一画素精度で補間される(625)、付記17記載の方法。
〔付記19〕
テンプレート照合予測を使って、ピクチャにおける少なくともある画像ブロックをデコードするビデオ・デコーダを有する装置であって、前記テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される、装置。
〔付記20〕
付記19記載の装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き補償方法によって使用される精度より低いサブ画素精度に制約することと、
前記テンプレート照合予測のために実行される前記テンプレート照合予測動きベクトル探索を、対応するデコーダにおいて要求される動き探索を欠く、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つにおける符号化モードによって使用される精度より低い前記サブ画素精度に制約することと、
を含む、装置。
〔付記21〕
前記画像ブロックを前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードするか、前記画像ブロックを前記標準的な動き推定方法の結果を使ってエンコードするかの決定の結果がデコードされ、前記結果が前記ビデオ・デコーダによって、前記画像ブロックをデコードするために前記テンプレート照合予測動きベクトル探索を適用するか前記標準的な動き推定方法を適用するかを決定するために使われる、付記20記載の装置。
〔付記22〕
付記21記載の装置であって、前記テンプレート照合予測動きベクトル探索がフル画素解像度で許可されるのが、前記決定の結果が、前記画像ブロックが前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードされたことを示すときのみである、装置。
〔付記23〕
付記19記載の装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き推定方法との関連で実行される動き推定方法より少数の位置を探索するよう制約することを含む、装置。
〔付記24〕
付記23記載の装置であって、前記より少数の位置が探索範囲に対応し、前記探索範囲の中心が前記画像ブロックの動きベクトル予測子に対応する、装置。
〔付記25〕
付記23記載の装置であって、前記より少数の位置が、前記画像ブロックに関して空間的な近隣ピクセルおよび時間的な近隣ピクセルの少なくとも一方の動きベクトルによって決定される、装置。
〔付記26〕
付記19記載の装置であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な補間方式に比べ、より複雑でないサブ画素補間方式を、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索のために使うよう制約することを含む、装置。
〔付記27〕
前記画像ブロックのルーマ成分がフル画素精度で補間され、前記画像ブロックのクロマ成分が二分の一画素精度で補間される、付記26記載の装置。
〔付記28〕
ビデオ・デコーダにおける方法であって、テンプレート照合予測を使って、画像中の少なくともある画像ブロックをデコードする(715、745、750、770)ことを含み、前記テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される(715、745、750)、方法。
〔付記29〕
付記28記載の方法であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き補償方法によって使用される精度より低いサブ画素精度に制約することと、
前記テンプレート照合予測のために実行される前記テンプレート照合予測動きベクトル探索を、対応するデコーダにおいて要求される動き探索を欠く、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つにおける符号化モードによって使用される精度より低い前記サブ画素精度に制約することと(715、745)、
を含む、方法。
〔付記30〕
前記画像ブロックを前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードするか、前記画像ブロックを前記標準的な動き推定方法の結果を使ってエンコードするかの決定の結果がデコードされ(730、740)、前記結果が前記ビデオ・デコーダによって、前記画像ブロックをデコードするために前記テンプレート照合予測動きベクトル探索を適用するか(740、750)前記標準的な動き推定方法を適用するか(755、760、765)を決定するために使われる、付記29記載の方法。
〔付記31〕
付記30記載の方法であって、前記テンプレート照合予測動きベクトル探索がフル画素解像度で許可されるのが、前記決定の結果が、前記画像ブロックが前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードされたことを示すときのみである(745)、方法。
〔付記32〕
付記28記載の方法であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な動き推定方法との関連で実行される動き推定方法より少数の位置を探索するよう制約する(715、750)「ことを含む、方法。
〔付記33〕
付記32記載の方法であって、前記より少数の位置が探索範囲に対応し、前記探索範囲の中心が前記画像ブロックの動きベクトル予測子に対応する(750)、方法。
〔付記34〕
付記32記載の方法であって、前記より少数の位置が、前記画像ブロックに関して空間的な近隣ピクセルおよび時間的な近隣ピクセルの少なくとも一方の動きベクトルによって決定される(750)、方法。
〔付記35〕
付記28記載の方法であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、既存のビデオ符号化規格および既存のビデオ符号化勧告の少なくとも一つに対応する標準的な補間方式に比べ、より複雑でないサブ画素補間方式を、前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索のために使うよう制約する(715、745)ことを含む、方法。
〔付記36〕
前記画像ブロックのルーマ成分がフル画素精度で補間され、前記画像ブロックのクロマ成分が二分の一画素精度で補間される(745)、付記35記載の方法。
〔付記37〕
テンプレート照合予測を使ってエンコードされたピクチャにおける少なくともある画像ブロックを含むビデオ信号データがエンコードされているコンピュータ読み取り可能な記憶媒体であって、前記テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約される、記憶媒体。


Claims (15)

  1. ビデオ・エンコーダにおける方法であって:
    テンプレート照合予測を使って、ピクチャにおける少なくともある画像ブロックをエンコードすることを含み、前記テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約され、前記一つまたは複数の制約条件が、
    通常の動き探索およびテンプレート照合予測を実行する前に、フレームについて、サブ画素位置を補間し、その際、前記通常の動き探索か前記テンプレート照合予測かの判断はビットストリームにおいて送られ、
    前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索をフル画素精度に制約し、前記ビデオ符号化規格もしくは勧告における、対応するデコーダにおいて動き探索を必要としない符号化モードを使うときにサブ画素補間精度を使うことを含み、
    前記テンプレート照合予測から得られる複数のマッチを平均すること(615)を含む、方法。
  2. 前記テンプレート照合予測動きベクトル探索および前記動き推定方法のうちのいずれかを実行する前に前記ピクチャの全体についてサブ画素位置が補間され、補間されたサブ画素位置の少なくとも一部が前記テンプレート照合予測動きベクトル探索に使用される、請求項1記載の方法。
  3. 前記画像ブロックを前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードするか、前記画像ブロックを前記動き推定方法の結果を使ってエンコードするかの決定がなされ、前記決定の結果が対応するデコーダへの伝送のためにエンコードされる、請求項2記載の方法。
  4. 請求項1記載の方法であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、前記動き推定方法との関連で実行される動き推定方法より少数の位置を探索するよう制約することを含む、方法。
  5. 請求項4記載の方法であって、前記より少数の位置が探索範囲に対応し、前記探索範囲の中心が前記画像ブロックの動きベクトル予測子に対応する、方法。
  6. 請求項4記載の方法であって、前記より少数の位置が、前記画像ブロックに関して空間的な近隣ピクセルおよび時間的な近隣ピクセルの少なくとも一方の動きベクトルによって決定される、方法。
  7. 前記画像ブロックのルーマ成分がフル画素精度で補間され、前記画像ブロックのクロマ成分が前記サブ画素精度で補間される、請求項1記載の方法。
  8. ビデオ・デコーダにおける方法であって、テンプレート照合予測を使って、画像中の少なくともある画像ブロックをデコードすることを含み、前記テンプレート照合予測は、該テンプレート照合予測の実行の複雑さを低下させる一つまたは複数の制約条件を使って選択可能な形で制約され、前記一つまたは複数の制約条件が、
    通常の動き探索およびテンプレート照合予測を実行する前に、フレームについて、サブ画素位置を補間し、その際、前記通常の動き探索か前記テンプレート照合予測かの判断はビットストリームにおいて送られ、
    前記テンプレート照合予測のために実行されるテンプレート照合予測動きベクトル探索についてフル画素精度を使うよう制約し、対応するデコーダのためにエンコードされる動きベクトルを生成するまたは対応するデコーダにおいて動き探索を必要としないビデオ符号化規格もしくは勧告の補間方式を使うときはサブ画素精度を使うことを含み、
    前記テンプレート照合予測から得られる複数のマッチを平均することを含む、
    方法。
  9. 請求項8記載の方法であって、前記一つまたは複数の制約条件が
    前記テンプレート照合予測のために実行される前記テンプレート照合予測動きベクトル探索を、前記ビデオ符号化規格もしくは勧告における、対応するデコーダにおいて動き探索を必要としない符号化モードによって使用される精度より低い前記サブ画素精度に制約することを含む、方法。
  10. 前記画像ブロックを前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードするか、前記画像ブロックを前記動き推定方法の結果を使ってエンコードするかの決定の結果がデコードされ、前記結果が前記ビデオ・デコーダによって、前記画像ブロックをデコードするために前記テンプレート照合予測動きベクトル探索を適用するか前記動き推定方法を適用するかを決定するために使われる、請求項9記載の方法。
  11. 請求項10記載の方法であって、前記テンプレート照合予測動きベクトル探索がフル画素解像度で許可されるのが、前記決定の結果が、前記画像ブロックが前記テンプレート照合予測動きベクトル探索の結果を使ってエンコードされたことを示すときのみである、方法。
  12. 請求項8記載の方法であって、前記一つまたは複数の制約条件が、前記テンプレート照合予測を、前記動き推定方法との関連で実行される動き推定方法より少数の位置を探索するよう制約することを含む、方法。
  13. 請求項12記載の方法であって、前記より少数の位置が探索範囲に対応し、前記探索範囲の中心が前記画像ブロックの動きベクトル予測子に対応する、方法。
  14. 請求項12記載の方法であって、前記より少数の位置が、前記画像ブロックに関して空間的な近隣ピクセルおよび時間的な近隣ピクセルの少なくとも一方の動きベクトルによって決定される、方法。
  15. 前記画像ブロックのルーマ成分がフル画素精度であり、前記画像ブロックのクロマ成分が前記サブ画素精度で補間される、請求項8記載の方法。
JP2012548962A 2010-01-19 2011-01-19 ビデオ・エンコードおよびデコードのための低複雑性テンプレート照合予測のための方法および装置 Active JP5875989B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US29632910P 2010-01-19 2010-01-19
US61/296,329 2010-01-19
PCT/US2011/000098 WO2011090783A1 (en) 2010-01-19 2011-01-19 Methods and apparatus for reduced complexity template matching prediction for video encoding and decoding

Publications (3)

Publication Number Publication Date
JP2013517682A JP2013517682A (ja) 2013-05-16
JP2013517682A5 JP2013517682A5 (ja) 2013-11-28
JP5875989B2 true JP5875989B2 (ja) 2016-03-02

Family

ID=43629411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012548962A Active JP5875989B2 (ja) 2010-01-19 2011-01-19 ビデオ・エンコードおよびデコードのための低複雑性テンプレート照合予測のための方法および装置

Country Status (6)

Country Link
US (2) US9516341B2 (ja)
EP (1) EP2526697A1 (ja)
JP (1) JP5875989B2 (ja)
KR (1) KR101782661B1 (ja)
CN (1) CN102804774B (ja)
WO (1) WO2011090783A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101791919B1 (ko) 2010-01-22 2017-11-02 톰슨 라이센싱 예시-기반의 초 해상도를 이용하여 비디오 압축을 위한 데이터 프루닝
CN102823242B (zh) 2010-01-22 2016-08-10 汤姆森特许公司 基于取样超分辨率视频编码和解码的方法和装置
KR101836981B1 (ko) * 2010-07-09 2018-03-09 한국전자통신연구원 템플릿 매칭을 이용한 영상 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
KR101892019B1 (ko) * 2010-09-10 2018-09-28 톰슨 라이센싱 이미지 컨텐츠에 기초한 검색 및 랭킹에 의한, 비디오 압축 시 레퍼런스 블록으로의 링크를 인코딩
WO2012033972A1 (en) 2010-09-10 2012-03-15 Thomson Licensing Methods and apparatus for pruning decision optimization in example-based data pruning compression
WO2012033971A1 (en) 2010-09-10 2012-03-15 Thomson Licensing Recovering a pruned version of a picture in a video sequence for example - based data pruning using intra- frame patch similarity
WO2012075612A1 (en) * 2010-12-10 2012-06-14 Technicolor (China) Technology Co., Ltd. Method and device for determining a motion vector for a current block of a current video frame
KR101547041B1 (ko) * 2011-01-12 2015-08-24 미쓰비시덴키 가부시키가이샤 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법 및 화상 복호 방법
JP2013085157A (ja) * 2011-10-12 2013-05-09 Toshiba Corp 画像処理装置、画像処理方法および画像処理システム
US9345573B2 (en) 2012-05-30 2016-05-24 Neovasc Tiara Inc. Methods and apparatus for loading a prosthesis onto a delivery system
US20140184618A1 (en) * 2012-12-28 2014-07-03 Scott A. Krig Generating canonical imaging functions
JP6394876B2 (ja) * 2014-09-17 2018-09-26 株式会社ソシオネクスト 符号化回路、符号化方法
JP6379186B2 (ja) * 2016-02-17 2018-08-22 テレフオンアクチーボラゲット エルエム エリクソン(パブル) ビデオピクチャを符号化および復号する方法および装置
KR20180040824A (ko) * 2016-10-13 2018-04-23 디지털인사이트 주식회사 복호화기 기반의 화면 내 예측 모드 추출 기술을 사용하는 비디오 코딩 방법 및 장치
EP3580928A1 (en) * 2017-02-08 2019-12-18 Fraunhofer Gesellschaft zur Förderung der Angewand Predictive coding concept using template matching
KR102510902B1 (ko) * 2018-01-17 2023-03-17 삼성디스플레이 주식회사 열화 보상 장치, 이를 포함하는 표시 장치 및 이를 이용한 표시 장치의 열화 보상방법
WO2019225932A1 (ko) * 2018-05-21 2019-11-28 엘지전자 주식회사 영상 코딩 시스템에서 dmvr을 사용하는 영상 디코딩 방법 및 그 장치
EP3804329A1 (en) 2018-06-01 2021-04-14 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Video codec using template matching prediction
WO2020001578A1 (en) * 2018-06-28 2020-01-02 Huawei Technologies Co., Ltd. Motion vector refinement search with integer pixel resolution
US20230093043A1 (en) * 2021-09-22 2023-03-23 Tencent America LLC Method and apparatus for adaptive reordering for reference frames

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6968008B1 (en) * 1999-07-27 2005-11-22 Sharp Laboratories Of America, Inc. Methods for motion estimation with adaptive motion accuracy
US7408988B2 (en) * 2002-12-20 2008-08-05 Lsi Corporation Motion estimation engine with parallel interpolation and search hardware
US20050207495A1 (en) * 2004-03-10 2005-09-22 Jayaram Ramasastry Methods and apparatuses for compressing digital image data with motion prediction
US20060233258A1 (en) * 2005-04-15 2006-10-19 Microsoft Corporation Scalable motion estimation
JP2007043651A (ja) * 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
US8705630B2 (en) * 2006-02-10 2014-04-22 Nvidia Corporation Adapting one type of encoder to another type of encoder
AU2007244443A1 (en) 2006-04-28 2007-11-08 Ntt Docomo, Inc. Image predictive coding device, image predictive coding method, image predictive coding program, image predictive decoding device, image predictive decoding method and image predictive decoding program
JP2007300380A (ja) * 2006-04-28 2007-11-15 Ntt Docomo Inc 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
CN100551073C (zh) * 2006-12-05 2009-10-14 华为技术有限公司 编解码方法及装置、分像素插值处理方法及装置
US9031130B2 (en) * 2007-04-09 2015-05-12 Ntt Docomo, Inc. Image prediction/encoding device, image prediction/encoding method, image prediction/encoding program, image prediction/decoding device, image prediction/decoding method, and image prediction decoding program
JP4767908B2 (ja) * 2007-05-29 2011-09-07 シャープ株式会社 画像復号装置及び画像符号化装置
JP5406465B2 (ja) * 2008-04-24 2014-02-05 株式会社Nttドコモ 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
JP2010016453A (ja) * 2008-07-01 2010-01-21 Sony Corp 画像符号化装置および方法、画像復号装置および方法、並びにプログラム
JP2010035137A (ja) 2008-07-01 2010-02-12 Sony Corp 画像処理装置および方法、並びにプログラム
US8787459B2 (en) * 2010-11-09 2014-07-22 Sony Computer Entertainment Inc. Video coding methods and apparatus

Also Published As

Publication number Publication date
US9516341B2 (en) 2016-12-06
US10349080B2 (en) 2019-07-09
WO2011090783A1 (en) 2011-07-28
KR101782661B1 (ko) 2017-10-23
CN102804774A (zh) 2012-11-28
EP2526697A1 (en) 2012-11-28
US20120320983A1 (en) 2012-12-20
KR20120118457A (ko) 2012-10-26
JP2013517682A (ja) 2013-05-16
US20170064327A1 (en) 2017-03-02
CN102804774B (zh) 2016-08-24

Similar Documents

Publication Publication Date Title
JP5875989B2 (ja) ビデオ・エンコードおよびデコードのための低複雑性テンプレート照合予測のための方法および装置
TWI735172B (zh) 用於多個工具的互相排斥設定
JP7179037B2 (ja) 動き情報の適応型符号化方法及び装置
US9832474B2 (en) Method and apparatus for setting reference picture index of temporal merging candidate
US11051010B2 (en) Merge candidates with multiple hypothesis
JP5413923B2 (ja) 変位イントラ予測およびテンプレート・マッチングのためのデブロッキング・フィルタリング
US10511839B2 (en) Image encoding/decoding method and device for same
JP5628155B2 (ja) 動き補償の補間フィルタリング及び参照画像のフィルタリングのための局所的な適応フィルタリングの方法及び装置
JP2020074597A (ja) 符号化装置、復号方法、符号化方法、復号方法、及びプログラム
JP2013523010A (ja) ビデオ符号化およびビデオ復号化のための暗示的適応型動きベクトル予測器選択の方法および装置
JP2016015752A (ja) 映像符号化及び復号化のためのdcイントラ予測モードのための方法及び装置
JP2022535859A (ja) Mpmリストを構成する方法、クロマブロックのイントラ予測モードを取得する方法、および装置
JP2023100979A (ja) オプティカルフローによる予測洗練化、双方向オプティカルフローおよびデコーダ側の動きベクトル洗練化のための方法および装置
GB2571311A (en) Methods and devices for improvement in obtaining linear component sample prediction parameters
JP7223858B2 (ja) ビデオコーディングの方法、ビデオコーディングデバイス、コンピュータ可読記憶媒体およびコンピュータプログラム
US20180249155A1 (en) Method and apparatus of prediction offset derived based on neighbouring area in video coding
WO2020063598A1 (en) A video encoder, a video decoder and corresponding methods
JP2022527673A (ja) ビデオ符号化のための動きベクトル予測
JP7303255B2 (ja) ビデオコーディングの方法、ビデオコーディングデバイス、コンピュータ可読記憶媒体およびコンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131010

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131010

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140930

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150512

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160120

R150 Certificate of patent or registration of utility model

Ref document number: 5875989

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250