JP2013505615A - 動画像の重み付き動き補償 - Google Patents

動画像の重み付き動き補償 Download PDF

Info

Publication number
JP2013505615A
JP2013505615A JP2012529206A JP2012529206A JP2013505615A JP 2013505615 A JP2013505615 A JP 2013505615A JP 2012529206 A JP2012529206 A JP 2012529206A JP 2012529206 A JP2012529206 A JP 2012529206A JP 2013505615 A JP2013505615 A JP 2013505615A
Authority
JP
Japan
Prior art keywords
segment
weighted
data
parameter
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012529206A
Other languages
English (en)
Inventor
スプルリャン、ニコラ
シープリンスキー、レセック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2013505615A publication Critical patent/JP2013505615A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

予測符号化されたデータを復号するように動作可能な動画像復号器であって、各符号化データセグメントが局所重み付きパラメータで符号化されている、動画像復号器が開示される。画像の各セグメントを符号化するとき、画像の以前に符号化されたセグメントから重み付きパラメータが導出される。有利には、各セグメントに対して異なる重み付きパラメータを許容することによって、単一の大域重み付きパラメータを画像のセグメントの全てに対して用いる場合よりも、画像内の照明変化に良好に適応する。本出願は、MPEG動画像符号化及びMPEG動画像復号を含む。したがって、画像のシーケンスを規定する予測符号化された動画像データを復号するように動作可能な動画像復号器が提供される。各画像は複数のセグメントに分割され、当該復号器は、符号化された動画像データを復号して、画像のセグメントにおける復号された差分データ(MBr’)、セグメントにおける復号された動きデータ(14)、及びセグメントにおける少なくとも1つの復号された重み付きパラメータを生成するように動作可能な復号器と、動きデータ及び以前に復号された動画像データを処理してセグメントにおける動き補償された動画像データ(MBc’)を生成するように動作可能な動き補償データ生成器と、セグメントにおける動き補償された動画像データ(MBc’)と、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータとは異なる、セグメントにおける少なくとも1つの重み付きパラメータと結合することによって、セグメントにおける予測相画像データ(MBp)を生成するように動作可能な予測データ生成器と、セグメントにおける復号された差分データ(MBr’)とセグメントにおける予測動画像データ(MBp)とを結合するように動作可能なデータ結合器とを備える。

Description

本発明は、動画像の符号化及び復号に関する。
[優先権の主張]
本出願は、2009年9月17日に出願された欧州特許出願第09170576.4号に基づく優先権を主張し、当該特許出願の内容全体が相互参照により本明細書に援用される。
最新の動画像圧縮方法は、画像の時空間予測に基づくものである。時空間予測は、本質的には予測信号と予測画像との間の差分の符号化によって構成される。通常、適切なメトリックにおいて、予測信号が予測画像に近いほど、画像を良好に圧縮することができ、すなわち画像をより少ないビットで表すことができる。予測は、以前に符号化された画像の復号されたサンプルか、或いは現在の画像における以前に符号化されたブロックを取得することによって形成される。通常の動画像信号は大きな時間相関を呈するので、時間予測は全体圧縮効率における重要な利得因子である。動きベクトルを用いて異なる画像の部分間の空間変位を補償することに加えて、重み付き予測を用いることによって、輝度レベルの変化も補償することができる。符号化における別の顕著な技法は、レート歪み最適化(RDO)であり、可能な最良の符号化効率利得を達成するための動画像符号化モード選択に役立つように広く用いられている。このプロセスは、以下のように説明することができる。有効な符号化モードについて、ビット消費量が取得されると共に、元の動画像データと復号された動画像データとの間の歪みが測定される。ラグランジュ乗数λを用いてレートRと歪みDとをバランスさせることによって、コスト関数Jが構築される。
Figure 2013505615
最小のコスト値に従って、可能な最良の符号化効率利得を達成するための動画像符号化モードが決定される。所与の動画像データについて幾つかの符号化モードが可能である場合、RDOプロセスは符号化効率利得を捉えるために重要である。
H.264/MPEG−4 AVC動画像符号化標準規格は、重み付き予測を採用している。重み付き予測では、任意の乗法加重係数及び加法オフセット係数を基準画像予測に適用することができる。一般的に、重み付き予測は、以下の関係で表すことができる。
Figure 2013505615
ここで、Xは基準画像信号であり、Yは予測画像信号であり、oは加法オフセット重み付きパラメータであり、wは乗法加重重み付きパラメータである。現在の画像を予測するのに用いられる基準画像信号のそれぞれについて、別個のオフセット/加重のペアを割り当てることができる。H.264/MPEG−4 AVCでは、最大2つの画像が任意の所与のマクロブロックの時間補償に用いられる。P画像では、単一の画像から生成される単一の予測のみが用いられる。一方、B画像では、2つの予測信号を用いることができる。明示モードでは、加重及びオフセットはスライスレベルで指定され、それらの派生物については標準規格では規定されていない。暗示モードでは、重み付きは基準画像への距離に従って計算される。ここでは、画像距離と適用される重み付きとの間の関係は標準規格で規定されている。標準規格は、メモリ管理制御動作(MMCO)の形態でスライスの異なるセグメントに異なる明示的な重み付きパラメータを適用するための規定を、マクロブロックのサイズまで落とした状態にしている。これは、例えば、特許文献1において説明されている。しかしながら、これには、実際に役立つ十分に大きな重み付き予測パラメータセットのオーバーヘッド情報のために、多大なペナルティを伴う。
さらに、通常は、画像レベルの重み付き予測パラメータの導出には、何らかのマルチパス方式が伴い、画像データは少なくとも2回処理されなくてはならない。1つの可能性は、単にパラメータを推定することであり、そのためには、予測される圧縮性能に関連する或る判断基準を用いて最適重み付きパラメータを計算するために、実際の圧縮の前に全体画像統計が捉えられる必要がある。画像レベル重み付き予測を利用する圧縮性能は、実際にデータを圧縮してみなければ確実に推定することができないため、「画像レベルレート歪み最適化」として知られる方式を用いてもよい。この方式では、画像は毎回異なる重み付き予測パラメータを用いて複数回圧縮され、重み付き予測が無効にされるモードを含み、ラグランジュコストの観点で最良の結果が保持される。これは、計算複雑度が非常に高い一方で、限られた性能改善しか提供しないという不利な点を有する。
明示的な重み付きパラメータの導出は標準規格では規定されていないので、様々な方式が存在する。特許文献2では、2つの画像の平均を減算することのみによるオフセット、2つの画像の平均を除算することのみによる加重、ヒストグラムに基づく方法と線形回帰に基づく方法、また全ての上記方法の反復的変形形態も検討されており、パラメータは動き補償後に調整される。特許文献2におけるヒューリスティックベースの方法では、それぞれ異なる導出方法を用いることによってパラメータの幾つかのペアを計算し、次に特定のメトリックを用いることによって、いずれのペアが最も良好に機能するかを判定する。
米国特許出願公開第2006/0198440号 国際公開第2007/092215号
しかしながら、既知の技法には多数の問題が存在する。特に、一般的に、重み付き予測パラメータの全体的な性質に起因して、既知の重み付き予測技法の結果は、符号化効率の観点から信頼性がない。マルチパス画像レベル最適化手法が用いられない場合、符号化性能は一層悪化する場合がある。マルチパス手法は改善を保証するが、多くの場合に、その改善は依然として極めて小さく、計算複雑度が非常に高くなるという犠牲を伴う。
概して、本発明の一実施の形態における重み付き予測の演算は、画像内の照明変化に適応するように局所レベルで定義され、当該局所レベルにおいては、各画像セグメントについて重み付きパラメータの異なるセットが規定され、現在のブロックのパラメータを伝達するビットストリームの一部として送信される。重み付き予測の演算は、以下によって定義することができる。
Figure 2013505615
ここで、Bcはn+1番目の画像セグメントであり、oは加法オフセット重み付きパラメータであり、wは画像セグメントBcに関連付けられる乗法加重重み付きパラメータである。基準画像Bpは、現在符号化されている画像セグメントを予測するのに用いられる予測信号である。画像セグメントBcは、n+1番目の基準画像に関連付けることができるが、一般的には、任意の以前に処理された画像セグメントとすることができる。さらに、画像セグメントBcは、(例えば補間によって)再サンプリングされた画像セグメントとすることもできる。上述した画像セグメントは、任意の形状とすることができる。
これらの特徴の結果として、重み付きパラメータはコンテンツ内の局所変動に適合し、これによって予測が改善される。
より詳細には、本発明によれば、画像のシーケンスを規定する予測符号化された動画像データを復号する動画像復号方法が提供される。各画像は複数のセグメントに分割され、当該方法は:
符号化された動画像データを復号して、画像のセグメントにおける復号された差分データと、セグメントにおける復号された動きデータと、セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む復号された重み付きパラメータとを生成するステップであって、重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にする重み付きパラメータである、ステップと、
動きデータ及び以前に復号された動画像データを処理して、セグメントにおける動き補償された動画像データを生成するステップと、
セグメントにおける動き補償された動画像データと、セグメントにおけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータとを結合することによって、セグメントにおける予測動画像データを生成するステップであって、セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータとは異なる、ステップと、
セグメントにおける復号された差分データとセグメントにおける予測動画像データとを結合するステップと
を含む。
上記動画像復号方法においては、
符号化された動画像データを復号して、複数のセグメントのそれぞれにおいて、加重重み付きパラメータを生成することができ、
複数のセグメントにおける動きデータ及び以前に復号された動画像データを処理して、複数のセグメントのそれぞれにおいて、動き補償された動画像データを生成することができ、
複数のセグメントのそれぞれにおいて、動き補償された動画像データと加重重み付きパラメータとを結合して、予測動画像データを生成することができる。
異なる各画像内の複数のセグメントにおいて、動きデータ及び以前に復号された動画像データを処理して、複数のセグメントのそれぞれにおいて、動き補償された動画像データを生成することができる。
上記動画像復号方法においては、
復号プロセスは、符号化された動画像データを復号して重み付きパラメータの差分データを生成することができ、
重み付きパラメータと、以前に復号したセグメントにおいて導出された以前に復号された重み付きパラメータとの復号された差分データを用いて、セグメントにおける重み付きパラメータを導出することによって、セグメントにおける予測動画像データを生成することができる。
セグメントにおける予測動画像データを、
以前に復号された少なくとも1つの近傍セグメントにおける重み付きパラメータからセグメントにおける重み付きパラメータを予測することと、
予測重み付きパラメータと復号プロセスから取得された重み付きパラメータと結合して、結果としての予測重み付きパラメータを生成することと、
セグメントにおける動き補償された動画像データと結果としての予測重み付きパラメータとを結合して、セグメントにおける予測動画像データを生成することと
によって生成することができる。
以前に復号された少なくとも2つの近傍セグメントにおける重み付きパラメータの平均を計算することによって、セグメントにおける重み付きパラメータを予測することができる。
動画像復号方法において、予測動画像データを生成するプロセスは、
セグメントにおける動きデータと、少なくとも1つの以前に復号されたセグメントにおける動きデータとを比較して、動きデータ間の類似度の測定値を求め、
求められた測定値が高い類似度を示している場合には、少なくとも1つの以前に復号されたセグメントにおける重み付きパラメータを用いて、セグメントにおける予測重み付きパラメータを生成し、動き補償された動画像データと予測重み付きパラメータとを結合することを含むことができる。
動画像復号方法においては、符号化された動画像データを復号してオフセット重み付きパラメータ及び加重重み付きパラメータを生成し、オフセット重み付きパラメータの値がより少ないビットで表されるほど、値がゼロに近づくようにし、また、加重重み付きパラメータの値がより少ないビットで表されるほど、値が1に近づくようにすることができる。
また、本発明は、画像のシーケンスを規定する動画像データを予測符号化する動画像符号化方法も提供する。各画像は複数のセグメントに分割され、当該方法は:
セグメントの動画像データを処理して、セグメントにおける動きデータ及び動き補償された動画像データを生成するステップと、
セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータを計算するステップであって、重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にするものであり、セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータとは異なる、ステップと、
動き補償された動画像データと重み付きパラメータとを結合して、セグメントにおける重み付き動き補償データを生成するステップと、
セグメントにおける動画像データとセグメントにおける重み付き動き補償データとの間の差分を規定する差分データを生成するステップと、
セグメントにおける差分データ、セグメントにおける動きデータ、及びセグメントにおける重み付きパラメータを含む、セグメントのデータを符号化するステップと
を含む。
ビデオ符号化方法においては、
複数のセグメントのそれぞれにおいて、加重重み付きパラメータを計算することができ、
1つのセグメント及び複数の異なるセグメントにおける動画像データを処理して、複数の動き補償された動画像データセグメントを生成することができ、
複数の動き補償された動画像データセグメントと複数の加重重み付きパラメータとを、複数の動き補償された動画像データセグメントのそれぞれが複数の加重重み付きパラメータのそれぞれによって重み付けされるように結合することによって、重み付き動き補償データを生成することができる。
異なる各画像内のセグメント及び複数のセグメントにおける動画像データを処理して、複数の動き補償された動画像データセグメントを生成することができる。
さらに、動画像符号化方法は、セグメントにおける各重み付きパラメータについて、セグメントにおける重み付きパラメータと、以前のセグメントにおける重み付きパラメータとの間の差分を含む当該セグメントにおける重み付きパラメータ差分値を計算し、符号化プロセスは、セグメントにおける差分データ、セグメントにおける動きデータ、及びセグメントにおける重み付きパラメータ差分値を符号化することを含むことができる。
セグメントにおける各差分値は、
少なくとも1つの以前の近傍セグメントにおける重み付きパラメータからセグメントにおける予測重み付きパラメータを予測することと、
重み付きパラメータ計算プロセスによって計算された重み付きパラメータと予測重み付きパラメータとの間の差分を計算することと
によって生成することができる。
コスト関数J(o,w)
Figure 2013505615
を最小にするオフセット(o)及び加重(w)を計算することができ、ここで、oはオフセットであり、wは加重であり、Dはセグメントにおける重み付き動き補償データとセグメントにおける動画像データとの間の差分を含む歪み測定値であり、Rは符号化データレートの測定値であり、λはラグランジュ乗数であり、
上記計算は、
a)歪み測定値Dの最小値を表すようなオフセット値と加重値とのペアを規定する、オフセット−加重空間における直線を計算することと、
b)オフセット及び加重のうちの一方を第1の探索パラメータとして選択し、他方を第2の探索パラメータとして選択することと、
c)第1の探索パラメータの大域範囲を選択することと、
d)選択された大域範囲から第1の探索パラメータの値を選択すること、
e)第2の探索パラメータの局所探索範囲を選択することと、
f)第1の探索パラメータの選択された定数値について、局所探索範囲内における直線の付近で探索し、その領域においてJ(o,w)の最小値を与える第2の探索パラメータの値を特定することと、
g)第1の探索パラメータの様々な定数値について手順d)〜f)を繰り返し、J(o,w)の全体最小値を与えるオフセット値及び加重値の組合せを見つけることと
による。
Figure 2013505615
が成立する間、局所探索範囲内において継続的に増大するか又は継続的に減少する第1の探索パラメータの値が試されるようにプロセスf)を実行することができ、ここで、ΔDは歪み測定値における変化であり、ΔRはレート測定値における変化である。
また、本発明は、画像のシーケンスを規定する予測符号化された動画像データを復号するように動作可能な動画像復号器も提供する。各画像は複数のセグメントに分割され、当該復号器は:
符号化された動画像データを復号して、画像のセグメントにおける復号された差分データと、セグメントにおける復号された動きデータと、セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータとを生成するように動作可能な復号器であって、重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にする重み付きパラメータである、復号器と、
動きデータ及び以前に復号された動画像データを処理して、セグメントにおける動き補償された動画像データを生成するように動作可能な動き補償データ生成器と、
セグメントにおける動き補償された動画像データと、セグメントにおけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータと結合することによって、セグメントにおける予測動画像データを生成するように動作可能な予測データ生成器であって、セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータとは異なる、予測データ生成器と、
セグメントにおける復号された差分データとセグメントにおける予測動画像データとを結合するように動作可能なデータ結合器と
を備える。
また、本発明は、画像のシーケンスを規定する動画像データを予測符号化するように動作可能な動画像符号化器も提供する。各画像は複数のセグメントに分割され、当該符号化器は:
セグメントの動画像データを処理して、セグメントにおける動きデータ及び動き補償された動画像データを生成するように動作可能な動き補償データ生成器と、
セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータを計算するように動作可能な重み付きパラメータ計算器であって、重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にするものであり、セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータとは異なる、重み付きパラメータ計算器と、
動き補償された動画像データと重み付きパラメータとを結合して、セグメントにおける重み付き動き補償データを生成するように動作可能な重み付き動き補償データ生成器と、
セグメントにおける動画像データとセグメントにおける重み付き動き補償データとの間の差分を定義する差分データを生成するように動作可能な差分データ生成器と、
セグメントにおける差分データ、セグメントにおける動きデータ、及びセグメントにおける重み付きパラメータを含む、セグメントのデータを符号化するように動作可能な符号化器と
を備える。
さらに、本発明は、プログラム可能な処理装置を動画像復号方法又は動画像符号化方法を実行するように動作可能になるようプログラムするためのコンピュータプログラム命令を保持するストレージ媒体又は信号を含むコンピュータプログラム製品も提供する。
次に、本発明の実施形態を、添付の図面を参照して例としてのみ説明する。
一実施形態における動画像復号器のブロック図である。 一実施形態における動画像符号化器のブロック図である。 動き推定におけるマッチングされるブロックと候補ブロックの一例である。 範囲−10,...,10において(oqi,wqi)についてプロットされた歪み関数D(o,w)の一例である。 ラグランジュコストのレート部分のプロット例である。 全体ラグランジュコスト(歪み及びレートが結合されている)のプロットである。 ラグランジュの大域最小の局所探索の2つの例である。 一実施形態において符号化器によって実行される、重み付きパラメータを計算するための処理動作を示すフローチャートである。
好ましい実施形態では、重み付き予測が行われる画像セグメントは、H.264/MPEG−4 AVCにおいて規定されるようなマクロブロックである。この文脈において、本明細書において説明される手法は、MBWP(マクロブロック重み付き予測)と呼ばれる。表記をより簡単にするために、MBWPは一方向予測の場合(例えばH.264/MPEG−4 AVCにおけるP画像)についてのみ示され、複数画像を参照する一般化の検討は必要な場合に論議される。この場合、MBWPは、
Figure 2013505615
で定義することができる。ここで、MBc’は復号されたマクロブロックであり、サブペル(sub-pel)精度の動きベクトルの場合には、補間によって取得されるか、又は以前に復号された画像から直接に取得される。oは加算オフセット重み付きパラメータであり、wは乗算加重重み付きパラメータである(これ以降、それぞれ単にオフセット及び加重と呼び、用語「重み付きパラメータ」は双方を包含するものとする)。MBpは結果としての予測信号であり、現在のマクロブロックを予測するのに用いられる。
代替的な実施形態では、重み付きプロセスは、マクロブロック内のより小さなブロック(例えばH.264/MPEG−4 AVC標準規格によって指定されるブロック)について或いはピクセルごとに適応される。
Figure 2013505615
ここで、nは現在処理されているピクセルのインデックスであり、関数f()及びf()はそれぞれ現在のオフセット及び加重を求めるものであり、既に処理したデータ(符号化器において既に符号化されたデータ、又は復号器において既に復号されたデータ)に依存する。例えば、これらは以前に処理された予測信号サンプルMBc’(0),...,MBc’(n−1)、以前に取得した予測信号サンプルMBp(0),...,MBp’(n−1)等の値とすることができる。1つの特定の例では、乗法加重の適用によって一般に非整数値が得られるので、この関数では重み付き予測によって与えられた結果の適応丸め処理を実行してもよい。
予測信号は復号された差分信号MBr’に付加され、現在のマクロブロックMB’が以下のように再構築される。
Figure 2013505615
復号器
図1には、MBWPを組み込んだ復号器の図が示されている。現在のマクロブロックの入力ストリームは、エントロピー復号器10によってエントロピー復号され、結果として以下のデータ:現在のマクロブロックの量子化されて変換されたサンプル12、動きベクトル14、及び重み付きパラメータ16が生成される。これらのうちの全て及び任意のものは、以前に復号されたデータからの減算によって取得される差分信号とすることができる。この場合、予測を行う必要があり、例えば図1に示すように、重み付きパラメータは、以前に復号された重み付きパラメータから予測され、動きベクトルに対しても同様に行われる。次に、復号された動きベクトル及び以前に復号された基準信号を用いて動き補償が実行される。続いて、そのような動き補償信号は、加重及びオフセットを適用することによって変更される。逆量子化器20による逆量子化及び逆空間変換器30による逆空間変換によって残差マクロブロック信号が取得された後、重み付き予測信号が付加され、復号されたマクロブロックサンプルが取得される。
したがって、上記から、エントロピー復号器10、逆量子化器20、及び逆変換器30は、複合器として動作し、セグメントにおける符号化された差分データMBr’、セグメントにおける動きデータ14、及びセグメントにおける重み付きパラメータ16を生成して、画像のセグメントにおける符号化された動画像データを復号することが理解されよう。動きベクトル予測器40、加算器42、及び動き補償器60は、動き補償データ生成器としての役割を果たし、動きデータ14を以前に復号された動画像データとともに処理して、セグメントにおける動き補償された動画像データMBc’を生成する。重み付きパラメータ予測器50、加算器52、乗算器70、及び加算器80は、予測データ生成器としての役割を果たし、セグメントにおける動き補償された動画像データMBc’をセグメントにおける重み付きパラメータと結合することによって、セグメントにおける予測動画像データMBpを生成する。上述したように、セグメントにおける重み付きパラメータは、同一画像内の異なるセグメントごとに異なる重み付きパラメータを用いることができる。加算器90は、データ結合器としての役割を果たし、セグメントにおける復号された差分データMBr’とセグメントにおける予測動画像データMBpとを結合し、それによって、セグメントにおける復号された全体動画像データMB’を生成する。
好ましい実施形態では、重み付き予測はルマ要素についてのみ規定される。一方、代替的な実施形態では、重み付き予測は、同一又は別個の重み付きパラメータのセットを用いることによって、クロマ要素にも適用することができる。
別の代替的な実施形態では、MBWPパラメータは、大域的に規定された重み付きパラメータからの特定のマクロブロックの重み付きパラメータの差分として伝達することもできる。
MPEG−4 AVC/H.264に類似した構造を有するコーデックに適用されるとき、MBWPに必要なシグナリングは、以前のコーデックにおけるスライス(画像)ヘッダの代わりに、動画像ビットストリームのマクロブロックヘッダ部分内に配置される追加情報を用いて達成される。第1の実施形態では、必要とされる動画像ビットストリーム構文要素は以下である。
Figure 2013505615
MBWP_parameters_present_flagが1である場合、MBWPパラメータの存在をシグナリングする。このフラグが0である場合、重み付き予測は実行されず、MBWPoパラメータ及びMBWPwパラメータはデフォルト値にセットされる。デフォルト値が適用される場合、それらはMBWPを実行しないのと等しい値になるように定義される。代替的な実施形態では、MBWPが画像の広範囲のエリアにおいて利用されない場合の冗長性を回避するために、ランレングス符号化又は四分木符号化を用いることによって、複数のマクロブロックにわたって複数のフラグを連結して符号化することもできる。
MBWPo_difference及びMBWPw_differenceは、予測オフセット値及び予測加重値からの差分信号であり、重み付きパラメータであるMBWPo及びMBWPwの導出は、後述のように行われる。好ましい実施形態では、これらの差分信号のエントロピー符号化には可変長符号化が用いられるが、代替的には、任意の他のエントロピー符号化方法、例えば算術的符号化を用いることもできる。代替的な実施形態では、エントロピー符号化方法の効率を改善するために、以前に復号された構文要素の値をエントロピー符号化方法で用いることもできる。
予測演算predict_MBWPo()及びpredict_MBWPw()は、重み付きパラメータの近傍マクロブロックからの空間予測を伴う。好ましい実施形態では、現在の画像内のr行c列に位置する現在のマクロブロックの重み付きパラメータの予測のために、最上部から1番近傍のマクロブロック(現在と同じ列で前の行)と左から1番近傍(以前に符号化されている)との平均化が用いられる。
Figure 2013505615
ここで、[・]は最も近い整数への丸め処理を表す。この予測は、様々な形で変更することができることに留意されたい。この予測には、2つよりも多い若しくは2つよりも少ない近傍マクロブロックを利用することもできるし、かつ/又は、予測演算子における重み付きを用いることもできるし、或いは、例えば中央値のような種々の演算を用いることもできる。代替的な実施形態では、現在のマクロブロックのオフセット値は、以前に復号された重み付きパラメータと併せて、同じマクロブロックの加重パラメータを予測するのに用いられる。別の代替的な実施形態では、重み付きパラメータの予測は、他の以前に復号された構文要素を用いる。1つの例では、現在復号されているマクロブロックの動きベクトルの値と以前に復号されたマクロブロックの動きベクトルの値とが比較され、当該比較結果を用いて、現在のマクロブロックの重み付きパラメータの導出のために以前に復号された重み付きパラメータを用いるかどうかを判定する。例えば、2つの動きベクトルの間の差分が大きい場合、対応するマクロブロックの重み付きパラメータは、現在のマクロブロックの重み付きパラメータの予測には用いられない。1つのオプションとしては、予測演算を一切省くことであり、その場合、predict_MBWPo()及びpredict_MBWPw()の結果は0になることにも留意されたい。以降において、行インデックス及び列インデックスは省略され、各ステップは、現在のマクロブロックに対して動作するものとして理解されたい。
パラメータは、当該パラメータをビットストリーム内で効率的に送信するために量子化される。ここでは、128の均一な量子化ステップが用いられるが、他の量子化ステップ及び量子化方式も可能である。オフセットパラメータ及び加重パラメータは、以下のように量子化される。
Figure 2013505615
符号化される整数値oqi及びwqiは、以下のようにして得られる。
Figure 2013505615
そのため、逆マッピングは、以下のように定義される。
Figure 2013505615
デフォルトの非重み付き予測値は、o=0(oqi=0)及びw=1(wqi=0)である。
上記で提示したような量子化方式を用いると、値oqi及びwqiは、(o,w)=(0,1)からの差分の絶対値が増大するのに伴って増大する。実際には大部分の重み付きパラメータは(0,1)に近いので、この性質は、後続のエントロピー符号化において、より小さい絶対値のoqi及びwqiに対してより短い符号を割り当てるのに利用される。他の量子化方式として、例えば、重みに不均一なステップサイズを用いることによって、圧縮性能の利益がもたらされる値の範囲内においてより高い精度を達成することができる。
値oqi及びwqiは、上記の構文記述においては、MBWPo及びMBWPwで直接に表される。このとき、重み付き予測は以下のように書くことができる。
Figure 2013505615
続いて、得られた値は、画像サンプルの規定の範囲にクリップされる。重み付き予測のプロセスは、除算をビットシフト演算子に置き換えることによって、除算なし整数保障(division-free integer-safe)演算として容易に実施することができることは留意するに値する。
符号化器
次に、符号化プロセスにおいて最適又は準最適のオフセットパラメータ及び加重パラメータを導出する高速方法を実行する、符号化器の一実施形態を説明する。符号化プロセスの全体におけるこの手順(MBWPパラメータの導出)の位置が、図2に示されている。
図2を参照すると、動き推定器210及び動き補償器220は、動き補償データ生成器としての役割を果たし、セグメントの動画像データMBを処理して当該セグメントにおける動きデータ(本実施形態においては動きベクトルを含む)を生成し、当該動きデータをセグメントの動画像データに適用して、当該セグメントにおける動き補償された動画像データを生成する。重み付きパラメータ計算器200は、セグメントにおける重み付きパラメータを計算する重み付きパラメータ計算器としての役割を果たし、上述したように、セグメントにおける重み付きパラメータは、同一画像内の異なるセグメントごとに異なる重み付きパラメータを用いることができる。乗算器230及び加算器240は、重み付き動き補償データ生成器としての役割を果たし、動き補償された動画像データと重み付きパラメータを結合して、セグメントにおける重み付き動き補償データMBpを生成する。加算器250は、差分データ生成器としての役割を果たし、セグメントにおける入力動画像データMBと重み付き動き補償データMBpとの間の差分を定義する差分データMBrを生成する。変換器260、量子化器270、及びエントロピー符号化器320は、符号化器としての役割を果たし、セグメントにおける差分データMBr、セグメントにおける動きデータ、及びセグメントにおける重み付きパラメータを含む、セグメントのデータを符号化する。このデータは、上記で説明した復号器に送信されて復号されるデータである。
MBWPパラメータの高速導出の手順は、3つのステップに分割される。これらのステップを以下に説明する。より簡単に表現するために、単一の基準画像MBWPに基づくものを説明するが、提示された関係及びアルゴリズムステップを直接拡張したものとして、同じ着想を複数の基準画像の場合にも適用することができる。説明される方法は単一マクロブロックのマッチングに適用されるものであり、動き推定プロセスと無関係であるため、MBWPが試される動きベクトルの選択についてはここでは論じない。
1.歪み最適重み付きパラメータを見つける
このステップでは、符号化コストの歪み部分についてのみの最適重み付き予測パラメータを見つける。
2つのマクロブロック間のLノルムの形態で歪みを最小にするために、オフセット及び加重を最適化変数として用いて、以下の式を最適化する必要がある。
Figure 2013505615
式を簡単化するために、以下のように定義する。
Figure 2013505615
ここで、MBは現在のブロックであり、Nはマクロブロック内のピクセル数である。このとき、歪みの式は以下となる。
Figure 2013505615
この対応する最小化問題は、線形最小二乗最適化問題としてモデル化され、以下の関係を用いて表される。
Figure 2013505615
o及びwについて偏微分することで以下が得られる。
Figure 2013505615
これら2つをo及びwについて解くと、以下が得られる。
Figure 2013505615
しかしながら、パラメータo、w、及び重み付きの演算が量子化されることに起因して、この問題は従来の最小二乗適合と幾分異なるものとなり、整数最小二乗推定(integer least squares estimation)として大別することができる。この問題はNP困難(すなわち、実際の時間量において最適なパラメータを求めるのが不可能)であることが知られており、そのために何らかの高速近似が必要とされる。
ここで、歪みの式は、o及びwの関数として書くことができる。
Figure 2013505615
以下において一例を与える。この例では、図3に示す2つのブロックが選択され、上記で定義した関数が当該ブロックについて図4にプロットされる。
最小歪み点の計算によって(省略表現による変数A、B、C、D、Eを導入する)、以下が得られる。
Figure 2013505615
ここで、上記の関係における分母はXの分散に等しく、すなわち
Figure 2013505615
である。計算された値は、図3のブロック例に対応する。σ=0(定数値X)の場合、wmin=1及びomin=D−Bが定義される。この表記を用いて、歪みの関係を、一般的な二変量二次曲線の形式で書くことができる。
Figure 2013505615
また、(25)を(26)に代入すると、
Figure 2013505615
となる。
2.レート制約付きコスト式
このステップでは、表現歪み及び符号化コストの双方を考慮に入れて、レート制約付きラグランジュコストの完全な関係が導出される。
以下において、MBWPパラメータの符号化のために指数ゴロムエントロピー符号化が用いられるが、正確なコード長又は概算のコード長がコスト推定器に利用可能であるという要件のもとに、他の方式を用いることも可能である。1つの例は、コンテキスト適応型二値算術コーディング(CABAC:Context Adaptive Binary Arithmetic Coding)である。符号化されるデータがxとして表される場合、関連する指数ゴロムコードの長さR(x)は、以下のように定義される。
Figure 2013505615
このとき、非予測的MBWPパラメータ符号化のための、MBWP符号化のレート制約付きの式を、ラグランジュ乗数形式で書くことができる。
Figure 2013505615
ここで、R(o,w)は、点(oqi,wqi)においてのみ定義される。これと等価な式は、動き推定において動きベクトル場を正規化する目的で用いられている。ここで、同じ原理をMBWPに拡張することができ、MBWPのパラメータはMV情報への拡張として理解することができる。より具体的には、MV情報を(29)及び(20)に追加して、例えば以下のように連結MV−MBWPコストを得ることができる。
Figure 2013505615
ここで、mvは動きベクトルであり、動きベクトルのラグランジュ乗数λMVと重み付きパラメータのラグランジュ乗数λWPとは、通常は異なるものとすることができる。このコストは、選択がマクロブロックモード選択に先だって行われる場合に、動きベクトルと重み付きパラメータの連結対を比較する際に用いられる。
予測値がその原点内にあるようにoqi−wqi空間を再定義することからなる補正を行えば、MBWPパラメータの予測的符号化の式も同様となる。
図4〜図6において一例が与えられる。この例においては、2つのブロックが選択され、それらについて上記で定義された関数がプロットされている。
3.大域最小コストの局所探索
このステップにおいて、整数グリッド上におけるラグランジュの大域最小値を見つけるために、レートコストの減少方向において局所探索が実行される。
図4〜図6から、ラグランジュコストのレート部分が大域最小値の位置に影響を与える可能性があることは明らかである。レート部分の影響は、操作しているラグランジュ乗数に強く依存し、ビットレートが低くなるほど(λWPが大きくなるほど)強くなる。重み付き操作における丸め処理操作の影響はこの段階では考慮されておらず、MBWPパラメータの量子化のみが考慮されていることに留意されたい。
歪み関数のみが考慮される場合、ラグランジュコスト関数のレート部分は、大域最小値の位置をその位置から効果的に動かし、またラグランジュコストの関係は非解析的である(大域最小値の式を導出することができない)ため、大域最小値の位置を特定する他の何らかの方法が必要とされる。各(oqi,wqi)のペアについてJ(o,w)を計算することを回避するために、oqi−wqi空間において、レート及び歪み成分の関数の特性を利用する局所探索が行われる。それによって、歪み(26)は、全ての可能な(oqi,wqi)の中の小さなサブセットについてのみ計算すればばよくなる。また、指数ゴロム以外にも、最も短い符号語を有する座標(例えば(0,0))からの距離とともに厳密に増大する同じレート特性を有する他の何らかの符号化法を用いることもできることに留意されたい。
図5において、探索は、定数wについての最小歪み直線の周囲のコストを計算する。この直線は、(21)を用いることによって見つけることができ、
Figure 2013505615
で定義される。
探索は様々なwにわたってループし、各wについて、直線(32)の周囲の或る特定の範囲のパラメータoにおけるコストが、軸wの方向(レートコストの減少方向)に計算される。直線(32)は、点w=D/Bにおいてw軸(ここでo=0)と交差することが見て取れる。この点は探索を2つのセグメントに分割する。一方のセグメントは、増加するo(点w>w)にわたってループし、他方のセグメントは、減少するo(点w<w)にわたってループする。このとき、検索アルゴリズムの一般形式は、以下のように書くことができる。
重みパラメータ探索ウィンドウ[wstart,wend]を見つけ、Jmin=∞にセットする。
w=wstart〜wendについて
end=0
w>wの場合
Figure 2013505615
そうでない場合
Figure 2013505615
o=ostart〜oendについて
J(o,w)<Jminの場合、Jmin=J(o,w)
コストの低減が期待できない場合、中止
上記において、
Figure 2013505615
は床関数であり、
Figure 2013505615
は天井関数である。特に、変数wがwよりも大きく、w軸の左側にある最小歪み直線の部分(全て負のオフセット)に対応するとき、切捨てが実行される。探索方向は任意であることに留意されたい。
好ましい実施形態では、コストを低減する確率の条件は、ΔD(o,w)<−λ・ΔR(o+1,w)の関係を満たすレート及び歪みの勾配で表すことができる。この関係は、ΔD(o,w)が厳密に非減少であり、またΔR(o+1,w)が0又は何らかの固定の負値(例えば、指数ゴロム符号化の場合−2ビット)となるように、局所探索がオフセット座標を訪れるように構築される。この探索におけるオフセットと加重の役割は逆にすることもできること、及びその場合、定数oの最小歪み直線の周囲の探索が用いられることに留意されたい。
図8は、好ましい実施形態において、オフセット及び加重を計算するために符号化器によって実行される、上述した処理動作を要約するフローチャートである。
4.重み付きパラメータの量子化を考慮
量子化されたMBWPパラメータにおける大域歪み最小値の位置の曖昧性を考慮に入れるために、この最小値の潜在位置を包含するように探索範囲が拡張される。この目的のために、定歪み楕円を以下のように定義することができる。
Figure 2013505615
ここで、Dは選択された歪みである。必要な条件に代入することによってこの楕円をチェックすることができ、条件
Figure 2013505615
及びDmin<Dが満たされなくてはならないことになる。ここで、Dは、少なくとも1つの(oqi,wqi)座標を含む限り任意に選ぶことができるが、Dminに近い方がよい。なぜならば、楕円が小さくなり、探索ループにおいて訪れる必要のある潜在的整数最小値の捕捉数が少なくなるためである。ここで、Dは大域最小値に最も近い点における歪み
Figure 2013505615
を計算することによって選択される。次に、そのような楕円の極値oの座標が見つけられ、探索の開始点及び終了点をセットするときに用いられる。
Figure 2013505615
e1及びoe2に対応する加重値を用いて、範囲[wstart,wend]がそれらを含むようにwstart及びwendを変更する。2つの別個の例示的な事例の探索手順を図7に示している。
変更及び変形
上述した実施形態に対して、多くの変更及び変形を行うことができることが理解されよう。
特に、上述した復号器及び符号化器の構成要素は、ハードウェア構成要素を含んでいるが復号器及び/又は符号化器はソフトウェア及び/又はファームウェアを用いて実装することもできる。同様に、復号器及び/又は符号化器は、ハードウェア及びソフトウェア/ファームウェア構成要素の組合せを含むこともできる。したがって、本発明の一実施形態は、プログラム可能な処理装置を、上述した処理動作を実行するように動作可能になるようにプログラムするためのコンピュータプログラム命令を保持するストレージデバイス又は信号の形式のコンピュータプログラム製品を含む。

Claims (19)

  1. 画像のシーケンスを規定する予測符号化された動画像データを復号するように動作可能な動画像復号器であって、各画像は複数のセグメントに分割され、該復号器は:
    前記符号化された動画像データを復号して、画像のセグメントにおける復号された差分データと、該セグメントにおける復号された動きデータと、該セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む復号された重み付きパラメータとを生成するように動作可能な復号器であって、前記重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にする重み付きパラメータである、復号器と、
    前記動きデータ及び以前に復号された動画像データを処理して、前記セグメントにおける動き補償された動画像データを生成するように動作可能な動き補償データ生成器と、
    前記セグメントにおける前記動き補償された動画像データと、前記セグメントにおける前記オフセット重み付きパラメータ及び加重重み付きパラメータを含む前記重み付きパラメータと結合することによって、前記セグメントにおける予測動画像データを生成するように動作可能な予測データ生成器であって、前記セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータとは異なる、予測データ生成器と、
    前記セグメントにおける前記復号された差分データと前記セグメントにおける前記予測動画像データとを結合するように動作可能なデータ結合器と
    を備える、画像のシーケンスを規定する予測符号化された動画像データを復号するように動作可能な動画像復号器。
  2. 前記復号器は、前記符号化された動画像データを復号して、複数のセグメントのそれぞれにおいて、加重重み付きパラメータを生成するように動作可能であり、
    前記動き補償データ生成器は、前記複数のセグメントにおける前記動きデータ及び前記以前に復号された動画像データを処理して、前記複数のセグメントのそれぞれにおいて、動き補償された動画像データを生成するように動作可能であり、
    前記予測データ生成器は、前記複数のセグメントのそれぞれにおいて、前記動き補償された動画像データと前記加重重み付きパラメータとを結合して、前記予測動画像データを生成するように動作可能である、請求項1に記載の動画像復号器。
  3. 前記動き補償データ生成器は、異なる各画像内の複数のセグメントにおいて、前記動きデータ及び前記以前に復号された動画像データを処理して、前記複数のセグメントのそれぞれにおいて、前記動き補償された動画像データを生成するように動作可能である、請求項2に記載の動画像復号器。
  4. 前記復号器は、前記符号化された動画像データを復号して前記重み付きパラメータの差分データを生成するように動作可能であり、
    前記予測データ生成器は、前記復号器からの前記重み付きパラメータと、以前に復号したセグメントにおいて導出された以前に復号された重み付きパラメータとの前記差分データを用いて、前記セグメントにおける重み付きパラメータを導出することによって、前記セグメントにおける前記予測動画像データを生成するように動作可能である、請求項1〜3のいずれか一項に記載の動画像復号器。
  5. 前記予測データ生成器は、
    以前に復号された少なくとも1つの近傍セグメントにおける重み付きパラメータから前記セグメントにおける重み付きパラメータを予測することと、
    前記予測重み付きパラメータと前記復号器からの前記重み付きパラメータとを結合して、結果としての予測重み付きパラメータを生成することと、
    前記セグメントにおける前記動き補償された動画像データと前記結果としての予測重み付きパラメータとを結合して、前記セグメントにおける前記予測動画像データを生成することと
    によって、前記セグメントにおける前記予測動画像データを生成するように動作可能である、請求項4に記載の動画像復号器。
  6. 前記予測データ生成器は、以前に復号された少なくとも2つの近傍セグメントにおける重み付きパラメータの平均を計算することによって、前記セグメントにおける前記重み付きパラメータを予測するように動作可能である、請求項5に記載の動画像復号器。
  7. 前記予測データ生成器は、
    前記セグメントにおける前記動きデータと、少なくとも1つの以前に復号されたセグメントにおける動きデータとを比較して、該動きデータ間の類似度の測定値を求め、
    前記求められた測定値が高い類似度を示している場合には、前記少なくとも1つの以前に復号されたセグメントにおける前記重み付きパラメータを用いて、前記セグメントにおける予測重み付きパラメータを生成し、前記動き補償されたビデオデータと該予測重み付きパラメータとを結合するように動作可能である、請求項1〜6のいずれか一項に記載の動画像復号器。
  8. 前記復号器は、前記符号化された動画像データを復号して前記オフセット重み付きパラメータ及び前記加重重み付きパラメータを生成し、前記オフセット重み付きパラメータの値がより少ないビットで表されるほど、該値がゼロに近づくようにし、また、前記加重重み付きパラメータの値がより少ないビットで表されるほど、該値が1に近づくようにするよう動作可能である、請求項1〜7のいずれか一項に記載の動画像復号器。
  9. 画像のシーケンスを規定する動画像データを予測符号化するように動作可能な動画像符号化器であって、各画像は複数のセグメントに分割され、該符号化器は:
    セグメントの動画像データを処理して、該セグメントにおける動きデータ及び動き補償された動画像データを生成するように動作可能な動き補償データ生成器と、
    前記セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータを計算するように動作可能な重み付きパラメータ計算器であって、前記重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にするものであり、前記セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータとは異なる、重み付きパラメータ計算器と、
    前記動き補償された動画像データと前記重み付きパラメータとを結合して、前記セグメントにおける重み付き動き補償データを生成するように動作可能な重み付き動き補償データ生成器と、
    前記セグメントにおける前記動画像データと前記セグメントにおける前記重み付き動き補償データとの間の差分を定義する差分データを生成するように動作可能な差分データ生成器と、
    前記セグメントにおける前記差分データ、前記セグメントにおける前記動きデータ、及び前記セグメントにおける前記重み付きパラメータを含む、前記セグメントのデータを符号化するように動作可能な符号化器と
    を備える、画像のシーケンスを規定する動画像データを予測符号化するように動作可能な動画像符号化器。
  10. 前記重み付きパラメータ計算器は、複数のセグメントのそれぞれにおいて、加重重み付きパラメータを計算するように動作可能であり、
    前記動き補償データ生成器は、1つのセグメント及び複数の異なるセグメントにおける前記動画像データを処理して、複数の動き補償された動画像データセグメントを生成するように動作可能であり、
    前記重み付き動き補償データ生成器は、前記複数の動き補償された動画像データセグメントと前記複数の加重重み付きパラメータとを、該複数の動き補償された動画像データセグメントのそれぞれが該複数の加重重み付きパラメータのそれぞれによって重み付けされるように結合することによって、前記重み付き動き補償データを生成するように動作可能である、請求項9に記載の動画像符号化器。
  11. 前記動き補償データ生成器は、異なる各画像内のセグメント及び複数のセグメントにおける前記動画像データを処理して、前記複数の動き補償された動画像データセグメントを生成するように動作可能である、請求項10に記載の動画像符号化器。
  12. 前記セグメントにおける各重み付きパラメータについて、該セグメントにおける該重み付きパラメータと、以前のセグメントにおける重み付きパラメータとの間の差分を含む該セグメントにおける重み付きパラメータ差分値を計算するように動作可能な重み付きパラメータ差分計算器を更に備え、
    前記符号化器は、前記セグメントにおける前記差分データ、前記セグメントにおける前記動きデータ、及び前記セグメントにおける前記重み付きパラメータ差分値を含む、前記セグメントのデータを符号化するように構成される、請求項9〜11のいずれか一項に記載の動画像符号化器。
  13. 前記重み付きパラメータ差分計算器は、
    少なくとも1つの以前の近傍セグメントにおける重み付きパラメータから前記セグメントにおける予測重み付きパラメータを予測することと、
    前記重み付きパラメータ計算器によって計算された前記重み付きパラメータと前記予測重み付きパラメータとの間の差分を計算することと
    によって、前記セグメントにおける各差分値を生成するように動作可能である、請求項12に記載の動画像符号化器。
  14. 前記重み付きパラメータ計算器は、コスト関数J(o,w)
    Figure 2013505615
    を最小にするオフセット重み付きパラメータ及び加重重み付きパラメータを計算するように構成され、ここで、oはオフセットであり、wは加重であり、Dは前記セグメントにおける前記重み付き動き補償データと前記セグメントにおける前記動画像データとの間の差分を含む歪み測定値であり、Rは符号化データレートの測定値であり、λはラグランジュ乗数であり、
    前記計算は、
    a)前記歪み測定値Dの最小値を表すようなオフセット値と加重値のペアを規定する、オフセット−加重空間における直線を計算することと、
    b)前記オフセット及び前記加重のうちの一方を第1の探索パラメータとして選択し、他方を第2の探索パラメータとして選択することと、
    c)前記第1の探索パラメータの大域範囲を選択することと、
    d)前記選択された大域範囲から前記第1の探索パラメータの値を選択することと、
    e)前記第2の探索パラメータの局所探索範囲を選択することと、
    f)前記第1の探索パラメータの前記選択された定数値について、前記局所探索範囲内における前記直線の付近を探索し、その領域においてJ(o,w)の最小値を与える前記第2の探索パラメータの値を特定することと、
    g)前記第1の探索パラメータの様々な定数値について手順d)〜f)を繰り返し、J(o,w)の全体最小値を与えるオフセット値及び加重値の組合せを見つけることと
    による、請求項9〜13のいずれか一項に記載の動画像符号化器。
  15. 前記重み付きパラメータ計算器は、
    Figure 2013505615
    が成立する間、前記局所探索範囲内において継続的に増大するか又は継続的に減少する前記第1の探索パラメータの値が試されるようにプロセスf)を実行するように構成され、ここで、ΔDは歪み測定値における変化であり、ΔRはレート測定値における変化である、請求項14に記載の動画像符号化器。
  16. 画像のシーケンスを規定する予測符号化された動画像データを復号する動画像復号方法であって、各画像は複数のセグメントに分割され、該方法は:
    前記符号化された動画像データを復号して、画像のセグメントにおける復号された差分データと、該セグメントにおける復号された動きデータと、該セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む復号された重み付きパラメータとを生成するステップであって、前記重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にする重み付きパラメータである、ステップと、
    前記動きデータ及び以前に復号された動画像データを処理して、前記セグメントにおける動き補償された動画像データを生成するステップと、
    前記セグメントにおける前記動き補償された動画像データと、前記セグメントにおけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータと結合することによって、前記セグメントにおける予測動画像データを生成するステップであって、前記セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータとは異なる、ステップと、
    前記セグメントにおける前記復号された差分データと前記セグメントにおける前記予測動画像データとを結合するステップと
    を含む、画像のシーケンスを規定する予測符号化された動画像データを復号する動画像復号方法。
  17. 画像のシーケンスを規定する動画像データを予測符号化する動画像符号化方法であって、各画像は複数のセグメントに分割され、該方法は:
    セグメントの動画像データを処理して、該セグメントにおける動きデータ及び動き補償された動画像データを生成するステップと、
    前記セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータを計算するステップであって、該重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にするものであり、前記セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータと異なる、ステップと、
    前記動き補償された動画像データと前記重み付きパラメータとを結合して、前記セグメントにおける重み付き動き補償データを生成するステップと、
    前記セグメントにおける前記動画像データと前記セグメントにおける前記重み付き動き補償データとの間の差分を定義する差分データを生成するステップと、
    前記セグメントにおける前記差分データ、前記セグメントにおける前記動きデータ、及び前記セグメントにおける前記重み付きパラメータを含む、前記セグメントのデータを符号化するステップと
    を含む、画像のシーケンスを規定する動画像データを予測符号化する動画像符号化方法。
  18. プログラム可能な処理装置を画像のシーケンスを規定する予測符号化された動画像データを復号する動画像復号方法を実行するように動作可能になるようプログラムするためのコンピュータプログラム命令を保持するコンピュータプログラム製品であって、各画像は複数のセグメントに分割され、前記方法は:
    前記符号化された動画像データを復号して、画像のセグメントにおける復号された差分データと、該セグメントにおける復号された動きデータと、該セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む復号された重み付きパラメータとを生成するステップであって、前記重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にする重み付きパラメータである、ステップと、
    前記動きデータ及び以前に復号された動画像データを処理して、前記セグメントにおける動き補償された動画像データを生成するステップと、
    前記セグメントにおける前記動き補償された動画像データと、前記セグメントにおけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータと結合することによって、前記セグメントにおける予測動画像データを生成するステップであって、前記セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータとは異なる、ステップと、
    前記セグメントにおける前記復号された差分データと前記セグメントにおける前記予測動画像データとを結合するステップと
    を含む、プログラム可能な処理装置を画像のシーケンスを規定する予測符号化された動画像データを復号する動画像復号方法を実行するように動作可能になるようプログラムするためのコンピュータプログラム命令を保持するコンピュータプログラム製品。
  19. プログラム可能な処理装置を画像のシーケンスを規定する動画像データを予測符号化する動画像符号化方法を実行するように動作可能になるようプログラムするためのコンピュータプログラム命令を保持するコンピュータプログラム製品であって、各画像は複数のセグメントに分割され、前記方法は:
    セグメントの動画像データを処理して、該セグメントにおける動きデータ及び動き補償された動画像データを生成するステップと、
    前記セグメントの重み付き予測におけるオフセット重み付きパラメータ及び加重重み付きパラメータを含む重み付きパラメータを計算するステップであって、該重み付きパラメータは、表現歪み及び符号化コストの双方を考慮したレート制約付きのコスト式を最小にするものであり、前記セグメントにおける少なくとも1つの重み付きパラメータは、同じ画像内の異なるセグメントにおいて用いられる重み付きパラメータと異なる、ステップと、
    前記動き補償された動画像データと前記重み付きパラメータとを結合して、前記セグメントにおける重み付き動き補償データを生成するステップと、
    前記セグメントにおける前記動画像データと前記セグメントにおける前記重み付き動き補償データとの間の差分を定義する差分データを生成するステップと、
    前記セグメントにおける前記差分データ、前記セグメントにおける前記動きデータ、及び前記セグメントにおける前記重み付きパラメータを含む、前記セグメントのデータを符号化するステップと
    を含む、プログラム可能な処理装置を画像のシーケンスを規定する動画像データを予測符号化する動画像符号化方法を実行するように動作可能になるようプログラムするためのコンピュータプログラム命令を保持するコンピュータプログラム製品。
JP2012529206A 2009-09-17 2010-09-06 動画像の重み付き動き補償 Pending JP2013505615A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP09170576.4 2009-09-17
EP09170576A EP2302933A1 (en) 2009-09-17 2009-09-17 Weighted motion compensation of video
PCT/EP2010/063024 WO2011032852A1 (en) 2009-09-17 2010-09-06 Weighted motion compensation of video

Publications (1)

Publication Number Publication Date
JP2013505615A true JP2013505615A (ja) 2013-02-14

Family

ID=41138739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012529206A Pending JP2013505615A (ja) 2009-09-17 2010-09-06 動画像の重み付き動き補償

Country Status (3)

Country Link
EP (1) EP2302933A1 (ja)
JP (1) JP2013505615A (ja)
WO (1) WO2011032852A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3675497B1 (en) 2011-10-17 2021-12-29 Kabushiki Kaisha Toshiba Encoding method and decoding method
CA3160230A1 (en) 2012-06-27 2014-01-03 Kabushiki Kaisha Toshiba Video encoding and decoding using weighting factor with predetermined bit precision
US9538239B2 (en) * 2012-08-13 2017-01-03 Gurulogic Microsystems Oy Decoder and method for decoding encoded input data containing a plurality of blocks or packets
JP5702011B2 (ja) * 2014-04-07 2015-04-15 株式会社東芝 符号化方法、符号化装置及びプログラム
JP5869160B2 (ja) * 2015-02-16 2016-02-24 株式会社東芝 復号方法、復号装置及びプログラム
US20160277767A1 (en) * 2015-03-16 2016-09-22 Thomson Licensing Methods, systems and apparatus for determining prediction adjustment factors
JP6088036B2 (ja) * 2015-12-22 2017-03-01 株式会社東芝 復号方法、復号装置及びプログラム
JP6235742B2 (ja) * 2017-01-30 2017-11-22 株式会社東芝 電子機器、復号方法及びプログラム
JP6235745B2 (ja) * 2017-02-23 2017-11-22 株式会社東芝 電子機器、復号方法及びプログラム
US10412410B2 (en) 2017-08-14 2019-09-10 Google Llc Compound motion-compensated prediction
JP6396566B2 (ja) * 2017-10-20 2018-09-26 株式会社東芝 電子機器、符号化方法及びプログラム
JP2019009792A (ja) * 2018-08-22 2019-01-17 株式会社東芝 符号化方法、復号方法及び符号化データ
JP6744507B2 (ja) * 2020-01-07 2020-08-19 株式会社東芝 符号化方法および復号方法
JP7000498B2 (ja) * 2020-05-29 2022-01-19 株式会社東芝 記憶装置、送信装置および符号化方法
CN115695812A (zh) * 2021-07-30 2023-02-03 中兴通讯股份有限公司 视频编码、视频解码方法、装置、电子设备和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004120138A (ja) * 2002-09-24 2004-04-15 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
JP2004242276A (ja) * 2002-08-08 2004-08-26 Matsushita Electric Ind Co Ltd 動画像の符号化方法および復号化方法
WO2007081177A1 (en) * 2006-01-12 2007-07-19 Lg Electronics Inc. Processing multiview video
JP2007221201A (ja) * 2006-02-14 2007-08-30 Victor Co Of Japan Ltd 動画像符号化装置及び動画像符号化プログラム
WO2008004940A1 (en) * 2006-07-07 2008-01-10 Telefonaktiebolaget Lm Ericsson (Publ) Video data management
JP2008541502A (ja) * 2005-05-26 2008-11-20 株式会社エヌ・ティ・ティ・ドコモ 動き及び予測の重み付けパラメータを符号化する方法及び装置
WO2009017301A1 (en) * 2007-07-31 2009-02-05 Samsung Electronics Co., Ltd. Video encoding and decoding method and apparatus using weighted prediction
JP2009512347A (ja) * 2005-10-12 2009-03-19 トムソン ライセンシング スケーラブルビデオ符号化及び復号における重み付け予測方法及び装置
JP2009525687A (ja) * 2006-02-02 2009-07-09 トムソン ライセンシング 動き補償予測のための適応重み選択を行う方法および装置
WO2009089032A2 (en) * 2008-01-10 2009-07-16 Thomson Licensing Methods and apparatus for illumination compensation of intra-predicted video

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060055472A (ko) 2003-06-25 2006-05-23 톰슨 라이센싱 변위된 프레임 차분을 이용하여 가중된 예측 추정을 위한방법 및 장치
US8023562B2 (en) * 2007-09-07 2011-09-20 Vanguard Software Solutions, Inc. Real-time video coding/decoding
JP5427785B2 (ja) * 2007-09-28 2014-02-26 ドルビー ラボラトリーズ ライセンシング コーポレイション ビデオ圧縮技法及びビデオ伝達技法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004242276A (ja) * 2002-08-08 2004-08-26 Matsushita Electric Ind Co Ltd 動画像の符号化方法および復号化方法
JP2004120138A (ja) * 2002-09-24 2004-04-15 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
JP2008541502A (ja) * 2005-05-26 2008-11-20 株式会社エヌ・ティ・ティ・ドコモ 動き及び予測の重み付けパラメータを符号化する方法及び装置
JP2009512347A (ja) * 2005-10-12 2009-03-19 トムソン ライセンシング スケーラブルビデオ符号化及び復号における重み付け予測方法及び装置
WO2007081177A1 (en) * 2006-01-12 2007-07-19 Lg Electronics Inc. Processing multiview video
JP2009525687A (ja) * 2006-02-02 2009-07-09 トムソン ライセンシング 動き補償予測のための適応重み選択を行う方法および装置
JP2007221201A (ja) * 2006-02-14 2007-08-30 Victor Co Of Japan Ltd 動画像符号化装置及び動画像符号化プログラム
WO2008004940A1 (en) * 2006-07-07 2008-01-10 Telefonaktiebolaget Lm Ericsson (Publ) Video data management
WO2009017301A1 (en) * 2007-07-31 2009-02-05 Samsung Electronics Co., Ltd. Video encoding and decoding method and apparatus using weighted prediction
WO2009089032A2 (en) * 2008-01-10 2009-07-16 Thomson Licensing Methods and apparatus for illumination compensation of intra-predicted video

Also Published As

Publication number Publication date
WO2011032852A1 (en) 2011-03-24
EP2302933A1 (en) 2011-03-30

Similar Documents

Publication Publication Date Title
US11546627B2 (en) Moving picture decoding method and moving picture encoding method
JP2013505615A (ja) 動画像の重み付き動き補償
KR101528361B1 (ko) 움직임 벡터 예측 부호화 방법, 움직임 벡터 예측 복호 방법, 동화상 부호화 장치, 동화상 복호 장치 및 그들의 프로그램
TWI458356B (zh) 動向量預測編碼方法、動向量預測解碼方法、動畫像編碼裝置、動畫像解碼裝置及其程式
KR20090095012A (ko) 연속적인 움직임 추정을 이용한 영상 부호화, 복호화 방법및 장치
KR20140083063A (ko) 움직임 벡터 예측 부호화 방법, 움직임 벡터 예측 복호 방법, 동화상 부호화 장치, 동화상 복호 장치 및 그들의 프로그램
WO2011124676A1 (en) Weighted motion compensation of video
JP2011199362A (ja) 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
KR20120112723A (ko) 움직임 벡터 예측 부호화 방법, 움직임 벡터 예측 복호 방법, 동화상 부호화 장치, 동화상 복호 장치 및 그들의 프로그램
US20180227592A1 (en) Motion picture encoding device, motion picture encoding method, and storage medium storing motion picture encoding program
CN113055684A (zh) 一种编解码方法、装置及其设备
JP5281597B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
JP5281596B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
JP2020028067A (ja) 画像符号化装置、画像復号装置、及びプログラム
JP4243205B2 (ja) 動画像符号化装置、その方法及びそのプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130702

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131126