JP2005533464A - 加重予測による動き推定 - Google Patents

加重予測による動き推定 Download PDF

Info

Publication number
JP2005533464A
JP2005533464A JP2005505118A JP2005505118A JP2005533464A JP 2005533464 A JP2005533464 A JP 2005533464A JP 2005505118 A JP2005505118 A JP 2005505118A JP 2005505118 A JP2005505118 A JP 2005505118A JP 2005533464 A JP2005533464 A JP 2005533464A
Authority
JP
Japan
Prior art keywords
reference image
motion
weighting factor
image
weighted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005505118A
Other languages
English (en)
Other versions
JP4533841B2 (ja
Inventor
ボイス,ジル,マクドナルド
スタイン,アラン,ジェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2005533464A publication Critical patent/JP2005533464A/ja
Application granted granted Critical
Publication of JP4533841B2 publication Critical patent/JP4533841B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

映像エンコーダ及びデコーダは、画像ブロックに対する映像信号データと、当該画像ブロックを予測するためのある基準画像インデックスとを符号化及び復号化するために備えられ、当該エンコーダは基準画像インデックスに対応する加重係数を示す出力を有する基準画像加重係数セレクタと、基準画像加重係数セレクタに信号通信し、基準画像を重み付けしたものを提供するマルチプレクサと、マルチプレクサに信号通信し、基準画像を重み付けしたものに対応する動きベクトルを提供する動き推定装置とを有し、対応するデコーダは、基準画像インデックスに対応する加重係数を決定するための出力を有する基準画像加重係数ユニットを有する。

Description

発明の詳細な説明
[関連出願の相互参照]
本出願は、そのすべてが参照することによりここに含まれる、2002年7月15日に出願された米国仮特許出願第60/395,874号(代理人整理番号PU020339)「加重予測による動き推定(Motion Estimation With Weighting Prediction)」の優先権を主張するものである。さらに、本出願は、そのすべてが参照することによりここに含まれる、2002年7月15日に出願された米国仮特許出願第60/395,843号(代理人整理番号PU020340)「ビデオCODECにおける基準画像の適応的加重(Adaptive Weighting Of Reference Pictures In Video CODEC)」の優先権を主張するものである。
[発明の技術分野]
本発明は、映像エンコーダ及びデコーダに関し、より詳細には、映像エンコーダ及びデコーダにおける加重予測による統合された動き推定に関する。
[発明の背景]
映像データは、一般にビットストリーム形式により処理及び転送される。典型的な映像圧縮符号化及び復号化装置(CODEC)は、符号化対照の画像の基準画像予測を形成し、現在画像と当該予測の間の差分を符号化することにより、それらの圧縮効率の多くを獲得する。より密接に当該予測と現在画像が相関するほど、当該画像の圧縮に要するビットは少なくて済み、これにより処理効率が向上する。従って、可能なもののうち最良の基準画像予測が形成されることが望ましい。
MPEG(Moving Picture Experts Group)−1、MPEG−2及びMPEG−4を含む多くの映像圧縮規格において、以前の基準画像の動き補償されたものが現在画像の予測として利用され、現在画像と予測との差分のみが符号化される。単独の画像予測(P画像)が利用されるとき、動き補償予測の生成時には基準画像はスケーリングされない。双方向の画像予測(B画像)が利用されるとき、2つの異なる画像からそれぞれの中間予測が生成され、その後これら2つの中間予測は、それぞれに対して(1/2,1/2)の等しい加重係数を用いて平均化され、単独の平均予測が生成される。これらのMPEG規格では、2つの基準画像のそれぞれは、B画像の順方向及び逆方向からの画像である。
[発明の概要]
従来技術における上記及び他の問題点および短所が、映像エンコーダ及びデコーダにおける加重予測による統合された動き推定のためのシステムおよび方法により解決される。
映像エンコーダ及びデコーダは、画像ブロックに対する映像信号データと、当該画像ブロックを予測するためのある基準画像インデックスとを符号化及び復号化するために備えられ、当該エンコーダは基準画像インデックスに対応する加重係数を示す出力を有する基準画像加重係数セレクタと、基準画像加重係数セレクタに信号通信し、基準画像を重み付けしたものを提供するマルチプレクサと、マルチプレクサに信号通信し、基準画像を重み付けしたものに対応する動きベクトルを提供する動き推定装置とを有し、対応するデコーダは、基準画像インデックスに対応する加重係数を決定するための出力を有する基準画像加重係数ユニットを有する。
画像ブロックに対する映像信号データの対応する符号化方法は、実質的に未圧縮の画像ブロックを受信するステップと、ある基準画像に対応して画像ブロックに加重係数を割り当てるステップと、当該加重係数により基準画像を重み付けするステップと、画像ブロックと重み付け荒れた基準画像との差分に対応する動きベクトルを計算するステップと、当該動きベクトルに応じて重み付けされた基準画像を動き補償するステップと、動き補償された重み付けされた基準画像に応答して、加重係数選択を精緻化するステップと、動きベクトルに応じてもとの重み付けされていない基準画像を動き補償するステップと、重み付けされ動き補償された基準画像を生成するため、動き補償されたもとの基準画像と割り当てられた加重係数とを乗ずるステップと、重み付けされ動き補償された基準画像を実質的に未圧縮の画像ブロックから差し引くステップと、実質的に未圧縮の画像ブロックと重み付けされ動き補償された基準画像との差分を示す信号を符号化するステップとを有する。
本発明の上記及び他の特徴及び効果は、添付された図面と共に読まれる以下の実施例の説明から明らかとなるであろう。
[好適実施例の詳細な説明]
統合された動きベクトルの推定及び適応的な基準画像加重係数選択のための効率的な処理が与えられる。動き推定処理において初期的加重係数が推定及び使用される繰り返しの処理が利用される。荷重係数の推定は、動き推定処理の結果に基づき精緻化される。加重係数が符号化において利用されるとき、映像エンコーダは、加重係数と動きベクトルの両方を決定するが、それぞれに対する最良の選択はもう一方に依存する。動き推定は、典型的には、デジタル映像圧縮エンコーダの最も計算量を有する部分である。
ある映像シーケンス、特にフェージング(fading)を有するシーケンスでは、符号化対照の現在画像または画像ブロックは、基準画像自体よりも、加重係数によりスケーリングされた基準画像により強く相関する。基準画像に適用される加重係数のない映像CODECは、フェージングシーケンスをかなり非効率的に符号化する。
提案されているJVT(Joint Video Team)映像圧縮規格では、各P画像は複数の基準画像を利用して、画像の予測を生成するが、個々の動きブロックまたは8×8の領域を有するマクロブロックは、予測に対して単独の基準画像しか利用しない。動きベクトルの符号化及び送信に加えて、どの基準画像が使用されるかを示す基準画像インデックスが、各動きブロックまたは8×8の領域に対して送信される。可能な基準画像の限られた集合は、エンコーダとデコーダの両方に格納され、可能な基準画像の個数が送信される。
JVT規格では、双予測的な(bi−predictive)画像(またはB画像と呼ばれる)のために、各動きブロックまたは8×8の領域に対して、各自が異なる基準画像から得られる2つの予測子(predictor)が生成され、単一の平均予測子を生成するため、これら2つの予測子は平均化される。双予測的に符号化された動きベクトルに対して、基準画像の両方を順方向から、基準画像の両方を逆方向から、あるいは基準画像を順方向と逆方向の各方向から取得することができる。予測に利用されてもよい利用可能な基準画像の2つのリストが維持されている。2つの基準画像は、リスト0予測子及びリスト1予測子と呼ばれる。各基準画像に対するインデックス、リスト0及びリスト1基準画像に対してそれぞれref_idx_l0及びref_idx_l1が、符号化及び送信される。JVT双予測画像またはB画像は、2つの予測との間の適応的重み付けを可能にする。すなわち、
Pred=[(P0)*(Pred0)]+[(P1)*(Pred1)]+D
が成り立つ。ただし、P0及びP1は加重係数であり、Pred0及びPred1はそれぞれリスト0及びリスト1に対する基準画像予測であり、Dはオフセットである。
加重係数を示すための2つの方法が提案されてきた。第1の方法では、加重係数は、基準画像に用いられる方向により決定される。この方法では、インデックスref_idx_l0がref_idx_l1以下である場合、(1/2,1/2)の加重係数が使用され、そうでない場合には、(2,−1)の係数が使用される。
第2の方法では、任意の個数の加重係数が、各スライスに対して送信される。その後、加重係数インデックスが、双方向予測を利用する動きブロックまたは8×8のマクロブロックの領域のそれぞれに対して送信される。デコーダは、受信した加重係数インデックスを用いて、送信された集合から当該動きブロックまたは8×8の領域を復号するときに利用する適切な加重係数を選択する。例えば、3つの加重係数がスライスレイヤにおいて送信された場合、それらはそれぞれ加重係数インデックス0、1及び2に対応するであろう。
以下の説明は本発明の原理を単に例示したものである。従って、ここで明示的に説明または表示がされていなくても、当業者は本発明の原理を体現し、その趣旨及び範囲内に含まれる様々な構成を考案することができるであろうということは理解されるであろう。さらに、ここで記載されるすべての実施例や条件付言語は、読者が発明の原理や発明者による当該技術分野に貢献する概念の理解に資する教育的目的のみのために本来意図されたものであり、このような具体的に記載された実施例や条件に限定されるものでないと解釈されるべきである。さらに、本発明の原理、特徴及び実施例に関するここでの説明のすべては、それの特定の実施例と共に、本発明の構成的及び機能的均等物を包括することが意図される。さらに、このような均等物は、現在知られている均等物と共に、将来開発される均等物、すなわち、構成とは関係なく同一の機能を実行するよう開発された任意の要素を含むものと解されるべきである。
従って、例えば、ここでのブロック図は、本発明の原理を体現する例示的な回路の概念図を表すということが、当業者により理解されるであろう。同様に、任意のフローチャート、フロー図、状態遷移図、擬似コードなどは、コンピュータによる読み出し可能な媒体により実質的に表現され、コンピュータやプロセッサにより、このようなコンピュータやプロセッサが明示的に示されているかどうかに関係なく実行される各種処理を表す。
図面に示される各種要素の機能は、専用ハードウェアだけでなく、適切なソフトウェアに付属のソフトウェアの実行が可能なハードウェアの使用を通じて提供されてもよい。プロセッサによる提供時には、これらの機能は、単一の専用プロセッサ、単一の共有プロセッサ、または一部が共有可能な複数の個別のプロセッサにより与えられてもよい。さらに、「プロセッサ」または「コントローラ」という用語の明示的使用は、ソフトウェアの実行が可能なハードウェアのみを呼ぶものと解されるべきでなく、以下に限定するものではないが、デジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを格納する読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)及び不揮発性記憶装置を暗黙に含むものであってもよい。また、他のハードウェア、従来および/またはカスタマイズされたハードウェアが含まれてもよい。同様に、図面に示される任意のスイッチは単なる概念的なものである。それらの機能は、プログラム論理の動作、専用論理、プログラム制御と専用論理の相互作用、あるいは手動を通じてでさえ実行可能であり、特定技術が実現者により文脈からより具体的に理解されるものとして選択可能である。
ここでのクレームにおいて、特定機能を実行する手段として表される任意の要素は、当該機能を実行するためのソフトウェアを実行する適切な回路と組み合わされて、例えば、a)当該機能を実行する回路要素の組み合わせ、またはb)ファームウェアやマイクロコードなどを含む任意の形式によるソフトウェアを含む当該機能を実行する任意の方法を含むものと解されるべきである。クレームにより規定される発明は、記載された各種手段により与えられる機能が、クレームが求める方法により合成及び提供されるという事実に基づくものである。従って、出願人は、これらの機能を提供することができる任意の手段をここで示されたものと均等なものとしてみなしている。
図1に示されるように、標準的な映像エンコーダ100は、参照番号100により全体的に示される。エンコーダ100への入力は、加算接合110の非反転入力と信号通信的に接続される。加算接合110の出力は、ブロック変換装置120と信号通信的に接続される。変換装置120は、量子化装置130と信号通信的に接続される。量子化装置130の出力は、可変長符号化装置(VLC)140と信号通信的に接続され、VLC140の出力はエンコーダ100の外部利用可能な出力となる。
量子化装置130の出力は、さらに、逆量子化装置150と信号通信的に接続される。逆量子化装置150は、逆ブロック変換装置160に信号通信的に接続され、さらに逆ブロック変換装置160は、基準画像記憶部170と信号通信的に接続される。基準画像記憶部170の第1出力は、動き推定装置180の第1出力と信号通信的に接続される。エンコーダ100への入力はさらに、動き推定装置180の第2入力と信号通信的に接続される。動き推定装置180の出力は、動き補償装置190の第1入力と信号通信的に接続される。基準画像記憶部170の第2出力は、動き補償装置190の第2入力と信号通信的に接続される。動き補償装置190の出力は、加算接合110の反転入力と信号通信的に接続される。
図2を参照するに、基準画像重み付けを備える映像エンコーダは、参照番号200により全体的に示される。エンコーダ200への入力は、加算接合210の非反転入力と信号通信的に接続される。加算接合210の出力は、ブロック変換装置220と信号通信的に接続される。変換装置220は、量子化装置230と信号通信的に接続される。量子化装置230の出力は、VLC240と信号通信的に接続され、VLC440の出力はエンコーダ200の外部利用可能な出力となる。
量子化装置230の出力は、さらに、逆量子化装置250に信号通信的に接続される。逆量子化装置250は、逆ブロック変換装置260と信号通信的に接続され、さらに逆ブロック変換装置260は、基準画像記憶部270と信号通信的に接続される。基準画像記憶部270の第1出力は、基準画像加重係数割当装置272の第1入力と信号通信的に接続される。エンコーダ200への入力は、さらに、基準画像加重係数割当装置272の第2入力と信号通信的に接続される。加重係数を示す基準画像加重係数割当装置272の出力は、動き推定装置280の第1入力と信号通信的に接続される。基準画像記憶部270の第2出力は、動き推定装置280の第2入力と信号通信的に接続される。
エンコーダ200への入力は、さらに、動き推定装置280の第3入力と信号通信的に接続される。動きベクトルを示す動き推定装置280の出力は、動き補償装置290の第1入力と信号通信的に接続される。基準画像記憶部270の第3出力は、動き補償装置290の第2入力と信号通信的に接続される。動き補償された基準画像を示す動き補償装置290の出力は、乗算器292の第1入力と信号通信的に接続される。加重係数を示す基準画像加重係数割当装置272の出力は、乗算器292の第2入力と信号通信的に接続される。乗算器292の出力は、加算接合210の反転入力と信号通信的に接続される。
図3を参照するに、統合された動き推定と加重予測を備えた映像エンコーダは、参照番号300により全体的に示される。エンコーダ300への入力は、加算接合310の非反転入力と信号通信的に接続される。加算接合310の出力は、ブロック変換装置320と信号通信的に接続される。変換装置320は、量子化装置330と信号通信的に接続される。量子化装置330の出力は、VLC340と信号通信的に接続され、さらにVLC440の出力はエンコーダ300の外部利用可能な出力となる。
量子化装置330の出力はさらに、逆量子化装置350と信号通信的に接続される。逆量子化装置350は、逆ブロック変換装置360と信号通信的に接続され、さらに逆ブロック変換装置360は、基準画像記憶部370と信号通信的に接続される。基準画像記憶部370の第1出力は、基準画像加重係数選択装置372の第1入力と信号通信的に接続される。エンコーダ300への入力は、さらに、選択装置372に現在画像を提供するため、基準画像加重係数選択装置372の第1入力と信号通信的に接続される。加重係数を示す基準画像加重係数選択装置372の出力は、乗算器374の第1入力と信号通信的に接続される。乗算器374の第2入力は、基準画像記憶部370の基準画像出力と信号通信的に接続される。ここで、乗算器374として単に示されているが、乗算器以外の他のタイプの加重係数適用装置が構成されてもよく、当業者には明らかなように、そのすべてが本発明の趣旨及び範囲内に属すると考えられる。
乗算器374の出力は、加重基準画像記憶部376と信号通信的に接続される。加重基準画像記憶部376の出力は、重み付けされた基準画像を与えるため、動き推定装置380の第1入力と信号通信的に接続される。動き推定装置380の出力は、動きベクトルを提供するため、第1動き補償装置382と信号通信的に接続される。動き推定装置380の出力はさらに、第2動き補償装置390の第1入力と信号通信的に接続される。加重基準画像記憶部376の第2出力は、第1動き補償装置382の第2入力と信号通信的に接続される。
加重動き補償基準画像を示す第1動き補償装置382の出力は、絶対差分生成装置384の第1入力と信号通信的に接続される。現在画像であるエンコーダ300への入力は、さらに、絶対差分生成装置384の第2入力と信号通信的に接続される。絶対差分生成装置384の出力は、基準画像加重係数選択装置372の第3入力と信号通信的に接続される。
基準画像記憶部370の第3出力は、第2動き補償装置390の第2入力と信号通信的に接続される。動き補償基準画像を示す第2動き補償装置390の出力は、乗算器392の第1入力と信号通信的に接続される。加重係数を示す基準画像加重係数選択装置372の出力は、乗算器392の第2入力と信号通信的に接続される。乗算気392の出力は、加算結合310の反転入力と信号通信的に接続される。
図4に示されるように、標準的な映像デコーダが、参照番号400により全体的に示される。映像デコーダ400は、逆量子化装置420と信号通信的に接続された可変長デコーダ(VLD)410を有する。逆量子化装置420は、逆変換装置430と信号通信的に接続される。逆変換装置430は、加算器または加算接合440の第1入力端末に信号通信的に接続され、加算接合440の出力は映像デコーダ400の出力を提供する。加算接合440の出力は、基準画像記憶部450と信号通信的に接続される。基準画像記憶部450は、動き補償装置460に信号通信的に接続され、動き補償装置460は、加算接合440の第2入力端末と信号通信的に接続される。
図5を参照するに、適応的双予測を備えた映像デコーダが、参照番号500により全体的に示される。映像デコーダ500は、逆量子化装置520と信号通信的に接続されたVLD510を有する。逆量子化装置520は、逆変換装置530と信号通信的に接続される。逆変換装置530は、加算接合540の第1入力端末と信号通信的に接続され、加算接合540の出力は映像デコーダ500の出力を提供する。加算接合540の出力は、基準画像記憶部550と信号通信的に接続される。基準画像記憶部550は、動き補償装置560と信号通信的に接続され、動き補償装置560は、乗算器570の第1入力と信号通信的に接続される。
VLD510は、さらに、適応的双予測(ABP)係数インデックスをルックアップ(lookup)580に提供するため、基準画像加重係数ルックアップ580と信号通信的に接続される。ルックアップ580の第1出力は、加重係数を与えるためのものであり、乗算器570の第2入力と信号通信的に接続される。乗算器570の出力は、加算接合590の第1入力と信号通信的に接続される。ルックアップ580の第2出力は、オフセットを与えるためのものであり、加算接合590の第2入力と信号通信的に接続される。加算接合590の出力は、加算接合540の第2入力端末と信号通信的に接続される。
図6を参照するに、動きベクトル及び加重係数決定プロセスが、参照番号600により全体的に示される。ここで、機能ブロック610は、現在画像または画像ブロック(cur)と基準画像(ref)に対して、加重係数w=avg(cur)/avg(ref)を計算することにより、初期的加重係数推定を検出する。ブロック610は、加重係数wが閾値T1より大きく、閾値T2未満であるか判断する判定ブロック612に制御をわたす。wがT1とT2の間にある場合、制御はリターンブロック614にわたされ、w=1が初期的加重係数として使用される。wがT1とT2の間にない場合、制御は機能ブロック616にわたされ、加重基準画像wrefを生成するため、加重係数wが基準画像に適用される。ブロック616は、機能ブロック618に制御をわたし、加重基準画像wrefを用いて動きベクトル(MV)を検出することにより、動き推定を実行する。ブロック618は制御を機能ブロック620にわたし、MVをwrefに適用することにより、動き補償加重基準画像mcwrefが生成される。ブロック620は機能ブロック622に制御をわたし、差分diffが計算される。ただし、diffはcurとmcwrefとの画素差の和の絶対値に等しい。
ブロック622は制御を判定ブロック624にわたし、diffがこれまでの最良のdiffより大きいか判断する。diffがこれまでの最良のdiffより大きい場合、制御はリターンブロック626にわたされ、これまでの最良のdiffが使用される。diffがこれまでの最良のdiffより大きくない場合、制御は判定ブロック628にわたされ、diffが閾値Tより小さいか判断される。diffが閾値Tより小さい場合、制御はリターンブロック634にわたされ、現在の推定が利用される。diffが閾値Tより小さくない場合、制御は機能ブロック630にわたされ、MVをrefに適用することにより、動き補償基準画像mcrefが生成される。ブロック630は、制御を機能ブロック632にわたし、wをavg(cur)/avg(mcref)に設定することにより、加重係数推定を精緻化する。ブロック632は、さらなる処理のため、制御を機能ブロック616にわたす。従って、加重係数をさらに精緻化するための決定は、差分と閾値や許容度との比較に基づき行われる。
図7を参照するに、画像ブロックに対する映像信号データを復号するための一例となるプロセスが、参照番号700により全体的に示される。本プロセスは、入力ブロック712に制御をわたすスタートブロック710を有する。入力ブロック712は、当該画像ブロックの圧縮データを受け取り、入力ブロック714に制御をわたす。入力ブロック714は、画像ブロックのデータと共に、各自が特定の基準画像と対応する少なくとも1つの基準画像インデックスを受け取る。入力インデックス714は、制御を機能ブロック716にわたし、受信した各基準画像インデックスに対応する加重係数が決定され、任意的な機能ブロック717に制御がわたされる。任意的な機能ブロック717は、受信した各基準画像インデックスに対応するオフセットを決定し、制御を機能ブロック718にわたす。機能ブロック718は、受信した各基準画像インデックスに対応する基準画像を抽出し、制御を機能ブロック720にわたす。機能ブロック720は、抽出された基準画像を動き補償し、機能ブロック722に制御をわたす。機能ブロック722は、動き補償された基準画像と対応する加重係数とを乗算し、制御を任意的な機能ブロック723にわたす。任意的な機能ブロック723は、動き補償基準画像に対応するオフセットを加算し、制御を機能ブロック724にわたす。機能ブロック724は、重み付けされた動き補償基準画像を生成し、制御をエンドブロック726にわたす。
本実施例では、符号化された各画像またはスライスに対して、加重係数が現在画像のブロックが符号化可能な各教養可能な基準画像と関連付けされる。現在画像の各ブロックが符号化または復号化されるとき、それの基準画像インデックスに対応する加重係数とオフセットが、加重予測子を生成するため、基準予測に適用される。同一の基準画像に関して符号化されたスライスのすべてのブロックが、同一の加重係数を基準画像予測に適用する。
画像の符号化時に適応的重み付けを利用するかどうかは、画像パラメータ集合またはシーケンスパラメータ集合、若しくはスライスまたは画像ヘッダに示すことができる。適応的重み付けを利用する各スライスまたは画像に対して、加重係数が当該スライスまたは画像の符号化に利用可能な許容可能な各基準画像に対して送信されてもよい。許容可能な基準画像数は、スライスヘッダにより送信される。例えば、3つの基準画像が現在スライスの符号化に利用可能である場合、3つまでの加重係数が送信され、同じインデックスを有する基準画像と関連付けされる。
加重係数が送信されない場合、デフォルトの加重が使用される。本発明の一実施例では、加重係数が送信されないとき、(1/2,1/2)のデフォルトの加重が使用される。加重係数は、固定長または派遣長のコードを用いて送信されてもよい。
典型的なシステムと異なり、各スライス、ブロックまたは画像と共に送信される各加重係数は、特定の基準画像インデックスに対応する。以前に、各スライスまたは画像と共に送信された加重係数の何れの集合も、特定の基準画像と関連付けされていない。代わりに、各動きブロックまたは8×8の領域に対して適応的双予測加重インデックスが送信され、送信された集合からどの加重係数が当該動きブロックまたは8×8の領域に適用されるべきか選択される。
本実施例では、各動きブロックまたは8×8の領域に対する加重係数インデックスは、明示的には送信されない。代わりに、送信された基準画像インデックスに関連付けされた加重係数が用いられる。これにより、基準画像の適応的重み付けを可能にするための送信ビットストリームにおけるオーバヘッド量は劇的に低減する。
本システム及び技術は、単一の予測子により符号化される予測P画像、あるいは2つの予測子により符号化される双予測B画像の何れかに適用されてもよい。エンコーダとデコーダの両方において与えられる復号化プロセスが、P及びB画像のケースに対して以下で説明される。また、本技術は、I、B及びP画像に類似したコンセプトを用いた符号化システムに適用されてもよい。
B画像の一方向予測とB画像の双方向予測に対して、同一の加重係数を使用することができる。単独の予測子がP画像のマクロブロックまたはB画像の一方向予測に対して使用されるとき、当該ブロックに対して単独の基準画像インデックスが送信される。動き補償の復号化プロセスステップにより予測子が生成された後、加重係数が予測子に適用される。その後、加重予測子が符号化された残差に加えられ、復号化画像を生成するのに当該和に対してクリッピング(clipping)が実行される。リスト0予測のみを用いるP画像におけるブロックまたはB画像におけるブロックの利用に対して、加重予測子は、
Pred=W0*Pred0+D0 (1)
として構成される。ただし、W0はリスト0の基準画像に関連付けされた加重係数であり、D0はリスト0の基準画像に関連付けされたオフセットであり、Pred0はリスト0の基準画像から動き補償された予測ブロックである。
リスト1予測のみを用いるB画像におけるブロックの利用に対して、加重予測子は、
Pred=W1*Pred1+D1 (2)
として構成される。ただし、W1はリスト1の基準画像に関連付けされた加重係数であり、D0はリスト1の基準画像に関連付けされたオフセットであり、Pred1はリスト1の基準画像から動き補償された予測ブロックである。
加重予測子は、結果として得られる値が、典型的には0から255までの許容される画素値の範囲内にあることを保証するようクリッピングされてもよい。重み付けの式における乗算の精度は、任意の所定の解像度ビット数に限定されてもよい。
双予測のケースでは、基準画像インデックスが2つの予測子のそれぞれに対して送信される。2つの予測子を生成するため、動き補償が実行される。各予測子は、それの基準画像インデックスに関連付けされた加重係数を用いて、2つの加重予測子を生成する。その後、これら2つの加重予測子は、平均化された予測子を生成するため平均化され、その後、符号化された残差に加えられる。
リスト0とリスト1の予測を用いたB画像におけるブロックの利用に対して、加重予測子は、
Pred=(P0*Pred0+D0+P1*Pred1+D1)/2 (3)
として構成される。
結果として得られる値が、典型的には0から255までの画素値の許容範囲内となることを保証するため、加重予測子の計算において、クリッピングが加重予測子または中間値の何れかに適用されてもよい。
従って、加重係数が、複数の基準画像を用いる映像圧縮エンコーダ及びデコーダの基準画像予測に適用される。加重係数は、画像内の個々の動きブロックに対して、当該動きブロックに対して用いられる基準画像インデックスに基づき調整される。基準画像インデックスが圧縮映像ビットストリームによりすでに送信されているため、動きブロックに基づき加重係数を調整するための追加的なオーバヘッドを劇的に低減することができる。同一の基準画像に関して符号化されるすべての動きブロックは、同じ加重係数を基準画像予測に適用する。
動き推定技術についてはこれまで広く研究されてきた。符号化対照の画像の各動きブロックに対して、基準画像からの当該動きブロックのずれを表す動きベクトルが選択される。検索領域内の網羅的探索法では、動きブロックの位置に対する所定の範囲のオフセット内のすべてのずれが調べられる。このチェックは、基準画像におけるずれた動きブロックとの現在画像の動きブロックの各画素の絶対差の和(SADまたは平均二乗誤差(MSE)を計算することを含む。最小のSADまたはMSEとのオフセットが、動きベクトルとして選択される。以下のすべてが基準画像におけるずれた動きブロックによる現在動きブロックのSADまたはMSEを計算するステップを含む、3ステップ探索やレート歪最適化動き推定などの当該方法に関する多数の変形が提案されてきた。
動きベクトルまたは適応的基準画像加重係数を決定するための計算コストは、高い圧縮効率を達成することが可能な動きベクトル及び加重係数を選択しながら、繰り返し処理を用いることにより低減することが可能である。一例となる動きベクトル及び加重係数の決定プロセスが、本発明の原理の用途がそのようなケースに限定されるものではないが、単一の加重係数が基準画像全体に適用されるということを仮定して説明される。本プロセスはまた、例えば、スライスなどの画像のより小さな領域に適用することができる。さらに、本発明の一実施例は1つの基準画像のみを用いるものとして説明されているが、本発明は、複数の基準画像予測及び双予測画像に適用されてもよい。
動きブロックに対する動きベクトルの計算は、典型的には、使用される加重係数が既知であるとき、最も良く行うことができる。一実施例では、加重係数の推定は、基準画像と現在画像の画素値を用いて構成される。加重係数は、複数の解像度ビットに限定されてもよい。加重係数が1に近接する場合、動き推定プロセスにおける加重係数を考慮する必要はなく、1に等しいと仮定される加重係数により通常の動き推定が実行可能である。そうでない場合には、加重係数推定が基準画像に適用される。その後、SADまたはMSEを計算する任意の方法を用いて動き推定が行われるが、このSADまたはMSEの計算は、重み付けされていない基準画像でなく重み付けされた基準画像におけるずれた動きブロックと現在画像の動きブロックとの間で実行される。動きベクトルの選択後、必要に応じて、加重係数の推定を精緻化することができる。
果汁動き補償基準画像を生成するのに、現在動きベクトルが果汁基準画像に適用される。加重動き補償基準画像と現在画像との差分が計算される。この差分が閾値あるいはこれまでの最良の差分未満である場合、本プロセスは完了し、現在候補動きベクトルと加重係数が受け入れられる。
差分が閾値より大きい場合、加重係数を精緻化することができる。この場合、動き補償されているが、重み付けされていない基準画像が、現在候補動きベクトルに基づき生成される。加重係数推定は、加重係数の初期的推定の構成で行われたように、動き補償されていない基準画像でなく、動き補償基準画像と現在画像を用いて精緻化される。
この選択プロセスは、加重基準画像を生成するのに、新たに精緻化された加重係数を基準画像に適用することを繰り返す。この繰り返しの処理は、差分がこれまでの最良の差分以上または閾値未満となるまで、あるいは所定の回数が終了するまで継続される。現在の繰り返しの差分が以前の最良の繰り返しより大きい場合、この最良の繰り返しに対する加重係数及び動きベクトルが利用される。現在の繰り返しの差分が閾値未満である場合、
現在の加重係数及び動きベクトルが用いられる。繰り返しの回数の最大数が終了すると、最良の差分を有する以前の繰り返しからの加重係数及び動きベクトルが用いられる。
一実施例では、加重係数wの初期的推定は、現在画像curの画素の平均値を基準画像refの画素の平均値により除された比率である。すなわち、
w=avg(cur)/avg(ref) (4)
である。
精緻化推定は、現在画像の画素の平均と動き補償された基準画像mcrefの画素の平均との比率であり、
w=avg(cur)/avg(mcref) (5)
となる。
差分diffは、現在画像curと加重動き補償基準画像wmcrefとの画素差の平均の絶対値であり、
diff=|Σcur−wmcref| (6)
である。
他の実施例では、差分は、現在画像における画素と加重動き補償基準画像における画素との絶対差の和であり、
diff=Σ|cur−wmcref| (7)
である。
ブロックベースの動き推定が実行されるとき、基準画像における同一画素が多数のSAD計算に対して用いられる。一実施例では、動き推定処理中、加重係数が基準画像の一画素に適用されると、加重画素が通常の画素に加えて格納される。この格納処理は、画像の一領域または画像全体に対して行われてもよい。
加重基準画像値は、例えば8ビットなどの重み付けされていない基準と同数のビットと共に格納されるようクリップ処理されてもよいし、あるいはより多くのビットを用いて格納されてもよい。クリッピングがメモリをより効率的にする動き補償処理に対して実行される場合、加重係数は実際に選択された動きベクトルに対して基準画像に再適用され、追加ビットを用いて差分が計算され、加重係数の適用後、デコーダがクリッピングを実行しない場合に生じるデコーダとの不一致を回避するため、差分の後にクリッピングが実行される。
複数の基準画像が1つの画像を符号化するのに利用されるとき、各基準画像に対して別々の加重係数を計算することができる。動き推定中、動きベクトルと基準画像インデックスが書く動きブロックに対して選択される。当該プロセスの各繰り返しに対して、動きベクトルと加重係数が、各基準画像に対して求められる。
好適な実施例では、動き推定中、与えられた動きブロックに対する最良の基準画像が決定される。差分計算は各基準画像に対して別々に行われ、当該基準画像を用いた動きブロックのみが計算において使用される。与えられた基準画像に対する加重係数推定の精緻化は、当該基準画像を用いて符号化される動きブロックのみを用いる。双予測的符号化に対して、加重係数及び動きベクトルが2つの予測のそれぞれに対して別々に決定され、平均化された予測を構成するのにこれらは平均化される。
本発明の原理は、他の多数のタイプの動き推定アルゴリズムに適用可能である。階層的アプローチと共に利用されるとき、加重係数の選択と動きベクトルの選択の繰り返しは、任意のレベルの動き推定階層と共に利用可能である。例えば、繰り返しアプローチは、整数画像要素(pel)動き推定と共に利用することができる。与えられた繰り返しのアルゴリズムを用いて加重係数及び整数動きベクトルが求められた後、サブpel動きベクトルが、加重係数の選択の他の繰り返しを必要とすることなく求められてもよい。
本発明の上記及び他の特徴および効果は、ここでの教示に基づき当業者により容易に確信されるであろう。本発明の原理は、ハードウェア、ソフトウェア、ファームウェア、特定用途プロセッサあるいは上記の組み合わせの各種形態により実現されてもよいということが理解されるべきである。
最も好ましくは、本発明の原理は、ハードウェアとソフトウェアの組み合わせとして実現される。さらに、このソフトウェアは好ましくは、プログラム記憶ユニット上で有形的に実現されるアプリケーションプログラムとして実現される。このアプリケーションプログラムは、任意の適切なアーキテクチャからなるマシーンにアップロードされ、実行されてもよい。好ましくは、このマシーンは、1以上の中央演算ユニット(CPU)、ランダムアクセスメモリ(RAM)及び入出力(I/O)インタフェースなどのハードウェアを有するコンピュータプラットフォーム上で実現される。コンピュータプラットフォームはまた、オペレーティングシステムやマイクロインストラクションコード(microinstruction code)を有するようにしてもよい。ここで説明された各種プロセス及び機能は、CPUにより実行可能なマイクロインストラクションコードの一部、アプリケーションプログラムの一部、または上記の任意の組み合わせであってもよい。さらに、追加的データ記憶ユニット及び印刷ユニットなどの他の様々な周辺ユニットが、コンピュータプラットフォームに接続されてもよい。
さらに、添付された図面に示されるシステムコンポーネント及び方法の一部は、好ましくはソフトウェア的に実現されるため、システムコンポーネントまたはプロセス機能ブロック間の実際の接続は、本発明がプログラムされる方法に依存して異なっているかもしれない。ここでの教示が与えられると、当業者は、本発明の上記及び類似の実現形態及び構成を考案することができるであろう。
添付された図面を参照して、例示的な実施例が説明されたが、本発明はこれらの実施例に限定されるものでなく、本発明の範囲または趣旨から逸脱することなく、様々な変更及び改良が当業者により可能であるかもしれない。このようなあらゆる変更及び改良は、添付されたクレームにより与えられる本発明の範囲内に含まれるものと解される。
図1は、標準的な映像エンコーダのブロック図を示す。 図2は、基準画像加重を備えた映像エンコーダのブロック図を示す。 図3は、本発明の原理による統合された動き推定及び加重予測を備えた映像エンコーダのブロック図を示す。 図4は、標準的な映像デコーダのブロック図を示す。 図5は、適応的予測を備えた映像デコーダのブロック図を示す。 図6は、本発明の原理による符号化処理に対するフローチャートを示す。 図7は、本発明の原理による復号化処理に対するフローチャートを示す。

Claims (18)

  1. 少なくとも1つの基準画像に対する画像ブロックの映像信号データを符号化する映像エンコーダであって、
    前記少なくとも1つの基準画像に対応する加重係数を示す出力を有する基準画像加重係数選択器と、
    前記基準画像加重係数選択装置と信号通信し、前記少なくとも1つの基準画像の重み付けされたものを提供する加重係数適用器と、
    前記加重係数適用器と信号通信し、前記少なくとも1つの基準画像の重み付けされたものに対応する動きベクトルを提供する動き推定器と、
    から構成されるエンコーダ。
  2. 請求項1記載の映像エンコーダであって、さらに、
    前記基準画像加重係数選択器と信号通信し、前記少なくとも1つの基準画像と対応する基準画像インデックスとを提供する基準画像記憶部を有することを特徴とするエンコーダ。
  3. 請求項2記載の映像エンコーダであって、さらに、
    前記基準画像記憶部と信号通信し、前記少なくとも1つの基準画像に対応する基準画像インデックスを符号化する可変長符号化器を有することを特徴とするエンコーダ。
  4. 請求項1記載の映像エンコーダであって、さらに、
    前記基準画像加重係数選択器と信号通信し、前記基準画像の重み付けされたものを格納する加重基準画像記憶部を有することを特徴とするエンコーダ。
  5. 請求項1記載の映像エンコーダであって、さらに、
    前記基準画像加重係数選択器と信号通信し、前記基準画像加重係数選択器に応じた動き補償基準画像を提供する動き補償器を有することを特徴とするエンコーダ。
  6. 請求項5記載の映像エンコーダであって、さらに、
    前記動き補償器及び前記基準画像加重係数選択器と信号通信し、加重係数を動き補償基準画像に適用する乗算器を有することを特徴とするエンコーダ。
  7. 請求項1記載の映像エンコーダであって、さらに、
    前記動き推定器と信号通信し、前記基準画像加重係数選択器及び前記動き推定器に応じた加重動き補償基準画像を提供する動き補償器を有することを特徴とするエンコーダ。
  8. 請求項7記載の映像エンコーダであって、
    双予測画像予測子と共に利用可能であり、さらに、
    異なる2つの基準画像から第1及び第2予測子を生成する予測手段を有する、
    ことを特徴とするエンコーダ。
  9. 請求項8記載の映像エンコーダであって、
    前記異なる2つの基準画像は共に、前記画像ブロックに対して同一方向からのものであることを特徴とするエンコーダ。
  10. 画像ブロックの映像信号データの符号化方法であって、
    実質的に未圧縮な画像ブロックを受信するステップと、
    前記画像ブロックに基準画像に対応する加重係数を割り当てるステップと、
    前記基準画像を前記加重係数により重み付けするステップと、
    前記画像ブロックと前記重み付けされた基準画像との差に対応する動きベクトルを計算するステップと、
    前記動きベクトルに対応して、前記加重基準画像を動き補償するステップと、
    前記動き補償加重基準画像に応答して、前記加重係数の選択を精緻化するステップと、
    から構成されることを特徴とする方法。
  11. 請求項10記載の符号化方法であって、さらに、
    前記動きベクトルに対応して、前記もとの重み付けされていない基準画像を動き補償するステップと、
    加重動き補償基準画像を生成するため、前記動き補償されたもとの基準画像と前記割り当てられた加重係数とを乗算するステップと、
    前記実質的に未圧縮の画像ブロックから前記加重動き補償基準画像を差し引くステップと、
    前記実質的に未圧縮の画像ブロックと前記加重動き補償基準画像との差を示す信号を符号化するステップと、
    を有することを特徴とする方法。
  12. 請求項10記載の符号化方法であって、
    前記動きベクトルを計算するステップは、
    前記画像ブロックに対する所定の範囲のオフセット内のすべてのずれに対して検索領域内を調べるステップと、
    動き補償基準画像により前記画像ブロックの各画素の絶対差の和と平均二乗誤差の少なくとも1つを計算するステップと、
    前記絶対差の和と前記平均二乗誤差の最小値によるオフセットを前記動きベクトルとして選択するステップと、
    から構成されることを特徴とする方法。
  13. 請求項10記載の符号化方法であって、
    双予測画像予測子が利用され、さらに、
    前記画像ブロックに第2基準画像に対応する第2加重係数を割り当てるステップと、
    前記画像ブロックと前記第2加重基準画像との差に対応する第2動きベクトルを計算するステップと、
    前記第2動きベクトルに対応して、前記第2加重参照画像を動き補償するステップと、
    前記第2動き補償加重基準画像に応答して、前記第2加重係数の選択を精緻化するステップと、
    を有することを特徴とする方法。
  14. 請求項11記載の符号化方法であって、
    双予測画像予測子が利用され、さらに、
    前記画像ブロックに第2基準画像に対応する第2加重係数を割り当てるステップと、
    前記第2基準画像を前記第2加重係数により重み付けするステップと、
    前記画像ブロックと前記第2加重基準画像との差に対応する第2動きベクトルを計算するステップと、
    前記第2動きベクトルに対応して、前記第2加重基準画像を動き補償するステップと、
    前記動き補償加重基準画像に対応して、前記第2加重係数の選択を精緻化するステップと、
    前記第2動きベクトルに対応して、前記もとの重み付けされていない第2基準画像を動き補償するステップと、
    第2加重動き補償基準画像を生成するため、前記動き補償されたもとの第2基準画像を前記割り当てられた第2加重係数と乗算するステップと、
    前記実質的に未圧縮の画像ブロックから前記第2加重動き補償基準画像を差し引くステップと、
    前記実質的に未圧縮の画像ブロックと前記第2加重動き補償基準画像との差を示す信号を符号化するステップと、
    を有することを特徴とする方法。
  15. 請求項13記載の符号化方法であって、
    前記第1及び第2基準画像は共に、前記画像ブロックに対して同一方向からのものであることを特徴とする方法。
  16. 請求項13記載の符号化方法であって、
    前記動きベクトルを計算するステップは、
    前記画像ブロックに対する所定の範囲のオフセット内のすべてのずれに対して検索領域内を調べるステップと、
    前記第1予測子に対応する第1動き補償基準画像により前記画像ブロックの各画素の絶対差の和と平均二乗誤差の少なくとも1つを計算するステップと、
    前記絶対差の和と前記平均二乗誤差の最小値によるオフセットを前記第1予測子に対する前記動きベクトルとして選択するステップと、
    前記第2予測子に対応する第2動き補償基準画像により前記画像ブロックの各画素の絶対差の和と平均二乗誤差の少なくとも1つを計算するステップと、
    前記絶対差の和と前記平均二乗誤差の最小値によるオフセットを前記第2予測子に対する前記動きベクトルとして選択するステップと、
    から構成されることを特徴とする方法。
  17. 請求項10記載の符号化方法であって、
    前記基準画像を前記加重係数により重み付けするステップは、
    前記加重係数がほぼ1に近いか判断するステップと、
    前記加重係数がほぼ1に近い場合、前記もとの基準画像を前記加重基準がぞうとして使用するステップと、
    から構成されることを特徴とする方法。
  18. 請求項10記載の符号化方法であって、
    前記動き補償加重基準画像に応じて前記加重係数の選択を精緻化するステップは、
    前記画像ブロックと前記動き補償加重基準画像との差を計算するステップと、
    前記計算された差を所定の許容度と比較するステップと、
    さらに、前記計算された差が前記所定の許容度にない場合、前記加重係数を精緻化するステップと、
    から構成されることを特徴とする方法。
JP2005505118A 2002-07-15 2003-07-11 加重予測による動き推定 Expired - Fee Related JP4533841B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US39587402P 2002-07-15 2002-07-15
US39584302P 2002-07-15 2002-07-15
US10/410,479 US7376186B2 (en) 2002-07-15 2003-04-09 Motion estimation with weighting prediction
PCT/US2003/021653 WO2004008642A2 (en) 2002-07-15 2003-07-11 Motion estimation with weighting prediction

Publications (2)

Publication Number Publication Date
JP2005533464A true JP2005533464A (ja) 2005-11-04
JP4533841B2 JP4533841B2 (ja) 2010-09-01

Family

ID=30119144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005505118A Expired - Fee Related JP4533841B2 (ja) 2002-07-15 2003-07-11 加重予測による動き推定

Country Status (12)

Country Link
US (1) US7376186B2 (ja)
EP (1) EP1540824B1 (ja)
JP (1) JP4533841B2 (ja)
CN (1) CN100450185C (ja)
AU (1) AU2003259110A1 (ja)
BR (2) BR0305517A (ja)
DE (1) DE60319239T2 (ja)
ES (1) ES2301828T3 (ja)
MX (1) MXPA05000672A (ja)
MY (1) MY137057A (ja)
TW (1) TWI234402B (ja)
WO (1) WO2004008642A2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006509467A (ja) * 2002-12-04 2006-03-16 トムソン ライセンシング 重み付け予測を用いたビデオ・クロス・フェードの符号器および符号化方法
US7809060B2 (en) 2004-04-28 2010-10-05 Panasonic Corporation Moving picture stream generation apparatus, moving picture coding apparatus, moving picture multiplexing apparatus and moving picture decoding apparatus
JPWO2009041215A1 (ja) * 2007-09-25 2011-01-20 シャープ株式会社 動画像符号化装置及び動画像復号装置
KR20130116897A (ko) * 2010-12-14 2013-10-24 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 예측 인코딩을 위한 인코더 및 방법, 디코딩을 위한 디코더 및 방법, 예측 인코딩 및 디코딩을 위한 시스템 및 방법, 및 예측 인코딩된 정보 신호

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8255989B2 (en) * 2001-09-26 2012-08-28 General Instrument Corporation Access control and key management system for streaming media
JP4015934B2 (ja) * 2002-04-18 2007-11-28 株式会社東芝 動画像符号化方法及び装置
US8406301B2 (en) 2002-07-15 2013-03-26 Thomson Licensing Adaptive weighting of reference pictures in video encoding
WO2004032521A1 (ja) * 2002-10-01 2004-04-15 Matsushita Electric Industrial Co., Ltd. 画像符号化装置、画像復号化装置およびこれらの方法
US7801217B2 (en) * 2002-10-01 2010-09-21 Thomson Licensing Implicit weighting of reference pictures in a video encoder
JP2004179687A (ja) * 2002-11-22 2004-06-24 Toshiba Corp 動画像符号化/復号化方法及び装置
WO2005004492A2 (en) * 2003-06-25 2005-01-13 Thomson Licensing S.A. Method and apparatus for weighted prediction estimation using a displaced frame differential
US8731054B2 (en) * 2004-05-04 2014-05-20 Qualcomm Incorporated Method and apparatus for weighted prediction in predictive frames
KR100813958B1 (ko) * 2004-06-07 2008-03-14 세종대학교산학협력단 동영상의 무손실 인코딩 및 디코딩 방법, 그 장치
US8462850B2 (en) * 2004-07-02 2013-06-11 Qualcomm Incorporated Motion estimation in video compression systems
US8284837B2 (en) 2004-09-16 2012-10-09 Thomson Licensing Video codec with weighted prediction utilizing local brightness variation
US20060146932A1 (en) * 2004-12-30 2006-07-06 Krit Panusopone Method and apparatus for providing motion estimation with weight prediction
KR100703770B1 (ko) 2005-03-25 2007-04-06 삼성전자주식회사 가중 예측을 이용한 비디오 코딩 및 디코딩 방법, 이를위한 장치
KR100763182B1 (ko) * 2005-05-02 2007-10-05 삼성전자주식회사 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치
JP5484725B2 (ja) * 2005-07-21 2014-05-07 トムソン ライセンシング スケーラブルビデオコーディングのための重み付け予測方法及び装置
US8239766B2 (en) * 2005-09-27 2012-08-07 Qualcomm Incorporated Multimedia coding techniques for transitional effects
US20070092007A1 (en) * 2005-10-24 2007-04-26 Mediatek Inc. Methods and systems for video data processing employing frame/field region predictions in motion estimation
JP5165593B2 (ja) * 2006-02-02 2013-03-21 トムソン ライセンシング 組合せ参照双方向予測を用いて動き推定を行う方法および装置
WO2007092215A2 (en) * 2006-02-02 2007-08-16 Thomson Licensing Method and apparatus for adaptive weight selection for motion compensated prediction
WO2007091779A1 (en) 2006-02-10 2007-08-16 Lg Electronics Inc. Digital broadcasting receiver and method of processing data
WO2007126196A1 (en) 2006-04-29 2007-11-08 Lg Electronics Inc. Digital broadcasting system and method of processing data
WO2007136166A1 (en) 2006-05-23 2007-11-29 Lg Electronics Inc. Digital broadcasting system and method of processing data
US7873104B2 (en) 2006-10-12 2011-01-18 Lg Electronics Inc. Digital television transmitting system and receiving system and method of processing broadcasting data
JP2010507335A (ja) * 2006-10-18 2010-03-04 トムソン ライセンシング 予測データ精緻化を使用してビデオを符号化する方法及び装置
JP2008219100A (ja) * 2007-02-28 2008-09-18 Oki Electric Ind Co Ltd 予測画像生成装置、方法及びプログラム、並びに、画像符号化装置、方法及びプログラム
KR101285887B1 (ko) 2007-03-26 2013-07-11 엘지전자 주식회사 디지털 방송 시스템 및 데이터 처리 방법
KR101253185B1 (ko) 2007-03-26 2013-04-10 엘지전자 주식회사 디지털 방송 시스템 및 데이터 처리 방법
KR101285888B1 (ko) 2007-03-30 2013-07-11 엘지전자 주식회사 디지털 방송 시스템 및 데이터 처리 방법
KR101475365B1 (ko) * 2007-04-09 2014-12-23 가부시키가이샤 엔.티.티.도코모 화상 예측 부호화 장치, 화상 예측 부호화 방법, 화상 예측 부호화 프로그램, 화상 예측 복호 장치, 화상 예측 복호 방법 및 화상 예측 복호 프로그램
US8433973B2 (en) 2007-07-04 2013-04-30 Lg Electronics Inc. Digital broadcasting system and method of processing data
WO2009005326A2 (en) 2007-07-04 2009-01-08 Lg Electronics Inc. Digital broadcasting system and method of processing data
US7982776B2 (en) * 2007-07-13 2011-07-19 Ethicon Endo-Surgery, Inc. SBI motion artifact removal apparatus and method
KR20090012180A (ko) * 2007-07-28 2009-02-02 엘지전자 주식회사 디지털 방송 시스템 및 데이터 처리 방법
EP2191644A4 (en) 2007-08-24 2015-01-07 Lg Electronics Inc DIGITAL BROADCASTING SYSTEM AND METHOD OF PROCESSING DATA IN A DIGITAL BROADCASTING SYSTEM
US8467451B2 (en) * 2007-11-07 2013-06-18 Industrial Technology Research Institute Methods for selecting a prediction mode
US8320455B2 (en) * 2009-03-05 2012-11-27 Qualcomm Incorporated System and method to process motion vectors of video data
US20120230405A1 (en) * 2009-10-28 2012-09-13 Media Tek Singapore Pte. Ltd. Video coding methods and video encoders and decoders with localized weighted prediction
JP2011147049A (ja) * 2010-01-18 2011-07-28 Sony Corp 画像処理装置および方法、並びにプログラム
US8768082B2 (en) 2011-06-22 2014-07-01 Blackberry Limited Compressing image data
US8837582B2 (en) 2011-06-22 2014-09-16 Blackberry Limited Compressing image data
US9083983B2 (en) 2011-10-04 2015-07-14 Qualcomm Incorporated Motion vector predictor candidate clipping removal for video coding
WO2013059470A1 (en) * 2011-10-21 2013-04-25 Dolby Laboratories Licensing Corporation Weighted predictions based on motion information
EP2769549A1 (en) * 2011-10-21 2014-08-27 Dolby Laboratories Licensing Corporation Hierarchical motion estimation for video compression and motion analysis
US9560369B2 (en) 2012-09-28 2017-01-31 Lg Electronics Inc. Video decoding method and apparatus using the same
JP6005865B2 (ja) * 2012-09-28 2016-10-12 インテル・コーポレーション スケーラブルビデオ符号化のためのエンハンスド参照領域の利用
CN103024390B (zh) * 2012-12-21 2015-09-09 天津大学 用于视频编码中的运动估计的自适应搜索方法
WO2017030198A1 (ja) * 2015-08-20 2017-02-23 日本放送協会 画像符号化装置、画像復号化装置、及びこれらのプログラム
WO2017197146A1 (en) 2016-05-13 2017-11-16 Vid Scale, Inc. Systems and methods for generalized multi-hypothesis prediction for video coding
US11997297B2 (en) * 2019-03-06 2024-05-28 Sharp Kabushiki Kaisha Systems and methods for signaling tile group information in video coding
US11973964B2 (en) 2019-09-20 2024-04-30 Interdigital Madison Patent Holdings, Sas Video compression based on long range end-to-end deep learning
US11533498B2 (en) * 2019-11-21 2022-12-20 Tencent America LLC Geometric partitioning mode in video coding

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4985768A (en) * 1989-01-20 1991-01-15 Victor Company Of Japan, Ltd. Inter-frame predictive encoding system with encoded and transmitted prediction error
US5488482A (en) * 1992-01-29 1996-01-30 Mitsubishi Denki Kabushiki Kaisha High-efficiency encoder and video information recording/reproducing apparatus
US6104439A (en) * 1992-02-08 2000-08-15 Samsung Electronics Co., Ltd. Method and apparatus for motion estimation
US5436665A (en) * 1992-03-03 1995-07-25 Kabushiki Kaisha Toshiba Motion picture coding apparatus
US5592228A (en) * 1993-03-04 1997-01-07 Kabushiki Kaisha Toshiba Video encoder using global motion estimation and polygonal patch motion estimation
JP3468856B2 (ja) * 1994-07-28 2003-11-17 株式会社東芝 動きベクトル検出方法及び装置
US5781788A (en) * 1995-05-08 1998-07-14 Avc Technology, Inc. Full duplex single clip video codec
JPH09121358A (ja) * 1995-10-25 1997-05-06 Matsushita Electric Ind Co Ltd 画像符号化及び復号化装置と方法
US6049362A (en) * 1996-02-14 2000-04-11 International Business Machines Corporation Dual prime motion estimation system and method
JP4034380B2 (ja) * 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
US6175592B1 (en) * 1997-03-12 2001-01-16 Matsushita Electric Industrial Co., Ltd. Frequency domain filtering for down conversion of a DCT encoded picture
US6151075A (en) * 1997-06-11 2000-11-21 Lg Electronics Inc. Device and method for converting frame rate
US6310919B1 (en) * 1998-05-07 2001-10-30 Sarnoff Corporation Method and apparatus for adaptively scaling motion vector information in an information stream decoder

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN7009003687, Kikuchi,Y., and Chujoh,T., "Multi−frame interpolative prediction with modified syntax", Joint Video Team (JVT) of ISO/IEC MPEG & ITU−T VCEG(ISO/IEC JTC1/SC29/WG11 and ITU−T SG16 Q.6) JVT−, 20020306 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006509467A (ja) * 2002-12-04 2006-03-16 トムソン ライセンシング 重み付け予測を用いたビデオ・クロス・フェードの符号器および符号化方法
JP4756573B2 (ja) * 2002-12-04 2011-08-24 トムソン ライセンシング 重み付け予測を用いたビデオ・クロス・フェードの符号器および符号化方法
US7809060B2 (en) 2004-04-28 2010-10-05 Panasonic Corporation Moving picture stream generation apparatus, moving picture coding apparatus, moving picture multiplexing apparatus and moving picture decoding apparatus
US8130843B2 (en) 2004-04-28 2012-03-06 Panasonic Corporation Moving picture stream generation apparatus, moving picture coding apparatus, moving picture multiplexing apparatus and moving picture decoding apparatus
US8254446B2 (en) 2004-04-28 2012-08-28 Panasonic Corporation Moving picture stream generation apparatus, moving picture coding apparatus, moving picture multiplexing apparatus and moving picture decoding apparatus
US8254447B2 (en) 2004-04-28 2012-08-28 Panasonic Corporation Moving picture stream generation apparatus, moving picture coding apparatus, moving picture multiplexing apparatus and moving picture decoding apparatus
JPWO2009041215A1 (ja) * 2007-09-25 2011-01-20 シャープ株式会社 動画像符号化装置及び動画像復号装置
KR20130116897A (ko) * 2010-12-14 2013-10-24 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 예측 인코딩을 위한 인코더 및 방법, 디코딩을 위한 디코더 및 방법, 예측 인코딩 및 디코딩을 위한 시스템 및 방법, 및 예측 인코딩된 정보 신호
KR101587703B1 (ko) 2010-12-14 2016-01-21 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 예측 인코딩을 위한 인코더 및 방법, 디코딩을 위한 디코더 및 방법, 예측 인코딩 및 디코딩을 위한 시스템 및 방법, 및 예측 인코딩된 정보 신호

Also Published As

Publication number Publication date
JP4533841B2 (ja) 2010-09-01
EP1540824A2 (en) 2005-06-15
MXPA05000672A (es) 2005-03-31
AU2003259110A8 (en) 2004-02-02
MY137057A (en) 2008-12-31
AU2003259110A1 (en) 2004-02-02
TWI234402B (en) 2005-06-11
CN1669330A (zh) 2005-09-14
WO2004008642A3 (en) 2004-04-08
EP1540824B1 (en) 2008-02-20
DE60319239D1 (de) 2008-04-03
CN100450185C (zh) 2009-01-07
ES2301828T3 (es) 2008-07-01
TW200412799A (en) 2004-07-16
WO2004008642A2 (en) 2004-01-22
DE60319239T2 (de) 2009-02-26
BR0305517A (pt) 2004-12-28
US7376186B2 (en) 2008-05-20
EP1540824A4 (en) 2005-08-24
BRPI0305517B1 (pt) 2018-04-17
US20040008782A1 (en) 2004-01-15

Similar Documents

Publication Publication Date Title
JP4533841B2 (ja) 加重予測による動き推定
KR100958504B1 (ko) 가중치 예측을 사용한 움직임 추정
JP6086559B2 (ja) ビデオ・データ伝送における参照ピクチャの適応重み付け
KR101017907B1 (ko) 화상 사이의 크로스-페이드를 인코딩하는 방법, 비디오 인코더 및 비디오 코덱
ZA200500417B (en) Adaptive weighting of reference pictures in video decoding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090804

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091104

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100415

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100518

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100614

R150 Certificate of patent or registration of utility model

Ref document number: 4533841

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees