JP2003532309A6 - 適応動きベクトル場符号化 - Google Patents

適応動きベクトル場符号化 Download PDF

Info

Publication number
JP2003532309A6
JP2003532309A6 JP2001515632A JP2001515632A JP2003532309A6 JP 2003532309 A6 JP2003532309 A6 JP 2003532309A6 JP 2001515632 A JP2001515632 A JP 2001515632A JP 2001515632 A JP2001515632 A JP 2001515632A JP 2003532309 A6 JP2003532309 A6 JP 2003532309A6
Authority
JP
Japan
Prior art keywords
motion
vector
coefficients
video codec
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001515632A
Other languages
English (en)
Other versions
JP2003532309A (ja
JP4596718B2 (ja
Inventor
カルチェビッチ マルタ
ライネマ ジャニ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/371,641 external-priority patent/US6735249B1/en
Application filed by Nokia Oyj filed Critical Nokia Oyj
Priority claimed from PCT/US2000/021824 external-priority patent/WO2001011892A1/en
Publication of JP2003532309A publication Critical patent/JP2003532309A/ja
Publication of JP2003532309A6 publication Critical patent/JP2003532309A6/ja
Application granted granted Critical
Publication of JP4596718B2 publication Critical patent/JP4596718B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

ビデオデータの動き補償符号化方法。この方法は、基準フレームに基づいて符号化される現在フレームのビデオピクセルの動きベクトル場を生成するステップと、分割情報を取得するステップと、圧縮された動き情報を提供すべく画像セグメントの動きベクトル場を符号化するステップと、次の画像セグメントの動きベクトル場を予測するステップと、次のセグメントに対し、1組の動き係数及び1組の予測動き係数間の差に対応する1組の細分動き係数を生成するステップとからなる。

Description

【0001】
(技術分野)
本発明は画像圧縮に係り、特に、推定動き場の符号化と、ビデオシーケンスに動き情報を生成することに関するものである。
【0002】
(発明の背景)
動き補償予測は、大部分の画像符号化方式の主要な要素である。動き補償予測の動作を説明するには、各デジタル画像が、その画像の一定の部分に対応して一定のピクセルの組を含むことを理解する必要がある。各ピクセルは、例えば、赤、緑及び青の強度(RGBカラーシステム)か、輝度及び2つの色信号の強度として表される。
【0003】
図1には、実例として、1つの画像の2つのセグメントS及びSが示されており、各セグメントの10から15は、連続する画像の前の画像におけるピクセル位置を示す。現在画像におけるこれらのピクセルの新位置は、符号10’から15’で示される。このピクセル位置の変化、すなわち動きは、これらセグメント内のピクセルの動きベクトルv からv 、及びv からv を定義する。最も単純な場合、セグメントは正方形または長方形である。または、従来のように、図1に示すような任意の形でも良い。
【0004】
図2は、動き補償を用いて画像シーケンスを圧縮するエンコーダの概略図である。このエンコーダの必須要素は、動き補償予測ブロック1、動き場推定ブロック2、及び動き場コーダ3である。動き補償ビデオコーダの動作原理は、現在フレームと称される符号化された着信フレームl(x,y)と予測フレームl^ (x,y)との間の差異である予測誤差E(x,y)を圧縮することにある。ここでは、
【0005】
【数1】
Figure 2003532309
となる。
【0006】
予測フレームI^n(x,y)は、動き補償予測ブロック1によって構成され、先行フレーム、あるいは、基準フレームと称されI ref(x,y)で示される既に符号化された他フレームのピクセル値、及び現在フレーム及び基準フレーム間のピクセルの動きベクトルのピクセル値を用いて組み立てられる。動きベクトルは動き場推定ブロック2によって算出され、結果として得られるベクトル場が何らかの方法で符号化され、予測ブロック1に入力される。この予測フレームを下記式に示す。
【0007】
【数2】
Figure 2003532309
【0008】
ここで、Δx(x,y)及びΔy(x,y)は、位置(x,y)における水平及び垂直方向のピクセル変位の値であり、この1組の数値[Δx(x,y),Δy(x,y)]をそのピクセルの動きベクトルと称す。そして、現在フレームIn(x,y)の全ピクセルの動きベクトルの1組を動きベクトル場と称す。符号化された動きベクトル場は、符号化された予測誤差情報と共に動き情報としてデコーダに送信される。
【0009】
そして、図3に示すように、デコーダでは、基準フレームI ref(x,y)におけるピクセルの予測I^n(x,y)を見つけて復号化予測誤差E^n(x,y)を付加し、現在出力フレームIn(x,y)を再構成する。動き補償予測ブロック21は、受信した動き情報と基準フレームI ref(x,y)とを用いて予測フレームを生成する。予測誤差デコーダ22は、予測フレームに付加する復号化予測誤差E^n(x,y)を生成し、その結果が現在出力フレームIn(x,y)となる。
動き補償(MC)予測の総合的な目的は、例えばEn(x,y)のエネルギーとして計測された予測誤差の量と共にデコーダに送信されるべき情報量をできるだけ少なくすることにある。
【0010】
マサチューセッツ州ケンブリッジにて1990年3月18日―26日に開催されたピクチャーコーディングシンポジウム‘90の議事録、841−845頁、H.Nguen及びE.Duboisの論文“Representation of motion information for image coding”では、動き場符号化技術についての報告がなされている。経験則として、予測誤差の削減はより高度の動き場モデルが必要となる、つまり、より多くのビットがその符号化に必要となる。そのため、画像符号化の全体的な目標は、予測誤差の程度をできるだけ低く保ちつつ動きベクトルをできるだけコンパクトに符号化することにある。
【0011】
図2に示されている動き場推定ブロック2は、所定の画像セグメントにおいてある程度の予測誤差、例えば2乗予測誤差を最小化する所与の画像セグメントの全ピクセルの動きベクトルを算出する。
【0012】
フレームのピクセル数が膨大なため、ピクセル毎に異なる動きベクトルを送信するのは効率的ではない。その代わり、大部分の画像符号化構成では、現在フレームがより大きな画像セグメントに分割されているので、このセグメントの全動きベクトルを少ないパラメータで表すことができる。画像セグメントは正方形のブロックで、例えば16×16及び8×8のピクセルブロックが、国際標準規格ISO/IECのMPEG−1、MPEG−2、MPEG−4またはITU―T H.264及びH.263に従ってコーデックで使用される。また、例えば分割アルゴリズムによって得られた任意の形状の領域で構成してもよい。実際には、セグメントは少なくとも数十のピクセルで構成される。
【0013】
1セグメント中のピクセルの動きベクトルをコンパクトに表現するためには、動きベクトルが少ないパラメータによる関数で表現されるのが望ましい。そのような関数は動きベクトル場モデルと呼ばれる。既知のモデル群は線形動きモデルで、動きベクトルが動き場基底関数の1次結合によって表される。このようなモデルでは、画像セグメントの動きベクトルが下記の一般式で表される。
【0014】
【数3】
Figure 2003532309
【0015】
ここでは、パラメータcが動き係数と称され、デコーダに送信される。一般的に、1セグメント用の動きモデルはN+M動き係数に基づく。関数f(x,y)は動き場基底関数と称され、エンコーダ及びデコーダ双方に対するものとして知られている。既知の動き場推定技術は、動き場を表現するのに用いられるモデルの観点から、かつ選択された予測誤差量を最小化するアルゴリズムによって異なる。
【0016】
また、動きの量及び複雑さもフレーム間及びセグメント間で異なる。例えば、画像の中身が回転したり斜めになったり、画像の一方の側から反対の側に移動する場合がある。一方、ビデオカメラがゆっくりと垂直の軸の周りを回転し、全ピクセルを水平面において少しだけ移動させるような場合もある。このため、セグメントにつきいつもN+M動き係数を用いるのは効率的でない。
動き情報を削減する1つの方法は、ピクセル位置をある画像から他の画像へと動かす動き場モデルから、動き係数の数を単純に減らすものである。しかしながら、動き場モデルのきめが粗くなると、予測誤差は増加する傾向にある。
【0017】
セグメント毎では、十分に低い予測誤差におさめる最少数の動き係数を決める必要がある。そのような動き係数の適応選択プロセスを動き係数除去と称する。このプロセスは、図2にあるように、エンコーダにて動き場符号化ブロック3が実行する。これは、動き場推定ブロック2によって実行される動き場推定の後に実行される。
【0018】
将来的に、デジタル画像伝送は、無線移動端末間で可能になるだろう。通常、そのような端末は追加コンポーネントに対して限られた空間しか持たず、かつ電池駆動のため、デスクトップコンピュータのような固定装置に匹敵する演算容量を搭載する見込みはない。よって、ビデオコーダで実行される動き場コーディングが計算的に単純であり、装置のプロセッサに過度の負担を課すことがないようにすることが重要である。さらに、符号化された動き場モデルは、受信(移動)端末のデコーダにおける後の復号処理を容易にするために、計算的に単純なものにすべきである。
【0019】
異なるモデルで動き推定を行い最適なものを選択する方法は、1994年の音響・音声・信号処理国際会議の議事録、III265−268頁、H,Nicolas及びC.Labitの論文“Region-based motion estimation using deterministic relaxation schemes for image sequence coding”、及び1994年6月発行、IEEE Tran. On Circuits and Systems for Video Technology、4巻、3号、357−364頁、P.Cicconi及びH.Nicolasの論文“Efficient region-based motion estimation and symmetry oriented segmentation for image sequence coding”で提案されている。これらの方法は、異なるモデルで動き推定を行い最適なものを選択することにより、動きの複雑さの程度によって動きモデルを適合させようと試みるものである。これらの方法の主な欠点は、計算に関する複雑度が高く、実際にテスト可能な異なる動き場モデルの数が少ないことである。
【0020】
さらに他の方法が国際出願番号WO97/16025に記載されている。ここで、ビデオコーデックは、動きベクトル場の動き係数の数を最小化する動き場コーダを備える。このコーダでは、第1ブロックが動きベクトル場の新しい行列表記を形成する手段を備える。新規に符号化されたこの動きベクトル場は線形である。次に、第2ブロックは、合成されたセグメントエリアを1つの共通動き場を用いて予測できる場合に隣接セグメント対をマージする手段を備える。情報の合成はデコーダに送信される。次に、第3ブロックは、動き場基底関数を除去する手段を備える。各除去ステップの後、2乗された予測誤差が算出されると共に、この除去処理は誤差の大きさが許容できなくなるまで継続される。そして、最終的な動き係数は、線形行列式を解くことにより計算される。その結果、セグメント毎に数が減らされた動き係数が得られる。そして、これら動き係数がデコーダに送信される。この方法により、ある閾値の予測誤差に達するまで動き係数の除去が可能となる。
しかしながら、復号化された画像の品質低下を最小限にとどめながらデコーダに送られるべき動き情報の量と、動き符号化プロセスの複雑さとをさらに低減させる必要がある。
【0021】
本発明は、復号化された画像の深刻な劣化を招くことなく、動き場推定ブロック2で生じた動き場ベクトル情報の量を大幅に削減することを目的とする。また、本発明の別の目的は、市販の信号プロセッサや汎用マイクロプロセッサを使用して実際に実現できるように、動き場コーダの複雑さを低く抑えることである。
【0022】
(発明の開示)
本発明は添付の特許請求の範囲によって定義される。
ビデオエンコーダの動き場コーダの一部をなす動き分析器において予測動き係数を利用することにより、従来公知の解決法よりもより良い速度歪み性能が達成できる。
また、動き係数除去ブロックを利用して、速度歪み性能をさらに最適化するのに用いられる複数の動き係数の代替組合せを計算できる。動き係数除去ブロックは、ある費用関数を実行し、最終の速度歪みを最適化する組み合わせを見つけるようにするのが好ましい。
【0023】
(発明を実施するための最良の形態)
図1から図3は上述されている。
以下に本発明のあらましを述べ、本発明の各種実施形態をさらに詳しく説明する。
本発明の好適実施形態によれば、ビデオエンコーダの動き場コーダは2つの主ブロックからなる。
【0024】
第1の主ブロックは、図4及び図5の通り、動き分析器32と称される。そのタスクは、図2の動き場推定ブロック2が生成した入力動き場の新しい表現を見つけ出すことにある。この新しい表現は、図4の第2の主ブロック、すなわち動き係数除去ブロック34に適用される。動き分析器における動作は、行列演算を含む複数のステップを含む。第1のステップでは、予測フレームの動きベクトルへの依存度が近似法を用いて線形化される。第2のステップでは、2乗予測誤差の極少化のために行列Aとベクトルdとが構成される。第3のステップでは、対角行列R及び補助ベクトルzの形で柔軟な動き表現を作成するために、Aの因数分解に基づく対角系の1次方程式がたてられる。
【0025】
動き係数除去ブロック34は、動き分析器ブロックが生成した対角行列R及び補助ベクトルzを入力する。1セグメントの動きベクトルは、複数の動き係数で表される。動き係数除去ブロックは、各セグメントに対して、再構成誤差を過剰に増加させることなく動き場モデルを簡略化することが可能かどうかを判断する。通例、いくつかの基底関数が動きモデルから除去されることにより、そのように簡略化された動き場モデルを記述するのに必要となる係数の数はより少なくなる。
【0026】
動き係数除去ブロック34は、対角行列Rの1列を取り除いて新しい配列を三角化することによって、対角行列Rを含む行列式を修正する。その結果、それらの式において動き係数が1つ少なくなり、ベクトルzから1つの項が取り除かれる。この処理は、動き場モデルから1つの基底関数を取り除くことに相当する。選択された予測誤差の程度、すなわち費用関数を最適化する動き場モデルを決定するために、動き場モデルに残存する基底関数がなくなるまで、これらの処理が繰り返される。基底関数が取り除かれるたびに、行列式を解いて新しい動き係数の組が推定される。これは、例えば、後退代入のような公知のアルゴリズムであるなら、どのようなものを用いても良い。最終組の動きパラメータ、すなわち、特定セグメントの動きを表現するのに選択されたものは、費用関数を最小にするものである。ここで、費用関数は、予測誤差量と画像を復号するのに要する情報量との加重合計であるのが好ましい。
【0027】
各処理セグメントに対し、動き係数除去ブロック34は動き場モデルから取り除かれた基底関数を定義する選択情報を出力する。加えて、残存する基底関数に対応する新しい動き係数も出力する。そして、選択情報と新しい動き係数の両方がデコーダに送信される。
【0028】
図4は本発明の1つの実施形態による動き場エンコーダ3を示しており、図2のブロック3に対応する。動き場エンコーダは基準フレームI~ ref(x,y)、現在フレームI~ (x,y)、予測動き係数、もしあれば図2の動き場推定ブロック2が生成した動きベクトル場[x(x、y),y(x,y)]を入力する。
ビデオエンコーダの出力は、1つのセグメントSに対して動き係数が定義したセグメントに分割されて圧縮されたフレームを含んでいる。このセグメントSは座標(xi,yi)のP個のピクセルからなる(ここではi=1,2,...P)。動き場コーダのタスクは、圧縮された動きベクトル場[Δx(・),Δy(・)]の動き係数c=(c ,c ,...,c N+M)を見つけ出すことにある。ここで、動きベクトルはある線形動きモデルによって表され、そのフィールドは下記の形式からなる。
【0029】
【数4】
Figure 2003532309
【0030】
これにより、選択された費用関数、例えばラグランジュ・コストが下記の通り最小化される。
【数5】
Figure 2003532309
【0031】
ここで、歪みD(S)は、元のセグメント及び符号化されたセグメント間の2乗誤差である。そして、速度R(S)は、セグメントを符号化するのに必要なビットの数と等しく、パラメータlは、符号化されたセグメントの品質とそのセグメントの圧縮に要するビット数とのトレードオフを定めるあらかじめ定義された係数である。
【0032】
このタスクの条件を満たすために、動き場コーダ3は2つの主ブロックからなる。すなわち、それらは動き分析器ブロック32と動き係数除去ブロック34である。動き分析器32の目的は、動き場の新しい表現を見つけることである。この新しい表現は、後に動き係数除去ブロックで用いられ、素早くかつ柔軟な方法で、所定の画像セグメントに対する動き係数を見つけ出す。動き係数除去ブロック34は、1つのセグメントの動き場を表すために用いられる動き情報の量を減少させ、その結果、以下に定義するように、2乗予測誤差を増加させる。
【0033】
【数6】
Figure 2003532309
【0034】
動き分析器32の動作を次に図5を参照して詳細に説明する。動き分析器32の動作は以下のステップからなる。
ステップ1:誤差の線形化。ブロック42。このステップでは、[Dx(x,y),Dy(x,y)]への依存度が線形をなすように、式(6)の基準フレームI~ ref(x,y)を公知の近似法を用いて近似する。そして、式(6)の合計における要素が動き係数Cの線形結合になる。
【0035】
【数7】
Figure 2003532309
【0036】
ステップ2:行列の構成。ブロック43。式の最小化は行列式(E−y)T(E−y)の最小化、あるいは下記式の解とまったく等価となる。
【数8】
Figure 2003532309
ここで、A=E T及びd=E T。そしてベクトルyはブロック46で作られる。
【0037】
【数9】
Figure 2003532309
【0038】
ステップ3:三角化と出力の生成。ブロック44。このステップでは、Aを下位の対角行列R Tとその転置行列R Tとの積に分解するための公知の方法を用いて式を三角化する。
【数10】
Figure 2003532309
これは、コレスキー分解を用いて行うことができる。
【0039】
そして、補助ベクトルz が、例えば後退代入を用いて下記式を解くことにより作成される。
【数11】
Figure 2003532309
【0040】
下記に示すように、式(7)を最小化する動き係数cのベクトルは、対角配列では未知のベクトルである。
【数12】
Figure 2003532309
そして、必要であれば、例えば後退代入を用いて解くことができる。
【0041】
動き係数cは、予測動き係数p及び細分動き係数rの合計として得られる。予測動き係数は、以前に生成された動き係数と細分動き係数から予測され、その予測動き係数と、動き場推定ブロック(図2)で計算された動き係数との差に対応する。この場合、式(12)は以下の形をとる。
【0042】
【数13】
Figure 2003532309
【0043】
そして出力ベクトルzは、下記式を計算することにより得られる。
【数14】
Figure 2003532309
【0044】
ブロック47は項z を形成し、ブロック45はRを生成する。そして、次の動き係数除去ブロック34の出力は、絶対動き係数ではなく、細分動き係数となる。もしくは、出力ベクトルz=z となる。
動き係数除去ブロック34は、動き分析器ブロック32が生成した入力行列Rとベクトルzとして受信する。各セグメントの動きベクトルはN+M個の動き係数で表される。
【0045】
所定セグメントSに対して、動き係数除去ブロックは、選択された誤差量を過剰に増加することなく、動き場モデルを簡略化することが可能かどうかを判断する。簡略化された動き場モデルは、本願の背景技術において説明した式(3)におけるモデルから基底関数が取り除かれる際に得られる。そのような簡略化された動き場モデルを記述するのに必要な係数の数はより少なくてすむ。
【0046】
最適な動きベクトル場を見つけ出すためには、以下の繰返し手順が実行される。
ステップA:初期コスト計算。セグメントに対するラグランジュ・コストは完全な動きモデルで評価され、動き係数のフルセットと共に格納される。
ステップB:予測品質への影響が最小の基底関数を求める。R は、残存するn個の基底関数を伴うn×nの上位対角固有行列を示し、R n,iはi番目の列が取り除かれた同行列を示す。ここで、行列R からi番目の列が取り除かれ、c からi番目の要素が取り除かれてn組の式が生成される。
【0047】
【数15】
Figure 2003532309
【0048】
生成されたすべての式は、スカラーによる一連の行の乗法を適用した後、それらの行の加算を行う公知の方法で三角化される。つまり方程式(15)は次の形に変換される。
【数16】
Figure 2003532309
【0049】
ここで、(qは、i番目の基底関数を動きモデルから除去することより生じる2乗予測エラーの増分の近似値である。除去の際に最小の(q値を生じる列は、この繰返し中に除去されるべきものであり、i番目の基関数を動きモデルから効果的に除去させる。
【0050】
ステップC:基底関数のモデルからの除去。新しい行列式は、除去すべき基底関数に関連する行列R n,i及びベクトルz n,iを選択し、行列の最終行及びベクトルの最終要素を以下のように除去して作られる。
【数17】
Figure 2003532309
【0051】
ステップD:係数計算。数が削減された基底関数の組に対し、以下の三角配列を解くことにより、動き係数の新しい組を計算する。
【数18】
Figure 2003532309
例えば、後退代入によって上記計算を行う。
【0052】
ステップE:コスト計算。このモデルがその時点で最上のものであれば、セグメントに対するラグランジュ・コストが評価され、1組の動きパラメータと共に格納される。
ステップF:最終動きモデル選択。まだ除去すべき基底関数がある場合、ステップBからEの処理を繰り返す。モデルから基底関数が全て除去されている場合は、その出力が生成される。その出力は、残存基底関数に対応する新しい動き係数と共に、どの基底関数を動き場モデルから除去すべきかを記述する選択情報とで構成されている。そして、選択情報及び動き係数両方ともがデコーダに送信される。
【0053】
従来技術の解決策に対する本発明の主たる利点は、再構築誤差を過度に増加させることなく、動き情報量を大幅に削減できることである。加えて、システム全体の複雑さの度合いが低いので、市販の信号プロセッサや汎用マイクロプロセッサに現実的に実装できる。
動き係数除去ブロックは、ビデオシーンにおける実際の動きの量と種類に動きモデルを瞬時に合わせる非常に強力なツールとなる。このブロックは、動きパラメータ予測の有無にかかわらず、多くの動きモデルをテストするのに用いられる。この構成の優れた利点は、動きモデルを変更する際に動き推定プロセスを繰り返す必要が無く、そのために演算的に単純なことである。
動き分析器が従う動き推定を利用することにより、動き場コーダは、1次方程式の非常に単純な系列を計算により解き、いかなる所望の動き場モデルに対しても新しい動き係数を発見できる。
【0054】
好適な実施形態では、6つの係数を持ち正規直交化された擬似動きベクトル場モデルが使われる。実際に、このモデルは、ビデオシーケンスの非常に複雑な動きでさえ高精度に処理することができ、良い予測結果を生み出す。
擬似動きベクトル場は、1組の動き係数で動きベクトルの近似値を得るのに用いられる動きモデルである。擬似動きモデルは、各種の動きを描写できるが、その中には、移動、回転、拡大縮小及び傾斜などの動作が含まれる。擬似動きモデルは6つの基底関数からなり、その場合に動きベクトルは、動き係数が掛けられた6つの基底関数を含む和データと実質的に置換可能であり、各動き係数は1つの特定基底関数に対して計算される。基底関数自体は、エンコーダ及びデコーダいずれに対しても公知のものである。
【0055】
動き分析器ブロック32において、ステップ1の線形化は、以下のポイントを取り囲むピクセル(x,y)毎に基準フレームI ref(x,y)のテイラー展開を用いて実行される。なお、ここでi=1,2,...,P(Pはセグメント内のピクセル数)。
【0056】
【数19】
Figure 2003532309
【0057】
そして、Σa=Σ(−a)である特性を用いると、予測誤差は次の通りとなる。
【数20】
Figure 2003532309
【0058】
補助値g(x,y)は下記式を用いて算出される。
【数21】
Figure 2003532309
【0059】
ここで、関数f(x,y)は式(4)で定義されるような基底関数である。式(9)の行列E及びベクトルyは下記式を用いてつくられる。
【数22】
Figure 2003532309
【数23】
Figure 2003532309
【0060】
(x,y)及びG(x,y)は、公知の3次スプライン補間関数の導関数を用いて計算された基準フレームI ref(x,y)の水平及び垂直の勾配の値である。
行列Aは、コレスキー分解を使って因数分解され、式(15)の配列はギブンズ回転列を用いて三角化される。
【0061】
新しい動きモデルに対する動き係数は、後退代入アルゴリズムを用いて式(18)を解くことにより計算される。
ref(x,y)、G(x,y)及びG(x,y)のピクセル値は、x及びyの整数座標に対してのみ定義される。xまたはyが整数でないとき、ピクセル値は。xとy近辺の整数ピクセル値を用いた3次スプライン補間を使って計算される。
【0062】
図6は本発明の1つの実施形態の移動局MSを示す。中央処理ユニット、すなわちマイクロプロセッサπPは移動局の異なる機能を担うブロック、すなわち、ランダムアクセスメモリRAM、高周波ブロックRF、読み出し専用メモリROM、ディスプレイDPLとキーボードKBDを有するユーザインタフェースUI、及びデジタルカメラブロックCAMを制御する。マイクロプロセッサの動作指示、すなわちプログラムコードと移動局の基底関数は、前もって、例えば製造工程中に移動局のROMに格納される。そのプログラムに従い、マイクロプロセッサは無線路上でメッセージを送受信するための高周波ブロックRFを用い、ユーザインターフェースUIの状態をモニタし、デジタルカメラブロックCAMを制御する。そして、ユーザコマンドに応じて、マイクロプロセッサはデジタル画像をRAMに記録するようデジタルカメラブロックCAMに指示する。ひとたび画像が取り込まれるか、あるいは画像取り込みプロセスの間、マイクロプロセッサは前述したような圧縮画像を生成するために、画像を画像セグメントに分割してそれらセグメントに対する動き場モデルを計算する。ディスプレイ上に画像を表示するよう、あるいはRFブロックを用いて圧縮画像を他の移動局、有線電話機、ファクシミリ装置、または他の電気通信装置に送るよう、ユーザは移動局にコマンドを送ることができる。
【0063】
好適な実施形態においては、受信者が最少遅延時間で復号処理を始められるように、最初のセグメントが符号化されるとすぐに画像送信が開始される。また、他の実施形態においては、移動局は、符号化、そしておそらくデジタルビデオデータを復号化する専用のエンコーダブロックENCを備える。
【0064】
図7は本発明の1つの実施形態による移動電気通信網の概略図である。ここでは、移動局MSが無線リンクによって基地局BTSと通信している。基地局BTSは、いわゆるAbisインタフェースを通じて基地局コントローラBSCにさらに接続される。基地局コントローラBSCは、いくつかの基地局を制御、管理する。複数の基地局BTS(通常は数ダースの基地局)及び1つの基地局コントローラBSCによって構成されるエンティティは、基地局システムBSSと呼ばれる。特に、基地局コントローラBSCは無線通信チャンネルとハンドオーバとを管理する。一方、基地局コントローラBSCは、いわゆるAインタフェースを介して移動サービス交換局MSCに接続される。移動サービス交換局MSCは、移動局から、あるいはそれら移動局への接続の形成を調整する。そして、移動サービス交換局MSCを介して、移動通信網の外部にさらに接続される。移動通信網の外部には、ゲートウェイGTW、例えばインターネットによって移動通信網に接続された他の通信網がさらに存在する。そのような外部ネットワーク、または電気通信ネットワークでは、コンピュータPC等のビデオ復号または符号化局が設置されている場合もある。本発明の実施形態において、移動電気通信網はこのようなサービスへ加入しているMSにビデオデータを提供するビデオサーバVSRVRを備える。このビデオデータは、本文献で先に述べたように、動き補償画像圧縮法を用いて圧縮される。ここでは、ビデオサーバがオンラインビデオソースへのゲートウェイとして機能するか、あるいは以前に記録されたビデオクリップを含んでいる。
【0065】
本システムは、本発明の精神及び範囲から逸脱することなく、様々な方法で実現することができる。例えば、
・異なる動きモデルを使用できる。
・方程式(5)で与えられたラグランジュ・コストの代わりに、異なるコスト関数を用いることができる。
・式(6)の項を線形化するために異なる方法を使用できる(コレスキー分解の代わりにQR分解を用いる等)。
・基底関数の除去順序を決定する方法を変更できる(例えば、式(16)における評価q’の代わりに予め定義した順番を使用できる)。
【0066】
・動きモデルによっては動き係数除去ブロックで省略できる(入力係数の中で無視し得るレベルのものがあれば、対応する基底関数を廃棄するとの決定ができる等)。
・動き係数除去ブロックにおけるコスト計算は、基底関数の除去の直後に行う必要はなく、遅延してもよい。これは、係数除去ブロックのステップB−DがステップB−Eの代わりに繰り返されてもよいことを意味する。そして、ステップE(コスト計算)は、(このセグメントに対して)生成された全動きモデルに対する他のループで実行される場合もある。
【0067】
・式(15)の配列の三角化は様々なアルゴリズムを使用して実行可能である。
・式(18)を求めることによる最終係数計算は、1次方程式の配列を解く多数の公知アルゴリズムを用いて実行可能である。
・式(13)及び(14)における予測項は、式(23)の動きベクトル(Dx(x,y)及びDy(x,y))を動きベクトルの細分(推定動きベクトルと予測動きベクトル間の差)によって置き換えることによって代替的に組み入れられる。
・非整数座標において基準フレームI ref(x,y)、G(x,y)及びG(x,y)の値を得るのに、異なる補間方法を用いることができる。
【図面の簡単な説明】
【図1】
セグメントに分割された画像の概略図である。
【図2】
従来技術によるエンコーダの概略図である。
【図3】
従来技術によるデコーダの概略図である。
【図4】
本発明の1つの実施形態による動き場コーダである。
【図5】
本発明の1つの実施形態による動き分析器である。
【図6】
本発明の1つの実施形態による移動局の概略図である。
【図7】
本発明の1つの実施形態による移動電気通信網の概略図である。

Claims (20)

  1. ビデオデータを動き補償符号化するためのビデオコーデックであって、
    基準フレームに基づいて符号化すべき現在フレームのビデオピクセルの動きベクトル場を生成する手段と、
    前記現在フレームの画像セグメントへの分割を定義する分割情報を取得する手段と、
    (x,y)がある1組の基底関数を定義し、iが各基底関数及び対応する動き係数間の対応を定義するインデックスである場合に、c・f(x,y)が前記動きベクトル場を表すように、1つの画像セグメントSの動きベクトル場を符号化し、前記1組の動き係数cを含む動き係数ベクトルcを含む圧縮された動き情報を提供する動き場コーダと、
    以前に生成された前記動き係数ベクトルcに基づき1組の予測動き係数pで後続の画像セグメントSLの動きベクトル場を予測する予測手段と、
    前記後続のセグメントSに対して、前記1組の動き係数c及び前記1組の予測動き係数p間の差に相当する1組の細分動き係数rをp+r=cとなるように生成する手段とを含むことを特徴とするビデオコーデック。
  2. 請求項1に記載のビデオコーデックにおいて、
    前記後続の画像セグメントSに対して近似行列E及び近似ベクトルyを計算する手段と、
    を前記後続の画像セグメントSの前記動きベクトル場を前記1組の基底関数と共に近似させるための動き係数cのベクトルとした場合に、前記後続セグメントの予め定義された歪み速度を関数E−yとして計算する手段と、
    対角出力行列R及び出力ベクトルzを含む出力パラメータを生成する手段とを含む動き分析器を備えることを特徴とするビデオコーデック。
  3. 請求項2に記載のビデオコーデックにおいて、
    前記動きベクトル場が1つの擬似モデルによって表現されることを特徴とするビデオコーデック。
  4. 請求項2に記載のビデオコーデックにおいて、
    少なくとも2組の代替動き係数を生成するために、少なくとも1つの動き係数を削減して動き係数の数を減らす係数除去ブロックと、
    1組の動き係数のコストを計算する手段と、
    前記代替動き係数の組の中から最小コストを生じる動き係数の組を選択する手段とをさらに含むことを特徴とするビデオコーデック。
  5. 請求項4に記載のビデオコーデックにおいて、
    前記コストは、ビデオ符号化誤差と、前記動き係数の組で1つの画像セグメントを符号化するのに要するデータ量との関数であることを特徴とするビデオコーデック。
  6. 請求項2に記載のビデオコーデックにおいて、
    前記行列Rが、行列A=E Tを下位の対角行列R Tおよびその転置行列Rに分解し、A=G Tとなるように取得されることを特徴とするビデオコーデック。
  7. 請求項2に記載のビデオコーデックにおいて、
    前記ベクトルzは、d=E Tを計算し、前記1組の式A=G Tを解くことによって取得されることを特徴とするビデオコーデック。
  8. 請求項2に記載のビデオコーデックにおいて、
    ベクトルzは、動きパラメータ予測ベクトルpが存在する場合、d=E Tを計算し、前記1組の式A=G Tを解き、z=QT を計算することによって取得されることを特徴とするビデオコーデック。
  9. 請求項1に記載のビデオコーデックを含む記憶装置。
  10. 請求項1に記載のビデオコーデックを含む移動局。
  11. 請求項1に記載のビデオコーデックを含む移動電気通信網。
  12. 請求項1に記載のビデオコーデックを含むコンピュータプログラム製品。
  13. ビデオデータの動き補償符号化方法であって、
    基準フレームに基づいて符号化すべき現在フレームのビデオピクセルの動きベクトル場を生成するステップと、
    前記現在フレームの画像セグメントへの分割を定義する分割情報を取得するステップと、
    (x,y)がある1組の基底関数を定義し、iが各基底関数及び対応する動き係数間の対応を定義するインデックスである場合に、c・f(x,y)が前記動きベクトル場を表すように、1つの画像セグメントSの動きベクトル場を符号化し、前記1組の動き係数cを含む動き係数ベクトルcを含む圧縮された動き情報を提供するステップと、
    以前に生成された前記動き係数ベクトルcに基づき1組の予測動き係数pで後続の画像セグメントSLの動きベクトル場を予測するステップと、
    前記後続のセグメントSに対して、前記1組の動き係数c及び前記1組の予測動き係数p間の差に相当する1組の細分動き係数rをp+r=cとなるように生成するステップとを含むことを特徴とする方法。
  14. 請求項13に記載の方法において、
    前記後続の画像セグメントSに対して近似行列E及び近似ベクトルyを計算するステップと、
    を前記後続の画像セグメントSの前記動きベクトル場を前記1組の基底関数と共に近似させるための動き係数cのベクトルとした場合に、前記後続セグメントの予め定義された歪み速度を関数E−yとして計算するステップと、
    対角出力行列R及び出力ベクトルzを含む出力パラメータを生成するステップとをさらに含むことを特徴とする方法。
  15. 請求項14に記載の方法において、
    前記動きベクトル場が1つの擬似モデルによって表現されることを特徴とする方法。
  16. 請求項14に記載の方法において、
    少なくとも2組の代替動き係数を生成するために、少なくとも1つの動き係数を削減して動き係数の数を減らすステップと、
    1組の動き係数のコストを計算するステップと、
    前記代替動き係数の組の中から最小コストを生じる動き係数の組を選択するステップとをさらに含むことを特徴とする方法。
  17. 請求項16に記載の方法において、
    前記コストは、ビデオ符号化誤差と、前記動き係数の組で1つの画像セグメントを符号化するのに要するデータ量との関数であることを特徴とする方法。
  18. 請求項14に記載の方法において、
    行列A=E Tを下位の対角行列R Tおよびその転置行列Rに分解し、A=G Tとなるように前記行列Rを取得するステップをさらに備えることを特徴とする方法。
  19. 請求項14に記載の方法において、
    =E Tを計算し、前記1組の式A=G Tを解くことによって前記ベクトルz取得するステップをさらに備えることを特徴とする方法。
  20. 請求項14に記載の方法において、
    動きパラメータ予測ベクトルpが存在する場合、d=E Tを計算し、前記1組の式A=G Tを解き、z=QT を計算することによってベクトルzを取得するステップをさらに備えることを特徴とする方法。
JP2001515632A 1999-08-11 2000-08-10 適応動きベクトル場符号化 Expired - Fee Related JP4596718B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US09/371,641 US6735249B1 (en) 1999-08-11 1999-08-11 Apparatus, and associated method, for forming a compressed motion vector field utilizing predictive motion coding
US09/371,641 1999-08-11
US09/489,327 2000-01-21
US09/489,327 US6711209B1 (en) 1999-08-11 2000-01-21 Adaptive motion vector field coding
PCT/US2000/021824 WO2001011892A1 (en) 1999-08-11 2000-08-10 Adaptive motion vector field coding

Publications (3)

Publication Number Publication Date
JP2003532309A JP2003532309A (ja) 2003-10-28
JP2003532309A6 true JP2003532309A6 (ja) 2004-07-08
JP4596718B2 JP4596718B2 (ja) 2010-12-15

Family

ID=27005456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001515632A Expired - Fee Related JP4596718B2 (ja) 1999-08-11 2000-08-10 適応動きベクトル場符号化

Country Status (7)

Country Link
US (1) US7161983B2 (ja)
EP (1) EP1228645B1 (ja)
JP (1) JP4596718B2 (ja)
CN (1) CN1229997C (ja)
AT (1) ATE241887T1 (ja)
DE (1) DE60003070T2 (ja)
WO (1) WO2001011892A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735249B1 (en) * 1999-08-11 2004-05-11 Nokia Corporation Apparatus, and associated method, for forming a compressed motion vector field utilizing predictive motion coding
US6530329B2 (en) * 2001-05-15 2003-03-11 Matthew A. Katzer Model train control system
GB2374479B (en) * 2001-04-12 2005-05-04 Snell & Wilcox Ltd Video signal processing
US20060100753A1 (en) * 2004-11-10 2006-05-11 Katzer Matthew A Model train control
CN100393133C (zh) * 2004-12-30 2008-06-04 中兴通讯股份有限公司 一种视频序列中运动物体的分割方法
KR100746022B1 (ko) * 2005-06-14 2007-08-06 삼성전자주식회사 서브픽셀 움직임 추정시 모델 스위칭을 통한 압축 효율을증가시키는 인코딩 방법 및 장치
US7944965B2 (en) * 2005-12-19 2011-05-17 Seiko Epson Corporation Transform domain based distortion cost estimation
KR100939917B1 (ko) 2008-03-07 2010-02-03 에스케이 텔레콤주식회사 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법
US8107750B2 (en) * 2008-12-31 2012-01-31 Stmicroelectronics S.R.L. Method of generating motion vectors of images of a video sequence
US8254443B2 (en) * 2009-08-28 2012-08-28 Ericsson Television, Inc. Latency rate distortion optimisation
TWI498008B (zh) * 2009-12-30 2015-08-21 Altek Corp Method of Adjusting Camera Parameters of Whole - week Images
JP5441803B2 (ja) * 2010-04-12 2014-03-12 キヤノン株式会社 動きベクトル決定装置及び動きベクトル決定方法、コンピュータプログラム
EP2490448A1 (de) * 2011-02-18 2012-08-22 Siemens Aktiengesellschaft Kodierverfahren und Bildkodiervorrichtung zur Kompression einer Bildsequenz
US8644383B2 (en) * 2011-03-10 2014-02-04 Microsoft Corporation Mean absolute difference prediction for video encoding rate control
US8891626B1 (en) * 2011-04-05 2014-11-18 Google Inc. Center of motion for encoding motion fields
EP2727357A1 (en) 2011-07-01 2014-05-07 Motorola Mobility LLC Motion vector prediction design simplification
US20130083845A1 (en) 2011-09-30 2013-04-04 Research In Motion Limited Methods and devices for data compression using a non-uniform reconstruction space
WO2013067440A1 (en) 2011-11-04 2013-05-10 General Instrument Corporation Motion vector scaling for non-uniform motion vector grid
EP2595382B1 (en) 2011-11-21 2019-01-09 BlackBerry Limited Methods and devices for encoding and decoding transform domain filters
US8908767B1 (en) 2012-02-09 2014-12-09 Google Inc. Temporal motion vector prediction
ITVI20120087A1 (it) 2012-04-17 2013-10-18 St Microelectronics Srl Stabilizzazione video digitale
US9172970B1 (en) 2012-05-29 2015-10-27 Google Inc. Inter frame candidate selection for a video encoder
US11317101B2 (en) 2012-06-12 2022-04-26 Google Inc. Inter frame candidate selection for a video encoder
US9485515B2 (en) 2013-08-23 2016-11-01 Google Inc. Video coding using reference motion vectors
US9503746B2 (en) 2012-10-08 2016-11-22 Google Inc. Determine reference motion vectors
US20140169444A1 (en) * 2012-12-14 2014-06-19 Microsoft Corporation Image sequence encoding/decoding using motion fields
EP2997732A1 (en) * 2013-05-15 2016-03-23 VID SCALE, Inc. Single loop decoding based inter layer prediction
US9313493B1 (en) 2013-06-27 2016-04-12 Google Inc. Advanced motion estimation
KR102059066B1 (ko) * 2015-08-24 2019-12-24 후아웨이 테크놀러지 컴퍼니 리미티드 모션 벡터 필드 코딩 방법 및 디코딩 방법, 및 코딩 및 디코딩 장치들
US10375156B2 (en) 2015-09-11 2019-08-06 Facebook, Inc. Using worker nodes in a distributed video encoding system
US10499070B2 (en) 2015-09-11 2019-12-03 Facebook, Inc. Key frame placement for distributed video encoding
US10506235B2 (en) 2015-09-11 2019-12-10 Facebook, Inc. Distributed control of video encoding speeds
US10602153B2 (en) 2015-09-11 2020-03-24 Facebook, Inc. Ultra-high video compression
US10602157B2 (en) 2015-09-11 2020-03-24 Facebook, Inc. Variable bitrate control for distributed video encoding
US10341561B2 (en) * 2015-09-11 2019-07-02 Facebook, Inc. Distributed image stabilization
US10063872B2 (en) 2015-09-11 2018-08-28 Facebook, Inc. Segment based encoding of video
US10814238B2 (en) * 2015-10-16 2020-10-27 Anthony John Ireland Overlay speed improvements for a layout control system
JP6669617B2 (ja) * 2016-09-12 2020-03-18 ルネサスエレクトロニクス株式会社 動画像処理システム
WO2018209067A1 (en) * 2017-05-11 2018-11-15 Vid Scale, Inc. Higher-order motion models and graduated motion parameter estimation for video coding

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE469866B (sv) 1991-04-12 1993-09-27 Dv Sweden Ab Metod för estimering av rörelseinnehåll i videosignaler
US5594504A (en) 1994-07-06 1997-01-14 Lucent Technologies Inc. Predictive video coding using a motion vector updating routine
DE69511119T2 (de) 1995-10-20 2000-02-03 Nokia Mobile Phones Ltd Kodierung eines feldes von bewegungsvektoren
US5778192A (en) 1995-10-26 1998-07-07 Motorola, Inc. Method and device for optimal bit allocation between different sources of information in digital video compression
ES2182972T3 (es) 1996-04-19 2003-03-16 Nokia Corp Codificador y descodificador de video utilizando procedimientos de segmentacion y fusion de movimiento.
WO1998042137A1 (en) 1997-03-14 1998-09-24 Cselt-Centro Studi E Laboratori Telecomunicazioni S.P.A. Circuit for motion estimation in digitised video sequence encoders
JP3351705B2 (ja) * 1997-04-25 2002-12-03 日本ビクター株式会社 動き補償符号化装置、動き補償符号化方法、及び記録媒体への記録方法
US5978048A (en) * 1997-09-25 1999-11-02 Daewoo Electronics Co., Inc. Method and apparatus for encoding a motion vector based on the number of valid reference motion vectors
GB2343319B (en) 1998-10-27 2003-02-26 Nokia Mobile Phones Ltd Video coding
US6418166B1 (en) * 1998-11-30 2002-07-09 Microsoft Corporation Motion estimation and block matching pattern

Similar Documents

Publication Publication Date Title
JP4596718B2 (ja) 適応動きベクトル場符号化
JP2003532309A6 (ja) 適応動きベクトル場符号化
US6711209B1 (en) Adaptive motion vector field coding
US6954502B2 (en) Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
AU2002324085C1 (en) Method for sub-pixel value interpolation
US8625916B2 (en) Method and apparatus for image encoding and image decoding
US6507617B1 (en) Video coding
JPH09172644A (ja) アフィン変換による動き補償フレーム間予測方式を用いた動画像符号化・復号化装置
JPH0795594A (ja) 半画素精度の動きベクトル検出方法および装置
AU2002324085A1 (en) Method for sub-pixel value interpolation
EP1256238A1 (en) Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
JP4417054B2 (ja) 離散コサイン変換係数を参照する動き推定方法及び装置
WO2019080892A1 (zh) 确定仿射编码块的运动矢量的方法和装置
Ribas-Corbera et al. Optimizing block size in motion-compensated video coding
JP2000224593A (ja) フレーム補間方法および装置およびこの方法を記録した記録媒体
US20120218443A1 (en) Decoder-derived geometric transformations for motion compensated inter prediction
CN117223289A (zh) 仿射运动的双边匹配
JP2001224036A (ja) 動画像符号化装置
KR0149938B1 (ko) 프랙탈과 움직임 보상을 이용한 동영상 압축 장치 및 그 압축 방법
JP2005516501A (ja) Pbフレームモードでのビデオ画像の符号化
Li et al. Side information extrapolation using motion-aligned auto regressive model for compressed sensing based Wyner-Ziv codec
AU2007237319B2 (en) Method for sub-pixel value interpolation
JP4134078B2 (ja) 動画像復号化装置
CN117296322A (zh) 仿射模型在仿射双边匹配中的使用
JP2004080682A (ja) 動画像データ符号化装置および動画像データ復号装置ならびにそれらの方法