JP2000512440A - 動きベクトルフィールド符号化 - Google Patents

動きベクトルフィールド符号化

Info

Publication number
JP2000512440A
JP2000512440A JP09516308A JP51630897A JP2000512440A JP 2000512440 A JP2000512440 A JP 2000512440A JP 09516308 A JP09516308 A JP 09516308A JP 51630897 A JP51630897 A JP 51630897A JP 2000512440 A JP2000512440 A JP 2000512440A
Authority
JP
Japan
Prior art keywords
motion
video codec
coefficient
matrix
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP09516308A
Other languages
English (en)
Other versions
JP3781194B2 (ja
Inventor
ニービグロスキー,ジャセック
カークセビクス,マータ
Original Assignee
ノキア モービル フォーンズ リミティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノキア モービル フォーンズ リミティド filed Critical ノキア モービル フォーンズ リミティド
Publication of JP2000512440A publication Critical patent/JP2000512440A/ja
Application granted granted Critical
Publication of JP3781194B2 publication Critical patent/JP3781194B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/543Motion estimation other than block-based using regions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 ビデオ符復号器は、動きベクトルフィールドの動き係数の個数を最小限にするための動きフィールド符号器を含んでいる。この符号器において、第1のブロックは、動きベクトルフィールドの新しい行列表示を作成するための手段を含んでいる。その新しい符号化されている動きベクトルフィールドは線形である。第2の主なブロックは、隣り合うセグメント同士の対を、もしその結合されたセグメント領域を共通の動きフィールドを使って予測することができるならば、併合させるための手段を含んでいる。併合情報は復号器に送られる。第3の主なブロックは、動きフィールド基底関数を除去するための手段を含んでいる。各除去ステップの後、二乗予測エラーが計算され、エラーの変化量が許容できない程度となるまで除去が続けられる。線形行列方程式を解くことによって最終の動き係数が計算される。その結果として、各セグメントの動き係数の個数が減らされる。各動き係数は復号器に送られる。

Description

【発明の詳細な説明】 動きベクトルフィールド符号化 発明の分野 本発明は、一般的にはビデオ圧縮に関する。より正確には、本発明は、推定さ れた動きフィールド(motion field)を符号化してビデオシーケンスにおける動 き情報を作成する方法に関する。 発明の背景 動き補償予測は、大多数のビデオ符号化方式の非常に重要な要素である。図1 は、動き補償を使用してビデオシーケンスを圧縮する符号器の略図である。この 符号器の必須要素は、動き補償予測ブロック1,動き推定器2,及び動きフィー ルド符号器3である。動き補償ビデオ符号器の動作原理は、現在のフレームと呼 ばれる符号化 予測エラーEn(x,y)を圧縮するというものであり、ここで、 ものであって、前の、或いはその他の既に符号化されている e)と呼ばれる)のピクセル値と、現在のフレーム及び参照フレームの間の各ピク セルの動きべクトル(motion vector)とを使って作成される。動きベクトルは動 きフィールド推定器2により計算され、その結果として得られたベクトルフィー ルドは、予測ブロック1に入力される前に何らかの方法で符号化される。予測フ レームは次の通りである: 数の対[x+Δx(x,y),y+Δy(x,y)]は、現在のフレームの中の場所(x,y)のピク セルの動きベクトルと呼ばれ、Δx(x,y)及びΔy(x,y)はこのピクセルの水平変位 及び垂直変位の値である。現在のフレームln(x,y)の中の全てのピクセルの動き ベクトルの集合は動きベクトルフィールドと称される。符号化された動きベクト ルフィールドは動き情報として復号器にも送られる。 図2の復号器において、現在のフレームln(x,y)の各ピクセルは めることによって、復元(再構成)される。動き補償予測ブロック では参照フレームは現在のフレームと同じである)を使用して予測フレームを作 成する。予測エラー復号器22において、復号された予測エラーEn(x,y)が予測 フレームと加算されて、元の現在のフレームlnが得られる。 動き補償(motion compensated(MC))予測の一般的目的は、復号器に送らな ければならない情報の量をなるべく少なくすることである。この予測は、例えば En(x,y)のエネルギーとして測定された予測エラーの量をなるべく少なくし、且 つ、動きベクトルフィールドを表示するのに必要な情報の量をなるべく少なくす るべきである。 1990年3月26−18日、マサチューセッツ州ケンブリッジ市での画像符 号化シンポジウム’90の議事録、841-845ページに掲載されているH.グエン 、E.デュボアの文献”画像符号化のための動き情報の表示”(the document H.N guen,E.Dubois,”Representation of motion information for image coding ".Proc.Picture Coding Symposium'90,Cambridge,Massachusetts,March 26 -18,1990,pages 841-845)は、動きフィールド符号化手法を概説している。大 ざっぱに言うと、予測エラーを小さくするためには、より複雑な動きフィールド が必要である、即ち、より多数のビットをその符号化のために使用しなければな らない。従って、ビデオ符号化の総合的目的は、予測エラーの尺度をなるべく低 く保ちながら動きベクトルフィールドをなるべくコンパクトに符号化することで ある。 動きフィールド推定ブロック1(図1)は、与えられたセグメントの全てのピ クセルの、このセグメントの例えば二乗予測エラー(square prediction error) などの予測エラーの何らかの尺度を最小にする動きベクトルを、計算する。動き フィールド推定手法は、動きフィールドのモデルと、予測エラーの選択された尺 度を最小化するためのアルゴリズムとの両方において異なる。 フレームの中のピクセルの数が非常に多いために、各ピクセルについて別々の 動きベクトルを送信するのは効率的でない。殆どのビデオ符号化方式で、現在の フレームは大きな画像セグメントに分割され、セグメントの全ての動きベクトル を少数のパラメータで記述できるようになっている。画像セグメントは正方形の ブロックであってもよくて、例えば国際規格ISO/IEC MPEG-1又はITU-TH.261に準 拠する符復号器(コーデック)では16×16のピクセル(画素)のブロックが 使用されており、また画像セグメントは例えば分割アルゴリズムによって得られ る全く任意の形状の領域から成っていてもよい。実際上、各セグメントは少なく とも数十個のピクセルを包含する。 セグメント内の各ピクセルの動きベクトルをコンパクトに表示するためには、 それらの値を少数のパラメータの関数で記述できることが望ましい。その様な関 数は動きベクトルフィールドモデル(mo tion vector field model)と称されている。公知のグループのモデルは線形の動 きモデルであり、その動きベクトルは動きフィールド基底関数の線形結合である 。このようなモデルでは画像セグメントの動きベクトルは下記の一般式: で記述され、ここでパラメータciは動き係数(motion coefficient)と呼ばれる ものであり、復号器に送られる。関数fi(x,y)は動きフィールド基底関数(motion field basis function)と呼ばれていて、この関数は固定されていて符号器及び 復号器の両方に知られている。 上記の式を有する線形動きモデルを使うときの問題は、予測エラーEn(x,y)の 尺度をなるべく低く保ちながら、復号器に送られる動き係数ciの数をどうやって 最小化するかということである。このプロセスは、符号器において動きフィール ド符号化ブロック3によって実行される(図1を参照)。それは、ブロック2に よって達成される、計算に関して非常に複雑な動きフィールド推定の後に、実行 される。従って、動きフィールド符号化は計算に関して単純で、追加の負担を符 号器にかけないことがきわめて重要である。 復号器に送る必要のある動き係数の総数は、画像の中のセグメントの個数と、 セグメントあたりの動き係数の個数との両方に依存する。従って、動き係数の総 数を減らす方法は少なくとも2つある。 第1の方法は、予測エラーを大幅に増大させることなく共通の動きベクトルフ ィールドで予測することのできるセグメント同士を結合(併合)させることによ ってセグメントの数を減らすことである 。隣り合っているセグメントを同じ動き係数の集合で予測できることが非常に頻 繁にあるので、フレーム内のセグメントの数を減らすことができる。その様なセ グメント同士を結合させるプロセスは動き補助併合(motion assisted merging) と呼ばれる。 第2の方法は、なるべく少ない係数で満足できるほど低い予測エラーを達成で きる動きモデルを各セグメントについて選択することである。動きの量と複雑さ とは各フレーム間で、また各セグメント間で異なるので、セグメントあたりに常 にN+M個の動き係数をすべて使用するのは効率的でない。満足できるほど低い予 測エラーを達成できる最少数の動き係数を全てのセグメントについて求める必要 がある。その様な係数の適応的選択のプロセスは動き係数除去と呼ばれる。 図3は、各セグメントに分割されたフレームを示している。動き係数符号化を 行う従来技術の手法は、動き補助併合を行う幾つかの手法を含んでいる。全ての セグメントの動きベクトルが推定された後、動き補助併合が行われる。それは、 隣接するセグメントSi及びSjの全ての対をそれらの動き係数ci及びcjとともに考 慮して行われる。結合されたセグメントSi及びSjの領域はSijと表示される。予 測エラーをSi及びSjの別々の予測から生じるエラーより大幅に増大させることな く動き係数cijの1つの集合で領域Sijを予測できるならば、Si及びSjは併合され る。動き補助併合を行う方法は、本質的に、互いに結合されたセグメントを良好 に予測することを可能にする動き係数cijの単一の集合を求める方法において異 なる。 1つの方法は徹底的な動き推定による併合方法として知られている。この方法 は、隣り合うセグメントSi及びSjの全ての対について動き係数cijの新しい集合 を”最初から”推定する。もしSij についての予測エラーがあまり大きくはならなければ、セグメントSi及びSjは併 合される。この方法では、併合することのできるセグメントを非常によく選択で きるけれども、通常は符号器の複雑さを数桁も大きくするので、この方法を実行 することはできない。 もう一つの方法は、動きフィールド拡張による併合として知られている。この 方法は、予測エラーをあまり大きくすることなくいずれかの動きパラメータci又 はcjを使ってSijの領域を予測できるか否か試験する。この方法は、新しい動き 推定を全く必要としないので、計算の複雑さが非常に低いという特徴を持ってい る。しかし、この方法では、1つのセグメントについて計算された係数での動き の補償によって隣のセグメントを予測することさえもうまくできるのは非常にま れであるので、セグメント同士を併合できないことが非常に頻繁にある。 もう一つの方法は動きフィールドはめ込みによる併合として知られている。こ の方法では、動き係数cijは近似の方法により計算される。それは、各セグメン トで少数の動きベクトルを評価することによって行われる。図3においてセグメ ントSi及びSjの幾つかの動きベクトルが描かれている。セグメントSijについて の動きフィールドは、或る公知のはめ込み方法を使用してこれらのベクトルを通 じて共通の動きベクトルフィールドをはめ込むことによって作成される。この方 法の欠点は、はめ込みによって得られる動きフィールドが充分に精密ではなくて 、予測エラーが許容できないほど大きくなることがしばしばあることである。 いろいろなモデルで動きを推定し、最も適当なものを選択する方法が下記の2 つの文献で提案されている: 1994年度、音響学、音声及び信号処理に関する国際会議議事録、III265 -268ページ、H.ニコラス及びC.ラビットの”画像 シーケンス符号化のための決定論的緩和法を用いる領域に基づく動き推定方法” (H.Nicolas and C.Labit,"Region-based motion estimation using determi nistic relaxation schemes for image seque ncecoding,”Proc.1994 Interna tional Conference on Acoustics,Speech and Signal Processing,pp.III265 -286); ビデオ技術のための回路及びシステムに関するIEEE会報、1994年6月、 第3巻第4号、357-364ページ、P.チッコーニ及びH.ニコラスによる”画像シ ーケンス符号化のための領域に基づく効率的動き推定方法及び対称指向分割方法 ”(P.Cicconi and H.Nicolas,"Efficient region-based motion estimation and symmetry oriented segmentation for image sequence coding,”IEEE Tra ns.on Circuits and Systems for Video Technology,Vol.4,No.3,June 19 94,pp.357-364) それらの方法は、いろいろなモデルで動き推定を行って、最も適当なものを1つ 選択することによって、動きの複雑さに応じて動きモデルを適応させようと試み る。それらの方法の主な欠点は、計算が複雑で、実際に試験することのできるい ろいろな動きフィールドモデルの量が少ないことである。 上記の方法のいずれも、単独では、予測エラーEn(x,y)の尺度をなるべく低く 保ちながら、復号器に送られる動き係数ciの数を最小にするという問題を解決す ることはできない。 発明の概要 本発明の目的は、予測エラーを大幅に増大させずに公知の動き推定方法により 作成される動きフィールドベクトル情報の量を大幅に減少させる動きフィールド 符号器を作ることである。利用可能な信 号処理装置或いは汎用マイクロプロセッサで実用的に実現できるように、その動 きフィールド符号器の複雑さは低くなければならない。 本発明によれば、動きフィールド符号器は3個の主なブロックを含んでいる。 第1の主なブロックはQR動き分析器(motion analyzer)と呼ばれる。その任務 は、動きフィールド推定器によって作成されて入力された動きフィールドの新し い表示を求めることである。その新しい表示は第2の主なブロックに入力される 。この第1の主なブロックでの動作は、行列演算からなる複数のステップを含ん でいる。その第1のステップでは予測フレームが公知の近似方法で線形化され、 予測フレームは動きベクトルに関して線形となる。第2ステップでは二乗予測エ ラー(square prediction error)を最小化するために行列Ei及び行列yiが作成 される。第3ステップでは周知のQR因数分解アルゴリズムを使って行列Eiを2 つの行列Qi及びRiの積に分解する。また、因数行列Qi及び行列yiから補助ベ クトルziを計算する。行列Riの一部分と補助ベクトルziとが第2の主なブロッ クに入力される。 セグメント併合ブロック(segment merging block)と呼ばれる第2の主なブロ ックは、隣り合うセグメントの対の結合された領域を共通の動きフィールドを使 用して予測できるか否かを判定して、それらのセグメントの対を併合させる。行 列演算では始めに行列方程式を作成し、その後に公知の行列計算方法を使用して 因数行列を処理する。その結果は行列方程式であり、その1つの行列はいくつか の項を含んでいて、それらに基づいて、併合されるセグメントの領域での二乗予 測エラーを簡単に計算できる。もし二乗予測エラーの変化が、選択された基準に 照らして許容できる程度のものであるな らば、それらのセグメントを併合させる。 全てのセグメントの対が検討された後、セグメント併合ブロックの出力は: i. セグメントの数が減っている、新たに分割された画像であるか、 を出力するか、 iii.併合情報であり、この情報は復号器に送られて、復号器が併合されたセグメ ントを特定するのに役立つ。 第3の主なブロックは係数除去ブロック(coefficient removalblock)と呼ばれ る。このブロックは入力として、新たに各セグメントに分割された現在のフレー ムを受け取るとともに、全てのセグメ 個の動き係数によって表示される。動き係数除去ブロックは、各セグメントにつ いて、予測エラーをあまり増大させることなく動きフィールドモデルを簡単にす ることができるか否か判定する。何らかの基底関数が動きモデルから除去され、 その様にして単純化された動きフィールドモデルを記述するのに必要な係数は少 なくなる。 この第3の主なブロックでの動作は行列操作であり、始めに因数行列の1つの 行と列とを除去して行列方程式を修正し、次にその行列方程式を三角行列にする (triangularized)。1つの列及び行の除去は動きモデルからの1つの基底関数 の除去に相当する。1つの基底関数の除去によって生じるセグメントについての 二乗予測エラーの変化は方程式中の1つの項の二乗に等しい。 選択された基準に照らして予測エラーの変化が許容できる程度であるならば、 1つの係数が係数の集合から除去される。これらの行 列操作を更に繰り返して、該セグメントについてより多くの係数を減らすことが できる。充分な量の係数が除去された後、得られた一次方程式を解くことによっ てそのセグメントについての最終の動き係数が計算される。例えば後退代入(ba cksubstitution)など、周知のアルゴリズムの1つを使って方程式を解くことが できる。 第3の主なブロックは、処理した全てのセグメントについて、どの基底関数が 動きフィールドモデルから除去されたのかを知らせる選択情報を出力する。更に このブロックは、残っている基底関数に対応する新しい動き係数も出力する。選 択情報と動き係数との両方が復号器に送られる。 図面の簡単な説明 図1は、公知の符号器の概略図である。 図2は、公知の復号器の概略図である。 図3は、併合される隣り合っているセグメントを示す。 図4は、動きフィールド近似による併合を示す。 図5は、本発明による動きフィールド符号器である。 図6は、QR動き分析器の概略図である。 図示した実施例の説明 図5は、本発明による動きフィールド符号器を示している。これは図1のブロ ック3に対応するものであるけれども、入力として参照フレーム及び現在のフレ ームも有する。このブロックへの第3の入力は、図1の動きフィールド推定ブロ ック2によって作成された動きベクトルフィールド[Δx(・),Δy(・)]である。 ビデオ符号器の出力が各セグメントに分割された圧縮されているフレームであ り、その各セグメントに動き係数が随伴しているとす るならば、座標(xi,yi),i=1,2,...,P、のP個のピクセルからなるセグメント Siについて、動きフィールド符号器の任務は、圧 きモデルで記述され、そのフィールドは下記の形を持っており: それは二乗予測エラー: を最小化するようになっている。 前記の任務を達成するために、動きフィールド符号器は3つの主な構成ブロッ クからなっており、それらはQR動き分析ブロック、セグメント併合ブロック、 及び動き係数除去ブロックである。セグメント併合ブロック及び動き係数除去ブ ロックは、二乗予測エラーを増大させる結果をもたらす動き情報の量を減少させ る。 QR動き分析器の目的は、動きフィールドの新しい表示を求めることである。 その新しい表示は、後に、他の2つのブロック、即ち併合されたセグメントにつ いての動き係数を高速で且つ柔軟に求めるためのブロック及び係数除去を行うブ ロック、で使用される。QR動き分析器の動作は下記のステップからなる。 即ち、ステップ1はエラーの線形化である。このステップでは方 )の総和での各要素は係数ciの一次結合となる: ステップ2は行列の作成である。それは、式(6)の最小化が行 基づいており、ここでEi及びyiは次の通りである: ステップ3はQR因数分解である。周知のQR因数分解アルゴリズムがG.H.ゴ ルブ及びC.ブァン・ローンの文献”行列計算”第2版、1989年ジョンズホ プキンス大学出版会(the document G.H.Golub and C.van Loan,"Matrix co mputation”2'nd edition,The Johns Hopkins University Press,1989)で解説 されている。このアルゴリズムを使用してEiを2つの行列の積に分解する: このステップで補助ベクトルziも計算するが、これは次の通りである: ステップ4ではQR動き分析ブロックの出力を計算する。その出 セグメント併合ブロックでは、隣り合うセグメントSi及びSj(図4を参照)の 対を、動き係数cijによって記述される共通の動きフィールドを使ってそれらの 結合領域Sijを予測できるか否かを判定して、併合操作がなされる。合併操作は 次の各ステップからな る。 即ち、ステップ1は行列計算からなる。本発明は、下記の一次方程式の系: を解くことによって動き係数cijを求めることができるという、以 ロックにより既に作成されている。 ステップ2は、ステップ1で得られた行列を三角行列にする(tr 列であり、方程式系(10)は前記の文献の教示によると下記の形を有する:ここで記号×はゼロでない要素を表す。前記の文献の教示によると、この系は、 各行にスカラーを乗じる一連の掛け算を行った後にそれらの行を加えることによ って三角行列にされる、即ち、それは下記の形に変換される: ステップ3では併合エラーを計算する。セグメントSi及びSjの併合により生じ る領域Siでの二乗予測エラーの変化ΔEijを前記の文献の教示に従って次のよう にして計算する: 最後に、ステップ4で、式(13)の二乗予測エラーの変化が、選択された基 準に照らして許容できる程度であるならば、前記のセグメント同士を併合させる 。それにより得られた新しいセグメントSijについて、方程式系(12)の始め のN+M個の行をとることに式によって与えられる: フレームのセグメントの全ての対が検討された後、セグメント併合ブロックの 出力が得られる。その出力は3種類の情報からなる。 第1に、その出力は、セグメントの個数が減らされている、画像の新しい分割態 様を提示する。第2に、新しいセグメントの各々につ 該ブロックは併合情報を提示し、それは復号器に送られて、復号器が併合された セグメントを識別しやすくする。 いての動き係数cij=(c1,c2,...cN+M)を計算することができるが、もし次のブロ ック(係数除去ブロック)を使用するのならばその計算は不要である。 ここで係数除去ブロックの動作を考察する。このブロックは入力として現在の フレームのセグメントへの新しい分割態様を受け取るとともに、全てのセグメン トSkについて、前もってセグメント併 。どのセグメントの動きベクトルもN+M個の動き係数によって表示される。 動き係数除去ブロックは、与えられたセグメントSkについて予測エラーをあま り増大させることなく動きフィールドモデルを簡単化することが可能か否かを判 定する。本明細書の背景技術の項で説明した方程式(3)のモデルから何らかの 基底関数が除去されると、簡単化された動きフィールドモデルが得られる。その 様に簡単化された動きフィールドモデルを記述するのに必要な係数は比較的に少 なくなっている。 動きフィールドモデルからi番目の基底関数(及びi番目の係数)を除去できる か否かを判定するために、下記の処理手順が各セグメントに対して実行される。 目の列を除去し、ckからi番目の要素を除去することによって下 記の一次方程式系: を修正する。 ステップ2は行列三角化を含んでおり、ここで各行にスカラーを乗じる一連の 掛け算を行った後にそれらの行を加えることによって方程式系(15)が公知の 方法で三角行列にされる、即ち、それは下記の形に変換される: ステップ3はエラー評価を含んでいる。i番目の係数の除去によって生じるセ グメントについての二乗予測エラーの変化は、単に方 ステップ4は係数の除去を含んでいる。もし予測エラーの変化が選択された基 準に照らして許容できる程度であれば、係数ciは係数の集合から除去される。こ れで係数の新しい個数はN+M-1となる行列(17)を方程式(15)で使用してステップ1−4を繰り返すことによっ て、このセグメントについての係数の個数を更に減ら すことができる。 ステップ5は係数計算を含んでいる。充分な数の係数が除去された後、このス テップが始まる。このステップで、一次方程式系: を解くことによってセグメントSkについての最終の動き係数が計 の結果である。例えば後退代入(backsubstitution)など、周知のアルゴリズム の1つを使ってこの方程式を解くことができる。 動き係数除去ブロックは、処理した全てのセグメントについて、どの基底関数 が動きフィールドモデルから除去されたのかを復号器に知らせる選択情報を出力 する。また、該ブロックは残っている基底関数に対応する新しい動き係数を出力 する。この選択情報と動き係数との両方が復号器に送られる。 これらブロックの全てにおける全てのステップの結果として、本発明による動 きフィールド符号器は、どのセグメントが併合されたかを復号器に知らせる併合 情報と、どの基底関数が除去されたかを復号器に知らせる選択情報と、動き係数 情報とを作成する。 従来技術と比べると、本発明の主な利点は、予測エラーを大幅に増大させずに 動き情報の量を大幅に減少させることができることである。また、システム全体 の複雑さが低くて、利用可能な信号処理装置或いは汎用マイクロプロセッサで実 用的に実現できる。 セグメント併合ブロックは、別々のセグメントについて推定された与えられた 動きベクトルから、結合されたセグメントの動きベクトルを求めることができる という独特の能力を持っている。このブロックが作成する動きベクトルは、実際 上、結合されたセグメントについての二乗エラーを最小に保つことに関して最適 であることを証明することができる。このことが、このブロックが二乗予測エラ ーをごくわずか増大させるだけでセグメントの個数を劇的に減少させる能力を持 っていることの理由である。 動き係数除去ブロックは、動きモデルをビデオシーンの中の動きの実際の量及 び種類に瞬時に適応させるための非常に強力な手段である。このブロックは、例 えば実現可能なあらゆる動きフィールド基底関数の組み合わせなど、非常に多数 のモデルで予測の結果(セグメントについての二乗予測エラーの値)を容易に試 験することができる。他の公知の如何なる方法もこの様な柔軟性を持っていない 。この方式の強力な利点は、動き推定のプロセスを反復する必要がないので計算 が簡単だということである。 動き推定後にQR動き分析を行うことによって、この動きフィールド符号器は 、画像セグメントの所望の如何なる組み合わせについても、或いはセグメントの 動きフィールドの所望の如何なるモデルについても、非常に単純な一次方程式系 を解くことによって新しい動き係数を求めることができる。 好ましい実施例の説明 好ましい実施例では12個の係数を有する下記の二次多項式動きベクトルフィ ールドモデルが使用される: このモデルは、実際上、ビデオシーケンスにおける非常に複雑な動きでも十分 に処理することができて、良好な予測結果をもたらす。 QR動き分析ブロックで、下記の各点:テイラー展開(Taylor expansion)を使ってステップ1での線形化を行う。 なる: 下記の式: を使って補助値gj(x,y)を計算する。ここで関数fj(xi,yi)は方程式(4a)及び( 4b)で定義される基底関数である。 方程式(9)の中の行列E及びベクトルyは下記の式: を使って作成される。Gx(x,y)及びGy(x,y)は、下記の式: 配の値である。 図6はQR動き分析器の略図である。行選択ブロックは入力された行列の始め のN+M個の行だけを選択する。セグメント併合ブロックでは、セグメント併合の ために下記の方針が実行される: a.フレーム全体で許容される二乗予測エラーの増加に対応するしきい値Tを選 択する。 b.隣り合うセグメント同士の全ての対について方程式(13)を使ってΔEij を計算する。 c.ΔEijが最小であるセグメントの対を併合させる。 d.併合された全てのセグメント対に対応するΔEijの総和がTより大きくなる までポイントb−cを繰り返す。 方程式系(11)を三角化するために、一連のギブンズ回転(Givens rotation s)が使用される。 動き係数除去ブロックでは係数除去のために下記の方針を実行する: a.フレーム全体で許容される二乗予測エラーの増加に対応するしきい値Tを選 択する。 b.全てのセグメント及び全ての基底関数について方程式(16) d.いろいろなセグメントで除去された全ての基底関数に対応する る。 式の系(16)は、一連のギブンズ回転によって三角化される。 セグメントの最終の動き係数は、後退代入アルゴリズムを使用して方程式(1 8)を解くことによって計算される。yだけについて定義される。x又はyが整数でない多くの場合に、整数座標を持っ た最も近い各ピクセルの双線形補間を行ってそのピクセル値を計算する。 このシステムを、本発明の範囲から逸脱せずにいろいろに実施することができ る。例えば、方程式(3)でいろいろな線形動きモデルを使用することができる 。いろいろな方法を使用して式(5)の項を線形化することができる。更に、2 つのセグメントを併合させるか否かを決定するためにいろいろな基準を用いるこ とができる。与えられた基底関数をモデルから除去するべきか否かを決定するた めの方針は様々であってよい。方程式(10)及び(15)の各行列の三角化を いろいろなアルゴリズムを使用して実行することができ、方程式(18)を解く ことによる最終係数の計算を、一次方程式系を解くための公知のいろいろなアル ゴリズムを使用して実行す びGy(x,y)の値に対していろいろな補間方法を使用することができる。
【手続補正書】特許法第184条の8第1項 【提出日】平成9年11月4日(1997.11.4) 【補正内容】 請求の範囲 1.ビデオシーケンスの現在のフレームInを符号化するためのビデオ符復号 器であって、このビデオ符復号器は、符号化された動きベクトルフィールドを供 給する動きフィールド符号器を有し、この動きフィールド符号器は、 − 現在のフレームInと、 − 動きベクトルフィールドとを受け取るようになっている動き分析器を有 し、 この動き分析器は、動きベクトルフィールドの新しい表示を求めるようになっ ており、その表示は、現在のフレームInの複数の画像セグメントのうちの各セ グメントSiについて、べクトルciによって表されるN+M個の動き係数の集合と基 底関数の集合とに基づく線形動きモデルを伴っており、 該動き分析器は、 − 現在のフレームの各セグメントSiについて、行列表示Eici−yiに基づ いて、その現在のフレームのセグメントと参照フ めの予測エラー線形化手段を含んでおり、ここでEiは行列であり、yiはベクト ルであり、 − 現在のフレームの各セグメントについて、前記行列表示か 該動きフィールド符号器はセグメント併合手段を有し、この手段は、 − 現在のフレームInの隣り合うセグメントの対(Si,Sj) もに、 対応するセグメント対を併合させるようになっており、 該動きフィールド符号器は、該セグメント併合手段に結合されている係数除去 手段を有し、この手段は、 − 現在のフレームInの各セグメント又は併合されたセグメ された予測エラー関数の変化が所定限度内となるように動き係数ckの減らされた 集合を決定し、 − 現在のフレームInの符号化されたバージョンを提供するようになって おり、その形は、各セグメント又は併合されたセグメントについて、個数の減ら された前記の動き係数と、どの係数が省略されたかを示す表示とから成るビデオ 符復号器。 2.現在のフレームの各セグメントについて動き分析器によって近似される予 測エラーの関数は下記の通りであり:ここで、 である請求項1に記載のビデオ符復号器。 3.前記行列処理手段はQR因数分解手段を含んでおり、この手段は、行列Ei を行列Qi及びRiの積に分解し、補助ベクトル 記載のビデオ符復号器。 4.該セグメント併合手段は、隣り合うセグメントの前記の対(Si,Sj)に ついて、下記の式: を下記の形:に三角化するための手段を含んでおり、ここでcijは併合された隣り合うセグメ ントの対のN+M個の動き係数の集合である請求項1乃至3のいずれか一項に記載 のビデオ符復号器。 5.該セグメント併合手段は、隣り合うセグメントの各対(Si,Sj)につい て下記の式: に従って二乗予測エラーの変化ΔEijを計算することにより予測エラーが所定限 度内であるか否かを判定するようになっている請求項4に記載のビデオ符復号器 。 6.該セグメント併合手段は、三角化された行列方程式の始めの に決定するようになっている請求項4又は5に記載のビデオ符復号器。 7.現在のフレームInの前記の符号化されたバージョンは、併合されたセグ メントの識別子を含んでいる請求項1乃至6のいずれか一項に記載のビデオ符復 号器。 を設けることによって、個数の減らされた動き係数ckを決定するようになってい る請求項1乃至7のいずれか一項に記載のビデオ符復号器。 9.該係数除去手段は、簡略化された行列方程式を下記の形: に三角化して、下記の式: に従って二乗予測エラーの変化を計算するようになっている請求項8に記載のビ デオ符復号器。 10.該係数除去手段は、もし二乗予測エラーの変化が所定限度内であれば該 係数行列ckから動き係数ciを除去するとともに、2番目に言及した三角化された 行列方程式の一番下の行を除去することによってこの行列方程式を再公式化する ようになっている請求項9に記載のビデオ符復号器。 程式の簡略化された形を解くことによって動き係数ckを決定するようになってい る請求項1乃至10のいずれか一項に記載のビデオ符復号器。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),OA(BF,BJ,CF,CG ,CI,CM,GA,GN,ML,MR,NE,SN, TD,TG),AP(KE,MW,SD,SZ,UG), AL,AM,AT,AU,BB,BG,BR,BY,C A,CH,CN,CZ,DE,DK,EE,ES,FI ,GB,GE,HU,IS,JP,KE,KG,KP, KR,KZ,LK,LR,LT,LU,LV,MD,M G,MK,MN,MW,MX,NO,NZ,PL,PT ,RO,RU,SD,SE,SG,SI,SK,TJ, TM,TT,UA,UG,US,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1.現在のフレーム、参照フレーム、及び動きベクトルフィールドに応答して 、符号化された動きベクトルフィールドを作成するとともに動き係数の個数を最 小にする動きフィールド符号器を有するビデオ符復号器であって、該動きフィー ルド符号器は、 現在のフレームのセグメントと予測フレームのセグメントとの間の二乗エラー 関数を線形化するための線形化手段と、該セグメント ブロックと、 この第1の主なブロックに接続されていて、隣り合うセグメント同士の対を、 もし共通の動きフィールドを使ってその結合された領域を予測できるならば、そ れらのセグメント同士の対を併合させるための併合手段を含んでいて、併合され た各セグメントについて第 なブロックと、 この第2の主なブロックに接続されていて、二乗予測エラーの変化が許容でき ない程度となるまで該セグメントの動き係数を除去するための係数除去手段を含 んでおり、各セグメントについて、個数の減らされた動き係数を出力するように なっている第3の主なブロックとから成っており、 出力された符号化されている動きベクトルフィールドにおいて各動きベクトル は基底関数及び動き係数からなる線形動きモデルに基づいているビデオ符復号器 。 2.線形化手段は二乗予測エラーを下記の式: の形に変換するようになっており、ここでは動き係数であり、N+Mは動き係数の 個数である請求項1に記載のビデオ符復号器。 3.該行列処理手段は下記の行列: を作成するための手段を含む請求項2に記載のビデオ符復号器。 4.該行列処理手段は、それ自体としては公知の方法で行列Ei トルziを作成し、行列Riの始めのN+H個の行からなる第1行列 のビデオ符復号器。 5.該併合手段は一次方程式: は前記の第1の主なブロックによってそれぞれセグメントSi及びSjについて下記 の形:に作成されるようになっている請求項1に記載のビデオ符復号器。 6.該併合手段は、セグメントSi及びSjの併合により生ずる領域Sijでの二乗 予測エラーの変化ΔEijを下記の式: に従って計算するための手段を更に含んでおり、該セグメントは、与えられた基 準に照らして該二乗予測エラーの変化が許容できる程度であるならば併合される ようになっている請求項5に記載のビデオ符復号器。 7.該併合手段は、三角化された行列方程式の始めのN+M個の行をとることに よって、併合の結果としてのセグメントSijについて により表され、前記の行列及びベクトルは前記の第2の主なブロッ クから出力されるようになっている請求項5に記載のビデオ符復号器。 8.該併合情報が該復号器に送られる請求項1に記載のビデオ符復号器。i番目の列を除去し、ベクトルckからi番目の要素を除去することによって、簡 略化するための手段を含んでいる請求項1に記載のビデオ符復号器。 10.該係数除去手段は、簡略化された行列方程式を下記の形: に三角化するための手段を更に含んでおり、i番目の列及びi番目 い請求項9に記載のビデオ符復号器。 11.該係数除去手段は、予測エラーの変化量を選択された基準と比較するた めの手段を更に含む請求項10に記載のビデオ符復号器。 12.該係数除去手段は、もし変化量が許容できる程度であれば動き係数ciを 該係数行列から除去するための手段と、三角化され おり、前記の修正された行列及び修正されたベクトルは該係数除去手段に入力さ れるようになっている請求項11に記載のビデオ符復 号器。 13.該係数除去手段は、もし更なる変化量が許容できないなら いて最終の動き係数を計算するための手段を更に含む請求項11に記載のビデオ 符復号器。
JP51630897A 1995-10-20 1995-10-20 動きベクトルフィールド符号化 Expired - Fee Related JP3781194B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FI1995/000581 WO1997016025A1 (en) 1995-10-20 1995-10-20 Motion vector field coding

Publications (2)

Publication Number Publication Date
JP2000512440A true JP2000512440A (ja) 2000-09-19
JP3781194B2 JP3781194B2 (ja) 2006-05-31

Family

ID=8556630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51630897A Expired - Fee Related JP3781194B2 (ja) 1995-10-20 1995-10-20 動きベクトルフィールド符号化

Country Status (8)

Country Link
US (1) US6163575A (ja)
EP (1) EP0856228B1 (ja)
JP (1) JP3781194B2 (ja)
KR (1) KR100381061B1 (ja)
AU (1) AU3701495A (ja)
DE (1) DE69511119T2 (ja)
HK (1) HK1017553A1 (ja)
WO (1) WO1997016025A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003506978A (ja) * 1999-08-11 2003-02-18 ノキア コーポレイション 運動ベクトルフィールドを圧縮するための装置及び方法
JP2014511054A (ja) * 2011-02-18 2014-05-01 シーメンス アクチエンゲゼルシヤフト 画像シーケンスを圧縮するためのコーディング方法及び画像コーディング装置

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999007157A1 (en) * 1997-07-28 1999-02-11 Idt International Digital Technologies Deutschland Gmbh Method and apparatus for compressing video sequences
GB2343319B (en) * 1998-10-27 2003-02-26 Nokia Mobile Phones Ltd Video coding
ATE241887T1 (de) * 1999-08-11 2003-06-15 Nokia Corp Adaptive bewegungsvektorfeldkodierung
US6738423B1 (en) * 2000-01-21 2004-05-18 Nokia Mobile Phones Ltd. Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
EP1404135B1 (en) * 2000-01-21 2016-12-14 Nokia Technologies Oy A motion estimation method and a system for a video coder
US8005145B2 (en) * 2000-08-11 2011-08-23 Nokia Corporation Method and apparatus for transferring video frame in telecommunication system
US6765963B2 (en) 2001-01-03 2004-07-20 Nokia Corporation Video decoder architecture and method for using same
US20020122491A1 (en) * 2001-01-03 2002-09-05 Marta Karczewicz Video decoder architecture and method for using same
US7693220B2 (en) * 2002-01-03 2010-04-06 Nokia Corporation Transmission of video information
US20030231795A1 (en) * 2002-06-12 2003-12-18 Nokia Corporation Spatial prediction based intra-coding
US7289674B2 (en) * 2002-06-11 2007-10-30 Nokia Corporation Spatial prediction based intra coding
US6909749B2 (en) * 2002-07-15 2005-06-21 Pts Corporation Hierarchical segment-based motion vector encoding and decoding
WO2006054257A1 (en) * 2004-11-22 2006-05-26 Koninklijke Philips Electronics N.V. Motion vector field projection dealing with covering and uncovering
US9258519B2 (en) * 2005-09-27 2016-02-09 Qualcomm Incorporated Encoder assisted frame rate up conversion using various motion models
US8218811B2 (en) 2007-09-28 2012-07-10 Uti Limited Partnership Method and system for video interaction based on motion swarms
KR101506446B1 (ko) * 2010-12-15 2015-04-08 에스케이 텔레콤주식회사 움직임정보 병합을 이용한 부호움직임정보생성/움직임정보복원 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
US20130083845A1 (en) 2011-09-30 2013-04-04 Research In Motion Limited Methods and devices for data compression using a non-uniform reconstruction space
EP2595382B1 (en) 2011-11-21 2019-01-09 BlackBerry Limited Methods and devices for encoding and decoding transform domain filters
CN102818868B (zh) * 2012-08-27 2013-11-20 浙江大学 复杂天然产物中活性成分筛选方法及应用
EP3343923B1 (en) * 2015-08-24 2021-10-06 Huawei Technologies Co., Ltd. Motion vector field coding method and decoding method, and coding and decoding apparatuses
US10635909B2 (en) * 2015-12-30 2020-04-28 Texas Instruments Incorporated Vehicle control with efficient iterative triangulation
US10136155B2 (en) 2016-07-27 2018-11-20 Cisco Technology, Inc. Motion compensation using a patchwork motion field

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2628864B1 (fr) * 1988-03-21 1990-06-15 France Etat Procede de segmentation d'un champ de vecteurs vitesse, notamment de vitesses de deplacement de points d'une image dans une sequence d'images
DE4138517A1 (de) * 1991-11-23 1993-05-27 Univ Hannover Einrichtung zur objekt-orientierten codierung von bildsignalen
US5594504A (en) * 1994-07-06 1997-01-14 Lucent Technologies Inc. Predictive video coding using a motion vector updating routine
JPH0846971A (ja) * 1994-07-29 1996-02-16 Sharp Corp 動画像符号化装置
JP3788823B2 (ja) * 1995-10-27 2006-06-21 株式会社東芝 動画像符号化装置および動画像復号化装置
JP3363039B2 (ja) * 1996-08-29 2003-01-07 ケイディーディーアイ株式会社 動画像内の移動物体検出装置
JPH1093920A (ja) * 1996-09-17 1998-04-10 Nec Corp Mpeg2スロー再生装置
US5956467A (en) * 1996-12-17 1999-09-21 Eastman Kodak Company Encoding color image data for multipass color printers
US6005626A (en) * 1997-01-09 1999-12-21 Sun Microsystems, Inc. Digital video signal encoder and encoding method
JP4573366B2 (ja) * 1997-09-25 2010-11-04 株式会社大宇エレクトロニクス 動きベクトル符号化方法及び符号化装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003506978A (ja) * 1999-08-11 2003-02-18 ノキア コーポレイション 運動ベクトルフィールドを圧縮するための装置及び方法
US8411757B2 (en) 1999-08-11 2013-04-02 Nokia Corporation Apparatus, and associated method, for forming a compressed motion vector field utilizing predictive motion coding
JP2014511054A (ja) * 2011-02-18 2014-05-01 シーメンス アクチエンゲゼルシヤフト 画像シーケンスを圧縮するためのコーディング方法及び画像コーディング装置

Also Published As

Publication number Publication date
KR100381061B1 (ko) 2003-08-19
DE69511119T2 (de) 2000-02-03
EP0856228A1 (en) 1998-08-05
AU3701495A (en) 1997-05-15
JP3781194B2 (ja) 2006-05-31
WO1997016025A1 (en) 1997-05-01
EP0856228B1 (en) 1999-07-28
DE69511119D1 (de) 1999-09-02
HK1017553A1 (en) 1999-11-19
KR19990064293A (ko) 1999-07-26
US6163575A (en) 2000-12-19

Similar Documents

Publication Publication Date Title
JP2000512440A (ja) 動きベクトルフィールド符号化
JP3790804B2 (ja) 動きに基づく分割及び合併を用いたビデオ・エンコーダ及びデコーダ
JP4006047B2 (ja) 画像縮小サンプリング方法
US6483877B2 (en) Method of coding and decoding image
JP3847827B2 (ja) 動きベクトル検出方法
US6507617B1 (en) Video coding
KR100209885B1 (ko) 적응적 제어점제거에 근거한 영상의 불규칙 삼각형메쉬 표현을 위한 방법
US20020131500A1 (en) Method for determining a motion vector for a video signal
EP0447328B1 (en) Scalar data processing method and apparatus
EP0552749A2 (en) Method of modifying a time-varying image sequence by estimation of velocity vector fields
KR100289862B1 (ko) 2차원병진움직임벡터와회기법을이용한전역움직임존재유무판정방법
JP2825571B2 (ja) 画像の動きパラメータ推定方法及び装置
El Gheche et al. Proximal splitting methods for depth estimation
KR100400962B1 (ko) 영상데이터를모션보상인코딩하는인코더와그방법및영상데이터를디코딩하는디코더
US8848800B2 (en) Signal processing method and apparatus based on multiple textures using video sensor excitation signals
JP2878580B2 (ja) 階層的動ベクトル検出方法
JPS62104387A (ja) 高能率符号化及び復号化方法
Seok et al. The differential structure of sub pixels interpolated from integer pixels using n-tab FIR filters for high definition H. 264 video encoding
JP3911784B2 (ja) 画像圧縮装置及び画像圧縮方法
JPH10255049A (ja) ブロックマッチングを用いた画像処理方法
JP2870626B2 (ja) 画像圧縮装置
JP3727731B2 (ja) 動画像の動き量推定装置
Huang et al. Classified variable‐block‐size motion estimation algorithm for image sequence coding
JPH09307907A (ja) 動きベクトル検出装置および検出方法
JPH09187013A (ja) 動きベクトル検出装置および方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20050907

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20051017

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051207

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20051207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060302

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100317

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110317

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110317

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees