JP3537616B2 - ビデオシーケンスの時間的に順次連続する画像の画素に対する、計算機による動き予測方法 - Google Patents

ビデオシーケンスの時間的に順次連続する画像の画素に対する、計算機による動き予測方法

Info

Publication number
JP3537616B2
JP3537616B2 JP34383696A JP34383696A JP3537616B2 JP 3537616 B2 JP3537616 B2 JP 3537616B2 JP 34383696 A JP34383696 A JP 34383696A JP 34383696 A JP34383696 A JP 34383696A JP 3537616 B2 JP3537616 B2 JP 3537616B2
Authority
JP
Japan
Prior art keywords
pixel
image
motion vector
value
cost function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34383696A
Other languages
English (en)
Other versions
JPH09187017A (ja
Inventor
パニス スタティス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JPH09187017A publication Critical patent/JPH09187017A/ja
Application granted granted Critical
Publication of JP3537616B2 publication Critical patent/JP3537616B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/269Analysis of motion using gradient-based methods

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ビデオシーケンス
の時間的に順次連続する画像の画素に対する、計算機に
よる動き予測方法に関する。
【0002】
【従来の技術】ブロックに基づく画像符号化方法または
オブジェクトに基づく画像符号化方法の領域では、ビデ
オシーケンスの個々の画像のブロックないしオブジェク
トに対して良質の動き予測をすることが重要である。こ
れは、必要な伝送容量を可能な限り節約する場合に、ビ
デオデータ流の受信器側で良質の再現画像を得るためで
ある。
【0003】動き予測によって、ビデオシーケンスの画
像の個々の画素(ピクセル)の輝度情報および/または
色彩情報を符号化する代わりに、所定のブロックないし
オブジェクトの形状と、2つの順次連続する画像間のブ
ロックないしオブジェクトに関する別の情報を符号化
し、これを受信器に伝送すればよいだけである。
【0004】前記別の情報は例えば、2つの順次連続す
る画像間のブロックないりオブジェクトのずれを含むこ
とができる。
【0005】このブロックないしオブジェクトに基づい
た符号化によって、必要な伝送容量を格段に節約するこ
とができる。
【0006】ブロックに基づいた画像符号化方法での動
き予測の基礎は例えば次の刊行物に記載されている。R.
Mester, M.Hoetter, Zuverlaessigkeit und Effizienz
vonVerfahren zur Verschiebunngsvektorschaetzung, M
ustererkennung, 1995, Infomatik Aktuell, Springer
Verlag, 285-294ページ; Liu et al. Method and Appar
atus for determining motion vectors for image sequ
ences, US-Patent-Nr. 5,398,068, 1995; F. Dufaux an
d F. Moscheni, Motion Techniques for digital TV: A
Review and a New Contributin, Proceedings of the
IEEE, Vol. 83, Nr.6, 858-876ページ, June 1995。
【0007】ダイナミック・プログラミング法が公知で
ある(H. Sakoe et al, Dynamic Programming Algorith
m Optimization for Spoken Word Recognition, IEEE T
ransactkons, Vol.ASSP-26, No. 1, 43-49ページ, 197
8)。
【0008】さらにダイナミック・プログラミング法
(ダイナミック・プログラミング・アルゴリズム、DP
法)を画像処理で、例えばいわゆるステレオ対応(D. G
eigeret al, Occlutions and Binocular Stereo, Inter
n. Jounal of Computer Visin, No.14, Kluwer Academi
c Publishers Boston, 211-226ページ、1995)と関連し
て使用することが公知である。
【0009】この提案された方法では次のことが欠点で
ある。DP法で使用されるコスト関数によって、画素に
割り当てられた動きベクトルが次のように強調される。
すなわち、動きベクトルが平面全体、すなわち分類すべ
きオブジェクト内で大きな差を有するのではなく、動き
ベクトル間で大きな跳躍が発生しないように強調される
ように構成されるという欠点がある(単調な強制)。こ
れによって、オブジェクト内で画素に対して良質の動き
予測が達成されるが、しかしこの方法はオブジェクトの
エッジの画素に対してはとくに不十分である。というの
は、これらの画素はこの方法においてはオブジェクトエ
ッジ画素として分類されるのではなく、間違ってマスク
として分類されるからである。
【0010】動き予測のためにDPアルゴリズムをいわ
ゆるステレオ対応の枠内で使用する別の方法が公知であ
る(I. Cox et al, Stereo Without Regularization, N
EC Reseach Institute, Peinceton, NJ 08540, 1-31ペ
ージ, 1992)。
【0011】前記2つの方法はさらに、DP法が2次元
最適化空間でしか実行で気にという欠点を有する。この
ことは、一方向、例えばスキャンラインの方向のオブジ
ェクトの動きしか確実に識別されないことを意味する。
しかしオブジェクトが急速に別の方向に運動すると、す
でに述べたように、オブジェクトがDP法によって“発
見”されなくなることもある。そのために、個々の画素
がこの方法によってエラーのある動きベクトルに割り当
てられてしまう。
【0012】
【発明が解決しようとする課題】本発明の課題は、ビデ
オシーケンスの画像のオブジェクトエッジにおける個々
の画素に正しい動きベクトルを割り当てることのできる
動き予測方法を提供することである。
【0013】
【課題を解決するための手段】上記課題は本発明によ
り、 a)符号化すべき画像の各画素毎に輝度勾配を検出し; b)符号化すべき画像の各画素毎にコスト関数を検出
し; c)前記コスト関数に基づいて、各画素に対してダイナ
ミック・プログラミングを実行し; d)ダイナミック・プログラミングによって検出された
動きベクトルを前記画素に割り当てる; ただし前記コスト関数は第1の項と第2の項を有してお
り、前記第1の項は、符号化すべき画像の領域の画素の
輝度値と、時間的に先行する画像であって、前記符号化
すべき画像に対してずらされている画像の同形状の領域
の画素の輝度値との一致を表わすものであり、また前記
第1の項によってコスト関数の値は、スキャンラインに
順次並んで存在する画素の動きベクトルの値の差に相応
して高められるものであり、前記第2の項によってコス
ト関数の値が、輝度勾配が上昇するときに低減されるも
のである、ことを特徴とする予測方法により解決され
る。
【0014】
【発明の実施の形態】ここではDPアルゴリズムに対し
て、次のような各個々の画素に対してコスト関数が使用
され、この値は画素の動きベクトルの値の差が大きくな
ると高められる。前記画素は、スキャンラインに並んで
存在し、その値は個々の画素の輝度勾配が大きくなると
低減されるような画素である。
【0015】このようにして、画素に対する動き予測が
格段に改善される。なぜなら、最適化がスキャンライン
に沿って全体的に行われるのではなく、付加項によって
個々のオブジェクト内で実行されるようになるからであ
る。このことは、オブジェクトのエッジも最適化の際に
DP法によって考慮されることを意味する。
【0016】本発明の有利な改善実施例は従属請求項に
記載されている。
【0017】本発明、DPアルゴリズムに対して有利に
は3次元最適化領域(探索領域とも称する)を使用す
る。
【0018】この3次元とは、 −動き予測に沿って実行されるスキャンライン −第1の方向の動きベクトルに対する値 −第1の方向と異なる第2の方向の動きベクトルに対す
る値 DPアルゴリズムに対する最適化空間を拡張することに
よって、次のようなオブジェクトを識別することができ
る。すなわち、時間的に順次連続する画像間にあり、第
1の方向とは異なる第2の方向で大きくずれるオブジェ
クトを識別することができ、したがって個々の画素に対
する動き予測を正確に実行することができる。
【0019】これにより、公知の方法で不可避のように
ある領域をマスクとして間違って分類されることが回避
される。
【0020】しかしこの場合、正規化はスキャンライン
に沿って全体として実行されるのではなく、スキャンラ
インはオブジェクトのエッジが検知されたか否かに依存
して個々のセグメントに分割される。スキャンラインの
画素がエッジ画素(それぞれの画素の輝度勾配の値が高
められている)として分類されると、画素の高められた
輝度勾配が、正規化に用いるDPアルゴリズムのコスト
関数の部分に及ぼす影響が“減衰”される。このことに
よってスキャンラインは、エッジによって相互に画定さ
れた個々のオブジェクトに対応するセグメントに分割さ
れる。
【0021】本発明の別の実施例では、2つの時間的に
順次連続する画像の画素をマッチングするために、矩形
または正方形の領域が使用される。それぞれの画素を取
り囲むこの領域内では、この領域内にある個々の画素の
輝度値が加算され、正規化され、相互に比較される。
【0022】
【実施例】本発明の方法を図1から図7に基づいてさら
に説明する。
【0023】ダイナミック・プログラミング ダイナミック・プログラミングの基礎的方法は、H.Sako
e et al, Dynamic Programming Optimisation for Spok
en Word Recogniton, IEEE Transaction, Vol.ASSP-26,
No.1, 43-49ページ、1978 に記載されている。
【0024】画像処理への変換と、動き予測への特別の
変換をダイナミック・プログラミング方法は目的として
おり、ビデオシーケンスの第1の画像のスキャンライン
が時間的に第1の画像に後続する第2の画像の領域と最
大の確率で一致することを検出し、これによりそれぞれ
のスキャンライン上に存在する画素に対して動き予測が
実行される。
【0025】ダイナミック・プログラミング方法は、最
適解を求めるために先験的な統計的情報並びに所定の検
出規則を必要とする最適化法である。
【0026】確率P(n−1,d)は、走査線上の第1
の画素n−1が動きベクトル値dを有する確率である。
【0027】条件確率P(n,d’|n−1,d)は、
第1の画素n−1が動きベクトル値dを有するという条
件のもとで第2の画素nが別の動きベクトル値d’を有
する確率である。
【0028】ここでは、別の動きベクトル値d’が動き
ベクトル値dと同じでも、または異なっていても良い。
【0029】前記の確率は、すべての画素および画素に
割り当てられたすべての動きベクトル値に当てはまるこ
とがわかる。第1の画素n−1と第2の画素nは、同じ
走査線上にあって隣接する2つの画素である。
【0030】これらの条件確率が走査線の各画素に対し
て、ダイナミック・プログラム方法の実行後に既知であ
れば、これを最適化問題に書き換えることができ、ダイ
ナミック・プログラミング方法によって解くことができ
る。
【0031】条件確率を各個々の画素に対して検出する
ことと、各個々の画素に割り当てられた動きベクトル値
について以下詳細に説明する。
【0032】図1には、基本例としてスキャンラインS
上にN個の画素を有する。ここでインデックスnは個々
の画素を示すためのものであり、間隔「0..N」であ
る。各画素に対してスキャンラインS上にある動きベク
トル値dがプロットされている。これらの動きベクトル
値はそれぞれの画素に割り当てることができる。
【0033】図1では簡単にするため、N=4が選択さ
れており、スキャンラインSの個々の4つの画素に対し
ても4つの動きベクトル値だけが示されている。
【0034】これは非常に簡単な例であることがわか
る。これはダイナミック・プログラミング方法の理解を
容易にするものであり、本発明の一般的有効性を制限す
るものではない。
【0035】図1の各画素毎に対してさらにそれぞれ確
率がプロットされており、それぞれの画素nは相応する
動きベクトル値dを有する。例えば画素n=2が動きベ
クトル値d=3を有する場合はP(2、3)と示されて
いる。
【0036】さらに各画素毎にそれぞれの条件確率を後
続の画素に対して求める。個の確率は図1には例として
P(4、4|3、3)により示されている。これによ
り、画素n=3(n−1)が動きベクトル値d=3を有
するという条件のもとで画素n=4が別の動きベクトル
値d’=4を有する確率が示される。
【0037】条件確率を個々の画素に対して求めること
と、割り当てられた動きベクトル値について以下さらに
説明する。
【0038】個々の確率と個々の条件確率から評価Cが
求められる。この評価は経路全体のそれぞれの発生確率
に対する尺度である。経路とは、動きベクトル値とそれ
ぞれの画素との個々の対応関係の組合せである。
【0039】評価Cの最大は、時間的に順次連続する2
つの画素間でスキャンラインのそれぞれの画素がもっと
も一致するときに生じる。
【0040】評価Cは次のように行われる。
【0041】
【数3】
【0042】ダイナミック・プログラミング方法を実行
する際には、スタート点から目的の終点までの経路を考
慮すればよいだけである。
【0043】図1に示された例ではこのことは、16の
経路が可能な場合において残りの15の可能な経路は考
慮する必要がないことを意味する。D(i,j)によっ
て、iベクトル(これは画素jで終点する)の経路に対
する評価Cの最大値が示されている。
【0044】D(i,j)は次の規則に従って検出され
る(図1に示された例に対して)。
【0045】
【数4】
【0046】ここでインデックスxは、画素jに割り当
てられたそれぞれの動きベクトル値を表す。
【0047】図1の場合に対してこのことは、1つの経
路が例えば画素n=3で終点することを意味する。
【0048】
【数5】
【0049】反復式(2)が次にnベクトルの経路長に
対して実行される。ここでこの方法は部分的にそれぞれ
の画像の画素に対して左から右へ記録しながら実行され
る。すべてのスキャンラインで“0番目”の画素はn=
0で始まる。
【0050】全体として最適のパターンを検出するため
には、すなわち最適の経路を検出するためには、この経
路を逆に追従できなければならない。そのためには、画
素のそれぞれ最適の先行過程とこの画素に割り当てられ
た動きベクトルとを各ベクトルについて全体経路で再発
見できなければならない。このことは、それぞれ最適の
先行過程をマークして記憶することによって達成され
る。このようにしていわゆるバックトラッキングが達成
され、スキャンラインSの画素について、動きベクトル
の最適の全体対応関係を検出することができる。
【0051】動きベクトル値dの値領域の大きさはダイ
ナミック・プログラムイング方法を実行することのでき
る速度に対して非常に重要である。この探索領域は通常
は所定の仮定によって制限される。このような制限の例
は単調制限であり、これは画素の動きベクトルがオブジ
ェクト内で単調関数を形成するために使用される。この
ことは次の仮定によるものである。すなわち、オブジェ
クトのすべての画素は類似の動きベクトル値を有すると
いう仮定によるものである。なぜなら、オブジェクトの
位置は全体的に変化するからである。
【0052】3次元最適空間によるDP方法 ダイナミック・プログラミングを用いた動き予測での画
像処理の問題は、順次連続する2つの画像間でオブジェ
クトを各任意の方向にずらすことができる、ということ
である。
【0053】これにより場合によっては、オブジェクト
の位置も2つの画像間で非常に高速に変化する。この問
題が図4のaとbに示されている。ここでは第1のオブ
ジェクトAが第2の画像42内で第1の画像41を基準
にして、水平方向と垂直方向にずれている。
【0054】これに対して第2のオブジェクトBは垂直
方向にはずれていない。
【0055】次に、第1の画像41の走査線rと第2の
画像42の領域との一致を得るために走査線rがスキャ
ンラインとしてダイナミック・プログラミング方法で使
用されるなら、公知の方法では図5aに示すように、第
1のオブジェクトAが垂直方向にずれたため一致の欠如
が検出される。ラインPによってそれぞれの一致点、す
なわち正しく分類された画素がこの画素に配属された動
きベクトル値によって表される。このことは図5aに示
されている。
【0056】当該の点において、公知の方法では第1の
画像41の輝度値と第2の画像42の画素の輝度値との
間で一致が検出されない。この理由からこの画素の領域
は間違っていわゆるマスクとして分類されてしまう。
【0057】第1のオブジェクトAのこの垂直方向の動
きは次の処理によって補償される。すなわち、走査線r
を複数の別の走査線に“分割”するのである。
【0058】簡単な例として図4bに別の走査線r−k
が示されている。
【0059】図5bでの結果は改善されており、複数の
セグメントによって複数の走査線が示されている。ライ
ンPによってここでもそれぞれ一致点が図5bに示され
ている。
【0060】図5aとbでは、第1の画像41のそれぞ
れの走査線rが示されている。この走査線は、第2の画
像42(図5a)の走査線rの1つ、または走査線rの
個々のセグメントと、本発明(図5b)による第2の画
像42の別の走査線r−kに対比されている。
【0061】ここではkによって、別の走査線r−kの
垂直方向のずれが走査線rに対して示されている。
【0062】それぞれ垂直方向に走査線rに対してずれ
た別の走査線の数は任意であり、適用に依存する。
【0063】評価Cの最適化は、以下の規則の3次元最
適化空間で行われる。
【0064】
【数6】
【0065】ここで、P(n,d1',d2'|n-1,d1,d2)は、
スキャンラインS上の画素nが、隣接する画素n−1が
動きベクトル(d1,d2)を有するという条件のもとで、
動きベクトル(d1',d2' )を有する確率を表す。P(n,
d1',d2')により画素nが動きベクトル(d1',d2')を有
する確率を表す。
【0066】本発明により、前記のアブストラクトで説
明した処理が次のようにして実現される。すなわち、ダ
イナミック・プログラミング方法に対して使用される最
適空間を1次元だけさらに拡張するのである。
【0067】同じようにこの最適空間の更なる拡張は、
個々の画素nに対するそれぞれのコスト関数Tn
(d,d)の検出で考慮される。このことは、画素
nには走査線に沿って2つの値が割り当てられることを
意味する。すなわち、第1の方向に対する第1の動きベ
クトル値dと第2の方向に対する第2の動きベクトル
値dである。
【0068】しかしここでは正規化はスキャンラインに
沿って全体で実行されるのではなく、スキャンラインは
個々のセグメントに、オブジェクトのエッジが検出され
るか否かに依存して分割される。スキャンラインの画素
がエッジ点として分類されれば(このことはそれぞれの
画素の輝度勾配の値が高められていることを意味す
る)、画素の高められた輝度勾配がDPアルゴリズム
(正規化に用いる)のコスト関数に及ぼす影響が“減
衰”される。これによってスキャンラインは、エッジに
よって画定された個々のオブジェクトに相応するセグメ
ントに分割される。
【0069】これによって、正規化(単調強制)は各オ
ブジェクト内でだけ行われ、したがってオブジェクトエ
ッジでの分類エラーが回避される。
【0070】コスト関数 それぞれの画素spに対する個々の確率と個々の条件確
率および画素spに配属された動きベクトル(d,d
)が未知であれば、例えば次のようにして求めること
ができる。
【0071】各画素sp毎に各可能なずれに対して、つ
まり可能なすべての第1の動きベクトル値dと可能な
すべての第2の動きベクトル値dに対してコスト関数
Tn(d,d)を次の規則に従って求めるのであ
る。コスト関数は基本的に前に説明した条件確率に相当
する。
【0072】
【数7】
【0073】ここで、n,mは個々の画素spの座標
値、dはそれぞれ記録された第1の動きベクトル値 dはそれぞれ記録された第2の動きベクトル値 (d,d)はそれぞれ記録された動きベクトル、2
τ+1は画素の第1の方向における領域の大きさ、2λ
+1は画素の第2の方向における領域の大きさ、N=
(2τ+2λ−1)*3は前記領域にある画素数、cは
正規化定数 WF1(i,j)は個所(i,j)での符号化すべき画
像の輝度値、WF2(i,j)は個所(i,j)での時
間的に先行する画像の輝度値である。
【0074】第1の画像の画素spが第2の画像の画素
と一致することの検出を行うこの処理はブロックマッチ
ングと称される。
【0075】これまではブロックマッチングを1方向で
だけ実行することが普通であった。このことは次の“伝
統的”コスト関数につながる。
【0076】
【数8】
【0077】ここでは符号dにより、それぞれの画素の
被検“ずれ方向”の1つにおける動きベクトル値が示さ
れる。
【0078】本発明の方法によって、この“伝統的”コ
スト関数は付加的な被加数だけ拡張される。
【0079】この拡張には2つの側面がある。
【0080】1.画素に割り当てられた動きベクトルが
次のように強調される。すなわち、動きベクトルが一体
的面内で、すなわち分類すべきオブジェクト内で大きな
差を有すのではなく、動きベクトル間で大きな跳躍が発
生しないように強調される(単調強制)。
【0081】この処理は公知である(D.Geiger et al,
Occlutions and Binocular stereo,Intern, Journal of
Computer Vision, No.14, Kluwer Accademic Publishe
rs,Boston, pp.211-226, 1995)。
【0082】2.オブジェクトエッジにおける画素に対
してコスト関数の値が低減される。これによりオブジェ
クトの変化が分類の際に可能となる。
【0083】このことが可能である理由は、例えば異な
るオブジェクトに所属する隣接する画素の動きベクトル
値の大きな変化がコスト関数での高い値によって同じよ
うには処置されないからである。例えば、1つのオブジ
ェクト内に存在し、したがってオブジェクトエッジに存
在する画素よりも小さな輝度勾配を有する画素では同じ
ように処置されてしまう。
【0084】このことを考慮した種々異なる関数を本発
明の方法で適用することができる。
【0085】前記第1の側面に対しては、種々の関数が
公知であり、その特性が固有の要請に関して研究されて
いる(D.Gerger et al, Occlutions and Binocular ste
reo,Intern, Journal of Computer Vision, No.14, Klu
wer Accademic Publishers,Boston, pp.211-226, 199
5)。可能な関数は図2にも示されている。
【0086】関数の有利な特徴は第1の側面に対して次
のように得られる。
【0087】
【数9】
【0088】3次元探索領域がDP法で使用される本発
明の方法に対する改善は次のようにして得られる。
【0089】
【数10】
【0090】ここでx1,x2は、スキャンラインSに
沿った2つの隣接する画素の第1の方向dないし第2
の方向dに対する動きベクトル値の差の大きさ、μ、
εは経験的に検出された2つの定数である。
【0091】経験的に検出された2つの定数μとεは有
利には、μ=0.3、ε=0.15である。
【0092】この更なる被加数によってまた、オブジェ
クト内の画素の動きベクトルが単調関数を形成する(単
調強制)。
【0093】本発明により達成される前記第2の側面で
のオブジェクトエッジの考慮は次のような関数によって
達成される。すなわち、f(x)ないしf(x1,x
2)がコスト関数に及ぼす影響をそれぞれの画素の輝度
勾配に依存して制御するような関数によって達成され
る。このことは、輝度勾配の上昇と共に関数f(x)な
いしf(x1,x2)の値が減衰、すなわち低減される
ようにして行われる。
【0094】これにより各画素に対するコスト関数が次
のようにして得られる。
【0095】Tn(d)=NMC+f(x,s) さらに、この関数を有する実施例について説明する。し
かしこの実施例は制限として理解すべきではなく、単な
る例である。具体的には指数関数が使用されるか、正規
化された輝度勾配を二乗するかは重要でない。輝度勾配
の上昇と共に増大する各関数を本発明の方法で使用する
ことができる。
【0096】コスト関数に対する付加的被加数として次
の関数を使用すると有利であることが判明した。
【0097】
【数11】
【0098】3次元最適空間を使用する場合には、次の
とおりである。
【0099】
【数12】
【0100】ここで、x,xはスキャンラインSに
沿って隣接する2つの画素の第1の方向dないし第2
の方向dに対する動きベクトル値の差の大きさ、μ、
εは経験的に検出された2つの定数、βは勾配増幅定
数、sはそれぞれの画素に対して正規化された輝度勾配
を表す。
【0101】この付加的被加数の分母eβs2により単
調関数
【0102】
【数13】
【0103】がコスト関数Tn(d,d)に及ぼす
影響がそれぞれの画素の輝度変化に依存するようにな
り、これにより単調関数がコスト関数Tn(d
)に及ぼす影響がオブジェクト内では大きく、オブ
ジェクトエッジでは小さくなる。
【0104】これによりオブジェクトエッジでは単調関
【0105】
【数14】
【0106】がコスト関数Tn(d,d)に及ぼす
影響が低減される。これにより、ダイナミック・プログ
ラミング方法はこの場合に対し当該領域において専ら、
コスト関数Tn(d,d)の第1の被加数NMC
(d,d)を最適基準として使用する。
【0107】式(5)の使用はオブジェクトエッジの近
傍でオブジェクト内よりも良好な結果を有するから、コ
スト関数Tn(d,d)の信頼性はオブジェクトエ
ッジにおいて高められる。これによってそれぞれの画素
とこの画素の解属された動きベクトル(d1,d2)に
対して正しい分類が単調関数の影響なしで得られる。
【0108】この適用領域での典型的な問題は、走査線
rに沿った順次連続する2つの画素間の動きベクトル大
きな変化がオブジェクトの急速な運動(大きなずれ)に
よって発生するような領域にある。
【0109】それぞれのオブジェクトのエッジが考慮さ
れず、式(6)だけが付加的被加数としてコスト関数で
考慮されることとなれば、 DP法の枠内でのそれぞれ
の画素に対するコスト全体は受け入れられた動きベクト
ルに対してオブジェクトエッジにおいて非常に高くな
り、この高いコストのために大きな動きを有する領域が
いわゆるマスクとして解釈されてしまう。
【0110】正規化輝度勾配はそれぞれの画素に対して
検出するためには、当業者には容易に想到できる各任意
の勾配フィルタの形式を使用することができる。
【0111】しかしこの実施例では、ソーベル演算子が
示されている。方向Kに対する輝度勾配は次の畳み込み
式によって求められる。
【0112】
【数15】
【0113】ここではH(n,m)は3×3パルス応
答マトリクスを示し、このマトリクスはそれぞれの輝度
勾配を4つの方向、すなわち垂直方向V、水平方向H、
すく直軸に対して左に45゜傾いた方向L、および右に
45゜傾いた方向Rで求めるために使用される。ソーベ
ル演算子のパルス応答の個々のマトリクスは次のように
表される。
【0114】水平方向Hに対するパルス応答マトリクス
【0115】
【数16】
【0116】垂直方向Vに対するパルス応答マトリクス
【0117】
【数17】
【0118】垂直軸に対して左に45゜傾いた方向Lに
対するパルス応答マトリクスH
【0119】
【数18】
【0120】垂直軸に対して右に45゜傾いた方向Rに
対するパルス応答マトリクスH
【0121】
【数19】
【0122】F(n.m)は画像のソーベル演算子によ
り畳み込まれた領域。各方向K∈[H,V,R,L]に
対して勾配G(n,m)がそれぞれの画素(n,m)
毎に検出される。
【0123】4つの検出された勾配から最大値Gmax
(n,m)がそれぞれの画素(n,m)に対するエッジ
の勾配として用いられる。
【0124】 Gmax(n,m)=max(G(n,m),G(n,m),G(n, m),G(n,m)) (9) このことは、正規化された輝度勾配sは次のようにして
得られることを意味する。
【0125】 s=Gmax(n,m)/ω (10) ここでωは正規化定数を表す。
【0126】図3には、付加的被加数が2次元関数f
(x,s)の形態で示されている。
【0127】この関数は2つの異なる領域に分割するこ
とができる。
【0128】
【数20】
【0129】0<s<1に対して式(11)は、オブジ
ェクトエッジが検出できなかった場合、または非常に小
さな輝度勾配s歯科検出できなかった場合に対して、付
加的被加数は動きベクトルの非常に大きな変化のみを制
限し、したがってオブジェクト内の画素に割り当てられ
た動きベクトルが単調関数となるようにすることを意味
する。
【0130】s≧1に対する第2の領域は、強いエッジ
が検出された領域を表す。これによりこの関数がコスト
関数に及ぼす影響が低減され、隣接する画素の動きベク
トルの跳躍が許容される。
【0131】第2の領域s≧1に対しては、
【0132】
【数21】
【0133】全体コスト関数TG(d,d)が次
に個々の画素に基づいて次の反復規則に従って検出され
る。
【0134】
【数22】
【0135】ここで項TGn−1(d1best,d
2best)はそれぞれ、先行する画素n−1に対する
動きベクトル(d1best,d2best)の最適の
対応関係を示す。
【0136】このことは、前に説明した条件確率による
基本処理に、DP方法の枠内で相当する。しかし、最大
発生確率に相当する最大評価Cが求められるのではな
く、この場合は全体コスト関数Tn(d,d)の最
小が全体コストを最小にするために求められる点で異な
る。
【0137】このことによって動きベクトルと、それぞ
れのスキャンラインSに存在する個々の画素との最適の
対応関係が得られる。
【0138】それぞれの画素に対してコスト関数の計算
のために使用される領域は基本的には任意に構成するこ
とができる。
【0139】しかしこの領域が正方形を有するか、また
は図6に示した形状を有すると有利である。
【0140】図6に示した領域の形状の利点は、この形
状によってエッジ近傍の一致結果が、適用される領域の
形状がそれ以外の場合よりも高い信頼性を有することで
ある。
【0141】この領域の形状は有利には、相互にほぼ垂
直の2つの顕著な方向で動き予測を行う際に比較的に良
好な結果を得るために選択される。この理由から、この
領域は特別の実施例では十字形をしている。
【0142】しかしこの実施例に対するこの領域の特別
の形状は、任意の形状の領域を適用できるという一般性
を制限するものではない。
【0143】3次元探索領域での各可能なずれ毎に輝度
差が形成される。この輝度差はさらに、結果を領域内に
存在する画素数Nによって割り算することにより正規化
される。
【0144】このことは基本的には、第1の画像の画素
spが、相応する第1の動きベクトル値および相応する
第2の動きベクトル値だけそれぞれずらされた、第2の
画像の画素に相当する確率である(図6参照)。
【0145】それぞれの画素に対してコスト関数が値ゼ
ロを有する場合に対しては、このことは第1の画像の輝
度値と第2の画像の輝度値との間で完全な一致の存在す
ることを意味する。コスト関数が値1を有する場合に対
しては、このことは第1の画像の領域と第2の画像の相
応する動きベクトル値だけずれた領域との間に既知の一
致が全くないことを意味する。
【0146】ここでは検出されたコスト関数Tn
(d,d)のただ1つの相違がわかる。すなわち、
比較的に小さな値に対するコスト関数の場合にはそれだ
け高い確率が得られるのである。本発明の方法ではこの
ことは、DP方法での最適化が同じように最小のコスト
関数に従って実行される場合であれば、とくに別個に考
慮する必要はない。
【0147】図6aには画素座標n,mと領域を有する
画素spが示されている。この領域内で画素spに対す
るコスト関数Tn(d,d)が形成される。
【0148】図6bには、動きベクトル(d,d
だけずれた領域が示されている。このことは、第1の画
像の画素spと第2が画像の別の画素sp’との一致が
検査されることを意味する。この第2の別の画素は第2
の画像において第1の画像に対し動きベクトル(d
)だけずれている。
【0149】図7には本発明の方法がフローチャートに
示されている。
【0150】第1のステップ71では、ビデオシーケン
スの各画像に対してインタラクティブに、第2のステッ
プ72で画像の各スキャンラインSに対して次の方法ス
テップが実行される。
【0151】ステップ73ではスキャンラインSに存在
する各画素に対して、ステップ74ではコスト関数Tn
(d,d)が上に述べたように検出される。これは
付加的被加数を伴うか、または伴わない。
【0152】ステップ75でスキャンラインSの画素に
対してDP方法を実行する。その際に、全体経路を最小
全体コスト関数TGn(d,d)に基づいて3次元
最適空間により検出する。この空間については前に説明
した。
【0153】最後のステップ76では、スキャンライン
Sの画素に、DP方法によって求められた動きベクトル
を配属する。
【0154】動き予測が実行された後、さらに画素をオ
ブジェクトについて分類し、オブジェクトに動きベクト
ルを割り当てることができる。この処理は当業者には容
易である。
【0155】画像は次に、個々のオブジェクトおよび運
動ベクトルを考慮してビデオデータ流についてチャネル
符号化され、受信器にチャネルを介して伝送される。受
信器では、ビデオデータ流が再びデコードされ、画像が
再生される。この処理も当業者には周知である。
【0156】本発明の方法は、画像処理方法であり少な
くとの1つのプロセッサによって宇実行される。
【図面の簡単な説明】
【図1】DP方法を概略的に示す線図である。
【図2】コスト関数に対する付加的被加数の枠内で使用
することのできる複数の関数を示す線図である。
【図3】付加的被加数としてコスト関数にとくに適した
関数の線図である。
【図4】2つのオブジェクトAとBを有する時間的に順
次連続した画像の概略図である。ここでオブジェクトA
は2つの方向でずれており(図4b)、そのために本発
明の基礎となる問題が明瞭である。
【図5】DP方法の結果が図4に示されたオブジェクト
AとBに適用された場合の概略図である。ここでaは公
知の方法によるものであり、マスクが検出される。本発
明の方法による付加的“探索方向”を伴うDP方法の結
果はbに示されている。本発明の方法により間違った分
類が回避され、オブジェクトAが正しく分類されてい
る。
【図6】被検ピクセルを取り囲む領域が第1の画像
(a)と、時間的に後続の第2の画像(b)に示されて
いる。第2の画像は運動ベクトル(d,d)だけず
れている。
【図7】本発明の方法の個々の方法ステップを示したフ
ローチャートである。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H04N 7/24 - 7/68

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 ビデオシーケンスの時間的に順次連続す
    る画像の画素(sp)に対する、計算機による動き予測
    方法において、a) 符号化すべき画像の各画素(sp)毎に輝度勾配を
    検出し b) 符号化すべき画像の各画素(sp)毎にコスト関数
    を検出し c)前記 コスト関数に基づいて、各画素(sp)に対し
    ダイナミック・プログラミングを実行し;d) ダイナミック・プログラミングによって検出された
    動きベクトルを前記画素(sp)に割り当てる ただし前記コスト関数は第1の項と第2の項を有してお
    り、 前記第1の項は、符号化すべき画像の領域の画素(s
    p)の輝度値と、時間的に先行する画像であって、前記
    符号化すべき画像に対してずらされている画像の同形状
    の領域の画素(sp)の輝度値との一致を表わすもので
    あり、 また前記第1の項によってコスト関数の値は、スキャン
    ライン(r)に順次並んで存在する画素(sp)の動き
    ベクトルの値(d;d1,d2)の差に相応して高めら
    れるものであり、 前記第2の項によってコスト関数の値が、輝度勾配が上
    昇するときに低減されるものである、 ことを特徴とする予測方法。
  2. 【請求項2】 前記領域を複数の画素(sp)にわたっ
    て第1の方向および/または第2の方向で伸長させる、
    請求項1記載の方法。
  3. 【請求項3】 前記領域は矩形または正方形である、請
    求項1または2記載の方法。
  4. 【請求項4】 コスト関数は次式により得られる、 【数1】 ここで、 n,mは、個々の画素(sp)の座標値、 dは、それぞれ記録された動きベクトル値、 2τ+1は、第1の方向における画素(sp)の領域の
    大きさ、 2λ+1は、第2の方向における画素(sp)の領域の
    大きさ、 N=(2τ+2λ−1)*3は、前記領域内に存在する
    画素(sp)数、 cは、正規化定数、 WF1(i,j)は、個所(i,j)における符号化す
    べき画像の輝度値、 WF2(i,j)は、個所(i,j)における時間的に
    先行する画像の輝度値、 xは、動きベクトル値の差の大きさであり、これはスキ
    ャンラインに沿って隣接する2つの画素(sp)の方向
    を表し、 μ,εは、経験的に検出された2つの定数、 βは、勾配増幅定数、 sは、それぞれの画素(sp)に対する正規化輝度勾配
    を表す、請求項1から3までのいずれか1項記載の方
    法。
  5. 【請求項5】 ダイナミック・プログラミングに対して
    以下の3つの探索領域を適用し、 ・スキャンライン(r)、これに沿って動き予測を実行
    する、 ・第1の方向に対する画素(sp)の動きベクトル値
    (d)、 ・第2の方向に対する画素(sp)の動きベクトル値
    (d)、 ダイナミック・プログラミングによって検出された第1
    の動きベクトル値と、ダイナミック・プログラミングに
    よって検出された第2の動きベクトル値を画素(sp)
    に割り当てる、請求項1から3までのいずれか1項記載
    の方法。
  6. 【請求項6】 コスト関は次のようにして得る、 【数2】 ここで、 n,mは、個々の画素(sp)の座標値、 dは、それぞれ記録された第1の動きベクトル値 dは、それぞれ記録された第2の動きベクトル値 (d,d)は、それぞれ記録された動きベクトル、 2τ+1は、第1の方向における画素(sp)の領域の
    大きさ、 2λ+1は、第2の方向における画素(sp)の領域の
    大きさ、 N=(2τ+2λ−1)*3は、前記領域にある画素
    (sp)数、 cは、正規化定数 WF1(i,j)は、個所(i,j)での符号化すべき
    画像の輝度値、 WF2(i,j)は、個所(i,j)での時間的に先行
    する画像の輝度値、 x1,x2は、スキャンラインに沿って隣接する2つの
    画素(sp)の第1ないし第2の方向に対する動きベク
    トル値の差の大きさ、 μ,εは、経験的に検出された2つの定数、 βは、勾配増幅定数、 sは、それぞれの画素に対する正規化輝度勾配を表す、
    請求項1から5までのいずれか1項記載の方法。
  7. 【請求項7】 正規化輝度勾配(s)を形成するため
    に、ソーベル・フィルタを使用する、請求項1から6ま
    でのいずれか1項記載の方法。
JP34383696A 1995-12-22 1996-12-24 ビデオシーケンスの時間的に順次連続する画像の画素に対する、計算機による動き予測方法 Expired - Fee Related JP3537616B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19548451.7 1995-12-22
DE19548451A DE19548451C1 (de) 1995-12-22 1995-12-22 Verfahren zur rechnergestützten Bewegungsschätzung für Bildpunkte zeitlich aufeinander folgender Bilder einer Videosequenz

Publications (2)

Publication Number Publication Date
JPH09187017A JPH09187017A (ja) 1997-07-15
JP3537616B2 true JP3537616B2 (ja) 2004-06-14

Family

ID=7781221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34383696A Expired - Fee Related JP3537616B2 (ja) 1995-12-22 1996-12-24 ビデオシーケンスの時間的に順次連続する画像の画素に対する、計算機による動き予測方法

Country Status (4)

Country Link
US (1) US5726713A (ja)
EP (1) EP0780793B1 (ja)
JP (1) JP3537616B2 (ja)
DE (2) DE19548451C1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6339616B1 (en) * 1997-05-30 2002-01-15 Alaris, Inc. Method and apparatus for compression and decompression of still and motion video data based on adaptive pixel-by-pixel processing and adaptive variable length coding
ATE365320T1 (de) * 2000-01-20 2007-07-15 Kyowa Hakko Kogyo Kk Verfahren zum erkennen oder quantifizieren von umwelthormonen
US7663695B2 (en) * 2000-05-05 2010-02-16 Stmicroelectronics S.R.L. Method and system for de-interlacing digital images, and computer program product therefor
US6600491B1 (en) * 2000-05-30 2003-07-29 Microsoft Corporation Video-based rendering with user-controlled movement
US20040028137A1 (en) * 2002-06-19 2004-02-12 Jeremy Wyn-Harris Motion detection camera
DE60312981D1 (de) * 2003-08-26 2007-05-16 St Microelectronics Srl Verfahren und System zum Aufheben des Zeilensprungverfahrens während der Darstellung von Videobildern
AU2006201210A1 (en) * 2006-03-23 2007-10-11 Canon Information Systems Research Australia Pty Ltd Motion characterisation
WO2019035007A1 (en) 2017-08-15 2019-02-21 American Well Corporation APPARATUS AND METHODS FOR REMOTE CAMERA CONTROL WITH INTENTION BASED COMMANDS AND AUTOMATIC LEARNING VISION STATUS MANAGEMENT

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2551290B1 (fr) * 1983-08-30 1985-10-11 Thomson Csf Procede et dispositif de detection de points en mouvement dans une image de television pour systemes de television numerique a compression de debit a rafraichissement conditionnel
EP0158984A3 (en) * 1984-04-13 1989-03-01 Hitachi, Ltd. Method for determining apair of corresponding points between images
JPH0644815B2 (ja) * 1984-04-27 1994-06-08 日本電気株式会社 動物体の動き内挿装置
US4689671A (en) * 1985-06-27 1987-08-25 Nec Corporation Coding apparatus for moving object image
FR2597283B1 (fr) * 1986-04-15 1988-06-10 Labo Electronique Physique Dispositif de traitement d'images pour l'estimation du deplacement d'objets situes dans celles-ci
FR2624682B2 (fr) * 1987-03-23 1990-03-30 Thomson Csf Procede et dispositif d'estimation de mouvement dans une sequence d'images animees
FR2648254B2 (fr) * 1988-09-23 1991-08-30 Thomson Csf Procede et dispositif d'estimation de mouvement dans une sequence d'images animees
FR2696069B1 (fr) * 1992-09-23 1994-12-09 Philips Electronique Lab Procédé et dispositif pour l'estimation du mouvement dans une image.
US5392072A (en) * 1992-10-23 1995-02-21 International Business Machines Inc. Hybrid video compression system and method capable of software-only decompression in selected multimedia systems
US5398068A (en) * 1993-09-02 1995-03-14 Trustees Of Princeton University Method and apparatus for determining motion vectors for image sequences
JP2576771B2 (ja) * 1993-09-28 1997-01-29 日本電気株式会社 動き補償予測装置
US5500689A (en) * 1994-10-26 1996-03-19 Thomson Consumer Electronics, Inc. System for detecting a video signal image intensity gradient

Also Published As

Publication number Publication date
EP0780793A2 (de) 1997-06-25
US5726713A (en) 1998-03-10
DE59609215D1 (de) 2002-06-20
EP0780793A3 (de) 1999-07-21
EP0780793B1 (de) 2002-05-15
DE19548451C1 (de) 1997-02-20
JPH09187017A (ja) 1997-07-15

Similar Documents

Publication Publication Date Title
US7046850B2 (en) Image matching
US9940719B2 (en) Alignment of an ordered stack of images from a specimen
US6549576B1 (en) Motion vector detecting method and apparatus
KR101612729B1 (ko) 전파 맵
EP0720377B1 (en) Method for detecting motion vectors for use in a segmentation-based coding system
US8331696B2 (en) Update region detection device
US20020159524A1 (en) Local constraints for motion matching
US8098963B2 (en) Resolution conversion apparatus, method and program
JP2006516062A (ja) ディジタル画像の奥行き順序付けを行う方法及び装置
JP3537616B2 (ja) ビデオシーケンスの時間的に順次連続する画像の画素に対する、計算機による動き予測方法
US7110453B1 (en) Motion or depth estimation by prioritizing candidate motion vectors according to more reliable texture information
KR20050085355A (ko) 분할된 이미지로부터 폴스 엣지들을 제거하는 방법 및 장치
JP5492223B2 (ja) 動きベクトル検出装置及び方法
JP3626826B2 (ja) ビデオシーケンスの時間的に順次の画像の画素のための計算機による動き推定方法
US7852939B2 (en) Motion vector detection method and device of the same
US9106926B1 (en) Using double confirmation of motion vectors to determine occluded regions in images
JP3175914B2 (ja) 画像符号化方法および画像符号化装置
US6553069B1 (en) Digital image segmenting method and device
KR101362545B1 (ko) 비디오 시퀀스에서 가변 외형 움직임 추정
JP2006215657A (ja) 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体
JP4250598B2 (ja) 動き補償型ip変換処理装置及び動き補償型ip変換処理方法
JP2861971B2 (ja) 動ベクトル予測装置
JP2980810B2 (ja) 動きベクトル探索方法と装置
JP3020299B2 (ja) 動きベクトル検出装置
JP3941900B2 (ja) 動きベクトル検出装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040317

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080326

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090326

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090326

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110326

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120326

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120326

Year of fee payment: 8

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120326

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140326

Year of fee payment: 10

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees