JP4606736B2 - 特徴点選択 - Google Patents
特徴点選択 Download PDFInfo
- Publication number
- JP4606736B2 JP4606736B2 JP2003504331A JP2003504331A JP4606736B2 JP 4606736 B2 JP4606736 B2 JP 4606736B2 JP 2003504331 A JP2003504331 A JP 2003504331A JP 2003504331 A JP2003504331 A JP 2003504331A JP 4606736 B2 JP4606736 B2 JP 4606736B2
- Authority
- JP
- Japan
- Prior art keywords
- motion
- image
- parameter
- feature points
- motion vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 33
- 238000013519 translation Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 6
- 230000002123 temporal effect Effects 0.000 claims 3
- 230000006870 function Effects 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 238000002187 spin decoupling employing ultra-broadband-inversion sequences generated via simulated annealing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000010187 selection method Methods 0.000 description 9
- 230000011218 segmentation Effects 0.000 description 8
- 230000007423 decrease Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Description
本発明は、特徴点選択、かかる特徴点選択を用いた動きベクトル推定、かかる動きベクトル推定を用いた画像信号処理、かかる画像信号処理を用いたビデオディスプレイ装置に関する。
【0002】
オブジェクトベースの動きベクトル推定(OME)は、オブジェクトと称される画像部のビデオシーケンスをセグメント化し、動きモデルを割り当てることを目的とし、シーケンスにおける各オブジェクトに対して、動き及び/又は画像部が受ける変形を表現することを目的とする。所与の画像部に対する動きモデルを計算し、若しくは、所与の動きモデルで画像をセグメント化することは明快であるが、OMEでは、オブジェクト及び動きモデルが与えられない。それ故に、目標は、ニワトリが先か卵が先かの問題を呈する。この問題を解決するための種々の選択肢が提案されている[例えば、最終項に一覧する参考文献3,9,10,11参照]。以前の発表では、我々は、これらの提案は全て計算的に複雑であるとの結論に達し、DSP上でリアルタイムに実行するように表示されうるより一層効果的な反復型OMEアルゴリズムを設計した[例えば、参考文献1,12参照]。
【0003】
この以前の設計OMEアルゴリズムは、賢い反復態様でニワトリが先か卵が先かの問題を解決することによって、非常に限定された量のピクチャデータ(画像の特徴点)でパラメトリック動きモデルを計算することによって、簡易なパラメータ最適化アルゴリズムを用いることによって、及び、副サンプルされたバージョンのビデオ信号を用いてビデオをセグメント化することによって、高効率を実現する。
【0004】
このアプローチの成功のためには、特徴点のインテリジェントな選択が決定的となる。この説明では、我々は、特徴点を選択する際の更なる前進について報告する。より詳細には、我々は、特に、簡易な最適化技術を用いたときの動きモデルパラメータ推定関数の収束を改善する、新たな特徴点選択アルゴリズムを開示する。この改善は、文献に見出せる代替方法及び評価の参照として我々が以前に使用したアルゴリズムを用いて定量化されるだろう。
【0005】
この説明は、次のように構成される。この序文に続いて、2章では、我々は、以前に開発した反復型OME方法を概説する。次いで、3章では、我々は、特徴点選択方法に焦点を当て、幾つかの以前の方法を議論し、新たな概念を導入する。4章では、我々は、これらの特徴点選択アルゴリズムを評価し、5章では、結論を導く。
【0006】
2.先行の研究
2.1. 動きモデル
我々の以前のOMEに対する寄稿では、我々は、特有ラベルOによりオブジェクトを識別した。各オブジェクトOには、パラメータベクトル
【外1】
が関連付けられる。このパラメータベクトルは、オブジェクトの並進運動及び倍率(ズーミング)を表わす。オブジェクトOのパラメータベクトルと、オブジェクトOの動き(若しくは変位)ベクトル
【外2】
との関係は、画像のピクセルグリッド位置
【外3】
にて、次式となる。
【0007】
【数1】
複雑性を許容可能に保つため、我々は、性能を大きく落とすことなく、オブジェクト数を5に固定した。
【0008】
2.2. 動きセグメント化
動きセグメント化モジュールは、画像中の各ブロックに、最も良好にマッチング(整合)する動きモデルを割り当てる。最終のセグメント化マスク
【外4】
は、それ故に、次式のように、最小化によって構築される。
【0009】
【数2】
計算効率を改善するため、変位ベクトル
【外5】
は、ブロック
【外6】
内の、各ピクセル毎
【外7】
に計算されないが、
中心ピクセル
【外8】
においてのみ計算される。
【0010】
尚、大文字
【外9】
は、ブロックグリッド上の位置を示し、
小文字
【外10】
は、ピクセルグリッド位置を示す。動きセグメント化の詳細な説明は、参照文献2にある。
【0011】
2.3. パラメータ推定
パラメータ推定モジュールは、特徴点の小セットFSに亘って、パラメータ推定誤差、数3の式を最小化することによって、オブジェクトの動きモデルのパラメータを決定する。
【0012】
【数3】
各々のオブジェクトは、直交ログ探索を用いてオブジェクトパラメータベクトルを推定する独自のパラメータ推定器PE0を有する。図1aは、ログ探索手順を示す。初期のパラメータベクトル
【外11】
は更新され、候補パラメータベクトルセットCPSl(1)を得る。このセットから最もマッチングする候補、この場合、
【外12】
、が選択され、それが、パラメータ推定器の次の反復に対する入力となり、即ち
【外13】
が、更新され、これにより候補パラメータベクトルセットCPSl(2)が得られ、このセットから、最もマッチングする候補が選択され、
【外14】
、更新され、といった具合に続く。更新は各反復で小さくなっていく。各パラメータ推定器は、前に推定されたパラメータベクトル
【外15】
を反復的に更新することによって、新たなオブジェクトパラメータベクトルを推定する。ここで、nは画像数、oはオブジェクト、kは、パラメータ推定器の反復数を示す。新たなパラメータベクトルは、多数の候補パラメータベクトル
【外16】
から、最も低いパラメータ推定誤差
【外17】
となるものが選択される。候補ベクトルのセットCPSo n(k)は、次式に従って構築され、この中から最も良好なベクトルが反復kにて選択される。
【0013】
【数4】
ここで、
【外18】
は、前の反復からの最もマッチングの良い候補、即ちサブセットCPSo n(k−1)からの最もマッチングの良い候補であり、
【外19】
は、前の画像ペアから得られた最もマッチングの良いパラメータベクトルである。更新ベクトル
【外20】
は、反復数kの増加と共に長さが減少する。更新セットUPSoは、次のように定義される。
【0014】
【数5】
このアルゴリズムは、盲目的に、減少する誤差の方向にパラメータ推定誤差表面に追従する。それ故に、局所最小値(極小)の影響を非常に受けやすい。更に、初期のパラメータベクトルの位置から絶対的な最小値までのパラメータ推定誤差表面内に単調減少経路がある場合、探索が絶対的な最小値を生む確率は小さい。明らかに、最適なパラメータ推定誤差表面は、絶対最小値に至る広い“ファンネル”で単調に減少していく。
【0015】
2.4. 初期探索
局所最小値で終了する危険を低減するため、パラメータ推定モジュールは、初期探索を実行できる。初期探索中、10のパラメータベクトルが試験され、そのうちの9つが図1bに従って分散される。初期探索中、最もマッチングの良いパラメータベクトルが、これらの9つのパラメータベクトルから選択され、前の画像からの最も良いパラメータベクトルで拡張される。このパラメータベクトルは、ログ探索に対する入力である。この初期探索中、併進のみが考慮される。9つのパラメータベクトルのセットは、前の画像ペアからの最も良いパラメータベクトルで拡張される。このパラメータベクトルは、前の推定成功が将来の推定に使用されることを保証するために必要である。初期探索中に試験されるパラメータベクトルのセットは、次の通りである。
【0016】
【数6】
初期探索は、このセットのパラメータベクトルでパラメータ推定を最小化する。
【0017】
【数7】
結果として得られるパラメータベクトルは、次いで、ログ探索に対する入力となる。
【0018】
試験を通して、パラメータ推定モジュールの性能が特徴点セットFSの選択に大きく依存することがわかった。次の章では、我々は、これらの特徴点を選択する新たな方法について議論する。
【0019】
3. 特徴点選択
アパーチャ問題(参考文献3)及びそれに伴いパラメータ推定問題を防止するため、特徴点のセットは、図1に示すように、少なくとも2つの方向にエッジを有するべきである。特徴点のセットが2次元構造を有しない場合、パラメータ推定誤差
【外21】
は、特有の最小値を有さず、オブジェクトの実際の動きは、図2a,図2dに示すように、決定できない。図2aは、2次元構造を有さない4つの特徴点のセットを持つ灰色長方形画像オブジェクトを示す。図2bは、2次元構造を有さない4つの特徴点のその他のセットを持つ同一の灰色長方形画像オブジェクトを示す。図2cは、ブロック内に2次元構造を有さないが、全体のセットは2次元構造を有する特徴点を示す。図2d,図2e,図2fは、それぞれ、図2a,図2b,図2cの特徴点に対応する併進パラメータを関数としてパラメータ推定誤差を示す。図2aは、
【外22】
で併進する灰色ブロックの鉛直向きエッジに位置する4つの特徴点を示す。図2dは、併進パラメータtx、tyを関数としてパラメータ推定誤差を示す。明らかに、この誤差表面は、特有の最小値を有さず、多数のパラメータベクトルが同一の最小値推定誤差を導く。これは、パラメータベクトルを性格に推定することが不可能であることを意味する。図2bは、特徴点自身が2次元構造を含む状況を示す。結果としてのパラメータ推定誤差表面、図2eは、実際のパラメータベクトルの位置で特有の最小値を表わす。これは、パラメータベクトルの正確な推定を可能とする。上述のパラメータ推定方法の場合、多数の特徴点が組み合わされるので、全ての特徴点が2次元構造を含むことは必要でない。それ故に、特徴点のセットが2次元構造を示すことで間に合う。これは、図2c,図2fに指示される。
【0020】
3.1. 従来の特徴点検出器
多くの著者は、2次元特徴の検出について報告している。概略は参考文献4にある。この文献に表わされるアルゴリズムは、例えば、Moravec、Plessey若しくはSUSANの検出器(参考文献5,6,7)は、一般的に、あまりにも計算的に複雑すぎて、プログラム可能な装置上での実時間OMEでの使用に耐えない。更に、これらの検出器は、特徴点内の2次元構造を探す。我々の場合、我々は、圧倒的に緩和された制約しかない、特徴点の完全なセット内の2次元構造に関心がある。Moravec関心オペレータは、通常次のように書ける。
【0021】
【数8】
SUSANの検出器は、単一の公式で捉えるのにはより難しい。SUSANの原理は、小さな画像領域の中心ピクセルと同一と評価されるピクセルを決定することにある。これ、所謂USAN(Univalue Segment Assimilating Nucleus)は、画像の構造についての多くの情報を含む。サイズから、図心、二次モーメント2次元特徴及びエッジが検出できる。
【0022】
これらの検出器は、通常的に、特徴点を決定するために多数のピクセル頻繁動作を必要とする。100の特徴点を決定するため、Moravec関心オペレータは、約1×109クロックサイクル必要とする。我々が実験に用いたDSP(Philips TriMediaからTM1100として購入可能)は、画像毎に約1×107を可能とする。幾つかのアルゴリズム的な最適化及びコード最適化により、検出器により必要とされるクロックサイクル数は、約20及び時々それ以上の要因まで下げることができる。しかし、クロックサイクル数が大きさの2のオーダーで減少された場合でも、DSPでの実現は実時間ビデオアプリケーションに対して可能でない。
【0023】
これらの特徴点検出器における上述以外の判り難い欠点は、式3の最小化が、これらの特徴検出器で決定された特徴点を用いたときに難しいことである。この問題を説明するため、図3を参照する。図3aでは、画像コンテンツが左から右にフレーム毎に5ピクセルの水平速度で併進する人工的なビデオシーケンスから画像が示されている。図3bは、併進パラメータtx、tyを関数としてパラメータ推定誤差
【外23】
を示す。パラメータ推定器の計算複雑性を制限するため、たった100つの特徴点が使用され、SUSANのコーナ検出器で検出される。図3aから、特徴点が非常に急激な輝度遷移を示す位置に配置されていることがわかる。
【0024】
特徴点内の特徴の急激さにより、
【外24】
の最小値が非常に局所化され、即ち3次元プロットの誤差表面における“ファンネル”が非常に狭い。多くの場合、これは、まさに、例えばこの個々の特徴点を追跡する際、望まれるものである。我々の場合、我々は、絶対最小値を探索するため非常に簡易な(ログ探索)アルゴリズムを有すればよい。この低い複雑性の制約は、OMEが実現されるプログラム可能な装置の制限に起因する。上述のログ探索を使用し、ランダムな初期パラメータベクトルを用いると、試験は、最小値が見つかる確率が0.3までであることを示す。すべての他の場合では、探索アルゴリズムは局所最小で終わる。この確率は、正確なパラメータ推定のためには低すぎることがわかる。試験についての詳細は4章にある。
【0025】
3.2. 効率的な特徴点検出のための新しいアプローチ
本発明の目的は、実時間特徴検出器を提供・使用することである。本発明は、独立クレームにより定義される。従属クレームは、効果的な実施例を定義する。
【0026】
DSP上でのOMEに対する実時間特徴検出器を得るため、我々は、動きセグメントモジュールの通常動作によって生成される情報を使用することができる。この情報はいずれにせよ計算されるので、特徴点検出器自体は、ほとんどオーバーヘッドを引き起こさない。次の2つの副章では、幾つかの選択肢がより詳細に論じられる。
【0027】
3.2.1. ハイエスト(Highest)SAD方法(HSAD)
画像の固定された領域をカバーする固定されたオブジェクトが定義される場合、移動部の動きモデルのみしか推定される必要がない。更に、2つの連続フレームの絶対差が取られる場合、この差が、あるノイズレベルより上の領域は、即ち、
【外25】
となる領域は、動きを持ち、より重要なことには、動きの方向に構造を有するだろう[参考文献3]。特徴点の小セットを得るため(計算上の複雑性により小さい)、残りのタスクは、これらの領域からサブセットを選択することである。即ち、
【0028】
【数9】
このアプローチの利点は、特徴点の選択が略ゼロの追加コストで生ずることである。ゼロの動きはビデオシーケンス内のどこにでもあるものであるので、我々は、我々のOMEにゼロ速度オブジェクトを加えることとした。このオブジェクトは、一定のパラメータベクトル
【外26】
を有し、例えばサブタイトル及び放送局のロゴを含む静止画像部をカバーする。動きセグメント化中、式2が最小化され、結果として、
【外27】
が全てのブロックに対して計算される。特徴点を選択する実際のコストは、サブセットを選択する複雑性によって決定される。
【0029】
かかるサブセットを選択する1つの方法は、絶対差
【外28】
の最も高い合計を有するN個の領域を単に取ることによる。これは、我々の以前のOME寄稿[参考文献1,12]で使用された方法である。しかし、我々は、図4aに示されているが、この方法は、高コントラストのエッジ上でなく、当該エッジの近傍の均一な領域に特徴点を位置付ける傾向にあることを見出した。これは、エッジ上に特徴点を位置付けることでは、たった半分のピクセルが異なる輝度値を有することになる一方、エッジ近傍に配置された特徴点では、すべてのピクセルが異なる輝度値を有し、それ故により高いSADを有することになる。
【0030】
図4bは、特別な場合に対する結果として、併進ベクトルtx、tyを関数としたパラメータ推定誤差εpを示す。HSAD法で選択された100の特徴点が使用されている。パラメータ推定誤差表面は、ここでは、正確なパラメータベクトル、この場合、
【外29】
で明確な最小値を有さないが、代わりに、誤差表面はtx<−10の領域で幾分か平らであり、これにより、正確なパラメータベクトルの推定が不能とされる。図4bに表わした例は極端なものであるが、この特性は、常に性能にマイナス方向に影響するだろう。
【0031】
3.2.2. ランダムSAD方法(RSAD)
前の副章で述べた問題により、我々は、フレーム差
【外30】
がある閾値よりも高い全てのブロックからN個のブロックのランダム選択がなされたときに得られるより良好なスキームを開発した。閾値は、全ての静止型できめ細かさの無い領域を除去するのに十分なほど高いが、前述のアルゴリズムの場合のように、高コントラストのエッジに近接する均質なブロックのみが選択されないことを保証するほど十分低い値が選択されなければならない。閾値の実際の値は、ビデオシーケンス内のノイズのレベルに依存する。RSAD法による特徴点の位置付けを示す図5aでわかるように、この方法は、高コントラストのエッジ近傍のブロック上のみならず、移動する高コントラストのエッジ上にも選択する。図5bは、併進ベクトルtx、tyを関数としたパラメータ推定誤差εpを示す。100個の特徴点が使用され、RSAD法により選択されている。結果として、ログ探索は、0.7の確率で最小値を見つけることになる。尚、最後の場合での“ファンネル”は、図3のファンネルよりも非常に広く、これは、絶対最小値が副章2.3で言及した計算効率のアルゴリズムにより見出されなければならないときに効果的である。
【0032】
4.試験
幾つかの試験が、特徴点検出器の性能を定量化するために実行された。プログラム可能な装置上で実時間で動く我々のソフトウェアOMEで適用可能とされるため、特徴点検出器が満たすべき多くの要求がある。
【0033】
この特徴点選択は、非常に少ない数の特徴点でも、正確なパラメータ推定が可能なままであるべきである。この要求の背景は、小さなオブジェクトは、少ない特徴点しか含み得ないことにある。従って、正確なパラメータ推定を可能とする特徴点の最小数は、我々が我々のOMEを使って扱えるオブジェクトの最小サイズに対する基準である。
【0034】
特徴点選択は、より小さい特徴セットでもノイズの通常レベルに対してパラメータ推定を幾分ロバストにすることを可能とする特徴セットを生むべきである。特徴点の数が小さくなるにつれて、ノイズの影響が大きくなる。従って、ノイズに対するロバスト性は、我々のOMEが扱えるオブジェクトの最小サイズを決定する。
【0035】
我々の特徴点選択方法は、計算的に簡易であるべきである。
【0036】
試験は、これらの条件を対処することを目標とする。4つの人工的シーケンスが試験に用いられる。第1では、コンテンツが5ピクセルだけ右に動き、第2では、コンテンツが10ピクセルだけ右に動き、第3では、コンテンツが5ピクセルだけ下に動き、第4では、コンテンツが10ピクセルだけ下に動く。我々は、各シーケンスから単一の画像を取り、それを上述の動きベクトルで併進させ、次の画像を生成することによってこれらのシーケンスを構築した。
【0037】
4.1. 特徴点の数の影響
上述の如く、正確なパラメータ推定を生む特徴点の最小値は、我々が動きを推定できるオブジェクトの最小サイズの基準である。明らかであるが、我々は、この最小を可能な限り小さくしたい。図6aは、成功の確率、即ち副章1.3で述べたログ探索が正確なパラメータベクトルを生む確率は、特徴点の数に依存することを示す。成功の確率は、4つの特徴点検出器(SUSAN,Moravec,HSAD,RSAD)に対して、T=200で与えられている。図6aに示す結果は、特別な特徴点検出器の全てのシーケンスに亘る結果を平均化することによって得られる。図6aから、SUSANコーナ検出器及びMoravec関心オペレータの成功確率は低く、適切なパラメータ推定に対して低すぎる。これらの貧弱な結果の背景は、既に章2.1で述べた。特徴の急激さがパラメータ推定誤差表面の“ファンネル”を非常に狭くさせている。この結果、簡易なログアルゴリズムは、大部分の場合、最小値を位置特定することができないことになる。
【0038】
また、HSAD法は、SUSAN及びMoravec検出器と同様の結果を導いていることがわかる。副章2.2.1で説明したように、この原因は、特徴点内の特徴の急激さではなく、特徴点内の構造の欠落である。これは、各位置で同一の誤差を実質的に有する大きな領域を示すパラメータ推定誤差表面を生み、正確なパラメータ推定を不能にする。RSAD法は、他の方法の成功率に比して2倍高い成功率を有する。図5aからわかるように、この方法は、急で浅い特徴を示すブロックを選択する。浅い特徴は、パラメータ推定誤差表面の“ファンネル”の拡幅によるもので、ログ探索が最小値まで“ファンネル”を下降することをより容易にする。
【0039】
RSADの成功確率は、他の方法よりも2倍高いけれど、我々は、パラメータ推定表面で絶対最小値を見出すため、多数の初期ベクトルを試みる必要が依然としてある。一般に、3つの試行が、正確なパラメータベクトルを見出す確率およそ95%を有するために必要とされる。我々のDSPを用いて、OMEは、画像毎に唯一のログ探索をすれば良い。従って、3つの画像が正確なベクトルを見出すために必要となるだろう。この問題は、非常に不規則な動きのある風景で若しくは風景変化でのみ起こるものであろう。人の視覚系は風景が変わった後に収束するのに2、3フレームかかるので、これはそんなに問題でない。他の特徴検出器の場合、我々は、平均8フレーム後に、正確なベクトルを得るだろう。
【0040】
異なる数の特徴点の場合のRSADアルゴリズムのロバスト性は良好である。アルゴリズムの性能は特徴点数の減少と共に減少するが、性能はN=30の特徴点まで安定である。
【0041】
図6bは、RSAD法の性能が特徴点の数及び使用される閾値に如何に依存するかを示し、即ち、RSAD法の特徴点の数及び閾値を関数とした正確な動きベクトルを見出す確率を示す。閾値を越える
【外31】
を備えるブロックだけが特徴点となることができるので、閾値は、特徴点内若しくは特徴点の近傍における特徴の急激さの指針である。面白いことは、閾値の増加と共に性能が落ちることである。これは、パラメータ推定プロセスへの特徴点の急激さの影響に関する我々の見解を裏付ける。幾つかのアプリケーションが急激な特徴から利点を得る場合、我々のOMEでは該当しないが、急激な特徴しか存在しない特徴点セットに悩まされる。
【0042】
4.2. ノイズの影響
通常のビデオ題材はノイズに悩まされるので、我々のOMEは、異なるレベルのノイズの下で実行できるべきである。これは、動きセグメント化及びパラメータ推定モジュールの双方が異なるレベルのノイズの下でロバストであるべきことを意味する。予測されることとして、より高いノイズレベルは、パラメータ推定の性能に悪影響を及ぼすだろう。ここで、特徴点は重要な役割をする。より少ない数の特徴点は、おそらく、より大きい数の特徴点より大きくノイズに影響されるだろう。疑問は、パラメータ推定器の性能がどの程度ノイズに影響されるのかである。試験は、この問題を解決するために実行される。4つの人工的な試験シーケンスが、異なるレベルのガウスノイズで汚染された。これらのシーケンスは異なる特徴点検出器に供給され、結果として得られた特徴点が、パラメータ推定に用いられた。異なる試験シーケンスを用いた結果は、平均化され、この結果(ガウスノイズの標準分散を関数とする成功確率)が、異なる特徴点検出器SUSAN,Moravec,HSAD,RSADに対して図7aに示される。使用された特徴点の数は100である。明らかに、全ての特徴点検出器の性能は、少なくともこの大きな数の特徴点では、ノイズのレベルから極めて独立している。
【0043】
パラメータ推定の性能に対する特徴点数とノイズの組み合わせの影響が図7bに示される。図7bは、特徴点の数を関数としてRSAD法に対する成功確率を示す。ガウスノイズの異なるレベルに対する結果が示される。30若しくはそれ以上の特徴点では、性能はノイズのレベルから幾分か独立していることがわかる。既に、30個の特徴点未満ではパラメータ推定器の性能が落ちることはわかっている。ロバストなパラメータ推定を得るためにはオブジェクト当たり30個の特徴点が最小値であると思われる。
【0044】
4.3. 計算上の複雑性
特徴点検出器が我々のOMEで効果的に使用できる前に満足すべき最後であるが最も重要性が低いわけでない要求は、その計算上の複雑性である。DSPは、非常に限られた数の動作しか有さない。150MHzで走り、一秒当たり50の画像を処理するTriMediaの場合、我々は、およそ7.5Mopsを計画立てることができる。尚、TriMediaは、5つの送出スロットを有し、説明上、我々は、動作当たり2サイクルの待ち時間を想定する。多くのこれらの動作は、動きセグメント化及びパラメータ推定モジュールで使用されることとなり、非常に少ない数の動作しか特徴点検出で使用されない。我々が試験で使用したアルゴリズムの解析は、図8の結果となり、特徴点の数を関数とする特徴点検出器により使用された動作数が、異なる特徴点選択方法に対して示されている。アルゴリズムの計算複雑性は、所与のアルゴリズムで使用される加算、減算、乗算、フェッチ、記憶を単にカウントすることによって決定された。
【0045】
図8は、SUSAN及びMoravec検出器が、DSPにより供されるものより2のオーダーの大きさで高い計算複雑性を有することを示す。HSAD及びRSAD検出器は、DSPリソースの端数(1×10−3)しかかからない。プラットフォーム上での最適な実現が利用可能でない場合、計算複雑性の図を比較することは常に幾分危険である。しかし、異なるアルゴリズムの複雑性間の大きな相違により、我々の場合、SUSAN及びMoravec検出器は非常にコストの多大なものであるといえる。HSADは、ソーティング(並べ替え)アルゴリズムが使用されなければならないので、RSADより幾分コストが大きい。
【0046】
上述の説明は、我々のオブジェクトベースの動き推定器が、副サンプル化された画像を処理してメモリのバンド幅及び計算負荷を低減するものであるので、副サンプル化された画像の観点からフレーム差を議論している。
【0047】
フレームは、水平方向及び垂直方向に4回サブサンプルされ、これは、ブロックサイズ、通常フレーム上の元来8×8ピクセルが、副サンプル化されたフレーム上の2×2ピクセルまで小さくされることを意味する。
【0048】
閾値Tnは、ビデオシーケンスにおけるブロックサイズ及びノイズレベルに依存する。
【0049】
2×2ピクセルのブロックサイズ及び通常のノイズレベル(即ち、放送題材に対する通常)に対応するのは、ピクセル値が0から255の間であるとき、下限Tn=20である。特徴がノイズにサブマージされる確率は、この最小値以下で非常に大きくなる。
【0050】
我々のアルゴリズムではTn=30を使用する。閾値の最大値の考え方を付与する。動き推定器の性能は、Tn=100で非常に低くなる。典型的な閾値の範囲は、最小20、最適30、最大100である。
【0051】
選択される特徴点の数は、動きの推定の対象となるオブジェクトの数に依存する。我々の場合4つのオブジェクトが使用される。
【0052】
オブジェクト当たり我々は各オブジェクトに対して最低10個の特徴点が必要である。これは、ノイズのマイナスの影響及び選択方法のランダムさを抑える。
【0053】
特徴点の最大量は、Philips TriMedia ICが提供するリソースによって支配される。たった今、特徴点の最大数は、200程度である。試験から、我々は、100の特徴点が、TriMedia上での現在のオブジェクトベースの動き推定器に対して最適な量であることを知っている。特徴点の数に対する範囲は、従って、最小30、最適100、最大200である。
【0054】
図9は、本発明によるディスプレイ装置の一実施例を示す。ビデオ信号VSは、画像の時間変化量が所定の閾値を超える画像(VS)の位置を決定する閾値回路THRに入力される。結果は、画像の時間変化量が所定の閾値を超える画像(VS)の位置から多数の選択位置Lを選択する選択回路Sに入力される。閾値回路THR及び選択回路Sは、協働して、特徴点選択装置FPSを形成する。選択位置L及びビデオ信号VSは、選択位置Lで動きパラメータ推定誤差を最小化することによって動きパラメータMPを推定する動きパラメータ推定器MPEに入力される。動きベクトル発生器MVGは、動きパラメータMPから動きベクトルMVを生成する。動きパラメータ推定器MPE及び動きベクトル発生器MVGは、協働して、パラメトリック動き推定器PMEを形成する。特徴点選択装置FPS及びパラメトリック動き推定器PMEは、協働して、動きベクトル推定装置を形成する。動きベクトル推定装置FPS,PMEの出力は、動きベクトルMVに依存してビデオ信号VSを処理する動き補償プロセッサMCPに入力される。動き補償プロセッサMCPは、50Hzの入力信号から100Hzの変換を実行してよく、若しくは、24Hzのフィルム信号の50Hzのビデオ信号への変換により生ずるフィルム変換ジャダーを、フィルム画像を2,3回交互に繰り返すことによって低減して良い。動きベクトル推定装置FPS,PME及び動き補償プロセッサMCPは、協働して、動き補償処理装置FPS,PME,MCPを形成する。ディスプレイ装置Dは、動き補償処理装置FPS,PME,MCPの出力信号を表示する。
【0055】
5. 結論
最近、我々は、デジタル信号プロセッサ(DSP)上での標準定義ビデオに対する実時間のオブジェクトベースの動き推定(OME)を可能とする反復アルゴリズムに関して報告した[参考文献1,2,12]。アルゴリズムは、パラメトリック動きモデルで画像内のオブジェクトの動きを近似し、最もマッチングするモデルをブロック毎に画像部に割り当てることによってセグメントマスクを作成する。パラメータ推定モジュールは、特徴点と称される画像データの小さな破片(フラクション)に関する動きモデルのパラメータを決定する。この説明では、我々は、動きパラメータ推定処理、特にプログラム可能な装置上でのオブジェクトベースの動き推定のための特徴点選択の、収束性を改善する計算効率が非常に良い新しい特徴点選択方法を提案する。この方法は、ある閾値Tnを越えるフレーム差を持つブロックのセットからN個のブロックをランダムに選択する。特徴点は、実時間OMEに対するパラメータ推定器で使用される。特徴点の品質は、それ故に、このアプリケーション範囲内で測定される。本方法は、3つの他の方法と比較された。文献から知られている2つの特徴検出器、即ち、SUSANコーナ検出器及びMoravec関心オペレータ、及び、OMEに関する先の発表で使用されていた、最も大きいフレーム差を持つN個のブロックを選択する1つの特徴検出器である。新たな特徴点選択アルゴリズムは、より良い性能を生み、より小さい計算複雑性を持つ。本発明に対するキーワードは、オブジェクトベースの動き推定、動きセグメント化、パラメータ推定、特徴点である。
【0056】
尚、上述の実施例は、本発明を限定するものでなく、当業者であれば、請求項に記載の発明の観点から逸脱することなく多くの代替実施例を設計できるだろう。フレーム差に代えて、フィールド差が用いられてよい。画像は、飛び越し型若しくは漸進的であってよい。上述の好ましい実施例では、ランダム選択が、初期の数、例えば3000個の特徴点から100個の特徴点を保持するためになされているが、“強い”及び“弱い”特徴を選択する如何なる他の選択方法でもよい。例えば、各30番目の特徴点を取ることは、3000個の初期の特徴点から選択された100個の特徴点の最終リストにおいて“強い”及び“弱い”特徴の双方をもたらすだろう。
【0057】
単語“含む”は、クレームに挙げられた要素若しくはステップ以外の存在を排除するものでない。単数表現は、複数の要素の存在を排除するものでない。本発明は、幾つかの特有の要素を含むハードウェアによって、及び、適切にプログラムされたコンピューターによって実現されてよい。幾つかの手段を列挙した装置クレームでは、これらの手段の幾つかは、一の同一のハードウェア製品によって具現化されても良い。ある手段が相互に異なる従属クレームで言及されている単なる事実は、効果を得るためにこれらの手段の組み合わせが使用できないことを示しているのではない。
【0058】
最後に、上述の説明において参照された参考文献を以下に示す。
【0059】
【外32】
【図面の簡単な説明】
【0060】
【図1】(a)及び(b)は、パラメータベクトルのログ探索を示す図である。
【図2】(a)及び(f)は、特徴点選択を示す図である。
【図3】(a)及び(b)は、先行技術の特徴点検出器の問題を示す図である。
【図4】(a)及び(b)は、ハイエストSAD方法に対する併進誤りを関数としてパラメータ推定誤りを示す図である。
【図5】(a)及び(b)は、ランダムSAD方法に対する併進誤りを関数としてパラメータ推定誤りを示す図である。
【図6】(a)及び(b)は、異なる特徴点選択方法の特徴点の数への依存性を示す図である。
【図7】(a)及び(b)は、異なる特徴点選択方法のノイズ依存性を示す図である。
【図8】異なる特徴点選択方法に対する特徴点の数を関数として動作の数を示す図である。
【図9】本発明によるディスプレイ装置の一実施例を示す図である。
Claims (6)
- ビデオ信号の画像の動きベクトルを推定する方法であって、
前記画像の時間変化量が所定閾値を超える画像中の位置を決定するステップと、
前記画像の時間変化量が前記所定閾値を超える位置の中から多数の選択位置をランダムに選択するステップと、
前記選択した選択位置に基づいて動きベクトルを推定するステップとを含み、
前記選択した選択位置に基づいて動きベクトルを推定するステップは、
前記選択位置及び前記ビデオ信号を動きパラメータ推定器に加え、前記動きパラメータ推定器は、前記画像中のオブジェクトの並進運動及び倍率を表すパラメータベクトルである動きパラメータを推定し、前記動きパラメータは、前記選択位置における動きパラメータ推定誤差を最小化することによって推定される、ステップと、
前記オブジェクトの並進運動及び倍率を表す前記動きパラメータから、前記動きベクトルを生成するステップと、
を含む、方法。 - 前記所定閾値は、ピクセル値が0から255まであるとき、20から100の間であり、好ましくは30である、請求項1記載の方法。
- 前記選択位置の数は、30から200の間であり、好ましくは100である、請求項1記載の方法。
- ビデオ信号の画像の動きベクトルを推定する動きベクトル推定装置であって、
前記画像の時間変化量が所定閾値を超える画像中の位置を決定する手段と、
前記画像の時間変化量が前記所定閾値を超える位置の中から多数の選択位置をランダムに選択する手段と、
前記選択位置及び前記ビデオ信号から、前記画像中のオブジェクトの並進運動及び倍率を表すパラメータベクトルである動きパラメータを推定する手段であって、前記動きパラメータは、前記選択位置における動きパラメータ推定誤差を最小化することによって推定される手段と、
前記オブジェクトの並進運動及び倍率を表す前記動きパラメータから、前記動きベクトルを生成する手段とを含む、ビデオ信号の画像の動きベクトルを推定する動きベクトル推定装置。 - 請求項4記載の動きベクトル推定装置と、
前記動きベクトルに依存してビデオ信号の画像を処理する手段とを含む、動き補償処理装置。 - 請求項5記載の動き補償処理装置と、
前記動き補償処理装置の出力ビデオ信号を表示するためのディスプレイ装置とを含む、画像表示装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01202217 | 2001-06-11 | ||
EP01204206 | 2001-11-05 | ||
PCT/IB2002/002146 WO2002101651A2 (en) | 2001-06-11 | 2002-06-10 | Feature point selection |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004533073A JP2004533073A (ja) | 2004-10-28 |
JP4606736B2 true JP4606736B2 (ja) | 2011-01-05 |
Family
ID=26076926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003504331A Expired - Fee Related JP4606736B2 (ja) | 2001-06-11 | 2002-06-10 | 特徴点選択 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20040151250A1 (ja) |
EP (1) | EP1435070B1 (ja) |
JP (1) | JP4606736B2 (ja) |
CN (1) | CN1328699C (ja) |
WO (1) | WO2002101651A2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7362374B2 (en) * | 2002-08-30 | 2008-04-22 | Altera Corporation | Video interlacing using object motion estimation |
EP2038842A2 (en) * | 2006-06-30 | 2009-03-25 | Nxp B.V. | A method and device for video stitching |
WO2008078736A1 (ja) * | 2006-12-27 | 2008-07-03 | Nec Corporation | 同一性判定装置、同一性判定方法および同一性判定用プログラム |
JP4775277B2 (ja) * | 2007-02-07 | 2011-09-21 | 株式会社デンソー | 画像処理装置及び画像処理方法 |
KR20090011515A (ko) * | 2007-07-26 | 2009-02-02 | 삼성전자주식회사 | 화질 개선방법, 이를 적용한 영상신호 처리장치 및av기기 |
US8456711B2 (en) * | 2009-10-30 | 2013-06-04 | Xerox Corporation | SUSAN-based corner sharpening |
US9449397B2 (en) | 2014-10-15 | 2016-09-20 | Caterpillar Inc. | Real-time visual odometry system for determining motion of a machine with a range detection unit |
CN105678587B (zh) * | 2016-01-12 | 2020-11-24 | 腾讯科技(深圳)有限公司 | 一种推荐特征确定方法、信息推荐方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5438374A (en) * | 1993-12-10 | 1995-08-01 | At&T Corp. | System and method for filtering video signals |
KR100209793B1 (ko) * | 1995-10-28 | 1999-07-15 | 전주범 | 특징점 기반 움직임 추정을 이용하여 비디오 신호를 부호화 및 복호화하는 장치 |
US6504569B1 (en) * | 1998-04-22 | 2003-01-07 | Grass Valley (U.S.), Inc. | 2-D extended image generation from 3-D data extracted from a video sequence |
US6252975B1 (en) * | 1998-12-17 | 2001-06-26 | Xerox Corporation | Method and system for real time feature based motion analysis for key frame selection from a video |
US6760488B1 (en) * | 1999-07-12 | 2004-07-06 | Carnegie Mellon University | System and method for generating a three-dimensional model from a two-dimensional image sequence |
US7123745B1 (en) * | 1999-11-24 | 2006-10-17 | Koninklijke Philips Electronics N.V. | Method and apparatus for detecting moving objects in video conferencing and other applications |
-
2002
- 2002-06-10 US US10/480,077 patent/US20040151250A1/en not_active Abandoned
- 2002-06-10 JP JP2003504331A patent/JP4606736B2/ja not_active Expired - Fee Related
- 2002-06-10 CN CNB028116704A patent/CN1328699C/zh not_active Expired - Fee Related
- 2002-06-10 EP EP02735771A patent/EP1435070B1/en not_active Expired - Lifetime
- 2002-06-10 WO PCT/IB2002/002146 patent/WO2002101651A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20040151250A1 (en) | 2004-08-05 |
WO2002101651A3 (en) | 2004-04-29 |
CN1328699C (zh) | 2007-07-25 |
EP1435070B1 (en) | 2012-10-17 |
EP1435070A2 (en) | 2004-07-07 |
JP2004533073A (ja) | 2004-10-28 |
WO2002101651A2 (en) | 2002-12-19 |
CN1529874A (zh) | 2004-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8315436B2 (en) | Robust camera pan vector estimation using iterative center of mass | |
US7480334B2 (en) | Temporal motion vector filtering | |
US7346109B2 (en) | Motion vector computation for video sequences | |
US6987866B2 (en) | Multi-modal motion estimation for video sequences | |
KR20030025276A (ko) | 제 2 세그먼트를 결정하는 분할 유닛 및 방법과 영상 처리장치 | |
EP1557037A1 (en) | Image processing unit with fall-back | |
KR20050012766A (ko) | 현재 모션 벡터 추정을 위한 유닛 및 모션 벡터 추정 방법 | |
JP4606736B2 (ja) | 特徴点選択 | |
JP5059855B2 (ja) | 大域的動き推定方法 | |
JP5197374B2 (ja) | 動き推定 | |
KR100969420B1 (ko) | 프레임 레이트 변환 방법 | |
KR20080066486A (ko) | 움직임 벡터 추정 장치 및 방법 | |
KR20040093708A (ko) | 세그먼테이션용 유닛 및 방법 | |
Wittebrood et al. | Feature point selection for object-based motion estimation on a programmable device | |
JP2000076449A (ja) | 動画像の動き量推定方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050607 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080220 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20080227 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080304 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080304 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080507 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20080804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080805 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081105 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20081219 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091222 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100104 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101006 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131015 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131015 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131015 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |