JP4550398B2 - 一連の画像に現れる物体の動きを表現する方法、一連の画像中の画像における物体の選択を識別する方法、画像に対応する信号を処理することによって一連の画像を探索する方法、及び装置 - Google Patents

一連の画像に現れる物体の動きを表現する方法、一連の画像中の画像における物体の選択を識別する方法、画像に対応する信号を処理することによって一連の画像を探索する方法、及び装置 Download PDF

Info

Publication number
JP4550398B2
JP4550398B2 JP2003375742A JP2003375742A JP4550398B2 JP 4550398 B2 JP4550398 B2 JP 4550398B2 JP 2003375742 A JP2003375742 A JP 2003375742A JP 2003375742 A JP2003375742 A JP 2003375742A JP 4550398 B2 JP4550398 B2 JP 4550398B2
Authority
JP
Japan
Prior art keywords
images
representative
series
function
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003375742A
Other languages
English (en)
Other versions
JP2004158014A (ja
Inventor
レスゼク・シープリンスキー
ホーマン・デイビス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2004158014A publication Critical patent/JP2004158014A/ja
Application granted granted Critical
Publication of JP4550398B2 publication Critical patent/JP4550398B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Description

本発明は、一連の画像に現れる移動物体を表す改良された方法および装置に関する。
画像または一連の画像における物体の表現を導き出す様々な技法が知られている。このような表現は、たとえば、探索・検索目的のために画像にインデックスを付与するにあたって有用である。主観的であり、かつ労働集約的なテキストベースのインデックス付与の後には、色、形状、および輪郭線等、物体の固有の属性に基づくインデックス付与が続けられた。さらに進んだ発展は、一連の画像における物体の動きを表現することであった。このような表現の非常に重要な側面は、導入される近似誤差を最小化しながら、必要な帯域幅および記憶領域を最小化する効率的な符号化である。
動きを表現する第1の既知の技法は、パラメータ軌跡(parameter trajectory)として知られている。この技法では、物体全体の動きが、回転および平行移動等、1つまたは複数のパラメータを使用して表現される。たとえば、フレーム中の頂点と基準フレーム中の頂点の間の置換ベクトルが導き出され、これを使用して、アフィン変換移動等、既知の動きモデルの式を解く。この技法により比較的コンパクトな表現が生成されるが、この技法は剛体物体、および動きモデル(たとえば、アフィン変換)がわかっている場合に制限される。
動きを表現する別の既知の技法は、像軌跡(figure trajectory)として知られている。この技法では、物体の動きが、いくつかの代表点それぞれの軌跡により独立して表現される。より具体的には、各代表点の座標が一連のフレームを通してトラッキングされ、各代表点の各座標の軌跡を近似する関数が導き出される。関数近似は、一次近似、二次近似、またはスプライン関数近似等、既知の技法を用いて行われる。像軌跡は、未知の、かつ/または複雑な動きを有する剛体物体の動きを含め、様々な種類の動きに使用することが可能である。
両方の技術において、物体が比較的複雑な輪郭線を有する場合、より複雑な物体の輪郭線を近似した矩形、楕円、または多角形等の参照領域でこの物体を表現することができる。多角形の場合、代表点は頂点であることができる。同様に、矩形の場合、代表点は4つの頂点のうちの3つに制限されうる。これは、4番目の頂点の位置は、その他の3つの頂点の位置から算出することができるためである。楕円の場合、矩形に外接する3つの頂点を代表点として選択することができる。
上に概説した像軌跡およびパラメータ軌跡に類似する一連の画像における物体の動きを表現する方法が開示されている(例えば、特許文献1及び特許文献2参照)。特許文献2及び特許文献1それぞれには、物体の代表領域をどのように導き出すか(多角形近似アルゴリズム)およびフレーム中の代表点をどのように別のフレーム中の代表点と関連付けるか(対応決定アルゴリズム)についてもより詳細に開示されている。
像軌跡では、時空的補間アルゴリズムとして知られている関数近似は、抽出誤差しきい値(EET)が所定のしきい値よりも大きくなるまで、近似関数の間隔を延長することを含む。
このアルゴリズムでは、補間の初期値は最初の2つの点に設定される。次に、補間を広げて一度に1点ずつ追加していき、ついに補間のEETが予め規定されたしきい値よりも大きくなる。その点で、新しい補間間隔が開始される。この手順はすべての点が処理されるまで繰り返される。補間モデルが変数値と良好にマッチングした場合、このアルゴリズムにより少数の長い補間間隔が得られる。反対に、マッチングが不良の場合、多数の短い補間間隔が得られることになる。
このアルゴリズムについて正しく説明するため、以下の表記を定義する。d(>0)を変数(次元)の数とし、時間tでのj番目の変数の値をvt (j)(j=1,2,・・・,d)で表す。一続きの時間点をti(i=0,1,・・・)で表す。(候補)補間間隔についての開始時間(終了時間)をtSTART(tEND)で表す。ftSTART,tEND (j)(t)(j=1,2,・・・,d)をj番目の変数補間関数の候補とする。これは、最小二乗法を用いて算出することができる。この場合、ftSTART,tEND (j)(t)は、次の式を最小化するように算出される。
Figure 0004550398
ここで補間関数は一次または二次の多項式である。導き出された候補関数を評価するために、Tjをj番目の変数のしきい値とし、誤差e(j)(j=1,2,・・・,d)を、次の式のように定義する。
Figure 0004550398
(j)は、範囲tSTART≦ti≦tENDのj番目の変数の最大近似誤差である。e(j)<Tjがすべてのjについて当てはまる場合、fta,tb (j)(t)は許容可能な候補である。しかし、より広い間隔で別の補間関数が見つかりうる。この可能性をテストしようとするため、ENDを増分することによって間隔を広げ、新しい関数を導き出してテストする。この手順は、新たに導き出される関数が容認条件を満たすまで繰り返される。次に、最後の候補関数が許容される。
同様の技法が、特許文献1に開示されている。
米国特許出願公開第2001/0040924号明細書 米国特許出願公開第2001/0025298号明細書
本発明の目的は、特に像軌跡の場合に、動きを表現する正確度を向上させることである。
したがって、本発明は、画像に対応する信号を処理することによって一連の画像に現れる物体の動きを表現する方法であって、各画像について、物体の場所を表す代表点のセットを導き出すこと、上記一連の画像の中の2枚以上の画像における代表点の軌跡を表す近似関数を導き出すこと、画像の代表点の上記近似関数の誤差値を算出することとを含み、誤差値が、代表点によって表される物体の面積と代表点が各近似関数値で置き換えられた物体の面積との差分に基づくことを特徴とする、物体の動きを表現する方法を提供する。
画像のセットを通しての各代表点の全体的な軌跡が、近似関数または近似関数のセットによって表現され、誤差値を使用して、それぞれの開始点および終了点を含むこれら近似関数を求める。
近似関数は、一連の画像を通しての物体の動きについての記述子を形成するために使用される。したがって、一連の画像中の任意の画像の物体記述子を補間することができる。
たとえば、代表点は、物体の輪郭線を近似する多角形、矩形、楕円等の像の頂点であることができる。好ましくは、本方法は、一連の画像における代表点間の対応を導き出すステップを含む。
本発明により、改良された、より正確な物体移動の表現を導き出すことができる。
本発明の実施形態について、添付図面を参照して述べる。
図1は、本発明の一実施形態によるコンピュータ化されたビデオデータベースシステムを示す。システムは、コンピュータからなる制御ユニット2と、モニタからなる表示ユニット4と、マウスからなるポインティングデバイス6と、動画像(以下、ビデオと記す)を構成する一連の画像が格納されたビデオデータベース8と、ビデオデータベース(画像データベース)8に格納されている画像に現れる物体のまたは物体の部分についての記述子を格納した記述子データベース10とを備える。
ビデオデータベース中の画像および画像に現れる物体の記述子は、制御ユニット2によって導き出され、記述子データベース10に格納される。制御ユニット2は、適切なプログラムの制御下で動作して記述子を導き出す。当該技術分野の他のどこかに述べられている画像中の物体の色、形状、および輪郭線の記述子等、多くの種類の記述子が既知であり、使用することが可能である。本実施形態の記述子は、ビデオ中の物体の動き記述子の導出に焦点を合わせる。
本実施形態の技法は、上に述べた像軌跡に基づくものであり、像軌跡の特徴の中のいくつかについて短くまとめたものをまず提供する。
図2は、制御ユニット2の機能構成要素を示す。これらは、望みに応じてソフトウェアおよび/またはハードウェアの形で実施することができる。制御ユニット2は、入力画像を受け取り、より詳しく以下に述べるように、画像中の物体の輪郭線を近似した多角形を導き出す多角形近似ユニット12を含む。多角形近似ユニット12の出力は、バッファ16および対応決定ユニット14に入力される。対応決定ユニット14は、より詳しく以下に述べるように、現フレーム中の多角形の頂点と、別のフレーム中の多角形の頂点との対応を求めるためのものである。対応決定ユニット14の出力は、一連のフレームを通しての各多角形頂点の軌跡を表現する近似関数を求める軌跡関数近似ユニット18に入力される。関数近似について、より詳しく以下に述べる。
軌跡関数近似ユニット18の出力は記述子形成ユニット20に入力され、記述子形成ユニット20が軌跡関数から記述子を形成する。
図3の流れ図は、一連の画像における物体の動きの表現を導き出す方法のステップを示す。
ステップ100において、関心のある物体を含む一連の画像中の各画像が、多角形近似ユニット12に入力される。ステップ110において、各画像について、バイナリマスクが物体について導き出される。これは図4に示される。より具体的には、各ピクセルについて、ピクセルが関心のある物体の一部である場合、そのピクセルは第1の値、図4では黒丸に設定され、ピクセルが関心のある物体の一部ではない場合、そのピクセルは、図4では白丸と示される第2の値に設定され、バイナリマスクが生成される。
ステップ120において、物体の輪郭線が抽出され、近似多角形の頂点が生成される。物体の輪郭線はすでに、五角形または六角形等の単純な多角形の形でありうる。しかし、通常、物体の輪郭線ははるかに複雑であり、これにより必要な処理量が大幅に増す。したがって、物体の輪郭線は多角形で近似される。たとえばこれは、特許文献1及び2に記載のように物体の輪郭線を平滑化することにより、または所定数の頂点を有する多角形にマッチングまたは変更することによって行うことができる。多角形近似についてのさらに詳しいことは、たとえば、特許文献1及び2に見出すことができる。図5は、図4の物体輪郭線の多角形近似を示す。この場合の多角形近似は六角形である。
この例では、各フレームにおける物体の多角形近似が同じ数の頂点を有するものと想定するが、これが必ずしも当てはまるとは限らない。
所与のフレームについて、多角形近似が多角形近似ユニット12から出力され、一時的に格納するためのバッファ16に入力されるとともに、対応ユニット14にも入力される。より具体的には、画像中の近似多角形の頂点の座標が入力される。
次に、ステップ130において、現画像の多角形の頂点と前の画像の多角形の頂点の間の対応が見つけられる。
図6は、時間tにおける最初の画像中の多角形(六角形)の位置、および時間t’における後続画像中の多角形の位置を示す。この目的は、時間tにおける画像中のどの頂点が時間t’における画像中のどの頂点に対応するかを求めることである。多角形は六角形であるため、考えられる対応の組合せが6つあることが理解されよう。言い換えれば、最初のフレーム中の各多角形頂点は、後続フレーム中で最も近い頂点に単純にマッピングされる場合もあり、または、たとえば頂点1つ分、頂点2つ分等、様々な程度で回転している場合もある。
頂点の対応を決定する方法は、特許文献1及び2により詳しく述べられている。
各頂点について、各画像中の頂点の座標が、頂点対応決定ユニットの結果を用いてリンクされる。これら座標は各頂点の軌跡を表す。
次のステップであるステップ140において、頂点の軌跡の関数近似が導き出される。
本実施形態では、各頂点が独立して検査され、さらに、各座標が別個に取り扱われる。
図7は、様々な時間t0〜t8における所与の頂点(図8中の頂点A)のy座標の値を示したグラフであり、各時間点は画像に対応する。グラフに示される曲線は、間隔t0〜t4およびt4〜t8にわたる近似関数の例である。
近似関数は、一次近似、二次近似、またはスプライン関数近似等、任意の適切な既知の技法を用いて導き出される。
本実施形態では、候補関数および誤差の算出および評価の違いを除き、このアルゴリズムは先行技術を考察するにあたり上述したアルゴリズムと同様である。
このアルゴリズムでは、補間の初期値は最初の2つの点に設定される。次に、補間を広げて一度に1点ずつ追加していき、ついに補間のEETが予め規定されたしきい値よりも大きくなる。その点で、新しい補間間隔が開始される。この手順は、すべての点が処理されるまで繰り返される。
このアルゴリズムについて正しく説明するため、以下の表記を定義する。d(>0)を変数(次元)の数とし、時間tでのj番目の変数の値をvt (j)(j=1,2,・・・,d)で表す。一続きの時間点をti(i=0,1,・・・)で表す。(候補)補間間隔について、開始時間(終了時間)をtSTART(tEND)で表す。ftSTART,tEND (j)(t)(j=1,2,・・・,d)をj番目の変数補間関数の候補とする。これは、最小二乗法を用いて算出することができる。この場合、ftSTART,tEND (j)(t)は、次の式を最小化するように算出される。
Figure 0004550398
ここで補間関数は一次または二次の多項式である。候補関数の時間間隔は反復的に延長される。
本例では、頂点Aのy座標の候補関数が導き出されている。候補近似関数fが、時間間隔t=Sからt=E−1までについて上に概説したように導き出されたものと想定する。次に、tがEに設定され、t=Eの候補関数の値が求められる。言い換えれば、導き出された近似関数をt=Eに拡張しようと試みる。次に、結果もたらされる誤差が算出される。
結果もたらされる誤差は、図8を参照して以下のように算出される。
図8は、時間Eにおける画像の、上記ステップ120において求められた頂点を有する物体輪郭線を実線で示す。また、図8は、元のy値が時間Eにおける近似関数の値で置き換えられた頂点の位置をバツ印で示す。破線は、頂点値が変更された物体輪郭線を示している。
図8から見て取ることができるように、頂点の1つを変更した結果、多角形の面積が変化している。本実施形態では、誤差値は、元の多角形の面積と変更された多角形の面積の差分である。より具体的には、本実施形態では、時間tでの面積の差分は、以下の式を用いて算出される。
Figure 0004550398
式中、iは画像中のピクセルにインデックスを付与し、POR(i)は、ピクセルiが元の物体の輪郭線内にあるが、変更後の物体の輪郭線内にはない場合、またはピクセルiが変更後の物体の輪郭線内にあるが、元の物体の輪郭線内にはない場合(すなわち、変更後の物体の輪郭線が元の物体の輪郭線よりも外側にある場合)、値1をとる。これにより、面積の差分の指標が与えられる。部分的に一方の面積内にあるが、他方の面積内にないピクセルの場合、POR(i)は、望みに応じて1または0に設定することができる。1つの変数(y)のみが変更されているため、変更後の物体の輪郭線は、全体的に元の輪郭線内にあるか、あるいは全体的に元の輪郭線の外側にあるかのいずれか一方である。
他の式を用いて、面積の差分を算出することができる。たとえば、以下の式を使用して、延長された間隔での誤差を算出し、しきい値と比較することが可能である。
Figure 0004550398
式中、SおよびEは関数近似の開始点および終了点それぞれである。言い換えれば、関数近似の間隔中の誤差合計は、関数近似の適切性をテストするものとみなされる。結果得られる誤差値は所定のしきい値と比較される。誤差値がしきい値未満の場合、関数近似は時間E+1に延長され、手順が繰り返される。代替として、たとえば、時間間隔t=S〜t=Eにおける式(1)からの最大誤差Dtをしきい値と比較することができる。
t=Eの誤差値がしきい値よりも大きい場合、関数近似はt=E−1で終了する。新しい関数近似がt=E−1で開始され、最初の終了点はt=Eである。この関数近似もまた、上に概説したように算出される誤差を用いてテストされる。
最初の関数もまた、上に概説したように算出される誤差でテストされる。
上記諸ステップは、一連の画像中のtのすべての値に対して繰り返され、頂点のy座標の軌跡を近似する関数のセットが得られる。
図7に示すように、この場合では、上記諸ステップにより2つの候補関数が得られる。
同じ諸ステップが、同じ頂点のx座標に対して行われる。
頂点のxおよびy座標の関数を組み合わせて、頂点の軌跡の記述を形成することができる。
上記諸ステップが各頂点の各座標に対して繰り返され、各頂点の軌跡記述が得られる。
すべての頂点の軌跡記述子が組み合わせられて、物体の動き記述子が形成される。
図8に示すように、先行技術による誤差は、y(A)とy(A’)との一次元差に対応するが、本実施形態は、yの変更により物体の面積の変更を反映しており、物体の動きの表現という点においてより正確である。
予め算出された関数の間隔を延長する代わりに、t=S〜t=Eの点に合う別の候補関数がある可能性がある。この可能性は、より長い間隔について、上に述べた最小二乗法によってテストすることができ、上記式を使用してt=S〜t=Eまでのtの各値について結果もたらされる面積誤差をテストする。面積誤差が、tの各値に所定のしきい値未満の場合、その候補関数を前の候補関数の代わりに選択することができる。2つのうちから選ぶため、全体面積、すなわち間隔中のtのすべての値についての面積誤差の和を、選択された最も小さい全体誤差を有する候補関数と比較することができる。同様に、候補関数は、t=Sからtの最大値までの時間間隔を考慮することによって導き出すことができ、候補関数を見つけ、すべてのtについて結果もたらされる面積誤差をテストする。tの値についての最大面積誤差が所定のしきい値よりも大きい場合、tの最大値が1だけ減じられ、適切な候補関数が見つけられるまで手順が繰り返される。次に、tの値をtの最小値に設定し、手順を繰り返すことができる。
上記実施形態では、関数近似が各頂点の各座標毎に別個に算出される。これは比較的粗い近似であるが、それでも先行技術と比較して、動き記述の品質を向上させる。
高度なアルゴリズムは、再帰的にすべての頂点を同時に解析して、近似を向上させる。別の手法では、異なる頂点の関数近似の主要な部分(開始点および終了点)すべてを同時に行う必要がある。
すべての頂点の関数近似およびそれぞれの主要点の再帰的な同時推定の例は以下である。
1.各頂点の最初の数個の主要点および対応する近似関数が、上記実施形態のように独立して推定される。主要点は、少なくともいくつかの頂点に数個の主要点を確保するに足る長さの間隔が与えられるように選択された所定の時間点EIまで選択される。
2.最初の頂点を選択する。
3.選択された頂点について、最初の主要点が識別され、選択される。
4.選択された主要点について、ステップ1において導き出された関数を使用して、同じ時間におけるその他のすべての頂点の(調整された)位置を求める。
5.ステップ4において算出された頂点の位置について、Dt’(上記式(2))の値が算出され、しきい値と比較される。Dt’がしきい値よりも大きい場合、考慮中の頂点の主要点が変更される。より具体的には、Dt’がしきい値未満になるまで、Dt’の値を算出する各段階において、主要点が後方に向けて段階的にとられ、すべての頂点がステップ2のように調整される。Dt’がしきい値よりも小さい場合、同様の段階的な主要点の延長が行われる。
6.ステップ4およびステップ5が、ステップ2と同じ頂点について、ステップ1において算出された次の主要点に対して繰り返される。この主要点は終了点であり、対応する関数の開始点はステップ5において求められる点である。
7.ステップ6は、考慮中の頂点のすべての主要点に対して繰り返される。
8.次の頂点が選択され、ステップ3〜7がこの頂点について繰り返される。
9.次に、主要点の変化が止まるまで、または変化が十分に小さくなる(すなわち、所定のしきい値未満になる)まで、繰り返しステップ8がすべての頂点に対して繰り返される。
10.全体の時間期間がEIから延長され、これに従って、各頂点の近似関数が独立して延長され、次にステップ2〜9が繰り返される。
全体の時間期間は、比較的短い場合、EIに設定し、ステップ9を省くことが可能である。
テストにより、誤差が実際の領域と関数近似によって推定された領域とのピクセル数の差分として定義される場合、提案された技法が、先行技術を越える平均正規化誤差(すべてのフレームにわたっての平均をとる)において大幅な改良をもたらすことがわかっている。
上に述べた実施形態では、一次元関数が、各頂点の各座標毎に別個に近似される。代替として、二次元関数を各頂点の両方の座標に同時に導き出すことができる。1つの座標が変更される実施形態では、物体の輪郭線は増大するか、あるいは減少するかのいずれか一方であり、ピクセルの変化は面積の変化である。しかし、2つの座標が同時に処理される場合、物体輪郭線の全体面積値が同じままであるが、元の物体がカバーする元画像の面積(ピクセル)と変更後の輪郭線がカバーするピクセルとに関して変化が生じている場合がある。誤差値は、変更後の輪郭線ないにあるが元の輪郭線内にないピクセル数、および元の輪郭線内にはあったが、変更後の輪郭線内にはないピクセル数の関数(たとえば、和)として算出される。
記述子は、物体の移動の表現である。これは、たとえば、ビデオシーケンス中の物体の選択を可能にするため、探索、比較、および検索目的で一連の画像にインデックスを付与するため、診断目的、監視または解析のために移動を識別または分類するため、また他の多くの用法に使用することができる。本発明の適用例としては、再生中のビデオシーケンス中の物体をクリックして、たとえば物体の説明とともに、関連するウェブページを呼び出せるようにすることができることである。大量のデータが関わる物体の記述子および各画像毎にその位置を格納する代わりに、動き記述子により、クリックされたポイントが物体に対応することを識別することが可能であり、これに伴って格納されるデータの量はかなり少ない。
これは、所与の物体について、前の画像中の物体の場所が、後続画像を通して動き記述子(動き関数)とともにわかっているためである。したがって、時間tにおける関心のある画像について、物体の場所を計算することができる。この場所を、たとえば、マウスおよびカーソルを使用して選択された画像中のポイントまたは領域の位置と比較して、物体が選択されているか否かを判定することができる。
本発明によるシステムは、たとえば、ビデオライブラリに提供することができる。代替として、データベースをシステムの制御ユニットから離れた場所に配置し、電話回線等の一時的なリンク、またはインターネット等のネットワークにより制御ユニットに接続してもよい。ビデオおよび記述子データベースは、たとえば、永久記憶装置またはCD−ROMもしくはDVD等のポータブルデータ記憶装置に提供することができる。
セレクタおよびコンパレータ等、上述したシステムの構成要素は、ソフトウェアまたはハードウェアの形で設けることが可能である。本発明はコンピュータシステムの形で説明されているが、たとえば、専用チップを使用して、他の形で実施することも可能である。
本発明は、たとえば、認証目的のための物体画像のマッチング、またはフィルタリングにも使用することが可能である。
本発明は、フィルムまたはビデオからの画像等の一連の画像、または同じウェブページ上にあるなど、なんらかの様式で関連している画像の集まりの中の画像に適用することが可能である。
ビデオデータベースシステムのブロック図である。 図1のシステムの制御ユニットの構成要素のブロック図である。 物体の動きの表現を導き出す方法の流れ図である。 画像における物体のバイナリマスクを示す図である。 図4に示す物体の輪郭線を近似した多角形を示す物体である。 物体輪郭線の頂点間の対応を導き出すステップを示す図である。 一連の画像に対応する時間間隔での頂点座標の変動を示す図である。 近似誤差の算出を示す図である。
符号の説明
2 制御ユニット、4 表示ユニット、6 ポインティングデバイス、8 ビデオデータベース、10 記述子データベース、12 多角形近似ユニット、14 対応決定ユニット、16 バッファ、18 軌跡関数近似ユニット、20 記述子形成ユニット。

Claims (14)

  1. 各画像について、物体の場所を表す代表点のセットを導き出すステップであって、前記代表点は多角形を形成し、この多角形に関連した代表面積を定義する、代表点のセットを導き出すステップと、
    一連の画像の中の2枚以上の画像における、前記代表点のセットから代表点の軌跡を表す近似関数を導き出すステップであって、前記代表点のセットの1つ以上の代表点について近似関数は導き出され、この近似関数は各代表点の場所の変更を提供し変更後の代表面積を提供する、近似関数を導き出すステップと、
    画像の代表点のそれぞれについて、前記近似関数の誤差値を算出するステップと
    を含む一連の画像に現れる物体の動きを表現する方法において、
    前記誤差値は、前記代表点によって表される物体の面積と、前記代表点が各近似関数値で置き換えられた物体の面積との変化に基づく
    ことを特徴とする、一連の画像に現れる物体の動きを表現する方法。
  2. 前記誤差値は、画像の面積の変化に基づく
    請求項1記載の一連の画像に現れる物体の動きを表現する方法。
  3. 前記誤差値は、複数の画像の面積の変化に基づく
    請求項1記載の一連の画像に現れる物体の動きを表現する方法。
  4. 関数近似は、代表点の各座標毎に導き出される
    請求項1から請求項3までのいずれかに記載の一連の画像に現れる物体の動きを表現する方法。
  5. 関数近似は、各代表点毎に導き出される
    請求項1から請求項4までのいずれかに記載の一連の画像に現れる物体の動きを表現する方法。
  6. 関数近似は、代表点に対して独立して行われる
    請求項1から請求項5までのいずれかに記載の一連の画像に現れる物体の動きを表現する方法。
  7. 関数近似は、2つ以上の頂点に対してまとめて行われる
    請求項1から請求項5までのいずれかに記載の一連の画像に現れる物体の動きを表現する方法。
  8. 画像の前記誤差値は、代表点が関数近似値で置き換えられた変更後の前記物体の輪郭線内にあるが、元の輪郭線内にはないピクセルの数、および前記元の輪郭線内にはあるが、前記変更後の輪郭線内にはないピクセルの数の関数に基づく
    請求項1から請求項7までのいずれかに記載の一連の画像に現れる物体の動きを表現する方法。
  9. 一連の画像中の画像における物体の選択を識別する方法であって、
    前記物体の動きは、請求項1から請求項8までのいずれかに記載の一連の画像に現れる物体の動きを表現する方法を用いて導き出された表現を有し、
    前記画像の選択された領域を識別するステップと、
    動き記述子を使用して前記画像中の前記物体の場所を求めるステップと、
    前記物体の場所を前記選択された領域と比較して、前記物体が選択されているか否かを判定するステップと
    を含む一連の画像中の画像における物体の選択を識別する方法。
  10. 画像に対応する信号を処理することによって一連の画像を探索する方法であって、
    物体移動クエリを入力するステップと、
    前記物体移動クエリの表現を導き出すステップと、
    前記表現を、請求項1から請求項8までのいずれかに記載の一連の画像に現れる物体の動きを表現する方法を用いて導き出された表現と比較するステップと、
    前記表現が前記クエリとある程度の類似度を示す一連の画像を選択して表示するステップと
    を含む画像に対応する信号を処理することによって一連の画像を探索する方法。
  11. 各画像について、物体の場所を表す代表点のセットを導き出す手段であって、前記代表点は多角形を形成し、この多角形に関連した代表面積を定義する、代表点のセットを導き出す手段と、
    一連の画像の中の2枚以上の画像における、前記代表点のセットから代表点の軌跡を表す近似関数を導き出す手段であって、前記代表点のセットの1つ以上の代表点について近似関数は導き出され、この近似関数は各代表点の場所の変更を提供し変更後の代表面積を提供する、近似関数を導き出す手段と、
    画像の代表点のそれぞれについて、前記近似関数の誤差値を算出する手段と
    を備える一連の画像に現れる物体の動きを表現する装置において、
    前記誤差値は、前記代表点によって表される物体の面積と、前記代表点が各近似関数値で置き換えられた物体の面積との変化に基づく
    ことを特徴とする、一連の画像に現れる物体の動きを表現する装置。
  12. 請求項1から請求項10までのいずれかに記載の方法を実行させるためのコンピュータプログラム。
  13. 一連の画像を格納するビデオデータベースと、
    格納された一連の画像に現れる物体の動きを表現するよう実施可能な制御ユニットと
    を備える、一連の画像に現れる物体の動きを表現するコンピュータシステムにおいて、
    前記制御ユニットは、
    各画像について、物体の場所を表す代表点のセットを導き出す手段であって、前記代表点は多角形を形成し、この多角形に関連した代表面積を定義する、代表点のセットを導き出す手段と、
    一連の画像の中の2枚以上の画像における、前記代表点のセットから代表点の軌跡を表す近似関数を導き出す手段であって、前記代表点のセットの1つ以上の代表点について近似関数は導き出され、この近似関数は各代表点の場所の変更を提供し変更後の代表面積を提供する、近似関数を導き出す手段と、
    画像の代表点のそれぞれについて、前記近似関数の誤差値を算出する手段とを有し、
    前記誤差値は、前記代表点によって表される物体の面積と、前記代表点が各近似関数値で置き換えられた物体の面積との変化に基づく
    ことを特徴とする、一連の画像に現れる物体の動きを表現するコンピュータシステム。
  14. 請求項1から請求項10までのいずれかに記載の方法を実行させるためのコンピュータ実行可能プロセスステップを記録した、または請求項12に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2003375742A 2002-11-07 2003-11-05 一連の画像に現れる物体の動きを表現する方法、一連の画像中の画像における物体の選択を識別する方法、画像に対応する信号を処理することによって一連の画像を探索する方法、及び装置 Expired - Fee Related JP4550398B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP02257726A EP1418546A1 (en) 2002-11-07 2002-11-07 Method and apparatus for representing moving objects in a sequence of images

Publications (2)

Publication Number Publication Date
JP2004158014A JP2004158014A (ja) 2004-06-03
JP4550398B2 true JP4550398B2 (ja) 2010-09-22

Family

ID=32104010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003375742A Expired - Fee Related JP4550398B2 (ja) 2002-11-07 2003-11-05 一連の画像に現れる物体の動きを表現する方法、一連の画像中の画像における物体の選択を識別する方法、画像に対応する信号を処理することによって一連の画像を探索する方法、及び装置

Country Status (3)

Country Link
US (1) US7400747B2 (ja)
EP (1) EP1418546A1 (ja)
JP (1) JP4550398B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007038986A1 (en) * 2005-09-30 2007-04-12 Robert Bosch Gmbh Method and software program for searching image information
DE102005059907A1 (de) * 2005-12-15 2007-06-21 Robert Bosch Gmbh Ultraschallsensor
US8239359B2 (en) * 2008-09-23 2012-08-07 Disney Enterprises, Inc. System and method for visual search in a video media player
US20220319019A1 (en) * 2021-03-31 2022-10-06 Nvidia Corporation Techniques to determine optical flow
CN114663447A (zh) * 2022-03-24 2022-06-24 河北灵畅互动科技有限公司 基于计算机视觉的ai医学图像处理方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056392A (ja) * 2000-05-11 2002-02-20 Toshiba Corp 物体領域情報記述方法、物体領域情報生成装置、及び物体領域情報記述プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SK399692A3 (en) * 1990-09-20 1995-01-05 British Broadcasting Corp Method of determination of suitable motion vector
KR0171147B1 (ko) * 1995-03-20 1999-03-20 배순훈 그레디언트 변화를 이용한 특징점 선정장치
WO2000011863A1 (en) * 1998-08-21 2000-03-02 Koninklijke Philips Electronics N.V. Problem area location in an image signal
GB2349460B (en) * 1999-04-29 2002-11-27 Mitsubishi Electric Inf Tech Method of representing colour images
JP2001266159A (ja) * 2000-03-17 2001-09-28 Toshiba Corp 物体領域情報生成方法及び物体領域情報生成装置並びに近似多角形生成方法及び近似多角形生成装置
KR100415266B1 (ko) * 2000-05-11 2004-01-16 가부시끼가이샤 도시바 물체영역정보 기술방법과 물체영역정보 생성장치 및 기록매체
JP4366023B2 (ja) * 2001-03-16 2009-11-18 インターナショナル・ビジネス・マシーンズ・コーポレーション ビデオ・イメージの部分イメージ領域抽出方法、部分イメージ領域抽出システム、部分イメージ領域抽出のためのプログラム、抽出されたビデオ・イメージの配信方法およびコンテンツ作成方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056392A (ja) * 2000-05-11 2002-02-20 Toshiba Corp 物体領域情報記述方法、物体領域情報生成装置、及び物体領域情報記述プログラム

Also Published As

Publication number Publication date
JP2004158014A (ja) 2004-06-03
US7400747B2 (en) 2008-07-15
US20040165751A1 (en) 2004-08-26
EP1418546A1 (en) 2004-05-12

Similar Documents

Publication Publication Date Title
JP3576987B2 (ja) 画像のテンプレートマッチング方法及び画像処理装置
US6389417B1 (en) Method and apparatus for searching a digital image
JP5121086B2 (ja) 物体を表現する方法、物体を探索する方法
KR101183391B1 (ko) 메트릭 임베딩에 의한 이미지 비교
KR101548438B1 (ko) 영상을 비교하기 위한 방법 및 장치
US20020164070A1 (en) Automatic algorithm generation
JP7058941B2 (ja) 辞書生成装置、辞書生成方法、及びプログラム
JPWO2009072466A1 (ja) 画像分類装置および画像分類プログラム
KR101432429B1 (ko) 시각적 데이터 생성을 이용한 악성 코드 분석 시스템과 그 방법
JP5123759B2 (ja) パターン検出器の学習装置、学習方法及びプログラム
JP3534009B2 (ja) 輪郭抽出方法及び装置
JP4550398B2 (ja) 一連の画像に現れる物体の動きを表現する方法、一連の画像中の画像における物体の選択を識別する方法、画像に対応する信号を処理することによって一連の画像を探索する方法、及び装置
JP2004030694A (ja) デジタル映像テクスチャー分析方法
CN116266387A (zh) 基于重参数化残差结构和坐标注意力机制的yolov4的图像识别算法及系统
JP4130915B2 (ja) グラフィカルオブジェクトの境界情報の処理
CN113705650A (zh) 一种人脸图片集的处理方法、装置、介质和计算设备
JP5538781B2 (ja) 画像検索装置及び画像検索方法
JP6622150B2 (ja) 情報処理装置および情報処理方法
JP2018124990A (ja) モデル生成装置、評価装置、モデル生成方法、評価方法及びプログラム
JP5061147B2 (ja) 画像検索装置
JP2000132692A (ja) 曲線の特徴点抽出方法及びこの方法を記録した記録媒体
JP3196749B2 (ja) 領域の属性モデルを用いる領域分割方法及び装置
JP2017004052A (ja) 学習装置、方法及びプログラム
JP2005071125A (ja) 被写体検出装置、被写体検出方法、被写体データ選定プログラムおよび被写体位置検出プログラム
JP4575751B2 (ja) ヒストグラム近似復元装置及びヒストグラム近似復元方法、並びに画像検索装置及び画像検索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100608

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100708

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S631 Written request for registration of reclamation of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313631

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S631 Written request for registration of reclamation of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313631

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S631 Written request for registration of reclamation of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313631

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees