JPH11110566A - 画像認識方法及び装置 - Google Patents

画像認識方法及び装置

Info

Publication number
JPH11110566A
JPH11110566A JP9274050A JP27405097A JPH11110566A JP H11110566 A JPH11110566 A JP H11110566A JP 9274050 A JP9274050 A JP 9274050A JP 27405097 A JP27405097 A JP 27405097A JP H11110566 A JPH11110566 A JP H11110566A
Authority
JP
Japan
Prior art keywords
image
optical flow
dimensional shape
corresponding point
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9274050A
Other languages
English (en)
Inventor
Koji Miyajima
耕治 宮島
Naoki Takegawa
直樹 武川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP9274050A priority Critical patent/JPH11110566A/ja
Publication of JPH11110566A publication Critical patent/JPH11110566A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transforming Light Signals Into Electric Signals (AREA)
  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 時系列画像における移動物体の3次元形状の
推定をオプティカルフロー技術を用いて高速且つ高精度
に行う画像認識装置を提供する。 【解決手段】 コンピュータ処理によるオプティカルフ
ローと操作者によって明示的に入力された画像間の対応
点座標とを融合させて画像認識装置1を構成する。具体
的には、時間的に連続した動画に含まれる対象物体画像
から輝度勾配画像生成部13で画素毎の輝度勾配画像を
生成し、オプティカルフロー推定部14で、輝度勾配画
像と対応点座標に基づいて対象物体画像の画素の動きを
表すオプティカルフローを推定する。3次元形状データ
生成部15は、推定されたオプティカルフローから対象
物体画像を復元するための3次元形状データを生成し、
これを操作者に提示する。推定形状が不適切な場合は対
応点座標を修正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、時系列に変化する
画像(以下、動画)の認識技術に係り、より詳しくは、
動画に写っている移動物体のみかけ上の速度分布(以
下、オプティカルフロー:optical flow)を推定して移
動物体の3次元形状を効率的に推定するための技術に関
する。
【0002】
【従来の技術】動画に写っている移動物体の3次元形状
を認識する手法として、オプティカルフローを用いた画
像解析手法が知られている。これは、移動物体の任意の
点(画素)における空間的明るさの差分及び変化前後の
画像間の明るさの差分の間に近似的に成立する評価関数
を導出し、この評価関数を最小とするようなオプティカ
ルフローを弛緩法等による反復演算によって推定するこ
とを主な内容とする。
【0003】この手法では、まず、移動物体の画像I
(x,y,t)の空間x−yに関する微分画像、即ち画像間の空
間的な明るさの差分を(Ix,Iy)、画像I(x,y,t)の時
間tに関する微分画像、即ち画像間の明るさの差分をI
t、画像上の点(x,y)におけるオプティカルフローを
(u,v)Tとする。また、「移動物体は剛体である」、
「移動後の輝度値は変化しない」、というオプティカル
フロー技術における2つの仮定を導入すると、ペナルテ
ィ汎関数Eaは、式(1)のように定義することができ
る。一方、2次元の動きベクトルの空間的変動は滑らか
であると仮定すると、安定化汎関数Ebは、式(2)のよ
うに定義することができる。さらに、これらの評価関数
の和Eは、式(3)で定義することができる。
【0004】
【数1】
【0005】この評価関数の和Eを最小化させることに
より、オプティカルフローの推定が行われる。このよう
な推定方法は、正則化手法と呼ばれているものであり、
式(3)の係数αは、2つの評価関数Ea及びEbに関
する重み係数で、正則化パラメータと呼ばれている。な
お、正則化パラメータは、対象物の複雑さ、動きの複雑
さによって予め設定されるものである。式(3)におけ
る最小化問題は、u,vに対する「Euler-Lagrangeの方
程式」を求め、これを離散化した連立方程式を解くこと
に帰着する。この場合、∂E/∂u=0、∂E/∂v=
0とすれば、以下の式(4)及び(5)が導かれる。さ
らに、「Gauss-Seidel法」を用いると、オプティカルフ
ローu,vは、再帰的に以下の式(6)及び(7)で求
められる。
【0006】
【数2】
【0007】但し、上記式(6)及び(7)において、
バーをつけて表したun及びvnは、局所領域におけるn回
目のu,vの平均値である。
【0008】次に、カメラの並進運動パラメータをT
(=(U,V,X)T)、カメラの回転パラメータをΩ
(=(A,B,C)T)とすれば、3次元空間上の点P
(X,Y,Z)における速度ベクトルV(=(X,Y,Z)T)は、
以下の式(8)で定義される。
【0008】
【数3】V=T+Ω×P ・・・(8)
【0009】また、点P(X,Y,Z)は、画像平面上に投
影されているので、焦点距離をfとすると、平面上の点
(x,y)におけるx座標値及びy座標値は、以下の式
(9)で定義することができ、また、画像上における見
かけの動きは、以下の式(10)で定義することができ
る。さらに、式(10)の左辺は、まさに前述のオプテ
ィカルフローであるので、上述の式(8)式を用いて右
辺を計算すると、以下の式(11)及び(12)が導か
れる。
【0010】
【数4】
【0011】カメラの並進運動パラメータT及び回転運
動パラメータΩが既知であるとすれば、式(6)及び
(7)より得られているu,vに基づいて、式(11)
及び(12)に対して最小2乗法等を用いることによ
り、カメラ画像の各画素毎に奥行きZを求めることが出
来る。このことから、画像に写っている対象の形状が取
得可能となる。なお、この手法については、例えば、
「ダイナミックシーンの理解」:電子情報通信学会編35
〜51頁[1994]に詳しく記述されている。一方、上記手法
と異なり、操作者が一対の画像を並べて画像間の移動物
体の対応点座標をポインティングデバイスにより直接入
力して画像間の特徴部位を対応付けることにより、3次
元形状を求める手法がある。これは、上述の解析手法の
代替として用いられるものである。
【0013】
【発明が解決しようとする課題】ところで、上記従来の
解析手法では、オプティカルフローの推定の際に、上述
の式(3)における正則化パラメータαを予め設定して
いる。この正則化パラメータαは、3次元形状を推定す
る対象物における形状の滑らかさや複雑さ等を反映して
おり、当該対象物の形状によって一意に決定されるもの
である。この正則化パラメータを用いた3次元形状の推
定手法では、対象物における3次元形状の制約として、
移動物体の形状が滑らかであることを前提としている
が、実際には形状の滑らかさを仮定できない領域も画像
中には存在する。例えば、物体の稜線や輪郭など、形状
が不連続な領域が存在し、この領域においてオプティカ
ルフローに誤差が生じるため、3次元形状復元の際に更
に誤差が増大してしまう。
【0014】また、操作者がステレオ画像を用いて画像
間の特徴部位を対応付ける場合は、対応点数が多くない
と3次元形状の推定精度が低下する。そのため、3次元
形状の推定精度を高めるためには数多くの対応点座標を
入力することが必要となり、作業負荷が多大になること
から、処理効率を高めることができない。
【0015】そこで本発明の課題は、3次元形状の復元
の処理効率とその精度向上を図ることができる、改良さ
れた画像認識方法を提供することにある。本発明の他の
課題は、上記画像認識方法の実施に適した画像認識装置
を提供することにある。
【0016】
【課題を解決するための手段】上記課題を解決する本発
明の画像認識方法は、形状推定の対象となる移動物体の
画像(対象物体画像)に対して明示的に与えた特徴間の
対応点座標と、オプティカルフローとを融合させる。す
なわち、時間的に連続した動画に含まれる対象物体画像
を解析して画素の動きを表すオプティカルフローを推定
演算する推定演算過程と、前記推定演算の結果及び前記
動画像の撮影時の並進、回転運動パラメータに基づいて
前記対象物体画像の3次元形状を推定する物体形状推定
過程とを含む画像認識方法において、前記対象物体画像
の同一特徴部位の画素を後続の画像間で対応付けるため
の対応点座標の入力を受け付けて特徴部位間のオプティ
カルフローの誤差を表す所定の誤差評価関数を演算し、
この誤差評価関数の演算結果を前記オプティカルフロー
の推定演算に反映させることを特徴とする。
【0017】前記入力を受け付ける対応点座標は、前記
対象物体画像における稜線、輪郭、頂点等の明示的な特
徴点の座標とする。前記物体形状推定過程で推定された
3次元形状が前記対象物体画像の形状に適合しない場合
は、前記対応点座標を修正して前記誤差評価関数の演算
と前記オプティカルフローの推定演算とを、前記推定さ
れた3次元形状が前記対象物体画像の形状に適合するま
で繰り返す。
【0018】なお、前記誤差評価関数は、画素毎に導出
されるものであり、前記対応点座標によって対応付けら
れた画素と対応付けられない画素とでそれぞれ異なる重
み係数をもつことを特徴とする。
【0019】また、上記課題を解決する本発明の画像認
識装置は、時間的に連続した動画に含まれる対象物体画
像から画素毎の輝度勾配画像を生成する前処理手段と、
前記対象物体画像の同一特徴部位の画素を後続の画像間
で対応付けるための対応点座標の入力を受け付ける座標
入力手段と、前記輝度勾配画像及び対応点座標に基づい
て前記対象物体画像の画素の動きを表すオプティカルフ
ローを推定するオプティカルフロー推定手段と、前記推
定されたオプティカルフローから前記対象物体画像を復
元するための3次元形状データを生成する手段と、を備
えて成る。
【0020】好ましくは、前記生成された3次元形状デ
ータを操作者に提示するとともに、該提示に対して入力
された指示を解読して同一対象物体画像についてのオプ
ティカルフローの推定を継続するか否かを判定する終了
判定手段をも備えるようにする。この場合において、継
続すると判定した場合は、前記対応点座標の再入力を前
記操作者に提示する。これにより、対応点座標が座標入
力手段に入力され、オプティカルフロー推定手段で再び
その対象物体画像についてのオプティカルフローが再推
定されるようになる。また、3次元形状データを保持す
るデータ保持手段をさらに備えるようにし、前記終了判
定手段は、前記オプティカルフローの推定を継続しない
と判定した場合に当該対象物体画像について最後に生成
された前記3次元形状データを前記データ保持手段に保
持させるように構成する。
【0021】上記画像認識装置の好ましい実施の形態と
して、前記座標入力手段は、同一の対象物体画像を異な
る角度で視覚化したステレオ画面を提示するインタフェ
ース手段を有し、このステレオ画面を通じて前記特徴部
位が特定されるように構成する。
【0022】なお、前記オプティカルフロー推定手段
は、前記輝度勾配画像に基づくペナルティ汎関数及び重
み付けされた安定化汎関数と、前記入力された対応点座
標に基づくオプティカルフローの誤差を表す所定の誤差
評価関数とを演算し、この演算結果を最小化することで
前記オプティカルフローを推定するように構成される。
【0023】
【発明の実施の形態】以下、本発明の画像認識方法の実
施の形態を詳細に説明する。図1は、この方法を実施す
るための画像認識装置の構成例を示す機能ブロック図で
ある。図中、実線は処理の流れ、点線はデータの流れを
表している。この画像認識装置1は汎用コンピュータ装
置によって実現されるもので、そのコンピュータ装置が
所定のプログラムを読み込んで実行することにより形成
される、時系列画像入力部11、初期設定部12、輝度
勾配画像生成部13、オプティカルフロー推定部14、
3次元形状データ生成部15、3次元形状データ出力部
16、3次元形状データ判定部17、3次元形状データ
格納部18、対応点入力部19、画面インタフェース2
0の各機能ブロックを備えて構成される。本発明の構成
要素との関係では、時系列画像入力部11、初期設定部
12、輝度勾配画像生成部13が前処理手段に相当し、
3次元データ判定部17が終了判定手段に相当し、対応
点入力部19及び画面インタフェース(インタフェース
手段)が座標入力手段に相当する。
【0024】上記プログラムは、通常、コンピュータ装
置の内部記憶装置あるいは外部記憶装置に格納され、随
時読み取られて実行されるようになっているが、コンピ
ュータ装置とは分離可能な記録媒体、例えばCD−RO
MやFD等の可搬性媒体、あるいは構内ネットワークの
プログラムサーバ等の固定媒体に格納され、使用時に上
記内部記憶装置または外部記憶装置にインストールされ
て随時実行に供されるものであっても良い。
【0025】時系列画像入力部11は、図示しない入力
装置からの動画の入力を受け付けるものである。入力さ
れた動画は、初期設定部12に入力される。初期設定部
12では、時系列画像入力部11から入力された動画に
対する形状推定に関する初期設定を行う。具体的には、
正則化パラメータα、後述する対応点パラメータβ、及
びオプティカルフロー推定の反復終了回数等が設定さ
れ、当該設定値に基づいた初期化が行われる。初期化
後、動画及び初期設定値は、輝度勾配画像生成部13に
入力される。
【0026】輝度勾配画像生成部13は、入力された動
画に含まれる対象物体画像の輝度勾配画像を生成し、こ
れをオプティカルフロー推定部14に入力する。オプテ
ィカルフロー推定部14は輝度勾配画像及び必要に応じ
て入力された対応点入力部19からの対応点座標に基づ
いてオプティカルフローの推定を行うものである。推定
されたオプティカルフローは、3次元形状データ生成部
15に入力される。3次元形状データ生成部15は、こ
のオプティカルフローから、3次元形状を推定して対象
物体画像を復元するための3次元形状データの生成を行
う。生成された3次元形状データは、3次元形状データ
出力部16、及び画面インタフェース20を通じて図示
しないディスプレイ装置に表示されるようになってい
る。
【0027】3次元形状データ判定部17は、ディスプ
レイ装置に表示された3次元形状データに対して、操作
者から入力される指示を解読して「適切」または「不適
切」かを判定し、判定結果に基づいて異なる処理を行
う。具体的には、判定結果が「適切」の場合、即ち復元
された対象物体画像の形状が元画像のものに適合する場
合は、対応する3次元形状データを3次元形状データ格
納部18が管理するメモリ領域に格納させる。一方、
「不適切」の場合、即ち復元された対象物体画像の形状
が元画像のものに適合しない場合は、対応点入力部19
へ処理を移す。
【0028】対応点入力部19は、3次元形状データ判
定部17の判定結果に基づいて、あるいは操作者の意思
によって入力された対応点座標を受け付けるものであ
る。対応点座標の入力は、図示しないマウスやタブレッ
ト等のポインティングデバイスを通じて行われる。な
お、対応点座標は、従来のように画像間の詳細な対応点
を入力するのではなく、画像間における稜線、輪郭、頂
点等の明示的な特徴点の座標のみを入力することで足り
る。また、この対応点座標の入力は、操作者の入力作業
を考慮して、画面インタフェース20に通じて行えるよ
うになっている。
【0029】画面インタフェース20は、複数の方向か
ら見た同一の対象物体画像と、対応点座標の入力に伴っ
て推定されたオプティカルフロー及び3次元形状データ
を同一画面に同時に表示させるものである。この画面イ
ンタフェース20によるディスプレイ装置上の表示例を
図2に示す。操作者は、図2(a)及び図2(b)に例
示される2つの画面(ステレオ画面)を使用して、対応
付ける部位をマウス等を使用して特定する。画面インタ
フェース20は、特定された部位の座標を検知してこれ
を対応点入力部19に入力する。図示の例では、図中に
示された(x1,y1)及び(x2,y2)が対応点座標である。
図2(c)は、オプティカルフロー推定部14で推定さ
れたオプティカルフローに基づく画像であり、また図2
(d)は、3次元形状データ生成部15において生成さ
れる3次元形状データに基づく画像である。操作者は、
これらの画像を画面インタフェース20で確認しながら
特徴点の対応付けを行うことができるので、画像間の対
応付けが極めて容易かつ正確なものとなる。
【0030】次に、図3を参照して、上記画像認識装置
1における全体処理をより詳細に説明する。動画が時系
列画像入力部11に入力されると、初期設定部12は、
オプティカルフロー推定における反復終了回数N、正則
化パラメータαを設定する(ステップS101)。ま
た、オプティカルフロー推定における反復回数nを設定
するとともに、オプティカルフローを“0”で初期化す
る(ステップS102)。輝度勾配画像算出部13で
は、画像I(x,y,t)に対し、式(13)で示されるx,y,t
方向の輝度勾配画像を生成する(ステップS103)。
【0031】
【数5】
【0032】従来手法と同様に、画像上の点(x,y)
におけるオプティカルフローを(u,v)Tとする。対
象物体は剛体であり、移動後の輝度値は変化しないと仮
定すると、ペナルティ汎関数Eaは、式(14)のよう
に定義することができる。また、2次元の動きベクトル
の空間的変動は滑らかであると仮定すると、安定化汎関
数Ebは式(15)のように定義することができる。
【0033】
【数6】
【0034】次に、対応点入力部8で入力された2つの
画像I1、I2間の対応点座標を各々、(x1,y1)及び(x
2,y2)とする(ステップS110)。これらの対応点座
標から得られる動きベクトル「ハットu」を「x2-x
1」、「ハットv」を「y2-y1」とし、これらの動きベク
トルとオプティカルフローとの誤差を表す評価関数Ec
を以下の式(16)のように定義する。
【0035】
【数7】
【0036】この評価関数Ecは、対応点における座標
間の差分に着目して定義したものであり、換言すれば、
対応点に係る信頼性の妥当性を示すものである。この評
価関数Ecを用いることにより、誤差精度の向上が保証
されるようになる。さらに、以下の式(17)のよう
に、これらの評価関数の和Eが導かれる。
【0037】
【数8】E=Ea+αEb+βEc ・・・(17)
【0038】オプティカルフロー推定部14では、この
評価関数Eを最小化させることにより、オプティカルフ
ローの推定を行う。正則化パラメータα及び対応点パラ
メータβは、評価関数の重みを意味するものである。対
応点パラメータβは、操作者が与える対応点座標に関し
て設定されるものであり、上述の「ハットu」及び「ハ
ットv」が定義されていない画素、即ち対応点入力部1
9における対応点座標の入力前の段階では、対応点パラ
メータβを“0”とする。一方、「ハットu」及び「ハ
ットv」が定義されている画素、即ち対応点座標の入力
後の段階では、対応点パラメータβは、正則化パラメー
タαに比べて大きい値を与えるように適宜設定する(ス
テップS111)。なお、これらの正則化パラメータ
α,βは、対象物の複雑さや動きの複雑さに基づいて設
定されるものである。
【0039】上記式(17)における最小化問題は、
u,vに対する「Euler-Lagrangeの方程式」を求め、こ
れを離散化した連立方程式を解くことに帰着するので、
∂E/∂u=0、∂E/∂v=0より、以下の式(1
8)及び(19)が導かれる。さらに、「Gauss-Seidel
法」を用いると、u,vは、再帰的に以下の式(20)
及び(21)で求められる。
【0040】
【数9】
【0041】但し、上記式(20)及び(21)におい
て、「バーun」,「バーvn」は、局所領域におけるn回
目のu及びvの平均値である。オプティカルフロー推定
部14では、上述の式(20)及び(21)によりオプ
ティカルフローを推定する。このオプティカルフロー
は、初期設定部12において設定された推定反復回数N
で反復演算されて算出される(ステップS104〜S1
06)。この推定に際しては、操作者により対応点座標
が与えられていない状況では、上述のステップS110
における対応点パラメータ等は考慮されずに、従来と同
様の処理によるオプティカルフロー推定となる。
【0042】3次元形状データ生成部15では、カメラ
の並進運動パラメータ及び回転運動パラメータと、オプ
ティカルフロー推定部14より得られたu,vに基づい
て、前述の式(11)及び(12)に最小2乗法等を適
合させることにより、カメラ画像の各画素毎に奥行きZ
を算出し(ステップS107)、3次元形状データを生
成する。生成された3次元形状データは、3次元形状デ
ータ出力部16を通じて操作者に提示される。
【0043】提示された3次元形状データを見た操作者
は、その3次元形状データについての後続処理の指示を
3次元形状データ判定部17に入力する。3次元形状デ
ータ判定部17は、操作者等からの指示を解読して「適
切」ならば(ステップS108:Yes)、3次元形状デー
タ格納部18にその3次元形状データを格納させ(ステ
ップS109)、一方、「適切」でなければ(ステップ
S108:No)、ステップS110に戻る。対応点入力
部19に対応点座標が再入力された場合は、オプティカ
ルフロー推定及び3次元形状データの生成を繰り返す。
【0044】このように、本実施形態の画像認識装置1
では、コンピュータ処理によって推定されるオプティカ
ルフローと、対応点座標の入力による画像間の対応付け
とを融合させるようにしたので、形状推定処理の効率化
と推定精度の向上を同時に満足することができるように
なる。また、これにより、従来の正則化手法による3次
元形状推定方法では困難であった物体の境界、稜線等の
領域における3次元形状の滑らかさの仮定が可能とな
り、オプティカルフローの推定精度を格段に高めること
ができる。対応点座標の入力は、対象物体画像の稜線や
輪郭等の特徴点を2画像間で対応付けるだけで足りるの
で、操作者側の負荷を増大させることもなくなる。
【0045】
【発明の効果】以上の説明から明らかなように、本発明
によれば、3次元形状推定の際に、誤差の少ないオプテ
ィカルフローが推定可能になるため、3次元形状の復元
精度が高まる効果がある。従って、3次元形状の復元処
理の効率も大幅に向上する。
【0046】また、2画像間の特徴を対応付けるための
対応点の入力は、物体の稜線、輪郭、頂点等の必要最小
限の特徴部分だけで足りるので、簡便な構成の画像認識
装置が実現可能となる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る画像認識装置の機能
ブロック図。
【図2】本実施形態による対応点入力部における画面イ
ンタフェースの表示例を示す図で、(a),(b)は同
一対象物体画像を異なる角度から見た図、(c)は推定
されたオプティカルフローを視覚化した図、(d)は3
次元形状データを視覚化した図である。
【図3】本実施形態による全体的な処理手順図。
【符号の説明】
1 画像認識装置 11 時系列画像入力部 12 初期設定部 13 輝度勾配画像生成部 14 オプティカルフロー推定部 15 3次元形状データ生成部 16 3次元形状データ出力部 17 3次元形状データ判定部 18 3次元形状データ格納部 19 対応点入力部 20 画面インタフェース

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 時間的に連続した動画に含まれる対象物
    体画像を解析して当該対象物体画像のオプティカルフロ
    ーを推定演算する推定演算過程と、前記推定演算の結果
    及び前記動画像の撮影時の並進、回転運動パラメータに
    基づいて前記対象物体画像の3次元形状を推定する物体
    形状推定過程とを含む画像認識方法において、 前記対象物体画像の同一特徴部位を後続の画像間で対応
    付けるための対応点座標の入力を受け付けて特徴部位間
    のオプティカルフローの誤差を表す所定の誤差評価関数
    を演算し、この誤差評価関数の演算結果を前記オプティ
    カルフローの推定演算に反映させることを特徴とする画
    像認識方法。
  2. 【請求項2】 前記対応点座標は、前記対象物体画像に
    おける稜線、輪郭、頂点等の明示的な特徴部位の座標で
    あることを特徴とする請求項1記載の画像認識方法。
  3. 【請求項3】 前記物体形状推定過程で推定された3次
    元形状が前記対象物体画像の形状に適合しない場合に、
    前記対応点座標を修正して前記誤差評価関数の演算と前
    記オプティカルフローの推定演算とを、前記推定された
    3次元形状が前記対象物体画像の形状に適合するまで繰
    り返すことを特徴とする請求項1記載の画像認識方法。
  4. 【請求項4】 前記特徴部位が画素毎に特定されるもの
    であり、前記誤差評価関数は、前記対応点座標によって
    対応付けられた画素と対応付けられない画素とでそれぞ
    れ異なる重み係数が付与されることを特徴とする請求項
    1記載の画像認識方法。
  5. 【請求項5】 時間的に連続した動画に含まれる対象物
    体画像から画素毎の輝度勾配画像を生成する前処理手段
    と、 前記対象物体画像の特徴部位を後続の画像との間で対応
    付けるための対応点座標の入力を受け付ける座標入力手
    段と、 前記輝度勾配画像及び対応点座標に基づいて前記対象物
    体画像のオプティカルフローを推定するオプティカルフ
    ロー推定手段と、 前記推定されたオプティカルフローから前記対象物体画
    像を復元するための3次元形状データを生成する手段
    と、を備えて成る画像認識装置。
  6. 【請求項6】 前記生成された3次元形状データを操作
    者に提示するとともに、該提示に対して入力された指示
    を解読して同一対象物体画像についてのオプティカルフ
    ローの推定を継続するか否かを判定する終了判定手段を
    さらに備え、継続すると判定した場合は、前記対応点座
    標の再入力を前記操作者に提示することを特徴とする請
    求項5記載の画像認識装置。
  7. 【請求項7】 前記生成された3次元形状データを保持
    するデータ保持手段をさらに備え、前記終了判定手段
    は、前記オプティカルフローの推定を継続しないと判定
    した場合に、当該対象物体画像について最後に生成され
    た前記3次元形状データを前記データ保持手段に保持さ
    せるように構成されていることを特徴とする請求項6記
    載の画像認識装置。
  8. 【請求項8】 前記座標入力手段は、同一の対象物体画
    像を異なる角度で視覚化したステレオ画面を提示するイ
    ンタフェース手段を有し、このステレオ画面を通じて前
    記特徴部位が特定されるように構成されていることを特
    徴とする請求項5ないし7のいずれかの項記載の画像認
    識装置。
  9. 【請求項9】 前記オプティカルフロー推定手段は、前
    記輝度勾配画像に基づくペナルティ汎関数及び重み付け
    された安定化汎関数と、前記入力された対応点座標に基
    づくオプティカルフローの誤差を表す所定の誤差評価関
    数とを演算し、この演算結果を最小化することで前記オ
    プティカルフローを推定するように構成されていること
    を特徴とする請求項5ないし8のいずれかの項記載の画
    像認識装置。
JP9274050A 1997-10-07 1997-10-07 画像認識方法及び装置 Pending JPH11110566A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9274050A JPH11110566A (ja) 1997-10-07 1997-10-07 画像認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9274050A JPH11110566A (ja) 1997-10-07 1997-10-07 画像認識方法及び装置

Publications (1)

Publication Number Publication Date
JPH11110566A true JPH11110566A (ja) 1999-04-23

Family

ID=17536277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9274050A Pending JPH11110566A (ja) 1997-10-07 1997-10-07 画像認識方法及び装置

Country Status (1)

Country Link
JP (1) JPH11110566A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006510280A (ja) * 2002-12-13 2006-03-23 フォルシュングスツェントルム・ユーリッヒ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング Cmosカメラ画像をデジタル画像処理する方法及び装置
JP2007233755A (ja) * 2006-03-01 2007-09-13 Toyota Motor Corp 画像処理装置、及び画像処理方法
JP2010134606A (ja) * 2008-12-03 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 三次元的動き検出装置、三次元的動き検出方法及び三次元的動き検出プログラム
CN103268589A (zh) * 2013-05-10 2013-08-28 中科创达软件股份有限公司 一种基于移动终端前置摄像头的体感交互方法
WO2015141324A1 (ja) * 2014-03-20 2015-09-24 富士フイルム株式会社 画像処理装置,方法,およびそのプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006510280A (ja) * 2002-12-13 2006-03-23 フォルシュングスツェントルム・ユーリッヒ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング Cmosカメラ画像をデジタル画像処理する方法及び装置
JP4712391B2 (ja) * 2002-12-13 2011-06-29 フォルシュングスツェントルム・ユーリッヒ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング Cmosカメラ画像内でデジタル画像処理することによって移動した物体を評価する方法及び装置
JP2007233755A (ja) * 2006-03-01 2007-09-13 Toyota Motor Corp 画像処理装置、及び画像処理方法
JP4622889B2 (ja) * 2006-03-01 2011-02-02 トヨタ自動車株式会社 画像処理装置、及び画像処理方法
JP2010134606A (ja) * 2008-12-03 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 三次元的動き検出装置、三次元的動き検出方法及び三次元的動き検出プログラム
CN103268589A (zh) * 2013-05-10 2013-08-28 中科创达软件股份有限公司 一种基于移动终端前置摄像头的体感交互方法
WO2015141324A1 (ja) * 2014-03-20 2015-09-24 富士フイルム株式会社 画像処理装置,方法,およびそのプログラム
JP6027705B2 (ja) * 2014-03-20 2016-11-16 富士フイルム株式会社 画像処理装置,方法,およびそのプログラム

Similar Documents

Publication Publication Date Title
JP3745117B2 (ja) 画像処理装置及び画像処理方法
Du et al. Montage4D: interactive seamless fusion of multiview video textures.
EP1303839B1 (en) System and method for median fusion of depth maps
Newcombe et al. Live dense reconstruction with a single moving camera
KR101923845B1 (ko) 이미지 처리 방법 및 장치
Wei et al. Fisheye video correction
US8655052B2 (en) Methodology for 3D scene reconstruction from 2D image sequences
US6636234B2 (en) Image processing apparatus for interpolating and generating images from an arbitrary view point
US5577175A (en) 3-dimensional animation generating apparatus and a method for generating a 3-dimensional animation
CN106846467B (zh) 基于每个相机位置优化的实体场景建模方法和系统
EP3367334B1 (en) Depth estimation method and depth estimation apparatus of multi-view images
JP2000215311A (ja) 仮想視点画像生成方法およびその装置
US8373802B1 (en) Art-directable retargeting for streaming video
JP7116262B2 (ja) 画像深度推定方法および装置、電子機器、ならびに記憶媒体
KR101266362B1 (ko) 카메라 트래킹 시스템, 트래킹 방법 및 이를 이용한 실사영상 합성 시스템
US6795090B2 (en) Method and system for panoramic image morphing
Mulligan et al. Stereo-based environment scanning for immersive telepresence
KR100837776B1 (ko) 2차원 영상을 3차원 영상으로 변환하는 영상 변환 장치 및그 방법
Deschenes et al. An unified approach for a simultaneous and cooperative estimation of defocus blur and spatial shifts
KR100922273B1 (ko) 영상 시퀀스로부터 선택된 중요 영상을 이용한 3차원모델의 재구성 방법
JPH11250273A (ja) 画像合成装置
JPH11110566A (ja) 画像認識方法及び装置
Somraj et al. Temporal view synthesis of dynamic scenes through 3D object motion estimation with multi-plane images
JP4642431B2 (ja) 地図表示装置、地図表示システム、地図表示方法およびプログラム
JP3642923B2 (ja) 映像生成処理装置及びその装置で用いられる構造化データを作成する構造化データ作成装置