JP5723301B2 - 被写体認識装置及び被写体認識プログラム - Google Patents

被写体認識装置及び被写体認識プログラム Download PDF

Info

Publication number
JP5723301B2
JP5723301B2 JP2012002288A JP2012002288A JP5723301B2 JP 5723301 B2 JP5723301 B2 JP 5723301B2 JP 2012002288 A JP2012002288 A JP 2012002288A JP 2012002288 A JP2012002288 A JP 2012002288A JP 5723301 B2 JP5723301 B2 JP 5723301B2
Authority
JP
Japan
Prior art keywords
subject
feature
image
feature point
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012002288A
Other languages
English (en)
Other versions
JP2013142973A (ja
Inventor
浩子 藪下
浩子 藪下
島村 潤
潤 島村
森本 正志
正志 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012002288A priority Critical patent/JP5723301B2/ja
Publication of JP2013142973A publication Critical patent/JP2013142973A/ja
Application granted granted Critical
Publication of JP5723301B2 publication Critical patent/JP5723301B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、撮像装置で撮影した被写体を認識する被写体認識装置及び被写体認識プログラムに関する。
従来からカメラ等の撮像装置で撮影した画像のみを用いて、対象を特定する画像認識技術がある。例えば、予め被写体を異なる角度から撮影した画像群を学習画像群として記憶しておき、この学習画像群から生成した特徴量データと、利用者が被写体に対して任意の方向から撮影したクエリ画像から得た特徴量とを比較することで、任意の被写体を特定するものがある(例えば、非特許文献1参照)。しかし、被写体が3次元形状の場合、観測方向によって画像上の被写体の構造が変化するため、予め多数の画像群を学習画像群として撮影しておく必要があり、この作業に多大な手間がかかるという問題がある。
このような問題を解決するために、学習画像群の撮影の代わりに、仮想視点を移動させることによって予め入力された被写体の3次元形状とテクスチャから構成されるCG(コンピュータグラフィックス)モデルに対し、コンピュータグラフィックス空間内で被写体を異なる方向から観測した学習画像群を合成し、この合成画像と利用者が被写体に対して任意の方向から撮影したクエリ画像の、両者から得た特徴量の照合によって対象を特定するものがある(例えば、非特許文献2参照)。しかしながら、上述した従来技術は、学習画像群を全方向分生成する必要があり、加えて学習対象が複数ある場合には学習対象の分だけ学習画像群を全方向分生成する必要があり、計算処理量が膨大になるという問題がある。
そこで、これらの事情を鑑みて考案された手法として、被写体の3次元形状とテクスチャを基に被写体を包含する球上に被写体を投影し、投影結果の球面展開によって、各観測方向の仮想視点画像を統合した仮想視点群統合画像を生成し、この仮想視点群統合画像と任意方向からのみ観測された少数の学習画像との照合により被写体を認識するものがある(例えば、非特許文献3参照)。この手法は、入力側で被写体の全周囲情報を持つことにより、学習側で被写体の観測画像を大量に持たなくても対応付けできること、さらに被写体の3次元形状およびテクスチャを2次元画像として展開することで、学習画像との2次元マッチングが可能となり計算コストを下げることができる特徴を有している。この手法によれば、任意方向分の学習画像を生成することなく高速な認識が可能となる。
村瀬洋,S.Nayar,"2次元照合による3次元物体認識−パラメトリック固有空間法″,信学論(D−II),vol.J77−D−II,no.11,pp.2179−2187,Nov.1994. 望戸雄史,渡辺義浩,小室孝,石川正俊,"Analysis−Synthesis法を用いた三次元物体姿勢推定法のGPUによる実装",第16回画像センシングシンポジウム,2010,講演論文集IS4−17. 薮下浩子,島村潤,森本正志,小池秀樹,"被写体形状の球面展開に基づく3次元物体認識の一検討",電子情報通信学会総合大会講演論文集 2011年_情報・システム(2), 156.
しかしながら、上述した従来技術は3次元計測時もしくは被写体展開図生成時に生じる画像上の不均一なゆがみにより特徴が変化してしまう。そのため被写体展開画像上において、予め被写体を撮影した観測方向の視点画像情報を含む箇所にゆがみが大きく発生すると認識精度が下がるという問題がある。
本発明は、このような事情に鑑みてなされたもので、被写体を高精度に認識することができる被写体認識装置及び被写体認識プログラムを提供することを目的とする。
本発明は、被写体の3次元形状データとテクスチャデータに基づいて生成された被写体展開画像と、複数の検索対象画像とのそれぞれから、特徴点を抽出する特徴点抽出手段と、前記被写体展開画像の各特徴点について隣接特徴点との空間距離を算出する空間距離算出手段と、前記被写体展開画像の各特徴点と、前記検索対象画像それぞれの特徴点との特徴ベクトル間距離を算出する特徴ベクトル間距離算出手段と、前記空間距離および前記ベクトル間距離に基づいてスコアを算出し、算出した前記スコアを該当する検索対象画像に対して投票し、該投票結果に基づき、前記検索対象画像の中から被写体候補の画像を選択して出力する照合手段とを備えたことを特徴とする。
本発明は、前記照合手段は、設定した注目特徴点の特徴量に加え、前記注目特徴点に隣接する隣接特徴点の特徴量に基づき、前記被写体展開画像の各特徴点の前記スコアを算出することを特徴とする。
本発明は、前記照合手段は、前記被写体展開画像の前記特徴点と前記隣接特徴点との前記空間距離と、前記被写体展開画像の前記特徴点と前記隣接特徴点に対応する前記検索対象画像内の特徴点との前記特徴ベクトル間距離と、に基づいて前記スコアを算出することを特徴とする。
本発明は、前記照合手段は、前記注目特徴点に対応する特徴点を有する前記検索対象画像に限定して、前記スコアの投票を行うことを特徴とする。
本発明は、コンピュータを前記被写体認識装置として機能させるための被写体認識プログラムである。
本発明によれば、2次元の被写体展開画像を生成した際に生じたテクスチャデータのゆがみにより特徴量が変化し、特徴点間の対応付けが弱まることによる認識精度の劣化という問題を、照合時に隣接特徴点の特徴量も利用してスコアを算出し投票することによって、対応付けを補い影響の緩和を図り、また、2次元の被写体展開画像を生成する際に生じる特徴点間の距離の変化による認識精度の劣化という問題を、特徴点間の本来の距離である3次元空間での距離を用いることで解決するようにしたため、被写体を高精度に認識することが可能になるという効果が得られる。
本発明の一実施形態の構成を示すブロック図である。 図1に示す特徴表現部11がユーザによって入力された被写体展開画像および予め記憶部3に保存した検索対象画像群から特徴量を抽出し、この特徴量を記憶部3に記憶する動作を示すフローチャートである。 図1に示す空間距離算出部12が特徴表現部11で保存した被写体展開画像の特徴量データに基づき、被写体展開画像の特徴点間の空間距離を算出し保存する動作を示すフローチャートである。 図1に示す特徴ベクトル間距離算出部13が、特徴表現部11でクエリの被写体展開画像と検索対象画像群から抽出し保存した特徴量データを参照して、被写体展開画像の特徴点と検索対象画像群の各特徴点との特徴ベクトル間距離を算出し保存する動作を示すフローチャートである。 図1に示す照合部14が、特徴表現部11でクエリの被写体展開画像と検索対象画像群から抽出し保存した特徴量データを照合して、被写体を特定する動作を示すフローチャートである。 注目特徴点の特徴量に加え、隣接特徴点の特徴量を用いて投票を行う際に、注目特徴点が投票した特徴点を有する画像のみを候補画像として絞り込み、候補画像が有する特徴点に対してのみスコア値算出および投票を実施する動作を示すフローチャートである。 被写体の3次元の形状データおよびテクスチャデータから2次元の被写体展開画像を生成する過程で、特徴点間の距離が変化している状態を示す説明図である。 本来3次元的な空間距離が大きく異なるにも拘わらず、前記交点の空間的な位置関係を考慮せず2つの交点がなす角度にのみ応じて球上投影することにより、投影結果を球面展開した際に同じ画像上距離になってしまう例を示す図である。 被写体展開画像内で空間的に近い位置に存在する特徴点が、任意の視点から撮影された検索対象画像群内の被写体を示す認識正解画像中においても一緒に写る可能性が高いことを示す説明図である。
以下、図面を参照して、本発明の一実施形態による被写体認識装置を説明する。図1は同実施形態の構成を示す機能ブロック図である。被写体認識装置は、コンピュータ装置によって構成する。図1において、符号1は、被写体の認識処理を行う被写体認識部である。符号2は、2次元画像データを入力する画像入力部である。符号3は、被写体認識処理に必要なデータを記憶する記憶部である。符号4は、キーボード等から構成する入力部である。符号5は、表示装置等から構成する表示部である。
符号11は、画像入力部2を介して、前述した非特許文献3記載の方法により3次元形状データ(形状の3次元座標データ)及びテクスチャデータ(3次元形状表面の模様データ)に基づき生成した被写体展開画像を入力し、また記憶部3から検索対象の2次元画像データを読み出し、それらすべての画像の特徴を抽出して、記憶部3に保存する特徴表現部である。符号12は、特徴表現部11で記憶部3に保存した特徴のうち被写体展開画像中の特徴点から、注目特徴点を決定し、注目特徴点から被写体展開画像内の他の特徴点までの空間距離を算出する空間距離算出部である。符号13は、特徴表現部11により得た被写体展開画像の特徴と検索対象の2次元画像データの特徴とで特徴ベクトル間距離を算出する特徴ベクトル間距離算出部である。符号14は、空間距離算出部12で算出した空間距離および特徴ベクトル間距離算出部13で算出した特徴ベクトル間距離をもとに、被写体展開画像と検索対象の2次元画像データ間で照合をとり、被写体を特定する照合部である。
次に、図1に示す被写体認識装置の処理動作を説明する。ここでは、クエリとして3次元形状データとテクスチャデータに基づく被写体展開画像を入力し、検索対象として1枚以上の2次元画像のデータ、さらに本実施形態の処理過程で必要のため、非特許文献3記載の方法で被写体展開画像を生成する際に、各仮想視点から画素情報のみではなく各仮想視点から被写体重心に向けた視線と被写体表面の交点までのdepth値を取得し、被写体展開後の画素位置と対応付けて保存したものを、予め記憶部3に記憶しておくものとして説明する。
なお、2次元画像群のデータは対象の被写体を任意の角度から撮影したものとし、予め対象の被写体毎に唯一に付与された被写体IDや名前などの各種情報が関連づけられて保存されているものとする。また、被写体展開画像を生成する際に利用する被写体の3次元形状データとテクスチャデータは、例えば携帯電話等に搭載された撮像装置で対象を撮影し、その画像から画像処理によって生成したものでもよいし、レンジファインダ等のセンサーによって計測したものでもよい。また、コンピュータグラフィックス(CG)技術によって手動で生成したものでもよい。
また、非特許文献3記載の方法で被写体展開画像を生成する際に、各仮想視点から画素情報とともに取得する情報は、各仮想視点と被写体表面までの距離であるdepth値ではなく、各仮想視点から被写体重心に向けた視線と被写体表面の交点の3次元座標値でもよい。
次に、図2を参照して、図1に示す特徴表現部11がユーザによって入力された被写体展開画像および予め記憶部3に保存した検索対象画像群から特徴量を抽出し、この特徴量を記憶部3に記憶する動作を説明する。図2は、図1に示す特徴表現部11がユーザによって入力された被写体展開画像および予め記憶部3に保存した検索対象画像群から特徴量を抽出し、この特徴量を記憶部3に記憶する動作を示すフローチャートである。
まず、ユーザが入力部4を操作して、2次元画像データの入力を指示すると、特徴表現部11は、画像入力部2から2次元画像データを入力する(ステップS1)。そして、特徴表現部11は、入力した画像から、特徴量を抽出する(ステップS2)。この特徴量抽出処理は、例えば、文献:H.Bay,T.Tuytelaars, and L.V.Gool,"SURF:SpeedUp Robust Features",Proc. of Int. Conf. of ECCV, (2006)に記載の方法や、ヒストグラム等の公知の方法を用いて実行する。この特徴量抽出処理は入力画像の枚数分繰り返し実行する。
次に、特徴表現部11は、被写体展開画像から得られたk次元の特徴量をまとめ特徴点idを割り当て、また検索対象画像群の対象の被写体IDと各々の画像から得られたk次元の特徴量をまとめて特徴点idを割り当てて(ステップS3)、記憶部3に保存し(ステップS4)、これを2次元画像特徴量データとする。例えば、特徴量の上記文献の方法を用いて特徴点を抽出した時、特徴点は各々128次元の特徴量を持つ。これにより、被写体ID毎に、かつ特徴点を識別する特徴点番号毎に、k(128)次元の特徴量のデータが記憶部3に保存されることになる。
次に、図3を参照して図1に示す空間距離算出部12が、特徴表現部11で保存した被写体展開画像の特徴量データに基づき、被写体展開画像の特徴点間の空間距離を算出し保存する方法を説明する。図3は、図1に示す空間距離算出部12が特徴表現部11で保存した被写体展開画像の特徴量データに基づき、被写体展開画像の特徴点間の空間距離を算出し保存する動作を示すフローチャートである。
まず、空間距離算出部12は、特徴表現部11により記憶部3に保存した特徴量データの中から、被写体展開画像の特徴量データを読み出す(ステップS11)。続いて、空間距離算出部12は、特徴量データの中から注目する特徴点を決定する。この注目特徴点はエッジの強さを示すHessian値に基づき、このHessian値が大きいものを優先的に選んでも良い。また被写体展開画像上から座標値に応じて均一に選択してもよい。例えばすべての特徴量データを注目する特徴点として順に処理を行う。このとき処理順序は問わないが、例えば保存された特徴量データの順に注目特徴点とする。
次に、空間距離算出部12は、注目特徴点と被写体展開画像中の隣接する特徴点間の画像上距離を算出する(ステップS12)。被写体展開画像上の特徴点2点をa=(x,y)、b=(x,y)としたとき、この2点の画像上距離の算出には(1)式を用いる。
Figure 0005723301
次に、空間距離算出部12は、求めた被写体展開画像の特徴点間画像上距離を空間距離に変換する(ステップS13)。これは、図7に示すように、被写体の3次元の形状データおよびテクスチャデータから2次元の被写体展開画像を生成する過程で、特徴点間の距離が変化しているからである。図7は、被写体の3次元の形状データおよびテクスチャデータから2次元の被写体展開画像を生成する過程で、特徴点間の距離にゆがみが生じている状態を示す図である。このゆがみは図7に示すように球状に配置された各視点から被写体の重心に向けた視線と被写体表面の交点のテクスチャデータを球上に投影した際に生じる。本来3次元的な空間距離が大きく異なるのにも拘わらず、交点の空間的な位置関係を考慮せず2つの交点がなす角度にのみ応じて球上投影することにより、この投影結果を球面展開した際に同じ画像上距離になってしまう例を図8に示す。図8は、本来3次元的な空間距離が大きく異なるのにも拘わらず、前記交点の空間的な位置関係を考慮せず2つの交点がなす角度にのみ応じて球上投影することにより、投影結果を球面展開した際に同じ画像上距離になってしまう例を示す図である。
このゆがみによる特徴点間距離の誤算出を防ぐため、被写体展開画像の生成時に視点から被写体表面までの距離(depth値)を、被写体展開画像上の座標に紐づけて保存したデータを記憶部3に読み込んでおき、このデータを空間距離算出部が記憶部3から読み出し、この距離を基に(2)式を用いて変換する。このとき、図7に示すように2視点間の為す角をθ、各視点から被写体の重心に向けた視線と被写体表面との交点から重心までの距離をr1、r2とする。隣接特徴点によっては(2)式において、θ→0近似し、D=r2+r1としもよい。また他の算出式によって空間距離変換を行ってもよい。
Figure 0005723301
なお、被写体展開画像は球面展開によって得られた画像として説明および式を示したが、球以外の形状を用いた投影およびこの投影面の展開によって得られた被写体展開図、もしくは他の手法によって被写体の3次元形状データおよびテクスチャデータを2次元画像に展開した場合においても展開前の空間座標と展開後の被写体展開画像上の座標の変換式を求め、空間距離の算出に用いることで実施することが可能である。
また、前述した説明においては、被写体展開図における特徴点座標間の画像上距離を求め、この画像上距離をもとに空間距離変換を行う方法を説明したが、被写体展開画像の生成時に空間座標を取得し、この空間座標を被写体展開画像上の座標値に紐づけて保存しておき、隣接特徴点の空間距離を求める際に、この空間座標をもとに空間距離を算出しても良い。2点の空間座標をa=(x,y,z)、b=(x,y,z)としたとき、この2点の空間距離Dの算出には(3)式を用いる。この場合、球面以外の形状で投影およびこの投影面の展開を行った被写体展開画像においても同様の式で算出が可能である。
Figure 0005723301
なお、前記被写体展開時に用いるデータは被写体の3次元形状データやテクスチャデータに限らない。
次に、空間距離算出部12は、画像上距離算出および空間距離変換処理を隣接特徴点分繰り返し実施する。このとき、注目特徴点の隣接特徴点とは、被写体展開画像中の注目特徴点以外のすべての特徴点としても良いし、注目特徴点からの画像上距離が、ユーザによって指定された閾値より小さいものを隣接特徴点と設定するなど任意の指標によって選択しても良い。
次に、空間距離算出部12は、注目特徴点からの空間距離が小さい順に隣接特徴点をソートする(ステップS14)。ソートが完了したら、ソート結果と注目特徴点の特徴点番号と対応づけて記憶部3に保存する(ステップS15)。
そして、空間距離算出部12は、全隣接特徴点との空間距離算出およびソートを、注目特徴点を変更しながら繰り返し実施する。注目特徴点として処理する特徴点は被写体展開画像上のすべての特徴点をその候補としてもよい(この場合すべての特徴点分処理を繰り返す)し、前記Hessian値等によって注目特徴点として処理する特徴点を、被写体展開画像のすべての特徴点から部分的に選択してもよい。
次に、図4を参照して、図1に示す特徴ベクトル間距離算出部13が、特徴表現部11でクエリの被写体展開画像と検索対象画像群から抽出し保存した特徴量データを参照して、被写体展開画像の特徴点から検索対象画像群の特徴点群までの特徴ベクトル間距離を算出し保存する処理動作を説明する。図4は、図1に示す特徴ベクトル間距離算出部13が、特徴表現部11でクエリの被写体展開画像と検索対象画像群から抽出し保存した特徴量データを参照して、被写体展開画像の特徴点から検索対象画像群の特徴点群までの特徴ベクトル間距離を算出し保存する動作を示すフローチャートである。
まず、特徴ベクトル間距離算出部13は、記憶部3からクエリとして入力した被写体展開画像の特徴量データと、検索対象画像群の特徴量データを読み出す(ステップS21)。続いて、特徴ベクトル間距離算出部13は、読み出した被写体展開画像の特徴量データと検索対象画像群の特徴量データとを比較し、各特徴点間の特徴量データそれぞれの特徴量1〜特徴量kまでのk次元ベクトルのベクトル間距離を算出する(ステップS22)。
次に、特徴ベクトル間距離算出部13は、算出処理を繰り返し実施したのち、被写体展開画像上の特徴点ごとに、検索対象画像群の特徴点を特徴ベクトル間距離が小さいものから順にソートする(ステップS23)。最後に、特徴ベクトル間距離算出部13は、被写体展開画像上の特徴点すべてにおいて、検索対象画像上の特徴点のソート結果を保存する(ステップS24)。なお、保存の際は被写体展開画像上の特徴点idとソート結果を関連付けて保存する。
次に、図5を参照して、図1に示す照合部14が、特徴表現部11でクエリの被写体展開画像と検索対象画像群から抽出し保存した特徴量データを照合して、被写体を特定する方法を説明する。図5は、図1に示す照合部14が、特徴表現部11でクエリの被写体展開画像と検索対象画像群から抽出し保存した特徴量データを照合して、被写体を特定する動作を示すフローチャートである。
まず、照合部14は、被写体展開画像の特徴点間の空間距離の算出結果、および被写体展開画像の特徴点と検索対象画像中の特徴点とのベクトル間距離の算出結果を記憶部3から読み出す(ステップS31)。続いて、照合部14は、注目特徴点を設定し、注目特徴点から、注目特徴点に対応する検索対象画像中の特徴点とのベクトル間距離の算出結果から(4)式を用いてスコアSを算出する(ステップS32)。このとき注目特徴点との空間距離をDとするが、注目特徴点のスコアを算出する際は本来D=0となるが、スコアSの発散を防止するために、D=1とする。これに伴い各隣接特徴点から注目特徴点までの距離はD=D+1とする。なお、注目点式中のαおよびβはユーザが事前に設定したスコア算出時の重みづけ係数である。例えばα=1,β=1を代入した(5)式を使う。ここで説明した(4)式、(5)式では、スコア算出に注目特徴点との空間距離Dおよびベクトル間距離に対して逆数を用いたが、ガウス関数や指数関数を用いてスコア算出式を設定してもよい。
Figure 0005723301
Figure 0005723301
なお、ここでスコア算出式に「特徴ベクトル間距離」を入れたのは、被写体展開画像の特徴点と検索対象画像群の特徴点間で、テクスチャの類似度をスコアに反映するためである。また、スコア算出式に「注目特徴点との空間距離D」を入れたのは、図9に示すように、被写体展開画像内で空間的に近い位置に存在する特徴点は、任意の視点から撮影された検索対象画像群内の被写体を示す認識正解画像中においても一緒に写る可能性が高く、さらに撮影(透視投影)のゆがみによって生じる特徴の変化も少ないであろうことを利用したもので、ベクトル間距離によるテクスチャ類似度に対する重みづけの役割を担っている。図9は、被写体展開画像内で空間的に近い位置に存在する特徴点が、任意の視点から撮影された検索対象画像群内の被写体を示す認識正解画像中においても一緒に写る可能性が高いことを示す図である。
次に、照合部14は、対応特徴点を有する検索対象画像を求めて、この画像IDに対して求めたスコアを投票する(ステップS33)。投票はベクトル間距離の近い順に事前に設定したN点分実施しても良いし、ベクトル間距離が事前に設定した閾値以下の特徴点にのみ実施してもよい。例えばN=3として実施する。
次に、照合部14は、本スコア値算出および投票処理を隣接特徴点においても同様に実施する。ただし、このとき注目特徴点が投票した特徴点を有する画像のみを候補画像として絞り込み、候補画像が有する特徴点に対してのみスコア値算出および投票を実施してもよい。この場合の処理動作は、図6に示すフローチャートになる。図6は、注目特徴点が投票した特徴点を有する画像のみを候補画像として絞り込み、この候補画像が有する特徴点に対してのみスコア値算出および投票を実施する動作を示すフローチャートである。図5に示すフローチャートと、図6に示すフローチャートの異なる点は、候補画像の決定ステップ(ステップS35)が追加されている点である。
次に、照合部14は、注目特徴点と隣接特徴点のスコア値算出および投票処理を、注目特徴点を変えながらすべての注目特徴点分実施する。そして、照合部14は、投票された合計スコアを開票し、1位となるものもしくはそのランキングを被写体認識結果として出力する(ステップS34)。
なお、前述した説明においては、特徴点間の比較による投票を実施する例を説明したが、画像内の複数の特徴点をまとめた特徴点群同士の比較による投票を実施するようにしてもよい。また、特徴点単位ではなく、面積や情報量等が均一になるように区切った領域を定義し、この特徴領域間の比較による投票を実施してもよい。
以上説明したように、2次元の被写体展開画像を生成した際に生じたテクスチャデータのゆがみにより特徴量が変化し、特徴点間の対応付けが弱まることによる認識精度の劣化という問題を、照合時に隣接特徴点の特徴量も利用してスコアを算出し投票することによって、対応付けを補い影響の緩和を図り、また、2次元の被写体展開画像を生成する際に生じる特徴点間の距離の変化による認識精度の劣化という問題を、特徴点間の本来の距離たる3次元空間での距離を用いることで解決するようにしたため、これによって被写体展開画像を用いて被写体を認識する手法における認識結果の精度向上を実現することができる。
なお、図1における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより被写体認識処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。
撮像装置で撮影した画像を使用して被写体を認識することが不可欠な用途に適用できる。
1・・・被写体認識部、11・・・特徴表現部、12・・・空間距離算出部、13・・・特徴ベクトル間距離算出部、14・・・照合部、2・・・画像入力部、3・・・記憶部、4・・・入力部、5・・・表示部

Claims (5)

  1. 被写体の3次元形状データとテクスチャデータに基づいて生成された被写体展開画像と、複数の検索対象画像とのそれぞれから、特徴点を抽出する特徴点抽出手段と、
    前記被写体展開画像の各特徴点について隣接特徴点との空間距離を算出する空間距離算出手段と、
    前記被写体展開画像の各特徴点と、前記検索対象画像それぞれの特徴点との特徴ベクトル間距離を算出する特徴ベクトル間距離算出手段と、
    前記空間距離および前記特徴ベクトル間距離に基づいてスコアを算出し、算出した前記スコアを該当する検索対象画像に対して投票し、該投票結果に基づき、前記検索対象画像の中から被写体候補の画像を選択して出力する照合手段と
    を備えたことを特徴とする被写体認識装置。
  2. 前記照合手段は、
    設定した注目特徴点の特徴量に加え、前記注目特徴点に隣接する隣接特徴点の特徴量に基づき、前記被写体展開画像の各特徴点の前記スコアを算出することを特徴とする請求項1記載の被写体認識装置。
  3. 前記照合手段は、
    前記被写体展開画像の前記特徴点と前記隣接特徴点との前記空間距離と、前記被写体展開画像の前記特徴点と前記隣接特徴点に対応する前記検索対象画像内の特徴点との前記特徴ベクトル間距離と、に基づいて前記スコアを算出することを特徴とする請求項2記載の被写体認識装置。
  4. 前記照合手段は、
    前記注目特徴点に対応する特徴点を有する前記検索対象画像に限定して、前記スコアの投票を行うことを特徴とする請求項3に記載の被写体認識装置。
  5. コンピュータを請求項1から4のいずれか1項に記載の被写体認識装置として機能させるための被写体認識プログラム。
JP2012002288A 2012-01-10 2012-01-10 被写体認識装置及び被写体認識プログラム Active JP5723301B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012002288A JP5723301B2 (ja) 2012-01-10 2012-01-10 被写体認識装置及び被写体認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012002288A JP5723301B2 (ja) 2012-01-10 2012-01-10 被写体認識装置及び被写体認識プログラム

Publications (2)

Publication Number Publication Date
JP2013142973A JP2013142973A (ja) 2013-07-22
JP5723301B2 true JP5723301B2 (ja) 2015-05-27

Family

ID=49039517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012002288A Active JP5723301B2 (ja) 2012-01-10 2012-01-10 被写体認識装置及び被写体認識プログラム

Country Status (1)

Country Link
JP (1) JP5723301B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201531960A (zh) * 2013-11-14 2015-08-16 Sicpa Holding Sa 用於驗證產品的圖像分析
CN107360048A (zh) * 2016-05-09 2017-11-17 富士通株式会社 节点性能评估方法、装置和系统

Also Published As

Publication number Publication date
JP2013142973A (ja) 2013-07-22

Similar Documents

Publication Publication Date Title
CN108875524B (zh) 视线估计方法、装置、系统和存储介质
US10254845B2 (en) Hand gesture recognition for cursor control
JP5940453B2 (ja) 画像のシーケンス内のオブジェクトのリアルタイム表現のハイブリッド型追跡のための方法、コンピュータプログラム、および装置
US9177381B2 (en) Depth estimate determination, systems and methods
CN110675487B (zh) 基于多角度二维人脸的三维人脸建模、识别方法及装置
CN109934847B (zh) 弱纹理三维物体姿态估计的方法和装置
CN110659582A (zh) 图像转换模型训练方法、异质人脸识别方法、装置及设备
CN111179419A (zh) 三维关键点预测及深度学习模型训练方法、装置及设备
CN113348465B (zh) 图像中对象的关联性预测方法、装置、设备和存储介质
WO2019228471A1 (zh) 指纹识别方法、设备及计算机可读存储介质
US20120033873A1 (en) Method and device for determining a shape match in three dimensions
JP5647072B2 (ja) 被写体認識装置、被写体認識方法及び被写体認識プログラム
Lopes et al. Spherical blurred shape model for 3-D object and pose recognition: Quantitative analysis and HCI applications in smart environments
JP2014102810A (ja) 被写体認識装置、被写体認識方法および被写体認識プログラム
JP6482130B2 (ja) 幾何検証装置、プログラム及び方法
JP6017343B2 (ja) データベース生成装置、カメラ姿勢推定装置、データベース生成方法、カメラ姿勢推定方法、およびプログラム
JP2014102746A (ja) 被写体認識装置及び被写体認識プログラム
JP2013101423A (ja) 画像マッチング装置及び画像マッチングプログラム
JP5723301B2 (ja) 被写体認識装置及び被写体認識プログラム
CN103034859B (zh) 一种获取姿势模型的方法及装置
JP2007140729A (ja) 物品の位置及び姿勢を検出する方法および装置
JP2015184743A (ja) 画像処理装置および物体認識方法
JPWO2019053790A1 (ja) 位置座標算出方法及び位置座標算出装置
KR102382883B1 (ko) 3차원 손 자세 인식 장치 및 방법
JP6946912B2 (ja) 推定プログラム、推定装置、及び推定方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130606

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130802

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140930

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150327

R150 Certificate of patent or registration of utility model

Ref document number: 5723301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150