JP7097285B2 - 平面物体の姿勢認識方法およびそのための装置 - Google Patents

平面物体の姿勢認識方法およびそのための装置 Download PDF

Info

Publication number
JP7097285B2
JP7097285B2 JP2018231071A JP2018231071A JP7097285B2 JP 7097285 B2 JP7097285 B2 JP 7097285B2 JP 2018231071 A JP2018231071 A JP 2018231071A JP 2018231071 A JP2018231071 A JP 2018231071A JP 7097285 B2 JP7097285 B2 JP 7097285B2
Authority
JP
Japan
Prior art keywords
posture
measured
measurement
vertices
rotation angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018231071A
Other languages
English (en)
Other versions
JP2019106184A (ja
Inventor
イ、ジュ-ヘン
キム、ジェ-ホン
ユン、ウ-ハン
イ、ジェ-ヨン
ジャン、ジン-ヒョク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2019106184A publication Critical patent/JP2019106184A/ja
Application granted granted Critical
Publication of JP7097285B2 publication Critical patent/JP7097285B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/269Analysis of motion using gradient-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Description

本発明は、平面物体の姿勢を認識する技術に関し、特に、短時間で物体の回転を正確に計算することができ、その結果を増強現実および人間とロボットの相互作用に活用できる平面物体の姿勢認識方法およびそのための装置に関する。
最近、実世界と仮想世界とをつなぐ技術の発展で物体の認識に関する技術需要が非常に高い。特に、増強現実およびロボット分野では、物体の認識、区別、姿勢認識が非常に重要な要素技術の一つである。多様な物体の中でも、学習教具などに大きな需要がある平面物体の姿勢を正確に計算することは非常に基本的な要素技術であるが、意外と正確ながらも効率的な計算が可能な方法が知られていない。また、姿勢の計算結果を増強現実およびロボット応用で適当に活用できる装置も必要である。周知の既存の方法を活用すると、計算が極めて遅く、また、単純な平面図形で発生する対称性を解決しにくい。
韓国公開特許第10-2011-0050759号、2011年5月17日公開(名称:ポリゴンモデルに対するハウスドルフ距離算出方法)
本発明の目的は、平面図形に対する入力映像からその図形の正確な姿勢を計算して基準に対する位置と回転を知ることである。
また、本発明の目的は、対称性とひっくり返りが存在する環境においても効果的に平面図形の姿勢を推定することである。
さらに、本発明の目的は、検出された平面図形の姿勢を増強現実および人間とロボットとの間の相互作用の応用に活用する方法を提供することである。
なお、本発明の目的は、実世界の平面図形に仮想世界の情報およびコンテンツを増強することにより、物体自体の使用性を高める方法を提供することである。
上記の目的を達成するための、本発明に係る平面物体の姿勢認識方法は、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出するステップと、前記平行移動値に基づいて前記2つの図形が重なるようにし、前記測定図形の回転角度ごとに算出される前記2つの図形の頂点間の距離に基づいて前記測定図形の回転角度を検出するステップと、前記2つの図形の頂点間の距離と前記測定図形のひっくり返りの有無を判断するための閾値とを比較して、前記測定図形のひっくり返りの有無を判断するステップと、前記平行移動値、前記回転角度および前記ひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と前記参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識するステップとを含む。
この時、回転角度を検出するステップは、前記参照図形に相応する複数の第1頂点それぞれに対して、前記測定図形に相応する複数の第2頂点までの距離を算出するステップと、前記距離のうち最小距離を前記回転角度ごとに算出し、前記回転角度ごとに算出された複数の最小距離の長さを合算した結果値のうち最小値に対応する角度を前記回転角度に決定するステップとを含むことができる。
この時、ひっくり返りの有無を判断するステップは、前記最小値が前記閾値を超える場合、前記測定図形がひっくり返ったと判断することができる。
この時、姿勢を認識するステップは、前記測定図形がひっくり返ったと判断される場合、前記姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識することができる。
この時、平行移動値を算出するステップは、測定対象が含まれた入力映像を2進化して、前記測定図形に相応する複数の第2頂点を検出するステップと、前記複数の第2頂点に対応する前記参照図形を抽出するステップと、前記複数の第2頂点に基づいて前記測定図形の重心を計算し、前記複数の第1頂点に基づいて前記参照図形の重心を計算するステップとを含むことができる。
この時、姿勢認識方法は、前記測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成するステップと、ディスプレイを介して前記ガイド情報を前記ユーザに出力するステップとをさらに含んでもよい。
この時、測定図形の姿勢は、実世界で前記ユーザによって制御される測定対象の姿勢であってもよい。
また、本発明の一実施形態に係る平面物体の姿勢認識装置は、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出し、前記平行移動値に基づいて前記2つの図形が重なるようにし、前記測定図形の回転角度ごとに算出される前記2つの図形の頂点間の距離に基づいて前記測定図形の回転角度を検出し、前記2つの図形の頂点間の距離と前記測定図形のひっくり返りの有無を判断するための閾値とを比較して、前記測定図形のひっくり返りの有無を判断し、前記平行移動値、前記回転角度および前記ひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と前記参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識するプロセッサと、前記参照図形に関する情報および前記閾値の少なくとも1つを格納するメモリとを含む。
この時、プロセッサは、前記参照図形に相応する複数の第1頂点それぞれに対して、前記測定図形に相応する複数の第2頂点までの距離を算出し、前記距離のうち最小距離を前記回転角度ごとに算出し、前記回転角度ごとに算出された複数の最小距離の長さを合算した結果値のうち最小値に対応する角度を前記回転角度に決定することができる。
この時、プロセッサは、前記最小値が前記閾値を超える場合、前記測定図形がひっくり返ったと判断することができる。
この時、プロセッサは、前記測定図形がひっくり返ったと判断される場合、前記姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識することができる。
この時、プロセッサは、測定対象が含まれた入力映像を2進化して、前記測定図形に相応する複数の第2頂点を検出し、前記複数の第2頂点に対応する前記参照図形を抽出し、前記複数の第2頂点に基づいて前記測定図形の重心を計算し、前記複数の第1頂点に基づいて前記参照図形の重心を計算することができる。
この時、プロセッサは、前記測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成し、ディスプレイを介して前記ガイド情報を前記ユーザに出力することができる。
この時、測定図形の姿勢は、実世界で前記ユーザによって制御される測定対象の姿勢であってもよい。
本発明によれば、平面図形に対する入力映像からその図形の正確な姿勢を計算して基準に対する位置と回転を知ることができる。
また、本発明は、対称性とひっくり返りが存在する環境においても効果的に平面図形の姿勢を推定することができる。
さらに、本発明は、検出された平面図形の姿勢を増強現実および人間とロボットとの間の相互作用の応用に活用する方法を提供することができる。
なお、本発明は、実世界の平面図形に仮想世界の情報およびコンテンツを増強することにより、物体自体の使用性を高める方法を提供することができる。
本発明の一実施形態に係る平面物体の姿勢認識方法を示す動作フローチャートである。 物体の移動や回転によるハウスドルフ距離の一例を示す図である。 物体の移動や回転によるハウスドルフ距離の一例を示す図である。 物体の移動や回転によるハウスドルフ距離の一例を示す図である。 物体の移動や回転によるハウスドルフ距離の一例を示す図である。 物体の移動や回転によるハウスドルフ距離の一例を示す図である。 本発明に係る参照図形の1つの頂点と測定図形の各頂点との間の距離を測定図形の回転角度ごとに表示したグラフの一例を示す図である。 図7に示されたグラフの距離のうち最小距離を表示したグラフの一例を示す図である。 本発明に係る参照図形の頂点に対して、図7に示されるような最小距離を表示したグラフの一例を示す図である。 図9に示された最小距離を、本発明に係るMMM演算およびMSM演算で演算した値を表示したグラフの一例を示す図である。 本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。 本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。 本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。 本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。 本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。 本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。 本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。 本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。 本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。 本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。 本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。 本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。 本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。 本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。 本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。 本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。 本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。 本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。 本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。 本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。 本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。 本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。 本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。 本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。 本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。 本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。 本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。 本発明により測定図形のひっくり返りを考慮した場合と、そうでない場合との整合誤差に関するMMM演算結果の一例を示す図である。 本発明に係る姿勢認識方法とこれをユーザの相互作用シナリオおよび増強現実装置と結合する構造の一例を示す図である。 本発明の一実施形態に係る姿勢認識方法を詳細に示す図である。 本発明の一実施形態に係る姿勢認識装置を示すブロック図である。
以下、本発明を添付した図面を参照して詳細に説明する。ここで、繰り返される説明、本発明の要旨を不必要にあいまいにしうる公知の機能および構成に関する詳細な説明は省略する。本発明の実施形態は、当業界における平均的な知識を有する者に本発明をより完全に説明するために提供されるものである。したがって、図面における要素の形状および大きさなどはより明確な説明のために誇張されることがある。
以下、本発明に係る好ましい実施形態を添付した図面を参照して詳細に説明する。
図1は、本発明の一実施形態に係る平面物体の姿勢認識方法を示す動作フローチャートである。
実世界の事物を撮影した映像からある平面図形の姿勢を認識するにあたり、平面図形が基準からどれくらい位置移動をしたか、またはどれくらい回転をしているかを検出することは非常に重要である。例えば、タングラムのような平面教具を仮想コンテンツと結合する場合、ユーザの現在の解を幾何学的に正確に測定することは、応用において決定的な情報となりうる。また、これに基づいて増強現実や人間とロボットとの間の相互作用の応用において適当な出力を与えると、インタラクティブなシナリオを作成することも可能になる。
平面図形の姿勢を計算することは幾何学的に単純に見えるにもかかわらず、一般的に最適化計算で解を求めることができる。しかし、このような方法は計算時間を多く要するので、インタラクティブな応用に適用するには好適でない。したがって、本発明では、平面図形の姿勢を効果的に計算する方法を提供しようとする。
まず、既存の最適化方法で平面図形の姿勢認識を実現する方式は、映像から図形を抽出し、基準図形と抽出された図形の姿勢を比較して位置と回転を計算した後、応用に活用するものであってもよい。すなわち、映像装置から平面図形の幾何学的表現を先に取得することができる。この時、平面図形の幾何学的表現とは、平面図形の輪郭線多角形(boundary polygon)に対する頂点と表現されるものを意味することができる。
このように取得された幾何学的情報を姿勢計算における基準となる参照図形の頂点と比較して平面図形の姿勢を計算するが、問題は、この過程で取得された平面図形の頂点と参照図形の頂点との対応関係が与えられていないという点である。例えば、参照図形Pの各頂点Piが平面図形Qのどの頂点に対応するかを知らないため、平面図形に対する回転計算が難しくなりうる。これを解決するための簡単な方法はすべての点との対応を考慮することであるが、これは、計算が極めて非効率的であるので、インタラクティブなシナリオを作成するのに好適でない。
一般的に対応関係が与えられていない時、2つの図形の幾何学的関係を表現するためにハウスドルフ距離(Hausdorff Distance、HD)を用いることができる。例えば、2つの図形PとQのハウスドルフ距離HD(P,Q)は、MAX(hd(P,Q),hd(Q,P))で定義される。すなわち、2つのhd値の最大値でHDが決定されるが、hdは、方向性が存在するハウスドルフ距離に相当する。つまり、hd(P,Q)は、図形Pの各点から図形Qまでの最小距離を求める時、その最小距離の最大値に相当できる。また、hd(Q,P)は逆に、図形Qの各点から図形Pまでの最小距離を求める時、その最小距離の最大値に相当できる。したがって、図形Pと図形Qの姿勢が完全に一致する場合、2つの図形間のハウスドルフ距離は0になる。
図2は、ハウスドルフ距離の一例を示すもので、図2に示された実線210、220のようにそれぞれの方向によるhdが計算され、このうち最大値がHDになる。
また、図3~図4のように、参照図形301と測定図形302の中心が一致した状況であれば、回転によってハウスドルフ距離が変化可能である。例えば、図3に示された場合のハウスドルフ距離310より、図4に示されるように多く回転した場合のハウスドルフ距離410の方がより大きく算出される。
したがって、ハウスドルフ距離が最小になる回転角度を探せるならば、参照図形301を基準とする測定図形302の相対的回転角度を獲得することができる。
また、上記で説明したように、ハウスドルフ距離は、2つの図形の各点間の最小距離の最大値で決定されるが、図5に示されるように、参照図形501と測定図形502が対称的な形態で平行移動のみある場合には、対称によって対応する頂点間の距離のうちいずれか1つだけを計算してハウスドルフ距離510、520を獲得することもできる。
しかし、図6に示されるように、測定図形502が平行移動と回転を同時に行った場合には、図3~図4に示されるような方式で測定図形502の回転角度を計算する過程を行う必要がある。
このようなハウスドルフ距離の計算は、ボロノイ図を用いて比較的効率的に計算することができるが、これを最適化過程に適用して回転角度を探すには効率的でない。まず、ハウスドルフ距離は、ユークリッド距離を計算する過程以外には最大値と最小値の比較で構成されているので、計算方式が手順的といえる。この時、最適化計算には微分可能な連続的な数式が役に立つのに対し、平面図形の姿勢に相応する回転角度を計算するためには、回転角度を引き続き変更しながらハウスドルフ距離を求める中間過程が必要であるので、計算過程が負担になりうる。例えば、Mathematica11.1でこれをテストすると、2つの三角形間のハウスドルフ距離を計算することは0.00013秒程度かかるが、これを回転しながら最適化計算を行う場合には1.36秒程度かかる。すなわち、インタラクティブ応用への適用が困難であることが分かる。
本発明では、次の過程により上記の問題を解決するための方法を提示しようとする。
まず、本発明の一実施形態に係る平面物体の姿勢認識方法は、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出する(S110)。
例えば、基準となる参照図形の重心から測定図形の重心が移動した値を2つの図形間の平行移動値として算出することができる。
この時、測定図形と参照図形は、同じ形態の平面図形であってもよい。すなわち、参照図形は、測定図形の姿勢を認識するために基準として用いられる図形に相当できる。
この時、測定対象が含まれた入力映像を2進化して、測定図形に相応する複数の第2頂点を検出し、複数の第2頂点に対応する参照図形を抽出することができる。
例えば、測定対象が入力された映像を2進化して、測定図形に相応する輪郭線多角形(boundary polygon)を検出し、これにより複数の第2頂点を検出することができる。この後、複数の第2頂点の位置を考慮して、これに相応する複数の第1頂点を有する参照図形を抽出することができる。
この時、複数の第1頂点や複数の第2頂点は、単純に測定図形と参照図形とを区分するために用いられたもので、その意味が限定されて適用されない。
この時、複数の第2頂点に基づいて測定図形の重心を計算し、参照図形に相応する複数の第1頂点に基づいて参照図形の重心を計算することができる。
また、本発明の一実施形態に係る平面物体の姿勢認識方法は、平行移動値に基づいて2つの図形が重なるようにし、測定図形の回転角度ごとに算出される2つの図形の頂点間の距離に基づいて測定図形の回転角度を検出する(S120)。
この時、参照図形に相応する複数の第1頂点それぞれに対して、測定図形に相応する複数の第2頂点までの距離を算出することができる。
まず、参照図形の姿勢を基準として測定図形をθだけ回転する演算を行うことができる。例えば、測定図形に相応する1つの第2頂点の座標が(tx,ty)と仮定する場合に、これをθだけ回転すると、数式1のように表すことができる。
[数式1]
{tx cos(θ)-ty sin(θ),tx sin(θ)+ty cos(θ)}
この後、参照図形に相応する1つの第1頂点である(rx,ry)から(tx,ty)までの距離の二乗であるd(r,t,θ)を計算すると、数式2のように表すことができる。
[数式2]
d(r,t,θ)=d((rx,ry),(tx,ty),θ)=
rx+ry+tx+ty+2sin(θ)(rx ty-ry tx)-2cos(θ)(rx tx+ry ty)
このような近似した距離の計算方法は、最適化過程で大きな計算効率を有することができる。
このような方式により、参照図形に相応する複数の第1頂点であるri=(rxi,ryi)に対して、測定図形に相応する複数の第2頂点であるti=(txi,tyi)との距離を計算して、数式3のようにこれらの最小値を表すことができる。
Figure 0007097285000001
この時、minは、関数d()の最小値を、jを変更させると探せるものを意味することができる。
この時、距離のうち最小距離を回転角度ごとに算出し、回転角度ごとに算出された複数の最小距離の長さを合算する結果値のうち最小値に対応する角度を回転角度に決定することができる。
もし、ハウスドルフ距離と類似の接近をすれば、参照図形の観点から、数式3の値を最大とするいずれか1つの第1頂点を探してその距離を測定する。例えば、下記数式4のようにiを変更させ、関数の最大値を抽出することができる。
Figure 0007097285000002
しかし、本発明では、この過程でmax演算を行う代わりに、sum演算を用いる数式5の方式を利用することができる。すなわち、回転角度ごとに算出された最小距離をすべて加算することができる。
Figure 0007097285000003
したがって、最終的に、本発明に係る姿勢認識方法を利用した最適化過程は、数式6のように表すことができる。すなわち、数式6によれば、()を最小化するθを測定図形の回転角度として検出することができる。
Figure 0007097285000004
この時、数式6における距離の測定は、Min-Sum-Minの過程を経るので、このような測定方式をMSM距離といえる。
また、数式7のように数式4の方法に基づいて計算する場合には、Min-Max-Minの過程を経るので、このような測定方式をMMM距離といえる。
Figure 0007097285000005
この時、MSM距離とMMM距離の計算時間は類似する方であるが、MMM距離は、maxに依存するので、MSM距離に比べてノイズにロバストでないことがある。反面、MSM距離は、最小距離をすべて加算した結果を提供するため、MMM距離に比べて値が大きいものの、全体的な傾向性の把握に有利でありうる。もし、特異な特徴の1つが回転角度を決定する場合であれば、MMM距離を用いることがさらに有利なこともある。
例えば、数式1~数式7をグラフで示すと、図7~図10のように示すことができる。この時、図7~図10は、測定図形が直角二等辺三角形の場合の値を示すものであってもよい。
まず、図7は、数式1~数式2に基づいて測定図形をθだけ回転させ、参照図形のいずれか1つの頂点であるrから測定図形の各頂点であるtまでの距離d(r,t,θ)を示すグラフであってもよい。すなわち、測定図形が直角二等辺三角形であるので、3つの頂点に対して回転角度ごとの距離を測定してグラフで示すことができる。
また、図8は、θを変化させる時、数式3に基づいてrからtまでの距離のうち最小距離だけを示すグラフに相応できる。すなわち、図7に示されたグラフの値のうち回転角度ごとに最小値だけを示すものであってもよい。
このような最小値を参照図形のすべての頂点ごとに検出して示すグラフが、図9に相応できる。すなわち、参照図形も、測定図形と同じく直角二等辺三角形であるので、3つのグラフ値として表現される。
また、図9に示されたMSM演算結果1010は、図8に示されたグラフ値を数式5に基づいて演算した結果を示すものであり、図9に示されたMMM演算結果1020は、図8に示されたグラフ値を数式4に基づいて演算した結果を示すものに相当できる。
この時、MSM演算結果1010やMMM演算結果1020による最小値1030に相応する回転角度が約1.6ラジアン(radian)であるので、測定図形の回転角度が1.6ラジアンであることが分かる。
この時、検出された測定図形の回転角度は、測定図形を検出された回転角度だけ逆に回転して参照図形と整合した場合に、その有効性を確認することができる。
また、本発明の一実施形態に係る平面物体の姿勢認識方法は、2つの図形の頂点間の距離と測定図形のひっくり返りの有無を判断するための閾値とを比較して、測定図形のひっくり返りの有無を判断する(S130)。
この時、図形のひっくり返り(flip)は、測定図形に対する正確な回転角度を計算するために考慮される。例えば、平行四辺形の場合には、図形がひっくり返っている場合のMSM演算結果と、図形がひっくり返っていない場合のMSM演算結果とが異なりうる。したがって、このように図形のひっくり返りを考慮しなければならない図形に対しては、これを判断するための閾値を事前に設定し、MSM演算結果と閾値とを比較してひっくり返りの有無を判断することができる。
この時、最小値が閾値を超える場合に、測定図形がひっくり返ったと判断することができる。
この時、測定図形のひっくり返りを判断する過程は、図32~図37により詳細に説明する。
また、本発明の一実施形態に係る平面物体の姿勢認識方法は、平行移動値、回転角度およびひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と参照図形とを比較した結果を考慮して、測定図形の姿勢を認識する(S140)。
この時、姿勢を補正した測定図形と参照図形とを比較した結果が一致する場合、検出された平行移動値、回転角度およびひっくり返りの有無に相応するように測定図形の姿勢を認識することができる。
この時、測定図形がひっくり返ったと判断される場合、姿勢をひっくり返した参照図形を基準として測定図形の最小値を再測定して回転角度を算出することができる。
また、測定図形がひっくり返ったと判断される場合、姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、測定図形の姿勢を認識することができる。
このように、本発明に係る単純な計算過程により効率的に平面図形の姿勢を計算しながら対称性とひっくり返りまでを考慮する手法は皆無といえる。本発明に係る姿勢認識方法の有効性は、幾何学的または解析学的証明により裏付けられる。
また、本発明に係る姿勢認識方法は非常に実用的である。例えば、我々の日常環境には教具、作業物体、インテリア、文書などといった非常に多い平面図形が存在するが、このような実世界の平面図形に仮想世界の情報やコンテンツを増強することにより、物体自体の使用性を高めることができる。すなわち、増強現実や人間とロボットとの間の相互作用のための応用装置に活用することもできる。
さらに、図1には示していないが、本発明の一実施形態に係る平面物体の姿勢認識方法は、測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成し、ディスプレイを介してガイド情報をユーザに出力することができる。
例えば、タングラムのような平面教具を用いた仮想コンテンツの場合、教具材を用いて作れる多様な形状に関するガイド情報を提供することができる。
この時、測定図形の姿勢は、実世界でユーザによって制御される測定対象の姿勢であってもよい。すなわち、ユーザが実世界で測定対象を動かした時の該当する姿勢をそのまま測定図形の姿勢として認識することができる。
また、図1には示していないが、本発明の一実施形態に係る平面物体の姿勢認識方法は、上述のように平面物体の姿勢認識過程で発生する多様な情報を格納する。
このような平面物体の姿勢認識方法により、平面図形に対する入力映像からその図形の正確な姿勢を計算して基準に対する位置と回転を知ることができる。
また、対称性とひっくり返りが存在する環境においても効果的に平面図形の姿勢を推定することができ、検出された平面図形の姿勢を増強現実および人間とロボットとの間の相互作用の応用に活用することができる。
図11~図18は、本発明に係る測定図形の回転を測定した結果と過程の一例を示す図である。
まず、図11~図12は、星状の参照図形1101と実世界で測定された測定図形1102との間の回転を測定した結果と過程を示す。
この時、図11に示されるように、回転している測定図形1102の回転を、本発明の一実施形態に係るMSM演算またはMMM演算で計算して回転角度を算出し、算出した回転角度を測定図形1102に逆に適用すると、図12に示されるように整合された映像を獲得することができ、この結果を応用に活用することができる。
この時、図13は、図11に示された参照図形1101を基準として測定図形1102の回転を計算する場合のMSM演算結果とMMM演算結果を示す。
この時、星状は、5つの対称的な形状が繰り返されるため、図13に示されるように、MSM演算またはMMM演算における最小値領域が周期的に繰り返されることが分かる。このように繰り返される条件を知っている状況では、最適化区間を1/5に縮小して計算を加速することもできる。
また、本発明に係る姿勢認識方法は、図12に示されるように、参照図形1101と測定図形1102の大きさが正確に一致しなくてもエラーなく計算することができる。
例えば、図14~図15に示されるように、参照図形1401と測定図形1402の大きさだけでなく、形状に差があるとしても、図16に示されるように、測定図形の回転角度を探すのには問題がない。
他の例として、図17のように、対称的な形状が繰り返される図形でない上に、参照図形と測定図形の大きさに差がある場合にも、本発明に係る姿勢認識方法により測定図形の回転角度を検出することができる。
さらに他の例として、図18のように、対称的な形状が繰り返される図形でない上に、参照図形と測定図形の形状が類似する場合にも、本発明に係る姿勢認識方法により測定図形の回転角度を検出することができる。
すなわち、本発明に係る平面図形の姿勢認識方法は、入力映像から測定図形を抽出する過程で発生しうるエラーによって測定図形が正確に抽出されなくても、これを勘案して測定図形の回転角度を検出することができる。
また、本発明は、PCA(Principal Component Analysis)のような方式で少なくとも2つの軸が確実で長めの長方形に対してのみ姿勢認識が可能であった従来の問題点を解決して、複雑な形状に対しても姿勢認識が可能な姿勢認識方法を提供することができる。
図19~図24は、本発明に係る姿勢認識方法によりlocal minimumのエラーを解決する過程の一例を示す図である。
まず、図19~図20を参照すれば、本発明に係る姿勢認識方法により直角二等辺三角形や正方形のように対称性がある平面図形に対する姿勢を認識する過程でlocal minimumに落ちるエラーを防止できることが分かる。
例えば、図19に示された直角二等辺三角形状の測定図形1902に対して、これに対する参照図形1901を基準としてMSM演算とMMM演算を行った結果は、図20の通りである。この時、図20を参照すれば、MMM演算結果の最小値が1.6ラジアン付近で発生するが、直角二等辺三角形の対称性によって3.8ラジアンと5.8ラジアン付近でも局所最小値が検出されることを確認することができる。このような結果は、測定図形の回転角度を算出するのにエラーを発生させることがある。
反面、図20に示されたMSM演算結果では、最小値がMMM演算結果と同様に1.6ラジアン付近で発生するが、3.8ラジアンと5.8ラジアン付近の値をMMM演算結果のような局所最小値と見なすことが困難である。すなわち、本発明によりMSM演算によって最小値を検出する場合、対称性がある測定図形から発生しうるlocal minimumのエラーを防止することができる。
また、図21~図24を参照すれば、本発明に係る姿勢認識方法は、対称性が存在する平面図形の姿勢を認識する時、計算効率を高めるために、回転角度の探索範囲を制限したり、splitして平行で計算することができる。
例えば、図21に示された正方形状の測定図形2102に対して、これに対する参照図形2101を基準としてMSM演算とMMM演算を行った結果は、図22の通りである。この時、図22を参照すれば、π/2ラジアンの周期で回転角度を検出できる最小値が繰り返されることが分かる。この場合、回転角度の探索範囲を2πラジアンより小さく設定することにより、測定図形の回転角度を検出するための計算の効率を向上させることができる。
他の例として、図23に示された平行四辺形状の測定図形2302に対して、これに対する参照図形2301を基準としてMSM演算とMMM演算を行った結果は、図24の通りである。この時、図24を参照すれば、πラジアンの周期で回転角度を検出できる最小値が繰り返されることが分かる。この場合にも、回転角度の探索範囲を2πラジアンより小さく設定することにより、計算の効率を向上させることができる。
図25~図31は、本発明に係る実物教具材を用いた姿勢認識過程の一例を示す図である。
図25~図31を参照すれば、本発明に係る姿勢認識方法は、実物を活用する増強現実の応用に活用するのに好適である。
この時、幾何および空間知覚能力の向上に役立つタングラム(tangram)は非常に簡単な実物教具材で、本発明に係る姿勢認識方法により増強現実の応用で実現することができる。
例えば、図25に示されるように、タングラムのための7つの実片2510、2520、2530、2540、2550、2560、2570に対する正確な姿勢を認識し、増強された映像として認識された片2511、2521、2531、2541、2551、2561、2571を出力することができる。
このような増強現実の応用を実現するためには、まず、図26に示されるように、実片2510、2520、2530、2540、2550、2560、2570が含まれた入力映像を分割してそれぞれの実片を分離することができる。
この後、図27に示されるように、分割された映像に基づいて2進化を行って実片2510、2520、2530、2540、2550、2560、2570に対する頂点を検出することができる。
この後、図25~図31に示していないが、実片2510、2520、2530、2540、2550、2560、2570の頂点に対応する参照図形を獲得し、重心方法で7つの実片2510、2520、2530、2540、2550、2560、2570それぞれに対する平行移動値を検出することができる。
この後、図28に示されるように、7つの実片2510、2520、2530、2540、2550、2560、2570それぞれに対してMSM演算とMMM演算を行って、7つの実片(2510、2520、2530、2540、2550、2560、2570それぞれに対する回転角度を検出することができる。
この後、検出された回転角度に基づいて7つの実片2510、2520、2530、2540、2550、2560、2570の姿勢を認識して、増強された映像として認識された片2511、2521、2531、2541、2551、2561、2571を出力することができる。
この過程により、最終的には、図29~図31のように、ユーザが移動させた実片2510、2520、2530、2540、2550、2560、2570の姿勢を評価し、これに関するガイドを出力するのに活用することができる。
図32~図37は、本発明に係る測定図形のひっくり返りを判断する過程の一例を示す図である。
図32~図37を参照すれば、本発明に係る姿勢認識方法では、測定図形のひっくり返り(flip)を考慮して、測定図形の正確な回転角度を検出することができる。
例えば、図32に示されるように測定図形3202と参照図形3201がひっくり返りの関係にある場合には、図33のように、本発明に係るMSM演算やMMM演算を行って測定図形3202の回転角度を検出することができる。しかし、このように検出された回転角度を測定図形3202に逆に適用して回転すると、図34に示されるように、参照図形3201と測定図形3402との間に整合誤差が大きく発生しうる。
また、図32のように2つの図形がひっくり返りの関係にある場合、図33に示されるように、MSM演算結果の最小値が一般的な場合より大きく現れることが分かる。
したがって、本発明に係る姿勢認識方法では、平行四辺形のようにflippingが発生しうる図形に対しては、最小値に対する閾値を事前に設定し、MSM演算により検出された最小値が閾値より大きく検出される場合には、測定図形がflippingされたと判断することができる。
この時、測定図形がひっくり返ったと判断される場合、図35に示されるように、ひっくり返った姿勢の参照図形3501を基準としてひっくり返った測定図形3502に対する回転角度を検出することができる。また、参照図形3501をひっくり返した姿勢で測定図形3502に対するMSM演算を行う場合、図36に示されるように、MSM演算の最小値が0に近い値で検出されることを確認することができる。
このように検出された回転角度を測定図形3502に逆に適用して回転すると、図37に示されるように、ひっくり返った姿勢の参照図形3501と、ひっくり返った測定図形3502との整合誤差が少なく発生するので、結論的には、測定図形3502の姿勢がひっくり返ったと確定することができる。
あるいは、本発明に係る姿勢認識方法では、ひっくり返りを考慮しなければならない測定図形に対する姿勢を認識する場合、入力映像から検出された測定図形の姿勢とひっくり返った姿勢に対していずれもMSM演算を行って、最小値が小さい方の姿勢の回転角度を測定図形の回転角度および姿勢として取ることもできる。
図38は、本発明により測定図形のひっくり返りを考慮した場合と、そうでない場合との整合誤差に関するMMM演算結果の一例を示す図である。
図38を参照すれば、本発明により測定図形のひっくり返りを考慮した場合(normal)の整合誤差をMMM演算した結果の最小値が、ひっくり返りを考慮しない場合(flipped)の整合誤差をMMM演算した結果の最小値より少なく検出されることを確認することができる。
すなわち、本発明のように、測定図形のひっくり返りを考慮して平面図形の姿勢を認識することにより、平面図形の姿勢をより正確に認識できることが分かる。
図39は、本発明に係る姿勢認識方法とこれをユーザの相互作用シナリオおよび増強現実装置と結合する構造の一例を示す図である。
図39を参照すれば、本発明の一実施形態に係る姿勢認識方法は、実世界に存在する事物に基づくユーザとの相互作用シナリオによって動作可能であり、この過程で増強現実装置と結合され、関連するコンテンツをユーザに提供することができる。
例えば、図39に示されるように、ユーザが実世界に存在する事物の位置と姿勢を変化させた後、当該事物を含む作業空間を撮影して入力映像を提供することができる。
この時、本発明の一実施形態に係る姿勢認識装置は、入力映像から姿勢を測定する対象の測定図形を抽出することができる。
この後、姿勢認識装置は、測定図形の頂点に基づいて参照図形を抽出することができ、参照図形に基づいて測定図形の平行移動値、回転角度およびひっくり返りの有無などを計算して測定図形の姿勢を獲得することができる。
このように獲得した測定図形の姿勢に関連する情報は増強現実装置に提供される。
この時、増強現実装置は、測定図形の姿勢を評価してユーザに提供されるガイド情報を生成することができ、別のディスプレイモジュールベースでユーザにガイド情報を出力することにより、ユーザとの相互作用を行うことができる。
このように、実世界での平面図形の姿勢を迅速で正確に認識することは、実世界と仮想世界とをつなぐ増強現実の応用および人間とロボットとの間の相互作用の応用において非常に重要な要素となりうる。したがって、本発明に係る平面図形の姿勢認識方法は、多様な物理的教具材を増強現実の応用に拡張する場合や、実際の事物に対する作業をめぐって人間とロボットが協業する状況で作業する物体の状態を把握して対応する問題に非常に有用に活用できる。
図40は、本発明の一実施形態に係る姿勢認識方法を詳細に示す図である。
図40を参照すれば、本発明の一実施形態に係る姿勢認識方法は、まず、測定対象を含む入力映像を獲得する(S4010)。
この後、入力映像に対して2進化を行って測定図形を検出する(S4020)。
この後、測定図形の頂点を算出して参照図形を検出する(S4030)。
例えば、測定対象が入力された映像を2進化して、測定図形に相応する輪郭線多角形(boundary polygon)を検出し、これにより測定図形に対する複数の第2頂点を検出することができる。この後、複数の第2頂点の位置を考慮して、これに相応する複数の第1頂点を有する参照図形を検出することができる。
この後、2つの図形の重心に基づいて測定図形の平行移動値を算出する(S4040)。
例えば、2つの図形の重心を結ぶベクトル値に相応するように平行移動値を算出することができる。
この後、平行移動値に基づいて2つの図形を重なるようにし、測定図形の回転角度ごとに算出される重なった2つの図形の頂点間の最小距離に基づいてMMM演算またはMSM演算を行って最小値を算出する(S4050)。
この後、測定図形のひっくり返りの有無を判断するために、ステップS4050で算出された最小値が予め設定された閾値を超えるか否かを判断し(S4055)、最小値が閾値を超える場合、測定図形がひっくり返ったと判断する(S4056)。
この時、測定図形がひっくり返ったと判断されると、参照図形の姿勢をひっくり返した状態でステップS4050を再び行って最小値を再算出することができる。
また、ステップS4055の判断結果、最小値が閾値を超えていなければ、最小値に相応する角度に相応するように測定図形の回転角度を算出する(S4060)。
この後、算出された平行移動値、回転角度およびひっくり返りの有無を考慮して、測定図形の姿勢を補正した後、補正された測定図形と参照図形とを比較して、測定図形の姿勢を認識する(S4070)。
この時、認識された測定図形の姿勢を評価してガイド情報が必要か否かを判断し(S4075)、ガイド情報が必要であれば、ガイド情報を生成してユーザに出力する(S4080)。
また、ステップS4075の判断結果、ガイド情報が必要でなければ、別途のガイド情報は出力せず増強された映像だけを生成して提供することもできる。
図41は、本発明の一実施形態に係る姿勢認識装置を示すブロック図である。
図41を参照すれば、本発明の一実施形態に係る姿勢認識装置は、通信部4110と、プロセッサ4120と、メモリ4130とを含む。
通信部4110は、平面図形の姿勢認識のために必要な情報を送受信する役割を果たすことができる。特に、本発明の一実施形態に係る通信部4110は、測定対象が含まれた入力映像を受信したり、ディスプレイを介してユーザにガイド情報を提供することもできる。
プロセッサ4120は、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出する。
例えば、基準となる参照図形の重心から測定図形の重心が移動した値を2つの図形間の平行移動値として算出することができる。
この時、測定図形と参照図形は、同じ形態の平面図形であってもよい。すなわち、参照図形は、測定図形の姿勢を認識するために基準として用いられる図形に相当できる。
この時、測定対象が含まれた入力映像を2進化して、測定図形に相応する複数の第2頂点を検出し、複数の第2頂点に対応する参照図形を抽出することができる。
例えば、測定対象が入力された映像を2進化して、測定図形に相応する輪郭線多角形(boundary polygon)を検出し、これにより複数の第2頂点を検出することができる。この後、複数の第2頂点の位置を考慮して、これに相応する複数の第1頂点を有する参照図形を抽出することができる。
この時、複数の第1頂点や複数の第2頂点は、単純に測定図形と参照図形とを区分するために用いられたもので、その意味が限定されて適用されない。
この時、複数の第2頂点に基づいて測定図形の重心を計算し、参照図形に相応する複数の第1頂点に基づいて参照図形の重心を計算することができる。
また、プロセッサ4120は、平行移動値に基づいて2つの図形が重なるようにし、測定図形の回転角度ごとに算出される2つの図形の頂点間の距離に基づいて測定図形の回転角度を検出する。
この時、参照図形に相応する複数の第1頂点それぞれに対して、測定図形に相応する複数の第2頂点までの距離を算出することができる。
まず、参照図形の姿勢を基準として測定図形をθだけ回転する演算を行うことができる。例えば、測定図形に相応する1つの第2頂点の座標が(tx,ty)と仮定する場合に、これをθだけ回転すると、数式1のように表すことができる。
[数式1]
{tx cos(θ)-ty sin(θ),tx sin(θ)+ty cos(θ)}
この後、参照図形に相応する1つの第1頂点である(rx,ry)から(tx,ty)までの距離の二乗であるd(r,t,θ)を計算すると、数式2のように表すことができる。
[数式2]
d(r,t,θ)=d((rx,ry),(tx,ty),θ)=
rx+ry+tx+ty+2sin(θ)(rx ty-ry tx)-2cos(θ)(rx tx+ry ty)
このような近似した距離の計算方法は、最適化過程で大きな計算効率を有することができる。
このような方式により、参照図形に相応する複数の第1頂点であるri=(rxi,ryi)に対して、測定図形に相応する複数の第2頂点であるti=(txi,tyi)との距離を計算して、数式3のようにこれらの最小値を表すことができる。
Figure 0007097285000006
この時、minは、関数d()の最小値を、jを変更させると探せるものを意味することができる。
この時、距離のうち最小距離を回転角度ごとに算出し、回転角度ごとに算出された複数の最小距離の長さを合算する結果値のうち最小値に対応する角度を回転角度に決定することができる。
もし、ハウスドルフ距離と類似の接近をすれば、参照図形の観点から、数式3の値を最大とするいずれか1つの第1頂点を探してその距離を測定する。例えば、下記数式4のようにiを変更させ、関数の最大値を抽出することができる。
Figure 0007097285000007
しかし、本発明では、この過程でmax演算を行う代わりに、sum演算を用いる数式5の方式を利用することができる。すなわち、回転角度ごとに算出された最小距離をすべて加算することができる。
Figure 0007097285000008
したがって、最終的に、本発明に係る姿勢認識方法を利用した最適化過程は、数式6のように表すことができる。すなわち、数式6によれば、()を最小化するθを測定図形の回転角度として検出することができる。
Figure 0007097285000009
この時、数式6における距離の測定は、Min-Sum-Minの過程を経るので、このような測定方式をMSM距離といえる。
また、数式7のように、数式4の方法に基づいて計算する場合には、Min-Max-Minの過程を経るので、このような測定方式をMMM距離といえる。
Figure 0007097285000010
この時、MSM距離とMMM距離の計算時間は類似する方であるが、MMM距離は、maxに依存するので、MSM距離に比べてノイズにロバストでないことがある。反面、MSM距離は、最小距離をすべて加算した結果を提供するため、MMM距離に比べて値が大きいものの、全体的な傾向性の把握に有利でありうる。もし、特異な特徴の1つが回転角度を決定する場合であれば、MMM距離を用いることがさらに有利なこともある。
また、プロセッサ4120は、2つの図形の頂点間の距離と測定図形のひっくり返りの有無を判断するための閾値とを比較して、測定図形のひっくり返りの有無を判断する。
この時、図形のひっくり返り(flip)は、測定図形に対する正確な回転角度を計算するために考慮される。例えば、平行四辺形の場合には、図形がひっくり返っている場合のMSM演算結果と、図形がひっくり返っていない場合のMSM演算結果とが異なりうる。したがって、このように、図形のひっくり返りを考慮しなければならない図形に対しては、これを判断するための閾値を事前に設定し、MSM演算結果と閾値とを比較して、ひっくり返りの有無を判断することができる。
この時、最小値が閾値を超える場合に、測定図形がひっくり返ったと判断することができる。
この時、測定図形のひっくり返りを判断する過程は、図32~図37により詳細に説明したので、省略する。
また、プロセッサ4120は、平行移動値、回転角度およびひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と参照図形とを比較した結果を考慮して、測定図形の姿勢を認識する。
この時、姿勢を補正した測定図形と参照図形とを比較した結果が一致する場合、検出された平行移動値、回転角度およびひっくり返りの有無に相応するように測定図形の姿勢を認識することができる。
この時、測定図形がひっくり返ったと判断される場合、姿勢をひっくり返した参照図形を基準として測定図形の最小値を再測定して回転角度を算出することができる。
また、測定図形がひっくり返ったと判断される場合、姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、測定図形の姿勢を認識することができる。
メモリ4130は、参照図形に関する情報および閾値の少なくとも1つを格納する。
この時、閾値は、ひっくり返りが発生しうる図形によって設定されて格納される。
また、メモリ4130は、上述のように、本発明の一実施形態に係る姿勢認識装置で発生する多様な情報を格納する。
実施形態により、メモリ4130は、姿勢認識装置と独立して構成され、平面図形の姿勢認識のための機能を支援することができる。この時、メモリ4130は、別途の大容量ストレージとして動作可能であり、動作実行のための制御機能を含むこともできる。
一方、姿勢認識装置は、メモリが搭載され、その装置内で情報を格納することができる。一実施形態の場合、メモリは、コンピュータで読取可能な媒体である。一実施形態において、メモリは、揮発性メモリユニットであってもよいし、他の実施形態の場合、メモリは、不揮発性メモリユニットであってもよい。一実施形態の場合、格納装置は、コンピュータで読取可能な媒体である。多様な互いに異なる実施形態において、格納装置は、例えば、ハードディスク装置、光学ディスク装置、あるいはある他の大容量格納装置を含むこともできる。
このような姿勢認識装置を用いることにより、平面図形に対する入力映像からその図形の正確な姿勢を計算して基準に対する位置と回転を知ることができる。
また、対称性とひっくり返りが存在する環境においても効果的に平面図形の姿勢を推定することができ、検出された平面図形の姿勢を増強現実および人間とロボットとの間の相互作用の応用に活用することができる。
以上、本発明に係る平面物体の姿勢認識方法およびそのための装置は、上記のように説明された実施形態の構成と方法が限定されて適用できるものではなく、上記の実施形態は多様な変形がなされるように各実施形態の全部または一部が選択的に組み合わされて構成されてもよい。
210、220:実線
310、410、510、520、610、620:ハウスドルフ距離
301、501、1101、1401、1901、2101、2301、3201、3401、3501、3701:参照図形
302、502、1102、1402、1902、2102、2302、3202、3402、3502、3702:測定図形
1010:MSM演算結果
1020:MMM演算結果
1030:最小値
2510、2520、2530、2540、2550、2560、2570:実片
2511、2521、2531、2541、2551、2561、2571:認識された片
4110:通信部
4120:プロセッサ
4130:メモリ

Claims (10)

  1. プロセッサが、測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出するステップと、
    前記プロセッサが、前記平行移動値に基づいて前記2つの図形が重なるようにし、前記測定図形の回転角度ごとに算出される前記2つの図形の頂点間の距離に基づいて前記測定図形の回転角度を検出するステップと、
    前記プロセッサが、前記2つの図形の頂点間の距離と前記測定図形のひっくり返りの有無を判断するための閾値とを比較して、前記測定図形のひっくり返りの有無を判断するステップと、
    前記プロセッサが、前記平行移動値、前記回転角度および前記ひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と前記参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識するステップとを含み、
    前記回転角度を検出するステップは、
    前記参照図形に相応する複数の第1頂点それぞれに対して、前記測定図形に相応する複数の第2頂点までの距離を算出するステップと、
    前記距離のうち最小距離を前記回転角度ごとに算出し、前記回転角度ごとに算出された複数の最小距離の長さを合算した結果値のうち最小値に対応する角度を前記回転角度に決定するステップとを含み、
    前記ひっくり返りの有無を判断するステップは、
    前記最小値が前記閾値を超える場合、前記測定図形がひっくり返ったと判断することを特徴とする平面物体の姿勢認識方法。
  2. 前記姿勢を認識するステップは、
    前記測定図形がひっくり返ったと判断される場合、前記姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識することを特徴とする請求項に記載の平面物体の姿勢認識方法。
  3. 前記平行移動値を算出するステップは、
    測定対象が含まれた入力映像を2進化して、前記測定図形に相応する複数の第2頂点を検出するステップと、
    前記複数の第2頂点に対応する前記参照図形を抽出するステップと、
    前記複数の第2頂点に基づいて前記測定図形の重心を計算し、前記複数の第1頂点に基づいて前記参照図形の重心を計算するステップとを含むことを特徴とする請求項に記載の平面物体の姿勢認識方法。
  4. 前記姿勢認識方法は、
    前記測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成するステップと、
    ディスプレイを介して前記ガイド情報を前記ユーザに出力するステップとをさらに含むことを特徴とする請求項1に記載の平面物体の姿勢認識方法。
  5. 前記測定図形の姿勢は、実世界で前記ユーザによって制御される測定対象の姿勢であることを特徴とする請求項に記載の平面物体の姿勢認識方法。
  6. 測定図形の重心と参照図形の重心に基づいて2つの図形間の平行移動値を算出し、前記平行移動値に基づいて前記2つの図形が重なるようにし、前記測定図形の回転角度ごとに算出される前記2つの図形の頂点間の距離に基づいて前記測定図形の回転角度を検出し、前記2つの図形の頂点間の距離と前記測定図形のひっくり返りの有無を判断するための閾値とを比較して、前記測定図形のひっくり返りの有無を判断し、前記平行移動値、前記回転角度および前記ひっくり返りの有無の少なくとも1つに基づいて姿勢を補正した測定図形と前記参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識するプロセッサと、
    前記参照図形に関する情報および前記閾値の少なくとも1つを格納するメモリとを含み、
    前記プロセッサは、
    前記参照図形に相応する複数の第1頂点それぞれに対して、前記測定図形に相応する複数の第2頂点までの距離を算出し、前記距離のうち最小距離を前記回転角度ごとに算出し、前記回転角度ごとに算出された複数の最小距離の長さを合算した結果値のうち最小値に対応する角度を前記回転角度に決定し、
    前記最小値が前記閾値を超える場合、前記測定図形がひっくり返ったと判断することを特徴とする平面物体の姿勢認識装置。
  7. 前記プロセッサは、
    前記測定図形がひっくり返ったと判断される場合、前記姿勢を補正した測定図形と姿勢をひっくり返した参照図形とを比較した結果を考慮して、前記測定図形の姿勢を認識することを特徴とする請求項に記載の平面物体の姿勢認識装置。
  8. 前記プロセッサは、
    測定対象が含まれた入力映像を2進化して、前記測定図形に相応する複数の第2頂点を検出し、前記複数の第2頂点に対応する前記参照図形を抽出し、前記複数の第2頂点に基づいて前記測定図形の重心を計算し、前記複数の第1頂点に基づいて前記参照図形の重心を計算することを特徴とする請求項に記載の平面物体の姿勢認識装置。
  9. 前記プロセッサは、
    前記測定図形の姿勢を評価してユーザに提供するためのガイド情報を生成し、ディスプレイを介して前記ガイド情報を前記ユーザに出力することを特徴とする請求項に記載の平面物体の姿勢認識装置。
  10. 前記測定図形の姿勢は、実世界で前記ユーザによって制御される測定対象の姿勢であることを特徴とする請求項に記載の平面物体の姿勢認識装置。
JP2018231071A 2017-12-11 2018-12-10 平面物体の姿勢認識方法およびそのための装置 Active JP7097285B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170169512A KR102056728B1 (ko) 2017-12-11 2017-12-11 평면 물체의 자세 인식 방법 및 이를 위한 장치
KR10-2017-0169512 2017-12-11

Publications (2)

Publication Number Publication Date
JP2019106184A JP2019106184A (ja) 2019-06-27
JP7097285B2 true JP7097285B2 (ja) 2022-07-07

Family

ID=67062468

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018231071A Active JP7097285B2 (ja) 2017-12-11 2018-12-10 平面物体の姿勢認識方法およびそのための装置

Country Status (2)

Country Link
JP (1) JP7097285B2 (ja)
KR (1) KR102056728B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052909B (zh) * 2020-09-17 2023-12-01 科大讯飞股份有限公司 图形匹配方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005107965A (ja) 2003-09-30 2005-04-21 Canon Inc 指標同定方法および装置
JP2008051664A (ja) 2006-08-24 2008-03-06 Daido Steel Co Ltd 羽根車の羽根形状検査方法及び検査装置
JP2015503778A (ja) 2011-12-24 2015-02-02 エコール ドゥ テクノロジー スペリウールEcole De Technologie Superieure ノイズに対して堅牢な画像レジストレーション方法およびシステム
US20160188938A1 (en) 2013-08-15 2016-06-30 Gideon Summerfield Image identification marker and method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101067826B1 (ko) 2009-10-27 2011-09-27 이화여자대학교 산학협력단 폴리곤 모델에 대한 하우스도르프 거리 산출 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005107965A (ja) 2003-09-30 2005-04-21 Canon Inc 指標同定方法および装置
JP2008051664A (ja) 2006-08-24 2008-03-06 Daido Steel Co Ltd 羽根車の羽根形状検査方法及び検査装置
JP2015503778A (ja) 2011-12-24 2015-02-02 エコール ドゥ テクノロジー スペリウールEcole De Technologie Superieure ノイズに対して堅牢な画像レジストレーション方法およびシステム
US20160188938A1 (en) 2013-08-15 2016-06-30 Gideon Summerfield Image identification marker and method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Xilin Yi et al.,"Line feature-based recognition using Hausdorff distance",Proceedings of International Symposium on Computer Vision - ISCV,米国,IEEE,1995年11月21日,pp.79-84
糠信 祐昌、外2名,"拡張ハウスドルフ距離法を用いたエッジ情報に基づく画像のマッチング",映像メディア処理シンポジウム 第4回シンポジウム資料,日本,電子情報通信学会画像工学研究専門委員会,1999年09月29日,pp.71-72

Also Published As

Publication number Publication date
KR102056728B1 (ko) 2019-12-17
KR20190069111A (ko) 2019-06-19
JP2019106184A (ja) 2019-06-27

Similar Documents

Publication Publication Date Title
Morrison et al. Closing the loop for robotic grasping: A real-time, generative grasp synthesis approach
Gualtieri et al. High precision grasp pose detection in dense clutter
Detry et al. Learning a dictionary of prototypical grasp-predicting parts from grasping experience
Saxena et al. Learning to grasp novel objects using vision
Herzog et al. Learning of grasp selection based on shape-templates
CN107571260B (zh) 控制机器人抓取物体的方法和装置
JP6126437B2 (ja) 画像処理装置および画像処理方法
Saxena et al. Robotic grasping of novel objects
Herzog et al. Template-based learning of grasp selection
Fischinger et al. Learning grasps for unknown objects in cluttered scenes
Kehoe et al. Cloud-based robot grasping with the google object recognition engine
US9089971B2 (en) Information processing apparatus, control method thereof and storage medium
JP4004899B2 (ja) 物品の位置姿勢検出装置及び物品取出し装置
JP2020532440A (ja) オブジェクトをロバストに把持し、ターゲティングするためのロボットシステムおよび方法
CN103984362B (zh) 位置和姿势测量装置、信息处理装置以及信息处理方法
Lévesque et al. A model-based scooping grasp for the autonomous picking of unknown objects with a two-fingered gripper
WO2015126443A1 (en) Moving object localization in 3d using a single camera
US20170140211A1 (en) Face comparison device, method, and recording medium
Adjigble et al. Model-free and learning-free grasping by local contact moment matching
Eizicovits et al. Efficient sensory-grounded grasp pose quality mapping for gripper design and online grasp planning
WO2020190166A1 (ru) Способ и система захвата объекта с помощью роботизированного устройства
Ala et al. A 3D-grasp synthesis algorithm to grasp unknown objects based on graspable boundary and convex segments
Ottenhaus et al. Visuo-haptic grasping of unknown objects based on gaussian process implicit surfaces and deep learning
JP2020197978A (ja) 物体検出装置、物体把持システム、物体検出方法及び物体検出プログラム
JP7097285B2 (ja) 平面物体の姿勢認識方法およびそのための装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220527

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220627

R150 Certificate of patent or registration of utility model

Ref document number: 7097285

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150