JP5812414B2 - 情報端末装置 - Google Patents

情報端末装置 Download PDF

Info

Publication number
JP5812414B2
JP5812414B2 JP2011258855A JP2011258855A JP5812414B2 JP 5812414 B2 JP5812414 B2 JP 5812414B2 JP 2011258855 A JP2011258855 A JP 2011258855A JP 2011258855 A JP2011258855 A JP 2011258855A JP 5812414 B2 JP5812414 B2 JP 5812414B2
Authority
JP
Japan
Prior art keywords
line segment
unit
line
line segments
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011258855A
Other languages
English (en)
Other versions
JP2013114380A (ja
Inventor
加藤 晴久
晴久 加藤
米山 暁夫
暁夫 米山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2011258855A priority Critical patent/JP5812414B2/ja
Publication of JP2013114380A publication Critical patent/JP2013114380A/ja
Application granted granted Critical
Publication of JP5812414B2 publication Critical patent/JP5812414B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)

Description

本発明は、表示部により情報を提示する情報端末装置に関し、特に、撮像部と撮像対象との相対的位置関係の変化によって表示部での表示情報を制御できる情報装置端末に関する。
撮像対象との相対的な位置関係に応じて情報を提示する装置は、提示する情報を直感的
に変化させることが可能であり、利用者の利便性を向上させることができる。このような装置を実現する技術として、以下のようなものが公開されている。
特許文献1では、物体の色に近似した色が付され、かつその外形および配置の組み合わせにより識別情報を構成する複数のマーカエレメントで構成されるマーカユニットを物体に配置し、該物体のカメラ映像を解析することによって、現実環境における物体に仮想情報を重畳表示する際の位置合わせを行う複合現実感システムが開示されている。
特許文献2では、位置姿勢センサが配置された現実空間の実写画像に、位置姿勢センサとカメラの計測範囲を重ね合わせた合成画像を生成する画像合成装置が開示されている。
特許文献3では、モーションセンサが検出した移動、傾動の方向および量に応じて、表示する情報をスクロールまたはズームするとともに、キー入力の所定キーを操作することによりスクロールまたはズームを停止する機能を有するポータブル機器が開示されている。
非特許文献1では、カメラで撮像した手の画像から曲率が大きな箇所を指先として検出し、楕円フィッティングの技術を利用して、検出された手の場所に位置合わせして情報を表示する手法が開示されている。
特開2009−020614号公報 特開2007−233971号公報 特開2009−003799号公報
T.Lee, et al., "Handy AR: Markerless Inspection of Augmented Reality Objects Using Fingertip Tracking," In Proc. IEEE International Symposium on Wearable Computers, pp.83-90, Oct. 2007.
特許文献1の複合現実感システムでは、カメラ画像におけるマーカユニットの位置により現実環境に重畳表示する仮想情報の位置が制御されるが、物体に予め人工的なマーカエレメントを配置しておく必要がある。このため、この複合現実感システムでの手法を利用できる場所が限定されるという課題がある。
特許文献2の画像合成装置では、位置姿勢センサを必要としている。また、特許文献3のポータブル機器では、モーションセンサを必要としている。このため、これらにおける手法を利用できる装置が限定されるという課題がある。また、センサ類の搭載は、端末のコスト上昇を招くだけでなく、装置の小型化や省電力化が困難になるという課題もある。
非特許文献1の手法では、特に曲率が大きな箇所を指先として検出するので、情報を正しく位置合わせして表示するには、指が丸く見えるくらいの近距離かつ高解像度画像を必要とする。また、処理負荷が大きい楕円フィッティングを用いて指先を検出するので、全ての指の指先を検出するとなると、処理時間がかかりすぎるという課題もある。
本発明の目的は、上記従来技術の課題を解決し、特別なマーカやセンサ等を用いることなく、撮像部に対して撮像対象の空間的位置や姿勢を変化させるだけで、表示部で表示する情報を確実かつ高精度に制御できる情報端末装置を提供することにある。
上記従来技術の課題を解決するため、本発明は、撮像部と、情報を表示する表示部と、前記表示部で表示する情報を記憶する記憶部とを備える情報端末装置において、前記撮像部で撮像した画像より撮像対象の前記撮像部に対する位置及び姿勢を推定する推定部と、前記記憶部から読み出して前記表示部で表示する情報を、前記推定された位置及び姿勢に応じて制御する制御部とを備え、前記推定部は、前記画像より前記撮像対象の複数の線分を抽出する線分抽出部と、前記抽出された複数の線分と、前記撮像対象の所定配置の画像において前記撮像対象に対して予め設定された複数の基準線分との平面射影変換の関係を求めて、該写像関係より前記位置及び姿勢を推定する姿勢推定部とを含むことを特徴とする。
本発明によれば、所定配置の撮像対象における基準線分の撮影画像における見え方に対応する平面射影変換の関係を求めて、撮像対象の位置及び姿勢を推定するので、特殊なセンサを用いることなく、また撮像対象にマーカ付与等の特別の設定を必要とすることなく、確実かつ高精度に推定を行うことができ、当該推定に基づいて表示部で表示する情報を制御することができる。
本発明の実施形態に係る情報端末装置の機能ブロック図である。 情報端末装置による表示情報の加工の例を説明するための図である。 推定部の詳細な機能ブロック図である。 指同士を閉じた手を撮像対象に、指同士の接する境界線を基準線分として設定する場合を説明する図である。 指同士を開いた手を撮像対象に、各指の中心線を基準線分として設定する場合を説明する図である。 姿勢推定部による推定と、当該推定結果を用いた表示情報の制御とを説明する図である。 線分特定に色特徴を用いる必要がある、対称な形状の例を示す図である。 線分検出部において、1つの基準線分に対して複数の候補線分を検討して、推定精度を上げる実施例を説明するための図である。 姿勢推定部において平面射影行列を求める際に、基準線分の端点を結んで新たに生成される線分をも含める実施例を説明するための図である。
以下、図面を参照して本発明を説明する。以下では、情報端末装置として携帯端末を利用し、撮像対象を手とした場合について説明する。しかし、本発明の情報端末装置は、携帯端末に限られるものではなく、撮像部を備えたものであればどのような情報端末装置でもよく、例えば、デスクトップ型、ラップトップ型又はその他のコンピュータなどでもよい。また、適宜説明するように、撮像対象も手に限られるものではない。
図1は、本発明の実施形態に係る情報端末装置の機能ブロック図である。情報端末装置1は、撮像部2、推定部3、制御部4、記憶部5及び表示部6を備える。撮像部2は、所定のサンプリング周期で撮像対象を連続的に撮像して、その撮影画像を推定部3及び必要に応じて制御部4へ出力する。撮像部2には、携帯端末に標準装備されるデジタルカメラを用いることができる。
推定部3には、撮像部2に対する撮像対象の位置および姿勢の変化の判断基準として、所定の位置および姿勢での撮像対象に対して基準線分が予め登録されている。推定部3は、撮像部2から入力される画像から基準線分に対応する線分を検出し、該線分と基準線分との対応を推定する。さらに、推定部3は、対応する線分と基準線線分とのそれぞれの座標位置から、予め設定された変換式に基づいて撮像部2に対する撮像対象の相対的位置および姿勢を表す変換係数を推定する。推定部3において変換係数の推定に用いられた変換式および推定された変換係数は、制御部4へ出力される。推定部3での処理の詳細は後述する。
記憶部5は、表示部6に表示する表示情報を予め複数蓄積している。利用者は、不図示のタッチパネル、ボタン又はキーボード等の入力部を介した制御部4に対する入力操作で、記憶部5に蓄積されている表示情報の中から任意の表示情報を選択して表示部6に表示させることができる。例えば表示情報として、複数の写真の画像データの中からいずれかを選択して、表示部6に表示させるようにすることができる。表示部6での情報表示の際、制御部4は、推定部3から入力された変換式および変換係数を表示情報に適用して表示情報を加工するように表示情報を制御する。
図2は、本発明の情報端末装置1による表示情報の加工の例を説明する図である。(A)には撮像部2がその位置を点として示され、撮像部2が撮影できるような位置に、撮像対象である手が配置されている。(A)において撮像対象としての手は、推定部3での判断基準となる所定の位置(例えば、手の重心が撮像部2から撮像面に垂直に20cm離れた位置など)および姿勢(例えば撮像部2に対して手のひらを真正面で向け且つ指を上方へ向けた姿勢など)にある。
(B)には表示部6で表示される表示情報の例が示され、表示情報P10は表示情報としてタイル状の画像を選択した場合であって、撮像対象の手が上記判断基準の所定位置及び姿勢にある際の例である。当該P10の状態から、手を(A)の矢印(1)に示すように、撮像部2へ近づけると、表示情報は(B)の矢印(10)に示すように連続的に拡大されて、その結果としてP11のように変化する。図中には示していないが、逆に手を撮像部2から遠ざけると表示情報は縮小される。
また同じく、当該P10の状態から、手をそれぞれ矢印(2)及び(3)の向きに回転させると、表示情報はそれぞれ矢印(20)及び(30)に示すように、手を回転させた向きと同じ向き(撮像部2からの奥行きが変化する向き)に連続的に回転されて、その結果としてそれぞれP12及びP13のように変化する。さらにまた、図中には示していないが、手の撮像部2に対する距離及び姿勢を変えずに動かして、その撮影画像が平行移動するようにすると、表示情報も同じ形状及び向きを保ったまま、手を動かしたのと同じ方向へと平行移動する。同様に図中には示していないが、(1)の方向に垂直な面内で手を回転させると、表示情報もその形状を保ったまま同じように回転する。
このように、本発明によれば手の位置及び姿勢に連動させて、表示情報があたかも手に乗っているかのように、表示情報を加工して変化させることができる。撮像対象が手ではなく何らかの物品であれば、当該物品を手で持つなどして撮像部2に対して動かすことで同様に、当該物品の位置及び姿勢に連動させて表示情報を加工して変化させることができる。この際、当該物品の特徴的部分が手などで隠されることなく、撮像部2に撮影されるようにして動かす。
なおまた、(C)に示すように、表示情報のみをP10のように表示する代わりに、P20に示すように、撮像対象である手の映像を重ねて、あるいはP30に示すように手の映像を別途所定枠内に表示するなどしてもよい。この場合、手が撮像部2の撮影画像の中から逸脱してしまっていないか確認しながら、ユーザは手を動かすことができるので、より確実に情報端末装置1を用いて表示情報を操ることができる。この場合、撮像部2の撮影画像(手以外を撮像対象としてもよい)が、推定部3のみでなく制御部4へも送られ、表示部6で表示されることとなる。
図3は、推定部3の詳細な機能ブロック図である。推定部3は、線分抽出部30、姿勢推定部34及び設定保存部35を含む。線分抽出部30は、線分検出部31、線分選別部32及び線分特定部33を含む。線分抽出部30は、撮影画像における撮像対象より、撮像対象を所定配置のもとで撮った画像において予め設定しておく複数の基準線分に対応する複数の線分を抽出する。図4及び図5に、このような撮像対象とその基準線分との設定例を示す。
図4は撮像対象として、握り込まずに指を伸ばしたうえで指同士が接するように閉じた状態の手を設定し、その複数の基準線分として、指同士が接する箇所に境界線として形成される線分を設定する例を示している。当該手は、右手の手の甲又は左手の手の平を示しているが、手の左右や、手の甲であるか手の平であるかの設定は任意に設定できる。図示するように、基準線分L1、L2、L3及びL4はそれぞれ、第一指と第二指との、第二指と第三指との、第三指と第四指との及び第四指と第五指との境界線としての線分である。
図5は撮像対象として、握り込まずに指を伸ばしたうえで指同士が互いに離れて開けるようにした状態の手を設定し、その複数の基準線分として、各指の中心線として形成される線分を設定する例を示している。図4と同様に、手の左右や手の平か手の甲かの設定は任意である。図示するように、基準線分L10、L20、L30、L40及びL50はそれぞれ、第一指、第二指、第三指、第四指及び第五指の中心線としての線分である。
なお、図4及び図5のような設定は、複数の設定を設定保存部35において登録しておくことができる。ユーザは登録されている設定のうちのいずれを利用するかをマニュアル入力で選択して、情報端末装置1を利用することができる。設定保存部35はまた、当該各設定において好ましい処理方式の情報も保存しており、線分抽出部30は当該処理方式に従って線分抽出を行う。
姿勢推定部34は、線分抽出部30の抽出した線分と、当該線分に対して図4及び図5のように予め所定配置で撮った画像において設定しておく基準線分との対応関係を求めて、当該対応関係より撮像対象の位置及び姿勢を推定する。図6は、当該推定と当該推定結果を用いた制御部4による表示部6の制御とを概念的に示す図である。図6では、図4の設定を採用した例が示されている。(A1)に示すように、撮像対象として採用した閉じた手が基準位置及び姿勢にある際の、基準線分として採用した各指の境界線の撮影画像上における配置が、予め設定保存部35に登録されている。
なお、当該登録は、ユーザが自身の手を撮像部2で撮影した画像に対して線分抽出部30で処理を行うことによって、ユーザによるマニュアル操作によって行うこともできる。また、撮像対象を、既知の形状及び抽出される基準線分を有する物品などとして、情報端末装置1の提供側で当該登録を行うこともできる。
(A2)は、当該設定された基準線分に対応する線分を、別配置を取る撮像対象の画像から線分抽出部30が抽出した例である。姿勢推定部34は、(A1)の複数の基準線分を(A2)の実際の画像から抽出された複数の線分に対応付ける写像関係として、図示するような写像Hを求める。当該写像Hについては後述するが、ある種の変換行列として求められ、(A2)における撮像対象の(A1)を基準とした位置及び姿勢を表現するものである。姿勢推定部34は、位置及び姿勢の推定結果として、当該写像Hの情報を制御部4へと渡す。
(B1)は、撮像対象が(A1)に示す基準配置(基準の位置及び姿勢)にある際の表示情報の例である。これに対して(B2)は、撮像対象が(A2)の位置及び姿勢になった際に、制御部4によって制御された表示情報の例である。制御部4は、一実施例では、図示するように写像Hをそのまま表示情報の座標変換に利用することで、表示情報を制御する。また別実施例として、写像Hの並進成分及び/又は回転成分に定数倍や閾値判定などの追加演算を施した写像H'による座標変換によって、表示情報を制御してもよい。
線分抽出部30は、撮像対象とその複数の基準線分に対する個別設定(例えば図4及び図5のような各個別設定)に応じた線分抽出処理を行うが、当該処理に共通の枠組みとして、線分抽出部30を構成する各部は次のような処理を行う。
線分検出部31は、撮影画像を解析して線分を検出する。しかし、当該検出される線分には一般に、基準線分に対応する線分以外の不要な線分も含まれている。そこで、線分選別部32は、当該検出された線分より、複数の基準線分と集合として対応する複数の線分を選別する。例えば、複数の基準線分が4本からなるものであれば、検出された線分のうちのこれら4本に集合として対応する複数の、すなわち4本の線分を選択する。しかし、当該選別された線分のいずれが基準線分のいずれに対応するかが不明である。そこで、線分特定部33は、当該選別された複数の線分の各々と前記複数の基準線分の各々との対応関係を特定して、その結果を姿勢推定部34に渡す。
図4の個別設定の場合、線分検出部31は撮影画像よりCanny等のエッジ検出を行い、検出されたエッジ群に対してノイズ除去及びエッジの拡張等の整形をする。線分検出部31は次に、整形されたエッジ領域に対してHough変換によってエッジ成分の座標を極座標系に変換し、同じ座標になった個数が多い極座標上の点を直交座標系の直線として検出する。線分検出部31は最後に、各直線においてその近傍の色特徴が肌色と認められる所定基準を満たす部分であり(第一条件)、且つ当該直線として抽出する元となったエッジ領域との近接度合いが所定基準を満たす部分(第二条件)を、線分として検出する。
ここで、第一条件により、検出された直線が手を通っている線分のみに限定され、第二条件により、図4のL1〜L4のような指の境界線部分の線分に限定される。
図5の個別設定の場合、線分検出部31は撮影画像より色特徴が肌色と認められる所定基準を満たす領域を抽出する。当該所定基準は予め学習によって構築しておいてもよい。線分検出部31は次に、抽出された領域のうち最も大きな領域を手の領域として検出する。ここで、撮影画像においては、手が大きく映っている又は手以外の背景等の部分に大きな肌色の領域がないこと、が前提である。線分検出部31は最後に、当該最大領域に細線化処理を施すことによって、線分を検出する。
線分選別部32では、検出された線分からの選別を行うために、まず、同一の基準線分に対してそれらの傾き及び位置が微差(所定基準を設けておく)に収まっている複数の線分が検出される場合があるので、第一選別として、当該複数の線分の中からランダムに1つの線分を、又は傾き及び位置が最も平均的な線分を選んで、その他を削除する。当該選別で基準線分の本数と同一になれば、それを選別結果としてよい。また、図4若しくは図5の場合又はその他の手を撮像対象とする場合に、第一選別を経てもなお、当該手の領域内で必要数以上の線分が検出されていることもあるので、線分選別部32はさらに、次のような条件(1)〜(4)のうち少なくとも1つを満たすものを選別してもよい。
(1)線分の長さに対する条件
例えば所定値よりも長い、又は一群の線分間の長さの比率が所定範囲に収まるなど
(2)線分の色分布に関する条件
例えば、線分の色が所定色に対して所定範囲内に収まるなど
(3)線分の近傍領域の色分布の単色性に対する条件
例えば、所定範囲として定まる近傍領域の色変化が所定閾値内に収まるなど
(4)線分同士の向き、角度関係に対する条件
例えば、一群の線分間の角度が所定範囲内に収まり、概ね平行とみなせるなど
なお、図4の個別設定の場合、上記(2)の所定色は指同士の境界線の色であり、上記(3)の近傍領域は当該境界線から離れて位置する指自体の色である。ここで通常、境界線の色の方が指自体の色よりも低輝度となる。よって(2)及び(3)を用いる場合さらに、各々の所定色条件に対して当該輝度の大小関係を課すようにしてもよい。
線分特定部33は、図4及び図5その他類似の設定の場合、基準線分の配置の偏りに基づいて対応関係を特定する。すなわち、手においては第一指が偏って配置されているので、図4の設定では基準線分L1が、図5の設定では基準線分L10が、最も端で且つ偏って配置される関係にある。当該関係は、手の姿勢及び位置を変化させても維持される。
図4及び図5等の設定では当該関係に着目した一例として、各線分の中心座標ciを求め、当該ciを除いた他線分(総数n−1本;図4ではn=4、図5ではn=5)の中心の平均座標との差が最大となるようなciに対応する線分を、第一指の関連する線分(図4ではL1に、図5ではL10に対応する撮影画像における線分)として判断する(式1)。
撮影画像においても線分間の相対的な位置関係は保持されるので、上記最大となるciから遠ざかる中点cjの順(ciとcjとの距離や、ciを通る垂線の横切る順などで判断可能)に、第二指、第三指、第四指、第五指に対応する線分が順次求められる。図4であればL1が判断された後、L2、L3、L4が順次求められ、図5であればL10が判断された後、L20、L30、L40、L50が順次求められる。
線分特定部33ではまた、一般の撮像対象であって基準配置において設定される複数の基準線分が対称な形状となるものについては、予め各基準線分の全体または一部に所定の区別可能な配色を設けておくことで、線分の特定を行うことができる。
例えば図7に示すように、(A)のような正六角形や(B)のような対称な星形といった対称な形状で基準線分が配置される場合、(A)においては各辺L21〜L26にそれぞれ異なる色特徴を設け、(B)においては各辺L31〜L35にそれぞれ異なる色特徴を設けておくことで、線分の特定が可能となる。
姿勢推定部34は、図7で概念的に説明した写像Hを具体的には次のように、Homography行列(平面射影変換行列)として求める。撮影画像から線分抽出部30で抽出された線分l'及び対応する基準線分lは、直線の係数としてそれぞれ次式(式2)及び(式3)で表現される。
ここで、Tは転置を表す。各線分上の座標x=(x, y, 1)との関係は次式(式4)及び(式5)で表現できる。
一般に、平面射影変換行列Hを使って、任意の座標xは座標x'に写像される。ただし、スケーリングには依存しないため、係数sを介して次式(式6)が成り立つ。
ここで、行列Hは下記(式7)の3×3行列で表される。係数は9個であるが、スケーリングの不定性のため自由度は8である。
(式6)を(式5)に代入すると、(式4)との関係から、以下の(式8)、そして(式9)が得られる。
ここで、(式9)においてベクトル及び行列の要素を書き表すと、以下(式10)のようになる。
よって、各行で展開すると、以下(式11)〜(式13)となる。
ここで、スケーリング係数sを除いて、以下(式14)及び(式15)とする。
これを、改めて行列表現に戻すと、以下(式16)となる。
表現を簡単にするため、(式16)において左辺の行列とベクトルとをそれぞれA,hで表せば、次式(式17)を解くこととなる。
ここで、右辺の0は要素が全て0で構成された2×1のベクトルである。上記(式17)は一組の線分(撮影画像から線分抽出部30で抽出された線分l'及び対応する基準線分l)の対応関係を表したものであるから、複数組の線分を同時に表す場合は、行列A及びベクトル0を拡張すればよい。
すなわち、n組の線分の対応関係を並べたとき(なお、1組の線分の対応関係が(式14)及び(式15))、行列Aは2n×9の行列、0は2n×1のベクトルで表される。なお、行列Hに対応するベクトルhはn組の対応関係においても9×1のベクトルで表される。
なおまた、複数の線分の係数が偏っている場合は、予め正規化しておくことが望ましい。線分l及びl'をそれぞれ行列N及びN'で正規化した線分L及びL'を(式18)及び(式19)のように求めておき、改めて線分l及びl'として扱う。
正規化した場合は、詳しくは以下の非特許文献2などに開示された、複数の直線の中心を原点に移動すると共に原点からの距離の平均をスケーリングする方法で、正規化後の直線L及びL'に対応する行列HLを算出した後、正規化後の直線に対応する行列Hlを次式(式20)で算出する。
(非特許文献2)H. Zeng, et al., ``A new normalized method on line-based homography estimation,'' Pattern Recognition Letters, Vol. 29, No. 9, pp.1236--1244, 2008.
さて、8自由度のhについて(式17)を解くにはn≧4組の線分を与える必要がある。なお、当該条件n≧4は、図4及び図5の設定において満たされている。当該与えられたn≧4組の線分に対して、(式17)左辺のノルムを最小化するhを求める[(式21)]。
ノルムを二乗和として最小化するとき、ATAの最小の固有値に対応する固有ベクトルがhとして求められる[(式22)]。
例えば、特異値分解によって解く場合は、行列Aを次式(式23)のように行列の積に分解することに相当する。
なお、Uは2n×2nの直交行列、Vは9×9の直交行列を表す。また、ΣはAの特異値σi(1≦i≦rank A)を降順に並べた2n×9の対角行列を表す。特異値σiは2n<9の場合はAAT、2n≧9の場合はATAの固有値λiの平方である。具体的に2n≧9の場合の手順は、まずATAの固有値を求め、特異値を算出する。次に、直交行列U及びVはその定義からUTU=I、VTV=Iであることを利用して(Iは単位行列)、次式(式24)が得られる。
よって、次式(式25)で示すように、Vの列ベクトルviはATAの固有値σi 2に対応する固有ベクトルとして求められる。
以上を基本実施例として、以下、本発明の追加的乃至補足的な各実施例を説明する。図8は、図4の設定の場合に、例えば第二指と第三指との間の境界線L2に対応する、線分検出部31で検出及び整形された、当該L2を抽出する元となったエッジ領域の例である。当該エッジ領域は理想的には、その後の線分検出部31の処理で1本の線分が検出されるような直線形状である。しかし、実際のところ、その一部は指の関節部がある程度突出している等のためにE1に示すように湾曲し、またその一部は指同士の間が密着せず隙間(図中、斜線付与して表記)を形成しているためにE2に示すように閉領域(当該斜線部を囲む閉領域)を形成していることがある。
このような場合、1つの境界線に対応するエッジ領域上の2点の選び方によって傾き及び/又は位置が様々にばらついた複数の直線(色特徴などで処理して線分とされる前の直線)を、線分検出部31で検出することとなる。前述の基本実施例においては、このように複数検出された線分は、次の線分選別部32の第一選別によって1本に絞り込まれた。
しかしながら、当該絞り込みが位置及び姿勢の推定において最適な線分を与えているとは限らない。そこで、追加実施例においては線分検出部31が、エッジ領域上から2点を通る所定数の直線を、上記1本に絞り込まれるべき候補直線として検出し、基本実施例にて説明した色特徴などに基づいて同複数の候補線分となす。
例えば、図8に示すように所定数として5個のエッジ上の点を、ランダムにP1〜P5として取ると、2点の組合せで5×4÷2=10本の候補直線を検出できる。しかし、P2とP5やP3とP4との組合せなどは、候補直線として不適切であるので、距離が近すぎる組合せは除外する。あるいは、所定数をランダムに選ぶ際、エッジ上で所定距離以上は離れるという制約を課して、例えば3個として、P1、P2及びP3や、P1、P5及びP4などを選び、3×2÷2=3本の候補直線を定めてもよい。
線分選別部32では、当該1つの境界線の箇所より複数検出された候補線分については絞り込みを行わず、続く線分特定部33及び姿勢推定部34においても、当該候補線分の各々の場合における基本実施例と同様の処理を行う。
最終的に候補線分の中から決定される線分は、上記(式1)〜(式25)で説明した推定処理をそれぞれの候補線分xiについて適用してそれぞれ行列Hを求めたうえで、次式(式26)の与える誤差ノルムを最小とするような行列Hに対応する候補線分xiである。最終的な位置及び姿勢推定は、当該最小ノルムの候補線分xiを適用して行われる。
例えば、図4の各基準線分L1〜L4に対応するエッジ領域において、L1のエッジ領域から3本、L2のエッジ領域から4本、L3及びL4ではエッジ領域が充分に直線的であったために共に1本の候補線分を検出したとすると、推定部3は上記(式26)を、候補線分xiの全ての組合せ3×4×1×1=12通りについて計算して、誤差が最小のものを求める。
なお、各基準線分に対応するエッジ領域において、当該追加実施例に係る候補線分を複数求めるか否かは、例えば次の事項を基準とすることができる。すなわち、当該エッジ領域が、図8のE1に示すように所定基準以上に湾曲している部分があり、及び/又は、E2に示すように閉領域を形成している部分があってその幅が所定基準以上であることを基準とする。
また、当該追加実施例においては、一旦、基本実施例を適用して線分抽出部30において各境界線に対応するエッジ領域がどれであるか、例えば境界線L2に対応するエッジ領域が、エッジ領域の全体のうちの図8で示すような領域であるといったようなことを、予め調べておいてから、以上のような各場合におけるノルム比較を行うものとする。
なおまた、当該追加実施例は図4の設定の場合を例に説明したが、図5の設定の場合も、細線化した線分が湾曲して得られることもありうるので、同様に適用することができる。
図9は、姿勢推定部34において位置及び姿勢の推定の精度を高める別実施形態を説明する図であり、ここでは図4の設定の場合を例として用いている。図示するように、基準線分L1、L2、L3及びL4は、それぞれ両端の点Q11及びQ12、Q21及びQ22、Q31及びQ32並びにQ41及びQ42を有する。
基本実施例では、基準線分L1〜L4とそれらの撮影画像中における検出線分(LL1〜LL4とする)との対応関係として、平面射影変換行列Hを求めた。しかし、基準線分自体として定義できなくとも、異なる基準線分の両端の点を結んで得られる所定の線分を新たに追加することで、姿勢及び位置の推定精度を上げることができる。そうした線分は、位置及び姿勢を基準線よりも顕著に反映することがあるためである。なお、線分の生成には両端ではなく、中点やその他の、基準線分上の所定割合の長さの位置の点を採用してもよい。
例えば、図9に示すように、新たに定義される線分Q12−Q42及び線分Q22−Q32を追加して、当初の基準線分L1〜L4と当該新規の2線分の6本の線分群を、拡張された基準線分として定義する。撮影画像においては基準線分L1〜L4に対応する線分LL1〜LL4を基本実施例と同様に線分抽出部30が抽出する。姿勢推定部34は、当該線分LL1〜LL4につき、対応する端点を結んで線分Q12−Q42及び線分Q22−Q32に対応する2本の線分を新たに追加し、同じく合計6本の拡張された線分群としたうえで、当該拡張された線分群同士の間で基本実施例と同様の方式によって平面射影変換行列Hを求める。
なお、線分Q12−Q42及び線分Q22−Q32に対応する2本の線分を求めるに際して、線分LL1〜LL4の各々につき、いずれの頂点が基準線分におけるいずれの頂点であるかの識別を行う必要がある。当該識別には、(式1)と同様に偏りに注目した手法を採用すればよい。例えば、L1の中点からL2の中点に向かうベクトルの向きが、手首へ至る向きよりも指先へと至る向きに近いという偏りの情報より、識別が可能となる。
1…情報端末装置、2…撮像部、3…推定部、4…制御部、5…記憶部、6…表示部

Claims (10)

  1. 撮像部と、
    情報を表示する表示部と、
    前記表示部で表示する情報を記憶する記憶部とを備える情報端末装置において、
    前記撮像部で撮像した画像より撮像対象の前記撮像部に対する位置及び姿勢を推定する推定部と、
    前記記憶部から読み出して前記表示部で表示する情報を、前記推定された位置及び姿勢に応じて制御する制御部とを備え、
    前記推定部は、
    前記画像より前記撮像対象の複数の線分を抽出する線分抽出部と、
    前記抽出された複数の線分と、前記撮像対象の所定配置の画像において前記撮像対象に対して予め設定された複数の基準線分との平面射影変換の関係を求めて、該関係より前記位置及び姿勢を推定する姿勢推定部とを含み、
    前記線分抽出部は、さらに、
    前記画像より線分を検出する線分検出部と、当該検出された線分から前記複数の基準線分に集合として対応する複数の線分を選別する線分選別部と、当該選別された複数の線分の各々と前記複数の基準線分の各々との対応関係を特定する線分特定部とを含み、
    当該線分検出部、線分選別部及び線分特定部がそれぞれ、前記撮像対象及びその複数の基準線分に対する個別設定に応じた処理を行うよう構成されていることを特徴とする情報端末装置。
  2. 前記姿勢推定部が、前記複数の基準線分を表現する係数を前記抽出された複数の線分を表現する係数に変換する平面射影変換の関係のうち、当該平面射影変換による変換の後の前記複数の基準線分を表現する係数と前記抽出された複数の線分を表現する係数との誤差を最小とするものを求めることを特徴とする請求項1に記載の情報端末装置。
  3. 前記姿勢推定部が前記求める関係として、前記複数の基準線分に対してさらに当該線分のうち所定の異なる線分の端点同士を結んで生成される線分を追加した線分群と、前記抽出された複数の線分に対してさらに前記所定の異なる線分の端点に対応する端点同士を結んで生成される線分を追加した線分群と、の関係を求めることを特徴とする請求項1または2のいずれかに記載の情報端末装置。
  4. 前記撮像対象に設定される対象及びその複数の基準線分に指同士を閉じた手及び指同士の接する境界線が含まれ、当該設定された場合に、
    前記線分検出部は前記画像よりエッジを検出し、当該検出されたエッジ領域より直線を検出してから、各直線においてその近傍の色特徴が所定基準を満たし、且つ当該直線を前記検出する元となったエッジ領域との近接度合いが所定基準を満たす部分を線分として検出することを特徴とする請求項1ないし3のいずれかに記載の情報端末装置。
  5. 前記線分抽出部は、一旦、前記線分特定部において対応関係を特定することで、前記線分検出部において検出されたエッジ領域を各基準線分に対応する領域に分けた後、
    前記線分検出部は、前記分けられたエッジ領域が所定基準で湾曲する部分を含み、又は所定基準の幅を有する閉領域を形成する部分を含む場合に、当該エッジ領域の2点を通る所定数の直線を候補直線として検出し、その各々につき前記近傍の色特徴及び近接度合いの各基準を満たす部分を候補線分として検出し、
    前記姿勢推定部は、前記候補線分の各々の場合における前記関係を求めて、当該関係における誤差が最小の場合によって前記位置および姿勢を推定することを特徴とする請求項に記載の情報端末装置。
  6. 前記撮像対象に設定される対象及びその複数の基準線分に指同士を開いた手及び各指の中心線が含まれ、当該設定された場合に、
    前記線分検出部は前記画像のうち色特徴が所定基準を満たす領域のうちの最大領域を抽出してから、該最大領域に細線化処理を施すことで線分を検出することを特徴とする請求項1ないし5のいずれかに記載の情報端末装置。
  7. 前記線分選別部が、当該検出された線分から前記複数の基準線分に集合として対応する複数の線分を選別するのに際して、当該線分の長さ、当該線分の色分布、当該線分の近傍の色分布及び当該線分同士の角度関係のうちの少なくとも1つを基準として用いることを特徴とする請求項1ないし6のいずれかに記載の情報端末装置。
  8. 前記線分特定部が、線分同士の配置の偏りに基づいて前記対応関係を特定することを特徴とする請求項1ないし7のいずれかに記載の情報端末装置。
  9. 前記線分特定部が、最も偏って配置される線分の特定と、その他の線分に対する当該特定された線分からの離れ度合いの順位付けとによって、前記対応関係を特定することを特徴とする請求項に記載の情報端末装置。
  10. 前記線分特定部が、前記撮像対象における複数の基準線分の各々の所与の色特徴に基づいて前記対応関係を特定することを特徴とする請求項1ないし9のいずれかに記載の情報端末装置。
JP2011258855A 2011-11-28 2011-11-28 情報端末装置 Expired - Fee Related JP5812414B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011258855A JP5812414B2 (ja) 2011-11-28 2011-11-28 情報端末装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011258855A JP5812414B2 (ja) 2011-11-28 2011-11-28 情報端末装置

Publications (2)

Publication Number Publication Date
JP2013114380A JP2013114380A (ja) 2013-06-10
JP5812414B2 true JP5812414B2 (ja) 2015-11-11

Family

ID=48709891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011258855A Expired - Fee Related JP5812414B2 (ja) 2011-11-28 2011-11-28 情報端末装置

Country Status (1)

Country Link
JP (1) JP5812414B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4712487B2 (ja) * 2005-08-25 2011-06-29 株式会社リコー 画像処理方法及び装置、デジタルカメラ装置、並びに画像処理プログラムを記録した記録媒体
JP5321417B2 (ja) * 2009-11-10 2013-10-23 株式会社Jvcケンウッド 透視変換パラメータ生成装置、画像補正装置、透視変換パラメータ生成方法、画像補正方法、及びプログラム
JP5464661B2 (ja) * 2010-03-12 2014-04-09 Kddi株式会社 情報端末装置

Also Published As

Publication number Publication date
JP2013114380A (ja) 2013-06-10

Similar Documents

Publication Publication Date Title
US10963041B2 (en) Gesture recognition using multi-sensory data
KR101865655B1 (ko) 증강현실 상호 작용 서비스 제공 장치 및 방법
Chua et al. Model-based 3D hand posture estimation from a single 2D image
JP6464934B2 (ja) カメラ姿勢推定装置、カメラ姿勢推定方法およびカメラ姿勢推定プログラム
JP7094702B2 (ja) 画像処理装置及びその方法、プログラム
Wang et al. Superpixel-based hand gesture recognition with kinect depth camera
EP3136203B1 (en) System and method of real-time interactive operation of user interface
Nai et al. Fast hand posture classification using depth features extracted from random line segments
WO2022002133A1 (zh) 手势追踪方法及装置
Caputo et al. 3D Hand Gesture Recognition Based on Sensor Fusion of Commodity Hardware.
Ilonen et al. Three-dimensional object reconstruction of symmetric objects by fusing visual and tactile sensing
CN110147767A (zh) 基于二维图像的三维手势姿态预测方法
JP5534432B2 (ja) 情報端末装置
Wang et al. A new hand gesture recognition algorithm based on joint color-depth superpixel earth mover's distance
Zou et al. Automatic reconstruction of 3D human motion pose from uncalibrated monocular video sequences based on markerless human motion tracking
JP5863034B2 (ja) 情報端末装置
Davis et al. Toward 3-D gesture recognition
JP6086474B2 (ja) 情報端末装置
JP5464661B2 (ja) 情報端末装置
JP5812414B2 (ja) 情報端末装置
Jeong et al. Prototype of learning tool with augmented reality and natural hand interaction using depth sensing camera
KR20050060606A (ko) 휴먼 컴퓨터 인터렉션 장치 및 방법
Yoshimoto et al. Cooperative Gesture Recognition-Learning Characteristics of Classifiers and Navigating the User to an Ideal Situation
Choi et al. Twenty-one degrees of freedom model based hand pose tracking using a monocular RGB camera
Rao et al. Vision based pointing error estimation for mobile eye-tracking system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150909

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150910

R150 Certificate of patent or registration of utility model

Ref document number: 5812414

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees