JP6079102B2 - 被写体検出装置、被写体検出方法及びプログラム - Google Patents
被写体検出装置、被写体検出方法及びプログラム Download PDFInfo
- Publication number
- JP6079102B2 JP6079102B2 JP2012216635A JP2012216635A JP6079102B2 JP 6079102 B2 JP6079102 B2 JP 6079102B2 JP 2012216635 A JP2012216635 A JP 2012216635A JP 2012216635 A JP2012216635 A JP 2012216635A JP 6079102 B2 JP6079102 B2 JP 6079102B2
- Authority
- JP
- Japan
- Prior art keywords
- posture
- unit
- respect
- candidate
- specific subject
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
この画像処理装置では、撮像されたフレーム画像の画像解析の結果に基づいて、フレーム画像におけるマーカーの画像の傾き(例えば、表示画面内における正視状態からの回転角度等)を検出して、当該マーカーの画像の傾きを初期値として記録しておく。また、画像処理装置は、逐次撮像されるフレーム画像におけるマーカーの傾きと初期値として記録されている傾きとの相対的な差分、具体的には、座標値の差分を算出する。そして、画像処理装置は、算出された座標値の差分から、所定のベクトルに沿うように仮想オブジェクトの画像を傾けて逐次表示させる処理を行う。
図1は、本発明を適用した実施形態1の携帯端末100の概略構成を示すブロック図である。
図1に示すように、本実施形態の携帯端末100は、中央制御部1と、メモリ2と、撮像部3と、撮像制御部4と、画像データ生成部5と、マーカー検出処理部6と、表示部7と、表示制御部8と、送受話部9と、通信制御部10と、操作入力部11等を備えている。
なお、携帯端末100は、例えば、通信機能を具備する撮像装置や、携帯電話やPHS(Personal Handy-phone System)などの移動体通信網で用いられる移動局、PDA(Personal Data Assistants)等から構成されている。
ここで、特定の被写体とは、二次元画像であっても良いし、3次元形状の立体であっても良い。例えば、特定の被写体を二次元画像とした場合には、一辺12mmの正方形をなす略枠状(額縁状)のマーカーM等が挙げられる(図3参照)。
なお、上記したマーカーMの形状、寸法は、一例であってこれに限られるものではなく、適宜任意に変更可能である。
レンズ部3aは、ズームレンズやフォーカスレンズ等の複数のレンズから構成されている。
電子撮像部3bは、例えば、CCD(Charge Coupled Device)やCMOS(Complementary Metal-oxide Semiconductor)等のイメージセンサから構成され、レンズ部3aの各種レンズを通過した光学像を二次元の画像信号に変換する。
なお、図示は省略するが、撮像部3は、レンズ部3aを通過する光の量を調整する絞りを備えていても良い。
また、撮像制御部4は、AF(自動合焦処理)、AE(自動露出処理)、AWB(自動ホワイトバランス)等の被写体の撮像条件の調整制御を行う。
また、画像データ生成部5は、生成したフレーム画像FのYUVデータを水平及び垂直ともに所定倍率で縮小処理を行って、ライブビュー表示用の低解像度(例えば、VGAやQVGAサイズ等)の画像データを生成する。具体的には、画像データ生成部5は、表示部7によるライブビュー画像の所定の表示フレームレートに応じた所定のタイミングで、フレーム画像FのYUVデータからライブビュー表示用の低解像度の画像データを生成する。
なお、マーカー検出処理部6の各部は、例えば、所定のロジック回路から構成されているが、当該構成は一例であってこれに限られるものではない。
即ち、仮姿勢指定部(指定手段)6aは、予め撮像部3を具備する端末本体に対するマーカー(特定の被写体)Mの仮の姿勢を指定する。具体的には、例えば、ユーザによる操作入力部11の所定操作に基づいて、二次元画像であるマーカーMの当該二次元平面に対する法線方向(即ち、図3中、マーカー座標系におけるZ軸の向き等)の向き(例えば、上下左右の何れか一の向き)が入力されると、仮姿勢指定部6aは、入力されたマーカーMの二次元平面に対する法線方向の向きを、端末本体に対するマーカーMの仮の姿勢として指定する。
なお、仮の姿勢の指定方法は、一例であってこれに限られるものではなく、適宜任意に変更可能である。例えば、仮の姿勢は、予めデフォルトとして設定されているものが自動的に指定される構成であっても良い。
即ち、画像取得部(取得手段)6bは、マーカー(特定の被写体)Mが連続して撮像された複数の画像を逐次取得する。具体的には、画像取得部6bは、撮像部3によりマーカーMが連続して撮像されて画像データ生成部5により逐次生成された複数のフレーム画像F、…の所定の解像度の画像データ(例えば、輝度データ)をメモリ2から逐次取得する。
即ち、座標検出部(検出手段)6cは、画像取得部6bにより取得されたフレーム画像Fに含まれるマーカー画像領域Sを構成する複数の点(例えば、4隅の点等)の座標を検出する。具体的には、座標検出部6cは、画像取得部6bにより取得されたフレーム画像Fに対して所定の二値化処理が施されることで生成された二値化画像の画像データに対して所定の特徴抽出処理を行って、略枠状のマーカー画像領域Sを抽出する。そして、座標検出部6cは、マーカー画像領域Sを構成する4隅の位置座標を検出する。
なお、特徴抽出処理は、公知の技術であるので、ここでは詳細な説明を省略する。
ここで、マーカー画像領域Sの複数の点の座標変換には、例えば、比較的精度の高い中心射影モデルを用いても良いし、中心射影モデルに比べて精度の低い擬似中心射影モデル(図4(a)参照)を用いても良い。例えば、擬似中心射影モデルでは、携帯端末100から所定の距離以上離れると、当該端末本体に対する前後方向(奥行き方向)の狭い範囲にて平行投影とみなされ、図4(a)中の点1、2は何れも画像の点aに投影されてしまう。
ここで、バンドル調整とは、画像から幾何学的なモデルのパラメータを高い推定精度の達成を目指して推定する手法であり、例えば、未知のパラメータの再投影誤差の合計を最小化するような手法等が用いられる。
また、端末本体に対するマーカーMの姿勢を表す行列Rは、具体的には、n行m列の行列(n、mは、それぞれ自然数)で表され、例えば、3×3の回転行列等が挙げられる。また、端末本体に対するマーカーMの位置関係を表す行列Tは、具体的には、n行m列の行列(n、mは、それぞれ自然数)で表され、例えば、1×3の並進ベクトル等が挙げられる。
また、式(1)中の「C」は、撮像部3の焦点距離等の内部パラメータを表し、「h」は、フレーム画像Fのスケールを表している。
具体的には、第2推定部d2は、判定部6eによって第1姿勢候補が正しくないと判定された場合に(詳細後述)、端末本体に対するマーカーMの第2姿勢候補を推定する。つまり、判定部6eによって第1姿勢候補が正しくないと判定された場合には、当該第1姿勢候補はバンドル調整により推定された局所解であると考えられるので、第1姿勢候補推定部6dは、第2推定部d2によって端末本体に対するマーカーMの姿勢候補(第2姿勢候補)を再度推定する。
例えば、第2推定部d2は、端末本体の所定位置(例えば、光軸が通る端末本体中心)とマーカーMの中心とを通る軸(中心軸)とマーカーMの二次元平面の法線ベクトルとの外積を算出する。そして、第2推定部d2は、仮姿勢指定部6aにより指定されたマーカーMの仮の姿勢(例えば、下向き;図4(b)中、破線L2で表すマーカーMの向き)と反対(例えば、上向き;図4(b)中、実線L1で表すマーカーMの向き)となるように、算出された外積を軸として第1姿勢候補である行列Rを回転させて、第2初期値を算出する。その後、第2推定部d2は、算出された第2初期値を端末本体に対するマーカーMの姿勢を表す行列Rの初期値として式(1)の座標変換式を解くことで、端末本体に対するマーカーMの姿勢及び位置関係を表す行列R、Tを推定し、推定された行列Rを端末本体に対するマーカーMの第2姿勢候補として特定する。
なお、第2姿勢候補の推定方法は、一例であってこれに限られるものではなく、適宜任意に変更可能である。例えば、第2推定部d2は、上記第1推定部d1と同様に、マーカー画像領域Sの4隅の点の座標から擬似中心射影モデルを利用することで、座標変換式(例えば、式(1)参照)の初期値として第1初期値とは異なる第2初期値を算出し、当該第2初期値を用いて端末本体に対するマーカーMの姿勢を表す行列R(第2姿勢候補)をバンドル調整により推定しても良い。
即ち、判定部(判定手段)6eは、第1推定部d1により推定された第1姿勢候補が正しいか否かを所定の判定基準に従って判定する。具体的には、判定部6eは、仮姿勢指定部6aによって指定されたマーカーMの仮の姿勢に基づいて、端末本体に対するマーカーMの第1姿勢候補が正しいか否かを判定する。
例えば、端末本体に対するマーカーMの第1姿勢候補を表す行列Rが3×3の回転行列で表されている場合、1列目の各要素r11、r21、r31は、端末本体の座標系におけるマーカー座標系のX軸の向きを表し、2列目の各要素r12、r22、r32は、端末本体の座標系におけるマーカー座標系のY軸の向きを表し、3列目の各要素r13、r23、r33は、端末本体の座標系におけるマーカー座標系のZ軸の向きを表す。ここで、例えば、仮姿勢指定部6aにより予めマーカーMの二次元平面に対する法線方向の向きが上向きと指定されている場合、判定部6eは、端末本体に対するマーカーMの第1姿勢候補を表す行列Rの所定の要素(例えば、2行目、3列目の要素r23)の符号を確認することで第1姿勢候補と仮の姿勢が一致するか否かを判定する。即ち、マーカーMの法線方向は、マーカー座標系のZ軸の向きと一致しているため、判定部6eは、3×3の回転行列のマーカー座標系のZ軸の向きを表す3列目の各要素のうち、端末本体の座標系のY軸に対応する要素r23の符号を確認することによって、マーカーMの法線方向が端末本体の座標系のY軸の正の方向を向いているか否かを判定することができる。
具体的には、例えば、判定部6eは、第1姿勢特定部6f(後述)により最適解として逐次特定される端末本体に対するマーカーMの姿勢の変化の態様に基づいて、第1姿勢候補が正しいか否かを判定するようにしても良い。例えば、フレーム画像Fが所定の撮像フレームレート(例えば、60fps等)で撮像されて取得される場合に、所定時間内に取得された複数のフレーム画像F、…に対応する第1姿勢候補の所定の要素に基づいてマーカーMの姿勢が所定の向き(例えば、上向き)である割合を算出し、その割合が所定値以上となった場合に、第1姿勢候補が正しいと判定するようにしても良い。また、例えば、判定部6eは、前回特定された第1姿勢候補の所定の要素と比較して、今回特定された第1姿勢候補の所定の要素が一致するか否かに応じて第1姿勢候補が正しいか否かを判定するようにしても良い。
この場合には、携帯端末100は、必ずしも仮姿勢指定部6aを具備する必要はない。
即ち、第1姿勢特定部(特定手段)6fは、第1姿勢候補推定部6dにより推定された少なくとも一の姿勢候補のうちの何れか一を端末本体に対するマーカーMの姿勢の最適解として特定する。具体的には、第1姿勢特定部6fは、第1姿勢候補及び第2姿勢候補のうち、一方を最適解として特定する。
例えば、第1姿勢特定部6fは、判定部6eによって第1姿勢候補が正しいと判定された場合に、当該第1姿勢候補を最適解として特定する一方で、第1姿勢候補が正しくないと判定された場合に、第2推定部d2により推定された第2姿勢候補を最適解として特定する。
つまり、判定部6eにより第1姿勢候補が正しいと判定された場合には、第1姿勢候補推定部6dにより一の姿勢候補(第1姿勢候補)のみが推定された状態であり、第1姿勢特定部6fは、当該第1姿勢候補を端末本体に対するマーカーMの姿勢を表す行列Rとして特定する。これに対して、判定部6eにより第1姿勢候補が正しくないと判定された場合には、第1姿勢候補推定部6dの第2推定部d2により改めて第2姿勢候補が推定され、第1姿勢特定部6fは、当該第2姿勢候補を端末本体に対するマーカーMの姿勢を表す行列Rとして特定する。
具体的には、例えば、フレーム画像Fが逐次取得される毎に、画像生成部6gは、第1姿勢特定部6fにより最適解として特定された端末本体に対するマーカーMの姿勢及び位置関係に基づいて、フレーム画像F内でのマーカー画像の姿勢(向き)や位置を調整し、当該マーカー画像と対応する仮想オブジェクトを所定の記録手段から取得して仮想画像の画像データを生成する。そして、画像生成部6gは、生成された各仮想画像の画像データをメモリ2に順次出力し、当該メモリ2に格納させる。
なお、画像生成部6gにより生成された仮想画像の画像データは、例えば、所定の圧縮形式(例えば、JPEG形式等)で符号化され、不揮発性メモリ(フラッシュメモリ)等の記録媒体(図示略)に記録されても良い。
具体的には、表示制御部8は、VRAM(Video Random Access Memory)、VRAMコントローラ、デジタルビデオエンコーダなどを備えている。そして、デジタルビデオエンコーダは、中央制御部1の制御下にてメモリ2から読み出されてVRAM(図示略)に記憶されている輝度信号Y及び色差信号Cb,Crを、VRAMコントローラを介してVRAMから所定の再生フレームレート(例えば、30fps)で読み出して、これらのデータを元にビデオ信号を発生して表示部7に出力する。
例えば、表示制御部8は、撮像部3及び撮像制御部4により撮像され画像データ生成部5により生成された複数のフレーム画像F、…を所定の表示フレームレートで逐次更新しながら表示部7にライブビュー表示させる。また、表示制御部8は、例えば、メモリ2から仮想画像の画像データを逐次取得して、当該仮想画像を表示部7に逐次ライブビュー表示させる。
具体的には、送受話部9は、マイク9a、スピーカ9b、データ変換部9c等を備えている。そして、送受話部9は、マイク9aから入力されるユーザの送話音声をデータ変換部9cによりA/D変換処理して送話音声データを中央制御部1に出力するとともに、中央制御部1の制御下にて、通信制御部10から出力されて入力される受話音声データ等の音声データをデータ変換部9cによりD/A変換処理してスピーカ9bから出力する。
即ち、通信アンテナ10aは、当該携帯端末100が無線基地局(図示略)との通信で採用している所定の通信方式(例えば、W−CDMA(Wideband Code Division Multiple Access)方式、GSM(Global System for Mobile Communications;登録商標)方式等)に対応したデータの送受信が可能なアンテナである。そして、通信制御部10は、所定の通信方式に対応する通信プロトコルに従って、この通信方式で設定される通信チャネルにより無線基地局との間で通信アンテナ10aを介してデータの送受信を行う。
即ち、通信制御部10は、中央制御部1から出力されて入力される指示信号に基づいて、通信相手の外部機器に対して、当該外部機器の外部ユーザとの通話中の音声の送受信や、電子メールのデータの送受信を行う。
なお、通信制御部10の構成は一例であってこれに限られるものではなく、適宜任意に変更可能であり、例えば、図示は省略するが、無線LANモジュールを搭載し、アクセスポイント(Access Point)を介して通信ネットワークNにアクセス可能な構成としても良い。
具体的には、操作入力部11は、被写体の撮影指示に係るシャッタボタン、モードや機能等の選択指示に係る上下左右のカーソルボタンや決定ボタン、電話の発着信や電子メールの送受信等の実行指示に係る通信関連ボタン、テキストの入力指示に係る数字ボタンや記号ボタン等の各種ボタン(何れも図示略)を備えている。
そして、ユーザにより各種ボタンが操作されると、操作入力部11は、操作されたボタンに応じた操作指示を中央制御部1に出力する。中央制御部1は、操作入力部11から出力され入力された操作指示に従って所定の動作(例えば、被写体の撮像、電話の発着信、電子メールの送受信等)を各部に実行させる。
図2は、マーカー検出処理に係る動作の一例を示すフローチャートである。
なお、以下のマーカー検出処理にて検出されるマーカーMは、例えば、鉢植えの観葉植物の鉢内の所定位置に配設されているものとする。
その後、撮像制御部4は、撮像部3にマーカーMを撮像させ、画像データ生成部5は、電子撮像部3bから転送された複数のフレーム画像F、…の画像データを生成する(ステップS2)。ここで、例えば、レンズ部の焦点距離を40mm(35mm判換算)として、一辺12mmの正方形をなす略枠状のマーカーMを40cm程度離れた場所から撮像すると、VGAサイズのフレーム画像Fでマーカー画像領域Sの一辺が50画素程度となる。このような状況では、後述するマーカー画像領域Sの4隅の点の座標の検出誤差が生じ易くなる。
そして、画像データ生成部5は、生成された各フレーム画像FのYUVデータをメモリ2に順次出力し、当該メモリ2に格納させる。
そして、画像生成部6gは、最適解として特定された端末本体に対するマーカーMの姿勢(第1姿勢候補)及び位置関係に基づいてフレーム画像F内でのマーカー画像の姿勢や位置を調整し、当該フレーム画像F中にマーカー画像と対応する仮想オブジェクトを重畳させた仮想画像の画像データを生成する。そして、表示制御部8は、当該仮想画像を表示部7にライブビュー表示させる(ステップS9)。
その後、中央制御部1のCPUは、処理をステップS3に戻す。
続けて、第2推定部d2は、算出された第2初期値を用いて式(1)の座標変換式を解くことで、端末本体に対するマーカーMの姿勢及び位置関係を表す行列R、Tをバンドル調整により推定し、推定された行列Rを端末本体に対するマーカーMの第2姿勢候補として特定する(ステップS11)。
即ち、ステップS9にて、画像生成部6gは、最適解として特定された端末本体に対するマーカーMの姿勢(第2姿勢候補)及び位置関係に基づいてフレーム画像F内でのマーカー画像の姿勢や位置を調整し、当該フレーム画像F中にマーカー画像と対応する仮想オブジェクトを重畳させた仮想画像の画像データを生成する。そして、表示制御部8は、当該仮想画像を表示部7にライブビュー表示させる。
即ち、例えば、携帯端末100の撮像部3からマーカーMまでの距離が相対的に遠い場合には、平行投影とみなされてマーカー画像領域Sを構成する複数の点の検出誤差が生じ易くなる。また、日差しの強い環境や暗闇などではマーカー画像領域Sの特定を適正に行うことができず、結果として、マーカー画像領域Sを構成する複数の点の検出誤差が生じ易くなる。また、撮像フレームレートが相対的に高い場合などでもマーカー画像領域Sを構成する複数の点の検出結果の信頼性が低下してしまう。このような環境では、マーカー画像領域Sの複数の点の座標から中心射影モデルを用いて撮像部3に対するマーカーMの姿勢を推定しても、局所解が算出され易くなってしまう。
そこで、本実施形態では、撮像部3に対するマーカーMの姿勢の最適解を一つ直接推定するのではなく、局所解を含む可能性があるものの、予め撮像部3に対するマーカーMの姿勢候補を推定しておき、姿勢候補の中から撮像部3に対するマーカーMの姿勢の最適解を特定するようにすることで、最終的に撮像部3に対するマーカーMの姿勢の局所解が特定されてしまうことを抑制することができる。
これにより、撮像部3に対するマーカーMの姿勢の推定を適正に行うことができることとなり、結果として、マーカーMに対応する仮想オブジェクトの表示を適正に行うことができる。
具体的には、例えば、マーカー画像領域Sの複数の点の座標から擬似中心射影モデルを用いて撮像部3に対するマーカーMの姿勢を推定する場合、マーカーMの二次元平面に対する法線方向の向きが異なる複数の姿勢候補を推定することができる。このとき、第1姿勢候補が正しいと判定された場合には、当該第1姿勢候補を最適解として特定することができ、第1姿勢候補が正しくないと判定された場合には、第1姿勢候補の推定結果を考慮して当該第1姿勢候補と異なる第2姿勢候補を推定して、当該第2姿勢候補を最適解として特定することができる。
以下に、実施形態2の携帯端末200について説明する。
実施形態2の携帯端末200は、以下に詳細に説明する以外の点で上記実施形態1の携帯端末100と略同様の構成をなし、詳細な説明は省略する。
図5に示すように、実施形態2の携帯端末200のマーカー検出処理部206は、仮姿勢指定部6aと、画像取得部6bと、座標検出部6cと、第2姿勢候補推定部206dと、第2姿勢特定部206fと、画像生成部6gとを具備している。
なお、仮姿勢指定部6a、画像取得部6b、座標検出部6c、画像生成部6gは、実施形態1の携帯端末100に備わるものと略同様の構成及び処理をなし、ここでは詳細な説明は省略する。
即ち、第2姿勢候補推定部206dは、座標検出部6cにより検出された複数の点の座標に基づいて、端末本体に対するマーカーMの姿勢候補を複数推定する。具体的には、第2姿勢候補推定部206dは、所定の記録手段に記録されているデータベース(図示略)等を参照し、マーカー画像領域Sの4隅の点の位置座標から擬似中心射影モデルを利用して、マーカーMの各点の三次元空間での座標とフレーム画像F内の二次元の平面座標との対応関係を規定する座標変換式(例えば、式(1))の初期値を複数算出する。つまり、第2姿勢候補推定部206dは、端末本体に対するマーカーMの姿勢を表す行列Rの初期値を姿勢候補として複数推定する。
具体的には、第2姿勢特定部206fは、第2姿勢候補推定部206dにより推定された複数の姿勢候補のうち、仮姿勢指定部6aによって指定された仮の姿勢と略一致するものを最適解として特定する。例えば、仮姿勢指定部6aにより予めマーカーMの二次元平面に対する法線方向の向きが上向きと指定されている場合、第2姿勢特定部206fは、端末本体に対するマーカーMの各姿勢候補(初期値)を表す行列Rの所定の要素(例えば、2行目、3列目の要素r23)の符号を確認することで仮の姿勢と一致するか否かを判定する。そして、第2姿勢特定部206fは、仮の姿勢と略一致する姿勢候補を特定して、座標変換式(例えば、式(1))の最終的な初期値とする。
その後、第2姿勢特定部206fは、特定された最終的な初期値を用いて式(1)の座標変換式を解くことで、端末本体に対するマーカーMの姿勢及び位置関係を表す行列R、Tをバンドル調整により推定し、推定された行列Rを端末本体に対するマーカーMの姿勢の最適解として特定する。
具体的には、例えば、第2姿勢特定部206fは、最適解として端末本体に対するマーカーMの姿勢を逐次特定していき、当該姿勢の変化の態様に基づいて端末本体に対するマーカーMの姿勢の最適解を再度特定するようにしても良い。例えば、フレーム画像Fが所定の撮像フレームレート(例えば、60fps等)で撮像されて取得される場合に、所定時間内に取得された複数のフレーム画像F、…に対応する姿勢の所定の要素に基づいてマーカーMの姿勢が所定の向き(例えば、上向き)である割合を算出し、その割合が所定値以上となった場合に、端末本体に対するマーカーMの姿勢が正しい(最適解である)と判定するようにしても良い。また、例えば、第2姿勢特定部206fは、前回最適解として特定された端末本体に対するマーカーMの姿勢の所定の要素と比較して、今回特定された端末本体に対するマーカーMの姿勢の所定の要素が一致するか否かに応じて端末本体に対するマーカーMの姿勢が正しいか否かを判定するようにしても良い。
この場合には、携帯端末200は、必ずしも仮姿勢指定部6aを具備する必要はない。
図6は、マーカー検出処理に係る動作の一例を示すフローチャートである。
なお、携帯端末200によるマーカー検出処理は、以下に詳細に説明する以外の点で上記実施形態1の携帯端末100によるマーカー検出処理と略同様であり、詳細な説明は省略する。
即ち、ステップS1にて、仮姿勢指定部6aは、端末本体に対するマーカーMの仮の姿勢を指定し、ステップS2にて、画像データ生成部5は、電子撮像部3bから転送された複数のフレーム画像F、…の画像データを生成する。また、ステップS3にて、画像取得部6bは、画像データ生成部5により逐次生成された何れか一のフレーム画像Fの画像データを取得し、ステップS4にて、座標検出部6cは、フレーム画像Fからマーカー画像領域Sを抽出し、マーカー画像領域Sを構成する4隅の点の位置座標を検出する。
続けて、第2姿勢特定部206fは、特定された最終的な初期値を用いて下記式(1)の座標変換式を解くことで、端末本体に対するマーカーMの姿勢及び位置関係を表す行列R、Tをバンドル調整により推定する。そして、第2姿勢特定部206fは、推定された行列Rを端末本体に対するマーカーMの姿勢の最適解として特定する。
その後、中央制御部1のCPUは、処理をステップS3に戻す。
特に、予め複数の姿勢候補を推定しておくことで、これら複数の姿勢候補の中から最適解を選択により特定することができ、撮像部3に対するマーカーMの姿勢の最適解の特定を簡便に行うことができる。
例えば、所定の座標変換式を解くことで端末本体(撮像部3)に対するマーカーMの姿勢を表す行列Rを特定するようにしたが、端末本体に対するマーカーMの姿勢の一例であって一例であってこれに限られるものではなく、適宜任意に変更可能である。
また、座標変換式を解くことで端末本体に対するマーカーMの位置関係を表す行列Tを特定するようにしたが、必ずしも当該端末本体に対するマーカーMの位置関係を特定する必要はない。
即ち、プログラムを記憶するプログラムメモリに、取得処理ルーチン、検出処理ルーチン、候補推定処理ルーチン、特定処理ルーチンを含むプログラムを記憶しておく。そして、取得処理ルーチンにより中央制御部1のCPUを、撮像部3により撮像された特定の被写体を含む画像を逐次取得する手段として機能させるようにしても良い。また、検出処理ルーチンにより中央制御部1のCPUを、取得された画像における特定の被写体の画像領域を構成する複数の点の座標を検出する手段として機能させるようにしても良い。また、候補推定処理ルーチンにより中央制御部1のCPUを、検出された複数の点の座標に基づいて、撮像部3に対する特定の被写体の姿勢候補を少なくとも一つ推定する手段として機能させるようにしても良い。また、特定処理ルーチンにより中央制御部1のCPUを、推定された姿勢候補のうちの何れか一を撮像部3に対する特定の被写体の姿勢の最適解として特定する手段として機能させるようにしても良い。
本発明のいくつかの実施形態を説明したが、本発明の範囲は、上述の実施の形態に限定するものではなく、特許請求の範囲に記載された発明の範囲とその均等の範囲を含む。
以下に、この出願の願書に最初に添付した特許請求の範囲に記載した発明を付記する。付記に記載した請求項の項番は、この出願の願書に最初に添付した特許請求の範囲の通りである。
<請求項1>
撮像部により撮像された特定の被写体を含む画像を逐次取得する取得手段と、
前記取得手段により取得された画像における前記特定の被写体の画像領域を構成する複数の点の座標を検出する検出手段と、
前記検出手段により検出された前記複数の点の座標に基づいて、前記撮像部に対する前記特定の被写体の姿勢候補を少なくとも一つ推定する候補推定手段と、
前記候補推定手段により推定された前記姿勢候補のうちの何れか一を前記撮像部に対する前記特定の被写体の姿勢の最適解として特定する特定手段と、
を備えたことを特徴とする被写体検出装置。
<請求項2>
前記候補推定手段は、
前記検出手段により検出された前記複数の点の座標に基づいて、前記撮像部に対する前記特定の被写体の第1姿勢候補を推定する第1推定手段と、
前記第1推定手段による推定結果に基づいて、前記撮像部に対する前記特定の被写体の前記第1姿勢候補と異なる第2姿勢候補を推定する第2推定手段と、を備え、
前記特定手段は、
前記第1姿勢候補及び前記第2姿勢候補のうち、一方を前記最適解として特定することを特徴とする請求項1に記載の被写体検出装置。
<請求項3>
前記第1推定手段により推定された前記第1姿勢候補が正しいか否かを所定の判定基準に従って判定する判定手段を更に備え、
前記第2推定手段は、前記判定手段によって前記第1姿勢候補が正しくないと判定された場合に、前記第2姿勢候補を推定することを特徴とする請求項2に記載の被写体検出装置。
<請求項4>
前記特定手段は、
前記判定手段によって前記第1姿勢候補が正しいと判定された場合に、当該第1姿勢候補を前記最適解として特定する一方で、前記第1姿勢候補が正しくないと判定された場合に、前記第2推定手段により推定された前記第2姿勢候補を前記最適解として特定することを特徴とする請求項3に記載の被写体検出装置。
<請求項5>
予め前記撮像部に対する前記特定の被写体の仮の姿勢を指定する指定手段を更に備え、
前記判定手段は、前記指定手段によって指定された仮の姿勢に基づいて、前記第1姿勢候補が正しいか否かを判定することを特徴とする請求項3又は4に記載の被写体検出装置。
<請求項6>
前記判定手段は、前記特定手段により前記最適解として逐次特定される前記撮像部に対する前記特定の被写体の姿勢の変化の態様に基づいて、前記第1姿勢候補が正しいか否かを判定することを特徴とする請求項3又は4に記載の被写体検出装置。
<請求項7>
予め前記撮像部に対する前記特定の被写体の仮の姿勢を指定する指定手段を更に備え、
前記特定手段は、前記候補推定手段により推定された複数の前記姿勢候補のうち、前記指定手段によって指定された仮の姿勢と略一致するものを前記最適解として特定することを特徴とする請求項1に記載の被写体検出装置。
<請求項8>
前記特定手段は、前記最適解として前記撮像部に対する前記特定の被写体の姿勢を逐次特定するとともに、当該姿勢の変化の態様に基づいて前記最適解を再度特定することを特徴とする請求項1に記載の被写体検出装置。
<請求項9>
前記特定の被写体は、マーカーであることを特徴とする請求項1〜8の何れか一項に記載の被写体検出装置。
<請求項10>
被写体検出装置を用いた被写体検出方法であって、
撮像部により撮像された特定の被写体を含む画像を逐次取得する処理と、
取得された画像における前記特定の被写体の画像領域を構成する複数の点の座標を検出する処理と、
検出された前記複数の点の座標に基づいて、前記撮像部に対する前記特定の被写体の姿勢候補を少なくとも一つ推定する処理と、
推定された前記姿勢候補のうちの何れか一を前記撮像部に対する前記特定の被写体の姿勢の最適解として特定する処理と、
を含むことを特徴とする被写体検出方法。
<請求項11>
被写体検出装置のコンピュータを、
撮像部により撮像された特定の被写体を含む画像を逐次取得する取得手段、
前記取得手段により取得された画像における前記特定の被写体の画像領域を構成する複数の点の座標を検出する検出手段、
前記検出手段により検出された前記複数の点の座標に基づいて、前記撮像部に対する前記特定の被写体の姿勢候補を少なくとも一つ推定する候補推定手段、
前記候補推定手段により推定された前記姿勢候補のうちの何れか一を前記撮像部に対する前記特定の被写体の姿勢の最適解として特定する特定手段、
として機能させることを特徴とするプログラム。
1 中央制御部
3 撮像部
6、206 マーカー検出処理部
6a 仮姿勢指定部
6b 画像取得部
6c 座標検出部
6d 第1姿勢候補推定部
d1 第1推定部
d2 第2推定部
206d 第2姿勢候補推定部
6e 判定部
6f 第1姿勢特定部
206f 第2姿勢特定部
F フレーム画像
M マーカー
Claims (10)
- 撮像部により撮像された特定の被写体を含む画像を逐次取得する取得手段と、
前記撮像部に対する前記特定の被写体の二次元平面に対する法線方向の向きを仮の姿勢として予め指定する指定手段と、
前記取得手段により取得された前記画像における前記特定の被写体の画像領域を構成する複数の点の座標を検出する検出手段と、
前記検出手段により検出された前記複数の点の座標に基づいて、前記撮像部に対する前記特定の被写体の第1姿勢候補を推定する第1推定手段と、前記第1推定手段による推定結果に基づいて、前記撮像部に対する前記特定の被写体の前記第1姿勢候補とは異なり、前記特定の被写体の前記二次元平面に対する前記法線方向の向きが反対となるように回転した、第2姿勢候補を推定する第2推定手段と、を有する候補推定手段と、
前記第1推定手段により推定された前記第1姿勢候補が正しいか否かを、前記指定手段によって指定された前記仮の姿勢に基づいて、判定する判定手段と、
前記判定手段の判定結果によって、前記第1姿勢候補が正しいと判定された場合に、前記第1姿勢候補を前記撮像部に対する前記特定の被写体の姿勢の最適解として特定する一方で、前記第1姿勢候補が正しくないと判定された場合に、前記第2姿勢候補を前記撮像部に対する前記特定の被写体の前記姿勢の最適解として特定する特定手段と、
を備える、
ことを特徴とする被写体検出装置。 - 前記第2推定手段は、前記判定手段の前記判定結果によって前記第1姿勢候補が正しくないと判定された場合に、前記第2姿勢候補を推定することを特徴とする請求項1に記載の被写体検出装置。
- 前記第2推定手段は、前記第1姿勢候補に基づいて、前記特定の被写体の前記二次元平面に対する前記法線方向の向きが反対となるように回転した、前記第1姿勢候補とは異なる前記第2姿勢候補を推定することを特徴とする請求項2に記載の被写体検出装置。
- 前記第2推定手段は、前記撮像部の光軸が通る前記撮像部の中心と前記特定の被写体の中心とを通る軸と、前記特定の被写体の前記二次元平面の法線ベクトルと、の外積を算出し、算出された前記外積を軸として前記第1姿勢候補を回転させて、前記第2姿勢候補を推定することを特徴とする請求項3に記載の被写体検出装置。
- 前記判定手段は、前記撮像部に対する前記特定の被写体の前記第1姿勢候補を表す行列が3×3の回転行列で表されている場合、前記行列の所定の要素の符号を確認することで前記第1姿勢候補と前記仮の姿勢とが一致するか否かを判定することを特徴とする請求項1〜4の何れか一項に記載の被写体検出装置。
- 前記特定の被写体の前記仮の姿勢としての二次元平面に対する法線方向の向きが指定されている場合、
前記判定手段は、前記行列の前記所定の要素の符号を確認することで、前記特定の被写体の前記二次元平面に対する前記法線方向の向きが、前記撮像部の座標系の所定の座標軸の正の方向を向いているか否かを判定することを特徴とする請求項5に記載の被写体検出装置。 - 前記取得部により逐次取得された前記画像における、前記特定の被写体の前記画像領域に、前記特定手段により特定された前記特定の被写体の前記姿勢の最適解と対応する仮想オブジェクトを重畳させた仮想画像を生成する画像生成手段を更に備えることを特徴とする請求項1〜6の何れか一項に記載の被写体検出装置。
- 前記特定の被写体は、マーカーであることを特徴とする請求項1〜7の何れか一項に記載の被写体検出装置。
- 被写体検出装置を用いた被写体検出方法であって、
撮像部により撮像された特定の被写体を含む画像を逐次取得する取得処理と、
前記撮像部に対する前記特定の被写体の二次元平面に対する法線方向の向きを仮の姿勢として予め指定する指定処理と、
前記取得処理において取得された前記画像における前記特定の被写体の画像領域を構成する複数の点の座標を検出する検出処理と、
前記検出処理において検出された前記複数の点の座標に基づいて、前記撮像部に対する前記特定の被写体の第1姿勢候補を推定する第1推定処理と、前記第1推定処理における推定結果に基づいて、前記撮像部に対する前記特定の被写体の前記第1姿勢候補とは異なり、前記特定の被写体の前記二次元平面に対する前記法線方向の向きが反対となるように回転した、第2姿勢候補を推定する第2推定処理と、を含む候補推定処理と、
前記第1推定処理において推定された前記第1姿勢候補が正しいか否かを、前記指定処理において指定された前記仮の姿勢に基づいて、判定する判定処理と、
前記判定処理における判定結果によって、前記第1姿勢候補が正しいと判定された場合に、前記第1姿勢候補を前記撮像部に対する前記特定の被写体の姿勢の最適解として特定する一方で、前記第1姿勢候補が正しくないと判定された場合に、前記第2姿勢候補を前記撮像部に対する前記特定の被写体の前記姿勢の最適解として特定する特定処理と、
を含む、
ことを特徴とする被写体検出方法。 - 被写体検出装置のコンピュータを、
撮像部により撮像された特定の被写体を含む画像を逐次取得する取得手段、
前記撮像部に対する前記特定の被写体の二次元平面に対する法線方向の向きを仮の姿勢として予め指定する指定手段、
前記取得手段により取得された前記画像における前記特定の被写体の画像領域を構成する複数の点の座標を検出する検出手段、
前記検出手段により検出された前記複数の点の座標に基づいて、前記撮像部に対する前記特定の被写体の第1姿勢候補を推定する第1推定手段と、前記第1推定手段による推定結果に基づいて、前記撮像部に対する前記特定の被写体の前記第1姿勢候補とは異なり、前記特定の被写体の前記二次元平面に対する前記法線方向の向きが反対となるように回転した、第2姿勢候補を推定する第2推定手段と、を有する候補推定手段、
前記第1推定手段により推定された前記第1姿勢候補が正しいか否かを、前記指定手段によって指定された前記仮の姿勢に基づいて、判定する判定手段、
前記判定手段の判定結果によって、前記第1姿勢候補が正しいと判定された場合に、前記第1姿勢候補を前記撮像部に対する前記特定の被写体の姿勢の最適解として特定する一方で、前記第1姿勢候補が正しくないと判定された場合に、前記第2姿勢候補を前記撮像部に対する前記特定の被写体の前記姿勢の最適解として特定する特定手段、
として機能させる、
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012216635A JP6079102B2 (ja) | 2012-09-28 | 2012-09-28 | 被写体検出装置、被写体検出方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012216635A JP6079102B2 (ja) | 2012-09-28 | 2012-09-28 | 被写体検出装置、被写体検出方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014071619A JP2014071619A (ja) | 2014-04-21 |
JP6079102B2 true JP6079102B2 (ja) | 2017-02-15 |
Family
ID=50746772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012216635A Expired - Fee Related JP6079102B2 (ja) | 2012-09-28 | 2012-09-28 | 被写体検出装置、被写体検出方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6079102B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003254716A (ja) * | 2002-03-04 | 2003-09-10 | Sony Corp | 3次元位置・姿勢計測装置及び方法、記憶媒体、並びにコンピュータ・プログラム |
-
2012
- 2012-09-28 JP JP2012216635A patent/JP6079102B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014071619A (ja) | 2014-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9558543B2 (en) | Image fusion method and image processing apparatus | |
JP5799928B2 (ja) | 閾値設定装置、被写体検出装置、閾値設定方法及びプログラム | |
JP6467787B2 (ja) | 画像処理システム、撮像装置、画像処理方法およびプログラム | |
KR101379066B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및, 기록 매체 | |
EP2640057B1 (en) | Image processing device, image processing method and program | |
JP5532026B2 (ja) | 表示装置、表示方法及びプログラム | |
WO2012114639A1 (ja) | オブジェクト表示装置、オブジェクト表示方法及びオブジェクト表示プログラム | |
KR100657522B1 (ko) | 휴대용 단말기를 이용한 아웃 포커싱 촬영 장치 및 방법 | |
JP5775977B2 (ja) | 画像処理装置、撮像装置、画像処理方法、及び画像処理プログラム | |
JP2009033392A (ja) | パノラマ画像生成装置およびプログラム | |
JP2015012480A (ja) | 画像処理装置及び画像処理方法 | |
JP2010193058A (ja) | 撮像装置、撮像方法及び撮像プログラム | |
JP2013162287A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
WO2014098143A1 (ja) | 画像処理装置、撮像装置、画像処理方法、画像処理プログラム | |
CN107534722A (zh) | 一种终端设备和拍照的方法 | |
KR102497526B1 (ko) | 검출 장치, 검출 제어 방법 및 컴퓨터 프로그램 | |
JP6217225B2 (ja) | 画像照合装置、画像照合方法及びプログラム | |
CN104796615B (zh) | 一种ois防抖马达的大像素拍摄方法、系统及移动终端 | |
JP2012222617A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP5928228B2 (ja) | 被写体検出装置、被写体検出方法及びプログラム | |
JP5798696B2 (ja) | 画像処理装置、方法、記録媒体及びプログラム並びに撮像装置 | |
JP6079102B2 (ja) | 被写体検出装置、被写体検出方法及びプログラム | |
JP5906745B2 (ja) | 画像表示装置、画像表示方法及びプログラム | |
JPWO2018079043A1 (ja) | 情報処理装置、撮像装置、情報処理システム、情報処理方法、およびプログラム | |
US11143874B2 (en) | Image processing apparatus, head-mounted display, and image displaying method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150612 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160512 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160517 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6079102 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |