JP7156643B2 - 姿勢推定装置、学習装置、方法、及びプログラム - Google Patents
姿勢推定装置、学習装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP7156643B2 JP7156643B2 JP2019030703A JP2019030703A JP7156643B2 JP 7156643 B2 JP7156643 B2 JP 7156643B2 JP 2019030703 A JP2019030703 A JP 2019030703A JP 2019030703 A JP2019030703 A JP 2019030703A JP 7156643 B2 JP7156643 B2 JP 7156643B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- geometric transformation
- model
- posture
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
本実施形態における姿勢推定方法は、画像を入力として受け付けると、その姿勢パラメータ、姿勢変換画像、並びに特徴量を出力するニューラルネットワークを画像変換器として用いる構成を採る。ここで言う姿勢パラメータとは、物体の姿勢を表す値であり、より具体的には、例えば、物体の位置・大きさ・角度を与える行列であるアフィン変換行列や射影変換行列の要素である。また、姿勢とは、基準となる姿勢から、物体にどのような剛体運動が与えられたかを示す値である。姿勢変換画像は、当該姿勢パラメータによる姿勢変換を入力画像に適用した場合に得られる姿勢変換後の画像を意味する。また、特徴量は、入力画像に写る物体の特徴をベクトル表現したものであり、物体の名称を特定するのに用いるものである。
学習処理は、姿勢推定を行う前に、少なくとも一度実施する必要のある処理であり、より具体的には、画像変換器10のパラメータであるニューラルネットワークの重みを学習用データに基づいて適切に決定するための処理である。
以降、各処理の詳細処理について、本実施形態における一例を説明する。
この処理では、特徴量を学習するために必要な特徴量損失を求める。画像認識の観点から言えば、同一の被写体を含む画像Ia、Iptの特徴量fa、fptはベクトルとして互いに近く、また、逆に、異なる被写体を含む画像Ia、Inの特徴量fa、fnはベクトルとして互いに遠くなっている方が好ましい。このような特徴量を得ることにより、特徴量の近さに基づいて同一被写体を検索したり、あるいは、例えばK近傍法などの識別法により被写体の名称を推定することもできるようになる。
続いて、本実施形態の一例における姿勢推定方法の姿勢推定処理について説明する。
以下、図面を参照して、本発明の一実施形態による学習装置及び姿勢推定装置について説明する。
これまで説明した本技術の実施形態の一例により構築した学習処理方法及び姿勢推定処理方法を用いて学習処理及び姿勢推定処理を行った実験結果を示す。
10A 画像変換器、幾何変換層無しモデル
11 幾何変換層
11A 姿勢パラメータ推定層
11B 画像変換層
20、50 入力部
30、60 演算部
32、62 モデル記憶部
34、64 推定部
38 学習部
66 参照画像データベース
68 照合部
70 出力部
100 学習装置
150 姿勢推定装置
Claims (5)
- 画像Ipに撮像された所定の被写体の、基準姿勢に対する相対的な姿勢を推定し、前記推定された前記相対的な姿勢を用いて、前記基準姿勢の前記所定の被写体が撮像されている画像Iaに、前記画像Ipを幾何変換する第1推定部と、
前記第1推定部による幾何変換の結果と、前記画像Iaとが一致するように、前記相対的な姿勢の推定及び前記幾何変換を学習する学習部と、
推定対象の画像に撮像された所定の被写体の、基準姿勢に対する相対的な姿勢を推定する第2推定部と、
を有し、
前記第1推定部は、画像Iaと同一の被写体を写した基準姿勢でない画像Ipに対して幾何変換層付きモデルを適用し、幾何変換後の画像Ipである画像Ipt、並びに特徴量fptを求め、
前記学習部は、前記画像Ia、並びに前記画像Ia及び前記画像Ipと別の被写体を写した画像Inのそれぞれに対して幾何変換層無しモデルを適用し、前記画像Iaに対応する特徴量fa、及び前記画像Inに対応する特徴量fnを求め、
画像Iptと画像Iaに基づき、アピアランス損失を求め、特徴量fa、特徴量fpt、特徴量fnを基に、特徴量損失を求め、アピアランス損失と特徴量損失の重み付き和を小さくするように幾何変換層付きモデルのパラメータを更新すると共に、幾何変換層無しモデルに幾何変換層付きモデルのパラメータをコピーし、
前記第1推定部の処理及び前記学習部の処理を、所定の終了条件が満たされるまで繰り返すことにより、前記幾何変換層付きモデルを学習し、
前記第2推定部は、学習済みの前記幾何変換層付きモデルに対して前記推定対象の画像を入力し、前記幾何変換層付きモデルの幾何変換層が出力した姿勢パラメータを得ることにより、前記推定対象の画像に対して前記相対的な姿勢を推定する
姿勢推定装置。 - 前記幾何変換層は、STN(Spatial Transformer Networks)である請求項1記載の姿勢推定装置。
- 前記第2推定部は、前記推定対象の画像に対して前記幾何変換層付きモデルを適用し、幾何変換後の画像の特徴量を求め、
前記第2推定部により得られた特徴量と、被写体情報が付与された参照画像に対して前記画像の特徴量を抽出する処理を行って得られた特徴量とを照合することにより、前記推定対象の画像に撮像された所定の被写体を認識する照合部を更に含む請求項1又は2記載の姿勢推定装置。 - 第1推定部が、画像Ipに撮像された所定の被写体の、基準姿勢に対する相対的な姿勢を推定し、前記推定された前記相対的な姿勢を用いて、前記基準姿勢の前記所定の被写体が撮像されている画像Iaに、前記画像Ipを幾何変換し、
学習部が、前記第1推定部による幾何変換の結果と、前記画像Iaとが一致するように、前記相対的な姿勢の推定及び前記幾何変換を学習し、
第2推定部が、推定対象の画像に撮像された所定の被写体の、基準姿勢に対する相対的な姿勢を推定することを含む姿勢推定方法であって、
前記第1推定部は、画像Iaと同一の被写体を写した基準姿勢でない画像Ipに対して幾何変換層付きモデルを適用し、幾何変換後の画像Ipである画像Ipt、並びに特徴量fptを求め、
前記学習部は、前記画像Ia、並びに前記画像Ia及び前記画像Ipと別の被写体を写した画像Inのそれぞれに対して幾何変換層無しモデルを適用し、前記画像Iaに対応する特徴量fa、及び前記画像Inに対応する特徴量fnを求め、
画像Iptと画像Iaに基づき、アピアランス損失を求め、特徴量fa、特徴量fpt、特徴量fnを基に、特徴量損失を求め、アピアランス損失と特徴量損失の重み付き和を小さくするように幾何変換層付きモデルのパラメータを更新すると共に、幾何変換層無しモデルに幾何変換層付きモデルのパラメータをコピーし、
前記第1推定部の処理及び前記学習部の処理を、所定の終了条件が満たされるまで繰り返すことにより、前記幾何変換層付きモデルを学習し、
前記第2推定部は、学習済みの前記幾何変換層付きモデルに対して前記推定対象の画像を入力し、前記幾何変換層付きモデルの幾何変換層が出力した姿勢パラメータを得ることにより、前記推定対象の画像に対して前記相対的な姿勢を推定する
姿勢推定方法。 - 画像Ipに撮像された所定の被写体の、基準姿勢に対する相対的な姿勢を推定し、前記推定された前記相対的な姿勢を用いて、前記基準姿勢の前記所定の被写体が撮像されている画像Iaに、前記画像Ipを幾何変換する第1推定部、
前記第1推定部による幾何変換の結果と、前記画像Iaとが一致するように、前記相対的な姿勢の推定及び前記幾何変換を学習する学習部、及び
推定対象の画像に撮像された所定の被写体の、基準姿勢に対する相対的な姿勢を推定する第2推定部
としてコンピュータを機能させるためのプログラムであって、
前記第1推定部は、画像Iaと同一の被写体を写した基準姿勢でない画像Ipに対して幾何変換層付きモデルを適用し、幾何変換後の画像Ipである画像Ipt、並びに特徴量fptを求め、
前記学習部は、前記画像Ia、並びに前記画像Ia及び前記画像Ipと別の被写体を写した画像Inのそれぞれに対して幾何変換層無しモデルを適用し、前記画像Iaに対応する特徴量fa、及び前記画像Inに対応する特徴量fnを求め、
画像Iptと画像Iaに基づき、アピアランス損失を求め、特徴量fa、特徴量fpt、特徴量fnを基に、特徴量損失を求め、アピアランス損失と特徴量損失の重み付き和を小さくするように幾何変換層付きモデルのパラメータを更新すると共に、幾何変換層無しモデルに幾何変換層付きモデルのパラメータをコピーし、
前記第1推定部の処理及び前記学習部の処理を、所定の終了条件が満たされるまで繰り返すことにより、前記幾何変換層付きモデルを学習し、
前記第2推定部は、学習済みの前記幾何変換層付きモデルに対して前記推定対象の画像を入力し、前記幾何変換層付きモデルの幾何変換層が出力した姿勢パラメータを得ることにより、前記推定対象の画像に対して前記相対的な姿勢を推定する
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019030703A JP7156643B2 (ja) | 2019-02-22 | 2019-02-22 | 姿勢推定装置、学習装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019030703A JP7156643B2 (ja) | 2019-02-22 | 2019-02-22 | 姿勢推定装置、学習装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020135637A JP2020135637A (ja) | 2020-08-31 |
JP7156643B2 true JP7156643B2 (ja) | 2022-10-19 |
Family
ID=72263294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019030703A Active JP7156643B2 (ja) | 2019-02-22 | 2019-02-22 | 姿勢推定装置、学習装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7156643B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113537393B (zh) * | 2021-08-09 | 2023-08-22 | 南通大学 | 一种基于改进Transformer的黑暗场景三维人体姿态估计算法 |
WO2024069727A1 (en) * | 2022-09-27 | 2024-04-04 | Nec Corporation | Training apparatus, training method, and non-transitory computer-readable storage medium |
-
2019
- 2019-02-22 JP JP2019030703A patent/JP7156643B2/ja active Active
Non-Patent Citations (1)
Title |
---|
Xiaoming Deng et al.,Joint Hand Detection and Rotation Estimation Using CNN,IEEE Transactions on Image Processing,IEEE,2018年,Vol.27, No.4,pp.1888-1900,https://ieeexplore.ieee.org/document/8128503 |
Also Published As
Publication number | Publication date |
---|---|
JP2020135637A (ja) | 2020-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020228446A1 (zh) | 模型训练方法、装置、终端及存储介质 | |
Novotny et al. | Semi-convolutional operators for instance segmentation | |
Mahler et al. | Dex-net 2.0: Deep learning to plan robust grasps with synthetic point clouds and analytic grasp metrics | |
Tang et al. | Track deformable objects from point clouds with structure preserved registration | |
US20240070554A1 (en) | Optimizing training data for image classification | |
Xia et al. | Loop closure detection for visual SLAM using PCANet features | |
WO2011086889A1 (ja) | 特徴点選択システム、特徴点選択方法および特徴点選択プログラム | |
KR20130122662A (ko) | 이미지들의 비교 방법 및 시스템 | |
CN108229347A (zh) | 用于人识别的拟吉布斯结构采样的深层置换的方法和装置 | |
CN111199562A (zh) | 用于在机器人拣选时快速物体检测的系统和方法 | |
KR102369413B1 (ko) | 영상 처리 장치 및 방법 | |
WO2021044122A1 (en) | Scene representation using image processing | |
Yang et al. | Self-supervised geometric perception | |
US10657625B2 (en) | Image processing device, an image processing method, and computer-readable recording medium | |
JP7156643B2 (ja) | 姿勢推定装置、学習装置、方法、及びプログラム | |
Uzkent et al. | Enkcf: Ensemble of kernelized correlation filters for high-speed object tracking | |
JP5674550B2 (ja) | 状態追跡装置、方法、及びプログラム | |
Erinc et al. | Anytime merging of appearance-based maps | |
JP6793925B2 (ja) | 検証装置、方法、及びプログラム | |
JP7393809B2 (ja) | 全方位画像情報に基づく自動位相マッピング処理方法及びそのシステムとコンピュータープログラム | |
Sui et al. | Tracking completion | |
Hameed et al. | Content based image retrieval based on feature fusion and support vector machine | |
JP2018195270A (ja) | 局所特徴表現学習装置、及び方法 | |
JP6482505B2 (ja) | 検証装置、方法、及びプログラム | |
JP2022028312A (ja) | 姿勢推定方法、学習方法、姿勢推定装置、学習装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190226 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210521 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7156643 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |