JP2022143363A - 対応点検出装置、対応点検出方法及びプログラム - Google Patents
対応点検出装置、対応点検出方法及びプログラム Download PDFInfo
- Publication number
- JP2022143363A JP2022143363A JP2021043830A JP2021043830A JP2022143363A JP 2022143363 A JP2022143363 A JP 2022143363A JP 2021043830 A JP2021043830 A JP 2021043830A JP 2021043830 A JP2021043830 A JP 2021043830A JP 2022143363 A JP2022143363 A JP 2022143363A
- Authority
- JP
- Japan
- Prior art keywords
- image
- units
- processing
- layer
- layers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 58
- 238000012545 processing Methods 0.000 claims abstract description 104
- 238000000605 extraction Methods 0.000 claims abstract description 47
- 238000006243 chemical reaction Methods 0.000 claims abstract description 12
- 238000012805 post-processing Methods 0.000 claims description 40
- 238000007781 pre-processing Methods 0.000 claims description 20
- 230000004913 activation Effects 0.000 claims description 16
- 230000001902 propagating effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 18
- 238000010586 diagram Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 11
- 238000013527 convolutional neural network Methods 0.000 description 9
- 238000011176 pooling Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
図1は、対応点検出装置1の概要を説明するための図である。対応点検出装置1は、学習モデルMを用いて、複数の画像における特徴点を検出するために用いられる装置であり、例えばPC(Personal Computer)である。画像は、被写体を含む静止画像又は動画像である。対応点検出装置1は、画像が動画像である場合、動画像に含まれるフレーム画像ごとに特徴点を検出する処理を実行する。被写体は、例えば、人物の顔や車両の前面やスポーツのコート等、左右あるいは上下の線対称な物体である。
以下、学習モデルMの構成について説明する。
図2は、学習モデルMの構成の一部を示す図である。図2に示す処理層Mxは、回転層M21及び畳み込み層M22以外の処理層(例えば、入力層、他の畳み込み層、プーリング層、正規化層のうちのいずれかの処理層)である。
続いて、対応点検出装置1の構成について説明する。図5は、対応点検出装置1の構成を示す図である。対応点検出装置1は、操作部11、記憶部12、及び制御部13を有する。制御部13は、取得部131と、伝搬制御部132と、抽出部133と、指示受付部134と、特徴点検出部135と、選択部136と、推定部137とを有する。
続いて、対応点検出装置1の処理の流れについて説明する。図11は、対応点検出装置1の処理の流れを示すシーケンス図である。本処理は、取得部131が、第1画像と第2画像とを取得したことを契機として開始する(S1)。
以上説明したとおり、対応点検出装置1は、直前の処理層から入力された入力データにそれぞれ異なる角度の回転を施す複数の回転層M21と、複数の回転層が変換した複数の変換データに畳み込みフィルタを適用する畳み込み層M22とを有する学習モデルMを用いて、複数の画像における特徴点を検出する。このようにすることで、学習モデルMは、入力された画像に含まれる被写体の向きが未学習であっても被写体を認識することができる。対応点検出装置1は、このような学習モデルMを用いることにより、複数の画像における特徴点を検出することができる。
11 操作部
12 記憶部
13 制御部
131 取得部
132 伝搬制御部
133 抽出部
134 指示受付部
135 特徴点検出部
136 選択部
137 推定部
M 学習モデル
M10 入力層
M20 隠れ層
M21 回転層
M22 畳み込み層
M30 出力層
Claims (6)
- 第1画像と、前記第1画像に鏡映変換が施された第2画像とのそれぞれに、入力された画像に基づいて当該画像に含まれる被写体の種別を出力可能な学習モデルに含まれる複数の処理層であって、複数のユニットをそれぞれ含む前記複数の処理層を伝搬させる伝搬制御部と、
前記第1画像に基づいて、前記複数の処理層から選択した後段処理層、及び前記後段処理層より前の処理層である前段処理層の両方の処理層において活性化している前記ユニットのうち、前記第2画像に基づいて前記両方の処理層のうちの少なくとも前記後段処理層において活性化している前記ユニットと共通する前記ユニットを示す一以上の第1画像出力と、前記第2画像に基づいて、前記両方の処理層において活性化している前記ユニットのうち、前記第1画像に基づいて前記両方の処理層のうちの少なくとも前記後段処理層において活性化している前記ユニットと共通する前記ユニットを示す一以上の第2画像出力とを抽出する抽出部と、
前記一以上の第1画像出力と前記一以上の第2画像出力とに基づいて、前記第1画像に含まれる特徴点である一以上の第1画像特徴点と、前記第2画像に含まれる特徴点である一以上の第2画像特徴点とを検出する特徴点検出部と、
を有し、
前記学習モデルは、入力された入力データにそれぞれ異なる角度の回転を施す複数の回転層と、前記複数の回転層が変換した複数の変換データに畳み込みフィルタを適用する畳み込み層とを有する、
対応点検出装置。 - 前記抽出部は、前記後段処理層が前記畳み込み層であり、かつ前記前段処理層が前記複数の回転層である場合、前記第1画像に基づいて、前記両方の処理層において活性化している前記ユニットのうち、前記第2画像に基づいて前記複数の回転層のいずれかと前記畳み込み層とにおいて活性化している前記ユニットと共通する前記ユニットを示す前記一以上の第1画像出力と、前記第2画像に基づいて、前記両方の処理層において活性化している前記ユニットのうち、前記第1画像に基づいて前記複数の回転層のいずれかと前記畳み込み層とにおいて活性化している前記ユニットと共通する前記ユニットを示す前記一以上の第2画像出力とを抽出する、
請求項1に記載の対応点検出装置。 - 前記抽出部は、前記後段処理層が前記複数の回転層である場合、前記第1画像に基づいて、前記両方の処理層において活性化している前記ユニットのうち、前記第2画像に基づいて前記複数の回転層のいずれかにおいて活性化している前記ユニットと共通する前記ユニットの活性化に寄与した前記前段処理層の前記ユニットを示す前記一以上の第1画像出力と、前記第2画像に基づいて、前記両方の処理層において活性化している前記ユニットのうち、前記第1画像に基づいて前記複数の回転層のいずれかにおいて活性化している前記ユニットと共通する前記ユニットの活性化に寄与した前記前段処理層の前記ユニットを示す前記一以上の第2画像出力とを抽出する、
請求項1又は2に記載の対応点検出装置。 - 前記一以上の第1画像特徴点と、前記一以上の第2画像特徴点とに基づいて、前記第1画像に含まれる被写体の向きを推定する推定部をさらに有する、
請求項1から3のいずれか一項に記載の対応点検出装置。 - コンピュータが実行する、
第1画像と、前記第1画像に鏡映変換が施された第2画像とのそれぞれに、入力された画像に基づいて当該画像に含まれる被写体の種別を出力可能な学習モデルに含まれる複数の処理層であって、複数のユニットをそれぞれ含む前記複数の処理層を伝搬させるステップと、
前記第1画像に基づいて、前記複数の処理層から選択した後段処理層、及び前記後段処理層より前の処理層である前段処理層の両方の処理層において活性化している前記ユニットのうち、前記第2画像に基づいて前記両方の処理層のうちの少なくとも前記後段処理層において活性化している前記ユニットと共通する前記ユニットを示す一以上の第1画像出力と、前記第2画像に基づいて、前記両方の処理層において活性化している前記ユニットのうち、前記第1画像に基づいて前記両方の処理層のうちの少なくとも前記後段処理層において活性化している前記ユニットと共通する前記ユニットを示す一以上の第2画像出力とを抽出するステップと、
前記一以上の第1画像出力と前記一以上の第2画像出力とに基づいて、前記第1画像に含まれる特徴点である一以上の第1画像特徴点と、前記第2画像に含まれる特徴点である一以上の第2画像特徴点とを検出するステップと、
を有し、
前記学習モデルは、入力された入力データにそれぞれ異なる角度の回転を施す複数の回転層と、前記複数の回転層が変換した複数の変換データに畳み込みフィルタを適用する畳み込み層とを有する、
対応点検出方法。 - コンピュータを、
第1画像と、前記第1画像に鏡映変換が施された第2画像とのそれぞれに、入力された画像に基づいて当該画像に含まれる被写体の種別を出力可能な学習モデルに含まれる複数の処理層であって、複数のユニットをそれぞれ含む前記複数の処理層を伝搬させる伝搬制御部、
前記第1画像に基づいて、前記複数の処理層から選択した後段処理層、及び前記後段処理層より前の処理層である前段処理層の両方の処理層において活性化している前記ユニットのうち、前記第2画像に基づいて前記両方の処理層のうちの少なくとも前記後段処理層において活性化している前記ユニットと共通する前記ユニットを示す一以上の第1画像出力と、前記第2画像に基づいて、前記両方の処理層において活性化している前記ユニットのうち、前記第1画像に基づいて前記両方の処理層のうちの少なくとも前記後段処理層において活性化している前記ユニットと共通する前記ユニットを示す一以上の第2画像出力とを抽出する抽出部、及び
前記一以上の第1画像出力と前記一以上の第2画像出力とに基づいて、前記第1画像に含まれる特徴点である一以上の第1画像特徴点と、前記第2画像に含まれる特徴点である一以上の第2画像特徴点とを検出する特徴点検出部、
として機能させ、
前記学習モデルは、入力された入力データにそれぞれ異なる角度の回転を施す複数の回転層と、前記複数の回転層が変換した複数の変換データに畳み込みフィルタを適用する畳み込み層とを有する、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021043830A JP7488216B2 (ja) | 2021-03-17 | 2021-03-17 | 対応点検出装置、対応点検出方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021043830A JP7488216B2 (ja) | 2021-03-17 | 2021-03-17 | 対応点検出装置、対応点検出方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022143363A true JP2022143363A (ja) | 2022-10-03 |
JP7488216B2 JP7488216B2 (ja) | 2024-05-21 |
Family
ID=83454216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021043830A Active JP7488216B2 (ja) | 2021-03-17 | 2021-03-17 | 対応点検出装置、対応点検出方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7488216B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018120591A (ja) * | 2017-01-24 | 2018-08-02 | 富士通株式会社 | 文書の向きの認識方法、認識装置及びニューラルネットワーク |
JP2018190388A (ja) * | 2017-04-28 | 2018-11-29 | 富士通株式会社 | 画像における関心部分の検出 |
JP2020009227A (ja) * | 2018-07-10 | 2020-01-16 | Kddi株式会社 | 物体領域抽出装置及び物体領域抽出方法 |
CN111695522A (zh) * | 2020-06-15 | 2020-09-22 | 重庆邮电大学 | 一种平面内的旋转不变人脸检测方法、装置及存储介质 |
JP2021033379A (ja) * | 2019-08-15 | 2021-03-01 | コニカミノルタ株式会社 | 画像処理システム、画像処理プログラム、および画像処理方法 |
-
2021
- 2021-03-17 JP JP2021043830A patent/JP7488216B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018120591A (ja) * | 2017-01-24 | 2018-08-02 | 富士通株式会社 | 文書の向きの認識方法、認識装置及びニューラルネットワーク |
JP2018190388A (ja) * | 2017-04-28 | 2018-11-29 | 富士通株式会社 | 画像における関心部分の検出 |
JP2020009227A (ja) * | 2018-07-10 | 2020-01-16 | Kddi株式会社 | 物体領域抽出装置及び物体領域抽出方法 |
JP2021033379A (ja) * | 2019-08-15 | 2021-03-01 | コニカミノルタ株式会社 | 画像処理システム、画像処理プログラム、および画像処理方法 |
CN111695522A (zh) * | 2020-06-15 | 2020-09-22 | 重庆邮电大学 | 一种平面内的旋转不变人脸检测方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP7488216B2 (ja) | 2024-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107066935B (zh) | 基于深度学习的手部姿态估计方法及装置 | |
CN109670474B (zh) | 一种基于视频的人体姿态估计方法、装置及设备 | |
Hasan et al. | RETRACTED ARTICLE: Static hand gesture recognition using neural networks | |
CN109753891A (zh) | 基于人体关键点检测的足球运动员姿势校准方法及系统 | |
US8615135B2 (en) | Feature point positioning apparatus, image recognition apparatus, processing method thereof and computer-readable storage medium | |
CN106951840A (zh) | 一种人脸特征点检测方法 | |
Geetha et al. | A vision based dynamic gesture recognition of indian sign language on kinect based depth images | |
CN108475113B (zh) | 用于检测用户的手部姿态的方法、系统和介质 | |
CN109816098B (zh) | 神经网络的处理方法及评估方法、数据分析方法及装置 | |
Chen et al. | Learning a deep network with spherical part model for 3D hand pose estimation | |
WO2005111936A1 (ja) | パラメタ推定方法、パラメタ推定装置および照合方法 | |
CN112258555A (zh) | 实时姿态估计运动分析方法、系统、计算机设备及存储介质 | |
CN114005169A (zh) | 人脸关键点检测方法、装置、电子设备及存储介质 | |
CN115272822A (zh) | 训练解析模型的方法、虚拟试衣方法及相关装置 | |
CN107895145A (zh) | 基于卷积神经网络结合超高斯去噪估测手指受力的方法 | |
CN114118181B (zh) | 一种高维回归点云配准方法、系统、计算机设备及应用 | |
CN114359785A (zh) | 基于自适应矩阵特征融合网络的唇语识别方法、装置及电子设备 | |
CN114220138A (zh) | 一种人脸对齐方法、训练方法、装置和存储介质 | |
Kajan et al. | Comparison of algorithms for dynamic hand gesture recognition | |
JP2022143363A (ja) | 対応点検出装置、対応点検出方法及びプログラム | |
US11495049B2 (en) | Biometric feature reconstruction method, storage medium and neural network | |
JP2021170247A (ja) | 情報処理装置、情報処理システム、情報処理方法およびプログラム | |
CN113920587B (zh) | 基于卷积神经网络的人体姿态估计方法 | |
US20220415085A1 (en) | Method of machine learning and facial expression recognition apparatus | |
CN113052030B (zh) | 一种基于单张rgb图像的双流多尺度手部姿态估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230214 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20231016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240509 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7488216 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |