JP6814374B2 - 検出方法、検出プログラム及び検出装置 - Google Patents
検出方法、検出プログラム及び検出装置 Download PDFInfo
- Publication number
- JP6814374B2 JP6814374B2 JP2016106851A JP2016106851A JP6814374B2 JP 6814374 B2 JP6814374 B2 JP 6814374B2 JP 2016106851 A JP2016106851 A JP 2016106851A JP 2016106851 A JP2016106851 A JP 2016106851A JP 6814374 B2 JP6814374 B2 JP 6814374B2
- Authority
- JP
- Japan
- Prior art keywords
- target
- detection
- image data
- parameters
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 99
- 238000009826 distribution Methods 0.000 claims description 48
- 238000005457 optimization Methods 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 27
- 238000003860 storage Methods 0.000 claims description 17
- 230000009466 transformation Effects 0.000 claims description 17
- 238000011156 evaluation Methods 0.000 claims description 13
- 230000002068 genetic effect Effects 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 241000282414 Homo sapiens Species 0.000 claims description 7
- 238000013500 data storage Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013519 translation Methods 0.000 claims description 4
- 239000002245 particle Substances 0.000 claims description 3
- 238000010353 genetic engineering Methods 0.000 claims 1
- 235000019557 luminance Nutrition 0.000 description 22
- 230000008859 change Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000001815 facial effect Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 210000003128 head Anatomy 0.000 description 8
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000000744 eyelid Anatomy 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000000994 depressogenic effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 201000009482 yaws Diseases 0.000 description 1
Landscapes
- Image Analysis (AREA)
Description
[1] 三次元の検出対象を含む画像データから対象の検出及び前記対象の姿勢推定を同時に行う検出方法であって、
三次元の検出対象を含む画像データから対象を検出するに当たり、
前記対象を抽象化した二次元のモデルを、前記画像データに照らし合わせ、前記モデルを規定するパラメータの最適化をしながら前記対象の検出を行うステップと、
前記画像データに前記対象が含まれている場合には前記対象の姿勢の推定を行うステップと、
を、備え、
前記対象の検出を行うステップにおいては、
前記パラメータとして、ヨーによる見え(p s, p e )とピッチによる見え(d)を設定し、
前記二次元のモデルを、三次元の検出対象についての画像データの輝度分布に応じて区分された複数の領域により特徴分布として作成し、
前記対象の姿勢の推定を行うステップにおいては、
前記二次元のモデルの前記画像データ中における前記ヨーによる見え(p s, p e )とピッチによる見え(d)からなるパラメータと、平行移動量(x,y)と拡大縮小倍率sと回転角度θとからなる幾何学的変換パラメータと、を進化計算手法により最適化するステップと、
最適化した前記ヨーによる見え(p s, p e )とピッチによる見え(d)からなるパラメータ及び前記幾何学的変換パラメータについて評価するステップと、
を含み、
前記幾何学的変換に関するパラメータから画像中での前記対象を検出し、
前記ヨーによる見え(p s, p e )とピッチによる見え(d)に関するパラメータから前記対象の姿勢を推定する、検出方法。
[2] 三次元の検出対象として人物画像を含むカラー画像データから、顔を対象として検出するに当たり、
前記検出の対象を含むカラー画像を入力し、
前記カラー画像をグレー画像に変換し、該グレー画像から黒画素の誇張処理を少なくとも一回以上行ってターゲット画像を得る、前記[1]に記載の検出方法。
[3] 前記進化計算手法を、遺伝的アルゴリズム、差分進化、粒子群最適化、蟻コロニー最適化の何れかとする、前記[1]又は[2]に記載の検出方法。
[4] 前記遺伝的アルゴリズムにおいて、遺伝的操作を行って個体の最適化をする際の評価に用いる適応度関数fは下記(1)〜(4)式で表される、前記[3]に記載の検出方法。
f=R×W (1)
ここで、R=r1+r2+r3+r4 (2)
W=1.0+0.5×m+m’ w +m’ h (3)
報酬r1は、グレー画像の輝度分布と二値画像の分布を調べることによって得られる報酬値である。
報酬r2は、物体のパーツとしての顔パーツ内に存在している黒画素数を数え、[0.0,1.0]に正規化することによって求められる。
報酬r3は、物体の非パーツ領域として肌領域に存在している白画素数を数え、[0.0,1.0]に正規化することによって求められる。
報酬r4は、候補領域内で全人類に共通するYCrCb表色系の閾値に当てはまる画素数を数え、[0.0,1.0]に正規化することによって求められる。ここで、Yは輝度、Crは赤色の色差、Cbは青色の色差を表している。
(4)式のw、hは個体によって決定されたテンプレートの幅と高さであり、t ij は座標(i,j)におけるグレー画像の画素値、t’ ij は座標(i,j)におけるテンプレートの画素数を表している。
[5] 前記[1]乃至[4]の何れかに記載の検出方法をコンピュータに実行させるためのプログラムを備えた、検出プログラム。
[6] 請求項1乃至4の何れかに記載の検出方法をコンピュータで実行させる検出装置であって、
三次元の検出対象を含む画像データを格納する画像データ格納部と、
前記対象を抽象化し、前記パラメータを用いて二次元のモデルを保存するモデル保存部と、
前記モデルを規定する前記幾何学的変換パラメータの最適化をする最適化処理部と、
を備える、検出装置。
[7] 前記最適化処理部は、前記パラメータの最適化と、前記モデルの前記画像データ中における前記幾何学的変換パラメータの最適化とを、最適化手法により同時に行う、[6]に記載の検出装置。
[8] さらに、前記最適化処理部による前記パラメータの最適化を評価する評価部を備える、前記[6]又は[7]に記載の検出装置。
[9] 前記モデル保存部は、前記二次元のモデルを、三次元の対象についての画像データの輝度分布に応じて区分された複数の領域により作成し、
前記最適化処理部で最適化される前記パラメータとして、ヨーによる見え(p s, p e )とピッチによる見え(d)が設定される、前記[6]乃至[8]の何れかに記載の検出装置。
先ず、本発明の実施形態で使用する原理を説明する。三次元の検出対象を撮影して作成された画像データから検出対象をサーチする前に、三次元の検出対象を二次元のモデルに抽象化する。
本発明の実施形態に係る検出方法は、前述の原理を用い、三次元の検出対象を含む画像データから対象を検出する際に、対象を二次元のモデルにすることにより抽象化し、モデルを規定するパラメータの最適化を図りながら、対象の検出を行う。
図10は、顔らしさを判定するための再分割したモデルである。図10に示すように、二次元モデルの領域を分割する。ここでは、設定した特徴分布を用いて、分割された領域それぞれの平均輝度値を計算する。その際には、膨張処理したグレースケース画像を使用する。図11は図10に示すモデル中に平均輝度値を示し、比較の状態を示す図である。顔のパーツ(黒)と肌領域(白)の平均輝度値を比較し、「或る領域(顔パーツ領域と推定される領域)の平均輝度値<別の或る領域(肌領域と推定される領域)の平均輝度値」となる分布を求める。そして,この分布がどの程度特徴分布に近いかを数値で表現することで,各候補領域、つまり個体を評価する。
f=R×W (1)
ここで、R=r1+r2+r3+r4 (2)
W=1.0+0.5×m+m’w+m’h (3)
fは適応度であり、Rは報酬、Wは重み付けを示し、(2)と(3)の各式は報酬と重みを構成している式であり、すべて[0.0,1.0]に正規化されている。
報酬r1は、グレー画像の輝度分布と二値画像の分布を調べることによって得られる報酬値である。候補領域でグレー画像における輝度分布を調べる。図10に示すように、輝度分布のテンプレートが領域毎に分割されている。
図12は、本発明の実施形態に係る検出装置10を示すブロック構成図である。本発明の実施形態に係る検出装置10は、三次元の検出対象を含む画像データを格納する画像データ格納部11と、対象を抽象化し、パラメータを用いて二次元のモデルを保存するモデル保存部12と、モデルを規定するパラメータの最適化をする最適化処理部13と、を備える。最適化処理部13は、パラメータの最適化と、モデルの画像データ中における幾何学的変換パラメータの最適化とを最適化手法により同時に行う。好ましくは、最適化処理部による前記パラメータの最適化を評価する評価部14を備える。
本発明の実施形態に係る検出プログラムは、コンピュータの記憶部に格納されてCPUに展開されて実行されることにより、前述の最適化処理部13、評価部14のほか、画像データ格納部11及びモデル保存部12のインタフェースとして実現される。
処理時間については、全ての結果で49ミリ秒以下であり、非常に高速である。これは、スマートフォンのような性能が低い計算機でも十分応用可能であることを示している。
11:画像データ格納部
12:モデル保存部
13:最適化処理部
14:評価部
Claims (9)
- 三次元の検出対象を含む画像データから対象の検出及び前記対象の姿勢推定を同時に行う検出方法であって、
三次元の検出対象を含む画像データから対象を検出するに当たり、
前記対象を抽象化した二次元のモデルを、前記画像データに照らし合わせ、前記モデルを規定するパラメータの最適化をしながら前記対象の検出を行うステップと、
前記画像データに前記対象が含まれている場合には前記対象の姿勢の推定を行うステップと、
を、備え、
前記対象の検出を行うステップにおいては、
前記パラメータとして、ヨーによる見え(p s, p e )とピッチによる見え(d)を設定し、
前記二次元のモデルを、三次元の検出対象についての画像データの輝度分布に応じて区分された複数の領域により特徴分布として作成し、
前記対象の姿勢の推定を行うステップにおいては、
前記二次元のモデルの前記画像データ中における前記ヨーによる見え(p s, p e )とピッチによる見え(d)からなるパラメータと、平行移動量(x,y)と拡大縮小倍率sと回転角度θとからなる幾何学的変換パラメータと、を進化計算手法により最適化するステップと、
最適化した前記ヨーによる見え(p s, p e )とピッチによる見え(d)からなるパラメータ及び前記幾何学的変換パラメータについて評価するステップと、
を含み、
前記幾何学的変換に関するパラメータから画像中での前記対象を検出し、
前記ヨーによる見え(p s, p e )とピッチによる見え(d)に関するパラメータから前記対象の姿勢を推定する、検出方法。 - 三次元の検出対象として人物画像を含むカラー画像データから、顔を対象として検出するに当たり、
前記検出の対象を含むカラー画像を入力し、
前記カラー画像をグレー画像に変換し、該グレー画像から黒画素の誇張処理を少なくとも一回以上行ってターゲット画像を得る、請求項1に記載の検出方法。 - 前記進化計算手法を、遺伝的アルゴリズム、差分進化、粒子群最適化、蟻コロニー最適化の何れかとする、請求項1又は2に記載の検出方法。
- 前記遺伝的アルゴリズムにおいて、遺伝的操作を行って個体の最適化をする際の評価に用いる適応度関数fは下記(1)〜(4)式で表される、請求項3に記載の検出方法。
f=R×W (1)
ここで、R=r1+r2+r3+r4 (2)
W=1.0+0.5×m+m’ w +m’ h (3)
報酬r1は、グレー画像の輝度分布と二値画像の分布を調べることによって得られる報酬値である。
報酬r2は、物体のパーツとしての顔パーツ内に存在している黒画素数を数え、[0.0,1.0]に正規化することによって求められる。
報酬r3は、物体の非パーツ領域として肌領域に存在している白画素数を数え、[0.0,1.0]に正規化することによって求められる。
報酬r4は、候補領域内で全人類に共通するYCrCb表色系の閾値に当てはまる画素数を数え、[0.0,1.0]に正規化することによって求められる。ここで、Yは輝度、Crは赤色の色差、Cbは青色の色差を表している。
(4)式のw、hは個体によって決定されたテンプレートの幅と高さであり、t ij は座標(i,j)におけるグレー画像の画素値、t’ ij は座標(i,j)におけるテンプレートの画素数を表している。 - 請求項1乃至4の何れかに記載の検出方法をコンピュータに実行させるためのプログラムを備えた、検出プログラム。
- 請求項1乃至4の何れかに記載の検出方法をコンピュータで実行させる検出装置であって、
三次元の検出対象を含む画像データを格納する画像データ格納部と、
前記対象を抽象化し、前記パラメータを用いて二次元のモデルを保存するモデル保存部と、
前記モデルを規定する前記パラメータと前記幾何学的変換パラメータの最適化をする最適化処理部と、
を備える、検出装置。 - 前記最適化処理部は、前記パラメータの最適化と、前記モデルの前記画像データ中における前記幾何学的変換パラメータの最適化とを、最適化手法により同時に行う、請求項6に記載の検出装置。
- さらに、前記最適化処理部による前記パラメータの最適化を評価する評価部を備える、請求項6又は7に記載の検出装置。
- 前記モデル保存部は、前記二次元のモデルを、三次元の対象についての画像データの輝度分布に応じて区分された複数の領域により作成し、
前記最適化処理部で最適化される前記パラメータとして、ヨーによる見え(p s, p e )とピッチによる見え(d)が設定される、請求項6乃至8の何れかに記載の検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016106851A JP6814374B2 (ja) | 2016-05-27 | 2016-05-27 | 検出方法、検出プログラム及び検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016106851A JP6814374B2 (ja) | 2016-05-27 | 2016-05-27 | 検出方法、検出プログラム及び検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017211959A JP2017211959A (ja) | 2017-11-30 |
JP6814374B2 true JP6814374B2 (ja) | 2021-01-20 |
Family
ID=60476175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016106851A Active JP6814374B2 (ja) | 2016-05-27 | 2016-05-27 | 検出方法、検出プログラム及び検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6814374B2 (ja) |
-
2016
- 2016-05-27 JP JP2016106851A patent/JP6814374B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017211959A (ja) | 2017-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | A deep coarse-to-fine network for head pose estimation from synthetic data | |
US11232286B2 (en) | Method and apparatus for generating face rotation image | |
US20210264144A1 (en) | Human pose analysis system and method | |
CN111931764B (zh) | 一种目标检测方法、目标检测框架及相关设备 | |
US10325184B2 (en) | Depth-value classification using forests | |
JP2014093023A (ja) | 物体検出装置、物体検出方法及びプログラム | |
CN104036284A (zh) | 基于Adaboost算法的多尺度行人检测方法 | |
CN111539911B (zh) | 一种口呼吸面容识别方法、设备和存储介质 | |
JP6756406B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
CN113591763B (zh) | 人脸脸型的分类识别方法、装置、存储介质及计算机设备 | |
CN113781519A (zh) | 目标跟踪方法和目标跟踪装置 | |
US20240096134A1 (en) | Action Recognition System and Method | |
Chan et al. | A 3-D-point-cloud system for human-pose estimation | |
Ahmed et al. | Robust Object Recognition with Genetic Algorithm and Composite Saliency Map | |
CN107886060A (zh) | 基于视频的行人自动检测与跟踪方法 | |
Mohamed et al. | A new method for face recognition using variance estimation and feature extraction | |
US20220180548A1 (en) | Method and apparatus with object pose estimation | |
CN102622765A (zh) | 基于黎曼流型度量的鱼群算法的目标跟踪方法 | |
Wang et al. | A study on hand gesture recognition algorithm realized with the aid of efficient feature extraction method and convolution neural networks: design and its application to VR environment | |
JP6814374B2 (ja) | 検出方法、検出プログラム及び検出装置 | |
Mocanu et al. | Multimodal convolutional neural network for object detection using rgb-d images | |
Zhao et al. | Octree segmentation based calling gesture recognition for elderly care robot | |
JP4942197B2 (ja) | テンプレート作成装置及び表情認識装置並びにその方法、プログラム及び記録媒体 | |
JP2011086245A (ja) | テンプレート作成装置、表情認識装置、テンプレート作成方法、表情認識方法、及びプログラム | |
CN117408304B (zh) | 6d姿态预测神经网络模型系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200609 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6814374 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |