JP4950787B2 - 画像処理装置及びその方法 - Google Patents
画像処理装置及びその方法 Download PDFInfo
- Publication number
- JP4950787B2 JP4950787B2 JP2007183610A JP2007183610A JP4950787B2 JP 4950787 B2 JP4950787 B2 JP 4950787B2 JP 2007183610 A JP2007183610 A JP 2007183610A JP 2007183610 A JP2007183610 A JP 2007183610A JP 4950787 B2 JP4950787 B2 JP 4950787B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- region
- dimensional
- interest
- dimensional model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional [3D] objects
- G06V20/647—Three-dimensional [3D] objects by matching two-dimensional images to three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/755—Deformable models or variational models, e.g. snakes or active contours
- G06V10/7553—Deformable models or variational models, e.g. snakes or active contours based on shape, e.g. active shape models [ASM]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
以下、第1の実施形態の画像処理装置10について図1〜図4に基づいて説明する。本実施形態の画像処理装置10は、人間の顔を認識する認識装置である。
図1は、画像処理装置10の構成を示すブロック図である。
画像入力部12は、処理対象となる顔画像を入力する。画像入力部12より得られた画像は、特徴点抽出部14に逐次送られる。
特徴点抽出部14では、顔特徴点として、画像中の顔部位の座標が検出される。
3次元モデル保持部16では、顔の3次元的な情報と、基準特徴点座標が保持されている。なお、顔の3次元的な情報とは、顔の立体的なモデルを構成する3次元位置情報である。また、基準特徴点座標の情報には、特徴点抽出部14により抽出される特徴点の種類も含まれている。
注目領域設定部18では、3次元モデル保持部16で保持されている3次元モデルに対し、任意に定義された局所的な注目領域を設定する。この設定のときに注目領域内に顔特徴点が属するようにする。
対応関係計算部20では、注目領域設定部18で設定された注目領域毎に、入力画像上の顔との対応関係を計算する。
3次元モデル統合部22では、対応関係計算部20において計算された注目領域毎の画像との対応関係を統合し、対照となる顔に対して当てはめを行って、最終的な3次元モデルを計算する。
図4に注目領域毎に計算した対応点を統合する例を示す。
このとき、座標を重み付けして統合する以外に、注目領域毎に正規化画像を生成し、その後に画素値を重み付けして統合する方法も考えられる。これは、特許文献1で述べられている方法を注目領域毎に単純に複数回適用し、生成した正規化画像を重み付け和することと等価である。
なお、重み付け和の係数wijは、注目領域毎に予め決めてあっても良い。
正規化画像生成部24では、3次元モデル統合部22で計算した3次元モデルと入力画像との位置の対応関係に基づいて、正規化画像を生成する。
認識部26では、正規化画像生成部24で得られた正規化画像(顔パターン)と、予め保存されている登録辞書との認識処理を行う。
このように、本実施形態に係わる画像処理装置10によれば、3次元モデルに対して複数個の注目領域を設定し、それぞれ個別の注目領域毎に入力画像との対応関係を計算し、画像上へ変換した座標値を用いて1つに統合した3次元モデルを求め、入力された顔の個人差や部分的な変形に対しても柔軟に適応した正規化画像を生成することで、より高精度な認識が可能となる。
第2の実施形態の画像処理装置10について説明する。
第3の実施形態の画像処理装置10について図5に基づいて説明する。
図5に本実施形態に係わる画像処理装置10の構成を表す。
画像変換部28では、3次元モデル統合部22により計算された3次元モデルを利用して、入力された顔画像を別の顔画像へと変換処理を行う。
この画像変換部28を用いることで、2枚の画像が与えられたときに、相互に顔画像を変換することが可能となり、例えば、コンピュータ上でのアバターなどに利用できる。
なお、入力画像は2枚として説明したが、これが2枚以上の任意の枚数であったとしても、これまでの議論は完全に成り立ち、任意の画像間の変換が可能である。
本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
12 画像入力部
14 特徴点抽出部
16 3次元モデル保持部
18 注目領域設定部
20 対応関係計算部
22 3次元モデル統合部
24 正規化画像生成部
Claims (8)
- 対象物体が写った画像を入力する画像入力部と、
3次元モデルの形状を表す情報と、前記3次元モデル上の同一平面上に存在しない4点以上の基準特徴点の3次元位置を格納する格納部と、
前記対象物体に関し、かつ、前記複数の基準特徴点に対応する複数の特徴点を、前記入力画像から抽出する抽出部と、
(1)前記基準特徴点と関連付けされ、(2)前記3次元モデル上に存在する複数の局所的な領域である複数の注目領域を設定する設定部と、
前記抽出された特徴点と、前記注目領域に関する基準特徴点とを用いて、前記入力画像の2次元位置と前記注目領域の3次元位置との対応関係を、前記注目領域毎に求める計算部と、
前記注目領域毎の対応関係に基づいて、前記入力画像の各領域に少なくとも一つの前記注目領域をそれぞれ対応させて、前記注目領域に対応する3次元モデルの3次元位置のピクセル値を、前記入力画像の2次元位置のピクセル値に決定する決定部と、
を有する画像処理装置。 - 前記計算部における前記注目領域毎の対応関係は、前記抽出された特徴点と前記注目領域の基準特徴点との間の射影行列である、
請求項1記載の画像処理装置。 - 前記決定部は、
前記注目領域毎の射影行列を用いて、前記各注目領域を前記入力画像上へそれぞれ射影し、
前記それぞれ射影された前記複数の注目領域の2次元位置を重み付け加算することにより、前記複数の注目領域にそれぞれ対応する3次元モデルの3次元位置のピクセル値を、前記入力画像の2次元位置のピクセル値に決定するものであり、
前記重み付け加算するための重みの総和は1であり、かつ、前記重みは、前記入力画像から検出した特徴点の信頼度から求める、
請求項2記載の画像処理装置。 - 前記格納部は、複数の前記3次元モデルを格納し、
前記設定部は、前記複数の3次元モデルのそれぞれに複数の注目領域を設定する、
請求項1記載の画像処理装置。 - 前記注目領域に対応する3次元モデルの3次元位置と前記入力画像の2次元位置との対応関係に基づいて、前記入力画像から正規化画像を生成する画像生成部と、
前記正規化画像と、予め格納された前記対象物体の辞書情報とに基づいてパターン認識を行い、前記入力画像の認識を行う認識部と、
をさらに有する請求項1記載の画像処理装置。 - 前記画像入力部に第1の入力画像と第2の入力画像が入力し、
前記決定部は、前記3次元モデルの3次元位置のピクセル値と、前記第1の入力画像の2次元位置のピクセル値の第1の対応関係を決定し、また、前記3次元モデルの3次元位置のピクセル値と、前記第2の入力画像の2次元位置のピクセル値の第2の対応関係を決定し、前記第1の対応関係と前記第2の対応関係を利用して、前記第2の入力画像のピクセル値を前記第1の入力画像のピクセル値に変換する画像変換部をさらに有する、
請求項1記載の画像処理装置。 - 対象物体が写った画像を入力する画像入力ステップと、
3次元モデルの形状を表す情報と、前記3次元モデル上の同一平面上に存在しない4点以上の基準特徴点の3次元位置を格納する格納ステップと、
前記対象物体に関し、かつ、前記複数の基準特徴点に対応する複数の特徴点を、前記入力画像から抽出する抽出ステップと、
(1)前記基準特徴点と関連付けされ、(2)前記3次元モデル上に存在する複数の局所的な領域である複数の注目領域を設定する設定ステップと、
前記抽出された特徴点と、前記注目領域に関する基準特徴点とを用いて、前記入力画像の2次元位置と前記注目領域の3次元位置との対応関係を、前記注目領域毎に求める計算ステップと、
前記注目領域毎の対応関係に基づいて、前記入力画像の各領域に少なくとも一つの前記注目領域をそれぞれ対応させて、前記注目領域に対応する3次元モデルの3次元位置のピクセル値を、前記入力画像の2次元位置のピクセル値に決定する決定ステップと、
を有する画像処理方法。 - 対象物体が写った画像を入力する画像入力機能と、
3次元モデルの形状を表す情報と、前記3次元モデル上の同一平面上に存在しない4点以上の基準特徴点の3次元位置を格納する格納機能と、
前記対象物体に関し、かつ、前記複数の基準特徴点に対応する複数の特徴点を、前記入力画像から抽出する抽出機能と、
(1)前記基準特徴点と関連付けされ、(2)前記3次元モデル上に存在する複数の局所的な領域である複数の注目領域を設定する設定機能と、
前記抽出された特徴点と、前記注目領域に関する基準特徴点とを用いて、前記入力画像の2次元位置と前記注目領域の3次元位置との対応関係を、前記注目領域毎に求める計算機能と、
前記注目領域毎の対応関係に基づいて、前記入力画像の各領域に少なくとも一つの前記注目領域をそれぞれ対応させて、前記注目領域に対応する3次元モデルの3次元位置のピクセル値を、前記入力画像の2次元位置のピクセル値に決定する決定機能と、
をコンピュータに実現させるための画像処理プログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007183610A JP4950787B2 (ja) | 2007-07-12 | 2007-07-12 | 画像処理装置及びその方法 |
| US12/171,473 US8086027B2 (en) | 2007-07-12 | 2008-07-11 | Image processing apparatus and method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007183610A JP4950787B2 (ja) | 2007-07-12 | 2007-07-12 | 画像処理装置及びその方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2009020761A JP2009020761A (ja) | 2009-01-29 |
| JP4950787B2 true JP4950787B2 (ja) | 2012-06-13 |
Family
ID=40360341
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007183610A Expired - Fee Related JP4950787B2 (ja) | 2007-07-12 | 2007-07-12 | 画像処理装置及びその方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US8086027B2 (ja) |
| JP (1) | JP4950787B2 (ja) |
Families Citing this family (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101793273B (zh) | 2009-01-30 | 2017-05-17 | 日立汽车系统株式会社 | 缸装置 |
| CN102460514A (zh) * | 2009-06-18 | 2012-05-16 | 皇家飞利浦电子股份有限公司 | 成像程序规划 |
| WO2011003171A1 (en) * | 2009-07-08 | 2011-01-13 | Smart Technologies Ulc | Three-dimensional widget manipulation on a multi-touch panel |
| CN103220974A (zh) * | 2010-07-21 | 2013-07-24 | 阿敏·E·莫尔勒 | 图像报告方法 |
| US8334985B2 (en) * | 2010-10-08 | 2012-12-18 | Omron Corporation | Shape measuring apparatus and shape measuring method |
| US8721567B2 (en) * | 2010-12-27 | 2014-05-13 | Joseph Ralph Ferrantelli | Mobile postural screening method and system |
| US9788759B2 (en) * | 2010-12-27 | 2017-10-17 | Joseph Ralph Ferrantelli | Method and system for postural analysis and measuring anatomical dimensions from a digital three-dimensional image on a mobile device |
| US9801550B2 (en) * | 2010-12-27 | 2017-10-31 | Joseph Ralph Ferrantelli | Method and system for measuring anatomical dimensions from a digital photograph on a mobile device |
| JP6131149B2 (ja) * | 2013-08-26 | 2017-05-17 | 富士フイルム株式会社 | 画像処理装置、方法およびプログラム |
| JP6424822B2 (ja) * | 2013-08-29 | 2018-11-21 | 日本電気株式会社 | 画像処理装置、画像処理方法、及びプログラム |
| KR102077260B1 (ko) * | 2014-08-08 | 2020-02-13 | 삼성전자주식회사 | 확룔 모델에 기반한 신뢰도를 이용하여 얼굴을 인식하는 방법 및 장치 |
| JP6543062B2 (ja) * | 2015-03-23 | 2019-07-10 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
| JP6348093B2 (ja) * | 2015-11-06 | 2018-06-27 | ファナック株式会社 | 入力データから検出対象物の像を検出する画像処理装置および方法 |
| JP6874772B2 (ja) * | 2016-11-25 | 2021-05-19 | 日本電気株式会社 | 画像生成装置、画像生成方法、およびプログラム |
| KR102565755B1 (ko) * | 2018-02-23 | 2023-08-11 | 삼성전자주식회사 | 얼굴의 특징점의 움직임에 따라 모션이 수행된 아바타를 표시하는 전자 장치와 이의 동작 방법 |
| CA3042819C (en) | 2018-05-09 | 2026-02-03 | Postureco, Inc. | Method and system for postural analysis and measuring anatomical dimensions from a digital image using machine learning |
| CN108717719A (zh) * | 2018-05-23 | 2018-10-30 | 腾讯科技(深圳)有限公司 | 卡通人脸图像的生成方法、装置及计算机存储介质 |
| CN109583406B (zh) * | 2018-12-06 | 2022-09-27 | 中山大学 | 基于特征关注机制的人脸表情识别方法 |
| US11610305B2 (en) | 2019-10-17 | 2023-03-21 | Postureco, Inc. | Method and system for postural analysis and measuring anatomical dimensions from a radiographic image using machine learning |
| CN111159976B (zh) * | 2019-12-18 | 2025-04-08 | 腾讯科技(深圳)有限公司 | 文本位置标注方法、装置 |
| CN113661513B (zh) * | 2019-12-27 | 2025-03-28 | 深圳市卓驭科技有限公司 | 一种图像处理方法、设备、图像处理系统及存储介质 |
| CN112669198A (zh) * | 2020-10-29 | 2021-04-16 | 北京达佳互联信息技术有限公司 | 图像特效的处理方法、装置、电子设备和存储介质 |
| CN112598808B (zh) * | 2020-12-23 | 2024-04-02 | 深圳大学 | 数据处理方法、装置、电子设备和存储介质 |
| CN116704555B (zh) * | 2023-08-09 | 2023-10-13 | 四川大学 | 基于姿态调整的小熊猫识别方法及系统 |
| CN117522951B (zh) * | 2023-12-29 | 2024-04-09 | 深圳市朗诚科技股份有限公司 | 鱼类监测方法、装置、设备及存储介质 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001283216A (ja) * | 2000-04-03 | 2001-10-12 | Nec Corp | 画像照合装置、画像照合方法、及びそのプログラムを記録した記録媒体 |
| JP4167390B2 (ja) * | 2000-11-20 | 2008-10-15 | 日本電気株式会社 | 物体照合方法,物体照合装置,およびそのプログラムを記録した記録媒体 |
| JP4161659B2 (ja) * | 2002-02-27 | 2008-10-08 | 日本電気株式会社 | 画像認識システム及びその認識方法並びにプログラム |
| JP2006227739A (ja) * | 2005-02-15 | 2006-08-31 | Toyota Motor Corp | 画像処理装置及び画像処理方法 |
| JP4653606B2 (ja) * | 2005-05-23 | 2011-03-16 | 株式会社東芝 | 画像認識装置、方法およびプログラム |
| JP4774818B2 (ja) * | 2005-06-07 | 2011-09-14 | トヨタ自動車株式会社 | 画像処理装置及び画像処理方法 |
| JP4691158B2 (ja) * | 2005-06-16 | 2011-06-01 | ストライダー ラブス,インコーポレイテッド | 三次元クラスモデルを用いた二次元画像における認識システムおよび方法 |
| KR100785594B1 (ko) * | 2005-06-17 | 2007-12-13 | 오므론 가부시키가이샤 | 화상 처리 장치 |
| JP4991317B2 (ja) * | 2006-02-06 | 2012-08-01 | 株式会社東芝 | 顔特徴点検出装置及びその方法 |
-
2007
- 2007-07-12 JP JP2007183610A patent/JP4950787B2/ja not_active Expired - Fee Related
-
2008
- 2008-07-11 US US12/171,473 patent/US8086027B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US20090262989A1 (en) | 2009-10-22 |
| US8086027B2 (en) | 2011-12-27 |
| JP2009020761A (ja) | 2009-01-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4950787B2 (ja) | 画像処理装置及びその方法 | |
| JP4829141B2 (ja) | 視線検出装置及びその方法 | |
| JP4653606B2 (ja) | 画像認識装置、方法およびプログラム | |
| CN110147721B (zh) | 一种三维人脸识别方法、模型训练方法和装置 | |
| Hasler et al. | Estimating body shape of dressed humans | |
| KR101980503B1 (ko) | 신체 이미징 | |
| EP3241151B1 (en) | An image face processing method and apparatus | |
| JP4951498B2 (ja) | 顔画像認識装置、顔画像認識方法、顔画像認識プログラムおよびそのプログラムを記録した記録媒体 | |
| JP6207210B2 (ja) | 情報処理装置およびその方法 | |
| CN103425964B (zh) | 图像处理设备和图像处理方法 | |
| CN111553284B (zh) | 人脸图像处理方法、装置、计算机设备和存储介质 | |
| WO2009091029A1 (ja) | 顔姿勢推定装置、顔姿勢推定方法、及び、顔姿勢推定プログラム | |
| WO2017029488A2 (en) | Methods of generating personalized 3d head models or 3d body models | |
| CN110675487A (zh) | 基于多角度二维人脸的三维人脸建模、识别方法及装置 | |
| JP2017016192A (ja) | 立体物検知装置及び立体物認証装置 | |
| CN104123749A (zh) | 一种图像处理方法及系统 | |
| JP4284664B2 (ja) | 三次元形状推定システム及び画像生成システム | |
| JP2005339288A (ja) | 画像処理装置及びその方法 | |
| JP2012185545A (ja) | 顔画像処理装置 | |
| Kang et al. | Appearance-based structure from motion using linear classes of 3-d models | |
| US11361467B2 (en) | Pose selection and animation of characters using video data and training techniques | |
| JP4814666B2 (ja) | 顔解析システム | |
| Lefevre et al. | Structure and appearance features for robust 3d facial actions tracking | |
| JP2009043065A (ja) | 顔認証装置 | |
| JP7326965B2 (ja) | 画像処理装置、画像処理プログラム、及び画像処理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100527 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110912 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110927 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111128 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120309 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |
