JP4505616B2 - 固有空間学習装置、固有空間学習方法及び固有空間プログラム - Google Patents
固有空間学習装置、固有空間学習方法及び固有空間プログラム Download PDFInfo
- Publication number
- JP4505616B2 JP4505616B2 JP2004355921A JP2004355921A JP4505616B2 JP 4505616 B2 JP4505616 B2 JP 4505616B2 JP 2004355921 A JP2004355921 A JP 2004355921A JP 2004355921 A JP2004355921 A JP 2004355921A JP 4505616 B2 JP4505616 B2 JP 4505616B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- subject
- learning
- images
- eigenspace
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/169—Holistic features and representations, i.e. based on the facial image taken as a whole
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/76—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries based on eigen-space representations, e.g. from pose or different illumination conditions; Shape manifolds
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Description
佐藤洋平他、「SOMによる顔画像自動識別と顔認識への利用」、信学技報 PRMU2003−144、2003年、p.25−p.30
ピングさせた被写体の3次元モデルを作成する第3のステップと、被写体の3次元モデルを用いて撮影角度間の補間角度から見た複数の補間画像を作成する第4のステップと、複数の基準被写体画像及び複数の補間画像からなる学習サンプル画像群を用いて被写体の特徴を表す固有空間を作成する第5のステップと、新たに被写体を撮影した追加学習用画像を取得する第6のステップと、前記追加学習用画像から被写体領域を抽出して置換被写体画像を作成する第7のステップと、前記複数の補間画像の中から前記置換被写体画像に最も近い補間画像を前記置換被写体画像に置き換えることにより前記学習サンプル画像群を更新する第8のステップと、前記第8のステップにおいて更新された学習サンプル画像群を用いて前記固有空間を更新する第9のステップとを含むものである。
次に、頭部領域抽出部22は、推定した3次元位置の周辺に適当な大きさ(例えば、40cm立方)のバウンディング・ボックスを配置し、バウンディング・ボックスの8頂点を下記の式(2)により撮影画像上に投影し、それらの点同士を結んだ凸領域を画像上での頭部領域として基準頭部画像を作成する。
3次元モデル作成部23は、CPU3等から構成され、4枚の基準頭部画像を用いて頭部の近似形状モデルを作成し、作成した近似形状モデルに4枚の基準頭部画像をマッピングする。具体的には、3次元モデル作成部23は、円筒を積み重ねた多段円筒モデルにより人間の頭部形状を近似する。
X=〔x1−c,x2−c,…,xN−c〕 … (4)
Q=XXT … (5)
λiei=Qei … (6)
次に、固有空間作成部26は、累積寄与率により固有空間を表現する次元kを求め、下記の式(7)により各画像を姿勢のパラメータ(例えば、撮影角度)と関連付けて固有空間に投影する。
また、画像取得部21は、例えば、ユーザが追加学習用画像取得指令を入力すると、追加学習用カメラ11により撮影された追加学習用画像を取得する。頭部領域抽出部22は、取得された追加学習用画像から頭部領域を切り出して置換頭部画像を作成する。
次に、画像置き換え部27は、4台の初期学習用カメラ10a〜10dの配置角度(撮影角度)が既知であることを拘束条件として、置換頭部画像との固有空間中でのユークリッド距離の合計が最小となる角度を探索し、当該角度の補間頭部画像を置換頭部画像に置換する。ここで、初期学習用画像だけでなく、各補間画像も角度情報を持っており、角度情報としては、ある初期学習用画像を0度として、そこからの角度情報が用いられ、原点が共通なので相対的でも絶対的でもある。また、上記の探索は、補間画像の中から新たに追加撮影した画像に最も似ている画像を探索することであり、各補間画像は角度情報を持っているので、探索した結果、角度情報も得ることができる。
22 頭部領域抽出部
23 3次元モデル作成部
24 補間画像作成部
25 画像記憶部
26 固有空間作成部
27 画像置き換え部
Claims (7)
- 互いに異なる撮影角度から被写体を撮影した複数の初期学習用画像を取得する取得手段と、
前記複数の初期学習用画像から被写体領域を抽出して複数の基準被写体画像を作成する抽出手段と、
前記複数の基準被写体画像をマッピングさせた被写体の3次元モデルを作成するモデル作成手段と、
前記3次元モデルを用いて前記撮影角度間の補間角度から見た複数の補間画像を作成する補間手段と、
前記複数の基準被写体画像及び前記複数の補間画像からなる学習サンプル画像群を用いて被写体の特徴を表す固有空間を作成する固有空間作成手段とを備え、
前記取得手段は、新たに被写体を撮影した追加学習用画像を取得し、
前記抽出手段は、前記追加学習用画像から被写体領域を抽出して置換被写体画像を作成し、
前記複数の補間画像の中から前記置換被写体画像に最も近い補間画像を前記置換被写体画像に置き換えることにより前記学習サンプル画像群を更新する置き換え手段をさらに備え、
前記固有空間作成手段は、前記置き換え手段により更新された学習サンプル画像群を用いて前記固有空間を更新することを特徴とする固有空間学習装置。 - 前記置き換え手段は、前記複数の補間画像の中から前記固有空間における置換被写体画像との距離が最小となる補間画像を置き換えることを特徴とする請求項1記載の固有空間学習装置。
- 前記モデル作成手段は、前記複数の基準被写体画像を用いて被写体の近似形状モデルを作成し、作成した近似形状モデルに前記基準被写体画像をマッピングすることを特徴とする請求項1〜2のいずれかに記載の固有空間学習装置。
- 前記被写体は、人間の頭部であり、
前記基準被写体画像、前記補間画像及び前記置換被写体画像は、人間の頭部領域を表す基準頭部画像、補間頭部画像及び置換頭部画像であり、
前記固有空間は、顔画像識別に用いられる固有空間であることを特徴とする請求項1〜3のいずれかに記載の固有空間学習装置。 - 前記モデル作成手段は、前記複数の基準被写体画像を用いて被写体の断面を等間隔で推定し、各断面を円で近似した多段円筒モデルを作成し、作成した多段円筒モデルに前記基準被写体画像をマッピングすることを特徴とする請求項4記載の固有空間学習装置。
- 互いに異なる撮影角度から被写体を撮影した複数の初期学習用画像を取得する第1のステップと、
前記複数の初期学習用画像から被写体領域を抽出して複数の基準被写体画像を作成する第2のステップと、
前記複数の基準被写体画像をマッピングさせた被写体の3次元モデルを作成する第3のステップと、
前記3次元モデルを用いて前記撮影角度間の補間角度から見た複数の補間画像を作成する第4のステップと、
前記複数の基準被写体画像及び前記複数の補間画像からなる学習サンプル画像群を用いて被写体の特徴を表す固有空間を作成する第5のステップと、
新たに被写体を撮影した追加学習用画像を取得する第6のステップと、
前記追加学習用画像から被写体領域を抽出して置換被写体画像を作成する第7のステップと、
前記複数の補間画像の中から前記置換被写体画像に最も近い補間画像を前記置換被写体画像に置き換えることにより前記学習サンプル画像群を更新する第8のステップと、
前記第8のステップにおいて更新された学習サンプル画像群を用いて前記固有空間を更新する第9のステップとを含むことを特徴とする固有空間学習方法。 - 互いに異なる撮影角度から被写体を撮影した複数の初期学習用画像を取得する取得手段と、
前記複数の初期学習用画像から被写体領域を抽出して複数の基準被写体画像を作成する抽出手段と、
前記複数の基準被写体画像をマッピングさせた被写体の3次元モデルを作成するモデル作成手段と、
前記3次元モデルを用いて前記撮影角度間の補間角度から見た複数の補間画像を作成する補間手段と、
前記複数の基準被写体画像及び前記複数の補間画像からなる学習サンプル画像群を用いて被写体の特徴を表す固有空間を作成する固有空間作成手段としてコンピュータを機能させ、
前記取得手段は、新たに被写体を撮影した追加学習用画像を取得し、
前記抽出手段は、前記追加学習用画像から被写体領域を抽出して置換被写体画像を作成し、
前記複数の補間画像の中から前記置換被写体画像に最も近い補間画像を前記置換被写体画像に置き換えることにより前記学習サンプル画像群を更新する置き換え手段として前記コンピュータをさらに機能させ、
前記固有空間作成手段は、前記置き換え手段により更新された学習サンプル画像群を用いて前記固有空間を更新することを特徴とする固有空間学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004355921A JP4505616B2 (ja) | 2004-12-08 | 2004-12-08 | 固有空間学習装置、固有空間学習方法及び固有空間プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004355921A JP4505616B2 (ja) | 2004-12-08 | 2004-12-08 | 固有空間学習装置、固有空間学習方法及び固有空間プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006163950A JP2006163950A (ja) | 2006-06-22 |
JP4505616B2 true JP4505616B2 (ja) | 2010-07-21 |
Family
ID=36665890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004355921A Expired - Fee Related JP4505616B2 (ja) | 2004-12-08 | 2004-12-08 | 固有空間学習装置、固有空間学習方法及び固有空間プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4505616B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI801936B (zh) * | 2020-07-27 | 2023-05-11 | 日商威亞視股份有限公司 | 資訊處理裝置、3d模型生成方法、及程式 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5403779B2 (ja) * | 2008-04-24 | 2014-01-29 | パナソニック株式会社 | 照明システム |
JP5248992B2 (ja) * | 2008-11-17 | 2013-07-31 | Kddi株式会社 | 3次元物体モデル情報生成装置及びプログラム |
KR101467307B1 (ko) | 2013-08-19 | 2014-12-01 | 성균관대학교산학협력단 | 인공 신경망 모델을 이용한 보행자 계수 방법 및 장치 |
JP6446971B2 (ja) * | 2014-10-06 | 2019-01-09 | 日本電気株式会社 | データ処理装置、データ処理方法、及び、コンピュータ・プログラム |
JP7482758B2 (ja) | 2020-11-19 | 2024-05-14 | 株式会社日立製作所 | 画像学習装置及び画像学習方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000306095A (ja) * | 1999-04-16 | 2000-11-02 | Fujitsu Ltd | 画像照合・検索システム |
JP2003346158A (ja) * | 2002-05-28 | 2003-12-05 | Toshiba Corp | 顔画像による顔領域追跡方法 |
-
2004
- 2004-12-08 JP JP2004355921A patent/JP4505616B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000306095A (ja) * | 1999-04-16 | 2000-11-02 | Fujitsu Ltd | 画像照合・検索システム |
JP2003346158A (ja) * | 2002-05-28 | 2003-12-05 | Toshiba Corp | 顔画像による顔領域追跡方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI801936B (zh) * | 2020-07-27 | 2023-05-11 | 日商威亞視股份有限公司 | 資訊處理裝置、3d模型生成方法、及程式 |
Also Published As
Publication number | Publication date |
---|---|
JP2006163950A (ja) | 2006-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6560480B2 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
CN109727303B (zh) | 视频展示方法、系统、计算机设备、存储介质和终端 | |
US8861800B2 (en) | Rapid 3D face reconstruction from a 2D image and methods using such rapid 3D face reconstruction | |
JP4950787B2 (ja) | 画像処理装置及びその方法 | |
US10580205B2 (en) | 3D model generating system, 3D model generating method, and program | |
JP4284664B2 (ja) | 三次元形状推定システム及び画像生成システム | |
US7925048B2 (en) | Feature point detecting device, feature point detecting method, and feature point detecting program | |
JP6207210B2 (ja) | 情報処理装置およびその方法 | |
JP4321350B2 (ja) | パラメタ推定方法、パラメタ推定装置および照合方法 | |
US20150243035A1 (en) | Method and device for determining a transformation between an image coordinate system and an object coordinate system associated with an object of interest | |
JP6196416B1 (ja) | 3次元モデル生成システム、3次元モデル生成方法、及びプログラム | |
JP2006520055A (ja) | 2次元画像からの3次元オブジェクトの不変視点検出および識別 | |
CN104123749A (zh) | 一种图像处理方法及系统 | |
WO2018075053A1 (en) | Object pose based on matching 2.5d depth information to 3d information | |
US20200057778A1 (en) | Depth image pose search with a bootstrapped-created database | |
CN113628327A (zh) | 一种头部三维重建方法及设备 | |
KR101478709B1 (ko) | Rgb-d 영상 특징점 추출 및 특징 기술자 생성 방법 및 장치 | |
US11816854B2 (en) | Image processing apparatus and image processing method | |
JP4505616B2 (ja) | 固有空間学習装置、固有空間学習方法及び固有空間プログラム | |
US11417063B2 (en) | Determining a three-dimensional representation of a scene | |
JP2017122993A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6717049B2 (ja) | 画像解析装置、画像解析方法およびプログラム | |
KR20200071008A (ko) | 2차원 이미지 처리 방법 및 이 방법을 실행하는 디바이스 | |
KR102218095B1 (ko) | 인물 및 평면 인식을 이용한 증강 현실 구현 방법 및 위 방법을 위한 명령어들이 저장된 컴퓨터 판독 가능한 저장 매체 | |
WO2022102015A1 (ja) | 画像情報取得装置、画像情報取得方法及びコンピュータープログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070131 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100330 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100405 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140514 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |