JP4486594B2 - 確率的外観集合体を使用するビデオに基づく顔認識 - Google Patents
確率的外観集合体を使用するビデオに基づく顔認識 Download PDFInfo
- Publication number
- JP4486594B2 JP4486594B2 JP2005502285A JP2005502285A JP4486594B2 JP 4486594 B2 JP4486594 B2 JP 4486594B2 JP 2005502285 A JP2005502285 A JP 2005502285A JP 2005502285 A JP2005502285 A JP 2005502285A JP 4486594 B2 JP4486594 B2 JP 4486594B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- posture
- recognition
- recognition image
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 42
- 230000006870 function Effects 0.000 claims 1
- 230000036544 posture Effects 0.000 description 60
- 238000012549 training Methods 0.000 description 49
- 230000008569 process Effects 0.000 description 21
- 230000008859 change Effects 0.000 description 19
- 230000007704 transition Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 14
- 238000005192 partition Methods 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 8
- 230000004044 response Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 238000000513 principal component analysis Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000031836 visual learning Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/169—Holistic features and representations, i.e. based on the facial image taken as a whole
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Collating Specific Patterns (AREA)
Description
Sk={I1,I2,...,Il} (1)
一実施例では、最小距離は、数式(6)〜(8)として表される。
Claims (12)
- 第1の認識画像は第1の姿勢の対象個人の第1の画像を含むものであり、前記第1の認識画像が1回目に取り込まれるものであり、一連の認識用画像から前記第1の認識画像を受ける工程と、
第2の認識画像は第2の姿勢の前記対象個人の第2の画像を含むものであり、前記第2の認識画像が2回目に取り込まれるものであり、前記一連の認識用画像から前記第2の認識画像を受ける工程と、
前記第1の画像に基づいて決定した前記対象個人の識別候補を含む第1の識別情報を生成する工程と、
前記第1の識別情報、および前記一連の認識用画像において前記第2の姿勢が前記第1の姿勢に続く確率に基づいて変更を加えた前記対象個人の識別候補を含む第2の識別情報を生成する工程とを含むことを特徴とする、対象個人を認識するためにコンピュータが実行する方法。 - 前記第2の姿勢は、第1の姿勢に対して二次元回転した顔の位置であることを特徴とする請求項1に記載の方法。
- 前記第2の姿勢は、前記第1の姿勢に対して三次元回転した顔の位置であることを特徴とする請求項1に記載の方法。
- コンピュータに、
第1の認識画像は第1の姿勢の対象個人の第1の画像を含むものであり、前記第1の認識画像が1回目に取り込まれるものであり、一連の認識用画像から前記第1の認識画像を受ける工程と、
第2の認識画像は第2の姿勢の前記対象個人の第2の画像を含むものであり、前記第2の認識画像が2回目に取り込まれるものであり、前記一連の認識用画像から前記第2の認識画像を受ける工程と、
前記第1の画像に基づいて決定した前記対象個人の識別候補を含む第1の識別情報を生成する工程と、
前記第1の識別情報、および前記一連の認識用画像において前記第2の姿勢が前記第1の姿勢に続く確率に基づいて変更を加えた前記対象個人の識別候補を含む第2の識別情報を生成する工程とを実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 前記第2の姿勢は、第1の姿勢に対して二次元回転した顔の位置であることを特徴とする請求項4に記載のコンピュータ読み取り可能な記録媒体。
- 前記第2の姿勢は、前記第1の姿勢に対して三次元回転した顔の位置であることを特徴とする請求項4に記載のコンピュータ読み取り可能な記録媒体。
- コンピュータに、
一連の認識用画像から第1の認識画像を受け、前記第1の認識画像は第1の姿勢の前記対象個人の第1の画像を含むものであり、前記第1の認識画像が1回目に取り込まれるものであり、および前記一連の認識用画像から第2の認識画像を受け、前記第2の認識画像は第2の姿勢の前記対象個人の第2の画像を含むものであり、前記第2の認識画像が2回目に取り込まれるものである、メモリに記憶されたビデオバッファと、
前記第1の画像に基づいて決定した前記対象個人の識別候補を含む第1の識別情報を生成し、前記第1の識別情報、および前記一連の認識用画像において前記第2の姿勢が前記第1の姿勢に続く確率に基づいて変更を加えた前記対象個人の識別候補を含む第2の識別情報を生成する、前記メモリに記憶された識別モジュールとを実現する、対象個人を認識するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 前記第2の姿勢は、第1の姿勢に対して二次元回転した顔の位置であることを特徴とする請求項7に記載のコンピュータ読み取り可能な記録媒体。
- 前記第2の姿勢は、前記第1の姿勢に対して三次元回転した顔の位置であることを特徴とする請求項7に記載のコンピュータ読み取り可能な記録媒体。
- コンピュータを、
一連の認識用画像から第1の認識画像を受け、前記第1の認識画像は第1の姿勢の前記対象個人の第1の画像を含むものであり、前記第1の認識画像が1回目に取り込まれるものであり、および前記一連の認識用画像から第2の認識画像を受け、前記第2の認識画像は第2の姿勢の前記対象個人の第2の画像を含むものであり、前記第2の認識画像が2回目に取り込まれるものである、メモリに記憶されたバッファ手段と、
前記第1の画像に基づいて決定した前記対象個人の識別候補を含む第1の識別情報を生成し、前記第1の識別情報、および前記一連の認識用画像において前記第2の姿勢が前記第1の姿勢に続く確率に基づいて変更を加えた前記対象個人の識別候補を含む第2の識別情報を生成する、前記メモリに記憶された識別手段として機能させる、対象個人を認識するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 前記第2の姿勢は、第1の姿勢に対して二次元回転した顔の位置であることを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
- 前記第2の姿勢は、前記第1の姿勢に対して三次元回転した顔の位置であることを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US42521402P | 2002-11-07 | 2002-11-07 | |
US47864403P | 2003-06-12 | 2003-06-12 | |
PCT/US2003/035496 WO2004042539A2 (en) | 2002-11-07 | 2003-11-06 | Video-based face recognition using probabilistic appearance manifolds |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006505875A JP2006505875A (ja) | 2006-02-16 |
JP4486594B2 true JP4486594B2 (ja) | 2010-06-23 |
Family
ID=32314578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005502285A Expired - Fee Related JP4486594B2 (ja) | 2002-11-07 | 2003-11-06 | 確率的外観集合体を使用するビデオに基づく顔認識 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7499574B1 (ja) |
EP (1) | EP1565887A4 (ja) |
JP (1) | JP4486594B2 (ja) |
AU (1) | AU2003301795A1 (ja) |
WO (1) | WO2004042539A2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5127583B2 (ja) * | 2008-06-20 | 2013-01-23 | 株式会社豊田中央研究所 | 対象物判定装置及びプログラム |
US9405995B2 (en) * | 2008-07-14 | 2016-08-02 | Lockheed Martin Corporation | Method and apparatus for facial identification |
GB2462851B (en) | 2008-08-21 | 2010-09-15 | 4Sight Imaging Ltd | Image processing |
US9202140B2 (en) * | 2008-09-05 | 2015-12-01 | Siemens Medical Solutions Usa, Inc. | Quotient appearance manifold mapping for image classification |
TWI382354B (zh) * | 2008-12-02 | 2013-01-11 | Nat Univ Tsing Hua | 臉部辨識方法 |
US11080513B2 (en) | 2011-01-12 | 2021-08-03 | Gary S. Shuster | Video and still image data alteration to enhance privacy |
US8744119B2 (en) * | 2011-01-12 | 2014-06-03 | Gary S. Shuster | Graphic data alteration to enhance online privacy |
US9020192B2 (en) | 2012-04-11 | 2015-04-28 | Access Business Group International Llc | Human submental profile measurement |
US8953843B1 (en) * | 2012-07-17 | 2015-02-10 | Google Inc. | Selecting objects in a sequence of images |
US8977003B1 (en) * | 2012-07-17 | 2015-03-10 | Google Inc. | Detecting objects in a sequence of images |
US9558396B2 (en) | 2013-10-22 | 2017-01-31 | Samsung Electronics Co., Ltd. | Apparatuses and methods for face tracking based on calculated occlusion probabilities |
US9721079B2 (en) | 2014-01-15 | 2017-08-01 | Steve Y Chen | Image authenticity verification using speech |
US9483997B2 (en) | 2014-03-10 | 2016-11-01 | Sony Corporation | Proximity detection of candidate companion display device in same room as primary display using infrared signaling |
US9696414B2 (en) | 2014-05-15 | 2017-07-04 | Sony Corporation | Proximity detection of candidate companion display device in same room as primary display using sonic signaling |
US10070291B2 (en) | 2014-05-19 | 2018-09-04 | Sony Corporation | Proximity detection of candidate companion display device in same room as primary display using low energy bluetooth |
US9594949B1 (en) * | 2015-08-31 | 2017-03-14 | Xerox Corporation | Human identity verification via automated analysis of facial action coding system features |
US10474908B2 (en) * | 2017-07-06 | 2019-11-12 | GM Global Technology Operations LLC | Unified deep convolutional neural net for free-space estimation, object detection and object pose estimation |
US10896318B2 (en) * | 2017-09-09 | 2021-01-19 | Apple Inc. | Occlusion detection for facial recognition processes |
US11853390B1 (en) * | 2018-08-03 | 2023-12-26 | Amazon Technologies, Inc. | Virtual/augmented reality data evaluation |
GB2583101B (en) * | 2019-04-16 | 2021-05-19 | Sony Interactive Entertainment Inc | Video processing |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5164992A (en) * | 1990-11-01 | 1992-11-17 | Massachusetts Institute Of Technology | Face recognition system |
GB9123210D0 (en) * | 1991-11-01 | 1991-12-18 | Marconi Gec Ltd | Filter |
JPH07302327A (ja) * | 1993-08-11 | 1995-11-14 | Nippon Telegr & Teleph Corp <Ntt> | 物体画像検出方法及び検出装置 |
US6188776B1 (en) * | 1996-05-21 | 2001-02-13 | Interval Research Corporation | Principle component analysis of images for the automatic location of control points |
JPH1013832A (ja) * | 1996-06-25 | 1998-01-16 | Nippon Telegr & Teleph Corp <Ntt> | 動画像認識方法および動画像認識検索方法 |
US6144755A (en) * | 1996-10-11 | 2000-11-07 | Mitsubishi Electric Information Technology Center America, Inc. (Ita) | Method and apparatus for determining poses |
JP3943223B2 (ja) * | 1997-02-12 | 2007-07-11 | 富士通株式会社 | 候補テーブルを用いて分類を行うパターン認識装置および方法 |
JPH1125269A (ja) * | 1997-07-02 | 1999-01-29 | Sanyo Electric Co Ltd | 顔画像認識装置及びその方法 |
US6272231B1 (en) * | 1998-11-06 | 2001-08-07 | Eyematic Interfaces, Inc. | Wavelet-based facial motion capture for avatar animation |
JP2000099722A (ja) * | 1998-09-22 | 2000-04-07 | Toshiba Corp | 人物顔認識装置及び人物顔認識方法 |
JP2000163396A (ja) * | 1998-11-25 | 2000-06-16 | Nippon Telegr & Teleph Corp <Ntt> | クラス数未知のデータのクラスタリング装置および方法と該方法を実施するプログラムを記録した記録媒体 |
JP2000220333A (ja) * | 1999-01-29 | 2000-08-08 | Toshiba Corp | 人物認証装置およびその方法 |
US7117157B1 (en) * | 1999-03-26 | 2006-10-03 | Canon Kabushiki Kaisha | Processing apparatus for determining which person in a group is speaking |
US6741756B1 (en) | 1999-09-30 | 2004-05-25 | Microsoft Corp. | System and method for estimating the orientation of an object |
JP4092059B2 (ja) * | 2000-03-03 | 2008-05-28 | 日本放送協会 | 画像認識装置 |
JP2001331799A (ja) * | 2000-03-16 | 2001-11-30 | Toshiba Corp | 画像処理装置および画像処理方法 |
US6671391B1 (en) * | 2000-05-26 | 2003-12-30 | Microsoft Corp. | Pose-adaptive face detection system and process |
WO2002039371A2 (en) * | 2000-11-03 | 2002-05-16 | Koninklijke Philips Electronics N.V. | Estimation of facial expression intensity using a bidirectional star topology hidden markov model |
US7330566B2 (en) * | 2003-05-15 | 2008-02-12 | Microsoft Corporation | Video-based gait recognition |
-
2003
- 2003-11-06 AU AU2003301795A patent/AU2003301795A1/en not_active Abandoned
- 2003-11-06 JP JP2005502285A patent/JP4486594B2/ja not_active Expired - Fee Related
- 2003-11-06 US US10/703,288 patent/US7499574B1/en active Active
- 2003-11-06 WO PCT/US2003/035496 patent/WO2004042539A2/en active Application Filing
- 2003-11-06 EP EP03810049A patent/EP1565887A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP1565887A2 (en) | 2005-08-24 |
JP2006505875A (ja) | 2006-02-16 |
WO2004042539A9 (en) | 2005-07-21 |
WO2004042539A3 (en) | 2004-09-02 |
AU2003301795A8 (en) | 2004-06-07 |
AU2003301795A1 (en) | 2004-06-07 |
US20090041310A1 (en) | 2009-02-12 |
US7499574B1 (en) | 2009-03-03 |
WO2004042539A2 (en) | 2004-05-21 |
EP1565887A4 (en) | 2009-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4486594B2 (ja) | 確率的外観集合体を使用するビデオに基づく顔認識 | |
Portmann et al. | People detection and tracking from aerial thermal views | |
Lee et al. | Video-based face recognition using probabilistic appearance manifolds | |
US7912253B2 (en) | Object recognition method and apparatus therefor | |
JP4479478B2 (ja) | パターン認識方法および装置 | |
JP6018674B2 (ja) | 被写体再識別のためのシステム及び方法 | |
US9898677B1 (en) | Object-level grouping and identification for tracking objects in a video | |
JP5642410B2 (ja) | 顔認識装置及び顔認識方法 | |
US9098760B2 (en) | Face recognizing apparatus and face recognizing method | |
US8553931B2 (en) | System and method for adaptively defining a region of interest for motion analysis in digital video | |
US7957560B2 (en) | Unusual action detector and abnormal action detecting method | |
US20100296706A1 (en) | Image recognition apparatus for identifying facial expression or individual, and method for the same | |
JP7447302B2 (ja) | デバイスのハンドジェスチャベースの制御のための方法及びシステム | |
JP2014093023A (ja) | 物体検出装置、物体検出方法及びプログラム | |
US11151412B2 (en) | Systems and methods for determining actions performed by objects within images | |
Garcia-Bunster et al. | Crowded pedestrian counting at bus stops from perspective transformations of foreground areas | |
Alqahtani et al. | 3D face tracking using stereo cameras: A review | |
WO2018050644A1 (en) | Method, computer system and program product for detecting video surveillance camera tampering | |
US10990859B2 (en) | Method and system to allow object detection in visual images by trainable classifiers utilizing a computer-readable storage medium and processing unit | |
Thabet et al. | Algorithm of local features fusion and modified covariance-matrix technique for hand motion position estimation and hand gesture trajectory tracking approach | |
Miramontes-Jaramillo et al. | Descriptor-based tracking algorithm using a depth camera | |
Granger et al. | Survey of academic research and prototypes for face recognition in video | |
KR102443330B1 (ko) | 치아 기반 개인 식별 장치 및 방법 | |
US20240152549A1 (en) | Image processing apparatus for search of an image, image processing method and storage medium | |
Sajid | Robust background subtraction for moving cameras and their applications in Ego-vision systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091102 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100309 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130402 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |