JP4575917B2 - 構成要素に基づいて構成された物体を識別するシステムを訓練するシステム、方法及びプログラム - Google Patents
構成要素に基づいて構成された物体を識別するシステムを訓練するシステム、方法及びプログラム Download PDFInfo
- Publication number
- JP4575917B2 JP4575917B2 JP2006517819A JP2006517819A JP4575917B2 JP 4575917 B2 JP4575917 B2 JP 4575917B2 JP 2006517819 A JP2006517819 A JP 2006517819A JP 2006517819 A JP2006517819 A JP 2006517819A JP 4575917 B2 JP4575917 B2 JP 4575917B2
- Authority
- JP
- Japan
- Prior art keywords
- component
- classifier
- components
- recognition classifier
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 50
- 238000012549 training Methods 0.000 title claims description 30
- 239000013598 vector Substances 0.000 claims description 22
- 238000002790 cross-validation Methods 0.000 claims description 6
- 230000001815 facial effect Effects 0.000 description 12
- 230000015654 memory Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002360 prefrontal effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/772—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
この出願は、ここで参照によって引用されている、次の米国仮特許出願に基づいて優先権を主張する:シリアル番号60/484,201、2003年6月30日出願、題名“エクスペクテーション・マクシマイゼーション・オブ・プリフロンタル−スーペリアー・テンポラル・ネットワーク・バイ・インディケータ・コンポーネント−ベースト・アプローチ”(Serial No. 60/484,201, filed on June 30, 2003, entitled “Expectation Maximization of Prefrontal-Superior Temporal Network by Indicator Component-Based Approach.”)
1.発明の分野
本発明は構成要素に基づいた物体の同一性確認システムに関する。より具体的には、本発明は構成要素に基づいた顔認識システムの訓練に関する。
顔認識技術は一般に二つのカテゴリに分類される:即ち包括的技術と構成要素に基づく技術である。包括的な方法では、一つの顔のイメージが一つの特徴ベクトルによって表現される。この特徴ベクトルは認識分類器へ入力される。認識分類器は特徴ベクトルに基づいて人物の同一性を決定する。
構成要素に基づいた物体の同一性確認システムにとって、どの構成要素がシステムの訓練に事例として使用されるかが、いずれの場合も重要である。ある特定の物体を他から区別する際に、構成要素はシステムの精度を最大化する必要がある。構成要素に基づいた顔認識システムを訓練するために、事例として用いる構成要素を決定する、システムと方法が提示される。
同じ番号が類似の要素を指示している添付の図面の図によって、本発明は説明のために図示されているのであって、限定するためではない。
物体検出分野は、イメージに基づいて、特定のタイプの物体が現存するかの決定を扱う。物体のタイプは、例えば、自動車、動物あるいは人物である。物体検出システムは一つのイメージに対してバイナリ分類を実行する。検出分類は異なるタイプの物体を区別する。具体的には、検出分類は1)特定のタイプの物体(第一のクラス)と2)特定のタイプの物体が無い場合(第二のクラス)を区別する。
以下の説明は顔認識システムに言及するものであるが、このシステムはどのようなタイプの物体を検出するためにも使用できる。物体のクラスは、例えば、自動車、動物および人を含むことが可能である。
図1は本発明の一つの実施形態による、構成要素に基づいた技術を使用する顔認識を実行するためのシステムのブロック図である。顔認識器100は特定の人の同一性を確認できる多数クラスの分類器である。顔認識器100は一つ以上の構成要素認識分類器110を含む。図示の実施形態では、顔認識器100はN個の構成要素認識分類器110を含む。
<p11+p21+...+pN1,p12+p22+...+pN2, ...,p1M+p2M+...+pNM>
この実施形態においては、出力130は、和ベクトル内の最大確率に対応する人物になる。
<p11・p21・...・pN1,p12・p22・...・pN2, ...,p1M・p2M・...・pNM>
出力130は、積ベクトル内の最大確率に対応する人物になる。
顔認識器100が顔認識を実行できるようになるには、訓練を受ける必要が有る。具体的には、構成要素認識分類器110が訓練を受ける必要がある。事例からの学習としても知られている教師付き学習を用いて、分類器は訓練を既に受けているので、分類器はタスクを実行できる(例えば、人物の構成要素に基づいてある特定の人物の同一性を確認する)。名称が示唆しているように、事例からなる集合を用いて、分類器は訓練を受ける。個々の事例は、ある特定の入力が与えられた場合に、分類器が何を出力すべきかを表す入出力の一ペアである。
一つの実施形態において、物体の構成要素は自動的に決定され、構成要素に基づいた顔認識システムを訓練するために事例として使用される。この点が、物体の構成要素が手動で選択される先行技術との差異である。
Claims (25)
- コンピュータを用いて構成要素を定める方法であって、
前記構成要素は、
物体の構成要素であって、
物体の構成要素に基づいて前記物体を識別するシステムにおいて使用されるものであり、
前記コンピュータは、
所与の構成要素がどのクラスに属するかを決定する第一の構成要素認識分類器であって、第一の物体領域を表す第一の構成要素に基づいて訓練された第一の構成要素認識分類器の精度を決定し、
前記第一の物体領域よりも大きい拡張構成要素であって、前記第一の物体領域を含む第二の物体領域を表し、前記第一の構成要素よりも大きい複数の拡張構成要素からなる集合を決定し、
特定の構成要素がどのクラスに属するかを決定する第二の構成要素認識分類器であって、前記拡張構成要素に基づいて訓練された第二の構成要素認識分類器の精度を、前記複数の拡張構成要素からなる集合内の拡張構成要素ごとに決定し、
前記第一の構成要素認識分類器及びそれぞれの第二の構成要素認識分類器のうちから、どの構成要素認識分類器が最も精度が高いかを決定し、
前記最も精度が高い構成要素認識分類器を訓練するためにどの構成要素が使用されたかを決定する、
ことを特徴とする方法。 - 前記第一の構成要素は、
イメージであること、
を特徴とする請求項1に記載の方法。 - 前記第一の構成要素は、
特徴ベクトルであること、
を特徴とする請求項1に記載の方法。 - 前記構成要素は、
顔の部分を含み、
前記構成要素の前記クラスは、
特定の人物であること、
を特徴とする請求項1に記載の方法。 - 前記物体を識別するシステムは、
構成要素に基づいた顔認識システムを含むこと、
を特徴とする請求項1に記載の方法。 - 前記複数の拡張構成要素からなる集合を決定することは、
前記第一の構成要素を、上、下、左又は右の4方向のうちの1方向へ拡張することを含むこと、
を特徴とする請求項1に記載の方法。 - 前記第一の構成要素は、
手動で決定されること、
を特徴とする請求項1に記載の方法。 - 前記第一の構成要素は、
構成要素検出器によって自動的に決定されること、
を特徴とする請求項1に記載の方法。 - 構成要素に基づいて訓練された構成要素認識分類器は、
訓練集合を使用して訓練されたものであり、
前記訓練集合は、
構成要素イメージの集合と、
前記構成要素イメージの集合のうちのそれぞれの構成要素イメージごとに、当該構成要素イメージに関連付けられたクラスを含むこと、
を特徴とする請求項1に記載の方法。 - 構成要素イメージは、
イメージから前記構成要素を抽出することによって生成されたものであること、
を特徴とする請求項9に記載の方法。 - 構成要素認識分類器の精度は、
前記構成要素認識分類器の認識率を含むこと、
を特徴とする請求項1に記載の方法。 - 前記構成要素認識分類器の精度を決定することは、
前記構成要素認識分類器を使用して、相互検証集合内の要素を分類すること、
を特徴とする請求項11に記載の方法。 - 前記相互検証集合は、
イメージから前記構成要素を抽出することによって生成された構成要素イメージの集合と、
前記構成要素イメージの集合のうちのそれぞれの構成要素イメージごとに、当該構成要素イメージに関連付けられたクラスを含むこと、
を特徴とする請求項12に記載の方法。 - 構成要素認識分類器の精度は、
前記構成要素認識分類器の予想誤差確率に基づくこと、
を特徴とする請求項1に記載の方法。 - 前記構成要素認識分類器の精度は、
前記構成要素認識分類器の予想誤差確率についての推定上限に基づくこと、
を特徴とする請求項1に記載の方法。 - 構成要素を定めるシステムであって、
前記構成要素は、
物体の構成要素であって、
物体の構成要素に基づいて前記物体を識別するシステムにおいて使用されるものであり、
前記構成要素を定めるシステムは、
所与の構成要素がどのクラスに属するかを決定する第一の構成要素認識分類器であって、第一の物体領域を表す第一の構成要素に基づいて訓練された第一の構成要素認識分類器の精度を決定する手段と、
前記第一の物体領域よりも大きい拡張構成要素であって、前記第一の物体領域を含む第二の物体領域を表し、前記第一の構成要素よりも大きい複数の拡張構成要素からなる集合を決定する手段と、
特定の構成要素がどのクラスに属するかを決定する第二の構成要素認識分類器であって、前記拡張構成要素に基づいて訓練された第二の構成要素認識分類器の精度を、前記複数の拡張構成要素からなる集合内の拡張構成要素ごとに決定する手段と、
前記第一の構成要素認識分類器及びそれぞれの第二の構成要素認識分類器のうちから、どの構成要素認識分類器が最も精度が高いかを決定する手段と、
前記最も精度が高い構成要素認識分類器を訓練するためにどの構成要素が使用されたかを決定する手段と、
を有することを特徴とする構成要素を定めるシステム。 - 前記第一の構成要素は、
イメージであること、
を特徴とする請求項16に記載のシステム。 - 前記第一の構成要素は、
特徴ベクトルであること、
を特徴とする請求項16に記載のシステム。 - 前記構成要素は、
顔の部分を含み、
前記構成要素の前記クラスは、
特定の人物であり、
前記物体を識別するシステムは、
構成要素に基づいた顔認識システムを含むこと、
を特徴とする請求項16に記載のシステム。 - 前記複数の拡張構成要素からなる集合を決定することは、
前記第一の構成要素を、上、下、左又は右の4方向のうちの1方向へ拡張することを含むこと、
を特徴とする請求項16に記載のシステム。 - 構成要素を定めるシステムを機能させるプログラムであって、
前記構成要素は、
物体の構成要素であって、
物体の構成要素に基づいて前記物体を識別するシステムにおいて使用されるものであり、
前記プログラムは、前記コンピュータに対し、
所与の構成要素がどのクラスに属するかを決定する第一の構成要素認識分類器であって、第一の物体領域を表す第一の構成要素に基づいて訓練された第一の構成要素認識分類器の精度を決定し、
前記第一の物体領域よりも大きい拡張構成要素であって、前記第一の物体領域を含む第二の物体領域を表し、前記第一の構成要素よりも大きい複数の拡張構成要素からなる集合を決定し、
特定の構成要素がどのクラスに属するかを決定する第二の構成要素認識分類器であって、前記拡張構成要素に基づいて訓練された第二の構成要素認識分類器の精度を、前記複数の拡張構成要素からなる集合内の拡張構成要素ごとに決定し、
前記第一の構成要素認識分類器及びそれぞれの第二の構成要素認識分類器のうちから、どの構成要素認識分類器が最も精度が高いかを決定し、
前記最も精度が高い構成要素認識分類器を訓練するためにどの構成要素が使用されたかを決定する処理を実行させる、
ことを特徴とするプログラム。 - 前記第一の構成要素は、
イメージであること、
を特徴とする請求項21に記載のプログラム。 - 前記第一の構成要素は、
特徴ベクトルであること、
を特徴とする請求項21に記載のプログラム。 - 前記構成要素は、
顔の部分を含み、
前記構成要素の前記クラスは、
特定の人物であり、
前記物体を識別するシステムは、
構成要素に基づいた顔認識システムを含むこと、
を特徴とする請求項21に記載のプログラム。 - 前記複数の拡張構成要素からなる集合を決定することは、
前記第一の構成要素を、上、下、左又は右の4方向のうちの1方向へ拡張することを含むこと、
を特徴とする請求項21に記載のプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US48420103P | 2003-06-30 | 2003-06-30 | |
PCT/US2004/021158 WO2005006278A2 (en) | 2003-06-30 | 2004-06-30 | Systems and methods for training component-based object identification systems |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007524919A JP2007524919A (ja) | 2007-08-30 |
JP4575917B2 true JP4575917B2 (ja) | 2010-11-04 |
Family
ID=33552096
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006516619A Expired - Fee Related JP4571628B2 (ja) | 2003-06-30 | 2004-06-30 | 顔認識システム及び方法 |
JP2006517819A Expired - Fee Related JP4575917B2 (ja) | 2003-06-30 | 2004-06-30 | 構成要素に基づいて構成された物体を識別するシステムを訓練するシステム、方法及びプログラム |
JP2010161500A Expired - Fee Related JP4972193B2 (ja) | 2003-06-30 | 2010-07-16 | 顔認識システム及び方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006516619A Expired - Fee Related JP4571628B2 (ja) | 2003-06-30 | 2004-06-30 | 顔認識システム及び方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010161500A Expired - Fee Related JP4972193B2 (ja) | 2003-06-30 | 2010-07-16 | 顔認識システム及び方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7783082B2 (ja) |
EP (1) | EP1639522B1 (ja) |
JP (3) | JP4571628B2 (ja) |
DE (1) | DE602004008282T2 (ja) |
WO (1) | WO2005001750A2 (ja) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100543706B1 (ko) * | 2003-11-28 | 2006-01-20 | 삼성전자주식회사 | 비젼기반 사람 검출방법 및 장치 |
US8995715B2 (en) * | 2010-10-26 | 2015-03-31 | Fotonation Limited | Face or other object detection including template matching |
US7197487B2 (en) * | 2005-03-16 | 2007-03-27 | Lg Chem, Ltd. | Apparatus and method for estimating battery state of charge |
JP4410732B2 (ja) * | 2005-07-27 | 2010-02-03 | グローリー株式会社 | 顔画像検出装置、顔画像検出方法および顔画像検出プログラム |
US7817826B2 (en) * | 2005-08-12 | 2010-10-19 | Intelitrac Inc. | Apparatus and method for partial component facial recognition |
CN101030259B (zh) * | 2006-02-28 | 2011-10-26 | 东软集团股份有限公司 | Svm分类器、利用svm分类器识别车辆图像的方法和装置 |
US8315463B2 (en) * | 2006-11-14 | 2012-11-20 | Eastman Kodak Company | User interface for face recognition |
JP5010905B2 (ja) * | 2006-12-13 | 2012-08-29 | パナソニック株式会社 | 顔認証装置 |
US8154600B2 (en) * | 2007-04-20 | 2012-04-10 | Utc Fire & Security Americas Corporation, Inc. | Method and system for distributed multiple target tracking |
CN101373519B (zh) * | 2007-08-20 | 2011-01-19 | 富士通株式会社 | 字符识别装置和方法 |
US7986828B2 (en) * | 2007-10-10 | 2011-07-26 | Honeywell International Inc. | People detection in video and image data |
JP5041229B2 (ja) * | 2007-12-07 | 2012-10-03 | ソニー株式会社 | 学習装置および方法、認識装置および方法、並びにプログラム |
JP5121681B2 (ja) * | 2008-04-30 | 2013-01-16 | 株式会社日立製作所 | 生体認証システム、認証クライアント端末、及び生体認証方法 |
KR101050687B1 (ko) | 2008-06-04 | 2011-07-20 | 주식회사 만도 | 사후확률을 이용한 보행자 인식 장치 및 방법과 그를이용한 보행자 보호 장치 |
TWI382354B (zh) * | 2008-12-02 | 2013-01-11 | Nat Univ Tsing Hua | 臉部辨識方法 |
US8306940B2 (en) * | 2009-03-20 | 2012-11-06 | Microsoft Corporation | Interactive visualization for generating ensemble classifiers |
US8917915B2 (en) * | 2010-06-30 | 2014-12-23 | Nec Solution Innovators, Ltd. | Head detecting method, head detecting apparatus, attribute determining method, attribute determining apparatus, program, recording medium, and attribute determining system |
JP5565190B2 (ja) * | 2010-08-11 | 2014-08-06 | 富士ゼロックス株式会社 | 学習モデル作成プログラム、画像識別情報付与プログラム、学習モデル作成装置及び画像識別情報付与装置 |
US8861870B2 (en) * | 2011-02-25 | 2014-10-14 | Microsoft Corporation | Image labeling with global parameters |
CN102393910B (zh) * | 2011-06-29 | 2013-04-24 | 浙江工业大学 | 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法 |
EP2754130A4 (en) * | 2011-08-09 | 2016-01-06 | Intel Corp | 3D MULTIVUE-BASED 3D FACES GENERATION |
JP5367037B2 (ja) * | 2011-09-26 | 2013-12-11 | 本田技研工業株式会社 | 顔向き検出装置 |
KR20140095601A (ko) * | 2013-01-18 | 2014-08-04 | 삼성전자주식회사 | 자세 분류 장치 및 자세 분류 방법 |
US9361411B2 (en) | 2013-03-15 | 2016-06-07 | Honeywell International, Inc. | System and method for selecting a respirator |
US20140341443A1 (en) * | 2013-05-16 | 2014-11-20 | Microsoft Corporation | Joint modeling for facial recognition |
CN105683724B (zh) * | 2013-09-19 | 2018-09-14 | 欧莱雅公司 | 对表面的颜色和光谱进行测量及分类的系统和方法 |
KR20150043795A (ko) * | 2013-10-15 | 2015-04-23 | 삼성전자주식회사 | 영상처리장치 및 그 제어방법 |
US9614724B2 (en) | 2014-04-21 | 2017-04-04 | Microsoft Technology Licensing, Llc | Session-based device configuration |
US9639742B2 (en) | 2014-04-28 | 2017-05-02 | Microsoft Technology Licensing, Llc | Creation of representative content based on facial analysis |
US9773156B2 (en) | 2014-04-29 | 2017-09-26 | Microsoft Technology Licensing, Llc | Grouping and ranking images based on facial recognition data |
US10111099B2 (en) | 2014-05-12 | 2018-10-23 | Microsoft Technology Licensing, Llc | Distributing content in managed wireless distribution networks |
US9384334B2 (en) | 2014-05-12 | 2016-07-05 | Microsoft Technology Licensing, Llc | Content discovery in managed wireless distribution networks |
US9430667B2 (en) | 2014-05-12 | 2016-08-30 | Microsoft Technology Licensing, Llc | Managed wireless distribution network |
US9384335B2 (en) | 2014-05-12 | 2016-07-05 | Microsoft Technology Licensing, Llc | Content delivery prioritization in managed wireless distribution networks |
US9874914B2 (en) | 2014-05-19 | 2018-01-23 | Microsoft Technology Licensing, Llc | Power management contracts for accessory devices |
US10037202B2 (en) | 2014-06-03 | 2018-07-31 | Microsoft Technology Licensing, Llc | Techniques to isolating a portion of an online computing service |
US9367490B2 (en) | 2014-06-13 | 2016-06-14 | Microsoft Technology Licensing, Llc | Reversible connector for accessory devices |
US9460493B2 (en) | 2014-06-14 | 2016-10-04 | Microsoft Technology Licensing, Llc | Automatic video quality enhancement with temporal smoothing and user override |
US9373179B2 (en) | 2014-06-23 | 2016-06-21 | Microsoft Technology Licensing, Llc | Saliency-preserving distinctive low-footprint photograph aging effect |
EP3183689A4 (en) * | 2014-08-22 | 2017-08-23 | Microsoft Technology Licensing, LLC | Face alignment with shape regression |
JP6041331B1 (ja) * | 2016-02-26 | 2016-12-07 | 国立大学法人山口大学 | 情報処理装置と情報処理プログラム並びに情報処理方法 |
US10552968B1 (en) * | 2016-09-23 | 2020-02-04 | Snap Inc. | Dense feature scale detection for image matching |
CN107273872B (zh) * | 2017-07-13 | 2020-05-05 | 北京大学深圳研究生院 | 用于图像或视频中行人重识别的深度判别网络模型方法 |
US20190332848A1 (en) | 2018-04-27 | 2019-10-31 | Honeywell International Inc. | Facial enrollment and recognition system |
US11113588B2 (en) | 2019-10-02 | 2021-09-07 | United States Of America As Represented By The Secretry Of The Navy | Randomization-based hierarchical and associatively assisted vector learning for machine vision |
KR20210066207A (ko) * | 2019-11-28 | 2021-06-07 | 엘지전자 주식회사 | 객체를 인식하는 인공 지능 장치 및 그 방법 |
CN111126221B (zh) * | 2019-12-16 | 2023-09-26 | 华中师范大学 | 一种融合双向视觉注意力机制的数学公式识别方法及装置 |
KR102454443B1 (ko) * | 2020-12-02 | 2022-10-12 | 인하대학교 산학협력단 | 저해상도 얼굴 인식을 위한 생성적 도메인 적응 방법 및 장치 |
CN112966626A (zh) * | 2021-03-16 | 2021-06-15 | 三星(中国)半导体有限公司 | 人脸识别方法和装置 |
KR102641358B1 (ko) * | 2021-11-01 | 2024-02-27 | 재단법인대구경북과학기술원 | 이미지 도메인 적응 장치 및 방법 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0831135B2 (ja) | 1990-02-01 | 1996-03-27 | 富士通株式会社 | 画像認識方法 |
JP3329806B2 (ja) | 1990-11-09 | 2002-09-30 | 株式会社日立製作所 | ニューラルネット構築装置 |
JPH04264985A (ja) | 1991-02-20 | 1992-09-21 | Hamamatsu Photonics Kk | 画像認識システム |
JP2673871B2 (ja) * | 1993-08-26 | 1997-11-05 | 日本アイ・ビー・エム株式会社 | ニューラル・ネットワークによるパターン認識方法及び装置 |
US5497430A (en) | 1994-11-07 | 1996-03-05 | Physical Optics Corporation | Method and apparatus for image recognition using invariant feature signals |
US5850470A (en) * | 1995-08-30 | 1998-12-15 | Siemens Corporate Research, Inc. | Neural network for locating and recognizing a deformable object |
JP3184092B2 (ja) | 1996-05-27 | 2001-07-09 | シャープ株式会社 | 画像処理方法 |
JP3894522B2 (ja) | 1996-12-17 | 2007-03-22 | 本田技研工業株式会社 | 画像認識法 |
US6324532B1 (en) * | 1997-02-07 | 2001-11-27 | Sarnoff Corporation | Method and apparatus for training a neural network to detect objects in an image |
US6108437A (en) * | 1997-11-14 | 2000-08-22 | Seiko Epson Corporation | Face recognition apparatus, method, system and computer readable medium thereof |
US6236749B1 (en) * | 1998-03-23 | 2001-05-22 | Matsushita Electronics Corporation | Image recognition method |
US6421463B1 (en) | 1998-04-01 | 2002-07-16 | Massachusetts Institute Of Technology | Trainable system to search for objects in images |
JP2002517867A (ja) * | 1998-06-08 | 2002-06-18 | ワシントン ユニバーシティ | 自動形状特徴付けのための方法および装置 |
AUPP400998A0 (en) | 1998-06-10 | 1998-07-02 | Canon Kabushiki Kaisha | Face detection in digital images |
JP2000099722A (ja) * | 1998-09-22 | 2000-04-07 | Toshiba Corp | 人物顔認識装置及び人物顔認識方法 |
US6317517B1 (en) | 1998-11-30 | 2001-11-13 | Regents Of The University Of California | Statistical pattern recognition |
JP4543455B2 (ja) | 1999-10-18 | 2010-09-15 | パナソニック株式会社 | パターン認識方法及びパターン認識装置、並びにパターン照合方法及びパターン照合装置 |
JP4443722B2 (ja) | 2000-04-25 | 2010-03-31 | 富士通株式会社 | 画像認識装置及び方法 |
JP4387552B2 (ja) * | 2000-04-27 | 2009-12-16 | 富士通株式会社 | 画像照合処理システム |
US6671391B1 (en) * | 2000-05-26 | 2003-12-30 | Microsoft Corp. | Pose-adaptive face detection system and process |
EP1342206A2 (en) * | 2000-11-03 | 2003-09-10 | Koninklijke Philips Electronics N.V. | Estimation of facial expression intensity using a bidirectional star topology hidden markov model |
US7099510B2 (en) | 2000-11-29 | 2006-08-29 | Hewlett-Packard Development Company, L.P. | Method and system for object detection in digital images |
US6975750B2 (en) * | 2000-12-01 | 2005-12-13 | Microsoft Corp. | System and method for face recognition using synthesized training images |
US7280697B2 (en) * | 2001-02-01 | 2007-10-09 | California Institute Of Technology | Unsupervised learning of object categories from cluttered images |
US7113637B2 (en) | 2001-08-24 | 2006-09-26 | Industrial Technology Research Institute | Apparatus and methods for pattern recognition based on transform aggregation |
US20030110038A1 (en) | 2001-10-16 | 2003-06-12 | Rajeev Sharma | Multi-modal gender classification using support vector machines (SVMs) |
JP2003150963A (ja) * | 2001-11-13 | 2003-05-23 | Japan Science & Technology Corp | 顔画像認識方法及び顔画像認識装置 |
US20030225526A1 (en) | 2001-11-14 | 2003-12-04 | Golub Todd R. | Molecular cancer diagnosis using tumor gene expression signature |
US7024033B2 (en) * | 2001-12-08 | 2006-04-04 | Microsoft Corp. | Method for boosting the performance of machine-learning classifiers |
US7203346B2 (en) * | 2002-04-27 | 2007-04-10 | Samsung Electronics Co., Ltd. | Face recognition method and apparatus using component-based face descriptor |
US7349917B2 (en) | 2002-10-01 | 2008-03-25 | Hewlett-Packard Development Company, L.P. | Hierarchical categorization method and system with automatic local selection of classifiers |
EP1649408B1 (en) | 2003-06-30 | 2012-01-04 | Honda Motor Co., Ltd. | Systems and methods for training component-based object identification systems |
-
2004
- 2004-06-30 JP JP2006516619A patent/JP4571628B2/ja not_active Expired - Fee Related
- 2004-06-30 WO PCT/IB2004/003274 patent/WO2005001750A2/en active IP Right Grant
- 2004-06-30 US US10/561,256 patent/US7783082B2/en active Active
- 2004-06-30 JP JP2006517819A patent/JP4575917B2/ja not_active Expired - Fee Related
- 2004-06-30 DE DE602004008282T patent/DE602004008282T2/de not_active Expired - Lifetime
- 2004-06-30 EP EP04785725A patent/EP1639522B1/en not_active Expired - Lifetime
-
2010
- 2010-07-16 JP JP2010161500A patent/JP4972193B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010282640A (ja) | 2010-12-16 |
EP1639522B1 (en) | 2007-08-15 |
JP4972193B2 (ja) | 2012-07-11 |
US20060280341A1 (en) | 2006-12-14 |
WO2005001750A2 (en) | 2005-01-06 |
US7783082B2 (en) | 2010-08-24 |
DE602004008282T2 (de) | 2008-05-15 |
JP2007524919A (ja) | 2007-08-30 |
DE602004008282D1 (de) | 2007-09-27 |
JP2007521550A (ja) | 2007-08-02 |
WO2005001750A3 (en) | 2005-06-02 |
JP4571628B2 (ja) | 2010-10-27 |
EP1639522A2 (en) | 2006-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4575917B2 (ja) | 構成要素に基づいて構成された物体を識別するシステムを訓練するシステム、方法及びプログラム | |
US10755120B2 (en) | End-to-end lightweight method and apparatus for license plate recognition | |
US7734071B2 (en) | Systems and methods for training component-based object identification systems | |
CN108629168B (zh) | 脸部验证方法、设备以及计算设备 | |
US10289897B2 (en) | Method and a system for face verification | |
WO2021026805A1 (zh) | 对抗样本检测方法、装置、计算设备及计算机存储介质 | |
US7016881B2 (en) | Method for boosting the performance of machine-learning classifiers | |
US20200097742A1 (en) | Training neural networks for vehicle re-identification | |
US20190320103A1 (en) | Fusion of inertial and depth sensors for movement measurements and recognition | |
Cohen et al. | Facial expression recognition from video sequences: temporal and static modeling | |
US20180336439A1 (en) | Novelty detection using discriminator of generative adversarial network | |
US20180114071A1 (en) | Method for analysing media content | |
US9892326B2 (en) | Object detection in crowded scenes using context-driven label propagation | |
US8266083B2 (en) | Large scale manifold transduction that predicts class labels with a neural network and uses a mean of the class labels | |
US11915500B2 (en) | Neural network based scene text recognition | |
CN102436811A (zh) | 用于语音识别的深度结构的全序列训练 | |
WO2020238353A1 (zh) | 数据处理方法和装置、存储介质及电子装置 | |
WO2021179719A1 (zh) | 人脸活体检测方法、装置、介质及电子设备 | |
EP3786882A1 (en) | Movement state recognition model learning device, movement state recognition device, method, and program | |
CN113255557A (zh) | 一种基于深度学习的视频人群情绪分析方法及系统 | |
CN111694954B (zh) | 图像分类方法、装置和电子设备 | |
CN114764869A (zh) | 利用每个对象的单个检测的多对象检测 | |
JP4348202B2 (ja) | 顔画像認識装置及び顔画像認識プログラム | |
JP2004178569A (ja) | データ分類装置、物体認識装置、データ分類方法及び物体認識方法 | |
CN114943873A (zh) | 一种工地人员异常行为分类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100810 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100820 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4575917 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |