JP6112801B2 - 画像認識装置及び画像認識方法 - Google Patents
画像認識装置及び画像認識方法 Download PDFInfo
- Publication number
- JP6112801B2 JP6112801B2 JP2012183456A JP2012183456A JP6112801B2 JP 6112801 B2 JP6112801 B2 JP 6112801B2 JP 2012183456 A JP2012183456 A JP 2012183456A JP 2012183456 A JP2012183456 A JP 2012183456A JP 6112801 B2 JP6112801 B2 JP 6112801B2
- Authority
- JP
- Japan
- Prior art keywords
- class
- boundary
- image
- feature
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/758—Involving statistics of pixels or of feature values, e.g. histogram matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Description
以下、添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。本実施形態では、複数の顔画像から顔の個人識別を行う例について説明する。
図1において、顔画像取得部101は、画像データを取得する撮像装置、及び取得した画像データから顔の領域を切り出して顔画像データを出力する画像処理装置により構成されている。特徴抽出部102は、顔画像取得部101で取得した顔画像データから顔の個人識別を行うための特徴量を求める。
図2において、まず、顔画像取得部101は、物体画像(顔画像)を取得する(S201)。S201の処理の詳細については、以下の図3のフローチャートを参照しながら説明する。
まず、動画像を撮影するために、登録する人物の顔を撮像し、動画像をフレーム毎に切り出して静止画像として画像データを取得する。そして、取得した画像データを顔画像取得部101内部のメモリに記憶する(S301)。このとき、取得する画像データは輝度画像とし、RGB等のカラー画像を取得した場合は輝度画像に変換して記憶する。
まず、入力した顔画像を領域分割する(S401)。この処理では、図6に示すように、水平方向及び垂直方向に同じ大きさの矩形領域になるようにブロックに分割する。このとき、例えば、一つのブロックが25×25画素の4×4の領域に分割する。その他にも、顔の目、口、鼻といった位置毎に領域の形状や大きさを変えて分割してもよく、夫々の領域が重なるようにしてもよい。
まず、特徴抽出部102が抽出した複数の特徴量から第1のHIK算出部112は、HIK(Histogram Intersection Kernel)を算出する(S501)。HIKは以下の(4)式により算出する。
図7は、入力された顔画像を識別する処理手順の一例を示すフローチャートである。
まず、顔画像取得部101は、認識対象の人物の顔画像を取得する(S701)。そして、特徴抽出部102、は取得した顔画像から顔の特徴を表す特徴量を抽出する(S702)。図7のS701及びS702の処理はそれぞれ、顔画像を登録する時のS201及びS202の処理と同様の処理を行う。なお、特徴抽出部102が特徴量を抽出すると、その情報は算出部105に出力される。
まず、算出部105は顔モデル記憶部104から照合すべき登録データ(顔モデル)を取得する(S801)。次に、入力された特徴量とS801で取得した登録データの境界サンプルとから、第2のHIK算出部121はHIKを算出する。HIKは以下の(5)式により算出する。
まず、算出部105により算出された人物毎の信頼度のうち、信頼度が所定値以上であるものを抽出する(S901)。そして、抽出した信頼度が所定値以上のもののうち、最も高い信頼度を持つ人物を認識結果とする(S902)。なお、信頼度が所定値以上のものが存在しない場合には、登録人物ではないという認識結果とする。また、信頼度が所定値以上の人物が複数存在した場合に、それら複数の人物を認識結果として、それぞれの信頼度とともに出力したり、信頼度順にソートして出力することもできる。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。また、当該プログラムを記憶したコンピュータ読み取り可能な記憶媒体も本発明に含まれる。
102 特徴抽出部
103 登録部
104 顔モデル記憶部
105 算出部
106 顔識別部
Claims (8)
- 物体画像を取得する取得手段と、
前記取得手段によって取得された物体画像から特徴量を抽出する特徴抽出手段と、
複数のクラスの各クラスについて、前記特徴抽出手段によって該クラスの物体を含む複数の物体画像から抽出されたそれぞれの特徴量を当該クラスの訓練サンプルの集合とし、該訓練サンプルの集合を包含する領域の境界付近に存在する複数の訓練サンプルのそれぞれを前記クラスの境界サンプルと判別して、該境界サンプルと当該境界サンプルのそれぞれに対するパラメータとを前記クラスのモデルとして登録する登録手段と、
前記複数のクラスの各クラスについて、前記取得手段により取得された認識対象の物体画像から前記特徴抽出手段により抽出された特徴量と、当該クラスのモデルとして登録された各境界サンプルとの所定のカーネル関数値を求め、当該各境界サンプルに対する前記カーネル関数値及びパラメータに基づいて、前記認識対象の物体画像に対して、クラスごとの信頼度を算出する算出手段と、
前記算出手段により算出されたクラスごとの信頼度に基づいて、前記認識対象の物体画像の認識結果を出力する識別手段とを備えたことを特徴とする画像認識装置。 - 前記クラスは、SVDD(Support Vector Data Description)により定義された超球であることを特徴とする請求項1に記載の画像認識装置。
- 前記特徴抽出手段は、前記特徴量として前記物体画像から正規化したヒストグラム特徴を抽出し、
前記登録手段は、前記ヒストグラム特徴のビン毎に算出した所定の正定値関数の和として表現可能なカーネル関数を算出することにより前記訓練サンプルの集合を包含する超球の境界付近に存在する訓練サンプルを境界サンプルと判別し、
前記算出手段は、前記各クラスについて、前記認識対象の物体画像から抽出されたヒストグラム特徴と、当該クラスのモデルとして登録された各境界サンプルとの前記所定のカーネル関数値と当該各境界サンプルに対するパラメータとを用いて前記クラスごとの信頼度を算出することを特徴とする請求項2に記載の画像認識装置。 - 前記取得手段は、動画像を構成するフレームから物体画像を取得し、
前記登録手段は、前記動画像を構成するそれぞれのフレームにおける同一の物体を対象とした訓練サンプルを登録することを特徴とする請求項1〜3の何れか1項に記載の画像認識装置。 - 前記物体画像は、人物の顔画像であることを特徴とする請求項1〜4の何れか1項に記載の画像認識装置。
- 物体画像を取得する取得工程と、
前記取得工程において取得された物体画像から特徴量を抽出する特徴抽出工程と、
複数のクラスの各クラスについて、前記特徴抽出工程において該クラスの物体を含む複数の物体画像から抽出されたそれぞれの特徴量を当該クラスの訓練サンプルの集合とし、該訓練サンプルの集合を包含する領域の境界付近に存在する複数の訓練サンプルのそれぞれを前記クラスの境界サンプルと判別して、該境界サンプルと当該境界サンプルのそれぞれに対するパラメータとを前記クラスのモデルとして登録する登録工程と、
前記複数のクラスの各クラスについて、前記取得工程において取得された認識対象の物体画像から前記特徴抽出工程において抽出された特徴量と、当該クラスのモデルとして登録された各境界サンプルとの所定のカーネル関数値を求め、当該各境界サンプルに対する前記カーネル関数値及びパラメータに基づいて、前記認識対象の物体画像に対して、クラスごとの信頼度を算出する算出工程と、
前記算出工程において算出されたクラスごとの信頼度に基づいて、前記認識対象の物体画像の認識結果を出力する識別工程とを備えたことを特徴とする画像認識方法。 - 物体画像を取得する取得工程と、
前記取得工程において取得された物体画像から特徴量を抽出する特徴抽出工程と、
複数のクラスの各クラスについて、前記特徴抽出工程において該クラスの物体を含む複数の物体画像から抽出されたそれぞれの特徴量を当該クラスの訓練サンプルの集合とし、該訓練サンプルの集合を包含する領域の境界付近に存在する複数の訓練サンプルのそれぞれを前記クラスの境界サンプルと判別して、該境界サンプルと当該境界サンプルのそれぞれに対するパラメータとを前記クラスのモデルとして登録する登録工程と、
前記複数のクラスの各クラスについて、前記取得工程において取得された認識対象の物体画像から前記特徴抽出工程において抽出された特徴量と、当該クラスのモデルとして登録された各境界サンプルとの所定のカーネル関数値を求め、当該各境界サンプルに対する前記カーネル関数値及びパラメータに基づいて、前記認識対象の物体画像に対して、クラスごとの信頼度を算出する算出工程と、
前記算出工程において算出されたクラスごとの信頼度に基づいて、前記認識対象の物体画像の認識結果を出力する識別工程とをコンピュータに実行させることを特徴とするプログラム。 - 請求項7に記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012183456A JP6112801B2 (ja) | 2012-08-22 | 2012-08-22 | 画像認識装置及び画像認識方法 |
US13/967,044 US9489566B2 (en) | 2012-08-22 | 2013-08-14 | Image recognition apparatus and image recognition method for identifying object |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012183456A JP6112801B2 (ja) | 2012-08-22 | 2012-08-22 | 画像認識装置及び画像認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014041477A JP2014041477A (ja) | 2014-03-06 |
JP6112801B2 true JP6112801B2 (ja) | 2017-04-12 |
Family
ID=50393687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012183456A Expired - Fee Related JP6112801B2 (ja) | 2012-08-22 | 2012-08-22 | 画像認識装置及び画像認識方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9489566B2 (ja) |
JP (1) | JP6112801B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015225410A (ja) * | 2014-05-26 | 2015-12-14 | 株式会社東芝 | 認識装置、方法及びプログラム |
CN104134058B (zh) * | 2014-07-21 | 2017-07-11 | 成都万维图新信息技术有限公司 | 一种人脸图像处理方法 |
CN105426811B (zh) * | 2015-09-28 | 2019-03-15 | 高新兴科技集团股份有限公司 | 一种人群异常行为与人群密度识别方法 |
JP6841232B2 (ja) * | 2015-12-18 | 2021-03-10 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US10621419B2 (en) * | 2016-12-06 | 2020-04-14 | Robert William Kocher | Method and system for increasing biometric acceptance rates and reducing false accept rates and false rates |
CN107247968A (zh) * | 2017-07-24 | 2017-10-13 | 东北林业大学 | 基于核熵成分分析失衡数据下物流设备异常检测方法 |
CN109145723A (zh) * | 2018-07-09 | 2019-01-04 | 长江大学 | 一种印章识别方法、系统、终端装置及存储介质 |
KR102355779B1 (ko) * | 2019-01-08 | 2022-01-25 | 주식회사 케이티 | 얼굴 인식을 위한 얼굴 사진 등록 방법, 얼굴 인식 방법 및 서버 |
US11537653B2 (en) | 2019-01-16 | 2022-12-27 | International Business Machines Corporation | Automated personalized identifier switching in view of closeness |
WO2021027440A1 (zh) * | 2019-08-15 | 2021-02-18 | 华为技术有限公司 | 一种人脸检索方法及装置 |
CN110701487B (zh) * | 2019-09-18 | 2021-08-24 | 浙江工业大学 | 一种基于KPCA和Cas-SVDD的多工况管道泄漏检测方法 |
CN115937556A (zh) * | 2021-09-30 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 对象识别方法、装置、设备和存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3621245B2 (ja) | 1997-12-12 | 2005-02-16 | 株式会社東芝 | 人物認識装置、人物認識方法、および、人物認識プログラムの記録媒体 |
KR100456619B1 (ko) * | 2001-12-05 | 2004-11-10 | 한국전자통신연구원 | 에스.브이.엠(svm)을 이용한 얼굴 등록/인증 시스템 및방법 |
US20060274949A1 (en) * | 2005-06-02 | 2006-12-07 | Eastman Kodak Company | Using photographer identity to classify images |
EP1910977B1 (en) * | 2005-07-29 | 2016-11-30 | Telecom Italia S.p.A. | Automatic biometric identification based on face recognition and support vector machines |
US8494238B2 (en) * | 2007-12-21 | 2013-07-23 | Siemens Medical Solutions Usa, Inc. | Redundant spatial ensemble for computer-aided detection and image understanding |
WO2009117607A1 (en) * | 2008-03-19 | 2009-09-24 | The Trustees Of Columbia University In The City Of New York | Methods, systems, and media for automatically classifying face images |
US8351662B2 (en) * | 2010-09-16 | 2013-01-08 | Seiko Epson Corporation | System and method for face verification using video sequence |
-
2012
- 2012-08-22 JP JP2012183456A patent/JP6112801B2/ja not_active Expired - Fee Related
-
2013
- 2013-08-14 US US13/967,044 patent/US9489566B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014041477A (ja) | 2014-03-06 |
US20140140583A1 (en) | 2014-05-22 |
US9489566B2 (en) | 2016-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6112801B2 (ja) | 画像認識装置及び画像認識方法 | |
US20230117712A1 (en) | Feature density object classification, systems and methods | |
CN110909651B (zh) | 视频主体人物的识别方法、装置、设备及可读存储介质 | |
JP6664163B2 (ja) | 画像識別方法、画像識別装置及びプログラム | |
CN106408037B (zh) | 图像识别方法及装置 | |
JP5629803B2 (ja) | 画像処理装置、撮像装置、画像処理方法 | |
JP6351240B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US8792722B2 (en) | Hand gesture detection | |
JP4743823B2 (ja) | 画像処理装置、撮像装置、画像処理方法 | |
JP6351243B2 (ja) | 画像処理装置、画像処理方法 | |
CN107918773B (zh) | 一种人脸活体检测方法、装置及电子设备 | |
Hebbale et al. | Real time COVID-19 facemask detection using deep learning | |
WO2012046426A1 (ja) | 物体検出装置、物体検出方法および物体検出プログラム | |
CN108509925A (zh) | 一种基于视觉词袋模型的行人重识别方法 | |
JP2015197708A (ja) | オブジェクト識別装置、オブジェクト識別方法及びプログラム | |
JP2008251039A (ja) | 画像認識システム及びその認識方法並びにプログラム | |
Cicconet et al. | Mirror symmetry histograms for capturing geometric properties in images | |
JP2013218605A (ja) | 画像認識装置、画像認識方法及びプログラム | |
CN113255557A (zh) | 一种基于深度学习的视频人群情绪分析方法及系统 | |
Kulkarni et al. | Real time face recognition using LBP features | |
Ansari | Hand Gesture Recognition using fusion of SIFT and HoG with SVM as a Classifier | |
JP2017084006A (ja) | 画像処理装置およびその方法 | |
CN114445916A (zh) | 一种活体检测方法、终端设备及存储介质 | |
Shukla et al. | Deep Learning Model to Identify Hide Images using CNN Algorithm | |
Geetha et al. | 3D face recognition using Hadoop |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150824 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170314 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6112801 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |