JP4588575B2 - デジタル画像の複数対象物検出方法および装置並びにプログラム - Google Patents
デジタル画像の複数対象物検出方法および装置並びにプログラム Download PDFInfo
- Publication number
- JP4588575B2 JP4588575B2 JP2005230704A JP2005230704A JP4588575B2 JP 4588575 B2 JP4588575 B2 JP 4588575B2 JP 2005230704 A JP2005230704 A JP 2005230704A JP 2005230704 A JP2005230704 A JP 2005230704A JP 4588575 B2 JP4588575 B2 JP 4588575B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- partial image
- weak
- vector
- predetermined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
Description
このような量は、正三角形の重心を原点としたときの3つの頂点の位置ベクトル(基底ベクトル)を用いて実現することができる(図14参照)。すなわち、W1=W2=W3のとき、W1〈e1〉+W2〈e2〉+W3〈e3〉=(0,0)となる。基底ベクトルは、位置、大きさについて任意性があるが、基底ベクトルの大きさを1とし、ひとつの基底ベクトルをx軸上に置いて、それをバックグラウンドのオブジェクト(非顔等)の基底ベクトルとすると、カスケードの際に都合がよいと思われる。基底ベクトル〈e1〉,〈e2〉,〈e3〉は以下に掲げる性質がある。
まず、次式にしたがって、サンプル画像の重みを初期化する。
図7は、上記顔検出システムにおける処理の流れを示したフローチャートである。図7に示すように、多重解像度化部10に入力画像S0が供給されると(ステップS11)、この入力画像S0の画像サイズが所定のサイズに変換された画像S0′が生成され、この画像S0′から2の−1/3乗倍ずつサイズ(解像度)が縮小された複数の解像度画像からなる解像度画像群S1が生成される(ステップS12)。そして、正規化部20において、解像度画像群S1の各々に対し、画像全体のコントラストのばらつきを抑制する正規化処理を施し、正規化済みの解像度画像群S1′が得られる(ステップS13)。顔検出部30においては、検出制御部31からの指示を受けた解像度画像選択部32により、解像度画像群S1′の中から画像サイズの小さい順、すなわち、S1′_n,S1′_n−1,・・・,S1′_1の順に所定の解像度画像S1′_iを選択する(ステップS14)。次に検出制御部31が、サブウィンドウ設定部33に対して、サブウィンドウ設定条件を設定する。これにより、サブウィンドウ設定部33は、解像度画像S1′_i上でサブウィンドウを走査しながら設定して所定サイズの部分画像Wを順次切り出し(ステップS15)、その部分画像Wを判別器34へ入力する(ステップS16)。判別器34は、入力された部分画像Wが上記の5種類の向きの顔のいずれかであるか否かを判別し、検出制御部31がその判別結果Rを取得する(ステップS17)。そして、検出制御部31は、現在切り出された部分画像Wが最後の順番に位置する部分画像であるか否かを判定し(ステップS18)、部分画像Wが最後の部分画像であると判定された場合には、次のステップS19へ移行し、部分画像Wが最後の部分画像でないと判定された場合には、ステップS15に戻って新たな部分画像Wが切り出される。このようにして解像度画像S1′_iについての顔画像を検出する。
10 多重解像度化部
20 正規化部
30 顔検出部
31 検出制御部
32 解像度画像選択部
33 サブウィンドウ設定部(部分画像切出し手段)
34 判別器(判別手段)
40 重複検出判定部
WC 弱判別器
Claims (12)
- 入力画像における複数の異なる対象物を検出する複数対象物検出方法であって、
前記入力画像から切り出された所定の大きさの部分画像について輝度分布に係る特徴量を算出し、
N(N≧3)種類の異なる所定の対象物の該種類毎に、該所定の対象物を表す複数の異なるサンプル画像の各々について前記特徴量を求めて該特徴量の値のヒストグラムを得、得られたN個のヒストグラムの各々と、N−1次元空間において大きさが同一で等方性を有する所定のN個の基底ベクトルの各々とを1つずつ対応させて、各前記ヒストグラムにおける各頻度を該ヒストグラムに対応する基底ベクトルと線形に結合してベクトル化し、前記N個のヒストグラム間で互いに対応する前記特徴量の値に対する頻度のベクトル同士をそれぞれ合成して得られたN−1次元の多次元ヒストグラムに基づいて、前記部分画像について算出された特徴量の値に対する前記多次元ヒストグラム上のベクトルを選択する、複数の弱判別器を用意するステップと、
前記入力画像上の複数の異なる位置において前記所定の大きさの部分画像を切り出すステップと、
前記部分画像の各々に対して、該部分画像に前記複数の弱判別器のうち少なくとも1つを適用して該弱判別器によって選択されたベクトルを合成し、該合成されたベクトルの前記各基底ベクトルの成分を、前記部分画像が該各基底ベクトルに対応する前記対象物である蓋然性を示すスコアとしてそれぞれ抽出し、該各スコアの大小に基づいて、前記部分画像が前記N種類の対象物のうちのいずれであるかを判別する判別処理を施すステップとを有することを特徴とする複数対象物検出方法。 - 前記複数の弱判別器が、該各弱判別器を直列に接続してなるものであり、
前記判別処理を施すステップが、前記部分画像に前記弱判別器を先頭から順次適用して該弱判別器によって選択されたベクトルを累積して合成してゆき、該合成されたベクトルに基づいて抽出されたスコアのうちのいずれかが所定の閾値を超えたときに、前記部分画像が該閾値を超えたスコアに対応する前記対象物であると判別するステップであることを特徴とする請求項1記載の複数対象物検出方法。 - 前記複数の弱判別器が、多数の弱判別器の中からブースティングの学習手法により選定されたものであることを特徴とする請求項1または2記載の複数対象物検出方法。
- 前記複数の弱判別器が、さらに、ブースティングの学習手法により決定された順番で接続されてなるものであることを特徴とする請求項3記載の複数対象物検出方法。
- 入力画像における複数の異なる対象物を検出する複数対象物検出装置であって、
前記入力画像から切り出された所定の大きさの部分画像について輝度分布に係る特徴量を算出し、
N(N≧3)種類の異なる所定の対象物の該種類毎に、該所定の対象物を表す複数の異なるサンプル画像の各々について前記特徴量を求めて該特徴量の値のヒストグラムを得、得られたN個のヒストグラムの各々と、N−1次元空間において大きさが同一で等方性を有する所定のN個の基底ベクトルの各々とを1つずつ対応させて、各前記ヒストグラムにおける各頻度を該ヒストグラムに対応する基底ベクトルと線形に結合してベクトル化し、前記N個のヒストグラム間で互いに対応する前記特徴量の値に対する頻度のベクトル同士をそれぞれ合成して得られたN−1次元の多次元ヒストグラムに基づいて、前記部分画像について算出された特徴量の値に対する前記多次元ヒストグラム上のベクトルを選択する、複数の弱判別器と、
前記入力画像上の複数の異なる位置において前記所定の大きさの部分画像を切り出す部分画像切出し手段と、
前記部分画像の各々に対して、該部分画像に前記複数の弱判別器のうち少なくとも1つを適用して該弱判別器によって選択されたベクトルを合成し、該合成されたベクトルの前記各基底ベクトルの成分を、前記部分画像が該各基底ベクトルに対応する前記対象物である蓋然性を示すスコアとしてそれぞれ抽出し、該各スコアの大小に基づいて、前記部分画像が前記N種類の対象物のうちのいずれであるかを判別する判別処理を施す判別手段とを備えたことを特徴とする複数対象物検出装置。 - 前記複数の弱判別器が、該各弱判別器を直列に接続してなるものであり、
前記判別手段が、前記部分画像に前記弱判別器を先頭から順次適用して該弱判別器によって選択されたベクトルを累積して合成してゆき、該合成されたベクトルに基づいて抽出されたスコアのうちのいずれかが所定の閾値を超えたときに、前記部分画像が該閾値を超えたスコアに対応する前記対象物であると判別するものであることを特徴とする請求項5記載の複数対象物検出装置。 - 前記複数の弱判別器が、多数の弱判別器の中からブースティングの学習手法により選定されたものであることを特徴とする請求項5または6記載の複数対象物検出装置。
- 前記複数の弱判別器が、さらに、ブースティングの学習手法により決定された順番で接続されてなるものであることを特徴とする請求項7記載の複数対象物検出装置。
- コンピュータを、入力画像における複数の異なる対象物を検出する複数対象物検出手段として機能させるためのプログラムであって、
該コンピュータを、
前記入力画像から切り出された所定の大きさの部分画像について輝度分布に係る特徴量を算出し、
N(N≧3)種類の異なる所定の対象物の該種類毎に、該所定の対象物を表す複数の異なるサンプル画像の各々について前記特徴量を求めて該特徴量の値のヒストグラムを得、得られたN個のヒストグラムの各々と、N−1次元空間において大きさが同一で等方性を有する所定のN個の基底ベクトルの各々とを1つずつ対応させて、各前記ヒストグラムにおける各頻度を該ヒストグラムに対応する基底ベクトルと線形に結合してベクトル化し、前記N個のヒストグラム間で互いに対応する前記特徴量の値に対する頻度のベクトル同士をそれぞれ合成して得られたN−1次元の多次元ヒストグラムに基づいて、前記部分画像について算出された特徴量の値に対する前記多次元ヒストグラム上のベクトルを選択する、複数の弱判別器と、
前記入力画像上の複数の異なる位置において前記所定の大きさの部分画像を切り出す部分画像切出し手段と、
前記部分画像の各々に対して、該部分画像に前記複数の弱判別器のうち少なくとも1つを適用して該弱判別器によって選択されたベクトルを合成し、該合成されたベクトルの前記各基底ベクトルの成分を、前記部分画像が該各基底ベクトルに対応する前記対象物である蓋然性を示すスコアとしてそれぞれ抽出し、該各スコアの大小に基づいて、前記部分画像が前記N種類の対象物のうちのいずれであるかを判別する判別処理を施す判別手段として機能させるためのプログラム。 - 前記複数の弱判別器が、該各弱判別器を直列に接続してなるものであり、
前記判別手段が、前記部分画像に前記弱判別器を先頭から順次適用して該弱判別器によって選択されたベクトルを累積して合成してゆき、該合成されたベクトルに基づいて抽出されたスコアのうちのいずれかが所定の閾値を超えたときに、前記部分画像が該閾値を超えたスコアに対応する前記対象物であると判別するものであることを特徴とする請求項9記載のプログラム。 - 前記複数の弱判別器が、多数の弱判別器の中からブースティングの学習手法により選定されたものであることを特徴とする請求項9または10記載のプログラム。
- 前記複数の弱判別器が、さらに、ブースティングの学習手法により決定された順番で接続されてなるものであることを特徴とする請求項11記載のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005230704A JP4588575B2 (ja) | 2005-08-09 | 2005-08-09 | デジタル画像の複数対象物検出方法および装置並びにプログラム |
US11/500,982 US7760940B2 (en) | 2005-08-09 | 2006-08-09 | Method, apparatus, and program for detecting objects in digital image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005230704A JP4588575B2 (ja) | 2005-08-09 | 2005-08-09 | デジタル画像の複数対象物検出方法および装置並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007047975A JP2007047975A (ja) | 2007-02-22 |
JP4588575B2 true JP4588575B2 (ja) | 2010-12-01 |
Family
ID=37742593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005230704A Active JP4588575B2 (ja) | 2005-08-09 | 2005-08-09 | デジタル画像の複数対象物検出方法および装置並びにプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7760940B2 (ja) |
JP (1) | JP4588575B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008108024A (ja) * | 2006-10-25 | 2008-05-08 | Matsushita Electric Ind Co Ltd | 画像処理装置および撮像装置 |
KR100919167B1 (ko) * | 2007-08-16 | 2009-09-28 | 한국과학기술원 | 히스토그램 평활화 시스템 및 방법 |
JP2009118009A (ja) * | 2007-11-02 | 2009-05-28 | Sony Corp | 撮像装置、その制御方法およびプログラム |
JP4970381B2 (ja) * | 2008-08-08 | 2012-07-04 | 株式会社東芝 | 特徴抽出装置、特徴抽出方法、画像処理装置、及び、プログラム |
JP4710979B2 (ja) | 2009-01-09 | 2011-06-29 | ソニー株式会社 | 対象物検出装置、学習装置、対象物検出方法およびプログラム |
JP2011090466A (ja) * | 2009-10-21 | 2011-05-06 | Sony Corp | 情報処理装置及び方法、並びにプログラム |
US8897489B2 (en) * | 2010-01-29 | 2014-11-25 | Rochester Institute Of Technology | Methods for object-based identification, sorting and ranking of target detections and apparatuses thereof |
JP5748472B2 (ja) * | 2010-12-15 | 2015-07-15 | 富士フイルム株式会社 | オブジェクト判別装置、方法、及びプログラム |
WO2012175785A1 (en) | 2011-06-20 | 2012-12-27 | Nokia Corporation | Methods, apparatuses and computer program products for performing accurate pose estimation of objects |
US9508018B2 (en) * | 2014-11-24 | 2016-11-29 | Texas Instruments Incorporated | Systems and methods for object detection |
US10127503B2 (en) * | 2015-10-21 | 2018-11-13 | International Business Machines Corporation | Generating multidimensional combination data |
EP3540634A1 (en) * | 2018-03-13 | 2019-09-18 | InterDigital CE Patent Holdings | Method for audio-visual events classification and localization and corresponding apparatus computer readable program product and computer readable storage medium |
EP4070236A4 (en) * | 2019-12-02 | 2024-01-17 | Univ Utah Res Found | MEDICAL IMAGE SYNTHESIS FOR MOTION CORRECTION USING GENERATIVE CONTRADICTORY NETWORKS |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004334836A (ja) * | 2003-04-14 | 2004-11-25 | Fuji Photo Film Co Ltd | 画像の特徴部分抽出方法及び特徴部分抽出プログラム並びに撮像装置と画像処理装置 |
JP2005108195A (ja) * | 2003-09-09 | 2005-04-21 | Fuji Photo Film Co Ltd | 対象物識別装置および方法並びにプログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4323880A (en) * | 1974-07-22 | 1982-04-06 | The United States Of America As Represented By The Secretary Of The Navy | Automatic target screening |
JPS6057475A (ja) * | 1983-09-07 | 1985-04-03 | Toshiba Corp | パタ−ン認識方式 |
US4972193A (en) * | 1988-08-09 | 1990-11-20 | The General Electric Company, P.L.C. | Target recognition |
US5446543A (en) * | 1992-07-24 | 1995-08-29 | Kabushiki Kaisha Toshiba | Method and apparatus for extracting a pattern of color from an object using a neural network |
US6154559A (en) * | 1998-10-01 | 2000-11-28 | Mitsubishi Electric Information Technology Center America, Inc. (Ita) | System for classifying an individual's gaze direction |
US6754367B1 (en) * | 1999-09-30 | 2004-06-22 | Hitachi Denshi Kabushiki Kaisha | Method and apparatus for automatically detecting intrusion object into view of image pickup device |
US6675174B1 (en) * | 2000-02-02 | 2004-01-06 | International Business Machines Corp. | System and method for measuring similarity between a set of known temporal media segments and a one or more temporal media streams |
US7099510B2 (en) * | 2000-11-29 | 2006-08-29 | Hewlett-Packard Development Company, L.P. | Method and system for object detection in digital images |
US6865295B2 (en) * | 2001-05-11 | 2005-03-08 | Koninklijke Philips Electronics N.V. | Palette-based histogram matching with recursive histogram vector generation |
DE60213032T2 (de) * | 2001-05-22 | 2006-12-28 | Matsushita Electric Industrial Co. Ltd. | Gerät zur Gesichtsdetektion, Gerät zur Detektion der Gesichtspose, Gerät zur Extraktion von Teilbildern und Verfahren für diese Geräte |
GB2409027A (en) * | 2003-12-11 | 2005-06-15 | Sony Uk Ltd | Face detection |
US7720291B2 (en) * | 2004-02-17 | 2010-05-18 | Corel Corporation | Iterative fisher linear discriminant analysis |
US7715597B2 (en) * | 2004-12-29 | 2010-05-11 | Fotonation Ireland Limited | Method and component for image recognition |
-
2005
- 2005-08-09 JP JP2005230704A patent/JP4588575B2/ja active Active
-
2006
- 2006-08-09 US US11/500,982 patent/US7760940B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004334836A (ja) * | 2003-04-14 | 2004-11-25 | Fuji Photo Film Co Ltd | 画像の特徴部分抽出方法及び特徴部分抽出プログラム並びに撮像装置と画像処理装置 |
JP2005108195A (ja) * | 2003-09-09 | 2005-04-21 | Fuji Photo Film Co Ltd | 対象物識別装置および方法並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2007047975A (ja) | 2007-02-22 |
US7760940B2 (en) | 2010-07-20 |
US20070036431A1 (en) | 2007-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4588575B2 (ja) | デジタル画像の複数対象物検出方法および装置並びにプログラム | |
CN110348319B (zh) | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 | |
JP4708909B2 (ja) | デジタル画像の対象物検出方法および装置並びにプログラム | |
JP4933186B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP4657934B2 (ja) | 顔検出方法および装置並びにプログラム | |
US20070195996A1 (en) | Characteristic point detection method, apparatus, and program | |
JP4624889B2 (ja) | 顔検出方法および装置並びにプログラム | |
US20150016679A1 (en) | Feature extraction device, feature extraction method, and feature extraction program | |
JP2008117391A (ja) | デジタル画像における顔を検出する方法、およびデジタル画像における顔を検出する装置 | |
KR20090131626A (ko) | 영상 데이터내의 특정 클래스의 오브젝트를 세그멘테이션하기 위한 시스템 및 방법 | |
JP2009211178A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
US8503768B2 (en) | Shape description and modeling for image subscene recognition | |
JP2008217589A (ja) | 学習装置及びパターン認識装置 | |
JP2005202932A (ja) | データを複数のクラスに分類する方法 | |
JP7294695B2 (ja) | 学習済モデルによるプログラム、情報記録媒体、分類装置、ならびに、分類方法 | |
WO2011092865A1 (ja) | 物体検出装置及び物体検出方法 | |
JP4795864B2 (ja) | 特徴点検出装置および方法並びにプログラム | |
Forczmański et al. | An algorithm of face recognition under difficult lighting conditions | |
JP5335554B2 (ja) | 画像処理装置及び画像処理方法 | |
JP4795737B2 (ja) | 顔検出方法および装置並びにプログラム | |
JP2004246618A (ja) | パターン認識における照合に用いられる画像の生成ならびに同画像を用いたパターン認識のための方法、装置、およびプログラム | |
JP2011170890A (ja) | 顔検出方法および装置並びにプログラム | |
JP2006285959A (ja) | 顔判別装置の学習方法、顔判別方法および装置並びにプログラム | |
JP2006031114A (ja) | 画像分割処理システム | |
JP2006244385A (ja) | 顔判別装置およびプログラム並びに顔判別装置の学習方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20061211 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100817 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100908 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4588575 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130917 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |