JP4439927B2 - 検出対象識別装置 - Google Patents
検出対象識別装置 Download PDFInfo
- Publication number
- JP4439927B2 JP4439927B2 JP2004010732A JP2004010732A JP4439927B2 JP 4439927 B2 JP4439927 B2 JP 4439927B2 JP 2004010732 A JP2004010732 A JP 2004010732A JP 2004010732 A JP2004010732 A JP 2004010732A JP 4439927 B2 JP4439927 B2 JP 4439927B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- filter
- region
- face
- detection target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims description 44
- 230000006870 function Effects 0.000 claims description 40
- 238000001914 filtration Methods 0.000 claims description 33
- 230000004044 response Effects 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 210000000887 face Anatomy 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Image Processing (AREA)
Description
即ち、従来の検出対象識別装置は、予め、大量の顔を含む画像と、顔を含まない画像を用意し、これらの画像を学習して、ニューラルネットワークなどの識別関数を構築する。
その後、検出対象が含まれている可能性がある画像を入力すると、その入力画像から識別対象の部分画像を順次切り出し、既に学習が完了している識別関数が、その入力画像の部分画像とひな形顔画像(例えば、予め学習された顔を含む画像の代表的な画像)との距離を演算し、その距離が所定の距離より短ければ、その部分画像が顔を表していると判断して“1”を出力する。一方、その距離が所定の距離より長ければ、その部分画像が顔を表していないと判断して“0”を出力する。
また、大量の画像の学習が完了した後、識別関数が入力画像に顔が含まれているか否かを識別する際、その入力画像の部分画像とひな形顔画像との距離を演算し、その距離が短ければ、顔が含まれていると判別するが、その入力画像の部分画像とひな形顔画像の距離は、画素値毎に演算を行う必要があるので、演算の簡素化が困難であり、顔が含まれているか否かの識別に長時間を要する課題があった。
さらに、入力画像の部分画像に顔が含まれていないことが明らかな場合でも、ひな形顔画像の画素数を減らすことができず、常に高解像度の識別処理を実施するため、識別に長時間を要する課題があった。
図1はこの発明の実施の形態1による検出対象識別装置を示す構成図であり、図2はこの発明の実施の形態1による検出対象識別装置のひな形顔画像生成部1を示す構成図である。
図において、ひな形顔画像生成部1は人間の顔(検出対象)を含む画像11を複数入力すると、複数の画像11から両目の位置を基準にして、顔領域12だけを切り出すとともに、その顔領域12のサイズを正規化して、同一サイズの顔画像14を出力する部分画像切出し部13と、部分画像切出し部13から出力された複数の顔画像14の画素毎の平均値を計算して平均顔画像を求め、その平均顔画像をひな形顔画像16として出力するひな形顔画像計算部15とから構成されている。
なお、ひな形顔画像計算部15は、複数の顔画像14の画素毎の平均値を計算して平均顔画像を求める代わりに、複数の顔画像14の主成分を分析して第一固有ベクトルを計算することにより代表的な顔画像を求め、その代表的な顔画像をひな形顔画像16として出力してもよい。
領域切出し部5は画像入力部4により入力された画像21の中から、識別対象の領域22を順次切り出して出力する(図5を参照)。なお、領域切出し部5は領域切出し手段を構成している。
判定部7はフィルタリング部6の適用結果とメモリ3に格納されている適用結果を照合することにより、領域切出し部5により切り出された領域22の画像が顔を表しているか否かを判定する。なお、判定部7は判定手段を構成している。
図6はこの発明の実施の形態1による検出対象識別装置の処理内容を示すフローチャートである。
検出対象識別装置は、入力画像に含まれている人間の顔を検出するに先立って、人間の一般的な顔を表しているひな形顔画像16を生成する(ステップST1)。
即ち、ひな形顔画像生成部1の部分画像切出し部13は、予め用意されている人間の顔を含む画像11を複数入力すると、複数の画像11から両目の位置を基準にして、顔領域12だけを切り出す処理を実施する。
この際、両目の位置や鼻の位置を特定する必要があるが、人間の目や鼻の形は、多少の相違があっても大きな特徴は同じであるので、これらの位置は容易に特定することができる。例えば、略楕円の画像が水平方向に2つ並んでいれば、その画像が目であると認識する。また、略二等辺三角形の画像が両目の下に存在していれば、その画像が鼻であると認識する。
即ち、複数の画像11から切り出した顔領域12のサイズが相互に異なる場合、各顔領域12を拡大、あるいは、縮小することにより、全ての顔領域12のサイズが後述する二次元直交関数フィルタを構成する各フィルタのサイズと同じになるように、各顔領域12のサイズを正規化する。
なお、ひな形顔画像計算部15は、複数の顔画像14の画素毎の平均値を計算して平均顔画像を求める代わりに、複数の顔画像14の主成分を分析して第一固有ベクトルを計算することにより代表的な顔画像を求め、その代表的な顔画像をひな形顔画像16として出力してもよい。
具体的には、図3に示すような二次元Walsh−Hadamard変換フィルタなどの二次元直交関数フィルタを使用するが(図3の例では、8×8ブロックサイズの二次元Walsh−Hadamard変換フィルタを示しているが、ブロックサイズは8×8に限るものではなく、例えば、16×16のブロックサイズでもよい)、二次元Walsh−Hadamard変換フィルタを構成する各フィルタの白い部分は“1”の係数を有し、黒い部分は“−1”の係数を有している。
前処理部2は、各フィルタの応答値を取得すると、その応答値の絶対値が大きい順に(応答値の絶対値が大きいフィルタは、一般的な人間の顔の特徴を明瞭に表現している)、数個のフィルタ17を選択し(図4の例では、9個のフィルタを選択している)、そのフィルタ17の応答値を要素とするひな形特徴量ベクトル18を構築する。
なお、画像に二次元直交関数フィルタを適用して特徴量ベクトルを構築する手法については、例えば、R.C.Gonzalez,R.E.Woods著の“Digital Image Processing”等の一般的な画像処理の教科書に記載されている。
検出対象識別装置の画像入力部4は、検出対象である顔が含まれている可能性がある画像21、即ち、映像機器により撮像された画像、あるいは、コンピュータに保存されている画像を入力する。
ただし、識別対象の領域22のサイズは、二次元Walsh−Hadamard変換フィルタを構成する各フィルタのサイズと一致している。
即ち、フィルタリング部6は、二次元Walsh−Hadamard変換フィルタを構成する各フィルタのうち、前処理部2により選択された数個のフィルタ17を順番に、その領域22の画像に適用する。
具体的には、数個のフィルタ17毎に、その領域22の画像の画素値と、その画像の画素に対応する部分のフィルタ係数(“1”or“−1”)を乗算し、全画素の乗算結果を加算することにより、フィルタの応答値を取得する。
フィルタリング部6は、数個のフィルタ17の応答値を取得すると、数個のフィルタ17の応答値を要素とする特徴量ベクトル23を構築する。
即ち、判定部7は、例えば、特徴量ベクトル23とひな形特徴量ベクトル18とのベクトル内積値を適用結果の一致度として計算する。
判定部7は、その適用結果の一致度が所定の閾値を上回る場合(ステップST7)、その領域22の画像が顔を表している旨を示す判定結果を出力する(ステップST8)。
一方、その適用結果の一致度が所定の閾値を上回らない場合(ステップST7)、その領域22の画像が顔を表していない旨を示す判定結果を出力する(ステップST10)。
領域切出し部5は、入力画像21の全てをスキャンするまで、その入力画像21の中から、識別対象の領域22の切出し処理を繰り返し、その領域22の画像に対して、フィルタリング部6及び判定部7が上述した処理を行う(ステップST11)。
また、識別対象の領域22の画像とひな形顔画像16との距離を演算することなく、フィルタリング部6の適用結果とメモリ3に格納されている適用結果を照合するだけで、その領域22の画像が顔を表しているか否かを判定することができるので、短時間で検出対象の有無を識別することができる効果を奏する。
このような画像センサの例として、例えば、雑誌「Nature, “Artificial Retinas − Fast, Versatile Image Processors”」(Vol.372, No.6502, pp197−198, 1994)や、特開平8−242265号公報に記載されている人工網膜LSIを用いることができる。
上記実施の形態1では、人間の顔を含む画像11をひな形顔画像生成部1の部分画像切出し部13に入力することにより、ひな形顔画像16を生成し、入力画像21から人間の顔を検出するものについて示したが、人間の顔以外を検出対象とするようにしてもよい。
例えば、検出対象が犬の顔であれば、犬の顔を含む画像11をひな形顔画像生成部1の部分画像切出し部13に入力することにより、犬の顔に係るひな形顔画像16を生成すればよい。
上記実施の形態1では、二次元直交関数フィルタとして、二次元Walsh−Hadamard変換フィルタを使用するものについて示したが、これに限るものではなく、例えば、高速フーリエ変換フィルタ、離散コサイン変換フィルタ、あるいは、ウェーブレット変換フィルタを使用し、これらのフィルタを画像に適用するようにしてもよい。この場合も、上記実施の形態1と同様の効果を奏することができる。
上記実施の形態1では、8×8ブロックサイズの二次元Walsh−Hadamard変換フィルタを使用するものについて示したが(図3を参照)、フィルタリング部6がフィルタサイズの変更が可能な二次元Walsh−Hadamard変換フィルタを領域切出し部5により切り出された領域22の画像に適用するようにしてもよい。
そして、判定部7は、一次適用フィルタ31の適用結果とメモリ3に格納されている適用結果を照合して、その領域22の画像が顔を表しているか否かを判別する。
フィルタリング部6は、判定部7の判定結果が顔を表していない旨を示す場合には、その領域22の画像が顔を表していないことは明らかであり、更に高解像度の識別処理を実施しても意味がないため、その領域22の画像に対する二次元Walsh−Hadamard変換フィルタの適用処理を中止する。したがって、領域切出し部5は、入力画像21の全てをスキャンしていなければ、次の領域22の切出し処理を実施する。
判定部7は、フィルタリング部6が二次適用フィルタ32を領域22の画像に適用すると、二次適用フィルタ32の適用結果とメモリ3に格納されている適用結果を照合して、その領域22の画像が顔を表しているか否かを判別する。
フィルタリング部6は、判定部7の判定結果が顔を表していない旨を示す場合には、その領域22の画像が顔を表していないことは明らかであり、更に高解像度の識別処理を実施しても意味がないため、その領域22の画像に対する二次元Walsh−Hadamard変換フィルタの適用処理を中止する。したがって、領域切出し部5は、入力画像21の全てをスキャンしていなければ、次の領域22の切出し処理を実施する。
判定部7は、フィルタリング部6が三次適用フィルタ33を領域22の画像に適用すると、三次適用フィルタ33の適用結果とメモリ3に格納されている適用結果を照合して、その領域22の画像が顔を表しているか否かを判別する。図7の例では、この判別結果が当該領域22の画像に関する最終識別結果となる。
Claims (5)
- 検出対象が含まれている可能性がある画像の中から、識別対象の領域を順次切り出す領域切出し手段と、上記領域切出し手段が識別対象の領域を切り出す毎に、その領域の画像に二次元直交関数フィルタを適用するフィルタリング手段と、検出対象を表しているひな形画像に対する二次元直交関数フィルタの適用結果を、上記ひな形画像に対する上記二次元直交関数フィルタの応答値の絶対値が大きい順に複数個のフィルタを選択し、選択されたフィルタ情報を記憶するとともに、フィルタ適用結果の応答値を要素とするひな形特徴量ベクトルとして記憶する記憶手段と、上記フィルタリング手段の適用結果を、上記記憶手段で記憶されている上記フィルタ情報に基づいてフィルタ応答値を選択して要素として構成される識別対象特徴量ベクトルと上記記憶手段にひな形特徴量ベクトルとして記憶されている適用結果を照合して、上記領域切出し手段により切り出された領域の画像が検出対象を表しているか否かを判定する判定手段とを備えた検出対象識別装置。
- ひな形画像に二次元直交関数フィルタを適用し、その適用結果を用いて上記二次元直交関数フィルタの応答値の絶対値が大きい順に複数個のフィルタを選択し、選択されたフィルタ情報と、フィルタ適用結果の応答値をひな形特徴量ベクトルとして記憶手段に出力する前処理手段を設けたことを特徴とする請求項1記載の検出対象識別装置。
- 判定手段は、フィルタリング手段の適用結果である上記識別対象特徴ベクトルと記憶手段に記憶されている適用結果である上記ひな形特徴量ベクトルとの一致度が所定の閾値を上回る場合、領域切出し手段により切り出された領域の画像が検出対象を表している旨を示す判定結果を出力することを特徴とする請求項1記載の検出対象識別装置。
- フィルタリング手段は、最初の段階では二次元直交関数フィルタのフィルタサイズを最小サイズに設定して、その二次元直交関数フィルタを領域の画像に適用し、その適用結果から判定手段により検出対象を表している旨を示す判定結果が得られると、その二次元直交関数フィルタのフィルタサイズを順次拡大して、その二次元直交関数フィルタを領域の画像に適用することを特徴とする請求項1記載の検出対象識別装置。
- フィルタリング手段は、判定手段により検出対象を表していない旨を示す判定結果が得られた段階で、二次元直交関数フィルタの適用処理を中止することを特徴とする請求項4記載の検出対象識別装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004010732A JP4439927B2 (ja) | 2004-01-19 | 2004-01-19 | 検出対象識別装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004010732A JP4439927B2 (ja) | 2004-01-19 | 2004-01-19 | 検出対象識別装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005202860A JP2005202860A (ja) | 2005-07-28 |
JP4439927B2 true JP4439927B2 (ja) | 2010-03-24 |
Family
ID=34823370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004010732A Expired - Fee Related JP4439927B2 (ja) | 2004-01-19 | 2004-01-19 | 検出対象識別装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4439927B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4840978B2 (ja) * | 2006-05-11 | 2011-12-21 | キヤノン株式会社 | 撮像装置及びその制御方法及びプログラム及び記憶媒体 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2875263B2 (ja) * | 1988-09-21 | 1999-03-31 | ヤマハ発動機株式会社 | 画像処理方法および装置 |
JP2542487B2 (ja) * | 1994-02-25 | 1996-10-09 | 工業技術院長 | 光情報処理システム |
JP3720412B2 (ja) * | 1995-05-01 | 2005-11-30 | キヤノン株式会社 | 情報処理方法及び装置 |
JP3675984B2 (ja) * | 1996-09-12 | 2005-07-27 | 株式会社ルネサステクノロジ | 受光素子回路及び受光素子回路アレイ |
JP4333364B2 (ja) * | 2001-08-23 | 2009-09-16 | ソニー株式会社 | ロボット装置、顔認識方法及び顔認識装置 |
JP2003271933A (ja) * | 2002-03-18 | 2003-09-26 | Sony Corp | 顔検出装置及び顔検出方法並びにロボット装置 |
JP4164737B2 (ja) * | 2002-05-24 | 2008-10-15 | ソニー株式会社 | 物体認識装置及び方法並びにロボット装置 |
-
2004
- 2004-01-19 JP JP2004010732A patent/JP4439927B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005202860A (ja) | 2005-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5047005B2 (ja) | 画像処理方法、パターン検出方法、パターン認識方法及び画像処理装置 | |
JP5517504B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2018028899A5 (ja) | ||
JP5671928B2 (ja) | 学習装置、学習方法、識別装置、識別方法、およびプログラム | |
US8107725B2 (en) | Image processor and image processing method | |
US20160086058A1 (en) | Information processing apparatus and control method thereof | |
TW200529093A (en) | Face image detection method, face image detection system, and face image detection program | |
JP5936561B2 (ja) | 画像における外観及びコンテキストに基づく物体分類 | |
JP6410450B2 (ja) | オブジェクト識別装置、オブジェクト識別方法及びプログラム | |
WO2012046426A1 (ja) | 物体検出装置、物体検出方法および物体検出プログラム | |
JP7210890B2 (ja) | 行動認識装置、行動認識方法、そのプログラム及びそのプログラムを記録したコンピュータ読取り可能な記録媒体 | |
JP2010176504A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN114863431A (zh) | 一种文本检测方法、装置及设备 | |
JP5335554B2 (ja) | 画像処理装置及び画像処理方法 | |
Jijina et al. | Detection of recoloring and copy-move forgery in digital images | |
JP5791361B2 (ja) | パターン識別装置、パターン識別方法およびプログラム | |
JP7225978B2 (ja) | 能動学習方法及び能動学習装置 | |
JP4439927B2 (ja) | 検出対象識別装置 | |
JP2005332382A (ja) | 画像処理方法および装置並びにプログラム | |
JP4099981B2 (ja) | 画像認識システム、画像認識方法および画像認識プログラム | |
KR20230060439A (ko) | 실물 촬영 이미지 여부 식별 방법 및 시스템 | |
JP2015187769A (ja) | 物体検出装置、物体検出方法及びプログラム | |
JP4789526B2 (ja) | 画像処理装置、画像処理方法 | |
JP2019106089A (ja) | 情報処理装置、情報処理方法、コンピュータプログラム | |
JP4812743B2 (ja) | 顔認識装置、顔認識方法、顔認識プログラムおよびそのプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061124 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071016 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080714 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090918 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100106 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4439927 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |