JP2003099777A - 顔画像検索装置 - Google Patents

顔画像検索装置

Info

Publication number
JP2003099777A
JP2003099777A JP2001289828A JP2001289828A JP2003099777A JP 2003099777 A JP2003099777 A JP 2003099777A JP 2001289828 A JP2001289828 A JP 2001289828A JP 2001289828 A JP2001289828 A JP 2001289828A JP 2003099777 A JP2003099777 A JP 2003099777A
Authority
JP
Japan
Prior art keywords
face
image
pattern
unit
face pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001289828A
Other languages
English (en)
Inventor
Taro Watanabe
太郎 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2001289828A priority Critical patent/JP2003099777A/ja
Publication of JP2003099777A publication Critical patent/JP2003099777A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 矩形領域内に存在する画像が顔であるか否を
より精度良く判断するための顔画像検索装置40を提供
する。 【解決手段】 外部から供給された画像の中から顔パタ
ーンを検索する顔画像検索装置40において、前記顔パ
ターンと顔以外の非顔パターンとを蓄積するパターン蓄
積部21と、パターン蓄積部21に蓄積されている前記
非顔パターンの中から、前記顔パターンに近接する非顔
パターンを検索する近接パターン検索部22と、前記顔
パターンと近接パターン検索部22で検索された非顔パ
ターンとの差分情報を算出する差分演算部23と、差分
演算部23で算出された前記差分情報に基づいて、該差
分情報の特徴量を分析する分析部24とから構成され
る。

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、外部から供給され
た画像の中から顔パターンを検索する顔画像検索装置に
関する。 【0002】 【従来の技術】従来から、人物、風景などが写実されて
いるスナップ写真を蓄積するデータベースの研究では、
データベースに蓄積されている画像中から精度良く顔領
域を検出する顔画像認識技術が注目されている。この顔
画像認識技術を用いて所定の画像から顔画像を検出する
方法としては、画像中の任意領域を矩形領域として選択
し、その選択された矩形領域内にある画像に基づいて、
前記矩形領域を構成する所定の成分が顔を構成するもの
であるかを判断することにより行われていた。 【0003】また、所定の画像中から顔画像を検出する
には、顔パターンと顔以外の非顔パターンとを含む画像
を複数枚用意し、その複数枚用意された画像の中から、
顔パターンと非顔パターンとを正しく識別することがで
きるようにニューラルネットの学習をすることができる
識別器を製作することが必要となる。 【0004】 【発明が解決しようとする課題】しかしながら、ニュー
ラルネットの学習をすることができる識別器は、ニュー
ラルネットの入力を単純にパターンの輝度値とすると、
輝度値は画素数分だけあるため、ニューラルネットのニ
ューロン数が大きくなって計数量が大きくなりニューラ
ルネットの学習等に大きな時間がかかっていた。 【0005】一方、識別器は、顔パターンと非顔パター
ンの集合に対して主成分分析を行い、固有値と固有ベク
トルとを求めた後に、固有値の大きい方からその固有値
に対応する固有ベクトルを適当に数個選択し、その選択
された固有値に対応する固有ベクトルを新たな基底とし
てパターンを表現し直すことができる。 【0006】これにより、識別器では、顔パターン及び
非顔パターンの集合に対して主成分分析を行い、その主
成分分析により求められた固有ベクトルに基づいて新た
にパターンを表現し直すことができるので、輝度値を用
いた識別よりもニューラルネットのニューロン数を少な
くすることができる。 【0007】ところが、上記識別器は、顔パターン及び
非顔パターンの集合に対して主成分分析を行っているの
で、顔パターン及び非顔パターンの両者が混在した固有
ベクトルが算出されてしまうこととなり、顔パターンと
非顔パターンとの差異を明確に識別することが困難であ
った。 【0008】そこで、本発明は以上の点に鑑みてなされ
たものであり、非顔パターンと顔パターンとの間の差分
情報を算出し、その算出された差分情報に基づいて、そ
の差分情報についての主成分分析を行い、その主成分分
析を行うことにより算出された固有値からその固有値に
対応する固有ベクトルを適当に選択し、選択された固有
ベクトルを新たな基底とすることにより、顔パターンな
どを含む画像の中から、顔パターンをより精度良く検索
することができる顔領域検出装置を提供することを課題
とする。 【0009】 【課題を解決するための手段】本願に係る発明は上記課
題を解決すべくなされたものであり、請求項1に係る発
明は、外部から供給された画像の中からその画像におけ
る顔パターンである第一顔パターンを検索する顔画像検
索装置において、第二顔パターンと前記第二顔パターン
以外の非顔パターンとを予めそれぞれ複数蓄積したパタ
ーン蓄積手段と、前記パターン蓄積手段に蓄積されてい
る前記非顔パターンの中から、前記各第二顔パターンに
類似する非顔パターンをそれぞれ検索する検索手段と、
前記各第二顔パターンと前記検索手段で検索された前記
第二顔パターンに類似するそれぞれの非顔パターンとの
差分情報を算出する算出手段と、前記算出手段で算出さ
れた前記差分情報に基づいて、該差分情報の特徴量を分
析する分析手段と、前記分析手段で分析された前記差分
情報の特徴量に基づいて、前記外部から供給された画像
の中から、前記第一顔パターンの領域を識別する識別手
段とを有することを特徴とするものである。 【0010】このような請求項1に係る発明によれば、
分析手段が、算出手段で算出された差分情報に基づいて
該差分情報の特徴量を分析するので、第二顔パターンと
非顔パターンとの差異を大きく表す特徴量を抽出するこ
とができる。また、識別手段は、分析手段で分析された
差分情報の特徴量に基づいて、外部から入力された画像
の中から、第一顔パターンの領域を識別することができ
るので、第一顔パターンと第一顔パターン以外の非顔パ
ターンとを精度良く識別することができる。 【0011】 【発明の実施の形態】(顔画像検出装置の構成)本発明
の実施形態について図面を参照しながら説明する。図1
は、本実施形態に係る顔画像検出装置を示すブロック図
である。同図に示すように、本実施形態に係る顔画像検
出装置は、画像読込部10と、特徴抽出部20と、パタ
ーン識別部30とを有している。 【0012】前記画像読込部10は、外部から供給され
た画像を読み込むことを行うものであり、本実施形態で
は、画像入力部11と、画像領域設定部12と、拡大縮
小部13と、走査部14とを有している。 【0013】画像入力部11は、顔パターンなどが含ま
れる画像を入力するものであり、例えば、テレビカメ
ラ、メカニカルスキャナ、CCDスキャナなどが挙げら
れる。具体的に画像入力部11は、写真などの画像を2
次元又は3次元の格子点の配列に標本化し、その点の輝
度値を量子化してデジタル化するものである。画像は、
図1(a)に示すように、例えば、人物、或いは、建造
物などが写し出されているものが挙げられる。この画像
を画像入力部11により入力されると、入力された画像
は、図1(b)に示すように、A〜A までの画素
領域に細分化される。 【0014】入力画像をA〜Aまでの画素領域に
細分化した画像入力部10は、A〜Aまで細分化さ
れた画素に基づいて、そのA〜Aに対応する濃度情
報(輝度値)をデジタル化し、そのデジタル化したもの
をA〜Aに対応するa 〜a (a〜a
画像ベクトルをaとする)の画像信号として画像領域設
定部12へと出力する。 【0015】画像領域設定部12は、画像入力部11に
より入力された画像から顔パターン領域を抽出するため
の矩形領域をユーザに設定させるものである。具体的に
画像領域設定部は、画像入力部11から画像信号が入力
された場合は、パーソナルコンピュータなどにあるの画
面部(図示せず)に矩形領域を設定するための設定画面
を表示させて、その表示された設定画面に基づいてユー
ザに操作部(例えば、キーボード)を介して矩形領域
(例えば、50×50(ピクセル)など)を設定させ
る。尚、図3に示すように、矩形領域は、20×20の
領域、或いは30×30の領域などを意味する。 【0016】画像領域設定部12は、ユーザに顔パター
ン領域を抽出するための矩形領域を設定させた場合は、
前記矩形領域が設定されたことを示す矩形領域信号と、
画像入力部11から入力された画像信号とを拡大縮小部
13へと出力する。これにより、顔画像検索装置40
は、画像領域設定部12設定された矩形領域に基づい
て、その矩形領域内に存在する画像が顔パターンである
か否かを識別することができる。 【0017】拡大縮小部13は、画像領域設定部12で
設定された矩形領域中にある画像を、所定の大きさに拡
大、或いは縮小するものである。具体的に拡大縮小部1
3は、画像領域設定部12から、画像信号と設定信号と
が入力された場合は、入力された画像信号と設定信号と
に対応する矩形領域中の画像を、予め設定してある倍率
に拡大、或いは縮小し、その拡大、或いは縮小した矩形
領域を拡大縮小信号として走査部14へと出力する。 【0018】例えば、拡大縮小部13は、図4(a)に
示すように、矩形領域に存在している小さい画像を、予
め設定されている倍率に拡大する。一方、図4(b)に
示すように、拡大縮小部13は、矩形領域に存在してい
る大きい画像を、予め設定されている倍率に縮小する。
これにより、拡大縮小部13は、所定の大きさに拡大縮
小することができるので、画像入力部11から入力され
た画像を、パターン認識部30(詳述は後述する)で認
識しやすい大きさに変更することができる。 【0019】走査部14は、画像領域設定部12で設定
した矩形領域を移動させるものである。具体的に走査部
14は、拡大縮小部13から拡大縮小信号が入力された
場合は、入力された拡大縮小信号を次元圧縮部31へと
出力すると共に、画像中にある矩形領域を所定の条件の
下で移動させて、その移動させたことを示す移動信号を
画像領域設定部12へと出力する。この矩形領域の移動
は、例えば、図5に示すように、実線で示した矩形領域
が現在の位置である場合は、10画素づつ次の位置
(矢印方向)に矩形領域をスライドさせる。 【0020】走査部14から移動信号が入力された画像
領域設定部14は、上記画像領域設定部14で行われて
いた同様の処理を繰り返す。また、走査部14は、前記
繰り返し処理により、矩形領域が全画像中を走査し終わ
ったと判断した場合は、矩形領域の移動を止める。 【0021】尚、画像領域設定部14及び拡大縮小部1
3で行われる繰り返し処理は、予め画像領域設定部14
及び拡大縮小部13で設定された設定内容を変更する必
要がない場合は、走査部14から入力された移動信号に
基づいて、その移動信号に対応する移動後の矩形領域内
に存在する画像を読み込み、その読み込まれた画像を所
定の倍率に拡大又は縮小することを行う。 【0022】前記特徴抽出部20は、外部から供給され
た画像の中から、画像特有の特徴量を抽出するものであ
り、本実施形態では、パターン蓄積部21と、近接パタ
ーン検索部22と、差分演算部23と、分析部24とを
有している。 【0023】パターン蓄積部21は、第二顔パターンと
第二顔パターン以外の非顔パターンとを予めそれぞれ複
数蓄積する蓄積手段であり、例えば、ハードディスク、
CD−ROMなどが挙げられる。具体的にパターン蓄積
部21は、例えば、風景、建造物などの非顔パターン
や、人物の顔を示した顔パターンが蓄積されている。こ
こで、第一顔パターンは、外部から供給された画像の中
に含まれる顔画像のことを意味し、第二顔パターンは、
パターン蓄積部21に予め複数蓄積されている顔画像を
意味する。第一顔パターン及び第二顔パターンは、本実
施形態では、単に「顔パターン」とする。 【0024】尚、パターン蓄積部21は、画像入力部1
1から顔パターン及び非顔パターンの画像を蓄積するこ
とができる。 【0025】近接パターン検索部22は、パターン蓄積
部21に予め複数蓄積されている非顔パターンの中か
ら、各第二顔パターンに類似する非顔パターンをそれぞ
れ検索する検索手段である。具体的に近接パターン検索
部22は、パターン蓄積部21に蓄積されている顔パタ
ーンと非顔パターンとに基づいて、非顔パターンの中か
ら、顔パターンに近接する非顔パターンを検索し、その
検索結果を差分演算部23へと出力する。この近接パタ
ーン検索部22が非顔パターンの中から顔パターンに近
接する非顔パターンを検索する方法は、以下の手順によ
り説明することができる。 【0026】パターン蓄積部21で蓄積されている顔パ
ターンのベクトルは、例えば、ベクトルxi(i=1,
2,・・・n;顔パターンの枚数)で表現することがで
きる。従って、同図(a)に示す顔パターンのベクトル
は、xi=(xi1、・・、xik、・・xim)になる。
添え字のik(k=1,2,・・・m)は、i枚目にお
ける顔パターンを構成する画素kを意味するものであ
る。一方、非顔パターンのベクトルは、上記と同様にベ
クトルyj(j=1,2,・・・p;非顔パターンの枚
数)で表現することができる。従って、同図(b)に示
す非顔パターンのベクトルは、yj=(yi1、・・・y
im)になる。添え字のjq(q=1,2,・・・m)
は、j枚目における非顔パターンを構成する画素qを意
味するものである。 【0027】近接パターン検索部22は、上記顔パター
ンの集合中の各顔パターンベクトルxi(i=1,2,・
・・n)と、非顔パターンベクトルyj(j=1,2,・
・・p)とからユーグリット距離dijを求める。このユ
ーグリット距離dijの計算方法は、(数1)により求め
ることができる。 【0028】 【数1】 具体的には、ユーグリット距離dijは、複数枚ある顔パ
ターンの中から、一枚の顔パターンを取り出し、その取
り出した顔パターンに対応するベクトルx1=(x11
・・・x1m)と、複数枚ある非顔パターンの中から、
一枚の非顔パターンを取り出し、その取り出した非顔パ
ターンに対応するベクトルy1=(y11、・・・y1m
とを用いることにより求められる。顔パターンに近接す
る非顔パターンは、ユーグリット距離dijの小さい数値
に対応する非顔パターンが該当する。 【0029】これにより、顔パターンに近接する非顔パ
ターンの検索は、求められた複数のユーグリット距離d
ijの中から、ユーグリット距離dijの小さい数値を数個
取得し、その数個取得したユーグリット距離dijの小さ
い数値に対応する非顔パターンをL個選出することによ
り行うことができる。尚、この選出された顔パターンに
近接する非顔パターンベクトルは、yijとする。 【0030】顔パターンベクトルx1を用いて選出され
た顔パターンベクトルx1に近接するL個の非顔パター
ンベクトルは、y 11、y 12、・・・y 1Lで表現す
ることができる。また、顔パターンベクトルxを用い
て選出された顔パターンベクトルxに近接するL個の
非顔パターンベクトルは、y 21、y 22、・・・y
2Lで表現することができる。更に、顔パターンベクトル
nを用いて選出された顔パターンベクトルxnに近接す
るL個の非顔パターンベクトルは、y n1、y n2、・
・・y nLで表現することができる。 【0031】差分演算部23は、各第二顔パターンと近
接パターン検索部22で検索された第二顔パターンに類
似するそれぞれの非顔パターンとの差分情報を算出する
算出手段である。具体的に差分演算部23は、近接パタ
ーン検索部22から検索結果が入力された場合は、入力
された検索結果に対応する顔パターンに近い非顔パター
ンベクトルyijと、顔パターンベクトルxiとに基づ
いて両パターンベクトルの差分ベクトルzijを算出し、
その算出された差分ベクトルzijの結果を差分信号とし
て分析部24へと出力する。差分ベクトルzijの算出
は、以下の式により求めることができる。尚、差分情報
とは、本実施形態では、差分ベクトルzijを意味するも
のとする。 【0032】 【数2】 分析部24は、差分演算部23で算出された差分情報に
基づいて、差分情報の特徴量を分析する分析手段であ
る。具体的に分析部24は、差分演算部23から差分信
号が入力された場合は、入力された差分信号に基づい
て、その差分信号に対応する差分ベクトルzkの特徴量
を抽出し、その抽出した特徴量を特徴信号として次元圧
縮部31へと出力する。尚、zkの添え字k(k=1,
2,・・・w)は、w=n×L個の集合のk番目のベク
トルを意味するものである。 【0033】この特徴量の抽出は、本実施形態では、主
成分分析を用いて行うものとする。ここで、主成分分析
とは、多変量の計測値から変量間の相関を無くし、より
低次元の変量によって元の計測値の特性を記述する解析
手法を意味するものである。主成分分析は、例えば、画
像圧縮等の情報圧縮やパターン認識のための特徴抽出等
で利用することができるものである。 【0034】この主成分分析を行うことにより求められ
る差分ベクトルzkの特徴量は、次の手順で求めること
ができる。先ずは、差分ベクトルzkの分散共分散行列
Aを求める。この分散共分散行列Aは、次の式により求
めることができる。 【0035】 【数3】 上式により求める特徴量は、分散共分散行列Aの固有ベ
クトルである。この固有ベクトルをvg(g=1,2,・
・・w)とすると、λgvg=Avg(λgは、固有値を意
味するものとする)の式が成り立つ。この式から求めら
れた複数ある固有値λgのうち、本実施形態で用いる固
有値λgは、固有値λgの大きい方からE(<W)個を用
いる。これにより、新しい基底は、E個選ばれた固有値
λに対応する固有ベクトルv*g(g=1,2,・・・
E)とすることができる。 【0036】前記パターン認識部30は、分析部24で
分析された差分情報の特徴量に基づいて、外部から供給
された画像の中から、顔パターンの領域を識別する識別
手段であり、本実施形態では、次元圧縮部31と、識別
部32とを有している。これにより、分析部24は、差
分演算部23で算出された差分情報に基づいて、その差
分情報の特徴量を分析するので、顔パターンと非顔パタ
ーンとの差異を大きく表す特徴量を抽出することができ
る。 【0037】次元圧縮部31は、特徴抽出部20にある
情報データと、画像読込部10で読み込まれた画像の情
報とを圧縮するものであり、本実施形態では、第一圧縮
部31aと、第二圧縮部31bとを有している。 【0038】第一圧縮部31aは、画像読込部10で読
み込まれた画像の情報を圧縮するものである。具体的に
第一圧縮部31aは、走査部14から画像信号が入力さ
れた場合は、入力された画像信号に対応する画像ベクト
ルaを、以下の算出方法により圧縮する。 【0039】この圧縮を行うには、上記画像信号に対応
する画像ベクトルをa=(a1、 2、・・・、
)、第一圧縮部31aにより圧縮されたベクトルを
a’=(a'1、a'2、・・・、a')とすると、次の
式により求めることができる。 【0040】 【数4】 上記の式によれば、右辺の圧縮後のベクトルa’の次元
数はE個であり、一方、左辺の圧縮前の次元数はW(>
E)であるので、上記の式から求められた圧縮後の次元
数Eは、次元圧縮前の次元数wよりも少なくなる。この
ため、第一圧縮部31aで行われる画像ベクトルの圧縮
は、この次元数を減らすことにより行うものである。 【0041】尚、第一圧縮部31aは、ある位置に存在
する矩形領域中の画像ベクトルaを圧縮するが、走査部
14により矩形領域が特定方向にスライドした場合は、
その特定方向にスライドした後の矩形領域内に存在する
画像ベクトルaを圧縮する。このため、第一圧縮部31
aにより算出された圧縮後の次元ベクトルは、矩形領域
の位置により変化することになる。一方、第二圧縮部3
1b(詳述は後述する)は、特徴抽出部20から入力さ
れた情報データに基づいて、その情報データを圧縮する
が、その圧縮された算出結果は、変動させずに固定して
用いる。 【0042】第二圧縮部31bは、特徴抽出部20にあ
る情報データを圧縮するものである。ここで、情報デー
タは、例えば、パターン蓄積部21に蓄積されている顔
パターンベクトルxij、非顔パターンベクトルyij、分
析部で算出された特徴量zkなどが挙げられる。具体的
に第二圧縮部31bは、パターン蓄積部21から顔パタ
ーンベクトルxijと非顔パターンベクトルyijと、分析
部24から特徴量zkとを有する情報データを取得し、
その取得した情報データに基づいて、その情報データの
圧縮を行う。 【0043】この情報データの圧縮を行うには、情報デ
ータのベクトルをh=(h、h、・・・hE)、第
二圧縮部31bにより圧縮された情報データのベクトル
をh’=(h’、h’、・・・h’E)とすると、
上記(数4)と同様に、次の式により求めることができ
る。第二圧縮部31bで行われる情報データのベクトル
の圧縮は、以下の式により次元数を減らすことにより行
うものである。 【0044】 【数5】 次元圧縮部31は、第一圧縮部31aと、第二圧縮部3
1bとから算出された次元圧縮後のベクトルa’、h’
を識別部32へと出力する。尚、上述の如く、第二圧縮
部31bにより次元圧縮された後のベクトルh’は、固
定(詳述は後述する)されているものであるが、第一次
元圧縮部31aにより次元圧縮された後のベクトルa’
は、矩形領域が位置する場所毎(例えば、数画素づつず
らした時の画像毎)に求められるものである。 【0045】このため、次元圧縮後のベクトルa’は、
矩形領域が位置する場所毎に求められるものであり、そ
の矩形領域の位置毎に対応して、識別部32は、その位
置毎に対応する矩形領域に存在する画像が顔パターンで
あるか否かを識別する。 【0046】識別部32は、分析24で分析された差分
情報の特徴量に基づいて、外部から供給された画像の中
から、第一顔パターンの領域を識別する識別手段であ
る。識別部32を構成するニューラルネットワークは、
図7に示すように、本実施形態では、三層のパーセプト
ロンにより構成される。具体的に識別部32は、第二圧
縮部31aからベクトルh’が入力された場合は、入力
されたベクトルh’を用いて、識別部32を構成するニ
ューラルネットワークを、バックプロパゲイションによ
り学習させる。 【0047】同図中の第一層目のニューロン数は、第一
圧縮部31aから入力されるベクトルa’の次元数と
し、その第一層目には、第一圧縮部31aから入力され
たベクトルa’が入力されるものとする。第二層目のニ
ューロン数は適当な数を用いるものとし、第三層目のニ
ューロン数は、一つのみとする。認識部32が、顔画像
であるか否かの認識を行うには、矩形領域内にある画像
を顔であると認識し、その認識された結果が顔であるこ
とを示すために、第三層目に”1”を出力する。一方、
認識部32は、矩形領域内にある画像を顔でないと認識
し、その認識された結果が顔でないことを示すために、
第三層目に”0”を出力する。 【0048】(顔画像検索装置を用いた顔画像検索方
法)上記構成を有する顔画像検索装置による顔画像検索
方法は、以下の手順により実施することができる。図8
は、本実施形態に係る顔画像検索方法の手順を示すフロ
ー図である。 【0049】同図に示すように、顔画像検索方法は、画
像を読み込むことを行う手順(同図中の領域)と、パ
ターン蓄積部21に蓄積されているパターンの特徴量の
抽出を行う手順(同図中の領域)と、同図中の領域
と領域とにより行われた手順に基づいて、画像入力部
11から入力された矩形領域内の画像が顔画像であるか
否かを識別することを行う手順(同図中の領域)とを
有している。 【0050】同図中の領域では、先ず、画像入力部1
1が、画像を入力するステップを行う(S101)。具
体的には、画像入力部11が、各種のパターンを含む画
像を入力して、その入力された画像を、A〜A
での画素領域に細分化する。そして、入力画像をA
までの画素領域に細分化した画像入力部10は、
〜Aまで細分化された画素に基づいて、そのA
〜Aに対応する輝度値(濃度情報)をデジタル化し、
そのデジタル化したものをA〜Aに対応するB
〜B の画像信号として画像領域設定部12へと出力
する。 【0051】次いで、画像領域設定部12が、矩形領域
を設定するステップを行う(S102)。具体的に画像
領域設定部12は、画像入力部11から画像信号が入力
された場合は、パーソナルコンピュータなどにあるの画
面部(図示せず)に矩形領域を設定するための設定画面
を表示させて、その表示された設定画面に基づいてユー
ザに操作部(例えば、キーボード)を介して矩形領域
(例えば、50×50(ピクセル)など)を設定させ
る。尚、図3に示すように、矩形領域は、20×20の
領域、或いは30×30の領域などの領域を意味す
る。 【0052】その後、上記よりユーザに顔パターン領域
を抽出するための矩形領域を設定させた画像領域設定部
12は、前記矩形領域が設定されたことを示す矩形領域
信号と、画像入力部11から入力された画像信号とを拡
大縮小部13へと出力する。これにより、顔画像検索装
置40は、画像領域設定部12設定された矩形領域に基
づいて、その矩形領域内に存在する画像が顔パターンで
あるか否かを識別することができる。 【0053】次いで、拡大縮小部13が所定の矩形領域
中にある画像を所定の大きさに変更するステップを行う
(S103)。具体的には、拡大縮小部13が、画像領
域設定部12から、画像信号と設定信号とが入力された
場合は、入力された画像信号と設定信号とに対応する矩
形領域中の画像を、予め設定してある倍率に拡大、或い
は縮小し、その拡大、或いは縮小した矩形領域にある画
像を拡大縮小信号として走査部14へと出力する。 【0054】例えば、拡大縮小部13は、図4(a)に
示すように、矩形領域に存在している小さい画像を、予
め設定されている倍率に拡大する。一方、図4(b)に
示すように、拡大縮小部13は、矩形領域に存在してい
る大きい画像を、予め設定されている倍率に縮小する。
これにより、拡大縮小部13は、所定の大きさに拡大縮
小することができるので、画像入力部11から入力され
た画像を、パターン認識部30で認識しやすい大きさに
変更することができる。 【0055】次いで、走査部14が、矩形領域をスライ
ドさせるステップを行う(S104)。具体的には、走
査部14が、拡大縮小部13から拡大縮小信号が入力さ
れた場合は、入力された拡大縮小信号を次元圧縮部31
へと出力すると共に、画像中にある矩形領域を所定の条
件の下で移動させて、その移動させたことを示す移動信
号を画像領域設定部12へと出力する。 【0056】この矩形領域の移動は、例えば、図5に示
すように、実線で示した矩形領域が現在の位置である
場合は、10画素づつ次の位置(矢印方向)に矩形領域
をスライドさせる。その後、走査部14から移動信号が
入力された画像領域設定部14は、上記画像領域設定部
14で行われていた同様の処理を繰り返す。 【0057】次いで、走査部14は、全画像内を矩形領
域が移動したか否かを判断するステップを行う(S10
5)。具体的には、走査部14は、前記繰り返し処理
(S102〜S104)により、矩形領域が全画像中を
走査し終わった場合は、矩形領域の移動を止める。 【0058】尚、(S102)及び(S103)で行わ
れる繰り返し処理は、予め画像領域設定部14及び拡大
縮小部13で設定された設定内容を変更する必要がない
場合は、走査部14から入力された移動信号に基づい
て、その移動信号に対応する移動後の矩形領域内に存在
する画像を読み込み、その読み込まれた画像を所定の倍
率に拡大又は縮小することを行う。 【0059】同図中の領域では、先ず、近接パターン
検索部22が、パターン蓄積部22に蓄積されている顔
パターンと非顔パターンとに近い非顔パターンを検索す
るステップを行う(S201)。具体的には、パターン
蓄積部21に蓄積されている顔パターンベクトルxijと
非顔パターンベクトルyijとに基づいて、非顔パターン
ベクトルyijの中から、顔パターンに近接する非顔パタ
ーンベクトルyijを検索し、その検索結果を差分演算
部23へと出力する。 【0060】次いで、差分演算部23が、近接パターン
で検索された顔パターンに近い非顔パターンと、顔パタ
ーンとに基づいて、両者の差分情報を算出するステップ
を行う(S202)。具体的には、差分演算部23が、
近接パターン検索部22から検索結果が入力された場合
は、入力された検索結果に対応する顔パターンに近い非
顔パターンベクトルyijと、顔パターンベクトルxi
とに基づいて両パターンの差分ベクトルzijを算出し、
その算出された差分ベクトルzijの結果を差分信号とし
て分析部24へと出力する。差分ベクトルzijの算出
は、上記で述べた算出方法(差分演算部24の説明で示
した箇所)により求めることができる。尚、差分情報と
は、本実施形態では、差分ベクトルzijを意味するもの
とする。 【0061】その後、分析部24が、差分演算部23で
算出された差分情報に基づいて、その差分情報の特徴量
を抽出するステップを行う(S203)。具体的には、
分析部24が、差分演算部23から差分信号が入力され
た場合は、入力された差分信号に基づいて、その差分信
号に対応する差分ベクトルzijの特徴量を抽出し、その
抽出した特徴量を特徴信号として次元圧縮部31へと出
力する。差分ベクトルzijの特徴量は、上記で述べた算
出方法(分析部24の説明で示した箇所)により求める
ことができる。 【0062】同図中の領域では、先ず、次元圧縮部3
1が、画像読込部10と特徴抽出部20とから入力され
た情報を圧縮するステップを行う(S301)。 【0063】具体的には、先ず、第一圧縮部31aが、
走査部14から画像信号が入力された場合は、入力され
た画像信号に対応する画像ベクトルaに基づいて、その
画像ベクトルaを、次元数の少ないベクトルa’に変換
し、その変換したベクトルa’を識別部32へと出力す
る。 【0064】また、第二圧縮部31bが、パターン蓄積
部21から顔パターンベクトルxiと非顔パターンベク
トルyjと、分析部24から特徴量zijとを有する情報
データhを取得し、その取得した情報データに基づい
て、その情報データを次元数の少ないベクトルh’に変
換し、その変換したベクトルh’を識別部32へと出力
する。ここで、情報データは、例えば、パターン蓄積部
21に蓄積されている顔パターンベクトルxi、非顔パ
ターンベクトルyj、分析部で算出された特徴量zkなど
が挙げられる。 【0065】次いで、識別部32が、次元圧縮部31で
圧縮された情報に基づいて、その圧縮された情報に対応
する画像が顔画像であるか否かを識別するステップを行
う(S302)。具体的には、識別部32が、第二圧縮
部31aからベクトルh’が入力された場合は、入力さ
れたベクトルh’を用いて、識別部32を構成するニュ
ーラルネットワークを、バックプロパゲイションにより
学習させる。 【0066】その後、認識部32は、矩形領域内にある
画像を顔であると認識し、その認識された結果が顔であ
ることを示すために、第三層目に”1”を出力する。一
方、認識部32は、同様に、矩形領域内にある画像を顔
でないと認識し、その認識された結果が顔でないことを
示すために、第三層目に”0”を出力する。 【0067】尚、次元圧縮後のベクトルa’は矩形領域
が位置する場所毎に求められるものであり、その矩形領
域の位置毎に応じて、識別部32は、その位置の矩形領
域内に存在する画像データaに対応する次元圧縮後のベ
クトルa’に基づいて、その位置毎に対応した矩形領域
内に存在する画像が顔パターンであるか否かを識別す
る。このため、識別部32は、ある位置に存在する矩形
領域内の画像毎に顔画像であるか否かを認識する (顔画像検索装置による作用及び効果)このような本実
施形態に係る顔画像検索装置40によれば、分析部24
が、差分演算部23で算出された差分情報に基づいて、
その差分情報の特徴量を分析するので、顔パターンと非
顔パターンとの差異を大きく表す特徴量を抽出すること
ができる。 【0068】また、識別部32は、分析部24で分析さ
れた差分情報の特徴量に基づいて、外部から入力された
画像の中から、前記顔パターンの領域を識別することが
できるので、その領域内にある画像が顔パターンである
のか、或いは非顔パターンであるのかを精度良く識別す
ることができる。 【0069】 【発明の効果】以上説明したように本発明の顔画像検索
装置40によれば、特徴抽出部20は、パターン蓄積部
21に蓄積された非顔パターンの集合の中から、顔パタ
ーンに最も相関の近い非顔パターンを選出し、その選出
された非顔パターンと顔パターンとの間の差分情報を算
出し、その算出された差分情報に基づいて、その差分情
報について主成分分析を行い、その主成分分析を行うこ
とにより差分情報の特徴量を抽出することができるの
で、顔パターンと非顔パターンとの差を大きく特徴付け
るベクトルを求めることができる。 【0070】また、パターン認識部32は、矩形領域内
に存在する画像が顔パターンであるか否かの判断を行う
際に、分析部24で算出された差分情報の特徴量を用い
て判断することができるので、矩形領域内に存在する画
像が顔であるか否をより精度良く判断することができ
る。
【図面の簡単な説明】 【図1】本実施形態に係る顔画像検索装置40のブロッ
ク図を示したものである。 【図2】本実施形態における画像入力部11により入力
された画像内容を示した図である。 【図3】本実施形態における画像入力部11により入力
された画像の矩形領域を示した図である。 【図4】本実施形態における拡大縮小部13により矩形
領域内にある画像が所定の倍率に拡大又は縮小されたこ
とを示した図である。 【図5】本実施形態における走査部14により矩形領域
が特定の方向に移動されていく様子を示した図である。 【図6】本実施形態におけるパターン蓄積部21に蓄積
されている顔パターン及び非顔パターンのベクトルを示
した図である。 【図7】本実施形態におけるパターン識別部30を構成
するニューラルネットを示した図である。 【図8】本実施形態に係る顔画像検索方法の手順を示し
たフロー図である。 【符号の説明】 10…画像読込部、11…画像入力部、12…画像領域
設定部、13…拡大縮小部、14…走査部、20…特徴
抽出部、21…パターン蓄積部、23…差分演算部、2
4…分析部、30…パターン識別部、31a…第一圧縮
部、31b…第二圧縮部、32…識別部、40…顔画像
検索装置
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B057 BA02 CA08 CA12 CA16 CB20 CC02 CD02 CD05 DA12 DC01 DC40 5B075 ND08 PR06 QM08 QS03 UU40 5L096 BA18 CA02 DA02 EA03 FA05 GA08 GA57 HA08 JA11

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 外部から供給された画像の中からその画
    像における顔パターンである第一顔パターンを検索する
    顔画像検索装置において、 第二顔パターンと前記第二顔パターン以外の非顔パター
    ンとを予めそれぞれ複数蓄積したパターン蓄積手段と、 前記パターン蓄積手段に予め複数蓄積されている前記非
    顔パターンの中から、前記各第二顔パターンに類似する
    非顔パターンをそれぞれ検索する検索手段と、 前記各第二顔パターンと前記検索手段で検索された前記
    第二顔パターンに類似するそれぞれの非顔パターンとの
    差分情報を算出する算出手段と、 前記算出手段で算出された前記差分情報に基づいて、該
    差分情報の特徴量を分析する分析手段と、 前記分析手段で分析された前記差分情報の特徴量に基づ
    いて、前記外部から供給された画像の中から、前記第一
    顔パターンを識別する識別手段とを有することを特徴と
    する顔画像検索装置。
JP2001289828A 2001-09-21 2001-09-21 顔画像検索装置 Pending JP2003099777A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001289828A JP2003099777A (ja) 2001-09-21 2001-09-21 顔画像検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001289828A JP2003099777A (ja) 2001-09-21 2001-09-21 顔画像検索装置

Publications (1)

Publication Number Publication Date
JP2003099777A true JP2003099777A (ja) 2003-04-04

Family

ID=19112268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001289828A Pending JP2003099777A (ja) 2001-09-21 2001-09-21 顔画像検索装置

Country Status (1)

Country Link
JP (1) JP2003099777A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005108196A (ja) * 2003-09-09 2005-04-21 Fuji Photo Film Co Ltd 対象物識別装置および方法並びにプログラム
JP2006277274A (ja) * 2005-03-29 2006-10-12 Seiko Epson Corp 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
JP2007158829A (ja) * 2005-12-06 2007-06-21 Hitachi Kokusai Electric Inc 画像処理装置、画像処理方法およびプログラム
US7308119B2 (en) 2003-11-26 2007-12-11 Canon Kabushiki Kaisha Image retrieval apparatus and method, and image display apparatus and method thereof
US7920725B2 (en) 2003-09-09 2011-04-05 Fujifilm Corporation Apparatus, method, and program for discriminating subjects
WO2019225595A1 (ja) * 2018-05-23 2019-11-28 日本電気株式会社 辞書学習装置、情報処理装置、辞書学習方法およびプログラム記憶媒体

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240930A (ja) * 1997-02-14 1998-09-11 Hewlett Packard Co <Hp> パターン認識方法およびパターン認識装置
JPH11175246A (ja) * 1997-12-12 1999-07-02 Toshiba Corp 視線検出装置及びその方法
JP2001005967A (ja) * 1999-06-21 2001-01-12 Matsushita Electric Ind Co Ltd 画像送信装置及びニューラルネットワーク
JP2001052168A (ja) * 1999-08-10 2001-02-23 Victor Co Of Japan Ltd パターン照合装置
JP2001202516A (ja) * 2000-01-19 2001-07-27 Victor Co Of Japan Ltd 個人識別装置
JP2002304629A (ja) * 2001-01-30 2002-10-18 Nec Corp ロボット装置、照合環境判定方法、及び照合環境判定プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240930A (ja) * 1997-02-14 1998-09-11 Hewlett Packard Co <Hp> パターン認識方法およびパターン認識装置
JPH11175246A (ja) * 1997-12-12 1999-07-02 Toshiba Corp 視線検出装置及びその方法
JP2001005967A (ja) * 1999-06-21 2001-01-12 Matsushita Electric Ind Co Ltd 画像送信装置及びニューラルネットワーク
JP2001052168A (ja) * 1999-08-10 2001-02-23 Victor Co Of Japan Ltd パターン照合装置
JP2001202516A (ja) * 2000-01-19 2001-07-27 Victor Co Of Japan Ltd 個人識別装置
JP2002304629A (ja) * 2001-01-30 2002-10-18 Nec Corp ロボット装置、照合環境判定方法、及び照合環境判定プログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005108196A (ja) * 2003-09-09 2005-04-21 Fuji Photo Film Co Ltd 対象物識別装置および方法並びにプログラム
JP4541806B2 (ja) * 2003-09-09 2010-09-08 富士フイルム株式会社 対象物識別装置および方法並びにプログラム
US7920725B2 (en) 2003-09-09 2011-04-05 Fujifilm Corporation Apparatus, method, and program for discriminating subjects
US8184870B2 (en) 2003-09-09 2012-05-22 Fujifilm Corporation Apparatus, method, and program for discriminating subjects
US7308119B2 (en) 2003-11-26 2007-12-11 Canon Kabushiki Kaisha Image retrieval apparatus and method, and image display apparatus and method thereof
JP2006277274A (ja) * 2005-03-29 2006-10-12 Seiko Epson Corp 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
JP2007158829A (ja) * 2005-12-06 2007-06-21 Hitachi Kokusai Electric Inc 画像処理装置、画像処理方法およびプログラム
JP4658788B2 (ja) * 2005-12-06 2011-03-23 株式会社日立国際電気 画像処理装置、画像処理方法およびプログラム
US7999846B2 (en) 2005-12-06 2011-08-16 Hitachi Kokusai Electric Inc. Image processing apparatus, image processing system, and recording medium for programs therefor
WO2019225595A1 (ja) * 2018-05-23 2019-11-28 日本電気株式会社 辞書学習装置、情報処理装置、辞書学習方法およびプログラム記憶媒体
US11600086B2 (en) 2018-05-23 2023-03-07 Nec Corporation Dictionary learning device, dictionary learning method, and program storage medium

Similar Documents

Publication Publication Date Title
WO2020125216A1 (zh) 一种行人重识别方法、装置、电子设备及计算机可读存储介质
JP6204199B2 (ja) 画像品質の評価
JP4505733B2 (ja) テクストンを用いる対象物認識方法及び装置
US7853038B2 (en) Systems and methods for object dimension estimation
Wu et al. A field model for human detection and tracking
JP2013196683A (ja) 姿勢分類器トレーニング方法、対象物分類器トレーニング方法、対象物検出方法、姿勢分類器トレーニング装置、対象物分類器トレーニング装置、及び対象物検出装置
JPH08339445A (ja) 確率的固有空間解析を用いた複雑な対象物の検出、認識、及び符号化方法及び装置
TWI254891B (en) Face image detection method, face image detection system, and face image detection program
JP2012238175A (ja) 情報処理装置、情報処理方法、及びプログラム
US20080159624A1 (en) Texture-based pornography detection
JP5180922B2 (ja) 画像検索システム及び画像検索方法
JP2016170542A (ja) 画像処理装置、画像処理方法及びプログラム
WO2000055811A1 (fr) Processeur de donnees, procede de traitement de donnees, et support d&#39;enregistrement
JP2004355370A (ja) 文書処理装置
Dong et al. Weighted locality collaborative representation based on sparse subspace
JP5290229B2 (ja) 学習装置及び対象物検知装置
Huang et al. Gradient feature extraction for classification-based face detection
CN115862113A (zh) 陌生人异常识别方法、装置、设备及存储介质
Oskouie et al. Automated recognition of building façades for creation of As-Is Mock-Up 3D models
Aslam et al. Emotion based facial expression detection using machine learning
JP2003099777A (ja) 顔画像検索装置
JP5538781B2 (ja) 画像検索装置及び画像検索方法
WO2010087451A1 (ja) 画像表示装置、画像表示方法、および画像表示プログラム
CN112906798A (zh) 图像匹配方法、装置及计算机存储介质
US20070047806A1 (en) Scatterness of pixel distribution

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100810

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100907