JP2010165156A - 画像処理装置、方法及びプログラム - Google Patents

画像処理装置、方法及びプログラム Download PDF

Info

Publication number
JP2010165156A
JP2010165156A JP2009006566A JP2009006566A JP2010165156A JP 2010165156 A JP2010165156 A JP 2010165156A JP 2009006566 A JP2009006566 A JP 2009006566A JP 2009006566 A JP2009006566 A JP 2009006566A JP 2010165156 A JP2010165156 A JP 2010165156A
Authority
JP
Japan
Prior art keywords
eye
image
pattern
face
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009006566A
Other languages
English (en)
Inventor
Satoru Yashiro
哲 八代
Kotaro Yano
光太郎 矢野
Yumi Watabe
由美 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009006566A priority Critical patent/JP2010165156A/ja
Publication of JP2010165156A publication Critical patent/JP2010165156A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】単眼候補数が多い時にペアリングの組合せを低減することで高速な顔検出を実現する。
【解決手段】画像入力手段と、片目領域検出手段と、両目ペアリング手段と、パターン切出し手段と、パターン判定手段と、出力部とを備える。両目ペアリング手段は、第1の目と組み合わせる第2の目を決定する際、第1の目を中心とする対数極座標系に変換されたフラグマップを参照して、重複した領域からの組合せを抑制する。
【選択図】図1

Description

本発明は、画像や動画像からこの画像中に含まれる顔を検出する画像処理装置等に関する。
画像から顔パターンを自動的に検出する画像処理方法は非常に有用である。このような方法は通信会議、マン・マシン・インタフェース、セキュリティ、人間の顔を追跡するためのモニタ・システム、画像圧縮などの多くの分野で使用することができる。このような画像中から顔を検出する技術としては、例えば、非特許文献1にはYangらの報告に各種方式が挙げられている。その中では、いくつかの顕著な特徴(2つの目、口、鼻など)とその特徴間の固有の幾何学的位置関係とを利用して人間の顔を検出する方式が示されている。
また、人間の顔の対称的特徴、人間の顔色の特徴、テンプレート・マッチング、ニューラル・ネットワークなどを利用することによって人間の顔を検出する方式が示されている。例えば、非特許文献2にはRowleyらの報告で提案されている。この方式は、ニューラル・ネットワークにより画像中の顔パターンを検出する方法である。以下、非特許文献2による顔検出の方法について簡単に説明する。
先ず、顔の検出を対象とする画像データをメモリに読み込み、顔と照合する所定の領域を読み込んだ画像中から切り出す。そして、切り出した領域の画素値の分布を入力としてニューラル・ネットワークによる演算で一つの出力を得る。このときニューラル・ネットワークの重み、閾値が膨大な顔画像パターンと非顔画像パターンにより予め学習されておいる。例えば、ニューラル・ネットワークの出力が0以上なら顔、それ以外は非顔であると判別する。そして、ニューラル・ネットワークの入力である顔と照合する画像パターンの切出し位置を、例えば図3に示すように画像全域から縦横順次に走査していくことにより、画像中から顔を検出する。
また、様々な大きさの顔の検出に対応するため、図3に示すように読み込んだ画像を所定の割合で順次縮小し、それに対して前述した顔検出の走査を行うようにしている。しかしながら、非特許文献2による方法では一枚の画像に対して膨大な回数のニューラル・ネットワークによる顔判別の処理を行う必要があり、処理速度に問題があった。
処理の高速化に着目した例としては、非特許文献3においてViolaとJonesの報告がある。この報告の中ではAdaBoostを使って多くの弱判別器を有効に組み合せて顔判別の精度を向上させる。また、夫々の弱判別器をHaarタイプの矩形特徴量で構成し、しかも矩形特徴量の算出を、積分画像を利用して高速に行っている。
また、AdaBoost学習によって得た判別器を直列に繋ぎ、カスケード型の顔検出器を構成するようにしている。このカスケード型の顔検出器は先ず、前段の単純な判別器を使って明らかに顔でないパターンの候補をその場で除去する。それ以外の候補に対してのみ、より高い識別性能を持つ後段の複雑な判別器を使って顔かどうかの判定を行っており、すべての候補に対して複雑な判定を行う必要がないので高速である。
特許文献2及び特許文献3は、画像を回転角度や縮小率を変えてラスタスキャンする、いわば総当り的な手法である。画像の回転及び解像度を変え、それぞれの画像に対して総当りで顔パターン判定をしていたため、回転、縮小率、縦位置、横位置の4次元探索であり、処理コストが高かった。それに対して、目や鼻穴などの顔の器官を高速に検出して顔領域を絞り込む手法がある。例えば、特許文献1にあるような目領域の検出方法が公開されている。これは、各画素の輝度に基づき各列を複数の間隔にセグメント化し、各間隔に谷領域、中間領域又は山領域のラベルを付け、各列の谷領域とその隣接列の谷領域とをマージすることで目候補領域を生成するものである。2つの目候補領域でペアを組んで顔領域を仮定して、顔パターン判定を行うことで、判定回数を抑えることができた。
特開2002−183731号公報 IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.24,NO.1,JANUARY 2002 "Detecting Faces in Images:A Survey" IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL.20,NO.1,JANUARY 1998 "Neural network‐based face detection" Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR'01) "Rapid Object Detection using Boosted Cascade of Simple Features"
しかしながら、単眼同士をペアリングする方法は、ペアリングの組合せ数が検出された単眼候補数の2乗になる。そのため特に単眼候補数が多い時に顔判定パターンの切出しのための処理コストが高いという問題点があった。
本発明はこのような問題点に鑑みてなされた。即ち、類似した顔パターンを形成する両目のペアを抑制することで、単眼候補数が多い時にペアリングの組合せを低減することで高速な顔検出を実現することを目的とする。
本発明は上記目的を達成するために、画像から顔パターンの検出を行う画像処理装置であって、識別対象の画像の入力を受け付ける画像入力手段と、前記画像入力手段により入力された画像から片目候補領域を検出する片目領域検出手段と、前記片目領域検出手段により出力された片目領域から両方の目を組み合わせる両目ペアリング手段と、ペアリングされた両目位置に基づいて顔パターンを切り出すパターン切出し手段と、前記切り出されたパターンが顔であるか否かを判定するパターン判定手段と、前記パターン判定部で顔と判定されたパターンを出力する出力部とを備え、前記両目ペアリング手段は、第1の目と組み合わせる第2の目を決定する際、前記第1の目を中心とする対数極座標系に変換されたフラグマップを参照して、重複した領域からの組合せを抑制することを特徴とする画像処理装置等を提供する。
本発明により、類似した顔パターンを形成する両目のペアを抑制することで、単眼候補数が多い時にペアリングの組合せを低減することで高速な顔検出を実現することができる効果がある。
図2は、本発明の第一実施形態における画像処理装置の構成を示すブロック図である。画像処理装置は、ROM202やRAM203に格納されたプログラムに従って命令を実行するCPU201、本発明のプログラムやその他の制御に必要なプログラムやデータを格納したROM202である。また、一時的なデータを格納するRAM203、IDEやSCSIなどの外部記憶装置とのインターフェースを実現するドライブI/F204、画像やパターン抽出などのプログラムを有する。
また、顔、非顔のサンプルパターンなどを記憶するHDD205、デジタルカメラなどの装置から識別対象の画像を入力する画像入力装置206、キーボード等、オペレータからの入力を行う入力装置208を有する。また、ブラウン管や液晶ディスプレイなどの表示装置209、インターネットやイントラネットなどのネットワークと接続を行うモデムやLANなどのネットワークI/F210を有する。また、これらを接続するバス211を介して相互にデータの入出力を行う。本画像処理装置は、オペレーティングとしてマイクロソフト社のWINDOWS(登録商標)XPがインストールされ、その上で動作するアプリケーションとして実装されている。
[全体フロー]
図1は、本発明の全体フローを示した図である。
画像入力部101から画像が入力されると、片目領域検出部102によって片目候補領域が抽出される。片目領域の検出は特許文献1などの従来技術によって開示されている。
次に、両目ペアリング部によって、片目領域から第1の目と第2の目との両方の目を組み合せる両目ペアリングを行う。その際、片方の目には多解像度フラグマップ管理部によって重複を抑制し、ペアリングするもう片方の目には対数極座標系フラグマップ管理部によって重複を抑制する。両目ペアリング部からはペアリングされた両目の2点の両目位置(座標リスト)が出力される。
次に、目の座標を基準にして次に顔候補(パターン)のパターン切出し部によって、所定のサイズのテンプレートにアフィン変換を行ってペアリングされた両目位置に基づいて顔パターンを切り出す。顔パターンは、本実施形態では20*20画素の輝度画像である。このパターン上に左目が上から、5画素目、左から5画素目、また右目が上から5画素目、右から5画素目に配置されるようにアフィン変換を行う。
次に、パターン判定部によってテンプレート中の輝度画像が顔か否か判定される。これは非特許文献2や非特許文献3などの従来技術によってパターン判定を行う。出力部では、パターン判定部によって顔と判定された入力画像中の領域がHDD205に記録、又は表示装置209に表示される。
[両目ペアリング]
次に、両目ペアリング部の処理の詳細について、図3のフローチャートを用いて詳細に説明する。ここでは、顔画像に向かって左側の目を左目、右側の目を右目として説明する。これは左右逆に読み替えても、なんら本発明の主旨を変えるものではない。
両目ペアリング部には、入力された画像とともに、図4に示すような前段の片目領域検出部で検出された目候補の中心座標のリストが入力される。両目ペアリング手段は、第1の目と組み合せる第2の目を決定する際、第1の目を中心とする対数極座標系に変換されたフラグマップを参照して、重複した領域からの組合せを抑制する。目候補の中心座標のリストには、右目か左目かを区別する情報や、目領域の大きさなどがあってもよいが、ここではないものとして説明する。
両目ペアリング部の処理を開始すると、先ずステップS301において多解像度フラグマップの領域を確保し、全てのフラグをOFFに初期化する。多解像度フラグマップについては、後に詳細な説明を行う。
次に、ステップS302においてリストから左目を1つ着目する。
次に、ステップS303において、対数極座標系フラグマップの領域を確保し、全てのフラグをOFFに初期化する。対数極座標系は次の式によって座標系を変換するものである。
Figure 2010165156
ここで、x0、y0は着目中の左目の座標である。α、βは、対数極座標系の解像度を適切に設定するための係数である。また、γは検出対象とする最小の顔の目間距離である。具体的な数値例を挙げて説明すると、下記数値である。
Figure 2010165156
これを直交系で示すと、着目している左目を中心とする同心円状となる。本実施形態では、20画素を最小とし、そこから1.1倍ごと、即ち20, 22, 24.2, 26.6, …という間隔で、また、角度が6度ごとに区切られた領域が対数極座標系の1画素に対応する。対数極座標系フラグマップは、対数極座標系の1画素に対して1つのフラグが対応したものである。
対数極座標系フラグマップの例を図6に示し、ペアリングを抑制する様子を説明する。
601は着目している左目を示し、602、603などの黒点は他の目候補である。602及び603は同一の領域に存在するため、602のみが左目とペアリングされる。603はペアリングされないことを示している。
次に、ステップS304においてリストから左目とペアリングするための右目を1つ着目する。次に、ステップS305において左右の目中心間の距離を求める。次にステップS306において、目中心間の距離に基づき、対応する多解像度フラグマップの解像度を選択する。解像度の境目では前後の解像度で目中心間の距離が重複して設定することもでき、その場合は複数の解像度が選択されてもよい。
次に、ステップS307において、多解像度の選択された解像度のフラグマップ上の左目座標に対応するフラグを評価する。これがONであれば、現在着目している左目の付近に、既にペアリングを行った左目があるということなので、ペアリングは行わずにステップS312に飛ぶ。複数の解像度が選択されていた場合には、全ての解像度での目座標に対応するフラグがONである場合にペアリングは行わずにステップS312に飛ぶ。
次に、ステップS308において、ステップS307で評価したフラグをONにする。次に、ステップS309において、対数極座標系フラグマップ上の右目座標に対応するフラグを評価する。これがONであれば、現在着目している右目の付近に、現在着目している左目とすでにペアリングを行った右目があるということなので、ペアリングは行わずにステップS312に飛ぶ。そうでなければステップS310に進み、ステップS309で評価したフラグをONにする。
次に、ステップS311に進み、両目ペアリストに着目している右目と左目の座標を追加する。ステップS312では着目している左目に対して全ての右目を処理したか判定し、全て処理するまで、ステップS304に戻るループを構成する。次に、ステップS313に進み、全ての左目に対して処理したか判定し、全て処理するまで、ステップS302に戻るループを構成する。すべての左目を処理したら、両目ペアリングの処理は終了である。
[多解像度フラグマップ]
多解像度フラグマップの一例を図5に示し、多解像度フラグマップによりペアリングが抑制される様子を説明する。説明のため、解像度のバリエーションを2種類にして簡略化しているが、実際には更に多くの解像度でフラグマップが存在する。
多解像度フラグマップは入力画像画素を所定の複数の解像度に落とし、各解像度の各画素に1つのフラグが対応したものである。また、各解像度ごとに対応する目間距離が定義されており、解像度が低いほど長い距離の目間距離が設定されている。解像度が変り目の目間距離における判別精度劣化を避けるため、目間距離は前後の解像度で重複していてもよい。重複したところでは複数の解像度のフラグマップが参照される。
図中、501は入力画像と同じ解像度の画像に抽出された目候補の中心座標をプロットしたものであり、502〜505は抽出された目の候補の例を示している。また、506〜507は複数の解像度のフラグマップである。白いブロック領域はフラグがOFFの状態であり、黒いブロック領域はフラグがONの状態である。両目ペアリング部の処理が終わったとき、各解像度で目候補に相当するブロックでフラグがONの状態になっていることを示している。
506の高解像度フラグマップでは短距離の目間候補をサポートし(502と504)、(502と504)及び(504と505)がペアリングされる。また、507の低解像度のフラグマップでは長距離の目間候補をサポートする。この解像度では502と503は同一の領域であるため、(502と505)のみがペアリングされ、(503と505)のペアリングは抑制される。
本実施形態ではフラグマップを格子状の領域としたが、円に近い方が精度上は理想的であり、各領域を六角形にして蜂の巣状のマップにしてもよい。また、本実施形態では、各領域で最初に処理した目の座標を用いていたが、各領域内の全目候補の平均座標を用いても、また、領域の中心座標を用いてもよい。
[プログラム]
図7は、本発明の第二実施形態における画像処理装置の構成を示すブロック図である。第一実施形態と共通する部分には同じ番号を付与している。ブロック構成としては本発明のプログラムを記録したDVD又はCDのような光ディスク212を追加し、ドライブインターフェース204にCD/DVDドライブなどの外部記憶読書装置213が接続されている。本発明のプログラムを記録した光ディスク212を、外部記憶読書装置213に挿入するとCPU201は記録媒体からプログラムを読み取る。そして、RAM203に展開することで、第一実施形態と同様の処理を実現することができる。
[プログラム記憶媒体]
プログラムコードを供給するための記憶媒体としては、例えばフレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD、DVD,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
[システム構成]
また、プログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部又は全部を行ない、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明の画像処理装置の構成を示すブロック図である。 第一実施形態のハードウェア構成を示す図である。 本発明の第一実施形態における両目ペアリング部の処理の流れを示すフローチャートである。 本発明の第一実施形態の片目領域検出部から出力され両目ペアリング部に入力される片目領域中心座標リストの例を示す図である。 本発明の第一実施形態における多解像度フラグマップを示す図である。 本発明の第一実施形態に対数極座標系フラグマップを示す図である。 本発明の第二実施形態のハードウェア構成を示す図である。
201 CPU
202 ROM
203 RAM
204 ドライブI/F
205 HDD
206 画像入力装置
208 入力装置
209 表示装置
210 ネットワークI/F
211 バス

Claims (5)

  1. 画像から顔パターンの検出を行う画像処理装置であって、
    識別対象の画像の入力を受け付ける画像入力手段と、
    前記画像入力手段により入力された画像から片目候補領域を検出する片目領域検出手段と、
    前記片目領域検出手段により出力された片目領域から両方の目を組み合わせる両目ペアリング手段と、
    ペアリングされた両目位置に基づいて顔パターンを切り出すパターン切出し手段と、
    前記切り出されたパターンが顔であるか否かを判定するパターン判定手段と、
    前記パターン判定部で顔と判定されたパターンを出力する出力部とを備え、
    前記両目ペアリング手段は、第1の目と組み合わせる第2の目を決定する際、前記第1の目を中心とする対数極座標系に変換されたフラグマップを参照して、重複した領域からの組合せを抑制することを特徴とする画像処理装置。
  2. 前記フラグマップの各領域は、格子状であることを特徴とする請求項1記載の画像処理装置。
  3. 前記フラグマップの各領域は、蜂の巣状であることを特徴とする請求項1記載の画像処理装置。
  4. 画像から顔パターンの検出を行う画像処理方法であって、
    識別対象の画像の入力を受け付ける画像入力工程と、
    前記画像入力工程により入力された画像から片目候補領域を検出する片目領域検出工程と、
    前記片目領域検出工程により出力された片目領域から両方の目を組み合わせる両目ペアリング工程と、
    ペアリングされた両目位置に基づいて顔パターンを切り出すパターン切出し工程と、
    前記切り出されたパターンが顔であるか否かを判定するパターン判定工程と、
    前記パターン判定工程で顔と判定されたパターンを出力する出力工程とを備え、
    前記両目ペアリング工程において、第1の目と組み合わせる第2の目を決定する際、前記第1の目を中心とする対数極座標系に変換されたフラグマップを参照して、重複した領域からの組合せを抑制することを特徴とする画像処理方法。
  5. 請求項4記載の画像処理方法の各工程をコンピュータにて実施させるプログラム。
JP2009006566A 2009-01-15 2009-01-15 画像処理装置、方法及びプログラム Pending JP2010165156A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009006566A JP2010165156A (ja) 2009-01-15 2009-01-15 画像処理装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009006566A JP2010165156A (ja) 2009-01-15 2009-01-15 画像処理装置、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2010165156A true JP2010165156A (ja) 2010-07-29

Family

ID=42581268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009006566A Pending JP2010165156A (ja) 2009-01-15 2009-01-15 画像処理装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2010165156A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3236366A1 (en) 2016-04-19 2017-10-25 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
US9965688B2 (en) 2016-01-14 2018-05-08 Canon Kabushiki Kaisha Display apparatus, display method, and storage medium
EP3418944A2 (en) 2017-05-23 2018-12-26 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and program
CN111626240A (zh) * 2020-05-29 2020-09-04 歌尔科技有限公司 一种人脸图像识别方法、装置、设备及可读存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9965688B2 (en) 2016-01-14 2018-05-08 Canon Kabushiki Kaisha Display apparatus, display method, and storage medium
EP3236366A1 (en) 2016-04-19 2017-10-25 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
US10664523B2 (en) 2016-04-19 2020-05-26 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
EP3418944A2 (en) 2017-05-23 2018-12-26 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and program
US10755080B2 (en) 2017-05-23 2020-08-25 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
CN111626240A (zh) * 2020-05-29 2020-09-04 歌尔科技有限公司 一种人脸图像识别方法、装置、设备及可读存储介质
CN111626240B (zh) * 2020-05-29 2023-04-07 歌尔科技有限公司 一种人脸图像识别方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
US10354159B2 (en) Methods and software for detecting objects in an image using a contextual multiscale fast region-based convolutional neural network
US20120070041A1 (en) System And Method For Face Verification Using Video Sequence
US10506174B2 (en) Information processing apparatus and method for identifying objects and instructing a capturing apparatus, and storage medium for performing the processes
EP3168810A1 (en) Image generating method and apparatus
JP5361524B2 (ja) パターン認識システム及びパターン認識方法
CN110532965B (zh) 年龄识别方法、存储介质及电子设备
CN105303156B (zh) 字符检测装置、方法及程序
US20210124928A1 (en) Object tracking methods and apparatuses, electronic devices and storage media
JP2009048489A (ja) 映像処理装置、プログラムおよび方法
WO2023045183A1 (zh) 图像处理
JP2007025900A (ja) 画像処理装置、画像処理方法
CN110619656A (zh) 基于双目摄像头的人脸检测跟踪方法、装置及电子设备
CN111145215A (zh) 一种目标跟踪方法及装置
CN114549557A (zh) 一种人像分割网络训练方法、装置、设备及介质
JP2010165052A (ja) 画像処理装置及び画像処理方法
JP2010165156A (ja) 画像処理装置、方法及びプログラム
CN108229281B (zh) 神经网络的生成方法和人脸检测方法、装置及电子设备
JP5159390B2 (ja) 物体検知方法及びその装置
US11941498B2 (en) Facial motion detection and image correction method and apparatus
WO2005041128A1 (ja) 顔画像候補領域検索方法及び顔画像候補領域検索システム並びに顔画像候補領域検索プログラム
JP2012068948A (ja) 顔属性推定装置およびその方法
US11132778B2 (en) Image analysis apparatus, image analysis method, and recording medium
CN115529837A (zh) 戴口罩人脸识别方法、装置、计算机存储介质
JP2006293720A (ja) 顔検出装置、顔検出方法、及び顔検出プログラム
Devrari et al. Fast face detection using graphics processor