JP2003173436A - 画像処理装置、画像処理方法及びそのプログラムをコンピュータ読み取り可能に記録した記録媒体 - Google Patents

画像処理装置、画像処理方法及びそのプログラムをコンピュータ読み取り可能に記録した記録媒体

Info

Publication number
JP2003173436A
JP2003173436A JP2002269706A JP2002269706A JP2003173436A JP 2003173436 A JP2003173436 A JP 2003173436A JP 2002269706 A JP2002269706 A JP 2002269706A JP 2002269706 A JP2002269706 A JP 2002269706A JP 2003173436 A JP2003173436 A JP 2003173436A
Authority
JP
Japan
Prior art keywords
result
filter
voting
image
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002269706A
Other languages
English (en)
Inventor
Katsuhiro Iwasa
克博 岩佐
Hideaki Matsuo
英明 松尾
Yuji Takada
雄二 高田
Kazuyuki Imagawa
和幸 今川
Eiji Fukumiya
英二 福宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002269706A priority Critical patent/JP2003173436A/ja
Publication of JP2003173436A publication Critical patent/JP2003173436A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 高速、高精度に画像から対象物の位置、大き
さを抽出できる技術を提供する。 【解決手段】 画像を入力してエッジ画像を生成するエ
ッジ抽出部2と、テンプレートを用いてエッジ画像上で
投票を行い投票結果を生成する投票部10と、投票結果
における極大点を抽出し抽出結果を生成する極大点抽出
部13と、抽出結果に基づいて対象物の位置を特定する
対象物特定部15とを備える。エッジ抽出部は、画像に
おけるノイズの除去とエッジの抽出とを一括して行うフ
ィルタを使用するフィルタ処理部7を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像処理装置に係
り、特に、入力した画像から、対象物の位置などを、高
速かつ高精度に、自動検出する技術に関するものであ
る。
【0002】
【従来の技術】顔は、人物の思考や感情を表す重要な意
味を持ち、瞳の中にある虹彩は、その人物が誰であるか
を特定するための指標となる。
【0003】従って、顔や瞳などの対象物を含む画像
(静止画、動画像、コンピュータグラフィックス等)を
取り扱う画像処理の分野において、対象物が、画像のど
の位置に、どれくらいの大きさで存在しているかという
問題を、自動的に処理できるシステムがあれば、便利で
ある。このため、システム上で、画像から対象物を抽出
しようとする試みが、始まっている。
【0004】顔抽出には、ハフ変換を用いた手法があ
る。この手法に関するものとして、非特許文献1があ
る。
【0005】この非特許文献1には、顔を単一の円で近
似し、大きさが異なる複数の円を同心状に備えるテンプ
レートを用いて、顔を抽出する技術が開示されている。
また、円の半径毎に、異なる投票面が用意される。
【0006】そして、画像上において、このテンプレー
トでラスタスキャンし、テンプレートの中心がエッジ点
(輪郭上の点)と重なる時、各投票面において、円を構
成する点に、投票(一定値の足し込み)を行う。
【0007】そして、ラスタスキャンが完了したら、最
大の投票値となった点の位置を、顔位置とし、この点が
属する投票面の、円の大きさを、顔のサイズとする。
【0008】これにより、画像上に様々な大きさの顔が
複数存在していても、1回のラスタスキャンのみで、全
ての顔の位置及びサイズを検出できるようにしている。
【0009】また、目領域の検出について、特許文献1
があり、これには、目領域の中心位置を求める技術が開
示されている。そして、このものでは、画像からエッジ
を検出し、そのエッジ線分の曲率半径で円弧を形成し、
この円弧が最も多く交差した点を、虹彩の中心としてい
る。
【特許文献1】特開平4−225478号公報(第3−
4頁、図1)
【非特許文献1】「”HeadFinder:フレーム
間差分をベースにした人物追跡”画像センシングシンポ
ジウム2000,pp329−334」
【0010】
【発明が解決しようとする課題】さて一般に、このよう
な対象物の検出においては、処理量と抽出精度とが、ト
レードオフの関係にある。即ち、環境条件にロバストな
抽出処理とすると、必然的に処理量が膨れ上がり、逆
に、処理量を軽くすると、特定の環境以外では精度を維
持するのが困難になる。
【0011】さらに、虹彩認証の分野においても、目近
傍の画像から瞳や瞳孔を高速に自動抽出できれば、認証
処理として処理量削減に大きく繋がるため、高速な抽出
法が求められている。
【0012】非特許文献1記載の技術では、複数の異な
るサイズの円をまとめてハフ投票することにより、ハフ
変換の処理量を削減している。しかしながら、この抽出
法は、フレーム間差分を基本としている。
【0013】したがって、人物が静止した状態では、動
き差分による人物輪郭エッジが検出できない。また、背
景が動いている環境では、周囲に動き差分によるエッジ
が多数発生し、人物の輪郭エッジが埋もれてしまう。即
ち、どちらの条件でも、エッジ検出が困難であり、結
局、顔領域抽出が困難になるという問題点がある。
【0014】特許文献1においても、目領域の画像の撮
影条件が悪いと、エッジ画像も劣化し、円弧を検出する
にも、たくさんの処理量を必要とするという問題点があ
る。
【0015】そこで本発明は、高速、高精度に画像から
対象物の位置、大きさを抽出できる技術を提供すること
を目的とする。
【0016】
【課題を解決するための手段】請求項1記載の画像処理
装置は、画像を入力してエッジ画像を生成するエッジ抽
出部と、テンプレートを用いてエッジ画像上で投票を行
い投票結果を生成する投票部と、投票結果における極大
点を抽出し抽出結果を生成する極大点抽出部と、抽出結
果に基づいて対象物の位置を特定する対象物特定部とを
備える。
【0017】この構成において、投票部の前段のエッジ
抽出部で検出エッジ点を抑え、後段の極大点抽出部で高
速・高精度に対象物の抽出位置候補を絞り込むため、動
画・静止画とも、実時間で位置・大きさを抽出できる。
【0018】請求項2記載の画像処理装置では、エッジ
抽出部は、画像におけるノイズの除去とエッジの抽出と
を一括して行うフィルタを使用するフィルタ処理部を備
える。
【0019】この構成により、フィルタを1回ラスタス
キャンするだけで、ノイズの除去とエッジの抽出とを完
了でき、高速かつ正確なエッジ抽出を行える。
【0020】請求項3記載の画像処理装置では、エッジ
抽出部は、フィルタ処理部によるフィルタ処理結果を細
線化する細線化部を備える。
【0021】この構成により、フィルタ処理結果が、太
い線でエッジを描画しているような場合でも、先鋭にエ
ッジを表現できる。
【0022】請求項4記載の画像処理装置では、フィル
タは、ガウスフィルタと単位ベクトルとを掛け合わせた
フィルタである。
【0023】この構成により、ガウスフィルタによるぼ
かし作用と、単位ベクトルによるエッジ抽出作用とを、
一括して発揮することができる。即ち、画像の特性の如
何によらず、杓子定規的に、しかも、的確にノイズを除
去しながら、必要なエッジのみを抽出できる。
【0024】請求項5記載の画像処理装置では、フィル
タ処理部は、xy方向についてのフィルタを使用しフィ
ルタ処理結果の他に、xy平面内のエッジベクトルを出
力する。
【0025】この構成により、xy2方向についてのフ
ィルタを使用することにより、xy2次元のエッジベク
トルで、エッジを表現できる。
【0026】請求項6記載の画像処理装置では、細線化
部は、注目画素と、この注目画素の隣接画素とにおける
フィルタ処理結果の大小関係と、エッジベクトルの向き
とに基づいて、フィルタ処理結果を細線化する。
【0027】この構成により、簡単な大小比較と、エッ
ジベクトルの向きとにより、フィルタ処理結果が、太い
線でエッジを描画しているような場合でも、正確に細線
化できる。
【0028】請求項7記載の画像処理装置では、極大点
抽出部は、中心画素の投票結果と、この中心画素の周囲
の画素の投票結果との差分に基づいて、抽出結果を生成
する。
【0029】この構成により、投票面中で投票値が絶対
評価的に高く、かつ周囲の投票値とも相対評価的に高い
点が、探索される。即ち、投票値が高いだけではなく、
急峻に高くなっている部分のみを検出でき、この傾向に
ある、顔領域や目領域の検出に好適である。
【0030】請求項8記載の画像処理装置では、極大点
抽出部は、中心画素の投票結果と、この中心画素の周囲
の画素の投票結果との差を求める、リングフィルタを用
いて抽出結果を生成する。
【0031】この構成により、リングフィルタをラスタ
スキャンするだけで、投票値が高いだけではなく、急峻
に高くなっている部分のみを検出できる。
【0032】請求項9記載の画像処理装置では、テンプ
レート、投票結果及び抽出結果は、複数のサイズ毎に区
別して設定され、対象物特定部は、対象物の位置及びサ
イズを特定する。
【0033】この構成により、対象物の位置だけでな
く、そのサイズも、同時に検出できる。
【0034】
【発明の実施の形態】まず、本形態そのものの説明に先
立ち、図16を用いて、本発明者らが文献1記載の技術
を改善するために、検討した技術を説明する。この技術
では、文献1におけるフレーム差分の代わりに、通常の
静止画エッジ検出手法に従い、ソーベルフィルタを適用
し、エッジを抽出した。
【0035】図16(a)は、ソーベルフィルタによる
エッジ抽出結果の例を示している。図16(a)から明
らかなように、本来抽出されるべき、顔の輪郭101及
び肩の輪郭102の他に、多数の余分なエッジ点103
が検出されてしまっている。これらのエッジ点103
は、ノイズに他ならない。
【0036】したがって、このまま、ハフ投票を行う
と、図16(b)に示すような結果となる。即ち、テン
プレートt4、t5のように、顔輪郭以外のノイズ(エ
ッジ点103)を中心とする円上にも投票が行われ、余
分な演算処理量を必要としているだけでなく、投票結果
の精度が低下する結果となる。
【0037】ここで、ノイズであるか否かを問わず、エ
ッジ点数が増加すると、テンプレートの足し込み回数が
比例して増加し、さらに、処理量は級数的に増加してし
まう。このため、パーソナルコンピュータレベルの処理
能力では、膨大な処理時間を要し、実時間処理が困難と
なる。
【0038】さらに、投票面からの特徴点検出は、非常
に処理量がかかり、実時間処理が困難であるため、分散
や閾値による取捨選択により高速化を図ることが考えら
れる。
【0039】しかしながら、高速化のため、間引きや単
位ブロック毎の平均化を行うと、顔位置がノイズに埋も
れる場合や、ノイズばかりが抽出される場合も生じ、抽
出精度に問題が生じてくる。
【0040】また、図16(a)のように、一旦、エッ
ジ画像を生成した後、予め設定した閾値と比較して、小
さなノイズであるエッジ点を除去し、しかる後、ハフ投
票を行うことも考えられる。
【0041】しかしながら、この閾値を適切に設定する
ことは、きわめて困難である。画像が入力される前に、
画像における、対象物の大きさ等を予め知ることはでき
ないから、結局、この閾値は、経験的に適当と思われる
値にせざるを得ない。そして、この閾値により、ノイズ
を除去する作用の強弱が定まる。
【0042】ここで、ノイズ除去の作用が弱すぎると、
ノイズが多く残存して、結局、図16(b)に示した状
態と大差ないことになってしまう。逆に、ノイズ除去の
作用が強すぎると、本来残るべき、顔の輪郭101の全
部又は一部が、欠けたり、消えたりすることになり、投
票結果の精度が低下してしまう。
【0043】このように、画像個々の特性に依存するよ
うな、ノイズ除去を行おうとしても、所期の目的を達成
することは困難である。
【0044】このような点を考慮して、本発明者らは、
画像の特性の如何によらず、いわば杓子定規的に適用で
き、しかも、その結果、ノイズを的確に除去できるフィ
ルタ等を案出し、以下詳細に説明するように、本発明を
完成するに至ったものである。
【0045】次に、図面を参照しながら、本発明の実施
の形態を説明する。図1は、本発明の一実施の形態にお
ける画像処理装置の機能ブロック図、図2は、同画像処
理装置のブロック図、図3は、同画像処理装置のフロー
チャートである。
【0046】各部の詳細を説明する前に、図3を用い
て、本形態の画像処理装置の処理の流れを概説する。ま
ず、画像を入力し(ステップ1)、これにフィルタ処理
を施し(ステップ2)、粗く太いエッジを得る。次に、
太いエッジを細線化し(ステップ3)、テンプレートを
用いて、投票を行う(ステップ4)。
【0047】さらに、投票結果から、極大となっている
点を抽出し(ステップ5)、対象物の位置とサイズを特
定し(ステップ6)、結果を出力する(ステップ7)。
【0048】次に、本形態の画像処理装置の構成を説明
する。図2は、図1の要素を具体的に構成した例を示
す。即ち、図2において、CPU(中央処理装置)20
は、ROM(リードオンリーメモリ)21に格納され、
図3、図8等のフローチャートに沿う画像処理プログラ
ムを実行し、バス19を経由し、図2に示す各要素を制
御する。
【0049】RAM(ランダムアクセスメモリ)22及
びハードディスク23には、図1に示す各記憶部1、
3、4、5、6、9、11、12、14のための領域の
他、CPU20がその処理のために必要とする一時記憶
領域が確保されている。
【0050】なお、図1に示す各処理部7、8、10、
13、15は、CPU20が、ROM21に格納された
画像処理プログラムを実行することにより実現される。
また、このプログラムは、ハードディスク23あるいは
CD−ROMなどの周知の記録媒体に格納することがで
きる。
【0051】また、図2の例では、インターフェイス2
4にカメラ25が接続され、リアルタイムで対象物を含
むであろう画像を取得できるようになっている。なお、
カメラ25は、CCD、CMOSのどちらのモジュール
を用いたものであっても良く、カメラ25は、スチルカ
メラ/ビデオカメラのいずれでも良く、携帯電話に付属
するカメラを用いることもできる。
【0052】図1において、入力画像記憶部1には、入
力画像が格納される。本形態では、簡単のため、入力画
像は、明るさの表現として代表的な輝度Y0(x,y)
(8ビット)を持ち、この輝度Y0(x,y)により処
理を行うものとする。
【0053】ここで、輝度Y0(x,y)を、別の階調
を持つようにしても良いし、輝度ではなく別の明るさの
別の表現を用いてもよい。また、入力画像は、グレース
ケールの画像であっても良いし、カラー画像から輝度Y
0(x,y)を分離しても良い。
【0054】入力画像記憶部1に格納される画像のデー
タ形式は、動画/静止画のいずれでも良いが、動画の場
合はフレーム単位で処理を行う。なお、フィールド構造
を持つ動画については、奇数フィールドと偶数フィール
ドとを合わせた一枚の絵にしてから処理を行うと良い。
【0055】また、入力画像記憶部1に格納される画像
としては、図2のカメラ25によりリアルタイムで撮像
したものを用いても良いし、過去に撮像され、かつ、R
AM22又はハードディスク23等の記憶装置に格納さ
れているものでも良い。
【0056】エッジ抽出部2は、入力画像記憶部1から
画像を入力してエッジ画像を生成する。図1に示すよう
に、エッジ抽出部2は、画像におけるノイズの除去とエ
ッジの抽出とを一括して行うフィルタを使用するフィル
タ処理部7と、フィルタ処理部7によるフィルタ処理結
果を細線化する細線化部8とを、有する。
【0057】フィルタ記憶部3には、フィルタ処理部7
が使用するフィルタが格納されている。
【0058】後述するように、このフィルタは、ガウス
フィルタと単位ベクトルとを掛け合わせたフィルタであ
り、フィルタ処理部7は、xy方向についてのフィルタ
を使用しフィルタ処理結果の他に、xy平面内のエッジ
ベクトルを出力する。
【0059】また、エッジ抽出部2では、フィルタ処理
部7が、フィルタ記憶部3が記憶するフィルタSx
(x,y)、Sy(x,y)により、フィルタ処理を行
い、エッジベクトル(Y1x(x,y),Y1y(x,
y))が、エッジベクトル記憶部4に格納され、フィル
タ処理結果Y1(x,y)が、フィルタ処理結果記憶部
5に格納される。
【0060】次に、細線化部8が、エッジベクトル(Y
1x(x,y),Y1y(x,y))と、フィルタ処理
結果Y1(x,y)とを用いて、フィルタ処理結果Y1
(x,y)に描かれる線の局所極大点を抽出し、細線化
をはかり、エッジ部を求める。ここで、このフィルタ処
理とは、画像とフィルタとの畳み込み演算処理である。
【0061】次に、図4、図5を用いて、数式を示しな
がら、フィルタについて詳細に説明する。まず、図4
(a)は、入力画像記憶部1に格納される画像の一例を
示す。
【0062】また、図4(b)に示すように、フィルタ
の系を定義する。このフィルタSは、縦横N画素であ
り、その中心を原点(0,0)とする。
【0063】このとき、極座標で示したガウスフィルタ
は、σ2を分散として、次式で定義される。
【数1】 これを、x−y座標系で表現すると、次のようになる。
【数2】 また、大きさが「1」である単位ベクトルは、次のとお
りである。
【数3】 そして、このフィルタは、ガウスフィルタと単位ベクト
ルとを、掛け合わせたものであり、x方向について、
【数4】 y方向について、
【数5】 という、2つの成分を持つ。但し、(数4)、(数5)
において、−N/2≦x≦N/2,−N/2≦y≦N/
2である。
【0064】このx方向のフィルタ成分を図示すると、
図5(a)のようになり、y方向のフィルタ成分を図示
すると、図5(b)のようになる。図5に示したフィル
タSは、19×19のサイズであるが、フィルタサイズ
はもっと大きなものでも良いし、もっと小さなものでも
良く、大きくなるほど粗いエッジが検出できる。
【0065】そして、フィルタ処理をするには、図4
(c)に示すように、画像上で、フィルタSをラスタス
キャンする。
【0066】このスキャンの結果、エッジベクトルのx
成分
【数6】 と、エッジベクトルのy成分
【数7】 とが得られる。フィルタ処理部7は、これらの成分をエ
ッジベクトル記憶部4に格納する。
【0067】また、フィルタ処理結果は、エッジベクト
ルの大きさに他ならず、次式で定義される。
【数8】 フィルタ処理部7は、この式で計算したフィルタ処理結
果を、フィルタ処理結果記憶部5に格納する。
【0068】ここで、ガウスフィルタが高周波ノイズ成
分を除去し、ガウスフィルタのσのサイズにより、より
粗いエッジが検出される。なお、フィルタとしては、画
像の特性の如何によらず、杓子定規的に適用でき、ノイ
ズを的確に除去できるものであれば、種々変更して差し
支えない。
【0069】以下、このフィルタを、画像の特性によら
ず、杓子定規的に適用できる理由について、簡単に説明
する。
【0070】さて、一般に、画像には、いろいろなスケ
ールのエッジが存在する。ここで、この「スケール」と
いう用語は、専門用語として定着しているものである
が、日常使用されるスケール(スケールが大きいとか小
さいとかいうもの)と同じ意味である。
【0071】例えば、ある風景の画像を入力した場合、
背景の山には、大きなエッジがあり、手前の家の窓の格
子には、小さなエッジがあることになる。また、背景の
山も全体的に見れば、なだらかであるが、よく見ると、
細部に細かな凹凸があるものである。
【0072】このような場合、背景の山のなだらかなエ
ッジは、大きなスケールで見ることになり、格子のエッ
ジは、小さなスケールで見ることになる。
【0073】ところで、画像中において、顔や目などの
検出物の輪郭のなだらかさは、だいたい決まっているこ
とが多く、一定のスケールで表現できる。したがって、
その輪郭を構成するエッジを最も良く抽出し、それ以外
の細々としたエッジを抽出しないスケールを予め定義し
ておけば、輪郭のみを良く抽出することができる。
【0074】数学的にいえば、スケールが大きい大まか
なエッジは、空間周波数の低い関数項で表現できるし、
スケールが小さい細かなエッジは、空間周波数の高い関
数項で記述できる。
【0075】したがって、適当なスケールのエッジを取
り出すには、画像に、適当なフィルタをかけて、画像を
相応にぼかし、その上で、エッジ抽出を行えばよい。
【0076】このようなフィルタは、帯域フィルタとし
て表現できるが、同じ帯域幅でエッジの位置の精度が最
も良いのは、ガウス関数である。
【0077】そのため、本形態のフィルタは、輪郭を最
も良く抽出するスケールで定義された帯域幅を持つガウ
ス関数に、x方向とy方向の単位ベクトルを掛け合わせ
た構造としたものである。具体的には、スケールと帯域
幅は、フィルタのサイズに関係する。
【0078】つまり、従来技術において、行っていた (工程1)平滑化(フィルタサイズは、経験値) (工程2)エッジ検出(フィルタサイズは、経験値) (工程3)閾値による小エッジの除去(閾値は場合毎に
調整) という、3つの工程を、本形態では、フィルタのサイズ
を、最も輪郭を抽出しやすいサイズに設定することによ
り、状況毎に閾値を調整するなどの面倒な処理を行うこ
となく、しかも、一回の処理のみで、画像によらず杓子
定規的に抽出しているのである。
【0079】さて、図6(a)は、図4(c)に示すス
キャンの結果得られた、フィルタ処理結果の例である。
図6(a)を、図4(c)と比較すると明らかなよう
に、凹凸や細かなノイズが除去されている。しかも、本
来の輪郭線よりも太いエッジが検出されている。
【0080】このように、フィルタ処理結果では、細か
なエッジやノイズが省かれ、輪郭の粗いエッジが検出さ
れるが、フィルタSのサイズが大きいため、検出エッジ
も非常に太い。そこで、次段の細線化部8で細線化処理
を行う。
【0081】即ち、細線化部8は、図8のフローチャー
トに従う処理を実行することにより、図6(a)のよう
なフィルタ処理結果を細線化し、図6(b)のようなエ
ッジ画像を生成する。
【0082】この細線化プロセスを、図7から図9を参
照しながら、説明する。簡単に述べると、細線化部8
は、注目画素と、この注目画素の隣接画素とにおけるフ
ィルタ処理結果の大小関係と、エッジベクトルの向きと
に基づいて、フィルタ処理結果を細線化する。
【0083】まず、細線化を始める前に、フィルタ処理
結果記憶部5には、図7(a)に示すようにフィルタ処
理結果Y1(x,y)が格納されており、エッジベクト
ル記憶部4には、エッジベクトル(Y1x(x,y),
Y1y(x,y))が格納されている。
【0084】このとき、図7(a)に示すように、注目
画素が(x,y)なる座標にあるとき、その座標のフィ
ルタ処理結果をcとし、その座標のエッジベクトルのx
成分Y1x(x,y)をhとし、同y成分Y1y(x,
y)をvとする。
【0085】また、注目画素の左、右、上及び下に、隣
接する画素のフィルタ処理結果をそれぞれ、l、r、
t、bとする。なおこのとき、図7(d)に示す幾何学
的関係がある。
【0086】そして、図9(a)又は図9(b)のいず
れかの条件を満たす場合、注目画素(x,y)のエッジ
画像Y2(x,y)にcをセット(エッジである)し、
そうでないとき、このエッジ画像Y2(x,y)に0を
セット(エッジでない)する。
【0087】これにより、図6(a)のような太いエッ
ジを、図6(b)のような先鋭なエッジとすることがで
きる。
【0088】ここで、図9(a)の条件とは、エッジベ
クトルの向きが、x軸となす角θが−45°≦θ≦45
°または135°≦θ≦225°の範囲にあり、かつ、
l≦c≧rなる関係が成り立つことである。
【0089】また、図9(b)の条件とは、エッジベク
トルの向きが、x軸となす角θが45°≦θ≦135°
または225°≦θ≦315°の範囲にあり、かつ、t
≦c≧bなる関係が成り立つことである。
【0090】なお、以上の数値などは、一例に過ぎず、
種々変更することができる。これにより、フィルタ処理
結果に存在する太いエッジの起伏の尾根のみを抽出して
細線化できる。これにより、投票部10の投票に先立っ
て、ノイズを抑え、エッジ点数を減らすことができる。
【0091】したがって、細線化部8は、図8の処理を
行う。即ち、ステップ21にて、x方向の座標カウンタ
iと、y方向の座標カウンタjを1に初期化し、図7を
用いて説明した値の代入を行う(ステップ22)。
【0092】次に、細線化部8は、ステップ23〜ステ
ップ26において、カウンタ(i,j)が示す座標に関
して、図9(a)又は図9(b)のいずれかの条件が満
たされているかどうかチェックする。満たされていれ
ば、ステップ27にて、カウンタ(i,j)が示す座標
に関するエッジ画像に、cをセットし、そうでなけれ
ば、ステップ28にて、0をセットする。
【0093】そして、ステップ29〜ステップ32に
て、カウンタi、jを進めながら、ステップ22以下の
処理を繰り返す。
【0094】この繰り返し処理が完了したら、細線化さ
れたエッジ画像が、エッジ画像記憶部6に格納されてい
ることになる。
【0095】次に、図1、図10、図11を用いて、投
票部10等について説明する。投票部10は、テンプレ
ート記憶部9に格納されたテンプレートT1,T
2,...Tnを用いて、エッジ画像記憶部6に格納さ
れた、エッジ画像上で投票を行い投票結果を生成する。
【0096】ここで、図10に示すように、テンプレー
ト記憶部9に格納されるテンプレートT1,T
2,...Tn、投票結果記憶部11に格納される投票
結果V1,V2,...Vnは、複数のサイズ毎に区別
して設定されている。
【0097】同様に、図1において、抽出結果記憶部1
4が記憶する抽出結果R1,R2,...Rnは、複数
のサイズ毎に区別して設定され、対象物特定部15は、
対象物の位置及びサイズを特定する。これにより、対象
物の位置だけでなく、そのサイズも、同時に検出でき
る。
【0098】図11(a)〜(d)は、顔又は目の領域
を検出するために、好適なテンプレートの例を示してい
る。即ち、図11(a)に示す円、図11(b)に示す
多角形、図11(c)に示す楕円のように、閉じた線を
用いても良いし、図11(d)のように、頭と肩の部分
を模した開いた線を用いても良い。
【0099】テンプレートは、以上のように、円、幅1
以上の円環、それ以外の楕円、正六角形などの多角形で
も差し支えない。円はテンプレート中心から形状全ての
画素までの距離が常に一定になるので、投票結果の精度
が高くなる。多角形は円ほどの精度は出ないが、形状が
単純になり、処理負担が軽減され、処理速度を向上でき
る。
【0100】そして、投票部10は、エッジ画像記憶部
6のエッジ画像において、図11(e)に例示している
ように、テンプレートの中心がエッジ上に存在する際、
投票結果記憶部11の該当するサイズの投票面上におい
て、投票(一定値の足し込み)を行う。
【0101】投票数を増やす処理においては、単調に減
少させるようにしても差し支えない。本例では、初期値
が零で投票する毎に、該当形状の成分を1つずつ増やす
ようにした。また、本例では、ハフ投票を用いたが、類
似の投票技術を使用することもできる。
【0102】図16(a)と同じ画像に対して、本形態
の細線化を行うと、図12(a)に示すようになる。ま
た、これに対して、投票を行うと、図12(b)のよう
になる。
【0103】ソーベルフィルタを用いた図16(a)に
対し、図12(a)では、ノイズが少ないため、図12
(b)に示すように、図16(b)におけるテンプレー
トt4,t5のような、余分な投票が行われず、余分な
演算処理がない。余分な投票が行われて真の顔位置の投
票値が埋もれ、判別しづらくなるようなこともない。演
算処理量と速度の面、判別の容易さという精度の面、こ
の2つの面において、本形態に関する図12(a)の結
果は、図16(a)の結果よりも、演算処理量の削減と
検出精度の向上を実現しているため優れている。
【0104】次に、図1、図13〜図15を用いて、極
大点抽出部13等について説明する。この極大点抽出部
13は、投票結果記憶部11に格納された投票結果にお
ける極大点を抽出し抽出結果を生成する。
【0105】また、極大点抽出部13は、中心画素の投
票結果と、この中心画素の周囲の画素の投票結果との差
を求める、リングフィルタを用いて、抽出結果を生成
し、投票結果から、局所極大であり、かつ孤立的な投票
点を検出する。
【0106】図13(a)〜(c)に例示するリングフ
ィルタが、図1に示すリングフィルタ記憶部12に格納
されている。
【0107】極大点抽出部13は、このリングフィルタ
を、図14(a)に示すように、投票結果記憶部11の
各投票面V1,V2,...Vn上で、走査し、リング
フィルタの評価値Valを、該当する抽出結果記憶部1
4の抽出面R1,R2,...Rnに格納する。
【0108】次に、図13を用いて、リングフィルタの
例を説明する。図13(a)のリングフィルタは、サイ
ズが3×3であり、その評価値Valは、投票面とフィ
ルタが重なる時、中心画素の投票値Aから、4つの周辺
画素B1、B2、B3、B4のうち最大の投票値を、引
いたものである。また、図13(b)に示すように、リ
ングフィルタの評価値Valは、投票面とフィルタが重
なる時、中心画素の投票値Aから、8つの周辺画素B1
〜B8のうち最大の投票値とを、引いたものとしてもよ
い。
【0109】さらに、図13(c)に示すように、3×
3以上のサイズとすることもできる。
【0110】このようなリングフィルタを用いることに
より、図15(a)のような投票値の分布が得られた場
合、図15(a)の左側の急峻な山のように、中心画素
Aの投票値が局所極大であり、かつ孤立的な投票値であ
るものは、評価値Rが高い値となる。
【0111】逆に、図15(a)の右側の山のように、
投票値が高くても、周囲も同様に高い値を示す孤立的で
はない点では、評価値Rが低くなる。
【0112】さらに、図15(b)の尾根のように、投
票値のたかみが横に伸びているような場合、評価値Rは
低くなる。
【0113】本形態のような、極大点抽出部13を用い
ると、投票面の起伏を見ない投票値による単純固定閾値
では検出できない急峻な変化も、捉えることができ、顔
領域候補や目領域候補の絞り込みに適している。
【0114】また、図1において、対象物特定部15
は、抽出結果記憶部14に格納された抽出結果(各抽出
面)に基づいて、対象物の位置及びサイズを特定する。
【0115】具体的には、対象物特定部15は、各抽出
面の評価値Rのうち、最大の評価値を持つ抽出面上の座
標を、対象物の位置とし、その面に関するテンプレート
のサイズを、対象物のサイズ(例えば、半径で表現す
る)とする。
【0116】ここで、本明細書にいう「プログラムをコ
ンピュータ読み取り可能に記録した記録媒体」には、複
数の記録媒体にプログラムを分散して配布する場合を含
む。また、このプログラムが、オペレーティングシステ
ムの一部であるか否かを問わず、種々のプロセスないし
スレッド(DLL、OCX、ActiveX等(マイク
ロソフト社の商標を含む))に機能の一部を肩代わりさ
せている場合には、肩代わりさせた機能に係る部分が、
記録媒体に格納されていない場合も含む。
【0117】図1には、スタンドアロン形式のシステム
を例示したが、サーバー/クライアント形式にしても良
い。つまり、1つの端末機のみに、本明細書に出現する
全ての要素が含まれている場合の他、1つの端末機がク
ライアントであり、これが接続可能なサーバないしネッ
トワーク上に、全部又は一部の要素が実存していても、
差し支えない。
【0118】さらには、図1のほとんどの要素をサーバ
ー側で持ち、クライアント側では、例えば、WWWブラ
ウザだけにしても良い。この場合、各種の情報は、通常
サーバ上にあり、基本的にネットワークを経由してクラ
イアントに配布されるものだが、必要な情報が、サーバ
上にある時は、そのサーバの記憶装置が、ここにいう
「記録媒体」となり、クライアント上にある時は、その
クライアントの記録装置が、ここにいう「記録媒体」と
なる。
【0119】さらに、この「プログラム」には、コンパ
イルされて機械語になったアプリケーションの他、上述
のプロセスないしスレッドにより解釈される中間コード
として実存する場合や、少なくともリソースとソースコ
ードとが「記録媒体」上に格納され、これらから機械語
のアプリケーションを生成できるコンパイラ及びリンカ
が「記録媒体」にある場合や、少なくともリソースとソ
ースコードとが「記録媒体」上に格納され、これらから
中間コードのアプリケーションを生成できるインタープ
リタが「記録媒体」にある場合なども含む。
【0120】
【発明の効果】本発明では、次の効果がある。投票を行
う前に、ノイズを抑制し、エッジ点を減らすため、現状
のパーソナルコンピュータレベルの処理能力で、高速実
行でき、実時間で実行可能である。
【0121】エッジ検出にフレーム差分ではなく、静止
画エッジ検出を用いることにより、カメラが非固定系で
あったり、人物があまり動かない場合、背景が動いてい
る場合などのフレーム間差分では安定してエッジ検出で
きない場合においても、安定して人物を検出することが
できる。
【0122】エッジ抽出部により、微細なエッジは取り
除かれ、凹凸の激しいエッジはならされて単純なエッジ
になるため、エッジ点数が下がり、投票の前処理が優れ
ている。
【0123】投票値が高いだけではなく、急峻に高くな
っている部分のみを検出でき、顔や目などの検出に適し
ている。
【図面の簡単な説明】
【図1】本発明の一実施の形態における画像処理装置の
ブロック図
【図2】同画像処理装置のブロック図
【図3】同画像処理装置のフローチャート
【図4】(a)同画像の例示図 (b)同フィルタの説明図 (c)同ラスタスキャンの説明図
【図5】(a)フィルタx成分の説明図 (b)フィルタy成分の説明図
【図6】(a)同フィルタ処理結果の例示図 (b)同エッジ画像の例示図
【図7】(a)同細線化プロセスの説明図(フィルタ処
理結果) (b)同細線化プロセスの説明図(エッジベクトルx成
分) (c)同細線化プロセスの説明図(エッジベクトルy成
分)
【図8】同細線化部のフローチャート
【図9】(a)同細線化プロセスの説明図 (b)同細線化プロセスの説明図
【図10】同テンプレートと投票面との関係説明図
【図11】(a)同テンプレートの例示図 (b)同テンプレートの例示図 (c)同テンプレートの例示図 (d)同テンプレートの例示図 (e)同投票の例示図
【図12】(a)同エッジ画像の例示図(本形態) (b)同投票プロセスの説明図(本形態)
【図13】(a)同リングフィルタの例示図 (b)同リングフィルタの例示図 (c)同リングフィルタの例示図
【図14】(a)同リングフィルタのスキャン説明図 (b)同評価面の例示図
【図15】(a)同投票値の分布例示図 (b)同投票値の分布例示図
【図16】(a)エッジ画像の例示図(ソーベルフィル
タ) (b)投票プロセスの説明図(ソーベルフィルタ)
【符号の説明】
1 入力画像記憶部 2 エッジ抽出部 3 フィルタ記憶部 4 エッジベクトル記憶部 5 フィルタ処理結果記憶部 6 エッジ画像記憶部 7 フィルタ処理部 8 細線化部 9 テンプレート記憶部 10 投票部 11 投票結果記憶部 12 リングフィルタ記憶部 13 極大点抽出部 14 抽出結果記憶部 15 対象物特定部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 高田 雄二 神奈川県横浜市港北区綱島東四丁目3番1 号 松下通信工業株式会社内 (72)発明者 今川 和幸 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 福宮 英二 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5B057 CA08 CA12 CA16 CC01 CE02 CE03 CE06 CF01 CH07 CH09 CH11 CH12 DA08 DA12 DB02 DB09 DC09 DC13 DC16 5L096 AA06 EA05 FA06 FA69 GA55

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】画像を入力してエッジ画像を生成するエッ
    ジ抽出部と、 テンプレートを用いてエッジ画像上で投票を行い投票結
    果を生成する投票部と、 投票結果における極大点を抽出し抽出結果を生成する極
    大点抽出部と、 抽出結果に基づいて対象物の位置を特定する対象物特定
    部とを備える画像処理装置。
  2. 【請求項2】前記エッジ抽出部は、画像におけるノイズ
    の除去とエッジの抽出とを一括して行うフィルタを使用
    するフィルタ処理部を備える、請求項1記載の画像処理
    装置。
  3. 【請求項3】前記エッジ抽出部は、前記フィルタ処理部
    によるフィルタ処理結果を細線化する細線化部を備え
    る、請求項2記載の画像処理装置。
  4. 【請求項4】前記フィルタは、ガウスフィルタと単位ベ
    クトルとを掛け合わせたフィルタである、請求項2から
    3記載の画像処理装置。
  5. 【請求項5】前記フィルタ処理部は、xy方向について
    のフィルタを使用しフィルタ処理結果の他に、xy平面
    内のエッジベクトルを出力する、請求項2から4記載の
    画像処理装置。
  6. 【請求項6】前記細線化部は、 注目画素と、この注目画素の隣接画素とにおけるフィル
    タ処理結果の大小関係と、 エッジベクトルの向きとに基づいて、フィルタ処理結果
    を細線化する、請求項3から5記載の画像処理装置。
  7. 【請求項7】前記極大点抽出部は、 中心画素の投票結果と、 この中心画素の周囲の画素の投票結果との差分に基づい
    て、抽出結果を生成する、請求項1から6記載の画像処
    理装置。
  8. 【請求項8】前記極大点抽出部は、 中心画素の投票結果と、 この中心画素の周囲の画素の投票結果との差を求める、
    リングフィルタを用いて抽出結果を生成する、請求項7
    記載の画像処理装置。
  9. 【請求項9】前記テンプレート、前記投票結果及び前記
    抽出結果は、複数のサイズ毎に区別して設定され、 前記対象物特定部は、対象物の位置及びサイズを特定す
    る、請求項1から8記載の画像処理装置。
  10. 【請求項10】前記対象物は、人間の顔又は人間の目領
    域のいずれかである、請求項1から9記載の画像処理装
    置。
  11. 【請求項11】画像を入力してエッジ画像を生成するエ
    ッジ抽出ステップと、 テンプレートを用いてエッジ画像上で投票を行い投票結
    果を生成する投票ステップと、 投票結果における極大点を抽出し抽出結果を生成する極
    大点抽出ステップと、 抽出結果に基づいて対象物の位置を特定する対象物特定
    ステップとを含む画像処理方法。
  12. 【請求項12】前記エッジ抽出ステップは、画像におけ
    るノイズの除去とエッジの抽出とを一括して行うフィル
    タを使用するフィルタ処理ステップを含む、請求項11
    記載の画像処理方法。
  13. 【請求項13】前記エッジ抽出ステップは、前記フィル
    タ処理ステップによるフィルタ処理結果を細線化する細
    線化ステップを含む、請求項12記載の画像処理方法。
  14. 【請求項14】前記フィルタは、ガウスフィルタと単位
    ベクトルとを掛け合わせたフィルタである、請求項12
    から13記載の画像処理方法。
  15. 【請求項15】前記フィルタ処理ステップでは、xy方
    向についてのフィルタを使用しフィルタ処理結果の他
    に、xy平面内のエッジベクトルを出力する、請求項1
    2から14記載の画像処理方法。
  16. 【請求項16】前記細線化ステップでは、 注目画素と、この注目画素の隣接画素とにおけるフィル
    タ処理結果の大小関係と、 エッジベクトルの向きとに基づいて、フィルタ処理結果
    を細線化する、請求項13から15記載の画像処理方
    法。
  17. 【請求項17】前記極大点抽出ステップでは、 中心画素の投票結果と、 この中心画素の周囲の画素の投票結果との差分に基づい
    て、抽出結果を生成する、請求項11から16記載の画
    像処理方法。
  18. 【請求項18】前記極大点抽出ステップでは、 中心画素の投票結果と、 この中心画素の周囲の画素の投票結果との差を求める、
    リングフィルタを用いて抽出結果を生成する、請求項1
    7記載の画像処理方法。
  19. 【請求項19】前記テンプレート、前記投票結果及び前
    記抽出結果は、複数のサイズ毎に区別して設定され、 前記対象物特定ステップでは、対象物の位置及びサイズ
    を特定する、請求項11から18記載の画像処理方法。
  20. 【請求項20】前記対象物は、人間の顔又は人間の目領
    域のいずれかである、請求項11から19記載の画像処
    理方法。
  21. 【請求項21】画像を入力してエッジ画像を生成するエ
    ッジ抽出ステップと、 テンプレートを用いてエッジ画像上で投票を行い投票結
    果を生成する投票ステップと、 投票結果における極大点を抽出し抽出結果を生成する極
    大点抽出ステップと、 抽出結果に基づいて対象物の位置を特定する対象物特定
    ステップとを含む、画像処理プログラムをコンピュータ
    読み取り可能に記録した記録媒体。
JP2002269706A 2001-09-27 2002-09-17 画像処理装置、画像処理方法及びそのプログラムをコンピュータ読み取り可能に記録した記録媒体 Pending JP2003173436A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002269706A JP2003173436A (ja) 2001-09-27 2002-09-17 画像処理装置、画像処理方法及びそのプログラムをコンピュータ読み取り可能に記録した記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001-296830 2001-09-27
JP2001296830 2001-09-27
JP2002269706A JP2003173436A (ja) 2001-09-27 2002-09-17 画像処理装置、画像処理方法及びそのプログラムをコンピュータ読み取り可能に記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2003173436A true JP2003173436A (ja) 2003-06-20

Family

ID=26623090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002269706A Pending JP2003173436A (ja) 2001-09-27 2002-09-17 画像処理装置、画像処理方法及びそのプログラムをコンピュータ読み取り可能に記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2003173436A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097310A (ja) * 2006-10-11 2008-04-24 Sharp Manufacturing System Corp エッジ抽出方法、定義表作成方法、画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムを記録する記録媒体
JP2008226189A (ja) * 2007-03-15 2008-09-25 Aisin Seiki Co Ltd 特徴点検出装置及びプログラム
JP2009288837A (ja) * 2008-05-27 2009-12-10 Marimo & Jvis:Kk 写真修整システムおよび写真撮影システムならびにアルバム作製システム
JP2010134535A (ja) * 2008-12-02 2010-06-17 Mitsubishi Electric Corp 画像検出装置及び画像検出方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097310A (ja) * 2006-10-11 2008-04-24 Sharp Manufacturing System Corp エッジ抽出方法、定義表作成方法、画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムを記録する記録媒体
JP4704310B2 (ja) * 2006-10-11 2011-06-15 シャープ株式会社 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムを記録する記録媒体
JP2008226189A (ja) * 2007-03-15 2008-09-25 Aisin Seiki Co Ltd 特徴点検出装置及びプログラム
JP2009288837A (ja) * 2008-05-27 2009-12-10 Marimo & Jvis:Kk 写真修整システムおよび写真撮影システムならびにアルバム作製システム
JP4678610B2 (ja) * 2008-05-27 2011-04-27 株式会社Marimo&Jvis 写真修整システムおよび写真撮影システムならびにアルバム作製システム
JP2010134535A (ja) * 2008-12-02 2010-06-17 Mitsubishi Electric Corp 画像検出装置及び画像検出方法

Similar Documents

Publication Publication Date Title
US11830230B2 (en) Living body detection method based on facial recognition, and electronic device and storage medium
EP1693782B1 (en) Method for facial features detection
US5715325A (en) Apparatus and method for detecting a face in a video image
Kligler et al. Document enhancement using visibility detection
EP2434431A1 (en) Method and device for classifying image
JPH0877334A (ja) 顔画像の特徴点自動抽出方法
Jun et al. Robust real-time face detection using face certainty map
US10521659B2 (en) Image processing device, image processing method, and image processing program
CN101945257A (zh) 基于监控视频内容提取车辆底盘图像的合成方法
Kanter Color Crack: Identifying Cracks in Glass
JP2005293539A (ja) 表情認識装置
CN111696072A (zh) 彩色图像的直线检测方法、装置、电子设备及存储介质
CN116342519A (zh) 一种基于机器学习的图像处理方法
Weerasekera et al. Robust asl fingerspelling recognition using local binary patterns and geometric features
Holtzman-Gazit et al. Salient edges: A multi scale approach
KR20100121817A (ko) 눈의 영역을 추적하는 방법
Al-Mahadeen et al. Signature region of interest using auto cropping
Kalam et al. Gender classification using geometric facial features
CN109145875B (zh) 一种人脸图像中的黑框眼镜去除方法及装置
JP2003173436A (ja) 画像処理装置、画像処理方法及びそのプログラムをコンピュータ読み取り可能に記録した記録媒体
Hu et al. Locating head and face boundaries for head–shoulder images
US20030059117A1 (en) Systems and methods for image processing, and recording medium therefor
Gautam et al. A GUI for automatic extraction of signature from image document
CN114529715A (zh) 一种基于边缘提取的图像识别方法及系统
Zafar et al. Novel iris segmentation and recognition system for human identification