JP2007287024A - 領域検出装置 - Google Patents
領域検出装置 Download PDFInfo
- Publication number
- JP2007287024A JP2007287024A JP2006115661A JP2006115661A JP2007287024A JP 2007287024 A JP2007287024 A JP 2007287024A JP 2006115661 A JP2006115661 A JP 2006115661A JP 2006115661 A JP2006115661 A JP 2006115661A JP 2007287024 A JP2007287024 A JP 2007287024A
- Authority
- JP
- Japan
- Prior art keywords
- image
- window
- feature amount
- face
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
【課題】ハードウェアのリソースを少なくすると共に処理時間を短縮した領域検出装置を提供する。
【解決手段】画像中の特定領域が当該画像のどの位置にあるかを自動検出する領域検出装置において、前記画像をデジタル化して得られたデジタル画像を所定の縮小率で縮小する画像縮小部(12)と、縮小されたデジタル画像を固定サイズのウインドウを用いて走査する画像走査部(13)と、前記ウインドウ内の画像に対してアダマール変換係数を計算することによって特徴量を求める特徴量計算部(15)と、求められた特徴量に基づいて前記ウインドウ内の画像が前記特定領域の候補かどうかを複数の弱分類器によって判定する判断部(16)と、判定手段(16)によって特定領域の候補であると判定された近傍にある特定領域候補から1つの特定領域を決定する領域結合部(18)とを備える。
【選択図】図1
【解決手段】画像中の特定領域が当該画像のどの位置にあるかを自動検出する領域検出装置において、前記画像をデジタル化して得られたデジタル画像を所定の縮小率で縮小する画像縮小部(12)と、縮小されたデジタル画像を固定サイズのウインドウを用いて走査する画像走査部(13)と、前記ウインドウ内の画像に対してアダマール変換係数を計算することによって特徴量を求める特徴量計算部(15)と、求められた特徴量に基づいて前記ウインドウ内の画像が前記特定領域の候補かどうかを複数の弱分類器によって判定する判断部(16)と、判定手段(16)によって特定領域の候補であると判定された近傍にある特定領域候補から1つの特定領域を決定する領域結合部(18)とを備える。
【選択図】図1
Description
本発明は、画像認識技術に関し、画像中から顔領域等の特定領域を検出する領域検出装置に関する。
パターン認識技術を用いて撮像画像中から顔の位置、大きさを検出して人物を識別し、セキュリティ等に反映させるものが知られている。
画像中から顔領域を自動的に検出するには、撮像画像をデジタル化して記憶し、このデジタル画像を繰り返し縮小し、固定サイズのウインドウ用いて繰り返し走査して、ウインドウ内のいくつかの位置における特徴量を計算する。そして、この特徴量に基づいて顔領域の候補を選択する処理を実行するようにしている。
この場合、特徴量をどのようして求めるかが処理のポイントとなる。従来では、特徴量としては、ウインドウ内の幾つかの位置における、例えば、図10に示すような簡単な矩形フィルタの出力を用いていた。
Paul Viola,"Robust Real-time Object Detection",(Tech.Rep.No.CRL 2001/01,Cambridge Research Laboratory,2001)
Paul Viola,"Robust Real-time Object Detection",(Tech.Rep.No.CRL 2001/01,Cambridge Research Laboratory,2001)
このように、従来の顔検出方法では、計算時間を短くするために、特徴量として、簡単な構成の矩形フィルタの出力値を用いていた。そのために、顔の検出精度を上げようとすると、多数の特徴量を用いる必要があり、ハードウェアのリソースと処理時間が長くなるという課題があった。
本発明は上記事情に鑑み、特徴量の抽出にアダマール変換係数を用いることにより、少ない特徴量で高い検出精度を実現でき、また、構成が簡単で計算量の少ないアダマール変換係数から順番に弱分類器を作成することにより処理時間の増加を抑制して、ハードウェアのリソースを少なくすると共に処理時間を短縮した領域検出装置を提供することを目的としている。
上記の目的を達成するために本発明は、画像中の特定領域が該画像のどの位置にあるかを検出する領域検出装置において、前記画像をデジタル化して得られたデジタル画像を所定の縮小率で繰り返し縮小する画像縮小手段と、前記縮小されたデジタル画像毎に所定のサイズのウインドウを用いて走査する画像走査手段と、前記走査するウインドウ内の各画像に対して、アダマール変換係数を適用して特徴量を計算する特徴量計算手段と、前記計算された特徴量に基づき、前記ウインドウ内の画像が前記特定領域の候補であるか否かを複数の弱分類器によって判定する判定手段と、前記判定手段により前記特定領域の候補であると判定された画像の中から1つの特定領域を選択する特定領域決定手段とを備えたことを特徴としている。
本発明によれば、特徴量の抽出にアダマール変換係数を用いることにより、少ない特徴量で高い検出精度を実現できる。また、構成が簡単で計算量の少ないアダマール変換係数から順番に弱分類器を作成することにより処理時間の増加を抑制して、ハードウェアのリソースを少なくすると共に処理時間を短縮した領域検出装置を提供することが可能となる。
図1は本発明に係る領域検出装置の一実施形態の構成を示すブロック図である。
この領域検出装置は、ビデオカメラ部10からの画像データを取り込み画像データ中にある顔領域の位置を自動検出するものであり、デジタル画像記録部11と、画像縮小部12と、画像走査部3と、積分変換部14と、特徴量計算部15と、判断部16と、顔領域候補記録部17と、領域結合部18とを備えている。
画像縮小部12は、デジタル画像記録部11に記録されている画像を適当な縮小率(例えば、1/1.25)で縮小し、再度、デジタル画像記録部11に記録すると共に画像走査部13に出力する。
画像走査部13は、画像中に所定の大きさのウインドウを設定する。例えば、24×24画素サイズのものが利用される。この場合、画像の原点を左下に取り、また、ウインドウを左下の頂点の座標で表す。
積分変換部14は、ウインドウ内の画像を積分画像に変換するものであり、画像を構成する画素の値が原点とその画素を頂点とする矩形領域内の画素の輝度の総和を求めて積分画像を構成する。
特徴量計算部15は、ウインドウ内の幾つかの位置における特徴量を2次元アダマール変換係数を用いて計算する。
判断部16は、特徴量計算部15で求められた特徴量に基づき、各ウインドウが顔領域であるかどうかを判断する。
顔領域候補記録部17は、判断部16で顔領域であると判断されたウインドウのデータを顔領域候補データとして記録する。
領域結合部18は、1つの顔領域に対して複数の顔領域候補が検出された場合、複数の候補から1つの顔領域に絞る処理を実行して顔領域画像を出力する。
<画像縮小部12および画像走査部13の処理>
画像縮小部12では、デジタル画像記録部11に記録されている画像を4/5(縮小率=1/1.25)に縮小する。例えば、640×480の画素数の画像であれば、512×384の画素数を持つ画像に縮小して、処理対象となる画素数を減らしている。
画像縮小部12では、デジタル画像記録部11に記録されている画像を4/5(縮小率=1/1.25)に縮小する。例えば、640×480の画素数の画像であれば、512×384の画素数を持つ画像に縮小して、処理対象となる画素数を減らしている。
このように縮小された画像に対して画像走査部13では、画像中に所定の大きさ、例えば24×24の画素サイズのウインドウWを設定して順次所定画素ずつずらして切り出す処理を実行する。この場合、原画(入力画像)の原点を左下に取り、また、ウインドウWを左下の頂点の座標で表す。ウインドウWの走査は、先ず、W(0,0)からスタートして、次に、W(dx,0),W(dx×2,0),…、画像の右端に達したとき、W(0,dy),W(dx,dy),…の順に走査する。ここで、dx,dyは適当な正の整数、例えば、dx=dy=2(画素)である。
1枚の縮小画像の処理が全て終了すると、次に、512×384の画素数を持つ画像をさらに4/5縮小して同一の処理を繰り返すことになる。
<積分変換部14の処理>
上述のように走査された画像に対し、積分変換部14では、ウインドウW内の画像を画素の値が、原点とその画素を頂点とする矩形領域内の画素の輝度の総和とする積分画像へ変換する。図2は入力画像と積分画像との関係を示している。図中の入力画像におけるメッシュ部分(座標(x0,y0)で示す)の画素の輝度値の総和が積分画像上ではSx,yで示される。例えば、ウインドウサイズをWx,Wyとすると、変換後のサイズは、Wx+1,Wy+1となり、積分画像の座標(x,y)の値Sx,yは(1)式で表される。ここで、Ii,jはウインドウ内の座標(i,j)の輝度値である。またS0,y,Sx,0の値は零とする。
上述のように走査された画像に対し、積分変換部14では、ウインドウW内の画像を画素の値が、原点とその画素を頂点とする矩形領域内の画素の輝度の総和とする積分画像へ変換する。図2は入力画像と積分画像との関係を示している。図中の入力画像におけるメッシュ部分(座標(x0,y0)で示す)の画素の輝度値の総和が積分画像上ではSx,yで示される。例えば、ウインドウサイズをWx,Wyとすると、変換後のサイズは、Wx+1,Wy+1となり、積分画像の座標(x,y)の値Sx,yは(1)式で表される。ここで、Ii,jはウインドウ内の座標(i,j)の輝度値である。またS0,y,Sx,0の値は零とする。
<特徴量計算部15の処理>
特徴量計算部15では、ウインドウW内の幾つかの位置における特徴量を計算する。特徴量は、“4×4”の2次元アダマール変換係数を用いている。図3にその係数(15個)を示す。この場合、白地部分は+1、黒地部分は−1を示す。例えば、ブロックサイズが“4”のアダマール変換係数A04は、図4(A)に示すような行列となる。また、ブロックサイズが“8”のアダマール変換係数A11は、同図(B)に示すような行列となる。
特徴量計算部15では、ウインドウW内の幾つかの位置における特徴量を計算する。特徴量は、“4×4”の2次元アダマール変換係数を用いている。図3にその係数(15個)を示す。この場合、白地部分は+1、黒地部分は−1を示す。例えば、ブロックサイズが“4”のアダマール変換係数A04は、図4(A)に示すような行列となる。また、ブロックサイズが“8”のアダマール変換係数A11は、同図(B)に示すような行列となる。
特徴量は、アダマール変換係数とブロックサイズとブロックの位置とから規定される。例えば、ブロックサイズを8×8画素、ブロック位置を(x0,y0)、アダマール変換係数をA04とすると、次の(2)式で表される。
この計算のとき、積分画像を用いると、各矩形領域の値は矩形領域の各頂点に対応する積分画像の値の加減演算のみで求めることができるので、計算量は矩形領域の大きさに対して一定となり、矩形領域の数に比例する。例えば、8×8の場合、64回の計算が必要であるが、積分画像を使うことにより計算量を減らすことができる。
ブロックサイズは、例えば、4×4、8×8、16×16の3種類とする。計算する特徴量の総数をNとする。n(=1,2,…,N)番目の特徴量の重み係数Wn、アダマール変換係数をan、ブロックサイズをbn、ブロック座標を(xn,yn)とすると、予め図5に示すような表を作成しておき、この表に基づいて特徴量を計算する。図5において、特徴量には1からNまでの番号が付され、行単位で1つの特徴量が示され、各列に特徴量を規定するのに必要な属性情報が示されている。例えば、番号1の特徴量は、重み係数(Wn)=0.80、アダマール変換係数(an)=0、ブロックサイズ(bn)=8、ブロック座標(xn,yn)=(7,13)であることを示している。重み係数(Wn)は予め学習によって求められた係数であり、学習の都度、変更される係数である。
なお、特徴量の選定は、予め顔画像と非顔画像とを多数用意しておき、それらの画像を用いてブースティング(boosting)により行う。このとき、選定するN個の特徴量をM個のグループ、例えば16個のグループに分割する。ここで、0<N1<N2<…<NM−1<NM=Nである。
先ず、0からN1−1までの特徴量を領域数の少ないアダマール変換係数A01,A02で構成する。次のグループも同様に係数A01から領域数が多いアダマール変換係数を加えたもので構成する。最後のグループはA01からA14までの全ての係数を用いて構成する。
<判断部16の処理>
判断部16では、各ウインドウが顔領域であるかどうかを判断する。
判断部16では、各ウインドウが顔領域であるかどうかを判断する。
この場合、特徴量と図6に示すような判別テーブルとから弱分類器を構成する。この判別テーブルは、行(横方向)が1つの特徴量に対応しており、特徴量の番号(行番号)1〜Nに対応させて特徴量の判別結果が格納されている。特徴量の値は、0から255までの整数に予め正規化され、かつ量子化された値である。また、判別結果は、顔のとき“1”、非顔のとき“0”を出力する。この弱分類器の出力gと重み係数Wnとから次の(3)式によって顔らしさを表す評価値Ri(i=0,2,…,M)を求める。
但し、弱分類器の出力が“1”のとき、g=1、出力が“0”のときg=−1である。
この判断部16の処理手順を図7のフローチャートを参照して説明する。
同図に示すように、評価値R0が予め設定した閾値T0より小さい場合、すなわち、R0≦T0である(ステップS10NO)ときは、顔でない(非顔))と判断する(ステップS11)。一方、R0>T0である(ステップS11YES)ときは、次に、評価値R1を求めて閾値T1と比較し、R1≦T1である(ステップS12NO)ときは、顔でない(非顔))と判断する(ステップS11)。
評価値R2以降も同様に処理して、最終的に評価値RM求めてRM≦TMである(ステップS10NO)ときは、顔でない(非顔))と判断する(ステップS11)。一方、RM>TMであるときは、顔であると判定して処理を終了する(ステップS14)。
こうして、“顔”と判定されたウインドウの中心座標とウインドウの縦、横のサイズと評価値RMが顔領域候補記録部17に記録される。
<顔結合部18の処理>
図8、図9は顔結合部18の処理手順を示している。ステップS21では、初期設定が実行される。すなわち、顔領域候補データをAi(i=0,1,…,N-1)、顔領域候補グループをGi(i≧0)と設定する。また、顔領域候補データA0を含む顔領域候補グループをGmと設定する。
図8、図9は顔結合部18の処理手順を示している。ステップS21では、初期設定が実行される。すなわち、顔領域候補データをAi(i=0,1,…,N-1)、顔領域候補グループをGi(i≧0)と設定する。また、顔領域候補データA0を含む顔領域候補グループをGmと設定する。
ステップS22からステップS25では、顔領域候補データがどの顔領域候補グループに属するかを決めるグループ化処理が実行される。先ず、ステップS22において、最初の顔領域候補データA0と他の顔領域候補Ai(i=0,1,…,N-1)との中心間距離が求められる。求められた中心間距離が所定の閾値以下であれば、この顔領域候補Aiを顔領域候補グループGMに入れる。次いで、顔領域候補Ai□Gj(i=0,1,…,N-1、j=0,1,…,M)の中から最も小さい番号iを選んで(i=kとする)、顔領域候補Akを含む顔領域候補グループをGM+1とする。
次いで、Mを1歩進させてM=M+1として全ての顔領域候補データのグループ分けを実行する。全ての顔領域候補データがグループのグループ分けが終了した場合には、次に、求められた顔領域候補グループGiに対して、グループに含まれる顔領域候補データの数がある閾値以下であれば、そのグループを消去する。残った顔領域候補グループに対して、顔領域のサイズと中心位置と評価値とを求める。
次に、顔領域候補グループにおいて、2つのグループの領域が近傍にある場合、評価値の大きい方の領域を残して小さい方を消去する。評価値の高いグループを最終的に顔領域として出力する。
このように、本実施形態によれば、特徴量の抽出にアダマール変換係数を用いることにより、少ない特徴量で高い検出精度を実現できる。また、構成が簡単で計算量の少ないアダマール変換係数から順番に弱分類器を作成することにより処理時間の増加を抑制して、ハードウェアのリソースを少なくすると共に処理時間を短縮することが可能となる。
10:ビデオカメラ部
11:デジタル画像記録部
12:画像縮小部
13:画像走査部
14:積分変換部
15:特徴量計算部
16:判断部
17:顔領域候補記録部
18:領域結合部
11:デジタル画像記録部
12:画像縮小部
13:画像走査部
14:積分変換部
15:特徴量計算部
16:判断部
17:顔領域候補記録部
18:領域結合部
Claims (1)
- 画像中の特定領域が該画像のどの位置にあるかを検出する領域検出装置において、
前記画像をデジタル化して得られたデジタル画像を所定の縮小率で繰り返し縮小する画像縮小手段と、
前記縮小されたデジタル画像毎に所定のサイズのウインドウを用いて走査する画像走査手段と、
前記走査するウインドウ内の各画像に対して、アダマール変換係数を適用して特徴量を計算する特徴量計算手段と、
前記計算された特徴量に基づき、前記ウインドウ内の画像が前記特定領域の候補であるか否かを複数の弱分類器によって判定する判定手段と、
前記判定手段により前記特定領域の候補であると判定された画像の中から1つの特定領域を選択する特定領域決定手段と、
を備えたことを特徴とする領域検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006115661A JP2007287024A (ja) | 2006-04-19 | 2006-04-19 | 領域検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006115661A JP2007287024A (ja) | 2006-04-19 | 2006-04-19 | 領域検出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007287024A true JP2007287024A (ja) | 2007-11-01 |
Family
ID=38758720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006115661A Pending JP2007287024A (ja) | 2006-04-19 | 2006-04-19 | 領域検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007287024A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018168042A1 (ja) * | 2017-03-14 | 2018-09-20 | オムロン株式会社 | 画像解析装置、画像解析方法、及び画像解析プログラム |
-
2006
- 2006-04-19 JP JP2006115661A patent/JP2007287024A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018168042A1 (ja) * | 2017-03-14 | 2018-09-20 | オムロン株式会社 | 画像解析装置、画像解析方法、及び画像解析プログラム |
JP2018151919A (ja) * | 2017-03-14 | 2018-09-27 | オムロン株式会社 | 画像解析装置、画像解析方法、及び画像解析プログラム |
US11188781B2 (en) | 2017-03-14 | 2021-11-30 | Omron Corporation | Image analyzer, image analysis method, and image analysis program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6985631B2 (en) | Systems and methods for automatically detecting a corner in a digitally captured image | |
US7457432B2 (en) | Specified object detection apparatus | |
US20070076951A1 (en) | Image recognition device | |
CN105339951A (zh) | 用于检测文档边界的方法 | |
JP6292911B2 (ja) | 画像処理方法、画像処理プログラムおよび画像処理装置 | |
JP2008033424A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP2004005675A (ja) | 勾配解析を利用したデジタル画像のノイズ予測方法 | |
US20220414827A1 (en) | Training apparatus, training method, and medium | |
WO2019210707A1 (zh) | 一种图像清晰度评测方法、装置及电子设备 | |
US20210374527A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP5335554B2 (ja) | 画像処理装置及び画像処理方法 | |
CN111767752B (zh) | 一种二维码识别方法及装置 | |
CN111080683B (zh) | 图像处理方法、装置、存储介质及电子设备 | |
JP2000242261A (ja) | 画像表示方法、画像処理装置、及び記録媒体 | |
JPH11312243A (ja) | 顔領域検出装置 | |
JP3223384B2 (ja) | 濃淡画像のパターンマッチング装置 | |
JP2007287024A (ja) | 領域検出装置 | |
JP5754931B2 (ja) | 画像解析装置、画像解析方法及びプログラム | |
JP4380308B2 (ja) | 顔領域検出方法及び装置及びプログラム及び顔領域検出プログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
JP4355305B2 (ja) | 画像処理装置、コンピュータプログラム、及び記録媒体 | |
WO2008023466A1 (en) | Moving vector detecting bdevice | |
US20220092357A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP4575751B2 (ja) | ヒストグラム近似復元装置及びヒストグラム近似復元方法、並びに画像検索装置及び画像検索方法 | |
US11995153B2 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2008205603A (ja) | 画像処理装置および画像処理方法 |