JP6202937B2 - 画像認識装置、画像認識方法、及びコンピュータプログラム - Google Patents

画像認識装置、画像認識方法、及びコンピュータプログラム Download PDF

Info

Publication number
JP6202937B2
JP6202937B2 JP2013171604A JP2013171604A JP6202937B2 JP 6202937 B2 JP6202937 B2 JP 6202937B2 JP 2013171604 A JP2013171604 A JP 2013171604A JP 2013171604 A JP2013171604 A JP 2013171604A JP 6202937 B2 JP6202937 B2 JP 6202937B2
Authority
JP
Japan
Prior art keywords
pixels
pixel
value
region
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013171604A
Other languages
English (en)
Other versions
JP2015041226A (ja
Inventor
雄司 金田
雄司 金田
佐藤 博
博 佐藤
崇士 鈴木
崇士 鈴木
俊亮 中野
俊亮 中野
敦夫 野本
敦夫 野本
山本 貴久
貴久 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013171604A priority Critical patent/JP6202937B2/ja
Publication of JP2015041226A publication Critical patent/JP2015041226A/ja
Application granted granted Critical
Publication of JP6202937B2 publication Critical patent/JP6202937B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像認識装置、画像認識方法、及びコンピュータプログラムに関し、特に、画像認識を行うために用いて好適なものである。
画像認識技術は、オートシャッター、画像検索等の多くのアプリケーションに有用であり、近年、画像認識に関する様々な特徴量が提案されている。
例えば、特許文献1には、照明の変動に対してロバストな特徴量を生成するために、或る局所領域内で、中央の画素値と周囲の画素値との大小関係に基づいて2値化処理を行う技術が開示されている。図16は、特許文献1に記載の技術における2値化処理の手法の一例を説明する図である。図16に示すように、特許文献1に記載の技術では、3×3の画素の領域の中央の画素の画素値Icと、その周辺の画素の画素値In(n=1〜8)と、の夫々の大小関係を比較する。そして、(中央の画素値Ic−周辺の画素値In)が所定の閾値Th以上であるならば「1」、それ以外は「0」とする2値化処理を実施し、2値化した画素値を連結することでバイナリーコードを生成する。
一方、局所領域で特徴量をヒストグラム化するヒストグラム特徴は、位置ずれの変化にロバストな特徴であるため、注目されている。
例えば、非特許文献1には、特許文献1に示されているようなバイナリーコードから、横軸をバイナリーコード、縦軸を頻度としたヒストグラムを生成し、生成したヒストグラムを利用して表情の認識をする技術が提案されている。このようなヒストグラムを、Local Binary Pattern(LBP)ヒストグラムと称する。
また、このようなバイナリーコード以外にも、非特許文献2のようにしてヒストグラムを生成して人体を認識する技術が提案されている。かかる技術では、まず、或る注目画素の上下左右の位置にある画素の画素値を使用して、輝度勾配と輝度方向とを求める。そして、横軸を輝度勾配の方向、縦軸を輝度勾配の強度和としたヒストグラムを生成し、生成したヒストグラムを利用して人体を検出する。更に非特許文献2では、輝度勾配の強度をヒストグラムビンに投票する際、1つのビンに対して投票せずに、輝度勾配の方向に基づいて2つのビンに対して重み付けをし、それに基づいて、輝度勾配の強度を分配して各ビンに投票することも提案されている。
特開2007−188504号公報
C. Shan, T. Gritti, "Learning discriminative lbp-histogram bins for facial expression recognition", Proc. British Machine Vision Conference, 2008 N. Dalal, B. Triggs, "Histograms of Oriented Gradients for Human Detection", Computer Vision and Pattern Recognition (CVPR), 2005 P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features", in Proc. Of CVPR, vol.1, pp.511-518, December, 2001
変動等に左右されない安定的な画像認識技術を実現するためには、変動等に左右されないヒストグラム特徴を生成することが重要である。
しかしながら、特許文献1に記載の技術のように、中央の画素の輝度値とその周辺の画素の輝度値との大小関係に基づいてコード変換し、ヒストグラムを生成する方法では、照明等の変動要因の影響で輝度値が変化する。このため、照明等の変動要因の有無で、図17のように異なるコード(投票値)が生成される可能性がある。図17(a)、(b)は、特許文献1に記載の技術によりバイナリー変換を行った結果の第1、第2の例を示す図である。図17に示す例では、閾値Thを「0(ゼロ)」とする。そうすると、図17(a)では、中央の画素の輝度値(=125)から、その上の画素の輝度値(124)を引いた値(=1)は閾値Th以上となるので、2値化処理の結果は「1」となる。一方、図17(b)に示す例では、中央の画素の輝度値(=125)から、その上の画素の輝度値(126)を引いた値(=−1)は閾値Th以上とならないので、2値化処理の結果は「0」となる。このように輝度値が僅かにしか異ならないのにもかかわらず、2値化処理の結果が異なることになる。
また、ヒストグラムを生成する領域が小さい場合には、ヒストグラムを生成する領域が大きい場合と比較すると、ヒストグラムビンへの投票数が少なくなるため、1つの投票値に対する重みが大きくなる。このような問題を抱えているため、例えば、個人を特定する個人認証に、このヒストグラム特徴を適用した場合には、同一人物の同一範囲から形状の異なるヒストグラムが生成され、別の人物と判定される可能性がある。つまり、画像の認識成功率の低下に繋がる。
以上述べた問題は、個人を特定する個人認証の他に、顔の表情を認識する表情認識、更には顔以外の特定の物体を検出する物体検出でも同様である。
本発明は、このような課題に鑑みてなされたものであり、照明等の変動要因があっても安定した画像認識を実現することができるようにすることを目的とする。
本発明の画像認識装置は、物体を含む画像を取得する画像取得手段と、前記画像取得手段により取得された前記画像に対してヒストグラム生成領域を設定する領域設定手段と、前記ヒストグラム生成領域における2つの画素の画素値のペアに対応する少なくとも1つのコードを生成し、生成した前記コードから符号化コードを生成する符号化コード生成手段と、前記符号化コード生成手段により生成された前記符号化コードを投票値としてヒストグラムを生成するヒストグラム生成手段と、前記ヒストグラム生成手段により生成された前記ヒストグラムに基づいて前記物体の属性を認識する属性認識手段と、前記符号化コード生成手段は、前記2つの画素の画素値の一方から他方を引いた値が、第1の閾値から第2の閾値までの間にある場合に、当該2つの画素の画素値のペアに対応するコードとして複数のコードを生成することを特徴とする。
本発明によれば、照明等の変動要因があっても安定した画像認識を実現することができる。
画像認識装置の構成の一例を示す図である。 画像認識装置の全体処理の一例を説明するフローチャートである。 正規化画像に対して設定されるヒストグラム生成領域を示す図である。 ステップS206の詳細を説明するフローチャートである。 符号化コードを生成する方法を説明する図である。 異なるヒストグラムビンに投票値が投票される様子を示す図である。 局所領域から複数のLBPコードを生成する方法を説明する図である。 ステップS402の詳細の第1の例を説明するフローチャートである。 LBPコードがヒストグラムビンに投票される様子を示す図である。 不安定な場合と安定な場合のヒストグラム生成領域を示す図である。 図10のヒストグラム生成領域におけるヒストグラムを示す図である。 ステップS402の詳細の第2の例を説明するフローチャートである。 画像認識装置の全体構成の他の例を示す図である。 画像認識装置の全体処理の他の例を説明するフローチャートである。 ステップS402の詳細の第3の例を説明するフローチャートである。 特許文献1における2値化処理の手法を説明する図である。 特許文献1の技術によりバイナリー変換を行った結果を示す図である。
以下、図面を参照しながら、本発明の実施形態について説明する。
(第1の実施形態)
まず、本発明の第1の実施形態について説明する。
本実施形態では、発明が解決しようとする課題で説明したLocal Binary Pattern(LBP)ヒストグラムを生成する際に生じる問題を解決するために、画像を構成する2つの画素値の大小関係に基づいて、投票数を適応的に変化させる。以下に、本実施形態の詳細を述べる。
図1は、画像認識装置の全体構成の一例を示す図である。
画像認識装置1000は、画像取得部100、物体位置検出部200、画像正規化部300、領域設定部400、適応的符号化コード生成部500、ヒストグラム特徴生成部600、及び属性認識部700を備えて構成される。図2は、画像認識装置1000の全体処理の一例を説明するフローチャートである。以下では、図2を参照しながら、画像認識装置1000の全体処理の一例を説明する。
ステップS201において、画像取得部100は、レンズ等の集光素子、光を電気信号に変換するCMOSセンサやCCD等の撮像素子、アナログ信号をデジタル信号に変換するAD変換器、を通過することによって得られたデジタル画像データを取得する。また、画像取得部100は、このステップS201において、間引き処理等を行うことによって、例えば、VGA(640×480[pixel])やQVGA(320×240[pixel])に変換した顔画像を取得することも可能である。このように、本実施形態では、画像認識装置1000が撮像装置である場合を一例として示す。
次に、ステップS202において、物体位置検出部200は、ステップS201で取得したデジタル画像データから、物体領域の重心の位置を検出する。本実施形態では、顔領域の中心の位置を検出する。顔検出処理としては、例えば、非特許文献3に記載されているような手法があり、本実施形態では、この手法を使用する。顔検出処理では、目や口等の顔のパーツを検出することでデジタル画像データ中に顔が存在するか否かを判定する手法がよく用いられている。そのため、ステップS202では、顔の中心座標(x,y)と共に、左右の眼の中心座標(x, y)や口の中心座標(x, y)を取得することが可能である。
次に、ステップS203において、物体位置検出部200は、ステップ202で物体領域(顔領域)が検出されたか否かを判定する。この判定の結果、物体領域(顔領域)が検出された場合にはステップS204へ進む。一方、物体領域(顔領域)が検出されなかった場合にはステップS201に戻り、次のデジタル画像データを取得する。
ステップS204に進むと、画像正規化部300は、ステップS202で得られた、顔の中心座標(x,y)と、左右の眼の中心座標(x,y)と、口の中心座標(x,y)とを使用して画像の切り出しと正規化処理とを行う。尚、本実施形態では、正規化処理には、アフィン変換を使用する。この正規化処理によって、例えば、左右の眼の中心座標間の距離が50[pixcel]となり、且つ、左右の眼の中心座標を結ぶ直線が水平方向になる(つまり、顔が正立するようになる)。以下の説明では、画像正規化部300により正規化処理が行われたデジタル画像データを必要に応じて正規化画像と称する。
次に、ステップS205では、領域設定部400は、ステップS204で生成された正規化画像に対して、ヒストグラム生成領域を設定する。図3は、正規化画像に対して設定されるヒストグラム生成領域1100、1101、1102の一例を示す図である。尚、図3では、ヒストグラム生成領域1100、1101、1102を3つとしているが、ヒストグラム生成領域の数は、3つに限定されず、認識する属性に応じて、1つ又は複数のヒストグラム生成領域を設定していればよい。
次に、ステップS206において、適応的符号化コード生成部500は、ヒストグラムの作成に必要な符号化コードを生成する。つまり、適応的符号化コード生成部500は、ヒストグラムビンへの投票値を生成する。図4は、ステップS206における適応的符号化コード生成処理の詳細を説明するフローチャートである。
図4のステップS401において、適応的符号化コード生成部500は、ステップS205で設定されたヒストグラム生成領域のそれぞれに対して、より細かな複数の局所領域を設定する。図5は、ヒストグラム生成領域に対して設定された局所領域を設定して符号化コードを生成する方法の一例を説明する図である。図5に示す例では、正規化画像(輝度画像)に対して設定されたヒストグラム生成領域に対して3×3の局所領域を設定する場合を例に挙げて示す。
ヒストグラムの生成時での投票値には、輝度等、様々なものが考えられるが、本実施形態では、非特許文献1に記載のLocal Binary Pattern(LBP)を使用する。よって、ステップS402において、適応的符号化コード生成部500は、コード変換としてバイナリー変換を行い、ステップS403において、適応的符号化コード生成部500は、符号化コードとしてLBPコードを取得する。このように以下では、コード変換がバイナリー変換であり、符号化コードがLBPコードであるものとして説明する。
次に、ステップS404において、適応的符号化コード生成部500は、ステップS402で設定された全てのヒストグラム生成領域に対してLBPコードを取得したか否かを判定する。この判定の結果、LBPコードを取得していないヒストグラム生成領域がある場合には、ステップS401に戻る。
ここで、ステップS402におけるバイナリー変換、ステップS403におけるLBPコードの取得の2つのステップの詳細について説明する。
1つのLBPコードを取得するのに、例えば、図5のように3×3の局所領域を用いる。局所領域の中央の画素の輝度値1105と、その画素の周辺の画素の輝度値との大小(すなわち、局所領域の基準となる画素とその他の画素との大小)を比較することで、当該周辺の画素の輝度値を「0」又は「1」にバイナリー変換(符号化)する。その後、当該周辺の画素のうち、所定の1画素1106を起点として、当該周辺の画素の符号化後の値を順次連結することで、バイナリーコードを得る。例えば、図5の3×3の局所領域からは8ビットのバイナリーコード(00011110)を得ることができ、8ビットのバイナリーコード(00011110)がヒストグラムの生成時の1投票値となる。
尚、本実施形態では、3×3の局所領域から8ビットのバイナリーコードを生成する場合を例に挙げて説明した。しかしながら、5×5等の局所領域を設定しても良い。また、コード変換は2値に限定されるわけではなく、3値等、多値に変換しても良い。
発明が解決しようとする課題の欄で説明したように、中央の画素の画素値と、その周辺の画素の画素値との差が大きい場合には、照明や顔の向き等の変動が混入した場合でも中央の画素の画像値とその周辺の画素の画素値との大小関係が保持される。このため、このような変動があった場合でも、変動がない場合と同一のバイナリーコードが得られる。しかし、中央の画素の画像値と、その周辺の画素の画素値との差が小さい場合には、このような変動により、中央の画素の画素値と、その周辺の画素の画素値との大小関係が逆転するケースが生じ、変動の有無で異なるバイナリーコードが生成される可能性がある。
図6は、照明や顔の向き等の変動がある場合とない場合とで異なるヒストグラムビンに投票値(バイナリコード)が投票される様子の一例を示す図である。具体的に図6(a)は、照明や顔の向き等の変動がない場合に生成されたバイナリーコードがヒストグラムビンに投票される様子を示す。また、図6(b)は、照明や顔の向き等の変動がある場合に生成されたバイナリーコードがヒストグラムビンに投票される様子を示す。
図6に示すように、中央の画素の画像値と、その周辺の画素の画素値との差が小さい場合に、変動の有無で異なるバイナリーコードが生成されると、それらのバイナリーコードは別々のヒストグラムビンに投票されてしまう。このため、形状の異なるヒストグラムが生成される。その結果、画像認識率の低下に繋がる可能性がある。
そこで、本実施形態では、3×3の局所領域から1つのLBPコードを生成するのはなく、必要に応じて複数のLBPコードを生成する。図7は、3×3の局所領域から複数のLBPコードを生成する方法の一例を説明する図である。
図8は、ステップS402におけるバイナリー変換の方法の詳細の第1の例を説明するフローチャートである。
まず、ステップS801において、適応的符号化コード生成部500は、局所領域の中央の画素の画素値Icと、その周囲の画素の画素値Inとのペアを1つ選択する。
次に、ステップS802において、適応的符号化コード生成部500は、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、所定の閾値Th以上であるか否かを判定する。この判定の結果、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上である場合には、ステップS803に進む。ステップS803に進むと、適応的符号化コード生成部500は、ステップS801で選択した画素値のペアに対応するコードとして「1」を割り当てる。そして、図8のフローチャートによる処理を終了する。
一方、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上でない場合には、ステップS804に進む。ステップS804に進むと、適応的符号化コード生成部500は、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値−Th以下であるか否かを判定する。この判定の結果、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値−Th以下である場合には、ステップS805に進む。ステップS805に進むと、適応的符号化コード生成部500は、ステップS801で選択した画素値のペアに対応するコードとして「0」を割り当てる。そして、図8のフローチャートによる処理を終了する。
一方、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値−Th以下でない場合には、ステップS806に進む。ステップS806に進むと、適応的符号化コード生成部500は、ステップS801で選択した画素値のペアに対応するコードとして「0」と「1」の両方を割り当てる。そして、図8のフローチャートによる処理を終了する。
尚、「0」を割り当てる第1の閾値−Thと、「1」を割り当てる第2の閾値Thの絶対値|Th|を同じにする必要はなく、閾値Th1と、閾値−Th2といったように別の値を設定するようにしても良い。また、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値を用いたが、局所領域の中央の画素の画素値Icから、局所領域の中央の画素の周囲の画素の画素値Inを引いた値を用いてもよい。すなわち、局所領域の中央の画素の周囲の画素の画素値Inと、局所領域の中央の画素の画素値Icの一方から他方を引いた値を用いればよい。
以上のようにしてバイナリー変換が行われた後は、割り当てられた値の組み合わせによりLBPコードが生成される。例えば、図7に示す例では、000、001、010、011の4つのLBPコードが生成され、図9に示すように、それら4つのLBPコードが4つのヒストグラムビンに個別に投票される。図9は、図7で得られたLBPコードがヒストグラムビンに投票される様子を示す図である。
このように、中央の画素の画素値Icと、その周囲の画素の画素値Inとの差が大きい領域については、投票数が少なくなる一方で、中央の画素の画素値Icと、その周囲の画素の画素値Inとの差が小さい領域については、投票数が多くなるようにしている。
その結果、ステップS207において、例えば、図10の影領域1107のようにエッジ強度が弱い不安定なヒストグラム生成領域に対しては、図11(a)のように平滑化されたようなヒストグラムが生成される。一方で、顔表面の影領域1107以外の領域1108のようにエッジ強度が強い安定したヒストグラム生成領域に対しては、図11(b)のようにシャープなヒストグラムが生成される。図10は、不安定なヒストグラム生成領域と安定したヒストグラム生成領域とを含む正規化画像の一例を示す図である。また、図11は、図10のヒストグラム生成領域におけるヒストグラムを示す図である。具体的に図11(a)は、不安定なヒストグラム生成領域におけるヒストグラムを示し、図11(b)は、安定したヒストグラム生成領域におけるヒストグラムを示す。
以上のように、中央画素値Icと周囲画素値Inとの差の大きさに基づいて適応的に投票値を生成することで、ステップS207では、照明の変動等の影響を受け易い領域(画素値が変動し易い領域)に対して、平滑化されたようなヒストグラムが生成される。一方で、照明変動等の影響を受けにくい領域(画素値が変動しづらい領域)に対しては、シャープなヒストグラムを生成される。
図1及び図2の説明に戻り、ステップS207において、ヒストグラム特徴生成部600は、ステップ206で生成された投票値を使用してヒストグラムを生成する。
次に、ステップS208において、ヒストグラム特徴生成部600は、対象となる全てのヒストグラム生成領域に対してヒストグラムを生成したか否かを判定する。この判定の結果、対象となる全てのヒストグラム生成領域に対してヒストグラムを生成していない場合には、ステップS204に戻る。一方、対象となる全てのヒストグラム生成領域に対してヒストグラムを生成した場合には、ステップS209に進む。
次に、ステップS209において、属性認識部700は、ステップS207で生成されたヒストグラムを使用して属性の認識を行う。本実施形態では、属性を顔の表情とする。例えば、ステップS205で設定された複数のヒストグラム生成領域から生成されるヒストグラムを連結することで特徴ベクトルを生成する。そして、非特許文献2でも使用されているSupport Vector Machine(SVM)を用いて、生成した特徴ベクトルに基づき、顔の表情が何であるかを認識する。尚、SVMは、特定の1つの表情と、その他の表情とを区別するように予め学習されているものを利用する。
尚、本実施形態では、顔の表情を認識する場合を例に挙げて示しているが、年齢、性別、人種、更には個人を認識するようにしても良く、物体の属性を認識していれば、認識する対象は、どのようなものであってもよい。
次に、ステップS210において、属性認識部700は、ステップS202で検出された全ての物体領域(顔領域)に対して、その属性(表情)を認識したか否かを判定する。この判定の結果、全ての物体領域(顔領域)に対して、その属性(表情)を認識していない場合には、ステップS204に戻る。一方、全ての物体領域(顔領域)に対して、その属性(表情)を認識した場合には、図2のフローチャートによる処理を終了する。
以上説明したように、LBPコードを用いたヒストグラム特徴では、照明や顔の向き等の変動の影響により、当該変動の有無で形状の異なるヒストグラムが生成され、その結果、画像認識の精度の低下に繋がるという問題があった。これに対し、本実施形態では、ヒストグラム生成領域を分割した分割領域の中央の画素の画像値とその周辺の画素の画素値との差の大きさに基づいて、ヒストグラムへの投票値の数を適応的に増加させる。具体的に本実施形態では、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上であれば、当該局所領域の中央の画素に対して「1」を割り当てる。また、この値が閾値−Th以下であれば、当該局所領域の中央の画素に対して「0」を割り当てる。また、この値が閾値−Th超、閾値Th未満であれば(閾値−Thから閾値Thまでの間にあれば)、当該局所領域の中央の画素に対して「0」及び「1」を割り当てる。そして、割り当てた符号の組み合わせのそれぞれをLBPコード(投票値)としてヒストグラムを生成する。したがって、変動等に影響されにくいロバストなヒストグラム特徴を生成することができる。これにより、変動等に影響されにくいロバストな画像認識処理が可能となる。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。第1の実施形態では、ヒストグラム生成領域の大きさに関わらず、ヒストグラムへの投票値の数を適応的に変化させるようにした。これに対し、本実施形態では、Local Binary Pattern(LBP)ヒストグラムを生成する際に生じる問題を解決するために、ヒストグラム生成領域の面積が小さい場合に、ヒストグラムへの投票値の数を適応的に変化させる。このように本実施形態と第1の実施形態とは、適応的符号化コード生成処理(図2のステップS206の処理)の詳細が主として異なる。したがって、本実施形態の説明において、第1の実施形態と同一の部分については、図1〜図11に付した符号と同一の符号を付す等して詳細な説明を省略する。
図4と図12を参照しながら、本実施形態における適応的符号化コード生成処理の一例を説明する。図12は、ステップS402におけるバイナリー変換の方法の詳細の第2の例を説明するフローチャートである。
ステップS401では、第1の実施形態と同様に、適応的符号化コード生成部500は、ステップS205で設定されたヒストグラム生成領域に対して、より細かな局所領域を設定する。
次に、ステップS402において、適応的符号化コード生成部500は、コード変換としてバイナリー変換を行う。図12を参照しながら、ステップS402の詳細について説明する。
まず、ステップS1201において、適応的符号化コード生成部500は、局所領域の中央の画素の画素値Icと、その周囲の画素の画素値Inとのペアを1つ選択する。
次に、ステップS1202において、適応的符号化コード生成部500は、ステップS205で設定されたヒストグラム生成領域の面積が所定値以上であるか否かを判定する。この判定の結果、ヒストグラム生成領域の面積が所定値以上である場合には、ステップS1203に進む。
ステップS1203に進むと、適応的符号化コード生成部500は、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、所定の閾値Th以上であるか否かを判定する。この判定の結果、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上である場合には、ステップS1204に進む。ステップS1204に進むと、適応的符号化コード生成部500は、ステップS1201で選択した画素値のペアに対応するコードとして「1」を割り当てる。そして、図12のフローチャートによる処理を終了する。
一方、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上でない場合には、ステップS1205に進む。ステップS1205に進むと、適応的符号化コード生成部500は、ステップS1201で選択した画素値のペアに対応するコードとして「0」を割り当てる。そして、図12のフローチャートによる処理を終了する。
ステップS1202において、ステップS205で設定されたヒストグラム生成領域の面積が所定値以上でないと判定された場合には、ステップS1206に進む。ステップS1206に進むと、適応的符号化コード生成部500は、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、所定の閾値Th以上であるか否かを判定する。この判定の結果、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上である場合には、ステップS1207に進む。ステップS1207に進むと、適応的符号化コード生成部500は、ステップS1201で選択した画素値のペアに対応するコードとして「1」を割り当てる。そして、図12のフローチャートによる処理を終了する。
一方、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上でない場合には、ステップS1208に進む。ステップS1208に進むと、適応的符号化コード生成部500は、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値−Th以下であるか否かを判定する。この判定の結果、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値−Th以下である場合には、ステップS1209に進む。ステップS1209に進むと、適応的符号化コード生成部500は、ステップS1201で選択した画素値のペアに対応するコードとして「0」を割り当てる。そして、図12のフローチャートによる処理を終了する。
一方、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値−Th以下でない場合には、ステップS1210に進む。ステップS1210に進むと、適応的符号化コード生成部500は、ステップS1201で選択した画素値のペアに対応するコードとして「0」と「1」の両方を割り当てる。そして、図12のフローチャートによる処理を終了する。例えば、ヒストグラム生成領域の面積が大きい場合には、局所領域の中央の画素の画素値Icと局所領域の中央の画素の周囲の画素の画素値Inとの差に関わらず、局所領域から1つの投票値だけが生成される。一方、ヒストグラム生成領域の面積が小さい場合には、第1の実施形態と同様にして、複数の投票値が生成されるようになる。
以上説明したように本実施形態では、ヒストグラム生成領域の面積判定の結果に基づいて、ヒストグラムへの投票値の数を適応的に増加させる。具体的には、ヒストグラム生成領域の面積が所定値未満である場合には、第1の実施形態と同様に複数の投票値が生成され得るようにして、ヒストグラムへの投票値を増加させることで、1投票値あたりの重みを分散させる。したがって、変動等により影響されにくいロバストなヒストグラム特徴を生成することができる。これにより、変動等により影響されにくいロバストな画像認識処理が可能となる。
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。本実施形態では、Local Binary Pattern(LBP)ヒストグラムを生成する際に生じる問題を解決するために、顔領域を複数の領域に分割し、分割した領域毎に、図10の影領域1107のような領域が存在するかどうかを判定する。そして、その判定結果に基づいて、ヒストグラムへの投票値の数を適応的に変化させる。このように本実施形態は、第1の実施形態に対し、不安定な領域であるか否かを判定する構成を付加し、これに応じて、適応的符号化コード生成処理(図2のステップS206の処理)の詳細を変更したものである。したがって、本実施形態の説明において、第1の実施形態と同一の部分については、図1〜図11に付した符号と同一の符号を付す等して詳細な説明を省略する。
図13は、本実施形態の画像認識装置3000の全体構成の一例を示す図である。本実施形態の画像認識装置3000は、図1に示した第1の実施形態の画像認識装置1000に対し、安定領域判定部800が付加されたものである。また、図14は、本実施形態の画像認識装置3000の全体処理の一例を説明するフローチャートである、図14のフローチャートは、図2に示したフローチャートに対し、ステップS205、S206の間に、ステップS1401が付加されたものである。そして、ステップS206の処理が、ステップS1401の処理の結果に応じた処理になる。したがって、ここでは、これら以外の詳細な説明を省略する。
ステップS1401において、安定領域判定部800は、ステップS205で設定されたヒストグラム生成領域内に、図10の影領域1107のようにエッジ強度が弱い不安定な領域が存在するか否かを判定する。この判定の方法には、例えば、次のような方法がある。まず、図10のような影領域1107が存在する画像と、そうでない画像とを大量に用意する。そして、図3のヒストグラム生成領域1102を構成する画素値を1つの要素とする特徴ベクトルを生成し、第1の実施形態で使用したSVMにより学習させることで、影のない安定領域か否かを判定する識別器を構築する。
次に、ステップS206において、適応的符号化コード生成部500は、ステップS1401の判定の結果に応じて、ヒストグラムの生成に必要な符号化コードを生成する。
ステップS206における適応的符号化コード生成処理は、第1の実施形態と同様に、図4に示したフローチャートにより実現される。ただし、図4のステップS402におけるバイナリー変換の方法の詳細の一部が第1の実施形態と異なる。
図15は、ステップS402におけるバイナリー変換の方法の詳細の第3の例を説明するフローチャートである。
ステップS1501において、適応的符号化コード生成部500は、局所領域の中央の画素の画素値Icと、その周囲の画素の画素値Inとのペアを1つ選択する。
次に、ステップS1502において、適応的符号化コード生成部500は、ステップS1401での判定の結果を参照し、ステップS1501で選択した画素の領域が、影のない安定している領域であるか否かを判定する。
この判定の結果、ステップS1501で選択した画素の領域が、影のない安定している領域でない場合には、ステップS1503に進む。
ステップS1503に進むと、適応的符号化コード生成部500は、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、所定の閾値Th以上であるか否かを判定する。この判定の結果、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上である場合には、ステップS1504に進む。ステップS1504に進むと、適応的符号化コード生成部500は、ステップS1501で選択した画素値のペアに対応するコードとして「1」を割り当てる。そして、図15のフローチャートによる処理を終了する。
一方、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上でない場合には、ステップS1505に進む。ステップS1505に進むと、適応的符号化コード生成部500は、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値−Th以下であるか否かを判定する。この判定の結果、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値−Th以下である場合には、ステップS1506に進む。ステップS1506に進むと、適応的符号化コード生成部500は、ステップS1501で選択した画素値のペアに対応するコードとして「0」を割り当てる。そして、図15のフローチャートによる処理を終了する。
一方、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値−Th以下でない場合には、ステップS1507に進む。ステップS1507に進むと、適応的符号化コード生成部500は、ステップS1501で選択した画素値のペアに対応するコードとして「0」と「1」の両方を割り当てる。そして、図15のフローチャートによる処理を終了する。
ステップS1502において、ステップS1501で選択した画素の領域が、影のない安定している領域であると判定された場合には、ステップS1508に進む。ステップS1508に進むと、適応的符号化コード生成部500は、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、所定の閾値Th以上であるか否かを判定する。この判定の結果、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上である場合には、ステップS1509に進む。ステップS1509に進むと、適応的符号化コード生成部500は、ステップS1501で選択した画素値のペアに対応するコードとして「1」を割り当てる。そして、図15のフローチャートによる処理を終了する。
一方、局所領域の中央の画素の周囲の画素の画素値Inから、局所領域の中央の画素の画素値Icを引いた値が、閾値Th以上でない場合には、ステップS1510に進む。ステップS1510に進むと、適応的符号化コード生成部500は、ステップS1501で選択した画素値のペアに対応するコードとして「0」を割り当てる。そして、図15のフローチャートによる処理を終了する。
以上説明したように本実施形態では、ヒストグラム生成領域に対して、影領域等の不安定な領域が存在するか否かを判定する処理を追加し、その判定の結果に基づいて、ヒストグラムへの投票値の数を適応的に変化させる。具体的には、不安定な領域では、第1の実施形態と同様に複数の投票値が生成され得るようにして、ヒストグラムへの投票値を増加させることで、1投票値あたりの重みを分散させる。したがって、変動等により影響されにくいロバストなヒストグラム特徴を生成することができる。これにより、変動等により影響されにくいロバストな画像認識処理が可能となる。
尚、第2の実施形態と第3の実施形態とを組み合わせることができる。例えば、図12のステップS1202でYESと判定された後に、図15のステップS1502〜S1510の処理を行うことができる。また、例えば、図15のステップS1502でYESと判定された後に、図12のステップS1202〜S1210の処理を行うことができる。
尚、前述した実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
(その他の実施例)
本発明は、以下の処理を実行することによっても実現される。即ち、まず、以上の実施形態の機能を実現するソフトウェア(コンピュータプログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)が当該コンピュータプログラムを読み出して実行する。
400 領域設定部、500 適応的符号化コード生成部、600 ヒストグラム特徴生成部

Claims (15)

  1. 物体を含む画像を取得する画像取得手段と、
    前記画像取得手段により取得された前記画像に対してヒストグラム生成領域を設定する領域設定手段と、
    前記ヒストグラム生成領域における2つの画素の画素値のペアに対応する少なくとも1つのコードを生成し、生成した前記コードから符号化コードを生成する符号化コード生成手段と、
    前記符号化コード生成手段により生成された前記符号化コードを投票値としてヒストグラムを生成するヒストグラム生成手段と、
    前記ヒストグラム生成手段により生成された前記ヒストグラムに基づいて前記物体の属性を認識する属性認識手段と、
    前記符号化コード生成手段は、前記2つの画素の画素値の一方から他方を引いた値が、第1の閾値から第2の閾値までの間にある場合に、当該2つの画素の画素値のペアに対応するコードとして複数のコードを生成することを特徴とする画像認識装置。
  2. 前記ヒストグラム生成領域の面積が所定の値よりも小さいか否かを判定する面積判定手段をさらに有し、
    前記符号化コード生成手段は、前記面積判定手段により、前記ヒストグラム生成領域の面積が所定の値よりも小さいと判定された場合であって、前記2つの画素の画素値の一方から他方を引いた値が、第1の閾値から第2の閾値までの間にある場合に、当該2つの画素の画素値のペアに対応するコードとして複数のコードを生成することを特徴とする請求項1に記載の画像認識装置。
  3. 前記2つの画素の画素値の領域が、エッジ強度が弱い不安定な領域であるか否かを判定する安定領域判定手段をさらに有し、
    前記符号化コード生成手段は、前記安定領域判定手段により、前記2つの画素の画素値の領域が、エッジ強度が弱い不安定な領域であると判定された場合であって、当該2つの画素の画素値の一方から他方を引いた値が、第1の閾値から第2の閾値までの間にある場合に、当該2つの画素の画素値のペアに対応するコードとして複数のコードを生成することを特徴とする請求項1又は2に記載の画像認識装置。
  4. 前記符号化コード生成手段は、前記2つの画素の画素値のペアに対応するコードを1つずつ組み合わせたものを前記符号化コードとして生成することを特徴とする請求項1〜3の何れか1項に記載の画像認識装置。
  5. 前記符号化コード生成手段は、前記ヒストグラム生成領域における基準となる画素とその他の画素を前記2つの画素として、当該2つの画素の画素値のペアに対応するコードを生成することを、前記ヒストグラム生成領域における前記その他の画素の全てについて行った結果から、前記2つの画素の画素値のペアに対応するコードを生成することを特徴とする請求項1〜4の何れか1項に記載の画像認識装置。
  6. 前記符号化コード生成手段により生成される前記符号化コードは、LBP(Local Binary Pattern)コードであることを特徴とする請求項1〜5の何れか1項に記載の画像認識装置。
  7. 前記物体は、顔であることを特徴とする請求項1〜6の何れか1項に記載の画像認識装置。
  8. 物体を含む画像を取得する画像取得工程と、
    前記画像取得工程により取得された前記画像に対してヒストグラム生成領域を設定する領域設定工程と、
    前記ヒストグラム生成領域における2つの画素の画素値のペアに対応する少なくとも1つのコードを生成し、生成した前記コードから符号化コードを生成する符号化コード生成工程と、
    前記符号化コード生成工程により生成された前記符号化コードを投票値としてヒストグラムを生成するヒストグラム生成工程と、
    前記ヒストグラム生成工程により生成された前記ヒストグラムに基づいて前記物体の属性を認識する属性認識工程と、
    前記符号化コード生成工程は、前記2つの画素の画素値の一方から他方を引いた値が、第1の閾値から第2の閾値までの間にある場合に、当該2つの画素の画素値のペアに対応するコードとして複数のコードを生成することを特徴とする画像認識方法。
  9. 前記ヒストグラム生成領域の面積が所定の値よりも小さいか否かを判定する面積判定工程をさらに有し、
    前記符号化コード生成工程は、前記面積判定工程により、前記ヒストグラム生成領域の面積が所定の値よりも小さいと判定された場合であって、前記2つの画素の画素値の一方から他方を引いた値が、第1の閾値から第2の閾値までの間にある場合に、当該2つの画素の画素値のペアに対応するコードとして複数のコードを生成することを特徴とする請求項8に記載の画像認識方法。
  10. 前記2つの画素の画素値の領域が、エッジ強度が弱い不安定な領域であるか否かを判定する安定領域判定工程をさらに有し、
    前記符号化コード生成工程は、前記安定領域判定工程により、前記2つの画素の画素値の領域が、エッジ強度が弱い不安定な領域であると判定された場合であって、当該2つの画素の画素値の一方から他方を引いた値が、第1の閾値から第2の閾値までの間にある場合に、当該2つの画素の画素値のペアに対応するコードとして複数のコードを生成することを特徴とする請求項8又は9に記載の画像認識方法。
  11. 前記符号化コード生成工程は、前記2つの画素の画素値のペアに対応するコードを1つずつ組み合わせたものを前記符号化コードとして生成することを特徴とする請求項8〜10の何れか1項に記載の画像認識方法。
  12. 前記符号化コード生成工程は、前記ヒストグラム生成領域における基準となる画素とその他の画素を前記2つの画素として、当該2つの画素の画素値のペアに対応するコードを生成することを、前記ヒストグラム生成領域における前記その他の画素の全てについて行った結果から、前記2つの画素の画素値のペアに対応するコードを生成することを特徴とする請求項8〜11の何れか1項に記載の画像認識方法。
  13. 前記符号化コード生成工程により生成される前記符号化コードは、LBP(Local Binary Pattern)コードであることを特徴とする請求項8〜12の何れか1項に記載の画像認識方法。
  14. 前記物体は、顔であることを特徴とする請求項8〜13の何れか1項に記載の画像認識方法。
  15. 請求項8〜14の何れか1項に記載の画像認識方法の各工程をコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2013171604A 2013-08-21 2013-08-21 画像認識装置、画像認識方法、及びコンピュータプログラム Active JP6202937B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013171604A JP6202937B2 (ja) 2013-08-21 2013-08-21 画像認識装置、画像認識方法、及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013171604A JP6202937B2 (ja) 2013-08-21 2013-08-21 画像認識装置、画像認識方法、及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2015041226A JP2015041226A (ja) 2015-03-02
JP6202937B2 true JP6202937B2 (ja) 2017-09-27

Family

ID=52695355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013171604A Active JP6202937B2 (ja) 2013-08-21 2013-08-21 画像認識装置、画像認識方法、及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6202937B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10755080B2 (en) 2017-05-23 2020-08-25 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9858498B2 (en) * 2015-09-23 2018-01-02 Qualcomm Incorporated Systems and methods for incremental object detection using dual-threshold local binary pattern operators
WO2017056312A1 (ja) 2015-10-02 2017-04-06 富士通株式会社 画像処理プログラムおよび画像処理装置
CN107194364B (zh) * 2017-06-02 2020-08-04 重庆邮电大学 一种基于分治策略的Huffman-LBP多姿态人脸识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217706A (ja) * 2007-03-07 2008-09-18 Tokyo Institute Of Technology ラベリング装置、ラベリング方法及びプログラム
JP2011186595A (ja) * 2010-03-05 2011-09-22 Sony Corp 情報生成装置、物体検出装置、情報生成方法、物体検出方法、およびプログラム
JP5789751B2 (ja) * 2011-08-11 2015-10-07 パナソニックIpマネジメント株式会社 特徴抽出装置、特徴抽出方法、特徴抽出プログラム、および画像処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10755080B2 (en) 2017-05-23 2020-08-25 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium

Also Published As

Publication number Publication date
JP2015041226A (ja) 2015-03-02

Similar Documents

Publication Publication Date Title
US11113587B2 (en) System and method for appearance search
JP5361530B2 (ja) 画像認識装置、撮像装置及び画像認識方法
US10846554B2 (en) Hash-based appearance search
JP4372051B2 (ja) 手形状認識装置及びその方法
JP5272215B2 (ja) ノイズ及び環境による影響を抑制することが可能な顔認識方法
US8929611B2 (en) Matching device, digital image processing system, matching device control program, computer-readable recording medium, and matching device control method
JP6907774B2 (ja) 物体検出装置、物体検出方法、およびプログラム
JP5483961B2 (ja) 画像処理装置、被写体判別方法、プログラム及び記憶媒体
KR20170047167A (ko) 전자 장치가 동영상의 얼굴의 인상을 변형하는 방법 및 그 전자 장치
JP6351243B2 (ja) 画像処理装置、画像処理方法
JP6202937B2 (ja) 画像認識装置、画像認識方法、及びコンピュータプログラム
JP6157165B2 (ja) 視線検出装置及び撮像装置
JP4903192B2 (ja) 顔検出装置
WO2012046426A1 (ja) 物体検出装置、物体検出方法および物体検出プログラム
JP2013030104A (ja) 特徴量抽出装置及び特徴量抽出方法
US8666176B2 (en) Object recognition apparatus and object recognition method
US8526738B2 (en) Information processing apparatus including a plurality of multi-stage connected information processing units
Kartheek et al. Local optimal oriented pattern for person independent facial expression recognition
JP2013218605A (ja) 画像認識装置、画像認識方法及びプログラム
KR101473991B1 (ko) 얼굴 검출 방법 및 그 장치
JP2013011950A (ja) 画像処理装置、画像処理方法及びプログラム
KR102243466B1 (ko) 이미지 내 동물의 눈 영역을 검출하는 방법 및 장치
KR101621157B1 (ko) Mct를 이용한 얼굴 인식 장치 및 그 방법
JP5625196B2 (ja) 特徴点検出装置、特徴点検出方法、特徴点検出プログラム及び記録媒体
Priya et al. Face detection using CbCr color model in video

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160812

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170829

R151 Written notification of patent or utility model registration

Ref document number: 6202937

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151