JP5913940B2 - 画像認識装置、画像認識装置の制御方法、およびプログラム - Google Patents

画像認識装置、画像認識装置の制御方法、およびプログラム Download PDF

Info

Publication number
JP5913940B2
JP5913940B2 JP2011264123A JP2011264123A JP5913940B2 JP 5913940 B2 JP5913940 B2 JP 5913940B2 JP 2011264123 A JP2011264123 A JP 2011264123A JP 2011264123 A JP2011264123 A JP 2011264123A JP 5913940 B2 JP5913940 B2 JP 5913940B2
Authority
JP
Japan
Prior art keywords
histogram
image
recognition
bin
image recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011264123A
Other languages
English (en)
Other versions
JP2013117794A (ja
Inventor
雄司 金田
雄司 金田
矢野 光太郎
光太郎 矢野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011264123A priority Critical patent/JP5913940B2/ja
Priority to US13/683,409 priority patent/US9036917B2/en
Publication of JP2013117794A publication Critical patent/JP2013117794A/ja
Application granted granted Critical
Publication of JP5913940B2 publication Critical patent/JP5913940B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • G06V40/175Static expression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/467Encoded features or binary features, e.g. local binary patterns [LBP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Description

本発明は、画像認識装置、画像認識装置の制御方法、およびプログラムに関する。
従来から、人物の顔を含む画像から顔の領域を抽出し、抽出した顔の領域を解析して顔の表情を認識する技術が知られている。このような技術を撮像装置に応用することにより、撮像装置に写った人物が笑顔になったタイミングで顔画像を記録したり、人物の視線がカメラ目線になったタイミングで顔画像を記録したりすることが可能になる。
非特許文献1では、輝度画像から抽出したローカル・バイナリ・パターン(Local Binary Pattern;LBP)からヒストグラムを生成し、このLBPヒストグラムを利用して、顔の表情を認識する技術が提案されている。非特許文献1の技術はヒストグラム特徴を用いることによって画像中の物体の位置ずれを吸収し、ロバスト性を向上させようとしたものである。
C. Shan and T. Gritti, "Learning Discriminative LBP-Histogram Bins For Facial Expression Recognition", In Proc. British Machine Vision. Conference, 2008 P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features", in Proc. Of CVPR, vol.1, pp.511-518, December, 2001 Timothy F. Cootes, Gareth J. Edwards, and Christopher J. Taylor, "Active Appearance Models", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 23, No.6, JUNE 2001 V. Vapnik. "Statistical Learning Theory", John Wiley & Sons, 1998 Dalal and Triggs, "Histograms of Oriented Gradients for Human Detection", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2005 P.Ekman and W.V.Friesen, Facial Action Coding System(FACS): Manual, Palo Alto:Consulting Psychologists Press, 1978 S. Liao, W. Fan, A. Chung, and D. Yeung. Facial expression recognition using advanced local binary patterns, tsallis entropies and global appearance features. Proc. of the IEEE International Conference on Image Processing (ICIP), pages 665--668, 2006
しかしながら、ヒストグラム特徴は一般的に特徴の次元が大きく、特徴の次元が大きくなれば、識別器での処理負荷も大きくなるという問題がある。特徴としてLBPヒストグラム、或いは輝度勾配ヒストグラムを利用する場合、ヒストグラムのビン数が多くなるほど、生成される特徴の次元が大きくなり、識別器での処理負荷が大きくなる。また、ノイズに影響され易いビンは、誤認識の原因になる可能性がある。
上記の課題に鑑み、本発明は、画像認識処理の高精度化および高速化を実現することを目的とする。
上記の目的を達成する本発明に係る画像認識装置は、
画像を取得する画像取得手段と、
前記画像において少なくとも1つの局所領域を設定する領域設定手段と、
前記局所領域から特徴パターンを抽出する特徴抽出手段と、
前記特徴パターンを構成する複数のパターンのそれぞれに対応する複数のビンのうち、前記局所領域の種類に応じて予め定められたビンをヒストグラムの生成に使用するヒストグラムビンとして設定する設定手段と、
前記設定されたヒストグラムビンを使用してヒストグラムを生成する生成手段と、
前記ヒストグラムを用いて画像認識を行う認識手段と、
を備えることを特徴とする。
本発明によれば、画像認識処理の高精度化および高速化を実現することが可能となる。
第1実施形態に係る画像認識装置の全体構成を示す図。 第1実施形態に係る画像認識装置の処理の手順を示すフローチャート。 画像から検出される左右の目、顔、口の重心位置、正規化画像の例を示す図。 笑顔の表情を認識するために必要な口の特徴抽出領域を示す図。 LBPの符号化例を示す図。 LBP符号化後の2進値および10進値を示す図。 笑顔の表情を認識するために重要となるLBPを示す図。 認識対象及び特徴抽出領域に応じて設定されるビン番号とLBPを示す図。 笑顔の表情を認識するために設定された口の詳細分割領域におけるヒストグラム生成を示す図。 第2実施形態に係る画像認識装置の全体構成を示す図。 第2実施形態に係る画像認識装置の処理の手順を示すフローチャート。 より細かな特徴点検出結果例を示す図。 視線認識に必要な顔の特徴抽出領域を示す図。 顔の向きを認識するために重要となる顔の輪郭エッジと勾配の方向を示す図。 認識対象及び特徴抽出領域に応じて設定されるビン番号と方向範囲とを示す図。 視線認識に必要な目の特徴抽出領域を示す図。 目の向きを認識するために重要となる瞳の輪郭エッジと勾配の方向とを示す図。 特徴ベクトルを生成する際に使用するヒストグラムと使用しないヒストグラムとを示す図。 年齢及び性別推定に必要な特徴抽出領域を示す図。 年齢及び性別推定で使用する特徴抽出領域に応じて設定されるビン番号とLBPとを示す図。 画像認識処理の際に使用するヒストグラムのビンを、統計量に基づいて決定するヒストグラムビン決定部を備えた画像認識装置の全体構成を示す図。 統計量に基づいたLBPと、そのビット数とを決定する処理の手順を示すフローチャート。 顔内部のある領域に対する統計量と、LBPとして採用するか否かを決定するための閾値とを示す図。 上位3ビットが同じ値のLBPを示す図。
(第1実施形態)
第1実施形態では、認識する対象を人物の顔の表情属性とし、所定の表情を認識した場合に自働撮影を実施し、メモリなどに画像を記録する例について説明する。
まず図1を参照して、第1実施形態に係る画像認識装置10の全体構成を説明する。画像認識装置10は、画像取得部100と、顔検出部110と、画像正規化部120と、領域設定部130と、特徴抽出部140と、ヒストグラムビン設定部150と、ヒストグラム生成部160と、ヒストグラム連結部170と、表情認識部180と、パラメータ記憶部190とを備える。これらの各処理部は、不図示のCPUによりその動作を制御される。
画像取得部100は、レンズなどの集光素子、光を電気信号に変換するCMOSやCCDなどの撮像素子、アナログ信号をデジタル信号に変換するAD変換器を通過することによって、デジタル画像を取得する。また、間引き処理等を行うことによって、低解像度画像にも変換可能である。例えば、VGA(640×480[pixel])やQVGA(320×240[pixel])に変換した画像を取得することも可能である。
顔検出部110は、画像取得部100により取得された画像に対して顔検出処理を実行する。本実施形態では、非特許文献2に開示される顔検出処理技術を使用する。画像正規化部120は、検出された顔の大きさが所定のサイズで、かつ顔の向きが正立するように、顔領域の切り出しとアフィン変換を行い、正規化画像を生成する。
領域設定部130は、画像正規化部120により生成された正規化画像に対して、検出された顔の複数の特徴点を使用して複数の局所領域を設定する。なお、より正確に局所領域を設定するために、更に非特許文献3のような技術を使用して、より細かな特徴点を抽出し、当該特徴点に基づいて局所領域を設定するようにしてもよい。
特徴抽出部140は、領域設定部130により設定された複数の領域のそれぞれから、非特許文献1のようにローカル・バイナリ・パターン(Local Binary Pattern;LBP)特徴を抽出する。
ヒストグラムビン設定部150は、LBP特徴(特徴パターン)を構成する複数のパターンのそれぞれに対応する複数のビンのうち、局所領域の種類に応じて予め定められたビンをヒストグラムの生成に使用するビンとして設定する。ヒストグラムビン設定部150による設定処理の詳細については後述する。ヒストグラム生成部160は、領域設定部130により設定された局所領域に対して、ヒストグラムビン設定部150により設定されたヒストグラムビンと、特徴抽出部140により抽出されたLBP画像とを使用して、ヒストグラムを生成する。ヒストグラム連結部170は、ヒストグラム生成部160により生成されたすべてのヒストグラムの連結処理を行い、1つの特徴ベクトルを生成する。
表情認識部180は、ヒストグラム連結部170により生成された特徴ベクトルを使用して、表情認識を行う。
パラメータ記憶部190は、統計量を採取することによって予め決定される、顔内部の領域に応じて使用すべきLBP特徴を構成するビンと、ビン番号とをペアにしてパラメータとして記憶している。ヒストグラムビン設定部150は、このパラメータ記憶部190に記憶されている情報に基づいて、ヒストグラムを生成するために必要なビンとして設定する処理を行う。
次に、図2のフローチャートを参照して、本実施形態に係る画像認識装置10の処理の手順を説明する。
ステップS1000において、画像取得部100は、画像データを取得する。ステップS1100において、顔検出部110は、ステップS1000で取得した画像に対して顔検出処理を実行する。ステップS1100での顔検出処理により、例えば図3の左側に示されるような左右の眼の中心座標(x,y)1110、1111と、顔の中心座標(x,y)1112、口の中心座標(x,y)1113を取得することができる。
ステップS1200において、顔検出部110は、顔が検出されたか否かを判定する。顔が検出されたと判定された場合(S1200;YES)、ステップS1300へ進む。一方、顔が検出されていないと判定された場合(S1200;NO)、ステップS1000へ戻る。ステップS1300において、顔検出部110は、検出された複数の顔の中から1つの顔を選択する。
ステップS1400において、画像正規化部120は、ステップS1100で得られた図3の顔の中心座標(x,y)1112と、左右の眼の中心座標(x,y)1110、1111とを使用して、顔の大きさが所定のサイズとなり、かつ顔の向きが正立するように、顔領域の切り出しとアフィン変換とを行い、正規化画像1114を生成する。例えば、左右の眼の中心座標(x,y)1110、1111から2点間の距離と傾きを算出し、夫々アフィン変換におけるスケーリング、回転量として使用すればよい。
ステップS1500において、領域設定部130は、ステップS1400で生成した正規化画像1114に対して、ステップS1100で検出した図3の顔の中心座標(x,y)1112と、左右の眼の中心座標(x,y)1110、1111と、口の中心座標(x,y)1113とを使用して、複数の局所領域を設定する。
例えば、表情の一例である笑顔を検出する場合には、目や口の形状、頬のシワを捉えることが非常に重要となる。そのため、図4に示されるように、顔の中心座標(x,y)1112と、左右の眼の中心座標(x,y)1110、1111、口の中心座標(x,y)1113を使用して、複数の局所領域1116、局所領域1117、局所領域1118を設定する。局所領域1116は、眼に関する局所領域である。局所領域1117は、頬に関する局所領域である。局所領域1118は、口に関する局所領域である。また、笑顔以外の様々な顔の表情を検出する場合には、非特許文献6に開示される技術を用いて、顔内部の動きに対応する局所領域を設定するようにしてもよい。
ステップS1600において、特徴抽出部140は、ステップS1500で設定された局所領域1116乃至局所領域1118のそれぞれに対して、非特許文献1のようにローカル・バイナリ・パターン(Local Binary Pattern;LBP)特徴を抽出する。なお、LBP特徴を抽出する基本的な方法は、注目画素と、注目画素に近接する8近傍の画素値を夫々大小比較する方式である。この他にも、非特許文献7に記載のように注目画素から所定画素離れた画素値を使用する方法など、LBP特徴を抽出する様々な方法が存在するが、何れの手法を使用しても構わない。本実施形態では、中央画素に近接する8近傍の画素値を夫々大小比較する基本的な方式を使用する。まずは、中央画素と周囲8近傍の画素値の夫々とを大小比較することで2値符号化処理を行う。つまり、図5(a)および(b)に示されるように、中央画素の周囲8近傍のうち、ある画素値が中央画素の画素値以上であれば1、そうでなければ0とする。図5(a)では、左上の画素値が4であり、中央画素の画素値が5であるため、2値符号化処理の結果は0となる。図5(b)では、左上の画素値が6であり、中央画素の画素値が5であるため、2値符号化処理の結果は1となる。この操作を周囲8画素のそれぞれに対して行う。そして、図6のように、所定画素を最上位ビットとして、周囲8近傍の値を連結することで、8ビットの2進値を作成する。なお、どの画素値を最上位ビットとして設定しても構わないが、図6の例では、中央画素の左上の画素を最上位ビットとして時計回りに値を連結している。このような処理を実施することで、LBP特徴を抽出することができる。図6の例では、2進値は、00011110であり、10進値は30である。
ステップS1700において、ヒストグラムビン設定部150は、LBP特徴を構成する複数のパターンのそれぞれに対応する複数のビンのうち、局所領域の種類に応じて予め定められたビンをヒストグラムの生成に使用するビンとして設定する。以下では、ステップS1700におけるビンの設定方法について説明する。
ステップS1600で抽出したLBP特徴は8ビットである。そのため、LBPの特徴パターンとしては0から255までの256通り出現する。そのため、8ビットすべてのLBPの特徴パターンをヒストグラムに使用する場合には256通りのヒストグラムビンが必要になる。
しかし、先に述べたように、笑顔を検出する場合には、目や口の形状、頬のシワを捉えることが非常に重要である。例えば、図4において口の形状を捉える局所領域1118では、図7に示されるような水平方向のエッジ1119や斜め方向のエッジ1120、1121が重要である。そのため、口の形状を捉える局所領域1118では、8ビットのすべてのLBP特徴を使用してヒストグラムを生成するのではなくて、図7に示される5つのLBP特徴だけに限定する。目や頬のシワに対しても同様に、笑顔を検出するために重要となるLBP特徴だけを使用して、ヒストグラムを生成する。図8は、認識対象を笑顔とし、ヒストグラムを生成する顔内部の領域に応じたLBP特徴を表として表現したものである。図7の斜め方向のエッジ1120のLBP特徴10001111および00000111は、双方とも斜めエッジを表わすパターンであり、ほぼ同一の特徴と考えても良い。そのため、本実施形態では、LBP特徴10001111と00000111とを同一のビンに加算するようにしている。但し、別々のビンに設定するようにしても良く、これに限らない。
このように、認識対象やヒストグラムを生成する顔内部の領域に応じて、ヒストグラムのビンを限定することで、ヒストグラムのビン数を削減することができる。ヒストグラムビン数の削減は、ヒストグラムによって生成される特徴ベクトルの次元を削減することが可能となり、ヒストグラム生成処理よりも後段で行われる処理負荷を軽減することが可能となる。
なお、認識対象やヒストグラムを生成する顔内部の領域に応じて使用するLBP特徴は、予め統計量を採取することによって決定する。例えば、笑顔を認識する場合には、予め収集した多数の笑顔画像において、その領域での出現頻度が閾値より高い特徴パターンに対応するビンを設定するようにする。このように予め認識処理に効果のあるビンを統計量に基づいて設定することにより、ノイズに影響され易い誤認識の原因になるビンの影響を回避することもできるので、精度向上にも効果がある。
このように統計量から決定したLBPの特徴パターンは、ビン番号とペアにしてパラメータ記憶部190にパラメータとして記憶しておく。そして、実際に画像認識処理を行う際に、ステップS1700のヒストグラムビン設定処理において、認識対象やヒストグラムを生成する顔内部の領域に応じて、パラメータ記憶部190に記憶されたパラメータを読み込むことで、ヒストグラムビンが設定される。
笑顔以外の表情、例えば驚きの表情を認識したい場合には、既に説明した笑顔特有のLBP特徴に加えて、驚きの表情に特有のLBP特徴を予め記憶しておくようにすれば良い。例えば、驚きの表情の際には、口は縦方向に開くので、縦方向のエッジを表現するLBP特徴を記憶する。
ステップ1800において、ヒストグラム生成部160は、ステップS1500で設定された局所領域に対して、ステップS1700で設定されたヒストグラムビンと、ステップS1600で抽出されたLBP画像とを使用して、図9(a)に示されるようなヒストグラムを生成する。
なお、表情の微妙な変化を捉えるために、ステップS1500で設定された局所領域をさらに複数のブロックに領域分割し、図9(b)に示されるように、より細かい領域でヒストグラム生成を行うようにしても良い。但し、領域が増加すると、ヒストグラムビンの総数も比例して増加するので、本実施形態で説明するような方法でヒストグラムビンを削減することによって、精度を向上させつつ後段の処理負荷を軽減させることが可能となる。
設定されたヒストグラムビンに該当しないLBP特徴のパターンに対しては、そのまま廃棄してもよく、もしくは、ステップS1700で設定されたヒストグラムビンの他にもう1つのビンを用意し、そのビンに加算してもよい。
ステップS1900において、ヒストグラム生成部160は、ステップS1500で設定された顔内部のすべての局所領域に対してヒストグラム生成処理を実施したか否かを判定する。顔内部のすべての領域に対してヒストグラムを生成したと判定された場合(S1900;YES)、ステップS2000へ進む。一方、顔内部のすべての領域に対してヒストグラムを生成していないと判定された場合(S1900;NO)、ステップS1500へ戻り、認識対象に必要な新たな領域を設定する。
ステップS2000において、ヒストグラム連結部170は、ステップS1800で生成したすべてのヒストグラムの連結処理を行い、1つの特徴ベクトルを生成する。なお、目や口などの夫々の領域から生成したヒストグラムの連結方法は、そのまま単純に連結処理をするのではなく、夫々の領域毎にヒストグラムを正規化した上で連結処理をするようにしても良い。更に、複数枚のフレーム画像から生成した特徴ベクトルを連結するようにしても良い。
ステップS2100において、表情認識部180は、ステップS2000で生成した特徴ベクトルを使用して、表情認識を行う。ここでは、例えば、非特許文献4のSupport Vector Machine(SVM)のような予め学習可能な表情認識器を用意しておく。つまり、笑顔の表情を認識する場合には、笑顔とそれ以外の特徴ベクトル群を使用して予め学習しておくようにする。非特許文献4のような技術を利用して、表情認識器を構成する場合、表情認識器の内部で実施される処理は、内積演算である。そのため、ステップS2000で生成される特徴ベクトルの次元数を小さくすれば、表情認識器における処理負荷を小さくすることが可能となる。更に、ステップS2000で生成される特徴ベクトルに対して、ステップS2100の処理の前段にPCA(主成分分析)などによる次元削減処理を実施した場合でも、基本的には内積演算であるので、処理負荷を小さくすることが可能となる。
笑顔だけではなくて、複数の表情の中から1つの表情を認識する場合には、夫々の表情を認識する表情認識器を用意しておき、Tree構造のように配置することによっても対応可能である。また、特徴ベクトルを複数の表情認識器に入力し、出力の最も高い表情認識器に対応する表情を、その時の表情として認識するようにしても良い。このように1つの認識器だけではなく、複数の認識器を構成する場合にも、処理負荷を大幅に削減することが可能となる。
ステップS2200において、顔検出部110は、ステップS1100で検出したすべての顔に対して処理が実行されたか否かを判定する。すべての顔に対して処理が実行されたと判定された場合(S2200;YES)、処理を終了する。一方、すべての顔に対して処理が実行されていないと判定された場合(S2200;NO)、ステップS1300へ戻り、顔検出部110は、処理が実行されていない顔を選択する。そして当該顔に対して以降同様の処理が実行される。
以上、認識対象やヒストグラムを生成する顔内部の領域に応じて、LBP特徴から生成されるヒストグラムのビン数を削減する方法について説明した。これにより、ヒストグラムによって生成される特徴ベクトルの次元を削減することが可能となり、ヒストグラム生成処理よりも後段で行われる処理負荷を軽減することが可能となる。
また、本実施形態のように予め認識に効果のあるビンを統計量に基づいて設定することは、処理負荷の軽減のみでなく、ノイズに影響され易い誤認識の原因になるビンの影響を回避することができるので、精度向上にも効果がある。
なお、本実施形態では、ステップS1600で抽出する特徴として、LBP特徴を利用しているが、非特許文献5のように輝度勾配強度を縦軸、輝度勾配方向を横軸としたヒストグラム、更には色など様々な特徴から生成したヒストグラム、またはこれらの組み合わせであってもよい。
また、認識対象についても本実施形態では笑顔などの表情としたが、顔の視線方向、年齢、性別、人種などの属性の推定、更には物体の位置検出に対して適用可能である。また、非特許文献5のように画像からの人体の検出に応用してもよい。
本実施形態によれば、ヒストグラムのビン数削減により、画像認識処理の高速化を実現することが可能となる。また、ノイズに影響され易い誤認識の原因になるビンの影響を回避することができるので、精度向上にも効果がある。
(第2実施形態)
第2実施形態では、第1実施形態とは異なり、認識する対象を視線属性とし、視線がカメラ方向を向いた場合に、自働撮影を実施し、メモリなどに画像を記録する例について説明する。
まず図10を参照して、第2実施形態に係る画像認識装置20の全体構成を説明する。画像認識装置20は、認識内容選択部200と、画像取得部210と、顔検出部220と、画像正規化部230と、特徴点検出部240と、領域設定部250と、特徴抽出部260と、ヒストグラムビン設定部270と、ヒストグラム生成部280と、ヒストグラム連結部290と、視線認識部300と、パラメータ記憶部310とを備える。これらの各処理部は、不図示のCPUによりその動作を制御される。
認識内容選択部200は、認識の種類の選択をユーザから受付けることによって、自働撮影を実施する条件設定を行う。画像取得部210は、画像取得部100は、第1実施形態と同様に画像データを取得する。顔検出部220は、第1実施形態と同様に画像取得部210により取得された画像に対して顔検出処理を実行する。画像正規化部230は、第1実施形態と同様に、顔検出部220により検出された画像から正規化画像を生成する。特徴点検出部240は、画像正規化部230により生成された正規化画像を利用して目尻や目頭などのより細かな特徴点の検出を行う。
領域設定部250は、人物の視線を認識するために必要な特徴抽出領域の設定を行う。特徴抽出部260は、領域設定部250により設定された顔全体領域の画像に対して、第1実施形態と同様にLBP特徴を抽出する。ヒストグラムビン設定部270は、第1実施形態と同様に、ヒストグラムを生成するために必要なビンの設定を行う。ヒストグラム生成部280は、特徴抽出部260により抽出されたLBP特徴と、ヒストグラムビン設定部270により設定されたヒストグラムビンとに基づいて、ヒストグラムを生成する。ヒストグラム連結部290は、ヒストグラム生成部280により生成された、人物の顔の向きを表わすヒストグラムと、目の向きを表わすヒストグラムとを連結して、特徴ベクトルを生成する。視線認識部300は、人物の視線がカメラ方向を向いているか否かの2値判別処理により、視線を認識する。パラメータ記憶部310は、顔の輪郭のエッジに相当するLBP特徴等、視線を認識するために必要なLBP特徴を局所領域ごとに予め記憶している。
次に、図11のフローチャートを参照して、本実施形態に係る画像認識装置20の処理の手順を説明する。
ステップS3000において、認識内容選択部200は、認識対象の選択を受付けることによって、自働撮影を実施する条件設定を行う。本実施形態では笑顔と視線のいずれかを選択可能であり、例えば、視線認識を選択することで、人物の顔の視線がカメラ方向を向いている場合には、自働撮影を実施するように設定する。
ステップS3100において、画像認識装置20は、自働撮影モードを開始するか否かを判定する。例えば、シャッターボタンが半押し状態となった場合に自働撮影モードが開始される。自働撮影モードを開始すると判定された場合(S3100;YES)、S3200へ進む。一方、自働撮影モードを開始しないと判定された場合(S3100;NO)、S3000へ戻る。
ステップS3200乃至ステップS3500までの各処理は、第1実施形態のステップS1000乃至ステップS1300までの各処理と同様であるため説明を省略する。
ステップS3600において、画像正規化部230は、第1実施形態と同様に正規化画像を生成する。ここでは、特徴点検出部240が使用するための正規化画像を生成する。ステップS3700において、特徴点検出部240は、ステップS3600で生成した正規化画像を利用して、図12に示されるように、目尻や目頭などのより細かな特徴点の検出を行う。特徴点検出方法は、第1実施形態で述べたような手法など様々な手法があり、どの手法を用いても構わないが、ここでは、夫々の特徴点を検出するテンプレートを用意しておき、テンプレートマッチングにより検出する手法を使用する。
ステップS3800において、画像正規化部230は、ステップS3700で検出した特徴点を利用して、顔の大きさが所定のサイズになるようにアフィン変換を実施し、特徴抽出に使用する正規化画像を生成する。
人物の視線認識では、顔の向きと目の向きとから総合して、その人物がどこを見ているかを認識する。そのため、本実施形態では、人物の顔の向きを表わす特徴と、目の向きを表わす特徴とを抽出するが、まずは、図13に示されるような、顔の向きを表わす特徴を抽出するための正規化画像2000を生成する。顔の向きは、画像中における移動量が比較的大きいので、低解像度の正規化画像を生成する。
ステップS3900において、領域設定部250は、人物の視線を認識するために必要な特徴抽出領域の設定を行う。例えば、ステップS3300で検出した左右の目、顔、口の中心位置、もしくはステップS3700で検出した特徴点を利用して、正規化画像2000に対して、顔全体領域を設定する。
ステップS4000において、特徴抽出部260は、ステップS3900で生成した顔全体領域の正規化画像2000に対して、第1実施形態と同様にLBP特徴を抽出する。なお、非特許文献5のように、輝度勾配方向と強度とを算出するような特徴(HOG)でも構わない。
ステップS4100において、ヒストグラムビン設定部270は、ステップS3900で生成した顔全体領域の正規化画像2000に対応するヒストグラムビンを、認識内容選択部200で選択した認識内容に応じて、パラメータ記憶部310に記憶されているヒストグラムビン情報に基づいて選択する。
人物の顔の向きを認識するためには、図14に示されるように顔の輪郭の位置を捉えることが重要である。パラメータ記憶部310には、図14のように顔の輪郭のエッジに相当するLPB特徴が記憶されている。但し、非特許文献5のように、輝度勾配方向と強度とを算出するような特徴(HOG)では、1つ1つのヒストグラムビンは、30度―45度、80度−100度、135度−150度というように幅として設定する。
また、図6に示されるように8近傍すべての画素値を使用し、8ビットのLBPを生成するのではなくて、5ビット、6ビットというように、LBPのビットに対しても限定するようにしても良い。例えば、顔の輪郭に対しては、図15に示されるように、顔の輪郭を捉えるために必要最小限の5近傍の画像値を使用する方法でも構わない。
ステップS4200において、ヒストグラム生成部280は、ステップS4000で算出したLBP特徴と、ステップS4100で設定されたヒストグラムビンとに基づいて、ヒストグラムを生成する。
ステップS4300において、ヒストグラム生成部280は、すべての領域に対してヒストグラムを生成したか否かを判定する。すべての領域に対してヒストグラムを生成したと判定された場合(S4300;YES)、ステップS4400へ進む。一方、すべての領域に対してヒストグラムを生成していないと判定された場合(S4300;NO)、ステップS3600へ戻る。ここまでの処理では、複数の領域のうち、人物の顔の向きを表わすヒストグラムしか生成していないので、ステップS3600に戻って、目の向きを表わすヒストグラム生成について説明する。
再び、ステップS3600において、画像正規化部230は、ステップS3300で検出した左右の目、顔、口の中心位置、もしくは、顔の向きを表わす特徴を抽出する際に検出した特徴点を利用して、ステップS3200で取得した画像から正規化画像を生成する。目(瞳)の動きは、画像中では微小であるため、目(瞳)の動きを敏感に捉えるために、高解像度の正規化画像を生成する。
ステップS3700において、特徴点検出部240は、ステップS3600で生成した高解像度の正規化画像を利用して、図12に示されるように、目尻や目頭などのより細かな特徴点の検出を行う。高解像度の正規化画像に対して再度特徴点を検出することで、より高精度な特徴点検出結果が得られる。但し、処理負荷を軽減するために、高解像度の正規化画像に対して特徴点検出を行わなくても良い。
ステップS3800において、画像正規化部230は、ステップS3700で検出したより高精度な特徴点を利用して、再度、正規化画像を生成する。もし、ステップS3700で特徴点検出を実施しない場合には、ステップS3800で正規化画像を再度生成する必要はない。
ステップS3900において、領域設定部250は、ステップS3600もしくはステップS3800で生成した正規化画像に対して、図16に示されるように特徴抽出領域の設定を行う。図16の例では、特徴抽出領域として目領域の2001、2002が設定されている。
ステップS4000において、特徴抽出部260は、目領域の画像2001、2002に対して、LBP特徴を算出する。
ステップS4100において、ヒストグラムビン設定部270は、ヒストグラムを生成するために必要なビンの設定を行う。具体的には、ヒストグラムビン設定部270は、ステップS3900で設定された目領域に対応するヒストグラムビンを設定する。人物の目の向きを認識するためには、瞳の位置を捉えることが重要である。そのため、本実施形態における人物の目領域に対しては、図17に示されるように瞳の輪郭を捉えるバイナリーパターンをビンとして設定する。
ステップS4200において、ヒストグラム生成部280は、ステップS4000で抽出したLBP特徴と、ステップS4100で設定されたヒストグラムビンとに基づいて、ヒストグラムを生成する。
ステップS4300において、ヒストグラム生成部280は、すべての領域に対してヒストグラムを生成したか否かを判定する。ここまでの説明では、人物の顔の向きと目の向きとを表わすヒストグラムが生成されたので、すべての領域に対してヒストグラムを生成したと判定され(S4300;YES)、ステップS4400へ進む。
ステップS4400において、ヒストグラム連結部290は、ステップS4200で生成した人物の顔の向きを表わすヒストグラムと、目の向きを表わすヒストグラムとを連結して、特徴ベクトルを生成する。なお、ステップS4500へ進む前に、主成分分析などの次元削減を実施するようにしても良い。
ステップS4500において、視線認識部300は、第1実施形態と同様の識別器を用いることによって視線認識を行う。なお、本実施形態では、人物の視線がカメラ方向を向いているか否かの2値判別処理を実施する。そのため、視線認識結果は、人物の視線がカメラ方向を向いているか否かの2値判別結果となる。
ステップS4600において、顔検出部220は、ステップS3300で検出したすべての顔に対して処理が実行されたか否かを判定する。すべての顔に対して処理が実行されたと判定された場合(S4600;YES)、ステップS4700へ進む。一方、すべての顔に対して処理が実行されていないと判定された場合(S4600;NO)、ステップS3500へ戻り、顔検出部220は、処理が実行されていない顔を選択する。そして当該顔に対して以降同様の処理が実行される。ステップS4700において、画像認識装置20は、ステップS4500での視線認識結果に基づいて撮影を実施するか否かを判定する。撮影を実施すると判定された場合(S4700;YES)、ステップS4800へ進む。一方、撮影を実施しないと判定された場合(S4700;NO)、ステップS3200へ戻り、次の画像を取得する。
ステップS4800において、不図示の撮像部は、撮影処理を行い、撮影画像を所定の不揮発性メモリなどに記憶して処理を終了する。
以上、認識対象やヒストグラムを生成する顔内部の領域に応じて、輝度勾配方向と強度とから生成されるヒストグラムにおけるビン数を削減する方法について説明した。これにより、ヒストグラムによって生成される特徴ベクトルの次元を削減することが可能となり、ヒストグラム生成処理よりも後段で行われる処理負荷を軽減することが可能となる。
なお、第1実施形態、第2実施形態では、ヒストグラムを生成する際に使用されるビンを限定して設定するようにした。しかし、LBP値の全パターンのビンを用意しておき、図18のように特徴ベクトルを生成する際に使用するLBP値に対応するビンを選択することで特徴ベクトルの次元を削減するようにしても良い。
(第3実施形態)
第3実施形態では、年齢や性別の属性を推定する点が第1実施形態と異なる。本実施形態に係る画像認識装置の全体構成は第1実施形態と同様である。以下では、第1実施形態で説明したヒストグラムビン設定処理の変形例について説明する。
図19は、年齢や性別を推定する際に、領域設定部130により設定される領域を示している。人は年齢を重ねるにつれて、一般的に顔の局所領域にシワなどが発生する。また、男性と女性とでは、特に顔の輪郭に違いが生じる。そのため、年齢や性別を推定するためには、目尻のシワ領域3001、下瞼付近のシワ領域3002、顔の輪郭領域3003、頬のシワ領域3004を捉えることが非常に重要である。
図20は、目尻、下瞼、頬、輪郭の夫々の領域に対して使用するLBP特徴を示している。目尻や下瞼領域では、主に水平方向のエッジを表現するLBP特徴が設定される。頬領域では、主に斜め方向のエッジを表現するLBP特徴が設定される。輪郭領域では主に垂直方向のエッジを表現するLBP特徴が設定される。
また、年齢や性別を推定する場合など、図19に示されるように多数の領域から特徴を抽出する場合には、領域毎にヒストグラムのビンを限定すると、処理負荷を大幅に軽減することが可能となる。以上のように、年齢や性別の属性を認識対象とし、設定された領域が多数存在する場合にも夫々の領域に応じて、ビンを限定することで処理負荷を軽減することが可能となる。
(第4実施形態)
第1乃至第3実施形態では、局所領域の特徴パターンを構成する複数のパターンにそれぞれ対応する複数のビンのうち、統計量に基づいて予め定められたビンを、ヒストグラムの生成に使用するビンとして設定することを説明した。本実施形態では、ヒストグラム決定部を用いて、画像を取得して画像認識を行う前に統計量に基づいてビンを予め決定する際の具体的な処理を説明する。
図21は、統計量に基づいたヒストグラムのビン決定を行う画像認識装置40の全体構成を示す。図21は、画像取得部400と、顔検出部410と、画像正規化部420と、領域設定部430と、特徴抽出部440と、パラメータ記憶部450と、ヒストグラムビン決定部460と、認識内容選択部470とを備える。画像取得部400、顔検出部410、画像正規化部420、領域設定部430、特徴抽出部440、およびパラメータ記憶部450は、それぞれ第1実施形態の対応する各処理部と同様であり、認識内容選択部470は、第2実施形態の認識内容選択部200と同様であるため、説明を省略する。ヒストグラムビン決定部460は、画像認識を行う前に統計量に基づいてビンを予め決定する。例えば、ヒストグラムビン決定部460は、予め取得された画像の局所領域の種類ごとに、当該局所領域から抽出された特徴パターンを構成する複数のパターンのそれぞれの出現頻度が閾値よりも高いパターンに対応するヒストグラムビンを、予め定められたヒストグラムビンとして決定する。また、ヒストグラムビン決定部460は、特徴パターンを構成する出現頻度が閾値よりも高い複数のパターンのそれぞれについて、当該パターンを示すビット列のうち値が共通のビットを削減してもよい。
次に図22のフローチャートを参照して、ヒストグラムビン決定部460の処理手順を説明する。
ステップS5000において、認識内容選択部470は、認識内容の選択を受付ける。例えば、第1実施形態で説明した笑顔などの表情、第2実施形態で説明した視線、第3実施形態で説明した性別や年齢などの属性である。
ステップS5100において、画像取得部400は、統計量調査に使用する画像群の中から1つの画像データを選択する。
ステップS5200において、領域設定部430は、ステップS5000での認識内容の選択結果に応じて、領域設定を行う。例えば、第1実施形態で説明した笑顔などの表情は、目、頬、口領域の変化を捉える必要がある。そのため、ステップS5000で笑顔が選択された場合には、設定される領域は、目、頬、口領域である。
ステップS5300において、特徴抽出部440は、ステップS5200で設定された領域に対して、LBP特徴を抽出する。
ステップS5400において、特徴抽出部440は、予め決められたすべての画像に対して、LBP特徴を抽出したか否かを判定する。すべての画像に対してLBP特徴を抽出したと判定された場合(S5400;YES)、ステップS5400へ進む。一方、すべての画像に対してLBP特徴を抽出していないと判定された場合(S5400;NO)、ステップS5100へ戻り、画像取得部100は、LBP特徴を抽出していない画像を選択する。
ステップS5500において、ヒストグラムビン決定部460は、予め用意されたすべての画像に対するLBP特徴の統計量を調査する。この統計量調査では、ヒストグラムビン決定部460は、ステップS5200で選択された領域毎にヒストグラムを生成し、出現頻度が閾値より高いLBP特徴を選択する。
例えば、図23は、統計量調査用に用意した画像から抽出した、特定領域のLBP特徴のヒストグラムを示しており、この統計量調査に使用した画像総数の80%を閾値として設定する。そして、閾値を超えたLBP特徴に対応するビンをヒストグラムビンとして設定するためのLBP特徴として採用し、そうでないLBP特徴は採用しないように閾値処理を行う。なお、本実施形態では、画像総数の80%をヒストグラムビンとして設定するためのLBPとして閾値設定しているが、この数字に限られる訳ではない。
ステップS5600において、ヒストグラムビン決定部460は、ステップS5500で決定したLBP特徴を使用して、LBPビット数の決定を行う。例えば、ステップS5500で決定した出現頻度が閾値より高いLBP特徴が、図24に示される3つのパターン00011111、00011100、00011000であるとした場合、最初の3ビットは共通の000(定数)となるため、残りの5ビットに対してのみ演算を行えば良い。つまり、ステップS5500で決定した出現頻度の高いLBP特徴の特定ビットの値が共通(定数)であるならば、その特定ビットを削減する。そのため、図24の3つのパターン00011111、00011100、00011000が選択された領域に対しては、最初の3ビット分を除いた残りの5ビットに対してのみ計算を行う。よって、顔内部の領域に応じて、LBP特徴のビット数は異なる。
このように、ヒストグラムビンとして設定するLBPは、ヒストグラムによる閾値処理と、ビット数の削減処理の2つの処理によって最終的に決定する。なお、ビット数の削減を行うステップ5600の処理は必ずしも必須ではない。
以上のような処理により、ヒストグラムビンとして設定するためのLBP特徴を決定することで、その後の画像認識処理の高速化を実現することが可能となる。
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (10)

  1. 画像を取得する画像取得手段と、
    前記画像において少なくとも1つの局所領域を設定する領域設定手段と、
    前記局所領域から特徴パターンを抽出する特徴抽出手段と、
    前記特徴パターンを構成する複数のパターンのそれぞれに対応する複数のビンのうち、前記局所領域の種類に応じて予め定められたビンをヒストグラムの生成に使用するヒストグラムビンとして設定する設定手段と、
    前記設定されたヒストグラムビンを使用してヒストグラムを生成する生成手段と、
    前記ヒストグラムを用いて画像認識を行う認識手段と、
    を備えることを特徴とする画像認識装置。
  2. 前記認識手段により画像認識を行う認識対象の選択を受け付ける受付手段をさらに備え、
    前記設定手段は、前記受付手段により受け付けられた認識対象について局所領域の種類に応じて予め定められたビンを、ヒストグラムの生成に使用するヒストグラムビンとして設定することを特徴とする請求項1に記載の画像認識装置。
  3. 前記認識対象は、画像中の人物に関する表情、視線、年齢、性別、または人種の属性であることを特徴とする請求項2に記載の画像認識装置。
  4. 前記領域設定手段により設定された前記局所領域の種類ごとに予め定められたビンの情報を記憶する記憶手段をさらに備えることを特徴とする請求項1乃至3の何れか1項に記載の画像認識装置。
  5. 前記特徴パターンは、ローカル・バイナリ・パターン、輝度勾配方向、または色の少なくとも1つであることを特徴とする請求項1乃至4の何れか1項に記載の画像認識装置。
  6. 予め取得された画像の局所領域の種類ごとに、当該局所領域から抽出された特徴パターンを構成する複数のパターンのそれぞれの出現頻度が閾値よりも高いパターンに対応するビンを、前記予め定められたビンとして決定する決定手段をさらに備えることを特徴とする請求項1乃至5の何れか1項に記載の画像認識装置。
  7. 前記決定手段は、前記特徴パターンを構成する前記出現頻度が閾値よりも高い複数のパターンのそれぞれについて、当該パターンを示すビット列のうち値が共通のビットを削減することを特徴とする請求項6に記載の画像認識装置。
  8. 前記局所領域の種類は、前記認識手段により画像認識を行う認識対象における位置であることを特徴とする請求項1乃至7の何れか1項に記載の画像認識装置。
  9. 画像取得手段と、領域設定手段と、特徴抽出手段と、設定手段と、生成手段と、認識手段とを備える画像認識装置の制御方法であって、
    前記画像取得手段が、画像を取得する画像取得工程と、
    前記領域設定手段が、前記画像において少なくとも1つの局所領域を設定する領域設定工程と、
    前記特徴抽出手段が、前記局所領域から特徴パターンを抽出する特徴抽出工程と、
    前記設定手段が、前記特徴パターンを構成する複数のパターンのそれぞれに対応する複数のビンのうち、前記局所領域の種類に応じて予め定められたビンをヒストグラムの生成に使用するヒストグラムビンとして設定する設定工程と、
    前記生成手段が、前記設定されたヒストグラムビンを使用してヒストグラムを生成する生成工程と、
    前記認識手段が、前記ヒストグラムを用いて画像認識を行う認識工程と、
    を有することを特徴とする画像認識装置の制御方法。
  10. 請求項に記載の画像認識装置の制御方法の各工程をコンピュータに実行させるためのプログラム。
JP2011264123A 2011-12-01 2011-12-01 画像認識装置、画像認識装置の制御方法、およびプログラム Expired - Fee Related JP5913940B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011264123A JP5913940B2 (ja) 2011-12-01 2011-12-01 画像認識装置、画像認識装置の制御方法、およびプログラム
US13/683,409 US9036917B2 (en) 2011-12-01 2012-11-21 Image recognition based on patterns of local regions

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011264123A JP5913940B2 (ja) 2011-12-01 2011-12-01 画像認識装置、画像認識装置の制御方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2013117794A JP2013117794A (ja) 2013-06-13
JP5913940B2 true JP5913940B2 (ja) 2016-05-11

Family

ID=48524050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011264123A Expired - Fee Related JP5913940B2 (ja) 2011-12-01 2011-12-01 画像認識装置、画像認識装置の制御方法、およびプログラム

Country Status (2)

Country Link
US (1) US9036917B2 (ja)
JP (1) JP5913940B2 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101671137B1 (ko) * 2012-12-04 2016-10-31 엘지전자 주식회사 영상 촬영 장치 및 그 방법
KR101436369B1 (ko) * 2013-06-25 2014-09-11 중앙대학교 산학협력단 적응적 블록 분할을 이용한 다중 객체 검출 장치 및 방법
JP6166981B2 (ja) * 2013-08-09 2017-07-19 日本放送協会 表情解析装置及び表情解析プログラム
JP6351240B2 (ja) * 2013-11-20 2018-07-04 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP6351243B2 (ja) 2013-11-28 2018-07-04 キヤノン株式会社 画像処理装置、画像処理方法
JP6254836B2 (ja) 2013-11-29 2017-12-27 キヤノン株式会社 画像検索装置、画像検索装置の制御方法およびプログラム
CN104714633A (zh) * 2013-12-12 2015-06-17 华为技术有限公司 一种终端配置的方法及终端
JP6532190B2 (ja) 2014-03-26 2019-06-19 キヤノン株式会社 画像検索装置、画像検索方法
JP6410450B2 (ja) 2014-03-31 2018-10-24 キヤノン株式会社 オブジェクト識別装置、オブジェクト識別方法及びプログラム
JP6365671B2 (ja) 2014-07-24 2018-08-01 富士通株式会社 顔認証装置、顔認証方法および顔認証プログラム
US9444999B2 (en) * 2014-08-05 2016-09-13 Omnivision Technologies, Inc. Feature detection in image capture
US9923004B2 (en) * 2014-09-30 2018-03-20 Qualcomm Incorporated Hardware acceleration of computer vision feature detection
JP2016092513A (ja) * 2014-10-31 2016-05-23 カシオ計算機株式会社 画像取得装置、ブレ軽減方法及びプログラム
US9405965B2 (en) * 2014-11-07 2016-08-02 Noblis, Inc. Vector-based face recognition algorithm and image search system
JP6527421B2 (ja) * 2015-08-04 2019-06-05 日本放送協会 人物認識装置及びそのプログラム
US9734594B2 (en) 2015-08-26 2017-08-15 Electronics Arts Inc. Producing three-dimensional representation based on images of an object
US10169891B2 (en) * 2015-08-26 2019-01-01 Electronic Arts Inc. Producing three-dimensional representation based on images of a person
CN106778444B (zh) * 2015-11-23 2022-02-15 广州华久信息科技有限公司 一种基于多视图卷积神经网络的表情识别方法
EP3232368A1 (en) * 2016-04-14 2017-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Determining facial parameters
CN107545261A (zh) * 2016-06-23 2018-01-05 佳能株式会社 文本检测的方法及装置
TWI622020B (zh) * 2016-09-26 2018-04-21 財團法人成大研究發展基金會 使用二階區域二元圖的分群方法及疊代影像測試系統
US10482336B2 (en) 2016-10-07 2019-11-19 Noblis, Inc. Face recognition and image search system using sparse feature vectors, compact binary vectors, and sub-linear search
KR102615070B1 (ko) * 2016-10-12 2023-12-19 삼성전자주식회사 디스플레이 장치, 및 그 제어방법
US10262187B1 (en) * 2016-11-10 2019-04-16 Synaptics Incorporated Systems and methods for spoof detection based on local binary patterns
JP7085812B2 (ja) 2017-08-02 2022-06-17 キヤノン株式会社 画像処理装置およびその制御方法
US11733780B2 (en) * 2018-03-16 2023-08-22 Veridium Ip Limited System and method for user recognition using motion sensor data
CN109993127A (zh) * 2019-04-03 2019-07-09 浙江口信科技有限公司 一种基于人工智能的人脸图像识别方法
JP6675564B1 (ja) * 2019-05-13 2020-04-01 株式会社マイクロネット 顔認識システム、顔認識方法及び顔認識プログラム
US11526477B2 (en) * 2019-07-31 2022-12-13 Myndshft Technologies, Inc. System and method for on-demand data cleansing
US10949715B1 (en) 2019-08-19 2021-03-16 Neon Evolution Inc. Methods and systems for image and voice processing
US10803646B1 (en) 2019-08-19 2020-10-13 Neon Evolution Inc. Methods and systems for image and voice processing
US10671838B1 (en) * 2019-08-19 2020-06-02 Neon Evolution Inc. Methods and systems for image and voice processing
US10658005B1 (en) 2019-08-19 2020-05-19 Neon Evolution Inc. Methods and systems for image and voice processing
US11244206B2 (en) * 2019-09-06 2022-02-08 Fujitsu Limited Image normalization for facial analysis
JP2021114111A (ja) * 2020-01-17 2021-08-05 Necソリューションイノベータ株式会社 撮像支援装置、撮像支援方法、及びプログラム
US20220101024A1 (en) * 2020-09-30 2022-03-31 Magna Electronics Inc. Vehicular vision system with object classification
US11308657B1 (en) 2021-08-11 2022-04-19 Neon Evolution Inc. Methods and systems for image processing using a learning engine

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58163075A (ja) * 1982-03-20 1983-09-27 Toshiyuki Sakai 2値線図形画像の画質判定法
JP2004295776A (ja) * 2003-03-28 2004-10-21 Minolta Co Ltd 画像認識装置および画像認識プログラム
EP1650711B1 (en) 2003-07-18 2015-03-04 Canon Kabushiki Kaisha Image processing device, imaging device, image processing method
JP5008269B2 (ja) 2005-04-08 2012-08-22 キヤノン株式会社 情報処理装置、情報処理方法
KR100723406B1 (ko) * 2005-06-20 2007-05-30 삼성전자주식회사 국부이진패턴 구별 방법을 이용한 얼굴 검증 방법 및 장치
WO2007016936A1 (en) * 2005-07-29 2007-02-15 Telecom Italia, S.P.A. Automatic biometric identification based on face recognition and support vector machines
KR100745981B1 (ko) * 2006-01-13 2007-08-06 삼성전자주식회사 보상적 특징에 기반한 확장형 얼굴 인식 방법 및 장치
WO2008004710A1 (fr) 2006-07-07 2008-01-10 Canon Kabushiki Kaisha Dispositif de traitement d'image, procédé de traitement d'image, et programme de traitement d'image
KR100866792B1 (ko) * 2007-01-10 2008-11-04 삼성전자주식회사 확장 국부 이진 패턴을 이용한 얼굴 기술자 생성 방법 및장치와 이를 이용한 얼굴 인식 방법 및 장치
JP2009086749A (ja) 2007-09-27 2009-04-23 Canon Inc パターン識別手法、識別用パラメータ学習方法、及び装置
JP5055166B2 (ja) 2008-02-29 2012-10-24 キヤノン株式会社 眼の開閉度判定装置、方法及びプログラム、撮像装置
JP5121506B2 (ja) * 2008-02-29 2013-01-16 キヤノン株式会社 画像処理装置、画像処理方法、プログラム及び記憶媒体
US8131066B2 (en) * 2008-04-04 2012-03-06 Microsoft Corporation Image classification
WO2009130693A2 (en) * 2008-04-21 2009-10-29 Mts Investments Inc. System and method for statistical mapping between genetic information and facial image data
US8331655B2 (en) 2008-06-30 2012-12-11 Canon Kabushiki Kaisha Learning apparatus for pattern detector, learning method and computer-readable storage medium
CN101833749B (zh) * 2009-03-12 2012-03-28 株式会社理光 检测图像中阴影的装置和方法
JP5361530B2 (ja) * 2009-05-20 2013-12-04 キヤノン株式会社 画像認識装置、撮像装置及び画像認識方法
US8406483B2 (en) * 2009-06-26 2013-03-26 Microsoft Corporation Boosted face verification
FI123982B (fi) * 2009-10-09 2014-01-15 Visidon Oy Kasvojen tunnistaminen digitaalisissa kuvissa
US8509482B2 (en) * 2009-12-21 2013-08-13 Canon Kabushiki Kaisha Subject tracking apparatus, subject region extraction apparatus, and control methods therefor
US8917911B2 (en) * 2009-12-31 2014-12-23 Nokia Corporation Method and apparatus for local binary pattern based facial feature localization
JP5447162B2 (ja) * 2010-05-07 2014-03-19 住友電気工業株式会社 移動体識別装置、コンピュータプログラム及び移動体識別方法
US20110293189A1 (en) * 2010-05-28 2011-12-01 Microsoft Corporation Facial Analysis Techniques
JP2012038106A (ja) 2010-08-06 2012-02-23 Canon Inc 情報処理装置、情報処理方法、およびプログラム
JP5675233B2 (ja) 2010-09-09 2015-02-25 キヤノン株式会社 情報処理装置、その認識方法及びプログラム
US8351662B2 (en) * 2010-09-16 2013-01-08 Seiko Epson Corporation System and method for face verification using video sequence
KR101326230B1 (ko) * 2010-09-17 2013-11-20 한국과학기술원 사용자 동적 기관 제스처 인식 방법 및 인터페이스와, 이를 사용하는 전기 사용 장치
JP5701005B2 (ja) 2010-10-15 2015-04-15 キヤノン株式会社 物体検知装置、物体検知方法、監視カメラシステム、およびプログラム
US20120213419A1 (en) * 2011-02-22 2012-08-23 Postech Academy-Industry Foundation Pattern recognition method and apparatus using local binary pattern codes, and recording medium thereof
US8805018B2 (en) * 2011-04-11 2014-08-12 Intel Corporation Method of detecting facial attributes
JP5755012B2 (ja) 2011-04-21 2015-07-29 キヤノン株式会社 情報処理装置、その処理方法、プログラム及び撮像装置
JP5719230B2 (ja) 2011-05-10 2015-05-13 キヤノン株式会社 物体認識装置、物体認識装置の制御方法、およびプログラム
JP5801601B2 (ja) 2011-05-10 2015-10-28 キヤノン株式会社 画像認識装置、画像認識装置の制御方法、およびプログラム
US9082235B2 (en) * 2011-07-12 2015-07-14 Microsoft Technology Licensing, Llc Using facial data for device authentication or subject identification

Also Published As

Publication number Publication date
US9036917B2 (en) 2015-05-19
JP2013117794A (ja) 2013-06-13
US20130142426A1 (en) 2013-06-06

Similar Documents

Publication Publication Date Title
JP5913940B2 (ja) 画像認識装置、画像認識装置の制御方法、およびプログラム
US10783354B2 (en) Facial image processing method and apparatus, and storage medium
US10423848B2 (en) Method, system, and computer-readable recording medium for long-distance person identification
KR102290392B1 (ko) 얼굴 등록 방법 및 장치, 얼굴 인식 방법 및 장치
US8836777B2 (en) Automatic detection of vertical gaze using an embedded imaging device
US8891819B2 (en) Line-of-sight detection apparatus and method thereof
US10304164B2 (en) Image processing apparatus, image processing method, and storage medium for performing lighting processing for image data
US20160140399A1 (en) Object detection apparatus and method therefor, and image recognition apparatus and method therefor
EP1650711A1 (en) Image processing device, imaging device, image processing method
JP6351243B2 (ja) 画像処理装置、画像処理方法
US10079974B2 (en) Image processing apparatus, method, and medium for extracting feature amount of image
US9426375B2 (en) Line-of-sight detection apparatus and image capturing apparatus
JP2012530994A (ja) 半顔面検出のための方法および装置
US11315360B2 (en) Live facial recognition system and method
Weerasekera et al. Robust asl fingerspelling recognition using local binary patterns and geometric features
CN110738607A (zh) 基于人工智能拍摄驾驶证的方法、装置、设备及存储介质
Chen et al. Fast eye detection using different color spaces
JP6101470B2 (ja) 顔表情解析装置および顔表情解析プログラム
JP2013011950A (ja) 画像処理装置、画像処理方法及びプログラム
JP5286574B2 (ja) オブジェクト検出認識装置、オブジェクト検出認識方法、および、プログラム
Jiang et al. Combining background subtraction and temporal persistency in pedestrian detection from static videos
JP4789526B2 (ja) 画像処理装置、画像処理方法
Huang et al. Eye detection based on skin color analysis with different poses under varying illumination environment
US11335123B2 (en) Live facial recognition system and method
Chaw et al. Facial expression recognition using correlation of eyes regions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150918

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160404

R151 Written notification of patent or utility model registration

Ref document number: 5913940

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees