JP2013012190A - ガボールフィルターをブロックガボールフィルターとして近似する方法、及び、プロセッサ上で実行されているアプリケーションプログラムによるアクセスのためのデータ構造を格納するメモリ - Google Patents

ガボールフィルターをブロックガボールフィルターとして近似する方法、及び、プロセッサ上で実行されているアプリケーションプログラムによるアクセスのためのデータ構造を格納するメモリ Download PDF

Info

Publication number
JP2013012190A
JP2013012190A JP2012120988A JP2012120988A JP2013012190A JP 2013012190 A JP2013012190 A JP 2013012190A JP 2012120988 A JP2012120988 A JP 2012120988A JP 2012120988 A JP2012120988 A JP 2012120988A JP 2013012190 A JP2013012190 A JP 2013012190A
Authority
JP
Japan
Prior art keywords
block
gabor
image
gabor filter
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012120988A
Other languages
English (en)
Inventor
J Jones Michael
マイケル・ジェイ・ジョーンズ
Tim K Marks
ティム・ケイ・マークス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2013012190A publication Critical patent/JP2013012190A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

【課題】高速に算出でき、メモリ効率がよく、また優れた正確度を維持する画像記述子の算出手段を提供する。
【解決手段】ガボールフィルタがブロックガボールフィルタとして近似される。ガボールフィルタは数字のマトリックスによって表され、各数字は連続ガボール関数から導出されたサンプルである。ブロックガボールフィルタはブロックのセットに分割される。ガボールフィルタに基づき任意の特定のブロック内の全てのピクセルに同一のフィルタ値が割り当てられる。次に、ブロックガボールフィルタのセットを用いて画像をフィルタリングし、フィルタリングされた画像のセットを得ることにより、画像から特徴を抽出する。フィルタリングされた画像はピクセルの領域に分割され、ピクセルごとにNビットシグネチャが求められる。各領域内のピクセルのNビットシグネチャのヒストグラムが結合され、特徴を形成する。複数の画像の特徴を顔認識に用いることができる。
【選択図】図3

Description

本発明は包括的にはデジタルフィルターに関し、より詳細には、物体認識、顔認識、及び物体追跡のために、画像内の顔等の物体の記述子を求めることに関する。
物体認識及び顔認識は、多くのコンピュータービジョン用途において用いられている。顔は人物を認識するための最も好都合な生体情報(biometric)である。したがって、顔認識は、様々なセキュリティ用途、並びに画像検索用途及びビデオ検索用途において用いられている。
未知の顔の画像を取得し、画像を固定のサイズに正規化及びクロッピングし、顔を一意に特徴付ける役割を果たす記述子を求め、次に該記述子をデータベース(ギャラリー)内の既知の顔の記述子と比較して類似度スコアを得る、基本的な手法が登場した。類似度スコアが特定の既知の顔について所定の閾値を上回る場合、顔はその同じ人物と関連付けられるものとして分類される。
多くの物体認識システムが、画像に適用されたガボールフィルターを用いて顕著な特徴を抽出する。2Dガボールフィルターは、入力平面内の離散ロケーションのグリッド上で2Dガボール関数をサンプリングすることによって得られる数字の2Dマトリックスである。空間領域において、2Dガボール関数はガウス関数とシヌソイド関数との積である。実数領域及び虚数領域における一対の従来の2Dガボール関数の例がそれぞれ図1A及び図1Bに示されている。関数値(図1A及び図1Bにおいて高さで表される)が絶えず変動することに留意されたい。
図1C及び図1Dは、水平平面内で45度回転されたガボール関数を示している。
従来技術において、ガボールフィルターは、エッジを検出し、向きを求めるために画像に通常適用される線形フィルターである。ガボールフィルターは、人間の視覚系におけるいくつかのニューロンの受容野に似ている。したがって、ガボールフィルターはテクスチャの表現及び識別に特に適している。
例えば、1つの従来技術の方法は、局所ガボール二値パターンヒストグラムシーケンス(LGBPHS)を求める。この方法は従来のガボールフィルターを用いる。しかしながら、従来のガボールフィルターを用いるLGBPHS方法は求めるのが低速であり、大量のメモリを必要とする。さらに、LGBPHS法は局所二値パターン(LBP)を用いて該LGBPHS法のヒストグラムをポピュレート(populate)する。LGBPHS記述子は、40個のガボールフィルター対、32ビンヒストグラム、及び8×16=128個のヒストグラム領域を用いる。このため、この方法は、記述子を格納するのに40×32×128=163840バイトを必要とする。
求めるのが高速で、メモリ効率がよく、また優れた正確度を維持する記述子が必要とされている。
画像の記述子が、該画像をブロックガボールフィルターのセットを用いてフィルタリングし、対応するフィルタリングされた画像のセットを得ることによって求められる。ブロックガボールフィルターは、従来のガボールフィルターを近似する。2Dガボールフィルターの入力空間において、フィルターの値が正である領域及びフィルターの値が負である領域は、ピクセルの長方形領域によって良好に近似される。ブロックガボールフィルターは、これらの領域を長方形を用いて近似し、各長方形内でブロックガボールフィルターの値は一定である。
ブロックガボールフィルターのセットを用いて入力画像をフィルタリングして、フィルタリングされた画像のセットを得た後、各フィルタリングされた画像はピクセルの領域に分割される。ピクセルごとに、フィルタリングされた画像内のピクセルの局所近傍に基づいてNビットシグネチャが求められる。次に、領域ごとに、該領域内のピクセルのNビットシグネチャのヒストグラムが構築され、記述子が形成される。好ましい実施の形態では、各ピクセルのNビットシグネチャは勾配極性シグネチャ(gradient polarity signature)であり、Nビット勾配極性シグネチャの各ビットは、ピクセルの局所近傍内のフィルタリングされた画像の勾配値に基づく二進値である。
1つの実施の形態では、元の画像から積分画像が生成され、ブロックガボールフィルタリングされた画像を効率的に求めることが可能になる。いくつかの実施の形態では、ブロックガボールフィルターは0度、45度、90度、及び135度に向けられる。
本発明によるブロックガボールフィルター記述子は、従来技術の顔認識方法とほぼ同じ正確度を、約2桁少ない(約100分の1の)時間で、メモリ要件を20分の1に低減して達成する。
一対の従来のガボール関数のうちの、実数領域における従来のガボール関数の概略図である。 一対の従来のガボール関数のうちの、虚数領域における従来のガボール関数の概略図である。 x軸及びy軸に対し45度に向けられた一対の従来のガボール関数の概略図である。 x軸及びy軸に対し45度に向けられた一対の従来のガボール関数の概略図である。 本発明の実施形態による一対のブロックガボールフィルターのうちの、実数領域におけるブロックガボールフィルターの概略図である。 本発明の実施形態による一対のブロックガボールフィルターのうちの、虚数領域におけるブロックガボールフィルターの概略図である。 本発明の実施形態による、x軸及びy軸に対し45度に向けられた一対のブロックガボールフィルターのうちの、実数領域におけるブロックガボールフィルターの概略図である。 本発明の実施形態による、x軸及びy軸に対し45度に向けられた一対のブロックガボールフィルターのうちの、虚数領域におけるブロックガボールフィルターの概略図である。 本発明の実施形態による、画像の記述子を求める方法のフローチャートである。 本発明の実施形態による、積分画像、及び積分画像を用いて長方形領域内のピクセルの和を求めることの概略図である。 本発明の実施形態によるNビット勾配極性シグネチャを求めるためのピクセルの局所領域の概略図である。 本発明の実施形態によるフィルタリングされた画像の分割の概略図である。 本発明の実施形態による、45度の積分画像、及び45度の積分画像を用いて、45度回転されピクセル化された長方形領域内のピクセルの和を求めることの概略図である。 本発明の実施形態による、基本グリッド(underlying grid)に対し45度の角度にあるピクセル化された長方形の概略図である。 本発明の実施形態による、基本グリッド(underlying grid)に対し45度の角度にあるピクセル化された長方形の概略図である。
本発明の実施形態は、当該技術分野において既知の最良の方法に等しい正確度が得られる画像の記述子を約100分の1の時間量で求めることを可能にする、本発明者らによる実現化に基づいている。記述子は、ブロックガボールフィルターを用いて求められる。
ブロックガボールフィルターは従来のガボールフィルターを近似したものである。ガボールフィルターはブロックのセットに分割される。ここでブロックはピクセル化された長方形である。ガボールフィルターに基づいて、任意の特定のブロックのピクセルに同一のフィルター値が割り当てられ、ガボールフィルターを近似するブロックガボールフィルターが生成される。
ピクセル化された長方形は、基本グリッド(underlying grid)からのピクセルを用いた長方形に対する近似である。基本グリッドが長方形の軸と位置合わせされている場合、近似は正確であり、ピクセル化された長方形は単にピクセルの長方形ブロックである。基本グリッドが長方形の軸と位置合わせされていない場合、ピクセル化された長方形の4つの境界のそれぞれはピクセル化された線分である。図8A及び図8Bはピクセル化された長方形の2つの例を示し、長方形の軸は基本グリッドの軸から45度回転されている。
ブロックガボールフィルターは、入力画像のピクセルに適用される。本発明によるブロックガボールフィルターを入力画像の領域に適用した結果として得られる数値は、フィルターのフットプリントにわたって分布したピクセル化された長方形内のピクセルの和を用いて求められる。従来技術と対照的に、ブロックガボールフィルターは1つ又は複数のピクセル化された長方形ブロックを含む。ここで、ブロック内の全てのピクセルのフィルター値は同じ実数であり、この値はブロックごとに従来のガボールフィルターを近似するように選ばれる。
積分画像、又は「エリア総和テーブル」は、和が求められるピクセル数と無関係に、一定の時間内に長方形内のピクセルの和を求めることを可能にする。本発明者らは、参照より本明細書に援用される米国特許第7,583,823号、同第7,212,651号、同第7,099,510号、同第7,020,337号において積分画像を開示した。積分画像を用いることによって、本発明者らのブロックガボールフィルターが非常に効率的になる。
画像が、ブロックガボールフィルターを用いて、該画像の各ピクセル上にブロックガボールフィルターをセンタリングし、フィルターの各ピクセル化された長方形領域内のピクセルの加重和を求めることによってフィルタリングされる。結果として得られるスカラー値が、その中心ピクセルにおけるブロックガボールフィルターの出力である。好ましい実施形態では、各ピクセル化された長方形領域内のピクセルの和が、入力画像の積分画像表現を用いて効率的に求められる。このフィルタリングプロセスは、従来のガボールフィルターを用いた画像の畳み込みに類似している。
1つの実施形態では、同じスケール及び向きを有し、90度位相がずれている従来の一対のガボールフィルターを近似する一対の2つの別個のブロックガボールフィルターを用いて画像をフィルタリングすることによって、各フィルター値が求められる。90度位相がずれたフィルターは、複素ガボール関数の実数成分及び虚数成分から得られる。最終的なフィルタリングされた画像の各ピクセルにおける単一の値は、該ピクセルにおける2つのフィルタリングされた画像の値の二乗の和の平方根をとることによってそれらの値を結合することにより得られる。
標準的な2D畳み込み等、ブロックガボールフィルターを求める異なる方法を用いることが可能であり、この方法を、グラフィック処理ユニット等の専用ハードウェアを用いて加速することができることに留意されたい。また、ブロックガボールフィルターのうちのいくつかは45度の角度にあり、付加的な45度の積分画像を用いて、45度の角度にあるブロックガボールフィルターを効率的に適用する。換言すれば、1つの実施形態では2つの積分画像が実際に求められる。
図2A及び図2Bは、それぞれ実数領域及び虚数領域における、本発明による一対のブロックガボールフィルターの一例を示している。これらの図において、水平軸は基本グリッドの軸を示し、垂直軸はフィルター値を示す。各ブロックは、長さ軸及び幅軸を有する長方形を近似するピクセル化された長方形であり、ブロックは、長さ軸がシヌソイド関数の定数値の線上に位置するようにシヌソイド関数と位置合わせされている。これらの例では、基本グリッドは長方形の軸と位置合わせされているので、近似は正確であり、ピクセル化された長方形は単にピクセルの長方形ブロックである。
図2C及び図2Dは、それぞれ実数領域及び虚数領域における、x軸及びy軸に対し45度に向けられた本発明による一対のブロックガボールフィルターの一例を示している。これらの図において、水平軸は基本グリッドの軸を示し、垂直軸はフィルター値を示す。各ブロックは、長さ軸及び幅軸を有する長方形を近似するピクセル化された長方形であり、ブロックは、長さ軸がシヌソイド関数の定数値の線上に位置するようにシヌソイド関数と位置合わせされている。これらの例では、基本グリッドは長方形の軸と位置合わせされていないので、ピクセル化された長方形の4つの境界のそれぞれはピクセル化された線分である。
図3は、特に画像が顔の画像であるときの、本発明の一実施形態による画像の記述子を求める方法を示している。記述子は、物体(顔)認識のために用いることができる。しかしながら、本発明によるブロックガボールフィルターは、記述子を求めることが必要な他のコンピュータービジョン用途に用いることができることが理解される。また、本発明は顔を認識することに限定されないことも理解される。本方法のステップは、当該技術分野において既知であるようにメモリ及び入出力インターフェースに接続されたプロセッサ300において実行することができる。
任意選択の前処理ステップにおいて、顔及び特徴の自動検出器を用いて、顔の画像301を固定サイズにクロッピング及び正規化する(310)。
図4に示すように、正規化された入力画像Iから任意選択の積分画像も生成することができる(315)。積分画像
Figure 2013012190
は、入力画像内の、(x,y)の左上の全てのピクセルの和として規定される。
Figure 2013012190
次に、エリアD(図4に示す)内のピクセルの和等、画像Iの長方形エリア内のピクセルの任意の和を、一定時間内に以下のように求めることができる。画像IのエリアA、B、C、及びD内のピクセル値の和を、それぞれA、B、C、及びDによって表す。
Figure 2013012190
積分画像を用いて、0度又は90度に向けられた本発明によるブロックガボールフィルターを用いて画像を効率的にフィルタリングすることができる。
加えて、45度又は135度に向けられたブロックガボールフィルターを効率的に求めるために、45度の積分画像を用いることができる。45度の積分画像
Figure 2013012190
は以下のように規定される。
Figure 2013012190
図7は、ロケーション(x,y)におけるピクセルの左対角方向(diagonally to the left)のピクセルを総和すること、及び本発明によるフィルターが45度又は135度に向けられているときにエリアD内のピクセルの和を求めることを示している。
図8Bは、ピクセル化された長方形を示しており、該ピクセル化された長方形は、基本グリッドからのピクセルを用いた、長方形に対する近似である。基本グリッドが長方形の軸と位置合わせされている場合、近似は正確であり、ピクセル化された長方形は単にピクセルの長方形ブロックである。
一方、基本グリッドが長方形の軸と位置合わせされていない場合、ピクセル化された長方形の4つの境界800のそれぞれはピクセル化された線分である。
図8A及び図8Bは、ピクセル化された長方形の2つの例を示しており、該長方形の軸は基本グリッド801の軸から45度回転されている。
ブロックガボールフィルターが3Dである場合、ブロックはピクセル化された長方形ではなくピクセル化された直方体である。
画像のM個のフィルタリングされたバージョンのセットが生成される(320)。各フィルタリングされた画像は、2つの90度位相がずれた(従来の離散)ガボールフィルターを近似する2つのブロックガボールフィルターを、画像内の各ピクセルを用いて畳み込みすることによって求められる。任意選択で、フィルタリングされた画像の各ピクセルにおける値は、適切な積分画像を用いて効率的に求めることができる。
各ピクセルにおける2つのフィルター値v及びvは、ピクセルごとに大きさ
Figure 2013012190
を求めることによって結合される。ブロックガボールフィルターの異なる対はスケール及び向きが異なり、対の2つのフィルターは位相が異なり、すなわち、これらのフィルターは90度位相がずれたガボールフィルターを近似する。
フィルタリングされた画像ごとに、各ピクセルにおいてNビットシグネチャが求められる(330)。好ましい実施形態では、これはNビット勾配極性シグネチャである。各勾配極性シグネチャは、N個の方向のそれぞれについて各ピクセルにおける方向性局所勾配(directional local gradient)の極性を示す。
図5に示すように、フィルタリングされた画像のピクセルごとに、該ピクセルを取り囲むピクセルの小さな近傍を用いて、該ピクセルにおけるN個の方向性勾配の極性(符号)を推定する。この例において、ピクセルの3×3の近傍を用いて、N個の二進値b,b,...,b(ここではN=3)を以下のように求める。
p1+p5+p9>p2+p3+p6のとき、b=1、
それ以外のとき、b=0 (対角勾配)
p2+p5+p8>p3+p6+p9のとき、b=1、
それ以外のとき、b=0 (垂直勾配)
p1+p2+p3>p4+p5+p6のとき、b=1、
それ以外のとき、b=0 (水平勾配)
ピクセルp5の最終的なNビットの勾配極性シグネチャは、N個のビットを結合したもの、すなわちbである。結合は、特徴ベクトルを求めるための連結とすることができる。代替的に、結合の結果、単一の整数又は実数を得ることができる。
別の実施形態では、Nビットシグネチャは局所二値パターン(LBP)である。局所ガボール二値パターンヒストグラムシーケンス(LGBPHS)が顔認識に適用されてきた。しかしながら、LBPは、本発明によるブロックガボールフィルターとともには用いられてこなかった。LBPの最も単純な形態では、画像は領域に分割され、領域内のピクセルごとに、ピクセルが該ピクセルの8つの近傍のそれぞれと比較される。近傍ピクセルは円に沿って、又は反時計回りに辿られる。中心ピクセルが該ピクセルの近傍よりも大きい場合、該近傍ピクセルに対応するビットが1を割り当てられ、そうでない場合、0を割り当てられる。これによって、局所二値パターンと呼ばれる8ビットの値が得られる。領域内の局所二値パターンのセットを用いてヒストグラムをポピュレートし、該ヒストグラムを正規化し、記述子として結合することができる。例えば、米国特許出願公開第2007/0112699号「Image verification method, medium, and apparatus using a kernel based discriminant analysis with a local binary pattern (LBP)」を参照されたい。
図6に示すように、フィルタリングされた画像はR個の領域のセット、例えばサイズ8×4のピクセルの長方形領域に分割される(340)。本発明の実施形態によって、他のサイズ及び形状の領域も適応(accommodate)させることができること、並びにこれらの領域は、好ましい実施形態におけるように重なっていないこともできるし、重なっていることもできることが理解される。
本発明においては、各画像領域内のNビットシグネチャのヒストグラムを求める(350)。各ヒストグラムは2個のビンを有する。全てのヒストグラムのビンを結合して記述子302を生成する。好ましい実施形態では、この結合は、ビンを連結してベクトルにしたものである。R個の領域が存在し、各領域は2個のビンを有するヒストグラムを有するので、各記述子の長さはB=2Rである。
次に、ヒストグラムの交点を用いて、2つの画像の2つの記述子を比較することができる。
Figure 2013012190
ここで、f及びgは2つの画像の記述子であり、これらの記述子のi番目の要素はそれぞれf及びgによって表され、S(f,g)はベクトルfとベクトルgとの間の類似度スコアであり、関数minによって返される値は、該関数の入力引数の最小値である。類似度スコアを用いて、2つの画像内の顔が類似しているか否かを求めることができる。本発明の実施形態によって、ヒストグラムを比較するための他の類似度関数も適応(accommodate)させることができることが理解される。
本発明による記述子は、限定ではないが、プロセス制御、イベント検出、監視、情報の組織化、物体又は環境のモデリング、物体追跡、物体認識、機械学習、インデックス付け、動き推定、画像復元、コンテンツベースの画像検索、及び姿勢推定等の他の用途にも用いることができる。
従来のガボールフィルターを用いた従来技術による方法LGBPHSは、記述子を格納するのに163840バイトを必要とする。対照的に、本発明によるブロックガボールフィルター記述子は、好ましい実施形態では、8個のブロックガボールフィルター対、8ビンヒストグラム、及び128個のヒストグラム領域を用い、本発明による記述子を格納するのに合計8×8×128=8192バイトとなる。
発明の効果
本発明によるブロックガボールフィルター記述子は、従来技術の顔認識方法とほぼ同じ正確度を、約2桁少ない(約100分の1の)時間で、メモリ要件を20分の1に低減して達成する。

Claims (25)

  1. ガボールフィルターをブロックガボールフィルターとして近似する方法であって、該ガボールフィルターは数字のマトリックスであり、該マトリックスにおいて、各数字は連続ガボール関数から導出されたサンプルであり、該連続ガボール関数は連続ガウス関数とシヌソイド関数との積であり、前記方法は、
    前記ガボールフィルターを、ピクセル化された長方形のブロックのセットに分割するステップと、
    前記ガボールフィルターに基づいて、任意の特定のブロックの前記ピクセルに同一のフィルター値を割り当て、前記ガボールフィルターを近似する前記ブロックガボールフィルターを生成するステップと
    を含み、
    前記ステップはプロセッサにおいて実行される、方法。
  2. 各ブロックは、長さ軸及び幅軸を有する長方形を近似し、前記ブロックは、前記長さ軸が前記シヌソイド関数の定数値の線上に位置するように該シヌソイド関数と位置合わせされる、請求項1に記載の方法。
  3. 前記長さ軸は、前記シヌソイド関数の正のピーク及び負のピークに対応する、請求項2に記載の方法。
  4. 前記ブロックの前記フィルター値は、該ブロックが前記シヌソイド関数の前記正のピークに対応するときに正であり、該ブロックが前記シヌソイド関数の前記負のピークに対応するときに負である、請求項3に記載の方法。
  5. 前記シヌソイド関数は正弦関数である、請求項1に記載の方法。
  6. 前記シヌソイド関数は余弦関数である、請求項1に記載の方法。
  7. 前記ブロックガボールフィルターは2Dである、請求項1に記載の方法。
  8. 前記ブロックガボールフィルターは3Dであり、前記ブロックはピクセル化された直方体である、請求項1に記載の方法。
  9. 前記ピクセル化された長方形は基本グリッドの軸から45度回転されている、請求項1に記載の方法。
  10. 各ブロックは前記セット内の他のブロックから独立している、請求項1に記載の方法。
  11. 前記方法は、ピクセルを含む画像の記述子を求めるステップを更に含み、
    該求めるステップは、
    前記画像を前記ブロックガボールフィルターのセットを用いてフィルタリングして、対応するフィルタリングされた画像のセットを得ることと、
    各フィルタリングされた画像内の各ピクセルの付近の局所近傍からNビットシグネチャを求めることと、
    各フィルタリングされた画像を領域のセットに分割することと、
    各領域ごとに前記Nビットシグネチャのヒストグラムを構築することと、
    前記ヒストグラムを結合して、前記画像の前記記述子を形成すること、
    を含む、請求項1に記載の方法。
  12. 前記NビットシグネチャはNビットの勾配極性シグネチャであり、該Nビットの勾配極性シグネチャの各ビットは、N個の方向のうちの1つについて、前記ピクセルの前記局所近傍における方向性局所勾配の極性を示す、請求項11に記載の方法。
  13. 前記方法は、前記画像から積分画像を生成するステップを更に含み、
    前記フィルタリングは、該積分画像を用いて実行される、
    請求項11に記載の方法。
  14. 前記方法は、前記画像から45度の積分画像を生成するステップを更に含み、
    前記フィルタリングは、該45度の積分画像を用いて実行される、
    請求項11に記載の方法。
  15. 各フィルタリングされた画像は、一対の前記ブロックガボールフィルターを、前記画像を用いて畳み込みすることによって求められる、請求項11に記載の方法。
  16. 前記一対のブロックガボールフィルターは、2つの90度位相がずれたガボールフィルターを近似する、請求項15に記載の方法。
  17. 各ピクセルにおける前記一対のブロックガボールフィルターの出力はv及びvであり、前記方法は、
    Figure 2013012190
    に従って前記出力を結合して、前記フィルタリングされた画像の前記ピクセルの大きさを求めるステップ
    を更に含む、請求項15に記載の方法。
  18. 前記ブロックガボールフィルターの異なる対は、スケール及び向きが異なる、請求項15に記載の方法。
  19. 前記記述子は、下記数式により、ヒストグラムの交点を用いることによって、別の画像の前記記述子と比較され、
    Figure 2013012190
    ここで、ベクトルf及びgは前記2つの画像の前記記述子であり、fは該ベクトルfのi番目の要素を表し、gは前記ベクトルgのi番目の要素を表し、Bは各ベクトルf及びg内の要素数であり、S(f,g)は前記ベクトルfと前記ベクトルgとの間の類似度スコアであり、関数minは最小値を返す、請求項11に記載の方法。
  20. 前記類似度スコアを用いて前記2つの画像の類似度を求める、請求項19に記載の方法。
  21. 前記方法は、前記画像を正規化及びクロッピングするステップを更に含む、請求項11に記載の方法。
  22. 前記画像は顔の画像である、請求項11に記載の方法。
  23. 前記記述子は顔認識に用いられる、請求項11に記載の方法。
  24. 前記結合は、前記ヒストグラムを連結し、前記記述子はベクトルである、請求項11に記載の方法。
  25. プロセッサ上で実行されているアプリケーションプログラムによるアクセスのためのデータ構造を格納するメモリであって、
    該データ構造はガボールフィルターをブロックガボールフィルターとして近似し、
    前記メモリは、
    前記メモリ内に格納され、前記ガボールフィルターを表す数字のマトリックスであって、各数字は連続ガボール関数から導出されたサンプルであり、該連続ガボール関数は連続ガウス関数とシヌソイド関数との積である、数字のマトリックスと、
    前記メモリ内に格納されたブロックのセットであって、該ブロックは前記ガボールフィルターから分割された、ピクセル化された長方形であり、前記ガボールフィルターに基づいて、任意の特定のブロックの前記ピクセルに同一のフィルター値が割り当てられる、ブロックのセットと
    を含む、メモリ。
JP2012120988A 2011-06-28 2012-05-28 ガボールフィルターをブロックガボールフィルターとして近似する方法、及び、プロセッサ上で実行されているアプリケーションプログラムによるアクセスのためのデータ構造を格納するメモリ Pending JP2013012190A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/171,170 US20130004028A1 (en) 2011-06-28 2011-06-28 Method for Filtering Using Block-Gabor Filters for Determining Descriptors for Images
US13/171,170 2011-06-28

Publications (1)

Publication Number Publication Date
JP2013012190A true JP2013012190A (ja) 2013-01-17

Family

ID=47390740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012120988A Pending JP2013012190A (ja) 2011-06-28 2012-05-28 ガボールフィルターをブロックガボールフィルターとして近似する方法、及び、プロセッサ上で実行されているアプリケーションプログラムによるアクセスのためのデータ構造を格納するメモリ

Country Status (2)

Country Link
US (1) US20130004028A1 (ja)
JP (1) JP2013012190A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014203135A (ja) * 2013-04-01 2014-10-27 キヤノン株式会社 信号処理装置、信号処理方法、及び、信号処理システム
JP2018501675A (ja) * 2014-09-30 2018-01-18 クアルコム,インコーポレイテッド センサ素子アレイにおける特徴計算
US10614332B2 (en) 2016-12-16 2020-04-07 Qualcomm Incorportaed Light source modulation for iris size adjustment
US10984235B2 (en) 2016-12-16 2021-04-20 Qualcomm Incorporated Low power data generation for iris-related detection and authentication
US11068712B2 (en) 2014-09-30 2021-07-20 Qualcomm Incorporated Low-power iris scan initialization

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8723868B2 (en) * 2010-09-23 2014-05-13 General Electric Company Systems and methods for displaying digitized waveforms on pixilated screens
CN106961621A (zh) * 2011-12-29 2017-07-18 英特尔公司 使用化身的通信
CN104170318B (zh) 2012-04-09 2018-06-01 英特尔公司 使用交互化身的通信
WO2014176485A1 (en) * 2013-04-26 2014-10-30 West Virginia High Technology Consortium Foundation, Inc. Facial recognition method and apparatus
CN104112152A (zh) * 2013-10-30 2014-10-22 北京安捷天盾科技发展有限公司 二维码生成装置、人像识别装置和身份验证装置
CN103679708B (zh) * 2013-11-28 2016-06-08 河海大学 一种环形lbp纹理生成方法
CN104680190B (zh) * 2013-11-29 2018-06-15 华为技术有限公司 目标检测方法及装置
JP6431044B2 (ja) * 2014-03-25 2018-11-28 富士通フロンテック株式会社 生体認証装置、生体認証方法、及びプログラム
EP3125192B1 (en) 2014-03-25 2023-05-10 Fujitsu Frontech Limited Biometric authentication device, biometric authentication method, and program
EP3125194B1 (en) * 2014-03-25 2021-10-27 Fujitsu Frontech Limited Biometric authentication device, biometric authentication method, and program
EP3125193B1 (en) * 2014-03-25 2020-12-23 Fujitsu Frontech Limited Biometric authentication device, biometric authentication method, and program
CN104021397A (zh) * 2014-06-13 2014-09-03 中国民航信息网络股份有限公司 人脸识别比对方法及装置
WO2016101131A1 (en) 2014-12-23 2016-06-30 Intel Corporation Augmented facial animation
US10113877B1 (en) * 2015-09-11 2018-10-30 Philip Raymond Schaefer System and method for providing directional information
KR102407624B1 (ko) * 2015-10-06 2022-06-10 삼성전자주식회사 전자 장치의 영상 처리 방법 및 그 전자 장치
CN105426446A (zh) * 2015-11-06 2016-03-23 西安电子科技大学 Gabor-Zernike特征在医学图像检索中的应用
WO2017101094A1 (en) 2015-12-18 2017-06-22 Intel Corporation Avatar animation system
KR101993729B1 (ko) * 2017-02-15 2019-06-27 동명대학교산학협력단 다중채널 가버 필터와 중심대칭지역 이진 패턴기반 얼굴인식기술
CN107392183B (zh) * 2017-08-22 2022-01-04 深圳Tcl新技术有限公司 人脸分类识别方法、装置及可读存储介质
CN107589449B (zh) * 2017-08-29 2020-04-28 电子科技大学 基于曲线Gabor滤波的三维数据断层增强方法
CN107798308B (zh) * 2017-11-09 2020-09-22 一石数字技术成都有限公司 一种基于短视频训练法的人脸识别方法
CN110111711A (zh) * 2019-04-30 2019-08-09 京东方科技集团股份有限公司 屏幕的检测方法及装置、计算机可读存储介质
CN110462630A (zh) * 2019-05-27 2019-11-15 深圳市汇顶科技股份有限公司 用于人脸识别的光学传感器、装置、方法和电子设备
CN110956653B (zh) * 2019-11-29 2021-05-04 中国科学院空间应用工程与技术中心 相关滤波器与运动估计融合的卫星视频动态目标追踪方法
CN111340752B (zh) * 2019-12-04 2024-08-06 京东方科技集团股份有限公司 屏幕的检测方法、装置、电子设备及计算机可读存储介质
CN111353472B (zh) * 2020-03-30 2023-04-07 蚌埠学院 一种基于LBP和Gabor方向韦伯局部描述子的指静脉识别方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100723406B1 (ko) * 2005-06-20 2007-05-30 삼성전자주식회사 국부이진패턴 구별 방법을 이용한 얼굴 검증 방법 및 장치
US7583823B2 (en) * 2006-01-11 2009-09-01 Mitsubishi Electric Research Laboratories, Inc. Method for localizing irises in images using gradients and textures
EP1850270B1 (en) * 2006-04-28 2010-06-09 Toyota Motor Europe NV Robust interest point detector and descriptor
CN101796550B (zh) * 2007-09-07 2012-12-12 光荣株式会社 纸张类识别装置和纸张类识别方法
US8004576B2 (en) * 2008-10-31 2011-08-23 Digimarc Corporation Histogram methods and systems for object recognition
JP2011180792A (ja) * 2010-03-01 2011-09-15 Sony Corp 画像処理装置及び画像処理方法、並びにコンピューター・プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014203135A (ja) * 2013-04-01 2014-10-27 キヤノン株式会社 信号処理装置、信号処理方法、及び、信号処理システム
JP2018501675A (ja) * 2014-09-30 2018-01-18 クアルコム,インコーポレイテッド センサ素子アレイにおける特徴計算
US11068712B2 (en) 2014-09-30 2021-07-20 Qualcomm Incorporated Low-power iris scan initialization
US10614332B2 (en) 2016-12-16 2020-04-07 Qualcomm Incorportaed Light source modulation for iris size adjustment
US10984235B2 (en) 2016-12-16 2021-04-20 Qualcomm Incorporated Low power data generation for iris-related detection and authentication

Also Published As

Publication number Publication date
US20130004028A1 (en) 2013-01-03

Similar Documents

Publication Publication Date Title
JP2013012190A (ja) ガボールフィルターをブロックガボールフィルターとして近似する方法、及び、プロセッサ上で実行されているアプリケーションプログラムによるアクセスのためのデータ構造を格納するメモリ
Soltanpour et al. A survey of local feature methods for 3D face recognition
Chen et al. An end-to-end system for unconstrained face verification with deep convolutional neural networks
AU2009246750B2 (en) Fingerprint representation using gradient histograms
US11145080B2 (en) Method and apparatus for three-dimensional object pose estimation, device and storage medium
KR101548928B1 (ko) 불변적인 시각적 장면 및 객체 인식
CN109948397A (zh) 一种人脸图像校正方法、系统及终端设备
CN110728196A (zh) 一种人脸识别的方法、装置及终端设备
CN113490947A (zh) 检测模型训练方法、装置、检测模型使用方法及存储介质
CN110852311A (zh) 一种三维人手关键点定位方法及装置
Vokhmintcev et al. Face recognition based on a matching algorithm with recursive calculation of oriented gradient histograms
Shojaeilangari et al. Feature extraction through binary pattern of phase congruency for facial expression recognition
JP2015197708A (ja) オブジェクト識別装置、オブジェクト識別方法及びプログラム
CN111222452A (zh) 一种人脸匹配方法、装置、电子设备及可读存储介质
CN114758145B (zh) 一种图像脱敏方法、装置、电子设备及存储介质
Huo et al. Three-dimensional mechanical parts reconstruction technology based on two-dimensional image
CN113228105A (zh) 一种图像处理方法、装置和电子设备
CN108960246B (zh) 一种用于图像识别的二值化处理装置及方法
CN111612083A (zh) 一种手指静脉识别方法、装置及设备
Günay et al. Real-time dynamic texture recognition using random sampling and dimension reduction
KR101733288B1 (ko) 방향정보를 이용한 객체 검출기 생성 방법, 이를 이용한 객체 검출 장치 및 방법
Terzić et al. BIMP: A real-time biological model of multi-scale keypoint detection in V1
Pflug et al. Segmentation and normalization of human ears using cascaded pose regression
Kekre et al. Content based image retrieval using weighted hamming distance image hash value
CN110717406B (zh) 一种人脸检测的方法、装置及终端设备