JP5703705B2 - 画像特徴検出システム、画像認識システム、画像特徴検出方法、およびプログラム - Google Patents

画像特徴検出システム、画像認識システム、画像特徴検出方法、およびプログラム Download PDF

Info

Publication number
JP5703705B2
JP5703705B2 JP2010254505A JP2010254505A JP5703705B2 JP 5703705 B2 JP5703705 B2 JP 5703705B2 JP 2010254505 A JP2010254505 A JP 2010254505A JP 2010254505 A JP2010254505 A JP 2010254505A JP 5703705 B2 JP5703705 B2 JP 5703705B2
Authority
JP
Japan
Prior art keywords
pixel
pixel value
image
integral image
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010254505A
Other languages
English (en)
Other versions
JP2012104078A (ja
Inventor
和之 櫻井
和之 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010254505A priority Critical patent/JP5703705B2/ja
Publication of JP2012104078A publication Critical patent/JP2012104078A/ja
Application granted granted Critical
Publication of JP5703705B2 publication Critical patent/JP5703705B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は画像特徴検出システム、画像認識システム、画像特徴検出方法、画像認識方法、およびプログラムに関し、少ない記憶容量で特徴を検出することができる画像特徴検出システム、画像認識システム、画像特徴検出方法、画像認識方法、およびプログラムに関する。
関連する画像特徴検出システムの一例が、特許文献1に記載されている。ここでの画像特徴とは、原画像から、例えば顔等の検出を行う際に用いる特徴であり、原画像内の部分領域内の予め指定された矩形領域におけるピクセル値の合計や平均等、前記矩形領域のピクセル値の総和を用いて計算される特徴量に基づいて検出される。図15に示すように、この画像特徴検出システムは、情報入力部1200と、累積情報生成部1201と、累積情報保持部1202と、累積情報利用演算部1203とから構成されている。
この画像特徴検出システムは次のように動作する。
すなわち、前記情報入力部1200は、原画像を入力する。前記累積情報生成部1201は前記原画像の原点と各ピクセルとを対角線とする矩形領域内の前記原画像のピクセル値の和を当該ピクセルでのピクセル値とする画像を生成する。この新たに生成された画像はインテグラル画像と呼ばれるものであり、本明細でも以下、この呼称を使用する。前記累積情報保持部1202は前記インテグラル画像データを保持する。前記累積情報利用演算部1203は前記インテグラル画像を用いて前記特徴量を計算する。前記特徴量の計算方法については、特許文献1または後述の式(1)を参照されたい。
ところで、前記インテグラル画像のピクセル値は前記原画像の前記矩形領域内のピクセル値和であるため、前記原画像のピクセル値と比較して大きな値となる傾向がある。従って、このままでは前記インテグラル画像の保持に大きな記憶容量を必要とする。そこで、この画像特徴検出システムでは、以下のようにして前記インテグラル画像の保持に必要な記憶容量を抑制している。
すなわち、前記特徴量の最大値がM以下である場合、M≦X=2NとなるようなNを選び、これを前記インテグラル画像の保持に用いるバッファのビット精度とする。この場合、前記累積情報保持部1202での前記インテグラル画像のピクセル値の保持においてオーバーフローを起こす場合があるが、その際にもオーバーフローを起こした値をそのままピクセル値として保持する。また、前記累積情報利用演算部1203における前記特徴量の計算において、Nビットの正整数入出力の加算器を用いる。このように構成であっても前記累積情報利用演算部1203における前記特徴量の計算において正しい値が計算されることが特許文献1に示されている。また、Nとして十分小さな値を選択することができるならば、前記インテグラル画像の保持に必要な記憶容量を抑制することが出来る。
特開2008−299627号公報
しかし、上記特許文献1の構成では、インテグラル画像の保持に必要な記憶容量の抑制に限界がある。
その理由は、インテグラル画像の記憶に用いるバッファのビット精度が、計算される特徴量の値の大きさにより規定されるため、計算される特徴量の値が大きい場合には、インテグラル画像の保持に用いるバッファのビット精度も大きくなってしまうためである。
本発明の目的は、計算される特徴量の値の大きさに関わらずにインテグラル画像の保持に必要な記憶容量を抑制することにより、少ない記憶容量で特徴を検出することができる技術を提供することにある。
本願発明の第1の観点によれば、原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成するインテグラル画像作成手段と、前記インテグラル画像の各行もしくは各列において左端から(列の場合は上端から)当該行内(列の場合は列)のピクセル値を予め定めた上限ピクセル値と比較し、前記上限ピクセル値以上のピクセル値を持つピクセルの横位置(列の場合は縦位置)をビット下げ点座標として記憶するピクセル値ビット下げ点検出手段と、前記インテグラル画像の各ピクセルにおけるピクセル値から、前記当該ピクセルが属する行内で(列の場合は列内で)前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を、減ずるインテグラル画像ピクセル値ビット下げ手段と、前記インテグラル画像を基に原画像内の単独または複数の矩形領域内のピクセル値和を計算する矩形領域内ピクセル値和計算手段と、前記矩形領域内ピクセル値和を基に特徴ベクトルを計算する特徴ベクトル計算手段と、前記特徴ベクトルを出力する特徴ベクトル出力手段とを備えたことを特徴とする画像特徴検出システムが提供される。
本願発明の第2の観点によれば、原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成し、前記インテグラル画像の各行もしくは各列において左端から(列の場合は上端から)当該行内(列の場合は列)のピクセル値を予め定めた上限ピクセル値と比較し、前記上限ピクセル値以上のピクセル値を持つピクセルの横位置(列の場合は縦位置)をビット下げ点座標として記憶し、前記インテグラル画像の各ピクセルにおけるピクセル値から、前記当該ピクセルが属する行内で(列の場合は列内で)前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を、減じ、前記インテグラル画像を基に原画像内の単独または複数の矩形領域内のピクセル値和を計算し、前記矩形領域内ピクセル値和を基に特徴ベクトルを計算し、前記特徴ベクトルを出力することを特徴とする画像特徴検出方法が提供される。
本願発明の第3の観点によれば、原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成するインテグラル画像作成処理と、前記インテグラル画像の各行もしくは各列において左端から(列の場合は上端から)当該行内(列の場合は列)のピクセル値を予め定めた上限ピクセル値と比較し、前記上限ピクセル値以上のピクセル値を持つピクセルの横位置(列の場合は縦位置)をビット下げ点座標として記憶するピクセル値ビット下げ点検出処理と、前記インテグラル画像の各ピクセルにおけるピクセル値から、前記当該ピクセルが属する行内で(列の場合は列内で)前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を、減ずるインテグラル画像ピクセル値ビット下げ処理と、前記インテグラル画像を基に原画像内の単独または複数の矩形領域内のピクセル値和を計算する矩形領域内ピクセル値和計算処理と、前記矩形領域内ピクセル値和を基に特徴ベクトルを計算する特徴ベクトル計算処理と、前記特徴ベクトルを出力する特徴ベクトル出力処理とをコンピュータに実行させるためのプログラムが提供される。
本願発明によれば、少ない記憶容量で特徴を検出することができることにある。
その理由は、インテグラル画像の保持に用いるバッファのビット精度を小さく設定するとともにインテグラル画像のピクセル値がオーバーフローするピクセル位置を保持し、特徴量の計算の際にインテグラル画像のピクセル値がオーバーフローしたピクセル位置を参照することによりオーバーフロー前のインテグラル画像のピクセル値を再現しながら特徴量の計算をすることで、計算される特徴量の値の大きさに関わらずにインテグラル画像の保持に必要な記憶容量を抑制することができるためである。
本発明の第1の発明を実施するための最良の形態の構成を示すブロック図である。 ビット下げインテグラル画像の作成方法を示す図である。 ビット下げインテグラル画像からの原画像内の矩形領域ピクセル値和の計算方法を示す図である。 第1の発明を実施するための最良の形態の動作を示す第1フローである。 第1の発明を実施するための最良の形態の動作を示す第2フローである。 原画像と部分領域、および部分領域の移動を示す図である。 Haar-like特徴を示す図である。 第1の発明を実施するための最良の形態の具体例の構成を示すブロック図である。 第1の発明を実施するための最良の形態の具体例の動作を示す第1フローである。 第1の発明を実施するための最良の形態の具体例の動作を示す第2フローである。 HOG特徴ベクトル計算におけるセルを説明する図である。 第1の発明を実施するための最良の形態の別の具体例の構成を示すブロック図である。 第1の発明を実施するための最良の形態の別の具体例の動作を示す第1フローである。 第1の発明を実施するための最良の形態の別の具体例の動作を示す第2フローである。 従来技術の例の構成を示すブロック図である。
次に、発明を実施するための最良の形態について図面を参照して詳細に説明する。図1を参照すると、本発明の第1の実施の形態は、プログラム制御により動作するコンピュータ100と、画像入力装置110とから構成されている。
コンピュータ100は、CPU(Central Proccessing Unit)やROM(Read Only Memory)、RAM(Random Access Memory)を備えている。ROMには、予めプログラムが記憶されている。このプログラムは、CPUによって読み込まれ、CPU上で実行されることで、CPU等のハードウェアに、インテグラル画像作成機能101と、ピクセル値ビット下げ点検出機能102と、インテグラル画像ピクセル値ビット下げ機能103と、ビット下げインテグラル画像作成機能104と、インテグラル画像端点読込み機能105と、ピクセル値ビット上げ機能106と、矩形領域ピクセル値和計算機能107と、特徴値ベクトル計算機能108と、特徴値ベクトル出力機能109を実現させる。
これらの手段はそれぞれ概略つぎのように動作する。
前記画像入力装置110は、原画像を入力する。前記インテグラル画像作成機能101は、原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成する。前記ピクセル値ビット下げ点検出機能102は、図2に示すとおり、各ピクセルの前記インテグラル画像ピクセル値を予め定めた上限ピクセル値203と比較し、前記上限ピクセル値203以上のピクセル値をもつピクセルの横位置(列の場合は縦位置)をビット下げ点座標205として記憶する。前記インテグラル画像ピクセル値ビット下げ機能103は、前記上限ピクセル値203を適宜整数倍した値を当該ピクセルの前記インテグラル画像ピクセル値から減ずる。前記ビット下げインテグラル画像作成機能104は、前記上限ピクセル値203を適宜整数倍した値を減ぜられた前記インテグラル画像ピクセル値を各ピクセル値とするビット下げインテグラル画像202を作成する。前記インテグラル画像端点読込み機能105は、図3に示すとおり、前記原画像内の計算対象である矩形領域301の四隅の各端点に相当する前記ビット下げインテグラル画像300(図2のビット下げインテグラル画像202に相当。)の各ピクセル値を読み込む。前記ピクセル値ビット上げ機能106は、前記端点の前記ビット下げインテグラル画像300の各ピクセル値について、当該ピクセルが属する行(もしくは列)内の前記ビット下げ点座標205との位置関係により、前記当該ピクセル値が前記上限ピクセル値203を減じられたものであるか否かを判定し、減じられていた場合は当該ピクセル値に前記上限ピクセル値203を加算することにより前記インテグラル画像200でのピクセル値を得る。前記矩形領域ピクセル値和計算機能107は、前記矩形領域301の四隅に相当する前記インテグラル画像の前記各ピクセル値により前記原画像での矩形領域ピクセル値和301を計算する。前記特徴値ベクトル計算機能108は、前記矩形領域ピクセル値和301を基に特徴値ベクトルを計算する。前記特徴値ベクトル出力機能109は、前記特徴値ベクトルを出力する。
なお、前記矩形領域301の四隅に相当する前記インテグラル画像の前記各ピクセルによる前記原画像での矩形領域ピクセル値和301の計算は、以下のように行う。すなわち、図3に示すとおり、前記矩形領域の4隅の各端点の座標をそれぞれ(x1, y1)、(x2, y1)、(x1, y2)、(x2, y2)とし(ただし、x2≧x1、y2≧y1)、座標(x, y)での前記インテグラル画像ピクセル値をI(x, y)とすると、前記矩形領域ピクセル値和S(x1, y1, x2, y2)は式(1)のように計算できる。
S(x1, y1, x2, y2) = I(x2, y2) + I(x1, y1) - I(x1, y2) - I(x2, y1)・・・(1)
また、本実施の形態における前記原画像の代わりに、これらにフィルタや幾何変換等の処理を施した処理画像を用いてもよい。
また、前記原画像は1つである必要はなく、複数の前記原画像に対して複数の前記ビット下げインテグラル画像を作成し、それら複数の前記ビット下げインテグラル画像を用いた原画像の矩形領域ピクセル値和を基に特徴値を計算してもよい。
また、前記ピクセル値ビット下げ点は各行もしくは各列に1つである必要はなく、複数の前記ピクセル値ビット下げ点を検出してもよい。この場合、前記ビット下げインテグラル画像の各ピクセルでのピクセル値は、前記上限ピクセル値に、当該ピクセルを含む行(もしくは列)で当該ピクセルおよびその左(列の場合は上)に存在する前記ピクセル値ビット下げ点の個数を乗じた値を前記インテグラル画像の当該ピクセルでのピクセル値から減じた値とする。
また、前記原画像は通常の画像のような2次元の画像である必要はなく、3次元以上の多次元の画像を対象としてもよい。その際、前記矩形領域は多次元直方体領域として多次元直方体領域ピクセル値和を計算する。また、前記インテグラル画像作成機能101は、原点と各ピクセルとを対角線とする多次元直方体領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成する。
次に、図1〜3、及び、図4〜5のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。
なお、本動作の説明においては、前記ビット下げ座標205(図2参照)は前記ビット下げインテグラル画像202の各行について検出するが、前記ビット下げ座標205の検出を各列に対しておこなってもよい。この場合、下記の説明において左右を上下と読み替えることにより処理が成立する。
まず、前記画像入力装置110により撮像された原画像を入力する(図4のステップA1)。次に、前記原画像においてインテグラル画像ピクセル値未計算のピクセルが存在すればステップA3へ、存在しなければ図5のステップA9へすすむ(ステップA2)。ステップA3では、前記インテグラル画像作成機能101により当該ピクセルでのインテグラル画像ピクセル値を原点と前記当該ピクセルとを対角線とする矩形領域内の前記原画像のピクセル値の和として計算する。さらに、前記インテグラル画像ピクセル値ビット下げ機能103により前記当該ピクセルでの前記インテグラル画像ピクセル値から、前記当該ピクセル上またはその左側にある前記ビット下げ座標205の個数と前記上限ピクセル値203を乗じた値を減ずる(ステップA4)。さらに、前記ピクセル値ビット下げ点検出機能102により前記当該ピクセルでの前記インテグラル画像ピクセル値と前記上限ピクセル値203を比較し、前記インテグラル画像ピクセル値が前記上限ピクセル値203以上であればステップA6へ、前記上限ピクセル値203未満であればステップA8へとすすむ(ステップA5)。ステップA6では、前記ピクセル値ビット下げ点検出機能102により前記当該ピクセルの位置をビット下げ座標205として記憶する。さらに、前記インテグラル画像ピクセル値ビット下げ機能103により前記当該ピクセルでの前記インテグラル画像ピクセル値から前記上限ピクセル値203を減ずる(ステップA7)。ステップA8では、前記ビット下げインテグラル画像作成機能104により前記インテグラル画像ピクセル値を前記ビット下げインテグラル画像のピクセル値として記憶する。図5のステップA9では、前記ビット下げインテグラル画像において特徴値ベクトル未計算のピクセルが存在すればステップA10へすすみ、存在しなければ処理を終了する。ステップA10では、前記特徴ベクトルを計算するために必要な前記矩形領域ピクセル値和のうち未計算の前記矩形領域301が存在すればステップA11へ、存在しなければステップA16へすすむ。ステップA11では、前記インテグラル画像端点読込み機能105により当該矩形領域301の4隅の各端点での前記ビット下げインテグラル画像ピクセル値を読み込む。さらに、前記ピクセル値ビット上げ機能106により前記当該矩形領域301の前記各端点と前記各端点が含まれる各行での前記ビット下げ座標205との位置関係をそれぞれ比較する(ステップA12)。さらに、前記ピクセル値ビット上げ機能106により前記各端点が対応する各前記ビット下げ座標上もしくはその左側に位置するか否かを判定し、各前記ビット下げ座標上もしくはその左側の位置する場合はA14へ、位置しない場合はA15へすすむ(ステップA13)。ステップA14では、前記ピクセル値ビット上げ機能106により前記各端点での前記ビット下げインテグラル画像ピクセル値に、前記各端点上またはその左側にある前記ビット下げ座標205の個数と前記上限ピクセル値203を乗じた値を加算し前記インテグラル画像ピクセル値を得る。ステップA15では、前記矩形領域ピクセル値和計算機能107により前記各端点の前記インテグラル画像ピクセル値から前記矩形領域ピクセル値和301を計算する。ステップA16では、前記特徴値ベクトル計算機能108により前記矩形領域ピクセル値和から前記特徴値ベクトルを計算する。さらに、前記特徴ベクトル出力機能109により前記特徴値ベクトルを出力する(ステップA17)。
次に、本実施の形態の効果について説明する。
本実施の形態では、インテグラル画像のピクセル値の上限が前記上限ピクセル値203として定められているためインテグラル画像の記憶に必要なビット数を削減することができ、また前記上限ピクセル値203および前記ビット下げ座標205の記憶に要するビット数は、削減されたインテグラル画像格納のためのビット数より通常用いられる画像サイズであれば小さいと考えられるので、全体として記憶に必要なビット数を小さく抑えることができる。
また、前記上限ピクセル値203は計算される特徴値とは無関係に定めることが出来るため、インテグラル画像の記憶に必要なビット数を計算される特徴値の大きさに拘わらずより小さく抑えることができる。
(実施例)
次に、具体的な実施例を用いて本発明を実施するための最良の形態の動作を説明する。
本実施例は、図6に示すように輝度画像502を前記原画像とするものであり、前記原画像から、例えば顔等の検出に用いる特徴値ベクトル(1次元のスカラー値を含む)を検出するものである。前記特徴値ベクトルは当該ピクセル501を左上端点とする部分領域503内のピクセル値から算出されるものであり、前記部分領域503を縦横方向に適当な間隔、例えば横3ピクセル縦3ピクセルずつ、適当な順序、例えばラスタスキャン方向に移動し、それぞれの位置において前記特徴値ベクトルを計算し、それを基に前記部分領域503が例えば顔を含むか否かを識別することにより例えば顔等の検出を行う。前記特徴値ベクトルを基にした識別については、例えば非特許文献1(P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features", Proc. IEEE Conf. on Computer Vision and Pattern Recognition, Vol. 1, pp.511-518, December 2001.)に示されている方法等を用いることが出来る。また、前記特徴値ベクトルとして、非特許文献1で用いられているHaar-like特徴を要素とする特徴値ベクトルを用いる。前記Haar-like特徴は、図7に示すように前記部分領域601内の適当な位置における前記矩形領域についての前記矩形領域ピクセル値和から計算される特徴値である。例えば、図7におけるHaar-like特徴602は矩形領域605についての前記矩形領域ピクセル値和から矩形領域604と矩形領域606についての前記矩形領域ピクセル値和を減ずることにより計算される。Haar-like特徴603についても同様に、矩形領域607についての前記矩形領域ピクセル値和から矩形領域608についての前記矩形領域ピクセル値和を減ずることにより計算される。非特許文献1では、さらにさまざまな前記矩形領域ピクセル値和の加減算によるHaar-like特徴が示されており、それらのHaar-like特徴を特徴値ベクトルの要素とすることにより例えば顔等の検出を行うことが出来るが、本実施例では計算される特徴値は2つのHaar-like特徴602、603であるとして、以下説明を行う。
本実施例は、図8にしめすように、プログラム制御により動作するコンピュータ700と、画像入力装置710とから構成されている。
コンピュータ700は、CPU(Central Proccessing Unit)やROM(Read Only Memory)、RAM(Random Access Memory)を備えている。ROMには、予めプログラムが記憶されている。このプログラムは、CPUによって読み込まれ、CPU上で実行されることで、CPU等のハードウェアに、インテグラル画像作成機能701と、ピクセル値ビット下げ点検出機能702と、インテグラル画像ピクセル値ビット下げ機能703と、ビット下げインテグラル画像作成機能704と、インテグラル画像端点読込み機能705と、ピクセル値ビット上げ機能706と、矩形領域ピクセル値和計算機能707と、特徴値ベクトル計算機能708と、特徴値ベクトル出力機能709を実現させる。
これらの手段はそれぞれ概略つぎのように動作する。
前記画像入力装置710は、原画像を入力する。前記インテグラル画像作成機能701は、原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とする前記インテグラル画像200を作成する。前記ピクセル値ビット下げ点検出機能702は、各ピクセルの前記インテグラル画像ピクセル値を予め定めた前記上限ピクセル値203と比較し、前記上限ピクセル値203以上のピクセル値をもつピクセルの横位置をビット下げ点座標205として記憶する。前記インテグラル画像ピクセル値ビット下げ機能703は、前記上限ピクセル値203を適宜整数倍した値を当該ピクセルの前記インテグラル画像ピクセル値から減ずる。前記ビット下げインテグラル画像作成機能704は、前記上限ピクセル値203を適宜整数倍した値を減ぜられた前記インテグラル画像ピクセル値を各ピクセル値とするビット下げインテグラル画像202を作成する。前記インテグラル画像端点読込み機能705は、前記矩形領域604、605、606、607、608の各前記矩形領域の四隅の各端点に相当する前記ビット下げインテグラル画像300(図2のビット下げインテグラル画像202に相当。)の各ピクセル値を読み込む。前記ピクセル値ビット上げ機能706は、前記端点の前記ビット下げインテグラル画像300の各ピクセル値について、当該ピクセルが属する行内の前記ビット下げ点座標205との位置関係により、前記当該ピクセル値が前記上限ピクセル値203を減じられたものであるか否かを判定し、減じられていた場合は当該ピクセル値に前記上限ピクセル値203を加算することにより前記インテグラル画像200でのピクセル値を得る。前記矩形領域ピクセル値和計算機能707は、前記矩形領域604、605、606、607、608についての前記矩形領域ピクセル値和を各前記矩形領域の四隅に相当する前記インテグラル画像200の前記各ピクセル値により前記矩形領域ピクセル値和301を計算する。前記特徴値ベクトル計算機能708は、前記矩形領域604、605、606、607、608についての前記矩形領域ピクセル値和を基に前記Haar-like特徴602、603を計算し、それらを要素とする特徴値ベクトルを計算する。前記特徴値ベクトル出力機能709は、前記特徴値ベクトルを出力する。なお、前記矩形領域ピクセル値和の計算は式(1)によって行われる。
次に、以上説明した構成要素により構成される本実施例の動作について、図9及び図10のフローチャートを参照して詳細に説明する。
まず、前記画像入力装置710により撮像された原画像を入力する(図9のステップB1)。次に、前記原画像においてインテグラル画像ピクセル値未計算のピクセルが存在すればステップB3へ、存在しなければ図10のステップB9へすすむ(ステップB2)。ステップB3では、ラスタスキャン方向に順次指定される各ピクセルについて、前記インテグラル画像作成機能701により当該ピクセルでのインテグラル画像ピクセル値を原点と前記当該ピクセルとを対角線とする矩形領域内の前記原画像のピクセル値の和として計算する。さらに、前記インテグラル画像ピクセル値ビット下げ機能703により前記当該ピクセルでの前記インテグラル画像ピクセル値から、前記当該ピクセル上またはその左側にある前記ビット下げ座標205の個数と前記上限ピクセル値203を乗じた値を減ずる(ステップB4)。さらに、前記ピクセル値ビット下げ点検出機能702により前記当該ピクセルでの前記インテグラル画像ピクセル値と前記上限ピクセル値203を比較し、前記インテグラル画像ピクセル値が前記上限ピクセル値203以上であればステップB6へ、前記上限ピクセル値203未満であればステップB8へとすすむ(ステップB5)。ステップB6では、前記ピクセル値ビット下げ点検出機能702により前記当該ピクセルの位置をビット下げ座標205として記憶する。さらに、前記インテグラル画像ピクセル値ビット下げ機能703により前記当該ピクセルでの前記インテグラル画像ピクセル値から前記上限ピクセル値203を減ずる(ステップB7)。ステップB8では、前記ビット下げインテグラル画像作成機能704により前記インテグラル画像ピクセル値を前記ビット下げインテグラル画像のピクセル値として記憶する。図10のステップB9では、前記ビット下げインテグラル画像において特徴値ベクトル未計算のピクセルが存在すればステップB10へすすみ、存在しなければ処理を終了する。ステップB10では、ラスタスキャン順に順次指定される各ピクセルについて、前記特徴ベクトルを計算するために必要な前記矩形領域604、605、606、607、608についての矩形領域ピクセル値和のうち未計算の前記矩形領域301が存在すればステップB11へ、存在しなければステップB16へすすむ。ステップB11では、各前記矩形領域604、605、606、607、608について、前記インテグラル画像端点読込み機能705により当該矩形領域301の4隅の各端点での前記ビット下げインテグラル画像ピクセル値を読み込む。さらに、前記ピクセル値ビット上げ機能706により前記当該矩形領域301の前記各端点と前記各端点が含まれる各行での前記ビット下げ座標205との位置関係をそれぞれ比較する(ステップB12)。さらに、前記ピクセル値ビット上げ機能706により前記各端点が対応する各前記ビット下げ座標上もしくはその左側に位置するか否かを判定し、各前記ビット下げ座標上もしくはその左側の位置する場合はB14へ、位置しない場合はB15へすすむ(ステップB13)。ステップB14では、前記ピクセル値ビット上げ機能706により前記各端点での前記ビット下げインテグラル画像ピクセル値に、前記各端点上またはその左側にある前記ビット下げ座標205の個数と前記上限ピクセル値203を乗じた値を加算し前記インテグラル画像ピクセル値を得る。ステップB15では、前記矩形領域ピクセル値和計算機能707により前記各端点の前記インテグラル画像ピクセル値から前記矩形領域ピクセル値和301を計算する。ステップ16では、前記特徴値ベクトル計算機能108により前記矩形領域604、605、606、607、608についての各前記矩形領域ピクセル値和から前記Haar-like特徴602、603を計算し、これらをベクトルの要素として前記特徴値ベクトルを計算する。さらに、前記特徴ベクトル出力機能709により前記特徴値ベクトルを出力する(ステップB17)。
次に、別の具体的な実施例を用いて本発明を実施するための最良の形態の動作を説明する。
本実施例は、図6に示すように輝度画像502を前記原画像とするものであり、前記原画像から、例えば顔等の検出に用いる特徴値ベクトル(1次元のスカラー値を含む)を検出するものである。前記特徴値ベクトルは当該ピクセル501を左上端点とする部分領域503内のピクセル値から算出されるものであり、前記部分領域503を縦横方向に適当な間隔、例えば横3ピクセル縦3ピクセルずつ、適当な順序、例えばラスタスキャン方向、に移動し、それぞれの位置において前記特徴値ベクトルを計算しそれを基に前記部分領域503が例えば顔を含むか否かを識別することにより例えば顔等の検出を行う。前記特徴値ベクトルを基にした識別については、例えば非特許文献2(N. Dalal and B. Triggs, "Histograms of Oriented Gradients for Human Detection", Proc. IEEE Conf. on Computer Vision and Pattern Recognition, Vol. 1, pp.886-893, December 2005.)に示されている方法等を用いることが出来る。また、前記特徴値ベクトルとして、非特許文献2で用いられているHOG特徴ベクトルを用いる。前記HOG特徴ベクトルは、非特許文献2にあるように、例えばSobelフィルタ等の画像勾配を算出するフィルタを原画像にかけた後に各ピクセルでの勾配の方向を例えば4方向や8方向といった幾つかの離散的な量子化勾配方向に量子化し、さらに図11に示すような前記部分領域901を幾つかの矩形領域902、903、904、905、906、907、908、909、910に分割した各前記矩形領域において、前記量子化勾配方向毎に当該前記量子化勾配方向をもつ当該前記矩形領域内のピクセルについての勾配値和を計算する。非特許文献2では、前記勾配値和を基にさらに各種の正規化を行い、前記HOG特徴ベクトルを得る手法が述べられているが、これらの正規化についての詳細は非特許文献2を参照されたい。前記HOG特徴ベクトルの計算においては、前記量子化勾配方向毎の勾配値和の計算が必要であるため、前記量子化勾配方向毎の勾配値をピクセル値とした原画像に対してのインテグラル画像が必要となる。本実施例では前記矩形領域の数は3×3=9個、前記量子化勾配方向は4方向として、以下説明を行う。
本実施例は、図12にしめすように、プログラム制御により動作するコンピュータ1000と、画像入力装置1011とから構成されている。
コンピュータ1000は、CPU(Central Proccessing Unit)やROM(Read Only Memory)、RAM(Random Access Memory)を備えている。ROMには、予めプログラムが記憶されている。このプログラムは、CPUによって読み込まれ、CPU上で実行されることで、CPU等のハードウェアに、勾配画像作成機能1001と、インテグラル画像作成機能1002と、ピクセル値ビット下げ点検出機能1003と、インテグラル画像ピクセル値ビット下げ機能1004と、ビット下げインテグラル画像作成機能1005と、インテグラル画像端点読込み機能1006と、ピクセル値ビット上げ機能1007と、矩形領域ピクセル値和計算機能1008と、特徴値ベクトル計算機能1009と、特徴値ベクトル出力機能1010を実現させる。
これらの手段はそれぞれ概略つぎのように動作する。
前記画像入力装置1011は、原画像を入力する。前記勾配画像作成機能1001は、前記原画像に例えばSobelフィルタ等の勾配値を算出するフィルタをかけ、勾配画像を作成する。前記インテグラル画像作成機能1002は、前記量子化勾配方向毎に、原点と各ピクセルとを対角線とする矩形領域内の、勾配画像内で当該前記量子化勾配方向をもつピクセルにおけるピクセル値の和を当該ピクセルでのピクセル値とする前記インテグラル画像200を作成する。前記ピクセル値ビット下げ点検出機能1003は、各前記インテグラル画像において各ピクセルの前記インテグラル画像ピクセル値を予め定めた前記上限ピクセル値203と比較し、前記上限ピクセル値203以上のピクセル値をもつピクセルの横位置をビット下げ点座標205として記憶する。前記インテグラル画像ピクセル値ビット下げ機能1004は、前記上限ピクセル値203を適宜整数倍した値を当該ピクセルの前記インテグラル画像ピクセル値から減ずる。前記ビット下げインテグラル画像作成機能1005は、前記上限ピクセル値203を適宜整数倍した値を減ぜられた前記インテグラル画像ピクセル値を各ピクセル値とするビット下げインテグラル画像202を、各前記量子化勾配方向について作成する。前記インテグラル画像端点読込み機能1006は、前記矩形領域902、903、904、905、906、907、908、909、910の各前記矩形領域の四隅の各端点に相当する前記ビット下げインテグラル画像300の各ピクセル値を、各前記量子化勾配方向に対して読み込む。前記ピクセル値ビット上げ機能1007は、前記端点の前記ビット下げインテグラル画像300の各ピクセル値について、当該ピクセルが属する行内の前記ビット下げ点座標205との位置関係により、前記当該ピクセル値が前記上限ピクセル値203を減じられたものであるか否かを判定し、減じられていた場合は当該ピクセル値に前記上限ピクセル値203を加算することにより各前記量子化勾配方向についての前記インテグラル画像200でのピクセル値を得る。前記矩形領域ピクセル値和計算機能1008は、前記矩形領域902、903、904、905、906、907、908、909、910についての各前記量子化勾配方向に対する前記矩形領域ピクセル値和を、各前記矩形領域の四隅に相当する前記インテグラル画像200の前記各ピクセル値により前記矩形領域ピクセル値和301を計算する。前記特徴値ベクトル計算機能1009は、各前記量子化勾配方向に対する前記矩形領域902、903、904、905、906、907、908、909、910についての前記矩形領域ピクセル値和を基に前記HOG特徴ベクトルを計算し、それらを要素とする特徴値ベクトルを計算する。前記特徴値ベクトル出力機能1010は、前記特徴値ベクトルを出力する。
次に、以上説明した構成要素により構成される本実施例の動作について、図13及び図14のフローチャートを参照して詳細に説明する。
まず、前記画像入力装置1011により撮像された原画像を入力する(図13のステップC1)。次に、前記勾配画像作成機能1001により前記原画像に例えばSobelフィルタ等の勾配値を算出するフィルタをかけ、勾配画像を作成する(ステップC2)。次に、対応するインテグラル画像が未作成である前記量子化勾配方向が存在すればステップC4へ、存在しなければ図14のステップC11へすすむ(ステップC3)。ステップC4では、当該前記量子化勾配方向についての前記インテグラル画像においてインテグラル画像ピクセル値未計算のピクセルが存在すればステップC5へ、存在しなければステップC3へすすむ(ステップC4)。ステップC5では、ラスタスキャン方向に順次指定される各ピクセルについて、前記インテグラル画像作成機能1002により当該ピクセルでのインテグラル画像ピクセル値を原点と各ピクセルとを対角線とする矩形領域内の、勾配画像内で当該前記量子化勾配方向をもつピクセルにおけるピクセル値の和として計算する。さらに、前記インテグラル画像ピクセル値ビット下げ機能1004により前記当該ピクセルでの前記インテグラル画像ピクセル値から、前記当該ピクセル上またはその左側にある前記ビット下げ座標205の個数と前記上限ピクセル値203を乗じた値を減ずる(ステップC6)。さらに、前記ピクセル値ビット下げ点検出機能1003により前記当該ピクセルでの前記インテグラル画像ピクセル値と前記上限ピクセル値203を比較し、前記インテグラル画像ピクセル値が前記上限ピクセル値203以上であればステップC8へ、前記上限ピクセル値203未満であればステップC10へとすすむ(ステップC7)。ステップC8では、前記ピクセル値ビット下げ点検出機能1003により前記当該ピクセルの位置をビット下げ座標205として記憶する。さらに、前記インテグラル画像ピクセル値ビット下げ機能1004により前記当該ピクセルでの前記インテグラル画像ピクセル値から前記上限ピクセル値203を減ずる(ステップC9)。ステップC10では、前記ビット下げインテグラル画像作成機能1005により前記インテグラル画像ピクセル値を前記ビット下げインテグラル画像のピクセル値として記憶する。図14のステップC11では、ラスタスキャン順に順次指定される各ピクセルについて、前記ビット下げインテグラル画像において特徴値ベクトル未計算のピクセルが存在すればステップC12へすすみ、存在しなければ処理を終了する。ステップC12では、当該ピクセルにおける、対応する前記矩形領域ピクセル値和が未計算である前記量子化勾配方向が存在すればステップC13へ、存在しなければステップC19へとすすむ。ステップC13では、当該ピクセルと当該前記量子化勾配方向に対して、前記矩形領域902、903、904、905、906、907、908、909、910についての前記矩形領域ピクセル値和のうち未計算の前記矩形領域301が存在すればステップC14へ、存在しなければステップC12へすすむ。ステップC14では、各前記矩形領域902、903、904、905、906、907、908、909、910について、前記インテグラル画像端点読込み機能1006により当該矩形領域301の4隅の各端点での当該前記量子化勾配方向に対応する前記ビット下げインテグラル画像ピクセル値を読み込む。さらに、前記ピクセル値ビット上げ機能1007により前記当該矩形領域301の前記各端点と前記各端点が含まれる各行での前記ビット下げ座標205との位置関係をそれぞれ比較する(ステップC15)。さらに、前記ピクセル値ビット上げ機能1007により前記各端点が対応する各前記ビット下げ座標上もしくはその左側に位置するか否かを判定し、各前記ビット下げ座標上もしくはその左側の位置する場合はC17へ、位置しない場合はC18へすすむ(ステップC16)。ステップC17では、前記ピクセル値ビット上げ機能1007により前記各端点での当該前記量子化勾配方向に対応する前記ビット下げインテグラル画像ピクセル値に、前記各端点上またはその左側にある前記ビット下げ座標205の個数と前記上限ピクセル値203を乗じた値を加算し前記インテグラル画像ピクセル値を得る。ステップC18では、前記矩形領域ピクセル値和計算機能1008により前記各端点の当該前記量子化勾配方向に対応する前記インテグラル画像ピクセル値から前記矩形領域ピクセル値和301を計算する。ステップC19では、前記特徴値ベクトル計算機能1009により前記矩形領域902、903、904、905、906、907、908、909、910についての各前記量子化勾配歩行に対する各前記矩形領域ピクセル値和から前記HOG特徴ベクトルを計算する。さらに、前記特徴ベクトル出力機能1010により前記特徴値ベクトルを出力する(ステップC20)。
(付記1)
原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成するインテグラル画像作成手段と、
前記インテグラル画像の各行もしくは各列において左端から(列の場合は上端から)当該行内(列の場合は列)のピクセル値を予め定めた上限ピクセル値と比較し、前記上限ピクセル値以上のピクセル値を持つピクセルの横位置(列の場合は縦位置)をビット下げ点座標として記憶するピクセル値ビット下げ点検出手段と、
前記インテグラル画像の各ピクセルにおけるピクセル値から、前記当該ピクセルが属する行内で(列の場合は列内で)前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を、減ずるインテグラル画像ピクセル値ビット下げ手段と
前記インテグラル画像を基に原画像内の単独または複数の矩形領域内のピクセル値和を計算する矩形領域内ピクセル値和計算手段と、
前記矩形領域内ピクセル値和を基に特徴ベクトルを計算する特徴ベクトル計算手段と、
前記特徴ベクトルを出力する特徴ベクトル出力手段と
を備えたことを特徴とする画像特徴検出システム。
(付記2)
前記矩形領域内ピクセル値和計算手段において、前記インテグラル画像の各ピクセルが属する行内もしくは列内で前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を前記当該ピクセルでのピクセル値に加算した値を元に前記矩形領域内ピクセル値和を計算すること
を特徴とする付記1に記載の画像特徴検出システム。
(付記3)
前記インテグラル画像の格納に用いる記憶領域のピクセル当りのビット数がNである場合に、前記上限ピクセル値を2Nとすること
を特徴とする付記1または2に記載の画像特徴検出システム。
(付記4)
前記特徴ベクトルがHaar-like特徴であること
を特徴とする付記1〜3の何れかに記載の画像特徴検出システム。
(付記5)
画像から勾配画像を作成し、勾配方向を量子化し、量子化勾配方向毎に対応する勾配方向の勾配値を各ピクセルに格納した方向量子化勾配画像を作成し、各前記方向量子化勾配画像を前記原画像として前記特徴ベクトルの計算を行い、前記量子化勾配方向毎の前記特徴ベクトルを統合することにより特徴ベクトルを得る
ことを特徴とする付記1〜3の何れかに記載の画像特徴検出システム。
(付記6)
付記1〜5の何れかに記載の画像特徴検出システムにより検出した前記特徴ベクトルを基に画像内の物体の検知・認識を行う画像認識システム。
(付記7)
原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成し、
前記インテグラル画像の各行もしくは各列において左端から(列の場合は上端から)当該行内(列の場合は列)のピクセル値を予め定めた上限ピクセル値と比較し、前記上限ピクセル値以上のピクセル値を持つピクセルの横位置(列の場合は縦位置)をビット下げ点座標として記憶し、
前記インテグラル画像の各ピクセルにおけるピクセル値から、前記当該ピクセルが属する行内で(列の場合は列内で)前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を、減じ
前記インテグラル画像を基に原画像内の単独または複数の矩形領域内のピクセル値和を計算し、
前記矩形領域内ピクセル値和を基に特徴ベクトルを計算し、
前記特徴ベクトルを出力する
ことを特徴とする画像特徴検出方法。
(付記8)
前記インテグラル画像の各ピクセルが属する行内もしくは列内で前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を前記当該ピクセルでのピクセル値に加算した値を元に前記矩形領域内ピクセル値和を計算する
ことを特徴とする付記7に記載の画像特徴検出方法。
(付記9)
前記インテグラル画像の格納に用いる記憶領域のピクセル当りのビット数がNである場合に、前記上限ピクセル値を2Nとする
ことを特徴とする付記7または8に記載の画像特徴検出方法。
(付記10)
前記特徴ベクトルがHaar-like特徴である
ことを特徴とする付記7〜9の何れかに記載の画像特徴検出方法。
(付記11)
画像から勾配画像を作成し、勾配方向を量子化し、量子化勾配方向毎に対応する勾配方向の勾配値を各ピクセルに格納した方向量子化勾配画像を作成し、各前記方向量子化勾配画像を前記原画像として前記特徴ベクトルの計算を行い、前記量子化勾配方向毎の前記特徴ベクトルを統合することにより特徴ベクトルを得る
ことを特徴とする付記7〜9の何れかに記載の画像特徴検出方法。
(付記12)
付記7〜11の何れかに記載の画像特徴検出方法により検出した前記特徴ベクトルを基に画像内の物体の検知・認識を行う画像認識方法。
(付記13)
原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成するインテグラル画像作成処理と、
前記インテグラル画像の各行もしくは各列において左端から(列の場合は上端から)当該行内(列の場合は列)のピクセル値を予め定めた上限ピクセル値と比較し、前記上限ピクセル値以上のピクセル値を持つピクセルの横位置(列の場合は縦位置)をビット下げ点座標として記憶するピクセル値ビット下げ点検出処理と、
前記インテグラル画像の各ピクセルにおけるピクセル値から、前記当該ピクセルが属する行内で(列の場合は列内で)前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を、減ずるインテグラル画像ピクセル値ビット下げ処理と
前記インテグラル画像を基に原画像内の単独または複数の矩形領域内のピクセル値和を計算する矩形領域内ピクセル値和計算処理と、
前記矩形領域内ピクセル値和を基に特徴ベクトルを計算する特徴ベクトル計算処理と、
前記特徴ベクトルを出力する特徴ベクトル出力処理と
をコンピュータに実行させるためのプログラム。
(付記14)
前記矩形領域内ピクセル値和計算処理において、前記インテグラル画像の各ピクセルが属する行内もしくは列内で前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を前記当該ピクセルでのピクセル値に加算した値を元に前記矩形領域内ピクセル値和を計算すること
を特徴とする付記13に記載のプログラム。
(付記15)
前記インテグラル画像の格納に用いる記憶領域のピクセル当りのビット数がNである場合に、前記上限ピクセル値を2Nとすること
を特徴とする付記13または14に記載のプログラム。
(付記16)
前記特徴ベクトルがHaar-like特徴であること
を特徴とする付記13〜15の何れかに記載のプログラム。
(付記17)
画像から勾配画像を作成し、勾配方向を量子化し、量子化勾配方向毎に対応する勾配方向の勾配値を各ピクセルに格納した方向量子化勾配画像を作成し、各前記方向量子化勾配画像を前記原画像として前記特徴ベクトルの計算を行い、前記量子化勾配方向毎の前記特徴ベクトルを統合することにより特徴ベクトルを得る
ことを特徴とする付記13〜15の何れかに記載のプログラム。
(付記18)
付記13〜17の何れかに記載のプログラムにより検出した前記特徴ベクトルを基に画像内の物体の検知・認識を行うプログラム。
本発明によれば、画像からの特徴検出といった用途に適用できる。特に、画像からの例えば顔等の物体検知・認識、画質測定といった画像処理一般に適用可能である。
100, 700, 1000 コンピュータ(中央処理装置;プロセッサ;データ処理装置)
101, 701, 1002 インテグラル画像作成機能
102, 702, 1003 ピクセル値ビット下げ点検出機能
103, 703, 1004 インテグラル画像ピクセル値ビット下げ機能
104, 704, 1005 ビット下げインテグラル画像作成機能
105, 705, 1006 インテグラル画像端点読込み機能
106, 706, 1007 ピクセル値ビット上げ機能
107, 707, 1008 矩形領域ピクセル値和計算機能
108, 708, 1009 特徴値ベクトル計算機能
109, 709, 1010 特徴値ベクトル出力機能
110, 710, 1011 画像入力装置
200, 300 インテグラル画像
201 インテグラル画像の1行内でのピクセル値
202 ビット下げインテグラル画像
203 上限ピクセル値
204 ビット下げインテグラル画像の1行内でのピクセル値
205 ビット下げ点座標
301, 604, 605, 606, 607, 608 矩形領域
500 輝度画像
501, 600, 900 当該ピクセル
502, 601, 901 部分領域
602, 603 Haar-like特徴
902, 903, 904, 905, 906, 907, 908, 909, 910 セル
1001 勾配画像作成機能
1200 情報入力部
1201 累積情報生成部
1202 累積情報保持部
1203 累積情報利用演算部

Claims (8)

  1. 原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成するインテグラル画像作成手段と、
    前記インテグラル画像の各行もしくは各列において、当該ピクセルのピクセル値を予め定めた上限ピクセル値と比較し、前記上限ピクセル値以上のピクセル値を持つ場合に当該ピクセルの横位置(列の場合は縦位置)を当該行内(列の場合は列)のビット下げ点座標として記憶するピクセル値ビット下げ点検出手段と、
    前記インテグラル画像の当該ピクセルにおけるピクセル値から、前記当該ピクセルが属する行内で(列の場合は列内で)前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を、減ずるインテグラル画像ピクセル値ビット下げ手段と、
    前記インテグラル画像の各行もしくは各列において左端から(列の場合は上端から)、各ピクセルについて前記インテグラル画像ピクセル値ビット下げ手段と前記ピクセル値ビット下げ点検出手段を適用するビット下げインテグラル画像作成手段と、
    前記インテグラル画像を基に原画像内の単独または複数の矩形領域内のピクセル値和である矩形領域内ピクセル値和を計算する矩形領域内ピクセル値和計算手段と、
    前記矩形領域内ピクセル値和を基に特徴ベクトルを計算する特徴ベクトル計算手段と、
    前記特徴ベクトルを出力する特徴ベクトル出力手段と、
    を備えたことを特徴とする画像特徴検出システム。
  2. 前記矩形領域内ピクセル値和計算手段において、前記インテグラル画像の各ピクセルが属する行内もしくは列内で前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を前記当該ピクセルでのピクセル値に加算した値を元に前記矩形領域内ピクセル値和を計算すること
    を特徴とする請求項1に記載の画像特徴検出システム。
  3. 前記インテグラル画像の格納に用いる記憶領域のピクセル当りのビット数がNである場合に、前記上限ピクセル値を2Nとすること
    を特徴とする請求項1または2に記載の画像特徴検出システム。
  4. 前記特徴ベクトルがHaar-like特徴であること
    を特徴とする請求項1〜3の何れかに記載の画像特徴検出システム。
  5. 画像から勾配画像を作成し、勾配方向を量子化し、量子化勾配方向毎に対応する勾配方向の勾配値を各ピクセルに格納した方向量子化勾配画像を作成し、各前記方向量子化勾配画像を前記原画像として前記特徴ベクトルの計算を行い、前記量子化勾配方向毎の前記特徴ベクトルを統合することにより特徴ベクトルを得る
    ことを特徴とする請求項1〜3の何れかに記載の画像特徴検出システム。
  6. 請求項1〜5の何れかに記載の画像特徴検出システムにより検出した前記特徴ベクトルを基に画像内の物体の検知・認識を行う画像認識システム。
  7. 原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成するインテグラル画像作成処理と、
    前記インテグラル画像の各行もしくは各列において、当該ピクセルのピクセル値を予め定めた上限ピクセル値と比較し、前記上限ピクセル値以上のピクセル値を持つ場合に当該ピクセルの横位置(列の場合は縦位置)を当該行内(列の場合は列)のビット下げ点座標として記憶するピクセル値ビット下げ点検出処理と、
    前記インテグラル画像の当該ピクセルにおけるピクセル値から、前記当該ピクセルが属する行内で(列の場合は列内で)前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を、減ずるインテグラル画像ピクセル値ビット下げ処理と、
    前記インテグラル画像の各行もしくは各列において左端から(列の場合は上端から)、各ピクセルについて前記インテグラル画像ピクセル値ビット下げ処理と前記ピクセル値ビット下げ点検出処理を適用するビット下げインテグラル画像作成処理と、
    前記インテグラル画像を基に原画像内の単独または複数の矩形領域内のピクセル値和である矩形領域内ピクセル値和を計算する矩形領域内ピクセル値和計算処理と、
    前記矩形領域内ピクセル値和を基に特徴ベクトルを計算する特徴ベクトル計算処理と、
    前記特徴ベクトルを出力する特徴ベクトル出力処理と、
    を含む、画像特徴検出方法。
  8. 原点と各ピクセルとを対角線とする矩形領域内の原画像のピクセル値の和を当該ピクセルでのピクセル値とするインテグラル画像を作成するインテグラル画像作成処理と、
    前記インテグラル画像の各行もしくは各列において、当該ピクセルのピクセル値を予め定めた上限ピクセル値と比較し、前記上限ピクセル値以上のピクセル値を持つ場合に当該ピクセルの横位置(列の場合は縦位置)を当該行内(列の場合は列)のビット下げ点座標として記憶するピクセル値ビット下げ点検出処理と、
    前記インテグラル画像の当該ピクセルにおけるピクセル値から、前記当該ピクセルが属する行内で(列の場合は列内で)前記当該ピクセルを含みその左側(列の場合は上側)に存在する前記ビット下げ点座標の個数と前記上限ピクセル値を乗じた値を、減ずるインテグラル画像ピクセル値ビット下げ処理と、
    前記インテグラル画像の各行もしくは各列において左端から(列の場合は上端から)、各ピクセルについて前記インテグラル画像ピクセル値ビット下げ処理と前記ピクセル値ビット下げ点検出処理を適用するビット下げインテグラル画像作成処理と、
    前記インテグラル画像を基に原画像内の単独または複数の矩形領域内のピクセル値和である矩形領域内ピクセル値和を計算する矩形領域内ピクセル値和計算処理と、
    前記矩形領域内ピクセル値和を基に特徴ベクトルを計算する特徴ベクトル計算処理と、
    前記特徴ベクトルを出力する特徴ベクトル出力処理と、
    をコンピュータに実行させるためのプログラム。
JP2010254505A 2010-11-15 2010-11-15 画像特徴検出システム、画像認識システム、画像特徴検出方法、およびプログラム Active JP5703705B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010254505A JP5703705B2 (ja) 2010-11-15 2010-11-15 画像特徴検出システム、画像認識システム、画像特徴検出方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010254505A JP5703705B2 (ja) 2010-11-15 2010-11-15 画像特徴検出システム、画像認識システム、画像特徴検出方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2012104078A JP2012104078A (ja) 2012-05-31
JP5703705B2 true JP5703705B2 (ja) 2015-04-22

Family

ID=46394355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010254505A Active JP5703705B2 (ja) 2010-11-15 2010-11-15 画像特徴検出システム、画像認識システム、画像特徴検出方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5703705B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016009387A (ja) * 2014-06-25 2016-01-18 本田技研工業株式会社 画像処理装置
EP3058510B1 (en) * 2014-11-28 2017-12-20 FotoNation Limited A method for producing a histogram of oriented gradients
JP6896177B2 (ja) * 2018-08-10 2021-06-30 三菱電機株式会社 画像処理装置及び画像処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11455864B2 (en) 2018-07-25 2022-09-27 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Also Published As

Publication number Publication date
JP2012104078A (ja) 2012-05-31

Similar Documents

Publication Publication Date Title
EP3709266A1 (en) Human-tracking methods, apparatuses, systems, and storage media
KR102068719B1 (ko) 이미지들 내의 움직임 검출
JP5703705B2 (ja) 画像特徴検出システム、画像認識システム、画像特徴検出方法、およびプログラム
KR101548928B1 (ko) 불변적인 시각적 장면 및 객체 인식
US20150154450A1 (en) Optical Flow Tracking Method and Apparatus
JP2018501675A (ja) センサ素子アレイにおける特徴計算
US8442327B2 (en) Application of classifiers to sub-sampled integral images for detecting faces in images
US11062464B2 (en) Image processing apparatus, method, and storage medium to derive optical flow
KR101465035B1 (ko) 정보처리장치 및 정보처리방법
JP5777367B2 (ja) パターン識別装置、パターン識別方法及びプログラム
JP6123975B2 (ja) 特徴量抽出装置及び特徴量抽出方法
EP2898473A1 (en) Systems and methods for reducing noise in video streams
JP2010072694A (ja) 動態推定装置、動態推定方法、プログラム
US11647152B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
US20150139487A1 (en) Image processor with static pose recognition module utilizing segmented region of interest
JP2010165052A (ja) 画像処理装置及び画像処理方法
US10559091B2 (en) Object counting device, object counting method, object counting program, and object counting system
GB2553447A (en) Image processing apparatus, control method thereof, and storage medium
US8712167B2 (en) Pattern identification apparatus, control method and program thereof
US20190279392A1 (en) Medium recognition device and medium recognition method
JP2013015891A (ja) 画像処理装置、画像処理方法及びプログラム
JP2005339535A (ja) 相違度の計算
JP6116271B2 (ja) 特徴量算出装置、方法及びプログラム
US9159118B2 (en) Image processing apparatus, image processing system, and non-transitory computer-readable medium
KR101767927B1 (ko) 실시간 움직임 검출 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131011

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140715

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150209

R150 Certificate of patent or registration of utility model

Ref document number: 5703705

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150