JP5388835B2 - 情報処理装置及び情報処理方法 - Google Patents
情報処理装置及び情報処理方法 Download PDFInfo
- Publication number
- JP5388835B2 JP5388835B2 JP2009292941A JP2009292941A JP5388835B2 JP 5388835 B2 JP5388835 B2 JP 5388835B2 JP 2009292941 A JP2009292941 A JP 2009292941A JP 2009292941 A JP2009292941 A JP 2009292941A JP 5388835 B2 JP5388835 B2 JP 5388835B2
- Authority
- JP
- Japan
- Prior art keywords
- image information
- cumulative
- input image
- information
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/446—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7747—Organisation of the process, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Description
近年、コンピュータ・グラフィックスの分野では、F. C. Crowにより長方形のsummed-area tableと称される、元の入力画像情報に対する累積画像情報の概念が提案されている(例えば、非特許文献1参照)。
本発明はこのような問題点に鑑みなされたもので、累積画像情報の保持に必要なメモリリソースを低減することを目的とする。
図1は、本発明の一実施形態に係る情報処理装置のハードウェア構成を示す図である。
はじめに、様々な画像処理装置を例に挙げて、本情報処理装置の機能の一例である画像処理、画像認識、情報分析を行うに際しての前提の技術を説明する。
画像処理を行う画像処理装置には、入力画像の矩形領域内の要素の総和値を式(1)より計算するものがある(例えば、非特許文献1を参照のこと。)。この画像処理装置は、summed-area tableを入力画像と同サイズ(同要素数)の二次元配列とし、入力画像の座標位置(x,y)の画素値をI(x,y)とし、総和値としてC(x,y)を求める。
この画像処理装置によれば、入力画像上で水平又は垂直に配置された任意の矩形領域内の画素値I(x,y)の和を、summed-area table上の4点を参照するのみで、求めることができる。例えば、この画像処理装置は、図3に示すように(x0,y0)と(x1,y1)とを対角とする矩形領域内の画素値の総和C(x0,y0;x1,y1)を、式(2)を計算することにより求める。
参考文献1:P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features", Proc. IEEE Conf. on Computer Vision and Pattern Recognition, Vol. 1, pp.511-518, December 2001.
図4は、パターン認識処理の一例を示す図である。画像処理装置は、ある特定の大きさの矩形領域(以下「処理ウィンドウ」と称する。)801を処理対象となる入力画像800内で移動させる。そして、画像処理装置は、各移動先の処理ウィンドウ801内に人物の顔が含まれるか否かを判定する。
図5は、各移動先の位置における処理ウィンドウ801において、画像処理装置が顔検出を行う構成を示す図である。画像処理装置は、ある処理ウィンドウ内における顔検出についての処理を、複数のステージによって実行する。
ここで、各ステージには、異なる組み合わせの弱判別器が割り当てられている。各弱判別器は、所謂Haar-like特徴を検出するもので、矩形フィルタが組み合わされて構成されている。また、各ステージには、順番が割り当てられており、画像処理装置は、その順番に従って各ステージの処理を行う。例えば、画像処理装置は、第1ステージでの判定の次に第2ステージでの判定を実施し、続いて第3ステージの判定を実施する。
また、例えば、画像処理装置では、各ステージに割り当てられる弱判別器の数が異なる構成を採用している。画像処理装置は、各ステージでは、ステージに割り当てられたパターンの弱判別器を用いて、処理ウィンドウ内に人物の顔が含まれるか否かを判定する。あるステージにおいて、処理ウィンドウ内に人物の顔が含まれないと判定された場合、画像処理装置は、それ以降の順番のステージでは、この位置における処理ウィンドウについての判定を実施しない(カスケード処理が打ち切られる。)。そして、画像処理装置は、最後の順番のステージによる判定で、処理ウィンドウ内に人物の顔が含まれると判定した場合に、この移動先における処理ウィンドウ内に人物の顔が含まれると判定する。
CPU101は、情報処理装置の動作をコントロールし、外部メモリ104に格納されたプログラムの実行等を行う。
情報入力部102は、入力画像情報(画像データ)を入力する。例えば、情報入力部102は、処理対象となる入力画像情報を装置内に取り込む。なお、情報入力部102は、CCD等の画像センサによって構成されていてもよいし、ネットワーク等を介して外部装置から入力画像情報を受信するI/F装置であってもよい。ここで、本実施形態では、二次元配列の画像情報(RGB画像、Grayscale画像等の画像情報だけでなく、一次微分フィルタをかけた画像情報、加工された画像情報等も含む。)を入力画像情報と称する。
DMAC103は、CPU101が動作指令することにより、外部メモリ104、情報入力部102、及び累積画像情報演算処理部100間の所定サイズのデータ転送を自立的に連続して行う。DMAC103は、CPU101により指令された転送が完了すると、バス105を介して割り込み信号をCPU101に通知する。
外部メモリ104は、ROM、RAM、HDD等のストレージ装置であり、CPU101の動作に基づき読み込まれたプログラム、長時間記憶しなくてはならないデータ等を記憶する。外部メモリ104は、CPU101等が各種処理を行う上での作業領域として用いられる記憶領域である。また、外部メモリ104は、必要に応じて入力画像情報を保持するための領域として用いられる記憶領域であってもよい。
累積画像情報生成部111は、情報入力部102より入力された入力画像情報について、限定された位置の累積画像情報を生成し、累積画像情報保持部113は、生成された累積画像情報を保持する。ここで、本実施形態では、Summed-area table、Integral Image等の二次元配列の情報を累積画像情報と称する。
累積画像情報利用演算部112は、CPU101からの要求に従って累積画像情報保持部113に保持されている累積画像情報を読み出して種々の演算をし、演算した結果をCPU101に返す。
累積画像情報保持部113は、累積画像情報を保持するためのメモリサイズSbufの専用メモリと、専用メモリへの入出力を制御するメモリコントローラと、を含んで構成される。パラメータ保持部114は、累積画像情報演算処理部100内の各部の設定に関する情報を保持する。
本実施形態では、累積画像情報演算処理部100、CPU101、情報入力部102、DMAC103、外部メモリ104、及びバス105により、情報処理装置における機能及び後述するフローチャートに係る処理が実現される。
なお、本情報処理装置は、上述のハードウェア構成に加え、マウス、キーボード、タッチパネルデバイス、ボタン等である、各種の指示を入力する入力装置を有してもよい。また、本情報処理装置は、液晶パネル、外部モニタ等である、各種の情報を出力する出力装置を有してもよい。
本情報処理装置では、ユーザの操作、外部装置(図示せず。)からのトリガ等を契機に、処理が開始する。
ステップS1101では、読込手段の一例である情報入力部102は、入力画像情報を入力し(読込み)、入力画像情報を必要に応じて外部メモリ104に記憶する。
ステップS1102では、生成手段の一例である累積画像情報演算処理部100は、外部メモリ104に記憶された入力画像情報を用い、累積画像情報を生成する処理を行う。累積画像情報を生成する処理では、累積画像情報演算処理部100は、入力画像情報について、限定された位置の累積画像情報を生成する。なお、CPU101は、DMAC103を設定し、外部メモリ104から累積画像情報演算処理部100への入力画像情報の転送を逐次行わせる。
ステップS1103では、累積画像情報利用手段の一例である累積画像情報演算処理部100は、累積画像情報保持部113に累積画像情報が格納されると、後述の図7を参照して説明するメイン処理を行う。なお、本情報処理装置では、メイン処理として、図7で説明するパターン識別処理を行っているが、累積画像情報を用いる他の処理を適用することが可能である。また、図7に示すパターン識別処理においては、後述のステップS1003の判定処理において、各弱判別器で所定のHaar-like特徴を検出するため、各矩形領域内の要素の総和値を得る必要がある。これに対し、CPU101は、累積画像情報利用演算部112を動作させて矩形領域内の要素の総和値を高速に得ることが可能である。累積画像情報利用演算部112の動作については、図11を参照して説明する。
ステップS1104では、累積画像情報演算処理部100は、パターン識別処理等のメイン処理が終了すると、後処理を行う。後処理は、外部装置、ユーザ等に処理の結果を通知する処理、認識の結果を利用して行う諸々の処理である。
ステップS1001では、累積画像情報演算処理部100は、処理の対象となる処理ウィンドウを入力画像情報上に配置する。累積画像情報演算処理部100は、基本的には、図4に示される内容と同様に入力画像情報の端から一定間隔で縦方向及び横方向へスキャンすることによって網羅的に処理ウィンドウを順次移動して選択する。例えば、累積画像情報演算処理部100は、入力画像情報をラスタスキャンすることによって処理ウィンドウを選択する。
ステップS1002では、累積画像情報演算処理部100は、選択した処理ウィンドウについて、処理ウィンドウ内に人物の顔が含まれるか否かの判定を実施するために、カスケード処理におけるステージを選択する。なお、この判定は、図5を参照して説明したように、複数のステージを用いて実施されるので、累積画像情報演算処理部100は、判定を実施するステージとして第一のものから順に選択する。
ステップS1003では、累積画像情報演算処理部100は、選択したステージによる判定処理を実施する。この判定処理では、累積画像情報演算処理部100は、累積得点を算出する。なお、この判定処理の内容については後述する。
ステップS1005では、累積画像情報演算処理部100は、現在のステージが最終ステージであるか否かを判別する。最終ステージでなかった場合(NOである場合)、累積画像情報演算処理部100は、処理をステップS1002に戻す。なお、ステップS1002では、累積画像情報演算処理部100は、次のステージを選択し、新たに選択したステージによる判定処理を実施する。他方、最終ステージである場合(YESである場合)、累積画像情報演算処理部100は、現在の処理ウィンドウ内に人物の顔が含まれるか否かの最終的な判定をする(ステップS1006)。この時点で、累積画像情報演算処理部100は、この処理ウィンドウ内に人物の顔が含まれると判断したことになる。
ステップS1007では、累積画像情報演算処理部100は、判定の対象となっていた処理ウィンドウが、入力画像情報の中で最後の処理ウィンドウであるか否かを判別する。最後の処理ウィンドウでない場合(NOである場合)、累積画像情報演算処理部100は、処理をステップS1001に戻す。なお、ステップS1001では、累積画像情報演算処理部100は、次の処理ウィンドウを選択し、ステップS1002以降の処理を実行する。他方、最後の処理ウィンドウである場合、累積画像情報演算処理部100は、入力画像情報に対するメイン処理(顔検出処理)を終了する。
各ステージには、1以上のパターンの弱判別器が割り当てられている。この割り当ては学習処理において、AdaBoost等のブースティング学習アルゴリズムによって実施される。
したがって、累積画像情報演算処理部100は、各ステージでは、各ステージに割り当てられたパターンの弱判別器に基づいて、処理ウィンドウ内に顔が含まれるか否かの判定を行う。
より詳細に説明すると、累積画像情報演算処理部100は、各ステージでは、各ステージに割り当てられた各パターンの弱判別器に基づいて、処理ウィンドウ内の複数の矩形フィルタ(以下「局所領域」と称する。)における特徴量をそれぞれ算出する。このとき用いられる特徴量は、各局所領域内の画素値の合計、平均等、局所領域内の画素値の合計を用いて算出される物体を識別可能な値である。この局所領域内の画素値の合計(要素の総和値)は、図3で説明したように、入力画像に対する累積画像情報(Summed-area table、Integral Image等)を用いて高速に計算される。
ただし、この時点での判定は、各パターンの弱判別器それぞれに基づいた判定であり、ステージによる判定ではない。このように、累積画像情報演算処理部100は、各ステージでは、割り当てられた全てのパターンの弱判別器それぞれに基づいて個別に判定を実施し、それぞれの判定結果を得る。
このような構成により、高速なパターン識別を実現する。なお、弱判別器は、予め適正な学習が行われている場合には、顔以外のパターン識別器として用いることができる。
本実施形態の累積画像情報は、Integral Image(或いは、Summed-area table)に相当する累積画像情報の中から、生成する位置を限定した累積画像情報である。
図8は、入力画像情報と、入力画像情報の各要素の位置(入力画像情報を構成する各画素の位置)に対応する累積画像情報との関係を示す図である。図8には、入力画像情報の各要素の位置に対応する累積画像情報の位置が示されている。
図8(a)には、入力画像情報601と、入力画像情報601の1つの画素である画素602とが示されている。
図8(b)には、入力画像情報601の各画素の位置に対応する累積画像情報611が示されている。例えば、画素602に対応する累積画像情報は、累積画像情報612である。
本実施形態では、累積画像情報生成部111は、水平方向にP画素、垂直方向にQ画素の単位(P,Qは正の整数であり、少なくとも一方は2以上である。)で累積画像情報611を分割し、そのP×Q画素の中から1以上P×Q未満の任意の位置の累積画像情報を生成する。より具体的には、本実施形態では、累積画像情報生成部111が生成する累積画像情報を、P×Q画素パターン614の中から右下に位置する累積画像情報618としている。なお、累積画像情報613は、生成される累積画像情報であることを示している。
図8(c)には、画素パターンの例が示されている。ここで、本実施形態では、累積画像情報生成部111は、P×Q画素パターン614に基づいて右下に位置する累積画像情報618を生成したが、これに限られるものではない。例えば、累積画像情報生成部111は、累積画像情報615から累積画像情報617までのいずれかの累積画像情報を生成する画素パターン621から画素パターン623までの画素パターンに基づいて累積画像情報を生成してもよい。また、例えば、累積画像情報生成部111は、累積画像情報615から累積画像情報618までを組み合わせた位置を生成する画素パターン631、画素パターン632等の画素パターンに基づいて累積画像情報を生成してもよい。また、例えば、累積画像情報生成部111は、P×Q画素単位で変則的な位置を生成する画素パターン641に基づいて累積画像情報を生成してもよい。すなわち、累積画像情報生成部111(より広義には、累積画像情報演算処理部100)は、複数の画素のうち指標とする画素の位置を示す画素パターンに基づいて累積画像情報を生成する。
図9及び図10を参照して、累積画像情報生成部111の構成及び動作について説明する。ここでは、累積画像情報生成部111は、図8で説明したP=2、Q=2の画素パターン614に基づいて累積画像情報を生成するものとする。
図9は、バスI/F部110、累積画像情報生成部111、累積画像情報保持部113、及びパラメータ保持部114の構成を示す図である。また、図10は、入力画像情報から累積画像情報を生成する構成の一例を示す図である。
パラメータ保持部114は、累積画像情報サイズ記憶レジスタ201を含んで構成される。累積画像情報サイズ記憶レジスタ201は、累積画像情報生成部111で生成する累積画像情報のサイズを記憶する。累積画像情報サイズ記憶レジスタ201には、バスI/F部110を介してCPU101により処理が開始される前に値が設定される。
累積画像情報生成部111は、アドレスカウンタ202、入力値保持レジスタ203、合計値保持レジスタ204、累積値参照レジスタ205、合計値計算部206、及び累積値計算部207を含んで構成される。
入力値保持レジスタ203は、バスI/F部110を介してCPU101又はDMAC103の制御により入力される入力画像情報の要素値を一時保持する。ここでは、例えば、図10における画素1301から画素1304まで(P=2,Q=2)の画像データが要素値として順次送られてくるものとする。ここで、画素1301の位置を(x,y)とすると、画素1302から画素1304までの各位置は、(x+1,y)、(x,y+1)、(x+1,y+1)で定義される位置となる。
合計値計算部206は、入力値保持レジスタ203に保持された画素1301から画素1304までの合計値を計算する。また、合計値保持レジスタ204は、計算された合計値を保持する。
ここで、各位置の画素値をI(x,y)で表すと、合計値計算部206は、合計値Isumを、式(3)により算出する。
また、アドレスカウンタ202は、累積画像情報を求めるために必要な現在の位置の周辺の累積画像情報(換言するならば、移動先の画素パターンと近隣関係の画素パターンについて生成されている累積画像情報)の参照アドレスを計算する。例えば、現在の累積画像情報1314の位置が(x',y')であるとする。この場合、アドレスカウンタ202が参照する累積画像情報1311から累積画像情報1313までの位置は、それぞれ(x'-1,y'-1)、(x',y'-1)、(x'-1,y')となる。そこで、アドレスカウンタ202は、これらの位置に対応する累積画像情報保持部113内のアドレスを現在の位置のアドレスから計算する。ただし、現在の位置が1ライン目にある場合は、累積画像情報1311、累積画像情報1312が存在せず、1カラム目であれば累積画像情報1313が存在しない。この場合、アドレスカウンタ202は、累積画像情報の領域外であることを示す情報を累積画像情報保持部113に出力する。
アドレスカウンタ202は、計算したアドレスをメモリコントローラ113−2に与え、記憶制御手段の一例であるメモリコントローラ113−2は、記憶部の一例である累積画像情報保持メモリ113−1の当該アドレスへの書き込みと読み出しとを行う。
メモリコントローラ113−2によって読み出された累積画像情報C'(x'-1,y'-1)、C'(x',y'-1)、C'(x'-1,y')は、累積値参照レジスタ205により一時保持される。ただし、累積画像情報の領域外の情報が入力されている場合、メモリコントローラ113−2は、読み出し値として0をセットする。
なお、本実施形態では、累積画像情報生成部111は、累積画像情報を生成する位置を限定して計算を行い、累積画像情報を累積画像情報保持部113に保持する構成であるが、これに限られるものではない。例えば、累積画像情報生成部111は、一旦、全入力画素位置に対応する累積画像情報を生成した後に不要な位置の累積画像情報を間引いて累積画像情報を生成し、累積画像情報保持部113は、生成された累積画像情報を保存してもよい。この構成であっても、同様のメモリリソース削減の効果が得られる。
図11及び図12を参照して、累積画像情報利用演算部112について説明する。図11は、累積画像情報利用演算部112、累積画像情報保持部113、パラメータ保持部114、及びバスI/F部110の構成を示す図である。本実施形態では、情報処理装置は、累積画像情報を利用した演算の結果を用いる後段の処理として、パターン識別処理を行っている(例えば、図7を参照のこと。)。したがって、必要とする演算の結果は、処理ウィンドウ内に相対的に配置される、Haar-like特徴を検出する弱判別器の各局所領域内の要素の総和値である。入力画像の任意の局所領域内の要素の総和値は、図3を参照して説明したように4点の累積画像情報(要素値)を参照することで計算することができる。
ここで、CPU101は、処理ウィンドウ内における要素の総和値を求める局所領域を特定する。そして、CPU101は、この局所領域の2点の対角座標(相対座標)を、累積画像情報の原点からの絶対座標、例えば、図3における(x0,y0),(x1,y1)に変換する。そして、CPU101は、バスI/F部110を介して領域指定レジスタ301に絶対座標値を設定する。
バスI/F部110を介してCPU101から演算開始のトリガが掛かると、参照アドレス計算部302は、領域指定レジスタ301に設定されている絶対座標値を参照し、図3に示すA,B,C,Dの位置の累積画像情報を格納しているアドレスを計算する。そして、参照アドレス計算部302は、計算したアドレスをメモリコントローラ113−2に順に渡す。
メモリコントローラ113−2は、受信したアドレスに基づき累積画像情報保持メモリ113−1にアクセスし、順次取得した4点の累積画像情報を参照値一時保持レジスタ303に設定する。
参照値一時保持レジスタ303に4点の値が保持されると、加減算処理部304は、4点の値を用いた所定の加減算処理を実行する。ここで、所定の加減算処理とは、式(2)に示した演算を行うものである。なお、演算結果保持レジスタ305は、この演算の結果を保持する。CPU101は、演算の完了を、バスI/F部110を介して割り込み通知、完了フラグの参照等によって把握する。そして、CPU101は、演算結果保持レジスタ305の値を取得し、取得した値を設定されている局所領域の要素の総和値として使用する。
例としてP=2,Q=2とすると、認識処理での要素の総和値を求める座標がずれる量は、最大で1となり、計算の結果に影響が生じるとも考えられる。
このように、座標のずれの影響は、小さいと考えられるが、さらに座標のずれの影響を極力排除するには予め学習時に生成する累積画像情報の位置を考慮しておく方法が有効である。例としてP=2,Q=2とした場合、学習時に認識処理で使用する局所領域の位置を水平方向、垂直方向共に偶数となる位置に限定しておく。これによりずれを学習の段階で考慮しておくことができるため精度低下を極力抑えられる。
例えば、認識処理において、累積画像情報を使用して処理ウィンドウ内の局所領域の画素値の総和を求めるには、入力画像の全ての画素位置に対応した累積画像情報を準備しなければならない。また、基本的には、入力画像と同じサイズのXimg、Yimgが必要で、累積画像情報を減らすことができなかった。
このような事情を踏まえ、本実施形態では、情報処理装置が上述した構成を有することで、累積画像情報の保持に必要なメモリリソースを低減することができる。
すなわち、本実施形態では、累積画像情報を使用して処理ウィンドウ内の局所領域の画素値の総和を求める処理において、累積画像情報の保持に使用するバッファ容量を低減できる。
第1の実施形態では、入力画像情報について、限定された位置の累積画像情報を格納する方法について説明したが、第2の実施形態では、入力画像情報をバンド領域で分割し、分割した領域ごとに累積画像情報を生成して格納する方法について説明する。
図13は、累積画像情報保持部113の累積画像情報保持メモリ113−1を、バンドバッファとして利用する際に一時的に保持される累積画像情報に係る入力画像情報の領域を示す図である。
処理ウィンドウ701は、図4で示した処理ウィンドウに対応するものである。そして、入力画像情報700をバンドに分割するものがバンド領域711(矩形領域)、バンド領域712(矩形領域)である。バンド領域711は、処理の開始時に入力されるバンド領域であり、バンド領域712は、所定ライン数(ここでは、1ライン)だけ下方に移動したバンド領域である。
バンド領域711の高さYbandは、処理ウィンドウ領域の高さ又はそれ以上に定められる。なお、本実施形態では、Ybandを処理ウィンドウ領域の高さと等しく定めている。また、バンド領域711の幅Xbandは、入力画像情報の幅に等しい。そして、バンド領域711の各要素に対して第1の実施形態と同様に生成する位置を限定した累積画像情報が累積画像情報721である。また、バンド領域712についても同様に、生成する位置を限定した累積画像情報が累積画像情報722である。そして、この累積画像情報721等が累積画像情報保持部113の累積画像情報保持メモリ113−1に保持される。
第1の実施形態では、情報処理装置がP×Q画素単位で累積画像情報を生成する位置の限定を行う方法を説明した。この方法は、本実施形態にも同様に適用でき、累積画像情報721の幅は、バンド領域の幅Xbandの1/P、累積画像情報721の高さは、バンド領域の高さYbandの1/Qのサイズとなる。そして累積画像情報保持部113の累積画像情報保持メモリ113−1をバンドバッファとして使うために必要なバッファサイズS''bufは、式(10)により算出される。
すなわち、第2の実施形態では、入力画像情報をバンド領域に分割して情報入力し(ステップS1201)、全バンド領域の処理が完了するまでループさせる(ステップS1205)構成が第1の実施形態に係る構成と異なる点である。
なお、本実施形態では、情報処理装置は、ステップS1201における入力画像情報をバンド領域に分割し、分割した情報を入力している。すなわち、情報処理装置は、入力画像情報を外部メモリ104が一旦保持し、CPU101又はDMAC103が1回目にバンド領域711に対応する画像データを送り、2回目にバンド領域712に対応する画像データを送る構成を有する。
また、ここで示した逐次処理は、一例であって、情報処理装置は、情報入力部102から入力される入力画像情報が外部メモリ104に1バンド領域分たまった場合に、累積画像情報を生成する処理を開始するようにパイプライン的に処理を行ってもよい。
また、本実施形態では、情報処理装置は、バンド領域711についての処理が終わった後に、バンド領域712を最初から送りなおす。しかしながら、情報処理装置は、差分だけのデータを転送して処理できるように累積画像情報保持メモリ113−1をリングバッファとして利用してもよい。
第1の実施形態及び第2の実施形態では、情報処理装置が二次元配列の情報に対して累積画像情報を生成する構成について説明したが、累積画像情報の保持に必要なバッファサイズの低減は、三次元以上の多次元配列の情報に対しても実現することができる。そこで、第3の実施形態では、三次元配列の情報を例に挙げて、情報処理装置が累積画像情報を生成する構成について説明する。三次元配列の入力画像情報とは、例えば動画情報であって、二次元配列の方法に時間軸の一次元が加わり三次元配列の情報となる。
また、三次元を超える多次元の入力画像情報に対する累積画像情報であっても、同様に超直方体で考えれば、入力画像情報について、限定した位置の累積画像情報をバッファサイズに保持することによりバッファサイズを低減させることができる。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (7)
- 記憶部を含んで構成される情報処理装置であって、
入力画像情報を読み込む読込手段と、
前記読込手段で読み込まれた入力画像情報と、複数の画素のうち指標とする画素の位置を示す画素パターンとに基づいて、前記指標とする画素の位置に対応する前記入力画像情報の位置についての累積画像情報を生成する生成手段と、
前記生成手段で生成された累積画像情報を前記記憶部に記憶する記憶制御手段と、
を有する、情報処理装置。 - 前記生成手段は、前記入力画像情報に対して前記画素パターンを順次移動し、移動した画素パターンについての前記複数の画素の各位置に対応する前記入力画像情報の位置の画素の合計値を算出し、算出した合計値と、前記移動した画素パターンと近隣関係の画素パターンについて生成された累積画像情報とに基づいて、前記移動した画素パターンに係る累積画像情報を生成する、請求項1記載の情報処理装置。
- 前記記憶部に記憶された累積画像情報に基づいて、物体を識別可能な特徴量を算出する累積画像情報利用手段を更に有する、請求項1又は2記載の情報処理装置。
- 前記累積画像情報利用手段は、前記入力画像情報の一部の領域を表す局所領域に対応した特徴量と、前記局所領域に含まれる位置の画素パターンに係る累積画像情報及び前記局所領域と近隣関係の画素パターンに係る累積画像情報から算出された特徴量とに基づいて、前記入力画像情報に前記物体を表す画像情報が含まれるか否かを判別する、請求項3記載の情報処理装置。
- 前記読込手段は、前記入力画像情報を分割して読み込む、請求項1乃至4の何れか1項記載の情報処理装置。
- 前記読込手段は、前記入力画像情報として、動画情報を読み込む、請求項1乃至5の何れか1項記載の情報処理装置。
- 記憶部を含んで構成される情報処理装置による情報処理方法であって、
入力画像情報を読み込む読込工程と、
前記読込工程で読み込まれた入力画像情報と、複数の画素のうち指標とする画素の位置を示す画素パターンとに基づいて、前記指標とする画素の位置に対応する前記入力画像情報の位置についての累積画像情報を生成する生成工程と、
前記生成工程で生成された累積画像情報を前記記憶部に記憶する記憶工程と、
を有する、情報処理方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009292941A JP5388835B2 (ja) | 2009-12-24 | 2009-12-24 | 情報処理装置及び情報処理方法 |
US12/970,718 US9076067B2 (en) | 2009-12-24 | 2010-12-16 | Information processing apparatus and method for classifier-based object detection |
KR1020100130400A KR101465035B1 (ko) | 2009-12-24 | 2010-12-20 | 정보처리장치 및 정보처리방법 |
CN201010608533.XA CN102110284B (zh) | 2009-12-24 | 2010-12-21 | 信息处理设备及信息处理方法 |
EP10196123.3A EP2339509A3 (en) | 2009-12-24 | 2010-12-21 | Information processing apparatus and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009292941A JP5388835B2 (ja) | 2009-12-24 | 2009-12-24 | 情報処理装置及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011134102A JP2011134102A (ja) | 2011-07-07 |
JP5388835B2 true JP5388835B2 (ja) | 2014-01-15 |
Family
ID=43828112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009292941A Active JP5388835B2 (ja) | 2009-12-24 | 2009-12-24 | 情報処理装置及び情報処理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9076067B2 (ja) |
EP (1) | EP2339509A3 (ja) |
JP (1) | JP5388835B2 (ja) |
KR (1) | KR101465035B1 (ja) |
CN (1) | CN102110284B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101522985B1 (ko) * | 2008-10-31 | 2015-05-27 | 삼성전자주식회사 | 영상처리 장치 및 방법 |
JP5548087B2 (ja) * | 2010-09-30 | 2014-07-16 | オリンパス株式会社 | 演算装置および演算方法 |
US20120328160A1 (en) * | 2011-06-27 | 2012-12-27 | Office of Research Cooperation Foundation of Yeungnam University | Method for detecting and recognizing objects of an image using haar-like features |
JP5868054B2 (ja) * | 2011-07-26 | 2016-02-24 | キヤノン株式会社 | パターン識別装置、方法及びプログラム |
JP5777458B2 (ja) * | 2011-09-12 | 2015-09-09 | キヤノン株式会社 | パターン識別装置、パターン識別方法及びプログラム |
CN104620285B (zh) * | 2012-09-14 | 2017-04-12 | 本田技研工业株式会社 | 对象物识别装置 |
US9432671B2 (en) * | 2014-05-22 | 2016-08-30 | Xerox Corporation | Method and apparatus for classifying machine printed text and handwritten text |
JP6569224B2 (ja) * | 2015-01-26 | 2019-09-04 | ヤマハ株式会社 | 歌唱評価装置、歌唱評価方法およびプログラム |
CN107368836A (zh) * | 2016-05-12 | 2017-11-21 | 北京君正集成电路股份有限公司 | 一种获取积分图的方法及装置 |
CN110415229B (zh) * | 2019-07-25 | 2022-04-26 | 广西科技大学 | 基于Haar特征和AdaBoost算法的纹理图像质量估计方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7099510B2 (en) * | 2000-11-29 | 2006-08-29 | Hewlett-Packard Development Company, L.P. | Method and system for object detection in digital images |
JP3932379B2 (ja) * | 2001-10-02 | 2007-06-20 | 株式会社日立製作所 | 画像処理装置と撮像素子 |
JP2008021228A (ja) * | 2006-07-14 | 2008-01-31 | Renesas Technology Corp | データ処理装置 |
JP4582079B2 (ja) * | 2006-10-19 | 2010-11-17 | トヨタ自動車株式会社 | 画像識別装置および画像識別方法 |
CN101196984B (zh) | 2006-12-18 | 2010-05-19 | 北京海鑫科金高科技股份有限公司 | 一种快速人脸检测方法 |
JP5058681B2 (ja) | 2007-05-31 | 2012-10-24 | キヤノン株式会社 | 情報処理方法及び装置、プログラム、記憶媒体 |
CN100561505C (zh) | 2007-12-05 | 2009-11-18 | 北京中星微电子有限公司 | 一种图像检测方法及装置 |
CN100561501C (zh) | 2007-12-18 | 2009-11-18 | 北京中星微电子有限公司 | 一种图像检测方法及装置 |
US8315473B1 (en) * | 2008-08-22 | 2012-11-20 | Adobe Systems Incorporated | Variably fast and continuous bilateral approximation filtering using histogram manipulations |
JP5340088B2 (ja) * | 2009-09-07 | 2013-11-13 | キヤノン株式会社 | 情報処理方法及び装置 |
US8295610B1 (en) * | 2010-01-06 | 2012-10-23 | Apple Inc. | Feature scaling for face detection |
-
2009
- 2009-12-24 JP JP2009292941A patent/JP5388835B2/ja active Active
-
2010
- 2010-12-16 US US12/970,718 patent/US9076067B2/en active Active
- 2010-12-20 KR KR1020100130400A patent/KR101465035B1/ko active IP Right Grant
- 2010-12-21 CN CN201010608533.XA patent/CN102110284B/zh not_active Expired - Fee Related
- 2010-12-21 EP EP10196123.3A patent/EP2339509A3/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
KR20110074453A (ko) | 2011-06-30 |
EP2339509A2 (en) | 2011-06-29 |
CN102110284A (zh) | 2011-06-29 |
KR101465035B1 (ko) | 2014-11-25 |
EP2339509A3 (en) | 2013-11-27 |
US9076067B2 (en) | 2015-07-07 |
JP2011134102A (ja) | 2011-07-07 |
CN102110284B (zh) | 2014-12-17 |
US20110158544A1 (en) | 2011-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5388835B2 (ja) | 情報処理装置及び情報処理方法 | |
JP5340088B2 (ja) | 情報処理方法及び装置 | |
JP5058681B2 (ja) | 情報処理方法及び装置、プログラム、記憶媒体 | |
JP6432162B2 (ja) | 画像照合方法、画像照合装置、モデルテンプレート生成方法、モデルテンプレート生成装置、およびプログラム | |
JP6937508B2 (ja) | 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム | |
JP7402623B2 (ja) | フィルタ処理装置及びその制御方法 | |
JP2020017082A (ja) | 画像オブジェクト抽出装置及びプログラム | |
JP6815741B2 (ja) | 画像処理装置および画像処理方法 | |
US20210004667A1 (en) | Operation processing apparatus and operation processing method | |
JP5759126B2 (ja) | パターン識別装置及びその制御方法、プログラム | |
JP6082312B2 (ja) | テンプレート画像候補領域決定装置、テンプレート画像候補領域決定方法、及びプログラム | |
JP2013061737A (ja) | パターン識別装置、パターン識別方法及びプログラム | |
JP2022140857A (ja) | マシンビジョン用の画像データを処理するための方法及び装置 | |
JP5396977B2 (ja) | データ処理装置、データ処理方法およびプログラム | |
JP2011141664A (ja) | 文書比較装置、文書比較方法、及びプログラム | |
JP5083162B2 (ja) | 画像データ判定装置、画像データ判定システム、及びプログラム | |
JP2014153937A (ja) | 特徴量算出装置、方法及びプログラム | |
JP4865021B2 (ja) | 画像処理装置および画像処理方法 | |
JP5674535B2 (ja) | 画像処理装置、方法、及びプログラム | |
WO2023119642A1 (ja) | 情報処理装置、情報処理方法、及び記録媒体 | |
JP2003124815A (ja) | 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム | |
JP2022187564A (ja) | 学習装置、学習方法及びプログラム | |
JPH07200804A (ja) | 画像縮小方法および画像処理装置 | |
JPH03240175A (ja) | ヒストグラム計算回路 | |
KR20170068774A (ko) | 적분 영상을 사용하지 않는 surf 특징점 추출 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121225 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130903 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131008 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5388835 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |