JP5388835B2 - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP5388835B2
JP5388835B2 JP2009292941A JP2009292941A JP5388835B2 JP 5388835 B2 JP5388835 B2 JP 5388835B2 JP 2009292941 A JP2009292941 A JP 2009292941A JP 2009292941 A JP2009292941 A JP 2009292941A JP 5388835 B2 JP5388835 B2 JP 5388835B2
Authority
JP
Japan
Prior art keywords
image information
cumulative
input image
information
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009292941A
Other languages
English (en)
Other versions
JP2011134102A (ja
Inventor
賀保 橋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009292941A priority Critical patent/JP5388835B2/ja
Priority to US12/970,718 priority patent/US9076067B2/en
Priority to KR1020100130400A priority patent/KR101465035B1/ko
Priority to CN201010608533.XA priority patent/CN102110284B/zh
Priority to EP10196123.3A priority patent/EP2339509A3/en
Publication of JP2011134102A publication Critical patent/JP2011134102A/ja
Application granted granted Critical
Publication of JP5388835B2 publication Critical patent/JP5388835B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/446Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7747Organisation of the process, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Description

本発明は、情報処理装置及び情報処理方法に関する。
従来、情報処理分野においては、多次元配列の情報が頻繁に取り扱われている。その中でも、画像処理、画像認識、画像合成等に関わる一部処理、統計処理等では、特定領域の範囲内における要素の総和値を求めて使用することが多い。
近年、コンピュータ・グラフィックスの分野では、F. C. Crowにより長方形のsummed-area tableと称される、元の入力画像情報に対する累積画像情報の概念が提案されている(例えば、非特許文献1参照)。
F. C. Crow, "Summed-Area Tables For Texture Mapping", Computer Graphics, 1984.
しかしながら、累積画像情報を使用して処理ウィンドウ内の矩形領域の要素の総和を求めるには入力画像情報の全ての画素位置に対応した累積画像情報を準備しなければならず、累積画像情報の保持に多くのメモリリソースを消費する問題があった。
本発明はこのような問題点に鑑みなされたもので、累積画像情報の保持に必要なメモリリソースを低減することを目的とする。
そこで、本発明は、記憶部を含んで構成される情報処理装置であって、入力画像情報を読み込む読込手段と、前記読込手段で読み込まれた入力画像情報と、複数の画素のうち指標とする画素の位置を示す画素パターンとに基づいて、前記指標とする画素の位置に対応する前記入力画像情報の位置についての累積画像情報を生成する生成手段と、前記生成手段で生成された累積画像情報を前記記憶部に記憶する記憶制御手段と、を有することを特徴とする。
本発明によれば、累積画像情報の保持に必要なメモリリソースを低減することができる。
情報処理装置のハードウェア構成の一例を示す図である。 入力画像情報と累積画像情報との関係を示す図である。 累積画像情報を用いて矩形領域内の要素の総和値を求める概念を示す図である。 パターン認識処理の一例を示す図である。 複数の弱判別器で構成されるパターン識別器の構成の一例を示す図である。 情報処理装置の全体的な処理に係るフローチャートを示す図である。 パターン識別器における処理に係るフローチャートを示す図である。 入力画像情報と累積画像情報との対応を示す図である。 累積画像情報生成部の構成を示す図である。 入力画像情報と生成する累積画像情報との関係を示す図である。 累積画像情報利用演算部の構成を示す図である。 位置ずれに対する相関性を説明するための図である。 バンド領域を示す図である。 第2の実施形態の情報処理装置の全体的な処理に係るフローチャートを示す図である。 多次元累積画像情報の一例である三次元の累画像積情報を示す図である。
以下、本発明の実施形態について図面に基づいて説明する。
(第1の実施形態)
図1は、本発明の一実施形態に係る情報処理装置のハードウェア構成を示す図である。
はじめに、様々な画像処理装置を例に挙げて、本情報処理装置の機能の一例である画像処理、画像認識、情報分析を行うに際しての前提の技術を説明する。
画像処理を行う画像処理装置には、入力画像の矩形領域内の要素の総和値を式(1)より計算するものがある(例えば、非特許文献1を参照のこと。)。この画像処理装置は、summed-area tableを入力画像と同サイズ(同要素数)の二次元配列とし、入力画像の座標位置(x,y)の画素値をI(x,y)とし、総和値としてC(x,y)を求める。
Figure 0005388835
例えば、図2に示すように、summed-area table20の位置(x,y)の値C(x,y)は、元の入力画像10において、原点位置(0,0)と位置(x,y)とを対角とする長方形内の要素の総和値となる。なお、非特許文献1では、summed-area tableの原点位置が画像左下として説明されている。
この画像処理装置によれば、入力画像上で水平又は垂直に配置された任意の矩形領域内の画素値I(x,y)の和を、summed-area table上の4点を参照するのみで、求めることができる。例えば、この画像処理装置は、図3に示すように(x0,y0)と(x1,y1)とを対角とする矩形領域内の画素値の総和C(x0,y0;x1,y1)を、式(2)を計算することにより求める。
Figure 0005388835
したがって、この画像処理装置は、入力画像上の任意の矩形領域内の画素値の総和を高速に求めることができる。
他方、画像認識の分野においては、ViolaとJonesとが上記summed-area tableと同等の累積画像情報をIntegral imageと称している(例えば、参考文献1参照のこと。)。Integral imageを用いた複数の矩形フィルタからなる弱判別器をカスケード接続する構成を備える画像処理装置は、高速な顔検出処理を実現している。
参考文献1:P. Viola, M. Jones, "Rapid Object Detection using a Boosted Cascade of Simple Features", Proc. IEEE Conf. on Computer Vision and Pattern Recognition, Vol. 1, pp.511-518, December 2001.
この画像処理装置による画像認識における顔の認識の方法(パターン識別法)について説明する。
図4は、パターン認識処理の一例を示す図である。画像処理装置は、ある特定の大きさの矩形領域(以下「処理ウィンドウ」と称する。)801を処理対象となる入力画像800内で移動させる。そして、画像処理装置は、各移動先の処理ウィンドウ801内に人物の顔が含まれるか否かを判定する。
図5は、各移動先の位置における処理ウィンドウ801において、画像処理装置が顔検出を行う構成を示す図である。画像処理装置は、ある処理ウィンドウ内における顔検出についての処理を、複数のステージによって実行する。
ここで、各ステージには、異なる組み合わせの弱判別器が割り当てられている。各弱判別器は、所謂Haar-like特徴を検出するもので、矩形フィルタが組み合わされて構成されている。また、各ステージには、順番が割り当てられており、画像処理装置は、その順番に従って各ステージの処理を行う。例えば、画像処理装置は、第1ステージでの判定の次に第2ステージでの判定を実施し、続いて第3ステージの判定を実施する。
また、例えば、画像処理装置では、各ステージに割り当てられる弱判別器の数が異なる構成を採用している。画像処理装置は、各ステージでは、ステージに割り当てられたパターンの弱判別器を用いて、処理ウィンドウ内に人物の顔が含まれるか否かを判定する。あるステージにおいて、処理ウィンドウ内に人物の顔が含まれないと判定された場合、画像処理装置は、それ以降の順番のステージでは、この位置における処理ウィンドウについての判定を実施しない(カスケード処理が打ち切られる。)。そして、画像処理装置は、最後の順番のステージによる判定で、処理ウィンドウ内に人物の顔が含まれると判定した場合に、この移動先における処理ウィンドウ内に人物の顔が含まれると判定する。
図1に示すように、本情報処理装置は、累積画像情報演算処理部100、CPU101、情報入力部102、DMAC103、外部メモリ104、及びバス105を含んで構成される。CPUは、Central Processing Unitの略称であり、DMACは、Direct Memory Access controllerの略称である。なお、各装置(ハードウェア)は、互いにバス105を介して接続され、通信可能に構成されている。
CPU101は、情報処理装置の動作をコントロールし、外部メモリ104に格納されたプログラムの実行等を行う。
情報入力部102は、入力画像情報(画像データ)を入力する。例えば、情報入力部102は、処理対象となる入力画像情報を装置内に取り込む。なお、情報入力部102は、CCD等の画像センサによって構成されていてもよいし、ネットワーク等を介して外部装置から入力画像情報を受信するI/F装置であってもよい。ここで、本実施形態では、二次元配列の画像情報(RGB画像、Grayscale画像等の画像情報だけでなく、一次微分フィルタをかけた画像情報、加工された画像情報等も含む。)を入力画像情報と称する。
DMAC103は、CPU101が動作指令することにより、外部メモリ104、情報入力部102、及び累積画像情報演算処理部100間の所定サイズのデータ転送を自立的に連続して行う。DMAC103は、CPU101により指令された転送が完了すると、バス105を介して割り込み信号をCPU101に通知する。
外部メモリ104は、ROM、RAM、HDD等のストレージ装置であり、CPU101の動作に基づき読み込まれたプログラム、長時間記憶しなくてはならないデータ等を記憶する。外部メモリ104は、CPU101等が各種処理を行う上での作業領域として用いられる記憶領域である。また、外部メモリ104は、必要に応じて入力画像情報を保持するための領域として用いられる記憶領域であってもよい。
累積画像情報演算処理部100は、バスI/F部110、累積画像情報生成部111、累積画像情報利用演算部112、累積画像情報保持部113、及びパラメータ保持部114を含んで構成される。
累積画像情報生成部111は、情報入力部102より入力された入力画像情報について、限定された位置の累積画像情報を生成し、累積画像情報保持部113は、生成された累積画像情報を保持する。ここで、本実施形態では、Summed-area table、Integral Image等の二次元配列の情報を累積画像情報と称する。
累積画像情報利用演算部112は、CPU101からの要求に従って累積画像情報保持部113に保持されている累積画像情報を読み出して種々の演算をし、演算した結果をCPU101に返す。
累積画像情報保持部113は、累積画像情報を保持するためのメモリサイズSbufの専用メモリと、専用メモリへの入出力を制御するメモリコントローラと、を含んで構成される。パラメータ保持部114は、累積画像情報演算処理部100内の各部の設定に関する情報を保持する。
本実施形態では、累積画像情報演算処理部100、CPU101、情報入力部102、DMAC103、外部メモリ104、及びバス105により、情報処理装置における機能及び後述するフローチャートに係る処理が実現される。
なお、本情報処理装置は、上述のハードウェア構成に加え、マウス、キーボード、タッチパネルデバイス、ボタン等である、各種の指示を入力する入力装置を有してもよい。また、本情報処理装置は、液晶パネル、外部モニタ等である、各種の情報を出力する出力装置を有してもよい。
次に、図6を参照して、情報処理装置における処理について説明する。図6は、情報処理装置における処理に係るフローチャートを示す図である。
本情報処理装置では、ユーザの操作、外部装置(図示せず。)からのトリガ等を契機に、処理が開始する。
ステップS1101では、読込手段の一例である情報入力部102は、入力画像情報を入力し(読込み)、入力画像情報を必要に応じて外部メモリ104に記憶する。
ステップS1102では、生成手段の一例である累積画像情報演算処理部100は、外部メモリ104に記憶された入力画像情報を用い、累積画像情報を生成する処理を行う。累積画像情報を生成する処理では、累積画像情報演算処理部100は、入力画像情報について、限定された位置の累積画像情報を生成する。なお、CPU101は、DMAC103を設定し、外部メモリ104から累積画像情報演算処理部100への入力画像情報の転送を逐次行わせる。
ステップS1103では、累積画像情報利用手段の一例である累積画像情報演算処理部100は、累積画像情報保持部113に累積画像情報が格納されると、後述の図7を参照して説明するメイン処理を行う。なお、本情報処理装置では、メイン処理として、図7で説明するパターン識別処理を行っているが、累積画像情報を用いる他の処理を適用することが可能である。また、図7に示すパターン識別処理においては、後述のステップS1003の判定処理において、各弱判別器で所定のHaar-like特徴を検出するため、各矩形領域内の要素の総和値を得る必要がある。これに対し、CPU101は、累積画像情報利用演算部112を動作させて矩形領域内の要素の総和値を高速に得ることが可能である。累積画像情報利用演算部112の動作については、図11を参照して説明する。
ステップS1104では、累積画像情報演算処理部100は、パターン識別処理等のメイン処理が終了すると、後処理を行う。後処理は、外部装置、ユーザ等に処理の結果を通知する処理、認識の結果を利用して行う諸々の処理である。
本実施形態では、処理が逐次的に行われる構成を採用しているが、これに限られるものではない。例えば、本情報処理装置における後段の処理等で入力画像情報がそのまま利用されない場合には、情報処理装置は、ステップS1101とS1102とを並列に処理してもよい。すなわち、情報処理装置は、1ライン入力される毎にステップS1101とS1102とを繰り返してもよいし、1要素入力単位でパイプライン的に連続して処理してもよい。このとき、CPU101は、DMAC103に対し、情報入力部102から累積画像情報演算処理部100に入力画像情報の各要素を自動で逐次転送するように設定してもよい。なお、後段の処理とは、累積画像情報を用いるステップS1103以降の処理を指している。
図7は、メイン処理(本実施形態では、顔検出処理)に係るフローチャートを示す図である。ここで、図7を参照して、メイン処理について説明する。
ステップS1001では、累積画像情報演算処理部100は、処理の対象となる処理ウィンドウを入力画像情報上に配置する。累積画像情報演算処理部100は、基本的には、図4に示される内容と同様に入力画像情報の端から一定間隔で縦方向及び横方向へスキャンすることによって網羅的に処理ウィンドウを順次移動して選択する。例えば、累積画像情報演算処理部100は、入力画像情報をラスタスキャンすることによって処理ウィンドウを選択する。
ステップS1002では、累積画像情報演算処理部100は、選択した処理ウィンドウについて、処理ウィンドウ内に人物の顔が含まれるか否かの判定を実施するために、カスケード処理におけるステージを選択する。なお、この判定は、図5を参照して説明したように、複数のステージを用いて実施されるので、累積画像情報演算処理部100は、判定を実施するステージとして第一のものから順に選択する。
ステップS1003では、累積画像情報演算処理部100は、選択したステージによる判定処理を実施する。この判定処理では、累積画像情報演算処理部100は、累積得点を算出する。なお、この判定処理の内容については後述する。
ステップS1004では、累積画像情報演算処理部100は、累積得点がステージごとに予め定められている閾値を超えたか否かを判別する。閾値を越えなかった場合(NOである場合)、累積画像情報演算処理部100は、処理ウィンドウ内に人物の顔が含まれないと判定し(ステップS1008)、ステップS1007の処理を実行する。他方、累積得点がステージごとに予め定められている閾値を超えた場合(YESである場合)、累積画像情報演算処理部100は、続いて、ステップS1005の処理を行う。
ステップS1005では、累積画像情報演算処理部100は、現在のステージが最終ステージであるか否かを判別する。最終ステージでなかった場合(NOである場合)、累積画像情報演算処理部100は、処理をステップS1002に戻す。なお、ステップS1002では、累積画像情報演算処理部100は、次のステージを選択し、新たに選択したステージによる判定処理を実施する。他方、最終ステージである場合(YESである場合)、累積画像情報演算処理部100は、現在の処理ウィンドウ内に人物の顔が含まれるか否かの最終的な判定をする(ステップS1006)。この時点で、累積画像情報演算処理部100は、この処理ウィンドウ内に人物の顔が含まれると判断したことになる。
ステップS1007では、累積画像情報演算処理部100は、判定の対象となっていた処理ウィンドウが、入力画像情報の中で最後の処理ウィンドウであるか否かを判別する。最後の処理ウィンドウでない場合(NOである場合)、累積画像情報演算処理部100は、処理をステップS1001に戻す。なお、ステップS1001では、累積画像情報演算処理部100は、次の処理ウィンドウを選択し、ステップS1002以降の処理を実行する。他方、最後の処理ウィンドウである場合、累積画像情報演算処理部100は、入力画像情報に対するメイン処理(顔検出処理)を終了する。
次に、各ステージにおける判定処理の内容について説明する。
各ステージには、1以上のパターンの弱判別器が割り当てられている。この割り当ては学習処理において、AdaBoost等のブースティング学習アルゴリズムによって実施される。
したがって、累積画像情報演算処理部100は、各ステージでは、各ステージに割り当てられたパターンの弱判別器に基づいて、処理ウィンドウ内に顔が含まれるか否かの判定を行う。
より詳細に説明すると、累積画像情報演算処理部100は、各ステージでは、各ステージに割り当てられた各パターンの弱判別器に基づいて、処理ウィンドウ内の複数の矩形フィルタ(以下「局所領域」と称する。)における特徴量をそれぞれ算出する。このとき用いられる特徴量は、各局所領域内の画素値の合計、平均等、局所領域内の画素値の合計を用いて算出される物体を識別可能な値である。この局所領域内の画素値の合計(要素の総和値)は、図3で説明したように、入力画像に対する累積画像情報(Summed-area table、Integral Image等)を用いて高速に計算される。
次に、累積画像情報演算処理部100は、算出した特徴量の相対値(比、差分値等。ここでは特徴量の差分値を算出するものとする。)としての差分値を算出し、この差分値に基づいて処理ウィンドウに人物の顔が含まれるか否かの判定を実施する。より具体的には、累積画像情報演算処理部100は、算出した差分値が、判定に用いられているパターンの弱判別器に設定された閾値よりも大きいか否か(或いは、小さいか否か)を判断する。そして、累積画像情報演算処理部100は、この判断の結果に応じて、処理ウィンドウにおける人物の顔の存否を判定する。
ただし、この時点での判定は、各パターンの弱判別器それぞれに基づいた判定であり、ステージによる判定ではない。このように、累積画像情報演算処理部100は、各ステージでは、割り当てられた全てのパターンの弱判別器それぞれに基づいて個別に判定を実施し、それぞれの判定結果を得る。
次に、累積画像情報演算処理部100は、ステージにおける累積得点を算出する。ここで、各パターンの弱判別器には、個別の得点が割り当てられている。累積画像情報演算処理部100は、処理ウィンドウ内に人物の顔が含まれると判定すると、そのとき使用したパターンの弱判別器に割り当てられた得点を参照し、参照している得点を当該ステージの累積得点に加算する。このようにして、累積画像情報演算処理部100は、加算した得点の総計を、ステージにおける累積得点として算出する。そして、累積画像情報演算処理部100は、このステージにおける累積得点が特定の閾値(累積得点閾値)を越えた場合に、このステージでは処理ウィンドウ内に人物の顔が含まれる可能性が有ると判定し、次のステージでの処理を行う。他方、ステージにおける累積得点が累積得点閾値を越えない場合、累積画像情報演算処理部100は、このステージでは処理ウィンドウ内に人物の顔が含まれないと判定し、カスケード処理を打ち切る。
このような構成により、高速なパターン識別を実現する。なお、弱判別器は、予め適正な学習が行われている場合には、顔以外のパターン識別器として用いることができる。
(累積画像情報の説明)
本実施形態の累積画像情報は、Integral Image(或いは、Summed-area table)に相当する累積画像情報の中から、生成する位置を限定した累積画像情報である。
図8は、入力画像情報と、入力画像情報の各要素の位置(入力画像情報を構成する各画素の位置)に対応する累積画像情報との関係を示す図である。図8には、入力画像情報の各要素の位置に対応する累積画像情報の位置が示されている。
図8(a)には、入力画像情報601と、入力画像情報601の1つの画素である画素602とが示されている。
図8(b)には、入力画像情報601の各画素の位置に対応する累積画像情報611が示されている。例えば、画素602に対応する累積画像情報は、累積画像情報612である。
本実施形態では、累積画像情報生成部111は、水平方向にP画素、垂直方向にQ画素の単位(P,Qは正の整数であり、少なくとも一方は2以上である。)で累積画像情報611を分割し、そのP×Q画素の中から1以上P×Q未満の任意の位置の累積画像情報を生成する。より具体的には、本実施形態では、累積画像情報生成部111が生成する累積画像情報を、P×Q画素パターン614の中から右下に位置する累積画像情報618としている。なお、累積画像情報613は、生成される累積画像情報であることを示している。
図8(c)には、画素パターンの例が示されている。ここで、本実施形態では、累積画像情報生成部111は、P×Q画素パターン614に基づいて右下に位置する累積画像情報618を生成したが、これに限られるものではない。例えば、累積画像情報生成部111は、累積画像情報615から累積画像情報617までのいずれかの累積画像情報を生成する画素パターン621から画素パターン623までの画素パターンに基づいて累積画像情報を生成してもよい。また、例えば、累積画像情報生成部111は、累積画像情報615から累積画像情報618までを組み合わせた位置を生成する画素パターン631、画素パターン632等の画素パターンに基づいて累積画像情報を生成してもよい。また、例えば、累積画像情報生成部111は、P×Q画素単位で変則的な位置を生成する画素パターン641に基づいて累積画像情報を生成してもよい。すなわち、累積画像情報生成部111(より広義には、累積画像情報演算処理部100)は、複数の画素のうち指標とする画素の位置を示す画素パターンに基づいて累積画像情報を生成する。
(累積画像情報生成部の説明)
図9及び図10を参照して、累積画像情報生成部111の構成及び動作について説明する。ここでは、累積画像情報生成部111は、図8で説明したP=2、Q=2の画素パターン614に基づいて累積画像情報を生成するものとする。
図9は、バスI/F部110、累積画像情報生成部111、累積画像情報保持部113、及びパラメータ保持部114の構成を示す図である。また、図10は、入力画像情報から累積画像情報を生成する構成の一例を示す図である。
パラメータ保持部114は、累積画像情報サイズ記憶レジスタ201を含んで構成される。累積画像情報サイズ記憶レジスタ201は、累積画像情報生成部111で生成する累積画像情報のサイズを記憶する。累積画像情報サイズ記憶レジスタ201には、バスI/F部110を介してCPU101により処理が開始される前に値が設定される。
累積画像情報生成部111は、アドレスカウンタ202、入力値保持レジスタ203、合計値保持レジスタ204、累積値参照レジスタ205、合計値計算部206、及び累積値計算部207を含んで構成される。
入力値保持レジスタ203は、バスI/F部110を介してCPU101又はDMAC103の制御により入力される入力画像情報の要素値を一時保持する。ここでは、例えば、図10における画素1301から画素1304まで(P=2,Q=2)の画像データが要素値として順次送られてくるものとする。ここで、画素1301の位置を(x,y)とすると、画素1302から画素1304までの各位置は、(x+1,y)、(x,y+1)、(x+1,y+1)で定義される位置となる。
合計値計算部206は、入力値保持レジスタ203に保持された画素1301から画素1304までの合計値を計算する。また、合計値保持レジスタ204は、計算された合計値を保持する。
ここで、各位置の画素値をI(x,y)で表すと、合計値計算部206は、合計値Isumを、式(3)により算出する。
Figure 0005388835
アドレスカウンタ202は、累積画像情報サイズ記憶レジスタ201に記憶されている累積画像情報のサイズに基づき、合計値保持レジスタ204に合計値が入力される毎に、累積画像情報を格納すべき累積画像情報保持部113のメモリアドレスを計算する。例えば、アドレスカウンタ202は、最初の合計値(累積画像情報の原点位置)が入力されると、格納すべきアドレスを0又は所定のオフセット値にリセットし、以後終端まで、格納先アドレスを1ずつインクリメントする。
また、アドレスカウンタ202は、累積画像情報を求めるために必要な現在の位置の周辺の累積画像情報(換言するならば、移動先の画素パターンと近隣関係の画素パターンについて生成されている累積画像情報)の参照アドレスを計算する。例えば、現在の累積画像情報1314の位置が(x',y')であるとする。この場合、アドレスカウンタ202が参照する累積画像情報1311から累積画像情報1313までの位置は、それぞれ(x'-1,y'-1)、(x',y'-1)、(x'-1,y')となる。そこで、アドレスカウンタ202は、これらの位置に対応する累積画像情報保持部113内のアドレスを現在の位置のアドレスから計算する。ただし、現在の位置が1ライン目にある場合は、累積画像情報1311、累積画像情報1312が存在せず、1カラム目であれば累積画像情報1313が存在しない。この場合、アドレスカウンタ202は、累積画像情報の領域外であることを示す情報を累積画像情報保持部113に出力する。
アドレスカウンタ202は、計算したアドレスをメモリコントローラ113−2に与え、記憶制御手段の一例であるメモリコントローラ113−2は、記憶部の一例である累積画像情報保持メモリ113−1の当該アドレスへの書き込みと読み出しとを行う。
メモリコントローラ113−2によって読み出された累積画像情報C'(x'-1,y'-1)、C'(x',y'-1)、C'(x'-1,y')は、累積値参照レジスタ205により一時保持される。ただし、累積画像情報の領域外の情報が入力されている場合、メモリコントローラ113−2は、読み出し値として0をセットする。
累積値計算部207は、現在の位置の累積画像情報を計算する。累積値計算部207は、合計値保持レジスタ204に保持されているP×Q画素の合計値Isumと累積値参照レジスタ205に保持されている累積画像情報とにより、現在の位置の累積画像情報を計算する。求める現在の位置の累積画像情報をC'(x',y')とすると、累積値計算部207は、累積画像情報C'(x',y')を、式(4)により算出する。
Figure 0005388835
そして、メモリコントローラ113−2は、算出された累積画像情報C'(x',y')をアドレスカウンタ202によって計算された格納先のアドレスの位置に書き込む。
なお、本実施形態では、累積画像情報生成部111は、累積画像情報を生成する位置を限定して計算を行い、累積画像情報を累積画像情報保持部113に保持する構成であるが、これに限られるものではない。例えば、累積画像情報生成部111は、一旦、全入力画素位置に対応する累積画像情報を生成した後に不要な位置の累積画像情報を間引いて累積画像情報を生成し、累積画像情報保持部113は、生成された累積画像情報を保存してもよい。この構成であっても、同様のメモリリソース削減の効果が得られる。
(累積画像情報利用演算部の説明)
図11及び図12を参照して、累積画像情報利用演算部112について説明する。図11は、累積画像情報利用演算部112、累積画像情報保持部113、パラメータ保持部114、及びバスI/F部110の構成を示す図である。本実施形態では、情報処理装置は、累積画像情報を利用した演算の結果を用いる後段の処理として、パターン識別処理を行っている(例えば、図7を参照のこと。)。したがって、必要とする演算の結果は、処理ウィンドウ内に相対的に配置される、Haar-like特徴を検出する弱判別器の各局所領域内の要素の総和値である。入力画像の任意の局所領域内の要素の総和値は、図3を参照して説明したように4点の累積画像情報(要素値)を参照することで計算することができる。
累積画像情報利用演算部112は、領域指定レジスタ301、参照アドレス計算部302、参照値一時保持レジスタ303、加減算処理部304、及び演算結果保持レジスタ305を含んで構成される。なお、図1及び図9で示したものと同一のものについては、同一の符号を付している。また、CPU101は、累積画像情報が生成される前に、バスI/F部110を介して予め累積画像情報のサイズを設定する。
ここで、CPU101は、処理ウィンドウ内における要素の総和値を求める局所領域を特定する。そして、CPU101は、この局所領域の2点の対角座標(相対座標)を、累積画像情報の原点からの絶対座標、例えば、図3における(x0,y0),(x1,y1)に変換する。そして、CPU101は、バスI/F部110を介して領域指定レジスタ301に絶対座標値を設定する。
バスI/F部110を介してCPU101から演算開始のトリガが掛かると、参照アドレス計算部302は、領域指定レジスタ301に設定されている絶対座標値を参照し、図3に示すA,B,C,Dの位置の累積画像情報を格納しているアドレスを計算する。そして、参照アドレス計算部302は、計算したアドレスをメモリコントローラ113−2に順に渡す。
メモリコントローラ113−2は、受信したアドレスに基づき累積画像情報保持メモリ113−1にアクセスし、順次取得した4点の累積画像情報を参照値一時保持レジスタ303に設定する。
参照値一時保持レジスタ303に4点の値が保持されると、加減算処理部304は、4点の値を用いた所定の加減算処理を実行する。ここで、所定の加減算処理とは、式(2)に示した演算を行うものである。なお、演算結果保持レジスタ305は、この演算の結果を保持する。CPU101は、演算の完了を、バスI/F部110を介して割り込み通知、完了フラグの参照等によって把握する。そして、CPU101は、演算結果保持レジスタ305の値を取得し、取得した値を設定されている局所領域の要素の総和値として使用する。
なお、加減算処理部304で用いられている加減算器は、全てNbufビットの正の値を入出力とするものである。また、変換元の入力画像情報上の座標を(Xsrc,Ysrc)、対応する累積画像情報上の座標を(X'dst, Y'dst)とすると、CPU101は、式(5)及び式(6)により、入力画像情報の局所領域の座標から累積画像情報の座標への変換を行う。
Figure 0005388835
ここで、CPU101は、X'dst,Y'dstについて、小数点以下を切り捨てることで近傍座標に近似させている。これにより求められる局所領域内の要素の総和値にずれが生じるので、このずれを許容できるアルゴリズムに適用する。このずれが許容できるアルゴリズムの1つとして参考文献1に示す認識処理が挙げられる。
例としてP=2,Q=2とすると、認識処理での要素の総和値を求める座標がずれる量は、最大で1となり、計算の結果に影響が生じるとも考えられる。
そこで、図12を参照して、ずれの影響がほとんどないことを説明する。ずれがない局所領域1401の要素の総和値と右端に1画素のずれが生じた局所領域1402とを比較すると、局所領域1402に局所領域1401が包含されているので、相関性が高いことが想像できる。また、局所領域のサイズが大きいほどずれによる影響は小さいことがわかる。さらに、実際は、認識対象の様々なサンプルを使って学習処理がされているので、数画素のずれに対応することができる。そのため1画素程度のずれが与える影響は、局所領域のサイズが極端に小さい場合、局所領域のずれが起こる境界で極端な入力値をとる等の特殊なケースに限られる。
このように、座標のずれの影響は、小さいと考えられるが、さらに座標のずれの影響を極力排除するには予め学習時に生成する累積画像情報の位置を考慮しておく方法が有効である。例としてP=2,Q=2とした場合、学習時に認識処理で使用する局所領域の位置を水平方向、垂直方向共に偶数となる位置に限定しておく。これによりずれを学習の段階で考慮しておくことができるため精度低下を極力抑えられる。
以上、第1の実施形態に係る情報処理装置について説明した。ここで、入力画像情報から、summed area table又はintegral imageと称される累積画像情報を生成するにあたり、通常は、入力画像情報の全ての位置に対応する累積画像情報が求められてバッファに格納される。すなわち、入力画像情報の幅(横方向画素数)をXimg、高さ(縦方向画素数)をYimgとし、各画素のビット精度をNimgビット(但し正の整数)とすると、累積画像情報に要するビット精度は、式(7)により算出される。そして、全累積画像情報を格納するために必要なバッファサイズSbufは、式(8)により算出される。
Figure 0005388835
したがって、累積画像情報を格納するバッファサイズSbufは、1要素のビット精度Nbufにも依存するが、Ximg、Yimgの影響も大きい。例えば、VGAサイズの8ビットGrayscale画像を入力画像とする場合、Nimg=8, Ximg=640, Yimg=480であるので、必要なビット精度は、Nbuf=27bitとなる。よって、入力画像情報に対する累積画像情報を全域分、一時的に持つ必要がある場合には、Nbuf×Ximg×Yimg=8,294,400bitものRAM等のメモリ領域を準備する必要があり、メモリリソースを多量に消費する。
特にこのような累積画像情報に基づく処理をハードウェアで行う場合、バッファとして用いられるメモリの容量は、回路の規模に直結するため切実な問題である。また、ソフトウェアによる処理であっても、Sbufを低減できれば、より少ないメモリで処理することが可能となって、リソースの消費量を抑えることができる。
例えば、認識処理において、累積画像情報を使用して処理ウィンドウ内の局所領域の画素値の総和を求めるには、入力画像の全ての画素位置に対応した累積画像情報を準備しなければならない。また、基本的には、入力画像と同じサイズのXimg、Yimgが必要で、累積画像情報を減らすことができなかった。
このような事情を踏まえ、本実施形態では、情報処理装置が上述した構成を有することで、累積画像情報の保持に必要なメモリリソースを低減することができる。
すなわち、本実施形態では、認識処理に用いる累積画像情報を保持するために必要な累積画像情報保持部113のバッファサイズSbufを低減するために、情報処理装置は、P×Q画素の単位で分割して所定の位置の累積画像情報のみを生成し、保持した。通常、バッファサイズSbufは、式(8)により算出されるが、本実施形態によれば、バッファサイズS'bufは、式(9)により算出される。
Figure 0005388835
例えば、P=2、Q=2の場合は、バッファサイズSbufを1/4にまで低減させることができ、メモリリソースを大幅に削減することができる。このように、バッファサイズを低減させることにより、入力画像情報の全ての位置に対して要素の総和値を求めることはできなくなるが、上述したように、認識処理では影響がほとんどない。
また、本実施形態に係る認識処理では、入力画像からターゲットとなる物体を認識するために、累積画像情報(インテグラルイメージ)を利用して特徴量(一部領域の要素の総和値)を高速に計算する。この処理において、本実施形態では、入力画像情報の各要素に対して限定された位置の累積画像情報を保持することでメモリリソースの消費を低減させる。また、本実施形態では、特徴量を計算する位置を限定した累積画像情報のみを予め学習させておくことで認識の精度を保ちつつ、メモリリソースの消費を低減することを可能にする。
すなわち、本実施形態では、累積画像情報を使用して処理ウィンドウ内の局所領域の画素値の総和を求める処理において、累積画像情報の保持に使用するバッファ容量を低減できる。
<第2の実施形態>
第1の実施形態では、入力画像情報について、限定された位置の累積画像情報を格納する方法について説明したが、第2の実施形態では、入力画像情報をバンド領域で分割し、分割した領域ごとに累積画像情報を生成して格納する方法について説明する。
図13は、累積画像情報保持部113の累積画像情報保持メモリ113−1を、バンドバッファとして利用する際に一時的に保持される累積画像情報に係る入力画像情報の領域を示す図である。
処理ウィンドウ701は、図4で示した処理ウィンドウに対応するものである。そして、入力画像情報700をバンドに分割するものがバンド領域711(矩形領域)、バンド領域712(矩形領域)である。バンド領域711は、処理の開始時に入力されるバンド領域であり、バンド領域712は、所定ライン数(ここでは、1ライン)だけ下方に移動したバンド領域である。
バンド領域711の高さYbandは、処理ウィンドウ領域の高さ又はそれ以上に定められる。なお、本実施形態では、Ybandを処理ウィンドウ領域の高さと等しく定めている。また、バンド領域711の幅Xbandは、入力画像情報の幅に等しい。そして、バンド領域711の各要素に対して第1の実施形態と同様に生成する位置を限定した累積画像情報が累積画像情報721である。また、バンド領域712についても同様に、生成する位置を限定した累積画像情報が累積画像情報722である。そして、この累積画像情報721等が累積画像情報保持部113の累積画像情報保持メモリ113−1に保持される。
第1の実施形態では、情報処理装置がP×Q画素単位で累積画像情報を生成する位置の限定を行う方法を説明した。この方法は、本実施形態にも同様に適用でき、累積画像情報721の幅は、バンド領域の幅Xbandの1/P、累積画像情報721の高さは、バンド領域の高さYbandの1/Qのサイズとなる。そして累積画像情報保持部113の累積画像情報保持メモリ113−1をバンドバッファとして使うために必要なバッファサイズS''bufは、式(10)により算出される。
Figure 0005388835
次に、図14を参照して、情報処理装置の全体の処理を説明する。なお、ここでは、第1の実施形態で示した内容と異なる点に着目して説明をする。
すなわち、第2の実施形態では、入力画像情報をバンド領域に分割して情報入力し(ステップS1201)、全バンド領域の処理が完了するまでループさせる(ステップS1205)構成が第1の実施形態に係る構成と異なる点である。
なお、本実施形態では、情報処理装置は、ステップS1201における入力画像情報をバンド領域に分割し、分割した情報を入力している。すなわち、情報処理装置は、入力画像情報を外部メモリ104が一旦保持し、CPU101又はDMAC103が1回目にバンド領域711に対応する画像データを送り、2回目にバンド領域712に対応する画像データを送る構成を有する。
ここで、本実施形態でのバンド領域の進ませ方は、図13の矢印703に示す通りであり、バンド領域711、バンド領域712へと進み、その後、下方のバンド領域へ終端まで進ませる方法である。また、処理ウィンドウの進ませ方は、図13の矢印702に示す通りであり、バンド領域内を左端から右端まで進ませる方法である。ただし、これらバンド領域と処理ウィンドウとを進ませる方法は、バンド領域に分割したときの一例であって、情報処理装置は、バンド領域を下から上に順番に進ませてもよいし、バンド領域をランダムに進ませてもよい。
また、ここで示した逐次処理は、一例であって、情報処理装置は、情報入力部102から入力される入力画像情報が外部メモリ104に1バンド領域分たまった場合に、累積画像情報を生成する処理を開始するようにパイプライン的に処理を行ってもよい。
また、本実施形態では、情報処理装置は、バンド領域711についての処理が終わった後に、バンド領域712を最初から送りなおす。しかしながら、情報処理装置は、差分だけのデータを転送して処理できるように累積画像情報保持メモリ113−1をリングバッファとして利用してもよい。
以上、第2の実施形態に係る情報処理装置について説明した。本実施形態によれば、バンド領域に分割して処理をする場合においても、累積画像情報保持メモリ113−1のメモリリソースをさらに低減させることができるようになる。
<第3の実施形態>
第1の実施形態及び第2の実施形態では、情報処理装置が二次元配列の情報に対して累積画像情報を生成する構成について説明したが、累積画像情報の保持に必要なバッファサイズの低減は、三次元以上の多次元配列の情報に対しても実現することができる。そこで、第3の実施形態では、三次元配列の情報を例に挙げて、情報処理装置が累積画像情報を生成する構成について説明する。三次元配列の入力画像情報とは、例えば動画情報であって、二次元配列の方法に時間軸の一次元が加わり三次元配列の情報となる。
図15(a)において、点Xの位置における三次元の累積画像情報は、三次元の入力画像情報における原点と点Xを対角とする直方体の中に含まれる要素の総和値となる。情報処理装置は、この三次元の累積画像情報を用いて、例えば、図15(b)に示す直方体1501内の要素の総和値を求めることが可能である。ここで、直方体1501の対角を示す2点の座標を(x0,y0,t0),(x1,y1,t1)とする。A,B,C,D,E,F,G,Hの座標における累積画像情報は、(A)に示す内容になる。そして、情報処理装置は、これらの累積画像情報を用いて、直方体1501内の要素の総和値S3dを、式(11)により算出する。
Figure 0005388835
ここで、本情報処理装置は、三次元の累積画像情報に対し、第1の実施形態及び第2の実施形態に示した構成を適用して、入力画像情報について、限定した位置の累積画像情報をバッファサイズに保持することによりバッファサイズを低減させることができる。
また、三次元を超える多次元の入力画像情報に対する累積画像情報であっても、同様に超直方体で考えれば、入力画像情報について、限定した位置の累積画像情報をバッファサイズに保持することによりバッファサイズを低減させることができる。
<その他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
上述した実施形態の構成によれば、累積画像情報の保持に必要なメモリリソースを低減することができる。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
100 累積画像情報演算処理部、 101 CPU、 104 外部メモリ

Claims (7)

  1. 記憶部を含んで構成される情報処理装置であって、
    入力画像情報を読み込む読込手段と、
    前記読込手段で読み込まれた入力画像情報と、複数の画素のうち指標とする画素の位置を示す画素パターンとに基づいて、前記指標とする画素の位置に対応する前記入力画像情報の位置についての累積画像情報を生成する生成手段と、
    前記生成手段で生成された累積画像情報を前記記憶部に記憶する記憶制御手段と、
    を有する、情報処理装置。
  2. 前記生成手段は、前記入力画像情報に対して前記画素パターンを順次移動し、移動した画素パターンについての前記複数の画素の各位置に対応する前記入力画像情報の位置の画素の合計値を算出し、算出した合計値と、前記移動した画素パターンと近隣関係の画素パターンについて生成された累積画像情報とに基づいて、前記移動した画素パターンに係る累積画像情報を生成する、請求項1記載の情報処理装置。
  3. 前記記憶部に記憶された累積画像情報に基づいて、物体を識別可能な特徴量を算出する累積画像情報利用手段を更に有する、請求項1又は2記載の情報処理装置。
  4. 前記累積画像情報利用手段は、前記入力画像情報の一部の領域を表す局所領域に対応した特徴量と、前記局所領域に含まれる位置の画素パターンに係る累積画像情報及び前記局所領域と近隣関係の画素パターンに係る累積画像情報から算出された特徴量とに基づいて、前記入力画像情報に前記物体を表す画像情報が含まれるか否かを判別する、請求項3記載の情報処理装置。
  5. 前記読込手段は、前記入力画像情報を分割して読み込む、請求項1乃至4の何れか1項記載の情報処理装置。
  6. 前記読込手段は、前記入力画像情報として、動画情報を読み込む、請求項1乃至5の何れか1項記載の情報処理装置。
  7. 記憶部を含んで構成される情報処理装置による情報処理方法であって、
    入力画像情報を読み込む読込工程と、
    前記読込工程で読み込まれた入力画像情報と、複数の画素のうち指標とする画素の位置を示す画素パターンとに基づいて、前記指標とする画素の位置に対応する前記入力画像情報の位置についての累積画像情報を生成する生成工程と、
    前記生成工程で生成された累積画像情報を前記記憶部に記憶する記憶工程と、
    を有する、情報処理方法。
JP2009292941A 2009-12-24 2009-12-24 情報処理装置及び情報処理方法 Active JP5388835B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2009292941A JP5388835B2 (ja) 2009-12-24 2009-12-24 情報処理装置及び情報処理方法
US12/970,718 US9076067B2 (en) 2009-12-24 2010-12-16 Information processing apparatus and method for classifier-based object detection
KR1020100130400A KR101465035B1 (ko) 2009-12-24 2010-12-20 정보처리장치 및 정보처리방법
CN201010608533.XA CN102110284B (zh) 2009-12-24 2010-12-21 信息处理设备及信息处理方法
EP10196123.3A EP2339509A3 (en) 2009-12-24 2010-12-21 Information processing apparatus and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009292941A JP5388835B2 (ja) 2009-12-24 2009-12-24 情報処理装置及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2011134102A JP2011134102A (ja) 2011-07-07
JP5388835B2 true JP5388835B2 (ja) 2014-01-15

Family

ID=43828112

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009292941A Active JP5388835B2 (ja) 2009-12-24 2009-12-24 情報処理装置及び情報処理方法

Country Status (5)

Country Link
US (1) US9076067B2 (ja)
EP (1) EP2339509A3 (ja)
JP (1) JP5388835B2 (ja)
KR (1) KR101465035B1 (ja)
CN (1) CN102110284B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101522985B1 (ko) * 2008-10-31 2015-05-27 삼성전자주식회사 영상처리 장치 및 방법
JP5548087B2 (ja) * 2010-09-30 2014-07-16 オリンパス株式会社 演算装置および演算方法
US20120328160A1 (en) * 2011-06-27 2012-12-27 Office of Research Cooperation Foundation of Yeungnam University Method for detecting and recognizing objects of an image using haar-like features
JP5868054B2 (ja) * 2011-07-26 2016-02-24 キヤノン株式会社 パターン識別装置、方法及びプログラム
JP5777458B2 (ja) * 2011-09-12 2015-09-09 キヤノン株式会社 パターン識別装置、パターン識別方法及びプログラム
CN104620285B (zh) * 2012-09-14 2017-04-12 本田技研工业株式会社 对象物识别装置
US9432671B2 (en) * 2014-05-22 2016-08-30 Xerox Corporation Method and apparatus for classifying machine printed text and handwritten text
JP6569224B2 (ja) * 2015-01-26 2019-09-04 ヤマハ株式会社 歌唱評価装置、歌唱評価方法およびプログラム
CN107368836A (zh) * 2016-05-12 2017-11-21 北京君正集成电路股份有限公司 一种获取积分图的方法及装置
CN110415229B (zh) * 2019-07-25 2022-04-26 广西科技大学 基于Haar特征和AdaBoost算法的纹理图像质量估计方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7099510B2 (en) * 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
JP3932379B2 (ja) * 2001-10-02 2007-06-20 株式会社日立製作所 画像処理装置と撮像素子
JP2008021228A (ja) * 2006-07-14 2008-01-31 Renesas Technology Corp データ処理装置
JP4582079B2 (ja) * 2006-10-19 2010-11-17 トヨタ自動車株式会社 画像識別装置および画像識別方法
CN101196984B (zh) 2006-12-18 2010-05-19 北京海鑫科金高科技股份有限公司 一种快速人脸检测方法
JP5058681B2 (ja) 2007-05-31 2012-10-24 キヤノン株式会社 情報処理方法及び装置、プログラム、記憶媒体
CN100561505C (zh) 2007-12-05 2009-11-18 北京中星微电子有限公司 一种图像检测方法及装置
CN100561501C (zh) 2007-12-18 2009-11-18 北京中星微电子有限公司 一种图像检测方法及装置
US8315473B1 (en) * 2008-08-22 2012-11-20 Adobe Systems Incorporated Variably fast and continuous bilateral approximation filtering using histogram manipulations
JP5340088B2 (ja) * 2009-09-07 2013-11-13 キヤノン株式会社 情報処理方法及び装置
US8295610B1 (en) * 2010-01-06 2012-10-23 Apple Inc. Feature scaling for face detection

Also Published As

Publication number Publication date
KR20110074453A (ko) 2011-06-30
EP2339509A2 (en) 2011-06-29
CN102110284A (zh) 2011-06-29
KR101465035B1 (ko) 2014-11-25
EP2339509A3 (en) 2013-11-27
US9076067B2 (en) 2015-07-07
JP2011134102A (ja) 2011-07-07
CN102110284B (zh) 2014-12-17
US20110158544A1 (en) 2011-06-30

Similar Documents

Publication Publication Date Title
JP5388835B2 (ja) 情報処理装置及び情報処理方法
JP5340088B2 (ja) 情報処理方法及び装置
JP5058681B2 (ja) 情報処理方法及び装置、プログラム、記憶媒体
JP6432162B2 (ja) 画像照合方法、画像照合装置、モデルテンプレート生成方法、モデルテンプレート生成装置、およびプログラム
JP6937508B2 (ja) 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム
JP7402623B2 (ja) フィルタ処理装置及びその制御方法
JP2020017082A (ja) 画像オブジェクト抽出装置及びプログラム
JP6815741B2 (ja) 画像処理装置および画像処理方法
US20210004667A1 (en) Operation processing apparatus and operation processing method
JP5759126B2 (ja) パターン識別装置及びその制御方法、プログラム
JP6082312B2 (ja) テンプレート画像候補領域決定装置、テンプレート画像候補領域決定方法、及びプログラム
JP2013061737A (ja) パターン識別装置、パターン識別方法及びプログラム
JP2022140857A (ja) マシンビジョン用の画像データを処理するための方法及び装置
JP5396977B2 (ja) データ処理装置、データ処理方法およびプログラム
JP2011141664A (ja) 文書比較装置、文書比較方法、及びプログラム
JP5083162B2 (ja) 画像データ判定装置、画像データ判定システム、及びプログラム
JP2014153937A (ja) 特徴量算出装置、方法及びプログラム
JP4865021B2 (ja) 画像処理装置および画像処理方法
JP5674535B2 (ja) 画像処理装置、方法、及びプログラム
WO2023119642A1 (ja) 情報処理装置、情報処理方法、及び記録媒体
JP2003124815A (ja) 部分選択変換装置、部分選択変換方法及び部分選択変換プログラム
JP2022187564A (ja) 学習装置、学習方法及びプログラム
JPH07200804A (ja) 画像縮小方法および画像処理装置
JPH03240175A (ja) ヒストグラム計算回路
KR20170068774A (ko) 적분 영상을 사용하지 않는 surf 특징점 추출 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131008

R151 Written notification of patent or utility model registration

Ref document number: 5388835

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151