JP6893751B2 - 画像検出装置、画像検出方法及び画像検出用プログラム - Google Patents

画像検出装置、画像検出方法及び画像検出用プログラム Download PDF

Info

Publication number
JP6893751B2
JP6893751B2 JP2019149940A JP2019149940A JP6893751B2 JP 6893751 B2 JP6893751 B2 JP 6893751B2 JP 2019149940 A JP2019149940 A JP 2019149940A JP 2019149940 A JP2019149940 A JP 2019149940A JP 6893751 B2 JP6893751 B2 JP 6893751B2
Authority
JP
Japan
Prior art keywords
image
search
layer
detected
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019149940A
Other languages
English (en)
Other versions
JP2021033426A (ja
Inventor
高橋 純也
純也 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Information Systems Japan Corp
Original Assignee
Toshiba Information Systems Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Information Systems Japan Corp filed Critical Toshiba Information Systems Japan Corp
Priority to JP2019149940A priority Critical patent/JP6893751B2/ja
Publication of JP2021033426A publication Critical patent/JP2021033426A/ja
Application granted granted Critical
Publication of JP6893751B2 publication Critical patent/JP6893751B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

この発明は、画像検出装置、画像検出方法及び画像検出用プログラムに関するものである。
従来の一般的な物体検出装置では、例えば次に説明するような手法により検出が行われていた。例えば、図1に示すようなオリジナル画像に対し、(1)〜(6)の距離的粒度で物体検出が行われ、かつテンプレートサイズが固定のシステムの場合には、図2に示すようにサイズと解像度が異なる6枚のレイヤ画像P1〜P6を作成して物体検出を行う。テンプレート画像TEMPが、図の左端に示されている。
上記のレイヤ画像P1〜P6は、サイズがレイヤ画像P1、P2、・・・、P5、P6の順に大きくなっており、レイヤ画像P6、P5、・・・、P2、P1の順に下から上に適当な距離で6段重ねると、ピラミッドの如き形状となるので、画像ピラミッドと称されている。
上記の物体検出において、特徴量を用いる物体検出手法(例えばHOG特徴量ベースの物体検出)の場合、検出精度は高いが比較テンプレートからの大きさの変化には脆弱性を有する場合がある。この物体検出手法を採用して処理を実行する場合、上記のように画面上で大きさの異なる物体を検出しようとするときには、図2のようなピラミッドレイヤを用いることができる。
ピラミッドレイヤ数を多くすると、細かい粒度で物体サイズ変化に対応可能となるが、ピラミッド画像の生成時間、スキャン時間の双方で処理時間が増加してしまう。また、処理時間を優先してピラミッドレイヤ数を削減した場合には、ピラミッドの隙間で検出される人物の検出漏れが生じてしまう問題がある。
特許文献1には、検出処理に利用した画像を、別の大きさの顔を検出処理する際にも再度利用できるようなピラミッド画像の構成とし、さらに、縮小率β=1/K(Kは2以上の整数)を有効に利用した方法で当該ピラミッド画像を作成する手法が開示されている。即ち、この手法は、作成されたピラミッド画像の再利用によって高速化に関する技術が開示されている。
特許文献2には、基準ピラミッドpy1及び追跡ピラミッドpy2から画像サイズが最小の階層画像をそれぞれ読み込んで、勾配法を用いて追跡点の反復検出を実行する画像処理方法が開示されている。この画像処理方法では、設定された収束判定条件に従って上位の階層画像を読み込んで追跡点検出を行い、上記追跡点の反復検出と収束条件の設定変更が繰り返される。これにより追跡点の反復検出回数を抑制する。探索領域を事前計算することで探索範囲を抑制する手法である。
特許文献3には、これまでよりも有効な物体検出・追跡処理などの画像処理装置が開示されている。この画像処理装置では、入力した画像データに基づいて複数の異なるスケールの層画像データから成る画像ピラミッドを形成すると共に、対象物について固定スケールとしたテンプレートを用意する。これにより、テンプレートが該当する画像ピラミッド内位置を求める。
更に、この画像ピラミッド内位置に基づいて特定された上側層画像データと下側層画像データ毎にパーティクルとの照合により尤度を求める。次に、これらの尤度を用いて真の尤度を求める補間処理を行う。このように、ピラミッド間の隙間を補間してピラミッド間に存在する物標の尤度を求める手法である。
特許文献4には、対象物を撮像した画像について、ゴミや汚れの付着、照明の変化、個体差による表面状態の違い等により、エッジ方向が部分的に反転した場合でも、認識ミスを防止しつつ処理時間を短縮化することのできる画像処理方法が開示されている。この画像処理方法においては、解像度の異なる複数のテンプレート画像を解像度順に階層化した第1ピラミッドと、この第1ピラミッドにおけるテンプレート画像と同じ解像度であって、解像度の異なる複数の被探索画像を解像度順に階層化した第2ピラミッドとを用いる。そして、画像処理装置が行う画像処理により、同解像度の階層において上記第1ピラミッドのテンプレート画像に含まれる特徴画像を上記第2ピラミッドの被探索画像の中から、類似度の判定により探索する処理を解像度の低い順から行うものである。
更に、上記画像処理方法は、上記特徴画像の点と、上記被探索画像における上記特徴画像の点に対応する位置の点との局所類似度を、上記特徴画像の全ての点についてそれぞれ計算する局所類似度計算工程と、上記局所類似度計算工程にて計算した上記各局所類似度を合計して正規化することにより上記類似度を計算する類似度計算工程と、を備えている。
そして、上記局所類似度計算工程では、上記特徴画像の点と、上記被探索画像における上記特徴画像の点に対応する位置の点との仮の局所類似度を計算し、上記仮の局所類似度が所定値を下回るか否かを判断し、上記仮の局所類似度が上記所定値以上であると判断した場合は、上記仮の局所類似度を上記局所類似度とし、上記仮の局所類似度が上記所定値を下回ると判断した場合は、前記仮の局所類似度を絶対値が小さくなるように変更して上記局所類似度とするものである。
特許文献5には、パターンマッチングを高速化し、しかも物体の検出の失敗を防ぐ画像処理方法が開示されている。具体的には最上段の被探索画像よりも下段の被探索画像において、該被探索画像に対して上段の被探索画像で抽出した候補点に対応した位置の点毎に、該候補点に対応した位置の点を含む領域と領域限定閾値とを設定する。類似度の計算途中で、類似度の計算途中結果に基づき、類似度が領域限定閾値よりも低い値となるか否かを予測し、類似度が領域限定閾値よりも低い値となると予測した場合には、類似度の計算を途中で打ち切る。類似度が領域限定閾値以上となると予測した場合には、類似度の計算を続行し、類似度の計算が完了したとき類似度が領域限定閾値よりも高い値であれば、次の走査位置において用いる領域限定閾値を、領域限定閾値よりも高い値となった類似度で更新するものである。
特開2006−202184号公報 特開2010−009375号公報 特開2010−113513号公報 特開2016−018422号公報 特開2017−111638号公報
しかしながら、上記手法はいずれも、検出能力を大きく落としたくないという要求や、また処理時間を増大させたくないという要求など多様な要求に応えるという課題を達成するものではない。本発明はこのような画像ピラミッドを用いた画像検出装置の現状に鑑みてなされたもので、その目的は、検出能力を大きく落としたくないという要求や、また処理時間を増大させたくないという要求など、多様な要求を全てではなくとも解決し、多様な要求に応えた様々な態様の画像検出装置を提供することである。即ち、検出能力は高い方が良いが処理時間は多少要しても良いという要求に応えた実施形態や、検出能力はある程度で良いが処理時間は短い方が良いという要求に応えた実施形態の画像検出装置を提供する。
本実施形態に係る画像検出装置は、1フレームずつ順次に画像データを取り込み、過去において、任意の指定フレーム回数内で画像が検出されているか否かを判定する判定手段と、対象の画像データに対し画像ピラミッドを生成する画像ピラミッド生成手段と、前記判定手段による判定がNOとなった場合に、検出対象の画像が含まれるテンプレート画像と前記画像ピラミッドを構成する複数レイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出する第1の画像検索手段と、前記判定手段による判定がYESとなった場合に、前記第1の画像検索手段が行った検索によって検出対象画像が検出できなかったレイヤ画像と前の検索で検出対象画像が検出された対応レイヤ画像である対比画像に対して、類似度情報を使った画像検索により検出対象画像を検出する第2の画像検索手段とを具備し、前記第1の画像検索手段は、前記第2の画像検索手段による処理の次にも処理を行うことを特徴とする。
本実施形態に係る画像検出装置が処理する画像の原画の一例を示す図。 本実施形態に係る画像検出装置が処理する画像の原画から生成したピラミッド画像の一例を示す図。 本実施形態に係る画像検出装置の構成を示すブロック図。 本実施形態に係る画像検出装置の要部構成を示すブロック図。 本実施形態に係る画像検出装置の動作を示すフローチャート。 本実施形態に係る画像検出装置が処理する画像の原画から生成したピラミッド画像に対する処理の手順を示す図。
以下添付図面を参照して本発明に係る画像検出装置、画像検出方法及び画像検出用プログラムの実施形態を説明する。各図において、同一の構成要素には同一の符号を付して重複する説明を省略する。本実施形態に係る画像検出装置は、ワークステーション、パーソナルコンピュータ、サーバコンピュータなどの各種のコンピュータによって実現される。上記コンピュータは、図3に示されるような構成を備えることができる。
即ち、CPU10が主メモリ11のプログラムやデータなどを用いて画像検出装置としての処理を行う構成となっている。CPU10には主メモリ11以外に、バス12を介して外部記憶インタフェース13、入力インタフェース14、表示インタフェース15、画像入力インタフェース16が接続されている。
外部記憶インタフェース13には外部記憶装置23が接続され、入力インタフェース14にはマウスなどのポインティングデバイス22やキーボード入力装置やタッチパネル入力装置などの入力装置24が接続され、表示インタフェース15にはLEDやLCDなどの各種の表示装置25が接続されている。
更に、画像入力インタフェース16には画像入力装置としてのカメラ26が接続され、画像データが供給されている。ここでは、カメラ26が接続されているものとしているが、複数台のカメラが接続されていても良い。更に、画像入力インタフェース16には画像を供給する装置であればカメラ26に限定されず、例えば、画像データを送るサーバや端末、更には、画像データが記憶された媒体などであっても良い。
外部記憶装置23には、本実施形態に係る画像検出装置を実現するためのプログラムが保持されている。即ち、図4に示されるように外部記憶装置23には、画像ピラミッド生成手段31、第1の画像検索手段32、第2の画像検索手段33、検索対象抽出手段34が備えられている。画像ピラミッド生成手段31は、対象の画像データに対し画像ピラミッドを生成するものである。即ち、画像ピラミッド生成手段31は、カメラ26により撮像され画像入力インタフェース16を介して取り込んだ1フレームの画像データに対して6枚のレイヤの画像データを生成する。既に説明したように、図1に示すようなオリジナル画像に対し、(1)〜(6)の距離的粒度で物体検出を行うものであり、かつテンプレートサイズが固定のシステムとし、図2に示すようにサイズと解像度が異なる6枚の画像P1〜P6を作成して物体検出を行うものとする。上記図2のレイヤ画像P1〜P6においては、レイヤ画像P6が原画像であるものとし、レイヤ画像P1〜P5はレイヤ画像P6を所定の割合で縮小して作成することができる。なお、生成するレイヤ画像の枚数は6に限定されず、6より少なくても良いし、6より多くても良い。
第1の画像検索手段32は、検出対象の画像が含まれるテンプレート画像と上記画像ピラミッドを構成する複数レイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出するものである。例えば、6枚(全ての)のレイヤ画像に対して特徴量を使った画像検索により検出対象画像を検出する。
検索対象抽出手段34は、上記画像ピラミッドを構成する複数レイヤの画像データについていくつかのレイヤの画像を抽出して検索対象レイヤ画像を抽出するものである。例えば、1フレームにおいて生成されるNレイヤからSレイヤ置きに1枚(1レイヤ)抽出して検索対象レイヤ画像とする。1フレームにおいて抽出により得られる検索対象レイヤ画像の数はLである。即ち、Nは(S+1)の整数倍であり、L、S、Nの関係は、L=N/(S+1)である。
検索対象抽出手段34による抽出が行われる場合には、上記第1の画像検索手段32は、上記検索対象抽出手段34により抽出されたレイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出する。ここで、特徴量とは、スケール変化に弱い特徴量として、CoHOG(Co-Occurrence Histogram Of Gradient)特徴量、HOG(Histogram Of Gradient)特徴量、LBP(Local Binary Pattern)特徴量、Haar-Like特徴量、ICF(Integral Channel Features)特徴量、ACF(Aggregate Channel Features)特徴量などがあり、スケール変化に強い特徴量として、SIFT(Scale Invariant Feature Transform)特徴量、SURF(Speeded Up Robust Features)特徴量などを挙げることができる。
また、特徴量としては、1フレーム(1画面)内のオブジェクトや検出対象である人や車など物の部位(全部または一部)の模様、色または階調度の値、空間周波数、各種特徴量の平均値、ヒストグラム、標準偏差、更に特徴ベクトルなどを用いても良い。
第2の画像検索手段33は、上記第1の画像検索手段32が行った検索によって検出対象画像が検出できなかったレイヤ画像と前の検索で検出対象画像が検出された対応レイヤ画像である対比画像に対して、類似度情報を使った画像検索により検出対象画像を検出する。テンプレートマッチングにおける類似度情報を使った画像検索手法としては、SAD(Sum of Absolute Difference)、SSD(Sum of Squared Difference)、NCC(Normalized Cross Correlation)などを用いることができる。
上記において、「上記第1の画像検索手段32が行った検索によって検出対象画像が検出できなかったレイヤ画像」とは、第mフレームの画像検索において検出できなかった第M番目のレイヤ画像を指す。上記で、Mは複数であっても良く、実際には、例えばM番目のレイヤ画像とM+2番目のレイヤ画像のようなこともあり得る。また、「前の検索で検出対象画像が検出された対応レイヤ画像である対比画像」とは、第mフレームの画像検索より前のフレームにおける検索の意味であり、第m−1フレーム以前の検索における同じレイヤ位置またはその近隣レイヤ位置のレイヤ画像であって、検出対象画像が検出された場合のレイヤ画像を指す。同じレイヤ位置とは正確に対応するM番目のレイヤ画像を指す。Mが複数であっても良いことは前述の通りであり、この場合には、その近隣レイヤ位置が含まれる。「第m−1フレーム以前」は、「第m−1フレーム以前」でmから直近のフレームを指す。
また、本実施形態では、「所定数置きに」抽出を行っているために正確に対応するM番目のレイヤ画像のみならず、その近隣レイヤ位置が含まれる。例えば、「M」番目のレイヤに対しサイズの近いレイヤを含み、「M」に隣接する「M−1」番目のレイヤ画像或いは、「M+1」番目のレイヤ画像であっても良い。隣接するレイヤ位置の意味は、「M」からそのシステムで決定されただけ離れていても良く、「Mプラスマイナス所定数のレイヤ」を許容する。
上記において、上記検索対象抽出手段34は、上記第1の画像検索手段32が採用する特徴量の種類に応じてSの値を決定するようにしても良い。前述の通り、特徴量には、スケール変化に弱い特徴量とスケール変化に弱い特徴量があるので、スケール変化に強い特徴量として、SIFT(Scale Invariant Feature Transform)特徴量、SURF(Speeded Up Robust Features)特徴量などを用いる場合には、Sを大きくしてスケール変化が大きなレイヤ画像について画像検索を行うようにしても良い。ただし、同じ特徴量(例えばCoHOG)であっても、辞書のサイズ自体の大きい小さい(解像度の高い低い)によって、どの程度スケール変化に強い、弱いが変化し得ることが分かった。例えば、解像度の高い辞書の方が、スケール変化が大きくなっても検出能力が下がりにくいということが分かった。このため、辞書のサイズ自体の大きい小さい(解像度の高い低い)によっても、Sを変えるようにしても良い。
以上の通りに構成された画像検出装置は、外部記憶装置23のプログラムである各手段がCPU10によって実現されることにより処理を行う。この場合の処理を図5のフローチャートに示す。このフローチャートにおいて、Nは1フレームで生成される画像ピラミッドのレイヤの数であり、Sは、N枚のレイヤからS枚置きに抽出を行うときの数であり、1フレームにおいて抽出により得られる検索対象レイヤ画像の数がLである。既に説明した通り、Nは(S+1)の整数倍であり、L、S、Nの関係は、L=N/(S+1)である。従って、1フレームではLのレイヤに対してレイヤ処理が行われる。更に、フレーム番号がtであり、探索レイヤセットの先頭番号をnとしてあり、n=t mod(S+1)が成り立つ。従って、S=1の場合、Nは0、1、0、1、0、1、・・・・と繰り返される。1フレームを処理するループは、以下の条件で繰り返される。
For(i=n;i<N;i+=(S+1))
図5のフローチャートがスタートとなり、1フレームの画像を取り込む(S11)。このとき、フレーム番号tが更新される。次に、過去において、任意の指定フレーム回数内で画像が検出されているかを判定する(S12)。ここで、YesとなるとステップS13へ進み、類似度情報を用いた画像処理による画像検出を行う(S13)。ステップS12においてNoと判断した場合、またはステップS13の処理が終了すると、所定(N枚の)レイヤから構成される画像ピラミッドを生成すると共に、nを先頭としたS枚置きのレイヤ抽出を行う(S14)。次に、S枚置きのレイヤ抽出を行ったレイヤの画像について特徴量を用いた画像検索を行う(S15)。このステップS15においては、1フレーム内でループ処理が行われる。このステップS15が完了すると、ステップS11へ戻って処理を続ける。
図5のフローチャートによる処理の具体例を図6を参照して説明する。ここでは、t−1フレーム目(回目)の処理とし、ステップS11からS12へ進み、ステップS12においてNoへ分岐したものとする。本実施形態の処理当初においては画像検出がされていないから、当然このようになるものと推察できる。本実施形態では、図6(A)のレイヤ画像P1〜P6のようにピラミッド画像が生成され、S枚置きのレイヤ抽出により、レイヤ画像P2、P4、P6が抽出され、このレイヤ画像P2、P4、P6においてテンプレート画像TEMPの画像の検出が特徴量を用いて行われる(S14、S15)。ここでは、図6(A)のレイヤ画像P2、P4において画像検出ができず、レイヤ画像P6において画像検出できたものとする。
次に、tが1インクリメントされ(S11)、ステップS12へ進む。なお上記ステップS12は、次の理由により存在している。本実施形態では特徴量を用いた画像検索において目的の対象物画像が見つからなかった場合に類似度情報を用いた画像処理による画像検出を行っている。このため、「過去(又は直前)のフレームに存在していた検出済み物体などの画像と、類似性の高い物体などの画像」が存在していることが必須であり、この画像の存在を検出するため、ステップS12が存在している。従って、初回フレームではNoへ分岐するため、類似度情報を用いた物体検出は行われず、また、長期間にわたり物体検出がなされていない場合にもステップS12においてNoへ分岐することになる。
ステップS14の特徴量を用いた画像検索を終えてステップS11へ戻ると、次の1フレームの画像を取り込んで(S11)、任意の指定フレーム回数内で画像が検出されているかを判定する(S12)。ここでは、tフレーム目(回目)であるので、1つ前の(t−1)フレーム目でレイヤ画像P6において画像検出できているために、ステップS12においてYesへ分岐する。図6(B)に示されるtフレーム目のS枚置きに抽出したレイヤ画像P1、P3、P5の全てにおいて類似度情報を用いた画像処理による画像検出を行っても良いのであるが、本実施形態では、先に特徴量を用いて画像検索を実行する。つまり、現在のフレーム(tフレーム目)においてS枚置きに抽出した図6(B)のレイヤ画像P1、P3、P5について、1テンプレート画像TEMPの画像の検出が特徴量を用いて実行される(S14、S15)。特徴量を用いた画像検索においては、図6(B)のレイヤ画像P1、P3において画像が検出でき、レイヤ画像P5において画像検出できなかったものとする。本実施形態では、特徴量を用いた画像検索ができなかったレイヤ画像についてのみ、類似度情報を用いた画像処理を行うために、画像検出できないレイヤがあるか検出がなされ、この画像検出できなかったレイヤ画像であるレイヤ画像P5についてステップS13の処理が行われる(S13)。
具体的には、現在のフレーム(tフレーム)より前のフレーム(t−1フレーム)において画像検出できた対比画像であるレイヤ画像P6があるので、このレイヤ画像P6を対比画像としてこの度のフレームの検出できなかったレイヤ画像P5に対して類似度情報を使った画像検索により検出対象画像を検出する。なお、この場合に、レイヤ画面全体を比較するのではなく、対比画像の領域(位置とサイズ)をデータとして保持しておき、これを多少縮小・拡大により微調整して検出対象レイヤに適用しても良い。また、画像検出できたレイヤについては、検出できた画像にタグを付すなどして更なる画像処理へ使用できるデータを作成する。今回画像検出できなかったレイヤ画像の全てを処理して、ステップS11へ進む。
ステップS11へ進むと、tの更新により、t+1フレーム目(回目)について処理が行われる。ここでは、t+1フレーム目(回目)であるので、ステップS12においてYesへ分岐するのであるが、前述の通り、先にステップS14、S15を実行する。この1フレームの画像を取り込んで、所定レイヤの画像ピラミッドを生成する。画像ピラミッドを構成する複数レイヤの画像データについてS枚置きにレイヤの抽出を実行して検索対象レイヤ画像を抽出する。本実施形態では、特徴量を用いた画像検索に失敗したレイヤ画像についてのみ、類似度情報を用いた画像処理を行うために、図6(c)のレイヤ画像P2、P4、P6においてテンプレート画像TEMPの画像の検索が特徴量を用いて実行される。図6(c)のレイヤ画像P2、P4において画像検出が失敗し、レイヤ画像P6において画像検出が成功したものとする。
以上によりステップS13へ戻って、ここでは、画像検出が失敗しているレイヤ画像P2、P4に対して処理を行う。つまり、この度のフレームの検出できなかったレイヤ画像P2、P4に対して類似度情報を使った画像検索により検出対象画像を検出する。なお、この場合に、レイヤ画面全体を比較するのではなく、対比画像の領域(位置とサイズ)をデータとして保持しておき、これを多少縮小・拡大により微調整して検出対象レイヤに適用しても良いことは前述の通りである。また、画像検出できたレイヤについては、検出できた画像にタグを付すなどして更なる画像処理へ使用できるデータを作成する。今回画像検出できなかったレイヤ全て処理したかを検出して、ステップS11へ戻って、次の1フレームであるt+2フレームの処理へと進むことになる。
上記の実施形態によれば、歩行者などの検出の場合、歩行者が瞬間移動して突然画面上に発生することはないため、過去のフレームにおいて特徴量を用いた画像検索での検出が成功する可能性が高く、本実施形態のように1フレームの複数レイヤ画像について所定数置きに抽出を行っても検出能力を落とすことなく高速化を実現できる。
なお、上記実施形態では、t−1フレーム目(回目)で、レイヤ画像P2、P4、P6においてテンプレート画像TEMPの画像が特徴量を用いて検出し、tフレーム目(回目)で、レイヤ画像P1、P3、P5においてテンプレート画像TEMPの画像が特徴量を用いて検出し、t+1フレーム目(回目)で、レイヤ画像P2、P4、P6においてテンプレート画像TEMPの画像が特徴量を用いて検出し、t−1フレーム目(回目)で、レイヤ画像P1、P3、P5において画像検出を行わず、tフレーム目(回目)で、レイヤ画像P2、P4、P6において画像検出を行わず、t+1フレーム目(回目)で、レイヤ画像P1、P3、P5において画像検出を行わないものを示した。
上記第1の実施形態の処理に加えて、t−1フレーム目(回目)で、抽出されなかったレイヤ画像P1、P3、P5において類似度情報を使った画像検索により画像検出を行い、tフレーム目(回目)で、抽出されなかったレイヤ画像P2、P4、P6において類似度情報を使った画像検索により画像検出を行い、t+1フレーム目(回目)で、抽出されなかったレイヤ画像P1、P3、P5において類似度情報を使った画像検索により画像検出を行うようにしても良い。
対象の画像データに対し画像ピラミッドを生成する画像ピラミッド生成手段と、
検出対象の画像が含まれるテンプレート画像と前記画像ピラミッドを構成する複数レイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出する第1の画像検索手段と、
前記第1の画像検索手段が行った検索によって検出対象画像が検出できなかったレイヤ画像と前の検索で検出対象画像が検出された対応レイヤ画像である対比画像に対して、更に、前記第1の画像検索手段が画像検索しなかったレイヤ画像に対して、類似度情報を使った画像検索により検出対象画像を検出する第2の画像検索手段と
を具備することを特徴とする画像検出装置としても良い。
また、第2の画像検索手段が、前記第1の画像検索手段が行った検索によって検出対象画像が検出できなかったレイヤ画像と前の検索で検出対象画像が検出された対応レイヤ画像である対比画像に対して、類似度情報を使った画像検索により検出対象画像を検出しなくとも良い。
すなわち、
対象の画像データに対し画像ピラミッドを生成する画像ピラミッド生成手段と、
前記画像ピラミッドを構成する複数レイヤの画像データについていくつか置きに検索対象レイヤ画像を抽出する検索対象抽出手段と
検出対象の画像が含まれるテンプレート画像と前記画像ピラミッドを構成する複数レイヤの画像データであって、前記検索対象抽出手段により抽出されたレイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出する第1の画像検索手段と、
前記検索対象抽出手段により抽出されなかったレイヤの画像データであって、前記第1の画像検索手段が画像検索しなかったレイヤ画像に対して、類似度情報を使った画像検索により検出対象画像を検出する第2の画像検索手段と
を具備することを特徴とする画像検出装置であっても良い。
更に、上記では、いずれの場合も、類似度情報を使った画像検索により検出対象画像を検出する第2の画像検索手段による処理は、レイヤを対象としたが、レイヤに限定されず、ピラミッド画像を生成した元の画像を対象としても良い。即ち、類似度情報を用いた検出では、任意のサイズで検出が可能なので、例えばピラミッド画像を生成する元となった画像(以下、元画像)を毎回用いるなどでも良い。例えば、上記のレイヤP2で検出された物体等の画像もレイヤP6で検出された物体等の画像も、サイズは異なるものの、それぞれ元画像には映っているので類似度情報を用いて検出することが可能である。
10 CPU
11 主メモリ
12 バス
13 外部記憶インタフェース
14 入力インタフェース
15 表示インタフェース
16 画像入力インタフェース
22 ポインティングデバイス
23 外部記憶装置
24 入力装置
25 表示装置
26 カメラ
31 画像ピラミッド生成手段
32 第1の画像検索手段
33 第2の画像検索手段
34 検索対象抽出手段

Claims (12)

  1. 1フレームずつ順次に画像データを取り込み、過去において、任意の指定フレーム回数内で画像が検出されているか否かを判定する判定手段と、
    対象の画像データに対し画像ピラミッドを生成する画像ピラミッド生成手段と、
    前記判定手段による判定がNOとなった場合に、検出対象の画像が含まれるテンプレート画像と前記画像ピラミッドを構成する複数レイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出する第1の画像検索手段と、
    前記判定手段による判定がYESとなった場合に、前記第1の画像検索手段が行った検索によって検出対象画像が検出できなかったレイヤ画像と前の検索で検出対象画像が検出された対応レイヤ画像である対比画像に対して、類似度情報を使った画像検索により検出対象画像を検出する第2の画像検索手段と
    を具備し、
    前記第1の画像検索手段は、前記第2の画像検索手段による処理の次にも処理を行うことを特徴とする画像検出装置。
  2. 前記画像ピラミッドを構成する複数レイヤの画像データについていくつかのレイヤの画像を抽出して検索対象レイヤ画像を抽出する検索対象抽出手段を具備し、
    前記第1の画像検索手段は、前記検索対象抽出手段により抽出されたレイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出することを特徴とする請求項1に記載の画像検出装置。
  3. 前記検索対象抽出手段は、1つの画像ピラミッドに対しSレイヤ置きに抽出を行って検索対象のレイヤ画像を抽出することを特徴とする請求項2に記載の画像検出装置。
  4. 前記検索対象抽出手段は、前記第1の画像検索手段が採用する特徴量の種類に応じてSの値を決定することを特徴とする請求項3に記載の画像検出装置。
  5. 1フレームずつ順次に画像データを取り込み、過去において、任意の指定フレーム回数内で画像が検出されているか否かを判定する判定ステップと、
    対象の画像データに対し画像ピラミッドを生成する画像ピラミッド生成ステップと、
    前記判定ステップによる判定がNOとなった場合に、検出対象の画像が含まれるテンプレート画像と前記画像ピラミッドを構成する複数レイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出する第1の画像検索ステップと、
    前記判定ステップによる判定がYESとなった場合に、前記第1の画像検索ステップが行った検索によって検出対象画像が検出できなかったレイヤ画像と前の検索で検出対象画像が検出された対応レイヤ画像である対比画像に対して、類似度情報を使った画像検索により検出対象画像を検出する第2の画像検索ステップと
    を具備し、
    前記第1の画像検索ステップでは、前記第2の画像検索ステップによる処理の次にも処理を行うことを特徴とする画像検出方法。
  6. 前記画像ピラミッドを構成する複数レイヤの画像データについていくつかのレイヤの画像を抽出して検索対象レイヤ画像を抽出する検索対象抽出ステップを具備し、
    前記第1の画像検索ステップでは、前記検索対象抽出ステップにより抽出されたレイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出することを特徴とする請求項5に記載の画像検出方法。
  7. 前記検索対象抽出ステップでは、1つの画像ピラミッドに対してSレイヤ置きに抽出を行って検索対象のレイヤ画像を抽出することを特徴とする請求項6に記載の画像検出方法。
  8. 前記検索対象抽出ステップでは、前記第1の画像検索ステップが採用する特徴量の種類に応じてSの値を決定することを特徴とする請求項7に記載の画像検出方法。
  9. コンピュータを、
    1フレームずつ順次に画像データを取り込み、過去において、任意の指定フレーム回数内で画像が検出されているか否かを判定する判定手段、
    対象の画像データに対し画像ピラミッドを生成する画像ピラミッド生成手段、
    前記判定手段による判定がNOとなった場合に、検出対象の画像が含まれるテンプレート画像と前記画像ピラミッドを構成する複数レイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出する第1の画像検索手段、
    前記判定手段による判定がYESとなった場合に、前記第1の画像検索手段が行った検索によって検出対象画像が検出できなかったレイヤ画像と前の検索で検出対象画像が検出された対応レイヤ画像に対して、類似度情報を使った画像検索により検出対象画像を検出する第2の画像検索手段
    として機能させ、
    前記コンピュータを前記第1の画像検索手段として、前記第2の画像検索手段による処理の次にも処理を行うように機能させることを特徴とする画像検出用プログラム。
  10. 前記コンピュータを、更に、
    前記画像ピラミッドを構成する複数レイヤの画像データについていくつかのレイヤの画像を抽出して検索対象レイヤ画像を抽出する検索対象抽出手段として機能させ、
    前記コンピュータを前記第1の画像検索手段として、前記検索対象抽出手段により抽出されたレイヤの画像データについて、特徴量を使った画像検索により検出対象画像を検出するように機能させることを特徴とする請求項9に記載の画像検出用プログラム。
  11. 前記コンピュータを前記検索対象抽出手段として、1つの画像ピラミッドに対してSレイヤ置きに抽出を行って検索対象のレイヤ画像を抽出するように機能させることを特徴とする請求項10に記載の画像検出用プログラム。
  12. 前記コンピュータを前記検索対象抽出手段として、前記第1の画像検索手段が採用する特徴量の種類に応じてSの値を決定するように機能させることを特徴とする請求項11に記載の画像検出用プログラム。
JP2019149940A 2019-08-19 2019-08-19 画像検出装置、画像検出方法及び画像検出用プログラム Active JP6893751B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019149940A JP6893751B2 (ja) 2019-08-19 2019-08-19 画像検出装置、画像検出方法及び画像検出用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019149940A JP6893751B2 (ja) 2019-08-19 2019-08-19 画像検出装置、画像検出方法及び画像検出用プログラム

Publications (2)

Publication Number Publication Date
JP2021033426A JP2021033426A (ja) 2021-03-01
JP6893751B2 true JP6893751B2 (ja) 2021-06-23

Family

ID=74676530

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019149940A Active JP6893751B2 (ja) 2019-08-19 2019-08-19 画像検出装置、画像検出方法及び画像検出用プログラム

Country Status (1)

Country Link
JP (1) JP6893751B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4561380B2 (ja) * 2005-01-24 2010-10-13 コニカミノルタホールディングス株式会社 検出装置、検出方法及び検出プログラム
JP6532317B2 (ja) * 2015-06-19 2019-06-19 キヤノン株式会社 物体追尾装置、物体追尾方法及びプログラム
JP6648925B2 (ja) * 2015-12-17 2020-02-14 キヤノン株式会社 画像処理方法、画像処理装置、画像処理システム、生産装置、プログラム及び記録媒体
JP7134716B2 (ja) * 2017-09-08 2022-09-12 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
JP2021033426A (ja) 2021-03-01

Similar Documents

Publication Publication Date Title
US7929728B2 (en) Method and apparatus for tracking a movable object
US8170368B2 (en) Correcting device and method for perspective transformed document images
USRE43206E1 (en) Apparatus and method for providing panoramic images
US8406470B2 (en) Object detection in depth images
US7706603B2 (en) Fast object detection for augmented reality systems
US5930378A (en) Dynamic image processing apparatus and method
Dahyot Statistical hough transform
JP7132050B2 (ja) テキスト行の区分化方法
US20110311100A1 (en) Method, Apparatus and Computer Program Product for Providing Object Tracking Using Template Switching and Feature Adaptation
EP2808828B1 (en) Image matching method, image matching device, model template generation method, model template generation device, and program
Nasrollahi et al. Extracting a good quality frontal face image from a low-resolution video sequence
JP2006146626A (ja) パターン認識方法および装置
KR20120044484A (ko) 이미지 처리 시스템에서 물체 추적 장치 및 방법
JP2019102061A5 (ja)
Gilly et al. A survey on license plate recognition systems
JP7392488B2 (ja) 遺留物誤検出の認識方法、装置及び画像処理装置
Wang et al. Pose optimization in edge distance field for textureless 3D object tracking
Fang et al. 1-D barcode localization in complex background
JP6893751B2 (ja) 画像検出装置、画像検出方法及び画像検出用プログラム
US20190130178A1 (en) Image recognition device and image recognition program
US11238309B2 (en) Selecting keypoints in images using descriptor scores
US20230410561A1 (en) Method and apparatus for distinguishing different configuration states of an object based on an image representation of the object
Yu et al. Condensed object representation with corner HOG features for object classification in outdoor scenes
US20180268228A1 (en) Obstacle detection device
Nebehay et al. Evaluation of an online learning approach for robust object tracking

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210601

R150 Certificate of patent or registration of utility model

Ref document number: 6893751

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250