JP2017091103A - 粗密探索方法および画像処理装置 - Google Patents
粗密探索方法および画像処理装置 Download PDFInfo
- Publication number
- JP2017091103A JP2017091103A JP2015218761A JP2015218761A JP2017091103A JP 2017091103 A JP2017091103 A JP 2017091103A JP 2015218761 A JP2015218761 A JP 2015218761A JP 2015218761 A JP2015218761 A JP 2015218761A JP 2017091103 A JP2017091103 A JP 2017091103A
- Authority
- JP
- Japan
- Prior art keywords
- image
- search
- data
- template
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
- G06V10/7515—Shifting the patterns to accommodate for positional errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/955—Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Advance Control (AREA)
- Image Processing (AREA)
Abstract
【課題】粗密探索によるテンプレートマッチングをより高速化するための技術を提供する。【解決手段】テンプレートマッチングにより第1の画像のなかから対象物を検出する第1の探索ステップと、第1の画像に比べ横n倍、縦m倍の解像度をもつ第2の画像のうち、第1の探索ステップでの検出位置に対応するnピクセル×mピクセルの領域を探索範囲とし、テンプレートマッチングにより第2の画像のなかから対象物を検出する第2の探索ステップと、を含む、粗密探索において、第2の探索ステップに先立ち、テンプレートの同じ要素と照合演算され得るn×m個のピクセルのデータが連続したメモリアドレスに格納されるように、第2の画像のデータをワークメモリ上に再配置し、第2の探索ステップでは、n×m個のピクセルに対するn×m個の照合演算がSIMD命令によるn×mよりも少ない回数の演算処理で実行される。【選択図】図8
Description
本発明は、テンプレートマッチングにより画像から対象物を検出する技術に関する。
画像から対象物を検出する方法の一つにテンプレートマッチングと呼ばれる手法がある。テンプレートマッチングの基本処理は、検出対象となる物体のモデル(テンプレート)を予め用意しておき、入力画像とテンプレートのあいだの画像特徴の一致度を評価することで、画像中の物体の位置や姿勢を検出するというものである。テンプレートマッチングによる物体検出は、例えば、FA(Factory Automation)における検査やピッキング、ロボット・ビジョン、監視カメラなど様々な分野で実用されている。最近は、画像の高解像度化や、検出対象の種類の増加、動画像に対するリアルタイム処理の要請などから、テンプレートマッチングのさらなる高速化が求められている。
テンプレートマッチングによる探索処理を高速化する技術として、粗密探索と呼ばれるアルゴリズムが知られている。粗密探索とは、解像度を段階的に異ならせた画像群(画像ピラミッドと呼ばれる)を用意し、低解像度の画像における探索結果をもとに探索範囲を絞り込み、当該探索範囲について高解像度の画像でさらなる探索を行う、という処理を繰り返し、最終的に元の解像度の画像における物体の位置を特定する方法である。探索範囲を段階的に絞り込んでいくことで、照合演算の回数を削減できるため、全体の処理時間の短縮を図ることができる。
また、コンピュータによる演算処理を高速化する技術として、SIMD(single instruction multiple data)がある。SIMDとは、1つの命令で複数のデータの演算を実行する並列処理の一種である。例えば、128ビット幅のSIMDレジスタをもつプロセッサの場合、16ビットの8個のデータに対する演算や8ビットの16個のデータに対する演算を1クロックの命令で並列に処理できる。特許文献1には、空間フィルタ演算の高速化のためにSIMDを適用した例が開示されている。また、非特許文献1には、レスポンスマップの計算にSIMDを適用するため、Tピクセルおきに並んだ複数の特徴量をメモリ上に連続的に並べて格納することが開示されている(非特許文献1中ではSIMDの代わりにSSE(Streaming Simd EXtensions)という用語で記載されている)。
SIMDによる並列処理は処理の高速化に有効である。しかしながら、特許文献1や非特許文献1の方法は、各々の文献に開示された処理に特化した方法であり、前述した粗密探索には適用することができない。
S. Hinterstoisser, et al., "Gradient Response Maps for Real-Time Detection of Textureless Objects", IEEE Transaction on Pattern Analysis and Machine Intelligence, vol. 34 (5) 2012.
本発明は、上記実情に鑑みてなされたものであり、粗密探索によるテンプレートマッチ
ングをより高速化するための技術を提供することを目的とする。
ングをより高速化するための技術を提供することを目的とする。
上記目的を達成するために本発明では、テンプレートマッチングにより第1の画像のなかから対象物を検出する第1の探索ステップと、前記第1の画像に比べ横n倍、縦m倍(n、mは2以上の整数)の解像度をもつ第2の画像のうち、前記第1の探索ステップで対象物が検出された位置に対応するnピクセル×mピクセルの領域を探索範囲とし、テンプレートマッチングにより前記第2の画像のなかから前記対象物を検出する第2の探索ステップと、を含む、粗密探索方法において、前記第2の探索ステップに先立ち、前記第2の探索ステップにおいてテンプレートの同じ要素と照合演算され得るn×m個のピクセルのデータが連続したメモリアドレスに格納されるように、前記第2の画像のデータをワークメモリ上に再配置する再配置ステップをさらに含み、前記第2の探索ステップでは、前記ワークメモリ上で連続したメモリアドレスに格納されているn×m個のピクセルに対するn×m個の照合演算が、SIMD命令によるn×mよりも少ない回数の演算処理で実行されることを特徴とする粗密探索方法を提供する。
この構成によれば、第2の探索ステップに先立ち第2の画像のデータの再配置を行うため、ワークメモリからSIMDレジスタへのデータ転送を1クロックで行うことができ、SIMD演算による並列処理の効率を向上できる。したがって、粗密探索によるテンプレートマッチングをより高速化することが可能となる。
前記再配置ステップでは、前記第2の画像において横方向に隣接する2つのピクセルのデータの間に、当該2つのピクセルのうちの一方のピクセルから縦方向に連なる(m−1)個のピクセルのデータのコピーを挿入することが好ましい。このような規則でデータの再配置を行うことで、データ重複(冗長性)が最小となり、ワークメモリの節約が可能だからである。
前記再配置ステップでは、前記第2の探索ステップにおいて用いるテンプレートの各要素のデータがn×m個ずつ連続したメモリアドレスに格納されるように、前記テンプレートのデータをワークメモリ上に再配置することが好ましい。これにより、テンプレートのデータについても、ワークメモリからSIMDレジスタへのデータ転送を1クロックで行うことができ、SIMD演算による並列処理の効率を向上できる。
また、本発明の別の側面は、テンプレートマッチングにより画像のなかから対象物を検出する探索処理を実行するテンプレートマッチング部と、前記探索処理に用いられるデータを格納するワークメモリと、前記ワークメモリに格納するデータの再配置を行うデータ再配置部と、前記テンプレートマッチング部の処理結果を出力する結果出力部と、を有する画像処理装置であって、前記テンプレートマッチング部は、テンプレートマッチングにより第1の画像のなかから対象物を検出する第1の探索処理を実行した後、前記第1の画像に比べ横n倍、縦m倍(n、mは2以上の整数)の解像度をもつ第2の画像のうち、前記第1の探索処理で対象物が検出された位置に対応するnピクセル×mピクセルの領域を探索範囲とし、テンプレートマッチングにより前記第2の画像のなかから前記対象物を検出する第2の探索処理を実行するものであり、前記データ再配置部は、前記第2の探索処理に先立ち、前記第2の探索処理においてテンプレートの同じ要素と照合演算され得るn×m個のピクセルのデータが連続したメモリアドレスに格納されるように、前記第2の画像のデータを前記ワークメモリ上に再配置し、前記第2の探索処理では、前記ワークメモリ上で連続したメモリアドレスに格納されているn×m個のピクセルに対するn×m個の照合演算が、SIMD命令によるn×mよりも少ない回数の演算処理で実行されることを特徴とする画像処理装置を提供する。
この構成によれば、第2の探索処理に先立ち第2の画像のデータの再配置を行うため、ワークメモリからSIMDレジスタへのデータ転送を1クロックで行うことができ、SIMD演算による並列処理の効率を向上できる。したがって、粗密探索によるテンプレートマッチングをより高速化することが可能となる。
なお、本発明は、上記処理の少なくとも一部を有する粗密探索方法、または、その粗密探索方法を用いる物体検出方法もしくは物体認識方法、または、かかる方法をコンピュータに実行させるためのプログラムやそのプログラムを非一時的に記憶したコンピュータ読取可能な記録媒体として捉えることもできる。また、本発明は、上記粗密探索方法を用いて物体を検出ないし認識する画像処理装置または物体認識装置として捉えることもできる。上記構成および処理の各々は技術的な矛盾が生じない限り互いに組み合わせて本発明を構成することができる。
本発明によれば、粗密探索によるテンプレートマッチングをより高速化することができる。
本発明は、テンプレートマッチングの粗密探索によって画像から対象物を検出する技術に関し、より詳しくは、SIMDによる並列化処理によって粗密探索の高速化を図る技術に関する。この技術は、FA用の画像センサ、コンピュータビジョン、マシンビジョンなどにおける物体認識などに応用することができる。以下に述べる実施形態では、本発明の好ましい応用例の一つとして、ベルトコンベヤで搬送される物体の位置及び姿勢を判別するFA用の画像センサに本発明を適用した例を説明する。
(物体認識装置の全体構成)
図1を参照して、本発明の実施形態に係る物体認識装置の全体構成および適用場面について説明する。
図1を参照して、本発明の実施形態に係る物体認識装置の全体構成および適用場面について説明する。
物体認識装置1は、生産ラインなどに設置され、カメラ11から取り込まれた画像を用いてコンベヤ3上の物体2の認識を行うシステムである。コンベヤ3上には複数の物体2が任意の姿勢で流れている。物体認識装置1は、カメラ11から所定の時間間隔で画像を取り込み、画像処理装置10によって画像に含まれる各物体2の種類・位置・姿勢を認識する処理を実行し、その結果を出力する。物体認識装置1の出力(認識結果)は、例えば
、ピッキング・ロボットの制御、加工装置や印字装置の制御、物体2の検査・計測などに利用される。
、ピッキング・ロボットの制御、加工装置や印字装置の制御、物体2の検査・計測などに利用される。
(ハードウェア構成)
図2を参照して、物体認識装置1のハードウェア構成を説明する。物体認識装置1は、大まかに分けて、カメラ11と画像処理装置10から構成される。
図2を参照して、物体認識装置1のハードウェア構成を説明する。物体認識装置1は、大まかに分けて、カメラ11と画像処理装置10から構成される。
カメラ11は、物体2のデジタル画像を画像処理装置10に取り込むための撮像デバイスであり、例えばCMOS(Complementary Metal-Oxide-Semiconductor)カメラやCC
D(Charge-Coupled Device)カメラを好適に用いることができる。入力画像の形式(解
像度、カラー/モノクロ、静止画像/動画、階調、データ形式など)は任意であり、物体2の種類やセンシングの目的に合わせて適宜選択すればよい。可視光像以外の特殊な画像(X線画像、サーモ画像など)を物体認識や検査に利用する場合には、その画像に合わせたカメラを用いてもよい。
D(Charge-Coupled Device)カメラを好適に用いることができる。入力画像の形式(解
像度、カラー/モノクロ、静止画像/動画、階調、データ形式など)は任意であり、物体2の種類やセンシングの目的に合わせて適宜選択すればよい。可視光像以外の特殊な画像(X線画像、サーモ画像など)を物体認識や検査に利用する場合には、その画像に合わせたカメラを用いてもよい。
画像処理装置10は、CPU(中央演算処理装置)110と、ワークメモリとして用いられるメインメモリ112と、固定記憶部であるハードディスク114と、カメラインターフェイス116と、入力インターフェイス118と、表示コントローラ120と、PLCインターフェイス122と、通信インターフェイス124と、データリーダ/ライタ126とを含む。これらの各部は、バス128を介して、互いにデータ通信可能に接続される。
カメラインターフェイス116は、CPU110とカメラ11とのあいだのデータ伝送を仲介する部分であり、カメラ11からの画像データを一時的に蓄積するための画像バッファ116aを有している。入力インターフェイス118は、CPU110と入力部(マウス13、キーボード、タッチパネル、ジョグコントローラなど)とのあいだのデータ伝送を仲介する。表示コントローラ120は、液晶モニタなどのディスプレイ12に接続され、当該ディスプレイ12での表示を制御する。PLCインターフェイス122は、CPU110とPLC4のあいだのデータ伝送を仲介する。通信インターフェイス124は、CPU110とコンソール(あるいは、パーソナルコンピュータやサーバ装置)などとのあいだのデータ伝送を仲介する。データリーダ/ライタ126は、CPU110と記憶媒体であるメモリカード14との間のデータ伝送を仲介する。
画像処理装置10は、汎用的なアーキテクチャを有するコンピュータで構成可能であり、CPU110が、ハードディスク114またはメモリカード14に格納されたプログラムを読み込み、実行することで、各種機能を提供する。このようなプログラムは、メモリカード14や光ディスクなどのコンピュータ読取可能な記録媒体に格納された状態で流通するか、インターネットなどを通じて提供(ダウンロード)される。なお、本実施形態に係るプログラムは単体のアプリケーションプログラムとして提供されてもよいし、他のプログラムの一部に組み込まれるモジュールとして提供されてもよい。また、その機能の一部または全部がASICなどの専用回路で代替されてもよい。
(機能構成)
図3に、物体認識装置1の機能構成を示す。図3に示す機能は、画像処理装置10がプログラムを実行することにより実現されるものである。物体認識装置1は、大まかに分けて、テンプレート作成装置20としての機能部と物体認識処理装置30としての機能部とを備える。テンプレート作成装置20は、物体認識処理で利用するテンプレートを作成する機能部である。テンプレート作成装置20によって作成されたテンプレートは、物体認識処理装置30のテンプレートDB(データベース)31に登録される。物体認識処理装置30は、カメラ11から取り込まれた画像に対しテンプレートマッチングによる粗密探
索を実行することで、画像中の物体を認識する機能部である。物体認識処理装置30は、テンプレートDB31、画像取得部32、画像ピラミッド生成部33、特徴抽出部34、データ最配置部35、テンプレートマッチング部36、認識結果出力部37を有している。これらの機能の詳細については後述する。
図3に、物体認識装置1の機能構成を示す。図3に示す機能は、画像処理装置10がプログラムを実行することにより実現されるものである。物体認識装置1は、大まかに分けて、テンプレート作成装置20としての機能部と物体認識処理装置30としての機能部とを備える。テンプレート作成装置20は、物体認識処理で利用するテンプレートを作成する機能部である。テンプレート作成装置20によって作成されたテンプレートは、物体認識処理装置30のテンプレートDB(データベース)31に登録される。物体認識処理装置30は、カメラ11から取り込まれた画像に対しテンプレートマッチングによる粗密探
索を実行することで、画像中の物体を認識する機能部である。物体認識処理装置30は、テンプレートDB31、画像取得部32、画像ピラミッド生成部33、特徴抽出部34、データ最配置部35、テンプレートマッチング部36、認識結果出力部37を有している。これらの機能の詳細については後述する。
図4にカメラ11から取り込まれる画像の一例を示す。図4に示すように、画像の中には、複数の物体2が含まれており、且つ、各物体2の位置(XYZ座標)及び姿勢(XYZの3軸周りの角度)は任意である。完全な球体である場合を除き、カメラ11に対する物体の姿勢(向き)が異なると、画像に写る物体の形態(形状、色など)も異なるものとなる。したがって、2D画像を用いた一般的なテンプレートマッチングにおいて任意姿勢の3D物体を認識するためには、物体の姿勢ごとに個別のテンプレートを用意し、それらのテンプレートの総当たりによるマッチングを行う。
(テンプレート)
テンプレートは、検出対象となる物体の画像特徴を表すデータである。テンプレートの形式はどのようなものでもよいが、本実施形態では、図5に示すように、画像中の複数の特徴点の特徴量を記述した配列形式のデータを用いる。図5右側のテンプレートの各行が1つの特徴点の情報を表しており、特徴点の情報は、特徴点の座標x,yと特徴量の値valを含んでいる。
テンプレートは、検出対象となる物体の画像特徴を表すデータである。テンプレートの形式はどのようなものでもよいが、本実施形態では、図5に示すように、画像中の複数の特徴点の特徴量を記述した配列形式のデータを用いる。図5右側のテンプレートの各行が1つの特徴点の情報を表しており、特徴点の情報は、特徴点の座標x,yと特徴量の値valを含んでいる。
特徴量としては、例えば、ピクセル値(輝度)、輝度勾配方向、量子化勾配方向、HoG(Histogram of Oriented Gradients)、HAAR−like、SIFT(Scale-Invariant Feature Transform)などを用いることができる。輝度勾配方向とは、特徴点を中心とする局所領域での輝度の勾配の方向(角度)を連続値で表すものであり、量子化勾配方向とは、特徴点を中心とする局所領域での輝度の勾配の方向を離散値で表す(例えば、8方向を0〜7の1バイトの情報で保持する)ものである。図5の特徴量valは、量子化勾配方向を2進数で表記した例を示している。各ビットが0度、45度、90度、135度、180度、225度、270度、315度の方向を表している。
テンプレートは、物体の画像を用いて特徴点検出及び特徴量抽出の処理を行うことにより作成することができる。特徴点検出及び特徴量抽出については公知の手法を利用できるため、ここでは詳しい説明を割愛する。テンプレートの基になる画像は、実際の物体を撮影することにより得ることができる。あるいは、物体の3次元CADデータを入手可能な場合には、3次元コンピュータグラフィックスを用いてレンダリング処理することにより、所望の姿勢(視点、回転角)及び光源の下での画像を得ることができる。
詳しくは後述するが、本実施形態では、解像度が段階的に異なる複数の画像(画像ピラミッド)を用いた粗密探索を行うため、それぞれの解像度に応じたテンプレートを用意する必要がある。解像度が異なる複数のテンプレートを作成する方法としては、解像度が異なる複数の物体画像からそれぞれテンプレートを作成する方法と、最も高い解像度の物体画像から作成したテンプレートに対し低解像度化処理を施すことで必要な解像度のテンプレートを作成する方法とがある。低解像度化処理とは、各特徴点の位置関係を基に、近傍にある複数の特徴点を統合することで、テンプレートの解像度を下げる処理である。図6に、テンプレートの解像度を1/2にする例を示す。解像度を1/2にする場合、2×2の範囲内の近傍特徴点が1つの特徴点に統合される。図6の例では、4つの特徴点(1,1)、(1,2)、(2,1)、(2,2)の特徴量の値を統合した結果が、低解像度テンプレートの特徴点(1,1)の特徴量の値となる。また、3つの特徴点(1,3)、(1,4)、(2,4)の特徴量の値を統合した結果が、低解像度テンプレートの特徴点(1,2)の特徴量の値となる。なお、これは低解像度化処理の一例である。テンプレートは特徴量の値をピクセル値にもつ画像データとみなすことができるので、公知の画像解像
度変換処理を用いることができる。
度変換処理を用いることができる。
(粗密探索)
次に、粗密探索法について説明する。粗密探索とは、テンプレートマッチングによる探索処理を高速化するアルゴリズムであり、粗精探索、ピラミッド探索、ピラミッドサーチ、Coarse to Fine Searchとも呼ばれる。
次に、粗密探索法について説明する。粗密探索とは、テンプレートマッチングによる探索処理を高速化するアルゴリズムであり、粗精探索、ピラミッド探索、ピラミッドサーチ、Coarse to Fine Searchとも呼ばれる。
図7に、粗密探索アルゴリズムを概念的に示す。粗密探索では、解像度を段階的に異ならせた第1層から第k層(kは2以上の整数)のk枚の画像群(画像ピラミッド)を用いる。第1層画像が最も解像度が低く、第2層、…、第k層の順に解像度が高くなる。第i層画像(i=1,2,…,k−1)に比べ、第(i+1)層画像は横n倍、縦m倍(n、mは2以上の整数)の解像度をもつ。縦と横の倍率は異なっていてもよい(つまり、n≠mでもよい)。
図7は、k=3、n=2、m=2の例である。第3層画像が元画像に対応しており、第2層画像、第1層画像といくにしたがい解像度が1/2ずつ低くなっている。例えば、第3層画像(元画像)が640ピクセル×480ピクセルのVGAサイズの画像である場合、第2層画像は320ピクセル×240ピクセル、第1層画像は160ピクセル×120ピクセルの解像度となる。
粗密探索では、最初に、最も低解像度の第1層画像に対しテンプレートマッチングによる探索処理が行われ、第1層画像の中での物体の存在位置(候補)が検出される。図7の第1層画像において黒色の四角形で示したピクセルが検出位置を表している。次に、第2層画像に対する探索処理では、第1層画像での検出位置に対応する第2層画像内の領域が探索範囲に設定される。図7の例では第2層画像は第1層画像に比べて横2倍、縦2倍の解像度であるため、探索範囲は2ピクセル×2ピクセルの領域となる。そして、第2層画像に対しては、この探索範囲に対してのみ探索処理が行われる。同様に、第2層画像での検出結果に基づき第3層画像での探索範囲が設定され、その探索範囲に対する探索処理が行われ、最終的に、第3層画像(元画像)内での物体位置が特定される。
例えば、第3層用テンプレートの要素数をtとすると、通常のテンプレートマッチングにより第3層画像内を網羅的に探索した場合、必要な照合演算の回数は、640×480×t=307200×tとなる。これに対し、粗密探索の場合は、第1層画像のみ網羅的に探索するため、第1層画像の探索処理に必要な照合演算の回数は、160×120×(t/4)となるが、以後は探索範囲が限定されるため、第2層画像の探索処理では2×2×(t/2)、第3層画像の探索処理では2×2×tで済み、合計4806×t回の照合演算でよい。すなわち、図7の例では、照合演算の回数を約1/64に削減することができ、大幅な処理速度の向上を図ることができる。
(SIMDによる高速化)
次に、SIMD命令による並列処理を用いることによって、粗密探索をさらに高速化するアルゴリズムを説明する。
次に、SIMD命令による並列処理を用いることによって、粗密探索をさらに高速化するアルゴリズムを説明する。
テンプレートマッチングにおいては、テンプレートの各要素のデータと画像の各ピクセルのデータとの間で照合演算が行われる。ピクセルのデータが表す特徴量により四則演算や論理演算など様々な演算が照合演算として用いられる。例えば、特徴量が輝度である場合は減算や減算の絶対値などの照合演算が用いられる。また特徴量が量子化勾配方向である場合は排他的論理和などの照合演算が用いられる。照合演算を行うとき、SIMD命令を用いて複数の照合演算を一回の演算処理で実行すれば、探索処理の高速化を図ることができる。ただし、SIMD命令による並列処理が有効なのは、一回のSIMD命令で同時
に演算される複数のデータ(つまり、SIMDレジスタに格納される複数のデータ)がワークメモリ上で連続したメモリアドレスに並んでいる場合に限られる。連続したメモリアドレスに格納されているデータであれば1クロックの命令でワークメモリからSIMDレジスタに転送できるが、各データがワークメモリ上の離れたアドレスに存在する場合は、ワークメモリからSIMDレジスタへのデータ転送に数クロック必要となり(つまり、ワークメモリからSIMDレジスタへのデータ転送がボトルネックになり)、並列処理の効果が減殺されてしまうからである。そこで、本実施形態では、SIMD命令による並列処理の効率を最大限高めるため、探索処理に先立って画像データの再配置(並べ替え)を行う。このとき、粗密探索で参照され得るデータの範囲(探索範囲)の規則性に着目することで、粗密探索に最適なデータの並べ替えを行う点に本アルゴリズムの特徴がある。
に演算される複数のデータ(つまり、SIMDレジスタに格納される複数のデータ)がワークメモリ上で連続したメモリアドレスに並んでいる場合に限られる。連続したメモリアドレスに格納されているデータであれば1クロックの命令でワークメモリからSIMDレジスタに転送できるが、各データがワークメモリ上の離れたアドレスに存在する場合は、ワークメモリからSIMDレジスタへのデータ転送に数クロック必要となり(つまり、ワークメモリからSIMDレジスタへのデータ転送がボトルネックになり)、並列処理の効果が減殺されてしまうからである。そこで、本実施形態では、SIMD命令による並列処理の効率を最大限高めるため、探索処理に先立って画像データの再配置(並べ替え)を行う。このとき、粗密探索で参照され得るデータの範囲(探索範囲)の規則性に着目することで、粗密探索に最適なデータの並べ替えを行う点に本アルゴリズムの特徴がある。
図8に、データの並べ替え(再配置)とSIMDによる高速化の原理を模式的に示す。図8では、説明の簡単のため、第1層画像のサイズを4ピクセル×3ピクセル、第2層画像のサイズを8ピクセル×6ピクセルとする(つまり、n=m=2)。また、第1層用テンプレートのサイズを1×1、第2層用テンプレートのサイズを2×2とする。図8において、A0〜A11は第1層画像の各ピクセルのインデックスを表し、B0〜B47は第2層画像の各ピクセルのインデックスを表す。また、P0は第1層用テンプレートの要素のインデックス、Q0〜Q3は第2層用テンプレートの各要素のインデックスを表す。なお、第1層画像および第2層画像の各ピクセルには、テンプレートの各要素と同じく、特徴量のデータがセットされている。
第1層の探索処理では、第1層用テンプレートを用いて第1層画像の全体が探索される。具体的には、第1層用テンプレートを第1層画像の左上のピクセルA0から順に当てはめていき、P0とA0、P0とA1、・・・、P0とA11、の計12回の照合演算を行う。そして、特徴量の類似度が所定の閾値を超えるピクセルが検出されたら、そのピクセルを物体の存在位置の候補とする。図8は、ピクセルA5が存在位置の候補として検出された例である。
第2層画像において、第1層画像のピクセルA5に対応する領域は、(B18,B19,B26,B27)の2ピクセル×2ピクセルの領域である。この領域が第2層の探索処理における探索範囲に設定される。第2層の探索処理では、(1)第2層用テンプレートの要素Q0を第2層画像のピクセルB18の位置に当てはめた場合、(2)要素Q0をピクセルB19の位置に当てはめた場合、(3)要素Q0をピクセルB26の位置に当てはめた場合、(4)要素Q0をピクセルB27の位置に当てはめた場合、の4つの位置について探索を行うため、必要となる照合演算の組み合わせは以下の16個である。
(1)Q0とB18、Q1とB19、Q2とB26、Q3とB27
(2)Q0とB19、Q1とB20、Q2とB27、Q3とB28
(3)Q0とB26、Q1とB27、Q2とB34、Q3とB35
(4)Q0とB27、Q1とB28、Q2とB35、Q3とB36
(2)Q0とB19、Q1とB20、Q2とB27、Q3とB28
(3)Q0とB26、Q1とB27、Q2とB34、Q3とB35
(4)Q0とB27、Q1とB28、Q2とB35、Q3とB36
ここで、テンプレートの同じ要素と照合演算されるピクセルに注目すると、要素Q0と照合演算される4つのピクセル(B18,B19,B26,B27)、要素Q1と照合演算される4つのピクセル(B19,B20,B27,B28)、要素Q2と照合演算される4つのピクセル(B26,B27,B34,B35)、要素Q3と照合演算される4つのピクセル(B27,B28,B35,B36)はいずれも第2層画像において2×2のブロック様に並んでいる。そこで、第2層画像において2×2のブロック様に並ぶ任意の4つのピクセルがワークメモリ上で連続したアドレスに並ぶように、第2層画像のデータを再配置する。図8では、第2層画像のオリジナルのピクセル(白抜きで図示したピクセル)の次のアドレスに、当該ピクセルの列方向(縦方向)に隣接するピクセルのコピー(
網掛けで図示したピクセル)を挿入する、という規則でデータの再配置を行う。なお、最終行においては、列方向に隣接するピクセルが存在しないため、ダミーのデータを挿入すればよい。
網掛けで図示したピクセル)を挿入する、という規則でデータの再配置を行う。なお、最終行においては、列方向に隣接するピクセルが存在しないため、ダミーのデータを挿入すればよい。
一方、第2層用テンプレートに対してもデータの再配置を行う。具体的には、図8に示すように、テンプレートのそれぞれの要素Q0〜Q3が4つずつ連続するようなデータ列を作成する。
前処理(事前準備)として上記のようなデータの再配置を行っておくと、例えば、要素Q0と4つのピクセル(B18,B19,B26,B27)との間の4つの照合演算が、
(1)データ列(B18,B19,B26,B27)をワークメモリからSIMDレジスタ#1へ転送、
(2)データ列(Q0,Q0,Q0,Q0)をワークメモリからSIMDレジスタ#2へ転送、
(3)SIMD命令による一括演算、
の3クロックで実行可能である。
(1)データ列(B18,B19,B26,B27)をワークメモリからSIMDレジスタ#1へ転送、
(2)データ列(Q0,Q0,Q0,Q0)をワークメモリからSIMDレジスタ#2へ転送、
(3)SIMD命令による一括演算、
の3クロックで実行可能である。
図9(A)〜図9(D)に示すように、要素Q0の照合演算だけでなく、要素Q1とピクセル(B19,B20,B27,B28)の間の照合演算、要素Q2とピクセル(B26,B27,B34,B35)の間の照合演算、要素Q3とピクセル(B27,B28,B35,B36)の間の照合演算についても、SIMDによる効率的な並列処理が可能である。
データの再配置の仕方(並べ方)は図8の例に限定されない。例えば、図10(A)〜図10(D)に示すように、テンプレートの同じ要素と照合演算され得る4つのピクセルのすべての組み合わせのデータ列を準備してもよい。この並べ方は、図8の並べ方に比べて必要なメモリサイズが増えるが、図8の並べ方と同様、SIMDによる効率的な並列処理が可能である。
以上の説明において、第2層の探索処理の探索範囲が2ピクセル×2ピクセルの領域となり、テンプレートの同じ要素と照合演算され得るピクセルの数が4つとなるのは、第1層画像と第2層画像の解像度の比が横2倍、縦2倍(n=m=2)だからである。解像度の比が2倍でない場合も、もちろん同様の処理が可能である。また、第1層画像と第2層画像の間だけでなく、第2層画像と第3層画像の間、…、第i層画像と第(i+1)層画像の間、…、第(k−1)層画像と第k層画像の間でも同様の処理が可能である。
一般化すると、第1の画像に比べて横n倍、縦m倍(n、mは2以上の整数)の解像度をもつ第2の画像を考えたとき、第1の画像に対する探索処理で検出された位置に対応する第2の画像における探索範囲は、nピクセル×mピクセルの領域となる。したがって、第2の画像に対する探索処理においてテンプレートの同じ要素と照合演算され得るピクセルの数はn×m個である。そこで、このn×m個のピクセルのデータが連続したメモリアドレスに格納されるように、第2の画像のデータをワークメモリ上に再配置する。そうすると、n×m個のピクセルのデータ列が1クロックでSIMDレジスタに転送でき、n×m個の照合演算がSIMD命令による一回の演算処理で実行可能となる。データの再配置の仕方としては、第2の画像において行方向(横方向)に隣接する2つのピクセルのデータの間に、当該2つのピクセルのうちの一方のピクセルから列方向(縦方向)に連なる(m−1)個のピクセルのデータのコピーを挿入するのがよい。このような規則で再配置を行うと、データの重複(冗長性)が最小となり、ワークメモリの節約が可能だからである。図11に、n=2、m=3の例を示す。
(物体認識処理)
次に、図12のフローに沿って、物体認識処理装置30によって実行される物体認識処理の流れを説明する。
次に、図12のフローに沿って、物体認識処理装置30によって実行される物体認識処理の流れを説明する。
まず、画像取得部32が、カメラ11から画像を取り込む(ステップS10)。次に、画像ピラミッド生成部33が、ステップS10で取り込まれた元画像から低解像度画像を生成し、画像ピラミッドを生成する(ステップS11)。本実施形態では、図7に示すように、第1層画像(160ピクセル×120ピクセル)、第2層画像(320ピクセル×240ピクセル)、第3層画像(640ピクセル×480ピクセル)の3枚の画像で構成される画像ピラミッドを用いる。
次に、特徴抽出部34が、画像ピラミッドの各層画像に対し特徴抽出処理を施す(ステップS12)。ここで抽出される特徴量はテンプレートのものと同種の特徴量であり、本実施形態では量子化勾配方向を用いるものとする。第1層画像に対する特徴抽出処理の結果として、第1層画像と同じ解像度を有し、第1層画像の各ピクセル位置で抽出された特徴量のデータ(特徴値)をピクセル値としてもつ画像(以後、第1層特徴画像と呼ぶ)が得られる。同様に、第2層画像に対する特徴抽出処理の結果として第2層特徴画像が、第3層画像に対する特徴抽出処理の結果として第3層特徴画像が得られる。第1層特徴画像〜第3層特徴画像も画像ピラミッドを構成している。
次に、データ再配置部35が、第2層特徴画像と第3層特徴画像それぞれのデータをワークメモリ上において再配置する(ステップS13)。この再配置処理は、後段の粗密探索によるテンプレートマッチングの照合処理を高速化するための前処理である。データの再配置の具体的な方法は前述のとおりである。
次に、テンプレートマッチング部36が、第1層特徴画像と第1層用テンプレートを用いて第1の探索処理を実行する(ステップS14)。なお、複数種類の物体が検出対象である場合や、物体の姿勢ごとにテンプレートがある場合には、テンプレートごとにステップS14の処理を繰り返す。
続いて、テンプレートマッチング部36は、第1の探索処理の検出結果に基づき第2層特徴画像の探索範囲を設定し、第2層特徴画像と第2層用テンプレートを用いて第2の探索処理を実行する(ステップS15)。第2の探索処理では、前述のとおり、ワークメモリ上で連続したメモリアドレスに格納されている2×2個のピクセルに対する4つの照合演算がSIMD命令による一回の演算処理で実行される。複数種類の物体が検出対象である場合や、物体の姿勢ごとにテンプレートがある場合には、テンプレートごとにステップS15の処理を繰り返す。また、第1の探索処理で物体の存在位置候補が複数検出された場合には、検出された候補ごとにステップS15の処理を繰り返す。
続いて、テンプレートマッチング部36は、第2の探索処理の検出結果に基づき第3層特徴画像の探索範囲を設定し、第3層特徴画像と第3層用テンプレートを用いて第3の探索処理を実行する(ステップS16)。第3の探索処理でも、前述のとおり、ワークメモリ上で連続したメモリアドレスに格納されている2×2個のピクセルに対する4つの照合演算がSIMD命令による一回の演算処理で実行される。複数種類の物体が検出対象である場合や、物体の姿勢ごとにテンプレートがある場合には、テンプレートごとにステップS16の処理を繰り返す。また、第2の探索処理で物体の存在位置候補が複数検出された場合には、検出された候補ごとにステップS16の処理を繰り返す。
以上の処理の結果、元画像と同じ解像度をもつ第3層特徴画像における物体の存在位置を特定することができる。また、複数のテンプレートを用いた場合には、どのテンプレー
トと最もマッチしたかで、物体の種類や姿勢を認識することもできる。このような認識結果は、認識結果出力部37により外部装置やディスプレイに出力される(ステップS17)。認識結果の情報は、例えば、ピッキング・ロボットの制御、加工装置や印字装置の制御、物体2の検査・計測などに利用される。
トと最もマッチしたかで、物体の種類や姿勢を認識することもできる。このような認識結果は、認識結果出力部37により外部装置やディスプレイに出力される(ステップS17)。認識結果の情報は、例えば、ピッキング・ロボットの制御、加工装置や印字装置の制御、物体2の検査・計測などに利用される。
(本実施形態の利点)
以上述べた構成によれば、探索処理に先立ちワークメモリ上のデータの再配置を行うことによって、ワークメモリからSIMDレジスタへのデータ転送を1クロックで行うことができ、SIMD演算による並列処理の効率を向上できる。したがって、粗密探索によるテンプレートマッチングをより高速化することが可能となる。
以上述べた構成によれば、探索処理に先立ちワークメモリ上のデータの再配置を行うことによって、ワークメモリからSIMDレジスタへのデータ転送を1クロックで行うことができ、SIMD演算による並列処理の効率を向上できる。したがって、粗密探索によるテンプレートマッチングをより高速化することが可能となる。
(変形例)
上述した実施形態の構成は本発明の一具体例を示したものにすぎず、本発明の範囲を限定する趣旨のものではない。本発明はその技術思想を逸脱しない範囲において、種々の具体的構成を採り得るものである。
上述した実施形態の構成は本発明の一具体例を示したものにすぎず、本発明の範囲を限定する趣旨のものではない。本発明はその技術思想を逸脱しない範囲において、種々の具体的構成を採り得るものである。
例えば、上記実施形態では、粗密探索を実行する前に画像全体のデータを再配置するようにしたが、第1の探索処理の検出結果に基づいて、画像内の必要な領域のデータのみを再配置するようにしてもよい。これにより、データの再配置に要する時間およびメモリの削減を期待できる。また上記実施形態では、n×m個の照合演算を一回のSIMD演算で実行したが、n×m個の照合演算で用いるデータがSIMDレジスタのデータ幅よりも大きい場合など、一回のSIMD演算で実行できない場合には、n×m個の照合演算を複数回(ただし、n×mよりも少ない回数)のSIMD演算で実行してもよい。すなわち、n×m個の照合演算をn×mよりも少ない回数のSIMD演算に置き換えることができれば、探索処理の高速化を図ることができる。
1:物体認識装置、2:物体、3:コンベヤ、10:画像処理装置、11:カメラ
20:テンプレート作成装置
30:物体認識処理装置、31:テンプレートDB、32:画像取得部、33:画像ピラミッド生成部、34:特徴抽出部、35:データ再配置部、36:テンプレートマッチング部、37:認識結果出力部
20:テンプレート作成装置
30:物体認識処理装置、31:テンプレートDB、32:画像取得部、33:画像ピラミッド生成部、34:特徴抽出部、35:データ再配置部、36:テンプレートマッチング部、37:認識結果出力部
Claims (5)
- テンプレートマッチングにより第1の画像のなかから対象物を検出する第1の探索ステップと、
前記第1の画像に比べ横n倍、縦m倍(n、mは2以上の整数)の解像度をもつ第2の画像のうち、前記第1の探索ステップで対象物が検出された位置に対応するnピクセル×mピクセルの領域を探索範囲とし、テンプレートマッチングにより前記第2の画像のなかから前記対象物を検出する第2の探索ステップと、を含む、粗密探索方法において、
前記第2の探索ステップに先立ち、前記第2の探索ステップにおいてテンプレートの同じ要素と照合演算され得るn×m個のピクセルのデータが連続したメモリアドレスに格納されるように、前記第2の画像のデータをワークメモリ上に再配置する再配置ステップをさらに含み、
前記第2の探索ステップでは、前記ワークメモリ上で連続したメモリアドレスに格納されているn×m個のピクセルに対するn×m個の照合演算が、SIMD命令によるn×mよりも少ない回数の演算処理で実行される
ことを特徴とする粗密探索方法。 - 前記再配置ステップでは、前記第2の画像において横方向に隣接する2つのピクセルのデータの間に、当該2つのピクセルのうちの一方のピクセルから縦方向に連なる(m−1)個のピクセルのデータのコピーを挿入する
ことを特徴とする請求項1に記載の粗密探索方法。 - 前記再配置ステップでは、前記第2の探索ステップにおいて用いるテンプレートの各要素のデータがn×m個ずつ連続したメモリアドレスに格納されるように、前記テンプレートのデータをワークメモリ上に再配置する
ことを特徴とする請求項1又は2に記載の粗密探索方法。 - 請求項1〜3のうちいずれか1項に記載の粗密探索方法の各ステップをコンピュータに実行させることを特徴とするプログラム。
- テンプレートマッチングにより画像のなかから対象物を検出する探索処理を実行するテンプレートマッチング部と、
前記探索処理に用いられるデータを格納するワークメモリと、
前記ワークメモリに格納するデータの再配置を行うデータ再配置部と、
前記テンプレートマッチング部の処理結果を出力する結果出力部と、
を有する画像処理装置であって、
前記テンプレートマッチング部は、テンプレートマッチングにより第1の画像のなかから対象物を検出する第1の探索処理を実行した後、前記第1の画像に比べ横n倍、縦m倍(n、mは2以上の整数)の解像度をもつ第2の画像のうち、前記第1の探索処理で対象物が検出された位置に対応するnピクセル×mピクセルの領域を探索範囲とし、テンプレートマッチングにより前記第2の画像のなかから前記対象物を検出する第2の探索処理を実行するものであり、
前記データ再配置部は、前記第2の探索処理に先立ち、前記第2の探索処理においてテンプレートの同じ要素と照合演算され得るn×m個のピクセルのデータが連続したメモリアドレスに格納されるように、前記第2の画像のデータを前記ワークメモリ上に再配置し、
前記第2の探索処理では、前記ワークメモリ上で連続したメモリアドレスに格納されているn×m個のピクセルに対するn×m個の照合演算が、SIMD命令によるn×mよりも少ない回数の演算処理で実行される
ことを特徴とする画像処理装置。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015218761A JP6493163B2 (ja) | 2015-11-06 | 2015-11-06 | 粗密探索方法および画像処理装置 |
PCT/JP2016/081870 WO2017077938A1 (ja) | 2015-11-06 | 2016-10-27 | 粗密探索方法および画像処理装置 |
CN201680042130.9A CN107851327B (zh) | 2015-11-06 | 2016-10-27 | 粗细搜索方法、图像处理装置及记录介质 |
US15/744,844 US10366307B2 (en) | 2015-11-06 | 2016-10-27 | Coarse-to-fine search method, image processing device and recording medium |
KR1020187001511A KR101991763B1 (ko) | 2015-11-06 | 2016-10-27 | 조밀 탐색 방법 및 화상 처리 장치 |
EP16861999.7A EP3373242B1 (en) | 2015-11-06 | 2016-10-27 | Coarse-to-fine search method and image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015218761A JP6493163B2 (ja) | 2015-11-06 | 2015-11-06 | 粗密探索方法および画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017091103A true JP2017091103A (ja) | 2017-05-25 |
JP6493163B2 JP6493163B2 (ja) | 2019-04-03 |
Family
ID=58662024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015218761A Active JP6493163B2 (ja) | 2015-11-06 | 2015-11-06 | 粗密探索方法および画像処理装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10366307B2 (ja) |
EP (1) | EP3373242B1 (ja) |
JP (1) | JP6493163B2 (ja) |
KR (1) | KR101991763B1 (ja) |
CN (1) | CN107851327B (ja) |
WO (1) | WO2017077938A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020061132A (ja) * | 2018-09-12 | 2020-04-16 | コグネックス・コーポレイション | マシンビジョン用の画像データを処理するための方法及び装置 |
JP2020071793A (ja) * | 2018-11-02 | 2020-05-07 | 富士通株式会社 | 目標検出プログラム、目標検出装置、及び目標検出方法 |
JPWO2020129384A1 (ja) * | 2018-12-21 | 2021-10-07 | 株式会社島津製作所 | 放射線画像処理装置、放射線画像処理方法及び放射線画像処理プログラム |
US11475593B2 (en) | 2018-09-12 | 2022-10-18 | Cognex Corporation | Methods and apparatus for processing image data for machine vision |
US11657630B2 (en) | 2018-09-12 | 2023-05-23 | Cognex Corporation | Methods and apparatus for testing multiple fields for machine vision |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6554900B2 (ja) * | 2015-04-28 | 2019-08-07 | オムロン株式会社 | テンプレート作成装置及びテンプレート作成方法 |
JP6648925B2 (ja) * | 2015-12-17 | 2020-02-14 | キヤノン株式会社 | 画像処理方法、画像処理装置、画像処理システム、生産装置、プログラム及び記録媒体 |
EP3200122B1 (de) * | 2016-01-26 | 2022-06-22 | Sick Ag | Optoelektronischer sensor und verfahren zur sicheren erkennung von objekten einer mindestgrösse |
JP7073785B2 (ja) * | 2018-03-05 | 2022-05-24 | オムロン株式会社 | 画像検査装置、画像検査方法及び画像検査プログラム |
EP3572971B1 (de) * | 2018-05-22 | 2021-02-24 | Sick Ag | Absichern eines überwachungsbereichs mit mindestens einer maschine |
CN110603535B (zh) * | 2019-07-29 | 2023-02-28 | 香港应用科技研究院有限公司 | 支持大模板匹配的迭代多方向图像搜索 |
CN110910312A (zh) * | 2019-11-21 | 2020-03-24 | 北京百度网讯科技有限公司 | 图像处理方法和装置、自动驾驶车辆、电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000069478A (ja) * | 1998-08-18 | 2000-03-03 | Canon Inc | 画像処理装置及び方法並びに記憶媒体 |
JP2004173224A (ja) * | 2002-11-20 | 2004-06-17 | National Chiao Tung Univ | 全二値表現によるモーション推定のための方法および装置 |
JP2008226190A (ja) * | 2007-03-15 | 2008-09-25 | Canon Electronics Inc | 画像処理装置およびその方法 |
JP2014078110A (ja) * | 2012-10-10 | 2014-05-01 | Konica Minolta Inc | 画像処理装置、画像処理方法および画像処理プログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7715591B2 (en) * | 2002-04-24 | 2010-05-11 | Hrl Laboratories, Llc | High-performance sensor fusion architecture |
JP2010134612A (ja) | 2008-12-03 | 2010-06-17 | Nikon Corp | 画像処理方法およびプログラム |
US8290298B2 (en) * | 2009-01-20 | 2012-10-16 | Mitsubishi Electric Research Laboratories, Inc. | Method for temporally editing videos |
JP5389592B2 (ja) | 2009-09-30 | 2014-01-15 | 富士フイルム株式会社 | 特定被写体検出方法及び装置 |
US8848970B2 (en) | 2011-04-26 | 2014-09-30 | Digimarc Corporation | Salient point-based arrangements |
US9495611B2 (en) * | 2012-01-17 | 2016-11-15 | Konica Minolta, Inc. | Image processing apparatus, image processing method, and image processing program |
US8774510B2 (en) * | 2012-09-11 | 2014-07-08 | Sharp Laboratories Of America, Inc. | Template matching with histogram of gradient orientations |
US10586570B2 (en) * | 2014-02-05 | 2020-03-10 | Snap Inc. | Real time video processing for changing proportions of an object in the video |
CN104050481B (zh) * | 2014-06-17 | 2017-05-03 | 西安电子科技大学 | 多模板轮廓特征和灰度相结合的红外图像实时行人检测 |
CN104318570B (zh) * | 2014-10-29 | 2017-06-30 | 沈阳建筑大学 | 一种基于背景的自适应迷彩伪装设计方法 |
-
2015
- 2015-11-06 JP JP2015218761A patent/JP6493163B2/ja active Active
-
2016
- 2016-10-27 WO PCT/JP2016/081870 patent/WO2017077938A1/ja active Application Filing
- 2016-10-27 US US15/744,844 patent/US10366307B2/en active Active
- 2016-10-27 EP EP16861999.7A patent/EP3373242B1/en active Active
- 2016-10-27 CN CN201680042130.9A patent/CN107851327B/zh active Active
- 2016-10-27 KR KR1020187001511A patent/KR101991763B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000069478A (ja) * | 1998-08-18 | 2000-03-03 | Canon Inc | 画像処理装置及び方法並びに記憶媒体 |
JP2004173224A (ja) * | 2002-11-20 | 2004-06-17 | National Chiao Tung Univ | 全二値表現によるモーション推定のための方法および装置 |
JP2008226190A (ja) * | 2007-03-15 | 2008-09-25 | Canon Electronics Inc | 画像処理装置およびその方法 |
JP2014078110A (ja) * | 2012-10-10 | 2014-05-01 | Konica Minolta Inc | 画像処理装置、画像処理方法および画像処理プログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020061132A (ja) * | 2018-09-12 | 2020-04-16 | コグネックス・コーポレイション | マシンビジョン用の画像データを処理するための方法及び装置 |
US11475593B2 (en) | 2018-09-12 | 2022-10-18 | Cognex Corporation | Methods and apparatus for processing image data for machine vision |
JP7182528B2 (ja) | 2018-09-12 | 2022-12-02 | コグネックス・コーポレイション | マシンビジョン用の画像データを処理するための方法及び装置 |
US11657630B2 (en) | 2018-09-12 | 2023-05-23 | Cognex Corporation | Methods and apparatus for testing multiple fields for machine vision |
JP2020071793A (ja) * | 2018-11-02 | 2020-05-07 | 富士通株式会社 | 目標検出プログラム、目標検出装置、及び目標検出方法 |
JP7212247B2 (ja) | 2018-11-02 | 2023-01-25 | 富士通株式会社 | 目標検出プログラム、目標検出装置、及び目標検出方法 |
JPWO2020129384A1 (ja) * | 2018-12-21 | 2021-10-07 | 株式会社島津製作所 | 放射線画像処理装置、放射線画像処理方法及び放射線画像処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US10366307B2 (en) | 2019-07-30 |
CN107851327B (zh) | 2021-06-11 |
KR20180018785A (ko) | 2018-02-21 |
EP3373242A4 (en) | 2019-08-21 |
US20180204090A1 (en) | 2018-07-19 |
CN107851327A (zh) | 2018-03-27 |
EP3373242A1 (en) | 2018-09-12 |
WO2017077938A1 (ja) | 2017-05-11 |
EP3373242B1 (en) | 2022-08-10 |
KR101991763B1 (ko) | 2019-06-21 |
JP6493163B2 (ja) | 2019-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6493163B2 (ja) | 粗密探索方法および画像処理装置 | |
US11610362B2 (en) | Data volume sculptor for deep learning acceleration | |
CN108573273B (zh) | 图像处理装置、图像处理方法、模板作成装置、物体识别处理装置以及记录介质 | |
JP6554900B2 (ja) | テンプレート作成装置及びテンプレート作成方法 | |
US10803615B2 (en) | Object recognition processing apparatus, object recognition processing method, and program | |
US10713530B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP6656988B2 (ja) | 画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法 | |
US20200005078A1 (en) | Content aware forensic detection of image manipulations | |
CN110942473A (zh) | 一种基于特征点网格化匹配的运动目标跟踪检测方法 | |
CN114758145A (zh) | 一种图像脱敏方法、装置、电子设备及存储介质 | |
Zhang et al. | Data association between event streams and intensity frames under diverse baselines | |
Geng et al. | SANet: A novel segmented attention mechanism and multi-level information fusion network for 6D object pose estimation | |
Mentzer et al. | Online stereo camera calibration for automotive vision based on HW-accelerated A-KAZE-feature extraction | |
CN113837998B (zh) | 一种基于深度学习的图片自动调整对齐的方法及装置 | |
Guo et al. | CoFiNet: Unveiling Camouflaged Objects with Multi-Scale Finesse | |
US10706319B2 (en) | Template creation apparatus, object recognition processing apparatus, template creation method, and program | |
Romphet et al. | Optimizing MobileNetV2 architecture using split input and layer replications for 3D face recognition task | |
Scott et al. | cvTile: Multilevel parallel geospatial data processing with OpenCV and CUDA | |
JP2018136703A (ja) | 画像認識装置 | |
CN116012891A (zh) | 基于图像增强的多尺度行人检测方法、装置、设备及介质 | |
Wang et al. | Pedestrian Detection Over 100 fps with C4 Algorithm | |
Yu et al. | Research on tile surface defect detection by improved YOLOv5. | |
Huang et al. | PanoNormal: Monocular Indoor 360 {\deg} Surface Normal Estimation | |
CN115690051A (zh) | Pcb缺陷检测方法、装置、计算机设备及存储介质 | |
JP2020166341A (ja) | 画像認識装置、及び画像認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6493163 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |