JP5976665B2 - 画像の並列処理方法および装置 - Google Patents

画像の並列処理方法および装置 Download PDF

Info

Publication number
JP5976665B2
JP5976665B2 JP2013543531A JP2013543531A JP5976665B2 JP 5976665 B2 JP5976665 B2 JP 5976665B2 JP 2013543531 A JP2013543531 A JP 2013543531A JP 2013543531 A JP2013543531 A JP 2013543531A JP 5976665 B2 JP5976665 B2 JP 5976665B2
Authority
JP
Japan
Prior art keywords
image
convolution
difference
original image
blur
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013543531A
Other languages
English (en)
Other versions
JP2014501980A (ja
Inventor
シェハイバー モアタセム
シェハイバー モアタセム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IVISYS APS
Original Assignee
IVISYS APS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IVISYS APS filed Critical IVISYS APS
Publication of JP2014501980A publication Critical patent/JP2014501980A/ja
Application granted granted Critical
Publication of JP5976665B2 publication Critical patent/JP5976665B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20224Image subtraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、畳み込んだデータの並列計算に関するものである。特に、本発明は、SIFTアルゴリズムで使用するための繰り返し畳み込んだデータの並列演算などのような、画像データの並列処理に適したガウシアンピラミッド構築の効率的な計算に関するものである。
とりわけ、米国特許第6711293号に開示された従来のSIFTアルゴリズムは、画像中のスケール不変特徴を識別するための方法および装置と、画像内のオブジェクトを検索するための、これら特徴の使用を開示している。
米国特許出願公開2010/0169576には、スケール不変特徴変換アルゴリズムを実装するための方法が開示されているが、ここでは、ガウシアン画像の差分は、入力画像をガウシアンフィルタの差で畳み込むことで得られる。この出願では、プロセスが並行して行われてもよいことになっているが、実際の並列実装については触れていない。
従来のSIFTアルゴリズムは、逐次型プロセッサを使用する実装に適した直列アルゴリズムとして設計された。従来のSIFTアルゴリズムの速度を増大させるためには、並列プロセスとしてアルゴリズムを実行するように企図されてもよい。しかしながら、従来のSIFTアルゴリズムは、多数のステップからなっており、ステップの結果は後続を計算するための必須条件である。したがって、従来のSIFTアルゴリズムは、それ自体が容易に並列処理に適したものとはならない。
本発明の発明者は、驚くべきことに、従来のSIFTアルゴリズムにおける特定のステップは、並列処理を可能にするために改変され得ることを発見した。さらに、発明者は、このような改変により、手法をハードウェアに組み込むことができることを見出したため、これによって、アルゴリズムを実装した既知のソフトウェアと比較して、計算速度の驚異的な増大が可能となった。
一態様によれば、本発明は、複数の画素によって画成される画像においてスケール不変特徴を識別する方法で使用する差分画像を取得するための方法に関し、この方法は、2つの異なるボケ畳み込み関数間の差を算出することにより差分畳み込み関数値Difを計算し、前記2つの異なるボケ畳み込み関数の各々は、原画像を畳み込むことで原画像の異なるボケの程度を提供し、差分画像を取得するために前記差分畳み込み関数値Difを原画像と畳み込むことからなるものである。差分畳み込み関数は、好ましくは一度だけ計算され、その後、異なる画像に対して繰り返し使用してもよい。
一態様によれば、本発明は、複数の画素によって画成される画像におけるスケール不変特徴を識別する方法において使用する複数の差分画像を取得するための方法に関し、この方法は、複数のボケ畳み込み関数を提供し、前記畳み込み関数の各々は前記原画像の畳み込み時に原画像の増大するボケの程度を提供し、原画像から複数の差分画像を算出するものである。ボケ畳み込み関数は、好ましくは一度だけ計算され、その後、異なる画像に対して繰り返し使用することができる。ガウシアンボケ関数を用いると、その関数を畳み込むことによって得られる関数の幅を取得するためには、関数の幅を追加すれば足りる。
一態様によれば、本発明は、複数の画素によって画成される原画像から複数の差分画像を取得するための方法に関し、前記方法は、
a.複数のボケ畳み込み関数を提供する工程であって、前記畳み込み関数の各々は前記原画像の畳み込み時に原画像の増大するボケの程度を提供する工程と、
b.2つの前記ボケ畳み込み関数間の差を算出することにより複数の差分畳み込み関数値Difを確立する工程であって、前記2つのボケ畳み込み関数の各々は、前記原画像の畳み込み時に原画像のボケの異なる程度を提供する工程と、
c.差分画像を取得するために、前記差分畳み込み関数値Difの各々を前記原画像と畳み込むことによって、前記原画像から複数の差分画像を算出する工程と、を備える。
一態様によれば、本発明は、第1の複数の差分画像および少なくとも1つの後続する複数の差分画像を取得するための方法に関し、前記方法は、
a.複数のボケ畳み込み関数を用いて、本発明により原画像から前記第1の複数の差分画像を取得する工程と、
b.ダウンサンプリング・アンチエイリアシング畳み込み関数DAconを取得するために、前記複数のボケ関数をダウンサンプリング関数およびアンチエイリアシング関数で畳み込む工程と、
c.後続画像を取得するために、前記ダウンサンプリング・アンチエイリアシング畳み込み関数DAconを前記原画像と畳み込む工程と、
d.本発明により後続画像から後続する複数の差分画像を取得する工程と、
e.任意に、前記原画像として前記後続画像を用い、付加的な後続する複数の差分画像を取得するために、上記cおよびdの工程を繰り返す工程と、
を備える。
一態様によれば、本発明は、第1の複数の差分画像および少なくとも1つの後続する複数の差分画像を取得するための方法であって、前記方法は、
a.複数のボケ畳み込み関数を用いて、請求項1乃至8のいずれか一項に記載の方法により原画像から前記第1の複数の差分画像を取得する工程と、
b.第1の画像を取得するために、ボケた原画像をダウンサンプリングする工程と、
c.ダウンサンプリング・アンチエイリアシング畳み込み関数Aconを取得するために、前記複数のボケ関数をアンチエイリアシング関数と畳み込む工程と、
d.後続画像を取得するために、取得されたアンチエイリアシング畳み込み関数Aconを第1の画像と畳み込む工程と、
e.請求項1乃至8のいずれか一項に記載の方法により前記後続画像から後続する複数の差分画像を取得する工程、
f.任意に、前記後続画像前記原画像を表示し、付加的な後続する複数の差分画像を取得するために、上記b、cおよびdの工程を繰り返す工程と、
を備える。
一態様によれば、本発明は、第1の複数の差分画像および多数nの後続する複数の差分画像を取得するための方法であって、前記方法は、
a.複数のボケ畳み込み関数を用いて、本発明により原画像から前記第1の複数の差分画像を取得する工程と、
b.ダウンサンプリング・アンチエイリアシング畳み込み関数DAconを取得するために、前記複数のボケ関数をダウンサンプリング関数およびアンチエイリアシング関数で畳み込む工程と、
c.後続画像を取得するために、前記ダウンサンプリング・アンチエイリアシング畳み込み関数DAconを前記原画像と畳み込む工程と、
d.本発明により後続画像から後続する複数の差分画像を取得する工程と、
e.任意に、前記原画像として前記後続画像を用い、付加的な後続する複数の差分画像を取得するために、上記cおよびdの工程を繰り返す工程と、
を備える。
一態様によれば、本発明は、複数の画素によって画成される画像内で種々のスケールにわたって安定した画像特徴を識別するための方法であって、多重フィルタリング工程およびリサンプリング工程が並行して実施され得る方法において、前記方法は、
a.本発明の方法により多重差分画像を取得する工程と、
b.前記多重差分画像における画素振幅極値を検索する工程と、
c.各差分画像内の各画素について画素勾配ベクトルを生成する工程と、
d.ベクトルの向きを、各差分画像に関連するそれぞれの実際の最大および最小振幅画素と関連付ける工程と、
を備える。
一態様によれば、本発明は、複数の画素によって画成される原画像から複数の差分画像を取得するための画像処理装置であって、前記装置は、前記第1の画像に関するデータを受信するための手段と、前記差分画像を送信または記憶するための手段、および処理手段を備え、差分画像を取得するために、複数の差分ボケ関数Difの各々を前記原画像に畳み込むことによって原画像から複数の差分画像を算出し、前記複数の差分畳み込み関数Difは、2つのボケ畳み込み関数間の差を計算することによって確立され、前記2つのボケ畳み込み関数の各々は、前記原画を畳み込むと前記原画像の異なるボケの程度を提供する。
一態様によれば、本発明は、複数の画素によって画成される画像におけるスケール不変特徴を識別するための画像処理装置であって、前記画像処理装置は、本発明の方法を実装するように構成されたプロセッサ回路を備える。
一態様によれば、本発明は、複数の画素によって画成される原画像から差分画像を複数取得するためのソフトウェアプログラムであって、前記ソフトウェアプログラムは、複数のプロセッサに以下の動作をもたらす:前記複数のプロセッサが並行して異なる差分画像を算出するように、複数の差分ボケ関数Difの各々を前記原画像に畳み込むことによって原画像から複数の差分画像を算出し、前記差分畳み込み関数値Difは、2つのボケ畳み込み関数の差を計算することによって確立され、前記2つのボケ畳み込み関数の各々は、前記原画を畳み込むと前記原画像の異なるボケの程度を提供する。
一態様によれば、本発明は、複数の画素によって画成された画像においてスケール不変特徴を識別するためのソフトウェアプログラムであって、前記ソフトウェアプログラムが請求項1〜12のいずれか一項に記載の方法を実装するように構成される。
[詳細な開示]
追加の態様および実施形態を以下に記載する。
実施形態によれば、本発明は、複数の画素によって画成される原画像から複数の差分画像を取得するための方法であって、
a.複数のボケ畳み込み関数を提供する工程であって、前記畳み込み関数の各々は前記原画像の畳み込み時に原画像の増大するボケの程度を提供する工程と、
b.2つの前記ボケ畳み込み関数間の差を算出することにより複数の差分畳み込み関数値Difを確立する工程であって、前記2つのボケ畳み込み関数の各々は、前記原画像の畳み込み時に原画像のボケの異なる程度を提供する工程と、
c.差分画像を取得するために、前記差分畳み込み関数値Difの各々を前記原画像と畳み込むことによって、前記原画像から複数の差分画像を算出する工程と、
を備える。
この方法の特有な利点は、並列処理に容易に適応できることである。
実施形態によれば、本発明は、複数の前記差分画像が並列に計算される方法に関する。
実施形態によれば、本発明は、前記原画像におけるスケール不変特徴を識別する方法で使用するために、本発明による方法に関する。
実施形態によれば、本発明は、本発明に係る方法であって、前記複数の差分ボケ畳み込み関数は、一旦確定され、前記差分画像の後続計算に繰り返し使用される。ボケ畳み込み関数および/または差分畳み込み関数は、好ましくは一度だけ計算され、その後、異なる画像に対して繰り返し使用することができる。畳み込み関数は、単一チップのようなハードウェアに実装してもよい。
実施形態によれば、本発明は、前記ボケ畳み込み関数がガウシアン関数である、本発明よる方法に関する。ガウシアンボケ畳み込み関数を使用すると、その関数を畳み込むことによって得られる関数の幅を取得するためには、その関数の幅を追加すれば足りる。
実施形態によれば、本発明は、前記差分畳み込み関数値Difが多項式によって近似される、本発明による方法に関する。
実施形態によれば、本発明は、第1の複数の差分画像および少なくとも1つの後続する複数の差分画像を取得するための方法であって、
a.複数のボケ畳み込み関数を用いて、請求項1乃至6のいずれか一項に記載の方法により原画像から前記第1の複数の差分画像を取得する工程と、
b.ダウンサンプリング・アンチエイリアシング畳み込み関数DAconを取得するために、前記複数のボケ関数をダウンサンプリング関数およびアンチエイリアシング関数で畳み込む工程と、
c.後続画像を取得するために、前記ダウンサンプリング・アンチエイリアシング畳み込み関数DAconを前記原画像と畳み込む工程と、
d.請求項1乃至6のいずれか一項に記載の方法により後続画像から後続する複数の差分画像を取得する工程と、
e.任意に、前記原画像として前記後続画像を用い、付加的な後続する複数の差分画像を取得するために、上記cおよびdの工程を繰り返す工程と、
を備える。
工程bは一度行うことができ、ハードウェア実装の一部であってもよい。工程eの代わりに、更なるボケとダウンサンプリングおよびアンチエイリアシング畳み込み関数を組み合わせることにより、より多くの後続する複数の差分画像を原画像から直接計算することができる。
実施形態によれば、本発明は、後続する複数の差分画像は、原画像から、付加的なボケ、ダウンサンプリングおよびアンチエイリアシング畳み込み関数と畳み込むことによって、直接計算される本発明の方法に関する。
実施形態によれば、本発明は、第1の複数の差分画像および少なくとも1つの後続する複数の差分画像を取得するための方法であって、
a.複数のボケ畳み込み関数を用いて、請求項1乃至8のいずれか一項に記載の方法により原画像から前記第1の複数の差分画像を取得する工程と、
b.第1の画像を取得するために、ボケた原画像をダウンサンプリングする工程と、
c.ダウンサンプリング・アンチエイリアシング畳み込み関数Aconを取得するために、前記複数のボケ関数をアンチエイリアシング関数と畳み込む工程と、
d.後続画像を取得するために、取得されたアンチエイリアシング畳み込み関数Aconを第1の画像と畳み込む工程と、
e.請求項1乃至8のいずれか一項に記載の方法により前記後続画像から後続する複数の差分画像を取得する工程、
f.任意に、前記後続画像前記原画像を表示し、付加的な後続する複数の差分画像を取得するために、上記b、cおよびdの工程を繰り返す工程と、
を備える。
実施形態によれば、本発明は、第1の複数の差分画像と、多数nの後続する複数の差分画像を取得するための方法であって、前記方法は、
a.複数のボケ畳み込み関数を用いて、請求項1乃至9のいずれか一項に記載の方法により原画像から前記第1の複数の差分画像を取得する工程と、
b.前記複数のボケ関数をダウンサンプリング関数およびアンチエイリアシング関数と畳み込むことで第1のダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(1)を取得する工程と、
c.nが1よりも大きい場合、以前のダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(t−1)を、前記複数のボケ関数、ダウンサンプリング関数、およびアンチエイリアシング関数と畳み込むことで、付加的なダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(t)を取得する工程であって、t=2でこの工程cを始め、単一増分でtを増加させながらtがnに達するまでこの工程を繰り返す工程と、
d.ダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(x)の各々について画像(x)を取得すべく、前記ダウンサンプリング・アンチエイリアシング畳み込み関数DAconの全てを前記原画像と畳み込む工程と、
e.請求項1乃至9のいずれか一項に記載の方法により後続するn個の複数の差分画像を取得して、画像(x)の各々から複数(x)の各々を取得する工程と、
を備える。
ここでは、パラメーtおよびxは、関数と複数と画像を区別するために導入されたダミーのパラメータである。更なる実施形態によれば、工程b及びcは一度だけ行われる必要があり、ハードウェアに実装することができる。
実施形態によれば、本発明は、複数の画素によって画成される画像内で種々のスケールにわたって安定した画像特徴を識別するための方法であって、多重フィルタリング工程およびリサンプリング工程が並行して実施され得る方法において、
a.請求項1乃至10のいずれか一項に記載の方法により多重差分画像を取得する工程と、
b.前記多重差分画像における画素振幅極値を検索する工程と、
c.各差分画像内の各画素について画素勾配ベクトルを生成する工程と、
d.ベクトルの向きを、各差分画像に関連するそれぞれの実際の最大および最小振幅画素と関連付ける工程と、
を備える。
実施形態によれば、本発明は、複数のフィルタリング工程がガウシアンフィルタリング工程である。
実施形態によれば、本発明は、複数の画素によって画成される原画像から複数の差分画像を取得するための画像処理装置であって、前記第1の画像に関するデータを受信するための手段と、前記差分画像を送信または記憶するための手段、および処理手段を備え、差分画像を取得するために、複数の差分ボケ関数Difの各々を前記原画像に畳み込むことによって原画像から複数の差分画像を算出し、前記複数の差分畳み込み関数Difは、2つのボケ畳み込み関数間の差を計算することによって確立され、前記2つのボケ畳み込み関数の各々は、前記原画を畳み込むと前記原画像の異なるボケの程度を提供する、装置。
実施形態によれば、本発明は、複数の画素によって画成される画像におけるスケール不変特徴を識別するための画像処理装置に関し、前記画像処理装置は、本発明の方法を実装するように構成されたプロセッサ回路を備える。
実施形態によれば、本発明は、画像処理装置に関するものであって、前記プロセッサ回路は、例えばCPUなどのチップを含む。
実施形態によれば、本発明は、画像処理装置に関するものであって、前記画像処理装置は複数のチップを備え、各チップは少なくとも一つの差分画像を計算するように構成される。これにより、差分画像の並列計算を可能にする。
実施形態によれば、本発明は、画像処理装置に関し、前記画像処理装置は双線形補間器を備え、前記双線形補間器は、乗加算器(MAC)、遅延線加算器、および制御論理ブロックを含んでいる。
実施形態によれば、本発明は、複数の画素によって画成される原画像から差分画像を複数取得するためのソフトウェアプログラムであって、前記ソフトウェアプログラムは、複数のプロセッサに以下の動作をもたらす:前記複数のプロセッサが並行して異なる差分画像を算出するように、複数の差分ボケ関数Difの各々を前記原画像に畳み込むことによって原画像から複数の差分画像を算出し、前記差分畳み込み関数値Difは、2つのボケ畳み込み関数の差を計算することによって確立され、前記2つのボケ畳み込み関数の各々は、前記原画を畳み込むと前記原画像の異なるボケの程度を提供する。
実施形態によれば、本発明は、複数の画素によって画成された画像においてスケール不変特徴を識別するためのソフトウェアプログラムに関し、前記ソフトウェアプログラムは、本発明の方法を実装するように構成される。
SIFTアルゴリズムの一部として、多重スケールで生じるガウシアン差分(DoG)が計算される。原理上、他の関数も適用することができるが、ここでは説明のためにガウシアン関数が用いられる。
SIFTアルゴリズムでは、入力画像は一定回数繰り返しボケさせられ、連続するボケの反復の間の差が計算される。得られた画像の一つは、その後、ダウンサンプリングされ、ボケ/差分演算が繰り返される。結果は、「ガウシアンの差」画像の収集であり、いくつかは各スケールのためのものである。収集は、ガウシアンピラミッドの差と呼ばれ、本明細書ではDoGピラミッドと呼ぶ。
本発明の一態様によれば、ガウシアンピラミッドにおけるオクターブ全域のスケーリングされた画像が生成され、スケール/ダウンサンプリング画像を単一DoGカーネルの各々により畳み込むことで、ピラミッド内の全てのスケールで全てのDoG画像が並列に計算されるが、ここでは、各DoGカーネルはその分散と偏角において一意的なものである。得られた畳み込みプロセスは、必要とされるDoG画像の数に対応する多数の2次元FIRフィルタによって、全体のスケールでスケーリングされた画像を並列フィルタリングすることに相当する。FIRフィルタの係数は、予め計算されていてもよい。
画素数の線形時間複雑度を取り入れたピラミッド方法は、例えば、ビデオ圧縮、画像改善や画像再構成、並びに画像分割や特徴抽出などのアプリケーションを含むリアルタイム画像処理と解析に適している。
これらのアプリケーションに使用される例示的関数のいくつかは、以下のとおりである。
・双二次B−スプラインフィルタリングとのズーミング
・任意ボケ幅の効率的な画像ブレ
・散乱ピクセルデータとの滑らかな補間
・ミップマップテクスチャ
・勾配両極端を検出するためのスケールスペース構築
ここで、ガウシアンフィルタリングおよびリサンプリングカーネルの組み合わせからなる解析フィルタの並列インスタンス化を使用して、例えば、ガウシアンピラミッドを構築するための方法とシステムが提示される。本発明を説明するため、SIFTアルゴリズムによって示唆されるように、勾配両極端を検出するためのスケールスペース構造を構築するための方法およびシステムの実施形態を提示する。
SIFTの計算における主要なフェーズは、スケールスペース構造である。このフェーズでは、興味深い画像の特徴あるいはキーポイントは、画像の候補位置を識別するカスケードフィルタリングアプローチを用いて検出される。これらの画像位置は、種々の手法を用いながら、更なる段階で評価され、検証される。
最初の工程は、興味のある対象に変化をもたらすことで繰り返し割り当てることができる画像位置座標とスケールを識別することである。
スケールについて不変である位置を見つけることは、様々なスケールにわたって安定した特徴を検索するスケール関数によって行われる。最適なスケールスペース畳み込みカーネルは、入力画像のスケールスペース関数を決定するために使用されるガウシアン関数である。
スケールスペースで安定したキーポイントの位置を検出するために、画像で畳み込まれたガウシアン(DoG)関数の差D(x;y;σ)は、定数乗算係数kで区切られた二つの隣接するスケールの差から計算される。
DoG画像D(x;y;σ)は、以下の式により与えられる:
D(x,y,σ)=L(x,y,kσ)−L(x,y,kσ)
ここで、L(x;y;kσ)は、スケールkσにおけるガウシアンボケまたはカーネルG(x;y;kσ)と原画像L(x,y)との畳み込み(コンボリューション)であり、すなわち、
L(x,y,kσ)=G(x,y,kσ)I(x,y)
である。
記号""
は、xとyでの畳み込み演算を示すために使用される。このように、従来のSIFTアルゴリズムは、2つの畳み込みを計算し、その後、これら2つの畳み込み間の差を算出する。
本発明の一態様によれば、画像の2つの畳み込み間の差は、次のように2つの畳み込み関数間の差として、関数DiFで画像を畳み込むことによって計算することができる:
Figure 0005976665
ここで、
Figure 0005976665
である。
この置換を用いることによって、2つの畳み込み処理と差分の後続計算は、単一の畳み込み演算によって置き換えられるため、速度の顕著な増大が達成される。
ガウシアンカーネルを用いると、
Figure 0005976665
2つのガウシアンカーネルの畳み込みが、第3のガウシアンカーネルを生成することが示されるが、ガウシアン構成要素の分散の和である分散を伴う。
Figure 0005976665
繰り返し行われる畳み込みは、畳み込み関数を畳み込んで得られた単一の畳み込みにより置換してもよい。
同様に、一方の幅が他方の幅の2倍である2つのガウシアンカーネルのためのDiFが、下記の通り計算できることが示される。
Figure 0005976665
一般的には、一定の係数kで区切られた2つのガウシアンカーネルのためのDiFは、次のように計算できることを示すことが可能である。
Figure 0005976665
引用した文献はすべて、参照により本明細書に組み込まれる。
添付の図面と注釈は、本発明を限定するためではなく提供される。態様、実施形態および本発明の特許請求の範囲を組み合わせることができることは当業者にとって明らかであろう。
図面を以下に取り入れ、引き続いて、いくつかの図面についてさらに説明する。
図1はカスケードアプローチを用いてガウシアンピラミッドを構築する従来の方法を表現した概略図である。 図2は、並列ハードウェア実装に適した2つの実施形態による2つの異なるDoGピラミッド方法を表現した模式的概略図である。 図3は、実施形態による双線形ダウンサンプリン補間器のブロック図を示す模式的概略図である。 図4は、実施形態による双線形ダウンサンプリング補間器のハードウェアの効果的な実装のブロック図を示す模式的概略図である。 図5は、実施形態によるダウンサンプリング補間器を示す模式的フローチャートである。 図6は、本発明の実施形態により、効率的なハードウェア性能のためにガウシアンピラミッドの基本的な構築ブロックがいかに組み合わせることができるかを示す模式図である。 図7は、実施形態によるガウシアンピラミッドの構築のための効果的な双線形補間器を説明する概略図である。これは、双線形テクスチャ補間に基づくピラミッドスキームである。 図8Aは、幅の異なる2つのガウシアン関数間の差を算出して得られたガウシアンカーネル(DiF)の差を示すもので、これらの1つは図8Bに示されている。 図8Aは、幅の異なる2つのガウシアン関数間の差を算出して得られたガウシアンカーネル(DiF)の差を示すもので、これらの1つは図8Bに示されている。 図9は、実施形態よるDoG関数を計算するための模式的ブロック図である。 図10は、実施形態によるハードウェア実装の一部を示す模式図である。 図11は、実施形態によるハードウェア実装の一部を示す模式図である。 図12は、実施形態によるハードウェア実装の一部を示す模式図である。
[注釈]
図1は、DoG関数を構築する従来の方法を、例を挙げて示すものである。
ガウシアンカーネルのカスケード特性に従って、2つのガウシアンカーネルの畳み込みが第3のガウシアンカーネルを生成する。上述したように、2つのガウシアンカーネルを畳み込むと、構成するガウシアンの分散の和である分散σを持つ新規なより広い幅のガウシアンを取得する。下記記号は、畳み込み演算を表すために使用される。
Figure 0005976665
図1の各レベルでの減算器出力におけるガウシアンの画像の差は、次のように表すことができる。
Figure 0005976665
ここで、n=1からs、mは1からピラミッドレベルの数まで達する。
同様に、各レベルの入力画像は、下記の式で表すことができる。
Figure 0005976665
式において、m=>1である。従って、DoGピラミッドの完全な並列計算を可能にし、図1は図2として表し直せる。
図2を参照すると、リサンプリングカーネルとhpで示されるパスガウシアンカーネルの組み合わせは、分析フィルタとみなすことができるが、ここでは画像が先ず補間カーネルk(x、y)により畳み込まれ、次いでアンチエイリアスフィルタリングを含む畳み込みカーネルG(x、y、2σ+σ)により畳み込まれる。
次に、組み合わされた補間カーネルとG(x、y、2σ+σ)の解析フィルタは、単一の畳み込みカーネルにより次式で表すことができる。
Figure 0005976665
それ故、式(2)は次のように書き直すことができる(別表Aの論証を参照のこと):
Figure 0005976665
または
Figure 0005976665
または
Figure 0005976665
一般的には、K(x、y)で表されるリサンプリング関数は、デルタディラック関数δ(x)と見做すことができる。これは、内側のスケールがゼロになるにつれて限界をとるとき、ガウシアン関数で表すことができる一般化数学関数の一つである。それ故:
Figure 0005976665
となる。
従って、任意のサンプリング関数をガウシアンカーネルとして扱うことができ、カスケード特性を適用することができることとなる。
リサンプリング関数が畳み込みによる補間(畳み込み補間は任意のグリッド間でデータをリサンプリングするために使用される一般的な方法である)である特定のケースでは、解析フィルタは、1つのガウシアンカーネルによって以下の式で表すことができる。
Figure 0005976665
リサンプリングがダウンサンプリング関数を含む別の特定のケースでは、各次元における2の係数による換算を伴い、分析フィルタの組み合わせのために、便宜上、特定の表記を導入することができる。
Figure 0005976665
ここで、gは入力画像を意味し、fは下記の成分を伴って結果として生ずる画像である。
Figure 0005976665
フィルタマスクhがn×nマトリクスで表され、画像gがn×nの寸法である場合、マトリクス成分fr,cは行インデックスrおよび列インデックスcのためのものである。
ダウンサンプリングカーネルが双線補間である特定のケースでは、解析双線補間は、次式に従って、粗いスケールで単一の画素を生成するために、1つのスケール(s)において2×2カーネル内で4つの隣接する画素の重み付け平均化よって機能する。
Figure 0005976665
ここで、隣接する画素はp(x、y)によって表せられる。
Figure 0005976665
このような補間器のブロック図を図3に示す。図に示すように、線形時不変離散時間システムは、以下の式で表すことができる。
Figure 0005976665
ここで、kは入力画像のライン幅であり、tは整数であり、Nはサンプリング周期である。かくして、
Figure 0005976665
となる。
図4は、効果的な双線補間器のハードウェア実装のブロック図を示している。補間器は、乗加算器(MAC)、遅延線加算器、および制御論理ブロックで構成される。補間器は、実際のピラミッドレベルの画像における、線あたりの画素数および線の数に関して、画像サイズに対して設定可能である。ダウンサンプリング補間関数は、図5のフローチャートに概説されているが、ここではダウンサンプル補間器における制御ロジックを示している。
付録A:単一処理における補間と畳み込み
補間カーネル(x、y)によって画像f(x、y)をリサンプリングし、その後、これを畳み込みカーネルp(x、y)により畳み込むことを所望するならば、k(x、y)によるp(x、y)の畳み込みであるカーネルq(x、y)によって畳み込むことによって工程を節約することができる。
Figure 0005976665
(x、y)を取得するにはカーネルq(x、y)を使用して補間する。
Figure 0005976665
q(x、y)の定義に当てはめる:
Figure 0005976665
合計を再グループ化すると、最終的な合計に到達する:
Figure 0005976665
これを証明するため、補間後に且つ畳み込み前に、f(x、y)を画像として定義する:
Figure 0005976665
そして、最終結果f(x、y)を取得するために、p(x、y)によってこれを畳み込む:
Figure 0005976665
(x、y)のため値に当てはめる:
Figure 0005976665
合計を再グループ化することで、q(x、y)で補間することによって得たものと同じものを取得する:
Figure 0005976665
補間カーネルが、畳み込みカーネルよりも広い周波数範囲をサンプリングする正弦関数である場合、為さなければならないことは、畳み込みカーネルを用いて補間することのみであることに留意されたい。
Figure 0005976665
正弦関数のフーリエ変換は正方形であるから:
Figure 0005976665
ここで、もし|s|1/2の場合には、Π(s)=1であり、そうでなければ0である。
Figure 0005976665
これは、K(u,v)がいずれであっても、P(u、v)が0であるようなスケールを、K(u,v)が持つ場合である。換言すれば、P(u、v)が補間正弦関数K(u,v)の帯域制限よりも狭い帯域で制限される帯域であればいつでも、Q(u,v)=P(u,v)となる。

Claims (9)

  1. 第1の複数の差分画像および多数nの後続する複数の差分画像を取得するための並列計算のための方法であって、
    a.複数の画素によって画成された原画像から第1の複数の差分画像を取得する工程であって、前記第1の複数の差分画像が、
    i.複数のボケ畳み込み関数を提供する工程であって、前記ボケ畳み込み関数の各々は、前記原画像の畳み込み時に前記原画像の増大するボケの程度を提供する工程と、
    ii.2つの前記ボケ畳み込み関数間の差を算出することにより複数の差分畳み込み関数Difを確立する工程であって、前記2つのボケ畳み込み関数の各々は、前記原画像の畳み込み時に前記原画像のボケの異なる程度を提供する工程と、
    iii.差分画像を取得するために、前記差分畳み込み関数Difの各々を前記原画像と畳み込むことによって、前記原画像から複数の差分画像を算出する工程と、
    によって取得される工程と、
    b.前記複数のボケ畳み込み関数をダウンサンプリング関数およびアンチエイリアシング関数で畳み込むことによって、第1のダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(1)を取得する工程と、
    c.nが1よりも大きい場合、以前のダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(t−1)を、前記複数のボケ畳み込み関数、ダウンサンプリング関数、およびアンチエイリアシング関数と畳み込むことで、付加的なダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(t)を取得する工程であって、t=2でこの工程cを始め、単一増分でtを増加させながらtがnに達するまでこの工程を繰り返す工程と、
    d.ダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(x)の各々について画像(x)を取得すべく、前記ダウンサンプリング・アンチエイリアシング畳み込み関数DAconの全てを前記原画像と畳み込む工程と、
    e.後続するn個の複数の差分画像を取得して、各々の画像(x)から各複数(x)を取得する工程と、を備え、
    前記ボケ畳み込み関数が、ガウシアンである、方法。
  2. 前記原画像におけるスケール不変特徴を識別する方法に使用される、請求項1記載の方法。
  3. 前記複数の差分畳み込み関数は、一旦確定され、前記差分画像の後続計算に繰り返し使用される、請求項1記載の方法。
  4. 前記差分畳み込み関数Difが多項式によって近似される、請求項1記載の方法。
  5. 前記原画像におけるスケール不変特徴を識別する方法であって、識別された画像特徴は、複数の画素によって画成される画像内で種々のスケールにわたって安定しており、多重フィルタリング工程およびリサンプリング工程が並行して実施され得る、方法において、
    a.多重差分画像を取得する工程と、
    b.前記多重差分画像における画素振幅極値を検索する工程と、
    c.各差分画像内の各画素について画素勾配ベクトルを生成する工程と、
    d.ベクトルの向きを、各差分画像に関連するそれぞれの実際の最大および最小振幅画素と関連付ける工程と、
    を備えた、請求項2記載の方法。
  6. 複数の画素によって画成された原画像から複数の差分画像を取得するための並列計算のための画像処理装置であって、前記装置は、前記原画像に関するデータを受信するための手段、前記差分画像を送信または記憶するための手段、およびプロセッサ回路を備え、前記プロセッサ回路は、
    a.前記原画像から第1の複数の差分画像を取得し、前記第1の複数の差分画像が、
    i.複数のボケ畳み込み関数を提供し、前記ボケ畳み込み関数の各々は、前記原画像の畳み込み時に前記原画像の増大するボケの程度を提供し、
    ii.2つの前記ボケ畳み込み関数間の差を算出することにより複数の差分畳み込み関数Difを確立し、前記2つのボケ畳み込み関数の各々は、前記原画像の畳み込み時に前記原画像のボケの異なる程度を提供し、
    iii.差分画像を取得するために、前記差分畳み込み関数Difの各々を前記原画像と畳み込むことによって、前記原画像から複数の差分画像を算出し、
    b.前記複数のボケ畳み込み関数をダウンサンプリング関数およびアンチエイリアシング関数で畳み込むことによって、第1のダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(1)を取得し、
    c.nが1よりも大きい場合、以前のダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(t−1)を、前記複数のボケ畳み込み関数、ダウンサンプリング関数、およびアンチエイリアシング関数と畳み込むことで、付加的なダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(t)を取得し、t=2でこの工程cを始め、単一増分でtを増加させながらtがnに達するまでこの工程を繰り返し、
    d.ダウンサンプリング・アンチエイリアシング畳み込み関数DAcon(x)の各々について画像(x)を取得すべく、前記ダウンサンプリング・アンチエイリアシング畳み込み関数DAconの全てを前記原画像と畳み込み、
    e.後続するn個の複数の差分画像を取得して、各々の画像(x)から各複数(x)を取得し、前記ボケ畳み込み関数が、ガウシアンである、画像処理装置。
  7. 前記プロセッサ回路は、チップを含む、請求項6記載の画像処理装置。
  8. 画像処理装置は複数のチップを備え、各チップは少なくとも一つの差分画像を計算するように構成される、請求項6記載の画像処理装置。
  9. 前記画像処理装置は双線形補間器を備え、前記双線形補間器は、乗加算器(MAC)、遅延線加算器、および制御論理ブロックを含んでなる、請求項6記載の画像処理装置。
JP2013543531A 2010-12-17 2011-12-15 画像の並列処理方法および装置 Active JP5976665B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DKPA201070557 2010-12-17
DKPA201070557A DK177154B1 (da) 2010-12-17 2010-12-17 Method and device for parallel processing of images
US201161429263P 2011-01-03 2011-01-03
US61/429,263 2011-01-03
PCT/DK2011/050486 WO2012079587A2 (en) 2010-12-17 2011-12-15 Method and device for parallel processing of images

Publications (2)

Publication Number Publication Date
JP2014501980A JP2014501980A (ja) 2014-01-23
JP5976665B2 true JP5976665B2 (ja) 2016-08-24

Family

ID=45768004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013543531A Active JP5976665B2 (ja) 2010-12-17 2011-12-15 画像の並列処理方法および装置

Country Status (7)

Country Link
US (1) US9020297B2 (ja)
EP (1) EP2652703A2 (ja)
JP (1) JP5976665B2 (ja)
CN (1) CN103548053B (ja)
CA (1) CA2821025C (ja)
DK (1) DK177154B1 (ja)
WO (1) WO2012079587A2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463790B (zh) * 2013-09-17 2018-08-10 联想(北京)有限公司 一种图像处理的方法、装置和系统
KR102325602B1 (ko) 2015-07-06 2021-11-12 삼성전자주식회사 데이터를 병렬적으로 처리하는 장치 및 방법
CN105096276B (zh) * 2015-08-28 2017-12-05 东方网力科技股份有限公司 一种图像高斯滤波方法及装置
US10008030B2 (en) 2015-09-07 2018-06-26 Samsung Electronics Co., Ltd. Method and apparatus for generating images
US10043113B1 (en) * 2017-10-04 2018-08-07 StradVision, Inc. Method and device for generating feature maps by using feature upsampling networks
CN111435979A (zh) * 2019-01-15 2020-07-21 西安诺瓦电子科技有限公司 视频图像处理方法和装置
CN113128558B (zh) * 2021-03-11 2022-07-19 重庆邮电大学 基于浅层空间特征融合与自适应通道筛选的目标检测方法
CN113205145B (zh) * 2021-05-18 2022-08-16 广州大学 基于归一化互相关的模板匹配方法、系统、装置及介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5359674A (en) * 1991-12-11 1994-10-25 David Sarnoff Research Center, Inc. Pyramid processor integrated circuit
US6049859A (en) * 1996-01-15 2000-04-11 Siemens Aktiengesellschaft Image-processing processor
US6567564B1 (en) * 1996-04-17 2003-05-20 Sarnoff Corporation Pipelined pyramid processor for image processing systems
US5963675A (en) * 1996-04-17 1999-10-05 Sarnoff Corporation Pipelined pyramid processor for image processing systems
US6711293B1 (en) * 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
WO2004055724A2 (en) * 2002-12-18 2004-07-01 Philips Intellectual Property & Standards Gmbh Multi-resolution processing of image strips
WO2006083277A2 (en) * 2004-05-25 2006-08-10 Sarnoff Corporation Low latency pyramid processor for image processing systems
US7477794B2 (en) * 2005-06-30 2009-01-13 Microsoft Corporation Multi-level image stack of filtered images
US8233716B2 (en) * 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated System and method for finding stable keypoints in a picture image using localized scale space properties
US8150169B2 (en) 2008-09-16 2012-04-03 Viewdle Inc. System and method for object clustering and identification in video
US8441489B2 (en) * 2008-12-31 2013-05-14 Intel Corporation System and method for SIFT implementation and optimization
CN102169581A (zh) * 2011-04-18 2011-08-31 北京航空航天大学 一种基于特征向量的快速高精度鲁棒性匹配方法

Also Published As

Publication number Publication date
CN103548053B (zh) 2016-10-26
US9020297B2 (en) 2015-04-28
EP2652703A2 (en) 2013-10-23
DK177154B1 (da) 2012-03-05
CA2821025C (en) 2018-07-31
CA2821025A1 (en) 2012-06-21
WO2012079587A3 (en) 2012-08-09
WO2012079587A2 (en) 2012-06-21
CN103548053A (zh) 2014-01-29
JP2014501980A (ja) 2014-01-23
US20130251265A1 (en) 2013-09-26

Similar Documents

Publication Publication Date Title
JP5976665B2 (ja) 画像の並列処理方法および装置
Nguyen et al. Efficient generalized cross-validation with applications to parametric image restoration and resolution enhancement
Kundur et al. Blind image deconvolution
Chakrabarti A neural approach to blind motion deblurring
JP2008226233A (ja) カーネルフィルタを用いて入力データをフィルタリングするコンピュータ実装方法及び装置
US20130163882A1 (en) Method of estimating blur kernel from edge profiles in a blurry image
Hosseini et al. Derivative kernels: Numerics and applications
JP2014524084A (ja) 画像処理目的のためのフィルタによるコンボルーションの高速数値近似の適用
WO2012060093A1 (ja) ステレオ画像処理装置及びステレオ画像処理方法
JP2005025696A (ja) 画像処理装置、画像処理方法及びプログラム及び記録媒体
Deshpande et al. A novel modified cepstral based technique for blind estimation of motion blur
CN110874827A (zh) 湍流图像复原方法、装置、终端设备及计算机可读介质
Xiao et al. Detail enhancement of image super-resolution based on detail synthesis
Bratsolis et al. Comparison of optimized mathematical methods in the improvement of raster data and map display resolution of Sentinel-2 images
Belyaev Implicit image differentiation and filtering with applications to image sharpening
Gowri et al. 2D Image data approximation using Savitzky Golay filter—Smoothing and differencing
Pan et al. Fractional directional derivative and identification of blur parameters of motion-blurred image
Razak et al. Implementing Gabor filter for fingerprint recognition using Verilog HDL
Abraham Sundar et al. Multi-frame super-resolution using adaptive normalized convolution
Abang et al. Application of blind deconvolution and Lucy-Richardson Deconvolution for image deblurring
WO2019163244A1 (ja) 画像処理方法、画像処理装置、及び画像処理プログラム
Belhaj et al. Blind image deconvolution via Hankel based method for computing the GCD of polynomials
KR101775273B1 (ko) 이미지들 사이의 상관관계 획득 방법 및 시스템
Burt Pyramid-based extraction of local image features with applications to motion and texture analysis
JP7114321B2 (ja) データ処理装置及びその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150930

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20151227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160214

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160630

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160720

R150 Certificate of patent or registration of utility model

Ref document number: 5976665

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250