JP2007257518A - Image matching device, image matching method and image matching program - Google Patents
Image matching device, image matching method and image matching program Download PDFInfo
- Publication number
- JP2007257518A JP2007257518A JP2006083761A JP2006083761A JP2007257518A JP 2007257518 A JP2007257518 A JP 2007257518A JP 2006083761 A JP2006083761 A JP 2006083761A JP 2006083761 A JP2006083761 A JP 2006083761A JP 2007257518 A JP2007257518 A JP 2007257518A
- Authority
- JP
- Japan
- Prior art keywords
- motion
- image
- motion parameter
- point
- equation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
本発明は、対象画像と参照画像の2つの画像からそれぞれの対応点を検出して対応付ける画像マッチング装置、画像マッチング方法および画像マッチングプログラムに関する。 The present invention relates to an image matching apparatus, an image matching method, and an image matching program that detect and associate corresponding points from two images of a target image and a reference image.
一つの対象画像から他方の参照画像の各画素それぞれの対応点を検出して対応関係を求める画像マッチング技術は、例えば、動画像における動き検出、ステレオマッチング、画像モーフィング、画像認識、動画像符号化等の画像処理技術の分野において利用されている。 Image matching technology that detects the corresponding point of each pixel of the other reference image from one target image and obtains the corresponding relationship includes, for example, motion detection in moving images, stereo matching, image morphing, image recognition, and moving image coding Are used in the field of image processing technology.
このような画像マッチング技術としては、オプティカルフロー手法、ブロックベース手法、勾配法、ベイジアンメソッドという主として4種類に分類することができる(例えば、非特許文献1参照)。 Such image matching techniques can be classified into four main types: an optical flow method, a block-based method, a gradient method, and a Bayesian method (see, for example, Non-Patent Document 1).
オプティカルフロー手法は、「輝度の変化は一定である」というオプティカルフロー式を導出しそのオプティカルフロー式を拘束条件としてフローを求めるものである。ブロックベース手法は、画像を所定のブロックに分割し、ブロック毎のテンプレートマッチングによって動きを求める手法である。勾配法は、画像の輝度勾配が減少する方向にマッチングをおこなう手法である。ベイジアンメソッドは、確率的に尤もらしいマッチングを求める手法である。 The optical flow method derives an optical flow equation that “a change in luminance is constant” and obtains a flow using the optical flow equation as a constraint. The block-based method is a method in which an image is divided into predetermined blocks and a motion is obtained by template matching for each block. The gradient method is a method for performing matching in a direction in which the luminance gradient of an image decreases. The Bayesian method is a technique for obtaining matching that is probabilistically plausible.
また、従来の画像マッチング技術として、複数の多重解像度フィルタを用い、複数の多重解像度画像ピラミッドを生成し、生成された画像ピラミッドを上位の階層から下位の階層に順にマッチング処理を行うことによって、大きな動きから小さな動きまで画像の対応付けを行えるロバスト性の高い画像マッチング技術がある(例えば、特許文献1参照)。 In addition, as a conventional image matching technique, a plurality of multi-resolution image pyramids are generated using a plurality of multi-resolution filters, and the generated image pyramids are sequentially matched from the upper layer to the lower layer, thereby performing a large process. There is an image matching technique with high robustness capable of associating images from movement to small movement (see, for example, Patent Document 1).
しかしながら、このような従来の画像マッチング技術には次のような問題がある。オプティカルフロー手法では、ノイズに敏感で速い動きに対応することが本質的に困難であるという問題があり、ブロックベースの手法では、画像の中のブロック毎に画像マッチングを行っているので、画像中のオブジェクトの平行移動などの動きには高い信頼性を有するが、画像中のオブジェクトが変形したり、回転する等の動きに対して本質的に対応することが難しいという問題がある。勾配法では、画像の輝度勾配が減少する方向にマッチングを行うため、安定してオブジェクトの動きを探索することが困難であるという問題がある。ベイジアンメソッドでは、大域的最適点の求め方が困難であるという問題がある。 However, such a conventional image matching technique has the following problems. The optical flow method has a problem that it is sensitive to noise and it is inherently difficult to cope with fast movement. In the block-based method, image matching is performed for each block in the image. However, there is a problem that it is difficult to essentially cope with the movement of the object in the image such as deformation or rotation. In the gradient method, since matching is performed in a direction in which the luminance gradient of the image decreases, there is a problem that it is difficult to stably search for the movement of the object. The Bayesian method has a problem that it is difficult to obtain a global optimum.
一方、特許文献1に開示された技術では、原理的に複数の多重解像度フィルタを用い、多重解像度画像ピラミッドの最上位階層から最下位階層までのマッチング処理を行っているが、基本的には局所的な最適化処理であり大域的に最適になるとは限らない。
On the other hand, in the technique disclosed in
本発明は、上記に鑑みてなされたものであって、より高精度な画像マッチングを行うことができる画像マッチング装置、画像マッチング方法および画像マッチングプログラムを提供することを目的とする。 The present invention has been made in view of the above, and an object thereof is to provide an image matching apparatus, an image matching method, and an image matching program capable of performing image matching with higher accuracy.
上述した課題を解決し、目的を達成するために、本発明は、対象画像と参照画像との間の対応関係を求める画像マッチング装置であって、前記対象画像上の複数の第1の格子点の各々と前記参照画像上で当該第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーを計算するとともに、前記各第2の格子点の位置と当該第2の格子点に対応する前記各第1の格子点の位置とに基づいて前記ポテンシャルエネルギーの勾配により前記第2の格子点が受ける画像エネルギー力を計算する画像エネルギー力計算部と、前記各第2の格子点と当該第2の格子点に隣接する他の第2の格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する弾性エネルギー力計算部と、前記各第2の格子点に作用する摩擦力を計算する摩擦力計算部と、前記画像エネルギー力と前記第1の弾性エネルギー力と前記摩擦力とによる前記各第2の格子点に関する第1の運動方程式を数値解析により解法処理を行う第1の解法処理部と、前記第1の解法処理部による解法処理の結果から、前記参照画像を複数の領域に分割して、分割した領域ごとに領域を識別するラベルを割り当てる動きクラスタリング処理部と、前記ラベルが割り当てられた領域における前記第2の格子点と前記第1の格子点の写像関係を示す動きモデルを規定するパラメータである第1の動きパラメータを数値解析により推定する動きパラメータ推定部と、推定された前記第1の動きパラメータによって定まる前記対象画像上の点および前記参照画像上の点の間の前記ポテンシャルエネルギーが最小になるように前記第1の動きパラメータを修正する動きパラメータ修正部と、修正された前記第1の動きパラメータから、前記ラベルに対応する領域内の各第2の格子点に対して最適な前記第1の動きパラメータである第2の動きパラメータを決定し、決定された前記第2の動きパラメータを、前記ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当て部と、割り当てられた前記第2の動きパラメータと前記第1の解法処理部による解法処理の結果とに基づいて、前記第1の運動方程式を補正する補正項を算出する補正項計算部と、前記第1の運動方程式に前記補正項を加えた前記各第2の格子点に関する第2の運動方程式を数値解析により解法処理を行う第2の解法処理部と、前記第2の解法処理部による解法処理の結果から前記対象画像と前記参照画像との対応関係を求めるマッピング処理部と、を備えたことを特徴とする。 In order to solve the above-described problems and achieve the object, the present invention is an image matching device for obtaining a correspondence relationship between a target image and a reference image, and a plurality of first lattice points on the target image. And a potential energy based on the correlation of the image between each of the second grid points corresponding to the first grid point on the reference image on a one-to-one basis, The image energy for calculating the image energy force received by the second lattice point by the gradient of the potential energy based on the position of the lattice point and the position of the first lattice point corresponding to the second lattice point Elastic energy force calculation for calculating a first elastic energy force received from an elastic energy between the force calculation unit and each second lattice point and another second lattice point adjacent to the second lattice point And A frictional force calculation unit for calculating a frictional force acting on each second lattice point, and a first relating to each second lattice point by the image energy force, the first elastic energy force, and the frictional force. A first solution processing unit that solves the equation of motion by numerical analysis, and a result of the solution processing by the first solution processing unit, the reference image is divided into a plurality of regions, and each region is divided into regions. A clustering processing unit for assigning a label for identifying the first motion, and a first motion which is a parameter for defining a motion model indicating a mapping relation between the second lattice point and the first lattice point in the region to which the label is assigned Between a point on the target image and a point on the reference image determined by the estimated first motion parameter and a motion parameter estimation unit that estimates a parameter by numerical analysis A motion parameter correcting unit that corrects the first motion parameter so that the potential energy is minimized, and the second lattice point in the region corresponding to the label from the corrected first motion parameter. A second motion parameter that is the first motion parameter that is optimal for the second motion parameter is determined, and the determined second motion parameter is assigned to each second grid point in the region corresponding to the label. Correction term calculation for calculating a correction term for correcting the first equation of motion based on a motion parameter assignment unit, the assigned second motion parameter, and a result of the solution processing by the first solution processing unit And second solution processing for solving the second motion equation relating to each of the second lattice points obtained by adding the correction term to the first motion equation by numerical analysis And a mapping processing unit for obtaining a correspondence relationship between the target image and the reference image from a result of the solution processing by the second solution processing unit.
また、本発明は、上記画像マッチング装置で実行することができる画像マッチング方法および画像マッチングプログラムである。 The present invention also provides an image matching method and an image matching program that can be executed by the image matching apparatus.
本発明によれば、参照画像を複数の領域に分割して領域ごとに、第2の格子点の動きを規定した動きモデルを分類するための第1の動きパラメータの最適な動きパラメータである第2の動きパラメータを求めて、動きモデルを示す運動方程式の数値解析による解法処理を行って、対象画像と前記参照画像との対応関係を求めているので、領域境界の不連続性と領域内の一様性をロバストに表現できるようになり、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができるという効果を奏する。 According to the present invention, the reference image is divided into a plurality of regions, and the first motion parameter is the optimal motion parameter for classifying the motion model that defines the motion of the second grid point for each region. 2 motion parameters are obtained and solution processing is performed by numerical analysis of the equation of motion indicating the motion model to obtain the correspondence between the target image and the reference image. Uniformity can be expressed robustly, more accurate image matching can be performed, and as a result, an interpolated frame with higher image quality can be generated.
以下に添付図面を参照して、この発明にかかる画像マッチング装置、画像マッチング方法および画像マッチングプログラムの最良な実施の形態を詳細に説明する。 Exemplary embodiments of an image matching apparatus, an image matching method, and an image matching program according to the present invention are explained in detail below with reference to the accompanying drawings.
なお、以下の実施の形態にかかる画像マッチング装置は、動画像の動き補償を行って補償画像を生成する動き補償装置に適用する他、ステレオマッチング、画像モーフィング、
画像認識、動画像符号化等の画像処理技術に適用することもできる。
The image matching apparatus according to the following embodiment is applied to a motion compensation apparatus that generates a compensated image by performing motion compensation of a moving image, stereo matching, image morphing,
The present invention can also be applied to image processing techniques such as image recognition and moving image encoding.
(実施の形態1)
図1は、実施の形態1にかかる画像マッチング装置の構成を示すブロック図である。本実施の形態にかかる画像マッチング装置100は、図1に示すように、第1解法処理部101と、画像エネルギー力計算部103と、弾性エネルギー力計算部104と、摩擦力計算部105と、第2解法処理部108と、動きクラスタリング処理部109と、動きパラメータ推定部110と、動きパラメータ修正部113と、動きパラメー割り当て部111と、補正項計算部112と、マッピング処理部107と、フレームメモリ106とを主に備えている。
(Embodiment 1)
FIG. 1 is a block diagram illustrating a configuration of the image matching apparatus according to the first embodiment. As shown in FIG. 1, the
実施の形態1にかかる画像マッチング装置100では、対象画像および参照画像のそれぞれを所定の格子状に分割した各格子点を力学上の質点として扱い、対象画像の第1の格子点と第1の格子点に1対1に対応する参照画像の第2の格子点が画像の相関関係に基づいたポテンシャルエネルギーを考え、第1の格子点と第2の格子点の位置に基づいたポテンシャルエネルギーの勾配によって第2の格子点が受ける画像エネルギー力と、第2の格子点に隣接する格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力と、第2の格子点に生じる摩擦力とによる第2の格子点に関する第1の運動方程式を画像マッチング状態遷移モデルとして、この運動方程式に対して解法処理を行い、第2の格子点の平衡状態を求め、局所的な動きを求める。
In the
更に本実施の形態にかかる画像マッチング装置100では、複数個のパラメータ(動きパラメータ)によって写像関係を規定するパラメトリック動きモデルを導入している。すなわち、参照画像の画面内のすべての格子点の動き(第1の格子点との写像関係)が有限個のパラメトリック動きモデルによって決定されると仮定し、参照画像の画面を複数個の領域にクラスタリング(分割)し、動きモデルを規定するパラメータである動きパラメータを推定して、領域内の第2の格子点に最適の動きパラメータを割り当てる。そして、第1の運動方程式の解法処理結果である局所的な動きと、上記動きモデルによる動きとのずれを補正する力を補正項として第1の運動方程式に導入した第2の運動方程式を解法処理することによって、局所的に動きを更新する。このような、動きモデルの動きパラメータの推定処理、動きパラメータの割り当て処理、局所的な動きの更新(第2の運動方程式の解法処理)を繰り返すことによって、画像の正確な動きを推定して、第1の格子点と第2の格子点との写像関係を求めて画像マッチングを行っている。
Furthermore, the
第1解法処理部101は、対象画像上の複数の第1の格子点の各々と参照画像上で第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーの勾配により第2の格子点が受ける画像エネルギー力と、第2の格子点に隣接する格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力と、第2の格子点に生じる摩擦力とによる第2の格子点に関する運動方程式を、離散変数法としてのオイラー法による数値解析処理によって解法する処理部である。
The first
画像エネルギー力計算部103は、第1の格子点と第2の格子点の位置に基づいた上記ポテンシャルエネルギーの勾配によって第2の格子点が受ける画像エネルギー力を計算する処理部である。
The image energy
弾性エネルギー力計算部104は、第2の格子点に隣接する格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する処理部である。摩擦力計算部105は、第2の格子点に生じる摩擦力を計算する処理部である。また、弾性エネルギー力計算部104は、後述するラベルが同一の領域における第2の格子点と最適な動きパラメータによって定められる第2の格子点の動き後の第3の格子点に関しては第2の弾性エネルギー力を計算し、ラベルが異なる領域における第2の格子点と第3の格子点に関しては、ラベルが同一の領域における第2の弾性エネルギー力よりも小さくなるように第2の弾性エネルギー力を計算する。本実施の形態では、ラベルが異なる領域における第2の格子点と第3の格子点に関して、摩擦係数を0として第2の弾性エネルギー力を0とする処理を行っている。
The elastic energy
動きクラスタリング処理部109は、第1解法処理部101による解法処理によって求めた局所的な動きから、クラスタリング手法により参照画像を複数の領域にクラスタリング(分割)して、分割した領域ごとに領域を識別するラベルを割り当てる処理部である。
The motion
動きパラメータ推定部110は、ラベルが割り当てられた領域における第2の格子点と第1の格子点の写像関係を示す動きモデルを規定するパラメータである動きパラメータを数値解析により推定する。本実施の形態では、最小二乗法による数値解析を行って、動きパラメータ(第1の動きパラメータ)を推定している。
The motion
動きパラメータ修正部113は、最急降下法により、推定した動きパラメータによって定まる対象画像上の点および参照画像上の点の間の画像の相関関係に基づくポテンシャルエネルギーが最小になるように動きパラメータを修正するものである。
The motion
動きパラメータ割り当て部111は、推定された動きパラメータから、ラベルに対応する領域内の各第2の格子点に対して最適なラベルを決定して最適な動きパラメータ(第2の動きパラメータ)を求め、この最適な動きパラメータを、ラベルに対応する領域内の各第2の格子点に対して割り当てる処理部である。
The motion
補正項計算部112は、割り当てられた最適な動きパラメータによる動きベクトルと第1の解法処理部による解法処理の結果である動きベクトルとの差分から第1の運動方程式を補正する補正項を算出する処理部である。
The correction
第1解法処理部108は、画像エネルギー力と、第2の格子点と最適な動きパラメータによって定められる第2の格子点の動き後の第3の格子点との間の弾性エネルギーから受ける第2の弾性エネルギー力と、摩擦力と、補正項計算部112で求めた補正項とによって第2の格子点の動きを規定した第2の運動方程式を数値解析によって解法する処理部である。
The first
マッピング処理部107は、第2の解法処理部108による解法処理の結果から第2の格子点の平衡状態を求めることにより対象画像上の第1の格子点と参照画像上の第2の格子点との対応関係である写像関係を求める処理部である。
The
フレームメモリ106は、入力された対象画像と参照画像と保存するメモリである。なお、各部の詳細な処理については後述する。
The
次に、本実施の形態にかかる画像マッチング装置100で導入する画像マッチング状態遷移モデルについて説明する。
Next, an image matching state transition model introduced by the
2次元ユークリッド空間上の点x∈E2における対象画像、参照画像の画素値をそれぞれ(1)式で示す。 The pixel values of the target image and the reference image at the point x∈E 2 on the two-dimensional Euclidean space are shown by the formula (1).
このような写像に関する条件を導出すると以下のようになる。パラメータ(u,v)を用いて、曲面X上の点をx(u,v)∈X、曲面Y上の点をy(u,v)∈Yと表し、パラメータ(u,v)と点xが同じスケールを有する場合、曲面X上の点x(u,v)は、パラメータ(u,v)によって、(4)式で表すことができる。 Deriving such a mapping condition is as follows. Using the parameter (u, v), the point on the curved surface X is represented as x (u, v) εX, the point on the curved surface Y is represented as y (u, v) εY, and the parameter (u, v) and the point are represented. When x has the same scale, the point x (u, v) on the curved surface X can be expressed by the equation (4) by the parameter (u, v).
次に、上記画像マッチング問題の解法処理について説明する。(8)式は、(9)式のように変形することができる。 Next, a solution process for the image matching problem will be described. Expression (8) can be modified like Expression (9).
写像gは全単射であるので、写像gについて考えることは、曲面Yそのものを考えることと同義である。力学的構造としては、例えば、剛体のような構造が考えられるが、画像の場合には変形等が考えられるため、剛体の構造は適切でない。そこで、本実施の形態では、曲面Yに対して、画像の変形等に対して柔軟に対応可能な弾性体の構造を導入する。 Since the mapping g is bijective, thinking about the mapping g is synonymous with considering the curved surface Y itself. As the mechanical structure, for example, a structure like a rigid body is conceivable, but in the case of an image, deformation or the like is conceivable, so that the structure of the rigid body is not appropriate. Therefore, in the present embodiment, an elastic body structure that can flexibly cope with image deformation or the like is introduced into the curved surface Y.
弾性体のエネルギーは、(11)式で示される。 The energy of the elastic body is expressed by equation (11).
また(14)式より最適性の必要条件は、(15)式で求めることができる。 Further, the necessary condition for optimality can be obtained from the equation (15) from the equation (14).
このため、大域的な最適点を求めて(14)式を解法するため、本実施の形態では、対象画像および参照画像上の曲面を格子状に分割して分割した各格子点を質点と考え、参照画像上の曲面Yの格子点(質点)における運動エネルギーを導入し、大域的な最適化を行っている。すなわち、曲面Yに対して時間軸を導入し、曲面Yが時間に応じて変形できるような構造とし、曲面に対して運動の構造を適用する。図5は、ポテンシャルエネルギーの最小化の点を探索する場合の大域的な最適点の説明をするための模式図である。図5に示すように、運動エネルギーの導入により、最初のポテンシャルエネルギーが運動エネルギーに変換されるため、格子点(質点)が局所最適点からさらに広い範囲で(15)式を満たす大域的な最適点を探索することができる。これにより、静的な最適化よりもより広い範囲を探索できるので、初期値への依存性が低くなり、ノイズ等の影響に対してよりロバストになる可能性がある。 Therefore, in order to find a global optimum point and solve the equation (14), in this embodiment, each lattice point obtained by dividing the target image and the curved surface on the reference image into a lattice shape is considered as a mass point. The kinetic energy at the lattice point (mass point) of the curved surface Y on the reference image is introduced to perform global optimization. In other words, a time axis is introduced to the curved surface Y so that the curved surface Y can be deformed according to time, and a structure of motion is applied to the curved surface. FIG. 5 is a schematic diagram for explaining a global optimum point when searching for a potential energy minimizing point. As shown in FIG. 5, since the initial potential energy is converted into kinetic energy by the introduction of kinetic energy, the global optimality satisfying Eq. (15) in a wider range from the local optimal point to the lattice point (mass point). You can search for points. As a result, a wider range can be searched than in the static optimization, so that the dependency on the initial value is lowered, and there is a possibility that it is more robust against the influence of noise and the like.
次に、(15)式の大域的最適化のための運動方程式の導入について説明する。まず、運動方程式に導入する時間τを用いて曲面Y上の点yを(16)式のように拡張する。(16)式で表した曲面Y上の点yの全微分は(17)式となるが、パラメータ(u,v)Tは時間τに対して独立であると仮定すると、(18)式が成立するので、結局(17)式は(19)式で表現される。また、(19)式から曲面Y上の点yの2階微分は(20)式で表される。(19)式で示される曲面Y上の点yの全微分と(20)式で示される2階微分をそれぞれ(21)式で表現する。 Next, introduction of an equation of motion for global optimization of equation (15) will be described. First, the point y on the curved surface Y is expanded as shown in Equation (16) using the time τ introduced into the equation of motion. The total differentiation of the point y on the curved surface Y expressed by the equation (16) is the equation (17), but assuming that the parameter (u, v) T is independent of the time τ, the equation (18) is Since this holds, equation (17) is eventually expressed by equation (19). Further, the second derivative of the point y on the curved surface Y from the equation (19) is expressed by the equation (20). The total differentiation of the point y on the curved surface Y shown by the equation (19) and the second order differentiation shown by the equation (20) are expressed by the equation (21), respectively.
次に、ラグランジュの方法に従って次のように曲面Y上の点yの運動方程式を導出する。曲面Yは、エネルギー最小化の(14)式に従うので、ポテンシャルエネルギーUを最小にする方向に動く必要がある。ラグランジアンは(23)式で定義される。 Next, the equation of motion of the point y on the curved surface Y is derived as follows according to the Lagrange method. Since the curved surface Y follows the equation (14) for energy minimization, the curved surface Y needs to move in a direction that minimizes the potential energy U. Lagrangian is defined by equation (23).
(23)式は、位置のポテンシャルエネルギーである重力場における物体の自由落下などと同様に、物体は重力場を最小化するように落下することを意味している。ラグランジュ方程式は(24)式で示されるので、(23)および(24)式から、曲面Y上の点yの運動方程式は、(25)式で表される。 Equation (23) means that the object falls so as to minimize the gravitational field, similar to the free fall of the object in the gravitational field that is the potential energy of the position. Since the Lagrangian equation is expressed by the equation (24), the equation of motion of the point y on the curved surface Y is expressed by the equation (25) from the equations (23) and (24).
まず、探索が完了した場合を考える。この場合、点yは完全に停止するので、点yの速度(yの全微分)および加速度(yの2階微分)はともに0となるので、(28)式の運動方程式により(29)式となり、これにより(30)式が成立する。 First, consider the case where the search is completed. In this case, since the point y stops completely, both the velocity (total derivative of y) and acceleration (second derivative of y) of the point y are both 0, so that the equation (29) is obtained from the equation of motion (28). Thus, equation (30) is established.
次に、曲面Y上の点yが静止した場合を考える。この場合、点yの速度(yの全微分)は0となるが加速度(yの2階微分)は0にならないので、(28)式の運動方程式により(31)式が得られる。 Next, consider a case where the point y on the curved surface Y is stationary. In this case, the velocity at the point y (the total derivative of y) is 0, but the acceleration (the second derivative of y) is not 0, so that equation (31) is obtained from the equation of motion of equation (28).
次に、点yに摩擦エネルギーが作用している場合を考える。摩擦エネルギーの性質から(32)式が導かれ、これは点yの運動が停止して時間の経過により最適点の探索が完了することを意味している。 Next, consider the case where frictional energy is acting on the point y. Equation (32) is derived from the nature of the frictional energy, which means that the movement of the point y stops and the search for the optimum point is completed over time.
一方、(15)式は1階微分の形式であるが、2階微分の最適性必要条件については、図4または5に示すポテンシャルエネルギーの山の頂点で探索が完了する場合があるため、満足されない場合がある。この場合には、ポテンシャルエネルギーの山の頂点では、最適点の探索が完了しないための条件として(33)式を仮定することにより、2階の最適性必要条件を満足することができる。この(33)式の仮定は、具体的には(34)式の条件を探索アルゴリズムで実現することにより達成することができる。 On the other hand, equation (15) is in the form of first derivative, but the optimality requirement for second derivative is satisfied because the search may be completed at the peak of the potential energy peak shown in FIG. May not be. In this case, the optimality requirement for the second floor can be satisfied by assuming the equation (33) as a condition for the search for the optimum point not to be completed at the apex of the peak of potential energy. Specifically, the assumption of equation (33) can be achieved by realizing the condition of equation (34) with a search algorithm.
以上により、(28)式の運動方程式に従った最適点の探索は(14)式で示される最適化問題に対する最適解を与えることがわかる。このような探索は、静的な探索に比べてロバストなものとなる。 From the above, it can be seen that the search for the optimum point according to the equation of motion of Equation (28) gives the optimum solution for the optimization problem shown by Equation (14). Such a search is more robust than a static search.
ここで、(28)式に示す運動方程式において、弾性エネルギーEkの中に点yおよびパラメータ(u,v)に関する偏微分が含まれているため、有限差分法によって偏微分方程式を差分方程式によって置換する。弾性エネルギーEkの右辺を有限差分法によって離散化すると、(35)式のようになる。 Here, in the equation of motion shown in the equation (28), since the partial differential with respect to the point y and the parameters (u, v) is included in the elastic energy E k , the partial differential equation is converted into the differential equation by the finite difference method. Replace. When the right side of the elastic energy E k is discretized by the finite difference method, the equation (35) is obtained.
この(35)式をynで偏微分すると(36)式が得られ、かかる式は、弾性エネルギーによって発生する力である弾性エネルギー力を示している。 The equation (35) when partially differentiated by y n (36) below is obtained and such expression shows elastic energy force is the force generated by the elastic energy.
yn(τ)にもっとも近いサンプリング点を局所空間中心ycとして、ycを(41)式で求める。 The sampling point closest to y n (τ) is set as the local space center y c , and y c is obtained by equation (41).
次に、この第1解法処理部101による運動方程式の解法について説明する。(48)、(49)式で示される運動方程式、すなわち常微分方程式は、一般的に解析的に解法することができないため、この運動方程式の系が収束するのに十分大きな時間Tを考え、数値解析によってt=(0,T)区間を計算することによって運動方程式の収束状態を推定する。
Next, the solution of the equation of motion by the first
本実施の形態では、常微分方程式は初期値が定まれば離散変数法によって一意に解が求まることを利用して、オイラー法による数値解析処理を行っている。 In the present embodiment, numerical analysis processing by the Euler method is performed using the fact that the ordinary differential equation is uniquely determined by the discrete variable method when the initial value is determined.
尚、本実施の形態ではオイラー法による数値解析処理を行っているが、これに限定されるものではない。離散変数法には、オイラー法以外にも、ルンゲクッタ法、ブリルシュ・ストア法、予測子・修正子法、隠的ルンゲクッタ法など種々の手法があり、このため、数値解析処理として、これらのいずれの手法を用いてもよい。以下はオイラー法を用いた数値解析処理を例にあげて説明する。 In the present embodiment, numerical analysis processing by the Euler method is performed, but the present invention is not limited to this. In addition to the Euler method, the discrete variable method includes various methods such as the Runge-Kutta method, the Brillesh-Store method, the predictor / corrector method, and the hidden Runge-Kutta method. A technique may be used. In the following, a numerical analysis process using the Euler method will be described as an example.
オイラー法は、一階の常微分方程式に対する数値解法であるため、(50)式の変数変換を(48)、(49)式を運動方程式に施すことにより、(48)、(49)式を一階の常微分方程式に変換する。これにより、(51)、(52)式が得られる。 Since the Euler method is a numerical solution to the first-order ordinary differential equation, the equations (48) and (49) are converted by applying the variable transformation of the equation (50) to the equations (48) and (49). Convert to first-order ordinary differential equations. Thereby, formulas (51) and (52) are obtained.
(55)、(56)式の更新式は、各格子点の動きの状態が局所的な関係によって決定されるものであり、局所的な状態が平衡状態になりながら動きを推定していくため、より大域的な構造を導入し精度の向上を図る。 In the update formulas (55) and (56), the motion state of each lattice point is determined by a local relationship, and the motion is estimated while the local state is in an equilibrium state. Introduce more global structure to improve accuracy.
本実施の形態にかかる画像マッチング装置100では、複数個のパラメータ(動きパラメータ)によって写像関係を規定するパラメトリック動きモデルを導入している。以下、パラメトリック動きモデルを利用した動き推定について概要を説明する。
The
参照画像の画面内のすべての格子点の動き(第1の格子点との写像関係)が有限個のパラメトリック動きモデルによって決定されると仮定している。動きパラメータが既知であると仮定すると、画面内の各格子点の動きを求める問題は、各格子点がどのパラメトリック動きモデルに属するかを決定すること、すなわち、最適な動きパラメータを選択する問題となる。このことは、複数個の動きパラメータの最適化を行うことであり、画面全体で取り得る動きに関して最適化問題を解法することに比べてきわめて容易な手法となる。 It is assumed that the movement of all grid points in the screen of the reference image (mapping relationship with the first grid point) is determined by a finite number of parametric motion models. Assuming that the motion parameters are known, the problem of determining the motion of each grid point in the screen is to determine which parametric motion model each grid point belongs to, that is, to select the optimal motion parameter. Become. This is to optimize a plurality of motion parameters, which is an extremely easy method compared to solving an optimization problem with respect to the motion that can be taken on the entire screen.
しかしながら、動きパラメータは既知ではないため、局所的な動的マッチング処理の(55)、(56)式の更新式に従った動き推定の結果を用い、かかる動き推定の結果をクラスタリング手法を利用して、複数個のクラスタ(グループ)に分割する。本実施の形態では、動きクラスタリング処理部109によって、k-means法によって数値解析を行うことにより、(55)、(56)式の更新式に従った動き推定の結果から第2の格子点を複数個の領域にクラスタリングしている。なお、クラスタリングの手法としては、k-means法の手法以外の手法を用いてもよい。
However, since the motion parameter is not known, the result of motion estimation according to the update formulas of the local dynamic matching processes (55) and (56) is used, and the result of the motion estimation is obtained using a clustering method. Then, it is divided into a plurality of clusters (groups). In the present embodiment, by performing numerical analysis by the k-means method by the motion
そして、動きパラメータ推定部110によって、各クラスタ内(領域内)の局所的な動きから最小二乗法を用いて、パラメトリック動きモデルの動きパラメータ(第1の動きパラメータ)を推定している。なお、動きパラメータを推定する手法としては、最小二乗法以外の手法を用いることも可能である。
Then, the motion
動きパラメータの推定を行った後、動きパラメータ修正部113によって、推定された動きパラメータを修正する。その後、動きパラメータ割り当て部111は、各格子点に、各格子点が属する動きモデルの動きパラメータを割り当てる。具体的には、動きパラメータ割り当て部111は、各格子点がどの動きパラメータの動きモデルに属するかを示すラベルを導入し、ラベルを割り当てることにより、最適な動きパラメータ(第2の動きパラメータ)の割り当てを行う。このため、動きパラメータ割り当て部111は、動きモデルに対する評価関数を設定し、その評価関数が最小になる動きパラメータが示すラベルを各格子点に設定する。
After estimating the motion parameter, the motion
各格子点に対して、第1解法処理部101によって(55)、(56)式の更新式により、局所的な動きが求められるが、同時に各格子点には、パラメトリック動きモデルからも動きが求められる。このため、各格子点の局所的な動きと動きモデルによる動きのズレを補正する力を示す補正項を導入し、かかる補正項を補正項計算部112によって求め、第2解法処理部108によって、求めた補正項を第1の運動方程式に加えた第2の運動方程式を数値解析により解法することによって局所的な更新をおこなっている。図8は、動きモデルを利用した動き推定の画像上における状態を示す説明図である。
For each grid point, the first
このように本実施の形態にかかる画像マッチング装置100では、上述した動きパラメータ処理部110による動きモデルの動きパラメータの推定処理、動きパラメータ割り当て部111による動きパラメータの割り当て処理、補正項計算部112および第2解法処理部108による局所的な動きの更新(第2の運動方程式の解法処理)を繰り返すという動き分割を用いた処理によって、画像の正確な動きを推定して、第1の格子点と第2の格子点との写像関係を求めて画像マッチングを行っている。図10は、実施の形態1にかかるパラメトリック動きモデルを導入して動き分割を用いた画像マッチングの概念的な流れを示す説明図である。
As described above, in the
例えば、図9に示すように、画像上のオブジェクトの一部が誤った動きで画像マッチングされている状態を考える。図9に示すような誤った動きがあると、境界の歪み等として視認されてしまう。このような場合には、誤った動きの領域に対して正確な動きの情報を割り当てることによりオブジェクト全体に正しい画像マッチングを行うことができる。本実施の形態における最適な動きパラメータの割り当て、すなわち格子点が属するパラメトリック動きモデルを決定することは、このような誤った動きの領域に対して正確な動きの情報を割り当てることに相当し、これにより、画像上で文字の一部が崩れるといった不具合を防止することができる。 For example, as shown in FIG. 9, let us consider a state in which a part of an object on an image is image-matched with an incorrect motion. If there is an erroneous movement as shown in FIG. 9, it will be visually recognized as a boundary distortion or the like. In such a case, correct image matching can be performed on the entire object by assigning accurate motion information to an erroneous motion region. The optimal motion parameter assignment in the present embodiment, that is, the determination of the parametric motion model to which the lattice points belong corresponds to assigning accurate motion information to such erroneous motion regions. As a result, it is possible to prevent a problem that a part of the characters is broken on the image.
次に、このようなパラメトリック動きモデルを導入した動き推定の詳細について説明する。まず、パラメトリック動きモデルを規定する。各パラメトリック動きモデルは、任意の数のラベルα∈L⊂Zによってラベル付けされているものとする。格子点nのラベルをz(n)∈Lとし、ラベルαを有する領域の集合(各動き領域)をNα={n|z(n)=α}とする。ラベルαの領域ごとのパラメトリック動きモデルを(57)式で定義する。 Next, details of motion estimation using such a parametric motion model will be described. First, a parametric motion model is defined. Each parametric motion model is labeled with an arbitrary number of labels αεL⊂Z. Assume that the label of the lattice point n is z (n) εL, and a set of regions (each motion region) having the label α is Nα = {n | z (n) = α}. A parametric motion model for each region of the label α is defined by equation (57).
次に、動きパラメータ推定について説明する。動きパラメータ推定の処理は、動きパラメータ推定部110によって行われる。パラメトリック動きモデルによって定まる動きベクトルは、(60)式で示されるので、これと(57)式を用いると、パラメトリック動きモデルによって定まる動きベクトルは(61)式で示される。
Next, motion parameter estimation will be described. The motion parameter estimation processing is performed by the motion
次に、パラメータ修正部113によるパラメータ修正処理について説明する。上記動きパラメータ推定部110による動きパラメータの推定は、局所動きベクトルから動きパラメータを推定するが、推定された動きパラメータによって規定される動きモデルは画像に適合するかどうか分からない。すなわち、動きパラメータの画像に対する尤度は考慮されていないことになる。
Next, parameter correction processing by the
このことは、次に示すような問題として顕在化する。局所動き推定には推定誤差が入り込み、動きパラメータ推定にも推定誤差が入り込む。このため、得られた動きモデルは必ずしも画像に適合しているとは限らないため、ラベル割り当ての精度が低下する場合があり得る。その結果、正しいラベル割り当てが行われず、その情報を用いて次の局所動き推定をおこなうため、さらに誤差が拡大してしまう。これはフィードバックによる誤差の発散効果と見ることができるので、いずれかの段階で誤差のフィードバックをキャンセルする必要がある。上記の動きパラメータの画像に対する尤度を最適化することにより、動きパラメータの画像に対する誤差を減少することができ、十分上記フィードバックのキャンセルを行うことができる。 This becomes obvious as the following problem. An estimation error is included in the local motion estimation, and an estimation error is also included in the motion parameter estimation. For this reason, since the obtained motion model does not necessarily match the image, the accuracy of label allocation may be reduced. As a result, the correct label assignment is not performed, and the next local motion estimation is performed using the information, so that the error further increases. Since this can be regarded as an error divergence effect due to feedback, it is necessary to cancel the error feedback at any stage. By optimizing the likelihood of the motion parameter image, the error of the motion parameter image can be reduced, and the feedback can be canceled sufficiently.
動きパラメータの画像に対する尤度は、(70−2)、(70−3)式で示される。
(70−2)、(70−3)式は、ラベリングの尤度と等価であるが、ラベリングにおいてはラベルによって最適化がおこなわれるため、動きパラメータに関しては最適化されない。動きパラメータの最適化問題としては、(70−4)式を解法すればよい。
(70−4)式において、ノイズの標準偏差項は最尤推定の結果には影響を与えないため省略している。この問題は、Lucas−Kanadeアルゴリズムによって安定して解くことができることが知られている。ここでは、各ラベルαに対して個別に最尤推定をおこないたいため、ラベル毎にLucas−Kanadeアルゴリズムを適用する。 In equation (70-4), the standard deviation term of noise is omitted because it does not affect the result of maximum likelihood estimation. It is known that this problem can be solved stably by the Lucas-Kanade algorithm. Here, since it is desired to perform maximum likelihood estimation individually for each label α, the Lucas-Kanade algorithm is applied for each label.
ラベルを有する領域の集合、すなわち各動き領域を(70−5)式で示すと、動きパラメータの最適化問題は各領域毎に定義され、(70−6)式で示される。
Lucas−Kanadeアルゴリズムは、真の解(70−7)式の十分近い近傍点(70−8)式は既知として、(70−9)式のように解を反復的に漸化させることにより近似解を求める手法であり、(70−10)式による最小化を行えばよい。
(70−10)式を、aαの周りでテーラー展開すると、(70−11)式のようになる。かかる式をΔaαで微分すると(70−12)式が得られる。
かかる式に対し、ニュートン法を適用すると解の更新は(70−13)式のようになる。ここで、Hは(70−14)式で示されるHessianである。
従って、解の更新式は(70−15)式で示される。
ここで、例えば十分小さい定数ε(>0)に対して、(70−16)式を満たしたら終了等のように終了条件を定めておく。なお、所定のイテレーション回数を繰り返した後に終了するように構成してもよい。 Here, for example, for a sufficiently small constant ε (> 0), an end condition is defined such as end when the expression (70-16) is satisfied. It may be configured to end after repeating a predetermined number of iterations.
(70−10)式は、各画素を等価に扱っているために、ラベル内に外れ値が入っていると、その影響をうけて解(平均)がずれてしまう。そこで、(70−10)式に重み付けを行い、(70−17)式で示す問題を考える。
この重みw(n)を外れ値の場合には低くなるように設定することより、外れ値の影響に対してロバストになる。解の更新(70−13)式の導出と同様に更新式を導出すると、(70−18)式のようになる。なお、重みw(n)の決定はM推定の枠組みなどを使うことできる。
従って、本実施の形態では、動きパラメータ修正部113によって動きパラメータ推定部110で推定した動きパラメータを、(70−18)、(70−14)、(70−15)式によって修正すればよい。
Therefore, in the present embodiment, the motion parameter estimated by the motion
次に、弾性エネルギー力計算部104による不連続対応弾性力の計算について説明する。互いに異なるパラメトリック動きモデルは、一般に互いに異なる動きパラメータを有している。このため、両者の境界部分の弾性定数は0に設定した方が歪みが少ない。その境界部分は互いに異なるラベルを有する部分となる。すなわち、格子点n1,n2間の弾性定数は、(71)式で示されることになる。不連続に対応した弾性力(以下、「不連続対応弾性力」という)は、(71)式と(38)式により(72)式で定義することができる。
Next, calculation of the elastic force corresponding to discontinuity by the elastic energy
次に、補正項計算部112による補正項の計算について説明する。パラメトリック動きモデルによって定まる動きと各格子点の動きが異なる場合には、各格子点をパラメトリック動きモデルに近似させる補正をおこなう必要がある。このため、後述する第2の運動方程式にかかる近似を行うための補正項を加え、補正項計算部112によって補正項の計算を行っている。かかる近似の補正が線形な弾性エネルギーに従う場合とすれば、補正項は、(73)式のように、パラメトリック動きモデルによって定まる動きベクトルと各格子点の動きベクトルの差を入力とした線形関数の出力で示される補正力として定義される。ここで、k2は、補正の強度を示している。
Next, calculation of the correction term by the correction
次に、動きパラメータ割り当て部111による動きパラメータ割り当て処理、すなわちラベル割り当て処理について説明する。動きパラメータ割り当て部111による動きパラメータ割り当て処理では、格子点nに対する動きパラメータの割り当て問題として、(75)式に示す最適化問題を解放する。
Next, a motion parameter assignment process by the motion
ここで、動きパラメータを正確に割り当てるためには、動きパラメータの精度が高い必要があることが推察される。図11に示すように、マッチング対象領域に対して画像マッチングが正しい領域(図11中の白い領域)が広いほど、その領域に対する動きパラメータの推定精度も高くなる。これは最小二乗法の特性である(中心極限定理によりサンプル数が多いほど推定精度は向上する)。このため、画像マッチングが行われていない領域(図中の灰色領域)に対して、この動きパラメータを割り当てると、正確な画像マッチングとなりやすい。逆に、マッチング領域が狭い場合には、動きパラメータの推定精度は低下する。この場合、低精度の動きパラメータを拡張した場合でも、真の動きパラメータとのズレが大きくなり、正確な画像マッチングを行うことは困難である。 Here, it is inferred that the accuracy of the motion parameter needs to be high in order to assign the motion parameter accurately. As shown in FIG. 11, the larger the area where the image matching is correct (the white area in FIG. 11) with respect to the matching target area, the higher the estimation accuracy of the motion parameter for that area. This is a characteristic of the least square method (the estimation accuracy improves as the number of samples increases due to the central limit theorem). For this reason, if this motion parameter is assigned to an area where image matching has not been performed (gray area in the figure), accurate image matching is likely to occur. Conversely, when the matching area is narrow, the motion parameter estimation accuracy decreases. In this case, even when the low-precision motion parameter is expanded, the deviation from the true motion parameter becomes large, and it is difficult to perform accurate image matching.
ここで、画面全体での最適化を行うことも可能である。画像処理の有する局在性に着目し、画像の局在性をマルコフ性と等価なギブス分布によって定式化し、それを事前分布としてベイズの定理により、求めたい最適化問題を事後分布最大化問題として定式化すればよい。またその事後分布最大化問題は基本的にNP困難であり、大域的最適解を得るのは難しく、通常はシミュレイティッドアニーリングなどにより求解する。さらに効率よく解法するため、非特許文献「Y. Boykov, O. Veksler and R. Zabih, "Fast Approximate Energy Minimization via Graph Cuts", IEEE Trans. on Pattern Analysis and Machine Int., Vol. 23, No. 11, pp. 1222-1239, 2001」に詳述されているグラフ理論のグラフカットを用いて定式化することも可能である。 Here, it is possible to optimize the entire screen. Focusing on the localization of image processing, the localization of the image is formulated by the Gibbs distribution equivalent to the Markov property, and the optimization problem that we want to find as a prior distribution is the posterior distribution maximization problem It can be formulated. In addition, the posterior distribution maximization problem is basically NP-hard, and it is difficult to obtain a global optimal solution, and is usually solved by simulated annealing or the like. In order to solve the problem more efficiently, the non-patent document “Y. Boykov, O. Veksler and R. Zabih,“ Fast Approximate Energy Minimization via Graph Cuts ”, IEEE Trans. On Pattern Analysis and Machine Int., Vol. 23, No. 11, pp. 1222-1239, 2001 ", and can be formulated using graph theory graph cuts.
次に、第2解法処理部108によって解法処理を行う第2の運動方程式について説明する。第2の運動方程式は、(77)式に示されるように、(55)、(56)式の第1の運動方程式に、(73)式または(74)式の補正項が加わり、さらに弾性エネルギー力として、(71)、(72)式に示す不連続対応弾性力の項を有している。第2解法処理部108では、かかる第2の運動方程式を、第1の運動方程式と同様に、オイラー法等の離散変数法を用いた数値解析処理により解法している。
Next, the second equation of motion for which the second
動的マッチング処理が完了したら、動きクラスタリング処理109によって動きクラスタリング処理を行い(ステップS1203)、参照画像の画面を複数個に分割して動きパラメータのラベルの初期値を求める。次に、動きパラメータ推定部110による動きパラメータ推定処理を行い(ステップS1204)、各ラベルの領域に対する動きパラメータを推定する。そして、動きパラメータ修正部113によって、動きパラメータ推定部110で推定した動きパラメータを、(70−18)、(70−14)、(70−15)式によって修正する(ステップS1205)。そして、動きパラメータ割り当て部111によって、修正した動きパラメータから最適な動きパラメータを決定して、決定された最適な動きパラメータを、ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当て処理を行う(ステップS1206)。
When the dynamic matching processing is completed, motion clustering processing is performed by the motion clustering processing 109 (step S1203), and the reference image screen is divided into a plurality of frames to obtain initial values of motion parameter labels. Next, motion parameter estimation processing is performed by the motion parameter estimation unit 110 (step S1204), and motion parameters for each label area are estimated. Then, the motion
次に、補正項を付加した動的マッチング処理、すなわち補正項計算部112および第2解法処理部108による(77)式の第2の運動方程式の解法処理を行ってyn (LT2))を求め(ステップS1207)、フレームメモリ106に保存する。そして、カウント回数Lを1増加して(ステップS1208)、カウント回数Lが予め定められた所定回数を超えたか否かを調べる(ステップS1209)。
Next, the dynamic matching process with the correction term added, that is, the solution process of the second equation of motion of the equation (77) by the correction
カウント回数Lが予め定められた所定回数を超えていない場合には(ステップS1209:No)、ステップS1204からS1208までの処理を繰り返す。すなわち、動きパラメータ処理部110による動きモデルの動きパラメータの推定処理、動きパラメータ修正部113による動きパラメータの修正処理、動きパラメータ割り当て部111による動きパラメータの割り当て処理、補正項計算部112および第2解法処理部108による局所的な動きの更新(第2の運動方程式の解法処理)を繰り返す。
When the count number L does not exceed the predetermined number of times (step S1209: No), the processing from step S1204 to S1208 is repeated. That is, the motion parameter estimation processing by the motion
一方、ステップS1209において、カウント回数Lが予め定められた所定回数を超えた場合には(ステップS1209:Yes)、第2解法処理部108によって、すべての格子点nに対して、ynにyn (T)を設定する(ステップS1210)。そして、マッピング処理部107により、対象画像と参照画像との対応関係、すなわち写像を求める(ステップS1211)。このような動き分割を用いた処理によって、画像の正確な動きを推定して、第1の格子点と第2の格子点との写像関係を求めて画像マッチングが行われる。
On the other hand, if the count number L exceeds a predetermined number in step S1209 (step S1209: Yes), the second
次に、ステップS1202における局所的な動的マッチング処理について説明する。図13は、実施の形態1にかかる局所的な動的マッチング処理の手順を示すフローチャートである。具体的には、先に示した(55)、(56)式を数値解析により解法することにより画像マッチング処理を実現している。 Next, the local dynamic matching process in step S1202 will be described. FIG. 13 is a flowchart of a local dynamic matching process according to the first embodiment. Specifically, the image matching processing is realized by solving the equations (55) and (56) shown above by numerical analysis.
まず、第1解法処理部101は、時間τ(0)=0に設定し(ステップS1301)、初期値yn (0)=n、vn (0)=0を設定する(ステップS1302)。これにより、(56)式が実行される。
First, the first
次に、画像エネルギー力計算部103によって、すべての格子点nに対してmステップにおける画像相関ポテンシャル力Fi (m)(n)を計算する(ステップS1303)。かかる画像エネルギー力Fi (m)(n)の計算処理については後述する。
Next, the image energy
次いで、弾性エネルギー力計算部104によって、すべての格子点nに対してmステップにおける弾性エネルギー力Fk (m)(n)を(38)式により算出する(ステップS1304)。そして、摩擦力計算部105によって、すべての格子点nに対してmステップにおける摩擦力[−μvn (m)]を計算する(ステップS1305)。
Next, the elastic energy
次に、第1解法処理部101によって、(55)式の更新式を、ステップS1303〜S1305で求めた画像エネルギー力Fi (m)(n)、弾性エネルギー力Fk (m)(n)、摩擦力[−μvn (m)]で更新する(ステップS1306)。
Next, the first
次に、第1解法処理部101によって、yn (m)の値をフレームメモリ106に保存する(ステップS1307)。そして、第1解法処理部101によって、τ(m+1)=τ(m)+hと更新し(ステップS1308)、mを1だけ増加する(ステップS1309)。そして、τ(m+1)があらかじめ定められた時間Tを越えたか否かを判断し(ステップS1310)、越えていない場合には、上記ステップS1303からS1309を繰り返し実行する。
Next, the first
一方、τ(m+1)がTを越えた場合には、第1解法処理部101によって、すべての格子点nに対して、ynにyn (T)を設定する(ステップS1311)。
On the other hand, tau (m + 1) is the case beyond the T is the first
次に、ステップS1303における画像エネルギー力の計算処理について説明する。図14は、画像エネルギー力計算部103による画像エネルギー力の計算処理の手順を示すフローチャートである。
Next, the image energy force calculation process in step S1303 will be described. FIG. 14 is a flowchart showing a procedure of image energy force calculation processing by the image energy
まず、画像エネルギー力計算部103は、(41)式により、yn(τ)にもっとも近いサンプリング点を局所空間中心ycとして計算する(ステップS1401)。そして次に、画像エネルギー力計算部103は、(42)式で定義される隣接空間Lを設定し(ステップS1402)、局所探索集合Ωを(43)式によって計算する(ステップS1403)。
First, the image energy
次に、画像エネルギー力計算部103は、(46)式により局所最適化計算としてyminを計算し(ステップS1404)、正規化のために、ステップS1404で求めた局所最適化のyminを用いて(45)式によりd=ymin−yn (m)を計算する(ステップS1405)。そして、画像エネルギー力計算部103は、ymin、d等を用いて、(44)式により、画像エネルギー力Fi (m)(n)を計算する(ステップS1406)。
Next, the image energy
次に、ステップS1203における動きクラスタリング処理部109により動きクラスタリング処理について説明する。図15は、実施の形態1にかかる動きクラスタリング処理部109により動きクラスタリング処理の手順を示すフローチャートである。
Next, the motion clustering processing by the motion
まず、動きクラスタリング処理部109は、局所的な動的マッチング処理の結果としての輝度等の画素値に基づいて、参照画像をk−Means法によって複数個にクラスタリングを行って画像を分割しラベルを求める(ステップS1501)。
First, based on pixel values such as luminance as a result of local dynamic matching processing, the motion
そして、そのクラスタリング結果によるラベルに基づき、初期動きパラメータを推定し、複数個の初期動きパラメータを求める(ステップS1502)。次に、求めた初期動きパラメータを初期値としてk−Means法による数値解析処理により動きパラメータのラベルαを求める(ステップS1503)。ここで、ラベルαは、複数個の初期動きパラメータに対応して複数個求められる。かかる動きクラスタリング処理は、図12に示すように、局所的な動的マッチング処理が完了した直後に1回だけ実行される。 Then, based on the label based on the clustering result, an initial motion parameter is estimated to obtain a plurality of initial motion parameters (step S1502). Next, the motion parameter label α is obtained by numerical analysis processing by the k-Means method using the obtained initial motion parameter as an initial value (step S1503). Here, a plurality of labels α are obtained corresponding to a plurality of initial motion parameters. Such motion clustering processing is executed only once immediately after the local dynamic matching processing is completed, as shown in FIG.
次に、ステップS1204における動きパラメータ推定部110による動きパラメータ推定処理について説明する。図16は、実施の形態1にかかる動きパラメータ推定部110による動きパラメータ推定処理の手順を示すフローチャートである。
Next, the motion parameter estimation processing by the motion
まず、動きパラメータ推定部110は、動きクラスタリング処理部109によって求めたラベルαに対して、全ての格子点nに対して、(69−2)式によりAを、(69−3)式によりbを計算する(ステップS1601)。そして、(69−1)式を特異値分解法(もしくはLU法)による数値解析により解法処理を行う(ステップS1602)。そして、全てのラベルαに対して、上記ステップS1601およびS1602の処理を繰り返して実行する(ステップS1603)。このようにして推定された動きパラメータは、ステップS1205における動きパラメータ修正部113によって、(70−18)、(70−14)、(70−15)式により修正される。
First, the motion
次に、ステップS1206における動きパラメータ割り当て部111による動きパラメータ割り当て処理について説明する。図17は、実施の形態1にかかる動きパラメータ割り当て部111による動きパラメータ割り当て処理の手順を示すフローチャートである。
Next, the motion parameter assignment processing by the motion
まず、動きパラメータ割り当て部111は、全てのラベルαに対して、(76)式に示すコスト関数G(n)が最小になるα0を求める(ステップS1701)。かかる処理は、すなわち、(75)式を実行することである。そして、動きパラメータ割り当て部111は、α0を格子点nに対するラベルとして設定する(ステップS1702)。かかる処理により、格子点nに最適な動きパラメータが割り当てられたことになる。そして、動きパラメータ割り当て部111は、上記ステップS1701およびS1702の処理を全ての格子点nに対して繰り返し実行する(ステップS1703)。これにより、全ての格子点nに対して最適な動きパラメータが割り当てられる。
First, the motion
次に、ステップS1207における補正項を付加した動的マッチング処理について説明する。図18は、実施の形態1にかかる補正項を付加した動的マッチング処理の手順を示すフローチャートである。具体的には、先に示した(77)式を数値解析により解法することにより画像マッチング処理を実現している。 Next, the dynamic matching process with the correction term added in step S1207 will be described. FIG. 18 is a flowchart of a dynamic matching process procedure to which correction terms according to the first embodiment are added. Specifically, the image matching process is realized by solving the equation (77) shown above by numerical analysis.
まず、第2解法処理部108は、時間τ(0)=0に設定し(ステップS1801)、初期値yn (0)=n、vn (0)=0を設定する(ステップS1802)。これにより、(77)式の第2式が実行される。
First, the second
次に、画像エネルギー力計算部103によって、すべての格子点nに対してmステップにおける画像相関ポテンシャル力Fi (m)(n)を計算する(ステップS1803)。かかる画像エネルギー力Fi (m)(n)の計算処理については、図14で説明した処理と同様に行われる。
Next, the image energy
次いで、弾性エネルギー力計算部104によって、すべての格子点nに対してmステップにおける不連続対応弾性力Fdk (m)(n)を(71)、(72)式により算出する(ステップS1804)。不連続対応弾性力Fdk (m)(n)の計算処理については後述する。
Next, the elastic energy
次に、補正項計算部112によって、すべての格子点nに対してmステップにおける補正項Fd (m)(n)を(73)式により算出する(ステップS1805)。そして、摩擦力計算部105によって、すべての格子点nに対してmステップにおける摩擦力[−μ(τ(m))vn (m)]を計算する(ステップS1806)。
Next, the correction
次に、第2解法処理部108によって、(77)式の更新式を、ステップS1803〜S1806で求めた画像エネルギー力Fi (m)(n)、不連続対応弾性力Fdk (m)(n)、補正項Fd (m)(n)、摩擦力[−μ(τ(m))vn (m)]で更新する(ステップS1807)。
Next, the second
次に、第2解法処理部108によって、yn (m)の値をフレームメモリ106に保存する(ステップS1808)。そして、第2解法処理部108によって、τ(m+1)=τ(m)+hと更新し(ステップS1809)、mを1だけ増加する(ステップS1810)。そして、τ(m+1)があらかじめ定められた時間T1を越えたか否かを判断し(ステップS1811)、越えていない場合には、上記ステップS1803からS1810を繰り返し実行する。
Next, the value of y n (m) is stored in the
次に、ステップS1804における弾性エネルギー力計算部104による不連続対応弾性力Fdk (m)(n)の計算処理について説明する。図19は、実施の形態1にかかる弾性エネルギー力計算部104による不連続対応弾性力Fdk (m)(n)の計算処理の手順を示すフローチャートである。
Next, the calculation processing of the elastic force F dk (m) (n) corresponding to the discontinuity by the elastic energy
まず、弾性エネルギー力計算部104は、mステップにおける格子点n1のラベルz(m)(n1)と格子点n2のラベルz(m)(n2)が等しいか否かを調べる(ステップS1901)。これは、格子点n1と格子点n2は同一の動きパラメータの動きモデルに属するか否かを調べている。
First, elastic energy
そして、格子点n1のラベルz(m)(n1)と格子点n2のラベルz(m)(n2)が等しい場合(ステップS1901:Yes)、すなわち、格子点n1と格子点n2は同一の動きパラメータの動きモデルに属する場合には、格子点n1と格子点n2の間の弾性係数k(m)(n1,n2)をk1,に設定する(ステップS1902)。そして、不連続対応弾性力Fdk (m)(n)を(72)式により計算する(ステップS1904)。 When the grid point n 1 label z (m) (n 1) and the grid point n 2 label z (m) (n 2) are equal (step S1901: Yes), i.e., grid points n 1 and the lattice point If n 2 belongs to the motion model having the same motion parameter, the elastic coefficient k (m) (n 1 , n 2 ) between the lattice point n 1 and the lattice point n 2 is set to k 1 , (step S1902). Then, the discontinuous corresponding elastic force F dk (m) (n) is calculated by the equation (72) (step S1904).
一方、ステップS1901において、格子点n1のラベルz(m)(n1)と格子点n2のラベルz(m)(n2)が等しくない場合(ステップS1901:No)、すなわち、格子点n1と格子点n2が異なる動きパラメータの動きモデルに属する場合には、弾性係数k(m)(n1,n2)を0に設定する(ステップS1903)。これにより、(72)式によって不連続対応弾性力Fdk (m)(n)は0となる。なお、ステップS1901からS1903までの処理は、(71)式を実行する処理である。 On the other hand, in step S1901, if the grid point n 1 label z (m) (n 1) and the grid point n 2 label z (m) (n 2) are not equal (Step S1901: No), i.e., grid points If n 1 and lattice point n 2 belong to motion models having different motion parameters, the elastic coefficient k (m) (n 1 , n 2 ) is set to 0 (step S1903). As a result, the discontinuity-corresponding elastic force F dk (m) (n) becomes zero according to equation (72). Note that the processing from step S1901 to S1903 is processing for executing equation (71).
このようにして計算された不連続対応弾性力は、ステップS1807で、更新式(77)式の項に入力されることになる。 The discontinuity-corresponding elastic force calculated in this way is input to the term of the update equation (77) in step S1807.
このように実施の形態1にかかる画像マッチング装置100では、更新式(55)、(56)式による局所的な動的マッチング処理が終了した後、参照画像を複数の領域に分割して各領域ごとに、第2の格子点の動きを規定した動きモデルを分類するための動きパラメータの最適な動きパラメータを求めて動きモデルを示す第2の運動方程式(77)式の数値解析による解法処理を行って、対象画像と前記参照画像との対応関係を求めているので、領域境界の不連続性と領域内の一様性をロバストに表現できるようになり、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができる。
As described above, in the
(実施の形態2)
実施の形態2にかかる画像マッチング装置は、動きパラメータの推定処理において、ロバスト統計の手法であるM推定を利用したものである。
(Embodiment 2)
The image matching apparatus according to the second embodiment uses M estimation, which is a robust statistical technique, in motion parameter estimation processing.
実施の形態1では、動きパラメータ推定処理において、動きパラメータと得られた動きベクトルの誤差がガウス分布に従っていると仮定して最小二乗推定法を用いた動きパラメータの推定を行っていた。しかしながら、動きパラメータと動きベクトルの誤差が単純にガウス分布に従っているといえない場合には、ロバスト統計の手法であるM推定を利用することが好ましい。このような場合としては、例えば、画像の一部に大きな外れ値が含まれているような場合であり、動的マッチングにおいて、動きと動きの境界は歪みによってこのような状況になりやすい。 In the first embodiment, in the motion parameter estimation process, the motion parameter is estimated using the least square estimation method on the assumption that the error between the motion parameter and the obtained motion vector follows a Gaussian distribution. However, when it cannot be said that the error between the motion parameter and the motion vector simply follows a Gaussian distribution, it is preferable to use M estimation, which is a robust statistical technique. Such a case is, for example, a case where a large outlier is included in a part of an image, and in dynamic matching, the boundary between motion and motion tends to be in such a situation due to distortion.
実施の形態2にかかる画像マッチング装置の構成は実施の形態1と同様である。また、実施の形態2における画像マッチングの全体処理、局所的な動的マッチング処理、動きクラスタリング処理、動きパラメータ割り当て処理、補正項を付した動的マッチング処理については、実施の形態1と同様に行われる。 The configuration of the image matching apparatus according to the second embodiment is the same as that of the first embodiment. The overall image matching process, local dynamic matching process, motion clustering process, motion parameter assignment process, and dynamic matching process with correction terms in the second embodiment are the same as in the first embodiment. Is called.
M推定における標準正規変数z(n)は、(78)式で示される。TukeyのBiweight法によると重み関数w(n)は、(79)式で示される
図20は、実施の形態2にかかる動きパラメータ推定部110による動きパラメータ推定処理の手順を示すフローチャートである。まず、動きパラメータ推定部110は、重みw(n)を1に初期化する(ステップS2001)。そして、動きクラスタリング処理部109によって求めたラベルαに対して、全ての格子点nに対して、(81−2)式によりAを、(81−3)式によりbを計算する(ステップS2002)。そして、(81−1)式を特異値分解法(もしくはLU法)による数値解析により解法処理を行う(ステップS2003)。
FIG. 20 is a flowchart of a motion parameter estimation process performed by the motion
次に、動きパラメータ推定部110は、標準正規変数z(n)を(78)式に従って計算する(ステップS2004)。そして、重み関数w(n)を用いて標本平均z(i)、標本偏差s(i)を(80)式に従って計算する(ステップS2005)。次いで、動きパラメータ推定部110は、重みw(n)を更新し(ステップS2006)、イテレーションiを1増加する(ステップS2007)。そして、iが所定回数Iを越えたか否かを調べ(ステップS2008)、越えていない場合には、ステップS2002からS2007までの処理を繰り返し実行する。
Next, the motion
一方、ステップS2008において、iが所定回数Iを越えた場合には、全てのラベルαに対して、上記ステップS1601およびS1602の処理を繰り返して実行する(ステップS2009)。 On the other hand, if i exceeds the predetermined number I in step S2008, the processes in steps S1601 and S1602 are repeated for all labels α (step S2009).
このように実施の形態2にかかる画像マッチング装置では、動きパラメータの推定処理において、ロバスト統計の手法であるM推定を利用しているので、動きパラメータと動きベクトルの誤差がガウス分布に従っていない場合にも、領域境界の不連続性と領域内の一様性をロバストに表現できるようになり、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができる。 As described above, the image matching apparatus according to the second embodiment uses the M estimation, which is a robust statistical technique, in the motion parameter estimation process, and therefore, when the error between the motion parameter and the motion vector does not follow the Gaussian distribution. However, it becomes possible to robustly express the discontinuity of the region boundary and the uniformity within the region, and more accurate image matching can be performed. As a result, a higher quality interpolated frame can be generated. it can.
(実施の形態3)
実施の形態3にかかる画像マッチング装置は、第2の格子点が対象画像上には存在するが参照画像上には存在しない領域であるオクルージョン領域に含まれる場合には、当該格子点において動きパラメータの割り当てをおこなわず、オクルージョン領域に含まれない格子点に対してのみ動きパラメータの割り当てを行うものである。
(Embodiment 3)
In the image matching device according to the third embodiment, when the second grid point is included in the occlusion area, which is an area that exists on the target image but does not exist on the reference image, the motion parameter is determined at the grid point. Is assigned, and motion parameters are assigned only to lattice points not included in the occlusion area.
対象画像上には存在するが参照画像上には存在しない領域は、coveredなオクルージョン領域といい、本来的に画像マッチングを行うことができない領域である。実施の形態1にかかる画像マッチング装置100では、coveredオクルージョン領域にも動きパラメータの割り当てがおこなわれるため、動きパラメータ推定の結果が歪んでしまう場合がある。
An area that exists on the target image but does not exist on the reference image is called a covered occlusion area, and is an area that cannot inherently perform image matching. In the
実施の形態3にかかる画像マッチング装置では、coveredオクルージョン領域をあらかじめ検出しておき、そのオクルージョン領域の格子点には動きパラメータの割り当てをおこなわないようにしている。 In the image matching apparatus according to the third embodiment, a covered occlusion area is detected in advance, and motion parameters are not assigned to lattice points in the occlusion area.
図21は、実施の形態3にかかる画像マッチング装置2100の構成を示すブロック図である。実施の形態3にかかる画像マッチング装置2100では、オクルージョン検出部2101を備えている点が実施の形態1と異なり、他の構成については実施の形態1にかかる画像マッチング装置の構成と同様である。また、実施の形態3における画像マッチングの全体処理、局所的な動的マッチング処理、動きクラスタリング処理、動きパラメータ推定処理、補正項を付した動的マッチング処理については、実施の形態1と同様に行われる。
FIG. 21 is a block diagram of a configuration of an
オクルージョン検出部2101は、coveredオクルージョン領域を検出する処理部である。図22および図23は、coveredオクルージョン領域の状態を示す説明図である。coveredオクルージョン領域は、図22に示すように、典型的に移動物体の前方に現れる。図22に示す状態では、バネが縮んでいる領域がcoveredオクルージョン領域となる。
The
このようなcoveredオクルージョン領域は、次のように定式化することができる。図23に示すように、格子点の周囲の8格子を考える。そして、かかる8格子から形成される三角形の面積の和により、元の正方格子からの変形の度合いを調べる。かかる面積S(n)をベクトルの外積により、(82)式のように定義する。面積比r(n)は、正方格子の面積を4として、(83)式で表される。なお、(83)式において、×はベクトルの外積計算をあらわす。 Such a covered occlusion area can be formulated as follows. As shown in FIG. 23, 8 lattices around lattice points are considered. Then, the degree of deformation from the original square lattice is examined by the sum of the areas of the triangles formed from the eight lattices. Such an area S (n) is defined by an outer product of vectors as shown in equation (82). The area ratio r (n) is expressed by the equation (83), where the area of the square lattice is 4. In the equation (83), x represents the vector cross product calculation.
図24は、実施の形態2にかかる画像マッチング装置2100による動きパラメータ割り当て処理の手順を示すフローチャートである。
FIG. 24 is a flowchart of a motion parameter assignment process performed by the
まず、オクルージョン検出部2101は、格子点の周囲の8格子から形成される三角形の面積の総和S(n)を(82)式により計算する(ステップS2401)。次に、オクルージョン検出部2101は、S(n)を用いて面積比r(n)を(83)式により計算する(ステップS2402)。
First, the
次に、オクルージョン検出部2101は、面積比r(n)が所定の閾値Tより小さいか否か、すなわちオクルージョン領域か否かを判定する(ステップS2403)。そして、面積比r(n)が所定の閾値Tより小さくない場合(ステップS2403:No)、すなわち、オクルージョン領域でない場合には、動きパラメータ割り当て部111は、全てのラベルαに対して、(76)式に示すコスト関数G(n)が最小になるα0を求める(ステップS2404)。そして、動きパラメータ割り当て部111は、α0を格子点nに対するラベルとして設定する(ステップS2405)。かかる処理により、格子点nに最適な動きパラメータが割り当てられたことになる。
Next, the
一方、ステップS2403において、面積比r(n)が所定の閾値Tより小さい場合(ステップS2403:Yes)、すなわち、オクルージョン領域である場合には、ステップS2404およびS2405の最適な動きパラメータが割り当て処理は行わない。 On the other hand, in step S2403, if the area ratio r (n) is smaller than the predetermined threshold T (step S2403: Yes), that is, if it is an occlusion region, the optimal motion parameters in steps S2404 and S2405 are assigned. Not performed.
そして、動きパラメータ割り当て部111は、上記ステップS2401からS2405の処理を全ての格子点nに対して繰り返し実行する(ステップS2406)。これにより、オクルージョン領域でない全ての格子点nに対して最適な動きパラメータが割り当てられることになる。
Then, the motion
このように実施の形態3にかかる画像マッチング装置では、coveredオクルージョン領域をあらかじめ検出しておき、そのオクルージョン領域の格子点には動きパラメータの割り当てを行わないので、coveredオクルージョンによる歪みを最小限に抑えることができ、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができる。 As described above, in the image matching apparatus according to the third embodiment, the covered occlusion area is detected in advance, and no motion parameter is assigned to the lattice point of the occlusion area, so that distortion due to the covered occlusion is minimized. Therefore, more accurate image matching can be performed, and as a result, an interpolation frame with higher image quality can be generated.
(実施の形態4)
実施の形態4にかかる画像マッチング装置では、信頼性の低い領域に対しては動きパラメータの割り当てを行わないものである。
(Embodiment 4)
In the image matching apparatus according to the fourth embodiment, motion parameters are not assigned to regions with low reliability.
実施の形態1にかかる画像マッチング装置では、動きパラメータ割り当て処理の最適化を全て信頼していた。しかしながら、実際には動きパラメータ割り当て処理の最適化の信頼度が低い領域も存在する。例えば、動きパラメータの最適値に近似する値が二つ以上存在するような場合には、信頼性が低いと言える。すなわち、異なる動きパラメータに対して、最適値に近似する値が二つ以上存在するような場合は、コスト関数面が多峰性になっていると考えられ、動きパラメータの最適値の信頼度は低いと考えられる。本実施の形態では、このような低信頼領域に対しては動きパラメータの割り当て処理を行わないように構成している。 In the image matching apparatus according to the first embodiment, all optimization of the motion parameter assignment process is trusted. However, there is actually a region where the reliability of optimization of the motion parameter assignment process is low. For example, if there are two or more values that approximate the optimal value of the motion parameter, it can be said that the reliability is low. That is, when there are two or more values that approximate the optimal value for different motion parameters, the cost function surface is considered to be multimodal, and the reliability of the optimal value of the motion parameter is It is considered low. In the present embodiment, the motion parameter assignment process is not performed for such a low-reliability region.
実施の形態4かかる画像マッチング装置の構成は、実施の形態1と同様である。また、実施の形態4における画像マッチングの全体処理、局所的な動的マッチング処理、動きクラスタリング処理、動きパラメータ推定処理、補正項を付した動的マッチング処理については、実施の形態1と同様に行われる。 The configuration of the image matching apparatus according to the fourth embodiment is the same as that of the first embodiment. The overall image matching process, local dynamic matching process, motion clustering process, motion parameter estimation process, and dynamic matching process with correction terms in the fourth embodiment are performed in the same manner as in the first embodiment. Is called.
本実施の形態にかかる動きパラメータ割り当て部111では、格子点が低信頼領域に含まれるか否かを判定して低信頼性領域に含まれる場合には、動きパラメータの割り当てをおこなわない処理を行っている。
The motion
低信頼領域の判定は、(84)式により定式化することができる。 The determination of the low reliability region can be formulated by the equation (84).
次に、動きパラメータが近似するか否か、すなわち(85)式が成立するか否かを調べる(ステップS2503)。そして、(85)式が成立しない場合には、(86)式が成立するか否かにより低信頼性領域か否かを調べる(ステップS2504)。 Next, it is examined whether or not the motion parameter is approximate, that is, whether or not the equation (85) is satisfied (step S2503). If the formula (85) is not satisfied, it is checked whether or not the low reliability region is satisfied based on whether the formula (86) is satisfied (step S2504).
そして、(86)式が成立せず低信頼性領域でないと判断された場合には(ステップS2504:No)、ステップS2501で求めたα0を格子点nに対する最適なラベルと設定する(ステップS2505)。一方、ステップS2504において、(86)式が成立して低信頼性領域であると判断された場合には(ステップS2504:Yes)、ステップS2505の処理は行わず、最適なラベルの割り当て、すなわち最適な動きパラメータの割り当ては行われない。 If it is determined that equation (86) is not satisfied and the region is not a low-reliability region (step S2504: No), α 0 obtained in step S2501 is set as an optimum label for the lattice point n (step S2505). ). On the other hand, if it is determined in step S2504 that the expression (86) is satisfied and the region is a low-reliability region (step S2504: Yes), the process of step S2505 is not performed, and optimal label allocation, that is, optimal No assignment of motion parameters is performed.
また、ステップS2503において、動きパラメータが近似する場合、すなわち(85)式が成立する場合には(ステップS2503:Yes)、ステップS2404の低信頼性領域の判定処理を行わず、ステップS2501で求めたα0を格子点nに対する最適なラベルと設定する(ステップS2505)。 If the motion parameter is approximated in step S2503, that is, if equation (85) is satisfied (step S2503: Yes), the low-reliability region determination process in step S2404 is not performed, and the determination is performed in step S2501. α 0 is set as an optimum label for the lattice point n (step S2505).
かかる処理により、格子点nに最適な動きパラメータが割り当てられたことになる。そして、動きパラメータ割り当て部111は、上記ステップS2501からS2505までの処理を全ての格子点nに対して繰り返し実行する(ステップS2506)。
With this process, the optimum motion parameter is assigned to the lattice point n. Then, the motion
このように実施の形態4にかかる画像マッチング装置では、信頼性の低い領域に対しては動きパラメータの割り当てを行わないので、領域境界の不連続性と領域内の一様性をロバストに表現できるようになり、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができる。 As described above, in the image matching apparatus according to the fourth embodiment, since motion parameters are not assigned to regions with low reliability, discontinuity of region boundaries and uniformity within regions can be expressed robustly. As a result, more accurate image matching can be performed, and as a result, an interpolation frame with higher image quality can be generated.
実施の形態1〜4の画像マッチング装置は、CPUなどの制御装置と、ROM(ReadOnlyMemory)やRAMなどの記憶装置と、HDD、CDドライブ装置などの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボードやマウスなどの入力装置を備えており、通常のコンピュータを利用したハードウェア構成となっている。 The image matching devices according to the first to fourth embodiments include a control device such as a CPU, a storage device such as a ROM (Read Only Memory) and a RAM, an external storage device such as an HDD and a CD drive device, and a display device such as a display device. It has an input device such as a keyboard and a mouse, and has a hardware configuration using a normal computer.
実施の形態1〜4の画像マッチング装置で実行される画像マッチングプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。 The image matching program executed by the image matching apparatus according to the first to fourth embodiments is a file in an installable or executable format, and is a CD-ROM, flexible disk (FD), CD-R, DVD (Digital Versatile Disk). And the like recorded on a computer-readable recording medium.
また、実施の形態1〜4の画像マッチング装置で実行される画像マッチングプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施形態の画像マッチング装置で実行される画像マッチングプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。 Further, the image matching program executed by the image matching apparatus according to the first to fourth embodiments may be provided by being stored on a computer connected to a network such as the Internet and downloaded via the network. good. Further, the image matching program executed by the image matching apparatus of the present embodiment may be provided or distributed via a network such as the Internet.
また、本実施の形態の画像マッチングプログラムを、ROM等に予め組み込んで提供するように構成してもよい。 Further, the image matching program of the present embodiment may be configured to be provided by being incorporated in advance in a ROM or the like.
実施の形態1〜4の画像マッチング装置で実行される画像マッチングプログラムは、上述した各部(第1解法処理部101と、画像エネルギー力計算部103と、弾性エネルギー力計算部104と、摩擦力計算部105と、第2解法処理部108と、動きクラスタリング処理部109と、動きパラメータ推定部110と、動きパラメー割り当て部111と、補正項計算部112と、マッピング処理部107、オクルージョン検出部2101)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から画像マッチングプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、上記各部(第1解法処理部101と、画像エネルギー力計算部103と、弾性エネルギー力計算部104と、摩擦力計算部105と、第2解法処理部108と、動きクラスタリング処理部109と、動きパラメータ推定部110と、動きパラメー割り当て部111と、補正項計算部112と、マッピング処理部107、オクルージョン検出部2101)が主記憶装置上に生成されるようになっている。
The image matching program executed by the image matching apparatus according to the first to fourth embodiments includes the above-described units (first
なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施の形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態にわたる構成要素を適宜組み合わせても良い。 It should be noted that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the above embodiments. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.
100,2100 画像マッチング装置
101 第1解法処理部
103 画像エネルギー力計算部
104 弾性エネルギー力計算部
105 摩擦力計算部
106 フレームメモリ
107 マッピング処理部
108 第2解法処理部
109 動きクラスタリング処理部
110 動きパラメータ推定部
111 動きパラメー割り当て部
112 補正項計算部
2101 オクルージョン検出部
100, 2100
Claims (17)
前記対象画像上の複数の第1の格子点の各々と前記参照画像上で当該第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーを計算するとともに、前記各第2の格子点の位置と当該第2の格子点に対応する前記各第1の格子点の位置とに基づいて前記ポテンシャルエネルギーの勾配により前記第2の格子点が受ける画像エネルギー力を計算する画像エネルギー力計算部と、
前記各第2の格子点と当該第2の格子点に隣接する他の第2の格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する弾性エネルギー力計算部と、
前記各第2の格子点に作用する摩擦力を計算する摩擦力計算部と、
前記画像エネルギー力と前記第1の弾性エネルギー力と前記摩擦力とによる前記各第2の格子点に関する第1の運動方程式を数値解析により解法処理を行う第1の解法処理部と、
前記第1の解法処理部による解法処理の結果から、前記参照画像を複数の領域に分割して、分割した領域ごとに領域を識別するラベルを割り当てる動きクラスタリング処理部と、
前記ラベルが割り当てられた領域における前記第2の格子点と前記第1の格子点の写像関係を示す動きモデルを規定するパラメータである第1の動きパラメータを数値解析により推定する動きパラメータ推定部と、
推定された前記第1の動きパラメータによって定まる前記対象画像上の点および前記参照画像上の点の間の前記ポテンシャルエネルギーが最小になるように前記第1の動きパラメータを修正する動きパラメータ修正部と、
修正された前記第1の動きパラメータから、前記ラベルに対応する領域内の各第2の格子点に対して最適な前記第1の動きパラメータである第2の動きパラメータを決定し、決定された前記第2の動きパラメータを、前記ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当て部と、
割り当てられた前記第2の動きパラメータと前記第1の解法処理部による解法処理の結果とに基づいて、前記第1の運動方程式を補正する補正項を算出する補正項計算部と、
前記第1の運動方程式に前記補正項を加えた前記各第2の格子点に関する第2の運動方程式を数値解析により解法処理を行う第2の解法処理部と
前記第2の解法処理部による解法処理の結果から前記対象画像と前記参照画像との対応関係を求めるマッピング処理部と、
を備えたことを特徴とする画像マッチング装置。 An image matching device for obtaining a correspondence between a target image and a reference image,
There is an image correlation between each of the plurality of first grid points on the target image and each of the plurality of second grid points corresponding to the first grid points on the reference image. Based on the potential energy gradient based on the position of each second grid point and the position of each first grid point corresponding to the second grid point. An image energy force calculator for calculating the image energy force received by the grid points;
An elastic energy force calculator that calculates a first elastic energy force received from elastic energy between each second lattice point and another second lattice point adjacent to the second lattice point;
A friction force calculator for calculating a friction force acting on each of the second lattice points;
A first solution processing unit that solves the first equation of motion related to each second lattice point by the image energy force, the first elastic energy force, and the friction force by numerical analysis;
A motion clustering processing unit that divides the reference image into a plurality of regions and assigns a label for identifying the region to each of the divided regions, as a result of the solution processing by the first solution processing unit;
A motion parameter estimator that estimates, by numerical analysis, a first motion parameter that is a parameter that defines a motion model indicating a mapping relationship between the second lattice point and the first lattice point in the region to which the label is assigned; ,
A motion parameter correction unit that corrects the first motion parameter so that the potential energy between the point on the target image and the point on the reference image determined by the estimated first motion parameter is minimized; ,
From the corrected first motion parameter, a second motion parameter that is the first motion parameter optimal for each second grid point in the region corresponding to the label is determined and determined. A motion parameter assigning unit that assigns the second motion parameter to each second grid point in the region corresponding to the label;
A correction term calculation unit that calculates a correction term for correcting the first equation of motion based on the assigned second motion parameter and the result of the solution processing by the first solution processing unit;
A second solution processing unit that solves the second equation of motion relating to each of the second lattice points obtained by adding the correction term to the first equation of motion by numerical analysis; and a solution by the second solution processing unit A mapping processing unit for obtaining a correspondence relationship between the target image and the reference image from a processing result;
An image matching apparatus comprising:
前記第2の解法処理部は、前記画像エネルギー力と前記第2の弾性エネルギー力と前記摩擦力と前記補正項とによる前記第2の運動方程式を数値解析により解法処理を行うことを特徴とする請求項1に記載の画像マッチング装置。 The elastic energy force calculation unit further receives a first energy received from an elastic energy between the second lattice point and the third lattice point after the movement of the second lattice point determined by the second motion parameter. Calculate the elastic energy force of 2,
The second solution processing unit performs solution processing by numerical analysis on the second equation of motion based on the image energy force, the second elastic energy force, the friction force, and the correction term. The image matching apparatus according to claim 1.
前記動きパラメータ割り当て部は、前記第2の格子点が前記オクルージョン領域に含まれる場合に、前記オクルージョン領域に含まない前記第2の格子点に対してのみ前記第2の動きパラメータを割り当てることを特徴とする請求項1に記載の画像マッチング装置。 An occlusion detection unit that detects an occlusion region that is present in the target image but is not present in the reference image;
The motion parameter assignment unit assigns the second motion parameter only to the second lattice point not included in the occlusion region when the second lattice point is included in the occlusion region. The image matching apparatus according to claim 1.
前記対象画像上の複数の第1の格子点の各々と前記参照画像上で当該第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーを計算するとともに、前記各第2の格子点の位置と当該第2の格子点に対応する前記各第1の格子点の位置とに基づいて前記ポテンシャルエネルギーの勾配により前記第2の格子点が受ける画像エネルギー力を計算する画像エネルギー力計算ステップと、
前記各第2の格子点と当該第2の格子点に隣接する他の第2の格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する弾性エネルギー力計算ステップと、
前記各第2の格子点に作用する摩擦力を計算する摩擦力計算ステップと、
前記画像エネルギー力と前記第1の弾性エネルギー力と前記摩擦力とによる前記各第2の格子点に関する第1の運動方程式を数値解析により解法処理を行う第1の解法処理ステップと、
前記第1の解法処理ステップによる解法処理の結果から、前記参照画像を複数の領域に分割して、分割した領域ごとに領域を識別するラベルを割り当てる動きクラスタリング処理ステップと、
前記ラベルが割り当てられた領域における前記第2の格子点と前記第1の格子点の写像関係を示す動きモデルを規定するパラメータである第1の動きパラメータを数値解析により推定する動きパラメータ推定ステップと、
推定された前記第1の動きパラメータによって定まる前記対象画像上の点および前記参照画像上の点の間の前記ポテンシャルエネルギーが最小になるように前記第1の動きパラメータを修正する動きパラメータ修正ステップと、
前記修正された前記第1の動きパラメータから、前記ラベルに対応する領域内の各第2の格子点に対して最適な前記第1の動きパラメータである第2の動きパラメータを決定し、決定された前記第2の動きパラメータを、前記ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当てステップと、
割り当てられた前記第2の動きパラメータと前記第1の解法処理ステップによる解法処理の結果とに基づいて、前記第1の運動方程式を補正する補正項を算出する補正項計算ステップと、
前記第1の運動方程式に前記補正項を加えた前記各第2の格子点に関する第2の運動方程式を数値解析により解法処理を行う第2の解法処理ステップと
前記第2の解法処理ステップによる解法処理の結果から前記対象画像と前記参照画像との対応関係を求めるマッピング処理ステップと、
を含むことを特徴とする画像マッチング方法。 An image matching method for obtaining a correspondence between a target image and a reference image,
There is an image correlation between each of the plurality of first grid points on the target image and each of the plurality of second grid points corresponding to the first grid points on the reference image. Based on the potential energy gradient based on the position of each second grid point and the position of each first grid point corresponding to the second grid point. An image energy force calculation step for calculating the image energy force received by the grid points;
An elastic energy force calculation step of calculating a first elastic energy force received from elastic energy between each of the second lattice points and another second lattice point adjacent to the second lattice point;
A friction force calculating step for calculating a friction force acting on each of the second grid points;
A first solution processing step of performing a solution process by numerical analysis of the first equation of motion related to each of the second lattice points by the image energy force, the first elastic energy force, and the friction force;
From the result of the solution processing by the first solution processing step, a motion clustering step of dividing the reference image into a plurality of regions and assigning a label for identifying the region for each divided region;
A motion parameter estimation step of estimating, by numerical analysis, a first motion parameter that is a parameter that defines a motion model indicating a mapping relationship between the second lattice point and the first lattice point in the region to which the label is assigned; ,
A motion parameter correcting step of correcting the first motion parameter so that the potential energy between the point on the target image and the point on the reference image determined by the estimated first motion parameter is minimized; ,
From the modified first motion parameter, a second motion parameter that is the first motion parameter optimum for each second grid point in the region corresponding to the label is determined and determined. A motion parameter assigning step for assigning the second motion parameter to each second grid point in the region corresponding to the label;
A correction term calculation step for calculating a correction term for correcting the first equation of motion based on the assigned second motion parameter and the result of the solution processing by the first solution processing step;
A second solution processing step for solving the second motion equation relating to each of the second lattice points obtained by adding the correction term to the first motion equation by numerical analysis; and a solution by the second solution processing step A mapping processing step for obtaining a correspondence relationship between the target image and the reference image from a processing result;
An image matching method comprising:
前記対象画像上の複数の第1の格子点の各々と前記参照画像上で当該第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーを計算するとともに、前記各第2の格子点の位置と当該第2の格子点に対応する前記各第1の格子点の位置とに基づいて前記ポテンシャルエネルギーの勾配により前記第2の格子点が受ける画像エネルギー力を計算する画像エネルギー力計算ステップと、
前記各第2の格子点と当該第2の格子点に隣接する他の第2の格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する弾性エネルギー力計算ステップと、
前記各第2の格子点に作用する摩擦力を計算する摩擦力計算ステップと、
前記画像エネルギー力と前記第1の弾性エネルギー力と前記摩擦力とによる前記各第2の格子点に関する第1の運動方程式を数値解析により解法処理を行う第1の解法処理ステップと、
前記第1の解法処理ステップによる解法処理の結果から、前記参照画像を複数の領域に分割して、分割した領域ごとに領域を識別するラベルを割り当てる動きクラスタリング処理ステップと、
前記ラベルが割り当てられた領域における前記第2の格子点と前記第1の格子点の写像関係を示す動きモデルを規定するパラメータである第1の動きパラメータを数値解析により推定する動きパラメータ推定ステップと、
推定された前記第1の動きパラメータによって定まる前記対象画像上の点および前記参照画像上の点の間の前記ポテンシャルエネルギーが最小になるように前記第1の動きパラメータを修正する動きパラメータ修正ステップと、
前記修正された前記第1の動きパラメータから、前記ラベルに対応する領域内の各第2の格子点に対して最適な前記第1の動きパラメータである前記第2の動きパラメータを決定し、決定された前記第2の動きパラメータを、前記ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当てステップと、
割り当てられた前記第2の動きパラメータと前記第1の解法処理ステップによる解法処理の結果とに基づいて、前記第1の運動方程式を補正する補正項を算出する補正項計算ステップと、
前記第1の運動方程式に前記補正項を加えた前記各第2の格子点に関する第2の運動方程式を数値解析により解法処理を行う第2の解法処理ステップと
前記第2の解法処理ステップによる解法処理の結果から前記対象画像と前記参照画像との対応関係を求めるマッピング処理ステップと、
をコンピュータに実行させる画像マッチングプログラム。 An image matching program for obtaining a correspondence between a target image and a reference image,
There is an image correlation between each of the plurality of first grid points on the target image and each of the plurality of second grid points corresponding to the first grid points on the reference image. Based on the potential energy gradient based on the position of each second grid point and the position of each first grid point corresponding to the second grid point. An image energy force calculation step for calculating the image energy force received by the grid points;
An elastic energy force calculation step of calculating a first elastic energy force received from elastic energy between each of the second lattice points and another second lattice point adjacent to the second lattice point;
A friction force calculating step for calculating a friction force acting on each of the second grid points;
A first solution processing step of performing a solution process by numerical analysis of the first equation of motion related to each of the second lattice points by the image energy force, the first elastic energy force, and the friction force;
From the result of the solution processing by the first solution processing step, a motion clustering step of dividing the reference image into a plurality of regions and assigning a label for identifying the region for each divided region;
A motion parameter estimation step of estimating, by numerical analysis, a first motion parameter that is a parameter that defines a motion model indicating a mapping relationship between the second lattice point and the first lattice point in the region to which the label is assigned; ,
A motion parameter correcting step of correcting the first motion parameter so that the potential energy between the point on the target image and the point on the reference image determined by the estimated first motion parameter is minimized; ,
Determining, from the modified first motion parameter, the second motion parameter that is the first motion parameter optimal for each second grid point in the region corresponding to the label; Assigning said second motion parameter to each second grid point in the region corresponding to said label;
A correction term calculation step for calculating a correction term for correcting the first equation of motion based on the assigned second motion parameter and the result of the solution processing by the first solution processing step;
A second solution processing step for solving the second motion equation relating to each of the second lattice points obtained by adding the correction term to the first motion equation by numerical analysis; and a solution by the second solution processing step A mapping processing step for obtaining a correspondence relationship between the target image and the reference image from a processing result;
Matching program that makes computer execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006083761A JP2007257518A (en) | 2006-03-24 | 2006-03-24 | Image matching device, image matching method and image matching program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006083761A JP2007257518A (en) | 2006-03-24 | 2006-03-24 | Image matching device, image matching method and image matching program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007257518A true JP2007257518A (en) | 2007-10-04 |
Family
ID=38631667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006083761A Abandoned JP2007257518A (en) | 2006-03-24 | 2006-03-24 | Image matching device, image matching method and image matching program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007257518A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012048593A (en) * | 2010-08-30 | 2012-03-08 | Juki Corp | Image processing system |
CN103729849A (en) * | 2013-12-31 | 2014-04-16 | 南京航空航天大学 | Method for calculating digital image morphing initial value |
-
2006
- 2006-03-24 JP JP2006083761A patent/JP2007257518A/en not_active Abandoned
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012048593A (en) * | 2010-08-30 | 2012-03-08 | Juki Corp | Image processing system |
CN103729849A (en) * | 2013-12-31 | 2014-04-16 | 南京航空航天大学 | Method for calculating digital image morphing initial value |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7440619B2 (en) | Image matching method and image interpolation method using the same | |
JP5777311B2 (en) | How to generate high-resolution video from low-resolution video | |
US9697614B2 (en) | Method for segmenting and tracking content in videos using low-dimensional subspaces and sparse vectors | |
US20230134967A1 (en) | Method for recognizing activities using separate spatial and temporal attention weights | |
CN109598735A (en) | Method using the target object in Markov D-chain trace and segmented image and the equipment using this method | |
WO2011086889A1 (en) | Feature point selection system, feature point selection method and feature point selection program | |
JP2002525735A (en) | Tracking semantic objects in vector image sequences | |
JP6620882B2 (en) | Pattern recognition apparatus, method and program using domain adaptation | |
Li et al. | Refinement of LiDAR point clouds using a super voxel based approach | |
CN108335327B (en) | Camera attitude estimation method and camera attitude estimation device | |
JP4271115B2 (en) | Image matching apparatus, image matching method, and image matching program | |
JP4398919B2 (en) | Image matching apparatus, image matching method, and image matching program | |
JP2008084076A (en) | Image processor, method, and program | |
US8180167B2 (en) | Model-based error resilience in data communication | |
JP2007257518A (en) | Image matching device, image matching method and image matching program | |
JP3716455B2 (en) | Region extraction method and region extraction device | |
JP7472471B2 (en) | Estimation system, estimation device, and estimation method | |
KR101781942B1 (en) | Method of holl-filling, recording medium and apparatus for performing the method | |
KR20080066486A (en) | Apparatus and method for estimating motion vector | |
Einbeck et al. | Representing complex data using localized principal components with application to astronomical data | |
Kemp et al. | Multi-modal tracking using texture changes | |
KR20210092672A (en) | Method and apparatus for tracking target | |
JP6663838B2 (en) | Normal estimation device, normal estimation method, and normal estimation program | |
JPH07334690A (en) | Tracking method for contour of object | |
Kardoost et al. | Object segmentation tracking from generic video cues |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070926 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20090331 |