JP2007257518A - Image matching device, image matching method and image matching program - Google Patents

Image matching device, image matching method and image matching program Download PDF

Info

Publication number
JP2007257518A
JP2007257518A JP2006083761A JP2006083761A JP2007257518A JP 2007257518 A JP2007257518 A JP 2007257518A JP 2006083761 A JP2006083761 A JP 2006083761A JP 2006083761 A JP2006083761 A JP 2006083761A JP 2007257518 A JP2007257518 A JP 2007257518A
Authority
JP
Japan
Prior art keywords
motion
image
motion parameter
point
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2006083761A
Other languages
Japanese (ja)
Inventor
Sunao Mishima
直 三島
Takeshi Ito
伊藤  剛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006083761A priority Critical patent/JP2007257518A/en
Publication of JP2007257518A publication Critical patent/JP2007257518A/en
Abandoned legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image matching device, an image matching method and an image matching program, capable of performing higher-accuracy image matching. <P>SOLUTION: This image matching device has: a movement clustering processing part 109 allocating a label to each area obtained by dividing a reference image; a movement parameter estimation part 110 estimating a first movement parameter of a movement model; a movement parameter correction part 113 correcting the first movement parameter such that potential energy between a point on the reference image and a point on a target image decided by the first movement parameter becomes minimum; a movement parameter allocation part 111 determining a second movement parameter from the first movement parameter, and allocating it to each second lattice point inside the area corresponding to the label; a correction item calculation part 112 calculating a correction item from the second movement parameter and a solution processing result of a first motion equation; and a second solution processing part 108 performing solution processing of a second motion equation wherein the correction item is added to the first motion equation. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、対象画像と参照画像の2つの画像からそれぞれの対応点を検出して対応付ける画像マッチング装置、画像マッチング方法および画像マッチングプログラムに関する。   The present invention relates to an image matching apparatus, an image matching method, and an image matching program that detect and associate corresponding points from two images of a target image and a reference image.

一つの対象画像から他方の参照画像の各画素それぞれの対応点を検出して対応関係を求める画像マッチング技術は、例えば、動画像における動き検出、ステレオマッチング、画像モーフィング、画像認識、動画像符号化等の画像処理技術の分野において利用されている。   Image matching technology that detects the corresponding point of each pixel of the other reference image from one target image and obtains the corresponding relationship includes, for example, motion detection in moving images, stereo matching, image morphing, image recognition, and moving image coding Are used in the field of image processing technology.

このような画像マッチング技術としては、オプティカルフロー手法、ブロックベース手法、勾配法、ベイジアンメソッドという主として4種類に分類することができる(例えば、非特許文献1参照)。   Such image matching techniques can be classified into four main types: an optical flow method, a block-based method, a gradient method, and a Bayesian method (see, for example, Non-Patent Document 1).

オプティカルフロー手法は、「輝度の変化は一定である」というオプティカルフロー式を導出しそのオプティカルフロー式を拘束条件としてフローを求めるものである。ブロックベース手法は、画像を所定のブロックに分割し、ブロック毎のテンプレートマッチングによって動きを求める手法である。勾配法は、画像の輝度勾配が減少する方向にマッチングをおこなう手法である。ベイジアンメソッドは、確率的に尤もらしいマッチングを求める手法である。   The optical flow method derives an optical flow equation that “a change in luminance is constant” and obtains a flow using the optical flow equation as a constraint. The block-based method is a method in which an image is divided into predetermined blocks and a motion is obtained by template matching for each block. The gradient method is a method for performing matching in a direction in which the luminance gradient of an image decreases. The Bayesian method is a technique for obtaining matching that is probabilistically plausible.

また、従来の画像マッチング技術として、複数の多重解像度フィルタを用い、複数の多重解像度画像ピラミッドを生成し、生成された画像ピラミッドを上位の階層から下位の階層に順にマッチング処理を行うことによって、大きな動きから小さな動きまで画像の対応付けを行えるロバスト性の高い画像マッチング技術がある(例えば、特許文献1参照)。   In addition, as a conventional image matching technique, a plurality of multi-resolution image pyramids are generated using a plurality of multi-resolution filters, and the generated image pyramids are sequentially matched from the upper layer to the lower layer, thereby performing a large process. There is an image matching technique with high robustness capable of associating images from movement to small movement (see, for example, Patent Document 1).

A.MuratTekalp,“DigitalVideoProcessing”,PrenticeHall,1995A. MuratTekalp, “Digital Video Processing”, Prentice Hall, 1995 特許第2927350号公報Japanese Patent No. 2927350

しかしながら、このような従来の画像マッチング技術には次のような問題がある。オプティカルフロー手法では、ノイズに敏感で速い動きに対応することが本質的に困難であるという問題があり、ブロックベースの手法では、画像の中のブロック毎に画像マッチングを行っているので、画像中のオブジェクトの平行移動などの動きには高い信頼性を有するが、画像中のオブジェクトが変形したり、回転する等の動きに対して本質的に対応することが難しいという問題がある。勾配法では、画像の輝度勾配が減少する方向にマッチングを行うため、安定してオブジェクトの動きを探索することが困難であるという問題がある。ベイジアンメソッドでは、大域的最適点の求め方が困難であるという問題がある。   However, such a conventional image matching technique has the following problems. The optical flow method has a problem that it is sensitive to noise and it is inherently difficult to cope with fast movement. In the block-based method, image matching is performed for each block in the image. However, there is a problem that it is difficult to essentially cope with the movement of the object in the image such as deformation or rotation. In the gradient method, since matching is performed in a direction in which the luminance gradient of the image decreases, there is a problem that it is difficult to stably search for the movement of the object. The Bayesian method has a problem that it is difficult to obtain a global optimum.

一方、特許文献1に開示された技術では、原理的に複数の多重解像度フィルタを用い、多重解像度画像ピラミッドの最上位階層から最下位階層までのマッチング処理を行っているが、基本的には局所的な最適化処理であり大域的に最適になるとは限らない。   On the other hand, in the technique disclosed in Patent Document 1, in principle, a plurality of multi-resolution filters are used to perform matching processing from the highest layer to the lowest layer of the multi-resolution image pyramid. It is a typical optimization process and is not necessarily optimized globally.

本発明は、上記に鑑みてなされたものであって、より高精度な画像マッチングを行うことができる画像マッチング装置、画像マッチング方法および画像マッチングプログラムを提供することを目的とする。   The present invention has been made in view of the above, and an object thereof is to provide an image matching apparatus, an image matching method, and an image matching program capable of performing image matching with higher accuracy.

上述した課題を解決し、目的を達成するために、本発明は、対象画像と参照画像との間の対応関係を求める画像マッチング装置であって、前記対象画像上の複数の第1の格子点の各々と前記参照画像上で当該第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーを計算するとともに、前記各第2の格子点の位置と当該第2の格子点に対応する前記各第1の格子点の位置とに基づいて前記ポテンシャルエネルギーの勾配により前記第2の格子点が受ける画像エネルギー力を計算する画像エネルギー力計算部と、前記各第2の格子点と当該第2の格子点に隣接する他の第2の格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する弾性エネルギー力計算部と、前記各第2の格子点に作用する摩擦力を計算する摩擦力計算部と、前記画像エネルギー力と前記第1の弾性エネルギー力と前記摩擦力とによる前記各第2の格子点に関する第1の運動方程式を数値解析により解法処理を行う第1の解法処理部と、前記第1の解法処理部による解法処理の結果から、前記参照画像を複数の領域に分割して、分割した領域ごとに領域を識別するラベルを割り当てる動きクラスタリング処理部と、前記ラベルが割り当てられた領域における前記第2の格子点と前記第1の格子点の写像関係を示す動きモデルを規定するパラメータである第1の動きパラメータを数値解析により推定する動きパラメータ推定部と、推定された前記第1の動きパラメータによって定まる前記対象画像上の点および前記参照画像上の点の間の前記ポテンシャルエネルギーが最小になるように前記第1の動きパラメータを修正する動きパラメータ修正部と、修正された前記第1の動きパラメータから、前記ラベルに対応する領域内の各第2の格子点に対して最適な前記第1の動きパラメータである第2の動きパラメータを決定し、決定された前記第2の動きパラメータを、前記ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当て部と、割り当てられた前記第2の動きパラメータと前記第1の解法処理部による解法処理の結果とに基づいて、前記第1の運動方程式を補正する補正項を算出する補正項計算部と、前記第1の運動方程式に前記補正項を加えた前記各第2の格子点に関する第2の運動方程式を数値解析により解法処理を行う第2の解法処理部と、前記第2の解法処理部による解法処理の結果から前記対象画像と前記参照画像との対応関係を求めるマッピング処理部と、を備えたことを特徴とする。   In order to solve the above-described problems and achieve the object, the present invention is an image matching device for obtaining a correspondence relationship between a target image and a reference image, and a plurality of first lattice points on the target image. And a potential energy based on the correlation of the image between each of the second grid points corresponding to the first grid point on the reference image on a one-to-one basis, The image energy for calculating the image energy force received by the second lattice point by the gradient of the potential energy based on the position of the lattice point and the position of the first lattice point corresponding to the second lattice point Elastic energy force calculation for calculating a first elastic energy force received from an elastic energy between the force calculation unit and each second lattice point and another second lattice point adjacent to the second lattice point And A frictional force calculation unit for calculating a frictional force acting on each second lattice point, and a first relating to each second lattice point by the image energy force, the first elastic energy force, and the frictional force. A first solution processing unit that solves the equation of motion by numerical analysis, and a result of the solution processing by the first solution processing unit, the reference image is divided into a plurality of regions, and each region is divided into regions. A clustering processing unit for assigning a label for identifying the first motion, and a first motion which is a parameter for defining a motion model indicating a mapping relation between the second lattice point and the first lattice point in the region to which the label is assigned Between a point on the target image and a point on the reference image determined by the estimated first motion parameter and a motion parameter estimation unit that estimates a parameter by numerical analysis A motion parameter correcting unit that corrects the first motion parameter so that the potential energy is minimized, and the second lattice point in the region corresponding to the label from the corrected first motion parameter. A second motion parameter that is the first motion parameter that is optimal for the second motion parameter is determined, and the determined second motion parameter is assigned to each second grid point in the region corresponding to the label. Correction term calculation for calculating a correction term for correcting the first equation of motion based on a motion parameter assignment unit, the assigned second motion parameter, and a result of the solution processing by the first solution processing unit And second solution processing for solving the second motion equation relating to each of the second lattice points obtained by adding the correction term to the first motion equation by numerical analysis And a mapping processing unit for obtaining a correspondence relationship between the target image and the reference image from a result of the solution processing by the second solution processing unit.

また、本発明は、上記画像マッチング装置で実行することができる画像マッチング方法および画像マッチングプログラムである。   The present invention also provides an image matching method and an image matching program that can be executed by the image matching apparatus.

本発明によれば、参照画像を複数の領域に分割して領域ごとに、第2の格子点の動きを規定した動きモデルを分類するための第1の動きパラメータの最適な動きパラメータである第2の動きパラメータを求めて、動きモデルを示す運動方程式の数値解析による解法処理を行って、対象画像と前記参照画像との対応関係を求めているので、領域境界の不連続性と領域内の一様性をロバストに表現できるようになり、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができるという効果を奏する。   According to the present invention, the reference image is divided into a plurality of regions, and the first motion parameter is the optimal motion parameter for classifying the motion model that defines the motion of the second grid point for each region. 2 motion parameters are obtained and solution processing is performed by numerical analysis of the equation of motion indicating the motion model to obtain the correspondence between the target image and the reference image. Uniformity can be expressed robustly, more accurate image matching can be performed, and as a result, an interpolated frame with higher image quality can be generated.

以下に添付図面を参照して、この発明にかかる画像マッチング装置、画像マッチング方法および画像マッチングプログラムの最良な実施の形態を詳細に説明する。   Exemplary embodiments of an image matching apparatus, an image matching method, and an image matching program according to the present invention are explained in detail below with reference to the accompanying drawings.

なお、以下の実施の形態にかかる画像マッチング装置は、動画像の動き補償を行って補償画像を生成する動き補償装置に適用する他、ステレオマッチング、画像モーフィング、
画像認識、動画像符号化等の画像処理技術に適用することもできる。
The image matching apparatus according to the following embodiment is applied to a motion compensation apparatus that generates a compensated image by performing motion compensation of a moving image, stereo matching, image morphing,
The present invention can also be applied to image processing techniques such as image recognition and moving image encoding.

(実施の形態1)
図1は、実施の形態1にかかる画像マッチング装置の構成を示すブロック図である。本実施の形態にかかる画像マッチング装置100は、図1に示すように、第1解法処理部101と、画像エネルギー力計算部103と、弾性エネルギー力計算部104と、摩擦力計算部105と、第2解法処理部108と、動きクラスタリング処理部109と、動きパラメータ推定部110と、動きパラメータ修正部113と、動きパラメー割り当て部111と、補正項計算部112と、マッピング処理部107と、フレームメモリ106とを主に備えている。
(Embodiment 1)
FIG. 1 is a block diagram illustrating a configuration of the image matching apparatus according to the first embodiment. As shown in FIG. 1, the image matching apparatus 100 according to the present embodiment includes a first solution processing unit 101, an image energy force calculation unit 103, an elastic energy force calculation unit 104, a friction force calculation unit 105, Second solution processing unit 108, motion clustering processing unit 109, motion parameter estimation unit 110, motion parameter correction unit 113, motion parameter allocation unit 111, correction term calculation unit 112, mapping processing unit 107, frame A memory 106 is mainly provided.

実施の形態1にかかる画像マッチング装置100では、対象画像および参照画像のそれぞれを所定の格子状に分割した各格子点を力学上の質点として扱い、対象画像の第1の格子点と第1の格子点に1対1に対応する参照画像の第2の格子点が画像の相関関係に基づいたポテンシャルエネルギーを考え、第1の格子点と第2の格子点の位置に基づいたポテンシャルエネルギーの勾配によって第2の格子点が受ける画像エネルギー力と、第2の格子点に隣接する格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力と、第2の格子点に生じる摩擦力とによる第2の格子点に関する第1の運動方程式を画像マッチング状態遷移モデルとして、この運動方程式に対して解法処理を行い、第2の格子点の平衡状態を求め、局所的な動きを求める。   In the image matching device 100 according to the first embodiment, each lattice point obtained by dividing each of the target image and the reference image into a predetermined lattice shape is treated as a dynamic mass point, and the first lattice point and the first lattice point of the target image are processed. Considering the potential energy based on the correlation between the second grid points of the reference image corresponding to the grid points one-to-one, the gradient of the potential energy based on the positions of the first and second grid points By the image energy force received by the second grid point, the first elastic energy force received from the elastic energy between the grid points adjacent to the second grid point, and the frictional force generated at the second grid point Using the first equation of motion related to the second lattice point as an image matching state transition model, a solution process is performed on this equation of motion, the equilibrium state of the second lattice point is obtained, and the local motion is determined. Mel.

更に本実施の形態にかかる画像マッチング装置100では、複数個のパラメータ(動きパラメータ)によって写像関係を規定するパラメトリック動きモデルを導入している。すなわち、参照画像の画面内のすべての格子点の動き(第1の格子点との写像関係)が有限個のパラメトリック動きモデルによって決定されると仮定し、参照画像の画面を複数個の領域にクラスタリング(分割)し、動きモデルを規定するパラメータである動きパラメータを推定して、領域内の第2の格子点に最適の動きパラメータを割り当てる。そして、第1の運動方程式の解法処理結果である局所的な動きと、上記動きモデルによる動きとのずれを補正する力を補正項として第1の運動方程式に導入した第2の運動方程式を解法処理することによって、局所的に動きを更新する。このような、動きモデルの動きパラメータの推定処理、動きパラメータの割り当て処理、局所的な動きの更新(第2の運動方程式の解法処理)を繰り返すことによって、画像の正確な動きを推定して、第1の格子点と第2の格子点との写像関係を求めて画像マッチングを行っている。   Furthermore, the image matching apparatus 100 according to the present embodiment introduces a parametric motion model that defines a mapping relationship by a plurality of parameters (motion parameters). That is, assuming that the movement of all grid points in the reference image screen (mapping relationship with the first grid point) is determined by a finite number of parametric motion models, the reference image screen is divided into a plurality of regions. Clustering (dividing) is performed, a motion parameter that is a parameter defining a motion model is estimated, and an optimal motion parameter is assigned to a second lattice point in the region. Then, the second motion equation introduced into the first motion equation as a correction term is used as a solution to correct the deviation between the local motion that is the solution processing result of the first motion equation and the motion based on the motion model. The motion is updated locally by processing. By repeating such motion model motion parameter estimation processing, motion parameter assignment processing, and local motion update (second motion equation solving processing), the accurate motion of the image is estimated, Image matching is performed by obtaining a mapping relationship between the first grid point and the second grid point.

第1解法処理部101は、対象画像上の複数の第1の格子点の各々と参照画像上で第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーの勾配により第2の格子点が受ける画像エネルギー力と、第2の格子点に隣接する格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力と、第2の格子点に生じる摩擦力とによる第2の格子点に関する運動方程式を、離散変数法としてのオイラー法による数値解析処理によって解法する処理部である。   The first solution processing unit 101 between each of the plurality of first grid points on the target image and each of the plurality of second grid points corresponding to the first grid points on the reference image on a one-to-one basis. An image energy force received by the second lattice point due to a gradient of potential energy based on the correlation of the images, a first elastic energy force received from elastic energy between lattice points adjacent to the second lattice point, This is a processing unit that solves the equation of motion related to the second lattice point by the frictional force generated at the two lattice points by numerical analysis processing using the Euler method as a discrete variable method.

画像エネルギー力計算部103は、第1の格子点と第2の格子点の位置に基づいた上記ポテンシャルエネルギーの勾配によって第2の格子点が受ける画像エネルギー力を計算する処理部である。   The image energy force calculation unit 103 is a processing unit that calculates the image energy force received by the second lattice point based on the gradient of the potential energy based on the positions of the first lattice point and the second lattice point.

弾性エネルギー力計算部104は、第2の格子点に隣接する格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する処理部である。摩擦力計算部105は、第2の格子点に生じる摩擦力を計算する処理部である。また、弾性エネルギー力計算部104は、後述するラベルが同一の領域における第2の格子点と最適な動きパラメータによって定められる第2の格子点の動き後の第3の格子点に関しては第2の弾性エネルギー力を計算し、ラベルが異なる領域における第2の格子点と第3の格子点に関しては、ラベルが同一の領域における第2の弾性エネルギー力よりも小さくなるように第2の弾性エネルギー力を計算する。本実施の形態では、ラベルが異なる領域における第2の格子点と第3の格子点に関して、摩擦係数を0として第2の弾性エネルギー力を0とする処理を行っている。   The elastic energy force calculation unit 104 is a processing unit that calculates a first elastic energy force received from elastic energy between lattice points adjacent to the second lattice point. The frictional force calculation unit 105 is a processing unit that calculates the frictional force generated at the second grid point. Further, the elastic energy force calculation unit 104 performs the second grid point after the movement of the second grid point determined by the optimal motion parameter and the second grid point in the region where the label described later is the same. The elastic energy force is calculated, and the second elastic energy force is calculated so that the second lattice energy point and the third lattice point in regions having different labels are smaller than the second elastic energy force in the same region. Calculate In the present embodiment, the second lattice point and the third lattice point in regions having different labels are subjected to a process of setting the friction coefficient to 0 and the second elastic energy force to 0.

動きクラスタリング処理部109は、第1解法処理部101による解法処理によって求めた局所的な動きから、クラスタリング手法により参照画像を複数の領域にクラスタリング(分割)して、分割した領域ごとに領域を識別するラベルを割り当てる処理部である。   The motion clustering processing unit 109 clusters (divides) the reference image into a plurality of regions by the clustering method from the local motion obtained by the solution processing by the first solution processing unit 101, and identifies the region for each divided region. A processing unit for assigning labels to be performed.

動きパラメータ推定部110は、ラベルが割り当てられた領域における第2の格子点と第1の格子点の写像関係を示す動きモデルを規定するパラメータである動きパラメータを数値解析により推定する。本実施の形態では、最小二乗法による数値解析を行って、動きパラメータ(第1の動きパラメータ)を推定している。   The motion parameter estimation unit 110 estimates a motion parameter, which is a parameter that defines a motion model indicating the mapping relationship between the second grid point and the first grid point, in a region to which a label is assigned by numerical analysis. In the present embodiment, the motion parameter (first motion parameter) is estimated by performing numerical analysis by the least square method.

動きパラメータ修正部113は、最急降下法により、推定した動きパラメータによって定まる対象画像上の点および参照画像上の点の間の画像の相関関係に基づくポテンシャルエネルギーが最小になるように動きパラメータを修正するものである。   The motion parameter correction unit 113 corrects the motion parameter by the steepest descent method so that the potential energy based on the image correlation between the point on the target image and the point on the reference image determined by the estimated motion parameter is minimized. To do.

動きパラメータ割り当て部111は、推定された動きパラメータから、ラベルに対応する領域内の各第2の格子点に対して最適なラベルを決定して最適な動きパラメータ(第2の動きパラメータ)を求め、この最適な動きパラメータを、ラベルに対応する領域内の各第2の格子点に対して割り当てる処理部である。   The motion parameter assignment unit 111 determines an optimum label for each second grid point in the region corresponding to the label from the estimated motion parameter, and obtains an optimum motion parameter (second motion parameter). The processing unit assigns the optimal motion parameter to each second lattice point in the region corresponding to the label.

補正項計算部112は、割り当てられた最適な動きパラメータによる動きベクトルと第1の解法処理部による解法処理の結果である動きベクトルとの差分から第1の運動方程式を補正する補正項を算出する処理部である。   The correction term calculation unit 112 calculates a correction term for correcting the first equation of motion from the difference between the motion vector based on the allocated optimal motion parameter and the motion vector that is the result of the solution processing by the first solution processing unit. It is a processing unit.

第1解法処理部108は、画像エネルギー力と、第2の格子点と最適な動きパラメータによって定められる第2の格子点の動き後の第3の格子点との間の弾性エネルギーから受ける第2の弾性エネルギー力と、摩擦力と、補正項計算部112で求めた補正項とによって第2の格子点の動きを規定した第2の運動方程式を数値解析によって解法する処理部である。   The first solution processing unit 108 receives the second energy energy from the image energy force and the elastic energy between the second lattice point and the third lattice point after the movement of the second lattice point determined by the optimum motion parameter. The processing unit solves the second equation of motion that defines the movement of the second lattice point by the numerical analysis using the elastic energy force, the frictional force, and the correction term obtained by the correction term calculation unit 112.

マッピング処理部107は、第2の解法処理部108による解法処理の結果から第2の格子点の平衡状態を求めることにより対象画像上の第1の格子点と参照画像上の第2の格子点との対応関係である写像関係を求める処理部である。   The mapping processing unit 107 obtains the equilibrium state of the second lattice point from the result of the solution processing by the second solution processing unit 108, thereby obtaining the first lattice point on the target image and the second lattice point on the reference image. It is a processing part which calculates | requires the mapping relationship which is a corresponding relationship.

フレームメモリ106は、入力された対象画像と参照画像と保存するメモリである。なお、各部の詳細な処理については後述する。   The frame memory 106 is a memory for storing the input target image and reference image. Detailed processing of each unit will be described later.

次に、本実施の形態にかかる画像マッチング装置100で導入する画像マッチング状態遷移モデルについて説明する。   Next, an image matching state transition model introduced by the image matching apparatus 100 according to the present embodiment will be described.

2次元ユークリッド空間上の点x∈E2における対象画像、参照画像の画素値をそれぞれ(1)式で示す。 The pixel values of the target image and the reference image at the point x∈E 2 on the two-dimensional Euclidean space are shown by the formula (1).

Figure 2007257518
(1)式は実数空間における連続画像モデルであり、本実施の形態ではデジタル画像を扱うため、2次元格子空間上の点n∈N2について(2)式に示す離散画像モデルを考える。
Figure 2007257518
Equation (1) is a continuous image model in real number space. In this embodiment, in order to handle digital images, a discrete image model shown in Equation (2) is considered for a point n∈N 2 on a two-dimensional lattice space.

Figure 2007257518
従って、連続画像モデルの画素値はデータ補間関数gを用いて、(3)式に示すように定義される。ここで、データ補間関数gとしては、例えば双曲形補間関数を使用することができる。
Figure 2007257518
Therefore, the pixel value of the continuous image model is defined as shown in the equation (3) using the data interpolation function g. Here, as the data interpolation function g, for example, a hyperbolic interpolation function can be used.

Figure 2007257518
本実施の形態では、対象画像から参照画像への画像マッチング問題を、対象画像上の曲面X⊂E2から参照画像上の曲面Y⊂E2への写像として求めることにする。図2は、対象画像上の曲面から参照画像上の曲面への写像を示す説明図である。図3は、対象画像上の曲面Xの点xから参照画像上の曲面Yの点yへの写像を示す説明図である。すなわち、図2および3に示すように、画像マッチングは、対象画像上の曲面Xの点が参照画像上の曲面Yのどの点に対応しているのかを表す写像を求める問題として扱う。
Figure 2007257518
In this embodiment, to obtaining an image matching problem from the target image to the reference image, as a mapping from the curved X⊂E 2 on the target image to the curved surface Y⊂E 2 on the reference image. FIG. 2 is an explanatory diagram showing mapping from the curved surface on the target image to the curved surface on the reference image. FIG. 3 is an explanatory diagram showing a mapping from a point x on the curved surface X on the target image to a point y on the curved surface Y on the reference image. That is, as shown in FIGS. 2 and 3, image matching is handled as a problem of obtaining a mapping that indicates which point of the curved surface Y on the reference image corresponds to the point of the curved surface X on the target image.

このような写像に関する条件を導出すると以下のようになる。パラメータ(u,v)を用いて、曲面X上の点をx(u,v)∈X、曲面Y上の点をy(u,v)∈Yと表し、パラメータ(u,v)と点xが同じスケールを有する場合、曲面X上の点x(u,v)は、パラメータ(u,v)によって、(4)式で表すことができる。   Deriving such a mapping condition is as follows. Using the parameter (u, v), the point on the curved surface X is represented as x (u, v) εX, the point on the curved surface Y is represented as y (u, v) εY, and the parameter (u, v) and the point are represented. When x has the same scale, the point x (u, v) on the curved surface X can be expressed by the equation (4) by the parameter (u, v).

Figure 2007257518
ここで、曲面Xから曲面Yへの求めるべき写像を(5)式で定義する。写像の対応関係は曲面X上の点xが一意に曲面Yに対応づけることができればよいので、写像gはすべての点が一意に決定する全単射とする。よって同一パラメータ(u,v)を有する点x(u,v)、y(u,v)は,(6)式を満たすことになる。
Figure 2007257518
Here, the mapping to be obtained from the curved surface X to the curved surface Y is defined by equation (5). Since the mapping relationship is sufficient if the point x on the curved surface X can be uniquely associated with the curved surface Y, the mapping g is bijection in which all points are uniquely determined. Therefore, the points x (u, v) and y (u, v) having the same parameter (u, v) satisfy the expression (6).

Figure 2007257518
このことは、すなわち、写像gについて考えることは、曲面Yそのものを考えることと同じである。一つの対象物が対象画像と参照画像に射影されて映っていると考えると、射影された対象画像上の像と参照画像上の像は、画素値が同じであると考えることができる。従って、対応づけるべき同一点の画素値が等しいと仮定すると、写像gに関して(7)式の条件式が導出される。かかる(7)式をパラメータu=(u,v)を用いて表示すると、(8)式のようになる。
Figure 2007257518
This means that thinking about the mapping g is the same as considering the curved surface Y itself. If one object is projected on the target image and the reference image, it can be considered that the projected image on the target image and the image on the reference image have the same pixel value. Therefore, assuming that the pixel values of the same point to be matched are equal, the conditional expression (7) is derived for the mapping g. When the equation (7) is displayed using the parameter u = (u, v), the equation (8) is obtained.

Figure 2007257518
従って、画像マッチング問題は、(8)式の条件式を満たす写像gを求めるという問題に帰着することになる。
Figure 2007257518
Therefore, the image matching problem results in a problem of obtaining a mapping g that satisfies the conditional expression (8).

次に、上記画像マッチング問題の解法処理について説明する。(8)式は、(9)式のように変形することができる。   Next, a solution process for the image matching problem will be described. Expression (8) can be modified like Expression (9).

Figure 2007257518
しかしながら、(9)式は、画像に含まれるノイズなどにより厳密には成立しないため、かかる式から直接写像gを求めることは困難である。このため、本実施の形態では、最小二乗法を利用している。最小二乗法によれば、(10)式に示すエネルギー関数を考え、かかるエネルギー関数の最小化を行うことによりノイズが含まれていても条件を満足する写像gを求めることができる。
Figure 2007257518
However, since the expression (9) is not strictly established due to noise included in the image, it is difficult to directly obtain the mapping g from such an expression. For this reason, the least square method is used in the present embodiment. According to the least square method, the energy function shown in the equation (10) is considered, and by minimizing the energy function, a mapping g that satisfies the condition can be obtained even if noise is included.

Figure 2007257518
大数の法則が成立する程度の標本数があれば、最小二乗法により解が安定に求まると考えられるが、本実施の形態では、標本数が一つであるため、やはりノイズの影響を受けてしまう。解を安定して求めるためには、ベイズの定理により、近傍では滑らかに変化するという事前知識により事後分布の精度を高めるアプローチ、例えば、写像gに対して構造を規定して力学的なアプローチを考える。
Figure 2007257518
If the number of samples is sufficient to satisfy the law of large numbers, the solution can be obtained stably by the least squares method. However, in this embodiment, since there is only one sample, it is still affected by noise. End up. In order to obtain a stable solution, an approach that improves the accuracy of the posterior distribution based on Bayes' theorem based on prior knowledge that it changes smoothly in the vicinity, for example, a dynamic approach by defining the structure for the mapping g Think.

写像gは全単射であるので、写像gについて考えることは、曲面Yそのものを考えることと同義である。力学的構造としては、例えば、剛体のような構造が考えられるが、画像の場合には変形等が考えられるため、剛体の構造は適切でない。そこで、本実施の形態では、曲面Yに対して、画像の変形等に対して柔軟に対応可能な弾性体の構造を導入する。   Since the mapping g is bijective, thinking about the mapping g is synonymous with considering the curved surface Y itself. As the mechanical structure, for example, a structure like a rigid body is conceivable, but in the case of an image, deformation or the like is conceivable, so that the structure of the rigid body is not appropriate. Therefore, in the present embodiment, an elastic body structure that can flexibly cope with image deformation or the like is introduced into the curved surface Y.

弾性体のエネルギーは、(11)式で示される。   The energy of the elastic body is expressed by equation (11).

Figure 2007257518
また、(10)式で示される画像エネルギーを曲面Y上の点を用いて表すと、(12)式で表される。
Figure 2007257518
Further, when the image energy represented by the equation (10) is expressed using points on the curved surface Y, it is represented by the equation (12).

Figure 2007257518
ポテンシャルエネルギーは、(12)式の画像エネルギーと(11)式の弾性エネルギーの線形結合により(13)式のように定義される。
Figure 2007257518
The potential energy is defined as in equation (13) by linear combination of image energy in equation (12) and elastic energy in equation (11).

Figure 2007257518
このポテンシャルエネルギーを最小にすることは、画像マッチングの条件式である(7)式をできるだけ満たすように、かつ弾性体としての安定形態が取れるような曲面Yを探索することを意味する。このことをエネルギー最小化問題として定式化すると(14)式で表される。
Figure 2007257518
Minimizing this potential energy means searching for a curved surface Y that satisfies Equation (7), which is a conditional expression for image matching, as much as possible and that can take a stable form as an elastic body. When this is formulated as an energy minimization problem, it is expressed by equation (14).

Figure 2007257518
従って、条件式(7)式を満たす写像gを求める画像マッチング問題は、エネルギー最小化問題の(14)式を解法することに帰着する。
Figure 2007257518
Therefore, the image matching problem for obtaining the mapping g that satisfies the conditional expression (7) results in solving the expression (14) of the energy minimization problem.

また(14)式より最適性の必要条件は、(15)式で求めることができる。   Further, the necessary condition for optimality can be obtained from the equation (15) from the equation (14).

Figure 2007257518
従来の手法では、この最適性必要条件の(15)式を満たすような曲面Y上の点yを求めることにより解法している。これらは静的なエネルギーの最小化であり、静的な釣り合いの位置を求める静的な最適化である。図4は、ポテンシャルエネルギーの最小化の点を探索する場合の静的な最適点の説明をするための模式図である。図4に示すように、静的な最適化では初期値に最も近い位置で質点のポテンシャルエネルギーの局所最適点(釣り合い位置)が求まる。従って、この局所最適点が大域的な最適点になるかどうかは初期値に依存することになる。言い換えれば、初期値の選定が好ましくない場合には、大域的に最適な点が得られない場合がある。
Figure 2007257518
In the conventional method, the solution is obtained by obtaining a point y on the curved surface Y that satisfies the equation (15) of the optimality requirement. These are static energy minimizations and static optimizations that determine the position of the static balance. FIG. 4 is a schematic diagram for explaining a static optimum point when searching for a potential energy minimizing point. As shown in FIG. 4, in the static optimization, the local optimum point (balance position) of the potential energy of the mass point is obtained at the position closest to the initial value. Therefore, whether or not this local optimum point becomes a global optimum point depends on the initial value. In other words, when the selection of the initial value is not preferable, a globally optimum point may not be obtained.

このため、大域的な最適点を求めて(14)式を解法するため、本実施の形態では、対象画像および参照画像上の曲面を格子状に分割して分割した各格子点を質点と考え、参照画像上の曲面Yの格子点(質点)における運動エネルギーを導入し、大域的な最適化を行っている。すなわち、曲面Yに対して時間軸を導入し、曲面Yが時間に応じて変形できるような構造とし、曲面に対して運動の構造を適用する。図5は、ポテンシャルエネルギーの最小化の点を探索する場合の大域的な最適点の説明をするための模式図である。図5に示すように、運動エネルギーの導入により、最初のポテンシャルエネルギーが運動エネルギーに変換されるため、格子点(質点)が局所最適点からさらに広い範囲で(15)式を満たす大域的な最適点を探索することができる。これにより、静的な最適化よりもより広い範囲を探索できるので、初期値への依存性が低くなり、ノイズ等の影響に対してよりロバストになる可能性がある。   Therefore, in order to find a global optimum point and solve the equation (14), in this embodiment, each lattice point obtained by dividing the target image and the curved surface on the reference image into a lattice shape is considered as a mass point. The kinetic energy at the lattice point (mass point) of the curved surface Y on the reference image is introduced to perform global optimization. In other words, a time axis is introduced to the curved surface Y so that the curved surface Y can be deformed according to time, and a structure of motion is applied to the curved surface. FIG. 5 is a schematic diagram for explaining a global optimum point when searching for a potential energy minimizing point. As shown in FIG. 5, since the initial potential energy is converted into kinetic energy by the introduction of kinetic energy, the global optimality satisfying Eq. (15) in a wider range from the local optimal point to the lattice point (mass point). You can search for points. As a result, a wider range can be searched than in the static optimization, so that the dependency on the initial value is lowered, and there is a possibility that it is more robust against the influence of noise and the like.

次に、(15)式の大域的最適化のための運動方程式の導入について説明する。まず、運動方程式に導入する時間τを用いて曲面Y上の点yを(16)式のように拡張する。(16)式で表した曲面Y上の点yの全微分は(17)式となるが、パラメータ(u,v)Tは時間τに対して独立であると仮定すると、(18)式が成立するので、結局(17)式は(19)式で表現される。また、(19)式から曲面Y上の点yの2階微分は(20)式で表される。(19)式で示される曲面Y上の点yの全微分と(20)式で示される2階微分をそれぞれ(21)式で表現する。 Next, introduction of an equation of motion for global optimization of equation (15) will be described. First, the point y on the curved surface Y is expanded as shown in Equation (16) using the time τ introduced into the equation of motion. The total differentiation of the point y on the curved surface Y expressed by the equation (16) is the equation (17), but assuming that the parameter (u, v) T is independent of the time τ, the equation (18) is Since this holds, equation (17) is eventually expressed by equation (19). Further, the second derivative of the point y on the curved surface Y from the equation (19) is expressed by the equation (20). The total differentiation of the point y on the curved surface Y shown by the equation (19) and the second order differentiation shown by the equation (20) are expressed by the equation (21), respectively.

Figure 2007257518
(19)式は、曲面Y上の点yの速度を表し、(20)式は、曲面Y上の点yの加速度を表している。従って、曲面Y上の点yの運動エネルギーは、(22)式で定義することができる。
Figure 2007257518
Equation (19) represents the speed of the point y on the curved surface Y, and Equation (20) represents the acceleration of the point y on the curved surface Y. Therefore, the kinetic energy of the point y on the curved surface Y can be defined by equation (22).

Figure 2007257518
このような運動エネルギーを導入したことは、曲面Y上の点yを質点と考えて、曲面上の運動を定義したことになり、曲面Y上の点yの運動という力学的な構造を規定したことを意味する。かかる曲面Y上の点yの運動は運動方程式によって記述される。
Figure 2007257518
The introduction of such kinetic energy means that the point y on the curved surface Y is considered as a mass point and the motion on the curved surface is defined, and the dynamic structure of the movement of the point y on the curved surface Y is defined. Means that. The motion of the point y on the curved surface Y is described by a motion equation.

次に、ラグランジュの方法に従って次のように曲面Y上の点yの運動方程式を導出する。曲面Yは、エネルギー最小化の(14)式に従うので、ポテンシャルエネルギーUを最小にする方向に動く必要がある。ラグランジアンは(23)式で定義される。   Next, the equation of motion of the point y on the curved surface Y is derived as follows according to the Lagrange method. Since the curved surface Y follows the equation (14) for energy minimization, the curved surface Y needs to move in a direction that minimizes the potential energy U. Lagrangian is defined by equation (23).

(23)式は、位置のポテンシャルエネルギーである重力場における物体の自由落下などと同様に、物体は重力場を最小化するように落下することを意味している。ラグランジュ方程式は(24)式で示されるので、(23)および(24)式から、曲面Y上の点yの運動方程式は、(25)式で表される。   Equation (23) means that the object falls so as to minimize the gravitational field, similar to the free fall of the object in the gravitational field that is the potential energy of the position. Since the Lagrangian equation is expressed by the equation (24), the equation of motion of the point y on the curved surface Y is expressed by the equation (25) from the equations (23) and (24).

Figure 2007257518
Figure 2007257518

Figure 2007257518
(25)式の運動方程式に従った運動は保存系であり、エネルギー保存則により解は収束しない。このため、系を非保存系にするために(26)式で示される摩擦エネルギーを導入する。
Figure 2007257518
The motion according to the equation of motion of Equation (25) is a conservation system, and the solution does not converge due to the energy conservation law. For this reason, in order to make the system non-conservative, the frictional energy represented by the equation (26) is introduced.

Figure 2007257518
(26)式で示される摩擦エネルギーを導入した場合のラグランジュ方程式は、(27)式で表される。
Figure 2007257518
The Lagrangian equation when the friction energy represented by the equation (26) is introduced is represented by the equation (27).

Figure 2007257518
この(27)式を解法することによって、摩擦エネルギーを導入した運動方程式が(28)式で得られる。
Figure 2007257518
By solving the equation (27), an equation of motion in which friction energy is introduced is obtained by the equation (28).

Figure 2007257518
次に、動的な探索、(28)式の運動方程式に従った解がエネルギー最小化の(14)式に対する最適性必要条件である(15)式を満足することについて説明する。
Figure 2007257518
Next, it will be described that the dynamic search and the solution according to the equation of motion of the equation (28) satisfy the equation (15) which is the optimum requirement for the energy minimization (14).

まず、探索が完了した場合を考える。この場合、点yは完全に停止するので、点yの速度(yの全微分)および加速度(yの2階微分)はともに0となるので、(28)式の運動方程式により(29)式となり、これにより(30)式が成立する。   First, consider the case where the search is completed. In this case, since the point y stops completely, both the velocity (total derivative of y) and acceleration (second derivative of y) of the point y are both 0, so that the equation (29) is obtained from the equation of motion (28). Thus, equation (30) is established.

Figure 2007257518
(30)式が成立することは、最適性必要条件の(15)式を満足することを意味している。従って、探索が完了した場合、そのときの点yは最適点であることがわかる。
Figure 2007257518
The fact that the expression (30) is satisfied means that the expression (15) of the optimality requirement is satisfied. Therefore, when the search is completed, it can be seen that the point y at that time is the optimum point.

次に、曲面Y上の点yが静止した場合を考える。この場合、点yの速度(yの全微分)は0となるが加速度(yの2階微分)は0にならないので、(28)式の運動方程式により(31)式が得られる。   Next, consider a case where the point y on the curved surface Y is stationary. In this case, the velocity at the point y (the total derivative of y) is 0, but the acceleration (the second derivative of y) is not 0, so that equation (31) is obtained from the equation of motion of equation (28).

Figure 2007257518
ここで、点yが最適点であると仮定すると、最適性条件の(15)式により、点yの加速度(yの2階微分)は0となり、最適点の探索が完了する。一方、点yが最適点でない場合には、点yの加速度(yの2階微分)が0とならないため、最適点の探索は完了していないことになる。すなわち、点yが静止した位置が最適点の位置である場合に(31)式により最適性必要条件の(15)式が満足することを意味している。
Figure 2007257518
Assuming that the point y is the optimum point, the acceleration of the point y (second derivative of y) becomes 0 according to the equation (15) of the optimum condition, and the search for the optimum point is completed. On the other hand, when the point y is not the optimum point, the acceleration of the point y (second-order derivative of y) does not become 0, and the optimum point search is not completed. That is, when the position where the point y is stationary is the position of the optimum point, it means that the expression (15) of the optimality requirement is satisfied by the expression (31).

次に、点yに摩擦エネルギーが作用している場合を考える。摩擦エネルギーの性質から(32)式が導かれ、これは点yの運動が停止して時間の経過により最適点の探索が完了することを意味している。   Next, consider the case where frictional energy is acting on the point y. Equation (32) is derived from the nature of the frictional energy, which means that the movement of the point y stops and the search for the optimum point is completed over time.

Figure 2007257518
このように、最適点の探索が完了した場合、点yが静止した場合、点yに摩擦エネルギーが作用している場合の上記説明により、(28)式の運動方程式に従った点yの運動が、(15)式の最適性必要条件を満足することがわかる。
Figure 2007257518
As described above, when the search for the optimum point is completed, when the point y is stationary, or when the friction energy is acting on the point y, the motion of the point y according to the equation of motion of the equation (28) However, it is understood that the optimality requirement of the equation (15) is satisfied.

一方、(15)式は1階微分の形式であるが、2階微分の最適性必要条件については、図4または5に示すポテンシャルエネルギーの山の頂点で探索が完了する場合があるため、満足されない場合がある。この場合には、ポテンシャルエネルギーの山の頂点では、最適点の探索が完了しないための条件として(33)式を仮定することにより、2階の最適性必要条件を満足することができる。この(33)式の仮定は、具体的には(34)式の条件を探索アルゴリズムで実現することにより達成することができる。   On the other hand, equation (15) is in the form of first derivative, but the optimality requirement for second derivative is satisfied because the search may be completed at the peak of the potential energy peak shown in FIG. May not be. In this case, the optimality requirement for the second floor can be satisfied by assuming the equation (33) as a condition for the search for the optimum point not to be completed at the apex of the peak of potential energy. Specifically, the assumption of equation (33) can be achieved by realizing the condition of equation (34) with a search algorithm.

以上により、(28)式の運動方程式に従った最適点の探索は(14)式で示される最適化問題に対する最適解を与えることがわかる。このような探索は、静的な探索に比べてロバストなものとなる。   From the above, it can be seen that the search for the optimum point according to the equation of motion of Equation (28) gives the optimum solution for the optimization problem shown by Equation (14). Such a search is more robust than a static search.

ここで、(28)式に示す運動方程式において、弾性エネルギーEkの中に点yおよびパラメータ(u,v)に関する偏微分が含まれているため、有限差分法によって偏微分方程式を差分方程式によって置換する。弾性エネルギーEkの右辺を有限差分法によって離散化すると、(35)式のようになる。 Here, in the equation of motion shown in the equation (28), since the partial differential with respect to the point y and the parameters (u, v) is included in the elastic energy E k , the partial differential equation is converted into the differential equation by the finite difference method. Replace. When the right side of the elastic energy E k is discretized by the finite difference method, the equation (35) is obtained.

Figure 2007257518
ここで、nは離散化されたパラメータ(u,v)の格子点、ynはnに対応する離散化されたY上の点、yn+(-1,0),yn+(1,0),yn+(0,-1),yn+(0,1)は点ynの偏微分に関連する上下左右の格子点を示している。
Figure 2007257518
Here, n is a lattice point of the discretized parameter (u, v), y n is a point on Y that is discretized corresponding to n , y n + (− 1,0) , y n + (1,0 ) , Y n + (0, -1) , y n + (0,1) indicate the upper, lower, left, and right lattice points related to the partial differentiation of the point y n .

この(35)式をynで偏微分すると(36)式が得られ、かかる式は、弾性エネルギーによって発生する力である弾性エネルギー力を示している。 The equation (35) when partially differentiated by y n (36) below is obtained and such expression shows elastic energy force is the force generated by the elastic energy.

Figure 2007257518
この弾性エネルギー力を(37)式で示し、離散パラメータΔu,Δvをそれぞれ1とすると、弾性エネルギー力は(38)式で表されることになる。
Figure 2007257518
When this elastic energy force is expressed by the equation (37) and the discrete parameters Δu and Δv are respectively 1, the elastic energy force is expressed by the equation (38).

Figure 2007257518
ここで、画像エネルギーEiは、パラメータ(u,v)に関して独立と考え、(28)式の運動方程式もそのまま離散可能となり、(39)式で表される。
Figure 2007257518
Here, the image energy E i is considered to be independent with respect to the parameters (u, v), and the equation of motion of the equation (28) can be discrete as it is, and is expressed by the equation (39).

Figure 2007257518
この(39)式の右辺第1項は、点ynにおける画像エネルギーの勾配の逆向きの力である画像エネルギー力であり、(40)式のようにおく。
Figure 2007257518
The first term on the right side of the equation (39) is an image energy force that is the force opposite to the gradient of the image energy at the point y n , and is set as in the equation (40).

Figure 2007257518
次に、この画像エネルギー力Fi(n)、すなわち画像エネルギーの勾配の計算について説明する。本実施の形態では、画像エネルギーの勾配を、局所最適化の手法によって求めている。図6および図7は、画像エネルギー力の概念を示す説明図である。ここで、画像モデルScは連続画像モデルであり、実際にはサンプリングされた画像モデルSpを利用しているため、局所最適化においてもサンプリングされた画像モデルに基づいておこなっている。
Figure 2007257518
Next, calculation of the image energy force F i (n), that is, the gradient of the image energy will be described. In this embodiment, the gradient of image energy is obtained by a local optimization technique. 6 and 7 are explanatory diagrams showing the concept of image energy force. Here, the image model S c is a continuous image model, in practice because it uses the image model S p sampled, is performed also based on the sampled image model in local optimization.

n(τ)にもっとも近いサンプリング点を局所空間中心ycとして、ycを(41)式で求める。 The sampling point closest to y n (τ) is set as the local space center y c , and y c is obtained by equation (41).

Figure 2007257518
そして、隣接空間Lを(42)式で定義する。このとき、局所探索集合Ωは、(43)式のように定義することができる。
Figure 2007257518
And the adjacent space L is defined by (42) Formula. At this time, the local search set Ω can be defined as in equation (43).

Figure 2007257518
そして、局所最適化の後、その方向へのベクトルを求め、求めたベクトルを正規化し勾配の大きさを乗算すると、画像エネルギー力として(44)〜(46)式が得られる。本実施の形態では、画像エネルギー力として(44)〜(46)式を使用している。
Figure 2007257518
Then, after local optimization, a vector in that direction is obtained, and when the obtained vector is normalized and multiplied by the magnitude of the gradient, equations (44) to (46) are obtained as image energy forces. In the present embodiment, the equations (44) to (46) are used as the image energy force.

Figure 2007257518
なお、実装上の扱いやすさ等を考慮してエネルギー関数を(47)式のように定義して、(47)式により導かれる画像エネルギー力を用いることもできる。
Figure 2007257518
It is also possible to define an energy function as shown in Equation (47) in consideration of ease of handling in mounting and the like, and use the image energy force derived from Equation (47).

Figure 2007257518
以上説明した画像エネルギーFi(n)、弾性エネルギー力Fk(n)、摩擦力を使用して、格子点yn(τ)に対する運動方程式を画像マッチング状態遷移モデルとして生成すると、運動方程式は、(48)式で表される。また、yn(0)が参照画像に等しいとし、運動エネルギーは0、すなわちyn(0)の速度が0として考えると、運動方程式の初期条件は、(49)式となる。
Figure 2007257518
Using the image energy F i (n), elastic energy force F k (n), and frictional force described above to generate the equation of motion for the lattice point y n (τ) as an image matching state transition model, the equation of motion is , (48). Further, assuming that y n (0) is equal to the reference image and the kinetic energy is 0, that is, the velocity of y n (0) is 0, the initial condition of the equation of motion is the equation (49).

Figure 2007257518
本実施の形態では、画像エネルギー力計算部103によって、(44)〜(46)式で示される画像エネルギー力Fiを計算し、弾性エネルギー力計算部104によって(38)式で示される弾性エネルギー力Fkを計算し、摩擦力計算部105によって(48)式の右辺第3項で示される摩擦力を計算する。そして、第1解法処理部101によって(48)、(49)式で示される運動方程式を数値解析処理によって解法している。
Figure 2007257518
In the present embodiment, the image energy force calculation unit 103 calculates the image energy force F i expressed by the equations (44) to (46), and the elastic energy force calculation unit 104 calculates the elastic energy expressed by the equation (38). The force Fk is calculated, and the frictional force calculation unit 105 calculates the frictional force indicated by the third term on the right side of the equation (48). The first equation processing unit 101 solves the equations of motion represented by equations (48) and (49) by numerical analysis processing.

次に、この第1解法処理部101による運動方程式の解法について説明する。(48)、(49)式で示される運動方程式、すなわち常微分方程式は、一般的に解析的に解法することができないため、この運動方程式の系が収束するのに十分大きな時間Tを考え、数値解析によってt=(0,T)区間を計算することによって運動方程式の収束状態を推定する。   Next, the solution of the equation of motion by the first solution processing unit 101 will be described. Since the equation of motion represented by the equations (48) and (49), that is, the ordinary differential equation, cannot generally be solved analytically, the time T sufficient for the system of equations of motion to converge is considered, The convergence state of the equation of motion is estimated by calculating the t = (0, T) interval by numerical analysis.

本実施の形態では、常微分方程式は初期値が定まれば離散変数法によって一意に解が求まることを利用して、オイラー法による数値解析処理を行っている。   In the present embodiment, numerical analysis processing by the Euler method is performed using the fact that the ordinary differential equation is uniquely determined by the discrete variable method when the initial value is determined.

尚、本実施の形態ではオイラー法による数値解析処理を行っているが、これに限定されるものではない。離散変数法には、オイラー法以外にも、ルンゲクッタ法、ブリルシュ・ストア法、予測子・修正子法、隠的ルンゲクッタ法など種々の手法があり、このため、数値解析処理として、これらのいずれの手法を用いてもよい。以下はオイラー法を用いた数値解析処理を例にあげて説明する。   In the present embodiment, numerical analysis processing by the Euler method is performed, but the present invention is not limited to this. In addition to the Euler method, the discrete variable method includes various methods such as the Runge-Kutta method, the Brillesh-Store method, the predictor / corrector method, and the hidden Runge-Kutta method. A technique may be used. In the following, a numerical analysis process using the Euler method will be described as an example.

オイラー法は、一階の常微分方程式に対する数値解法であるため、(50)式の変数変換を(48)、(49)式を運動方程式に施すことにより、(48)、(49)式を一階の常微分方程式に変換する。これにより、(51)、(52)式が得られる。   Since the Euler method is a numerical solution to the first-order ordinary differential equation, the equations (48) and (49) are converted by applying the variable transformation of the equation (50) to the equations (48) and (49). Convert to first-order ordinary differential equations. Thereby, formulas (51) and (52) are obtained.

Figure 2007257518
Figure 2007257518
一方、常微分方程式(53)式をオイラー法で数値解析処理を行って解法する場合には、(54)式のようにt(m)からt(m+1)=t(m)+hへ解を進展させる。
Figure 2007257518
Figure 2007257518
On the other hand, when solving the ordinary differential equation (53) by performing numerical analysis processing using the Euler method, t (m) to t (m + 1) = t (m) + h as shown in equation (54). Develop the solution.

Figure 2007257518
Figure 2007257518
ここで、x(m)はmステップであることを示し、hはステップ幅である。オイラー法のスキームを(51)、(52)式に適用すると(55)、(56)式の更新式が得られる。
Figure 2007257518
Figure 2007257518
Here, x (m) indicates m steps, and h is a step width. When the Euler scheme is applied to the equations (51) and (52), the updated equations (55) and (56) are obtained.

Figure 2007257518
本実施の形態では、第1解法処理部101によって、(51)、(52)式の更新式を繰り返して解法することによって第1の運動方程式(48)、(49)式の系の収束状態を求めている。そして、マッピング処理部107では、この収束状態から、曲面Yをyn=yn (T)のように求め、さらに、(6)式よりyn=g(n)の関係から、写像gを求めている。
Figure 2007257518
In the present embodiment, the first solution processing unit 101 repeatedly solves the update equations (51) and (52), thereby converging the first equations of motion (48) and (49). Seeking. Then, the mapping processing unit 107 obtains the curved surface Y from this convergence state as y n = y n (T) , and further calculates the mapping g from the relationship of y n = g (n) from the equation (6). Looking for.

(55)、(56)式の更新式は、各格子点の動きの状態が局所的な関係によって決定されるものであり、局所的な状態が平衡状態になりながら動きを推定していくため、より大域的な構造を導入し精度の向上を図る。   In the update formulas (55) and (56), the motion state of each lattice point is determined by a local relationship, and the motion is estimated while the local state is in an equilibrium state. Introduce more global structure to improve accuracy.

本実施の形態にかかる画像マッチング装置100では、複数個のパラメータ(動きパラメータ)によって写像関係を規定するパラメトリック動きモデルを導入している。以下、パラメトリック動きモデルを利用した動き推定について概要を説明する。   The image matching apparatus 100 according to the present embodiment introduces a parametric motion model that defines a mapping relationship by a plurality of parameters (motion parameters). The outline of motion estimation using a parametric motion model will be described below.

参照画像の画面内のすべての格子点の動き(第1の格子点との写像関係)が有限個のパラメトリック動きモデルによって決定されると仮定している。動きパラメータが既知であると仮定すると、画面内の各格子点の動きを求める問題は、各格子点がどのパラメトリック動きモデルに属するかを決定すること、すなわち、最適な動きパラメータを選択する問題となる。このことは、複数個の動きパラメータの最適化を行うことであり、画面全体で取り得る動きに関して最適化問題を解法することに比べてきわめて容易な手法となる。   It is assumed that the movement of all grid points in the screen of the reference image (mapping relationship with the first grid point) is determined by a finite number of parametric motion models. Assuming that the motion parameters are known, the problem of determining the motion of each grid point in the screen is to determine which parametric motion model each grid point belongs to, that is, to select the optimal motion parameter. Become. This is to optimize a plurality of motion parameters, which is an extremely easy method compared to solving an optimization problem with respect to the motion that can be taken on the entire screen.

しかしながら、動きパラメータは既知ではないため、局所的な動的マッチング処理の(55)、(56)式の更新式に従った動き推定の結果を用い、かかる動き推定の結果をクラスタリング手法を利用して、複数個のクラスタ(グループ)に分割する。本実施の形態では、動きクラスタリング処理部109によって、k-means法によって数値解析を行うことにより、(55)、(56)式の更新式に従った動き推定の結果から第2の格子点を複数個の領域にクラスタリングしている。なお、クラスタリングの手法としては、k-means法の手法以外の手法を用いてもよい。   However, since the motion parameter is not known, the result of motion estimation according to the update formulas of the local dynamic matching processes (55) and (56) is used, and the result of the motion estimation is obtained using a clustering method. Then, it is divided into a plurality of clusters (groups). In the present embodiment, by performing numerical analysis by the k-means method by the motion clustering processing unit 109, the second lattice point is obtained from the result of motion estimation according to the update formulas (55) and (56). Clustered into multiple regions. As a clustering method, a method other than the k-means method may be used.

そして、動きパラメータ推定部110によって、各クラスタ内(領域内)の局所的な動きから最小二乗法を用いて、パラメトリック動きモデルの動きパラメータ(第1の動きパラメータ)を推定している。なお、動きパラメータを推定する手法としては、最小二乗法以外の手法を用いることも可能である。   Then, the motion parameter estimation unit 110 estimates the motion parameter (first motion parameter) of the parametric motion model from the local motion in each cluster (in the region) using the least square method. Note that a method other than the method of least squares can be used as a method of estimating the motion parameter.

動きパラメータの推定を行った後、動きパラメータ修正部113によって、推定された動きパラメータを修正する。その後、動きパラメータ割り当て部111は、各格子点に、各格子点が属する動きモデルの動きパラメータを割り当てる。具体的には、動きパラメータ割り当て部111は、各格子点がどの動きパラメータの動きモデルに属するかを示すラベルを導入し、ラベルを割り当てることにより、最適な動きパラメータ(第2の動きパラメータ)の割り当てを行う。このため、動きパラメータ割り当て部111は、動きモデルに対する評価関数を設定し、その評価関数が最小になる動きパラメータが示すラベルを各格子点に設定する。   After estimating the motion parameter, the motion parameter correcting unit 113 corrects the estimated motion parameter. Thereafter, the motion parameter assignment unit 111 assigns the motion parameters of the motion model to which each lattice point belongs to each lattice point. Specifically, the motion parameter assignment unit 111 introduces a label indicating which motion parameter each lattice point belongs to, and assigns a label, thereby assigning the optimum motion parameter (second motion parameter). Make an assignment. Therefore, the motion parameter assignment unit 111 sets an evaluation function for the motion model, and sets a label indicated by the motion parameter that minimizes the evaluation function at each lattice point.

各格子点に対して、第1解法処理部101によって(55)、(56)式の更新式により、局所的な動きが求められるが、同時に各格子点には、パラメトリック動きモデルからも動きが求められる。このため、各格子点の局所的な動きと動きモデルによる動きのズレを補正する力を示す補正項を導入し、かかる補正項を補正項計算部112によって求め、第2解法処理部108によって、求めた補正項を第1の運動方程式に加えた第2の運動方程式を数値解析により解法することによって局所的な更新をおこなっている。図8は、動きモデルを利用した動き推定の画像上における状態を示す説明図である。   For each grid point, the first solution processing unit 101 obtains local motion by the update formulas (55) and (56). At the same time, each grid point also has motion from the parametric motion model. Desired. For this reason, a correction term indicating the force for correcting the shift of the local movement of each grid point and the motion model is introduced, the correction term is obtained by the correction term calculation unit 112, and the second solution processing unit 108 A local update is performed by solving the second equation of motion obtained by adding the obtained correction term to the first equation of motion by numerical analysis. FIG. 8 is an explanatory diagram showing a state of motion estimation using a motion model on an image.

このように本実施の形態にかかる画像マッチング装置100では、上述した動きパラメータ処理部110による動きモデルの動きパラメータの推定処理、動きパラメータ割り当て部111による動きパラメータの割り当て処理、補正項計算部112および第2解法処理部108による局所的な動きの更新(第2の運動方程式の解法処理)を繰り返すという動き分割を用いた処理によって、画像の正確な動きを推定して、第1の格子点と第2の格子点との写像関係を求めて画像マッチングを行っている。図10は、実施の形態1にかかるパラメトリック動きモデルを導入して動き分割を用いた画像マッチングの概念的な流れを示す説明図である。   As described above, in the image matching apparatus 100 according to the present embodiment, the motion parameter estimation processing by the motion parameter processing unit 110 described above, the motion parameter allocation processing by the motion parameter allocation unit 111, the correction term calculation unit 112, and By using the motion division that repeats local motion update (second motion equation solution processing) by the second solution processing unit 108, the accurate motion of the image is estimated, and the first grid point and Image matching is performed by obtaining a mapping relationship with the second grid point. FIG. 10 is an explanatory diagram showing a conceptual flow of image matching using motion division by introducing the parametric motion model according to the first embodiment.

例えば、図9に示すように、画像上のオブジェクトの一部が誤った動きで画像マッチングされている状態を考える。図9に示すような誤った動きがあると、境界の歪み等として視認されてしまう。このような場合には、誤った動きの領域に対して正確な動きの情報を割り当てることによりオブジェクト全体に正しい画像マッチングを行うことができる。本実施の形態における最適な動きパラメータの割り当て、すなわち格子点が属するパラメトリック動きモデルを決定することは、このような誤った動きの領域に対して正確な動きの情報を割り当てることに相当し、これにより、画像上で文字の一部が崩れるといった不具合を防止することができる。   For example, as shown in FIG. 9, let us consider a state in which a part of an object on an image is image-matched with an incorrect motion. If there is an erroneous movement as shown in FIG. 9, it will be visually recognized as a boundary distortion or the like. In such a case, correct image matching can be performed on the entire object by assigning accurate motion information to an erroneous motion region. The optimal motion parameter assignment in the present embodiment, that is, the determination of the parametric motion model to which the lattice points belong corresponds to assigning accurate motion information to such erroneous motion regions. As a result, it is possible to prevent a problem that a part of the characters is broken on the image.

次に、このようなパラメトリック動きモデルを導入した動き推定の詳細について説明する。まず、パラメトリック動きモデルを規定する。各パラメトリック動きモデルは、任意の数のラベルα∈L⊂Zによってラベル付けされているものとする。格子点nのラベルをz(n)∈Lとし、ラベルαを有する領域の集合(各動き領域)をNα={n|z(n)=α}とする。ラベルαの領域ごとのパラメトリック動きモデルを(57)式で定義する。   Next, details of motion estimation using such a parametric motion model will be described. First, a parametric motion model is defined. Each parametric motion model is labeled with an arbitrary number of labels αεL⊂Z. Assume that the label of the lattice point n is z (n) εL, and a set of regions (each motion region) having the label α is Nα = {n | z (n) = α}. A parametric motion model for each region of the label α is defined by equation (57).

Figure 2007257518
動きパラメータaα(m)は種々の形式を採用することができる。例えば、動きパラメータaα(m)として、アファインモデルを用いた場合には(58)式、2次形式モデルを用いた場合には(59)式で示される。ここで、mは、イテレーションの変数である。
Figure 2007257518
The movement parameter aα (m) can take various forms. For example, when the affine model is used as the motion parameter aα (m) , the equation (58) is used, and when the quadratic form model is used, the equation (59) is used. Here, m is an iteration variable.

Figure 2007257518
Figure 2007257518
この他、動きパラメータとして、回転変換モデル、ユークリッド変換モデル、相似変換モデル、射影変換モデル、Lie変換モデルなどを用いてもよい。
Figure 2007257518
Figure 2007257518
In addition, a rotation transformation model, an Euclidean transformation model, a similarity transformation model, a projective transformation model, a Lie transformation model, or the like may be used as the motion parameter.

次に、動きパラメータ推定について説明する。動きパラメータ推定の処理は、動きパラメータ推定部110によって行われる。パラメトリック動きモデルによって定まる動きベクトルは、(60)式で示されるので、これと(57)式を用いると、パラメトリック動きモデルによって定まる動きベクトルは(61)式で示される。   Next, motion parameter estimation will be described. The motion parameter estimation processing is performed by the motion parameter estimation unit 110. Since the motion vector determined by the parametric motion model is expressed by Expression (60), using this and Expression (57), the motion vector determined by the parametric motion model is expressed by Expression (61).

Figure 2007257518
一方、対応点により求まる動きベクトルは、(62)式で示される。
Figure 2007257518
On the other hand, the motion vector obtained from the corresponding point is expressed by equation (62).

Figure 2007257518
パラメトリック動きモデルによって定まる動きベクトルと対応点により求まる動きベクトルとの誤差を(63)式で定義すると、誤差エネルギーは(64)式で表される。従って、各動きベクトルの定義式(61)、(62)式により、誤差エネルギーは(65)式のようになり、結局(66)式で示されることになる。
Figure 2007257518
When the error between the motion vector determined by the parametric motion model and the motion vector obtained from the corresponding point is defined by Equation (63), the error energy is expressed by Equation (64). Therefore, the error energy is expressed by the equation (65) according to the definition equations (61) and (62) of each motion vector, and is eventually expressed by the equation (66).

Figure 2007257518
Figure 2007257518
一方、ラベルα領域内の誤差は、(67)式で示され、このラベルα領域内の誤差が(68)式に示すように最小になるように動きパラメータが推定される。
Figure 2007257518
Figure 2007257518
On the other hand, the error in the label α region is expressed by equation (67), and the motion parameter is estimated so that the error in the label α region is minimized as shown in equation (68).

Figure 2007257518
Figure 2007257518
本実施の形態では、動きパラメータと得られた動きベクトルの誤差がガウス分布に従っていると仮定して、最適な動きパラメータは最小二乗法を使用した数値解析によって求めている。すなわち、最小二乗法における正規方程式は、(69−1)、(69−2)、(69−3)式に示されるため、動きパラメータは(70−1)式で示される。
Figure 2007257518
Figure 2007257518
In the present embodiment, assuming that the error between the motion parameter and the obtained motion vector follows a Gaussian distribution, the optimum motion parameter is obtained by numerical analysis using the least square method. That is, since the normal equation in the least square method is represented by equations (69-1), (69-2), and (69-3), the motion parameter is represented by equation (70-1).

Figure 2007257518
Figure 2007257518
かかる(70−1)式は連立一次方程式であり、このため、動きパラメータは、(70)式により特異値分解やLU分解などの手法で求めることができる。
Figure 2007257518
Figure 2007257518
Since the equation (70-1) is a simultaneous linear equation, the motion parameter can be obtained by a method such as singular value decomposition or LU decomposition according to the equation (70).

次に、パラメータ修正部113によるパラメータ修正処理について説明する。上記動きパラメータ推定部110による動きパラメータの推定は、局所動きベクトルから動きパラメータを推定するが、推定された動きパラメータによって規定される動きモデルは画像に適合するかどうか分からない。すなわち、動きパラメータの画像に対する尤度は考慮されていないことになる。   Next, parameter correction processing by the parameter correction unit 113 will be described. The motion parameter estimation by the motion parameter estimation unit 110 estimates the motion parameter from the local motion vector, but it is not known whether the motion model defined by the estimated motion parameter is suitable for the image. That is, the likelihood of the motion parameter for the image is not considered.

このことは、次に示すような問題として顕在化する。局所動き推定には推定誤差が入り込み、動きパラメータ推定にも推定誤差が入り込む。このため、得られた動きモデルは必ずしも画像に適合しているとは限らないため、ラベル割り当ての精度が低下する場合があり得る。その結果、正しいラベル割り当てが行われず、その情報を用いて次の局所動き推定をおこなうため、さらに誤差が拡大してしまう。これはフィードバックによる誤差の発散効果と見ることができるので、いずれかの段階で誤差のフィードバックをキャンセルする必要がある。上記の動きパラメータの画像に対する尤度を最適化することにより、動きパラメータの画像に対する誤差を減少することができ、十分上記フィードバックのキャンセルを行うことができる。   This becomes obvious as the following problem. An estimation error is included in the local motion estimation, and an estimation error is also included in the motion parameter estimation. For this reason, since the obtained motion model does not necessarily match the image, the accuracy of label allocation may be reduced. As a result, the correct label assignment is not performed, and the next local motion estimation is performed using the information, so that the error further increases. Since this can be regarded as an error divergence effect due to feedback, it is necessary to cancel the error feedback at any stage. By optimizing the likelihood of the motion parameter image, the error of the motion parameter image can be reduced, and the feedback can be canceled sufficiently.

動きパラメータの画像に対する尤度は、(70−2)、(70−3)式で示される。

Figure 2007257518
The likelihood of the motion parameter for the image is expressed by equations (70-2) and (70-3).
Figure 2007257518

(70−2)、(70−3)式は、ラベリングの尤度と等価であるが、ラベリングにおいてはラベルによって最適化がおこなわれるため、動きパラメータに関しては最適化されない。動きパラメータの最適化問題としては、(70−4)式を解法すればよい。

Figure 2007257518
Expressions (70-2) and (70-3) are equivalent to the likelihood of labeling. However, since the labeling is optimized by the label, the motion parameter is not optimized. As a motion parameter optimization problem, the equation (70-4) may be solved.
Figure 2007257518

(70−4)式において、ノイズの標準偏差項は最尤推定の結果には影響を与えないため省略している。この問題は、Lucas−Kanadeアルゴリズムによって安定して解くことができることが知られている。ここでは、各ラベルαに対して個別に最尤推定をおこないたいため、ラベル毎にLucas−Kanadeアルゴリズムを適用する。   In equation (70-4), the standard deviation term of noise is omitted because it does not affect the result of maximum likelihood estimation. It is known that this problem can be solved stably by the Lucas-Kanade algorithm. Here, since it is desired to perform maximum likelihood estimation individually for each label α, the Lucas-Kanade algorithm is applied for each label.

ラベルを有する領域の集合、すなわち各動き領域を(70−5)式で示すと、動きパラメータの最適化問題は各領域毎に定義され、(70−6)式で示される。

Figure 2007257518
When a set of regions having labels, that is, each motion region is represented by the equation (70-5), the motion parameter optimization problem is defined for each region and represented by the equation (70-6).
Figure 2007257518

Lucas−Kanadeアルゴリズムは、真の解(70−7)式の十分近い近傍点(70−8)式は既知として、(70−9)式のように解を反復的に漸化させることにより近似解を求める手法であり、(70−10)式による最小化を行えばよい。

Figure 2007257518
The Lucas-Kanade algorithm is approximated by iterating the solution iteratively as shown in equation (70-9), assuming that the nearest neighbor (70-8) equation of the true solution (70-7) is known. This is a method for obtaining a solution, and it is sufficient to perform minimization according to equation (70-10).
Figure 2007257518

Figure 2007257518
Figure 2007257518

(70−10)式を、aαの周りでテーラー展開すると、(70−11)式のようになる。かかる式をΔaαで微分すると(70−12)式が得られる。

Figure 2007257518
When the equation (70-10) is Taylor-expanded around aα, the equation (70-11) is obtained. Differentiating this equation by Δaα yields the equation (70-12).
Figure 2007257518

かかる式に対し、ニュートン法を適用すると解の更新は(70−13)式のようになる。ここで、Hは(70−14)式で示されるHessianである。

Figure 2007257518
When the Newton method is applied to such an equation, the update of the solution is as shown in equation (70-13). Here, H is Hessian expressed by the equation (70-14).
Figure 2007257518

従って、解の更新式は(70−15)式で示される。

Figure 2007257518
Therefore, the solution update equation is expressed by equation (70-15).
Figure 2007257518

ここで、例えば十分小さい定数ε(>0)に対して、(70−16)式を満たしたら終了等のように終了条件を定めておく。なお、所定のイテレーション回数を繰り返した後に終了するように構成してもよい。   Here, for example, for a sufficiently small constant ε (> 0), an end condition is defined such as end when the expression (70-16) is satisfied. It may be configured to end after repeating a predetermined number of iterations.

(70−10)式は、各画素を等価に扱っているために、ラベル内に外れ値が入っていると、その影響をうけて解(平均)がずれてしまう。そこで、(70−10)式に重み付けを行い、(70−17)式で示す問題を考える。

Figure 2007257518
Since the expression (70-10) treats each pixel equivalently, if an outlier is included in the label, the solution (average) is shifted due to the influence. Therefore, weighting is applied to the equation (70-10), and the problem indicated by the equation (70-17) is considered.
Figure 2007257518

この重みw(n)を外れ値の場合には低くなるように設定することより、外れ値の影響に対してロバストになる。解の更新(70−13)式の導出と同様に更新式を導出すると、(70−18)式のようになる。なお、重みw(n)の決定はM推定の枠組みなどを使うことできる。

Figure 2007257518
By setting the weight w (n) to be low in the case of an outlier, the weight w (n) is robust against the influence of the outlier. If the update equation is derived in the same manner as the solution update (70-13), the equation (70-18) is obtained. The weight w (n) can be determined using an M estimation framework or the like.

Figure 2007257518

従って、本実施の形態では、動きパラメータ修正部113によって動きパラメータ推定部110で推定した動きパラメータを、(70−18)、(70−14)、(70−15)式によって修正すればよい。   Therefore, in the present embodiment, the motion parameter estimated by the motion parameter estimation unit 110 by the motion parameter correction unit 113 may be corrected by the equations (70-18), (70-14), and (70-15).

次に、弾性エネルギー力計算部104による不連続対応弾性力の計算について説明する。互いに異なるパラメトリック動きモデルは、一般に互いに異なる動きパラメータを有している。このため、両者の境界部分の弾性定数は0に設定した方が歪みが少ない。その境界部分は互いに異なるラベルを有する部分となる。すなわち、格子点n1,n2間の弾性定数は、(71)式で示されることになる。不連続に対応した弾性力(以下、「不連続対応弾性力」という)は、(71)式と(38)式により(72)式で定義することができる。 Next, calculation of the elastic force corresponding to discontinuity by the elastic energy force calculation unit 104 will be described. Different parametric motion models generally have different motion parameters. For this reason, distortion is less when the elastic constant at the boundary between the two is set to zero. The boundary portion is a portion having a different label. That is, the elastic constant between the lattice points n 1 and n 2 is expressed by the equation (71). The elastic force corresponding to the discontinuity (hereinafter referred to as “discontinuous corresponding elastic force”) can be defined by the equation (72) by the equations (71) and (38).

Figure 2007257518
Figure 2007257518
このため、弾性エネルギー力計算部104では、(71)式に基づき弾性係数を決定し、後述する第2の運動方程式の項となる不連続対応弾性力を(72)式により計算している。
Figure 2007257518
Figure 2007257518
For this reason, the elastic energy force calculation unit 104 determines an elastic coefficient based on the equation (71), and calculates the discontinuous corresponding elastic force, which is a term of the second equation of motion described later, using the equation (72).

次に、補正項計算部112による補正項の計算について説明する。パラメトリック動きモデルによって定まる動きと各格子点の動きが異なる場合には、各格子点をパラメトリック動きモデルに近似させる補正をおこなう必要がある。このため、後述する第2の運動方程式にかかる近似を行うための補正項を加え、補正項計算部112によって補正項の計算を行っている。かかる近似の補正が線形な弾性エネルギーに従う場合とすれば、補正項は、(73)式のように、パラメトリック動きモデルによって定まる動きベクトルと各格子点の動きベクトルの差を入力とした線形関数の出力で示される補正力として定義される。ここで、k2は、補正の強度を示している。 Next, calculation of the correction term by the correction term calculation unit 112 will be described. When the motion determined by the parametric motion model is different from the motion of each grid point, it is necessary to perform correction to approximate each grid point to the parametric motion model. For this reason, a correction term for approximation to a second equation of motion described later is added, and the correction term calculation unit 112 calculates the correction term. Assuming that such approximate correction is based on linear elastic energy, the correction term is a linear function having a difference between the motion vector determined by the parametric motion model and the motion vector of each lattice point as input, as shown in equation (73). It is defined as the correction force indicated by the output. Here, k 2 represents the strength of correction.

Figure 2007257518
また、パラメトリック動きモデルによって定まる動きと各格子点の動きとの差が所定値以上となる場合には、(73)式に示す補正項では補正力が必要以上に大きくなってしまう。このような場合には、パラメトリック動きモデルによって定まる動きベクトルと各格子点の動きベクトルの差を入力とした非線形関数の出力で示される補正項、例えば、(74)式のような対数をとった補正項を採用することにより、補正項の値が膨大になることを防止することができる。
Figure 2007257518
Further, when the difference between the motion determined by the parametric motion model and the motion of each grid point is a predetermined value or more, the correction force in the correction term shown in the equation (73) becomes larger than necessary. In such a case, a correction term indicated by the output of a nonlinear function having the difference between the motion vector determined by the parametric motion model and the motion vector of each grid point as an input, for example, a logarithm as shown in equation (74) is taken. By adopting the correction term, it is possible to prevent the value of the correction term from becoming enormous.

Figure 2007257518
次に、動きクラスタリング処理部109による動きクラスタリング処理について説明する。更新式(55)、(56)式による局所的な動的マッチング処理が完了した時点では、ラベルの割り当て処理が行われていないため、動きパラメータの推定を行うことができない。このため、更新式(55)、(56)式による局所的な動的マッチング処理が完了して最初に動きパラメータの推定処理を行う場合には、動きパラメータの推定処理の実行前に、動きクラスタリング処理部109によって、更新式(55)、(56)式によって求められた動き推定をクラスタリングすることによりラベルの初期値として使用している。ここで、更新式(55)、(56)式による動き推定のクラスタリング処理としては、輝度等の画素値に基づいて画像をk−Means法によって複数個にクラスタリングを行って画像を分割し、そのクラスタリング結果によって複数個の動きパラメータを求め、求めた動きパラメータを初期値としてk−Means法による数値解析処理により動きパラメータのラベルを求める。
Figure 2007257518
Next, motion clustering processing by the motion clustering processing unit 109 will be described. When the local dynamic matching process according to the update expressions (55) and (56) is completed, the label allocation process is not performed, so that the motion parameter cannot be estimated. Therefore, when the motion parameter estimation process is performed first after the local dynamic matching process according to the update expressions (55) and (56) is completed, the motion clustering process is performed before the motion parameter estimation process is executed. The motion estimation obtained by the update equations (55) and (56) is clustered by the processing unit 109 and used as an initial value of the label. Here, as a clustering process of motion estimation by the update formulas (55) and (56), an image is divided into a plurality of images by the k-Means method based on pixel values such as luminance, and the image is divided. A plurality of motion parameters are obtained from the clustering result, and the motion parameter labels are obtained by numerical analysis processing by the k-Means method using the obtained motion parameters as initial values.

次に、動きパラメータ割り当て部111による動きパラメータ割り当て処理、すなわちラベル割り当て処理について説明する。動きパラメータ割り当て部111による動きパラメータ割り当て処理では、格子点nに対する動きパラメータの割り当て問題として、(75)式に示す最適化問題を解放する。   Next, a motion parameter assignment process by the motion parameter assignment unit 111, that is, a label assignment process will be described. In the motion parameter assignment process by the motion parameter assignment unit 111, the optimization problem shown in the equation (75) is released as a motion parameter assignment problem for the lattice point n.

Figure 2007257518
ここで、Gはコスト関数であり、本実施の形態では、非特許文献「A. M. Tekalp, “digital video processing”, Prentice Hall, 1995,pp. 103」に示されている、(76)式のようなMPC(Maximum Pel Count)を用いている。
Figure 2007257518
Here, G is a cost function, and in this embodiment, as shown in the non-patent document “AM Tekalp,“ digital video processing ”, Prentice Hall, 1995, pp. 103, MPC (Maximum Pel Count) is used.

Figure 2007257518
ここで、B⊂Λ2は、格子点nを中心とした局所領域(ブロック)を表す集合であり、N(B)は集合の要素数である。また、非特許文献「A. M. Tekalp, “digital video processing”, Prentice Hall, 1995,pp. 102-103」に示されているMSE(Mean Squared Error), MAD(Mean Absolute Error)などを用いても良い。
Figure 2007257518
Here, B⊂Λ 2 is a set representing a local region (block) centered on the lattice point n, and N (B) is the number of elements in the set. Further, MSE (Mean Squared Error), MAD (Mean Absolute Error) and the like shown in non-patent literature “AM Tekalp,“ digital video processing ”, Prentice Hall, 1995, pp. 102-103” may be used. .

ここで、動きパラメータを正確に割り当てるためには、動きパラメータの精度が高い必要があることが推察される。図11に示すように、マッチング対象領域に対して画像マッチングが正しい領域(図11中の白い領域)が広いほど、その領域に対する動きパラメータの推定精度も高くなる。これは最小二乗法の特性である(中心極限定理によりサンプル数が多いほど推定精度は向上する)。このため、画像マッチングが行われていない領域(図中の灰色領域)に対して、この動きパラメータを割り当てると、正確な画像マッチングとなりやすい。逆に、マッチング領域が狭い場合には、動きパラメータの推定精度は低下する。この場合、低精度の動きパラメータを拡張した場合でも、真の動きパラメータとのズレが大きくなり、正確な画像マッチングを行うことは困難である。   Here, it is inferred that the accuracy of the motion parameter needs to be high in order to assign the motion parameter accurately. As shown in FIG. 11, the larger the area where the image matching is correct (the white area in FIG. 11) with respect to the matching target area, the higher the estimation accuracy of the motion parameter for that area. This is a characteristic of the least square method (the estimation accuracy improves as the number of samples increases due to the central limit theorem). For this reason, if this motion parameter is assigned to an area where image matching has not been performed (gray area in the figure), accurate image matching is likely to occur. Conversely, when the matching area is narrow, the motion parameter estimation accuracy decreases. In this case, even when the low-precision motion parameter is expanded, the deviation from the true motion parameter becomes large, and it is difficult to perform accurate image matching.

ここで、画面全体での最適化を行うことも可能である。画像処理の有する局在性に着目し、画像の局在性をマルコフ性と等価なギブス分布によって定式化し、それを事前分布としてベイズの定理により、求めたい最適化問題を事後分布最大化問題として定式化すればよい。またその事後分布最大化問題は基本的にNP困難であり、大域的最適解を得るのは難しく、通常はシミュレイティッドアニーリングなどにより求解する。さらに効率よく解法するため、非特許文献「Y. Boykov, O. Veksler and R. Zabih, "Fast Approximate Energy Minimization via Graph Cuts", IEEE Trans. on Pattern Analysis and Machine Int., Vol. 23, No. 11, pp. 1222-1239, 2001」に詳述されているグラフ理論のグラフカットを用いて定式化することも可能である。   Here, it is possible to optimize the entire screen. Focusing on the localization of image processing, the localization of the image is formulated by the Gibbs distribution equivalent to the Markov property, and the optimization problem that we want to find as a prior distribution is the posterior distribution maximization problem It can be formulated. In addition, the posterior distribution maximization problem is basically NP-hard, and it is difficult to obtain a global optimal solution, and is usually solved by simulated annealing or the like. In order to solve the problem more efficiently, the non-patent document “Y. Boykov, O. Veksler and R. Zabih,“ Fast Approximate Energy Minimization via Graph Cuts ”, IEEE Trans. On Pattern Analysis and Machine Int., Vol. 23, No. 11, pp. 1222-1239, 2001 ", and can be formulated using graph theory graph cuts.

次に、第2解法処理部108によって解法処理を行う第2の運動方程式について説明する。第2の運動方程式は、(77)式に示されるように、(55)、(56)式の第1の運動方程式に、(73)式または(74)式の補正項が加わり、さらに弾性エネルギー力として、(71)、(72)式に示す不連続対応弾性力の項を有している。第2解法処理部108では、かかる第2の運動方程式を、第1の運動方程式と同様に、オイラー法等の離散変数法を用いた数値解析処理により解法している。   Next, the second equation of motion for which the second solution processing unit 108 performs solution processing will be described. As shown in the equation (77), the second equation of motion is obtained by adding a correction term of the equation (73) or (74) to the first equation of motion of the equations (55) and (56) and further elasticity. As energy force, it has the term of the elastic force corresponding to discontinuity shown in (71) and (72) types. The second solution processing unit 108 solves the second equation of motion by a numerical analysis process using a discrete variable method such as the Euler method, like the first equation of motion.

Figure 2007257518
次に、以上のように構成された実施の形態1にかかる画像マッチング装置100による画像マッチング処理について説明する。図12は、実施の形態1にかかる画像マッチング装置100による画像マッチングの全体処理の手順を示すフローチャートである。まず、カウント回数Lを1に初期化し(ステップS1201)、第1解法処理部101、画像エネルギー力計算部103、弾性エネルギー力計算部104、摩擦力計算部105による(55)、(56)式による局所的な動的マッチング処理を行う(ステップS1202)。
Figure 2007257518
Next, an image matching process performed by the image matching apparatus 100 according to the first embodiment configured as described above will be described. FIG. 12 is a flowchart of an overall image matching process performed by the image matching apparatus 100 according to the first embodiment. First, the count number L is initialized to 1 (step S1201), and the first solution processing unit 101, the image energy force calculation unit 103, the elastic energy force calculation unit 104, and the frictional force calculation unit 105 perform the expressions (55) and (56). A local dynamic matching process is performed by (step S1202).

動的マッチング処理が完了したら、動きクラスタリング処理109によって動きクラスタリング処理を行い(ステップS1203)、参照画像の画面を複数個に分割して動きパラメータのラベルの初期値を求める。次に、動きパラメータ推定部110による動きパラメータ推定処理を行い(ステップS1204)、各ラベルの領域に対する動きパラメータを推定する。そして、動きパラメータ修正部113によって、動きパラメータ推定部110で推定した動きパラメータを、(70−18)、(70−14)、(70−15)式によって修正する(ステップS1205)。そして、動きパラメータ割り当て部111によって、修正した動きパラメータから最適な動きパラメータを決定して、決定された最適な動きパラメータを、ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当て処理を行う(ステップS1206)。   When the dynamic matching processing is completed, motion clustering processing is performed by the motion clustering processing 109 (step S1203), and the reference image screen is divided into a plurality of frames to obtain initial values of motion parameter labels. Next, motion parameter estimation processing is performed by the motion parameter estimation unit 110 (step S1204), and motion parameters for each label area are estimated. Then, the motion parameter correcting unit 113 corrects the motion parameter estimated by the motion parameter estimating unit 110 using the equations (70-18), (70-14), and (70-15) (step S1205). Then, the motion parameter allocating unit 111 determines an optimal motion parameter from the corrected motion parameter, and the determined optimal motion parameter is allocated to each second grid point in the region corresponding to the label. Parameter assignment processing is performed (step S1206).

次に、補正項を付加した動的マッチング処理、すなわち補正項計算部112および第2解法処理部108による(77)式の第2の運動方程式の解法処理を行ってyn (LT2))を求め(ステップS1207)、フレームメモリ106に保存する。そして、カウント回数Lを1増加して(ステップS1208)、カウント回数Lが予め定められた所定回数を超えたか否かを調べる(ステップS1209)。 Next, the dynamic matching process with the correction term added, that is, the solution process of the second equation of motion of the equation (77) by the correction term calculation unit 112 and the second solution processing unit 108 is performed to obtain y n (LT2) ). Obtained (step S1207) and stored in the frame memory 106. Then, the count number L is incremented by 1 (step S1208), and it is checked whether the count number L exceeds a predetermined number of times (step S1209).

カウント回数Lが予め定められた所定回数を超えていない場合には(ステップS1209:No)、ステップS1204からS1208までの処理を繰り返す。すなわち、動きパラメータ処理部110による動きモデルの動きパラメータの推定処理、動きパラメータ修正部113による動きパラメータの修正処理、動きパラメータ割り当て部111による動きパラメータの割り当て処理、補正項計算部112および第2解法処理部108による局所的な動きの更新(第2の運動方程式の解法処理)を繰り返す。   When the count number L does not exceed the predetermined number of times (step S1209: No), the processing from step S1204 to S1208 is repeated. That is, the motion parameter estimation processing by the motion parameter processing unit 110, the motion parameter correction processing by the motion parameter correction unit 113, the motion parameter allocation processing by the motion parameter allocation unit 111, the correction term calculation unit 112, and the second solution method The local motion update (second motion equation solving process) by the processing unit 108 is repeated.

一方、ステップS1209において、カウント回数Lが予め定められた所定回数を超えた場合には(ステップS1209:Yes)、第2解法処理部108によって、すべての格子点nに対して、ynにyn (T)を設定する(ステップS1210)。そして、マッピング処理部107により、対象画像と参照画像との対応関係、すなわち写像を求める(ステップS1211)。このような動き分割を用いた処理によって、画像の正確な動きを推定して、第1の格子点と第2の格子点との写像関係を求めて画像マッチングが行われる。 On the other hand, if the count number L exceeds a predetermined number in step S1209 (step S1209: Yes), the second solution processing unit 108 sets y n to y n for all grid points n. n (T) is set (step S1210). Then, the mapping processing unit 107 obtains a correspondence relationship between the target image and the reference image, that is, a mapping (step S1211). Image matching is performed by estimating the exact motion of the image by the processing using such motion division and obtaining the mapping relationship between the first lattice point and the second lattice point.

次に、ステップS1202における局所的な動的マッチング処理について説明する。図13は、実施の形態1にかかる局所的な動的マッチング処理の手順を示すフローチャートである。具体的には、先に示した(55)、(56)式を数値解析により解法することにより画像マッチング処理を実現している。   Next, the local dynamic matching process in step S1202 will be described. FIG. 13 is a flowchart of a local dynamic matching process according to the first embodiment. Specifically, the image matching processing is realized by solving the equations (55) and (56) shown above by numerical analysis.

まず、第1解法処理部101は、時間τ(0)=0に設定し(ステップS1301)、初期値yn (0)=n、vn (0)=0を設定する(ステップS1302)。これにより、(56)式が実行される。 First, the first solution processing unit 101 sets time τ (0) = 0 (step S1301), and sets initial values y n (0) = n and v n (0) = 0 (step S1302). Thereby, the equation (56) is executed.

次に、画像エネルギー力計算部103によって、すべての格子点nに対してmステップにおける画像相関ポテンシャル力Fi (m)(n)を計算する(ステップS1303)。かかる画像エネルギー力Fi (m)(n)の計算処理については後述する。 Next, the image energy force calculation unit 103 calculates the image correlation potential force F i (m) (n) in m steps for all the lattice points n (step S1303). The calculation processing of the image energy force F i (m) (n) will be described later.

次いで、弾性エネルギー力計算部104によって、すべての格子点nに対してmステップにおける弾性エネルギー力Fk (m)(n)を(38)式により算出する(ステップS1304)。そして、摩擦力計算部105によって、すべての格子点nに対してmステップにおける摩擦力[−μvn (m)]を計算する(ステップS1305)。 Next, the elastic energy force calculation unit 104 calculates the elastic energy force F k (m) (n) in m steps with respect to all the lattice points n by the equation (38) (step S1304). Then, the frictional force calculation unit 105 calculates the frictional force [−μv n (m) ] in m steps for all the lattice points n (step S1305).

次に、第1解法処理部101によって、(55)式の更新式を、ステップS1303〜S1305で求めた画像エネルギー力Fi (m)(n)、弾性エネルギー力Fk (m)(n)、摩擦力[−μvn (m)]で更新する(ステップS1306)。 Next, the first solution processing unit 101 uses the image energy force F i (m) (n) and the elastic energy force F k (m) (n) obtained in Steps S1303 to S1305 as the update equations of Expression (55). The frictional force [−μv n (m) ] is updated (step S1306).

次に、第1解法処理部101によって、yn (m)の値をフレームメモリ106に保存する(ステップS1307)。そして、第1解法処理部101によって、τ(m+1)(m)+hと更新し(ステップS1308)、mを1だけ増加する(ステップS1309)。そして、τ(m+1)があらかじめ定められた時間Tを越えたか否かを判断し(ステップS1310)、越えていない場合には、上記ステップS1303からS1309を繰り返し実行する。 Next, the first solution processing unit 101 stores the value of y n (m) in the frame memory 106 (step S1307). Then, the first solution processing unit 101 updates τ (m + 1) = τ (m) + h (step S1308), and increases m by 1 (step S1309). Then, it is determined whether or not τ (m + 1) has exceeded a predetermined time T (step S1310). If not, step S1303 to S1309 are repeatedly executed.

一方、τ(m+1)がTを越えた場合には、第1解法処理部101によって、すべての格子点nに対して、ynにyn (T)を設定する(ステップS1311)。 On the other hand, tau (m + 1) is the case beyond the T is the first solution processing unit 101, for all grid points n, sets the y n (T) to y n (step S1311).

次に、ステップS1303における画像エネルギー力の計算処理について説明する。図14は、画像エネルギー力計算部103による画像エネルギー力の計算処理の手順を示すフローチャートである。   Next, the image energy force calculation process in step S1303 will be described. FIG. 14 is a flowchart showing a procedure of image energy force calculation processing by the image energy force calculation unit 103.

まず、画像エネルギー力計算部103は、(41)式により、yn(τ)にもっとも近いサンプリング点を局所空間中心ycとして計算する(ステップS1401)。そして次に、画像エネルギー力計算部103は、(42)式で定義される隣接空間Lを設定し(ステップS1402)、局所探索集合Ωを(43)式によって計算する(ステップS1403)。 First, the image energy force calculation unit 103 calculates the sampling point closest to y n (τ) as the local space center y c using equation (41) (step S1401). Next, the image energy force calculation unit 103 sets the adjacent space L defined by the equation (42) (step S1402), and calculates the local search set Ω by the equation (43) (step S1403).

次に、画像エネルギー力計算部103は、(46)式により局所最適化計算としてyminを計算し(ステップS1404)、正規化のために、ステップS1404で求めた局所最適化のyminを用いて(45)式によりd=ymin−yn (m)を計算する(ステップS1405)。そして、画像エネルギー力計算部103は、ymin、d等を用いて、(44)式により、画像エネルギー力Fi (m)(n)を計算する(ステップS1406)。 Next, the image energy force calculation unit 103 calculates y min as a local optimization calculation using the equation (46) (step S1404), and uses the local optimization y min obtained in step S1404 for normalization. Then, d = y min −y n (m) is calculated by the equation (45) (step S1405). Then, the image energy force calculation unit 103 calculates the image energy force F i (m) (n) by using equation (44) using y min , d, and the like (step S1406).

次に、ステップS1203における動きクラスタリング処理部109により動きクラスタリング処理について説明する。図15は、実施の形態1にかかる動きクラスタリング処理部109により動きクラスタリング処理の手順を示すフローチャートである。   Next, the motion clustering processing by the motion clustering processing unit 109 in step S1203 will be described. FIG. 15 is a flowchart of a motion clustering process performed by the motion clustering processing unit 109 according to the first embodiment.

まず、動きクラスタリング処理部109は、局所的な動的マッチング処理の結果としての輝度等の画素値に基づいて、参照画像をk−Means法によって複数個にクラスタリングを行って画像を分割しラベルを求める(ステップS1501)。   First, based on pixel values such as luminance as a result of local dynamic matching processing, the motion clustering processing unit 109 performs clustering on a plurality of reference images by the k-Means method to divide the images and label them. Obtained (step S1501).

そして、そのクラスタリング結果によるラベルに基づき、初期動きパラメータを推定し、複数個の初期動きパラメータを求める(ステップS1502)。次に、求めた初期動きパラメータを初期値としてk−Means法による数値解析処理により動きパラメータのラベルαを求める(ステップS1503)。ここで、ラベルαは、複数個の初期動きパラメータに対応して複数個求められる。かかる動きクラスタリング処理は、図12に示すように、局所的な動的マッチング処理が完了した直後に1回だけ実行される。   Then, based on the label based on the clustering result, an initial motion parameter is estimated to obtain a plurality of initial motion parameters (step S1502). Next, the motion parameter label α is obtained by numerical analysis processing by the k-Means method using the obtained initial motion parameter as an initial value (step S1503). Here, a plurality of labels α are obtained corresponding to a plurality of initial motion parameters. Such motion clustering processing is executed only once immediately after the local dynamic matching processing is completed, as shown in FIG.

次に、ステップS1204における動きパラメータ推定部110による動きパラメータ推定処理について説明する。図16は、実施の形態1にかかる動きパラメータ推定部110による動きパラメータ推定処理の手順を示すフローチャートである。   Next, the motion parameter estimation processing by the motion parameter estimation unit 110 in step S1204 will be described. FIG. 16 is a flowchart of a motion parameter estimation process performed by the motion parameter estimation unit 110 according to the first embodiment.

まず、動きパラメータ推定部110は、動きクラスタリング処理部109によって求めたラベルαに対して、全ての格子点nに対して、(69−2)式によりAを、(69−3)式によりbを計算する(ステップS1601)。そして、(69−1)式を特異値分解法(もしくはLU法)による数値解析により解法処理を行う(ステップS1602)。そして、全てのラベルαに対して、上記ステップS1601およびS1602の処理を繰り返して実行する(ステップS1603)。このようにして推定された動きパラメータは、ステップS1205における動きパラメータ修正部113によって、(70−18)、(70−14)、(70−15)式により修正される。   First, the motion parameter estimation unit 110 applies A to all lattice points n with respect to the label α obtained by the motion clustering processing unit 109, and b using the equation (69-2). Is calculated (step S1601). Then, the solution process is performed by numerical analysis by the singular value decomposition method (or LU method) for the equation (69-1) (step S1602). Then, the processes in steps S1601 and S1602 are repeated for all labels α (step S1603). The motion parameter estimated in this way is corrected by equations (70-18), (70-14), and (70-15) by the motion parameter correcting unit 113 in step S1205.

次に、ステップS1206における動きパラメータ割り当て部111による動きパラメータ割り当て処理について説明する。図17は、実施の形態1にかかる動きパラメータ割り当て部111による動きパラメータ割り当て処理の手順を示すフローチャートである。   Next, the motion parameter assignment processing by the motion parameter assignment unit 111 in step S1206 will be described. FIG. 17 is a flowchart of a motion parameter assignment process performed by the motion parameter assignment unit 111 according to the first embodiment.

まず、動きパラメータ割り当て部111は、全てのラベルαに対して、(76)式に示すコスト関数G(n)が最小になるα0を求める(ステップS1701)。かかる処理は、すなわち、(75)式を実行することである。そして、動きパラメータ割り当て部111は、α0を格子点nに対するラベルとして設定する(ステップS1702)。かかる処理により、格子点nに最適な動きパラメータが割り当てられたことになる。そして、動きパラメータ割り当て部111は、上記ステップS1701およびS1702の処理を全ての格子点nに対して繰り返し実行する(ステップS1703)。これにより、全ての格子点nに対して最適な動きパラメータが割り当てられる。 First, the motion parameter assignment unit 111 obtains α 0 that minimizes the cost function G (n) expressed by the equation (76) for all labels α (step S1701). This processing is to execute equation (75). Then, the motion parameter assignment unit 111 sets α 0 as a label for the lattice point n (step S1702). With this process, the optimum motion parameter is assigned to the lattice point n. Then, the motion parameter assignment unit 111 repeatedly executes the processes of steps S1701 and S1702 for all the lattice points n (step S1703). Thereby, an optimal motion parameter is assigned to all the lattice points n.

次に、ステップS1207における補正項を付加した動的マッチング処理について説明する。図18は、実施の形態1にかかる補正項を付加した動的マッチング処理の手順を示すフローチャートである。具体的には、先に示した(77)式を数値解析により解法することにより画像マッチング処理を実現している。   Next, the dynamic matching process with the correction term added in step S1207 will be described. FIG. 18 is a flowchart of a dynamic matching process procedure to which correction terms according to the first embodiment are added. Specifically, the image matching process is realized by solving the equation (77) shown above by numerical analysis.

まず、第2解法処理部108は、時間τ(0)=0に設定し(ステップS1801)、初期値yn (0)=n、vn (0)=0を設定する(ステップS1802)。これにより、(77)式の第2式が実行される。 First, the second solution processing unit 108 sets time τ (0) = 0 (step S1801), and sets initial values y n (0) = n and v n (0) = 0 (step S1802). Thereby, the second expression of the expression (77) is executed.

次に、画像エネルギー力計算部103によって、すべての格子点nに対してmステップにおける画像相関ポテンシャル力Fi (m)(n)を計算する(ステップS1803)。かかる画像エネルギー力Fi (m)(n)の計算処理については、図14で説明した処理と同様に行われる。 Next, the image energy force calculation unit 103 calculates the image correlation potential force F i (m) (n) in m steps for all grid points n (step S1803). The calculation processing of the image energy force F i (m) (n) is performed in the same manner as the processing described with reference to FIG.

次いで、弾性エネルギー力計算部104によって、すべての格子点nに対してmステップにおける不連続対応弾性力Fdk (m)(n)を(71)、(72)式により算出する(ステップS1804)。不連続対応弾性力Fdk (m)(n)の計算処理については後述する。 Next, the elastic energy force calculation unit 104 calculates the discontinuity-corresponding elastic force F dk (m) (n) in m steps for all the lattice points n by the equations (71) and (72) (step S1804). . The calculation processing of the discontinuity corresponding elastic force F dk (m) (n) will be described later.

次に、補正項計算部112によって、すべての格子点nに対してmステップにおける補正項Fd (m)(n)を(73)式により算出する(ステップS1805)。そして、摩擦力計算部105によって、すべての格子点nに対してmステップにおける摩擦力[−μ(τ(m))vn (m)]を計算する(ステップS1806)。 Next, the correction term calculation unit 112 calculates the correction term F d (m) (n) in m steps for all lattice points n by the equation (73) (step S1805). Then, the frictional force calculation unit 105 calculates the frictional force [−μ (τ (m) ) v n (m) ] in m steps for all lattice points n (step S1806).

次に、第2解法処理部108によって、(77)式の更新式を、ステップS1803〜S1806で求めた画像エネルギー力Fi (m)(n)、不連続対応弾性力Fdk (m)(n)、補正項Fd (m)(n)、摩擦力[−μ(τ(m))vn (m)]で更新する(ステップS1807)。 Next, the second solution processing unit 108 changes the equation (77) to the image energy force F i (m) (n) and the discontinuity corresponding elastic force F dk (m) ( n), the correction term F d (m) (n), and the frictional force [−μ (τ (m) ) v n (m) ] are updated (step S1807).

次に、第2解法処理部108によって、yn (m)の値をフレームメモリ106に保存する(ステップS1808)。そして、第2解法処理部108によって、τ(m+1)(m)+hと更新し(ステップS1809)、mを1だけ増加する(ステップS1810)。そして、τ(m+1)があらかじめ定められた時間T1を越えたか否かを判断し(ステップS1811)、越えていない場合には、上記ステップS1803からS1810を繰り返し実行する。 Next, the value of y n (m) is stored in the frame memory 106 by the second solution processing unit 108 (step S1808). Then, the second solution processing unit 108 updates τ (m + 1) = τ (m) + h (step S1809), and increases m by 1 (step S1810). Then, it is determined whether or not τ (m + 1) has exceeded a predetermined time T 1 (step S1811). If not, step S1803 to S1810 are repeatedly executed.

次に、ステップS1804における弾性エネルギー力計算部104による不連続対応弾性力Fdk (m)(n)の計算処理について説明する。図19は、実施の形態1にかかる弾性エネルギー力計算部104による不連続対応弾性力Fdk (m)(n)の計算処理の手順を示すフローチャートである。 Next, the calculation processing of the elastic force F dk (m) (n) corresponding to the discontinuity by the elastic energy force calculation unit 104 in step S1804 will be described. FIG. 19 is a flowchart illustrating a procedure of calculation processing of the discontinuous corresponding elastic force F dk (m) (n) by the elastic energy force calculation unit 104 according to the first embodiment.

まず、弾性エネルギー力計算部104は、mステップにおける格子点n1のラベルz(m)(n1)と格子点n2のラベルz(m)(n2)が等しいか否かを調べる(ステップS1901)。これは、格子点n1と格子点n2は同一の動きパラメータの動きモデルに属するか否かを調べている。 First, elastic energy force calculating unit 104 checks whether the label z grid point n 1 in m steps (m) (n 1) and the grid point n 2 label z (m) (n 2) is equal to ( Step S1901). This is to check whether the lattice point n 1 and the lattice point n 2 belong to a motion model having the same motion parameter.

そして、格子点n1のラベルz(m)(n1)と格子点n2のラベルz(m)(n2)が等しい場合(ステップS1901:Yes)、すなわち、格子点n1と格子点n2は同一の動きパラメータの動きモデルに属する場合には、格子点n1と格子点n2の間の弾性係数k(m)(n1,n2)をk1,に設定する(ステップS1902)。そして、不連続対応弾性力Fdk (m)(n)を(72)式により計算する(ステップS1904)。 When the grid point n 1 label z (m) (n 1) and the grid point n 2 label z (m) (n 2) are equal (step S1901: Yes), i.e., grid points n 1 and the lattice point If n 2 belongs to the motion model having the same motion parameter, the elastic coefficient k (m) (n 1 , n 2 ) between the lattice point n 1 and the lattice point n 2 is set to k 1 , (step S1902). Then, the discontinuous corresponding elastic force F dk (m) (n) is calculated by the equation (72) (step S1904).

一方、ステップS1901において、格子点n1のラベルz(m)(n1)と格子点n2のラベルz(m)(n2)が等しくない場合(ステップS1901:No)、すなわち、格子点n1と格子点n2が異なる動きパラメータの動きモデルに属する場合には、弾性係数k(m)(n1,n2)を0に設定する(ステップS1903)。これにより、(72)式によって不連続対応弾性力Fdk (m)(n)は0となる。なお、ステップS1901からS1903までの処理は、(71)式を実行する処理である。 On the other hand, in step S1901, if the grid point n 1 label z (m) (n 1) and the grid point n 2 label z (m) (n 2) are not equal (Step S1901: No), i.e., grid points If n 1 and lattice point n 2 belong to motion models having different motion parameters, the elastic coefficient k (m) (n 1 , n 2 ) is set to 0 (step S1903). As a result, the discontinuity-corresponding elastic force F dk (m) (n) becomes zero according to equation (72). Note that the processing from step S1901 to S1903 is processing for executing equation (71).

このようにして計算された不連続対応弾性力は、ステップS1807で、更新式(77)式の項に入力されることになる。   The discontinuity-corresponding elastic force calculated in this way is input to the term of the update equation (77) in step S1807.

このように実施の形態1にかかる画像マッチング装置100では、更新式(55)、(56)式による局所的な動的マッチング処理が終了した後、参照画像を複数の領域に分割して各領域ごとに、第2の格子点の動きを規定した動きモデルを分類するための動きパラメータの最適な動きパラメータを求めて動きモデルを示す第2の運動方程式(77)式の数値解析による解法処理を行って、対象画像と前記参照画像との対応関係を求めているので、領域境界の不連続性と領域内の一様性をロバストに表現できるようになり、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができる。   As described above, in the image matching apparatus 100 according to the first embodiment, after the local dynamic matching process according to the update equations (55) and (56) is finished, the reference image is divided into a plurality of regions and each region is divided. For each, the optimal motion parameter of the motion parameter for classifying the motion model defining the motion of the second grid point is obtained, and the solution processing by numerical analysis of the second motion equation (77) indicating the motion model is performed. Since the correspondence between the target image and the reference image is obtained, the discontinuity of the region boundary and the uniformity within the region can be expressed robustly, and more accurate image matching can be performed. As a result, an interpolation frame with higher image quality can be generated.

(実施の形態2)
実施の形態2にかかる画像マッチング装置は、動きパラメータの推定処理において、ロバスト統計の手法であるM推定を利用したものである。
(Embodiment 2)
The image matching apparatus according to the second embodiment uses M estimation, which is a robust statistical technique, in motion parameter estimation processing.

実施の形態1では、動きパラメータ推定処理において、動きパラメータと得られた動きベクトルの誤差がガウス分布に従っていると仮定して最小二乗推定法を用いた動きパラメータの推定を行っていた。しかしながら、動きパラメータと動きベクトルの誤差が単純にガウス分布に従っているといえない場合には、ロバスト統計の手法であるM推定を利用することが好ましい。このような場合としては、例えば、画像の一部に大きな外れ値が含まれているような場合であり、動的マッチングにおいて、動きと動きの境界は歪みによってこのような状況になりやすい。   In the first embodiment, in the motion parameter estimation process, the motion parameter is estimated using the least square estimation method on the assumption that the error between the motion parameter and the obtained motion vector follows a Gaussian distribution. However, when it cannot be said that the error between the motion parameter and the motion vector simply follows a Gaussian distribution, it is preferable to use M estimation, which is a robust statistical technique. Such a case is, for example, a case where a large outlier is included in a part of an image, and in dynamic matching, the boundary between motion and motion tends to be in such a situation due to distortion.

実施の形態2にかかる画像マッチング装置の構成は実施の形態1と同様である。また、実施の形態2における画像マッチングの全体処理、局所的な動的マッチング処理、動きクラスタリング処理、動きパラメータ割り当て処理、補正項を付した動的マッチング処理については、実施の形態1と同様に行われる。   The configuration of the image matching apparatus according to the second embodiment is the same as that of the first embodiment. The overall image matching process, local dynamic matching process, motion clustering process, motion parameter assignment process, and dynamic matching process with correction terms in the second embodiment are the same as in the first embodiment. Is called.

M推定における標準正規変数z(n)は、(78)式で示される。TukeyのBiweight法によると重み関数w(n)は、(79)式で示される

Figure 2007257518
ここで、c(>0)は定数であり、正規分布の場合にはc=6.0となる。動きパラメータ推定部110は、重み関数w(n)を用いて標本平均z(i)、標本偏差s(i)を(80)式のように計算する。 A standard normal variable z (n) in the M estimation is expressed by equation (78). According to Tukey's Biweight method, the weight function w (n) is expressed by equation (79).
Figure 2007257518
Here, c (> 0) is a constant, and c = 6.0 in the case of normal distribution. The motion parameter estimation unit 110 calculates the sample average z (i) and the sample deviation s (i) using the weight function w (n) as shown in Equation (80).

Figure 2007257518
ここで上付の(i)は、イテレーションを示している。また、動きパラメータ推定部110では、母分散は、標本偏差標本偏差s(i)を(81−1)、(81−2)式で示すようにプラグインして推定することとする。
Figure 2007257518
Here, the superscript (i) indicates an iteration. In the motion parameter estimation unit 110, the population variance is estimated by plugging in the sample deviation sample deviation s (i) as shown by the equations (81-1) and (81-2).

Figure 2007257518
そして、動きパラメータ推定部110によって、母標準偏差の計算と重み関数の計算を交互にI回繰り返すことによってM推定による動きパラメータの推定が行われる。
Figure 2007257518
Then, the motion parameter estimation unit 110 performs motion parameter estimation by M estimation by alternately repeating the calculation of the mother standard deviation and the weighting function I times.

図20は、実施の形態2にかかる動きパラメータ推定部110による動きパラメータ推定処理の手順を示すフローチャートである。まず、動きパラメータ推定部110は、重みw(n)を1に初期化する(ステップS2001)。そして、動きクラスタリング処理部109によって求めたラベルαに対して、全ての格子点nに対して、(81−2)式によりAを、(81−3)式によりbを計算する(ステップS2002)。そして、(81−1)式を特異値分解法(もしくはLU法)による数値解析により解法処理を行う(ステップS2003)。   FIG. 20 is a flowchart of a motion parameter estimation process performed by the motion parameter estimation unit 110 according to the second embodiment. First, the motion parameter estimation unit 110 initializes the weight w (n) to 1 (step S2001). Then, with respect to the label α obtained by the motion clustering processing unit 109, A is calculated from the equation (81-2) and b is calculated from the equation (81-3) for all the lattice points n (step S2002). . Then, the equation (81-1) is solved by numerical analysis using the singular value decomposition method (or LU method) (step S2003).

次に、動きパラメータ推定部110は、標準正規変数z(n)を(78)式に従って計算する(ステップS2004)。そして、重み関数w(n)を用いて標本平均z(i)、標本偏差s(i)を(80)式に従って計算する(ステップS2005)。次いで、動きパラメータ推定部110は、重みw(n)を更新し(ステップS2006)、イテレーションiを1増加する(ステップS2007)。そして、iが所定回数Iを越えたか否かを調べ(ステップS2008)、越えていない場合には、ステップS2002からS2007までの処理を繰り返し実行する。 Next, the motion parameter estimation unit 110 calculates the standard normal variable z (n) according to the equation (78) (step S2004). Then, using the weight function w (n), the sample average z (i) and the sample deviation s (i) are calculated according to the equation (80) (step S2005). Next, the motion parameter estimation unit 110 updates the weight w (n) (step S2006) and increases the iteration i by 1 (step S2007). Then, it is checked whether i has exceeded a predetermined number of times I (step S2008). If not, the processes from step S2002 to S2007 are repeatedly executed.

一方、ステップS2008において、iが所定回数Iを越えた場合には、全てのラベルαに対して、上記ステップS1601およびS1602の処理を繰り返して実行する(ステップS2009)。   On the other hand, if i exceeds the predetermined number I in step S2008, the processes in steps S1601 and S1602 are repeated for all labels α (step S2009).

このように実施の形態2にかかる画像マッチング装置では、動きパラメータの推定処理において、ロバスト統計の手法であるM推定を利用しているので、動きパラメータと動きベクトルの誤差がガウス分布に従っていない場合にも、領域境界の不連続性と領域内の一様性をロバストに表現できるようになり、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができる。   As described above, the image matching apparatus according to the second embodiment uses the M estimation, which is a robust statistical technique, in the motion parameter estimation process, and therefore, when the error between the motion parameter and the motion vector does not follow the Gaussian distribution. However, it becomes possible to robustly express the discontinuity of the region boundary and the uniformity within the region, and more accurate image matching can be performed. As a result, a higher quality interpolated frame can be generated. it can.

(実施の形態3)
実施の形態3にかかる画像マッチング装置は、第2の格子点が対象画像上には存在するが参照画像上には存在しない領域であるオクルージョン領域に含まれる場合には、当該格子点において動きパラメータの割り当てをおこなわず、オクルージョン領域に含まれない格子点に対してのみ動きパラメータの割り当てを行うものである。
(Embodiment 3)
In the image matching device according to the third embodiment, when the second grid point is included in the occlusion area, which is an area that exists on the target image but does not exist on the reference image, the motion parameter is determined at the grid point. Is assigned, and motion parameters are assigned only to lattice points not included in the occlusion area.

対象画像上には存在するが参照画像上には存在しない領域は、coveredなオクルージョン領域といい、本来的に画像マッチングを行うことができない領域である。実施の形態1にかかる画像マッチング装置100では、coveredオクルージョン領域にも動きパラメータの割り当てがおこなわれるため、動きパラメータ推定の結果が歪んでしまう場合がある。   An area that exists on the target image but does not exist on the reference image is called a covered occlusion area, and is an area that cannot inherently perform image matching. In the image matching apparatus 100 according to the first embodiment, since motion parameters are also assigned to the covered occlusion area, the result of motion parameter estimation may be distorted.

実施の形態3にかかる画像マッチング装置では、coveredオクルージョン領域をあらかじめ検出しておき、そのオクルージョン領域の格子点には動きパラメータの割り当てをおこなわないようにしている。   In the image matching apparatus according to the third embodiment, a covered occlusion area is detected in advance, and motion parameters are not assigned to lattice points in the occlusion area.

図21は、実施の形態3にかかる画像マッチング装置2100の構成を示すブロック図である。実施の形態3にかかる画像マッチング装置2100では、オクルージョン検出部2101を備えている点が実施の形態1と異なり、他の構成については実施の形態1にかかる画像マッチング装置の構成と同様である。また、実施の形態3における画像マッチングの全体処理、局所的な動的マッチング処理、動きクラスタリング処理、動きパラメータ推定処理、補正項を付した動的マッチング処理については、実施の形態1と同様に行われる。   FIG. 21 is a block diagram of a configuration of an image matching apparatus 2100 according to the third embodiment. The image matching apparatus 2100 according to the third embodiment is different from the first embodiment in that an occlusion detection unit 2101 is provided, and the other configuration is the same as that of the image matching apparatus according to the first embodiment. The overall image matching process, local dynamic matching process, motion clustering process, motion parameter estimation process, and dynamic matching process with correction terms in the third embodiment are performed in the same manner as in the first embodiment. Is called.

オクルージョン検出部2101は、coveredオクルージョン領域を検出する処理部である。図22および図23は、coveredオクルージョン領域の状態を示す説明図である。coveredオクルージョン領域は、図22に示すように、典型的に移動物体の前方に現れる。図22に示す状態では、バネが縮んでいる領域がcoveredオクルージョン領域となる。   The occlusion detection unit 2101 is a processing unit that detects a covered occlusion area. 22 and 23 are explanatory diagrams showing the state of the covered occlusion area. The covered occlusion area typically appears in front of a moving object, as shown in FIG. In the state shown in FIG. 22, the area where the spring is contracted is the covered occlusion area.

このようなcoveredオクルージョン領域は、次のように定式化することができる。図23に示すように、格子点の周囲の8格子を考える。そして、かかる8格子から形成される三角形の面積の和により、元の正方格子からの変形の度合いを調べる。かかる面積S(n)をベクトルの外積により、(82)式のように定義する。面積比r(n)は、正方格子の面積を4として、(83)式で表される。なお、(83)式において、×はベクトルの外積計算をあらわす。   Such a covered occlusion area can be formulated as follows. As shown in FIG. 23, 8 lattices around lattice points are considered. Then, the degree of deformation from the original square lattice is examined by the sum of the areas of the triangles formed from the eight lattices. Such an area S (n) is defined by an outer product of vectors as shown in equation (82). The area ratio r (n) is expressed by the equation (83), where the area of the square lattice is 4. In the equation (83), x represents the vector cross product calculation.

Figure 2007257518
そして、この面積比が閾値Tよりも小さければ、図22に示すような縮んでいる領域である、すなわちcoveredオクルージョン領域の可能性が高い。本実施の形態にかかるオクルージョン検出部2101では、(83)式に示す面積比を閾値Tと比較することにより、オクルージョン領域か否かを判定している。そして、動きパラメータ割り当て部111では、オクルージョン検出部2101によりcoveredオクルージョン領域であると判定された格子点に関しては、動きパラメータの割り当てをおこなわないように構成している。
Figure 2007257518
If the area ratio is smaller than the threshold value T, there is a high possibility that the area is shrunk as shown in FIG. 22, that is, a covered occlusion area. The occlusion detection unit 2101 according to the present embodiment determines whether or not it is an occlusion region by comparing the area ratio shown in the equation (83) with a threshold value T. The motion parameter assignment unit 111 is configured not to assign a motion parameter to a lattice point determined to be a covered occlusion region by the occlusion detection unit 2101.

図24は、実施の形態2にかかる画像マッチング装置2100による動きパラメータ割り当て処理の手順を示すフローチャートである。   FIG. 24 is a flowchart of a motion parameter assignment process performed by the image matching apparatus 2100 according to the second embodiment.

まず、オクルージョン検出部2101は、格子点の周囲の8格子から形成される三角形の面積の総和S(n)を(82)式により計算する(ステップS2401)。次に、オクルージョン検出部2101は、S(n)を用いて面積比r(n)を(83)式により計算する(ステップS2402)。   First, the occlusion detection unit 2101 calculates the total area S (n) of the triangles formed from the eight lattices around the lattice points using the equation (82) (step S2401). Next, the occlusion detection unit 2101 uses S (n) to calculate the area ratio r (n) using the equation (83) (step S2402).

次に、オクルージョン検出部2101は、面積比r(n)が所定の閾値Tより小さいか否か、すなわちオクルージョン領域か否かを判定する(ステップS2403)。そして、面積比r(n)が所定の閾値Tより小さくない場合(ステップS2403:No)、すなわち、オクルージョン領域でない場合には、動きパラメータ割り当て部111は、全てのラベルαに対して、(76)式に示すコスト関数G(n)が最小になるα0を求める(ステップS2404)。そして、動きパラメータ割り当て部111は、α0を格子点nに対するラベルとして設定する(ステップS2405)。かかる処理により、格子点nに最適な動きパラメータが割り当てられたことになる。 Next, the occlusion detection unit 2101 determines whether the area ratio r (n) is smaller than a predetermined threshold T, that is, whether the area is an occlusion region (step S2403). When the area ratio r (n) is not smaller than the predetermined threshold T (step S2403: No), that is, when the area ratio r (n) is not an occlusion area, the motion parameter assignment unit 111 sets (76 for all labels α. ) Α 0 that minimizes the cost function G (n) shown in equation (2) is obtained (step S2404). Then, the motion parameter assignment unit 111 sets α 0 as a label for the lattice point n (step S2405). With this process, the optimum motion parameter is assigned to the lattice point n.

一方、ステップS2403において、面積比r(n)が所定の閾値Tより小さい場合(ステップS2403:Yes)、すなわち、オクルージョン領域である場合には、ステップS2404およびS2405の最適な動きパラメータが割り当て処理は行わない。   On the other hand, in step S2403, if the area ratio r (n) is smaller than the predetermined threshold T (step S2403: Yes), that is, if it is an occlusion region, the optimal motion parameters in steps S2404 and S2405 are assigned. Not performed.

そして、動きパラメータ割り当て部111は、上記ステップS2401からS2405の処理を全ての格子点nに対して繰り返し実行する(ステップS2406)。これにより、オクルージョン領域でない全ての格子点nに対して最適な動きパラメータが割り当てられることになる。   Then, the motion parameter assignment unit 111 repeatedly executes the processing of steps S2401 to S2405 for all the lattice points n (step S2406). As a result, an optimal motion parameter is assigned to all lattice points n that are not in the occlusion region.

このように実施の形態3にかかる画像マッチング装置では、coveredオクルージョン領域をあらかじめ検出しておき、そのオクルージョン領域の格子点には動きパラメータの割り当てを行わないので、coveredオクルージョンによる歪みを最小限に抑えることができ、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができる。   As described above, in the image matching apparatus according to the third embodiment, the covered occlusion area is detected in advance, and no motion parameter is assigned to the lattice point of the occlusion area, so that distortion due to the covered occlusion is minimized. Therefore, more accurate image matching can be performed, and as a result, an interpolation frame with higher image quality can be generated.

(実施の形態4)
実施の形態4にかかる画像マッチング装置では、信頼性の低い領域に対しては動きパラメータの割り当てを行わないものである。
(Embodiment 4)
In the image matching apparatus according to the fourth embodiment, motion parameters are not assigned to regions with low reliability.

実施の形態1にかかる画像マッチング装置では、動きパラメータ割り当て処理の最適化を全て信頼していた。しかしながら、実際には動きパラメータ割り当て処理の最適化の信頼度が低い領域も存在する。例えば、動きパラメータの最適値に近似する値が二つ以上存在するような場合には、信頼性が低いと言える。すなわち、異なる動きパラメータに対して、最適値に近似する値が二つ以上存在するような場合は、コスト関数面が多峰性になっていると考えられ、動きパラメータの最適値の信頼度は低いと考えられる。本実施の形態では、このような低信頼領域に対しては動きパラメータの割り当て処理を行わないように構成している。   In the image matching apparatus according to the first embodiment, all optimization of the motion parameter assignment process is trusted. However, there is actually a region where the reliability of optimization of the motion parameter assignment process is low. For example, if there are two or more values that approximate the optimal value of the motion parameter, it can be said that the reliability is low. That is, when there are two or more values that approximate the optimal value for different motion parameters, the cost function surface is considered to be multimodal, and the reliability of the optimal value of the motion parameter is It is considered low. In the present embodiment, the motion parameter assignment process is not performed for such a low-reliability region.

実施の形態4かかる画像マッチング装置の構成は、実施の形態1と同様である。また、実施の形態4における画像マッチングの全体処理、局所的な動的マッチング処理、動きクラスタリング処理、動きパラメータ推定処理、補正項を付した動的マッチング処理については、実施の形態1と同様に行われる。   The configuration of the image matching apparatus according to the fourth embodiment is the same as that of the first embodiment. The overall image matching process, local dynamic matching process, motion clustering process, motion parameter estimation process, and dynamic matching process with correction terms in the fourth embodiment are performed in the same manner as in the first embodiment. Is called.

本実施の形態にかかる動きパラメータ割り当て部111では、格子点が低信頼領域に含まれるか否かを判定して低信頼性領域に含まれる場合には、動きパラメータの割り当てをおこなわない処理を行っている。   The motion parameter assignment unit 111 according to the present embodiment determines whether or not a lattice point is included in the low reliability region, and performs a process that does not assign a motion parameter when the lattice point is included in the low reliability region. ing.

低信頼領域の判定は、(84)式により定式化することができる。   The determination of the low reliability region can be formulated by the equation (84).

Figure 2007257518
ここで、α0は、求めた最適なラベルであり、α1は次に最適なラベルである。また、ε(>0)は定数である。ただし、動きパラメータの値が近似する場合には、(84)式に該当する場合があるため、(85)式を満たすほど動きパラメータが近似する場合には、(84)式は適用しないこととする。
Figure 2007257518
Here, α 0 is the optimum label obtained, and α 1 is the next optimum label. Also, ε (> 0) is a constant. However, when the motion parameter value approximates, it may correspond to the equation (84). Therefore, when the motion parameter approximates to satisfy the equation (85), the equation (84) is not applied. To do.

Figure 2007257518
図25は、実施の形態4にかかる動きパラメータ割り当て部111による動きパラメータ割り当て処理の手順を示すフローチャートである。まず、動きパラメータ割り当て部111は、全てのラベルαに対して、(76)式に示すコスト関数G(n)が最小になるα0を求める(ステップS2501)。次に、動きパラメータ割り当て部111は、α0より一つ大きいα1、すなわち次に最適なラベルを求める(ステップS2502)。
Figure 2007257518
FIG. 25 is a flowchart of a motion parameter assignment process performed by the motion parameter assignment unit 111 according to the fourth embodiment. First, the motion parameter assignment unit 111 obtains α 0 that minimizes the cost function G (n) expressed by the equation (76) for all labels α (step S2501). Next, the motion parameter assignment unit 111 obtains α 1 which is one greater than α 0 , that is, the next optimal label (step S2502).

次に、動きパラメータが近似するか否か、すなわち(85)式が成立するか否かを調べる(ステップS2503)。そして、(85)式が成立しない場合には、(86)式が成立するか否かにより低信頼性領域か否かを調べる(ステップS2504)。   Next, it is examined whether or not the motion parameter is approximate, that is, whether or not the equation (85) is satisfied (step S2503). If the formula (85) is not satisfied, it is checked whether or not the low reliability region is satisfied based on whether the formula (86) is satisfied (step S2504).

そして、(86)式が成立せず低信頼性領域でないと判断された場合には(ステップS2504:No)、ステップS2501で求めたα0を格子点nに対する最適なラベルと設定する(ステップS2505)。一方、ステップS2504において、(86)式が成立して低信頼性領域であると判断された場合には(ステップS2504:Yes)、ステップS2505の処理は行わず、最適なラベルの割り当て、すなわち最適な動きパラメータの割り当ては行われない。 If it is determined that equation (86) is not satisfied and the region is not a low-reliability region (step S2504: No), α 0 obtained in step S2501 is set as an optimum label for the lattice point n (step S2505). ). On the other hand, if it is determined in step S2504 that the expression (86) is satisfied and the region is a low-reliability region (step S2504: Yes), the process of step S2505 is not performed, and optimal label allocation, that is, optimal No assignment of motion parameters is performed.

また、ステップS2503において、動きパラメータが近似する場合、すなわち(85)式が成立する場合には(ステップS2503:Yes)、ステップS2404の低信頼性領域の判定処理を行わず、ステップS2501で求めたα0を格子点nに対する最適なラベルと設定する(ステップS2505)。 If the motion parameter is approximated in step S2503, that is, if equation (85) is satisfied (step S2503: Yes), the low-reliability region determination process in step S2404 is not performed, and the determination is performed in step S2501. α 0 is set as an optimum label for the lattice point n (step S2505).

かかる処理により、格子点nに最適な動きパラメータが割り当てられたことになる。そして、動きパラメータ割り当て部111は、上記ステップS2501からS2505までの処理を全ての格子点nに対して繰り返し実行する(ステップS2506)。   With this process, the optimum motion parameter is assigned to the lattice point n. Then, the motion parameter assignment unit 111 repeatedly executes the processing from step S2501 to S2505 for all the lattice points n (step S2506).

このように実施の形態4にかかる画像マッチング装置では、信頼性の低い領域に対しては動きパラメータの割り当てを行わないので、領域境界の不連続性と領域内の一様性をロバストに表現できるようになり、より高精度な画像マッチングを行うことができ、その結果、より高画質な補間フレームを生成することができる。   As described above, in the image matching apparatus according to the fourth embodiment, since motion parameters are not assigned to regions with low reliability, discontinuity of region boundaries and uniformity within regions can be expressed robustly. As a result, more accurate image matching can be performed, and as a result, an interpolation frame with higher image quality can be generated.

実施の形態1〜4の画像マッチング装置は、CPUなどの制御装置と、ROM(ReadOnlyMemory)やRAMなどの記憶装置と、HDD、CDドライブ装置などの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボードやマウスなどの入力装置を備えており、通常のコンピュータを利用したハードウェア構成となっている。   The image matching devices according to the first to fourth embodiments include a control device such as a CPU, a storage device such as a ROM (Read Only Memory) and a RAM, an external storage device such as an HDD and a CD drive device, and a display device such as a display device. It has an input device such as a keyboard and a mouse, and has a hardware configuration using a normal computer.

実施の形態1〜4の画像マッチング装置で実行される画像マッチングプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。   The image matching program executed by the image matching apparatus according to the first to fourth embodiments is a file in an installable or executable format, and is a CD-ROM, flexible disk (FD), CD-R, DVD (Digital Versatile Disk). And the like recorded on a computer-readable recording medium.

また、実施の形態1〜4の画像マッチング装置で実行される画像マッチングプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施形態の画像マッチング装置で実行される画像マッチングプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。   Further, the image matching program executed by the image matching apparatus according to the first to fourth embodiments may be provided by being stored on a computer connected to a network such as the Internet and downloaded via the network. good. Further, the image matching program executed by the image matching apparatus of the present embodiment may be provided or distributed via a network such as the Internet.

また、本実施の形態の画像マッチングプログラムを、ROM等に予め組み込んで提供するように構成してもよい。   Further, the image matching program of the present embodiment may be configured to be provided by being incorporated in advance in a ROM or the like.

実施の形態1〜4の画像マッチング装置で実行される画像マッチングプログラムは、上述した各部(第1解法処理部101と、画像エネルギー力計算部103と、弾性エネルギー力計算部104と、摩擦力計算部105と、第2解法処理部108と、動きクラスタリング処理部109と、動きパラメータ推定部110と、動きパラメー割り当て部111と、補正項計算部112と、マッピング処理部107、オクルージョン検出部2101)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から画像マッチングプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、上記各部(第1解法処理部101と、画像エネルギー力計算部103と、弾性エネルギー力計算部104と、摩擦力計算部105と、第2解法処理部108と、動きクラスタリング処理部109と、動きパラメータ推定部110と、動きパラメー割り当て部111と、補正項計算部112と、マッピング処理部107、オクルージョン検出部2101)が主記憶装置上に生成されるようになっている。   The image matching program executed by the image matching apparatus according to the first to fourth embodiments includes the above-described units (first solution processing unit 101, image energy force calculation unit 103, elastic energy force calculation unit 104, and friction force calculation). Unit 105, second solution processing unit 108, motion clustering processing unit 109, motion parameter estimation unit 110, motion parameter allocation unit 111, correction term calculation unit 112, mapping processing unit 107, occlusion detection unit 2101) As the actual hardware, a CPU (processor) reads out and executes an image matching program from the storage medium, and the respective units are loaded onto the main storage device. Solution processing unit 101, image energy force calculation unit 103, elastic energy force Arithmetic unit 104, frictional force calculation unit 105, second solution processing unit 108, motion clustering processing unit 109, motion parameter estimation unit 110, motion parameter allocation unit 111, correction term calculation unit 112, and mapping process Unit 107 and occlusion detection unit 2101) are generated on the main memory.

なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施の形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態にわたる構成要素を適宜組み合わせても良い。   It should be noted that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the above embodiments. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

実施の形態1にかかる画像マッチング装置の構成を示すブロック図である。1 is a block diagram illustrating a configuration of an image matching apparatus according to a first embodiment. 対象画像上の曲面から参照画像上の曲面への写像を示す説明図である。It is explanatory drawing which shows the mapping from the curved surface on a target image to the curved surface on a reference image. 対象画像上の曲面Xの点xから参照画像上の曲面Yの点yへの写像を示す説明図である。It is explanatory drawing which shows the mapping from the point x of the curved surface X on a target image to the point y of the curved surface Y on a reference image. ポテンシャルエネルギーの最小化の点を探索する場合の静的な最適点の説明をするための模式図である。It is a schematic diagram for demonstrating the static optimal point in the case of searching the point of potential energy minimization. ポテンシャルエネルギーの最小化の点を探索する場合の大域的な最適点の説明をするための模式図である。It is a schematic diagram for demonstrating the global optimal point in the case of searching for the point of potential energy minimization. 画像エネルギー力の概念を示す説明図である。It is explanatory drawing which shows the concept of image energy force. 画像エネルギー力の概念を示す説明図である。It is explanatory drawing which shows the concept of image energy force. 動きモデルを利用した動き推定の画像上における状態を示す説明図である。It is explanatory drawing which shows the state on the image of the motion estimation using a motion model. 画像上のオブジェクトの一部が誤った動きで画像マッチングされている状態を示す説明図である。It is explanatory drawing which shows the state by which the part of the object on an image is image-matched by the incorrect motion. 実施の形態1にかかるパラメトリック動きモデルを導入して動き分割を用いた画像マッチングの概念的な流れを示す説明図である。It is explanatory drawing which shows the conceptual flow of the image matching which introduce | transduced the parametric motion model concerning Embodiment 1 and used motion division. マッチング対象領域と動きパラメータの推定精度の関係を説明するための模式図である。It is a schematic diagram for demonstrating the relationship between a matching object area | region and the estimation accuracy of a motion parameter. 実施の実施の形態1にかかる画像マッチング装置100による画像マッチングの全体処理の手順を示すフローチャートである。3 is a flowchart illustrating a procedure of overall image matching processing by the image matching apparatus 100 according to the first embodiment; 実施の形態1にかかる局所的な動的マッチング処理の手順を示すフローチャートである。3 is a flowchart showing a procedure of local dynamic matching processing according to the first exemplary embodiment; 画像エネルギー力計算部103による画像エネルギー力の計算処理の手順を示すフローチャートである。5 is a flowchart illustrating a procedure of image energy force calculation processing by an image energy force calculation unit 103. 実施の形態1にかかる動きクラスタリング処理部109により動きクラスタリング処理の手順を示すフローチャートである。10 is a flowchart showing a procedure of motion clustering processing by the motion clustering processing unit 109 according to the first embodiment. 実施の形態1にかかる動きパラメータ推定部110による動きパラメータ推定処理の手順を示すフローチャートである。3 is a flowchart showing a procedure of motion parameter estimation processing by a motion parameter estimation unit 110 according to the first exemplary embodiment. 実施の形態1にかかる動きパラメータ割り当て部111による動きパラメータ割り当て処理の手順を示すフローチャートである。4 is a flowchart illustrating a procedure of motion parameter assignment processing by a motion parameter assignment unit 111 according to the first embodiment. 実施の形態1にかかる補正項を付加した動的マッチング処理の手順を示すフローチャートである。6 is a flowchart showing a procedure of dynamic matching processing to which a correction term according to the first embodiment is added. 実施の形態1にかかる弾性エネルギー力計算部104による不連続対応弾性力Fdk (m)(n)の計算処理の手順を示すフローチャートである。4 is a flowchart illustrating a procedure of calculation processing of a discontinuity-corresponding elastic force F dk (m) (n) by an elastic energy force calculation unit 104 according to the first embodiment. 実施の形態2にかかる動きパラメータ推定部110による動きパラメータ推定処理の手順を示すフローチャートである。10 is a flowchart showing a procedure of motion parameter estimation processing by a motion parameter estimation unit 110 according to the second exemplary embodiment. 実施の形態3にかかる画像マッチング装置2100の構成を示すブロック図である。It is a block diagram which shows the structure of the image matching apparatus 2100 concerning Embodiment 3. FIG. coveredオクルージョン領域を説明するための模式図である。It is a schematic diagram for demonstrating a covered occlusion area | region. coveredオクルージョン領域を説明するための模式図である。It is a schematic diagram for demonstrating a covered occlusion area | region. 実施の形態2にかかる画像マッチング装置2100による動きパラメータ割り当て処理の手順を示すフローチャートである。12 is a flowchart illustrating a procedure of motion parameter assignment processing by the image matching apparatus 2100 according to the second embodiment. 実施の形態4にかかる動きパラメータ割り当て部111による動きパラメータ割り当て処理の手順を示すフローチャートである。14 is a flowchart illustrating a procedure of motion parameter assignment processing by a motion parameter assignment unit 111 according to the fourth embodiment.

符号の説明Explanation of symbols

100,2100 画像マッチング装置
101 第1解法処理部
103 画像エネルギー力計算部
104 弾性エネルギー力計算部
105 摩擦力計算部
106 フレームメモリ
107 マッピング処理部
108 第2解法処理部
109 動きクラスタリング処理部
110 動きパラメータ推定部
111 動きパラメー割り当て部
112 補正項計算部
2101 オクルージョン検出部
100, 2100 Image matching device 101 First solution processor 103 Image energy force calculator 104 Elastic energy force calculator 105 Friction force calculator 106 Frame memory 107 Mapping processor 108 Second solution processor 109 Motion clustering processor 110 Motion parameters Estimation unit 111 Motion parameter assignment unit 112 Correction term calculation unit 2101 Occlusion detection unit

Claims (17)

対象画像と参照画像との間の対応関係を求める画像マッチング装置であって、
前記対象画像上の複数の第1の格子点の各々と前記参照画像上で当該第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーを計算するとともに、前記各第2の格子点の位置と当該第2の格子点に対応する前記各第1の格子点の位置とに基づいて前記ポテンシャルエネルギーの勾配により前記第2の格子点が受ける画像エネルギー力を計算する画像エネルギー力計算部と、
前記各第2の格子点と当該第2の格子点に隣接する他の第2の格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する弾性エネルギー力計算部と、
前記各第2の格子点に作用する摩擦力を計算する摩擦力計算部と、
前記画像エネルギー力と前記第1の弾性エネルギー力と前記摩擦力とによる前記各第2の格子点に関する第1の運動方程式を数値解析により解法処理を行う第1の解法処理部と、
前記第1の解法処理部による解法処理の結果から、前記参照画像を複数の領域に分割して、分割した領域ごとに領域を識別するラベルを割り当てる動きクラスタリング処理部と、
前記ラベルが割り当てられた領域における前記第2の格子点と前記第1の格子点の写像関係を示す動きモデルを規定するパラメータである第1の動きパラメータを数値解析により推定する動きパラメータ推定部と、
推定された前記第1の動きパラメータによって定まる前記対象画像上の点および前記参照画像上の点の間の前記ポテンシャルエネルギーが最小になるように前記第1の動きパラメータを修正する動きパラメータ修正部と、
修正された前記第1の動きパラメータから、前記ラベルに対応する領域内の各第2の格子点に対して最適な前記第1の動きパラメータである第2の動きパラメータを決定し、決定された前記第2の動きパラメータを、前記ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当て部と、
割り当てられた前記第2の動きパラメータと前記第1の解法処理部による解法処理の結果とに基づいて、前記第1の運動方程式を補正する補正項を算出する補正項計算部と、
前記第1の運動方程式に前記補正項を加えた前記各第2の格子点に関する第2の運動方程式を数値解析により解法処理を行う第2の解法処理部と
前記第2の解法処理部による解法処理の結果から前記対象画像と前記参照画像との対応関係を求めるマッピング処理部と、
を備えたことを特徴とする画像マッチング装置。
An image matching device for obtaining a correspondence between a target image and a reference image,
There is an image correlation between each of the plurality of first grid points on the target image and each of the plurality of second grid points corresponding to the first grid points on the reference image. Based on the potential energy gradient based on the position of each second grid point and the position of each first grid point corresponding to the second grid point. An image energy force calculator for calculating the image energy force received by the grid points;
An elastic energy force calculator that calculates a first elastic energy force received from elastic energy between each second lattice point and another second lattice point adjacent to the second lattice point;
A friction force calculator for calculating a friction force acting on each of the second lattice points;
A first solution processing unit that solves the first equation of motion related to each second lattice point by the image energy force, the first elastic energy force, and the friction force by numerical analysis;
A motion clustering processing unit that divides the reference image into a plurality of regions and assigns a label for identifying the region to each of the divided regions, as a result of the solution processing by the first solution processing unit;
A motion parameter estimator that estimates, by numerical analysis, a first motion parameter that is a parameter that defines a motion model indicating a mapping relationship between the second lattice point and the first lattice point in the region to which the label is assigned; ,
A motion parameter correction unit that corrects the first motion parameter so that the potential energy between the point on the target image and the point on the reference image determined by the estimated first motion parameter is minimized; ,
From the corrected first motion parameter, a second motion parameter that is the first motion parameter optimal for each second grid point in the region corresponding to the label is determined and determined. A motion parameter assigning unit that assigns the second motion parameter to each second grid point in the region corresponding to the label;
A correction term calculation unit that calculates a correction term for correcting the first equation of motion based on the assigned second motion parameter and the result of the solution processing by the first solution processing unit;
A second solution processing unit that solves the second equation of motion relating to each of the second lattice points obtained by adding the correction term to the first equation of motion by numerical analysis; and a solution by the second solution processing unit A mapping processing unit for obtaining a correspondence relationship between the target image and the reference image from a processing result;
An image matching apparatus comprising:
前記動きパラメータ推定部は、前記動きパラメータを、前記ラベルに基づいて最小二乗法による数値解析処理により推定することを特徴とする請求項1に記載の画像マッチング装置。   The image matching apparatus according to claim 1, wherein the motion parameter estimation unit estimates the motion parameter by a numerical analysis process using a least square method based on the label. 前記動きパラメータ推定部は、前記動きパラメータを、前記ラベルに基づいてM推定による数値解析により推定することを特徴とする請求項1に記載の画像マッチング装置。   The image matching apparatus according to claim 1, wherein the motion parameter estimation unit estimates the motion parameter by numerical analysis based on M estimation based on the label. 前記動きパラメータ修正部は、最急降下法を用いて前記ポテンシャルエネルギーが最小となる点を求めることにより、前記動きパラメータを修正することを特徴とする請求項1に記載の画像マッチング装置。   The image matching apparatus according to claim 1, wherein the motion parameter correction unit corrects the motion parameter by obtaining a point at which the potential energy is minimum using a steepest descent method. 前記弾性エネルギー力計算部は、さらに、前記第2の格子点と前記第2の動きパラメータによって定められる前記第2の格子点の動き後の第3の格子点との間の弾性エネルギーから受ける第2の弾性エネルギー力を計算し、
前記第2の解法処理部は、前記画像エネルギー力と前記第2の弾性エネルギー力と前記摩擦力と前記補正項とによる前記第2の運動方程式を数値解析により解法処理を行うことを特徴とする請求項1に記載の画像マッチング装置。
The elastic energy force calculation unit further receives a first energy received from an elastic energy between the second lattice point and the third lattice point after the movement of the second lattice point determined by the second motion parameter. Calculate the elastic energy force of 2,
The second solution processing unit performs solution processing by numerical analysis on the second equation of motion based on the image energy force, the second elastic energy force, the friction force, and the correction term. The image matching apparatus according to claim 1.
前記弾性エネルギー力計算部は、前記ラベルが同一の領域における前記第2の格子点と前記第3の格子点に関しては前記第2の弾性エネルギー力を計算し、前記ラベルが異なる領域における前記第2の格子点と前記第3の格子点に関しては前記第2の弾性エネルギー力が前記ラベルが同一の領域の場合より小さい値になるように計算することを特徴とする請求項5に記載の画像マッチング装置。   The elastic energy force calculation unit calculates the second elastic energy force for the second lattice point and the third lattice point in the region where the label is the same, and the second elastic energy force in the region where the label is different. 6. The image matching according to claim 5, wherein the second elastic energy force is calculated to be smaller than that in the case where the label is in the same region with respect to the grid point and the third grid point. apparatus. 前記補正項計算部は、前記第2の動きパラメータに基づいた動きベクトルと、前記第2の格子点の動きベクトルの差に基づいて前記補正項を算出することを特徴とする請求項1に記載の画像マッチング装置。   The correction term calculation unit calculates the correction term based on a difference between a motion vector based on the second motion parameter and a motion vector of the second grid point. Image matching device. 前記補正項計算部は、前記第2の動きパラメータに基づいた動きベクトルと、前記第2の格子点の動きベクトルの差を入力とした線形関数の出力を前記補正項として算出することを特徴とする請求項7に記載の画像マッチング装置。   The correction term calculation unit calculates, as the correction term, an output of a linear function having a difference between a motion vector based on the second motion parameter and a motion vector of the second grid point as an input. The image matching device according to claim 7. 前記補正項計算部は、前記第2の動きパラメータに基づいた動きベクトルと、前記第2の格子点の動きベクトルの差が所定値以上となる場合には、前記差を入力とした非線形関数の出力を前記補正項として算出することを特徴とする請求項7に記載の画像マッチング装置。   When the difference between the motion vector based on the second motion parameter and the motion vector of the second lattice point is equal to or greater than a predetermined value, the correction term calculation unit calculates a nonlinear function using the difference as an input. The image matching apparatus according to claim 7, wherein an output is calculated as the correction term. 前記動きパラメータ割り当て部は、前記第2の格子点と前記第1の格子点の画素値の差分値に基づいたコスト関数により前記ラベルを規定し、前記コスト関数が最小値となる前記ラベルを前記第2の動きパラメータとして前記第2の格子点に割り当てることを特徴とする請求項1に記載の画像マッチング装置。   The motion parameter assignment unit defines the label by a cost function based on a difference value between pixel values of the second grid point and the first grid point, and sets the label having the minimum cost function as the label. The image matching apparatus according to claim 1, wherein the second motion parameter is assigned to the second grid point. 前記動きパラメータ割り当て部は、前記ラベルの連続性の拘束を加えた前記コスト関数により前記ラベルを規定し、前記コスト関数が最小値となる前記ラベルを前記第2の動きパラメータとして前記第2の格子点に割り当てることを特徴とする請求項10に記載の画像マッチング装置。   The motion parameter allocating unit defines the label by the cost function to which the continuity of the label is added, and uses the label having the minimum cost function as the second motion parameter as the second lattice. The image matching apparatus according to claim 10, wherein the image matching apparatus is assigned to a point. 前記動きパラメータ割り当て部は、最適であると決定された前記ラベルの前記コスト関数の値と当該ラベルの次に第2の前記ラベルの前記コスト関数の値とが第1の範囲内にある場合には、前記第2の動きパラメータを前記ラベルに対応する領域内の各第2の格子点に対して割り当てないことを特徴とする請求項10に記載の画像マッチング装置。   The motion parameter allocating unit is configured such that the value of the cost function of the label determined to be optimal and the value of the cost function of the second label next to the label are within a first range. The image matching apparatus according to claim 10, wherein the second motion parameter is not assigned to each second grid point in an area corresponding to the label. 前記動きパラメータ割り当て部は、さらに、最適であると決定された前記ラベルの前記コスト関数の値と当該ラベルの次に最適な前記ラベルの前記コスト関数の値とが第2の範囲内にある場合には、前記第2の動きパラメータを前記ラベルに対応する領域内の各第2の格子点に対して割り当てることを特徴とする請求項12に記載の画像マッチング装置。   The motion parameter allocating unit further includes a case where the value of the cost function of the label determined to be optimal and the value of the cost function of the label optimal next to the label are within a second range. The image matching apparatus according to claim 12, wherein the second motion parameter is assigned to each second grid point in an area corresponding to the label. 前記対象画像に存在するが前記参照画像に存在しない領域であるオクルージョン領域を検出するオクルージョン検出部と、
前記動きパラメータ割り当て部は、前記第2の格子点が前記オクルージョン領域に含まれる場合に、前記オクルージョン領域に含まない前記第2の格子点に対してのみ前記第2の動きパラメータを割り当てることを特徴とする請求項1に記載の画像マッチング装置。
An occlusion detection unit that detects an occlusion region that is present in the target image but is not present in the reference image;
The motion parameter assignment unit assigns the second motion parameter only to the second lattice point not included in the occlusion region when the second lattice point is included in the occlusion region. The image matching apparatus according to claim 1.
前記オクルージョン検出部は、前記第2の格子点の周囲の格子点から形成される面積と前記参照画像における前記第2の格子点に対応する前記第1の格子点の周囲の格子点から形成される面積との比に基づいて前記オクルージョン領域を検出することを特徴とする請求項14に記載の画像マッチング装置。   The occlusion detection unit is formed from an area formed from grid points around the second grid point and grid points around the first grid point corresponding to the second grid point in the reference image. The image matching apparatus according to claim 14, wherein the occlusion region is detected based on a ratio to a certain area. 対象画像と参照画像との間の対応関係を求める画像マッチング方法であって、
前記対象画像上の複数の第1の格子点の各々と前記参照画像上で当該第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーを計算するとともに、前記各第2の格子点の位置と当該第2の格子点に対応する前記各第1の格子点の位置とに基づいて前記ポテンシャルエネルギーの勾配により前記第2の格子点が受ける画像エネルギー力を計算する画像エネルギー力計算ステップと、
前記各第2の格子点と当該第2の格子点に隣接する他の第2の格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する弾性エネルギー力計算ステップと、
前記各第2の格子点に作用する摩擦力を計算する摩擦力計算ステップと、
前記画像エネルギー力と前記第1の弾性エネルギー力と前記摩擦力とによる前記各第2の格子点に関する第1の運動方程式を数値解析により解法処理を行う第1の解法処理ステップと、
前記第1の解法処理ステップによる解法処理の結果から、前記参照画像を複数の領域に分割して、分割した領域ごとに領域を識別するラベルを割り当てる動きクラスタリング処理ステップと、
前記ラベルが割り当てられた領域における前記第2の格子点と前記第1の格子点の写像関係を示す動きモデルを規定するパラメータである第1の動きパラメータを数値解析により推定する動きパラメータ推定ステップと、
推定された前記第1の動きパラメータによって定まる前記対象画像上の点および前記参照画像上の点の間の前記ポテンシャルエネルギーが最小になるように前記第1の動きパラメータを修正する動きパラメータ修正ステップと、
前記修正された前記第1の動きパラメータから、前記ラベルに対応する領域内の各第2の格子点に対して最適な前記第1の動きパラメータである第2の動きパラメータを決定し、決定された前記第2の動きパラメータを、前記ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当てステップと、
割り当てられた前記第2の動きパラメータと前記第1の解法処理ステップによる解法処理の結果とに基づいて、前記第1の運動方程式を補正する補正項を算出する補正項計算ステップと、
前記第1の運動方程式に前記補正項を加えた前記各第2の格子点に関する第2の運動方程式を数値解析により解法処理を行う第2の解法処理ステップと
前記第2の解法処理ステップによる解法処理の結果から前記対象画像と前記参照画像との対応関係を求めるマッピング処理ステップと、
を含むことを特徴とする画像マッチング方法。
An image matching method for obtaining a correspondence between a target image and a reference image,
There is an image correlation between each of the plurality of first grid points on the target image and each of the plurality of second grid points corresponding to the first grid points on the reference image. Based on the potential energy gradient based on the position of each second grid point and the position of each first grid point corresponding to the second grid point. An image energy force calculation step for calculating the image energy force received by the grid points;
An elastic energy force calculation step of calculating a first elastic energy force received from elastic energy between each of the second lattice points and another second lattice point adjacent to the second lattice point;
A friction force calculating step for calculating a friction force acting on each of the second grid points;
A first solution processing step of performing a solution process by numerical analysis of the first equation of motion related to each of the second lattice points by the image energy force, the first elastic energy force, and the friction force;
From the result of the solution processing by the first solution processing step, a motion clustering step of dividing the reference image into a plurality of regions and assigning a label for identifying the region for each divided region;
A motion parameter estimation step of estimating, by numerical analysis, a first motion parameter that is a parameter that defines a motion model indicating a mapping relationship between the second lattice point and the first lattice point in the region to which the label is assigned; ,
A motion parameter correcting step of correcting the first motion parameter so that the potential energy between the point on the target image and the point on the reference image determined by the estimated first motion parameter is minimized; ,
From the modified first motion parameter, a second motion parameter that is the first motion parameter optimum for each second grid point in the region corresponding to the label is determined and determined. A motion parameter assigning step for assigning the second motion parameter to each second grid point in the region corresponding to the label;
A correction term calculation step for calculating a correction term for correcting the first equation of motion based on the assigned second motion parameter and the result of the solution processing by the first solution processing step;
A second solution processing step for solving the second motion equation relating to each of the second lattice points obtained by adding the correction term to the first motion equation by numerical analysis; and a solution by the second solution processing step A mapping processing step for obtaining a correspondence relationship between the target image and the reference image from a processing result;
An image matching method comprising:
対象画像と参照画像との間の対応関係を求める画像マッチングプログラムであって、
前記対象画像上の複数の第1の格子点の各々と前記参照画像上で当該第1の格子点に一対一に対応する複数の第2の格子点の各々との間で画像の相関関係に基づくポテンシャルエネルギーを計算するとともに、前記各第2の格子点の位置と当該第2の格子点に対応する前記各第1の格子点の位置とに基づいて前記ポテンシャルエネルギーの勾配により前記第2の格子点が受ける画像エネルギー力を計算する画像エネルギー力計算ステップと、
前記各第2の格子点と当該第2の格子点に隣接する他の第2の格子点との間の弾性エネルギーから受ける第1の弾性エネルギー力を計算する弾性エネルギー力計算ステップと、
前記各第2の格子点に作用する摩擦力を計算する摩擦力計算ステップと、
前記画像エネルギー力と前記第1の弾性エネルギー力と前記摩擦力とによる前記各第2の格子点に関する第1の運動方程式を数値解析により解法処理を行う第1の解法処理ステップと、
前記第1の解法処理ステップによる解法処理の結果から、前記参照画像を複数の領域に分割して、分割した領域ごとに領域を識別するラベルを割り当てる動きクラスタリング処理ステップと、
前記ラベルが割り当てられた領域における前記第2の格子点と前記第1の格子点の写像関係を示す動きモデルを規定するパラメータである第1の動きパラメータを数値解析により推定する動きパラメータ推定ステップと、
推定された前記第1の動きパラメータによって定まる前記対象画像上の点および前記参照画像上の点の間の前記ポテンシャルエネルギーが最小になるように前記第1の動きパラメータを修正する動きパラメータ修正ステップと、
前記修正された前記第1の動きパラメータから、前記ラベルに対応する領域内の各第2の格子点に対して最適な前記第1の動きパラメータである前記第2の動きパラメータを決定し、決定された前記第2の動きパラメータを、前記ラベルに対応する領域内の各第2の格子点に対して割り当てる動きパラメータ割り当てステップと、
割り当てられた前記第2の動きパラメータと前記第1の解法処理ステップによる解法処理の結果とに基づいて、前記第1の運動方程式を補正する補正項を算出する補正項計算ステップと、
前記第1の運動方程式に前記補正項を加えた前記各第2の格子点に関する第2の運動方程式を数値解析により解法処理を行う第2の解法処理ステップと
前記第2の解法処理ステップによる解法処理の結果から前記対象画像と前記参照画像との対応関係を求めるマッピング処理ステップと、
をコンピュータに実行させる画像マッチングプログラム。
An image matching program for obtaining a correspondence between a target image and a reference image,
There is an image correlation between each of the plurality of first grid points on the target image and each of the plurality of second grid points corresponding to the first grid points on the reference image. Based on the potential energy gradient based on the position of each second grid point and the position of each first grid point corresponding to the second grid point. An image energy force calculation step for calculating the image energy force received by the grid points;
An elastic energy force calculation step of calculating a first elastic energy force received from elastic energy between each of the second lattice points and another second lattice point adjacent to the second lattice point;
A friction force calculating step for calculating a friction force acting on each of the second grid points;
A first solution processing step of performing a solution process by numerical analysis of the first equation of motion related to each of the second lattice points by the image energy force, the first elastic energy force, and the friction force;
From the result of the solution processing by the first solution processing step, a motion clustering step of dividing the reference image into a plurality of regions and assigning a label for identifying the region for each divided region;
A motion parameter estimation step of estimating, by numerical analysis, a first motion parameter that is a parameter that defines a motion model indicating a mapping relationship between the second lattice point and the first lattice point in the region to which the label is assigned; ,
A motion parameter correcting step of correcting the first motion parameter so that the potential energy between the point on the target image and the point on the reference image determined by the estimated first motion parameter is minimized; ,
Determining, from the modified first motion parameter, the second motion parameter that is the first motion parameter optimal for each second grid point in the region corresponding to the label; Assigning said second motion parameter to each second grid point in the region corresponding to said label;
A correction term calculation step for calculating a correction term for correcting the first equation of motion based on the assigned second motion parameter and the result of the solution processing by the first solution processing step;
A second solution processing step for solving the second motion equation relating to each of the second lattice points obtained by adding the correction term to the first motion equation by numerical analysis; and a solution by the second solution processing step A mapping processing step for obtaining a correspondence relationship between the target image and the reference image from a processing result;
Matching program that makes computer execute.
JP2006083761A 2006-03-24 2006-03-24 Image matching device, image matching method and image matching program Abandoned JP2007257518A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006083761A JP2007257518A (en) 2006-03-24 2006-03-24 Image matching device, image matching method and image matching program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006083761A JP2007257518A (en) 2006-03-24 2006-03-24 Image matching device, image matching method and image matching program

Publications (1)

Publication Number Publication Date
JP2007257518A true JP2007257518A (en) 2007-10-04

Family

ID=38631667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006083761A Abandoned JP2007257518A (en) 2006-03-24 2006-03-24 Image matching device, image matching method and image matching program

Country Status (1)

Country Link
JP (1) JP2007257518A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048593A (en) * 2010-08-30 2012-03-08 Juki Corp Image processing system
CN103729849A (en) * 2013-12-31 2014-04-16 南京航空航天大学 Method for calculating digital image morphing initial value

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048593A (en) * 2010-08-30 2012-03-08 Juki Corp Image processing system
CN103729849A (en) * 2013-12-31 2014-04-16 南京航空航天大学 Method for calculating digital image morphing initial value

Similar Documents

Publication Publication Date Title
US7440619B2 (en) Image matching method and image interpolation method using the same
JP5777311B2 (en) How to generate high-resolution video from low-resolution video
US9697614B2 (en) Method for segmenting and tracking content in videos using low-dimensional subspaces and sparse vectors
US20230134967A1 (en) Method for recognizing activities using separate spatial and temporal attention weights
CN109598735A (en) Method using the target object in Markov D-chain trace and segmented image and the equipment using this method
WO2011086889A1 (en) Feature point selection system, feature point selection method and feature point selection program
JP2002525735A (en) Tracking semantic objects in vector image sequences
JP6620882B2 (en) Pattern recognition apparatus, method and program using domain adaptation
Li et al. Refinement of LiDAR point clouds using a super voxel based approach
CN108335327B (en) Camera attitude estimation method and camera attitude estimation device
JP4271115B2 (en) Image matching apparatus, image matching method, and image matching program
JP4398919B2 (en) Image matching apparatus, image matching method, and image matching program
JP2008084076A (en) Image processor, method, and program
US8180167B2 (en) Model-based error resilience in data communication
JP2007257518A (en) Image matching device, image matching method and image matching program
JP3716455B2 (en) Region extraction method and region extraction device
JP7472471B2 (en) Estimation system, estimation device, and estimation method
KR101781942B1 (en) Method of holl-filling, recording medium and apparatus for performing the method
KR20080066486A (en) Apparatus and method for estimating motion vector
Einbeck et al. Representing complex data using localized principal components with application to astronomical data
Kemp et al. Multi-modal tracking using texture changes
KR20210092672A (en) Method and apparatus for tracking target
JP6663838B2 (en) Normal estimation device, normal estimation method, and normal estimation program
JPH07334690A (en) Tracking method for contour of object
Kardoost et al. Object segmentation tracking from generic video cues

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070926

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20090331