JPH0822544A - Picture recognition method - Google Patents

Picture recognition method

Info

Publication number
JPH0822544A
JPH0822544A JP6158394A JP15839494A JPH0822544A JP H0822544 A JPH0822544 A JP H0822544A JP 6158394 A JP6158394 A JP 6158394A JP 15839494 A JP15839494 A JP 15839494A JP H0822544 A JPH0822544 A JP H0822544A
Authority
JP
Japan
Prior art keywords
energy
points
model
point
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6158394A
Other languages
Japanese (ja)
Inventor
Satoshi Nakagawa
聰 中川
Yuji Kuno
裕次 久野
Takahiro Watanabe
孝弘 渡辺
Yoshinori Shimosakota
義則 下迫田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6158394A priority Critical patent/JPH0822544A/en
Publication of JPH0822544A publication Critical patent/JPH0822544A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To obtain the accurate position of a structure model. CONSTITUTION:The operation is started from a given initial position in a step S301, and a position of energy minimizing is obtained by search of the vicinity of one point in the energy minimizing processing for search of the vicinity of one point in a step S302. The model is moved so as to reduce the energy in a step S303 if it is simultaneously moved to vicinities of two points. In the convergence discrimination of a step S304, the operation is returned to the step S302 to try to minimize the energy if the combination to reduce the energy is found in the step S303; but convergence is discriminated and the position of the model at this time is defined as the position of energy minimizing in a step S305 if it is not found in the step S303.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、入力された画像中の対
象物の輪郭等の構造を認識する画像認識方法に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image recognition method for recognizing a structure such as a contour of an object in an input image.

【0002】[0002]

【従来の技術】従来、このような分野の技術としては、
例えば、次のような文献に記載されるものがあった。 文献;ファースト インターナショナル コンファレン
ス オン コンピュータ ビジョン (First Internat
ional Conference on Computer Vision)(1987)I
EEE(米)Michael Kass,Andrew Witkin,andDemetri
Terzopoulos 著"Snakes:Active contour models"P.2
59−268 従来、画像認識方法として例えば輪郭抽出方法には、前
記文献に記載されるように、動的輪郭モデルによって入
力画像の輪郭を抽出する方法がある。動的輪郭モデル
は、線やエッジのような画像特徴に引き寄せられる拘束
条件と形状に関しての拘束条件を満たすような閉曲線
を、エネルギー最小化によって求める輪郭抽出方法であ
る。以下、従来の動的輪郭モデルによる輪郭抽出方法に
ついて説明する。
2. Description of the Related Art Conventionally, techniques in such a field include:
For example, some documents were described in the following documents. Literature; First International Conference on Computer Vision (First Internat
ional Conference on Computer Vision) (1987) I
EEE (US) Michael Kass, Andrew Witkin, and Demetri
Terzopoulos "Snakes: Active contour models" P. Two
59-268 Conventionally, as an image recognition method, for example, a contour extraction method includes a method of extracting a contour of an input image by an active contour model as described in the above-mentioned document. The dynamic contour model is a contour extraction method that obtains a closed curve satisfying a constraint condition attracted to image features such as lines and edges and a constraint condition regarding a shape by energy minimization. Hereinafter, a conventional contour extraction method using an active contour model will be described.

【0003】図2は、従来の動的輪郭モデルによる輪郭
抽出方法の処理内容を示す図である。図3は、図2にお
いてエネルギーが最小値に収束するのに伴い、閉曲線が
画像特徴に引き付けられて行く様子を示す動的輪郭モデ
ルの概念図である。なお、以下の説明では、符号の前に
「v」を付してベクトル記号を表すことにする。図中で
は太字で表す。図3に示すように、図2中の原画像デー
タ10より、抽出したい輪郭線のモデルである閉曲線
(以下、snake と記す)の位置を、画像上の座標系x,
yにおいて、n個の節点vv=(x,y),i=
1,…,nで表す。但し、閉曲線であるのでvvi+n
vvとする。この輪郭線のモデルsnake に対して次式
(1)のようなエネルギー関数E* sn ake の定義40を
与える。
FIG. 2 is a diagram showing the processing contents of a conventional contour extraction method using an active contour model. FIG. 3 is a conceptual diagram of an active contour model showing how a closed curve is attracted to image features as energy converges to a minimum value in FIG. In the following description, "v" is added before the symbol to represent the vector symbol. It is shown in bold type in the figure. As shown in FIG. 3, from the original image data 10 in FIG. 2, the position of the closed curve (hereinafter, referred to as snake) that is a model of the contour line to be extracted is determined by the coordinate system x,
In y, n nodes vv i = (x i , y i ), i =
It is represented by 1, ..., N. However, since it is a closed curve, vv i + n =
vv i . Energizing function E * sn ake definitions 40, such as: (1) the model snake of the contour.

【数1】 (1)式のEint はsnake の形状に関する拘束条件を表
す内部エネルギーであり、次式(2)のように表せる。
[Equation 1] E int in the equation (1) is an internal energy that represents a constraint condition regarding the shape of the snake, and can be expressed as the following equation (2).

【数2】 (2)式の各項は1階及び2階の連続性に関する項であ
り、第1項はsnake が短くなるほど、第2項はsnake が
滑らかになるほど小さくなるエネルギーである(但し、
αi >0,βi >0の場合)。(1)式のEext は、sn
ake が画像特徴に引き寄せられる拘束条件を表す外部エ
ネルギーであり、例えば、次式(3)のように定義す
る。 Eext (i) =wedge(−|▽I(xi ,yi )|2 ) ・・・(3) 但し、wedge;正の係数 I(xi ,yi );画像の濃度 外部エネルギーEext を(3)式のように定義すれば、
snake が画像のエッジに近付くほど、Eext が小さくな
る。
[Equation 2] Each term in the equation (2) is a term related to the continuity of the first and second orders, and the first term is energy that becomes smaller as the snake becomes shorter and the second term becomes smaller as the snake becomes smoother (however,
If α i > 0, β i > 0). E ext of the equation (1) is sn
ake is an external energy that represents a constraint condition that is attracted to the image feature, and is defined by the following equation (3), for example. E ext (i) = w edge (− | ▽ I (x i , y i ) | 2 ) (3) where w edge ; positive coefficient I (x i , y i ); image density external If the energy E ext is defined as in equation (3),
The closer the snake is to the edge of the image, the smaller E ext .

【0004】以上のように、形状に関する拘束条件と画
像特徴に関する拘束条件を満たす場合にエネルギーが最
小になるようなエネルギー関数を定義し、このエネルギ
ー関数を最小にするようなsnake の位置を求めることに
よって輪郭抽出を行うのが動的輪郭モデルである。例え
ば、(2)式で表されるようなsnake の形状が「滑らか
である」という形状の拘束条件と、(3)式で表される
ようなsnake が「画像のエッジ上にある」という画像特
徴の拘束条件を与えた場合、画像中の対象物の輪郭に一
致する滑らかな輪郭線が抽出される。(1)式のエネル
ギー関数E* snake を最小化するようなsnake の位置
は、図2のエネルギー最小化処理20において、変分法
により、次式(4)の方程式を解くことによって得られ
る。
As described above, the energy function that minimizes the energy when the constraint condition regarding the shape and the constraint condition regarding the image feature are satisfied is defined, and the position of the snake that minimizes this energy function is determined. The active contour model is used to extract the contours. For example, the constraint condition that the shape of the snake is “smooth” as expressed by the expression (2) and the image that the snake as expressed by the expression (3) is “on the edge of the image”. When the feature constraint condition is given, a smooth contour line that matches the contour of the object in the image is extracted. The position of the snake that minimizes the energy function E * snake of the equation (1) is obtained by solving the equation of the following equation (4) by the variation method in the energy minimization process 20 of FIG.

【数3】 (4)式は、行列形式で次式(5)、(6)のように表
せる。なお、以下の説明では、符号の前に「V」を付し
て行列記号を表すことにする。図中では太字で表す。
(Equation 3) The equation (4) can be expressed in matrix form as the following equations (5) and (6). In the following description, “V” is added before the code to represent the matrix symbol. It is shown in bold type in the figure.

【0005】 VA・VX+VFx (VX,VY)=0 ・・・(5) VA・VY+VFy (VX,VY)=0 ・・・(6) 但し、 VX=(x1 ・・・xn T VY=(y1 ・・・yn T VFx =(fx (1) ・・・fx (n))T VFy =(fy (1) ・・・fy (n))T VA;αi ,βi のみから決まるn×nの係数行列 この方程式(5),(6)は、図2の初期位置データ5
0として与えられる初期位置VX0 ,VY0 から、次式
(7),(8)の反復計算によって解くことができ、そ
れを輪郭抽出結果30として出力する。 VXt =(VA+γ・VI)-1 ・(γ・VXt-1 −VFx (VXt-1 ,VYt-1 )) ・・・(7) VYt =(VA+γ・VI)-1 ・(γ・VYt-1 −VFy (VXt-1 ,VYt-1 )) ・・・(8) 但し、 VI;n×nの単位行列 t;繰り返し数 γ;更新ステップのステップサイズを決める係数 以上のような従来の動的輪郭モデルによる輪郭抽出方法
における図2のエネルギー最小化処理20のフローチャ
ートを図4に示す。このエネルギー最小化処理20で
は、まず、初期位置処理21で、図2の初期位置データ
50よりsnake の初期値VX0 ,VY0 を与え、外部エ
ネルギー勾配の計算処理22へ進む。外部エネルギー勾
配の計算処理22では、snake 上の全節点での外部エネ
ルギーの勾配VFx ,VFy を、図2中のエネルギー関
数の定義40をもとに、入力された原画像10より計算
し、座標値の更新処理23へ進む。座標値の更新処理2
3では、(7),(8)式を用いて、更新されたsnake
の位置VXt ,VYt を求め、収束判定処理24へ進
む。収束判定処理24では、各節点の更新された量|V
t −VXt-1 |,|VYt −VYt-1 |が十分0に近
付いていれば、計算が収束したと判定し、そのときのV
t ,VYt を処理25でエネルギー最小化値とし、図
2中の輪郭抽出結果30として出力する。これに対して
収束判定処理24で、収束したと判定されなければ、外
部エネルギー勾配の計算処理22へ戻り、前記の処理を
繰り返す。以上の処理により、(1)式のエネルギー関
数E* snake を最小化するsnakeの位置が得られる。こ
のときのsnake は、「滑らかで画像のエッジ上にある」
といった形状の拘束条件と画像特徴の拘束条件を満たす
輪郭線となるため、図3に示すように画像中の対象物の
輪郭に一致する。
VA · VX + VF x (VX, VY) = 0 (5) VA · VY + VF y (VX, VY) = 0 (6) where VX = (x 1 ... x n ). T VY = (y 1 ... Y n ) T VF x = (f x (1) ・ ・ ・ f x (n)) T VF y = (f y (1) ・ ・ ・fy (n)) T VA; n × n coefficient matrix determined only by α i and β i The equations (5) and (6) are the initial position data 5 of FIG.
The initial positions VX 0 and VY 0 given as 0 can be solved by iterative calculation of the following equations (7) and (8), which are output as the contour extraction result 30. VX t = (VA + γ · VI) −1 · (γ · VX t−1 −VF x (VX t−1 , VY t−1 )) (7) VY t = (VA + γ · VI) −1 · (Γ · VY t-1 −VF y (VX t-1 , VY t-1 )) (8) where VI: n × n identity matrix t; number of iterations γ; update step size FIG. 4 shows a flowchart of the energy minimization processing 20 of FIG. 2 in the contour extraction method using the conventional active contour model as described above. In the energy minimization process 20, first, in the initial position process 21, the initial values VX 0 and VY 0 of the snake are given from the initial position data 50 of FIG. 2, and the process proceeds to the external energy gradient calculation process 22. In the external energy gradient calculation process 22, the external energy gradients VF x and VF y at all nodes on the snake are calculated from the input original image 10 based on the definition 40 of the energy function in FIG. , And proceeds to coordinate value update processing 23. Coordinate value update process 2
3 uses the formulas (7) and (8) to update the updated snake.
The positions VX t and VY t are calculated and the process proceeds to the convergence determination process 24. In the convergence determination processing 24, the updated amount | V of each node
X t -VX t-1 |, | VY t -VY t-1 | if the long close enough 0, it is determined that the calculation has converged, V at that time
X t, and energy minimization value processing 25 VY t, and outputs the contour extraction result 30 in FIG. On the other hand, if the convergence determination processing 24 does not determine that the convergence has occurred, the process returns to the external energy gradient calculation processing 22 and the above processing is repeated. By the above processing, the position of the snake that minimizes the energy function E * snake of the equation (1) is obtained. The snake at this time is "smooth and is on the edge of the image."
As described above, the contour line satisfies the constraint condition of the shape and the constraint condition of the image feature, and thus the contour line matches the contour of the object in the image as shown in FIG.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、従来の
輪郭抽出方法においては、次のような課題があり、それ
を解決することが困難であった。 (a) 従来の輪郭抽出方法では、輪郭線のみを認識対
象としており、認識対象を表現するモデルは閉曲線に限
定していた。このため、閉曲線だけでは表現できないよ
うな、より複雑な構造を持つ対象の認識への応用ができ
なかった。 (b) 複眼視画像や動画像のように、複数枚の画像か
らの認識に応用する場合は、個々の画像での従来の輪郭
抽出方法による結果を統合するための別の機構が必要で
あった。 (c) 前記(a)、(b)のような問題を解決しよう
とすれば、さらに複雑な処理が必要となるが、これを効
率的に処理することは困難であり、十分な処理速度が得
られない。 前記(a)〜(c)のような課題を解決すべく本出願人
等は、先に特願平5−24604明細書(以下、先の提
案と呼ぶ)において、閉曲線に限らない、より複雑な構
造を持つような入力画像を認識対象とし、複数枚の画像
からの認識も統一的に処理し、さらに、このような拡張
された認識方法を効率的に処理可能な画像認識方法を提
案した。すなわち、エネルギー最小化によって入力画像
の画像認識を行う画像認識方法において、認識対象の構
造のモデルを、任意枚数の画像上の任意個の点で表され
る構造モデルとして定義し、構造モデルが画像特徴に引
き寄せられる拘束条件と、該構造モデルの構造に関する
拘束条件を満たす場合にエネルギーが最小となるような
エネルギー関数を定義し、このエネルギー関数を最小化
する構造モデルの位置を求めることにより入力画像から
任意の構造を抽出するようにしている。しかしながら、
先の提案では、エネルギー関数を最小化する構造モデル
の位置を1点の近傍点へ移動した場合に、エネルギーが
減少するような1点の近傍の探索処理しか行わず、その
ため正確な構造モデルの位置が求められなかったという
問題があった。
However, the conventional contour extraction method has the following problems and it is difficult to solve them. (A) In the conventional contour extraction method, only the contour line is the recognition target, and the model expressing the recognition target is limited to the closed curve. Therefore, it cannot be applied to the recognition of objects with more complicated structures that cannot be represented by closed curves alone. (B) When applied to recognition from a plurality of images such as a compound-eye image or a moving image, another mechanism for integrating the results of the conventional contour extraction method for each image is necessary. It was (C) In order to solve the above problems (a) and (b), more complicated processing is required, but it is difficult to process this efficiently, and sufficient processing speed is required. I can't get it. In order to solve the above problems (a) to (c), the present applicants have previously described in Japanese Patent Application No. 5-24604 (hereinafter, referred to as the above-mentioned proposal) not only a closed curve but also a more complicated one. We proposed an image recognition method that can process input images with various structures, recognizes multiple images uniformly, and can efficiently process such an extended recognition method. . That is, in the image recognition method for recognizing the input image by energy minimization, the model of the structure to be recognized is defined as the structure model represented by the arbitrary number of points on the arbitrary number of images, and the structural model is the image. The input image is obtained by defining a constraint condition attracted to the feature and an energy function that minimizes energy when the constraint condition regarding the structure of the structural model is satisfied, and determining the position of the structural model that minimizes this energy function. Any structure is extracted from. However,
In the previous proposal, when the position of the structural model that minimizes the energy function is moved to a point close to one point, only the search processing of the vicinity of one point that reduces the energy is performed, and therefore the accurate structural model There was a problem that the position was not requested.

【0007】[0007]

【課題を解決するための手段】第1の発明は、前記課題
を解決するために、入力画像中の認識対象の構造を表現
するモデルを画像上の任意個の点で表されるモデルとし
て定義し、前記モデルが画像特徴に引き寄せられる拘束
条件と、該モデルの構造に関する拘束条件を満たす場合
にエネルギーが最小となるようなエネルギー関数を定義
し、前記エネルギー関数を最小化する前記モデルの位置
を求めることにより、前記入力画像から任意の構造を抽
出する画像認識方法において、以下のように構成する。
すなわち、前記エネルギー関数を最小化する前記モデル
の位置を、前記モデル上の1点の近傍点へ移動した場合
にエネルギーが減少するような移動をする1点の近傍の
探索処理及び前記モデル上の複数の点をそれぞれの近傍
点へ同時に移動した場合にエネルギーが減少するような
移動をする複数の点の近傍点への同時探索処理を行うこ
とにより求める。第2の発明は、第1の発明において、
まず前記1点の近傍の探索処理によってエネルギー最小
化処理を行い、その後前記モデル上の2点の近傍点へ同
時に移動した場合にエネルギーが減少するような移動を
行い、該移動があれば前記1点の近傍の探索処理に戻り
処理を繰り返すことによってエネルギー最小化を行うよ
うにしている。第3の発明は、第1の発明の複数の点の
近傍点への同時探索処理において、エネルギーの変化量
を、探索する複数の点の近傍への移動量の評価関数とし
て表し、前記評価関数に基づいてエネルギーが減少する
ような移動をするようにしている。第4の発明は、第3
の発明の複数の点の近傍点への同時探索処理において、
探索する複数の点の近傍への移動量の関数として表され
たエネルギーの変化量のうち、それぞれの点の1点の移
動量のみに依存した項を探索を開始する前にあらかじめ
計算して記憶しておき、前記記憶した1点の移動量のみ
に依存した項を前記複数の点の近傍点への同時探索処理
において用いるようにしている。
In order to solve the above-mentioned problems, the first invention defines a model expressing the structure of a recognition target in an input image as a model represented by arbitrary points on the image. Then, the constraint condition that the model is attracted to the image feature and the energy function that minimizes the energy when the constraint condition regarding the structure of the model are satisfied are defined, and the position of the model that minimizes the energy function is defined. An image recognition method for extracting an arbitrary structure from the input image by obtaining the image is configured as follows.
That is, when the position of the model that minimizes the energy function is moved to a point near one point on the model, the search process for the neighborhood of one point that moves such that the energy decreases and the position on the model It is obtained by performing simultaneous search processing to the neighboring points of a plurality of points that move so that the energy decreases when the plurality of points move to their neighboring points at the same time. The second invention is the same as the first invention,
First, energy minimization processing is performed by search processing in the vicinity of the one point, and then movement is performed so that energy is reduced when moving to two neighboring points on the model at the same time. The energy is minimized by returning to the search processing in the vicinity of the point and repeating the processing. A third aspect of the present invention represents the amount of change in energy as an evaluation function of the amount of movement to the vicinity of a plurality of points to be searched in the simultaneous search processing of the plurality of points into the vicinity of the point, the evaluation function Based on the above, the movement is such that the energy decreases. The fourth invention is the third invention.
In the simultaneous search process of a plurality of points to neighboring points of the invention of
Of the amount of change in energy expressed as a function of the amount of movement to the vicinity of multiple points to be searched, terms that depend only on the amount of movement of one point at each point are calculated and stored in advance before starting the search. In addition, the term that depends only on the stored amount of movement of one point is used in the simultaneous search process for the neighboring points of the plurality of points.

【0008】[0008]

【作用】第1の発明によれば、以上のように画像認識方
法を構成したので、エネルギー関数を最小化するモデル
の位置を、1点の近傍点へ移動した場合にエネルギーが
減少するような1点の近傍の探索処理により求める。こ
の1点の近傍の探索処理により求められたモデルの位置
では、複数の点をそれぞれの近傍点へ同時に移動した場
合にエネルギーが減少する場合が探索されていないの
で、正確なモデルの位置が求められていない。そこで、
複数の点をそれぞれの近傍点へ同時に移動した場合にエ
ネルギーが減少するような移動をも行い正確なモデルの
位置を求める。第4の発明によれば、複数の点の近傍点
への同時探索処理において、エネルギーの変化量を探索
する複数の点の近傍への移動量の関数として表し、それ
ぞれの点の1点の移動量のみに依存した項を探索を開始
する前にあらかじめ計算しておき、同時探索処理におい
てそれを用いる。例えば、探索する近傍点の個数がm個
で、2点の近傍点への同時探索処理を行う場合では、m
×m回の探索処理が必要となるが、それぞれの点の1点
の移動量のみに依存した項のm通りの値を探索を開始す
る前にあらかじめ計算しておき、同時探索処理において
それを使用するので、処理効率が向上する。従って、前
記課題を解決できるのである。
According to the first aspect of the invention, since the image recognition method is configured as described above, the energy is reduced when the position of the model that minimizes the energy function is moved to one neighboring point. It is obtained by a search process in the vicinity of one point. At the position of the model obtained by the search processing of the vicinity of this one point, the case where the energy decreases when a plurality of points are simultaneously moved to their respective neighboring points has not been searched, so the accurate position of the model is obtained. Has not been done. Therefore,
An accurate model position is also obtained by moving so that the energy decreases when multiple points are moved to their neighboring points at the same time. According to the fourth invention, in the simultaneous search process of a plurality of points in the vicinity, the amount of change in energy is expressed as a function of the amount of movement of the plurality of points to be searched in the vicinity, and the movement of one point of each point. The term that depends only on the quantity is calculated in advance before starting the search, and is used in the simultaneous search processing. For example, when the number of neighboring points to be searched is m and the simultaneous search processing is performed for two neighboring points, m
It requires xm times of search processing, but m values of terms that depend only on the amount of movement of one point of each point are calculated in advance before starting the search, and are calculated in the simultaneous search processing. Since it is used, the processing efficiency is improved. Therefore, the above problem can be solved.

【0009】[0009]

【実施例】本実施例では、まず、先の提案の画像認識方
法の実施例の概略(I)と、その問題点(II)とを説明
した後、その問題点を解決するための本発明の画像認識
方法の実施例(III)を説明する。 (I) 先の提案の画像認識方法の実施例 先の提案では、従来の動的輪郭モデルによる輪郭抽出方
法のように、認識する対象を表現するモデルを閉曲線に
限定せず、より複雑な対象の構造を表現できる動的な構
造のモデル(以下、動的モデルと呼ぶ)を考える。動的
モデルは、入力画像中の認識対象の輪郭等の構造を画像
上の任意個の点のモデルで表現し、それぞれの点が入力
画像の画像特徴に引き寄せられる拘束条件と各点の位置
関係に関する拘束条件とを満たすようなモデルの位置を
エネルギー最小化によって求める画像認識方法である。
動的モデルでは、認識対象の輪郭等の構造を、画像上の
n個の点で表されているようなモデル(以下、model と
呼ぶ)で表現する。このn個の点を画像座標系x,y
で、vvi =(v1i,v2i)=(xi ,yi ),i=
1,…,nと表す。このmodel が画像特徴に引き寄せら
れる拘束条件と、model の構造に関する拘束条件を満た
す場合にエネルギーを最小化するmodel の位置を求める
ことにより構造の抽出を行う。
EXAMPLE In this example, first, an outline (I) of the example of the previously proposed image recognition method and its problem (II) will be described, and then the present invention for solving the problem will be described. An example (III) of the image recognition method will be described. (I) Example of Image Recognition Method of Previous Proposal In the previous proposal, a model expressing a recognition target is not limited to a closed curve as in the conventional contour extraction method using an active contour model, and a more complex target is obtained. Consider a dynamic structure model that can express the structure of (hereinafter referred to as a dynamic model). The dynamic model expresses the structure such as the outline of the recognition target in the input image by a model of any number of points on the image, and the constraint condition that each point is attracted to the image feature of the input image and the positional relationship of each point. This is an image recognition method that finds the position of a model that satisfies the constraint condition regarding by energy minimization.
In the dynamic model, the structure such as the outline of the recognition target is represented by a model represented by n points on the image (hereinafter referred to as model). These n points are converted into the image coordinate system x, y.
Where vv i = (v 1i , v 2i ) = (x i , y i ), i =
1, ..., n. The structure is extracted by finding the constraint condition that this model is attracted to the image feature and the position of the model that minimizes the energy when the constraint condition concerning the structure of the model is satisfied.

【0010】図5(a)〜(c)は先の提案の動的モデ
ルの例を示す図である。例えば、図5(c)に示すよう
に、任意個の点があり、これらが画像特徴に引き寄られ
る拘束条件と、これらの点の間に図に示すような構造に
関する拘束条件が与えられているモデルを考える。ここ
で、図5(a)のような入力画像が与えられると、同図
(b)に示すような入力画像の特徴に一致するような構
造が抽出できる。このmodel に対するエネルギー関数E
model を次式(9)のように定義する。 Emodel =Eint +Eext =Eint +Eimage +Econ ・・・(9) (9)式のEint は、model の構造に関する拘束条件を
表現する内部エネルギー関数であり、次式(10)のよ
うに定義する。
FIGS. 5A to 5C are diagrams showing examples of the dynamic model proposed above. For example, as shown in FIG. 5C, there are arbitrary points, and a constraint condition that these points are drawn to the image feature and a constraint condition regarding the structure as shown in the figure are given between these points. Consider a model that has Here, when an input image as shown in FIG. 5A is given, a structure that matches the features of the input image as shown in FIG. 5B can be extracted. Energy function E for this model
The model is defined as the following expression (9). E model = E int + E ext = E int + E image + E con (9) E int in the equation (9) is an internal energy function expressing the constraint condition regarding the structure of the model, and is represented by the following equation (10). To be defined as

【数4】 但し、Aλi μj ,Bλi ,Cは係数であり、A
λi μj =Aμj λi とする。また、Σの添字i,jは
1,…,nを、λ、μは1,2の値をとる。同様に、以
下の説明でもΣの添字の範囲は省略して記述するが、
i,jのような英小文字の添字は1,…,n、ギリシャ
小文字は1,2の値をとるものとする。例えば、
[Equation 4] However, A λi μj , B λi , and C are coefficients, and
Let λi μj = A μj λi . The subscripts i and j of Σ are 1, ..., N, and λ and μ are 1 and 2. Similarly, in the following description, the range of the subscript of Σ is omitted,
The subscripts of lowercase letters such as i and j take the values 1, ..., N, and the Greek lowercase letters take the values of 1 and 2. For example,

【数5】 のような意味で用いる。(Equation 5) Is used in the sense of.

【0011】(10)式のような内部エネルギー関数E
int を用いると、以下のようなエネルギー項を表現でき
る。
The internal energy function E as shown in equation (10)
Using int, we can express the following energy terms.

【数6】 これは、図6に示すように、点vvi を固定点vsi
引き寄せる項として働く。
(Equation 6) This acts as a term that draws the point vv i to the fixed point vs i , as shown in FIG.

【数7】 これは、図7に示すように、点vvi から点vvj に向
かうベクトルvvj −vvi を、定ベクトルvtijに近
付ける項として働く。vtij=0の場合は、従来の
(2)式の右辺第1項αi ・|vvi −vvi-1 2
2と同じように、vvi とvvj を引き付け合う。但
し、従来の輪郭モデルでは、隣り合う2節点間のみにこ
のようなエネルギー項の設定が可能である。
(Equation 7) As shown in FIG. 7, this acts as a term that brings the vector vv j −vv i from the point vv i toward the point vv j closer to the constant vector vt ij . When vt ij = 0, the first term on the right-hand side of the conventional equation (2) α i · | vv i −vv i−1 | 2 /
As in 2, attract vv i and vv j . However, in the conventional contour model, such an energy term can be set only between two adjacent nodes.

【数8】 これは、図8に示すように、点vvi から点vvj へ向
かうベクトルと、点vvj から点vvk へ向かうベクト
ルの変化量、即ち折れ線vvi −vvj −vvk の曲り
具合vvi −2vvj +vvk を定ベクトルvuijk
近付ける項として働く。
(Equation 8) This is, as shown in FIG. 8, the amount of change between the vector from the point vv i to the point vv j and the vector from the point vv j to the point vv k , that is, the bending degree vv of the polygonal line vv i −vv j −vv k. It works as a term that brings i −2vv j + vv k close to the constant vector vu ijk .

【0012】[0012]

【数9】 これは、図9に示すように、3点vvi ,vvj ,vv
k が囲む三角形の面積を大きくする項として働く。この
項を組み合わせることによって、図10に示すように、
model 上のn個の点のうちの任意のm個の点よりなるm
角形が囲む面積に関する拘束条件を表現できる。以上の
ようなエネルギー項の他にも、2n個の変数Vλi (i
=1,…,n、λ=1,2)による2次以下の多項式で
表されるような任意のエネルギー項を(10)式で表現
できる。(9)式のEext =Eimage +Econ は、mode
l に対する外部エネルギー関数である。Econ は、外部
からの制御のためのエネルギー関数である。E
image は、model が画像特徴に引き寄せられる拘束条件
を表現する関数であり、次式(11)のように定義す
る。
[Equation 9] As shown in FIG. 9, this is the three points vv i , vv j , vv.
It works as a term that increases the area of the triangle surrounded by k . By combining these terms, as shown in FIG.
m consisting of arbitrary m points out of n points on model
It is possible to express the constraint condition regarding the area enclosed by the polygon. In addition to the above energy terms, 2n variables V λi (i
= 1, ..., N, λ = 1, 2), an arbitrary energy term represented by a polynomial of second order or less can be expressed by the equation (10). E ext = E image + E con in the equation (9) is mode
is an external energy function for l. E con is an energy function for external control. E
image is a function that represents a constraint condition in which model is attracted to the image feature, and is defined by the following equation (11).

【数10】 例えば、Ei (v1i,v2i)を次式(12)のように定
義すれば、点vvi は画像エッジに引き寄せられる。 Ei (v1i,v2i)=wedge(−|▽I(v1i,v2i)|2 ) ・・・(12) 但し、wedgeは正の係数、I(v1i,v2i)は画像の濃
度である。以上のように定義された(9)式のエネルギ
ー関数Emodel が最小となるようmodel の位置を求める
ことにより、画像特徴に関する拘束条件とmodel の構造
に関する拘束条件を満たす認識対象の構造を抽出でき
る。
[Equation 10] For example, if E i (v 1i , v 2i ) is defined by the following expression (12), the point vv i is attracted to the image edge. E i (v 1i , v 2i ) = w edge (− | ▽ I (v 1i , v 2i ) | 2 ) (12) where w edge is a positive coefficient, I (v 1i , v 2i ). Is the density of the image. By obtaining the position of the model so that the energy function E model of the equation (9) defined as above is minimized, it is possible to extract the structure of the recognition target that satisfies the constraint condition regarding the image feature and the constraint condition regarding the structure of the model. .

【0013】図11は、先の出願のエネルギー関数の最
小化処理のフローチャートである。図11に示す先の出
願のエネルギー最小化処理では、model 上の各点vvi
の近傍での(9)式のEmodel の変化を評価し、E
model が減少する近傍点への移動を繰り返すことにより
エネルギー関数の最小化を行う。すなわち、スイップS
141で与えられた初期位置からはじめて、ステップS
146でmodel が収束するまで、ステップS142から
S145までの処理を繰り返す。ステップS142,S
144,及びS145で、カウンタiを1からmodel の
点数nまで進め、ステップS143でそれぞれのiにつ
いて、以下で述べる点vvi の近傍探索処理を行う。す
なわち、model 上のすべての点について近傍探索処理を
行う。ステップS146の収束判定では、すべての点の
近傍にエネルギー関数を減少させる近傍点が存在しなく
なったところで収束したと判定して、このときのmodel
の位置をステップ147でエネルギー最小化位置とす
る。以下、図11中のステップS143の近傍探索処理
における、vvi の近傍での(9)式のEmodel の変化
の評価方法について説明する。
FIG. 11 is a flowchart of the energy function minimization process of the previous application. In the energy minimization process of the previous application shown in FIG. 11, each point vv i on the model
Evaluating the change of E model in the equation (9) in the vicinity of
The energy function is minimized by repeating the movement to the neighboring points where the model decreases. That is, the sweep S
Starting from the initial position given in 141, step S
The processing from steps S142 to S145 is repeated until the model converges in 146. Steps S142, S
In 144, and S145, the counter i is incremented from 1 to the number n of the model, and in step S143, the neighborhood search process of the point vv i described below is performed for each i. That is, the neighborhood search process is performed for all points on the model. In the convergence determination in step S146, it is determined that convergence has occurred when there are no neighboring points that reduce the energy function in the vicinity of all points, and the model at this time is determined.
Is set as the energy minimization position in step 147. Hereinafter, a method of evaluating a change in E model of the expression (9) in the vicinity of vv i in the neighborhood search processing of step S143 in FIG. 11 will be described.

【0014】(9)式において、model 上の点vvi
δvvi =(δv1i,δv2i)だけ変化させた、すなわ
ち、vvi をvvi +δvvi へ移動した時の(9)式
のEmodel の変化量δi model は、次式(13)のよ
うになる。
In the equation (9), the point vv i on the model is changed by δvv i = (δv 1i , δv 2i ), that is, when vv i is moved to vv i + δvv i variation [delta] i E model of E model is expressed by the following equation (13).

【数11】 この変化量δi model が負となる、すなわち、δi
model <0となるような移動δvvi は、(9)式のよ
うなエネルギー評価関数Emodel を減少させる。このよ
うな点vvi の近傍における(9)式のエネルギー関数
model の変化の様子を評価するために、次式(14)
のような近傍エネルギー評価関数ei (δvvi )を定
義する。
[Equation 11] This change amount δ i E model becomes negative, that is, δ i E model
The movement δvv i such that model <0 reduces the energy evaluation function E model as expressed by the equation (9). In order to evaluate such a change in the energy function E model of the equation (9) in the vicinity of the point vv i , the following equation (14)
The neighborhood energy evaluation function e i (δvv i ) such as

【数12】 但し、Dλi は、次式(15)であり、これは、δvv
i に依存しないので、近傍の探索を開始する前にあらか
じめ計算しておくことができる。
(Equation 12) However, D λi is the following equation (15), which is δvv
Since it does not depend on i , it can be calculated in advance before starting the search for the neighborhood.

【0015】[0015]

【数13】 また、Ei (vvi )は、入力画像と点vvi の座標値
から計算されるが、入力画像が定まれば、これはvvi
の座標値に関する2変数(v1i,v2i)の関数となる。
したがって、入力画像の全画素に対してEi (x,y)
を計算し、これをエネルギー関数画像(画素の値がEi
(x,y)であるような画像)としてあらかじめ得てお
くこともできる。ただし、上記の手法を用いるとE
i (vvi )が、各vvi (i=1,…,n)ごとの個
別の関数であるので、n枚ものエネルギー関数画像をあ
らかじめ得ておく必要があり、大量の記憶容量を必要と
する。そこで、以下のようにすることでよってエネルギ
ー関数画像の枚数を少なくすることもできる。すなわ
ち、すべてのEi (x,y),i=1,…,nがnf
類の関数fj (x,y),j=1,…,nf (但し、n
f <n)により、次式(16)のように表されていれ
ば、nf 枚のエネルギー関数画像をあらかじめ計算して
おくことによって、エネルギー最小化処理時のEi (v
i )の計算を単純な積和計算で処理できる。
(Equation 13) Further, E i (vv i ) is calculated from the input image and the coordinate value of the point vv i , but if the input image is determined, this is vv i.
It is a function of two variables (v 1i , v 2i ) related to the coordinate value of.
Therefore, for all pixels of the input image, E i (x, y)
Of the energy function image (the pixel value is E i
It can also be obtained in advance as an image such as (x, y). However, using the above method, E
Since i (vv i ) is an individual function for each vv i (i = 1, ..., N), it is necessary to obtain n energy function images in advance, which requires a large storage capacity. To do. Therefore, the number of energy function images can be reduced by doing the following. That is, all E i (x, y), i = 1, ..., N are n f type functions f j (x, y), j = 1, ..., n f (however, n
If f <n) is represented by the following equation (16), by calculating n f energy function images in advance, E i (v
The calculation of v i ) can be processed by a simple product-sum calculation.

【0016】[0016]

【数14】 (13)式のδi model は、式(14)の近傍エネル
ギー評価関数ei (δvvi )を用いて次式(17)の
ように表される。 δi model =ei (δvvi )−Ei (vvi )−Econ =ei (δvvi )−ei (0) ・・・(17) したがって、ei (δvvi )<ei (0)となるよう
な近傍点への移動δvvi が存在すれば、vvi をvv
i +δvvi へ移動することによって(9)式のE
model は減少する。このような移動をmodel 上の全ての
点について繰り返すことによって、(9)式のエネルギ
ー関数Emodel を最小化することができる。
[Equation 14] The δ i E model of the equation (13) is represented by the following equation (17) using the neighborhood energy evaluation function e i (δvv i ) of the equation (14). δ i E model = e i (δvv i ) −E i (vv i ) −E con = e i (δvv i ) −e i (0) (17) Therefore, e i (δvv i ) <e If there is a movement δvv i to a neighboring point such that i (0), then vv i becomes vv i
By moving to i + δvv i , E in Eq. (9)
model decreases. By repeating such movement for all points on the model, the energy function E model of the equation (9) can be minimized.

【0017】図12は、図11中のステップS143の
近傍探索処理のフローチャートである。図13は、近傍
探索の様子を示す概念図である。図12に示すように、
まず、(14)式の近傍エネルギー評価関数ei (δv
i )の計算を効率的に行うために、ステップS201
で、(15)式のDλiをあらかじめ計算しておく。ス
テップS202で、近傍エネルギー評価関数ei (δv
i )の最小値Emi n と、最小値Emin を与える近傍点
への移動δvvi を現在の位置で初期化する。ステップ
S203、S207,S208でカウンタjを1から近
傍点数mまで進めて、それぞれのjについて、点vvi
のj番目の近傍点vvi +δvvijに関する処理S20
4,S205,S206を行う。例えば、近傍点数がm
=8の場合に、j=5番目の近傍点を探索している様子
を図13に示す。ステップS204で、j番目の近傍点
への移動δvvijによる近傍エネルギー評価値を、ステ
ップS201で求めたDλi を使って、(14)式の近
傍エネルギー評価関数ei (δvvij)で評価する。ス
テップS205,S206で、これら評価値の最小値E
min と、最小値Emi n を与える近傍点への移動δvvi
を求める。ステップS209,S210で、近傍エネル
ギー評価関数の最小値を与える点が現在位置でなけれ
ば、点vvi をvvi +δvvi へ移動する。
FIG. 12 is a flowchart of the neighborhood search processing of step S143 in FIG. FIG. 13 is a conceptual diagram showing a state of neighborhood search. As shown in FIG.
First, the neighborhood energy evaluation function e i (δv of Eq. (14)
In order to efficiently calculate v i ), step S201
Then, D λi in the equation (15) is calculated in advance. In step S202, the neighborhood energy evaluation function e i (δv
v i and the minimum value E mi n of) initializes the movement Derutavv i to neighborhood points at the current position that gives the minimum value E min. In steps S203, S207, S208, the counter j is incremented from 1 to the neighborhood score m, and the point vv i is obtained for each j.
S20 regarding the j-th neighbor point vv i + δvv ij of
4, S205 and S206 are performed. For example, the number of neighbors is m
FIG. 13 shows how the j = 5th neighbor point is searched when = 8. In step S204, the neighborhood energy evaluation value by the movement δvv ij to the j-th neighbor point is evaluated by the neighborhood energy evaluation function e i (δvv ij ) of the equation (14) using D λi obtained in step S201. . In steps S205 and S206, the minimum value E of these evaluation values
movement Derutavv i of the min, the neighboring point which gives the minimum value E mi n
Ask for. In steps S209 and S210, if the point giving the minimum value of the neighborhood energy evaluation function is not the current position, the point vv i is moved to vv i + δvv i .

【0018】以上のように、図12に示したような近傍
探索処理により、点vvi を、その近傍点のうちで
(9)式のエネルギー関数Emodel を減少させる点へ移
動することができる。この近傍探索処理を、図11に示
すように、model 上のすべての点について繰り返し、す
べての点が移動しなくなったところで処理を終了する。
この時のmodel は、(9)式のエネルギー関数Emodel
が最小となるため、エネルギー関数として与えられた拘
束条件を満たすような認識対象の構造が抽出できる。図
14は、以上のような先の提案の動的モデルによる画像
認識方法の構成図である。図14に示すように、1枚あ
るいは複数枚の入力画像データ110より、エネルギー
関数画像計算処理120で、モデルの定義160をもと
に、エネルギー関数画像130を計算する。エネルギー
最小化処理140では、入力画像データ110より、モ
デルの定義160をもとに、初期位置データ170か
ら、図11、図12の処理によって、構造の抽出結果1
50を得る。
As described above, by the neighborhood search processing as shown in FIG. 12, the point vv i can be moved to a point among the neighboring points where the energy function E model of the equation (9) is reduced. . As shown in FIG. 11, this neighborhood search process is repeated for all points on the model, and the process ends when all points have stopped moving.
The model at this time is the energy function E model of equation (9).
Since is the minimum, the structure of the recognition target that satisfies the constraint condition given as the energy function can be extracted. FIG. 14 is a block diagram of an image recognition method based on the dynamic model proposed above. As shown in FIG. 14, an energy function image 130 is calculated from one or a plurality of input image data 110 by an energy function image calculation process 120 based on a model definition 160. In the energy minimization process 140, based on the model definition 160 from the input image data 110, the structure extraction result 1 from the initial position data 170 is processed by the processes of FIGS.
Get 50.

【0019】(II)先の提案の問題点 図15は先の提案の動的モデルにおける問題点を示す図
である。図15(a)の状態のmodel が、節点vvi
近傍探索時に図15(b)のような移動をしても、節点
vvj の近傍探索時に図15(c)のような移動をして
もエネルギーが増加してしまうような場合でも、図15
(d)に示すように、節点vvi とvvj を同時に動か
した状態の方が、図15(a)の状態よりもエネルギー
が小さい場合がある。すなわち、先の提案の方法では、
図15(a)の状態から移動できないため、この状態を
エネルギーが最小であるとして、エネルギー最小化処理
を終了してしまうが、実際には、図15(d)のような
さらにエネルギーの小さい状態が存在する場合があり、
エネルギー最小化処理が正確に行なえていなかった。
(II) Problems of Previous Proposal FIG. 15 is a diagram showing problems in the dynamic model of the previous proposal. Even if the model in the state of FIG. 15A moves as shown in FIG. 15B during the neighborhood search of the node vv i , it moves as shown in FIG. 15C during the neighborhood search of the node vv j . However, even if the energy increases, FIG.
As shown in (d), the state where the nodes vv i and vv j are moved at the same time may have lower energy than the state shown in FIG. That is, in the method proposed above,
Since the state cannot be moved from the state of FIG. 15 (a), the energy minimization process is terminated assuming that this state has the lowest energy, but in reality, the state of smaller energy as shown in FIG. 15 (d). May exist,
The energy minimization process was not performed correctly.

【0020】(III)本発明の実施例 図1は、本発明の実施例を示す画像認識方法のエネルギ
ー最小化処理のフローチャートである。本実施例のエネ
ルギー最小化処理は、先の出願と同様な1点の近傍探索
によるエネルギー最小化処理を行った後、2点のそれぞ
れの近傍点へ同時に移動した場合にエネルギーが最小と
なるような同時近傍探索によるmodel の移動処理を行う
ようにしている。図16は、図1中の2点の近傍探索に
よるmodel の移動処理ステップS303を示すフローチ
ャートである。これら図を参照しつつ、本実施例の画像
認識方法のエネルギー最小化処理の方法について説明す
る。図1に示すように、まず、ステップS301で与え
られた初期位置からはじめて、ステップS302の一点
の近傍探索によるエネルギー最小化処理で、先の出願と
同様に図11及び図12に示すようなフローチャートに
したがって1点の近傍探索によるエネルギー最小化位置
を求める。
(III) Embodiment of the Present Invention FIG. 1 is a flow chart of energy minimization processing of an image recognition method showing an embodiment of the present invention. In the energy minimization process of this embodiment, the energy is minimized when the energy minimization process is performed by the one point neighborhood search as in the previous application and then the two points are simultaneously moved. The model is moved by such simultaneous neighborhood search. FIG. 16 is a flowchart showing step S303 of moving a model by a neighborhood search of two points in FIG. The method of energy minimization processing of the image recognition method of the present embodiment will be described with reference to these drawings. As shown in FIG. 1, first, from the initial position given in step S301, in the energy minimization process by the neighborhood search of one point in step S302, the flowcharts as shown in FIGS. Then, the energy minimization position is obtained by the neighborhood search of 1 point.

【0021】次に、ステップS303で図16に示すよ
うな2点の近傍探索によるmodel の移動を行う。これ
は、全ての2点の組み合わせに対して2点を同時に移動
した場合にエネルギーの減少する組み合わせがあれば、
その移動を行う処理である。図16に示す2点の近傍探
索によるmodel の移動処理は、ステップS321、S3
26、及びS327で、カウンタiを1からn−1まで
進めながらそれぞれのiについて、ステップS322か
らS325までの処理を行う。ステップS322、S3
24、及びS325でカウンタjをi+1からnまで進
めながらそれぞれのjについて、ステップS323の処
理を行う。すなわち、全ての点vvi,vvj の組み合
わせについて、以下で述べる点vvi ,vvj の近傍探
索処理を行い、2点を同時に移動した場合にエネルギー
の減少する組み合わせの移動を行う。図1中のステップ
S304の収束判定では、ステップS303でエネルギ
ーの減少する組み合わせが見つかった場合は、ステップ
S302に戻りさらにエネルギー最小化を試みる。ステ
ップS303でエネルギーの減少する組み合わせが見つ
からなければ収束したと判定して、このときのmodel の
位置をステップS305でエネルギー最小化位置とす
る。以下、図16中のステップS323のvvi ,vv
j の近傍探索処理におけるvvi 、vvj の近傍での
(9)式のEmodel の変化の評価方法について説明す
る。
Next, in step S303, the model is moved by a two-point neighborhood search as shown in FIG. This is because if there are combinations that reduce energy when moving two points at the same time for all combinations of two points,
This is the process of moving. The process of moving the model by the two-point neighborhood search shown in FIG. 16 includes steps S321 and S3.
26 and S327, the process from step S322 to S325 is performed for each i while advancing the counter i from 1 to n-1. Steps S322 and S3
24, and the process of step S323 is performed for each j while advancing the counter j from i + 1 to n in S325. That is, all points vv i, for the combination of vv j, performs local search processing vv i, vv j points described below, to move the combination of decreasing energy when moving two points simultaneously. In the convergence determination of step S304 in FIG. 1, if a combination of decreasing energy is found in step S303, the process returns to step S302 to try to further minimize energy. If no combination of decreasing energy is found in step S303, it is determined that convergence has occurred, and the position of model at this time is set as the energy minimization position in step S305. Hereinafter, vv i and vv in step S323 in FIG.
A method of evaluating the change in E model in the expression (9) in the neighborhood of vv i and vv j in the neighborhood search processing of j will be described.

【0022】(9)式において、model 上の点vvi
びvvj をδvvi =(δv1i,δv2i)及びδvvj
=(δv1j,δv2j)だけ変化させた、すなわち、vv
i ,vvj をvvi +δvvi ,vvj +δvvj へ移
動した時の(9)式のEmode l の変化量δij
model は、次式(18)のようになる。
In equation (9), points vv i and vv j on model are expressed as δvv i = (δv 1i , δv 2i ) and δvv j
= (Δv 1j , δv 2j ), that is, vv
The change amount δ ij E of E mode l in the equation (9) when i , vv j are moved to vv i + δvv i , vv j + δvv j
The model is as in the following expression (18).

【数15】 この変化量δijmodel が負となる、すなわち、δij
model <0となるような移動δvvi ,δvvj は、式
(9)のEmodel を減少させる。
(Equation 15) This change amount δ ij E model becomes negative, that is, δ ij E model
The movements δvv i and δvv j such that model <0 reduces E model in equation (9).

【0023】このような、点vvi ,vvj における
(9)式のエネルギー関数Emodel の変化の様子を評価
するために、次式(19)、(20)のような近傍エネ
ルギー評価関数di (δvvi ),gij(δvvi ,δ
vvj )を定義する。
In order to evaluate such changes in the energy function E model of the equation (9) at the points vv i and vv j, the neighborhood energy evaluation function d as in the following equations (19) and (20) i (δvv i ), g ij (δvv i , δ
vv j ) is defined.

【数16】 (18)式の変化量δijmodel は、(19)、(2
0)式の近傍エネルギー評価関数di (δvvi ),g
ij(δvi ,δvj )を用いて次式(21)のように表
される。 δijmodel =di (δvvi )+dj (δvvj ) +gij(δvvi ,δvvj ) −di (0) −dj (0) −gij(0,0) ・・・(21) よって、di (δvvi )+dj (δvvj )+g
ij(δvvi ,δvvj )<di (0)+dj (0) +gij
(0,0) となるような近傍への移動δvvi ,δvvj
存在すればvvi ,vvj をvvi +δvvi ,vvj
+δvvj へ同時に移動することによって(9)式のE
model は減少する。すなわち、現在の状態(δvvi
δvvj =0)を含めた近傍点の組み合せのうち、近傍
エネルギー評価関数di (δvvi )+dj (δv
j )+gij(δvvi ,δvvj )が最小となるよう
な移動をすればよい。
[Equation 16] The amount of change δ ij E model in the equation (18) is (19), (2
0) neighborhood energy evaluation function d i (δvv i ), g
It is expressed by the following equation (21) using ij (δv i , δv j ). δ ij E model = d i (δvv i ) + d j (δvv j ) + g ij (δvv i , δvv j ) −d i (0) −d j (0) −g ij (0,0) ・ ・ ・ ( 21) Therefore, d i (δvv i ) + d j (δvv j ) + g
ij (δvv i , δvv j ) <d i (0) + d j (0) + g ij
If there are movements δvv i and δvv j to be (0,0), then vv i and vv j are vv i + δvv i and vv j
By moving to + δvv j simultaneously, E in Eq. (9)
model decreases. That is, the current state (δvv i =
Among combinations of neighboring points including δvv j = 0), the neighborhood energy evaluation function d i (δvv i ) + d j (δv
The movement may be such that v j ) + g ij (δvv i , δvv j ) is minimized.

【0024】図17は、図16中のステップS323の
vvi ,vvj の近傍探索処理のフローチャートであ
る。図18は、2点の近傍探索の様子を示す概念図であ
る。以下、図17を参照しつつ図16中のステップS3
23の処理について説明する。まず、(21)式の近傍
エネルギー評価関数di (δvvi )+dj (δv
j )+gij(δvvi ,δvvj )の計算を効率的に
行うために、di (δvvi ),dj (δvvj )は、
それぞれの点の移動量δvvi ,δvvj のみに依存し
た項であるので、それぞれのm個の近傍点での値をステ
ップS331で式(19)を用いてあらかじめ計算して
おく。この際、Dλi ,Dλj をあらかじめ計算してか
らこの処理を行えばさらに効率が良い。ステップS33
2で、エネルギー評価値の最小値Emin と最小値Emin
を与える近傍点への移動δvvi ,δvvj を現在の位
置で初期化する。ステップ333,S337でカウンタ
h及びkをそれぞれ1から近傍点数mまで進めて、<
h,k>のm×m個の全ての組み合わせについて、点v
i 及びvvj をそれぞれh番目の近傍点vvi +δv
h 及びk番目の近傍点vvj +δvvk へ同時に移動
したときのエネルギーの評価処理S334,S335,
S336を行う。
FIG. 17 is a flowchart of the vv i , vv j neighborhood search process of step S323 in FIG. FIG. 18 is a conceptual diagram showing a situation of a two-point neighborhood search. Hereinafter, with reference to FIG. 17, step S3 in FIG.
The processing of 23 will be described. First, the neighborhood energy evaluation function d i (δvv i ) + d j (δv) of the equation (21)
In order to efficiently calculate v j ) + g ij (δvvi, δvv j ), d i (δvv i ), d j (δvv j ) is
Since the term depends only on the movement amounts δvv i and δvv j of each point, the values at each of the m neighboring points are calculated in advance in step S331 using the equation (19). At this time, if D λi and D λj are calculated in advance and this process is performed, the efficiency is further improved. Step S33
In 2, the minimum value E min and the minimum value E min of the energy evaluation value
Initialize the movements δvv i , δvv j to the neighboring points that give In steps 333 and S337, the counters h and k are respectively incremented from 1 to the neighborhood number m, and <
For all m × m combinations of h, k>, point v
v i and vv j are respectively the h-th neighbor point vv i + δv
v evaluation process of energy when moving h and k th neighboring point of vv j + δvv k simultaneously to S334, S335,
S336 is performed.

【0025】たとえば、近傍点数がm=8の場合に、<
h,k>=<7,5>番目の近傍点を探索している様子
を図18に示す。ステップ334で、<h,k>番目の
近傍点への移動δvvh ,δvvk による近傍エネルギ
ーの評価値di (δvvh )+dj (δvvk )+gij
(δvvh ,δvvk )をステップ331で求めておい
たdi (δvvi ),dj (δvvj )を用いて計算す
る。ステップ334は、m×m回実行されるが、d
i (δvvi ),dj (δvvj )は、それぞれm通り
の値しかとらないため、ステップ334でm×m回も計
算するのは無駄であり、ステップ331であらかじめそ
れぞれのm通りの値を計算しておいて記憶しておくこと
で、ステップ334の計算が効率的に行える。ステップ
S335,S336で、これらの評価値の最小値Emin
と、最小値Emin を与える近傍点への移動δvvi ,δ
vvj を求める。ステップS338,S339で近傍エ
ネルギー評価関数の最小値を与える点が現在位置でなけ
れば、点vvi 及びvvj をvvi +δvvi 及びvv
j +δvvj へ移動する。以上のように、図17に示し
たような処理で点vvi およびvvj をそれぞれの近傍
点のうちで(9)式のエネルギー関数Emodel を減少さ
せる点へ移動することができる。図1に示すように、mo
del 上の全ての2点の組み合わせに対してこの処理を行
うことにより、1点の近傍探索ではエネルギーが減少し
なくなくなったmodel を、2点の近傍探索によってさら
にエネギーが減少する位置へ移動することができる。
For example, if the number of neighboring points is m = 8, <
FIG. 18 shows how the h, k> = <7,5> th neighbor point is searched. In step 334, the evaluation value d i (δvv h ) + d j (δvv k ) + g ij of the neighborhood energy by the movements δvv h and δvv k to the <h, k> -th neighborhood point.
(Δvv h , δvv k ) is calculated using d i (δvv i ) and d j (δvv j ) obtained in step 331. Step 334 is performed m × m times, but d
Since i (δvv i ) and d j (δvv j ) each take only m values, it is useless to calculate m × m times in step 334, and in step 331 each m value is calculated in advance. Is calculated and stored, the calculation in step 334 can be performed efficiently. In steps S335 and S336, the minimum value E min of these evaluation values
And moving to a neighboring point that gives the minimum value E min δvv i , δ
Find vv j . If the point giving the minimum value of the neighborhood energy evaluation function is not the current position in steps S338 and S339, the points vv i and vv j are set to vv i + δvv i and vv.
Move to j + δvv j . As described above, the points vv i and vv j can be moved to the point of decreasing the energy function E model of the equation (9) among the neighboring points by the processing shown in FIG. As shown in Figure 1, mo
By performing this process for all combinations of two points on del, the model whose energy does not decrease in the one-point neighborhood search is moved to the position where the energy decreases further by the two-point neighborhood search. be able to.

【0026】図1に示すように、2点の近傍探索によっ
てmodel が移動すれば1点の近傍探索へ戻って処理を繰
り返し、2点の近傍探索によっても点が移動しなくなっ
たところで処理を終了する。このときのmodel は、
(9)式のエネルギー関数Emode l が最小となるため、
エネルギー関数として与えられた拘束条件を満たすよう
な認識対象の構造が抽出できる。以上のように、本実施
例では、先の提案の動的モデルにおいて、1点の近傍の
みを探索していたためにエネルギーが最小となっていな
いにもかかわらず処理を終了してしまい、認識対象の輪
郭等の構造の抽出に失敗する場合があるという問題点を
解決し、2点を同時に移動して探索を繰り返すことによ
って、正確にエネルギー関数を最小化する認識対象の構
造を抽出できるという利点がある。なお、本発明は、上
記実施例に限定されず種々の変形が可能である。その変
形例としては、例えば次のようなものがある。 (1) 本実施例では、2点を同時に移動した場合の探
索を行う方法について説明したが、さらに3点以上の点
を同時に移動した場合の探索も可能である。すなわち、
3点以上の複数の点を同時に移動した時のエネルギー関
数の変化量を計算しエネルギーの減少する移動を繰り返
すことによってエネルギー最小化処理を行う。 (2) 本実施例では、1点の近傍探索の後に2点の近
傍探索を行う方法について説明したが、1点の近傍探索
処理と2点の近傍探索処理とを本実施例と異なる組み合
わせで処理するなど、種々の変形が可能である。
As shown in FIG. 1, if the model moves by the two-point neighborhood search, the process returns to the one-point neighborhood search and the process is repeated, and the process ends when the points do not move even after the two-point neighborhood search. To do. Model at this time is
Since the energy function E mode l of the equation (9) is the minimum,
The structure of the recognition target that satisfies the constraint condition given as the energy function can be extracted. As described above, in the present embodiment, the processing is ended even though the energy is not minimum because the dynamic model proposed above searches only the vicinity of one point, and the recognition target It is possible to extract the structure of the recognition target that minimizes the energy function accurately by solving the problem that the extraction of the structure such as the contour of the object may fail and moving the two points at the same time and repeating the search. There is. The present invention is not limited to the above embodiment, and various modifications can be made. The following are examples of such modifications. (1) In this embodiment, the method of performing a search when two points are moved at the same time has been described, but a search when three or more points are moved at the same time is also possible. That is,
Energy minimization processing is performed by calculating the amount of change in the energy function when moving a plurality of points of three or more points at the same time and repeating the movement of decreasing the energy. (2) In the present embodiment, the method of performing the two-point neighborhood search after the one-point neighborhood search has been described. However, the one-point neighborhood search process and the two-point neighborhood search process may be combined differently from the present embodiment. Various modifications such as processing are possible.

【0027】[0027]

【発明の効果】以上詳細に説明したように、第1〜第6
の発明によれば、画像認識方法において、エネルギー関
数を最小化するモデルの位置を、モデル上の1点の近傍
点へ移動した場合にエネルギーが減少するような移動を
する1点の近傍の探索処理及び前記モデル上の複数の点
をそれぞれの近傍点へ同時に移動した場合にエネルギー
が減少するような移動をする複数の点の近傍点への同時
探索処理を行うことにより求めるので、正確にエネルギ
ーを最小化する認識対象の構造を抽出できる。
As described in detail above, the first to sixth aspects
According to the invention, in the image recognition method, a search is made for a neighborhood of one point that moves so that energy is reduced when the position of the model that minimizes the energy function is moved to a neighborhood point of the one point on the model. Since it is determined by processing and simultaneous search processing of a plurality of points that move so that energy decreases when a plurality of points on the model are simultaneously moved to their respective neighboring points, the energy is accurately calculated. The structure of the recognition target that minimizes can be extracted.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例を示す画像認識方法のエネルギ
ー最小化処理のフローチャートである。
FIG. 1 is a flowchart of energy minimization processing of an image recognition method according to an embodiment of the present invention.

【図2】従来の動的輪郭モデルによる輪郭抽出方法を示
す図である。
FIG. 2 is a diagram showing a conventional contour extraction method using an active contour model.

【図3】図2の動的輪郭モデルを示す図である。FIG. 3 is a diagram showing the active contour model of FIG. 2;

【図4】図2中のエネルギー最小化処理を示すフローチ
ャートである。
FIG. 4 is a flowchart showing energy minimization processing in FIG.

【図5】先の提案の動的モデルを示す図である。FIG. 5 is a diagram showing the dynamic model proposed above.

【図6】固定点に引き寄せるエネルギー項を示す図であ
る。
FIG. 6 is a diagram showing an energy term attracted to a fixed point.

【図7】2点を結ぶベクトルに関する項を示す図であ
る。
FIG. 7 is a diagram showing terms related to a vector connecting two points.

【図8】3点を結ぶ折れ線に関する項を示す図である。FIG. 8 is a diagram showing terms related to a polygonal line connecting three points.

【図9】3点を頂点とする三角形の面積に関する項を示
す図である。
FIG. 9 is a diagram showing terms relating to the area of a triangle having three points as vertices.

【図10】m点を頂点とするm角形の面積に関する項を
示す図である。
FIG. 10 is a diagram showing terms relating to the area of an m-sided polygon having an apex at the point m.

【図11】先の提案のエネルギー最小化処理を示すフロ
ーチャートである。
FIG. 11 is a flowchart showing an energy minimization process of the above proposal.

【図12】図11中の近傍探索処理を示すフローチャー
トである。
FIG. 12 is a flowchart showing a neighborhood search process in FIG.

【図13】先の提案の近傍探索を示す図である。FIG. 13 is a diagram showing the neighborhood search proposed above.

【図14】先の提案の動的モデルの構成を示す図であ
る。
FIG. 14 is a diagram showing the structure of the previously proposed dynamic model.

【図15】先の提案の動的モデルにおける問題点を示す
図である。
FIG. 15 is a diagram showing a problem in the previously proposed dynamic model.

【図16】図1中の近傍探索によるmodel の移動を示す
図である。
FIG. 16 is a diagram showing movement of model by neighborhood search in FIG. 1.

【図17】図16中の2点の近傍探索によるmodel の移
動を示す図である。
FIG. 17 is a diagram showing movement of a model by a neighborhood search of two points in FIG.

【図18】2点の近傍探索処理を示す図である。FIG. 18 is a diagram showing a two-point neighborhood search process.

【符号の説明】[Explanation of symbols]

110 原画像データ 120 エネルギー画像計算処理 130 エネルギー関数画像 140 エネルギー最小化処理 160 構造モデルの定義 110 Original Image Data 120 Energy Image Calculation Processing 130 Energy Function Image 140 Energy Minimization Processing 160 Definition of Structural Model

───────────────────────────────────────────────────── フロントページの続き (72)発明者 下迫田 義則 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Yoshinori Shimosakoda 1-7-12 Toranomon, Minato-ku, Tokyo Oki Electric Industry Co., Ltd.

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 入力画像中の認識対象の構造を表現する
モデルを画像上の任意個の点で表されるモデルとして定
義し、 前記モデルが画像特徴に引き寄せられる拘束条件と、該
モデルの構造に関する拘束条件を満たす場合にエネルギ
ーが最小となるようなエネルギー関数を定義し、 前記エネルギー関数を最小化する前記モデルの位置を求
めることにより、前記入力画像から任意の構造を抽出す
る画像認識方法において、 前記エネルギー関数を最小化する前記モデルの位置を、
前記モデル上の1点の近傍点へ移動した場合にエネルギ
ーが減少するような移動をする1点の近傍の探索処理及
び前記モデル上の複数の点をそれぞれの近傍点へ同時に
移動した場合にエネルギーが減少するような移動をする
複数の点の近傍点への同時探索処理を行うことにより求
めることを特徴とする画像認識方法。
1. A model representing a structure of a recognition target in an input image is defined as a model represented by an arbitrary number of points on the image, and a constraint condition for attracting the model to image features and a structure of the model. In an image recognition method for extracting an arbitrary structure from the input image by defining an energy function that minimizes energy when a constraint condition regarding is satisfied, and determining a position of the model that minimizes the energy function. , The position of the model that minimizes the energy function,
Search processing for the neighborhood of one point that moves so that the energy decreases when the point moves to one of the neighboring points on the model, and energy when moving a plurality of points on the model to the respective neighboring points at the same time. An image recognition method characterized in that it is obtained by performing simultaneous search processing of a plurality of points that move such that the number of points decreases in the vicinity of the points.
【請求項2】 まず前記1点の近傍の探索処理によって
エネルギー最小化処理を行い、その後前記モデル上の2
点の近傍点へ同時に移動した場合にエネルギーが減少す
るような移動を行い、移動があれば前記1点の近傍の探
索処理に戻り処理を繰り返すことによってエネルギー最
小化を行うことを特徴とする請求項1記載の画像認識方
法。
2. First, energy minimization processing is performed by a search processing in the vicinity of the one point, and then 2
The energy is minimized by performing a movement such that the energy is reduced when the points simultaneously move to a neighboring point, and if there is a movement, returning to the search processing in the neighborhood of the one point and repeating the processing. The image recognition method according to item 1.
【請求項3】 前記複数の点の近傍点への同時探索処理
において、エネルギーの変化量を、探索する複数の点の
近傍への移動量の評価関数として表し、前記評価関数に
基づいてエネルギーが減少するような移動をすることを
特徴とする請求項1記載の画像認識方法。
3. In the simultaneous search process for the neighboring points of the plurality of points, the amount of change in energy is expressed as an evaluation function of the amount of movement of the plurality of points to be searched in the vicinity, and the energy is calculated based on the evaluation function. The image recognition method according to claim 1, wherein the movement is performed so as to decrease.
【請求項4】 前記複数の点の近傍点への同時探索処理
において、探索する複数の点の近傍への移動量の関数と
して表されたエネルギーの変化量のうち、それぞれの点
の1点の移動量のみに依存した項を探索を開始する前に
あらかじめ計算しておき、前記計算した1点の移動量の
みに依存した項を前記複数の点の近傍点への同時探索処
理において用いることを特徴とする請求項3記載の画像
認識方法。
4. In the simultaneous search process for neighboring points of the plurality of points, one point of each point is selected from among the amounts of change in energy expressed as a function of the amount of movement of the plurality of points to be searched to the neighboring points. A term that depends only on the movement amount is calculated in advance before the search is started, and the term that depends only on the calculated movement amount of one point is used in the simultaneous search process for the neighboring points of the plurality of points. The image recognition method according to claim 3, characterized in that
JP6158394A 1994-07-11 1994-07-11 Picture recognition method Withdrawn JPH0822544A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6158394A JPH0822544A (en) 1994-07-11 1994-07-11 Picture recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6158394A JPH0822544A (en) 1994-07-11 1994-07-11 Picture recognition method

Publications (1)

Publication Number Publication Date
JPH0822544A true JPH0822544A (en) 1996-01-23

Family

ID=15670782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6158394A Withdrawn JPH0822544A (en) 1994-07-11 1994-07-11 Picture recognition method

Country Status (1)

Country Link
JP (1) JPH0822544A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003062777A (en) * 2001-08-22 2003-03-05 Honda Motor Co Ltd Autonomous acting robot

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003062777A (en) * 2001-08-22 2003-03-05 Honda Motor Co Ltd Autonomous acting robot
JP4689107B2 (en) * 2001-08-22 2011-05-25 本田技研工業株式会社 Autonomous robot

Similar Documents

Publication Publication Date Title
CN109118564B (en) Three-dimensional point cloud marking method and device based on fusion voxels
JP2017059220A (en) Method and system for removing noise of image
Dal Poz et al. Automated extraction of road network from medium-and high-resolution images
CN107784288A (en) A kind of iteration positioning formula method for detecting human face based on deep neural network
CN108764244B (en) Potential target area detection method based on convolutional neural network and conditional random field
JP2008217706A (en) Labeling device, labeling method and program
CN109948533B (en) Text detection method, device and equipment and readable storage medium
Pistilli et al. Learning robust graph-convolutional representations for point cloud denoising
CN112488999B (en) Small target detection method, small target detection system, storage medium and terminal
Zhu et al. A multilayer-based framework for online background subtraction with freely moving cameras
Dong et al. Learning regional purity for instance segmentation on 3d point clouds
CN115345866A (en) Method for extracting buildings from remote sensing images, electronic equipment and storage medium
JP6389742B2 (en) Image segmentation method, apparatus, and program
CN111414913B (en) Character recognition method, recognition device and electronic equipment
Dinesh et al. Point cloud sampling via graph balancing and Gershgorin disc alignment
CN112013820B (en) Real-time target detection method and device for deployment of airborne platform of unmanned aerial vehicle
JPH0822544A (en) Picture recognition method
CN110837787A (en) Multispectral remote sensing image detection method and system for three-party generated countermeasure network
CN115631489A (en) Three-dimensional semantic scene completion method, device, equipment and medium
Saunders et al. Dyna-dm: Dynamic object-aware self-supervised monocular depth maps
JP2991584B2 (en) Image recognition method
JP7316771B2 (en) Learning device, parameter creation method, neural network, and information processing device using the same
JPH0822545A (en) Picture recognition method
Blache et al. Robust motion flow for mesh tracking of freely moving actors
CN110827238A (en) Improved side-scan sonar image feature extraction method of full convolution neural network

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20011002