JPH06348901A - Multiple resolution image feature extracting device - Google Patents

Multiple resolution image feature extracting device

Info

Publication number
JPH06348901A
JPH06348901A JP5136357A JP13635793A JPH06348901A JP H06348901 A JPH06348901 A JP H06348901A JP 5136357 A JP5136357 A JP 5136357A JP 13635793 A JP13635793 A JP 13635793A JP H06348901 A JPH06348901 A JP H06348901A
Authority
JP
Japan
Prior art keywords
image
template
unit
scale
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5136357A
Other languages
Japanese (ja)
Inventor
Takatsugu Yamada
敬嗣 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5136357A priority Critical patent/JPH06348901A/en
Publication of JPH06348901A publication Critical patent/JPH06348901A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

PURPOSE:To provide the feature extracting device of multiple resolution which employs the convolution of templates capable of absorbing a position shift without causing an increase in device scale. CONSTITUTION:An image feature extracting device with 1st multiple resolution generates an enlarged or reduced image by an image formation part 101 according to a scale signal which is generated by a scale control part 106 and corresponds to an enlargement/-reduction rate. A template convolution part 102 convolutes plural templates for the image and an addition part 103 adds a generated convolution signal to generate an addition image. Further, a re- sampling part 104 performs a thinning-out process according to the scale signal and outputs image features. An image feature extracting device with 2nd multiple resolution after enlarging or reducing the templates by a template convolution part 102 according to a scale signal convolutes the output image of an image formation part 101.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、画像特徴抽出装置に関
し、特に多重解像度の画像特徴抽出装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image feature extraction device, and more particularly to a multi-resolution image feature extraction device.

【0002】[0002]

【従来の技術】従来、この種の画像特徴抽出装置は、画
像認識、特に文字認識において、認識の鍵となる図形特
徴を抽出して、手ぶれや、雑音重畳による図形歪を吸収
して、変動に影響されない特徴を抽出して、その特徴デ
ータを認識部に引き渡すことを目的として用いられてい
る。例えば、「1978年、デジタル画像処理、近代科
学社、443ページ〜445ページ」には、文字のスト
ロークなどをテンプレートとして、それを畳み込み演算
により、対象画像に対して畳込みを行うことにより、対
象画像中のテンプレートの形状と類似する部分を検出す
る技術が記載されている。
2. Description of the Related Art Conventionally, this type of image feature extraction apparatus extracts a graphic feature which is a key to recognition in image recognition, particularly character recognition, absorbs a hand shake or a graphic distortion due to noise superposition, and changes It is used for the purpose of extracting the features that are not affected by and passing the feature data to the recognition unit. For example, in "1978, Digital Image Processing, Modern Science Co., Ltd., pages 443 to 445", a character stroke or the like is used as a template, and by performing a convolution operation on the target image, the target image is convolved. A technique for detecting a portion similar to the shape of the template in the image is described.

【0003】図10は、畳込みを用いた従来の画像特徴
抽出装置の動作の一例を示す図である。入力された画像
1001に対して、テンプレート1002を畳み込み部
1003において、数1に従った計算を実行する。
FIG. 10 is a diagram showing an example of the operation of a conventional image feature extraction apparatus using convolution. The convolution unit 1003 of the template 1002 performs the calculation according to the equation 1 on the input image 1001.

【0004】[0004]

【数1】 [Equation 1]

【0005】ここで、入力された画像1001のサイズ
をN×N画素とし、座標(x,y)での値をh(x,
y)とし、テンプレート1002の座標(a,b)での
値をf(a,b)とし、畳み込み後の画像1003の座
標(x,y)での値をH(f)とする。これにより、H
(f)の値が、入力画像1001中の座標(x,y)に
テンプレート1002が存在する程度が求められる。こ
の値が大きいほどテンプレート1002に似た局所パタ
ーンが存在することを示す。入力画像1001の全ての
座標(x,y)に対して同様の処理を行い、入力画像の
全ての場所でのテンプレート1002の存在の程度を検
出する。
Here, the size of the input image 1001 is N × N pixels, and the value at coordinates (x, y) is h (x,
y), the value at the coordinates (a, b) of the template 1002 is f (a, b), and the value at the coordinates (x, y) of the image 1003 after convolution is H (f). This makes H
The value of (f) is obtained to the extent that the template 1002 exists at the coordinates (x, y) in the input image 1001. The larger this value is, the more local pattern similar to the template 1002 exists. The same process is performed on all the coordinates (x, y) of the input image 1001 to detect the degree of existence of the template 1002 at all the positions of the input image.

【0006】[0006]

【発明が解決しようとする課題】この従来の画像特徴抽
出装置では、局所的な特徴をテンプレートで表現し、入
力画像中での局所特徴の検出のために、畳み込み演算を
実行している。少し位置のずれた局所特徴の検出は、全
ての位置ズレの可能性のある入力画像中の座標(x,
y)で畳込みを実行することにより求めているため、実
現するための計算量や記憶容量が増大して、実現が困難
になる。局所特徴が拡大したり、縮小している場合にも
この従来の画像特徴抽出装置では検出できず、検出した
い局所特徴を拡大したり、縮小したパターンをテンプレ
ートとして、多数種類備えておく必要がある。
In this conventional image feature extraction apparatus, a local feature is represented by a template, and a convolution operation is executed to detect the local feature in the input image. The detection of local features that are slightly misaligned can be performed by using the coordinates (x,
Since it is obtained by executing the convolution in y), the amount of calculation and the storage capacity for the realization increase, and the realization becomes difficult. Even if the local feature is expanded or reduced, this conventional image feature extraction device cannot detect it, and it is necessary to prepare a large number of types of the expanded or reduced local feature to be detected as a template. .

【0007】本発明の目的は、装置規模の増大を招くこ
となく、位置ズレ吸収可能なテンプレートの畳み込みに
よる多重解像度の特徴抽出を可能にする多重解像度画像
特徴抽出装置を提供することにある。
It is an object of the present invention to provide a multi-resolution image feature extraction apparatus capable of performing multi-resolution feature extraction by convoluting a template capable of absorbing positional deviation without increasing the scale of the apparatus.

【0008】[0008]

【課題を解決するための手段】第1の発明は、画像の局
所特徴をテンプレートとして備え、入力画像にそのテン
プレートを畳み込むことによって画像の特徴を抽出する
画像特徴抽出装置において、拡大縮小比率に対応するス
ケール信号を生成するスケール制御部と、前記スケール
制御部からのスケール信号に従って像を生成する像形成
部と、複数のテンプレートを畳み込むテンプレート畳み
込み部と、前記テンプレート畳み込み部において生成さ
れた畳み込み信号を加算し記憶する加算部と、前記加算
部から出力された畳み込み信号を前記スケール制御部か
らのスケール信号に従って間引きして特徴を出力する再
サンプリング部と、を備えることを特徴とする。
According to a first aspect of the present invention, there is provided an image feature extraction apparatus which includes a local feature of an image as a template and which convolves the template with an input image to extract the feature of the image, and which corresponds to a scaling ratio. A scale control unit that generates a scale signal, an image forming unit that generates an image according to the scale signal from the scale control unit, a template convolution unit that convolves a plurality of templates, and a convolution signal generated in the template convolution unit. It is characterized by comprising an adding section for adding and storing, and a resampling section for thinning out the convolutional signal output from the adding section according to the scale signal from the scale control section and outputting the characteristic.

【0009】第2の発明は、第1の発明において、前記
テンプレート畳み込み部が、複数のテンプレートを前記
スケール制御部からのスケール信号に従って拡大縮小し
た後に畳み込むことを特徴とする。
A second invention is characterized in that, in the first invention, the template convolution unit convolves a plurality of templates after enlarging / reducing a plurality of templates according to a scale signal from the scale control unit.

【0010】[0010]

【実施例】次に、本発明について図面を参照して説明す
る。図1は、第1の発明の一実施例を示すブロック図で
ある。図1を参照すると、本実施例は、画像から抽出す
る特徴の大きさを制御するスケール制御部106と、像
形成部101、テンプレート畳み込み部102、加算部
103、再サンプリング部104、出力端子105から
構成される。スケール制御部106は、抽出する局所特
徴の大きさに従ってスケール信号を生成する。例えば、
テンプレート畳み込み部102で用いる局所特徴のテン
プレートの大きさに対して、21/2 倍,2倍,2×2
1/2 倍,2-1/2倍、1/2倍の6種類の大きさの局所特
徴の存否を特徴として抽出する場合に、その倍率を示す
スケール信号sを像形成部101と再サンプリング部1
04に送出する。像形成部101の動作を図3を用いて
説明する。なお図3は、像形成部における画像の拡大縮
小部分の説明図である。特徴抽出の対象となる画像を、
端子301から入力して像記憶部302に記憶する。ス
ケール制御部106から送出されたスケール信号sは端
子305から入力され拡大縮小部304が起動される。
スケール信号sは、画像をs倍に拡大することを示す。
像記憶部302に記憶された入力画像の(x,y)座標
での画像の濃淡値をh(x,y)で表現した時に、s倍
に拡大した画像の濃淡値h′(x′,y′)は、数2で
示される式に従って計算される。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of the first invention. Referring to FIG. 1, in the present exemplary embodiment, a scale control unit 106 that controls the size of a feature extracted from an image, an image forming unit 101, a template convolution unit 102, an addition unit 103, a resampling unit 104, and an output terminal 105. Composed of. The scale control unit 106 generates a scale signal according to the size of the extracted local feature. For example,
2 1/2 times, 2 times, 2 × 2 times the size of the template of the local feature used in the template convolution unit 102.
When the presence / absence of six types of local features of 1/2 times, 2 −1/2 times, and 1/2 times is extracted as a feature, a scale signal s indicating the magnification is resampled with the image forming unit 101. Part 1
Send to 04. The operation of the image forming unit 101 will be described with reference to FIG. Note that FIG. 3 is an explanatory diagram of an image enlargement / reduction portion in the image forming unit. The target image for feature extraction is
It is input from the terminal 301 and stored in the image storage unit 302. The scale signal s sent from the scale control unit 106 is input from the terminal 305 and the scaling unit 304 is activated.
The scale signal s indicates that the image is magnified s times.
When the grayscale value of the image at the (x, y) coordinates of the input image stored in the image storage unit 302 is represented by h (x, y), the grayscale value h ′ (x ′, y ′) is calculated according to the equation shown in Equation 2.

【数2】 h′(x′,y′)=(y′/s−F(y′/s)) ((x′/s−F(x′/s))h(C(x′/s),C(y′/s)) +(C(x′/s)−x′/s)h(F(x′/s),C(y′/s))) +(C(y′/s)−y′/s) ((x′/s−F(x′/s))h(C(x′/s),F(y′/s)) +(C(x′/s)−x′/s)h(F(x′/s),F(y′/s))) ここで、C(R)は、実数値R以上で最小の整数値を表
し、F(R)は、実数値Rより小さい中で最大の整数値
を表す。また、元の画像の大きさを64画素×64画素
とすると、x,yの値は1から64の間の整数値をと
る。また、s倍された画像h′の座標値x′,y′は1
から64sの間の整数値をとる。以上のようにs倍に拡
大された画像h′(x′,y′)は、像記憶部302に
記憶され、端子303からテンプレート畳み込み部10
2に送出される。
## EQU00002 ## h '(x', y ') = (y' / s-F (y '/ s)) ((x' / s-F (x '/ s)) h (C (x' / s), C (y '/ s)) + (C (x' / s) -x '/ s) h (F (x' / s), C (y '/ s))) + (C (y '/ S) -y' / s) ((x '/ s-F (x' / s)) h (C (x '/ s), F (y' / s)) + (C (x '/ s) -x '/ s) h (F (x' / s), F (y '/ s))) where C (R) represents the smallest integer value equal to or greater than the real value R, and F ( R) represents the largest integer value smaller than the real value R. Further, if the size of the original image is 64 pixels × 64 pixels, the values of x and y take integer values between 1 and 64. In addition, the coordinate values x ′ and y ′ of the image h ′ multiplied by s are 1
To 64 s. The image h ′ (x ′, y ′) magnified s times as described above is stored in the image storage unit 302, and is input from the terminal 303 to the template convolution unit 10.
2 is sent.

【0011】次に図1のテンプレート畳み込み部102
について説明する。テンプレート畳み込み部102は、
予め生成した画像の局所特徴を表すテンプレートを複数
持つとともに、1つの局所特徴を表すテンプレートfに
対して、その局所特徴が少々の位置ズレを起こした場合
に相当するテンプレートf′を合わせて持つ。そのテン
プレートの生成方法の例を説明する。例えば、第i番目
の局所特徴に相当するテンプレートf(i,a,b)を
数3で表す。
Next, the template convolution unit 102 shown in FIG.
Will be described. The template convolution unit 102 is
In addition to having a plurality of templates representing the local features of the image generated in advance, a template f'corresponding to the case where the local features cause a slight positional deviation is also provided for the template f representing one local feature. An example of the template generation method will be described. For example, the template f (i, a, b) corresponding to the i-th local feature is represented by Equation 3.

【数3】 f(i,a,b)= (1/n)cos((2π/L)(A(i)a+B(i)b)) ×exp(−2(a2 +b2 )/L2 ) ここで、iは0から7までの整数値を表し、nは1、L
の値は8とするが、n,Lはこれ以外の値をとっても問
題はない。これにより、πi/8ラジアン分回転してお
り、L画素おきに平行に存在する線分からなる局所特徴
を表すテンプレートを構成する。また、A(i),B
(i)は第i番目の局所特徴に依存する値をとり、下の
数4,数5で与えることができるが、これは本質的な問
題ではなく、他の値もとり得る。
F (i, a, b) = (1 / n) cos ((2π / L) (A (i) a + B (i) b)) × exp (−2 (a 2 + b 2 ) / L 2 ) Here, i represents an integer value from 0 to 7, and n is 1, L
Although the value of is set to 8, there is no problem even if n and L take other values. As a result, the template is rotated by πi / 8 radians and forms a template representing a local feature that is composed of line segments that exist in parallel at every L pixel. Also, A (i), B
(I) takes a value depending on the i-th local feature, and can be given by the following equations 4 and 5, but this is not an essential problem, and other values can be employed.

【数4】A(i)=cos(πi/8)## EQU00004 ## A (i) = cos (.pi.i / 8)

【数5】B(i)=sin(πi/8)この場合に、i
は0から7までの整数値とすると、8種類の局所特徴を
表すテンプレートを用いることになる。数3で定められ
たテンプレートを用いる場合に、そのテンプレートを少
し位置ずれさせたテンプレートf′(i,a,b)は数
6で与える。
## EQU5 ## B (i) = sin (πi / 8) In this case, i
Is an integer value from 0 to 7, a template representing eight types of local features will be used. When the template defined by the equation 3 is used, the template f ′ (i, a, b) obtained by slightly shifting the template is given by the equation 6.

【数6】 f′(i,a,b)= (1/n)sin((2π/L)(A(i)a+B(i)b)) ×exp(−2(a2 +b2 )/L2 ) これにより定められたテンプレートf′は、元のテンプ
レートfに対して約L/4画素、つまり約2画素分の位
置ズレを起こしたものとなっている。以上により、8種
類の方向からなる平行線分を表すテンプレートとそれが
少し位置ズレした8種類のテンプレートが生成できる。
このように生成されたテンプレートは予めテンプレート
畳み込み部102に記憶されており、テンプレート畳み
込み部102では数3,数6で示したi番目の2つのテ
ンプレートを数1と同様の畳み込み演算を実行すること
により、2種類の結果画像H(i,f)(x,y)とH
(i,f′)(x,y)を生成し、加算部103に送出
する。
F ′ (i, a, b) = (1 / n) sin ((2π / L) (A (i) a + B (i) b)) × exp (−2 (a 2 + b 2 ) / L 2 ) The template f ′ defined in this way has a position shift of about L / 4 pixels, that is, about 2 pixels, from the original template f. As described above, it is possible to generate a template representing a parallel line segment composed of eight types of directions and eight types of templates with a slight positional deviation.
The template generated in this way is stored in advance in the template convolution unit 102, and the template convolution unit 102 performs the same convolution operation on the i-th two templates shown in Formulas 3 and 6 as in Formula 1. Two types of result images H (i, f) (x, y) and H
(I, f ') (x, y) is generated and sent to the adder 103.

【0012】加算部103では、受け取った(x,y)
座標の2種類の画像データH(i,f)とH(i,
f′)から、数7に従って加算を行う。
The adder 103 receives (x, y)
Two types of coordinate image data H (i, f) and H (i, f)
From f '), addition is performed according to the equation 7.

【数7】 G(i,f)=(H(i,f)2 +H(i,f′)2 1/2 この計算を実行して得られた(x,y)座標での値G
(i,f)(x,y)を、再サンプリング部104に転
送する。ここでは、位置ズレテンプレート数を2つにし
て、説明したが、3以上の場合も同様である。
## EQU7 ## G (i, f) = (H (i, f) 2 + H (i, f ') 2 ) 1/2 The value G at the (x, y) coordinates obtained by executing this calculation
(I, f) (x, y) is transferred to the resampling unit 104. Here, the description has been given assuming that the number of positional deviation templates is two, but the same applies to the case of three or more.

【0013】再サンプリング部104では、x方向,y
方向ともにk画素毎にサンプリングを行い、サンプリン
グされた画素のG(i,f)については端子105から
特徴として送出し、それ以外の画素の値G(i,f)は
消去する。ここでパラメータkは便宜上1とするが、そ
れ以外の値でも本質的な問題ではない。スケール信号s
を順次変更することにより、同一画像から異なる解像度
に相当する同一特徴を抽出することができる。
In the resampling unit 104, x direction, y
Sampling is performed every k pixels in both directions, and G (i, f) of the sampled pixels is sent out as a feature from the terminal 105, and the values G (i, f) of the other pixels are erased. Here, the parameter k is set to 1 for convenience, but other values are not an essential problem. Scale signal s
It is possible to extract the same feature corresponding to different resolutions from the same image by sequentially changing.

【0014】図4,図5は、第1の発明の他の実施例で
ある。特徴抽出の対象となる入力画像h(x,y)は、
入力端子410から入力され、スケール制御部106か
ら転送されたスケール信号sに従って、2次元レーザア
レイ401の各画素のスイッチングを行うものとする。
2次元レーザアレイの各画素には図5に示すレーザコン
ポーネントを配列する。(x,y)座標に配置されたレ
ーザコンポーネントの動作を図5を用いて3つのスケー
ルで特徴抽出する場合を説明する。ここでは、3スケー
ルの場合を説明するが、スケール数は3には限らない。
画素値入力端子501からは、入力画像の(x,y)座
標の値f(x,y)が入力される。スケール制御部10
6から転送されたスケール信号sは端子512から入力
されてセレクタ506を起動し、第s番目のスケールに
対応する信号線を選択し、3つのアンプ502の内の1
つを駆動する。それにより、異なる周波数のコヒーレン
ト光を照射する3つのレーザ素子503,504,50
5の内の1つからレーザ光が照射される。2次元レーザ
アレイ401のf(x,y)が定められたしきい値より
も大きい値を持つ座標(x,y)にあるレーザコンポー
ネント全てから、選択された1つのコヒーレント光が照
射される。ここで選択されたコヒーレント光の波長をP
とする。2次元レーザアレイ401から照射された光
は、ビームスプリッタ402で2方向の光に分けられ
る。1つはレンズ404を透過して空間変調器405に
至る。もう1つはミラー403で反射して、レンズ40
4を透過して空間変調器406に至る。空間変調器40
5は、数3で定めたテンプレートをフーリエ変換して得
られる画像を濃淡にして透明フィルムに焼き付けること
により実現できる。また、空間変調器406は、同様に
数6で定めたテンプレートをフーリエ変換して得られる
画像を濃淡にして透明フィルムに焼き付けることにより
実現できる。2次元レーザアレイ401からレンズ40
4に至る光路長と、レンズ404から空間変調器40
5、空間変調器406に至る光路長を、レンズ404の
焦点距離に一致させることにより空間変調器405と空
間変調器406の面上に、入射コヒーレント光の波長P
に反比例した大きさで端子410から入力された画像の
フーリエ変換像に相当する画像が投影される。そこで投
影光が空間変調器405を透過することにより、入力画
像に対して数3で与えたテンプレートを数1に従って畳
み込み演算を実行したものをフーリエ変換したものと同
等の結果が得られる。同様に空間変調器406を透過し
た光は、数6で定めたテンプレートを数1に従って畳み
込み演算を実行したものをフーリエ変換したものと同等
のものを表す。さらに、空間変調器405,406を透
過した光はレンズ409を透過して、プリズム407を
透過し、2次元光電変換素子アレイ408に至る。ここ
でも、空間変調器405,406からレンズ409に至
る光路長と、レンズ409から光電変換素子408に至
る光路長をレンズ409の焦点距離に一致させる。これ
により光電変換素子アレイ408上には空間変調器40
5,406を透過した画像の逆フーリエ変換像が重ね合
わせて投影され、入力画像に数3と数6で定めた2つの
テンプレートを畳み込んで、数7に従ってその2つの畳
み込み画像を加算した結果のG(i,f)2 (x′,
y′)が得られる。この結果を再サンプリング部104
に転送し、スケール制御部106から転送されたスケー
ル信号に従って、k画素おきに間引き、そのデータを端
子105から画像特徴として抽出する。ここでは、kを
波長Pに反比例した値に定めたが、これは本質的な問題
ではない。スケール信号sを順次変更することにより、
同一画像から異なる解像度に相当する同一特徴を抽出す
ることができる。
4 and 5 show another embodiment of the first invention. The input image h (x, y) that is the target of feature extraction is
It is assumed that each pixel of the two-dimensional laser array 401 is switched according to the scale signal s input from the input terminal 410 and transferred from the scale control unit 106.
The laser component shown in FIG. 5 is arranged in each pixel of the two-dimensional laser array. A case where the operation of the laser component arranged at the (x, y) coordinates is feature-extracted on three scales will be described with reference to FIG. Here, a case of 3 scales will be described, but the number of scales is not limited to 3.
From the pixel value input terminal 501, the value f (x, y) of the (x, y) coordinates of the input image is input. Scale control unit 10
The scale signal s transferred from No. 6 is input from the terminal 512, activates the selector 506, selects the signal line corresponding to the sth scale, and selects one of the three amplifiers 502.
Drive one. As a result, the three laser elements 503, 504, 50 that emit coherent light beams of different frequencies
Laser light is emitted from one of the five. The selected one coherent light is emitted from all the laser components at the coordinates (x, y) where f (x, y) of the two-dimensional laser array 401 has a value larger than a predetermined threshold value. Let P be the wavelength of the coherent light selected here.
And The light emitted from the two-dimensional laser array 401 is split into light in two directions by the beam splitter 402. One passes through the lens 404 and reaches the spatial modulator 405. The other is reflected by the mirror 403 and the lens 40
4 to reach the spatial modulator 406. Spatial modulator 40
5 can be realized by making an image obtained by Fourier transforming the template defined by the expression 3 dark and light and printing it on a transparent film. Further, the spatial modulator 406 can be realized by similarly printing the image obtained by Fourier transforming the template defined by the equation 6 on a transparent film by making the image dark and light. Two-dimensional laser array 401 to lens 40
4, the optical path length from the lens 404 to the spatial modulator 40
5. By matching the optical path length to the spatial modulator 406 with the focal length of the lens 404, the wavelength P of the incident coherent light is projected on the surfaces of the spatial modulator 405 and the spatial modulator 406.
An image corresponding to the Fourier transform image of the image input from the terminal 410 is projected in a size inversely proportional to. Therefore, the projection light is transmitted through the spatial modulator 405, and the result equivalent to the result obtained by performing the Fourier transform on the template obtained by performing the convolution operation on the input image according to the equation 1 is obtained. Similarly, the light transmitted through the spatial modulator 406 represents light equivalent to the light obtained by performing the Fourier transform on the template defined in Expression 6 and performing the convolution operation according to Expression 1. Further, the light transmitted through the spatial modulators 405 and 406 passes through the lens 409, the prism 407, and reaches the two-dimensional photoelectric conversion element array 408. Also in this case, the optical path length from the spatial modulators 405 and 406 to the lens 409 and the optical path length from the lens 409 to the photoelectric conversion element 408 are matched with the focal length of the lens 409. As a result, the spatial modulator 40 is provided on the photoelectric conversion element array 408.
The result obtained by superimposing the inverse Fourier transform images of the images transmitted through 5, 406, convolving the two templates defined by equations 3 and 6 on the input image, and adding the two convolution images according to equation 7. G (i, f) 2 (x ′,
y ') is obtained. The result is resampled by the resampling unit 104.
, And thinning out every k pixels in accordance with the scale signal transferred from the scale control unit 106, and extracting the data from the terminal 105 as an image feature. Here, k is set to a value inversely proportional to the wavelength P, but this is not an essential problem. By changing the scale signal s sequentially,
The same feature corresponding to different resolutions can be extracted from the same image.

【0015】図6を用いて第1の発明のさらに他の実施
例を説明する。スケール制御部106から転送されたス
ケール信号は、レーザ照射部601に転送される。レー
ザ照射部601は、例えば図5に示されるようなレーザ
コンポーネントを1つ以上並置したもので、スケール信
号sに従って波長Pのコヒーレント光を対象画像602
に照射する。反射光はレンズ404、空間変調器40
5,406、レンズ409、プリズム407を透過し
て、光電変換素子アレイ408に照射される。この光電
変換素子アレイ上には、図4に示した実施例と同様の動
作により、入力画像に数3と数6で定めた2つのテンプ
レートを畳み込んで、数7に従ってその2つの畳み込み
画像を加算した結果のG(i,f)2 (x′,y′)が
得られる。この結果を再サンプリング部104に転送
し、スケール制御部106から転送されたスケール信号
に従って、k画素おきに間引き、そのデータを端子10
5から画像特徴として送出する。ここでは、kを波長P
に反比例した値に定めたが、これは本質的な問題ではな
い。スケール信号sを順次変更することにより、同一画
像から異なる解像度に相当する同一特徴を抽出すること
ができる。
Still another embodiment of the first invention will be described with reference to FIG. The scale signal transferred from the scale control unit 106 is transferred to the laser irradiation unit 601. The laser irradiation unit 601 is one in which one or more laser components as shown in FIG. 5, for example, are arranged side by side, and the coherent light of the wavelength P according to the scale signal s is used as the target image 602.
To irradiate. The reflected light is reflected by the lens 404 and the spatial modulator 40.
5, 406, the lens 409, and the prism 407, and the photoelectric conversion element array 408 is irradiated. On this photoelectric conversion element array, by the same operation as that of the embodiment shown in FIG. 4, the two templates defined by the formulas 3 and 6 are convoluted to the input image, and the two convoluted images are calculated according to the formula 7. As a result of addition, G (i, f) 2 (x ′, y ′) is obtained. The result is transferred to the resampling unit 104, thinned out every k pixels in accordance with the scale signal transferred from the scale control unit 106, and the data is output to the terminal 10.
5 is sent as an image feature. Here, k is the wavelength P
The value is inversely proportional to, but this is not an essential problem. By sequentially changing the scale signal s, the same feature corresponding to different resolutions can be extracted from the same image.

【0016】次に図2と図7を用いて第2の発明の一実
施例を説明する。図2に示す多重解像度画像特徴抽出装
置の実施例は、像形成部101、テンプレートを拡大縮
小可能なテンプレート畳み込み部201、加算部10
3、再サンプリング部104、スケール制御部106、
出力端子105からなる。像形成部101、スケール制
御部106、加算部103は図1の実施例と同一のた
め、テンプレート畳み込み部201を図7を用いて説明
する。数3または数6に従った計算により生成されたテ
ンプレートf(a,b)は端子707から入力され、テ
ンプレート記憶部704に記憶される。拡大縮小部70
5では、スケール制御部106から転送されたスケール
信号sを端子706から入力し、その値sに従ってテン
プレート記憶部704に記憶されたテンプレートf
(a,b)を下記の数8に従った計算を実行して拡大縮
小してテンプレートf′(a′,b′)を得る。
Next, an embodiment of the second invention will be described with reference to FIGS. The embodiment of the multi-resolution image feature extraction apparatus shown in FIG. 2 includes an image forming unit 101, a template convolution unit 201 capable of scaling a template, and an adding unit 10.
3, the resampling unit 104, the scale control unit 106,
The output terminal 105. Since the image forming unit 101, the scale control unit 106, and the addition unit 103 are the same as those in the embodiment of FIG. 1, the template convolution unit 201 will be described with reference to FIG. The template f (a, b) generated by the calculation according to Formula 3 or Formula 6 is input from the terminal 707 and stored in the template storage unit 704. Enlarging / reducing unit 70
5, the scale signal s transferred from the scale control unit 106 is input from the terminal 706, and the template f stored in the template storage unit 704 according to the value s.
(A, b) is subjected to calculation according to the following formula 8 to scale it to obtain a template f '(a', b ').

【数8】 f′(a′,b′)=(a′s−F(b′s)) ((a′s−F(a′s))f(C(a′s),C(b′s)) +(C(a′s)−a′s)f(F(a′s),C(b′s))) +(C(b′s)−b′s) ((a′s−F(a′s))f(C(a′s),F(b′s)) +(C(a′s)−a′s)f(F(a′s),F(b′s))) 得られたテンプレートf′(a′,b′)は再びテンプ
レート記憶部704に記憶される。畳み込み計算部70
2で端子701を通して像生成部101から転送された
画像h(x,y)に対して、数3,数6に従って得た2
つのテンプレートを拡大縮小したものを用い、数1に従
った計算を実行することにより、2つの畳み込み画像H
(i,f′,x,y)を求め端子703を通して加算部
103に転送する。数7に従った計算により、加算部1
03で生成された画像G(i,f′)(x,y)は、再
サンプリング制御部104に転送され、スケール制御部
106から転送されたスケール信号sに従って、k画素
毎に間引きを行い、端子105から画像特徴として出力
する。ここではkをsに反比例する値として定めたが、
これは本質的な問題ではない。この実施例では、像形成
部101にて画像の拡大縮小を行わない場合にも、s倍
の拡大を行ったのと同様の効果が得られる。さらに、像
形成部101にてs倍の拡大を行った場合、s2 倍に入
力画像を拡大した場合と同様の効果が得られる。スケー
ル信号sを順次変更することにより、同一画像から異な
る解像度に相当する同一特徴を抽出することができる。
F ′ (a ′, b ′) = (a′s−F (b ′s)) ((a′s−F (a ′s)) f (C (a ′s), C ( b (s)) + (C (a's) -a's) f (F (a's), C (b's))) + (C (b's) -b's) (( a's-F (a's)) f (C (a's), F (b's)) + (C (a's) -a's) f (F (a's), F (B's))) The obtained template f '(a', b ') is stored again in the template storage unit 704. Convolution calculation unit 70
2 obtained according to Equations 3 and 6 for the image h (x, y) transferred from the image generation unit 101 through the terminal 701 in 2
The two convolutional images H are
(I, f ', x, y) is obtained and transferred to the adder 103 through the terminal 703. By the calculation according to the equation 7, the addition unit 1
The image G (i, f ′) (x, y) generated in 03 is transferred to the resampling control unit 104 and thinned out for every k pixels according to the scale signal s transferred from the scale control unit 106. It is output from the terminal 105 as an image feature. Here, k is defined as a value inversely proportional to s,
This is not an essential issue. In this embodiment, even when the image forming unit 101 does not perform image enlargement / reduction, the same effect as that obtained by performing s-fold enlargement can be obtained. Furthermore, when the image forming unit 101 enlarges the image by s times, the same effect as when the input image is enlarged by s 2 times is obtained. By sequentially changing the scale signal s, the same feature corresponding to different resolutions can be extracted from the same image.

【0017】次に、第2の発明の他の実施例を図8を用
いて説明する。入力端子410、2次元レーザアレイ4
01、ビームスプリッタ402、ミラー403、レンズ
404、レンズ409、プリズム407、光電変換素子
アレイ408、再サンプリング部104、端子105は
図4の実施例と同一であり、テンプレート記憶部70
4、拡大縮小部705、端子706,707は、図7の
実施例と同一であるため、可変空間変調器805につい
て説明する。図4での実施例では、空間変調器405,
406は固定でテンプレートをフィルムに焼き付けたも
のを用いたが、ここでは数3及び数6に従って生成さ
れ、s倍に拡大されたテンプレートを、それぞれ液晶表
示装置で構成された空間変調器805,806に表示す
る。これにより、2次元レーザアレイ401で、レーザ
光の波長を切り替えることなく、スケール信号sを順次
変更することにより、同一画像から異なる解像度に相当
する同一特徴を抽出することができる。また、2次元レ
ーザアレイ401で、レーザ光の波長を切り替えた場合
には、より多種類の解像度の特徴を抽出することができ
る。
Next, another embodiment of the second invention will be described with reference to FIG. Input terminal 410, two-dimensional laser array 4
01, the beam splitter 402, the mirror 403, the lens 404, the lens 409, the prism 407, the photoelectric conversion element array 408, the resampling unit 104, and the terminal 105 are the same as those in the embodiment of FIG.
4, the enlargement / reduction unit 705 and the terminals 706 and 707 are the same as those in the embodiment of FIG. 7, and therefore the variable spatial modulator 805 will be described. In the embodiment shown in FIG. 4, the spatial modulators 405,
406 is a fixed template printed on a film, but here, the templates generated according to Equations 3 and 6 and magnified s times are used as spatial modulators 805 and 806, respectively, which are configured by liquid crystal display devices. To display. As a result, the two-dimensional laser array 401 can sequentially change the scale signal s without switching the wavelength of the laser light to extract the same feature corresponding to different resolutions from the same image. Further, when the wavelength of the laser light is switched by the two-dimensional laser array 401, it is possible to extract the characteristics of a wider variety of resolutions.

【0018】次に、図9を用いて第2の発明のさらに他
の実施例を説明する。図9の実施例では、対象画像60
2、レーザ照射部601、レンズ404、レンズ40
9、プリズム407、光電変換素子アレイ408、再サ
ンプリング部104、出力端子105、スケール制御部
106は、図6の実施例と同じであり、拡大縮小部70
5、テンプレート記憶部704、端子706,707
は、実施例の図7と同じである。また、可変空間変調器
805,806も図8で説明したものと同じものであ
る。s倍に拡大されたテンプレートを可変空間変調器8
05,806に表示することにより、スケール信号s倍
のスケールの特徴を抽出できる。スケール信号sを順次
変更して、画像特徴を出力することにより、同一画像か
ら異なる解像度に相当する異なる大きさの同一形状特徴
を抽出することができる。
Next, still another embodiment of the second invention will be described with reference to FIG. In the example of FIG. 9, the target image 60
2, laser irradiation unit 601, lens 404, lens 40
9, the prism 407, the photoelectric conversion element array 408, the resampling unit 104, the output terminal 105, and the scale control unit 106 are the same as those in the embodiment of FIG.
5, template storage unit 704, terminals 706, 707
Is the same as FIG. 7 of the embodiment. The variable spatial modulators 805 and 806 are also the same as those described in FIG. The variable spatial modulator 8 uses the template magnified s times.
By displaying it on 05 and 806, it is possible to extract the characteristic of the scale of the scale signal s times. By sequentially changing the scale signal s and outputting the image features, it is possible to extract the same shape features of different sizes corresponding to different resolutions from the same image.

【0019】[0019]

【発明の効果】以上に説明した多重解像度特徴抽出装置
は、位置ズレに対応する複数のテンプレートを備えて、
それぞれを用いて畳み込まれた画像を加算することによ
り、中間的な位置ズレに影響されずにテンプレートで表
した特徴を抽出できる。
The multi-resolution feature extraction apparatus described above is provided with a plurality of templates corresponding to positional deviation,
By adding the convoluted images using each of them, the feature represented by the template can be extracted without being affected by the intermediate positional deviation.

【0020】また、拡大縮小されたテンプレートを予め
備えることなしに、画像自体を拡大縮小するのと同等の
効果を実現することやテンプレートを拡大縮小すること
により、1種類の局所特徴に対応するテンプレートは1
つだけ備えればよく、簡易に多重特徴抽出装置を実現で
き、多重特徴の分のテンプレート数を減らし、効率よく
多数種類の局所特徴に対応するテンプレートを備えるこ
とができる。
In addition, the template corresponding to one kind of local feature can be realized by providing the same effect as scaling the image itself without scaling the template in advance and scaling the template. Is 1
It is sufficient to provide only one, and a multiple feature extraction device can be easily realized, the number of templates corresponding to multiple features can be reduced, and templates corresponding to many types of local features can be efficiently provided.

【図面の簡単な説明】[Brief description of drawings]

【図1】第1の発明の多重解像度抽出装置の実施例を示
す構成図である。
FIG. 1 is a configuration diagram showing an embodiment of a multi-resolution extraction device of the first invention.

【図2】第2の発明の多重解像度抽出装置の実施例を示
す構成図である。
FIG. 2 is a configuration diagram showing an embodiment of a multi-resolution extraction device of the second invention.

【図3】像形成部における画像の拡大縮小部分の説明図
である。
FIG. 3 is an explanatory diagram of an enlargement / reduction portion of an image in the image forming unit.

【図4】第1の発明の多重解像度抽出装置の実施例を示
す構成図である。
FIG. 4 is a configuration diagram showing an embodiment of a multi-resolution extraction device of the first invention.

【図5】2次元レーザアレイのレーザコンポーネントの
構成を示す図である。
FIG. 5 is a diagram showing a configuration of a laser component of a two-dimensional laser array.

【図6】第1の発明の多重解像度抽出装置の実施例を示
す構成図である。
FIG. 6 is a configuration diagram showing an embodiment of a multi-resolution extraction device of the first invention.

【図7】テンプレート畳み込み部のテンプレートの拡大
縮小部分の実施例の説明である。
FIG. 7 is an illustration of an embodiment of a scaling portion of a template of a template convolution unit.

【図8】第2の発明の多重解像度抽出装置の実施例を示
す構成図である。
FIG. 8 is a configuration diagram showing an embodiment of a multi-resolution extraction device of the second invention.

【図9】第2の発明の多重解像度抽出装置の実施例を示
す構成図である。
FIG. 9 is a configuration diagram showing an embodiment of a multi-resolution extraction device of the second invention.

【図10】従来の畳み込みを用いた特徴抽出の説明図で
ある。
FIG. 10 is an explanatory diagram of feature extraction using conventional convolution.

【符号の説明】[Explanation of symbols]

101 像形成部 102 テンプレート畳み込み部 103 加算部 104 再サンプリング部 105 出力端子 106 スケール制御部 201 テンプレート畳み込み部 301 画像入力端子 302 像記憶部 303 像出力端子 304,705 拡大縮小部 305 スケール入力端子 401 2次元レーザアレイ 402 ビームスプリッタ 403 ミラー 404,409 レンズ 405,406 空間変調器 407 プリズム 408 光電変換素子アレイ 501 画素値入力端子 502 アンプ 503,504,505 レーザ素子 506 セレクタ 512 スケール入力端子 601 レーザ照射部 602 対象画像 701,703,706,707 端子 702 畳み込み計算部 704 テンプレート記憶部 805,806 可変空間変調器 1001 入力画像 1002 テンプレート 1003 畳み込み画像 1004 畳み込み処理 101 image forming unit 102 template convolution unit 103 adder unit 104 resampling unit 105 output terminal 106 scale control unit 201 template convolution unit 301 image input terminal 302 image storage unit 303 image output terminal 304, 705 scaling unit 305 scale input terminal 401 2 Dimensional laser array 402 Beam splitter 403 Mirror 404,409 Lens 405,406 Spatial modulator 407 Prism 408 Photoelectric conversion element array 501 Pixel value input terminal 502 Amplifier 503,504,505 Laser element 506 Selector 512 Scale input terminal 601 Laser irradiation part 602 Target image 701, 703, 706, 707 Terminal 702 Convolution calculation unit 704 Template storage unit 805, 806 Variable spatial modulator 1001 Input image 1002 Template 1003 Convolutional image 1004 Convolutional processing

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】画像の局所特徴をテンプレートとして備
え、入力画像にそのテンプレートを畳み込むことによっ
て画像の特徴を抽出する画像特徴抽出装置において、 拡大縮小比率に対応するスケール信号を生成するスケー
ル制御部と、 前記スケール制御部からのスケール信号に従って像を生
成する像形成部と、 複数のテンプレートを畳み込むテンプレート畳み込み部
と、 前記テンプレート畳み込み部において生成された畳み込
み信号を加算し記憶する加算部と、 前記加算部から出力された畳み込み信号を前記スケール
制御部からのスケール信号に従って間引きして特徴を出
力する再サンプリング部と、を備えることを特徴とする
多重解像度画像特徴抽出装置。
1. An image feature extraction apparatus that includes local features of an image as a template, and extracts the features of the image by convolving the template with an input image, and a scale control unit that generates a scale signal corresponding to a scaling ratio. An image forming unit that generates an image according to the scale signal from the scale control unit, a template convolution unit that convolves a plurality of templates, an addition unit that adds and stores the convolution signals generated in the template convolution unit, and the addition And a resampling unit that thins out the convolutional signal output from the unit according to the scale signal from the scale control unit and outputs the feature.
【請求項2】前記テンプレート畳み込み部において、複
数のテンプレートを前記スケール制御部からのスケール
信号に従って拡大縮小した後に畳み込むことを特徴とす
る請求項1記載の多重解像度画像特徴抽出装置。
2. The multi-resolution image feature extraction apparatus according to claim 1, wherein the template convolution unit performs convolution after enlarging / reducing a plurality of templates according to a scale signal from the scale control unit.
JP5136357A 1993-06-08 1993-06-08 Multiple resolution image feature extracting device Pending JPH06348901A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5136357A JPH06348901A (en) 1993-06-08 1993-06-08 Multiple resolution image feature extracting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5136357A JPH06348901A (en) 1993-06-08 1993-06-08 Multiple resolution image feature extracting device

Publications (1)

Publication Number Publication Date
JPH06348901A true JPH06348901A (en) 1994-12-22

Family

ID=15173294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5136357A Pending JPH06348901A (en) 1993-06-08 1993-06-08 Multiple resolution image feature extracting device

Country Status (1)

Country Link
JP (1) JPH06348901A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012038192A1 (en) 2010-09-22 2012-03-29 Wacker Chemie Ag A silicone composition containing fluorine

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61103368A (en) * 1984-10-26 1986-05-21 Fuji Xerox Co Ltd Optical reader
JPS6314278A (en) * 1986-07-04 1988-01-21 Hitachi Ltd Processing system for picture with variable constant parameter size
JPH0326180A (en) * 1989-06-23 1991-02-04 Toshiba Corp Moving target body automatic tracking device
JPH03225566A (en) * 1990-01-31 1991-10-04 Nec Corp Method and device for pattern recognition
JPH04321374A (en) * 1991-04-19 1992-11-11 Fuji Photo Film Co Ltd Image forming method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61103368A (en) * 1984-10-26 1986-05-21 Fuji Xerox Co Ltd Optical reader
JPS6314278A (en) * 1986-07-04 1988-01-21 Hitachi Ltd Processing system for picture with variable constant parameter size
JPH0326180A (en) * 1989-06-23 1991-02-04 Toshiba Corp Moving target body automatic tracking device
JPH03225566A (en) * 1990-01-31 1991-10-04 Nec Corp Method and device for pattern recognition
JPH04321374A (en) * 1991-04-19 1992-11-11 Fuji Photo Film Co Ltd Image forming method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012038192A1 (en) 2010-09-22 2012-03-29 Wacker Chemie Ag A silicone composition containing fluorine

Similar Documents

Publication Publication Date Title
Kanungo et al. Global and local document degradation models
US8107145B2 (en) Reproducing device and reproducing method
JP6743819B2 (en) Projection device, projection method, and projection program
US20100260433A1 (en) System and method for scaling images
JP4527885B2 (en) Rotation correction and duplicate image identification by Fourier transform correlation
JP5550301B2 (en) Image processing apparatus, image processing method, and program
Hlavac Fundamentals of Image Processing
Triggs Empirical filter estimation for subpixel interpolation and matching
US11226293B1 (en) Structured illumination optical inspection platform for transparent materials
CN112233614B (en) Image moire eliminating method and device and LED display screen correction method
JP2008021126A (en) Image enlarging/reducing device
EP0356727A2 (en) Symmetrie-based target position measurement
JPH06348901A (en) Multiple resolution image feature extracting device
JP4091455B2 (en) Three-dimensional shape measuring method, three-dimensional shape measuring apparatus, processing program therefor, and recording medium
US20220046169A1 (en) Incoherent Fourier Ptychographic Super-Resolution Imaging System with Priors
JP2020194532A (en) Method, system, and device for detecting object in distorted image
Thornton et al. Log-polar sampling incorporating a novel spatially variant filter to improve object recognition
JP3345123B2 (en) Pattern recognition device
CN112017113B (en) Image processing method and device, model training method and device, equipment and medium
US20230237628A1 (en) Modeling continuous kernels to generate an enhanced digital image from a burst of digital images
Elwarfalli A Convolutional Neural Network for Motion-Based Multiframe Super-Resolution Using Fusion of Interpolated Frames
JPH02248980A (en) Production of hologram filter for recognition, hologram filter for recognition and recognizing device using this filter
JPH0585935B2 (en)
CN112132155A (en) SIFT algorithm image boundary expansion method and processing method based on hardware circuit
Markov et al. Redundant Hough transform for invariant pattern recognition in machine vision systems

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19970610