JPH0646418B2 - Feature extraction method - Google Patents

Feature extraction method

Info

Publication number
JPH0646418B2
JPH0646418B2 JP62294057A JP29405787A JPH0646418B2 JP H0646418 B2 JPH0646418 B2 JP H0646418B2 JP 62294057 A JP62294057 A JP 62294057A JP 29405787 A JP29405787 A JP 29405787A JP H0646418 B2 JPH0646418 B2 JP H0646418B2
Authority
JP
Japan
Prior art keywords
character
pattern
coordinate
rectangular frame
division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62294057A
Other languages
Japanese (ja)
Other versions
JPH01136287A (en
Inventor
隆博 小川
晃治 伊東
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP62294057A priority Critical patent/JPH0646418B2/en
Publication of JPH01136287A publication Critical patent/JPH01136287A/en
Publication of JPH0646418B2 publication Critical patent/JPH0646418B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字認識装置等に適用される特徴抽出方式に
関し、特に微小な違いしか存在しないパタンの差を有効
かつ安定に抽出する特徴抽出方式に関する。
Description: TECHNICAL FIELD The present invention relates to a feature extraction method applied to a character recognition device or the like, and particularly feature extraction for effectively and stably extracting a pattern difference that has only a minute difference. Regarding the scheme.

従来の文字図形の認識においては、文字図形パタンより
ストロークを抽出し、それら抽出されたストロークの位
置、長さ、ストローク間の相互関係等を用いて認識する
方式が多く採用されている。その手法は(1) 文字図形の
輪郭を追跡することにより検出された輪郭点系列につい
て曲率を計算し、その曲率の大きな値の点を分割点とし
て輪郭系列を分割し、分割された系列を組合わせること
によりストロークを抽出するか、(2) 文字図形パタンに
細線化処理を行なって骨格化し、その骨格パタンの連結
性及び骨格パタンを追跡し急激な角度の変化点等を検出
してストロークを抽出し、前記(1)(2)より抽出されたス
トロークについて幾何学的な特徴等を抽出して識別を行
なっていた。又(3) 文字図形パタンの文字矩形枠の夫々
の辺から文字図形パタンまでの距離を求め、前記距離を
用いて前記文字矩形枠の各辺に対応する文字図形パタン
の突起部を抽出し、抽出された突起部の突起情報を用い
て、文字認識を行なう方式も特開昭60-230282 号公報に
より提案されている。
In the conventional recognition of character / graphics, a method is widely adopted in which strokes are extracted from a character / graphic pattern, and the positions and lengths of the extracted strokes and mutual relationships between the strokes are used for recognition. The method is as follows: (1) Calculate the curvature of a contour point sequence detected by tracing the contour of a character figure, divide the contour sequence with points with large curvature values as dividing points, and combine the divided sequences. The strokes are extracted by combining them, or (2) the character / graphic pattern is thinned to form a skeleton, and the connectivity and skeleton pattern of the skeleton pattern is traced to detect a sudden change point of the angle, etc. The strokes extracted and extracted in (1) and (2) above are identified by extracting geometrical features and the like. In addition, (3) the distance from each side of the character rectangular frame of the character / graphic pattern to the character / graphic pattern is determined, and the protrusion of the character / graphic pattern corresponding to each side of the character rectangular frame is extracted using the distance, Japanese Patent Laid-Open No. 60-230282 also proposes a method of recognizing characters by using the extracted protrusion information of the protrusions.

(発明が解決しようとする問題点) しかしながら(1) の方法は文字図形パタンが大きくな
り、又文字図形パタンが複雑化すると、その処理量が増
大し処理速度の低下を招いていた。(2) の方法は文字図
形パタンを細線化する必要があり、又その細線化による
パタンのひずみ、ヒゲ等の問題がありその後の処理を複
雑なものとしていた。(3) の方法は入力文字の字形が変
形すると抽出される特徴が不安定となり、特に「水」・
「氷」及び「大」・「太」等の類似文字間ではその影響
が顕著である。
(Problems to be Solved by the Invention) However, in the method (1), when the character / graphic pattern becomes large and the character / graphic pattern becomes complicated, the processing amount increases and the processing speed decreases. In the method (2), it is necessary to make the character / graphic pattern thin, and there are problems such as pattern distortion and beard due to the thinning, and the subsequent processing is complicated. In the method of (3), the extracted features become unstable when the shape of the input character is deformed, and especially "water"
The effect is significant between similar characters such as "ice" and "large" and "thick".

本発明の目的は、従来の認識方式における輪郭追跡や細
線化等の非常に複雑な処理を行なうことなく、文字図形
パタンの周辺分布に基づいて分割した(M×N)個の夫
々の領域に対して、文字図形パタンの外形を表す外郭座
標系列から、所定の条件を満たす極点についての情報を
抽出することにより、文字の字形の変動に対しても安定
で、特に微小な違いしか存在しないパタンの差を有効に
抽出する特徴抽出方式を提供することにある。
An object of the present invention is to divide each of (M × N) regions based on the peripheral distribution of a character / graphic pattern without performing very complicated processing such as contour tracing and thinning in the conventional recognition method. On the other hand, by extracting the information about the poles that satisfy a predetermined condition from the outer coordinate series that represents the outer shape of the character / graphic pattern, the pattern is stable even when the character shape changes, and there are only very small differences. The object of the present invention is to provide a feature extraction method that effectively extracts the difference between the two.

(問題点を解決するための手段) 本発明は、媒体上の文字図形を読取って量子化して得ら
れるパタンを原パタンとして記憶するパタンレジスタを
備え、上記原パタンに基づいて文字図形の特徴を抽出す
る特徴抽出方式を対象とし、前記従来技術の問題点を解
決するため、 (a) パタンレジスタに記憶された原パタンの外接辺から
なる文字矩形枠を検出する手段と、 (b) 上記原パタンを所望の2つの軸上に夫々投影して夫
々の黒ビット数分布を求める手段と、 (c) まず夫々の軸上に対して、上記文字矩形枠で限定さ
れる範囲で黒ビット数分布の夫々の重心座標を決定し
て、次いでそれまでに検出した夫々の重心座標で上記文
字矩形枠で限定される範囲を分割した夫々の範囲を対象
として夫々の前記黒ビット数分布の重心座標を決定する
過程を複数回繰返して夫々の重心座標系列を求め文字矩
形枠内を(M×N)個の領域に分割するための前記重心
座標に基づいた夫々の分割座標を決定する手段と、 (d) 上記原パタンの上記文字矩形枠内部を文字矩形枠の
夫々の辺から垂直方向に走査し、背景部から文字部への
最初の変化点の座標系列を検出する手段と、 (e) 上記変化点座標系列に基づいて、夫々の変化点の変
化量を算出する手段と、 (f) 上記変化量に従って、増減の変化する極点を検出す
る手段と、 (g) 上記(M×N)個の夫々の領域に対して、所定の条
件を満たす上記極点の情報を抽出する手段を設けたもの
である。
(Means for Solving the Problems) The present invention includes a pattern register for storing a pattern obtained by reading and quantizing a character graphic on a medium as an original pattern, and based on the original pattern, the characteristics of the character graphic are determined. In order to solve the above-mentioned problems of the prior art, the feature extraction method for extracting is to be used. (A) A means for detecting a character rectangular frame formed of the circumscribed side of the original pattern stored in the pattern register, and (b) the original Means for projecting the pattern onto desired two axes respectively to obtain respective black bit number distributions, and (c) first, along each axis, the black bit number distribution within a range limited by the character rectangular frame. The respective barycentric coordinates of the black bit number distribution are determined for the respective ranges obtained by dividing the range limited by the character rectangular frame by the respective barycentric coordinates detected until then. The process of making decisions multiple times Means for repeatedly obtaining respective barycentric coordinate series and dividing the inside of the character rectangular frame into (M × N) regions, determining means for the respective divided coordinates based on the barycentric coordinates, and (d) the original pattern Means for vertically scanning the inside of the character rectangular frame from each side of the character rectangular frame and detecting the coordinate series of the first change point from the background part to the character part, (e) based on the change point coordinate series Then, means for calculating the amount of change of each change point, (f) means for detecting a pole point whose increase and decrease change according to the above change amount, and (g) for each of the (M × N) areas Then, a means for extracting the information of the extreme point satisfying a predetermined condition is provided.

(作用) 本発明によれば、以上のように特徴抽出方式を構成した
ので各技術手段は次のように作用する。
(Operation) According to the present invention, since the feature extraction method is configured as described above, each technical means operates as follows.

(a) の手段は、パタンレジスタに格納された原パタンを
走査することによって、文字図形の外接枠である文字矩
形枠を検出し、(b)(c)及び(d) の各手段に出力する。
(b) の手段は、原パタンから、所望の2つの軸の各方向
(例えばX軸、Y軸方向)の黒ビット数分布を作成し、
(c) の手段に出力する。(c) の手段は、(a) の手段から
の文字矩形枠及び(b) の手段からの各黒ビット数分布を
受け、上記所望の2軸に対して周辺分布に基づいた原パ
タンの重心分割座標を検出し、その分割座標を(g) の手
段に出力する。(d) の手段は原パタンの文字矩形枠の上
辺・下辺・左辺・右辺の4辺の夫々の辺から垂直方向に
走査したときの最初の変化点の座標を上記辺の全範囲に
わたって検出することにより変化点座標系列を作成し、
(e) の手段に出力する。(e) の手段は、(d) の手段から
の変化点座標系列に基づいて夫々の変化点の変化量を算
出し、(f) の手段に出力する。(f) の手段は、(e) の手
段からの変化量を基に、増減が変化する極点を検出し、
(g) の手段に出力する。(g) の手段は、(c) の手段から
の分割点座標及び(f) の手段からの極点情報を受け、上
記(M×N)個の夫々の領域に対して、所定の条件を満
たす極点を抽出し、これを文字図形認識のための特徴と
して提供する。したがって、微小な違いしか存在しない
パタンの差を有効かつ安定に抽出できるようになり、前
記従来技術の問題点が解決される。
The means (a) detects the character rectangular frame that is the circumscribed frame of the character figure by scanning the original pattern stored in the pattern register, and outputs it to each means (b) (c) and (d). To do.
The means of (b) creates a black bit number distribution in each direction of the desired two axes (for example, X-axis and Y-axis directions) from the original pattern,
Output to the method of (c). The means of (c) receives the character rectangular frame from the means of (a) and each black bit number distribution from the means of (b), and the center of gravity of the original pattern based on the peripheral distribution with respect to the desired two axes. The division coordinates are detected and the division coordinates are output to the means (g). The means of (d) detects the coordinates of the first change point when scanning vertically from each of the four sides of the upper, lower, left and right sides of the original rectangular frame of the original pattern over the entire range of the above side. By creating a change point coordinate series,
Output to the means of (e). The means (e) calculates the amount of change of each change point on the basis of the change point coordinate series from the means (d) and outputs it to the means (f). The means of (f) detects the pole point where the increase and decrease change based on the amount of change from the means of (e),
Output to the means of (g). The means (g) receives the division point coordinates from the means (c) and the pole point information from the means (f), and satisfies the predetermined condition for each of the above (M × N) areas. We extract the poles and provide them as features for character and figure recognition. Therefore, it becomes possible to effectively and stably extract the pattern difference having only a minute difference, and the problem of the conventional technique is solved.

(実施例) 以下本発明の実施例につき図面を参照して詳細に説明す
る。
Embodiments Embodiments of the present invention will be described in detail below with reference to the drawings.

第1図は本発明の特徴抽出方式が適用される文字認識装
置の構成を示すブロック図である。
FIG. 1 is a block diagram showing the configuration of a character recognition device to which the feature extraction method of the present invention is applied.

第1図において、1は帳票からの光入力、14は本実施
例の文字認識装置の文字名出力である。この文字認識装
置は光電変換部2、パタンレジスタ3、文字枠検出部
4、文字投影作成部5、重心検出部6、文字枠分割点決
定部7、外郭座標系列検出部8、極点座標系列検出部
9、極点計数部10、極点計数領域テーブル11、識別
部12及び辞書メモリ13から構成される。
In FIG. 1, 1 is an optical input from a form, and 14 is a character name output of the character recognition device of this embodiment. This character recognition device includes a photoelectric conversion unit 2, a pattern register 3, a character frame detection unit 4, a character projection creation unit 5, a center of gravity detection unit 6, a character frame division point determination unit 7, an outer coordinate sequence detection unit 8, and a polar coordinate sequence detection. It includes a unit 9, a pole counting unit 10, a pole counting region table 11, an identifying unit 12, and a dictionary memory 13.

光入力1は光電変換部2に入力される。光電変換部2は
1つの文字予定領域を128 ×128 の画素へ分解し、各画
素を2値のディジタル信号(以下これを入力文字パタン
と呼ぶ)へ変換するものであり、平均的大きさの1文字
は60×60ビット程度の入力文字パタンで表現され
る。パタンレジスタ3は文字予定領域における各画素の
X,Y座標を再現できる形式で入力文字パタンを記憶す
るものであり、文字予定領域に対応して128 ×128 ビッ
トの容量を有するものである。
The optical input 1 is input to the photoelectric conversion unit 2. The photoelectric conversion unit 2 decomposes one character planned area into 128 × 128 pixels and converts each pixel into a binary digital signal (hereinafter referred to as an input character pattern), which has an average size. One character is represented by an input character pattern of about 60 × 60 bits. The pattern register 3 stores the input character pattern in a format capable of reproducing the X and Y coordinates of each pixel in the character planned area, and has a capacity of 128 × 128 bits corresponding to the character planned area.

文字枠検出部4は本実施例では文字の外接枠をそのパタ
ンレジスタ3における左端座標Xl 、右端座標Xr 、上
端座標Yt 、下端座標Yb で表現して検出するものであ
る。
In the present embodiment, the character frame detection unit 4 detects the circumscribing frame of a character by expressing it in the pattern register 3 by the left end coordinate X l , the right end coordinate X r , the upper end coordinate Y t , and the lower end coordinate Y b .

文字投影作成部5はパタンレジスタ3の入力文字パタン
を所望の2つの軸、本実施例ではX軸、Y軸(夫々パタ
ンレジスタ3の2次元座標における水平方向、垂直方
向)へ投影して黒ビット数の分布を求め、黒ビット数分
布SX(x) ,SY(y) を作成する。この黒ビット数分布
SX(x) ,SY(y) は次式で表される。
The character projection creation unit 5 projects the input character pattern of the pattern register 3 onto two desired axes, that is, the X axis and the Y axis (horizontal direction and vertical direction in the two-dimensional coordinates of the pattern register 3 respectively) in the present embodiment, and black. The distribution of the number of bits is obtained and black bit number distributions SX (x) and SY (y) are created. The black bit number distributions SX (x) and SY (y) are expressed by the following equation.

但し、x,yはパタンレジスタ3における夫々0〜127
なる2次元座標であり、Yt ,Yb は文字枠のY軸方向
の上端座標、下端座標、Xl ,Xr はX軸方向の左端座
標、右端座標であり、P(x,y)は黒ビット又は白ビ
ットを意味し、黒ビット(有意色)の場合P(x,y)
=1、白ビット(背景色)の場合P(x,y)=0をと
る。
However, x and y are 0 to 127 in the pattern register 3, respectively.
Where Y t and Y b are the upper and lower end coordinates in the Y axis direction of the character frame, X l and X r are the left and right end coordinates in the X axis direction, and P (x, y) Means a black bit or a white bit, and P (x, y) for a black bit (significant color)
= 1 and a white bit (background color), P (x, y) = 0.

第2図は(b),(c) に漢字「水」と「氷」夫々の入力文字
パタン(第2図(a) )に対する黒ビット数分布SX(x)
,SY(y) を示す。
Fig. 2 shows the black bit number distribution SX (x) for the input character patterns (Fig. 2 (a)) of the Chinese characters "water" and "ice" in (b) and (c).
, SY (y).

重心検出部6は、文字枠のX,Y各軸方向の全範囲Xl
〜Xr ,Yt 〜Yb 及び前の過程で検出した重心座標に
よって分割される各範囲を対象として、入力文字パタン
の夫々の黒ビット数分布SX(x) ,SY(y) の重心座標
系列X(Mp),Y(Mq)を求めるものであり、各範囲
の1次モーメントの和をその範囲の黒ビット和で除算す
ることによって求めるものである。但し、Mp ,Mq
座標値の大きさの順に付した重心座標番号であり、Mp
=1〜MX(MXはX軸方向の重心の個数)、Mq =1
〜MY(MYはY軸方向の重心の個数)である。以下の
説明では7個の重心座標X(Mp)を検出する場合につ
いて述べる。まず、文字枠のX軸方向の範囲Xl 〜Xr
を対象として、(3) 式に示すように入力文字パタンの黒
ビット数分布SX(x) の1次モーメント和をその範囲の
黒ビット和で除算することによって、中央の重心座標番
号が4の重心座標X(4) を求める。
The center-of-gravity detection unit 6 determines the entire range X l in the X and Y axis directions of the character frame.
˜X r , Y t ˜Y b and each range divided by the barycentric coordinates detected in the previous process, the barycentric coordinates of each black bit number distribution SX (x), SY (y) of the input character pattern The series X (M p ) and Y (M q ) are obtained by dividing the sum of the first-order moments in each range by the black bit sum in that range. However, M p, M q is the centroid coordinate numbers assigned in the order of magnitude of the coordinate values, M p
= 1 to MX (MX is the number of centers of gravity in the X-axis direction), M q = 1
To MY (MY is the number of centers of gravity in the Y-axis direction). In the following description, the case of detecting seven barycentric coordinates X (M p ) will be described. First, the range of X-axis direction of a character frame X l to X r
As shown in equation (3), the first moment sum of the black bit number distribution SX (x) of the input character pattern is divided by the black bit sum of the range, and the center of gravity coordinate number of 4 becomes Calculate the barycentric coordinate X (4).

次いで、その重心座標X(4) で分割された夫々の範囲、
l 〜X(4) ,X(4) 〜Xr を対象として2つの重心座
標X(2) ,X(6) を(4) 式により求める。
Then, each range divided by the barycentric coordinate X (4),
X l ~X (4), X (4) ~X r 2 two barycentric coordinates as the target X (2), determined by the X (6) (4) equation.

次いで、これまで検出された重心座標X(2) ,X(4) ,
X(6) で分割された範囲Xl 〜X(2) ,X(2) 〜X(4)
,X(4) 〜X(6) ,X(6) 〜Xr を対象として4個の
重心座標X(1) ,X(3) ,X(5) ,X(7) を(5) 式によ
り求める。
Then, the barycentric coordinates detected so far X (2), X (4),
Range divided by the X (6) X l ~X ( 2), X (2) ~X (4)
, X (4) to X (6), X (6) to Xr, the four barycentric coordinates X (1), X (3), X (5), and X (7) are expressed by equation (5). Ask by.

Y軸方向の重心座標Y(Mq)の検出も、検出する重心
座標個数MYを7個とした場合、まず、文字枠の範囲Y
t 〜Yb を対象として入力文字パタンの黒ビット分布S
Y(y) の重心座標Y(4) を検出し、次いで文字枠を重心
座標で2分した範囲Yt 〜Y(4) ,Y(4) 〜Yb それぞ
れを対象として黒ビット分布SY(y) の重心座標Y(2)
,Y(4) を検出し、更にこれまでに検出された重心座
標Y(2) ,Y(4) ,Y(6) でY軸方向の文字枠を分割し
た夫々の範囲Yt 〜Y(2) ,Y(2) 〜Y(4) ,Y(4) 〜
Y(6) ,Y(6) 〜Yb を対象として黒ビット分布SY
(y) の重心座標Y(1) ,Y(3) ,Y(5) ,Y(7) を検出
することによって、計7個の重心座標Y(1) 〜Y(7) を
検出する。
In the detection of the barycentric coordinate Y (M q ) in the Y-axis direction, if the number of barycentric coordinate MY to be detected is 7, first, the range Y of the character frame is detected.
Black bit distribution S of input character pattern for t to Y b
Detecting the Y center coordinates Y of the (y) (4), then the range Y t to Y for 2 minutes character frame center of gravity coordinates (4), Y (4) ~Y b black bit distribution SY respectively as the target ( barycentric coordinate Y (2) of y)
, Y (4) are detected, and the respective ranges Y t to Y (Y (2), Y (4), and Y (6) in which the character frames in the Y-axis direction are divided are detected. 2), Y (2) ~ Y (4), Y (4) ~
Y (6), Y (6 ) ~Y b black bit distribution as target SY
By detecting the barycentric coordinates Y (1), Y (3), Y (5), and Y (7) of (y), a total of seven barycentric coordinates Y (1) to Y (7) are detected.

第2図(b),(c) に漢字「水」と「氷」夫々の入力文字パ
タン(第2図(a) )に対する重心座標X(1) 〜X(7) ,
Y(1) 〜Y(7) が黒ビット数分布ともに例示されてい
る。
The barycentric coordinates X (1) to X (7) for the input character patterns (Fig. 2 (a)) of the Chinese characters "water" and "ice" are shown in Figs. 2 (b) and (c), respectively.
Y (1) to Y (7) are illustrated together with the black bit number distribution.

文字枠分割点決定部7は、重心検出部6よりうけたX,
Y軸各方向の重心座標系列X(Mp),Y(Mq)を分割
座標候補として、重心座標番号Mp ,Mq を入力文字パ
タンの文字枠をNX,NYなる個数の分割単位領域に分
割する分割座標番号ki,kjに対応づけて分割座標系列D
X(ki),DY(kj)を決定するものである。
The character frame division point determination unit 7 receives X, which is received from the center of gravity detection unit 6,
The barycentric coordinate series X (M p ) and Y (M q ) in each direction of the Y-axis are used as the divisional coordinate candidates, and the barycentric coordinate numbers M p and M q are divided unit areas whose number is NX, NY in the character frame of the input character pattern. Divided coordinate series D in association with divided coordinate numbers k i and k j
X (k i ) and DY (k j ) are determined.

この実施例における分割単位領域の分割形式は、X軸方
向に関する分割数としてNX=4,5,6,8なる4形
式を取ることができ、Y軸方向に関する分割数NYとし
てNY=4,5,6,8なる4形式を取ることができ、
X軸方向の分割座標番号をki(ki=1〜NX−1,NX
=4,5,6,8)とし且つY軸方向の分割座標番号を
kj(kj=1〜NY−1,NY=4,5,6,8)とし
て、文字枠をNX,NYなる個数の分割単位領域に分割
する分割座標系列DX(ki),DY(kj)を決定する。X,
Y軸各方向の重心座標番号Mp ,Mq とX,Y軸方向の
分割座標番号ki,kjを対応づけて分割座標系列DX
(ki),DY(kj)を決定するために、表1に示す如きテー
ブルが用意されていて、X,Y軸各方向の分割数NX,
NYに対応してこのテーブルから重心座標番号Mp ,M
q を読み出し、その重心座標番号Mp ,Mq に対応した
重心座標X(Mp),Y(Mq)を分割座標DX(ki),D
Y(kj)として決定する。
The division format of the division unit area in this embodiment can take four formats of NX = 4,5,6,8 as the division number in the X-axis direction, and NY = 4,5 as the division number NY in the Y-axis direction. , 6,8
The division coordinate number in the X-axis direction is k i (k i = 1 to NX-1, NX
= 4, 5, 6, 8) and the division coordinate number in the Y-axis direction
As k j (k j = 1 to NY-1, NY = 4, 5, 6, 8), the divided coordinate series DX (k i ), DY (which divides the character frame into the divided unit areas NX, NY. k j ). X,
Divided coordinate series DX by associating barycentric coordinate numbers M p and M q in each Y-axis direction with divided coordinate numbers k i and k j in the X and Y-axis directions.
In order to determine (k i ), DY (k j ), a table as shown in Table 1 is prepared, and the number of divisions NX in each direction of the X and Y axes,
Corresponding to NY, from this table, the barycentric coordinate numbers M p , M
q is read, and the barycentric coordinates X (M p ), Y (M q ) corresponding to the barycentric coordinate numbers M p , M q are divided into coordinates DX (k i ), D.
Determine as Y (k j ).

このテーブルは、重心検出部6で検出する重心座標の個
数MX,MYが7個の場合であるが、一般的な場合にお
いても、X,Y軸各方向の分割数の重心座標が含まれる
ように対応させ、且つその際余分の重心座標が残った場
合は両端の領域から順に1個多い重心座標が含まれるよ
うに対応させることによって作ることができる。
In this table, the number of barycentric coordinates MX and MY detected by the barycentric detecting unit 6 is 7, but in a general case, the barycentric coordinates of the number of divisions in each direction of the X and Y axes are included. , And in that case, if there are extra barycentric coordinates remaining, the barycentric coordinates may be added so as to include one more barycentric coordinate in order from the regions at both ends.

第3図には、X,Y軸各方向の分割数NX,NYとして
NX=NY=5なる分割数が指定された場合について、
分割座標系列DX(ki),DY(kj)と重心座標系列X(M
p),Y(Mq)との対応関係を示し、また、それらの分
割座標系列DX(ki),DY(kj)で設定される分割単位領
域(ki,kj)を示している。
FIG. 3 shows a case where the number of divisions NX = NY = 5 is designated as the number of divisions NX, NY in each direction of the X and Y axes.
The divided coordinate series DX (k i ), DY (k j ) and the barycentric coordinate series X (M
p ), Y (M q ) and the division unit areas (k i , k j ) set by the division coordinate series DX (k i ), DY (k j ). There is.

なお、分割数NX,NYは入力文字の複雑度に応じて決
定する。又、一旦リジェクトされた場合には分割数N
X,NYを変更して再度文字認識を行なわせる。
The division numbers NX and NY are determined according to the complexity of the input character. If it is rejected once, the number of divisions N
Change X and NY to make character recognition again.

以上の様に文字枠分割点決定部7において、分割単位領
域の分割形式は、X軸方向に関する分割数としてNX=
4,5,6,8なる4形式、Y軸方向に関する分割数と
してNY=4,5,6,8なる4形式をとることができ
る。本実施例では説明の簡略化のため、分割数をNX=
NY=8として以下説明する。この場合、X軸方向にお
いては、重心座標X(1) ,X(2) ,X(3) ,X(4) ,X
(5) ,X(6) ,X(7) に対応する分割座標DX(1),DX
(2) ,DX(3) ,DX(4) ,DX(5) ,DX(6) ,DX
(7) 、Y軸方向においては、重心座標Y(1) ,Y(2) ,
Y(3) ,Y(4) ,S(5) ,S(6) ,Y(7) に対応する分
割座標DY(1) ,DY(2) ,DY(3) ,DY(4) ,DS
(5) ,DY(6) ,DY(7) を決定する。
As described above, in the character frame division point determination unit 7, the division format of the division unit area is NX = as the number of divisions in the X-axis direction.
It is possible to adopt four formats of 4, 5, 6, 8 and 4 formats of NY = 4,5, 6, 8 as the number of divisions in the Y-axis direction. In the present embodiment, the number of divisions is NX =
The following description will be given assuming that NY = 8. In this case, in the X-axis direction, the barycentric coordinates X (1), X (2), X (3), X (4), X
Division coordinates DX (1), DX corresponding to (5), X (6), X (7)
(2), DX (3), DX (4), DX (5), DX (6), DX
(7) In the Y-axis direction, barycentric coordinates Y (1), Y (2),
Divided coordinates DY (1), DY (2), DY (3), DY (4), DS corresponding to Y (3), Y (4), S (5), S (6), and Y (7)
(5), DY (6) and DY (7) are determined.

なお、本実施例においてはテーブルを採用することによ
って重心座標と分割座標とを対応づけたが、第4図に示
すフローチャートの演算処理を実行させることによって
も両者を対応づけることができる。なお、第4図におけ
る除算の結果はすべて小数点以下切り捨てである。
Although the barycentric coordinates and the divided coordinates are associated with each other by using the table in the present embodiment, the two can be associated with each other by executing the arithmetic processing of the flowchart shown in FIG. The results of the division in FIG. 4 are all rounded down to the right of the decimal point.

第4図において、ステップS1で重心個数MXを分割数
NXで割った数Mαを求め、ステップS2,S3でMX
/NXの剰余R1 とそのR1 を2で割ったR2 を求め
る。又、ステップS4で分割数の中央値kαを求め、ス
テップS5,S6で分割番号kiと重心番号Mp を0をセ
ットする。又、ステップS7,S8,S9で、分割番号
kiを1つ増加する毎に、前に設定されている商R2 を1
つ乗じ、重心番号Mp をMαずつ増加させる。ステップ
S10で商R2 が負でないことを調べ、商R2 が負でな
い限りステップS11で重心番号の数を1つ増し、ステ
ップ12でその重心番号Mp を分割番号kiに対応づけ、
分割座標DX(Mp)を決定する。商R2 が負の場合、
ステップS13で現在の分割番号kiが中央値kdより大き
いか否かを判定し、大きい場合は重心番号を1つ増し、
小さい場合はステップS9で設定された重心番号によ
り、分割座標DX(Mp)を決定し、ステップS14で
分割番号kiが(NX−1)に一致したことを検出して終
了する。
In FIG. 4, a number M α is obtained by dividing the number of centroids MX by the number of divisions NX in step S1, and MX is obtained in steps S2 and S3.
The remainder R 1 of / NX and R 2 obtained by dividing R 1 by 2 are obtained. In step S4, the central value k α of the number of divisions is obtained, and in steps S5 and S6, the division number k i and the center of gravity number M p are set to 0. Also, in steps S7, S8, and S9, the division number
Each time k i is incremented by 1, the previously set quotient R 2 is incremented by 1
Then, the center of gravity number M p is increased by M α . It is checked in step S10 that the quotient R 2 is not negative, and unless the quotient R 2 is negative, the number of centroid numbers is incremented by 1 in step S11, and the centroid number M p is associated with the division number k i in step 12,
The division coordinate DX (M p ) is determined. If the quotient R 2 is negative,
In step S13, it is determined whether or not the current division number k i is larger than the median k d , and if it is larger, the center of gravity number is increased by 1,
If it is smaller, the division coordinate DX (M p ) is determined by the center of gravity number set in step S9, and it is detected in step S14 that the division number k i matches (NX-1), and the process ends.

外郭座標系列検出部8は、上記文字枠の内部を対象と
し、文字枠の上辺・下辺・左辺・右辺の4辺夫々の全範
囲に対して、辺に垂直な方向に走査して最初の黒点の座
標を検出し、外郭座標系列GT(x) ,GB(x) ,GL
(y) ,GR(y) を作成する。但し、x,yはパタンレジ
スタ3における夫々0〜127 なる2次元座標であり、G
Tは上辺に対して上記処理により求めたy座標を格納
し、GBは下辺に対して上記処理により求めたy座標を
格納し、GLは左辺に対して上記処理により求めたx座
標を格納し、GRは右辺に対して上記処理により求めた
x座標を格納する。
The outer coordinate sequence detection unit 8 targets the inside of the character frame, and scans the entire range of each of the upper side, lower side, left side, and right side of the character frame in the direction perpendicular to the first black dot. Of the outer coordinate series GT (x), GB (x), GL
Create (y) and GR (y). However, x and y are two-dimensional coordinates of 0 to 127 in the pattern register 3, respectively, and G
T stores the y coordinate obtained by the above process for the upper side, GB stores the y coordinate obtained by the above process for the lower side, and GL stores the x coordinate obtained by the above process for the left side. , GR stores the x-coordinates obtained by the above processing on the right side.

第5図に漢字「水」の入力文字パタンに対する上辺から
の外郭座標系列、第8図に漢字「氷」の入力文字パタン
に対する上辺からの外郭座標系列の値を夫々示す。
FIG. 5 shows the outline coordinate series from the upper side for the input character pattern of the Chinese character “water”, and FIG. 8 shows the values of the outline coordinate series from the upper side for the input character pattern of the Chinese character “ice”.

極点座標系列検出部9は、外郭座標系列検出部8で検出
した外郭座標系列において範囲Xl 〜Xr ,Yt 〜Yb
を対象とし、夫々の外郭座標系列に対する増減を(6) 式
〜(9) 式を用いて調べ、式の値が零となる点は無視し
て、増減の変化する極点の座標の系列 (TX(n1),TY(n1) ),(BX(n2),BY(n2) ), (LX(n3),LY(n3) ),(RX(n4),RY(n4) )を検出する。
The polar coordinate series detection unit 9 detects the ranges X l to X r and Y t to Y b in the outline coordinate series detected by the outline coordinate series detection unit 8.
(6) to (9), the points where the value of the equation becomes zero are ignored, and the coordinate series of the polar points where the increase and decrease change (TX (n 1 ), TY (n 1 )), (BX (n 2 ), BY (n 2 )), (LX (n 3 ), LY (n 3 )), (RX (n 4 ), RY (n 4 ))) is detected.

dGT(x)=GT(x+1)-GT(x) xl≦ x<xr …(6) dGB(x)=GB(x+1)-GB(x) xl≦ x<xr …(7) dGL(y)=GL(y+1)-GL(y) yt≦ y<yb …(8) dGR(y)=GR(y+1)-GR(y) yt≦ y<yb …(9) 但し、始点(xl,GT(xl)),(xl,GB(xl)),(GL(yt),yt),(GR
(yt),yt) 及び終点(xr,GT(Xr)),(xr,GB(xr)),(GL(yb ,y
b),(GR(yb),yb)は、無条件に極点とする。ここでn1
2 ,n3 ,n4 は夫々の外郭座標系列に対する極点の
座標番号で、2≦n1≦Tn,2≦n2≦Bn,2≦n3≦Ln,2
≦n4≦Rnであり、Tnは上辺に対する外郭座標系列GT
における極点の総数であり、Bnは下辺に対する外郭座
標系列GBにおける極点の総数であり、Lnは左辺に対
する外郭座標系列GLにおける極点の総数であり、Rn
は右辺に対する外郭座標系列GRにおける極点の総数で
ある。また(TX(n1),TY(n1))は上辺に対する外郭座標
系列GTにおける極点座標系列であり、(BX(n2),BY
(n2))は下辺に対する外郭座標系列GBにおける極点座
標系列であり、(LX(n3),LY(n3))は左辺に対する外郭
座標系列GLにおける極点座標系列であり、(RX(n4),R
Y(n4))は右辺に対する外郭座標系列GRにおける極点
座標系列である。
dGT (x) = GT (x + 1) -GT (x) x l ≤ x <x r … (6) dGB (x) = GB (x + 1) -GB (x) x l ≤ x <x r … (7) dGL (y) = GL (y + 1) -GL (y) y t ≦ y <y b … (8) dGR (y) = GR (y + 1) -GR (y) y t ≦ y <y b … (9) where start point (x l , GT (x l )), (x l , GB (x l )), (GL (y t ), y t ), (GR
(y t ), y t ) and end point (x r , GT (X r )), (x r , GB (x r )), (GL (y b , y
b ), (GR (y b ), y b ) are unconditionally poles. Where n 1 ,
n 2, n 3, n 4 is coordinate number of pole against outer coordinate sequence each, 2 ≦ n 1 ≦ Tn, 2 ≦ n 2 ≦ Bn, 2 ≦ n 3 ≦ Ln, 2
≦ n 4 ≦ Rn, where Tn is the outer coordinate series GT for the upper side
, Bn is the total number of poles in the outer coordinate series GB for the lower side, Ln is the total number of poles in the outer coordinate series GL for the left side, and Rn
Is the total number of poles in the outer coordinate series GR for the right side. Further, (TX (n 1 ), TY (n 1 )) is a polar coordinate series in the outer coordinate series GT with respect to the upper side, and (BX (n 2 ), BY
(n 2 )) is a polar coordinate series in the outer coordinate series GB for the lower side, (LX (n 3 ), LY (n 3 )) is a polar coordinate series in the outer coordinate series GL for the left side, and (RX (n 4 ), R
Y (n 4 )) is a polar coordinate series in the outer coordinate series GR for the right side.

第6図に漢字「水」の入力文字パタンに対する上辺から
の極点座標系列、第9図に漢字「氷」の入力文字パタン
に対する上辺からの極点座標系列の例を夫々示す。
FIG. 6 shows an example of the polar coordinate series from the upper side for the input character pattern of the Chinese character “water”, and FIG. 9 shows an example of the polar coordinate series from the upper side for the input character pattern of the Chinese character “ice”.

極点計数部10は、対象極点座標系列(PTX(pn1),PTY(p
n1)),(PBX(pn2),PBY(pn2)),(PLX(pn3)),PLY(pn3)),(P
RX(pn4),PRY(pn4))の上辺、下辺、左辺、右辺の種別を
表すSEと、前記極点座標系列を抽出する際の基準辺に
おける対象領域の始点分割点番号S と終点分割点番号E(SEが上辺、下辺を示す場合、S
≦E≦NX、左辺、右辺を示す場合は、S≦E≦NY)
と、前記基準辺と垂直な方向における対象領域の領域端
分割点番号D(SEが上辺、下辺を示す場合、 左辺、右辺を示す場合は、 とを極点計数領域テーブル11から参照し、前記種別S
Eによって定まる極点座標系列に対して、前記基準辺の
始点分割点番号Sに対する前記文字枠分割点決定部7で
決定された分割点及び前記基準辺の終点分割点番号Eに
対する前記文字枠分割点決定部7で決定された分割点と
前記基準辺及び前記領域端分割点番号Dに対する前記文
字枠分割点決定部7で決定された分割点によって囲まれ
る領域を対象として、前記基準辺に向かう方向を正とし
た時に極大点及び極小点となる極点を夫々極大点個数n
max(i)及び極小点個数nmin(i)として計数する。
The pole counting unit 10 calculates the target pole coordinate series (PTX (pn 1 ), PTY (p
n 1 )), (PBX (pn 2 ), PBY (pn 2 )), (PLX (pn 3 )), PLY (pn 3 )), (P
RX (pn 4 ), PRY (pn 4 )) top side, bottom side, left side, SE indicating the type of right side, and the start point division point number S of the target area in the reference side when extracting the polar coordinate series And the end point division point number E (if SE indicates the upper side and the lower side, S
≦ E ≦ NX, S ≦ E ≦ NY when indicating the left side and the right side)
And the area end division point number D (SE indicates the upper side and the lower side of the target area in the direction perpendicular to the reference side, When showing the left side and the right side, And S from the pole point counting area table 11
With respect to the polar coordinate series determined by E, the division point determined by the character frame division point determination unit 7 for the starting point division point number S of the reference side and the character frame division point for the end point division point number E of the reference side A direction toward the reference side with respect to the division point determined by the determination section 7, the reference side, and the area surrounded by the division points determined by the character frame division point determination section 7 with respect to the area end division point number D When n is positive, the number of maximum points and the number of maximum points are n, respectively.
It is counted as max (i) and the number of minimum points n min (i).

但し、本実施例において種別SEは、SE=1で上辺を
基準辺とする極点座標系列(TX(n1 ),TY(n
1 ))を示し、SE=2で下辺を基準辺とする極点座標
系列(BX(n2 ),BY(n2 ))を示し、SE=3
で左辺を基準辺とする極点座標系列(LX(n3 ),L
Y(n3 ))を示し、SE=4で右辺を基準辺とする極
点座標系列(RX(n4 ),RY(n4 ))を示すこと
とした。またiは極点計数領域テーブル11における種
別SE・始点分割点番号S・終点分割点番号E・領域端
分割点番号Dを1組としたときの夫々の組の番号を表
し、1≦ i≦imaxとし、imaxは、極点計数領域テーブル
11における総組数である。S,E,Dは、零でxl
しくはYt を示し、NXもしくはNYでxr もしくはY
b を示す。
However, in this embodiment, the type SE is the polar coordinate series (TX (n 1 ), TY (n) where SE = 1 and the upper side is the reference side.
1 )), SE = 2, and the polar coordinate series (BX (n 2 ), BY (n 2 )) with the lower side as the reference side, SE = 3
And the polar coordinate series (LX (n 3 ), L
Y (n 3 )), and SE = 4, and a polar coordinate series (RX (n 4 ), RY (n 4 )) with the right side as the reference side. Further, i represents the number of each set when the type SE, the starting point division point number S, the end point division point number E, and the area end division point number D in the pole counting area table 11 are set as 1 set, and 1 ≦ i ≦ i and max, i max is the total number of sets of pole count region table 11. S, E, and D are zero and represent x 1 or Y t , and NX or NY are x r or Y.
Indicates b .

第7図に第6図に対応した漢字「水」の上辺からの極大
点及び極小点とS,E,Dに対する極点計数領域、第1
0図に第9図に対応した漢字「氷」の上辺からの極大点
及び極小点とS,E,Dに対する極点計数領域を夫々示
す。
In FIG. 7, the maximum and minimum points from the upper side of the Chinese character “water” corresponding to FIG. 6 and the pole counting areas for S, E and D, the first
FIG. 0 shows the maximum and minimum points from the upper side of the Chinese character “ice” corresponding to FIG. 9 and the pole counting areas for S, E and D, respectively.

識別部12は、極点計数部10で計数した夫々の対象領
域に対する極大点個数及び極小点個数と辞書メモリ13
に格納されているあらかじめ用意された標準パタンの当
該領域に対する極大点個数範囲及び極小点個数範囲との
比較を行い辞書メモリ13内の当該するすべての領域に
おいて範囲内に存在すると判定された標準パタンの文字
名を文字名出力14に出力する。
The identification unit 12 determines the number of maximum points and the number of minimum points for each target area counted by the pole counting unit 10, and the dictionary memory 13.
The standard pattern stored in the above-mentioned standard pattern is compared with the maximum point number range and the minimum point number range for the relevant area, and the standard pattern determined to be within the range in all relevant areas in the dictionary memory 13 is stored. The character name of is output to the character name output 14.

ここで、本発明の特徴抽出方式の特徴情報の1種である
極大点の個数及び極小点の個数に関する有効性を以下に
示す。
Here, the effectiveness of the number of local maximum points and the number of local minimum points, which is one type of the feature information of the feature extraction method of the present invention, is shown below.

例えば、漢字「水」と漢字「氷」において、左上の点の
存在有無を上辺より検出する場合に、右の2本のストロ
ークの変動が特徴値に悪影響を与える。そこで、極点計
数領域の横方向の右側範囲を周辺分布に基づいた分割点
により制限して、上記悪影響を取り除くことができる。
また上下方向に対しても極点計数領域を制限することに
より極点計数領域外の切れ、かすれ等の影響も除くこと
ができ、より安定な特徴値を得ることができる。
For example, in the kanji “water” and the kanji “ice”, when the presence or absence of the upper left point is detected from the upper side, the fluctuation of the two right strokes adversely affects the feature value. Therefore, it is possible to eliminate the above-mentioned adverse effect by limiting the lateral right side range of the pole-counting region by the division points based on the peripheral distribution.
In addition, by limiting the pole counting area in the vertical direction as well, it is possible to eliminate the effects of cutting, blurring, etc. outside the pole counting area, and more stable feature values can be obtained.

また、本実施例における前記文字枠分割点決定部7を付
加することによって、極点計数対象領域の個数が減少
し、従って処理速度の高速化がはかれる。
Further, by adding the character frame division point determination unit 7 in the present embodiment, the number of pole point counting target areas is reduced, and therefore the processing speed can be increased.

(発明の効果) 以上詳細に説明したように、本発明によれば、従来の認
識方式の特徴情報抽出における輪郭追跡や細線化等の非
常に複雑なパタン処理を行なうことなく、文字図形パタ
ンの2つの軸への投影の重心座標より、文字矩形枠内部
を(M×N)個の領域に分割するための文字枠分割点座
標系列を抽出し、文字図形パタンの外形を表す外郭座標
系列から、前記夫々の領域に対して所定の条件を満たす
極点の情報を抽出し、もって特徴とすることで、安定性
良く、微小な違いしか存在しないパターンの差を有効に
抽出する特徴抽出方式を提供できる。
(Effect of the Invention) As described in detail above, according to the present invention, a character / graphic pattern can be formed without performing very complicated pattern processing such as contour tracking and thinning in the feature information extraction of the conventional recognition method. A character frame division point coordinate series for dividing the inside of the character rectangular frame into (M × N) areas is extracted from the barycentric coordinates of the projection on the two axes, and is extracted from the outline coordinate series representing the outer shape of the character / graphic pattern. A feature extraction method is provided that extracts the information of the poles satisfying a predetermined condition from each of the regions and uses them as features to effectively extract the pattern differences that are stable and have only minute differences. it can.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明が適用される文字認識装置の一実施例を
示す機能ブロック図、第2図は入力文字パタン例と、重
心座標系列、分割座標系列との関係を示す図、第3図は
重心座標系列と分割座標系列との対応関係を示す図、第
4図は分割座標系列の他の決定方法におけるフローチャ
ート、第5図は入力文字パタンの漢字「水」に対する上
辺からの外郭座標系列検出方法の説明図、第6図は第5
図の外郭座標系列に対する極大点及び極小点検出方法の
説明図、第7図は極点計数領域S=1,E=6,D=3
に対する第6図の極大点・極小点計数方法の説明図、第
8図は入力文字パタンの漢字「氷」に対する上辺からの
外郭座標系列検出方法の説明図、第9図は第8図の外郭
座標系列に対する極大点及び極小点検出方法の説明図、
第10図は極点計数領域S=1,E=6,D=3に対す
る第9図の極大点・極小点計数方法の説明図である。 1……光入力、2……光電変換部 3……パタンレジスタ、4……文字枠検出部 5……文字投影作成部、6……重心検出部 7……文字枠分割点決定部 8……外部座標系列検出部 9……極点座標系列検出部 10……極点計数部 11……極点計数領域テーブル 12……識別部、13……辞書メモリ 14……文字名出力
FIG. 1 is a functional block diagram showing an embodiment of a character recognition device to which the present invention is applied, FIG. 2 is a diagram showing a relationship between an input character pattern example, a barycentric coordinate series, and a divided coordinate series, and FIG. Is a diagram showing a correspondence relationship between the barycentric coordinate series and the divided coordinate series, FIG. 4 is a flowchart in another method of determining the divided coordinate series, and FIG. 5 is an outer coordinate series from the upper side for the Chinese character “water” of the input character pattern. Explanatory drawing of detection method, FIG.
FIG. 7 is an explanatory diagram of a maximum point / minimum point detection method for the outline coordinate series in FIG. 7, and FIG. 7 shows a maximum point counting area S = 1, E = 6, D = 3.
6 is an explanatory view of the maximum / minimum point counting method of FIG. 6, FIG. 8 is an explanatory view of an outer coordinate sequence detection method from the upper side for the Chinese character “ice” of the input character pattern, and FIG. 9 is an outer contour of FIG. Explanatory diagram of a maximum point and a minimum point detection method for a coordinate series,
FIG. 10 is an explanatory diagram of the maximum point / minimum point counting method of FIG. 9 for the pole counting areas S = 1, E = 6, D = 3. 1 ... Optical input, 2 ... Photoelectric conversion unit 3 ... Pattern register, 4 ... Character frame detection unit 5 ... Character projection creation unit, 6 ... Center of gravity detection unit 7 ... Character frame division point determination unit 8 ... ... External coordinate sequence detection unit 9 ... Pole point coordinate sequence detection unit 10 ... Pole point counting unit 11 ... Pole point counting area table 12 ... Identification unit 13 ... Dictionary memory 14 ... Character name output

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】媒体上の文字図形を読取って量子化して得
られるパタンを原パタンとして記憶するパタンレジスタ
を備え、上記原パタンに基づいて文字図形の特徴を抽出
する特徴抽出方式において、 (a)パタンレジスタに記憶された原パタンの外接辺か
ら成る文字矩形枠を検出する手段と、 (b)上記原パタンを所望の2つの軸上に夫々投影して
夫々の黒ビット数分布を求める手段と、 (c)まず夫々の軸上に対して、上記文字矩形枠で限定
される範囲で黒ビット数分布の夫々の重心座標を決定し
て、次いでそれまでに検出した夫々の重心座標で上記文
字矩形枠で限定される範囲を分割した夫々の範囲を対象
として夫々の前記黒ビット数分布の重心座標を決定する
過程を複数回繰り返して夫々の重心座標系列を求め文字
矩形枠内を(M×N)個の領域に分割するための前記重
心座標に基づいた夫々の分割座標を決定する手段と、 (d)上記原パタンの上記文字矩形枠内部を文字矩形枠
内の夫々の辺から垂直方向に走査し、背景部から文字部
への最初の変化点の座標系列を検出する手段と、 (e)上記変化点座標系列に基づいて、夫々の変化点の
変化量を算出する手段と、 (f)上記変化量に従って、増減の変化する極点を検出
する手段と、 (g)上記検出された極点のうち、上記(M×N)個の
夫々の領域のうちの予め定めた領域に存在する極点の個
数を検出する手段とを 具備したことを特徴とする特徴抽出方式。
1. A feature extraction method for extracting a feature of a character / graphic based on the original pattern, comprising a pattern register for storing a pattern obtained by reading and quantizing a character / graphic on a medium as an original pattern. ) Means for detecting a character rectangular frame composed of the circumscribed sides of the original pattern stored in the pattern register, and (b) Means for projecting the original pattern on desired two axes to obtain respective black bit number distributions. (C) First, determine the respective barycentric coordinates of the black bit number distribution within the range limited by the character rectangular frame with respect to the respective axes, and then use the respective barycentric coordinates detected until then. The process of determining the barycentric coordinates of each of the black bit number distributions for each range obtained by dividing the range limited by the character rectangular frame is repeated a plurality of times to obtain each barycentric coordinate sequence, and the inside of the character rectangular frame is calculated by (M × N Means for determining respective division coordinates based on the barycentric coordinates for division into individual areas, and (d) scanning the inside of the character rectangular frame of the original pattern in a vertical direction from each side of the character rectangular frame. Then, means for detecting the coordinate series of the first change point from the background portion to the character portion, (e) means for calculating the change amount of each change point based on the change point coordinate series, and (f) Means for detecting a pole whose increase or decrease changes according to the amount of change, and (g) a pole existing in a predetermined area of the (M × N) respective areas among the detected poles. A feature extraction method comprising: a means for detecting the number.
JP62294057A 1987-11-24 1987-11-24 Feature extraction method Expired - Fee Related JPH0646418B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62294057A JPH0646418B2 (en) 1987-11-24 1987-11-24 Feature extraction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62294057A JPH0646418B2 (en) 1987-11-24 1987-11-24 Feature extraction method

Publications (2)

Publication Number Publication Date
JPH01136287A JPH01136287A (en) 1989-05-29
JPH0646418B2 true JPH0646418B2 (en) 1994-06-15

Family

ID=17802724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62294057A Expired - Fee Related JPH0646418B2 (en) 1987-11-24 1987-11-24 Feature extraction method

Country Status (1)

Country Link
JP (1) JPH0646418B2 (en)

Also Published As

Publication number Publication date
JPH01136287A (en) 1989-05-29

Similar Documents

Publication Publication Date Title
JPH0877334A (en) Automatic feature point extracting method for face image
CN109034017A (en) Head pose estimation method and machine readable storage medium
WO1994023390A1 (en) Apparatus for identifying person
CN108171157A (en) The human eye detection algorithm being combined based on multiple dimensioned localized mass LBP histogram features with Co-HOG features
CN111259857A (en) Human face smile scoring method and human face emotion classification method
JPH0646418B2 (en) Feature extraction method
CN112348767A (en) Wood counting model based on object edge detection and feature matching
CN113537216B (en) Dot matrix font text line inclination correction method and device
CN115222652A (en) Method for identifying, counting and centering end faces of bundled steel bars and memory thereof
CN115273138A (en) Human body detection system and passenger flow camera
CN113159027B (en) Seven-segment digital display instrument identification method based on minimum external rectangular variant
CN114549694A (en) Certificate photo reloading method and system
CN108629226A (en) A kind of vehicle checking method and system based on image layered technology
JPS63238686A (en) Feature extracting system
JPH07146937A (en) Pattern matching method
JPH0147829B2 (en)
JPH0799534B2 (en) Character figure recognition method
JP2616994B2 (en) Feature extraction device
JPH0799536B2 (en) Character figure recognition method
JPH0799535B2 (en) Character figure recognition method
JPH0656624B2 (en) Feature extraction method
JPS6334682A (en) Character recognition system
JPH08101880A (en) Character recognition device
JP2749947B2 (en) Character recognition method
JPH0147835B2 (en)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees