JP2674286B2 - Feature extraction method - Google Patents

Feature extraction method

Info

Publication number
JP2674286B2
JP2674286B2 JP2202196A JP20219690A JP2674286B2 JP 2674286 B2 JP2674286 B2 JP 2674286B2 JP 2202196 A JP2202196 A JP 2202196A JP 20219690 A JP20219690 A JP 20219690A JP 2674286 B2 JP2674286 B2 JP 2674286B2
Authority
JP
Japan
Prior art keywords
pattern
character
scanning direction
feature
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2202196A
Other languages
Japanese (ja)
Other versions
JPH0485686A (en
Inventor
淳 津雲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2202196A priority Critical patent/JP2674286B2/en
Publication of JPH0485686A publication Critical patent/JPH0485686A/en
Application granted granted Critical
Publication of JP2674286B2 publication Critical patent/JP2674286B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、光学式文字認識における特徴抽出方式に関
する。
The present invention relates to a feature extraction method in optical character recognition.

〔従来の技術〕[Conventional technology]

情報処理システムの多様化に伴い、様々なデータ入力
方法が要求されており、文字認識技術も有力なデータ入
力方法として実用化が進められている。しかし現在の文
字認識技術は文字の読取能力の点で人間に比べてはるか
に劣っており、より高い認識能力を有する文字読取装置
が望まれている。
With the diversification of information processing systems, various data input methods are required, and character recognition technology is being put into practical use as a powerful data input method. However, the current character recognition technology is far inferior to humans in the reading ability of characters, and a character reading device having higher recognition ability is desired.

文字認識能力を高めるために、文字認識方式を構成す
る前処理方式,正規化方式,特徴抽出方式,分類・識別
方式そして後処理方式のそれぞれにおいて改良が進めら
れている。
In order to improve the character recognition ability, improvements are being made in each of the preprocessing method, the normalization method, the feature extraction method, the classification / identification method, and the postprocessing method that constitute the character recognition method.

文字認識技術の中でも漢字認識は、 認識対象の字種の多さ、 字形の複雑さ、 類似した形状の文字の組の多さ、 マルチフォント印刷漢字認識や手書き漢字認識では形
状の変形の多様さ、 を問題としてきた。この中で、の字種の多さの問題に
関しては、比較的簡単な処理で字種の候補を絞り込んで
から、丁寧な処理で最終的な認識結果を出す階層的な分
類処理が一般的に用いられている。
Among the character recognition technologies, kanji recognition is characterized by a large number of character types to be recognized, complexity of glyphs, a large number of groups of characters with similar shapes, and multi-font printing. , Has been a problem. Among these, regarding the problem of a large number of character types, a hierarchical classification process that narrows down character type candidates with a relatively simple process and then gives a final recognition result with a careful process is generally used. It is used.

分類の階層の初めの段階の処理は一般的に大分類ある
いは粗分類と呼ばれ、後段の分類処理は詳細分類あるい
は識別等と呼ばれることが多い。印刷漢字認識における
大分類として知られている方法は多々あるが、先駆的で
かつ実績のあるものとして、例えば文献「2,000字種を1
00字/秒で読む印刷漢字OCRの開発、森健一・坂井邦
夫、日経エレクトロニクス、1977.10.31、pp.102−128
(昭和52年10月)」で記載されている複雑指数等があ
り、手書き漢字認識に関しては、同一出願人により平成
2年6月14日に出願された特許出願明細書「文字分類方
式」に記載された方法がある。また手書き漢字認識にお
ける大分類として、これよりもやや処理量を必要とする
として、例えば、文献「手書き漢字のストローク密度関
数による大分類、内藤・淀川、電子通信学会パターン認
識・学習研究会技術報告PRL79−3(昭和54年)」に記
載されているストローク密度関数等が知られている。
The processing in the first stage of the classification hierarchy is generally called large classification or coarse classification, and the classification processing in the latter stage is often called detailed classification or identification. There are many methods known as major classifications in printed kanji recognition, but as a pioneering and proven record, for example, the document
Development of printing Kanji OCR that can be read at 00 characters / second, Kenichi Mori / Kunio Sakai, Nikkei Electronics, 1977.10.31, pp.102-128
(October 1977) ”, and the handwriting kanji recognition is included in the patent application specification“ Character classification method ”filed on June 14, 1990 by the same applicant. There is a method described. In addition, as a large classification in handwritten kanji recognition requires a little more processing than this, for example, the document "Large classification by stroke density function of handwritten kanji, Naito / Yodogawa, IEICE Pattern Recognition / Learning Study Group Technical Report" The stroke density function and the like described in "PRL 79-3 (1979)" are known.

漢字は「日」のように字形の簡単なものから、「電」
のように字形のやや複雑なもの、さらに「瀧」のように
字形の非常に複雑なものまであるので、この複雑さを基
準にして字種の候補を絞り込み、詳細分類あるいは識別
処理での負担を軽減しようとするものである。このよう
な各階層の分類において、取扱う特徴量の効果が分類能
力に大きく影響する。大分類から詳細分類のための特徴
としては、基本的なものとして方向特徴が知られてお
り、例えば文献「手書漢字の方向パターン・マッチング
法による解析、斎藤・山田・山本、電子通信学会論文誌
(D),Vol.J65−D,No.5,pp.550−557(昭和57年)」に
記載されている。また文字パターンの背景部に着目して
安定した特徴を抽出するものとして、文献「セル特徴を
用いた手書き漢字の認識、岡、電子通信学会論文誌
(D),Vol.J66−D,No.1,pp.17−24(昭和58年)」に記
載されている方法等がよく知られている。
Kanji starts with a simple glyph such as "day" and then "den"
There are some complicated glyphs such as, and even very complicated glyphs such as “Taki”. Therefore, the candidates for the glyphs are narrowed down based on this complexity, and the burden of detailed classification or identification processing is reduced. Is intended to reduce. In such classification of each layer, the effect of the feature quantity to be handled greatly affects the classification ability. Directional features are known as basic features from large classifications to detailed classifications. For example, literature "Handwritten Chinese character analysis by direction pattern matching method, Saito / Yamada / Yamamoto, IEICE papers" Journal (D), Vol. J65-D, No. 5, pp. 550-557 (1982) ". In addition, as a method for extracting stable features by paying attention to the background part of the character pattern, a document “Recognition of Handwritten Kanji Using Cell Features, Oka, The Institute of Electronics and Communication Engineers (D), Vol.J66-D, No. 1, pp. 17-24 (1983) "are well known.

〔発明が解決しようとする課題〕[Problems to be solved by the invention]

階層的な分類を行って候補文字を絞り込んでいくとき
に問題となるのは、各階層で使われる特徴量の分類能力
と、処理量あるいは処理を実行するための手段の規模、
すなわちコストである。特徴の分類能力に着目すると、
文字パタンの局所領域における方向性と大局的な複雑さ
が有効であることが知られているが、両者の特徴量の抽
出手段は異なる方法がとられており、コストを高くする
要因となっている。また各階層の分類用の特徴量の抽出
手段も異なる方法がとられているために、コストを高く
する要因となっている。
When performing hierarchical classification and narrowing down the candidate characters, the problems are the classification ability of the feature amount used in each layer, the processing amount or the scale of the means for executing the processing,
That is, cost. Focusing on the feature classification ability,
It is known that the directionality and global complexity in the local area of the character pattern are effective, but the method of extracting the feature amount of both is different, which causes the cost to increase. There is. In addition, the method of extracting the feature amount for classification of each layer is different, which is a factor of increasing the cost.

本発明の目的は、漢字認識における各階層の分類能力
を保持するために特徴として字形の複雑さと方向性を取
り上げ、両者の特徴量を共通の手段で抽出し、かつ各階
層の分類用の特徴量も共通の手段で抽出することによっ
て、処理の実現手段と処理量のコスト問題を回避する特
徴抽出方式を実現することにある。
An object of the present invention is to take the complexity and directionality of glyphs as features in order to maintain the classification ability of each layer in kanji recognition, extract the feature amounts of both by a common means, and classify the features of each layer. It is to realize a feature extraction method that avoids the cost problem of the processing realizing means and the processing amount by extracting the amount by the common means.

〔課題を解決するための手段〕[Means for solving the problem]

第1の発明の特徴抽出方式は、 二次元格子上の二値化されたディジタル図形として表
された文字パタンを格納する文字パタン記憶手段と、 前記文字パタン記憶手段から記憶内容である文字パタ
ンを読み込み、文字パタン上を複数方向に走査すること
に文字部分の各画素に対応する記憶場所には各走査方向
ごとに連続する文字部分の距離情報を格納し、文字パタ
ンの背景部分の各画素に対応する記憶場所には各走査方
向ごとに連続する背景部分の距離情報を出力する距離パ
タン作成手段と、 前記距離パタン作成手段から文字部分の各画素に対応
する記憶場所から各走査方向ごとに求められた距離情報
を読み込み、その逆数を計算して文字部分の各走査方向
ごとの特徴量を定め、文字パタンの背景部分の各画素に
対応する記憶場所から各走査方向ごとに求められた距離
情報を読み込み、その逆数を計算して背景部分の各走査
方向ごとの特徴量を定めることによって特徴パタンを作
成し、出力する面特徴パタン作成手段とから成ることを
特徴とする。
A feature extraction method according to a first aspect of the invention is a character pattern storage unit that stores a character pattern represented as a binarized digital figure on a two-dimensional grid, and a character pattern that is stored content from the character pattern storage unit. By reading and scanning the character pattern in multiple directions, the distance information of the continuous character part is stored in each memory area corresponding to each pixel of the character part, and it is stored in each pixel of the background part of the character pattern. Distance pattern generating means for outputting distance information of a continuous background portion for each scanning direction to the corresponding storage location, and for each scanning direction from the storage location corresponding to each pixel of the character portion from the distance pattern generating means The distance information is read, the reciprocal of the distance information is calculated, the feature amount for each scanning direction of the character portion is determined, and the scanning method is selected from the memory location corresponding to each pixel of the background portion of the character pattern. The distance information obtained for each is read, the reciprocal is calculated, and a feature pattern is created by defining the feature amount for each scanning direction of the background portion, and a surface feature pattern creating means for outputting is provided. To do.

第2の発明の特徴抽出方式は、 二次元格子上の二値化されたディジタル図形として表
された文字パタンを格納する文字パタン記憶手段と、 前記文字パタン記憶手段から記憶内容である文字パタ
ンを読み込み、文字パタン上を複数方向に走査すること
に文字部分の各画素に対応する記憶場所には各走査方向
ごとに連続する文字部分の距離情報を格納し、文字パタ
ンの背景部分の各画素に対応する記憶場所には各走査方
向ごとに連続する背景部分の距離情報を出力する距離パ
タン作成手段と、 前記距離パタン作成手段から文字部分の各画素に対応
する記憶場所から各走査方向ごとに求められた距離情報
を読み込み、その逆数を計算して文字部分の各走査方向
ごとの特徴量を定め、文字パタン背景部分の各画素に対
応する記憶場所から各走査方向ごとに求められた距離情
報を読み込み、その逆数を計算して背景部分の各走査方
向ごとの特徴量を定めることによって特徴パタンを作成
し、出力する面特徴パタン作成手段と、 前記面特徴パタン作成手段から文字部分の各画素の走
査方向ごとの特徴量を読み込み、各走査方向に対して垂
直方向に特徴量を累積することによって文字部分の各走
査方向に対するヒストグラムを作成し、文字パタンの背
景部分の各画素の走査方向ごとの特徴量を読み込み、各
走査方向に対して垂直方向に特徴量を累積することによ
って文字パタンの背景部分の各走査方向に対するヒスト
グラムを作成し、各ヒストグラムを圧縮された特徴パタ
ンとして出力する線特徴パタン作成手段とから成ること
を特徴とする。
A feature extraction method according to a second aspect of the present invention is a character pattern storage unit that stores a character pattern represented as a binarized digital figure on a two-dimensional grid, and a character pattern that is stored content from the character pattern storage unit. By reading and scanning the character pattern in multiple directions, the distance information of the continuous character part is stored in each memory area corresponding to each pixel of the character part, and it is stored in each pixel of the background part of the character pattern. Distance pattern generating means for outputting distance information of a continuous background portion for each scanning direction to the corresponding storage location, and for each scanning direction from the storage location corresponding to each pixel of the character portion from the distance pattern generating means The distance information is read, the reciprocal of the distance information is calculated to determine the feature amount for each scanning direction of the character portion, and the scanning direction is determined from the memory location corresponding to each pixel of the character pattern background portion. And a surface feature pattern creating unit that creates and outputs a feature pattern by calculating the reciprocal of the distance information obtained by calculating the reciprocal of the distance information and determining the feature amount for each scanning direction of the background portion, and the surface feature pattern creation. The feature amount for each scanning direction of each pixel of the character portion is read from the means, and a histogram for each scanning direction of the character portion is created by accumulating the feature amount in the vertical direction with respect to each scanning direction. The feature amount of each pixel in each scanning direction is read and the feature amount is accumulated in the direction perpendicular to each scanning direction to create a histogram for each scanning direction of the background portion of the character pattern, and each histogram is compressed. And a line feature pattern creating means for outputting as a feature pattern.

第3の発明の特徴抽出方式は、 二次元格子上の二値化されたディジタル図形として表
された文字パタンを格納する文字パタン記憶手段と、 前記文字パタン記憶手段から記憶内容である文字パタ
ンを読み込み、文字パタン上を複数方向に走査すること
に文字部分の各画素に対応する記憶場所には各走査方向
ごとに連続する文字部分の距離情報を格納し、文字パタ
ンの背景部分の各画素に対応する記憶場所には各走査方
向ごとに連続する背景部分の距離情報を出力する距離パ
タン作成手段と、 前記距離パタン作成手段から文字部分の各画素に対応
する記憶場所から各走査方向ごとに求められた距離情報
を読み込み、その逆数を計算して文字部分の各走査方向
ごとの特徴量を定め、文字パタン背景部分の各画素に対
応する記憶場所から各走査方向ごとに求められた距離情
報を読み込み、その逆数を計算して背景部分の各走査方
向ごとの特徴量を定めることによって特徴パタンを作成
し、出力する面特徴パタン作成手段と、 前記面特徴パタン作成手段から文字部分の各画素の走
査方向ごとの特徴量を読み込み、各走査方向に対して垂
直方向に特徴量を累積することによって文字部分の各走
査方向に対するヒストグラムを作成し、文字パタンの背
景部分の各画素の走査方向ごとの特徴量を読み込み、各
走査方向に対して垂直方向に特徴量を累積することによ
って文字パタンの背景部分の各走査方向に対するヒスト
グラムを作成し、各ヒストグラムを圧縮された特徴パタ
ンとして出力する線特徴パタン作成手段と、 前記線特徴パタン作成手段から文字部分の各走査方向
に対するヒストグラムを読み込み、各ヒストグラムの内
容の総和をそれぞれ求めて各走査方向に対する文字部分
の特徴量とし、文字パタンの背景部分の各走査方向に対
するヒストグラムを読み込み、各ヒストグラムの内容の
総和をそれぞれ求めて各走査方向に対する背景部分の特
徴量とすることによって、多次元特徴ベクトルとして出
力する点特徴パタン作成手段とから成ることを特徴とす
る。
A feature extraction method according to a third aspect of the present invention is a character pattern storage unit for storing a character pattern represented as a binarized digital figure on a two-dimensional grid, and a character pattern which is stored content from the character pattern storage unit. By reading and scanning the character pattern in multiple directions, the distance information of the continuous character part is stored in each memory area corresponding to each pixel of the character part, and it is stored in each pixel of the background part of the character pattern. Distance pattern generating means for outputting distance information of a continuous background portion for each scanning direction to the corresponding storage location, and for each scanning direction from the storage location corresponding to each pixel of the character portion from the distance pattern generating means The distance information is read, the reciprocal of the distance information is calculated to determine the feature amount for each scanning direction of the character portion, and the scanning direction is determined from the memory location corresponding to each pixel of the character pattern background portion. And a surface feature pattern creating unit that creates and outputs a feature pattern by calculating the reciprocal of the distance information obtained by calculating the reciprocal of the distance information and determining the feature amount for each scanning direction of the background portion, and the surface feature pattern creation. The feature amount for each scanning direction of each pixel of the character portion is read from the means, and a histogram for each scanning direction of the character portion is created by accumulating the feature amount in the vertical direction with respect to each scanning direction. The feature amount of each pixel in each scanning direction is read and the feature amount is accumulated in the direction perpendicular to each scanning direction to create a histogram for each scanning direction of the background portion of the character pattern, and each histogram is compressed. Line feature pattern creating means for outputting as a feature pattern, and a histogram for each scanning direction of the character portion from the line feature pattern creating means. Read, calculate the sum of the contents of each histogram as the feature amount of the character part for each scanning direction, read the histogram for the background part of the character pattern for each scanning direction, calculate the sum of the contents of each histogram, and calculate each scanning direction. And a point feature pattern creating means for outputting as a multi-dimensional feature vector by using the feature amount of the background portion as to.

〔作用〕[Action]

以下、本発明の中心的役割を果たす文字パタンの複雑
さと方向性の2次元的な特徴の抽出方法について説明す
る。尚、以下の説明では各特徴を抽出する時の走査方向
を水平方向と垂直方向の2方向を例として述べることに
する。
Hereinafter, a method of extracting a two-dimensional characteristic of complexity and directionality of a character pattern that plays a central role of the present invention will be described. In the following description, the scanning directions when extracting the respective features will be described by taking two directions, that is, the horizontal direction and the vertical direction as an example.

第4図は特徴抽出のための図形処理を説明するための
図である。第4図(a)は文字パタンの文字の部分(黒
画素部分)上と背景部分(白画素部分)上の水平に連続
する画素の長さを示す図であり、第4図(b)は文字パ
タンの文字の部分(黒画素部分)上と背景部分(白画素
部分)上の垂直に連続する画素の長さを示す図である。
すなわち第4図のようなi−j座標系上で、画素(i,
j)が文字部分の画素ならば、その画素を通って左右お
よび上下に連続する文字部分の画素の列の長さが定ま
り、画素(k,l)が背景部分の画素ならば、その画素を
通って左右および上下に連続する背景部分の画素の列の
長さが定まる。これらをそれぞれ文字画像(i,j)およ
び背景画素(k,l)における水平方向および垂直方向の
間隔と呼ぶことにする。第4図では、画素(i,j)の水
平方向の間隔はhij、垂直方向の間隔はvijであり、画素
(k,l)の水平方向の間隔はhkl、垂直方向の間隔はvkl
である。画素(i,j)と画素(i+l,j)が共に文字画素
か、あるいは共に背景画素ならば、水平方向の間隔hij
とhi+l,jについて、 hij=hi+l,j が成立ち、同じく画素(i,j)と画素(i,j+1)が共に
文字画素か、あるいは共に背景画素ならば、垂直方向の
間隔vijとvi,j+1について、 vij=vi,j+1 が成り立つ。すなわち、水平方向に隣接する文字部分上
の文字画素対あるいは背景部分上の背景画素対の水平方
向の間隔は等しく、垂直方向に隣接する垂直方向の間隔
は等しい。このように文字部分の各画素の各走査方向の
間隔が定められたものを文字部分の距離パタン、背景字
部分の各画素の各走査方向の間隔が定められたものを背
景部分の距離パタンと呼ぶことにする。
FIG. 4 is a diagram for explaining graphic processing for feature extraction. FIG. 4 (a) is a diagram showing the lengths of horizontally consecutive pixels on the character portion (black pixel portion) and the background portion (white pixel portion) of the character pattern, and FIG. 4 (b) is It is a figure which shows the length of the pixel which continues vertically on the character part (black pixel part) and background part (white pixel part) of a character pattern.
That is, on the i-j coordinate system as shown in FIG. 4, the pixel (i,
If j) is the pixel of the character part, the length of the row of pixels of the character part that continues to the left and right and up and down through that pixel is determined, and if pixel (k, l) is the pixel of the background part, then that pixel is The length of the row of pixels in the background portion that is continuous in the left-right and up-down directions is determined. These are referred to as horizontal and vertical intervals in the character image (i, j) and the background pixel (k, l), respectively. In FIG. 4, the pixel (i, j) has a horizontal interval of h ij and the vertical interval of v ij . The pixel (k, l) has a horizontal interval of h kl and a vertical interval of v ij. v kl
It is. If pixel (i, j) and pixel (i + 1, j) are both character pixels or both are background pixels, the horizontal interval h ij
And h i + l , j , h ij = h i + l , j , and if pixel (i, j) and pixel (i, j + 1) are both character pixels or both background pixels, then vertical For the intervals v ij and v i , j + 1 in the direction, v ij = v i , j + 1 holds. That is, the horizontal spacing between the character pixel pairs on the horizontally adjacent character portions or the background pixel pairs on the background portion is the same, and the vertical spacings that are vertically adjacent are the same. In this manner, the distance pattern of the character portion is defined as the distance between the pixels of the character portion in each scanning direction, and the distance pattern of the background portion is defined as the distance between the pixels of the background character portion in the scanning direction. I will call it.

第5図は水平方向と垂直方向の方向性の面特徴を定め
る方法を説明するための図である。走査方向が水平方向
の場合は以下のからの手順で求める。
FIG. 5 is a diagram for explaining a method of determining directional surface features in the horizontal direction and the vertical direction. When the scanning direction is the horizontal direction, the procedure from the following steps is used.

全ての文字画素(i,j)の水平方向の間隔hijを求め
る。
The horizontal interval h ij of all character pixels (i, j) is calculated .

水平方向の間隔hijの逆数を文字部分の面特徴パタン
上の点(i,j)の水平走査方向の特徴量と定める。
The reciprocal of the horizontal interval h ij is defined as the feature value in the horizontal scanning direction of the point (i, j) on the surface feature pattern of the character portion.

画素(k,l)が背景画素の場合は文字部分の面特徴パ
タン上の点(k,l)の各走査方向の特徴量は“0"と定め
る。
When the pixel (k, l) is a background pixel, the feature amount in each scanning direction of the point (k, l) on the surface feature pattern of the character portion is set to "0".

走査方向が垂直の場合も同様の処理となる。 The same process is performed when the scanning direction is vertical.

第5図(a)は文字部分の距離パタンの水平走査方向
パタン、第5図(b)は文字部分の面特徴パタンの水平
走査方向パタンを示し、第5図(c)は文字部分の距離
パタンの垂直走査方向パタン、第5図(d)は文字部分
の面特徴パタンの垂直走査方向パタンを示している。従
来から提案されている文字認識用の方向特徴と対比する
と、水平走査方向パタンが垂直方向特徴に対応し、垂直
走査方向パタンが水平方向特徴に対応している。
FIG. 5 (a) shows the horizontal scanning direction pattern of the distance pattern of the character portion, FIG. 5 (b) shows the horizontal characteristic pattern of the surface characteristic pattern of the character portion, and FIG. 5 (c) shows the distance of the character portion. A vertical scanning direction pattern of the pattern, and FIG. 5D shows a vertical scanning direction pattern of the surface feature pattern of the character portion. In comparison with the conventionally proposed directional features for character recognition, the horizontal scanning direction pattern corresponds to the vertical direction feature, and the vertical scanning direction pattern corresponds to the horizontal direction feature.

第6図は水平方向と垂直方向の複雑さの面特徴を定め
る方法を説明するための図である。走査方向が水平方向
の場合は以下のからの手順で求める。
FIG. 6 is a diagram for explaining a method of defining surface features of horizontal and vertical complexity. When the scanning direction is the horizontal direction, the procedure from the following steps is used.

全ての背景画素(i,j)の水平方向の間隔hijを求め
る。
The horizontal interval h ij of all background pixels (i, j) is calculated .

水平方向の間隔hijの逆数を背景部分の面特徴パタン
上の点(i,j)の水平走査方向の特徴量と定める。
The reciprocal of the horizontal interval h ij is defined as the feature value in the horizontal scanning direction of the point (i, j) on the surface feature pattern of the background portion.

画素(k,l)が文字画素の場合は背景部分の面特徴パ
タン上の点(k,l)の各走査方向の特徴量は“0"と定め
る。
When the pixel (k, l) is a character pixel, the feature amount in each scanning direction of the point (k, l) on the surface feature pattern of the background portion is defined as "0".

走査方向が垂直の場合も同様の処理となる。 The same process is performed when the scanning direction is vertical.

この処理は方向性の面特徴を求める処理と文字部分と
背景部分の扱いが丁度反転していることがわかる。第6
図(a)は背景部分の距離パタンの水平走査方向パタ
ン、第6図(b)は背景部分の面特徴パタンの水平走査
方向パタンを示し、第6図(c)は背景部分の距離パタ
ンの垂直走査方向パタン、第6図(d)は背景部分の面
特徴パタンの垂直走査方向パタンを示している。
It can be seen that in this process, the process of obtaining directional surface features and the handling of the character part and the background part are just reversed. Sixth
FIG. 6A shows the horizontal scanning direction pattern of the distance pattern of the background portion, FIG. 6B shows the horizontal scanning direction pattern of the surface feature pattern of the background portion, and FIG. 6C shows the distance pattern of the background portion. A vertical scanning direction pattern, FIG. 6D shows a vertical scanning direction pattern of the surface feature pattern of the background portion.

次に面特徴パタンから線特徴パタンを作成する手順を
説明する。
Next, a procedure for creating a line characteristic pattern from the surface characteristic pattern will be described.

第7図は水平走査方向の線特徴パタンを定める方法を
説明するための図である。第7図(a)は文字部分の面
特徴パタンの水平走査方向パタンから線特徴パタンの水
平走査方向パタンを求める図であり、面特徴パタンの各
点(i,j)の値を垂直方向に累積して総和を求めること
によってヒストグラムを求め、線特徴パタンと定めてい
る。第7図(b)は背景部分の面特徴パタンの水平走査
方向パタンから線特徴パタンの水平走査方向パタンを求
める図であり、面特徴パタンの各点(i,j)の値を垂直
方向に累積して総和を求めることによってヒストグラム
を求め、線特徴パタンと定めている。垂直走査方向の線
特徴パタンを定める手順も同様であり、面特徴パタンの
垂直走査方向パタンの各点の値を水平方向に累積して得
られるヒストグラムを垂直走査方向の線特徴パタンと定
めている。すなわち、線特徴パタンは面特徴パタンを一
次元に圧縮して求めることが基本となる。
FIG. 7 is a diagram for explaining a method of determining a line feature pattern in the horizontal scanning direction. FIG. 7 (a) is a diagram for obtaining the horizontal scanning direction pattern of the line characteristic pattern from the horizontal scanning direction pattern of the character portion in the character portion, and the value of each point (i, j) of the surface characteristic pattern in the vertical direction. The histogram is obtained by accumulating and obtaining the sum, and is defined as the line feature pattern. FIG. 7B is a diagram for obtaining the horizontal scanning direction pattern of the line characteristic pattern from the horizontal scanning direction pattern of the surface characteristic pattern of the background portion, and the value of each point (i, j) of the surface characteristic pattern in the vertical direction. The histogram is obtained by accumulating and obtaining the sum, and is defined as the line feature pattern. The procedure for determining the line feature pattern in the vertical scanning direction is similar, and the histogram obtained by accumulating the values of each point in the vertical scanning direction pattern of the surface feature pattern in the horizontal direction is determined as the line feature pattern in the vertical scanning direction. . That is, the line feature pattern is basically obtained by compressing the surface feature pattern in one dimension.

最後に線特徴パタンから点特徴パタンを作成する手順
を説明する。
Finally, a procedure for creating a point feature pattern from a line feature pattern will be described.

点特徴パタンは線特徴パタンを定めるヒストグラムの
値の総和と定める。すなわち、文字部分の水平走査方向
の点特徴パタンは文字部分の水平走査方向の線特徴パタ
ンの各値の総和であり、文字部分の垂直走査方向の点特
徴パタンは文字部分の垂直走査方向の線特徴パタンの各
値の総和である。同様に、背景部分の水平走査方向の点
特徴パタンは背景部分の水平走査方向の線特徴パタンの
各値の総和であり、背景部分の垂直走査方向の点特徴パ
タンは背景部分の垂直走査方向の線特徴パタンの各値の
総和である。このように、点特徴パタンは対応する線特
徴パタンを圧縮して求めることが基本となる。
The point feature pattern is defined as the sum of the histogram values that define the line feature pattern. That is, the point feature pattern of the character portion in the horizontal scanning direction is the sum of the values of the line feature pattern of the character portion in the horizontal scanning direction, and the point feature pattern of the character portion in the vertical scanning direction is the line in the vertical scanning direction of the character portion. It is the sum of each value of the characteristic pattern. Similarly, the point feature pattern in the horizontal scanning direction of the background portion is the sum of the respective values of the line feature patterns in the horizontal scanning direction of the background portion, and the point feature pattern in the vertical scanning direction of the background portion is the vertical scanning direction of the background portion. It is the sum of each value of the line feature pattern. As described above, the point feature pattern is basically obtained by compressing the corresponding line feature pattern.

尚、面特徴パタンから線特徴パタンを求めるときと、
線特徴パタンから点特徴パタンを求めるときに、文字パ
タンの大きさで値を正規化することも可能である。
In addition, when obtaining the line feature pattern from the surface feature pattern,
When obtaining the point feature pattern from the line feature pattern, it is possible to normalize the value with the size of the character pattern.

〔実施例〕〔Example〕

第1図は第1の発明の特徴抽出方式の一実施例の構成
を示す図である。
FIG. 1 is a diagram showing the configuration of an embodiment of the feature extraction system of the first invention.

この特徴抽出方式は、文字パタン記憶手段1と、距離
パタン作成手段2と、面特徴パタン作成手段3とから構
成されている。
This feature extraction method is composed of a character pattern storage means 1, a distance pattern creating means 2 and a surface feature pattern creating means 3.

文字パタン記憶手段1は、二値化されたディジタル図
形を格納する通常の記憶手段でよい。
The character pattern storage means 1 may be an ordinary storage means for storing a binarized digital figure.

距離パタン作成手段2は、文字パタン記憶手段1から
文字パタン信号を読み込み、作用の項で説明した文字画
素の水平走査方向及び垂直走査方向と背景画素の水平走
査方向及び垂直走査方向の間隔を求めて、その値を距離
値として各記憶場所に格納するもので従来技術で実現で
きる。
The distance pattern creating means 2 reads the character pattern signal from the character pattern storage means 1 and obtains the intervals between the horizontal scanning direction and the vertical scanning direction of the character pixel and the horizontal scanning direction and the vertical scanning direction of the background pixel described in the section of the action. The value is stored as a distance value in each storage location, which can be realized by the conventional technique.

面特徴パタン作成手段3は、距離パタン作成手段2の
各記憶場所から文字部分の水平走査方向及び垂直走査方
向の距離値信号を読み込んで、作用の項で説明したよう
に、画素(i,j)が文字画素の場合には距離値の逆数を
求めて文字部分の面特徴の画素(i,j)の対応する走査
方向の特徴量と定め、画素(i,j)が背景画素の場合に
は文字部分の面特徴の画素(i,j)の値を各走査方向に
対しても“0"と定め、画素(i,j)が背景画素の場合に
は距離値の逆数を求めて背景部分の面特徴の画素(i,
j)の対応する走査方向の特徴量と定め、画素(i,j)が
文字画素の場合には背景部分の面特徴の画素(i,j)の
値を各走査方向に対しても“0"と定めて面特徴パタン信
号を出力するもので従来技術で実現できる。
The plane characteristic pattern creating means 3 reads the distance value signals in the horizontal scanning direction and the vertical scanning direction of the character portion from each memory location of the distance pattern creating means 2 and, as described in the section of the operation, the pixel (i, j). ) Is a character pixel, the reciprocal of the distance value is obtained and defined as the feature amount in the scanning direction corresponding to the pixel (i, j) of the surface feature of the character portion. When pixel (i, j) is a background pixel, Defines the value of the pixel (i, j) of the surface feature of the character part as "0" in each scanning direction, and if the pixel (i, j) is a background pixel, the reciprocal of the distance value is calculated to determine the background. Pixels (i,
j) corresponding to the feature amount in the scanning direction. If the pixel (i, j) is a character pixel, the value of the pixel (i, j) of the surface feature of the background portion is set to “0” in each scanning direction. ", Which outputs the surface feature pattern signal and can be realized by the conventional technology.

尚、本実施例では走査方向を水平,垂直の2方向とし
たが、斜め45度の2方向を加えた4方向、あるいは他の
組み合せの複数の走査方向で特徴パタンを求めてもよ
く、本発明は上記実施例に限るものではない。
In the present embodiment, the scanning directions are horizontal and vertical. However, the characteristic pattern may be obtained in four directions by adding two directions at an angle of 45 degrees or a plurality of scanning directions in other combinations. The invention is not limited to the above embodiment.

第2図は第2の発明の特徴抽出方式の一実施例の構成
を示す図である。
FIG. 2 is a diagram showing the configuration of an embodiment of the feature extraction system of the second invention.

この特徴抽出方式は、文字パタン記憶手段1と、距離
パタン作成手段2と、面特徴パタン作成手段3と、線特
徴パタン作成手段4とから構成されている。この特徴抽
出方式は、第1図の構成に線特徴パタン作成手段4を付
加したものである。
This feature extraction method is composed of a character pattern storage means 1, a distance pattern creation means 2, a surface feature pattern creation means 3 and a line feature pattern creation means 4. In this feature extraction method, line feature pattern creating means 4 is added to the configuration of FIG.

線特徴パタン作成手段4は、作用の項で説明したよう
に、面特徴パタン作成手段3から面特徴パタン信号を読
み込み、文字部分の面特徴パタンの水平走査方向パタン
の各画素の値を垂直方向に累積してヒストグラムを求め
て文字部分の線特徴パタンの水平走査方向パタンを作成
し、文字部分の面特徴パタンの垂直走査方向パタンの各
画素の値を水平方向に累積してヒストグラムを求めて文
字部分の線特徴パタンの垂直走査方向パタンを作成し、
かつ背景部分の面特徴パタンの水平走査方向パタンの各
画素の値を垂直方向に累積してヒストグラムを求めて背
景部分の線特徴パタンの水平走査方向パタンを作成し、
背景部分の面特徴パタンの垂直走査方向パタンの各画素
の値を水平方向に累積してヒストグラムを求めて背景部
分の線特徴パタンの垂直走査方向パタンを作成して線特
徴パタン信号を出力するもので従来技術が実現できる。
The line feature pattern creating means 4 reads the surface feature pattern signal from the surface feature pattern creating means 3 as described in the section of operation, and sets the value of each pixel in the horizontal scanning direction pattern of the surface feature pattern of the character portion in the vertical direction. The horizontal scanning direction pattern of the line feature pattern of the character part is created by accumulating in the horizontal direction, and the value of each pixel in the vertical scanning direction pattern of the surface feature pattern of the character part is accumulated in the horizontal direction to obtain the histogram. Create a vertical scanning direction pattern of the line feature pattern of the character part,
And the horizontal scanning direction pattern of the line characteristic pattern of the background portion is created by obtaining the histogram by accumulating the values of the respective pixels of the horizontal characteristic pattern of the background portion in the horizontal scanning direction in the vertical direction,
The value of each pixel in the vertical scanning direction pattern of the background feature pattern in the vertical direction is accumulated in the horizontal direction to obtain a histogram, and the vertical scanning direction pattern of the background feature pattern is created to output a line feature pattern signal. Therefore, the conventional technology can be realized.

尚、本実施例では走査方向を水平、垂直の2方向とし
たが、斜め45度の2方向を加えた4方向、あるいは他の
組み合わせの複数の走査方向で特徴パタンを求めてもよ
く、本発明は上記実施例に限るものではない。
In the present embodiment, the scanning directions are horizontal and vertical, but the characteristic pattern may be obtained in four directions by adding two directions at an angle of 45 degrees or a plurality of scanning directions in other combinations. The invention is not limited to the above embodiment.

第3図(a)は第3の発明の特徴抽出方式の一実施例
の構成を示す図である。
FIG. 3 (a) is a diagram showing the configuration of an embodiment of the feature extraction method of the third invention.

この特徴抽出方式は、文字パタン記憶手段1と、距離
パタン作成手段2と、面特徴パタン作成手段3と、線特
徴パタン作成手段4と、点特徴パタン作成手段5とから
構成されている。この特徴抽出方式は、第2図の構成に
点特徴パタン作成手段5を付加したものである。
This feature extraction method is composed of a character pattern storage means 1, a distance pattern creating means 2, a surface feature pattern creating means 3, a line feature pattern creating means 4, and a point feature pattern creating means 5. In this feature extraction method, point feature pattern creating means 5 is added to the configuration of FIG.

点特徴パタン作成手段5は、作用の項で説明したよう
に、線特徴パタン作成手段4から線特徴パタン信号を読
み込み、文字部分の線特徴パタンの水平走査方向パタン
を示すヒストグラムの各値の累積値を求めて文字部分の
点特徴パタンの水平走査方向特徴量を作成し、文字部分
の線特徴パタンの垂直走査方向パタンを示すヒストグラ
ムの各値の累積値を求めて文字部分の点特徴パタンの垂
直走査方向特徴量を作成し、かつ背景部分の線特徴パタ
ンの水平走査方向パタンを示すヒストグラムの各値の累
積値を求めて背景部分の点特徴パタンの水平走査方向特
徴量を作成し、背景部分の線特徴パタンの垂直走査方向
パタンを示すヒストグラムの各値の累積値を求めて背景
部分の点特徴パタンの垂直走査方向特徴量を作成して点
特徴パタン信号を出力するもので従来技術で実現でき
る。
As described in the operation section, the point feature pattern creating means 5 reads the line feature pattern signal from the line feature pattern creating means 4 and accumulates the respective values of the histogram indicating the horizontal scanning direction pattern of the line feature pattern of the character portion. The horizontal scanning direction characteristic amount of the point feature pattern of the character portion is created by obtaining the value, and the cumulative value of each value of the histogram showing the vertical scanning direction pattern of the line feature pattern of the character portion is obtained to obtain the point feature pattern of the character portion. The vertical scanning direction feature quantity is created, and the cumulative value of each value of the histogram showing the horizontal scanning direction pattern of the line feature pattern of the background portion is obtained to create the horizontal scan direction feature quantity of the background point feature pattern, and the background value is created. The vertical scan direction feature quantity of the background point feature pattern is created by obtaining the cumulative value of each value of the histogram that indicates the vertical scan direction pattern of the line feature pattern of the part, and the point feature pattern signal is output. It can be realized in the prior art in which.

尚、本実施例では、面特徴パタン信号、線特徴パタン
信号、点特徴パタン信号のうちの一つを最終出力信号と
して説明したが、これら3種類の特徴パタン信号の任意
の組み合せで複数の特徴パタン信号を出力してもよい。
例えば、第3図(b)のように第3図(a)と同じ構成
要素で、3種類の特徴パタン信号を出力する構成でもよ
い。
In the present embodiment, one of the surface feature pattern signal, the line feature pattern signal, and the point feature pattern signal has been described as the final output signal, but a plurality of features can be obtained by arbitrarily combining these three types of feature pattern signals. A pattern signal may be output.
For example, as shown in FIG. 3B, the same constituent elements as in FIG. 3A may be used to output three types of characteristic pattern signals.

また本実施例では走査方向を水平,垂直の2方向とし
たが、斜め45度の2方向を加えた4方向、あるいは他の
組み合せの複数の走査方向で特徴パタンを求めてもよ
く、本発明は上記実施例に限るものではない。
Further, in the present embodiment, the scanning directions are horizontal and vertical, but the characteristic pattern may be obtained in four directions by adding two directions at an angle of 45 degrees or a plurality of scanning directions in other combinations. Is not limited to the above embodiment.

〔発明の効果〕〔The invention's effect〕

以上のように本発明によれば、文字パタンの方向性の
特徴量と形状の複雑さを尺度とした特徴量を同一の処理
で実現することができ、かつ階層的な分類のための特徴
量も共通の処理で実現することができ、本発明は漢字認
識の性能向上と応用拡大に大いに役立つものである。
As described above, according to the present invention, it is possible to realize the feature amount of the directionality of the character pattern and the feature amount based on the complexity of the shape by the same process, and the feature amount for hierarchical classification. Can be realized by a common process, and the present invention is very useful for improving the performance of Chinese character recognition and expanding its applications.

【図面の簡単な説明】[Brief description of the drawings]

第1図は第1の発明の特徴抽出方式の一実施例の構成を
示す図、 第2図は第2の発明の特徴抽出方式の一実施例の構成を
示す図、 第3図は第3の発明の特徴抽出方式の一実施例の構成を
示す図、 第4図は特徴抽出のための図形処理を説明するための
図、 第5図は文字部分の面特徴パタンを説明するための図、 第6図は背景字部分の面特徴パタンを説明するための
図、 第7図は線特徴パタンを説明するための図である。 1……文字パタン記憶手段 2……距離パタン作成手段 3……面特徴パタン作成手段 4……線特徴パタン作成手段 5……点特徴パタン作成手段
FIG. 1 is a diagram showing a configuration of an embodiment of a feature extraction system of the first invention, FIG. 2 is a diagram showing a configuration of an embodiment of a feature extraction system of the second invention, and FIG. Showing a configuration of an embodiment of the feature extraction system of the invention of FIG. 4, FIG. 4 is a diagram for explaining graphic processing for feature extraction, and FIG. 5 is a diagram for explaining a surface feature pattern of a character portion. FIG. 6 is a diagram for explaining the surface characteristic pattern of the background character portion, and FIG. 7 is a diagram for explaining the line characteristic pattern. 1 ... Character pattern storage means 2 ... Distance pattern creating means 3 ... Surface feature pattern creating means 4 ... Line feature pattern creating means 5 ... Point feature pattern creating means

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】二次元格子上の二値化されたディジタル図
形として表された文字パタンを格納する文字パタン記憶
手段と、 前記文字パタン記憶手段から記憶内容である文字パタン
を読み込み、文字パタン上を複数方向に走査することに
文字部分の各画素に対応する記憶場所には各走査方向ご
とに連続する文字部分の距離情報を格納し、文字パタン
の背景部分の各画素に対応する記憶場所には各走査方向
ごとに連続する背景部分の距離情報を出力する距離パタ
ン作成手段と、 前記距離パタン作成手段から文字部分の各画素に対応す
る記憶場所から各走査方向ごとに求められた距離情報を
読み込み、その逆数を計算して文字部分の各走査方向ご
との特徴量を定め、文字パタンの背景部分の各画素に対
応する記憶場所から各走査方向ごとに求められた距離情
報を読み込み、その逆数を計算して背景部分の各走査方
向ごとの特徴量を定めることによって特徴パタンを作成
し、出力する面特徴パタン作成手段とから成る特徴抽出
方式。
1. A character pattern storage means for storing a character pattern represented as a binarized digital figure on a two-dimensional grid, and a character pattern which is the stored content is read from the character pattern storage means to display on the character pattern. By scanning in multiple directions, the memory location corresponding to each pixel of the character portion stores the distance information of consecutive character portions in each scanning direction, and the memory location corresponding to each pixel of the background portion of the character pattern is stored. Is a distance pattern creating means for outputting distance information of a continuous background portion for each scanning direction, and distance information obtained for each scanning direction from the memory location corresponding to each pixel of the character portion from the distance pattern creating means. It is read and the reciprocal is calculated to determine the feature amount for each scanning direction of the character part, and it is obtained for each scanning direction from the memory location corresponding to each pixel of the background part of the character pattern. Reads the distance information, feature extraction method comprising a surface feature pattern creation means for creating a characteristic pattern by determining a feature value for each scanning direction of the background portion by calculating the inverse outputs.
【請求項2】二次元格子上の二値化されたディジタル図
形として表された文字パタンを格納する文字パタン記憶
手段と、 前記文字パタン記憶手段から記憶内容である文字パタン
を読み込み、文字パタン上を複数方向に走査することに
文字部分の各画素に対応する記憶場所には各走査方向ご
とに連続する文字部分の距離情報を格納し、文字パタン
の背景部分の各画素に対応する記憶場所には各走査方向
ごとに連続する背景部分の距離情報を出力する距離パタ
ン作成手段と、 前記距離パタン作成手段から文字部分の各画素に対応す
る記憶場所から各走査方向ごとに求められた距離情報を
読み込み、その逆数を計算して文字部分の各走査方向ご
との特徴量を定め、文字パタンの背景部分の各画素に対
応する記憶場所から各走査方向ごとに求められた距離情
報を読み込み、その逆数を計算して背景部分の各走査方
向ごとの特徴量を定めることによって特徴パタンを作成
し、出力する面特徴パタン作成手段と、 前記面特徴パタン作成手段から文字部分の各画素の走査
方向ごとの特徴量を読み込み、各走査方向に対して垂直
方向に特徴量を累積することによって文字部分の各走査
方向に対するヒストグラムを作成し、文字パタンの背景
部分の各画素の走査方向ごとの特徴量を読み込み、各走
査方向に対して垂直方向に特徴量を累積することによっ
て文字パタンの背景部分の各走査方向に対するヒストグ
ラムを作成し、各ヒストグラムを圧縮された特徴パタン
として出力する線特徴パタン作成手段とから成る特徴抽
出方式。
2. A character pattern storage means for storing a character pattern represented as a binarized digital figure on a two-dimensional grid, and a character pattern which is the stored content is read from the character pattern storage means, and the character pattern is stored on the character pattern. By scanning in multiple directions, the memory location corresponding to each pixel of the character portion stores the distance information of consecutive character portions in each scanning direction, and the memory location corresponding to each pixel of the background portion of the character pattern is stored. Is a distance pattern creating means for outputting distance information of a continuous background portion for each scanning direction, and distance information obtained for each scanning direction from the memory location corresponding to each pixel of the character portion from the distance pattern creating means. It is read and the reciprocal is calculated to determine the feature amount for each scanning direction of the character part, and it is obtained for each scanning direction from the memory location corresponding to each pixel of the background part of the character pattern. The distance information is read, a reciprocal is calculated, and a feature pattern is created by defining the feature amount for each scanning direction of the background portion, and a surface feature pattern creating means for outputting the surface feature pattern creating means, and the surface feature pattern creating means A histogram for each scanning direction of the character part is created by reading the feature amount for each pixel in each scanning direction and accumulating the feature amount in the direction perpendicular to each scanning direction, and scanning each pixel of the background part of the character pattern. A histogram for each scanning direction of the background part of the character pattern is created by reading the characteristic amount for each direction and accumulating the characteristic amount in the vertical direction to each scanning direction, and outputting each histogram as a compressed characteristic pattern. A feature extraction method comprising a line feature pattern creating means.
【請求項3】二次元格子上の二値化されたディジタル図
形として表された文字パタンを格納する文字パタン記憶
手段と、 前記文字パタン記憶手段から記憶内容である文字パタン
を読み込み、文字パタン上を複数方向に走査することに
文字部分の各画素に対応する記憶場所には各走査方向ご
とに連続する文字部分の距離情報を格納し、文字パタン
の背景部分の各画素に対応する記憶場所には各走査方向
ごとに連続する背景部分の距離情報を出力する距離パタ
ン作成手段と、 前記距離パタン作成手段から文字部分の各画素に対応す
る記憶場所から各走査方向ごとに求められた距離情報を
読み込み、その逆数を計算して文字部分の各走査方向ご
との特徴量を定め、文字パタンの背景部分の各画素に対
応する記憶場所から各走査方向ごとに求められた距離情
報を読み込み、その逆数を計算して背景部分の各走査方
向ごとの特徴量を定めることによって特徴パタンを作成
し、出力する面特徴パタン作成手段と、 前記面特徴パタン作成手段から文字部分の各画素の走査
方向ごとの特徴量を読み込み、各走査方向に対して垂直
方向に特徴量を累積することによって文字部分の各走査
方向に対するヒストグラムを作成し、文字パタンの背景
部分の各画素の走査方向ごとの特徴量を読み込み、各走
査方向に対して垂直方向に特徴量を累積することによっ
て文字パタンの背景部分の各走査方向に対するヒストグ
ラムを作成し、各ヒストグラムを圧縮された特徴パタン
として出力する線特徴パタン作成手段と、 前記線特徴パタン作成手段から文字部分の各走査方向に
対するヒストグラムを読み込み、各ヒストグラムの内容
の総和をそれぞれ求めて各走査方向に対する文字部分の
特徴量とし、文字パタンの背景部分の各走査方向に対す
るヒストグラムを読み込み、各ヒストグラムの内容の総
和をそれぞれ求めて各走査方向に対する背景部分の特徴
量とすることによって、多次元特徴ベクトルとして出力
する点特徴パタン作成手段とから成る特徴抽出方式。
3. A character pattern storage means for storing a character pattern represented as a binarized digital figure on a two-dimensional grid, and a character pattern which is the stored content is read from the character pattern storage means, and the character pattern is stored on the character pattern. By scanning in multiple directions, the memory location corresponding to each pixel of the character portion stores the distance information of consecutive character portions in each scanning direction, and the memory location corresponding to each pixel of the background portion of the character pattern is stored. Is a distance pattern creating means for outputting distance information of a continuous background portion for each scanning direction, and distance information obtained for each scanning direction from the memory location corresponding to each pixel of the character portion from the distance pattern creating means. It is read and the reciprocal is calculated to determine the feature amount for each scanning direction of the character part, and it is obtained for each scanning direction from the memory location corresponding to each pixel of the background part of the character pattern. The distance information is read, a reciprocal is calculated, and a feature pattern is created by defining the feature amount for each scanning direction of the background portion, and a surface feature pattern creating means for outputting the surface feature pattern creating means, and the surface feature pattern creating means A histogram for each scanning direction of the character part is created by reading the feature amount for each pixel in each scanning direction and accumulating the feature amount in the direction perpendicular to each scanning direction, and scanning each pixel of the background part of the character pattern. A histogram for each scanning direction of the background part of the character pattern is created by reading the characteristic amount for each direction and accumulating the characteristic amount in the vertical direction to each scanning direction, and outputting each histogram as a compressed characteristic pattern. Line feature pattern creating means, and a histogram for each scanning direction of the character portion is read from the line feature pattern creating means, and each histogram is read. Toggle the histogram of each character in the background part of the character pattern for each scanning direction and obtain the sum of the contents of each histogram to obtain the background part for each scanning direction. A feature extraction method comprising point feature pattern creating means for outputting a multidimensional feature vector by using the feature amount of.
JP2202196A 1990-07-30 1990-07-30 Feature extraction method Expired - Fee Related JP2674286B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2202196A JP2674286B2 (en) 1990-07-30 1990-07-30 Feature extraction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2202196A JP2674286B2 (en) 1990-07-30 1990-07-30 Feature extraction method

Publications (2)

Publication Number Publication Date
JPH0485686A JPH0485686A (en) 1992-03-18
JP2674286B2 true JP2674286B2 (en) 1997-11-12

Family

ID=16453561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2202196A Expired - Fee Related JP2674286B2 (en) 1990-07-30 1990-07-30 Feature extraction method

Country Status (1)

Country Link
JP (1) JP2674286B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3731758B2 (en) * 1995-01-31 2006-01-05 矢崎総業株式会社 Double locking connector

Also Published As

Publication number Publication date
JPH0485686A (en) 1992-03-18

Similar Documents

Publication Publication Date Title
CN111814722B (en) Method and device for identifying table in image, electronic equipment and storage medium
US7986831B2 (en) Image processing apparatus, image processing method and computer program
Yu et al. A generic system for form dropout
EP1831823B1 (en) Segmenting digital image and producing compact representation
US5774580A (en) Document image processing method and system having function of determining body text region reading order
US8155445B2 (en) Image processing apparatus, method, and processing program for image inversion with tree structure
JP2940936B2 (en) Tablespace identification method
Sabourin et al. Off-line identification with handwritten signature images: survey and perspectives
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
Zheng et al. Form frame line detection with directional single-connected chain
JPH01253077A (en) Detection of string
US6532302B2 (en) Multiple size reductions for image segmentation
Amin et al. Hand printed Arabic character recognition system
JP2674286B2 (en) Feature extraction method
JPH03126181A (en) Area dividing method for document image
KR930008669A (en) Candidate Character Classification Method
JPH0896072A (en) Detection method of inclination of page
Agui et al. Method of extracting car number plates by image processing
JP2812619B2 (en) Image processing device
JP2906591B2 (en) Character classification method
JP2613211B2 (en) Image input device
JP2708604B2 (en) Character recognition method
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image
JPH03268181A (en) Document reader
JPH06131496A (en) Pattern normalization processing method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070718

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080718

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090718

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees