JPS6355105B2 - - Google Patents

Info

Publication number
JPS6355105B2
JPS6355105B2 JP55120189A JP12018980A JPS6355105B2 JP S6355105 B2 JPS6355105 B2 JP S6355105B2 JP 55120189 A JP55120189 A JP 55120189A JP 12018980 A JP12018980 A JP 12018980A JP S6355105 B2 JPS6355105 B2 JP S6355105B2
Authority
JP
Japan
Prior art keywords
pattern
sample
dictionary
standard
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55120189A
Other languages
Japanese (ja)
Other versions
JPS5745680A (en
Inventor
Eiichiro Yamamoto
Kyonori Myata
Hideaki Sugawara
Yoshihisa Fujii
Koya Fujita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP55120189A priority Critical patent/JPS5745680A/en
Publication of JPS5745680A publication Critical patent/JPS5745680A/en
Publication of JPS6355105B2 publication Critical patent/JPS6355105B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation

Description

【発明の詳細な説明】 本発明は、辞書の標準パターンをサンプル文字
により漸次修正する標準パターン修正機能を有し
た文字認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a character recognition device having a standard pattern correction function that gradually corrects a standard pattern in a dictionary using sample characters.

手書文字の変形は種々様々であるため、印刷文
字のようにその変形を少数のサンプルから推定す
ることは難しい。したがつて、手書文字の認識装
置の読取性能を向上させるためには、多数のサン
プル文字を使用し、それらの文字から識別に供す
る辞書の標準パターンを作成する必要がある。し
かしながら、あらかじめ多数のサンプル文字を集
めることは困難である。そこで初めは少数のサン
プル文字により辞書パターンを作成し、漸次、サ
ンプル文字を増加してその都度該サンプル文字に
よる辞書パターン修正を行なう式が合理的であ
る。この場合サンプル数が増加すれば一層良好な
標準パターンになるかと言えばそうではなく、あ
らゆる変形文字を取入れてその平均値などから割
出した標準パターンはむしろ認識対象文字から離
れたものになつてしまう。
Since handwritten characters are deformed in a variety of ways, it is difficult to estimate the deformations from a small number of samples, as is the case with printed characters. Therefore, in order to improve the reading performance of a handwritten character recognition device, it is necessary to use a large number of sample characters and create standard patterns for a dictionary to be used for identification from these characters. However, it is difficult to collect a large number of sample characters in advance. Therefore, it is reasonable to first create a dictionary pattern using a small number of sample characters, and then gradually increase the number of sample characters and modify the dictionary pattern using the sample characters each time. In this case, it is not true that increasing the number of samples will result in a better standard pattern; rather, a standard pattern that incorporates all kinds of modified characters and calculates them from their average value will become far removed from the target character. Put it away.

本発明はかゝる問題に対処しようとするもので
あり、特徴とする所は、カテゴリCに属するサン
プルパターンX〓1〜X〓Nから導出されそしてパター
ン認識に対する標準パターンとなる平均値μ〓C N、お
よび標準偏差σ〓C N、ならびにサンプル数Nを記憶す
る辞書を備え、また新たに入力されたサンプルパ
ターンX〓N+1を含めた標準偏差σ〓C N+1が閾値dに対
し ‖σ〓C N+1‖d であるときは該サンプルパターンX〓N+1をカテゴ
リCに含めてその平均値をμ〓C N+1に修正し、また ‖σ〓N+1‖>d であるときは該カテゴリCの平均値はμ〓C N+1とした
ままで該サンプルパターンX〓N+1でサブカテゴリ
C′を起す辞書修正回路を有することにあるが、以
下図面を参照しながらこれを詳細に説明する。
The present invention attempts to deal with such a problem, and is characterized by an average value μ C N , standard deviation σ〓 C N , and the number of samples N are stored in the dictionary, and the standard deviation σ〓 C N+1 including the newly input sample pattern X〓 N+ 1 becomes the threshold d. On the other hand , when ‖σ〓 C N +1 ‖d , the sample pattern > d, the average value of the category C is μ〓 C N+1 , and the sample pattern X〓 N+1 is the subcategory.
The main purpose of the present invention is to have a dictionary correction circuit for generating C', which will be explained in detail below with reference to the drawings.

サンプル値の系列をxjとし、j=1、……、N
のN個のサンプルの平均値をμN、標準偏差をσN
すれば、 μN=1/NNj=1 xj 従つてNj=1 xj=NμN ……(1) σ2 N=1/NNj=1 (xj−μN2 従つてNj=1 x2 j=N(σ2 N+μ2 N) ……(2) で表わされる。今μN、σN、Nが既知とし、新たに
(N+1)番目のサンプル値xN+1が得られたとす
ると、平均値μNおよび分散σ2 N+1は μN+1=1/N+1Nj=1 xj=1/N+1(Nj=1 xj+xN+1)=1/N+1(NμN+xN+1) ……(3) σ2 N+1=1/N+1Nj=1 (xj−μN+12=1/N+1Nj=1 x2 j−μ2 N+1=1/N+1(Nj=1 x2 j+x2 N+1)−μ2 N+1 =1/N+1{N(σ2 N+μ2 N)x2 N+1}−μ2 N+1
…(4) となり、μN+1、σN+1は、μN、σN、NおよびxN+1
ら求めることができる。即ち、N個のサンプルに
ついてのμN、σNが既知とき、サンプルが1つ追加
された(N+1)個のサンプルについてのμN+1
σN+1は(3)、(4)式から求めることができる。本発明
はこの関係を利用してN個のサンプルによる標準
パターンで認識を開始し、各認識処理毎に提供さ
れるサンプルで該標準パターンを修正して次第に
より適切な標準パターンに変更してゆこうとする
ものである。
Let xj be the series of sample values, j=1, ..., N
If the average value of N samples is μ N and the standard deviation is σ N , then μ N = 1/N Nj=1 xj Therefore, Nj=1 xj=Nμ N ……(1) σ 2 N = 1/N Nj=1 (xj-μ N ) 2 Therefore, Nj=1 x 2 j = N (σ 2 N + μ 2 N ) ...(2). Assuming that μ N , σ N , and N are known and a new (N+1)th sample value x N+1 is obtained, the mean value μ N and variance σ 2 N+1 are μ N+1 = 1/ N+1 Nj=1 xj=1/N+1 ( Nj=1 xj+x N+1 )=1/N+1 (Nμ N +x N+1 ) ...(3) σ 2 N+1 = 1/N+1 Nj=1 (xj−μ N+1 ) 2 =1/N+1 Nj=1 x 2 j −μ 2 N+1 =1/N+1 ( Nj=1 x 2 j +x 2 N+1 )− μ 2 N+1 = 1/N+1 {N(σ 2 N + μ 2 N ) x 2 N+1 }−μ 2 N+1
...(4), and μ N+1 and σ N+1 can be found from μ N , σ N , N, and x N+1 . That is, when μ N and σ N for N samples are known, μ N+1 for (N+1) samples with one sample added,
σ N+1 can be obtained from equations (3) and (4). The present invention utilizes this relationship to start recognition with a standard pattern made up of N samples, modify the standard pattern with samples provided for each recognition process, and gradually change it to a more appropriate standard pattern. This is what we are trying to do.

あるカテゴリCに属する文字サンプルiより抽
出される特徴をX〓C iとするとき、X〓C iの平均値、μ〓
C N
をカテゴリCの標準パターンとする。すなわち、
カテゴリCに属する文字サンプルがN個与えられ
たときμ〓C Nは μ〓C N=1/NNi=1 X〓C i ……(5) である。こゝでカテゴリCとは「漢」「字」など
の字種を示しており、サンプル文字とはそれを各
種態様で手書きしたものをいう、そして特徴X〓C i
とは手書文字パターンをX方向またはY方向に投
影して得られた線密度(例えば文字「漢」のビデ
オ信号の各水平走査線に含まれる黒ドツトの個数
を垂直走査順に配列した数値群でこれはn次元ベ
クトルである)をいう。ところで同一カテゴリC
に属するすべてのサンプル文字の特徴パターン
(以下サンプルパターンという)からμ〓C Nを作成す
ると、サンプルパターンは手書文字の変形をすべ
て含むため、逆に精度のよい標準パターンμ〓C Nを構
成することができない。そこで本発明では特徴
X〓C iの標準偏差σ〓C Nを用いて ‖σ〓C N‖d ……(6) となるようにカテゴリCを制限し、この範囲に収
まらないものはサブカテゴリに分離し(つまりカ
テゴリCを複数個のサブカテゴリに分割する)、
精度のよい標準パターンを構成する。なお上式で
‖・‖はベクトルからスカラへの変換を示し、ま
たdは閾値である。今すでにN個のサンプルパタ
ーンX〓1、X〓2、……X〓Nから作成されたカテゴリC
の標準パターンμ〓C Nが存在するとし、その標準偏差
をσ〓C Nとすると、新たなサンプルパターンX〓N+1
与えられたとき、先ず(3)、(4)式からμ〓C N+1、σ〓C N
+1

求め、 ‖σ〓C N+1‖d ……(7) であるか否かを判定する。そして上式が満たされ
ればX〓N+1をカテゴリCに含めその標準パターン
(平均値)をμ〓C Nからμ〓C N+1に修正する。これに対
し、 ‖σ〓C N+1‖>d ……(8) であればX〓N+1をカテゴリCに含めず、新たにサ
ブカテゴリC′の標準パターンとして登録する。
When the feature extracted from a character sample i belonging to a certain category C is X〓 C i , the average value of X〓 C i , μ〓
C N
is the standard pattern of category C. That is,
When N character samples belonging to category C are given, μ〓 C N is μ〓 C N =1/N Ni=1 X〓 C i ...(5). Here, category C indicates types of characters such as "kanji" and "characters," and sample characters are those handwritten in various ways, and the characteristics X〓 C i
is the line density obtained by projecting a handwritten character pattern in the X or Y direction (for example, a group of numerical values in which the number of black dots included in each horizontal scanning line of the video signal of the character "Kan" is arranged in vertical scanning order) This is an n-dimensional vector). By the way, same category C
When μ〓 C N is created from the characteristic patterns of all sample characters belonging to (hereinafter referred to as sample patterns), since the sample pattern includes all the transformations of handwritten characters, conversely it forms a standard pattern μ〓 C N with high accuracy. Can not do it. Therefore, the present invention features
Using the standard deviation σ of X〓 C i〓 C N , limit the category C so that ‖σ〓 C N ‖d ...(6), and those that do not fall within this range are separated into subcategories (that is, categories C into multiple subcategories),
Construct a highly accurate standard pattern. Note that in the above equation, ‖·‖ indicates conversion from a vector to a scalar, and d is a threshold value. Category C has already been created from N sample patterns X〓 1 , X〓 2 , ...X〓 N
Assuming that there exists a standard pattern μ〓 C N , and its standard deviation is σ〓 C N , when a new sample pattern X〓 N+1 is given, first from equations (3) and (4), μ〓 C N+1 , σ〓 C N
Find +1 and determine whether ‖σ〓 C N+1 ‖d ...(7). If the above formula is satisfied, X〓 N+1 is included in category C and its standard pattern (average value) is corrected from μ〓 C N to μ〓 C N+1 . On the other hand, if ‖σ〓 C N+1 ‖>d (8), then X〓 N+1 is not included in category C and is newly registered as a standard pattern of subcategory C'.

第1図はこれを概念的に説明するもので、多次
元の特徴空間AでカテゴリCが表現される場合
に、(7)式を満たすサンプルパターンxN+1はカテゴ
リCに含め、その標準パターンμ〓C Nをμ〓C N+1に修正

る。しかし、(8)式の関係にある他のサンプルパタ
ーンxN+2、xN+3等はカテゴリCに含めてその標準
パターンを修正するのは有害であるので、例えば
XN+3はサブカテゴリC′に含ませる。同じカテゴ
リには属するがサンプルパターンX〓N+3のように
特徴がずれているというものは、例えば正規の文
字に対する略字などがこれに該当する。ひこの標
準パターン修正操作を本装置の稼動中、新たなサ
ンプルパターンが出現する都度行なので、最初は
少しのサンプル、次第に多くのサンプルの特徴を
収集した適格なものとなり、精度良い文字認識が
可能となる。しかも、収集した全ての特徴で単一
の標準パターンを作成するものではないので、雑
多な特徴の単純な集合(平均値)で認識精度を低
下させることはない。
Figure 1 conceptually explains this. When category C is expressed in multidimensional feature space A, sample pattern x N+1 that satisfies equation (7) is included in category C, and its standard Modify the pattern μ〓 C N to μ〓 C N+1 . However, it is harmful to include other sample patterns x N+2 , x N+3 , etc. that have the relationship in equation (8) in category C and modify the standard pattern, so for example
X N+3 is included in subcategory C′. Sample patterns that belong to the same category but have different characteristics, such as sample pattern Since Hiko's standard pattern correction operation is performed every time a new sample pattern appears while the device is in operation, it starts with a few samples and gradually becomes a qualified one that collects the characteristics of many samples, enabling highly accurate character recognition. becomes. Moreover, since a single standard pattern is not created from all the collected features, recognition accuracy will not be reduced by a simple collection (average value) of miscellaneous features.

第2図は本発明の一実施例を示すブロツク図で
ある。同図において1は制御部で、これは本パタ
ーン認識装置全体の制御を行なう。観測部2は、
入力された帳票上の文字Mを映像信号Vにして特
徴抽出部3へ送る。特徴抽出部3では、観測部2
より得られた映像信号Vから特徴パターンX〓を抽
出する。識別部4は、特徴パターンX〓と辞書5か
らの標準パターンμ〓C(Cはカテゴリ)との距離を
算出し、最短距離のカテゴリCに識別し、その結
果Rを出力する。辞書作成部6、辞書登録部7
は、辞書登録時に動作する。辞書作成部6は、入
力の特徴パターンX〓及び辞書5を参照することに
より、(3)(4)式で辞書(標準)パターンを計算す
る。辞書登録部7は計算された辞書パターンμN+1
の標準偏差σ〓C N+1とあらかじめ与えられた閾値dと
を(7)(8)式の様に比較することより、今までの辞書
パターンを修正し、あるいは新しい辞書パターン
を追加登録する。
FIG. 2 is a block diagram showing one embodiment of the present invention. In the figure, reference numeral 1 denotes a control section, which controls the entire pattern recognition apparatus. The observation section 2 is
The input character M on the form is converted into a video signal V and sent to the feature extraction section 3. In the feature extraction unit 3, the observation unit 2
The feature pattern X is extracted from the video signal V obtained by The identification unit 4 calculates the distance between the feature pattern Dictionary creation section 6, dictionary registration section 7
operates during dictionary registration. The dictionary creation unit 6 calculates a dictionary (standard) pattern using equations (3) and (4) by referring to the input feature pattern X and the dictionary 5. The dictionary registration unit 7 stores the calculated dictionary pattern μ N+1
By comparing the standard deviation σ〓 C N+1 with the pre-given threshold d as shown in equations (7) and (8), the existing dictionary patterns can be corrected or new dictionary patterns can be added and registered. .

第3図は辞書5の構成例を示す。ひとつのサブ
カテゴリの辞書は、平均値、標準偏差、サンプル
数、カテゴリ名の4項目からなる。サンプル数
N1、N2は各サブカテゴリC1、C2、……の辞書を
作るのに使用したサンプルの数であり、平均値お
よび標準偏差は、そのN個のサンプルの特徴パタ
ーンの平均値および標準偏差である。このサブカ
テゴリの説明に従えば、第2図のC,C′は例えば
C1、C2に相当し、そし全体が同一のカテゴリC
に属する。
FIG. 3 shows an example of the structure of the dictionary 5. The dictionary for one subcategory consists of four items: mean value, standard deviation, number of samples, and category name. The number of samples
N 1 , N 2 is the number of samples used to create the dictionary for each subcategory C 1 , C 2 , ..., and the average value and standard deviation are the average value and standard deviation of the characteristic pattern of the N samples. It is a deviation. According to the explanation of this subcategory, C and C' in Figure 2 are, for example,
Corresponds to C 1 and C 2 , and the whole category C is the same
belongs to

以上述べたように本発明によれば、種々に変形
される手書文字を、各種のサンプルパターンの学
習を経るにつれて順次高精度に認識できる利点が
ある。
As described above, according to the present invention, there is an advantage that handwritten characters that are variously transformed can be sequentially recognized with high precision as various sample patterns are learned.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明に係る辞書パターンの説明図、
第2図は本発明の一実施例を示すブロツク図、第
3図はサブカテゴリに分類された辞書の説明図で
ある。 図中、5は辞書、6は辞書作成部、7は辞書登
録部である。
FIG. 1 is an explanatory diagram of a dictionary pattern according to the present invention,
FIG. 2 is a block diagram showing one embodiment of the present invention, and FIG. 3 is an explanatory diagram of a dictionary classified into subcategories. In the figure, 5 is a dictionary, 6 is a dictionary creation section, and 7 is a dictionary registration section.

Claims (1)

【特許請求の範囲】 1 カテゴリCに属するサンプルパターンX〓1
X〓Nから導出されそしてパターン認識に対する標
準パターンとなる平均値μ〓C N、および標準偏差σ〓C N

ならびにサンプル数Nを記憶する辞書を備え、ま
た新たに入力されたサンプルパターンX〓N+1を含
めた標準偏差σ〓C N+1が閾値dに対し ‖σ〓C N+1‖d であるときは該サンプルパターンX〓N+1をカテゴ
リCに含めてその平均値をμ〓C N+1に修正し、また ‖σ〓N+1‖>d であるときは該カテゴリCの平均値はμ〓C N+1とした
ままで該サンプルパターンX〓N+1でサブカテゴリ
C′を起す辞書修正回路を有することを特徴とする
パターン認識装置。
[Claims] 1 Sample pattern X belonging to category C 1 ~
The mean value μ〓 C N , which is derived from X〓 N and becomes the standard pattern for pattern recognition, and the standard deviation σ〓 C N
,
In addition, the standard deviation σ〓 C N+1 including the newly input sample pattern X〓 N+ 1 is ‖σ〓 C N+1 ‖d with respect to the threshold d. If so , include the sample pattern The value remains μ〓 C N+1, and the subcategory is set to the sample pattern X〓 N+1.
A pattern recognition device characterized by having a dictionary correction circuit that generates C′.
JP55120189A 1980-08-30 1980-08-30 Pattern recognition device Granted JPS5745680A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55120189A JPS5745680A (en) 1980-08-30 1980-08-30 Pattern recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55120189A JPS5745680A (en) 1980-08-30 1980-08-30 Pattern recognition device

Publications (2)

Publication Number Publication Date
JPS5745680A JPS5745680A (en) 1982-03-15
JPS6355105B2 true JPS6355105B2 (en) 1988-11-01

Family

ID=14780107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55120189A Granted JPS5745680A (en) 1980-08-30 1980-08-30 Pattern recognition device

Country Status (1)

Country Link
JP (1) JPS5745680A (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63177285A (en) * 1987-01-17 1988-07-21 Nippon Telegr & Teleph Corp <Ntt> Character recognition processor
JP3131287B2 (en) * 1992-05-27 2001-01-31 株式会社日立製作所 Pattern recognition device
JP2002358095A (en) 2001-03-30 2002-12-13 Sony Corp Method and device for speech processing, program, recording medium

Also Published As

Publication number Publication date
JPS5745680A (en) 1982-03-15

Similar Documents

Publication Publication Date Title
US6021220A (en) System and method for pattern recognition
CN101482920B (en) Hand-written character recognition method and system
KR100708800B1 (en) Method and system for searching for object appearing in image and computer-readable medium
WO2015146113A1 (en) Identification dictionary learning system, identification dictionary learning method, and recording medium
WO2001054054A1 (en) Word recognition using silhouette bar codes
US5689584A (en) Method of and apparatus for pattern recognition and method of creating pattern recognition dictionary
JPS6355105B2 (en)
JPH01321591A (en) Character recognizing device
JP3706646B2 (en) OCR control method and classification method and apparatus
JP3083609B2 (en) Information processing apparatus and character recognition apparatus using the same
JP2622004B2 (en) Character recognition device
JP2991750B2 (en) Dictionary creation method
JP2728117B2 (en) Character recognition device
JP2576080B2 (en) Character extraction method
JP2766205B2 (en) Character recognition device
JP3986008B2 (en) Statistical analysis apparatus and statistical analysis program
JP4614582B2 (en) Partial template generator
JP3948943B2 (en) Graphic recognition method and apparatus
Hwang et al. Hierarchical Discriminant Regression for Incremental and Real-Time Image Classification
JPH0385686A (en) Pattern normalizing device
JPH08241378A (en) Recognizing method for low-quality character
CN114863445A (en) Extremely fast and accurate identification method for non-context handwritten form similar Chinese characters
CN114529567A (en) Harris and decision tree based corner detection method and system
Garris et al. Design of a handprint recognition system
CN115661825A (en) Character recognition method and system