JP3730073B2 - Template creation method, apparatus, and recording medium recording template creation program - Google Patents

Template creation method, apparatus, and recording medium recording template creation program Download PDF

Info

Publication number
JP3730073B2
JP3730073B2 JP2000042877A JP2000042877A JP3730073B2 JP 3730073 B2 JP3730073 B2 JP 3730073B2 JP 2000042877 A JP2000042877 A JP 2000042877A JP 2000042877 A JP2000042877 A JP 2000042877A JP 3730073 B2 JP3730073 B2 JP 3730073B2
Authority
JP
Japan
Prior art keywords
template
pattern
learning
training
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000042877A
Other languages
Japanese (ja)
Other versions
JP2001236467A (en
Inventor
美奈子 澤木
洋 村瀬
紀博 萩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000042877A priority Critical patent/JP3730073B2/en
Publication of JP2001236467A publication Critical patent/JP2001236467A/en
Application granted granted Critical
Publication of JP3730073B2 publication Critical patent/JP3730073B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、入力パターンと、学習用パターン中の訓練パターンを用いて予め作成されたテンプレートとの間の類似度あるいは距離値を計算し、前記入力パターンのカテゴリを認識するパターン認識方法に関する。
【0002】
【従来の技術】
以下では、パターン認識の一例として、文字認識を対象として説明する。
【0003】
従来、漢字OCR(Optical Character Reader)などの文字認識装置では、入力された文書、画像のパターンに対して、入力パターンとテンプレートとのパターン照合により認識を行う方法が知られている。このような手法は、一般的に、広告や新聞の見出しなどにみられる特異なテクスチャで構成されているデザイン処理された文字や、かすれ、つぶれ、文字背景雑音などが激しい画像に対して、比較的ロバストであることが報告されている。
【0004】
しかし、照明条件などの画像の観測条件などにより字形が変動した場合や、印刷条件や経年変化などにより字形が変動した場合には、入力パターンとテンプレートの類似度が下がり、認識率が低下する問題点があった。
【0005】
このような問題を解決するために、従来は主に、(1)入力パターン内の他の情報を雑音とみなして取り除いたり、字形の変動を補正してから、テンプレートを用いて認識を行う方法、(2)文字列をそのままテンプレートのパターンとする単語テンプレートを用いることにより個別文字の変形の影響を吸収する方法、の2つのアプローチがとられてきた。
【0006】
しかし、入力パターン内の他の情報のみを除去することは困難である。これは、文字のストロークと他の情報が非常に類似していることが頻繁に起こるためである。そのため、しばしば他の情報が残ったり、着目している情報が損失したりする。その結果、テンプレートとの照合の際の類似度が下がり、認識率が低下する。特に、‘l’や‘r’のような小さいパターンでは、周囲の他の情報の影響を受けやすく認識が困難となる場合が多い。
【0007】
一方、単語テンプレートを用いる方法では、複数文字同士の照合を行うため、小さい文字など字形が変動し誤認識しやすい文字が部分的に含まれている場合でも、単語全体としては認識可能となることが期待できる。しかし、単語数に応じたテンプレートを作成することが必要となり、単語数が増えるほどその組み合わせが膨大になる。また、それに伴い、照合時間も増加する。さらに、入力パターンに未知語が含まれている場合、対応するテンプレートがないため、認識できない。
【0008】
また、従来の方法の別の問題点として、使用をすすめるにつれて文字の変動や字形の変動が発生する場合に追随できないという点があった。従来提案されている上記のいずれの方法でも、入力パターンごとの変動の違いに追随できず、特定の変動以外のパターンは認識できない。
【0009】
【発明が解決しようとする課題】
上記のように、従来のOCRをはじめとするパターン認識技術は、劣化や変形が大きく、また状況によって変化するパターンを正しく認識できる手段が十分に確立していなかった。
【0010】
本発明の目的は、人手による作業なしに、高い認識率が得られるテンプレートを作成するテンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体を提供することにある。
【0011】
【課題を解決するための手段】
本発明のテンプレート作成方法は、入力パターンと照合されるテンプレートを、学習用パターン中の訓練パターンを用いて作成する、テンプレート作成装置で行われるテンプレート作成方法であって、
訓練パターン抽出手段が、学習用パターンを記憶している学習用パターン記憶手段から学習用パターンを読出し、各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段からテンプレートを読出し、前記読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出段階と、
テンプレート選別手段が、前記学習用パターン記憶手段から前記抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンをテンプレートとして選別し、該テンプレートを前記テンプレート記憶手段に新規に登録するテンプレート選別段階と、
を有する。
【0012】
入力パターンの状況に応じたテンプレートが自動的に、かつ簡易に作成されるため、従来、認識が困難であった状況の変化にも自動的に追随できる。
【0014】
本発明の他の実施態様によれば、抽出された訓練パターンのセットから1つまたは複数の類似パターンを求め、該類似パターンのカテゴリ分布から訓練パターンのテンプレートとしての登録の可否を決定する。たとえば、ある訓練パターン(カテゴリ‘e’)に対し、類似した訓練パターンを3つ求めたとした場合、カテゴリ‘e’,‘o’,‘c’となったとすると、この訓練パターンはカテゴリ‘e’である信頼性が低いとして選択しない。一方、類似した訓練パターンがすべてカテゴリ‘e’であった場合、この訓練パターンの信頼性が高いと判断し、テンプレートとして選択する。
【0015】
本発明の他の実施態様によれば、ある訓練パターンを、付与されているカテゴリのテンプレートとして適切かどうかの選択を行う際に、その訓練パターンに類似した訓練パターンを求め、それらのカテゴリ分布によって、カテゴリ名を決定する。たとえば、ある訓練パターン(カテゴリ‘e’)に対し、類似した訓練パターンを3つ求めたとした場合、カテゴリ‘o’,‘o’,‘o’となったとすると、この訓練パターンはカテゴリ‘e’である信頼性が低く、カテゴリ‘o’である可能性が高いと判断し、カテゴリ‘o’のテンプレートとして選択する。
【0016】
本発明のテンプレート作成装置は、入力パターンと照合されるテンプレートを、学習用パターン中の訓練パターンを用いて作成するテンプレート作成装置であって、
学習用パターンを記憶している学習用パターン記憶手段と、
各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段と、
学習用パターン記憶手段から学習用パターンを読出し、テンプレート記憶手段からテンプレートを読出し、読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出手段と、
学習用パターン記憶手段から、抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンテンプレートとして選別し、該テンプレートをテンプレート記憶手段に新規に登録するテンプレート選別手段と、
有する。
【0017】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して説明する。
【0018】
図1を参照すると、本発明の一実施形態のパターン認識装置は学習用パターン記憶回路11と訓練パターン抽出回路12とテンプレート選別回路13とテンプレート記憶回路14と入力パターン記憶回路15と認識回路16で構成されている。
【0019】
学習用パターン記憶回路11はテンプレートを作成するために用いられる学習用パターンである学習用画像を記憶している。学習用画像はn(n≧2)画素からなり、画素の値は、例えば白画素を「0」、黒画素を「1」で表す。
【0020】
訓練パターン抽出回路12は、学習用パターン記憶回路11から学習用パターンを読出し、その中から訓練パターンを抽出する。訓練パターンにはカテゴリ名が付与されている。
【0021】
テンプレート選別回路13は、訓練パターン抽出回路12から訓練パターンを入力し、適切なテンプレートを選別し、テンプレート記憶回路14に新規に登録する。
【0022】
テンプレート記憶回路14は、入力画像パターンの認識判定に用いる各カテゴリのテンプレートを、各カテゴリ毎に1つあるいは複数(一般には複数)記憶している。
【0023】
入力パターン記憶回路15は、認識される1つもしくは2以上の画像パターンを入力パターンとして記憶している。これらの画像パターンはM(M≧2)画素からなり、例えば、2値画像パターンの場合には各画素は「0」または「1」で示されている。
【0024】
認識回路16は、テンプレート記憶回路14からテンプレートを読出し、またパターン記憶回路15から入力パターンを読出し、入力パターンをテンプレートと照合することによりパターン認識を行い、その認識結果を出力する。
【0025】
本実施形態の特徴は、学習用パターンと初期のテンプレートを用いて、認識用のテンプレートを自動的に作成(追加)するところにある。以下に、学習用パターンから自動的にテンプレートを作成する処理について、図2のフローチャートを用いて詳細に説明する。
【0026】
ステップ21に、学習用パターン記憶回路11から学習用パターンが読み出され、訓練パターン抽出回路12に入力される。学習用パターンは、1つもしくは複数の訓練パターンを含んでいるとする。学習用パターンの例を図3(1)に示す。
【0027】
次に、ステップ22に訓練パターン抽出回路12は、テンプレート記憶回路14から、予め作成されているテンプレートを読みこむ。「予め作成されているテンプレート」は、例えば、各カテゴリごとに1つのテンプレートを学習用画像から手動で切り出して作成してあるとする。
【0028】
ステップ23に、訓練パターン抽出回路12は、読み出されたテンプレートを用いて、学習用パターンを認識する。認識手法としては、例えば、学習用パターンに対し傾き補正などの前処理を行うことにより前処理済パターンを作成し、その前処理済パターンに対し補完類似度を用いたずらし照合による方法(例:特願平9−343292)を用いることができる。認識した結果、高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリが得られる。図3(2)に、学習用パターン(図3(1))に傾き補正を行って得られた前処理済パターンを示す。また、図3(3)に、図3(2)の上の行を予め作成されているテンプレートによるずらし照合を行った際に、高い類似度を示したカテゴリを、高い類似度を示した位置に示す。
【0029】
次に、ステップ24に高い類似度を示した位置およびカテゴリを用いて、訓練パターンを抽出する。訓練パターンの抽出方法の例としては、認識された位置を中心として、予め定められた大きさの矩形領域を抽出する。抽出された訓練パターンは、テンプレート選別回路13に入力される。
【0030】
ステップ25に、テンプレート選別回路13では、入力された訓練パターンを用いて、テンプレートを選別する。テンプレートの選別方法としては、例えば、複数の訓練パターン中から類似パターンを求め、該類似パターンのカテゴリ分布の過半数が同じものであった場合に該訓練パターンを信頼できるテンプレートとして選択し、過半数が同じでなかった場合には棄却するという方法がある。図4に、棄却されたテンプレートの例を示す。図4(a)は誤って削除されたパターン、図4(b)は正しく削除されたパターンを示す。また、該類似パターンを用いて、該訓練パターンのカテゴリ名を決定する。例えば、該類似パターンのカテゴリ分布の過半数をしめたカテゴリ名を、該訓練パターンのカテゴリ名とする。
【0031】
ステップ26に、選別されたテンプレートはテンプレート記憶回路14に記憶される。
【0032】
また、新規保存されたテンプレートを用いて、ステップ22からステップ26までを繰り返し行い、テンプレートを更新することにより、より正確なテンプレートを得たり、状況の変化にさらに追随することができる。
【0033】
このようにして得られたテンプレートを用いて、文字を認識した時の結果を図5に示す。(a)は初期のテンプレート、(b)は全ての訓練パターン(t=1)、(c)は選択されたテンプレート(t=1)、(d)は全ての訓練パターン(t=2)、(e)は選択された辞書(t=2)の場合を示している。tは図2のステップ22〜26の繰り返し回数である。学習用パターンをテンプレートで認識した場合(○印)と、他のパターンをテンプレートで認識した場合(□印)とで認識率に殆ど差がないことがわかる。
【0034】
以上の説明では文字を中心に示したが、文字以外のパターンについても同様の処理が可能である。
【0035】
図6を参照すると、本発明の他の実施形態のパターン認識装置は入力装置31と記憶装置32〜35と出力装置36と記録媒体37とデータ処理装置38で構成されている。
【0036】
入力装置は入力パターンを入力するためのものである。記憶装置32,33,34はそれぞれ図1中の学習パターン記憶回路11、テンプレート記憶回路14、入力パターン記憶回路15に相当する。記憶装置35はハードディスクである。出力装置36は認識結果を出力するためのものである。記録媒体37は、図1中の訓練パターン抽出回路12、テンプレート選別回路13、認識回路16の各処理からなるパターン認識プログラムが記録されている、フロッピィ・ディスク、CD−ROM、光磁気ディスク等の記録媒体である。データ処理装置38はCPU、インタフェース等を含み、記録媒体37からパターン認識プログラムを記憶装置35に読み込んで後、これを実行する。
【0037】
【発明の効果】
以上説明したように、本発明によれば、下記のような効果がある。
【0038】
請求項1,2,3の発明は、学習用パターンを予め作成されているテンプレートによって認識し、その結果から訓練パターンを抽出し、類似パターンのカテゴリ分布から訓練パターンをテンプレートとして登録するかどうか決定することにより、人手による作業なしに、高い認識率が得られるテンプレートが自動的に作成できる。
【0040】
請求項2,4,6の発明は、訓練パターン抽出時に誤ったカテゴリ名が付与された場合であっても、正しいカテゴリ名に変更することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態のパターン認識装置の構成例を示すブロック図である。
【図2】図1のパターン認識装置におけるテンプレート作成を示すフローチャートである。
【図3】学習用パターンおよび前処理済パターンおよび認識結果の例を示す図である。
【図4】棄却された訓練パターンの例を示す図である。
【図5】作成されたテンプレートを用いた場合の認識率を示す図である。
【図6】本発明の他の実施形態のパターン認識装置の構成図である。
【符号の説明】
11 学習用パターン記憶回路
12 訓練パターン抽出回路
13 テンプレート選別回路
14 テンプレート記憶回路
15 パターン記憶回路
16 認識回路
21〜26 ステップ
31 入力装置
32〜35 記憶装置
36 出力装置
37 記録媒体
38 データ処理装置
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a pattern recognition method for calculating a similarity or distance value between an input pattern and a template created in advance using a training pattern in a learning pattern and recognizing the category of the input pattern.
[0002]
[Prior art]
Hereinafter, character recognition will be described as an example of pattern recognition.
[0003]
2. Description of the Related Art Conventionally, in a character recognition device such as Kanji OCR (Optical Character Reader), a method of recognizing an input document or image pattern by pattern matching between an input pattern and a template is known. In general, this method is used to compare design-processed characters that are made up of unique textures found in advertisements and newspaper headlines, and images that are severely blurred, crushed, and background noise is significant. Has been reported to be robust.
[0004]
However, if the character shape changes due to image observation conditions such as lighting conditions, or if the character shape changes due to printing conditions or aging, etc., the similarity between the input pattern and the template decreases and the recognition rate decreases. There was a point.
[0005]
In order to solve such problems, conventionally, mainly, (1) a method of performing recognition using a template after removing other information in the input pattern as noise or correcting variations in the shape of the character Two approaches have been taken: (2) a method of absorbing the influence of deformation of individual characters by using a word template that uses the character string as a template pattern as it is.
[0006]
However, it is difficult to remove only other information in the input pattern. This is because character strokes and other information often occur very similar. As a result, other information often remains or the information of interest is lost. As a result, the degree of similarity at the time of matching with the template is lowered, and the recognition rate is lowered. In particular, small patterns such as “l” and “r” are often affected by other information in the surrounding area and are difficult to recognize.
[0007]
On the other hand, in the method using a word template, since multiple characters are collated, even if characters such as small characters fluctuate and partially misrecognized characters are partially included, the whole word can be recognized. Can be expected. However, it is necessary to create a template according to the number of words, and the number of combinations increases as the number of words increases. Along with this, the verification time also increases. Furthermore, when an unknown word is included in the input pattern, it cannot be recognized because there is no corresponding template.
[0008]
Further, another problem of the conventional method is that it cannot be followed when character variation or character shape variation occurs as usage proceeds. Any of the above-described methods proposed in the past cannot follow the difference in fluctuation for each input pattern, and cannot recognize patterns other than a specific fluctuation.
[0009]
[Problems to be solved by the invention]
As described above, the pattern recognition technology including the conventional OCR has been greatly deteriorated and deformed, and means for correctly recognizing a pattern that changes depending on the situation has not been sufficiently established.
[0010]
An object of the present invention is to provide a template creation method and apparatus for creating a template capable of obtaining a high recognition rate without manual work, and a recording medium on which a template creation program is recorded.
[0011]
[Means for Solving the Problems]
The template creation method of the present invention is a template creation method performed by a template creation device that creates a template to be matched with an input pattern using a training pattern in a learning pattern,
The training pattern extraction unit reads the learning pattern from the learning pattern storage unit that stores the learning pattern, reads the template from the template storage unit that stores a template created in advance for each category, Predetermined preprocessing is performed on the read learning pattern, and the preprocessed pattern is compared with the template to obtain the image position of the portion showing high similarity to the template and the category of the template. , A training pattern extraction stage for extracting a training pattern in the learning pattern from these,
The template selection unit obtains one or a plurality of training patterns similar to the extracted training pattern from the learning pattern storage unit, and when there is a category that occupies a majority of the categories of the similar training pattern, the extraction A template selection step of selecting the trained training pattern as a template and newly registering the template in the template storage means;
Have
[0012]
Since a template corresponding to the state of the input pattern is automatically and easily created, it is possible to automatically follow a change in the situation that has conventionally been difficult to recognize.
[0014]
According to another embodiment of the present invention, one or a plurality of similar patterns are obtained from the extracted set of training patterns, and whether or not to register a training pattern as a template is determined from the category distribution of the similar patterns. For example, if three similar training patterns are obtained for a certain training pattern (category 'e'), assuming that the categories become 'e', 'o', and 'c', this training pattern is classified into category 'e'. Do not select as' unreliable. On the other hand, if all of the similar training patterns are category “e”, it is determined that the reliability of the training pattern is high, and is selected as a template.
[0015]
According to another embodiment of the present invention, when selecting whether or not a certain training pattern is appropriate as a template of a given category, a training pattern similar to the training pattern is obtained, and according to the category distribution. Determine the category name. For example, if three similar training patterns are obtained for a certain training pattern (category 'e'), assuming that the categories are 'o', 'o', and 'o', this training pattern is classified into category 'e'. It is determined that the reliability of “is low and the possibility of being in the category“ o ”is high, and is selected as a template for the category“ o ”.
[0016]
The template creation device of the present invention is a template creation device that creates a template to be matched with an input pattern using a training pattern in a learning pattern,
Learning pattern storage means for storing a learning pattern;
Template storage means for storing templates created in advance for each category ;
Reads learning patterns from the learning pattern storage means, reads out the template from the template storage unit, performs a predetermined pre-treatment against the learning pattern read out, to the preprocessed pattern by performing matching with the template, the A training pattern extracting means for obtaining an image position of a portion showing a high similarity to the template and a category of the template, and extracting a training pattern in the learning pattern from them,
One or a plurality of training patterns similar to the extracted training pattern are obtained from the learning pattern storage means, and if there is a category that occupies a majority of the categories of the similar training pattern, the extracted training pattern is used as a template. And a template selection means for newly registering the template in the template storage means,
Having.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments of the present invention will be described with reference to the drawings.
[0018]
Referring to FIG. 1, a pattern recognition apparatus according to an embodiment of the present invention includes a learning pattern storage circuit 11, a training pattern extraction circuit 12, a template selection circuit 13, a template storage circuit 14, an input pattern storage circuit 15, and a recognition circuit 16. It is configured.
[0019]
The learning pattern storage circuit 11 stores a learning image which is a learning pattern used for creating a template. The learning image is composed of n (n ≧ 2) pixels, and the pixel values are represented by, for example, “0” for white pixels and “1” for black pixels.
[0020]
The training pattern extraction circuit 12 reads a learning pattern from the learning pattern storage circuit 11 and extracts a training pattern from the learning pattern. A category name is assigned to the training pattern.
[0021]
The template selection circuit 13 inputs a training pattern from the training pattern extraction circuit 12, selects an appropriate template, and newly registers it in the template storage circuit 14.
[0022]
The template storage circuit 14 stores one or a plurality (generally a plurality) of templates for each category used for recognition recognition of the input image pattern for each category.
[0023]
The input pattern storage circuit 15 stores one or more recognized image patterns as input patterns. These image patterns are composed of M (M ≧ 2) pixels. For example, in the case of a binary image pattern, each pixel is indicated by “0” or “1”.
[0024]
The recognition circuit 16 reads a template from the template storage circuit 14, reads an input pattern from the pattern storage circuit 15, performs pattern recognition by collating the input pattern with the template, and outputs the recognition result.
[0025]
A feature of this embodiment is that a recognition template is automatically created (added) using a learning pattern and an initial template. Hereinafter, the process of automatically creating a template from the learning pattern will be described in detail with reference to the flowchart of FIG.
[0026]
In step 21, the learning pattern is read from the learning pattern storage circuit 11 and input to the training pattern extraction circuit 12. It is assumed that the learning pattern includes one or a plurality of training patterns. An example of the learning pattern is shown in FIG.
[0027]
Next, in step 22, the training pattern extraction circuit 12 reads a template created in advance from the template storage circuit 14. For example, it is assumed that the “template created in advance” is created by manually cutting out one template for each category from the learning image.
[0028]
In step 23, the training pattern extraction circuit 12 recognizes the learning pattern using the read template. As a recognition method, for example, a preprocessed pattern is created by performing preprocessing such as tilt correction on the learning pattern, and a method based on shift matching using complementary similarity is performed on the preprocessed pattern (for example: Japanese Patent Application No. 9-343292) can be used. As a result of the recognition, an image position of a portion showing a high similarity and a category of the template are obtained. FIG. 3B shows a preprocessed pattern obtained by performing inclination correction on the learning pattern (FIG. 3A). Further, in FIG. 3 (3), when the upper row of FIG. 3 (2) is subjected to the shift collation using the template created in advance, the category showing the high similarity is the position showing the high similarity. Shown in
[0029]
Next, a training pattern is extracted using the position and category that showed a high degree of similarity in step 24. As an example of the training pattern extraction method, a rectangular region having a predetermined size is extracted with the recognized position as the center. The extracted training pattern is input to the template selection circuit 13.
[0030]
In step 25, the template selection circuit 13 selects a template using the input training pattern. As a template selection method, for example, a similar pattern is obtained from a plurality of training patterns, and when the majority of the category distribution of the similar patterns is the same, the training pattern is selected as a reliable template, and the majority is the same. If it is not, there is a method of dismissing. FIG. 4 shows an example of a rejected template. FIG. 4A shows a pattern that has been deleted by mistake, and FIG. 4B shows a pattern that has been deleted correctly. Moreover, the category name of the training pattern is determined using the similar pattern. For example, a category name that is a majority of the category distribution of the similar pattern is set as the category name of the training pattern.
[0031]
In step 26, the selected template is stored in the template storage circuit 14.
[0032]
Further, by repeating the steps 22 to 26 using the newly saved template and updating the template, it is possible to obtain a more accurate template and further follow changes in the situation.
[0033]
FIG. 5 shows the results when characters are recognized using the template thus obtained. (A) is an initial template, (b) is all training patterns (t = 1), (c) is a selected template (t = 1), (d) is all training patterns (t = 2), (E) shows the case of the selected dictionary (t = 2). t is the number of repetitions of steps 22 to 26 in FIG. It can be seen that there is almost no difference in the recognition rate when the learning pattern is recognized by the template (◯ mark) and when the other pattern is recognized by the template (□ mark).
[0034]
In the above description, characters are mainly shown, but the same processing can be performed for patterns other than characters.
[0035]
Referring to FIG. 6, the pattern recognition apparatus according to another embodiment of the present invention includes an input device 31, storage devices 32 to 35, an output device 36, a recording medium 37, and a data processing device 38.
[0036]
The input device is for inputting an input pattern. The storage devices 32, 33, and 34 correspond to the learning pattern storage circuit 11, the template storage circuit 14, and the input pattern storage circuit 15 in FIG. The storage device 35 is a hard disk. The output device 36 is for outputting the recognition result. The recording medium 37 is a floppy disk, CD-ROM, magneto-optical disk, or the like on which a pattern recognition program consisting of the processes of the training pattern extraction circuit 12, the template selection circuit 13, and the recognition circuit 16 in FIG. 1 is recorded. It is a recording medium. The data processing device 38 includes a CPU, an interface, etc., and reads the pattern recognition program from the recording medium 37 into the storage device 35 and executes it.
[0037]
【The invention's effect】
As described above, the present invention has the following effects.
[0038]
According to the first , second, and third aspects of the present invention, the learning pattern is recognized by a template created in advance, the training pattern is extracted from the result, and it is determined whether to register the training pattern as a template from the category distribution of similar patterns. By doing so, a template with a high recognition rate can be automatically created without any manual work.
[0040]
The inventions of claims 2 , 4 and 6 can be changed to correct category names even when an incorrect category name is given at the time of training pattern extraction.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration example of a pattern recognition apparatus according to an embodiment of the present invention.
FIG. 2 is a flowchart showing template creation in the pattern recognition apparatus of FIG. 1;
FIG. 3 is a diagram illustrating an example of a learning pattern, a preprocessed pattern, and a recognition result.
FIG. 4 is a diagram showing an example of a rejected training pattern.
FIG. 5 is a diagram showing a recognition rate when a created template is used.
FIG. 6 is a configuration diagram of a pattern recognition apparatus according to another embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 11 Learning pattern storage circuit 12 Training pattern extraction circuit 13 Template selection circuit 14 Template storage circuit 15 Pattern storage circuit 16 Recognition circuit 21-26 Step 31 Input device 32-35 Storage device 36 Output device 37 Recording medium 38 Data processing device

Claims (6)

入力パターンと照合されるテンプレートを、学習用パターン中の訓練パターンを用いて作成する、テンプレート作成装置で行われるテンプレート作成方法であって
訓練パターン抽出手段が、学習用パターンを記憶している学習用パターン記憶手段から学習用パターンを読出し、各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段からテンプレートを読出し前記読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出段階と
テンプレート選別手段が、前記学習用パターン記憶手段から、前記抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンをテンプレートとして選別し、テンプレートを前記テンプレート記憶手段に新規に登録するテンプレート選別段階と
するテンプレート作成方法。
The template to be matched with an input pattern, made using training patterns of the learning patterns in, a templating method performed by the template creation apparatus,
Exercise pattern extracting unit reads the learning patterns from the learning pattern storage means for storing a learning pattern, reads the template from the template storage means for storing the template that is created in advance for each category, the Predetermined preprocessing is performed on the read learning pattern, and the preprocessed pattern is compared with the template to obtain the image position of the portion showing high similarity to the template and the category of the template. , A training pattern extraction stage for extracting a training pattern in the learning pattern from these ,
The template selection means obtains one or more training patterns similar to the extracted training pattern from the learning pattern storage means , and when there is a category that occupies a majority of the categories of the similar training pattern, It screened the extracted training pattern as a template, and the template selecting step of registering a new the template to the template storage means,
Template creation how to have a.
前記テンプレート選別手段は、前記テンプレート選別段階において、過半数を占めた類似パターンのカテゴリ名を、前記訓練パターンをテンプレートとして登録する際のカテゴリ名決定する、請求項記載のテンプレート作成方法。 The template selection means, in the template selecting step, the category name similar pattern a majority, determines the category name when registering the exercise pattern as a template, the template creation process according to claim 1, wherein. 入力パターンと照合されるテンプレートを、学習用パターン中の訓練パターンを用いて作成するテンプレート作成装置であって
学習用パターンを記憶している学習用パターン記憶手段と、
各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段と、
前記学習用パターン記憶手段から学習用パターンを読出し、前記テンプレート記憶手段からテンプレートを読出し前記読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出手段と
前記学習用パターン記憶手段から前記抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンをテンプレートとして選別し、テンプレートを前記テンプレート記憶手段に新規に登録するテンプレート選別手段と
するテンプレート作成装置
A template creation device that creates a template to be matched with an input pattern using a training pattern in a learning pattern,
Learning pattern storage means for storing a learning pattern;
Template storage means for storing templates created in advance for each category ;
A learning pattern is read from the learning pattern storage means, a template is read from the template storage means, a predetermined preprocessing is performed on the read learning pattern, and a preprocessed pattern is compared with the template. A training pattern extracting means for obtaining an image position of a portion showing a high similarity to the template and a category of the template, and extracting a training pattern in the learning pattern therefrom,
One or a plurality of training patterns similar to the extracted training pattern are obtained from the learning pattern storage means , and when there is a category that occupies a majority of the categories of the similar training pattern, the extracted training pattern is It was selected as a template, and the template selecting means for registering a new the template to the template storage means,
Template creation apparatus to have a.
前記テンプレート選別手段は、過半数を占めた類似パターンのカテゴリ名を、前記訓練パターンをテンプレートとして登録する際のカテゴリ名決定する、請求項記載のテンプレート作成装置。 The template selecting means, the category name similar pattern a majority, determines the category name when registering the exercise pattern as a template, the template creation apparatus according to claim 3, wherein. 入力パターンと照合されるテンプレートを、学習用パターン中の、訓練パターンを用いて作成する処理を、コンピュータに実行させるためのテンプレート作成プログラムを記録した記録媒体であって
学習用パターンを記憶している学習用パターン記憶手段から学習用パターンを読出し、各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段からテンプレートを読出し前記読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出手順と
前記学習用パターン記憶手段から前記抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンをテンプレートとして選別し、テンプレートを前記テンプレート記憶手段に新規に登録するテンプレート選別手順と
をコンピュータに実行させるためのテンプレート作成プログラムを記録した記録媒体
A recording medium recording a template creation program for causing a computer to execute a process of creating a template to be matched with an input pattern using a training pattern in a learning pattern,
The learning pattern is read from the learning pattern storage means storing the learning pattern, the template is read from the template storage means storing the template prepared in advance for each category, and the read learning pattern is used as the read learning pattern. Predetermined preprocessing is performed, the preprocessed pattern is compared with the template, and the image position of the portion showing a high similarity to the template and the category of the template are obtained. A training pattern extraction procedure for extracting a training pattern in the pattern ;
One or a plurality of training patterns similar to the extracted training pattern are obtained from the learning pattern storage means , and when there is a category that occupies a majority of the categories of the similar training pattern, the extracted training pattern is was selected as a template, and the template selection procedure for registering a new said template storage means the template,
A recording medium on which a template creation program for causing a computer to execute is recorded .
前記テンプレート選別手順は、前記テンプレート選別段階において、過半数を占めた類似パターンのカテゴリ名を、前記訓練パターンをテンプレートとして登録する際のカテゴリ名決定する、請求項記載の記録媒体。The recording medium according to claim 5 , wherein in the template selection step, a category name of a similar pattern occupying a majority in the template selection step is determined as a category name when the training pattern is registered as a template.
JP2000042877A 2000-02-21 2000-02-21 Template creation method, apparatus, and recording medium recording template creation program Expired - Fee Related JP3730073B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000042877A JP3730073B2 (en) 2000-02-21 2000-02-21 Template creation method, apparatus, and recording medium recording template creation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000042877A JP3730073B2 (en) 2000-02-21 2000-02-21 Template creation method, apparatus, and recording medium recording template creation program

Publications (2)

Publication Number Publication Date
JP2001236467A JP2001236467A (en) 2001-08-31
JP3730073B2 true JP3730073B2 (en) 2005-12-21

Family

ID=18565889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000042877A Expired - Fee Related JP3730073B2 (en) 2000-02-21 2000-02-21 Template creation method, apparatus, and recording medium recording template creation program

Country Status (1)

Country Link
JP (1) JP3730073B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4788106B2 (en) * 2004-04-12 2011-10-05 富士ゼロックス株式会社 Image dictionary creation device, encoding device, image dictionary creation method and program thereof
JP4645058B2 (en) * 2004-04-12 2011-03-09 富士ゼロックス株式会社 Image dictionary creation device, encoding device, image dictionary creation method and program thereof
JP5082512B2 (en) * 2007-03-08 2012-11-28 富士ゼロックス株式会社 Information processing apparatus, image processing apparatus, image encoding apparatus, information processing program, image processing program, and image encoding program
JP5381166B2 (en) * 2009-03-04 2014-01-08 オムロン株式会社 Model image acquisition support apparatus, model image acquisition support method, and model image acquisition support program
US8285057B2 (en) * 2010-05-14 2012-10-09 Palo Alto Research Center Incorporated Learning image anchor templates for document classification

Also Published As

Publication number Publication date
JP2001236467A (en) 2001-08-31

Similar Documents

Publication Publication Date Title
US7031519B2 (en) Orthogonal technology for character recognition
US6778703B1 (en) Form recognition using reference areas
US7650035B2 (en) Optical character recognition based on shape clustering and multiple optical character recognition processes
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
JPH0863546A (en) Information extracting method, method and system for recovering picture
JP2000293626A (en) Method and device for recognizing character and storage medium
JP4280355B2 (en) Character recognition device
JPWO2017141802A1 (en) Image processing apparatus, character recognition apparatus, image processing method, and program recording medium
CA2601144C (en) Method and system for adaptive recognition of distorted text in computer images
US6941030B2 (en) Character-recognition pre-processing apparatus and method, and program recording medium
JP2000285190A (en) Method and device for identifying slip and storage medium
JP3730073B2 (en) Template creation method, apparatus, and recording medium recording template creation program
JP2008226030A (en) Word recognition method and program
JP3090070B2 (en) Form identification method and device
JP4116688B2 (en) Dictionary learning method and character recognition device
JP3930466B2 (en) Character recognition device, character recognition program
JPH08287188A (en) Character string recognition device
JP4633271B2 (en) Dictionary learning method and dictionary learning program
JP2003115028A (en) Method for automatically generating document identification dictionary and document processing system
JP2993533B2 (en) Information processing device and character recognition device
CN116311264A (en) Character recognition method based on character outline
JP2002074262A (en) Method for correcting recognition character
JP2002207960A (en) Method and program for recognized character correction
JP4633246B2 (en) Recognized character correction method and computer-readable recording medium recording a recognized character correction program
JPH11184962A (en) Optical character reader, collation correction method and recording medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050322

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050322

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051005

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091014

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101014

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees