JP3730073B2 - Template creation method, apparatus, and recording medium recording template creation program - Google Patents
Template creation method, apparatus, and recording medium recording template creation program Download PDFInfo
- Publication number
- JP3730073B2 JP3730073B2 JP2000042877A JP2000042877A JP3730073B2 JP 3730073 B2 JP3730073 B2 JP 3730073B2 JP 2000042877 A JP2000042877 A JP 2000042877A JP 2000042877 A JP2000042877 A JP 2000042877A JP 3730073 B2 JP3730073 B2 JP 3730073B2
- Authority
- JP
- Japan
- Prior art keywords
- template
- pattern
- learning
- training
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、入力パターンと、学習用パターン中の訓練パターンを用いて予め作成されたテンプレートとの間の類似度あるいは距離値を計算し、前記入力パターンのカテゴリを認識するパターン認識方法に関する。
【0002】
【従来の技術】
以下では、パターン認識の一例として、文字認識を対象として説明する。
【0003】
従来、漢字OCR(Optical Character Reader)などの文字認識装置では、入力された文書、画像のパターンに対して、入力パターンとテンプレートとのパターン照合により認識を行う方法が知られている。このような手法は、一般的に、広告や新聞の見出しなどにみられる特異なテクスチャで構成されているデザイン処理された文字や、かすれ、つぶれ、文字背景雑音などが激しい画像に対して、比較的ロバストであることが報告されている。
【0004】
しかし、照明条件などの画像の観測条件などにより字形が変動した場合や、印刷条件や経年変化などにより字形が変動した場合には、入力パターンとテンプレートの類似度が下がり、認識率が低下する問題点があった。
【0005】
このような問題を解決するために、従来は主に、(1)入力パターン内の他の情報を雑音とみなして取り除いたり、字形の変動を補正してから、テンプレートを用いて認識を行う方法、(2)文字列をそのままテンプレートのパターンとする単語テンプレートを用いることにより個別文字の変形の影響を吸収する方法、の2つのアプローチがとられてきた。
【0006】
しかし、入力パターン内の他の情報のみを除去することは困難である。これは、文字のストロークと他の情報が非常に類似していることが頻繁に起こるためである。そのため、しばしば他の情報が残ったり、着目している情報が損失したりする。その結果、テンプレートとの照合の際の類似度が下がり、認識率が低下する。特に、‘l’や‘r’のような小さいパターンでは、周囲の他の情報の影響を受けやすく認識が困難となる場合が多い。
【0007】
一方、単語テンプレートを用いる方法では、複数文字同士の照合を行うため、小さい文字など字形が変動し誤認識しやすい文字が部分的に含まれている場合でも、単語全体としては認識可能となることが期待できる。しかし、単語数に応じたテンプレートを作成することが必要となり、単語数が増えるほどその組み合わせが膨大になる。また、それに伴い、照合時間も増加する。さらに、入力パターンに未知語が含まれている場合、対応するテンプレートがないため、認識できない。
【0008】
また、従来の方法の別の問題点として、使用をすすめるにつれて文字の変動や字形の変動が発生する場合に追随できないという点があった。従来提案されている上記のいずれの方法でも、入力パターンごとの変動の違いに追随できず、特定の変動以外のパターンは認識できない。
【0009】
【発明が解決しようとする課題】
上記のように、従来のOCRをはじめとするパターン認識技術は、劣化や変形が大きく、また状況によって変化するパターンを正しく認識できる手段が十分に確立していなかった。
【0010】
本発明の目的は、人手による作業なしに、高い認識率が得られるテンプレートを作成するテンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体を提供することにある。
【0011】
【課題を解決するための手段】
本発明のテンプレート作成方法は、入力パターンと照合されるテンプレートを、学習用パターン中の訓練パターンを用いて作成する、テンプレート作成装置で行われるテンプレート作成方法であって、
訓練パターン抽出手段が、学習用パターンを記憶している学習用パターン記憶手段から学習用パターンを読出し、各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段からテンプレートを読出し、前記読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出段階と、
テンプレート選別手段が、前記学習用パターン記憶手段から前記抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンをテンプレートとして選別し、該テンプレートを前記テンプレート記憶手段に新規に登録するテンプレート選別段階と、
を有する。
【0012】
入力パターンの状況に応じたテンプレートが自動的に、かつ簡易に作成されるため、従来、認識が困難であった状況の変化にも自動的に追随できる。
【0014】
本発明の他の実施態様によれば、抽出された訓練パターンのセットから1つまたは複数の類似パターンを求め、該類似パターンのカテゴリ分布から訓練パターンのテンプレートとしての登録の可否を決定する。たとえば、ある訓練パターン(カテゴリ‘e’)に対し、類似した訓練パターンを3つ求めたとした場合、カテゴリ‘e’,‘o’,‘c’となったとすると、この訓練パターンはカテゴリ‘e’である信頼性が低いとして選択しない。一方、類似した訓練パターンがすべてカテゴリ‘e’であった場合、この訓練パターンの信頼性が高いと判断し、テンプレートとして選択する。
【0015】
本発明の他の実施態様によれば、ある訓練パターンを、付与されているカテゴリのテンプレートとして適切かどうかの選択を行う際に、その訓練パターンに類似した訓練パターンを求め、それらのカテゴリ分布によって、カテゴリ名を決定する。たとえば、ある訓練パターン(カテゴリ‘e’)に対し、類似した訓練パターンを3つ求めたとした場合、カテゴリ‘o’,‘o’,‘o’となったとすると、この訓練パターンはカテゴリ‘e’である信頼性が低く、カテゴリ‘o’である可能性が高いと判断し、カテゴリ‘o’のテンプレートとして選択する。
【0016】
本発明のテンプレート作成装置は、入力パターンと照合されるテンプレートを、学習用パターン中の訓練パターンを用いて作成するテンプレート作成装置であって、
学習用パターンを記憶している学習用パターン記憶手段と、
各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段と、
学習用パターン記憶手段から学習用パターンを読出し、テンプレート記憶手段からテンプレートを読出し、読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出手段と、
学習用パターン記憶手段から、抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンをテンプレートとして選別し、該テンプレートをテンプレート記憶手段に新規に登録するテンプレート選別手段と、
を有する。
【0017】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して説明する。
【0018】
図1を参照すると、本発明の一実施形態のパターン認識装置は学習用パターン記憶回路11と訓練パターン抽出回路12とテンプレート選別回路13とテンプレート記憶回路14と入力パターン記憶回路15と認識回路16で構成されている。
【0019】
学習用パターン記憶回路11はテンプレートを作成するために用いられる学習用パターンである学習用画像を記憶している。学習用画像はn(n≧2)画素からなり、画素の値は、例えば白画素を「0」、黒画素を「1」で表す。
【0020】
訓練パターン抽出回路12は、学習用パターン記憶回路11から学習用パターンを読出し、その中から訓練パターンを抽出する。訓練パターンにはカテゴリ名が付与されている。
【0021】
テンプレート選別回路13は、訓練パターン抽出回路12から訓練パターンを入力し、適切なテンプレートを選別し、テンプレート記憶回路14に新規に登録する。
【0022】
テンプレート記憶回路14は、入力画像パターンの認識判定に用いる各カテゴリのテンプレートを、各カテゴリ毎に1つあるいは複数(一般には複数)記憶している。
【0023】
入力パターン記憶回路15は、認識される1つもしくは2以上の画像パターンを入力パターンとして記憶している。これらの画像パターンはM(M≧2)画素からなり、例えば、2値画像パターンの場合には各画素は「0」または「1」で示されている。
【0024】
認識回路16は、テンプレート記憶回路14からテンプレートを読出し、またパターン記憶回路15から入力パターンを読出し、入力パターンをテンプレートと照合することによりパターン認識を行い、その認識結果を出力する。
【0025】
本実施形態の特徴は、学習用パターンと初期のテンプレートを用いて、認識用のテンプレートを自動的に作成(追加)するところにある。以下に、学習用パターンから自動的にテンプレートを作成する処理について、図2のフローチャートを用いて詳細に説明する。
【0026】
ステップ21に、学習用パターン記憶回路11から学習用パターンが読み出され、訓練パターン抽出回路12に入力される。学習用パターンは、1つもしくは複数の訓練パターンを含んでいるとする。学習用パターンの例を図3(1)に示す。
【0027】
次に、ステップ22に訓練パターン抽出回路12は、テンプレート記憶回路14から、予め作成されているテンプレートを読みこむ。「予め作成されているテンプレート」は、例えば、各カテゴリごとに1つのテンプレートを学習用画像から手動で切り出して作成してあるとする。
【0028】
ステップ23に、訓練パターン抽出回路12は、読み出されたテンプレートを用いて、学習用パターンを認識する。認識手法としては、例えば、学習用パターンに対し傾き補正などの前処理を行うことにより前処理済パターンを作成し、その前処理済パターンに対し補完類似度を用いたずらし照合による方法(例:特願平9−343292)を用いることができる。認識した結果、高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリが得られる。図3(2)に、学習用パターン(図3(1))に傾き補正を行って得られた前処理済パターンを示す。また、図3(3)に、図3(2)の上の行を予め作成されているテンプレートによるずらし照合を行った際に、高い類似度を示したカテゴリを、高い類似度を示した位置に示す。
【0029】
次に、ステップ24に高い類似度を示した位置およびカテゴリを用いて、訓練パターンを抽出する。訓練パターンの抽出方法の例としては、認識された位置を中心として、予め定められた大きさの矩形領域を抽出する。抽出された訓練パターンは、テンプレート選別回路13に入力される。
【0030】
ステップ25に、テンプレート選別回路13では、入力された訓練パターンを用いて、テンプレートを選別する。テンプレートの選別方法としては、例えば、複数の訓練パターン中から類似パターンを求め、該類似パターンのカテゴリ分布の過半数が同じものであった場合に該訓練パターンを信頼できるテンプレートとして選択し、過半数が同じでなかった場合には棄却するという方法がある。図4に、棄却されたテンプレートの例を示す。図4(a)は誤って削除されたパターン、図4(b)は正しく削除されたパターンを示す。また、該類似パターンを用いて、該訓練パターンのカテゴリ名を決定する。例えば、該類似パターンのカテゴリ分布の過半数をしめたカテゴリ名を、該訓練パターンのカテゴリ名とする。
【0031】
ステップ26に、選別されたテンプレートはテンプレート記憶回路14に記憶される。
【0032】
また、新規保存されたテンプレートを用いて、ステップ22からステップ26までを繰り返し行い、テンプレートを更新することにより、より正確なテンプレートを得たり、状況の変化にさらに追随することができる。
【0033】
このようにして得られたテンプレートを用いて、文字を認識した時の結果を図5に示す。(a)は初期のテンプレート、(b)は全ての訓練パターン(t=1)、(c)は選択されたテンプレート(t=1)、(d)は全ての訓練パターン(t=2)、(e)は選択された辞書(t=2)の場合を示している。tは図2のステップ22〜26の繰り返し回数である。学習用パターンをテンプレートで認識した場合(○印)と、他のパターンをテンプレートで認識した場合(□印)とで認識率に殆ど差がないことがわかる。
【0034】
以上の説明では文字を中心に示したが、文字以外のパターンについても同様の処理が可能である。
【0035】
図6を参照すると、本発明の他の実施形態のパターン認識装置は入力装置31と記憶装置32〜35と出力装置36と記録媒体37とデータ処理装置38で構成されている。
【0036】
入力装置は入力パターンを入力するためのものである。記憶装置32,33,34はそれぞれ図1中の学習パターン記憶回路11、テンプレート記憶回路14、入力パターン記憶回路15に相当する。記憶装置35はハードディスクである。出力装置36は認識結果を出力するためのものである。記録媒体37は、図1中の訓練パターン抽出回路12、テンプレート選別回路13、認識回路16の各処理からなるパターン認識プログラムが記録されている、フロッピィ・ディスク、CD−ROM、光磁気ディスク等の記録媒体である。データ処理装置38はCPU、インタフェース等を含み、記録媒体37からパターン認識プログラムを記憶装置35に読み込んで後、これを実行する。
【0037】
【発明の効果】
以上説明したように、本発明によれば、下記のような効果がある。
【0038】
請求項1,2,3の発明は、学習用パターンを予め作成されているテンプレートによって認識し、その結果から訓練パターンを抽出し、類似パターンのカテゴリ分布から訓練パターンをテンプレートとして登録するかどうか決定することにより、人手による作業なしに、高い認識率が得られるテンプレートが自動的に作成できる。
【0040】
請求項2,4,6の発明は、訓練パターン抽出時に誤ったカテゴリ名が付与された場合であっても、正しいカテゴリ名に変更することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態のパターン認識装置の構成例を示すブロック図である。
【図2】図1のパターン認識装置におけるテンプレート作成を示すフローチャートである。
【図3】学習用パターンおよび前処理済パターンおよび認識結果の例を示す図である。
【図4】棄却された訓練パターンの例を示す図である。
【図5】作成されたテンプレートを用いた場合の認識率を示す図である。
【図6】本発明の他の実施形態のパターン認識装置の構成図である。
【符号の説明】
11 学習用パターン記憶回路
12 訓練パターン抽出回路
13 テンプレート選別回路
14 テンプレート記憶回路
15 パターン記憶回路
16 認識回路
21〜26 ステップ
31 入力装置
32〜35 記憶装置
36 出力装置
37 記録媒体
38 データ処理装置[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a pattern recognition method for calculating a similarity or distance value between an input pattern and a template created in advance using a training pattern in a learning pattern and recognizing the category of the input pattern.
[0002]
[Prior art]
Hereinafter, character recognition will be described as an example of pattern recognition.
[0003]
2. Description of the Related Art Conventionally, in a character recognition device such as Kanji OCR (Optical Character Reader), a method of recognizing an input document or image pattern by pattern matching between an input pattern and a template is known. In general, this method is used to compare design-processed characters that are made up of unique textures found in advertisements and newspaper headlines, and images that are severely blurred, crushed, and background noise is significant. Has been reported to be robust.
[0004]
However, if the character shape changes due to image observation conditions such as lighting conditions, or if the character shape changes due to printing conditions or aging, etc., the similarity between the input pattern and the template decreases and the recognition rate decreases. There was a point.
[0005]
In order to solve such problems, conventionally, mainly, (1) a method of performing recognition using a template after removing other information in the input pattern as noise or correcting variations in the shape of the character Two approaches have been taken: (2) a method of absorbing the influence of deformation of individual characters by using a word template that uses the character string as a template pattern as it is.
[0006]
However, it is difficult to remove only other information in the input pattern. This is because character strokes and other information often occur very similar. As a result, other information often remains or the information of interest is lost. As a result, the degree of similarity at the time of matching with the template is lowered, and the recognition rate is lowered. In particular, small patterns such as “l” and “r” are often affected by other information in the surrounding area and are difficult to recognize.
[0007]
On the other hand, in the method using a word template, since multiple characters are collated, even if characters such as small characters fluctuate and partially misrecognized characters are partially included, the whole word can be recognized. Can be expected. However, it is necessary to create a template according to the number of words, and the number of combinations increases as the number of words increases. Along with this, the verification time also increases. Furthermore, when an unknown word is included in the input pattern, it cannot be recognized because there is no corresponding template.
[0008]
Further, another problem of the conventional method is that it cannot be followed when character variation or character shape variation occurs as usage proceeds. Any of the above-described methods proposed in the past cannot follow the difference in fluctuation for each input pattern, and cannot recognize patterns other than a specific fluctuation.
[0009]
[Problems to be solved by the invention]
As described above, the pattern recognition technology including the conventional OCR has been greatly deteriorated and deformed, and means for correctly recognizing a pattern that changes depending on the situation has not been sufficiently established.
[0010]
An object of the present invention is to provide a template creation method and apparatus for creating a template capable of obtaining a high recognition rate without manual work, and a recording medium on which a template creation program is recorded.
[0011]
[Means for Solving the Problems]
The template creation method of the present invention is a template creation method performed by a template creation device that creates a template to be matched with an input pattern using a training pattern in a learning pattern,
The training pattern extraction unit reads the learning pattern from the learning pattern storage unit that stores the learning pattern, reads the template from the template storage unit that stores a template created in advance for each category, Predetermined preprocessing is performed on the read learning pattern, and the preprocessed pattern is compared with the template to obtain the image position of the portion showing high similarity to the template and the category of the template. , A training pattern extraction stage for extracting a training pattern in the learning pattern from these,
The template selection unit obtains one or a plurality of training patterns similar to the extracted training pattern from the learning pattern storage unit, and when there is a category that occupies a majority of the categories of the similar training pattern, the extraction A template selection step of selecting the trained training pattern as a template and newly registering the template in the template storage means;
Have
[0012]
Since a template corresponding to the state of the input pattern is automatically and easily created, it is possible to automatically follow a change in the situation that has conventionally been difficult to recognize.
[0014]
According to another embodiment of the present invention, one or a plurality of similar patterns are obtained from the extracted set of training patterns, and whether or not to register a training pattern as a template is determined from the category distribution of the similar patterns. For example, if three similar training patterns are obtained for a certain training pattern (category 'e'), assuming that the categories become 'e', 'o', and 'c', this training pattern is classified into category 'e'. Do not select as' unreliable. On the other hand, if all of the similar training patterns are category “e”, it is determined that the reliability of the training pattern is high, and is selected as a template.
[0015]
According to another embodiment of the present invention, when selecting whether or not a certain training pattern is appropriate as a template of a given category, a training pattern similar to the training pattern is obtained, and according to the category distribution. Determine the category name. For example, if three similar training patterns are obtained for a certain training pattern (category 'e'), assuming that the categories are 'o', 'o', and 'o', this training pattern is classified into category 'e'. It is determined that the reliability of “is low and the possibility of being in the category“ o ”is high, and is selected as a template for the category“ o ”.
[0016]
The template creation device of the present invention is a template creation device that creates a template to be matched with an input pattern using a training pattern in a learning pattern,
Learning pattern storage means for storing a learning pattern;
Template storage means for storing templates created in advance for each category ;
Reads learning patterns from the learning pattern storage means, reads out the template from the template storage unit, performs a predetermined pre-treatment against the learning pattern read out, to the preprocessed pattern by performing matching with the template, the A training pattern extracting means for obtaining an image position of a portion showing a high similarity to the template and a category of the template, and extracting a training pattern in the learning pattern from them,
One or a plurality of training patterns similar to the extracted training pattern are obtained from the learning pattern storage means, and if there is a category that occupies a majority of the categories of the similar training pattern, the extracted training pattern is used as a template. And a template selection means for newly registering the template in the template storage means,
Having.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments of the present invention will be described with reference to the drawings.
[0018]
Referring to FIG. 1, a pattern recognition apparatus according to an embodiment of the present invention includes a learning pattern storage circuit 11, a training
[0019]
The learning pattern storage circuit 11 stores a learning image which is a learning pattern used for creating a template. The learning image is composed of n (n ≧ 2) pixels, and the pixel values are represented by, for example, “0” for white pixels and “1” for black pixels.
[0020]
The training
[0021]
The
[0022]
The
[0023]
The input
[0024]
The
[0025]
A feature of this embodiment is that a recognition template is automatically created (added) using a learning pattern and an initial template. Hereinafter, the process of automatically creating a template from the learning pattern will be described in detail with reference to the flowchart of FIG.
[0026]
In step 21, the learning pattern is read from the learning pattern storage circuit 11 and input to the training
[0027]
Next, in
[0028]
In
[0029]
Next, a training pattern is extracted using the position and category that showed a high degree of similarity in
[0030]
In
[0031]
In
[0032]
Further, by repeating the
[0033]
FIG. 5 shows the results when characters are recognized using the template thus obtained. (A) is an initial template, (b) is all training patterns (t = 1), (c) is a selected template (t = 1), (d) is all training patterns (t = 2), (E) shows the case of the selected dictionary (t = 2). t is the number of repetitions of
[0034]
In the above description, characters are mainly shown, but the same processing can be performed for patterns other than characters.
[0035]
Referring to FIG. 6, the pattern recognition apparatus according to another embodiment of the present invention includes an
[0036]
The input device is for inputting an input pattern. The
[0037]
【The invention's effect】
As described above, the present invention has the following effects.
[0038]
According to the first , second, and third aspects of the present invention, the learning pattern is recognized by a template created in advance, the training pattern is extracted from the result, and it is determined whether to register the training pattern as a template from the category distribution of similar patterns. By doing so, a template with a high recognition rate can be automatically created without any manual work.
[0040]
The inventions of
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration example of a pattern recognition apparatus according to an embodiment of the present invention.
FIG. 2 is a flowchart showing template creation in the pattern recognition apparatus of FIG. 1;
FIG. 3 is a diagram illustrating an example of a learning pattern, a preprocessed pattern, and a recognition result.
FIG. 4 is a diagram showing an example of a rejected training pattern.
FIG. 5 is a diagram showing a recognition rate when a created template is used.
FIG. 6 is a configuration diagram of a pattern recognition apparatus according to another embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 11 Learning
Claims (6)
訓練パターン抽出手段が、学習用パターンを記憶している学習用パターン記憶手段から学習用パターンを読出し、各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段からテンプレートを読出し、前記読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出段階と、
テンプレート選別手段が、前記学習用パターン記憶手段から、前記抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンをテンプレートとして選別し、該テンプレートを前記テンプレート記憶手段に新規に登録するテンプレート選別段階と、
を有するテンプレート作成方法。 The template to be matched with an input pattern, made using training patterns of the learning patterns in, a templating method performed by the template creation apparatus,
Exercise pattern extracting unit reads the learning patterns from the learning pattern storage means for storing a learning pattern, reads the template from the template storage means for storing the template that is created in advance for each category, the Predetermined preprocessing is performed on the read learning pattern, and the preprocessed pattern is compared with the template to obtain the image position of the portion showing high similarity to the template and the category of the template. , A training pattern extraction stage for extracting a training pattern in the learning pattern from these ,
The template selection means obtains one or more training patterns similar to the extracted training pattern from the learning pattern storage means , and when there is a category that occupies a majority of the categories of the similar training pattern, It screened the extracted training pattern as a template, and the template selecting step of registering a new the template to the template storage means,
Template creation how to have a.
学習用パターンを記憶している学習用パターン記憶手段と、
各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段と、
前記学習用パターン記憶手段から学習用パターンを読出し、前記テンプレート記憶手段からテンプレートを読出し、前記読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出手段と、
前記学習用パターン記憶手段から前記抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンをテンプレートとして選別し、該テンプレートを前記テンプレート記憶手段に新規に登録するテンプレート選別手段と、
を有するテンプレート作成装置。A template creation device that creates a template to be matched with an input pattern using a training pattern in a learning pattern,
Learning pattern storage means for storing a learning pattern;
Template storage means for storing templates created in advance for each category ;
A learning pattern is read from the learning pattern storage means, a template is read from the template storage means, a predetermined preprocessing is performed on the read learning pattern, and a preprocessed pattern is compared with the template. A training pattern extracting means for obtaining an image position of a portion showing a high similarity to the template and a category of the template, and extracting a training pattern in the learning pattern therefrom,
One or a plurality of training patterns similar to the extracted training pattern are obtained from the learning pattern storage means , and when there is a category that occupies a majority of the categories of the similar training pattern, the extracted training pattern is It was selected as a template, and the template selecting means for registering a new the template to the template storage means,
Template creation apparatus to have a.
学習用パターンを記憶している学習用パターン記憶手段から学習用パターンを読出し、各カテゴリ毎の予め作成されているテンプレートを記憶しているテンプレート記憶手段からテンプレートを読出し、前記読出した学習用パターンに対し所定の前処理を行い、前処理済パターンに対し前記テンプレートとの照合を行って、前記テンプレートに対し高い類似度を示した部分の画像位置およびそのテンプレートのカテゴリを得、これらから前記学習用パターン中の訓練パターンを抽出する訓練パターン抽出手順と、
前記学習用パターン記憶手段から前記抽出された訓練パターンと類似した1つまたは複数の訓練パターンを求め、該類似訓練パターンのカテゴリのうち過半数を占めるカテゴリが存在する場合、前記抽出された訓練パターンをテンプレートとして選別し、該テンプレートを前記テンプレート記憶手段に新規に登録するテンプレート選別手順と、
をコンピュータに実行させるためのテンプレート作成プログラムを記録した記録媒体。 A recording medium recording a template creation program for causing a computer to execute a process of creating a template to be matched with an input pattern using a training pattern in a learning pattern,
The learning pattern is read from the learning pattern storage means storing the learning pattern, the template is read from the template storage means storing the template prepared in advance for each category, and the read learning pattern is used as the read learning pattern. Predetermined preprocessing is performed, the preprocessed pattern is compared with the template, and the image position of the portion showing a high similarity to the template and the category of the template are obtained. A training pattern extraction procedure for extracting a training pattern in the pattern ;
One or a plurality of training patterns similar to the extracted training pattern are obtained from the learning pattern storage means , and when there is a category that occupies a majority of the categories of the similar training pattern, the extracted training pattern is was selected as a template, and the template selection procedure for registering a new said template storage means the template,
A recording medium on which a template creation program for causing a computer to execute is recorded .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000042877A JP3730073B2 (en) | 2000-02-21 | 2000-02-21 | Template creation method, apparatus, and recording medium recording template creation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000042877A JP3730073B2 (en) | 2000-02-21 | 2000-02-21 | Template creation method, apparatus, and recording medium recording template creation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001236467A JP2001236467A (en) | 2001-08-31 |
JP3730073B2 true JP3730073B2 (en) | 2005-12-21 |
Family
ID=18565889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000042877A Expired - Fee Related JP3730073B2 (en) | 2000-02-21 | 2000-02-21 | Template creation method, apparatus, and recording medium recording template creation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3730073B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4788106B2 (en) * | 2004-04-12 | 2011-10-05 | 富士ゼロックス株式会社 | Image dictionary creation device, encoding device, image dictionary creation method and program thereof |
JP4645058B2 (en) * | 2004-04-12 | 2011-03-09 | 富士ゼロックス株式会社 | Image dictionary creation device, encoding device, image dictionary creation method and program thereof |
JP5082512B2 (en) * | 2007-03-08 | 2012-11-28 | 富士ゼロックス株式会社 | Information processing apparatus, image processing apparatus, image encoding apparatus, information processing program, image processing program, and image encoding program |
JP5381166B2 (en) * | 2009-03-04 | 2014-01-08 | オムロン株式会社 | Model image acquisition support apparatus, model image acquisition support method, and model image acquisition support program |
US8285057B2 (en) * | 2010-05-14 | 2012-10-09 | Palo Alto Research Center Incorporated | Learning image anchor templates for document classification |
-
2000
- 2000-02-21 JP JP2000042877A patent/JP3730073B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001236467A (en) | 2001-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7031519B2 (en) | Orthogonal technology for character recognition | |
US6778703B1 (en) | Form recognition using reference areas | |
US7650035B2 (en) | Optical character recognition based on shape clustering and multiple optical character recognition processes | |
US6834121B2 (en) | Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof | |
JPH0863546A (en) | Information extracting method, method and system for recovering picture | |
JP2000293626A (en) | Method and device for recognizing character and storage medium | |
JP4280355B2 (en) | Character recognition device | |
JPWO2017141802A1 (en) | Image processing apparatus, character recognition apparatus, image processing method, and program recording medium | |
CA2601144C (en) | Method and system for adaptive recognition of distorted text in computer images | |
US6941030B2 (en) | Character-recognition pre-processing apparatus and method, and program recording medium | |
JP2000285190A (en) | Method and device for identifying slip and storage medium | |
JP3730073B2 (en) | Template creation method, apparatus, and recording medium recording template creation program | |
JP2008226030A (en) | Word recognition method and program | |
JP3090070B2 (en) | Form identification method and device | |
JP4116688B2 (en) | Dictionary learning method and character recognition device | |
JP3930466B2 (en) | Character recognition device, character recognition program | |
JPH08287188A (en) | Character string recognition device | |
JP4633271B2 (en) | Dictionary learning method and dictionary learning program | |
JP2003115028A (en) | Method for automatically generating document identification dictionary and document processing system | |
JP2993533B2 (en) | Information processing device and character recognition device | |
CN116311264A (en) | Character recognition method based on character outline | |
JP2002074262A (en) | Method for correcting recognition character | |
JP2002207960A (en) | Method and program for recognized character correction | |
JP4633246B2 (en) | Recognized character correction method and computer-readable recording medium recording a recognized character correction program | |
JPH11184962A (en) | Optical character reader, collation correction method and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20041108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050322 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050322 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050928 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051005 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091014 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101014 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |