JPH06259565A - System for preparing pattern recognition dictonary - Google Patents

System for preparing pattern recognition dictonary

Info

Publication number
JPH06259565A
JPH06259565A JP5075072A JP7507293A JPH06259565A JP H06259565 A JPH06259565 A JP H06259565A JP 5075072 A JP5075072 A JP 5075072A JP 7507293 A JP7507293 A JP 7507293A JP H06259565 A JPH06259565 A JP H06259565A
Authority
JP
Japan
Prior art keywords
pattern
reference vector
vector
category
pattern recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5075072A
Other languages
Japanese (ja)
Inventor
Hiroshi Idemoto
浩 出本
Hiromi Kida
博巳 木田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP5075072A priority Critical patent/JPH06259565A/en
Publication of JPH06259565A publication Critical patent/JPH06259565A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide a system for reconstituting a pattern recognition dictionary having a high recognition ratio. CONSTITUTION:An error pattern sorting part 5 sorts a learning pattern read out in error into a pair of a correct side category group and a misread category group. A reference vector preparing part 6 finds out, the mean vector of patterns in each group and newly prepares a reference vecotor for providing a vector element close to a correct category side reference vector with the feature value of the correct category reference vector and providing a vector element close to a misread category side reference vector with hte veature value of the mean vector. The reference vector expresses the specific deformation of each misread learning pattern. Thereby a reference vector adding part 7 adds the reference vector to an existing pattern recognition dictionary.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字パターンや音声パ
ターン等のパターン認識用の辞書作成システムに関し、
特に、既存のパターン認識用の辞書(パターン認識辞
書)を再構築して高精度化するために利用されるパター
ン認識辞書作成システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dictionary creation system for pattern recognition of character patterns, voice patterns, etc.
In particular, the present invention relates to a pattern recognition dictionary creation system used to reconstruct an existing pattern recognition dictionary (pattern recognition dictionary) to improve accuracy.

【0002】[0002]

【従来の技術】文字や図形あるいは音声を、例えば各種
の制御や処理のための情報としてコンピュータに入力す
る場合、これら文字などを機械的に認識させる必要があ
る。このため、一般的には、文字等を例えば複数の特徴
値の列からなるベクトル(以下「特徴ベクトル」とい
う。)によって表現してパターン化し、これら文字パタ
ーン等の入力パターンに基づくパターン認識により、入
力された文字等を判別する手法が採られている。
2. Description of the Related Art When a character, a figure, or a voice is input to a computer as information for various kinds of control or processing, it is necessary to mechanically recognize the character or the like. Therefore, in general, a character or the like is expressed by a vector (hereinafter referred to as “feature vector”) composed of a sequence of a plurality of feature values to be patterned, and pattern recognition based on an input pattern such as the character pattern is performed. A method of discriminating input characters and the like is adopted.

【0003】上記のようなパターン認識においては、予
め各カテゴリ(例えば文字パターン認識の場合には文字
種類)の標準的なパターンを参照ベクトルとしてパター
ン認識辞書に用意しておく。そして、認識させたい入力
パターンとパターン認識辞書における各カテゴリの参照
ベクトルとの類似性を所定の評価関数を用いて計算し、
この計算結果に基いて、最も類似性の高いカテゴリを入
力パターンの認識結果として出力する。
In the above pattern recognition, standard patterns of each category (for example, character type in the case of character pattern recognition) are prepared in the pattern recognition dictionary as reference vectors. Then, the similarity between the input pattern to be recognized and the reference vector of each category in the pattern recognition dictionary is calculated using a predetermined evaluation function,
Based on this calculation result, the category with the highest similarity is output as the recognition result of the input pattern.

【0004】また、文字や図形あるいは音声は、同じカ
テゴリーでも種々の態様があるため、上記の参照ベクト
ルを作成する場合には、まずカテゴリごとにいくつかの
異なるパターンの平均を計算し、これをパターン認識辞
書に用意する。そして、文字認識等に携わる作業者ある
いは所謂エキスパートシステムによる学習等によって、
このパターン認識辞書を再構成して高精度化し、パター
ン認識辞書による入力パターンの認識率を高めている。
このようなパターン認識辞書を再構成するための技術と
して、従来、以下に挙げるような方法が提案されてい
る。
Further, since there are various modes of characters, figures, or voices even in the same category, when creating the above reference vector, first, the average of several different patterns is calculated for each category, and this is calculated. Prepare in the pattern recognition dictionary. And by learning by a worker involved in character recognition or so-called expert system,
This pattern recognition dictionary is reconfigured to improve accuracy and the recognition rate of input patterns by the pattern recognition dictionary is increased.
As a technique for reconstructing such a pattern recognition dictionary, conventionally, the following methods have been proposed.

【0005】(1)第一の方法では、既存のパターン認
識辞書により学習用の入力パターン(以下「学習パター
ン」という。)を認識させる。そして、入力パターンの
誤読(誤認識)が最小になるように参照ベクトルの位置
を最適化する処理を繰り返し行うことで、パターン認識
辞書を再構成する。参照ベクトルの最適化の方法として
は、例えば、LSIのレイアウト設計などで適用されて
いるシミュレーティドアニーリング法を採用したものが
提案されている(松永、阿部、木田:“シミュレーテッ
ドアニーリング法を用いた文字認識辞書の最適化”、信
学技法、PRU90−39(1990))。
(1) In the first method, an input pattern for learning (hereinafter referred to as "learning pattern") is recognized by an existing pattern recognition dictionary. Then, the pattern recognition dictionary is reconstructed by repeatedly performing the process of optimizing the position of the reference vector so that the misreading (misrecognition) of the input pattern is minimized. As a method for optimizing the reference vector, for example, a method adopting a simulated annealing method applied in LSI layout design or the like has been proposed (Matsunaga, Abe, Kida: “The simulated annealing method is used. Optimized character recognition dictionary ", IEEJ, PRU90-39 (1990)).

【0006】(2)第二の方法は、既存のパターン認識
辞書で学習パターンを認識させる点は上記方法と同じで
あるが、正しく認識できなかった入力パターンをそのま
ま対応するカテゴリの参照ベクトルとしてパターン認識
辞書に新規追加することで、パターン認識辞書を再構成
する。
(2) The second method is the same as the above method in that the learning pattern is recognized by the existing pattern recognition dictionary, but the input pattern that cannot be correctly recognized is used as the reference vector of the corresponding category. The pattern recognition dictionary is reconstructed by newly adding it to the recognition dictionary.

【0007】(3)第三の方法は、上記第二の方法に類
似するが、パターン認識辞書のサイズをできる限り小さ
くするため、誤読された入力パターン1つに対して1つ
の参照ベクトルをパターン認識辞書に設けるのではな
く、誤読された複数の入力パターンの平均を対応するカ
テゴリの参照ベクトルとしてパターン認識辞書に追加す
る(井出、若原:“文字認識におけるサブカテゴリ生成
法の一検討”、1990年電子情報通信学会秋季全国大
会論文集、D−348、p.6−350(199
0))。
(3) The third method is similar to the above second method, but one reference vector is added to one misread input pattern in order to reduce the size of the pattern recognition dictionary as much as possible. Instead of providing it in the recognition dictionary, the average of multiple misread input patterns is added to the pattern recognition dictionary as a reference vector of the corresponding category (Ide, Wakahara: "A Study of Subcategory Generation Method for Character Recognition", 1990). IEICE Autumn National Conference Proceedings, D-348, p. 6-350 (199)
0)).

【0008】[0008]

【発明が解決しようとする課題】しかしながら、上記従
来技術には、以下のような解決すべき課題があった。
However, the above-mentioned prior art has the following problems to be solved.

【0009】まず、第一の方法は、カテゴリ間のパター
ン分布の違いを考慮して認識精度が高くなるようにパタ
ーン認識辞書を最適化するという点では優れている。し
かし、パターン分布が複雑でカテゴリ間でパターン分布
が入り組み合っている場合、あるいはパターン分布が連
続でなく分離(分散)している場合には、1つの参照ベ
クトルでは対処できない。このため、このようなパター
ンの場合には、パターン認識辞書の精度向上が図り難
く、逆に認識精度の低下を招いてしまう。
First, the first method is excellent in that the pattern recognition dictionary is optimized so that the recognition accuracy becomes high in consideration of the difference in pattern distribution between categories. However, when the pattern distributions are complicated and the pattern distributions are intermingled between the categories, or when the pattern distributions are not continuous but separated (dispersed), one reference vector cannot handle it. Therefore, in the case of such a pattern, it is difficult to improve the accuracy of the pattern recognition dictionary, and conversely the recognition accuracy is deteriorated.

【0010】また、第二の方法では、カテゴリごとに複
数の参照ベクトルを持たせることができるため、第一の
方法による問題点を解決することができる。しかし、こ
の方法では、作られた参照ベクトルが学習時の入力パタ
ーンそのものに対応したものであるため、当該カテゴリ
のパターン認識用としての汎用性に乏しい。また、学習
パターンを参照ベクトルとするため、その学習パターン
が他のカテゴリにも類似している場合には、入力パター
ンを当該他のカテゴリのパターンと誤読する虞がある。
Further, in the second method, since a plurality of reference vectors can be provided for each category, the problem of the first method can be solved. However, in this method, since the created reference vector corresponds to the input pattern itself at the time of learning, the versatility for pattern recognition of the category is poor. Further, since the learning pattern is used as the reference vector, if the learning pattern is similar to other categories, the input pattern may be misread as a pattern of the other category.

【0011】更に第三の方法では、複数のパターンの平
均を参照ベクトルとすることで、パターン認識に際して
の汎用性確保ができる。しかし、この方法では、学習時
に誤読された入力パターンが少数の場合に、参照ベクト
ルにおける汎用性確保が難しく、誤読される入力パター
ンが多数無ければ効果が出ないという欠点がある。
Further, in the third method, by using the average of a plurality of patterns as the reference vector, it is possible to ensure versatility in pattern recognition. However, this method has a drawback that it is difficult to secure versatility in the reference vector when the number of input patterns that are misread during learning is small, and the effect is not obtained unless there are many input patterns that are misread.

【0012】本発明は、上記課題に鑑みてなされたもの
で、その目的とするところは、学習時において誤読され
る入力パターンが少数の場合でも汎用性が高い参照ベク
トルが作成でき、認識率の高いパターン認識辞書を効率
良く作成できる、パターン認識辞書作成システムを提供
することにある。
The present invention has been made in view of the above problems, and an object thereof is to make it possible to create a highly versatile reference vector even when the number of input patterns that are misread during learning is small, and to improve the recognition rate. It is to provide a pattern recognition dictionary creating system that can efficiently create a high pattern recognition dictionary.

【0013】[0013]

【課題を解決するための手段】上記目的を達成する本発
明のパターン認識辞書作成システムは、入力パターンの
認識時に照合される参照ベクトルの集合からなる既存の
パターン認識辞書を再構成するシステムであって、前記
パターン認識辞書を初期辞書として設定する辞書設定手
段と、前記入力パターンから特徴抽出を行う特徴抽出手
段と、前記初期辞書を用いて前記入力パターンの特徴ベ
クトルのカテゴリを認識するパターン認識手段と、この
パターン認識手段で認識された入力パターンから誤読さ
れたものを抽出するパターン抽出手段と、抽出された誤
読入力パターンを正解側カテゴリと誤読先カテゴリの組
合わせ毎に分類してグループ化する分類手段と、各グル
ープ毎に異なる値に基づく新たな参照ベクトルを作成す
る参照ベクトル作成手段と、この新たに作成された参照
ベクトルを前記パターン認識辞書に追加する参照ベクト
ル追加手段と、を有し、誤読パターン特有の変形を表現
する参照ベクトルを作成して汎化能力の高いパターン認
識辞書を得る構成とした。
The pattern recognition dictionary creating system of the present invention for achieving the above object is a system for reconstructing an existing pattern recognition dictionary composed of a set of reference vectors to be collated at the time of recognition of an input pattern. A dictionary setting means for setting the pattern recognition dictionary as an initial dictionary, a feature extracting means for extracting a feature from the input pattern, and a pattern recognizing means for recognizing a category of a feature vector of the input pattern using the initial dictionary. And a pattern extracting means for extracting misreads from the input patterns recognized by the pattern recognition means, and the extracted misreading input patterns are classified and grouped for each combination of the correct answer side category and the misreading destination category. Reference vector creation that creates new reference vectors based on different values for each group and each classification means Pattern recognition with a high generalization ability by creating a reference vector expressing a modification peculiar to a misreading pattern, and having a means and a reference vector adding means for adding the newly created reference vector to the pattern recognition dictionary. It was configured to get a dictionary.

【0014】上記構成において、参照ベクトル作成手段
は、同一グループに含まれる入力パターン群の各特徴値
の平均値列からなる平均ベクトルを求め、この平均ベク
トルが正解側カテゴリ参照ベクトル及び誤読先カテゴリ
参照ベクトルのいずれに近いかを特徴値毎に判定すると
共に、誤読先カテゴリに近い特徴値については前記平均
値、それ以外については正解側カテゴリ参照ベクトルの
特徴値を夫々採用して参照ベクトルを作成するベクトル
判定手段を含んでなる。
In the above structure, the reference vector creating means obtains an average vector consisting of an average value sequence of each feature value of the input pattern groups included in the same group, and the average vector is the correct category reference vector and the misread category reference. It is determined which of the vectors is closer to each feature value, and the reference value is created by adopting the average value for the feature values close to the misread category and the feature values of the correct category reference vector for the other values. It comprises vector decision means.

【0015】[0015]

【作用】上記構成である本発明のパターン認識辞書作成
システムでは、まず、誤読された入力パターンを正解側
カテゴリと誤読先カテゴリの組合わせでグループ化する
ことで、類似した誤読傾向を持つもの同士を集める。そ
して、同じグループに含まれる入力パターンから得られ
た平均ベクトルにおいて、正解側カテゴリの参照ベクト
ルに近い特徴値は正解側カテゴリ参照ベクトルの値を、
一方、誤読先カテゴリの参照ベクトルに近い特徴値は該
平均ベクトルの平均値を夫々採用することで、誤読され
た入力パターンに共通した変形のみが異なって表現され
た汎用性の高い参照ベクトルが作成される。この新たに
作成される参照ベクトルは、誤読される入力パターンが
少数の場合でも有効であるため、この参照ベクトルをパ
ターン認識辞書に追加することで、パターン認識辞書に
おける認識率が向上する。
In the pattern recognition dictionary creating system of the present invention having the above-described structure, first, misread input patterns are grouped by the combination of the correct answer side category and the misread destination category, so that those having similar misreading tendencies are grouped. Collect. Then, in the average vector obtained from the input patterns included in the same group, the feature value close to the reference vector of the correct category is the value of the correct category reference vector,
On the other hand, for the feature values close to the reference vector of the misreading destination category, by adopting the average value of the average vector, respectively, a highly versatile reference vector is created in which only the common deformation of the misreading input patterns is expressed differently. To be done. Since this newly created reference vector is effective even if the number of misread input patterns is small, adding this reference vector to the pattern recognition dictionary improves the recognition rate in the pattern recognition dictionary.

【0016】[0016]

【実施例】以下、本発明の実施例を図面を参照して説明
する。
Embodiments of the present invention will be described below with reference to the drawings.

【0017】図1は、本発明の一実施例に係るパターン
認識用辞書作成システムのブロック構成図である。図
中、実線の矢印は、このシステムにおける処理の流れを
示し、破線の矢印は、データの流れを示している。
FIG. 1 is a block diagram of a pattern recognition dictionary creating system according to an embodiment of the present invention. In the figure, solid arrows indicate the flow of processing in this system, and broken arrows indicate the flow of data.

【0018】図1を参照すると、本実施例のパターン認
識辞書作成システムは、初期辞書設定部1、特徴抽出部
2、パターン認識部3、エラーパターン抽出部4、エラ
ーパターン分類部5、参照ベクトル作成部6、参照ベク
トル追加部7、並びに認識辞書記憶部8から構成され
る。
Referring to FIG. 1, the pattern recognition dictionary creating system according to the present embodiment has an initial dictionary setting unit 1, a feature extraction unit 2, a pattern recognition unit 3, an error pattern extraction unit 4, an error pattern classification unit 5, and a reference vector. It includes a creation unit 6, a reference vector addition unit 7, and a recognition dictionary storage unit 8.

【0019】初期辞書設定部1は、既存のパターン認識
辞書を初期辞書として設定する(辞書設定手段)。この
パターン認識辞書には、各カテゴリ毎の標準的なパター
ンが参照ベクトルとして夫々用意されている。特徴抽出
部2は、入力された学習パターンの特徴抽出を行う(特
徴抽出手段)。この抽出処理は、例えばパターン認識対
象が文字の場合には、スキャナや文字切出し装置等の読
取り手段によって学習対象となる文字ないし文字列を文
字単位に2値化して入力し、これら入力された文字を複
数のベクトル要素たる特徴値の配列からなる特徴ベクト
ルで表現して学習パターンとすることで行われる。
The initial dictionary setting unit 1 sets an existing pattern recognition dictionary as an initial dictionary (dictionary setting means). In this pattern recognition dictionary, standard patterns for each category are prepared as reference vectors. The feature extraction unit 2 performs feature extraction of the input learning pattern (feature extraction means). In the extraction process, for example, when the pattern recognition target is a character, a character or a character string to be learned is binarized and input by a reading unit such as a scanner or a character slicing device, and these input characters are input. Is represented by a feature vector composed of an array of feature values, which is a plurality of vector elements, and is used as a learning pattern.

【0020】パターン認識部3では、初期辞書設定部1
に設定された初期辞書を用いて学習パターンを認識する
(パターン認識手段)。この認識処理は、初期辞書から
取出した参照ベクトルと学習パターンの特徴ベクトル
を、これらベクトルを構成する特徴値の配列等を照合し
て配列等の類似度の高いものを求めることにより行わ
れ、これにより学習パターンの特定のカテゴリが認識さ
れる。エラ−パターン抽出部4は、パターン認識部3に
おいて正しく認識されずに誤読された学習パターンを抽
出する(パターン抽出手段)。このような抽出処理は、
従来と同様に、例えば文字認識等に携わる作業者により
行われる。
In the pattern recognition unit 3, the initial dictionary setting unit 1
The learning pattern is recognized using the initial dictionary set to (pattern recognition means). This recognition processing is performed by comparing the reference vector extracted from the initial dictionary and the feature vector of the learning pattern with the array of feature values forming these vectors to obtain the one with a high degree of similarity. Recognizes a particular category of learning patterns. The error pattern extraction unit 4 extracts a learning pattern that was misread by the pattern recognition unit 3 without being correctly recognized (pattern extraction means). Such an extraction process
Similar to the conventional method, it is performed by an operator who is involved in character recognition, for example.

【0021】エラーパターン分類部5は、上記抽出され
た誤読の学習パターンを、正しいカテゴリである正解側
カテゴリと、誤読されたカテゴリである誤読先カテゴリ
との組合わせ毎に分類してグループ化する(分類手
段)。参照ベクトル作成部6は、これら分類されたグル
ープ毎に、参照ベクトルを作成する(参照ベクトル作成
手段)。この参照ベクトルについては後述する。この新
たに作成された参照ベクトルは、参照ベクトル追加部7
から認識辞書記憶部8に送出され、認識辞書記憶部8に
おいて初期辞書に追加される(参照ベクトル追加手
段)。
The error pattern classifying unit 5 classifies the extracted misreading learning patterns into groups by classifying them into combinations of correct categories, which are correct categories, and misreading destination categories, which are misreading categories. (Classification means). The reference vector creation unit 6 creates a reference vector for each of these classified groups (reference vector creation means). This reference vector will be described later. This newly created reference vector is used by the reference vector adding unit 7
From the recognition dictionary storage unit 8 and is added to the initial dictionary in the recognition dictionary storage unit 8 (reference vector adding means).

【0022】次に、本実施例によるパターン認識辞書の
再構成作業の処理手順を具体的に説明する。図2は上記
処理手順を示すフローチャートであり、Sは各ステップ
を表す。図2を参照すると、まず、初期辞書設定部1で
初期辞書を認識辞書記憶部8に記憶する(S101)。
次いで、特徴抽出部2で学習パターンの特徴抽出を行い
(S102)、パターン認識部3で初期辞書による学習
パターンの認識を行う(S103)。エラーパターン抽
出部4では、上記認識された学習パターンから誤読され
たパターンを抽出し(S104)、次いでエラーパター
ン分類部5において、これら誤読された学習パターンが
正解側カテゴリと誤読先カテゴリとのペアからなる複数
のグループGe(e=1、2、・・・E)に分類する
(S105)。この処理により、例えば、G1 は「亜」
の学習パターンのうち「王」に誤読された学習パターン
のグループ、G2 は「東」の学習パターンのうち「束」
に誤読された学習パターンのグループとなる。
Next, the processing procedure of the reconstruction work of the pattern recognition dictionary according to this embodiment will be concretely described. FIG. 2 is a flowchart showing the above processing procedure, and S represents each step. Referring to FIG. 2, first, the initial dictionary setting unit 1 stores the initial dictionary in the recognition dictionary storage unit 8 (S101).
Next, the feature extraction unit 2 extracts the features of the learning pattern (S102), and the pattern recognition unit 3 recognizes the learning pattern using the initial dictionary (S103). The error pattern extracting unit 4 extracts misread patterns from the recognized learning patterns (S104), and then the error pattern classifying unit 5 extracts the misread learning patterns from the correct answer side category and the misread destination category. Are grouped into a plurality of groups Ge (e = 1, 2, ... E) (S105). By this processing, for example, G1 is "A"
Group of learning patterns misread by "King" among the learning patterns of G, and G2 is "bunch" among the learning patterns of "East"
It becomes a group of learning patterns misread by.

【0023】上記分類されたグループは、参照ベクトル
作成部6においてグループGe 毎に平均ベクトルm
Ge(i)(i=1、…、n)が作成される(S10
7)。次いで参照ベクトル作成部6において、この作成
された平均ベクトルが、正解側カテゴリ(例えばグルー
プG1 であれば「亜」)の参照ベクトルと誤読先カテゴ
リ(同・「王」)の参照ベクトルとのいずれに近いか
を、ベクトル要素、即ち特徴値毎に判定する(S10
8)。
The above-mentioned classified groups are average vectors m for each group Ge in the reference vector creating section 6.
Ge (i) (i = 1, ..., N) is created (S10).
7). Next, in the reference vector creating unit 6, the created average vector is either the reference vector of the correct answer side category (for example, “A” in the case of group G1) or the reference vector of the misreading destination category (the same, “King”). Is determined for each vector element, that is, for each feature value (S10).
8).

【0024】この判定の結果、誤読先カテゴリに近い特
徴値については上記作成された平均ベクトルmGe(i)
(i=1、…、n)の平均値が(S109)、それ以外
の正解カテゴリに近い特徴値については正解側カテゴリ
の参照ベクトルmc (i)(i=1、…、n)の特徴値
が(S110)、夫々採用される。この処理を全ての特
徴値について行なうことで(S111)、グループGe
の新たな参照ベクトルm´Ge(i)(i=1、…、n)
を作成する。こうして作成した新たな参照ベクトルm´
Ge(i)(i=1、…、n)を、参照ベクトル追加部7
により初期辞書に追加し(S112)、認識記憶部8に
記憶する。この工程を全てのグループG1 、G2 、…、
GE について行う(S106)。
As a result of this determination, for the feature value close to the misread category, the average vector m Ge (i) created above is used.
The average value of (i = 1, ..., N) is (S109), and for the feature values close to the correct category other than that, the feature value of the reference vector mc (i) (i = 1, ..., N) of the correct category. (S110) are adopted respectively. By performing this process for all feature values (S111), the group Ge
New reference vector m ′ Ge (i) (i = 1, ..., N)
To create. The new reference vector m'created in this way
Ge (i) (i = 1, ..., N) is added to the reference vector adding unit 7
Is added to the initial dictionary (S112) and stored in the recognition storage unit 8. This process is applied to all groups G1, G2, ...
GE is performed (S106).

【0025】このようにすれば、夫々の学習パターン特
有の変形を表現する新たな参照ベクトルが逐次パターン
認識辞書に追加され、パターン分布がカテゴリ間で入り
組み合っている場合や、連続でなく分離している場合の
認識精度の低下が抑制される。また、汎化能力も高ま
り、他カテゴリのパターンを引き込むことも無くなる。
しかも、学習の際に誤読される入力パターンが少数でも
汎用性が高い参照ベクトルが作成できることから、認識
率の高いパターン認識辞書を効率よく作成できる。 な
お、本発明はこの実施例に拘束されるものではなく、そ
の要旨を逸脱しない範囲で図1の構成あるいは図2の処
理手順の変更が可能である。
In this way, new reference vectors expressing transformations peculiar to the respective learning patterns are sequentially added to the pattern recognition dictionary, and when pattern distributions are intermixed between categories or when they are not continuous but separated. In this case, the deterioration of the recognition accuracy is suppressed. In addition, generalization ability is improved, and it is not necessary to draw in patterns of other categories.
Moreover, since a reference vector having high versatility can be created even if the number of input patterns misread during learning is small, it is possible to efficiently create a pattern recognition dictionary having a high recognition rate. The present invention is not limited to this embodiment, and the configuration of FIG. 1 or the processing procedure of FIG. 2 can be changed without departing from the scope of the invention.

【0026】[0026]

【発明の効果】以上詳細に説明したように、本発明のパ
ターン認識辞書作成システムでは、正解側と誤読先のペ
アにて誤読の学習パターンをグループ化するとともに、
各グループに含まれるパターン群について、特徴値の平
均値の列からなる平均ベクトルを求め、該平均ベクトル
が正解カテゴリ参照ベクトル及び誤読先カテゴリ参照ベ
クトルのいずれかに近いかを特徴値毎に判定し、誤読先
に近いベクトル要素については該平均値、それ以外につ
いては正解側カテゴリ参照ベクトルの特徴値を採用して
新たな参照ベクトルを形成し、この新たな参照ベクトル
を既存のパターン認識辞書に追加するようにしたので、
夫々のエラー学習パターン特有の変形を表現する参照ベ
クトルを形成することが可能となり、汎化能力の高い認
識辞書が得られる。
As described in detail above, in the pattern recognition dictionary creation system of the present invention, the misreading learning patterns are grouped by the correct answer side and the misreading destination pair, and
For the pattern groups included in each group, an average vector composed of a column of average values of feature values is obtained, and it is determined for each feature value whether the average vector is closer to the correct category reference vector or the misread category reference vector. , The average value for the vector element close to the misreading destination, and the feature value of the correct category reference vector for the other cases to form a new reference vector, and add this new reference vector to the existing pattern recognition dictionary. I decided to do so,
It becomes possible to form a reference vector that represents a transformation peculiar to each error learning pattern, and a recognition dictionary with high generalization ability can be obtained.

【0027】また、学習の際に誤読される入力パターン
が少数でも汎用性が高い参照ベクトルが作成できること
から、認識率の高いパターン認識辞書を効率よく作成で
き、既存のパターン認識辞書の高精度化のためのパター
ン認識辞書の再構成が効率良く行える。
Since a reference vector having high versatility can be created even if the number of input patterns misread during learning is small, it is possible to efficiently create a pattern recognition dictionary with a high recognition rate and improve the accuracy of the existing pattern recognition dictionary. The pattern recognition dictionary for can be efficiently reconstructed.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係るパターン認識辞書作成
システムの要部構成図。
FIG. 1 is a configuration diagram of main parts of a pattern recognition dictionary creating system according to an embodiment of the present invention.

【図2】この実施例におけるパターン認識辞書作成の処
理手順を示すフローチャート。
FIG. 2 is a flowchart showing a processing procedure for creating a pattern recognition dictionary in this embodiment.

【符号の説明】[Explanation of symbols]

1 初期辞書設定部(辞書設定手段) 2 特徴抽出部(特徴抽出手段) 3 パターン認識部(パターン認識手段) 4 エラーパターン抽出部(パターン抽出手段) 5 エラーパターン分類部(分類手段) 6 参照ベクトル作成部(参照ベクトル作成手段) 7 参照ベクトル追加部(参照ベクトル追加手段) 8 認識辞書記憶部 1 initial dictionary setting unit (dictionary setting unit) 2 feature extraction unit (feature extraction unit) 3 pattern recognition unit (pattern recognition unit) 4 error pattern extraction unit (pattern extraction unit) 5 error pattern classification unit (classification unit) 6 reference vector Creation unit (reference vector creation unit) 7 Reference vector addition unit (reference vector addition unit) 8 Recognition dictionary storage unit

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 入力パターンの認識時に照合される参照
ベクトルの集合からなる既存のパターン認識辞書を再構
成するシステムであって、前記パターン認識辞書を初期
辞書として設定する辞書設定手段と、前記入力パターン
から特徴抽出を行う特徴抽出手段と、前記初期辞書を用
いて前記入力パターンの特徴ベクトルのカテゴリを認識
するパターン認識手段と、このパターン認識手段で認識
された入力パターンから誤読されたものを抽出するパタ
ーン抽出手段と、抽出された誤読入力パターンを正解側
カテゴリと誤読先カテゴリの組合わせ毎に分類してグル
ープ化する分類手段と、各グループ毎に異なる値に基づ
く新たな参照ベクトルを作成する参照ベクトル作成手段
と、この新たに作成された参照ベクトルを前記パターン
認識辞書に追加する参照ベクトル追加手段と、を有する
ことを特徴とするパターン認識辞書作成システム。
1. A system for reconstructing an existing pattern recognition dictionary composed of a set of reference vectors to be collated at the time of recognizing an input pattern, the dictionary setting means for setting the pattern recognition dictionary as an initial dictionary, and the input. Feature extraction means for performing feature extraction from a pattern, pattern recognition means for recognizing the category of the feature vector of the input pattern using the initial dictionary, and extraction of misreads from the input patterns recognized by the pattern recognition means Pattern extracting means, classifying means for classifying the extracted misreading input patterns for each combination of the correct answer side category and the misreading destination category, and creating a new reference vector based on a different value for each group Reference vector creating means and the newly created reference vector are added to the pattern recognition dictionary. A pattern recognition dictionary creating system comprising: a reference vector adding means.
【請求項2】 前記参照ベクトル作成手段は、同一グル
ープに含まれる入力パターン群の各特徴値の平均値列か
らなる平均ベクトルを求め、この平均ベクトルが正解側
カテゴリ参照ベクトル及び誤読先カテゴリ参照ベクトル
のいずれに近いかを前記特徴値毎に判定すると共に、誤
読先カテゴリに近い特徴値については前記平均値、それ
以外については正解側カテゴリ参照ベクトルの特徴値を
夫々採用して参照ベクトルを作成するベクトル判定手段
を含んでなることを特徴とする請求項1記載のパターン
認識辞書作成システム。
2. The reference vector creating means obtains an average vector consisting of an average value sequence of respective feature values of input pattern groups included in the same group, and the average vector is the correct category reference vector and the misread category reference vector. Which one is closer to each of the characteristic values is determined, and a reference vector is created by adopting the average value for the characteristic value close to the misreading destination category and the characteristic value of the correct category reference vector for other than that. The pattern recognition dictionary creating system according to claim 1, further comprising a vector determining means.
JP5075072A 1993-03-10 1993-03-10 System for preparing pattern recognition dictonary Pending JPH06259565A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5075072A JPH06259565A (en) 1993-03-10 1993-03-10 System for preparing pattern recognition dictonary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5075072A JPH06259565A (en) 1993-03-10 1993-03-10 System for preparing pattern recognition dictonary

Publications (1)

Publication Number Publication Date
JPH06259565A true JPH06259565A (en) 1994-09-16

Family

ID=13565626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5075072A Pending JPH06259565A (en) 1993-03-10 1993-03-10 System for preparing pattern recognition dictonary

Country Status (1)

Country Link
JP (1) JPH06259565A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000055811A1 (en) * 1999-03-12 2000-09-21 Sony Corporation Data processor, data processing method, and recorded medium
JP2013250809A (en) * 2012-05-31 2013-12-12 Casio Comput Co Ltd Multi-class discrimination device, method and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000055811A1 (en) * 1999-03-12 2000-09-21 Sony Corporation Data processor, data processing method, and recorded medium
US7697732B2 (en) 1999-03-12 2010-04-13 Sony Corporation Data processing apparatus, data processing method and recording medium
US7916977B2 (en) 1999-03-12 2011-03-29 Sony Corporation Data processing apparatus, data processing method and recording medium
JP2013250809A (en) * 2012-05-31 2013-12-12 Casio Comput Co Ltd Multi-class discrimination device, method and program

Similar Documents

Publication Publication Date Title
US7308378B2 (en) System and method for identifying an object
Senior A combination fingerprint classifier
US4989258A (en) Character recognition apparatus
US5267332A (en) Image recognition system
US6009199A (en) Classification technique using random decision forests
EP0784285B1 (en) Method, apparatus and computer program product for generating a classification tree
US5657396A (en) Method and apparatus for pattern recognition and validation, especially for hand-written signatures
US20050129313A1 (en) Efficient method and system for determining parameters in computerized recognition
Zois et al. A comprehensive study of sparse representation techniques for offline signature verification
US8326040B2 (en) Combiner for improving handwriting recognition
Du et al. Siamese convolutional neural networks for authorship verification
JP3634574B2 (en) Information processing method and apparatus
Rajnoha et al. Handwriting comenia script recognition with convolutional neural network
JPH10143613A (en) Pattern recognition method
JPH06259565A (en) System for preparing pattern recognition dictonary
JP3095069B2 (en) Character recognition device, learning method, and recording medium storing character recognition program
US6009194A (en) Methods, systems and computer program products for analyzing information in forms using cell adjacency relationships
US6466926B1 (en) Method for optimizing a recognition dictionary to distinguish between patterns that are difficult to distinguish
Henter et al. Classifier self-assessment: active learning and active noise correction for document classification
Mazumdar et al. Evolutionary-rough feature selection for face recognition
Thepade et al. Classification of fingerprint using kmcg algorithm
RU2251151C2 (en) Bitmap image analysis method
JPH06162265A (en) Image-recognition system
Amin Prototyping structural description using decision tree learning techniques
JPH0652537B2 (en) Pattern recognition method