JPH11134316A - Pattern recognition method and pattern recognition dictionary preparation method and device therefor - Google Patents

Pattern recognition method and pattern recognition dictionary preparation method and device therefor

Info

Publication number
JPH11134316A
JPH11134316A JP9297582A JP29758297A JPH11134316A JP H11134316 A JPH11134316 A JP H11134316A JP 9297582 A JP9297582 A JP 9297582A JP 29758297 A JP29758297 A JP 29758297A JP H11134316 A JPH11134316 A JP H11134316A
Authority
JP
Japan
Prior art keywords
pattern
category
recognition
dictionary
reject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9297582A
Other languages
Japanese (ja)
Inventor
Ei Sakano
鋭 坂野
Naoki Takegawa
直樹 武川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP9297582A priority Critical patent/JPH11134316A/en
Publication of JPH11134316A publication Critical patent/JPH11134316A/en
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a pattern recognition dictionary preparing device for effectively preparing a pattern recognition dictionary by easily detecting a range in which an error is likely to be generated at the time of pattern recognition. SOLUTION: A pattern converting part 23 converts a feature vector in which erroneous recognition is likely to be generated into an original pattern by using a genetic algorithm. When a belonging category can be specified, this original pattern is registered as a reference pattern, and obtained as a sample for deciding a category. When the belonging category of the original pattern can not be specified, this original pattern is registered as a reject pattern being the index of pattern reject at the time of recognition.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字や音声等のパ
ターン認識を行うパターン認識技術に係り、特に、パタ
ーン照合に用いるパターン認識辞書の作成手法に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a pattern recognition technique for recognizing patterns of characters, voices, and the like, and more particularly, to a technique for creating a pattern recognition dictionary used for pattern matching.

【0002】[0002]

【従来の技術】一般に、文字認識や音声認識等において
は、パターン認識対象となる文字や音声を複数のカテゴ
リに分割して各々の特徴を表すパターンベクトル(以
下、特徴ベクトル)を抽出し、この特徴ベクトルと、パ
ターン認識辞書内に用意した各カテゴリの特徴を代表す
る参照パターンベクトル(以下、参照ベクトル)との類
似性を何らかの評価関数、例えばユークリッド自乗距離
を用いて判定し、両ベクトルの距離が最も短くなるカテ
ゴリを認識結果として出力する。この場合、文字に対し
ては、例えば"あ"、"い"、"う"等のような1文字単位を
1つのカテゴリとし、音声に対しては、音声を構成する
音素や音韻等を1つのカテゴリとする。
2. Description of the Related Art Generally, in character recognition or voice recognition, a character or voice to be subjected to pattern recognition is divided into a plurality of categories to extract a pattern vector (hereinafter, feature vector) representing each feature. The similarity between the feature vector and a reference pattern vector (hereinafter, referred to as a reference vector) representing the characteristics of each category prepared in the pattern recognition dictionary is determined using some evaluation function, for example, a Euclidean square distance, and the distance between the two vectors is determined. Is output as a recognition result. In this case, for characters, one character unit such as "A", "I", "U", etc. is defined as one category, and for speech, phonemes, phonemes, etc. constituting speech are classified into one category. Category.

【0003】通常、参照ベクトルは、カテゴリ毎に存在
する複数のサンプルパターンの特徴を表すベクトル(サ
ンプルベクトル)の平均ベクトルとして与えられる。し
かし、数字や平仮名等の文字は、筆記者によって様々な
字体となり易く、また音声認識においても発声には個人
差があるので、これらに対応するためには、カテゴリ毎
に複数の参照ベクトルを集合させておく必要がある。
Normally, a reference vector is given as an average vector of vectors (sample vectors) representing characteristics of a plurality of sample patterns existing for each category. However, characters such as numbers and hiragana tend to have various fonts depending on the writer, and there are individual differences in vocalization in speech recognition.To cope with these, multiple reference vectors are set for each category. You need to keep it.

【0004】このように、カテゴリ毎に複数の参照ベク
トルの集合させたパターン認識辞書は、例えば学習ベク
トル量子化法(以下、LVQ)によって作成することが
できる。LVQについては、参考文献「T.Kohonen,G.Ba
rna,and R.Chirisley,"Statistical pattern with neur
al networks:Benchmarking studies.",Proceedings of
the IEEE International Conference on Neural Networ
ks,pp.I−61-68,1988」に詳しく紹介されているが、要
するに、複数の参照ベクトルを生成する際に、誤りを訂
正しながら学習を行うことでベクトル空間の最適化を図
る手法であり、以下のアルゴリズムから成る。 (1)学習に用いる全てのサンプルベクトル(学習ベク
トル)についてカテゴリ内クラスタリング処理等を行っ
て複数の参照ベクトルを生成し、これらの参照ベクトル
の集合を初期辞書とする。 (2)カテゴリが既知の1つの学習ベクトルに最も距離
の近い参照ベクトルを検出する。 (3)検出した参照ベクトルが上記学習ベクトルと異な
るカテゴリに属するものであった場合、つまり誤認識で
あった場合には、その参照ベクトルを学習ベクトルから
遠ざける。他方、検出した参照ベクトルが上記学習ベク
トルと同一カテゴリに属するものの場合は、これを該学
習ベクトルにより近付ける。上記処理を、誤認識が無く
なるか、あるいは所定の繰り返し回数に到達するまで繰
り返すことにより、初期辞書におけるベクトル空間の最
適化を図る。このように、LVQは、アルゴリズムが簡
単であるうえ、多くの場合に効果が期待できるので、こ
の種のパターン認識辞書の作成に良く使用されている。
As described above, a pattern recognition dictionary in which a plurality of reference vectors are collected for each category can be created by, for example, a learning vector quantization method (hereinafter, LVQ). Regarding LVQ, refer to the reference "T. Kohonen, G. Ba.
rna, and R.Chirisley, "Statistical pattern with neur
al networks: Benchmarking studies. ", Proceedings of
the IEEE International Conference on Neural Networ
ks, pp. I-61-68, 1988 ”, in short, a method of optimizing the vector space by performing learning while correcting errors when generating multiple reference vectors And consists of the following algorithm: (1) A plurality of reference vectors are generated by performing in-category clustering processing or the like on all sample vectors (learning vectors) used for learning, and a set of these reference vectors is used as an initial dictionary. (2) Detect a reference vector closest to one learning vector whose category is known. (3) If the detected reference vector belongs to a category different from the learning vector, that is, if the recognition vector is incorrectly recognized, the reference vector is moved away from the learning vector. On the other hand, if the detected reference vector belongs to the same category as the learning vector, the reference vector is brought closer to the learning vector. By optimizing the vector space in the initial dictionary, the above process is repeated until erroneous recognition is eliminated or a predetermined number of repetitions is reached. As described above, since the LVQ has a simple algorithm and can be expected to be effective in many cases, the LVQ is often used for creating this type of pattern recognition dictionary.

【0005】[0005]

【発明が解決しようとする課題】ところで、上記参照ベ
クトルは、一般には大量のデータから、統計的手法や上
記LVQを含む人工神経回路網的な手法により生成され
るが、そのためのデータ収集には非常に高いコストがか
かる。また、大量のデータを収集しても、パターン認識
装置を高性能化するために必要なデータが得られるとは
限らないため、辞書作成の効率化が図れないという問題
があった。
The above-mentioned reference vector is generally generated from a large amount of data by a statistical method or an artificial neural network method including the above-mentioned LVQ. Very high cost. Further, even if a large amount of data is collected, it is not always possible to obtain data necessary for improving the performance of the pattern recognition apparatus, so that there has been a problem that the efficiency of dictionary creation cannot be improved.

【0006】また、実際のパターン認識の際には、複数
のカテゴリの中間的な部分で人間にも判断がつかないパ
ターンが存在することが知られているが、これを現実的
に検出することは困難であった。そのため、認識対象パ
ターンをリジェクト(拒絶)するための明確な指標がな
く、パターン認識を精度良く行うことができないという
問題もあった。
In actual pattern recognition, it is known that there is a pattern which cannot be judged by humans in an intermediate part of a plurality of categories. Was difficult. Therefore, there is no clear index for rejecting (rejecting) the recognition target pattern, and there is a problem that pattern recognition cannot be performed with high accuracy.

【0007】本発明の課題は、かかる従来の問題を解消
し、パターン認識の精度を高めることができる、改良さ
れたパターン認識方法を提供することにある。本発明の
他の課題は、パターン認識の精度を高めることができる
パターン認識辞書を効率よく作成するパターン認識辞書
作成方法、この方法の実施に適したパターン認識辞書作
成装置、及び汎用コンピュータを用いてパターン認識辞
書を作成する場合に好適となる記録媒体を提供すること
にある。
SUMMARY OF THE INVENTION An object of the present invention is to provide an improved pattern recognition method which can solve such a conventional problem and improve the accuracy of pattern recognition. Another object of the present invention is to provide a pattern recognition dictionary creation method for efficiently creating a pattern recognition dictionary capable of improving the accuracy of pattern recognition, a pattern recognition dictionary creation apparatus suitable for implementing the method, and a general-purpose computer. An object of the present invention is to provide a recording medium suitable for creating a pattern recognition dictionary.

【0008】[0008]

【課題を解決するための手段】上記課題を解決する本発
明のパターン認識方法は、パターン認識の際に誤認識が
生じやすいサンプルパターンに遺伝的アルゴリズムを適
用してパターン照合に用いる参照パターンとパターンリ
ジェクトの指標となるリジェクトパターンのいずれかに
分類しておき、入力された認識対象パターンの特徴と前
記リジェクトパターンの特徴との一致度が所定値を越え
るときに当該認識対象パターンをリジェクトすることを
特徴とする。
A pattern recognition method according to the present invention which solves the above-mentioned problems includes a reference pattern and a pattern used for pattern matching by applying a genetic algorithm to a sample pattern in which misrecognition is likely to occur in pattern recognition. It is classified into any one of reject patterns serving as reject indicators, and rejecting the recognition target pattern when the degree of coincidence between the characteristics of the input recognition target pattern and the characteristics of the reject pattern exceeds a predetermined value. Features.

【0009】本発明の他のパターン認識方法は、パター
ン認識の際に誤認識が生じやすいパターンに遺伝的アル
ゴリズムを適用してパターン照合に用いる参照パターン
とパターンリジェクトの指標となるリジェクトパターン
のいずれかに分類しておき、入力された認識対象パター
ンに対して最も類似する参照パターンと二番目に類似す
る参照パターンとの特徴差または特徴比が所定値以下の
場合に前記リジェクトパターンと前記認識対象パターン
との一致度を検出し、検出値が所定値を越えるときに当
該認識対象パターンをリジェクトすることを特徴とす
る。なお、前記特徴差または特徴比が所定値を越え、且
つ前記検出値が所定値以下のときは所定数個の参照パタ
ーンを正解候補パターンとして特定するようにする。
According to another pattern recognition method of the present invention, a genetic algorithm is applied to a pattern in which misrecognition is likely to occur during pattern recognition, either a reference pattern used for pattern matching or a reject pattern serving as an index of pattern rejection. If the feature difference or the feature ratio between the reference pattern most similar to the input recognition target pattern and the second similar reference pattern is equal to or less than a predetermined value, the reject pattern and the recognition target pattern Is detected, and when the detected value exceeds a predetermined value, the recognition target pattern is rejected. When the feature difference or the feature ratio exceeds a predetermined value and the detected value is equal to or less than a predetermined value, a predetermined number of reference patterns are specified as correct candidate patterns.

【0010】上記他の課題を解決する本発明のパターン
認識辞書作成方法は、所属カテゴリが不明なサンプルパ
ターン(例えば、異なるカテゴリに所属する複数の参照
パターンに類似するパターン)を遺伝的アルゴリズムに
よって成長させる過程と、成長後のパターンの所属カテ
ゴリの有無を判定する過程と、所属カテゴリが特定でき
た場合は当該成長後のパターンをパターン照合に用いら
れる参照パターン、所属カテゴリが特定できない場合は
当該成長後のパターンをパターンリジェクトの指標とな
るリジェクトパターンとして分類する過程と、分類され
た各パターンの特徴データを辞書登録する過程とを含む
方法である。
[0010] In the pattern recognition dictionary creating method according to the present invention for solving the above-described other problems, a sample pattern whose affiliation category is unknown (for example, a pattern similar to a plurality of reference patterns belonging to different categories) is grown by a genetic algorithm. And the step of determining the presence or absence of a category belonging to the pattern after growth. If the belonging category can be identified, the pattern after growth is used as a reference pattern for pattern matching. This method includes a step of classifying a later pattern as a reject pattern serving as an index of pattern reject, and a step of dictionary-registering feature data of each classified pattern.

【0011】この場合、成長するパターンを視認可能な
原パターンに変換して操作者に提示し、該提示に基づく
操作者からの指示によって、パターンを分類するように
してもよい。例えば所属カテゴリが指定された場合は当
該原パターンをパターン照合に用いられる参照パターン
として分類し、所属カテゴリの決定が留保された場合は
当該原パターンをパターンリジェクトの指標となるリジ
ェクトパターンとして分類する。所属カテゴリの決定可
否は、前記遺伝的アルゴリズムを繰り返す度に行う。
In this case, the growing pattern may be converted into a visible original pattern and presented to the operator, and the pattern may be classified according to an instruction from the operator based on the presentation. For example, when the belonging category is designated, the original pattern is classified as a reference pattern used for pattern matching, and when the belonging category is not determined, the original pattern is classified as a reject pattern serving as an index of pattern rejection. The determination of the belonging category is performed each time the genetic algorithm is repeated.

【0012】上記他の課題を解決する本発明のパターン
認識辞書作成装置は、所属カテゴリが不明なサンプルパ
ターンを遺伝的アルゴリズムによって成長させるパター
ン変換手段と、前記成長後のパターンの所属カテゴリが
特定できるかどうかを判定するカテゴリ判定手段と、所
属カテゴリが特定できるパターンをパターン照合に用い
られる参照パターン、所属カテゴリが特定できないパタ
ーンをパターンリジェクトの指標となるリジェクトパタ
ーンとして分類し、各パターンの特徴データをそれぞれ
パターン認識辞書の所定領域に登録する手段と、を備え
て成る。
A pattern recognition dictionary creating apparatus according to the present invention for solving the above-mentioned other problems can provide a pattern conversion means for growing a sample pattern whose categorization is unknown by a genetic algorithm, and can specify the categorization of the pattern after the growth. Category determining means for determining whether or not a pattern whose belonging category can be specified is classified as a reference pattern used for pattern matching, and a pattern whose belonging category cannot be specified is classified as a reject pattern serving as an index of pattern rejection. Means for registering in a predetermined area of the pattern recognition dictionary.

【0013】上記他の課題を解決する本発明の記録媒体
は、辞書作成に用いるサンプルパターンを遺伝的アルゴ
リズムによって成長させる処理、成長後のパターンの所
属カテゴリの有無を判定する処理、所属カテゴリが特定
できた場合は当該成長後のパターンをパターン照合に用
いられる参照パターン、所属カテゴリが特定できない場
合は当該成長後のパターンをパターンリジェクトの指標
となるリジェクトパターンとして分類する処理、及び、
分類された各パターンの特徴データを辞書登録する処理
をコンピュータに実行させるプログラムを記録して成る
コンピュータ読み取り可能な記録媒体である。
According to another aspect of the present invention, there is provided a recording medium for growing a sample pattern used for creating a dictionary by a genetic algorithm, determining whether a category belongs to a pattern after growth, and specifying a belonging category. If successful, a process of classifying the pattern after growth as a reference pattern used for pattern matching, and if the belonging category cannot be specified, classifying the pattern after growth as a reject pattern serving as an index of pattern rejection; and
This is a computer-readable recording medium that records a program that causes a computer to execute a process of registering feature data of each classified pattern in a dictionary.

【0014】[0014]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。図1は、本発明が適用され
るパターン認識装置の構成図である。このパターン認識
装置1はコンピュータ装置によって実現されるもので、
コンピュータ装置が所定のプログラムを読み込んで実行
することにより形成される、パターン入力部10、前処
理部11、特徴抽出部12、照合部13、パターン認識
辞書14、パターン出力部15の機能ブロックを含んで
成る。
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a configuration diagram of a pattern recognition device to which the present invention is applied. This pattern recognition device 1 is realized by a computer device.
It includes functional blocks of a pattern input unit 10, a preprocessing unit 11, a feature extraction unit 12, a collation unit 13, a pattern recognition dictionary 14, and a pattern output unit 15, which are formed by a computer device reading and executing a predetermined program. Consists of

【0015】上記プログラムは、コンピュータ装置がア
クセス可能な内部記憶装置あるいは外部記憶装置に一体
に組み込まれて随時使用されるのが通常であるが、コン
ピュータ装置に所要の機能を付与できる形態であれば本
発明を実施することができるので、その記録形態は任意
であってよい。例えば、CD−ROM等の可搬性記録媒
体にコンピュータ読み取り可能な形態で記録され、使用
時に上記内部記憶装置あるいは外部記憶装置にインスト
ールされるものであってもよい。
The above program is usually incorporated as needed into an internal storage device or an external storage device accessible by the computer device, and is used as needed. Since the present invention can be implemented, the recording form may be arbitrary. For example, it may be recorded in a computer-readable form on a portable recording medium such as a CD-ROM, and may be installed in the internal storage device or the external storage device at the time of use.

【0016】パターン入力部10は、スキャナ等のイメ
ージ入力装置から認識対象となるパターンの入力(以
下、入力パターン)を受け付ける。前処理部11は、入
力パターンの雑音除去等の整形を行う。特徴抽出部12
は、入力パターンの特徴を表す特徴ベクトルを抽出す
る。照合部13は、特徴抽出部12で抽出された特徴ベ
クトルとパターン認識辞書14との照合を行い、照合結
果をパターン出力部15に出力する。パターン出力部1
5は、照合結果をディスプレイ等の出力装置に出力させ
る。
The pattern input unit 10 receives an input of a pattern to be recognized (hereinafter, an input pattern) from an image input device such as a scanner. The preprocessing unit 11 performs shaping such as noise removal of the input pattern. Feature extraction unit 12
Extracts a feature vector representing the feature of the input pattern. The matching unit 13 compares the feature vector extracted by the feature extracting unit 12 with the pattern recognition dictionary 14, and outputs a matching result to the pattern output unit 15. Pattern output unit 1
5 causes the collation result to be output to an output device such as a display.

【0017】パターン認識辞書14には、参照ベクトル
格納領域141とリジェクトパターンデータ格納領域1
42とが形成されている。参照ベクトル格納領域141
は、個々のカテゴリを代表する参照ベクトルを格納する
領域であり、リジェクトパターン格納領域142は、入
力パターンをリジェクトする際の指標となるリジェクト
パターンデータ(リジェクトパターンの特徴ベクトル、
以下同じ)を格納する領域である。
The pattern recognition dictionary 14 has a reference vector storage area 141 and a reject pattern data storage area 1.
42 are formed. Reference vector storage area 141
Is an area for storing reference vectors representative of individual categories, and reject pattern storage area 142 stores reject pattern data (feature vector of reject pattern,
The same applies hereinafter).

【0018】上記パターン認識辞書14は、例えば図2
に示す構成のパターン認識辞書作成装置2によって作成
することができる。このパターン認識辞書作成装置2も
またパターン認識装置1と同様に、コンピュータ装置が
所要のプログラムを読み込んで実行することにより形成
されるもので、サンプルパターンの入力を受け付けるサ
ンプルパターン入力部21、予め人間が確認しやすい形
式の複数の原パターンを格納した原パターンDB(デー
タベース)22、入力されたサンプルパターンを原パタ
ーンDB22内の原パターンを用いて成長させて新たな
パターンに変換するパターン変換部23、このパターン
変換部23の出力をディスプレイ装置等の出力装置に出
力する原パターン出力部24、成長後のパターンに対し
て所属カテゴリが特定できるかどうかを判定するカテゴ
リ判定部25、パターン認識辞書14の最適化処理を行
うとともにデータの追加登録を行う辞書管理部26の機
能を備えて構成される。
The pattern recognition dictionary 14 is, for example, as shown in FIG.
Can be created by the pattern recognition dictionary creating apparatus 2 having the configuration shown in FIG. Like the pattern recognition device 1, the pattern recognition dictionary creation device 2 is also formed by a computer device reading and executing a required program. An original pattern DB (database) 22 storing a plurality of original patterns in a format that can be easily checked, and a pattern conversion unit 23 that grows an input sample pattern using the original patterns in the original pattern DB 22 and converts it into a new pattern. An original pattern output unit 24 for outputting the output of the pattern conversion unit 23 to an output device such as a display device, a category determination unit 25 for determining whether a belonging category can be specified for a pattern after growth, and a pattern recognition dictionary 14. For optimizing data and registering additional data Configured with the function of the management unit 26.

【0019】本実施形態のパターン変換部23は、遺伝
的アルゴリズムを用いてサンプルパターンを原パターン
に変換する。このパターン変換部23での変換手順は図
3に示すとおりであり、まず、サンプルパターンから特
徴ベクトルを抽出し(ステップS101)、抽出した特
徴ベクトルをキーとして、原パターンDB22から、特
徴がサンプルパターンに類似する複数の原パターンを選
択して初期集団を形成する(ステップS102)。その
後、初期集団の個々の原パターンに対応する特徴ベクト
ルを抽出して特徴比較を行う(ステップS103)。具
体的には、抽出された特徴ベクトル同士を、例えば自乗
誤差のような尺度で比較し、類似性評価を行う。そし
て、この類似性評価に基づいて類似性の高いと判定され
る原パターンほど高くなるような重み付き確率を用いる
ことで一対の類似パターンの組を作成する(ステップS
104)。一方の類似パターンと他方の類似パターンの
成分の一部を相互に入れ替え、次の世代のパターンを1
組作成する(ステップS105)。このパターンがサン
プルパターンに適合しない場合はステップS103以降
の処理を繰り返し(ステップS106:No)、パターン
がサンプルパターンに適合するようになった時点で処理
を終える(ステップS106:Yes)。
The pattern converter 23 of the present embodiment converts a sample pattern into an original pattern using a genetic algorithm. The conversion procedure in the pattern conversion unit 23 is as shown in FIG. 3. First, a feature vector is extracted from the sample pattern (step S101). Are selected to form an initial group (step S102). Thereafter, feature vectors corresponding to individual original patterns of the initial group are extracted and feature comparison is performed (step S103). Specifically, the extracted feature vectors are compared with each other on a scale such as a square error, and similarity evaluation is performed. Then, a set of a pair of similar patterns is created by using a weighted probability that the original pattern determined to be higher in similarity based on the similarity evaluation becomes higher (Step S).
104). A part of the components of one similar pattern and the other similar pattern are exchanged with each other, and the pattern of the next generation is replaced by 1
A pair is created (step S105). If this pattern does not conform to the sample pattern, the processing after step S103 is repeated (step S106: No), and the processing ends when the pattern conforms to the sample pattern (step S106: Yes).

【0020】なお、遺伝的アルゴリズムについては、
「OCRの見ている文字を見る」(坂野他、‘画像の認
識と理解シンポジウム MIRU’96pp1313−
1318)の記載を参考にすることができる。
In addition, regarding the genetic algorithm,
"Looking at the characters seen by OCR" (Sakano et al., 'Image Recognition and Understanding Symposium MIRU' 96pp1313)
1318) can be referred to.

【0021】次に、上記のように構成されるパターン認
識辞書作成装置2によって、実際に辞書作成を行う場合
の手順を図4にしたがって説明する。最初に辞書管理部
26を起動し、LVQによって現在のサンプルパターン
に基づくパターン認識辞書14を最適化する(ステップ
S201)。すなわち、参照ベクトル格納領域141に
格納されている初期参照ベクトル集合(初期辞書)か
ら、カテゴリが既知の1つのサンプルベクトル(これを
学習ベクトルとする)に最も距離の近い参照ベクトルを
検出する。検出した参照ベクトルが学習ベクトルと異な
るカテゴリに属するものであった場合、つまり誤認識で
あった場合には、その参照ベクトルを学習ベクトルから
遠ざける。他方、検出した参照ベクトルが学習ベクトル
と同一カテゴリに属する場合は、これを学習ベクトルに
より近付ける。この処理を、誤認識が無くなるか、ある
いは所定の繰り返し回数に到達するまで繰り返す。
Next, a procedure for actually creating a dictionary by the pattern recognition dictionary creating apparatus 2 configured as described above will be described with reference to FIG. First, the dictionary management unit 26 is activated, and the pattern recognition dictionary 14 based on the current sample pattern is optimized by the LVQ (step S201). That is, from the initial reference vector set (initial dictionary) stored in the reference vector storage area 141, a reference vector closest to one sample vector whose category is known (this is set as a learning vector) is detected. If the detected reference vector belongs to a different category from the learning vector, that is, if it is misrecognized, the reference vector is moved away from the learning vector. On the other hand, if the detected reference vector belongs to the same category as the learning vector, it is brought closer to the learning vector. This process is repeated until erroneous recognition is eliminated or a predetermined number of repetitions is reached.

【0022】次に、誤認識が生じやすいと思われる特徴
ベクトル、すなわち、所属カテゴリが異なり、かつ、互
いに隣接している参照ベクトルの中点近傍の特徴ベクト
ルをランダムに選択する(ステップS202)。
Next, a feature vector that is likely to be erroneously recognized, that is, a feature vector in the vicinity of the midpoint of a reference vector that belongs to a different category and is adjacent to each other is randomly selected (step S202).

【0023】この特徴ベクトルを、パターン変換部23
で原パターンに変換し(ステップS203)、変換され
た原パターンの所属カテゴリが特定できるかどうかをカ
テゴリ判定部25で判定する(ステップS204)。
This feature vector is converted into a pattern
To convert the original pattern (step S203), and determine whether the category belonging to the converted original pattern can be specified by the category determination unit 25 (step S204).

【0024】この判定は、パターン変換部23で変換さ
れた原パターンを原パターン出力部24を通じて操作者
に提示するとともに、この提示に基づく入力指示内容を
解読することによって行う。すなわち、操作者が原パタ
ーンについて所属カテゴリを定めた場合はその所属カテ
ゴリ、所属カテゴリが留保された場合は、その旨がカテ
ゴリ判定部25に入力されるので、カテゴリ判定部25
は、この入力指示に応じた判定結果を生成する。このと
き、遺伝的アルゴリズムの1世代毎に操作者に提示して
入力指示を待ってもよく、予め定めた複数世代の処理が
終了した時点で操作者に提示してそのときの指示を待つ
ようにしてもよい。なお、パターン変換部23での処理
を必要に応じて繰り返すようにする。
This determination is made by presenting the original pattern converted by the pattern conversion unit 23 to the operator through the original pattern output unit 24 and decoding the input instruction content based on the presentation. In other words, if the operator has defined a belonging category for the original pattern, the belonging category is entered. If the belonging category is reserved, the fact is input to the category determining unit 25.
Generates a determination result according to the input instruction. At this time, it may be presented to the operator for each generation of the genetic algorithm and wait for an input instruction, or may be presented to the operator at the time when a predetermined plurality of generations of processing are completed and wait for the instruction at that time. It may be. Note that the processing in the pattern conversion unit 23 is repeated as necessary.

【0025】辞書管理部26は、カテゴリ判定部25に
おいて原パターンの所属カテゴリが特定できた場合は、
この原パターンから抽出される特徴ベクトルをその所属
カテゴリと共に参照ベクトル格納領域141に追加登録
する(ステップS204:Yes、S205)。一方、変
換された原パターンについて、所属すべきカテゴリが特
定できないときは、その原パターンの特徴ベクトルをリ
ジェクトパターンデータ格納領域142に格納する(ス
テップS204:No、S206)。必要に応じてステ
ップS202以降の処理を繰り返す(ステップS20
7)。このようにして、パターン認識辞書14が作成さ
れる。
If the category determining unit 25 can identify the category to which the original pattern belongs, the dictionary managing unit 26
The feature vector extracted from the original pattern is additionally registered in the reference vector storage area 141 together with its belonging category (step S204: Yes, S205). On the other hand, when the category to which the converted original pattern belongs cannot be specified, the feature vector of the original pattern is stored in the reject pattern data storage area 142 (step S204: No, S206). The processing from step S202 is repeated as necessary (step S20
7). Thus, the pattern recognition dictionary 14 is created.

【0026】次に、上述のようにして作成されたパター
ン認識辞書14を用いた本発明のパターン認識方法を図
5を参照して説明する。図1のパターン入力部11で受
け付けた入力パターンは、前処理部11で前処理された
後、特徴抽出部12で特徴ベクトルが抽出される(ステ
ップS301)。照合部13は、この特徴ベクトルとパ
ターン認識辞書14の参照ベクトル格納領域141に格
納されている参照ベクトルとの照合を行い、特徴ベクト
ルとの距離が最小となる参照ベクトルの所属カテゴリ
と、2番目に距離が小さかった参照ベクトルの所属カテ
ゴリとを特定する(ステップS302)。
Next, a pattern recognition method of the present invention using the pattern recognition dictionary 14 created as described above will be described with reference to FIG. The input pattern received by the pattern input unit 11 of FIG. 1 is pre-processed by the pre-processing unit 11, and then a feature vector is extracted by the feature extraction unit 12 (step S301). The matching unit 13 compares the feature vector with the reference vector stored in the reference vector storage area 141 of the pattern recognition dictionary 14, and determines the belonging category of the reference vector having the smallest distance from the feature vector, The belonging category of the reference vector having the shortest distance is specified (step S302).

【0027】次に、最小となった参照ベクトルと2番目
に距離が小さかった参照ベクトルとの距離差もしくは距
離比が事前に定められた第1閾値以下かどうか、つまり
正解データと不正解データとの区別がつきにくいかどう
かを判定する(ステップS303)。第1閾値を越える
場合は(ステップS303:Yes)、正解データである
として、カテゴリをパターン出力部15に出力する(ス
テップS304)。
Next, whether the distance difference or the distance ratio between the minimum reference vector and the reference vector having the second smallest distance is equal to or smaller than a predetermined first threshold value, that is, whether the correct answer data and the incorrect answer data It is determined whether or not it is difficult to distinguish (step S303). If it exceeds the first threshold (step S303: Yes), the category is output to the pattern output unit 15 as correct data (step S304).

【0028】一方、距離が第1閾値以下であった場合は
(ステップS303:No)、特徴ベクトルとリジェクト
パターンデータ格納領域142内のリジェクトパターン
データとの距離を計算し(ステップS305)、計算し
た距離が第2閾値以下かどうか、つまり入力パターンが
リジェクトパターンと近似するかどうかを判定する(ス
テップS306)。距離が第2閾値以下の場合は(ステ
ップS306:No)、その入力パターンを直ちにリジェ
クトさせる(ステップS307)。距離が第2閾値を越
える場合は、所定数個の参照ベクトルのカテゴリを正解
候補データとしてパターン出力部15に出力する(ステ
ップS308)。
On the other hand, if the distance is equal to or smaller than the first threshold value (step S303: No), the distance between the feature vector and the reject pattern data in the reject pattern data storage area 142 is calculated (step S305). It is determined whether the distance is equal to or less than the second threshold, that is, whether the input pattern is similar to the reject pattern (step S306). If the distance is equal to or less than the second threshold (step S306: No), the input pattern is immediately rejected (step S307). When the distance exceeds the second threshold, the categories of a predetermined number of reference vectors are output to the pattern output unit 15 as correct answer candidate data (step S308).

【0029】このように、本実施形態では、サンプルパ
ターンを遺伝的アルゴリズムによって原パターンに変換
して操作者が所属カテゴリを特定できるかどうかを確認
するようにしたので、人間にも判断がつかないサンプル
パターンからであっても容易にパターン認識辞書14を
作成できるようになる。また、原パターンについて所属
カテゴリが特定できる場合はこれを参照ベクトルとして
採用するようにしたので、従来のように、カテゴリ決定
のためのデータを大量に収集する必要がなくなり、パタ
ーン認識辞書の作成に要していた作業が大幅に削減され
るようになる。
As described above, according to the present embodiment, the sample pattern is converted into the original pattern by the genetic algorithm to check whether the operator can specify the category to which the operator belongs. The pattern recognition dictionary 14 can be easily created even from a sample pattern. In addition, when the category belonging to the original pattern can be specified, this is adopted as a reference vector, so that it is not necessary to collect a large amount of data for category determination as in the past, and it is necessary to create a pattern recognition dictionary. The required work will be greatly reduced.

【0030】また、原パターンの所属カテゴリが特定で
きないときは、その原パターンの特徴ベクトルをリジェ
クトパターンデータとしてリジェクトパターン格納領域
142に格納するようにしたので、パターンリジェクト
の基準が明確になり、認識性能を格段に高めることがで
きるようになる。
When the category to which the original pattern belongs cannot be specified, the feature vector of the original pattern is stored in the reject pattern storage area 142 as reject pattern data. Performance can be greatly improved.

【0031】[0031]

【発明の効果】以上の説明から明らかなように、本発明
によれば、高性能でリジェクトの機能を持った最適なパ
ターン認識辞書を効率的に作成することができるように
なる。また、このパターン認識辞書を用いることによ
り、パターン認識の精度を従来のパターン認識装置より
も格段に高めることができるようになる。
As is apparent from the above description, according to the present invention, it is possible to efficiently create an optimal pattern recognition dictionary having a high performance and a reject function. Also, by using this pattern recognition dictionary, the accuracy of pattern recognition can be significantly improved as compared with a conventional pattern recognition device.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明が適用されるパターン認識装置のブロッ
ク構成図。
FIG. 1 is a block diagram of a pattern recognition apparatus to which the present invention is applied.

【図2】本発明のパターン認識辞書作成装置の実施の一
形態を示すブロック構成図。
FIG. 2 is a block diagram showing an embodiment of a pattern recognition dictionary creating apparatus according to the present invention.

【図3】本実施形態による遺伝的アルゴリズムの手順説
明図。
FIG. 3 is an explanatory diagram of a procedure of a genetic algorithm according to the embodiment.

【図4】本実施形態によるパターン認識辞書の作成手順
説明図。
FIG. 4 is an explanatory diagram of a procedure for creating a pattern recognition dictionary according to the embodiment.

【図5】本実施形態によるパターン認識方法の手順説明
図。
FIG. 5 is a diagram illustrating a procedure of a pattern recognition method according to the embodiment;

【符号の説明】[Explanation of symbols]

1 パターン認識装置 10 パターン入力部 11 前処理部 12 特徴抽出部 13 照合部 14 パターン認識辞書 141 参照ベクトル格納領域 142 リジェクトパターンデータ格納領域 15 パターン出力部 2 パターン認識辞書作成装置 21 サンプルパターン入力部 22 原パターンDB 23 パターン変換部 24 原パターン出力部 25 カテゴリ判定部 26 辞書管理部 REFERENCE SIGNS LIST 1 pattern recognition device 10 pattern input unit 11 preprocessing unit 12 feature extraction unit 13 collation unit 14 pattern recognition dictionary 141 reference vector storage area 142 reject pattern data storage area 15 pattern output unit 2 pattern recognition dictionary creation device 21 sample pattern input unit 22 Original pattern DB 23 Pattern conversion unit 24 Original pattern output unit 25 Category determination unit 26 Dictionary management unit

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 パターン認識の際に誤認識が生じやすい
サンプルパターンに遺伝的アルゴリズムを適用してパタ
ーン照合に用いる参照パターンとパターンリジェクトの
指標となるリジェクトパターンのいずれかに分類してお
き、 入力された認識対象パターンの特徴と前記リジェクトパ
ターンの特徴との一致度が所定値を越えるときに当該認
識対象パターンをリジェクトすることを特徴とするパタ
ーン認識方法。
1. A genetic pattern is applied to a sample pattern in which misrecognition is likely to occur during pattern recognition, and the sample pattern is classified into one of a reference pattern used for pattern matching and a reject pattern serving as an index of pattern rejection. A pattern recognition method for rejecting the recognition target pattern when the degree of coincidence between the obtained characteristic of the recognition target pattern and the characteristic of the reject pattern exceeds a predetermined value.
【請求項2】 パターン認識の際に誤認識が生じやすい
パターンに遺伝的アルゴリズムを適用してパターン照合
に用いる参照パターンとパターンリジェクトの指標とな
るリジェクトパターンのいずれかに分類しておき、 入力された認識対象パターンに対して最も類似する参照
パターンと二番目に類似する参照パターンとの特徴差ま
たは特徴比が所定値以下の場合に前記リジェクトパター
ンと前記認識対象パターンとの一致度を検出し、検出値
が所定値を越えるときに当該認識対象パターンをリジェ
クトすることを特徴とするパターン認識方法。
2. A method in which a genetic algorithm is applied to a pattern in which misrecognition is likely to occur during pattern recognition to classify the pattern into one of a reference pattern used for pattern matching and a reject pattern serving as an index of pattern rejection. When the feature difference or the feature ratio between the reference pattern most similar to the recognition target pattern and the second similar reference pattern is equal to or less than a predetermined value, the degree of coincidence between the reject pattern and the recognition target pattern is detected, A pattern recognition method comprising rejecting a recognition target pattern when a detection value exceeds a predetermined value.
【請求項3】 前記特徴差または特徴比が所定値を越
え、且つ前記検出値が所定値以下のときに所定数個の参
照パターンを正解候補パターンとして特定することを特
徴とする請求項2記載のパターン認識方法。
3. The method according to claim 2, wherein when the characteristic difference or the characteristic ratio exceeds a predetermined value and the detected value is equal to or less than a predetermined value, a predetermined number of reference patterns are specified as correct candidate patterns. Pattern recognition method.
【請求項4】 辞書作成に用いるサンプルパターンを遺
伝的アルゴリズムによって成長させる過程と、 成長後のパターンの所属カテゴリの有無を判定する過程
と、 所属カテゴリが特定できた場合は当該成長後のパターン
をパターン照合に用いられる参照パターン、所属カテゴ
リが特定できない場合は当該成長後のパターンをパター
ンリジェクトの指標となるリジェクトパターンとして分
類する過程と、 分類された各パターンの特徴データを辞書登録する過程
とを含む、 パターン認識辞書作成方法。
4. A process of growing a sample pattern used for creating a dictionary by a genetic algorithm, a process of determining the presence or absence of a category to which the pattern after growth belongs. If the reference pattern used for pattern matching and the belonging category cannot be specified, the process of classifying the pattern after growth as a reject pattern that is an index of pattern rejection, and the process of registering feature data of each classified pattern in a dictionary Including, how to create a pattern recognition dictionary.
【請求項5】 辞書作成に用いるサンプルパターンを遺
伝的アルゴリズムによって視認可能な原パターンに変換
して操作者に提示する過程と、 該提示に基づいて操作者から所属カテゴリが指定された
場合は当該原パターンをパターン照合に用いられる参照
パターン、所属カテゴリの決定が留保された場合は当該
原パターンをパターンリジェクトの指標となるリジェク
トパターンとして分類する過程と、 各パターンの特徴データを辞書登録する過程とを含む、 パターン認識辞書作成方法。
5. A process of converting a sample pattern used for creating a dictionary into an original pattern that can be visually recognized by a genetic algorithm and presenting it to an operator, and, when an affiliation category is specified by the operator based on the presentation, A step of classifying the original pattern as a reference pattern used for pattern matching, and a step of classifying the original pattern as a reject pattern that is an index of pattern reject when the determination of a belonging category is reserved; a step of registering feature data of each pattern in a dictionary; A method for creating a pattern recognition dictionary.
【請求項6】 前記原パターンの所属カテゴリの決定可
否を、前記遺伝的アルゴリズムを繰り返す度に行うこと
を特徴とする請求項4記載のパターン認識辞書作成方
法。
6. The pattern recognition dictionary creating method according to claim 4, wherein whether or not the category to which the original pattern belongs is determined each time the genetic algorithm is repeated.
【請求項7】 前記サンプルパターンは、異なるカテゴ
リに所属する複数の参照パターンに類似するパターンで
あることを特徴とする請求項4、5、または6記載のパ
ターン認識辞書作成方法。
7. The pattern recognition dictionary creation method according to claim 4, wherein the sample pattern is a pattern similar to a plurality of reference patterns belonging to different categories.
【請求項8】 所属カテゴリが不明なサンプルパターン
を遺伝的アルゴリズムによって成長させるパターン変換
手段と、 前記成長後のパターンの所属カテゴリが特定できるかど
うかを判定するカテゴリ判定手段と、 所属カテゴリが特定できるパターンをパターン照合に用
いられる参照パターン、所属カテゴリが特定できないパ
ターンをパターンリジェクトの指標となるリジェクトパ
ターンとして分類し、各パターンの特徴データをそれぞ
れパターン認識辞書の所定領域に登録する手段と、 を備えて成るパターン認識辞書作成装置。
8. A pattern conversion means for growing a sample pattern whose affiliation category is unknown by a genetic algorithm, a category determination means for judging whether or not the affiliation category of the pattern after growth can be identified, and an affiliation category can be identified. Means for classifying a pattern as a reference pattern used for pattern matching, a pattern whose belonging category cannot be specified as a reject pattern serving as an index of pattern rejection, and registering characteristic data of each pattern in a predetermined area of the pattern recognition dictionary. Pattern recognition dictionary creation device.
【請求項9】 前記パターン変換手段は、前記成長した
パターンを視認可能な形式の原パターンに変換して操作
者に提示するように構成され、前記カテゴリ判定手段
は、前記提示に対応して入力されたカテゴリ決定情報に
基づいて前記判定を行うように構成されていることを特
徴とする請求項8記載のパターン認識辞書作成装置。
9. The pattern conversion unit is configured to convert the grown pattern into an original pattern in a visually recognizable format and present the converted original pattern to an operator, and the category determination unit performs input corresponding to the presentation. 9. The pattern recognition dictionary creating apparatus according to claim 8, wherein the determination is made based on the determined category determination information.
【請求項10】 辞書作成に用いるサンプルパターンを
遺伝的アルゴリズムによって成長させる処理、 成長後のパターンの所属カテゴリの有無を判定する処
理、 所属カテゴリが特定できた場合は当該成長後のパターン
をパターン照合に用いられる参照パターン、所属カテゴ
リが特定できない場合は当該成長後のパターンをパター
ンリジェクトの指標となるリジェクトパターンとして分
類する処理、及び、分類された各パターンの特徴データ
を辞書登録する処理をコンピュータに実行させるプログ
ラムを記録して成るコンピュータ読み取り可能な記録媒
体。
10. A process for growing a sample pattern used for creating a dictionary by a genetic algorithm, a process for determining whether or not a category belongs to a pattern after growth, and a pattern matching for the pattern after growth when the belonging category can be specified. In the case where the reference pattern to be used for the belonging category cannot be specified, the computer performs a process of classifying the pattern after growth as a reject pattern serving as an index of the pattern reject, and a process of registering feature data of each classified pattern in a dictionary. A computer-readable recording medium that records a program to be executed.
JP9297582A 1997-10-29 1997-10-29 Pattern recognition method and pattern recognition dictionary preparation method and device therefor Pending JPH11134316A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9297582A JPH11134316A (en) 1997-10-29 1997-10-29 Pattern recognition method and pattern recognition dictionary preparation method and device therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9297582A JPH11134316A (en) 1997-10-29 1997-10-29 Pattern recognition method and pattern recognition dictionary preparation method and device therefor

Publications (1)

Publication Number Publication Date
JPH11134316A true JPH11134316A (en) 1999-05-21

Family

ID=17848427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9297582A Pending JPH11134316A (en) 1997-10-29 1997-10-29 Pattern recognition method and pattern recognition dictionary preparation method and device therefor

Country Status (1)

Country Link
JP (1) JPH11134316A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003317083A (en) * 2002-04-25 2003-11-07 Dainippon Screen Mfg Co Ltd Image classifying method, program, and image classifying device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003317083A (en) * 2002-04-25 2003-11-07 Dainippon Screen Mfg Co Ltd Image classifying method, program, and image classifying device

Similar Documents

Publication Publication Date Title
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
US5067165A (en) Character recognition method
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
CN105469080B (en) A kind of facial expression recognizing method
CN113408574B (en) License plate classification method, license plate classification device and computer readable storage medium
KR19990010210A (en) Mass Pattern Matching Device and Method
JP4039708B2 (en) Pattern recognition method and pattern recognition apparatus
JP2009129253A (en) Pattern recognition apparatus, pattern recognition program and pattern recognition method
CN110688998A (en) Bill identification method and device
JP3313272B2 (en) Address reading method and identification function weight vector generation method
JPH11134316A (en) Pattern recognition method and pattern recognition dictionary preparation method and device therefor
KR100441706B1 (en) Method for optimizing a recognition dictionary to distinguish between patterns that are difficult to distinguish
JPH08115387A (en) Pattern recognition device
JPH0638276B2 (en) Pattern identification device
CN113407439B (en) Detection method for software self-recognition type technical liabilities
JP2002183667A (en) Character-recognizing device and recording medium
JPH0749926A (en) Character recognizing device
JP3209197B2 (en) Character recognition device and recording medium storing character recognition program
JP3805831B2 (en) Character recognition device
JP2001092924A (en) Method and device for recognizing pattern
JP4215385B2 (en) PATTERN RECOGNIZING DEVICE, PATTERN RECOGNIZING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
CN114882538A (en) Fingerprint comparison method and system based on multilevel pattern
JP2851865B2 (en) Character recognition device
JPH05197813A (en) Feature selecting method
JP2973898B2 (en) Character recognition method and device