JPH08272904A - Pattern recognition device - Google Patents

Pattern recognition device

Info

Publication number
JPH08272904A
JPH08272904A JP7077925A JP7792595A JPH08272904A JP H08272904 A JPH08272904 A JP H08272904A JP 7077925 A JP7077925 A JP 7077925A JP 7792595 A JP7792595 A JP 7792595A JP H08272904 A JPH08272904 A JP H08272904A
Authority
JP
Japan
Prior art keywords
classification
feature
dictionary
character
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7077925A
Other languages
Japanese (ja)
Inventor
Shinji Ono
真司 尾野
Shigeko Kaneichi
滋子 金一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP7077925A priority Critical patent/JPH08272904A/en
Publication of JPH08272904A publication Critical patent/JPH08272904A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE: To perform recognition which is highly reliable for various candidate characters by providing a specific dictionary generating means and a specific pattern recognizing means. CONSTITUTION: An image input part reads out an image to be recognized first (S101) and segments characters out of the read image (S102). Then, a character feature extraction part performs feature extraction (S103) and collates the input character feature quantities with a rough classification dictionary (S104). On the basis of the collation results, a feature extracting method matching with each input character is selected out of a detailed classification dictionary (S105), and feature extraction for detailed classification is performed by the feature extracting means (S106). And, the extracted input character feature quantities are collated with the detailed classification dictionary (S107) and the results are outputted (S110). Consequently, even when an object to be recognized and a character feature extracting method are added, recognition and evaluation are only performed by the dictionaries and feature extracting methods after the addition and the maintenance of the dictionary on a dictionary generation side is facilitated to easily perform high-precision recognition.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、パターン認識装置に係
り、特に文字認識率を維持し、誤読率を低減する詳細分
類辞書の自動構築に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a pattern recognition apparatus, and more particularly to automatic construction of a detailed classification dictionary which maintains a character recognition rate and reduces a misreading rate.

【0002】[0002]

【従来技術】従来、類似した認識候補文字の詳細分類に
おいて単一の文字特徴量を用い、特徴成分毎の分散に基
づいて分類に適した特徴成分を抽出し照合する文字認識
装置が提案されている(特開平1−233678号)。
2. Description of the Related Art Heretofore, a character recognition device has been proposed which uses a single character feature amount in detailed classification of similar recognition candidate characters and extracts and collates a characteristic component suitable for classification based on the variance of each characteristic component. (JP-A-1-233678).

【0003】[0003]

【発明が解決しようとする課題】このような装置では、
候補文字間ごとに分類に適した特徴量が異なることが多
く、単一の文字特徴量では十分な認識精度を得ることが
できないという問題がある。
SUMMARY OF THE INVENTION In such a device,
The feature amount suitable for classification often differs between candidate characters, and there is a problem that sufficient recognition accuracy cannot be obtained with a single character feature amount.

【0004】本発明は前記実情に鑑みてなされたもの
で、種々の候補文字に対して、高速で信頼性の高い認識
を行うことのできる認識装置を提供することを目的とす
る。
The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a recognition device which can recognize various candidate characters at high speed and with high reliability.

【0005】[0005]

【課題を解決するための手段】本発明の装置の特徴は、
文字パターンに対し、大分類後の詳細分類において、複
数の特徴抽出方法を設定しておき、各特徴抽出方法毎に
分類判定しきい値を算出して、分類精度を評価し、その
分類精度の評価値が最小である特徴抽出方法と判定しき
い値および分類精度の評価値を辞書として格納する辞書
作成手段と、前記大分類結果での類似候補間の分類に適
した特徴抽出方法と判定しきい値を辞書からよみ込み、
詳細分類を行うパターン認識手段とを具備したことにあ
る。
The features of the device of the present invention are:
For the character pattern, in the detailed classification after the major classification, a plurality of feature extraction methods are set, the classification determination threshold value is calculated for each feature extraction method, and the classification accuracy is evaluated. A feature extraction method having the smallest evaluation value, a dictionary creating means for storing a determination threshold value and an evaluation value of classification accuracy as a dictionary, and a feature extraction method suitable for classification between similar candidates in the large classification result. Read the threshold value from the dictionary,
It has a pattern recognition means for performing detailed classification.

【0006】すなわち、本発明は、候補文字毎に詳細分
類に適した特徴量と特徴成分を選択できる辞書を自動構
築するようにしたもので、文字変形パターンを自動生成
し、用意した多種多様な文字特徴量で認識評価し、その
結果候補文字毎に、文字認識率が最も高く誤読率を最も
低く抑えることのできる文字特徴量を1つ選択し、その
文字特徴抽出方法名と判定しきい値および分類精度の評
価値を詳細分類辞書として格納しておく。
That is, the present invention is designed to automatically construct a dictionary capable of selecting a characteristic amount and a characteristic component suitable for detailed classification for each candidate character. The character transformation pattern is automatically generated and prepared in various types. The character feature amount is recognized and evaluated, and as a result, one character feature amount having the highest character recognition rate and the lowest misreading rate is selected for each candidate character, and the character feature extraction method name and the determination threshold value are selected. And the evaluation value of the classification accuracy is stored as a detailed classification dictionary.

【0007】そしてこの辞書を用い、候補文字間毎に適
した特徴量と特徴成分とを選択し詳細分類を行う。
Then, using this dictionary, a feature amount and a feature component suitable for each candidate character are selected to perform detailed classification.

【0008】[0008]

【作用】かかる構成によれば、新規に認識対象や文字特
徴抽出方法が追加されても、追加後の辞書と特徴抽出方
法とで認識評価すれば、その結果新規の詳細分類辞書を
更新することができ、辞書のメンテナンスが容易である
とともに、詳細分類用の新規文字特徴抽出方法の追加が
容易である。
With this configuration, even if a new recognition target or character feature extraction method is added, if a dictionary and feature extraction method after addition are recognized and evaluated, the new detailed classification dictionary is updated as a result. It is possible to maintain the dictionary easily, and it is easy to add a new character feature extraction method for detailed classification.

【0009】また認識に適した特徴抽出方法を判断する
手段として認識結果に基づいた分類精度を適用している
ため、簡単化でき、自動登録化が可能となった。
Further, since the classification accuracy based on the recognition result is applied as a means for judging the feature extraction method suitable for recognition, the simplification and the automatic registration are possible.

【0010】また入力パターンを変形させその変形を考
慮した上で分類精度を評価しているので、文字変形パタ
ーンや未知パターンにも認識精度を向上させることがで
きた。 さらにまた2カテゴリのパターン間で、特徴抽
出方法と判定しきい値を決定することで、高い分類精度
の実現が可能となる。
Further, since the input pattern is deformed and the classification accuracy is evaluated in consideration of the deformation, the recognition accuracy can be improved even for the character deformed pattern and the unknown pattern. Furthermore, by determining the feature extraction method and the determination threshold value between the patterns of the two categories, high classification accuracy can be realized.

【0011】なお、複数の文字特徴抽出方法から1つを
選択するのではなく、複数の文字特徴抽出方法で分類
し、それぞれの出力値(距離値)を分類判定に用いるこ
ともできる。
Instead of selecting one from a plurality of character feature extraction methods, it is also possible to classify by a plurality of character feature extraction methods and use the respective output values (distance values) for classification determination.

【0012】[0012]

【実施例】次に、本発明の実施例について図面を参照し
つつ詳細に説明する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0013】このパターン認識装置は、まず文字変形パ
ターンを自動生成し、用意した多種多様な文字特徴量で
認識評価し、その結果候補文字毎に、文字認識率が最も
高く誤読率を最も低く抑えることのできる文字特徴量を
1つ選択し、その文字特徴抽出方法名と判定しきい値お
よび分類精度の評価値を詳細分類辞書として格納してお
くようにした辞書作成手段と、この辞書を用い、候補文
字間毎に適した特徴量と特徴成分とを選択し詳細分類を
行うパターン認識手段とを具備したことを特徴とする。
This pattern recognition device first automatically generates a character deformation pattern, recognizes and evaluates it with a variety of prepared character feature amounts, and as a result, has a highest character recognition rate for each candidate character and a lowest misreading rate. A dictionary creating means for selecting one possible character feature amount and storing the character feature extracting method name, the judgment threshold value, and the evaluation value of the classification accuracy as a detailed classification dictionary, and this dictionary are used. A pattern recognition means for selecting a feature quantity and a feature component suitable for each candidate character and performing detailed classification is provided.

【0014】次にこのパターン認識装置を用いた認識処
理を図1に示すフローチャートを参照しつつ説明する。
Next, a recognition process using this pattern recognition device will be described with reference to the flow chart shown in FIG.

【0015】まず、画像入力部で認識しようとする画像
をよみとる(ステップ101)。
First, the image to be recognized by the image input unit is read (step 101).

【0016】次に文字切り出し部において、読み取った
画像から、文字の切り出しを行う(ステップ102)。
Next, in the character cutting section, characters are cut out from the read image (step 102).

【0017】この後文字特徴抽出部において特徴抽出を
行う(ステップ103)。
After this, the character feature extraction section performs feature extraction (step 103).

【0018】そして入力文字特徴量と大分類辞書との照
合を行う(ステップ104)。この大分類辞書はあらか
じめステップ108で作成されているものとする。
Then, the input character feature amount is compared with the large classification dictionary (step 104). It is assumed that this large classification dictionary has been created in step 108 in advance.

【0019】また詳細分類辞書も同様に、あらかじめス
テップ109で作成されているものとする。
Similarly, it is assumed that the detailed classification dictionary is also created in advance in step 109.

【0020】大分類辞書との照合結果に基づき、この入
力文字に適切な特徴抽出方法を詳細分類用辞書から選択
し(ステップ105)、この特徴抽出方法に基づいて詳
細分類用の特徴抽出を行う(ステップ106)。
Based on the comparison result with the large classification dictionary, a feature extraction method suitable for this input character is selected from the detailed classification dictionary (step 105), and the feature extraction for detailed classification is performed based on this feature extraction method. (Step 106).

【0021】そして適切な方法で特徴抽出のなされた入
力文字特徴量と詳細分類辞書との照合を行い(ステップ
107)、結果を出力する(ステップ110)。
Then, the input character feature amount which has been subjected to feature extraction by an appropriate method is compared with the detailed classification dictionary (step 107), and the result is output (step 110).

【0022】特徴抽出方法は次の表に示すように、特徴
値として、濃度勾配特徴に強度重みなしとありの2種
類、特徴ベクトルとして部分特徴、全面特徴、上下対称
度特徴3種、左右対称度特徴3種、対角対称度特徴2種
の10種類、しきい値設定1種で2×10×1の20通
りの特徴抽出方法を用いている。
As shown in the following table, the feature extraction method has two types of feature values, that is, the density gradient feature has no intensity weighting, and the feature vector has partial features, full features, three types of vertical symmetry features, and bilateral symmetry. 20 types of feature extraction methods of 2 × 10 × 1 are used with 10 types of 3 degree features, 2 types of diagonal symmetry features, and 1 type of threshold setting.

【0023】 この特徴値について説明する。入力画像が256階調の
場合、濃度勾配強度値は、1024階調となるが、その
濃度勾配強度値を、2値もしくは多値(8レベル)に正
規化した値である(図10ステップ304)特徴ベクト
ルを次に示す。
[0023] This characteristic value will be described. When the input image has 256 gradations, the density gradient strength value is 1024 gradations, which is a value obtained by normalizing the density gradient strength value to a binary value or a multi-value (8 levels) (step 304 in FIG. 10). ) The feature vector is shown below.

【0024】 次に大分類辞書作成について図2のフローチャートを参
照しつつ説明する。
[0024] Next, the creation of the large classification dictionary will be described with reference to the flowchart of FIG.

【0025】このフローチャートは前記図1のフローチ
ャートにおける大分類辞書作成ステップ108に相当す
る。
This flowchart corresponds to the large classification dictionary creating step 108 in the flowchart of FIG.

【0026】まず、図3に示すように、A〜Nのフォン
トに対して0〜9と記号に対するカテゴリの文字データ
を入力する(ステップ201)。
First, as shown in FIG. 3, character data of categories 0 to 9 and symbols for the fonts A to N is input (step 201).

【0027】そして図4に例を示すように基準パターン
に対して6種類の変形パターンを発生させる(ステップ
202)。
Then, as shown in the example of FIG. 4, six types of modified patterns are generated for the reference pattern (step 202).

【0028】そしてさらに文字特徴抽出(ステップ20
3)を行い、文字特徴量を格納する(ステップ20
4)。
Then, character feature extraction (step 20)
3) is performed and the character feature amount is stored (step 20).
4).

【0029】そして全変形パターンの発生が終了したか
否かを判断し(ステップ205)、終了していれば文字
特徴量の平均、特徴次元ごとに標準偏差を算出する(ス
テップ206)。
Then, it is judged whether or not the generation of all the deformation patterns is completed (step 205), and if completed, the average of the character feature amount and the standard deviation are calculated for each feature dimension (step 206).

【0030】一方、終了していなければ変形パターン発
生ステップ202に戻る。
On the other hand, if not completed, the process returns to the modified pattern generation step 202.

【0031】そしてこの入力文字データのフォント、カ
テゴリの平均文字特徴量および特徴次元毎の標準偏差を
大分類辞書に格納する(ステップ207)。
The font of the input character data, the average character feature amount of the category, and the standard deviation for each feature dimension are stored in the large classification dictionary (step 207).

【0032】そして全フォント、カテゴリについて処理
が終了したか否かを判断し(ステップ208)、終了し
ていればこのフローを終了し、処理が終了していなけれ
ば、最初の文字データ入力ステップ201に戻る。
Then, it is judged whether or not the processing is completed for all fonts and categories (step 208), and if it is completed, this flow is ended, and if the processing is not completed, the first character data input step 201 is executed. Return to.

【0033】次に詳細分類辞書の作成について図5を参
照しつつ説明する。まず大分類を行うが、図2で説明し
たように、A〜Nのフォントに対して0〜9と記号に対
するカテゴリの文字データを入力する(ステップ40
1)。
Next, the creation of the detailed classification dictionary will be described with reference to FIG. First, major classification is performed. As described with reference to FIG. 2, character data of categories 0 to 9 and symbols for fonts A to N is input (step 40).
1).

【0034】そして基準パターンに対して変形パターン
を発生させる(ステップ402)。そしてさらに文字特
徴抽出(ステップ403)を行い、大分類辞書との照合
を行う(ステップ404)。
Then, a deformed pattern is generated with respect to the reference pattern (step 402). Then, character feature extraction (step 403) is further performed, and collation with the large classification dictionary is performed (step 404).

【0035】そして、特徴抽出法1〜Mを用いた分類
(ステップ4051 〜405m )を行い、特徴抽出方法
別に大分類一位、二位の組み合わせ別に正解、エラーの
距離値と距離値の差の頻度分布を集計する(ステップ4
06)。図6はある一種類の特徴抽出法を用いた場合の
詳細分類一位の絶対距離値と相対距離値(詳細分類一位
と二位の絶対距離値差)の関係を詳細分類一位が正解、
エラー別にプロットしたものである。
Then, classification is performed by using the feature extraction methods 1 to M (steps 4051 to 405 m ), and the feature extraction method is classified into the first rank, the correct answer is classified according to the combination of the second rank, the error distance value and the distance value. Summarize the frequency distribution of the differences (Step 4
06). FIG. 6 shows the relationship between the absolute distance value of the first detailed classification and the relative distance value (difference in absolute distance between the first and second detailed classifications) when one kind of feature extraction method is used. ,
It is plotted by error.

【0036】 そして全変形パターンについてこれらの処理を完了した
か否かを判断し(ステップ407)、完了していなけれ
ば変形パターンの発生ステップ402に戻るが、完了し
ていれば全フォント、カテゴリについて処理が終了した
か否かを判断する(ステップ408)。
[0036] Then, it is judged whether or not these processes have been completed for all the deformation patterns (step 407), and if not completed, the process returns to the deformation pattern generation step 402, but if completed, the processes are completed for all fonts and categories. It is determined whether or not (step 408).

【0037】そしてこの判断ステップ408で処理が終
了していないと判断されると最初に戻り、終了している
と判断されると、しきい値関数の算出を行う(ステップ
409)。ここでは特徴抽出方法別詳細分類一位、二位
の組み合わせ別の正解、エラー距離値頻度分布(図6)
から次に示すマハラノビス距離を用いてしきい値関数を
算出する。
If it is judged in the judgment step 408 that the processing is not completed, the procedure returns to the beginning, and if it is judged that the processing is completed, the threshold function is calculated (step 409). Detailed classification by feature extraction method Here, correct answers for each combination of first and second positions, error distance value frequency distribution (Fig. 6)
Then, the threshold function is calculated using the Mahalanobis distance shown below.

【0038】 しきい値関数は正解の集団とエラーの集団の間でマハラ
ノビス距離が等しい点の軌跡、すなわち両群の境界を求
め、その点列を一時回帰した結果をしきい値関数とす
る。 しきい値関数(相対距離)−a×(絶対距離)−b=0 このようにして求めたしきい値関数の値が0以下の場
合、リジェクトとする。
[0038] For the threshold function, the locus of points having the same Mahalanobis distance between the correct answer group and the error group, that is, the boundary between both groups is obtained, and the result of temporary regression of the point sequence is used as the threshold function. Threshold function (relative distance) -a * (absolute distance) -b = 0 When the value of the threshold function thus obtained is 0 or less, it is rejected.

【0039】図7はしきい値関数決定の説明図である。
そして分類精度の評価値Vを算出し、この値に基づいて
特徴抽出方法を決定する。(ステップ410) 特徴抽出方法の決定に際しては、まず大分類一位の参照
テーブルと二位の参照テーブルの間で、特徴抽出方法毎
に分類精度の評価値Vを下式で求め、最小となる方法に
決定する。
FIG. 7 is an explanatory diagram for determining the threshold function.
Then, the evaluation value V of classification accuracy is calculated, and the feature extraction method is determined based on this value. (Step 410) When determining the feature extraction method, first, the evaluation value V of the classification accuracy is calculated by the following formula between the reference table of the first rank in the large classification and the reference table of the second rank, and the value is minimized. Decide on the method.

【0040】ここでは、 評価値V=α×E+R (E:エラー率、R:リジェクト率、α:定数) 最終的な詳細分類辞書は、大分類一位候補の参照テーブ
ルと二位候補の字種の組み合わせ(大分類参照テーブル
数×字種数)毎に認識精度の良い1種の特徴抽出方法が
格納されることになる(ステップ411)。
Here, the evaluation value V = α × E + R (E: error rate, R: reject rate, α: constant) The final detailed classification dictionary is a reference table of major classification first-ranked candidates and letters of second-ranked candidates. One kind of feature extraction method with high recognition accuracy is stored for each kind combination (number of large classification reference tables × number of character types) (step 411).

【0041】ここではαの値は10とし、エラー率、リ
ジェクト率の算出方法を説明する。大分類一位候補がフ
ォントA,カテゴリ0と大分類2位候補がカテゴリ8の
組み合わせで、特徴抽出方法は重みなしの特徴値、全面
特徴を特徴ベクトルに用いた場合の例を図8に示す。
Here, the value of α is 10, and the method of calculating the error rate and the reject rate will be described. FIG. 8 shows an example in which the major classification first-ranked candidate is a combination of font A, category 0 and the major classification second-ranked candidate is category 8, and the feature extraction method uses feature values without weighting and full-features as feature vectors. .

【0042】ここでは図5に従い集計された正解、エラ
ーの集団からマハラノビス距離を用いて算出されたしき
い値関数 (相対距離)−(0.24604)×(絶対距離)−(158.64)=0 に入力パターン毎に相対絶対距離値を代入する。その値
が、負となる入力パターンの頻度をリジェクト率Rと
し、エラー集団(詳細分類一位がエラーとなる入力パタ
ーン)でしきい値関数の値が正となる頻度をエラー率E
とする。
Here, the threshold function calculated using the Mahalanobis distance from the group of correct answers and errors collected according to FIG. 5 (relative distance)-(0.24604) × (absolute distance)-(158.64) Substitute the relative absolute distance value for each input pattern into = 0. The frequency of the input pattern with a negative value is the reject rate R, and the frequency with which the value of the threshold function is positive in the error group (the input pattern in which the first rank of the detailed classification is an error) is the error rate E.
And

【0043】次にこの方法を用いた処理例について説明
する。ここでは大分類一位候補と一位とは異なるカテゴ
リのものが二位候補であるときの処理例である。まず図
9に示すように文字パターンについて大分類を行い、上
位M位例えば二位までの候補を選出する(ステップ50
1)。
Next, an example of processing using this method will be described. Here is an example of the processing when the large category first place candidate and the category different from the first place are second place candidates. First, as shown in FIG. 9, the character patterns are roughly classified, and candidates for the upper M ranks, for example, the 2nd ranks are selected (step 50).
1).

【0044】そして詳細分類辞書の参照を行い、大分類
一位候補C1と二位候補C2の組み合わせについて特徴
抽出方法、特徴量、しきい値関数を詳細分類辞書から入
力する(ステップ502)。
Then, the detailed classification dictionary is referred to, and the feature extraction method, the feature amount, and the threshold function for the combination of the large classification first rank candidate C1 and the second rank candidate C2 are input from the detailed classification dictionary (step 502).

【0045】そして入力文字の詳細分類特徴抽出を行う
(ステップ503)。これについては後で詳細に説明す
る。
Then, the detailed classification feature of the input character is extracted (step 503). This will be described in detail later.

【0046】この後、大分類一位、二位のそれぞれの詳
細分類用特徴量と、入力文字の詳細分類用特徴量との間
で距離計算を行い、最小距離値D(絶対距離)および一
位と二位の差B(相対距離)を算出する(ステップ50
4)。
Thereafter, distance calculation is performed between the detailed classification feature amounts of the first and second major classifications and the detailed classification feature amount of the input character, and the minimum distance value D (absolute distance) and the first distance value are calculated. The difference B (relative distance) between the second place and the second place is calculated (step 50).
4).

【0047】そして前述したしきい値関数に最小距離値
D(相対距離)と距離値の差B(相対距離)を代入し
(ステップ505)、しきい値関数の出力値が0よりも
大であるか否かの判断を行い(ステップ506)、0よ
りも大であるときアクセプト(ステップ507)とす
る。一方0よりも小さいときリジェクト(ステップ50
8)とする。
Then, the minimum distance value D (relative distance) and the difference B (relative distance) between the distance values are substituted into the above-mentioned threshold function (step 505), and the output value of the threshold function is larger than 0. It is determined whether there is any (step 506), and when it is greater than 0, it is accepted (step 507). On the other hand, if it is smaller than 0, reject (step 50
8).

【0048】ここで入力文字の文字特徴抽出過程につい
て説明する。まず、図10に示すように、画像入力部で
認識しようとする画像をよみとる(ステップ301)。
Here, the process of extracting the character feature of the input character will be described. First, as shown in FIG. 10, the image to be recognized by the image input unit is read (step 301).

【0049】次に読み取った画像の平滑化処理(ステッ
プ302)を行った後エッジ抽出オペレータ303にか
け注目画素の濃度勾配強度を検出し、8方向の中で最大
強度となる方向を注目画素の濃度勾配方向とし、その強
度値を濃度勾配強度値とする。 そして濃度勾配強度分
布から特徴量を決定するためのしきい値を設定し(ステ
ップ304)、パターンをM×Nの領域に分割し(ステ
ップ305)、領域ごとに特徴値を集計し(ステップ3
06)、重みなしの場合とありの場合とに対し特徴量を
算出する(ステップ307,308)。
Next, after smoothing the read image (step 302), the edge extraction operator 303 is applied to detect the density gradient strength of the pixel of interest, and the density of the pixel of interest is determined in the direction of maximum intensity among the eight directions. The gradient direction is set, and the intensity value is set as the concentration gradient intensity value. Then, a threshold value for determining the feature amount from the density gradient intensity distribution is set (step 304), the pattern is divided into M × N regions (step 305), and the feature values are totaled for each region (step 3).
06), the feature amount is calculated for the case without weight and the case with weight (steps 307 and 308).

【0050】なお、図9に示した処理例では大分類一位
候補と二位候補(一位とは異カテゴリ)間の処理につい
て説明したが、適用する候補の範囲を拡張した場合につ
いて説明する。
In the processing example shown in FIG. 9, the processing between the large-class first-ranked candidate and the second-ranked candidate (a category different from the first-ranked candidate) has been described, but a case where the range of the candidate to be applied is expanded will be described. .

【0051】まず大分類一位と同一カテゴリの候補文字
と、一位とは異なるカテゴリ候補文字の全組み合わせに
ついて、詳細分類処理1(図9)を適用する。ただし、
しきい値関数での判定すなわちリジェクトは設定しな
い。
First, the detailed classification process 1 (FIG. 9) is applied to all combinations of candidate characters in the same category as the first major classification and category candidate characters different from the first major classification. However,
Judgment by the threshold function, that is, rejection is not set.

【0052】異カテゴリの候補文字との詳細分類処理に
全勝する候補文字、すなわち比較するすべての候補より
も小さい距離値となる候補文字があれば、その候補文字
のカテゴリを出力し、なければリジェクトする。
If there is a candidate character that wins all detailed classification processing with a candidate character of a different category, that is, a candidate character having a distance value smaller than all the candidates to be compared, the category of the candidate character is output, and if there is no reject character, it is rejected. To do.

【0053】例えば大分類での候補カテゴリが3種類現
れるまでの順位までの候補について処理を適用した例を
示す。次表に示すように大分類一位「フォントAのカテ
ゴリ0」と同一カテゴリの候補文字である「フォントB
のカテゴリ0、フォントDのカテゴリ0、フォントFの
カテゴリ0」それぞれと、大分類一位と異なるカテゴリ
の候補文字である「フォントCのカテゴリ6、フォント
Eのカテゴリ6、フォントGのカテゴリ8」の全組み合
わせについて、図9に示した詳細分類処理を実施する。
For example, an example is shown in which the processing is applied to candidates up to the rank of three types of candidate categories in the large classification. As shown in the table below, "Font B," which is a candidate character in the same category as "Category 0 of font A", which is ranked first in the major categories.
Category 0, font D category 0, font F category 0 "and" C category 6 of font C, category 6 of font E, category 8 of font G "which are candidate characters of categories different from the first place in the major classification. The detailed classification process shown in FIG. 9 is performed for all combinations of.

【0054】 この表では詳細分類特徴での距離値が、比較する候補文
字よりも小さい場合「勝ち○」と表現し、大きい場合、
「負け×」と表現している。大分類二位の「フォントB
のカテゴリ0」が詳細分類特徴での距離値が、すべての
異カテゴリ候補文字よりも小さな距離値となり全勝した
ことを示している。よって最終候補文字はフォントBの
カテゴリ0で出力する。
[0054] In this table, if the distance value in the detailed classification feature is smaller than the candidate character to be compared, it is expressed as "winning ○", and if it is larger,
It is expressed as "Loss x". "Font B", which is the second largest category
“Category 0” indicates that the distance value in the detailed classification feature is smaller than all the different category candidate characters and that all the wins have been achieved. Therefore, the final candidate character is output in the font 0 category 0.

【0055】また他の処理例について説明する。まず大
分類n位までの候補文字間で総当たりの詳細分類処理1
(図9)を適用する。ただし、しきい値関数での判定す
なわちリジェクトは設定しない。
Another processing example will be described. First, brute force detailed classification processing between candidate characters up to the nth major classification 1
(Figure 9) applies. However, the judgment by the threshold function, that is, the rejection is not set.

【0056】前記例と同様に異カテゴリの候補文字との
詳細分類処理に全勝する候補文字、すなわち比較するす
べての候補よりも小さい距離値となる候補文字があれ
ば、その候補文字のカテゴリを出力し、なければリジェ
クトする。全勝するカテゴリが複数発生した場合リジェ
クトする。
Similar to the above example, if there is a candidate character that wins all the detailed classification processing with candidate characters of different categories, that is, a candidate character having a distance value smaller than all the candidates to be compared, the category of the candidate character is output. If not, reject it. Reject if multiple categories that win all games occur.

【0057】例えば大分類の上位5位までの候補文字に
ついて処理を適用した例を示す。 この表では詳細分類特徴での距離値が、比較する候補文
字よりも小さい場合「勝ち○」と表現し、大きい場合、
「負け×」と表現している。大分類二位の「フォントB
のカテゴリ0」が詳細分類特徴での距離値が、すべての
異カテゴリ候補文字よりも小さな距離値となり全勝した
ことを示している。よって最終候補文字はフォントBの
カテゴリ0で出力する。
For example, an example is shown in which the processing is applied to the top 5 candidate characters in the major classification. In this table, if the distance value in the detailed classification feature is smaller than the candidate character to be compared, it is expressed as "winning ○", and if it is larger,
It is expressed as "Loss x". "Font B", which is the second largest category
“Category 0” indicates that the distance value in the detailed classification feature is smaller than all the different category candidate characters and that all the wins have been achieved. Therefore, the final candidate character is output in the font 0 category 0.

【0058】この方法によれば、大分類結果の組み合わ
せごとに、分類に適した特徴抽出方法を用いて判定する
ことができるため、全体の認識精度の向上をはかること
が可能となる。
According to this method, since it is possible to make a determination for each combination of large classification results using a feature extraction method suitable for classification, it is possible to improve the overall recognition accuracy.

【0059】例えば図11(a) に示すように部分的な汚
れをもつ0が入力されたとき、図11(b) に示すように
特徴値重みなしの文字特徴を用いた場合大分類での距離
値は“8”<“0”で出力結果はエラーであるが、図1
1(c) のように特徴値重みありの部分特徴を用いた詳細
分類での距離値が“8”>“0”となり出力結果は正解
もしくはリジェクトとなる。
For example, when 0 having a partial stain is input as shown in FIG. 11A, when character features without feature value weighting are used as shown in FIG. The distance value is "8"<"0" and the output result is an error.
The distance value in the detailed classification using the partial features with feature value weighting as in 1 (c) is “8”> “0”, and the output result is the correct answer or the reject.

【0060】大分類一位がカテゴリ8(フォントi)
で、二位がカテゴリ0の組み合わせでの詳細分類辞書作
成処理(図5)の結果を次表に示す。
The first major category is category 8 (font i)
The following table shows the result of the detailed classification dictionary creation process (FIG. 5) when the second rank is the category 0 combination.

【0061】 評価値Vが最小、つまりリジェクト、エラー率が小さく
なる特徴抽出方法は、特徴値重みあり、部分特徴であっ
た。詳細分類辞書には、 ・特徴抽出方法および特徴量 ・しきい値関数および評価値V=5.0が格納される。
[0061] The feature extraction method in which the evaluation value V is the minimum, that is, the reject and error rates are small, is the feature value weighting and the partial feature. The detailed classification dictionary stores: -feature extraction method and feature amount-threshold function and evaluation value V = 5.0.

【0062】実際に、大分類一位がカテゴリ8(フォン
トi)で二位がカテゴリ0の組み合わせについて、大分
類の出力結果でリジェクト、エラーが発生しやすい入力
パターンの内容を確認すると、図11のように0の中央
が部分的に汚れていたり、背景絵柄があるという傾向が
あった。この傾向には汚れや背景絵柄の不安定な情報を
曖昧さで表現できれば分類が可能になると考えられる。
Actually, for the combination of the category 8 (font i) in the first major category and the category 0 in the second major category, the contents of the input patterns that are likely to cause rejects and errors in the output results of the major categories are as shown in FIG. There was a tendency that the center of 0 was partially soiled or there was a background pattern. It is considered that this tendency can be classified if stains and unstable information of the background picture can be represented by ambiguity.

【0063】この場合、かすれ、汚れなど不安定な特徴
値を多値で表現し、あいまいさを分類判定に用いる特徴
抽出方法が、自動的に選択されているので、認識制度が
向上する。
In this case, since the feature extraction method in which unstable feature values such as faintness and dirt are expressed in multivalues and the ambiguity is used for classification determination is automatically selected, the recognition system is improved.

【0064】また図12(a) に示すように入力カテゴリ
が3であるとき、大分類1位の結果はフォントjのカテ
ゴリ8となって大分類結果はエラーであるが詳細分類に
よって正解となり認識精度の向上をはかることができ
る。
As shown in FIG. 12 (a), when the input category is 3, the result of the first major classification is category 8 of font j, and the major classification result is an error, but the correct answer is recognized by the detailed classification. The accuracy can be improved.

【0065】すなわちこのとき、図12(b) に示すよう
に特徴値重みなしの文字特徴を用いた大分類での距離値
は“8”<“3”で出力結果はエラーであるが、図12
(c)のように特徴値重みありの左右対称度特徴2では詳
細分類での距離値が“8”>“3”となり出力結果は正
解となる。
That is, at this time, as shown in FIG. 12B, the distance value in the large classification using the character features without feature value weighting is "8"<"3", and the output result is an error. 12
As shown in (c), in the left-right symmetry feature 2 with feature value weighting, the distance value in the detailed classification is “8”> “3”, and the output result is the correct answer.

【0066】また大分類一位がカテゴリ8である場合
(フォントj)で、二位がカテゴリ3の組み合わせでの
詳細分類辞書作成処理(図5)の結果を次表に示す。
The following table shows the result of the detailed classification dictionary creation processing (FIG. 5) in the case where the first major classification is category 8 (font j) and the second largest classification is a combination of categories 3.

【0067】 評価値Vが最小、つまりリジェクト、エラー率が小さく
なる特徴抽出方法は、特徴値重みあり、左右対称度特徴
2であった。詳細分類辞書には、 ・特徴抽出方法(特徴値重みあり、左右対称度特徴2)
および特徴量 ・しきい値関数および評価値V=18.2が格納され
る。
[0067] The feature extraction method in which the evaluation value V is the minimum, that is, the reject and the error rate are small is the feature value weighting and the symmetry degree feature 2. The detailed classification dictionary includes: -feature extraction method (feature value weighting, left / right symmetry feature 2)
And feature amount-The threshold value function and the evaluation value V = 18.2 are stored.

【0068】実際に、大分類一位がカテゴリ8(フォン
トj)で二位がカテゴリ3の組み合わせについて、大分
類の出力結果で,リジェクト、エラーが発生しやすい入
力パターンの内容を確認すると、図12のように、8に
類似した3という傾向があった。
Actually, for the combination of category 8 (font j) in the first major category and category 3 in the second major category, the output result of the major category confirms the contents of the input pattern that is likely to cause rejection or error. Like 12, there was a tendency for 3 to be similar to 8.

【0069】大分類一位がカテゴリ8(フォントj)で
二位がカテゴリ3という結果を得た場合、候補カテゴリ
8と3との差異が大きい文字左中央部分の特徴に注目す
ればよいと思われるが、ずれなどの変動を考慮している
本手法によって文字中央部の左右対称性が表現される特
徴抽出方法の方が認識精度を向上させるために適してい
ることが明確になる。
When the result that the first major category is category 8 (font j) and the second major category is category 3 is to focus on the feature of the character left center part where the difference between candidate categories 8 and 3 is large. However, it is clarified that the feature extraction method that expresses the left-right symmetry of the central part of the character is more suitable for improving the recognition accuracy by the method that considers the variation such as the shift.

【0070】また大分類一位が、フォントkのカテゴリ
5の場合、図13(a) に示すように入力カテゴリが6
(かすれ、文字中心の位置ずれがある)であるとき、大
分類結果はエラーであるが詳細分類によって正解となり
認識精度の向上をはかることができる。
When the first major classification is category 5 of font k, the input category is 6 as shown in FIG. 13 (a).
If there is (blurring or misalignment of the character center), the result of the large classification is an error, but a correct answer is obtained by the detailed classification, and the recognition accuracy can be improved.

【0071】すなわちこのとき、図13(b) に示すよう
に特徴値重みなしの文字特徴を用いた大分類での距離値
は“5”<“6”で出力結果はエラーであるが、図13
(c)に示すように、特徴値重みありの対角対称度特徴1
では詳細分類での距離値が“6”>“5”となり出力結
果は正解もしくはリジェクトとなる。
That is, at this time, as shown in FIG. 13 (b), the distance value in the large classification using the character features without feature value weighting is "5"<"6", and the output result is an error. Thirteen
As shown in (c), diagonal symmetry feature 1 with feature value weighting
Then, the distance value in the detailed classification becomes “6”> “5”, and the output result becomes the correct answer or the reject.

【0072】また大分類一位がカテゴリ5である場合
(フォントk)で、二位がカテゴリ6の組み合わせでの
詳細分類辞書作成処理(図5)の結果を次表に示す。
The following table shows the result of the detailed classification dictionary creation process (FIG. 5) in the case where the first major classification is category 5 (font k) and the second largest classification is a combination of category 6.

【0073】 評価値Vが最小、つまりリジェクト、エラー率が小さく
なる特徴抽出方法は、特徴値重みあり、対角対称度特徴
1であった。詳細分類辞書には、 ・特徴抽出方法(特徴値重みあり、対角対称度特徴1)
および特徴量 ・しきい値関数および評価値V=23.2が格納され
る。
[0073] The feature extracting method with the smallest evaluation value V, that is, the reject and the error rate being small, was the feature 1 with the feature value weighting. The detailed classification dictionary includes: -Feature extraction method (feature value weighting, diagonal symmetry feature 1)
And feature amount-The threshold value function and the evaluation value V = 23.2 are stored.

【0074】実際に、大分類一位がカテゴリ5(フォン
トk)で二位がカテゴリ6の組み合わせについて、大分
類の出力結果でリジェクト、エラーが発生しやすい入力
パターンの内容を確認すると、図13のように6の左部
分がかすれ、文字中心が位置ずれしているという傾向が
あった。
Actually, for the combination of category 5 (font k) in the first major category and category 6 in the second major category, when the contents of the input pattern in which rejection and error are likely to occur are confirmed in the output result of the major category, FIG. As shown in FIG. 6, the left part of 6 was faint, and the center of the character was displaced.

【0075】大分類一位がカテゴリ5(フォントk)で
二位がカテゴリ6という結果を得た場合、候補カテゴリ
5と6との差異が大きい文字左部分の特徴(重みなし、
部分特徴)で比較すると、入力パターンは左上部はカテ
ゴリ6に類似し、左下部はカテゴリ5に類似する結果と
なり、判定不可能となる。しかし、本発明の方法で自動
的に選択された左上部と右下部の対角対称度特徴1(図
13)を用いるとカテゴリ5は対称性がなく、カテゴリ
6は対称性があるという特色を用いることになり判定可
能となる。
When the result that the first major category is category 5 (font k) and the second major category is category 6 is, the features of the left part of the character with a large difference between the candidate categories 5 and 6 (no weight,
Comparing with (partial feature), the input pattern has a result that the upper left part is similar to category 6 and the lower left part is similar to category 5, and it is impossible to determine. However, using the upper left and lower right diagonal symmetry features 1 (FIG. 13) that are automatically selected by the method of the present invention, the characteristic is that category 5 has no symmetry and category 6 has symmetry. It will be used and can be judged.

【0076】なお複数の文字特徴抽出方法で分類し、そ
れぞれの出力値を分類判定に用いることも可能である。
It is also possible to classify by a plurality of character feature extraction methods and use the respective output values for classification determination.

【0077】[0077]

【発明の効果】以上説明してきたように、本発明によれ
ば、認識対象や文字特徴抽出方法が追加されても、追加
後の辞書と特徴抽出方法で認識評価すればよく、辞書作
成側では辞書のメンテナンスが容易であり、容易に高精
度の認識を行うことが可能となる。
As described above, according to the present invention, even if a recognition target or a character feature extraction method is added, recognition and evaluation can be performed using the dictionary and feature extraction method after the addition. The maintenance of the dictionary is easy, and it is possible to easily perform highly accurate recognition.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の方法を示す説明図FIG. 1 is an explanatory diagram showing a method of the present invention.

【図2】本発明による大分類辞書の作成フローチャート
FIG. 2 is a flowchart of creating a large classification dictionary according to the present invention.

【図3】入力する文字データの一例を示す図FIG. 3 is a diagram showing an example of input character data.

【図4】変形パターンの発生例を示すFIG. 4 shows an example of generation of a deformation pattern.

【図5】本発明による詳細分類辞書の作成フローチャー
ト図
FIG. 5 is a flowchart of creating a detailed classification dictionary according to the present invention.

【図6】正解の集団とエラーの集団の距離値頻度分布を
示す図
FIG. 6 is a diagram showing a distance value frequency distribution of a correct answer group and an error group.

【図7】しきい値関数決定の説明図FIG. 7 is an explanatory diagram of determination of a threshold function.

【図8】しきい値関数決定の一例を示す図FIG. 8 is a diagram showing an example of determination of a threshold function.

【図9】詳細分類処理例を示すフローチャートを示す図FIG. 9 is a diagram showing a flowchart showing an example of detailed classification processing.

【図10】文字特徴抽出のフローチャートを示す図FIG. 10 is a diagram showing a flowchart of character feature extraction.

【図11】本発明の装置を用いた認識処理を示す図FIG. 11 is a diagram showing a recognition process using the device of the present invention.

【図12】本発明の装置を用いた認識処理を示す図FIG. 12 is a diagram showing a recognition process using the device of the present invention.

【図13】本発明の装置を用いた認識処理を示す図FIG. 13 is a diagram showing a recognition process using the device of the present invention.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 文字パターンに対し、大分類後の詳細分
類において、複数の特徴抽出方法を設定しておき、 各特徴抽出方法毎に分類判定しきい値を算出して、分類
精度を評価し、その分類精度の評価値が最小である特徴
抽出方法と判定しきい値および分類精度の評価値を辞書
として格納する辞書作成手段と、 前記大分類結果での類似候補間の分類に適した特徴抽出
方法と判定しきい値を辞書からよみ込み、詳細分類を行
うパターン認識手段とを具備したことを特徴とするパタ
ーン認識装置。
1. A plurality of feature extraction methods are set in the detailed classification after the major classification for a character pattern, and a classification determination threshold value is calculated for each feature extraction method to evaluate the classification accuracy. A feature extraction method having the smallest evaluation value of the classification accuracy, a dictionary creating means for storing the judgment threshold value and the evaluation value of the classification accuracy as a dictionary, and a feature suitable for classification between similar candidates in the large classification result. A pattern recognition device comprising: a pattern recognition means for performing detailed classification by reading an extraction method and a judgment threshold value from a dictionary.
JP7077925A 1995-04-03 1995-04-03 Pattern recognition device Pending JPH08272904A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7077925A JPH08272904A (en) 1995-04-03 1995-04-03 Pattern recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7077925A JPH08272904A (en) 1995-04-03 1995-04-03 Pattern recognition device

Publications (1)

Publication Number Publication Date
JPH08272904A true JPH08272904A (en) 1996-10-18

Family

ID=13647675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7077925A Pending JPH08272904A (en) 1995-04-03 1995-04-03 Pattern recognition device

Country Status (1)

Country Link
JP (1) JPH08272904A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146373A (en) * 2006-12-11 2008-06-26 Sharp Corp Pattern recognition method, pattern recognition program and pattern recognition device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146373A (en) * 2006-12-11 2008-06-26 Sharp Corp Pattern recognition method, pattern recognition program and pattern recognition device

Similar Documents

Publication Publication Date Title
US6970601B1 (en) Form search apparatus and method
EP0166598B1 (en) Pattern recognition apparatus
US6636631B2 (en) Optical character reading method and system for a document with ruled lines and its application
US6021220A (en) System and method for pattern recognition
KR100248917B1 (en) Pattern recognizing apparatus and method
JP2951814B2 (en) Image extraction method
US7283669B2 (en) Fine segmentation refinement for an optical character recognition system
EP1956551B1 (en) Pattern recognition apparatus, pattern recognition method, and pattern recognition program
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
GB2259599A (en) Automatic clustering method
KR19990072440A (en) Address reader and mails separater, and character string recognition method
JP5003051B2 (en) Automatic mail sorting machine and automatic mail sorting method
US20040146200A1 (en) Segmenting touching characters in an optical character recognition system to provide multiple segmentations
JP3965983B2 (en) Image processing method and apparatus
JP4802176B2 (en) Pattern recognition apparatus, pattern recognition program, and pattern recognition method
JP2007058882A (en) Pattern-recognition apparatus
JP3095069B2 (en) Character recognition device, learning method, and recording medium storing character recognition program
JPH08272904A (en) Pattern recognition device
JPH1063789A (en) Learning method for discriminant function
Cinque et al. Optimal range segmentation parameters through genetic algorithms
JPH11328309A (en) Method and device for optical character read
JPH08263655A (en) Pattern recognition method
Graf et al. Analysis of complex and noisy check images
JP2007026470A (en) Pattern recognition device
KR970002424B1 (en) Candidate character classifying method