JP2643293B2 - Dictionary creation method - Google Patents
Dictionary creation methodInfo
- Publication number
- JP2643293B2 JP2643293B2 JP63120340A JP12034088A JP2643293B2 JP 2643293 B2 JP2643293 B2 JP 2643293B2 JP 63120340 A JP63120340 A JP 63120340A JP 12034088 A JP12034088 A JP 12034088A JP 2643293 B2 JP2643293 B2 JP 2643293B2
- Authority
- JP
- Japan
- Prior art keywords
- mesh
- area
- region
- dictionary
- membership
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Image Analysis (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 A.産業上の利用分野 本発明は文字や図形等のパターンを認識するために用
いられる辞書を作成する方法に関するものである。The present invention relates to a method for creating a dictionary used for recognizing patterns such as characters and figures.
B.発明の概要 本発明は、文字や図形等のパターンを認識するために
用いられ、前記パターンの照合の対象となる辞書を作成
する方法において、 パターンの特徴点の位置関係を表現するためにあいま
い集合(ファジィ集合)の概念を取り入れ、メッシュ領
域を割り当てて各メッシュ毎に特徴点の出現頻度を求め
ると共に、メッシュ領域を分離して分離領域毎にメッシ
ュ領域の全体を正規化し、分離領域毎に1次元ファジィ
辞書を作成し、更に各分離領域の全領域に対する2次元
ファジィ辞書を作成することによって、 辞書を自動的に生成することができ、しかも辞書登録
のためのマニュアル作業時間を短縮することができ、更
に記憶容量の低減化を図ることができるようにしたもの
である。B. Summary of the Invention The present invention is used for recognizing patterns such as characters and figures, and in a method of creating a dictionary to be compared with the pattern, the method for expressing a positional relationship between feature points of the pattern. The concept of fuzzy set (fuzzy set) is adopted, mesh areas are allocated, the appearance frequency of feature points is obtained for each mesh, and the mesh areas are separated to normalize the entire mesh area for each separated area. A dictionary can be automatically generated by creating a one-dimensional fuzzy dictionary in addition to a two-dimensional fuzzy dictionary for all areas of each separation area, and shortening the manual work time for dictionary registration. The storage capacity can be further reduced.
C.従来の技術 文字や図形等のパターンを認識する場合、例えば、書
類や図面等をイメージスキャナ等の入力装置で操作して
得られる黒と白の2値画像データ(入力パターン)に基
づいて、予め記憶されている文字や図形の標準パターン
(辞書パターン)と位置等を照合し、辞書パターンの中
から最も重なり合うものを最終的に認識結果として求め
ている。C. Prior Art When recognizing patterns such as characters and figures, for example, based on black and white binary image data (input pattern) obtained by operating a document or drawing with an input device such as an image scanner. The position and the like are compared with a standard pattern (dictionary pattern) of characters or figures stored in advance, and the most overlapped dictionary pattern is finally obtained as a recognition result.
認識方法の具体例として、例えば、入力パターンと辞
書パターンをそれぞれ小さな正方格子状(メッシュ)に
区切り、格子点が文字や図形である場合には黒(1)、
そうでないときは白(0)と表す場合において、入力と
辞書の2つのパターンの重なりの程度をハミング距離を
用いて求めることができる。これは、入力と辞書が黒と
黒または白と白の場合には0、黒と白または白と黒の場
合には1とおき、その総和を求めるものである。つま
り、黒と黒、白と白のように重なり合っていればいるほ
ど、その総和(ハミング距離)が小さくなる。この性質
により、多数の辞書パターンの中から入力パターンと最
も重なり合っているもの、すなわち、ハミング距離が最
も小さいものを認識結果とするものである。As a specific example of the recognition method, for example, the input pattern and the dictionary pattern are each divided into small square lattices (mesh), and black (1) when the lattice points are characters or figures,
Otherwise, in the case of expressing white (0), the degree of overlap between the two patterns of the input and the dictionary can be obtained using the Hamming distance. In this case, 0 is set when the input and the dictionary are black and black or white and white, and 1 is set when the input and dictionary are black and white or white and black. That is, the more they overlap, such as black and black, and white and white, the smaller the sum (Humming distance). Due to this property, a pattern that most overlaps with the input pattern among a large number of dictionary patterns, that is, a pattern with the smallest Hamming distance is used as a recognition result.
D.発明が解決しようとする課題 この方法だと入力パターンの位置が辞書パターンの位
置とずれていたり、大きさが異なっていたり、傾きが異
なっていたりすると、重なりの程度が変わってしまい、
認識の誤りが生じやすい欠点がある。D. Problems to be solved by the invention With this method, if the position of the input pattern is shifted from the position of the dictionary pattern, the size is different, or the inclination is different, the degree of overlap will change,
There is a disadvantage that recognition errors easily occur.
また、記憶容量の点でも問題がある。1文字あるいは
1図形パターンの必要空間は表示のための文字フォント
のように8×8画素(英数字)や24×24画素(漢字)の
空間では済まず、線の切れやつぶれを極力避けるため少
なくともその3〜5倍の空間を必要とする。特に、漢字
や複雑な図形の場合128×128画素程度以上確保しないと
安定な処理が望めないことになる。There is also a problem in terms of storage capacity. The space required for one character or one graphic pattern is not limited to the space of 8 x 8 pixels (alphanumeric characters) or 24 x 24 pixels (kanji) like a character font for display. At least 3 to 5 times the space is required. In particular, in the case of kanji or complicated figures, stable processing cannot be expected unless about 128 × 128 pixels or more are secured.
文字や図形パターンの辞書種別は漢字の場合第二水準
を含めると6000字種以上に及び、図形の場合でも多いと
きには1000字種以上になる。The dictionary type of characters and graphic patterns is more than 6000 characters including the second level in the case of Chinese characters, and more than 1000 characters when there are many figures.
このような膨大な辞書種別に対して、1辞書毎に128
×128画素を確保するとすれば、メモリとして2Kバイト
が必要となる。つまり、先の漢字では12Mバイト以上、
図形で2Mバイト以上もの記憶領域が必要となる。For such a huge dictionary type, 128
Assuming that × 128 pixels are secured, 2K bytes are required as memory. In other words, the previous kanji is over 12MB,
A figure requires a storage area of 2 Mbytes or more.
ハードウェア構成上この容量は無視できないほど大き
く、また、辞書の探索や整合処理にも処理時間などで影
響を与えることになる。Due to the hardware configuration, this capacity is so large that it cannot be ignored, and also affects the search and matching processing of the dictionary due to processing time and the like.
更に、辞書種別の点からいえば、上述の膨大な種別に
ついてひとつひとつ辞書をマニュアルで登録する作業が
必要とされており、そのための作業時間も膨大となる問
題点がある。Further, in terms of dictionary types, it is necessary to manually register the dictionaries one by one for each of the enormous types described above, and there is a problem that the time required for the work is enormous.
以上まとめると、従来技術には以下の大きな3つの課
題が残されている。In summary, the prior art has the following three major problems.
認識精度の高い認識手法の確立 記憶容量低減のための辞書構成方法の確立 辞書の自動生成方法の確立 本発明は、このうち特にの問題点の解決に主眼をお
いたものである。Establishment of a recognition method with high recognition accuracy Establishment of a dictionary construction method for reducing storage capacity Establishment of an automatic dictionary generation method The present invention focuses on solving particular problems.
E.課題を解決するための手段 文字や図形パターンは人間の歴史的または経験的規則
に従って記述された位置関係にあるが、パターンを特徴
づける点(特徴点)そのものはあいまい性を有してい
る。E. Means to solve the problem Characters and graphic patterns have a positional relationship described according to human historical or empirical rules, but the points that characterize the pattern (feature points) themselves have ambiguity. .
例えば、第3図aの○印で示す文字“A"の代表的な特
徴点の場合(これを頂点と呼ぶものとする)、頂点の位
置そのものは他の特徴点からみて左に振れたり(同図
b)、右に振れたり(同図c)する。また、頂点のとこ
ろで切れたり(同図d)もする。For example, in the case of a representative feature point of the character “A” indicated by a circle in FIG. 3A (this is referred to as a vertex), the position of the vertex itself is shifted left as viewed from other feature points ( FIG. B), and swings to the right (FIG. C). In addition, it is cut off at the vertex (d in the figure).
しかし、同図eのように、頂点の部分だけが他の特徴
点より下の方に位置することはありえない。However, it is unlikely that only the vertex is located below other feature points as shown in FIG.
結局、文字“A"の頂点というものは、他の特徴点より
位置関係でいうと上の方でかつまん中付近にある、とい
う極めてあいまいな尺度で規則性を持っているというこ
とになる。As a result, the vertex of the character "A" has regularity on a very ambiguous scale that it is closer to the center and closer to the center in terms of positional relationship than other feature points.
本発明は、このように文字や図形パターンの特徴点の
位置関係にあいまい性があることを考慮して、その位置
関係をあいまい集合(ファジィ集合)の概念を取り入れ
て表現し、これを辞書に登録しようとするものである。The present invention takes into account the fact that the positional relationship between the characteristic points of a character or a graphic pattern has ambiguity, expresses the positional relationship by introducing the concept of an ambiguous set (fuzzy set), and expresses this in a dictionary. You are trying to register.
第1図に本発明方法のフローを示すと、先ずあるパタ
ーンに対して多数のサンプルを作成しノイズ処理等の前
処理を行った後、各サンプルにおけるパターンの特徴点
を抽出する。そしてパターンが描かれる平面領域にm×
n個(m,nは整数)のメッシュ領域を割り当てると共
に、このメッシュ領域内の各メッシュ毎に前記特徴点の
出現回数である出現頻度を求めて、メッシュ領域に対応
する出現頻度分布を作成する。FIG. 1 shows the flow of the method of the present invention. First, a large number of samples are prepared for a certain pattern, preprocessing such as noise processing is performed, and then feature points of the pattern in each sample are extracted. And mx in the plane area where the pattern is drawn
In addition to allocating n (m and n are integers) mesh regions, an appearance frequency that is the number of appearances of the feature point is obtained for each mesh in the mesh region, and an appearance frequency distribution corresponding to the mesh region is created. .
しかる後に各メッシュの出現頻度のうち最大値をとる
メッシュを第1の領域の探索開始点として予め定めた規
則に従い第1の領域に含まれるメッシュを探索し、次い
で第1の領域以外のメッシュの中から出現頻度の最大値
をとるメッシュを第2の領域の探索開始点として、同様
に第2の領域に含まれるメッシュを探索し、こうした処
理の繰り返すことにより前記メッシュ領域を1以上の領
域に分離する。一方出現頻度を正規化するために例えば
出現頻度の総数にもとずいて基準頻度を求める。Thereafter, a mesh having the maximum value among the appearance frequencies of the respective meshes is used as a search start point of the first area, and a mesh included in the first area is searched according to a predetermined rule. Similarly, a mesh having the maximum value of the appearance frequency is set as a search start point of the second region, and a mesh included in the second region is similarly searched. By repeating such processing, the mesh region is converted into one or more regions. To separate. On the other hand, in order to normalize the appearance frequency, a reference frequency is obtained based on, for example, the total number of appearance frequencies.
続いて分離領域毎にその分離領域のみを含む前記メッ
シュ領域について各出現頻度を基準頻度を用いて正規化
してメンバーシップ値を求め、その後当該メッシュ領域
の各メッシュの1行づつについてその行に含まれるメン
バーシップ値の中から最大値を求めると共に、1列づつ
についてその列に含まれるメンバーシップ値の中から最
大値を求め、これら最大値を分離領域毎に組にして1次
元ファジィデータを作成し、これを1次元ファジィ辞書
として登録する。Subsequently, for each separation region, the appearance frequency of the mesh region including only the separation region is normalized using a reference frequency to obtain a membership value, and thereafter, each line of each mesh of the mesh region is included in the line. The maximum value is determined from the membership values that are included in each column, and the maximum value is determined from the membership values included in that column for each column, and these maximum values are grouped for each separation area to create one-dimensional fuzzy data. Then, this is registered as a one-dimensional fuzzy dictionary.
更にはまた1次元ファジィデータにもとずいて1次元
ファジィ辞書を次のようにして作成する。即ち、メッシ
ュ領域の端からi番目のメッシュ列にX座標xiを、端か
らj番目の行にY座標yjを夫々割り当てると共に、分離
領域毎に作成した1次元ファジィデータについて、xi,y
jに夫々対応するメンバーシップ値をX(i),Y(j)
と表示したとき、分離領域毎に(xi,yj)のメッシュ位
置における2次元のメンバーシップ値f(i,j)に対し
てX(i),Y(j)のうちの小さい方の値を割り当て
て、分離領域に対する2次元のメンバーシップ値の集合
を得る。Furthermore, a one-dimensional fuzzy dictionary is created based on the one-dimensional fuzzy data as follows. That is, the X coordinate xi is assigned to the i-th mesh column from the end of the mesh area, and the Y coordinate yj is assigned to the j-th row from the end, and xi, y is calculated for the one-dimensional fuzzy data created for each separation area.
X (i) and Y (j) are the membership values corresponding to j, respectively.
Is displayed, the smaller one of X (i) and Y (j) with respect to the two-dimensional membership value f (i, j) at the mesh position of (xi, yj) for each separation region. Assign to get a two-dimensional set of membership values for the isolation region.
次いでメッシュ位置(xi,yj)におけるメンバーシッ
プ値F(i,j)に対して、各分離領域のf(i,j)のうち
の最大値を割り当て、このF(i,j)の集合によって各
分離領域の全領域に対する2次元ファジィ辞書を作成す
る。Next, the maximum value of f (i, j) of each separation region is assigned to the membership value F (i, j) at the mesh position (xi, yj). A two-dimensional fuzzy dictionary is created for all areas of each separation area.
F.実施例 本発明方法の具体的手順を以下に説明する。F. Examples Specific procedures of the method of the present invention will be described below.
(1)辞書作成準備 辞書を作成するため、同一の文字、または、図形に対
して複数のサンプルを準備する。(1) Preparation for dictionary creation In order to create a dictionary, a plurality of samples are prepared for the same character or graphic.
それらはあるひとつの辞書を作成するときの辞書作成
用パターンとなる。These become patterns for creating a dictionary when a certain dictionary is created.
(2)特徴点出現頻度分布(2次元ヒストグラム)の作
成 サンプルを繰り返し入力して、それぞれ特徴点を抽出
する。(2) Creation of feature point appearance frequency distribution (two-dimensional histogram) Samples are repeatedly input and feature points are extracted.
辞書空間と同じm×n(m,nは整数)のメッシュ空間
をとり、第2図に示すようにそれらの特徴点が出現する
頻度を分布させる。The same m × n (m, n is an integer) mesh space as the dictionary space is taken, and the frequency of occurrence of these feature points is distributed as shown in FIG.
例えば、辞書空間が10×10のメッシュ空間であると
き、ヒストグラムも10×10のメッシュ空間を取る。この
とき、ある特徴点の位置がz(x,y)=(5,3)と得られ
た場合には、ヒストグラム上の位置Z(5,3)の頻度に
1を加えたものとなる。For example, when the dictionary space is a 10 × 10 mesh space, the histogram also takes a 10 × 10 mesh space. At this time, if the position of a certain feature point is obtained as z (x, y) = (5,3), one is added to the frequency of the position Z (5,3) on the histogram.
特徴点位置をz(x,y)とすれば、2次元ヒストグラ
ム上で対応する位置Z(x,y)における頻度P(x,y)
は、次式で示される。If the feature point position is z (x, y), the frequency P (x, y) at the corresponding position Z (x, y) on the two-dimensional histogram
Is represented by the following equation.
P(x,y)=P(x,y)+1 (P(x,y)の初期値0) (1) (3)特徴点出現頻度分布における領域分離 同一の文字、または、図形に対して、複数サンプルに
よる頻度分布を取ると、似通った位置に特徴点が出現し
やすいため、その付近に頻度のピークが存在することが
多い。P (x, y) = P (x, y) +1 (Initial value of P (x, y) 0) (1) (3) Area separation in feature point appearance frequency distribution For the same character or figure If a frequency distribution of a plurality of samples is taken, a feature point is likely to appear at a similar position, and a frequency peak is often present in the vicinity thereof.
一般的に、活字のような定形パターンの場合にはピー
ク値は鋭く高いが、手書き文字のような不定形パターン
の場合にはバラツキによりピーク値が緩やかで低くなる
傾向がある。Generally, the peak value is sharp and high in the case of a fixed pattern such as a typeface, but tends to be gentle and low due to variations in the case of an irregular pattern such as a handwritten character.
そこで、特徴点が出現しやすい領域を考慮して、辞書
に反映する必要がある。Therefore, it is necessary to reflect in the dictionary in consideration of an area where the feature points are likely to appear.
本発明方法は、特徴点出現頻度分布を用いて領域を分
離するものである。領域の分離方法は以下の手順を繰り
返すことで行う。The method of the present invention separates regions using a feature point appearance frequency distribution. The region is separated by repeating the following procedure.
探索開始点の検出 特徴点出現頻度分布における最大ピーク値(出現頻度
の最大値)をとる点Z(x,y)を第1の領域Aにおける
探索開始点(第4図の○印の点に相当する。)とする。Detection of Search Start Point The point Z (x, y) having the maximum peak value (maximum appearance frequency) in the feature point appearance frequency distribution is set as the search start point in the first area A (the point indicated by a circle in FIG. 4). Equivalent).
開始点近傍における領域の検出 探索開始点Zにおける頻度をP、Zに関する8近傍の
任意の近傍点Ziにおける頻度をPiとしたとき、次の条件
により領域Aをひろげる。なお8近傍とは第5図に示す
ようにZについて縦.横,斜め方向に隣接することであ
る。Detection of Region Near Start Point Assuming that the frequency at the search start point Z is P and the frequency at any of the eight neighboring points Zi about Z is Pi, the region A is expanded under the following conditions. In addition, as shown in FIG. Adjacent horizontally and diagonally.
Pi≠0 P≧Pi ならば Zi∈A (2) ただし、i=0,1,……,7 実際には、探索開始点Zは最大ピーク値であり、その
近傍でP<Piとはならないため、通常の場合、Pi≠0を
満たす近傍点Ziは領域Aに含まれる。If Pi ≠ 0 P ≧ Pi, Zi∈A (2) where i = 0, 1,..., 7 Actually, the search start point Z is the maximum peak value, and P <Pi does not lie in the vicinity of it. Therefore, in the normal case, the neighborhood point Zi satisfying Pi を 満 た す 0 is included in the area A.
この処理を8近傍すべてについて行う。 This process is performed for all eight neighborhoods.
探索点の移動と領域の検出 Ziが領域Aの点であれば、探索点をZiに移す。Movement of search point and detection of area If Zi is a point in area A, the search point is moved to Zi.
これを改めてZとおき、その頻度をPとする。またこ
の新しい探索点Zの8近傍の任意の近傍点を改めてZiと
おき、その頻度をPiとする。This is set to Z again, and its frequency is set to P. In addition, an arbitrary neighboring point in the vicinity of the new search point Z is set to Zi again, and its frequency is set to Pi.
このとき探索点Zに対して近傍点Ziが領域Aに含まれ
るかどうかは、次の条件式により求める。At this time, whether or not the neighboring point Zi is included in the area A with respect to the search point Z is determined by the following conditional expression.
Pi≠0,P>Pi P≧Pi-1 ならば Zi∈A (3) P≧Pi+1 ただし、i=0,1,……,7 i=0のときPi-1=P7 i=7のときPi+1=P0 この新しい探索点Zに対しても8近傍すべてについて
行う。Pi ≠ 0, P> Pi If P ≧ Pi −1 , Zi∈A (3) P ≧ P i + 1 where i = 0,1,..., 7 When i = 0, Pi −1 = P performed for 8 near all against 7 i = 7 P i + 1 = P 0 the new search points Z when.
探索点移動と領域検出の繰り返し処理 項の処理を繰り返して行うことで、領域の探索を進め
ることができる。Repetition of Search Point Movement and Area Detection The area search can be advanced by repeatedly performing the processing of the item.
これにより、どの近傍点をとっても領域Aに含まれな
くなるまで実行すれば、最終的に領域Aが定まることに
なる。As a result, if the processing is performed until the neighboring point is no longer included in the area A, the area A is finally determined.
この様子を第4図に示している。 This is shown in FIG.
図では、2つのピークを持つ特徴点出現頻度分布を表
しているが、その中で最大ピーク値は○印で囲んだ頻度
であり、その位置が探索開始点となる。この開始点の8
近傍の点はすべての手順により、領域Aに含まれる。
それらはすべて新しい探索点となるので、各探索点に対
しての手順を繰り返して行うことができる。これによ
りさらに新しく探索点が見いだされ、またの手順によ
り、………と処理が続いていく。In the figure, a feature point appearance frequency distribution having two peaks is shown, in which the maximum peak value is the frequency surrounded by a circle, and that position is the search start point. 8 of this starting point
The neighboring points are included in the area A by all the procedures.
Since all of them become new search points, the procedure for each search point can be repeated. As a result, a new search point is found, and the processing continues in the order of...
このようにして探索点がすべて見いだされて行くが、
第4図の矢印は探索点がの手順で移っていく様子を示
したものである。In this way all search points are found,
The arrows in FIG. 4 show how the search points move in the following procedure.
ここまでの処理で、最大ピーク点に続する領域が矩形
の実線で囲まれたものと決定される。With the processing up to this point, it is determined that the area following the maximum peak point is surrounded by a rectangular solid line.
特徴点頻度分布から求めた領域に対する後処理 求めた領域に対し後処理として、境界条件を考慮した
クリア処理を次のように行う。なおこの領域は一時記憶
メモリにコピーする。Post-Processing for Regions Obtained from Feature Point Frequency Distribution As post-processing for the regions obtained, clear processing is performed as follows in consideration of boundary conditions. This area is copied to the temporary storage memory.
領域の境界にある点は他の領域と接している場合、そ
ちら側に含まれても不思議でない場合もあり、あいまい
な部分である。When a point at the boundary of the region is in contact with another region, it may not be surprising that it is included on that side, and it is an ambiguous part.
従ってこの点を考慮し、第6図の4近傍で示す近傍点
で他の領域と接しているかどうかを調べることにより、
次のような処理を行っている。Therefore, considering this point, by examining whether or not the vicinity point indicated by 4 in FIG. 6 is in contact with another area,
The following processing is performed.
領域境界点をZとし、その4近傍の任意の近傍点をZi
とする。またそれらの位置における頻度をそれぞれP、
Piとする。Let Z be the region boundary point and Zi be any of the four neighboring points.
And The frequencies at those positions are P,
Pi.
このとき次のように定義する。 At this time, it is defined as follows.
定義:4つの近傍点のうち1つでも自己領域になくかつそ
の点が0でないならば、その点は他の領域に含まれる。Definition: If any one of the four neighboring points is not in the self-area and the point is not 0, the point is included in other areas.
この定義に戻つき領域境界点が他と接する場合、次式
により領域境界点の頻度を下げる処理を行っている。When the area boundary point comes back into contact with this definition, a process of reducing the frequency of the area boundary point is performed by the following equation.
P=P−1 (4) 領域境界以外の点及び境界点のうち他の領域と接して
いない点のすべてについては、頻度を0とクリアする。P = P-1 (4) The frequency is cleared to 0 for all points other than the area boundary and all points that are not in contact with other areas among the boundary points.
この様子を第7図に示している。点線で囲んだ矩形領
域の処理がこの処理にあたる。This is shown in FIG. The processing of the rectangular area surrounded by the dotted line corresponds to this processing.
全領域の検出(〜の繰り返し処理) で境界を考慮したクリア処理を行ったことにより、
特徴点出現頻度分布上では既に検出した領域が取り除か
れたことになる。By performing the clearing process in consideration of the boundary in the detection of all regions (repeating process of ~),
This means that the already detected area has been removed from the feature point appearance frequency distribution.
そこで、残された特徴点の頻度分布に基づいて最大ピ
ーク点を求めると、これは次の領域に対する領域開始点
となる。Therefore, when the maximum peak point is obtained based on the frequency distribution of the remaining feature points, this becomes the area start point for the next area.
つまりの処理に戻って次の領域を探索するという繰
り返し処理となる。In other words, the process is repeated to return to the above process and search for the next area.
〜の繰り返し処理を行って、領域が見いだされな
くなった時点で領域検出処理は終わる。第7図の例で
は、第2の領域を検出した時点で他の領域がなくなるた
め、第8図のように頻度がすべて0となり、検出処理が
終了する。The area detection processing ends when the area is no longer found after the repetition of the above processing. In the example of FIG. 7, since the other area disappears when the second area is detected, the frequency becomes all 0 as shown in FIG. 8, and the detection processing ends.
(4)ファジィ集合におけるメンバーシップ値の定義と
辞書の作成 上で求めた特徴点出現頻度分布は、特徴点がどの様な
位置に出現しやすいかという傾向を示したものである。(4) Definition of Membership Value in Fuzzy Set and Creation of Dictionary The feature point appearance frequency distribution obtained in the above shows the tendency at which positions feature points are likely to appear.
そしてまた、頻度分布に基づき特徴点を含む領域が検
出・分離できることを示した。It was also shown that a region including a feature point can be detected and separated based on the frequency distribution.
同一の文字、または、図形に対して、複数のサンプル
による頻度分布を取ると、似通った位置に特徴点が出現
しやすく、その付近に頻度のピークが存在することが多
いことを示している。If a frequency distribution of a plurality of samples is obtained for the same character or graphic, characteristic points are likely to appear at similar positions, and a frequency peak is often present near the characteristic points.
このことから逆に、ピーク位置を抽出することで特徴
点位置を推定することができる。Conversely, by extracting the peak position, the feature point position can be estimated.
本発明は、この考え方をファジィ集合におけるメンバ
ーシップ値の設定に応用したものである。The present invention applies this concept to setting membership values in fuzzy sets.
ここでは、正規化、1次元・2次元ファジィ集合のメ
ンバーシップ値の定義方法について、手順を追って以下
に示す。Here, a method of defining the membership values of the normalized one-dimensional and two-dimensional fuzzy sets will be described below step by step.
特徴点頻度分布の正規化 頻度分布は、ひとつのパターンに対するサンプル数が
多ければ多いほど、全体の頻度が高くなり、客観的な判
断をすることがむずかしくなるため、頻度分布の正規化
が必要である。Normalization of feature point frequency distribution The frequency distribution needs to be normalized because the larger the number of samples for one pattern, the higher the overall frequency and the more difficult it is to make objective judgments. is there.
特徴点が頻度分布のピークに対応する場合が多いこと
をヒントにして、次のように正規化処理を行っている。With the hint that the feature points often correspond to the peaks of the frequency distribution, the normalization processing is performed as follows.
まず、正規化の考え方を述べる。上のヒントは、特徴
点出現頻度を横軸に取り、その頻度が現れる回数(頻
度)を縦軸に取った1次元ヒストグラムを考えたとき、
横軸は特徴点出現頻度の高いものほど右側に表されるの
で、横軸のある基準点の右側に占める特徴点出現頻度は
特徴点として期待の高いものばかり集まっていることを
示している。First, the concept of normalization will be described. The above hint is based on a one-dimensional histogram in which the frequency of appearance of feature points is plotted on the horizontal axis, and the frequency (frequency) of the frequency is plotted on the vertical axis.
The higher the feature point appearance frequency is on the right side of the horizontal axis, so that the feature point appearance frequency occupying the right side of a certain reference point on the horizontal axis indicates that only those feature points with high expectations are gathered.
但し実際にはこうしたヒストグラムは取らず、次のよ
うにして簡単に基準点を求めている。However, such a histogram is not actually taken, and the reference point is easily obtained as follows.
全サンプルの特徴点数(出現頻度の合計値)をKとし
たとき、ある一定の割合Ckを乗じたものを基準点までの
ピーク抽出数kとして求める。Assuming that the number of feature points (total value of appearance frequency) of all samples is K, a value obtained by multiplying by a certain ratio Ck is obtained as a peak extraction number k up to a reference point.
k=Ck・K (5) 次に、特徴点出現頻度分布において、頻度の大きいも
のから順に捜していき、k番目の頻度の値を取るものを
求め、これを基準頻度Pkとする。これは先の1次元ヒス
トグラムにおいて、横軸の最も右側から順に求めたもの
と同様の考え方となる。k = Ck · K (5) Next, in the feature point appearance frequency distribution, search is performed in descending order of frequency, and the one that takes the value of the k-th frequency is obtained, and this is set as a reference frequency Pk. This is the same idea as the one obtained in the one-dimensional histogram in order from the rightmost side of the horizontal axis.
Pkをもとに、正規化は上記の項目(3)で分離した分
離領域毎に次式のように行う。Based on Pk, normalization is performed for each of the separation areas separated in the above item (3) as follows.
分離領域中のある頻度をPr(i,j)、正規化後の頻度
をMr(i,j)とすれば、 Mr(i,j)=1.0 …Pr(i,j)≧Pkのとき Pr(i,j)/Pk…Pr(i,j)<Pkのとき (6) ここにPr(i,j)、Mr(i,j)は夫々メッシュ領域の位
置(xi,yj)における頻度及び正規化後の頻度であり、
1≦i≦m、1≦j≦nである。また1≦r≦Rであ
り、Rは領域数である。If a certain frequency in the separation region is Pr (i, j) and the normalized frequency is Mr (i, j), then Pr (i, j) = 1.0 ... Pr (i, j) ≧ Pk (I, j) / Pk ... Pr (i, j) <Pk (6) Here, Pr (i, j) and Mr (i, j) represent the frequency and the frequency at the position (xi, yj) of the mesh region, respectively. The frequency after normalization,
1 ≦ i ≦ m and 1 ≦ j ≦ n. Also, 1 ≦ r ≦ R, where R is the number of regions.
こうして分離領域毎に、その分離領域のみを含むメッ
シュ領域(その分離領域以外の頻度を0にクリアしたメ
ッシュ領域)の総てのメッシュの頻度について正規化を
行う。In this way, for each separation region, the frequency of all meshes in the mesh region including only the separation region (mesh region other than the separation region, the frequency of which is cleared to 0) is normalized.
1次元ファジィ集合におけるメンバーシップ値の定義 で求めた正規化した頻度Mr(i,j)は、0〜1の実
数区間にあり1.0に近づくほど特徴点出現頻度が高く、
含まれる位置は特徴をよく表した点である可能性が高
い。つまり、1.0に近づくほど、その確信度が高いとい
えるので、特徴点位置というあいまいな尺度を示す指標
となり得、そのままメンバーシップ値として使用するこ
とも可能である。The normalized frequency Mr (i, j) obtained by the definition of the membership value in the one-dimensional fuzzy set is in a real number section of 0 to 1, and the appearance frequency of the feature point becomes higher as it approaches 1.0,
It is highly likely that the included positions are points that express the features well. In other words, the closer the value is to 1.0, the higher the degree of certainty is. Therefore, it can be used as an index indicating an ambiguous measure of the feature point position, and can be used as it is as a membership value.
ここでは、更にこの考え方を発展させて、分離領域毎
に求めたMr(i,j)をもとに、x軸,y軸に射影させて、
1次元のファジィ集合におけるメンバーシップ値を求め
る方法を示す。Here, this idea is further developed, and based on Mr (i, j) obtained for each separation area, the projection is performed on the x-axis and the y-axis.
A method for obtaining a membership value in a one-dimensional fuzzy set will be described.
x方向メンバーシップ値即ち座標xiに対応するメンバ
ーシップ値をXr(i)とすれば、次の計算で求める。Assuming that the membership value in the x direction, that is, the membership value corresponding to the coordinate xi is Xr (i), the membership value is obtained by the following calculation.
Xr(i)=max(Mr(i,j),Mr(i,2),……,Mr(i,
n)) (7) y方向メンバーシップ値即ち座標xjに対応するメンバ
ーシップ値をYr(j)とすれば、次の計算で求める。Xr (i) = max (Mr (i, j), Mr (i, 2), ..., Mr (i,
n)) (7) Assuming that the membership value corresponding to the y-direction membership value, that is, the coordinate xj is Yr (j), the value is obtained by the following calculation.
Yr(j)=max(Mr(i,j),Mr(2,j),……,Mr(m,
j)) (8) ただしmax(a,b,c)はa,b,cの中の最大値を表現して
いる。また1≦i≦m、1≦j≦nである。Yr (j) = max (Mr (i, j), Mr (2, j), ..., Mr (m,
j)) (8) where max (a, b, c) represents the maximum value among a, b, c. Also, 1 ≦ i ≦ m and 1 ≦ j ≦ n.
これにより、あるひとつの分離領域rにおいてx,yの
各1次元方向に対するメンバーシップ値の組が、それぞ
れm,n個得られ、以て1次元ファジィデータが得られ
る。As a result, m and n sets of membership values for each one-dimensional direction of x and y are obtained in one certain separation region r, and one-dimensional fuzzy data is obtained.
2次元ファジィ辞書の作成 上記のメンバーシップ値を用いて、あるひとつの領域
rにおける2次元のメンバーシップ値を次のようにして
求める。Creation of Two-Dimensional Fuzzy Dictionary Using the above membership values, a two-dimensional membership value in one region r is determined as follows.
fr(i,j)=min(Xr(i),Yr(j)) (9) ただしmin(a,b,c)はa,b,cの中の最小値を表現して
いる。fr (i, j) = min (Xr (i), Yr (j)) (9) where min (a, b, c) represents the minimum value among a, b, c.
例えばfr(4,0)のときはXr(4)とYr(0)を比較
してその小さいものを選び、Xr(4)が小さい場合はfr
(4,0)はXr(4)の値を取る。また同様にfr(6,3)の
とき、Xr(6)とYr(3)を比較してYr(3)が小さい
場合は、fr(6,3)はYr(3)の値を取る。このように
して、m×nについて求めることにより、領域rに対す
る2次元のメンバーシップ値の集合が得られる。これを
全領域について求める。For example, when fr (4,0), Xr (4) is compared with Yr (0) and the smaller one is selected. When Xr (4) is smaller, fr is smaller.
(4,0) takes the value of Xr (4). Similarly, when fr (6,3), Xr (6) is compared with Yr (3), and if Yr (3) is smaller, fr (6,3) takes the value of Yr (3). In this way, by obtaining m × n, a set of two-dimensional membership values for the region r is obtained. This is obtained for all regions.
ファジィ集合の概念により、全領域に対する和集合を
次のように取れば、ひとつのパターンに対してひとつの
辞書が得られる。According to the concept of the fuzzy set, if a union for all areas is obtained as follows, one dictionary can be obtained for one pattern.
F(i,j)=max(f1(i,j),f2(i,j),…… ……,fR(i,j)) (10) 例えば、F(2,5)のとき、f1(2,5)からfR(2,5)
までの各値を比較して、その中で最大値を取るものをF
(2,5)とする。すなわち、f1(2,5)からfR(2,5)ま
でのうち最大値がf4(2,5)であれば、F(2,5)はf
4(2,5)の値を取ればよい。F (i, j) = max (f 1 (i, j), f 2 (i, j),..., F R (i, j)) (10) For example, for F (2,5) When f 1 (2,5) to f R (2,5)
, And the one that takes the maximum value is F
(2,5). That is, if the maximum value from f 1 (2,5) to f R (2,5) is f 4 (2,5), F (2,5) becomes f (2,5).
4 You just need to take the value of (2,5).
以上のようにして、ひとつのパターンの複数個のサン
プルから辞書を作成できる。As described above, a dictionary can be created from a plurality of samples of one pattern.
(4)複数パターン辞書作成 複数のパターンを取り扱う場合は、(1)〜(3)を
繰り返せばよい。(4) Creation of a plurality of pattern dictionaries When handling a plurality of patterns, (1) to (3) may be repeated.
(5)辞書作成例 第9図は文字「A」の特徴点頻度分布を示す図であ
り、この例ではある領域に9×9のメッシュ領域をと
り、文字「A」の最上端の位置を特徴点としたものであ
る。第10図は、第9図に示す特徴点頻度分布に対して上
記(3)項で述べた処理を実行することによりメッシュ
領域を複数の領域に分離し、更に上記(4),項で
述べた処理を実行することにより作成した1次元ファジ
ィデータを示す図である。第11図は第10図に示す1次元
ファジィデータに対して上記(4)項で述べた処理を
実行することにより作成した2次元ファジィ辞書であ
る。(5) Example of dictionary creation FIG. 9 is a diagram showing the characteristic point frequency distribution of the character “A”. In this example, a 9 × 9 mesh area is set in a certain area, and the uppermost position of the character “A” is determined. These are feature points. FIG. 10 shows that the mesh area is divided into a plurality of areas by performing the processing described in the above item (3) on the feature point frequency distribution shown in FIG. 9, and further described in the above item (4). FIG. 9 is a diagram showing one-dimensional fuzzy data created by executing the above-described processing. FIG. 11 is a two-dimensional fuzzy dictionary created by executing the processing described in the above item (4) on the one-dimensional fuzzy data shown in FIG.
次に本発明方法を実行するための回路について述べる
と、第12図に示すように文字や図形等のサンプルパター
ン1に対して走査回路2により走査が行われ、次いでそ
の走査結果に対してノイズ処理や大きさの正規化といっ
た前処理が前処理回路3により施される。なお走査回路
2はコントローラ6の制御の下に多数のサンプルについ
て走査を行う。前処理回路3から出力されたデータは特
徴点抽出回路4に入力され、特徴点抽出回路4は特徴点
を抽出し、その位置を正規化して特徴点出現頻度分布作
成器5に出力すると共に、特徴点数を特徴点数カウンタ
回路9に渡す。特徴点出現頻度分布作成器5では、特徴
点抽出回路4によって得られる特徴点出現位置にもとづ
き、一時記憶メモリ50,51に記憶された頻度をカウント
アップして特徴点出現頻度分布を作成する。コントロー
ラ6は、辞書のサンプル数によって走査回路2への入力
を繰り返し、特徴点出現頻度分布の作成処理をコントロ
ールすると共に、作成処理終了後基準頻度検出回路10に
処理を進める。基準頻度検出回路10では、特徴点数カウ
ンタ回路9から得られる全特徴点数(出現頻度の合計
値)とコントローラ6から与えられる設定値により、基
準頻度を求めるためのピーク数を決定し、そのピーク数
をもとに一時記憶メモリ51に記憶されている特徴点出現
頻度分布からピーク頻度を順次大きいものから読み出す
とともに、与えられたピーク数に達した頻度を基準頻度
として検出する。Next, a circuit for executing the method of the present invention will be described. As shown in FIG. 12, a scanning circuit 2 scans a sample pattern 1 such as a character or a graphic, and then, applies a noise to the scanning result. Preprocessing such as processing and size normalization is performed by the preprocessing circuit 3. The scanning circuit 2 scans a large number of samples under the control of the controller 6. The data output from the preprocessing circuit 3 is input to a feature point extraction circuit 4, which extracts feature points, normalizes their positions, and outputs them to a feature point appearance frequency distribution creating unit 5, The number of feature points is passed to the feature point counter circuit 9. The feature point appearance frequency distribution creator 5 counts up the frequencies stored in the temporary storage memories 50 and 51 based on the feature point appearance positions obtained by the feature point extraction circuit 4 to create a feature point appearance frequency distribution. The controller 6 repeats the input to the scanning circuit 2 according to the number of samples in the dictionary, controls the generation processing of the feature point appearance frequency distribution, and advances the processing to the reference frequency detection circuit 10 after the completion of the generation processing. The reference frequency detection circuit 10 determines the number of peaks for obtaining the reference frequency based on the total number of feature points (total value of appearance frequency) obtained from the feature point number counter circuit 9 and the set value given from the controller 6. From the characteristic point appearance frequency distribution stored in the temporary storage memory 51, the peak frequencies are sequentially read in descending order, and the frequency at which the given number of peaks is reached is detected as the reference frequency.
一方領域検出回路7は、一時記憶メモリ50に記憶され
た特徴点出現頻度分布から分離領域探索開始点となるメ
ッシュ位置を見い出し、所定の条件を満たす分離領域を
検出すると共に、分離領域がそれ以上見い出せなくなっ
た時点で領域正規化回路11に処理を進める。また領域検
出回路7により検出された分離領域は領域分離回路8に
より一時記憶メモリ52に順次記憶される。そして領域分
離回路8は領域境界の条件を考慮した当該領域の後処
理、即ち上記(3)項の領域を一時記憶メモリ50内の
出現頻度分布に対して行う。On the other hand, the area detection circuit 7 finds a mesh position serving as a separation area search start point from the feature point appearance frequency distribution stored in the temporary storage memory 50, detects a separation area satisfying a predetermined condition, and further increases the separation area. When no more data can be found, the process proceeds to the area normalization circuit 11. The separation areas detected by the area detection circuit 7 are sequentially stored in the temporary storage memory 52 by the area separation circuit 8. Then, the area separating circuit 8 performs post-processing of the area in consideration of the condition of the area boundary, that is, the area of the above item (3) with respect to the appearance frequency distribution in the temporary storage memory 50.
こうして領域検出回路7と基準頻度検出回路10におけ
る処理が終了したのち、領域正規化回路8により一時記
憶メモリ52に記憶された領域単位の頻度分布を基準頻度
検出回路10で検出された基準頻度を用いて正規化処理を
行うとともに、正規化された領域単位の頻度分布を再度
一時記憶メモリ52に記憶する。After the processing in the area detection circuit 7 and the reference frequency detection circuit 10 is completed in this way, the area distribution stored in the temporary storage memory 52 by the area normalization circuit 8 is used to calculate the reference frequency detected by the reference frequency detection circuit 10. In addition to the normalization processing, the normalized frequency distribution in each area is stored in the temporary storage memory 52 again.
更にx方向メンバーシップ値演算器12は、一時記憶メ
モリ52に記憶された領域単位の正規化された頻度分布を
用いて領域ごとに式(7)によりx方向メンバーシップ
値を求めるとともに、一時記憶メモリ53に記憶し、また
y方向メンバーシップ値演算器13は一時記憶メモリ52に
記憶された領域単位の正規化された頻度分布を用いて、
領域ごとに式(8)によりy方向メンバーシップ値を求
めるとともに、一時記憶メモリ53に記憶する。Further, the x-direction membership value calculator 12 obtains the x-direction membership value for each region by the equation (7) using the normalized frequency distribution of the region unit stored in the temporary storage memory 52, and temporarily stores the value. Stored in the memory 53, the y-direction membership value calculator 13 uses the normalized frequency distribution of the area unit stored in the temporary storage memory 52,
The y-direction membership value is obtained for each area by the equation (8) and stored in the temporary storage memory 53.
こうして一時記憶メモリ53に記憶されたx方向メンバ
ーシップ値、および、y方向メンバーシップ値をもと
に、合成回路14は式(9)により領域単位の2次元メン
バーシップ値を合成して2次元ファジィ辞書をメモリ54
に記憶する。Based on the x-direction membership value and the y-direction membership value stored in the temporary storage memory 53 in this way, the combining circuit 14 combines the two-dimensional membership values in area units according to equation (9) to obtain two-dimensional membership values. Fuzzy dictionary memory 54
To memorize.
G.発明の効果 本発明によれば、文字や図形等のパターンの特徴点の
出現頻度分布を、多数のサンプルを用意することにより
作成し、この出現頻度分布の各頻度を正規化して、その
値をメンバーシップ値として登録するようにしているた
め、辞書を自動的に作成することができると共に辞書登
録のためのマニュアル作業が大幅に低減し、また入力パ
ターンの位置や傾きにばらつきがあっても認識の誤りが
生じにくい。G. Effects of the Invention According to the present invention, an appearance frequency distribution of feature points of a pattern such as a character or a graphic is created by preparing a large number of samples, and each frequency of the appearance frequency distribution is normalized. Because values are registered as membership values, dictionaries can be created automatically, manual work for dictionary registration is greatly reduced, and there are variations in the position and inclination of input patterns. In addition, recognition errors are less likely to occur.
更に辞書空間としては、表示のための文字フォントの
1.2倍〜1.5倍程度のメッシュ空間があれば十分認識でき
る。例えば英数字の場合9×9程度、複雑な漢字の場合
32×32程度のメッシュ空間で済む。そして例えばメンバ
ーシップ値を、0〜1までを0.1で刻んだ値により表現
した場合、データ表現としては0〜10の整数で持てばよ
いから4ビットで構成することができる。従ってメモリ
量としては漢字1文字当たり32×32×4ビット=512バ
イトとなり、従来必要であった2Kバイトと比較して1/4
程度で済み、記憶容量の低減化を図ることができる。Furthermore, as a dictionary space, character fonts for display
If there is a mesh space of about 1.2 times to 1.5 times, it can be sufficiently recognized. For example, about 9x9 for alphanumeric characters, complicated kanji
Only 32 × 32 mesh space is required. For example, when the membership value is expressed by a value obtained by dividing 0 to 1 by 0.1, the data expression can be made up of 4 bits because it is sufficient to have an integer of 0 to 10. Therefore, the amount of memory is 32 x 32 x 4 bits per kanji character = 512 bytes, which is 1/4 that of the conventionally required 2K bytes.
And the storage capacity can be reduced.
第1図は本発明方法のフローを示すフローチャート、第
2図は特徴点出現頻度分布を示す分布図、第3図は特徴
点のあいまい性を示す説明図、第4図は第1の領域の検
出と分離の様子を示す説明図、第5図及び第6図はメッ
シュの近傍点を示す説明図、第7図は第2の領域の検出
と分離の様子を示す説明図、第8図は第1,第2の領域分
離後の特徴点出現頻度分布を示すデータ図、第9図は特
徴点出現頻度分布を示すデータ図、第10図は1次元ファ
ジィデータを示すデータ図、第11図は2次元ファジィデ
ータを示すデータ図、第12図は辞書作成回路を示すブロ
ック図である。 1……入力パターン、2……走査回路、3……前処理回
路、4……特徴点抽出回路、5……特徴点出現頻度分布
作成器、6……コントローラ、7……領域検出回路、8
……領域分離回路、9……特徴点数カウンタ回路、10…
…基準頻度検出回路、11……領域正規化回路、12……x
方向メンバーシップ値演算器、13……y方向メンバーシ
ップ値演算器、14……2次元メンバーシップ値合成回
路、50〜54……メモリ。FIG. 1 is a flowchart showing the flow of the method of the present invention, FIG. 2 is a distribution diagram showing a feature point appearance frequency distribution, FIG. 3 is an explanatory diagram showing the ambiguity of feature points, and FIG. FIGS. 5 and 6 are explanatory diagrams showing points near the mesh, FIG. 7 is an explanatory diagram showing the state of detection and separation of the second region, and FIG. FIG. 9 is a data diagram showing a feature point appearance frequency distribution after the first and second region separation, FIG. 9 is a data diagram showing a feature point appearance frequency distribution, FIG. 10 is a data diagram showing one-dimensional fuzzy data, and FIG. Is a data diagram showing two-dimensional fuzzy data, and FIG. 12 is a block diagram showing a dictionary creation circuit. 1 ... input pattern, 2 ... scanning circuit, 3 ... preprocessing circuit, 4 ... feature point extraction circuit, 5 ... feature point appearance frequency distribution creator, 6 ... controller, 7 ... area detection circuit, 8
……………………………………………………………………………………………………………………………… ………………………………………………………….
... Reference frequency detection circuit, 11 ... Regularization circuit, 12 ... x
Directional membership value calculator, 13... Y-direction membership value calculator, 14... Two-dimensional membership value synthesis circuit, 50 to 54.
Claims (2)
用いられ、前記パターンの照合の対象となる辞書を作成
する方法において、 あるパターンに対して多数のサンプルを作成し、各サン
プルにおけるパターンの特徴点を抽出し、 パターンが描かれる平面領域にm×n個(m,nは整数)
のメッシュ領域を割り当てると共に、このメッシュ領域
内の各メッシュ毎に前記特徴点の出現回数である出現頻
度を求めて、メッシュ領域に対応する出現頻度分布を作
成し、 しかる後に各メッシュの出現頻度のうち最大値をとるメ
ッシュを第1の領域の探索開始点として予め定めた規則
に従い第1の領域に含まれるメッシュを探索し、次いで
第1の領域以外のメッシュの中から出現頻度の最大値を
とるメッシュを第2の領域の探索開始点として、同様に
第2の領域に含まれるメッシュを探索し、こうした処理
を繰り返すことにより前記メッシュ領域を1以上の領域
に分離し、 続いて分離領域毎にその分離領域のみを含む前記メッシ
ュ領域について各出現頻度を基準頻度を用いて正規化し
てメンバーシップ値を求め、その後当該メッシュ領域の
各メッシュの1行づつについてその行に含まれるメンバ
ーシップ値の中から最大値を求めると共に、1列づつに
ついてその列に含まれるメンバーシップ値の中から最大
値を求め、これら最大値を分離領域毎に組にして1次元
ファジィデータを作成することを特徴とする辞書作成方
法。1. A method for creating a dictionary used for recognizing a pattern such as a character or a figure, which is to be compared with the pattern, comprising: creating a large number of samples for a certain pattern; Mxn (m, n are integers) in the plane area where the pattern is drawn
And assigning an appearance frequency that is the number of appearances of the feature points to each mesh in the mesh area, and creating an appearance frequency distribution corresponding to the mesh area. The mesh having the maximum value is used as a search start point of the first region to search for a mesh included in the first region according to a predetermined rule, and then the maximum value of the appearance frequency is determined from the meshes other than the first region. The mesh to be taken is used as a search start point of the second region, a mesh included in the second region is similarly searched, and the above-described processing is repeated to separate the mesh region into one or more regions. In the mesh area including only the separation area, a membership value is obtained by normalizing each appearance frequency using a reference frequency, and then the mesh area is determined. For each row of each mesh, the maximum value is obtained from the membership values contained in that row, and for each column, the maximum value is obtained from the membership values contained in that column, and these maximum values are divided into the separation areas. A dictionary creation method characterized in that one-dimensional fuzzy data is created for each group.
にx座標xiを、端からj番目の行にY座標yjを夫々割り
当てると共に、分離領域毎に作成した1次元ファジィデ
ータについて、xi,yjに夫々対応するメンバーシップ値
をX(i),Y(j)と表示したとき、分離領域毎に(x
i,yj)のメッシュ位置における2次元のメンバーシップ
値f(i,j)に対してX(i),Y(j)のうちの小さい
方の値を割り当てて、分離領域に対する2次元のメンバ
ーシップ値の集合を得、 次いでメッシュ位置(xi,yj)におけるメンバーシップ
値F(i,j)に対して、各分離領域のf(i,j)のうちの
最大値を割り当て、このF(i,j)の集合によって各分
離領域の全領域に対する2次元ファジィ辞書を作成する
請求項1記載の辞書作成方法。2. An x coordinate xi is assigned to an i-th mesh column from an end of a mesh area, and a Y coordinate yj is assigned to a j-th row from an end. For one-dimensional fuzzy data created for each separation area, xi, When the membership values respectively corresponding to yj are indicated as X (i) and Y (j), (x
The smaller of X (i) and Y (j) is assigned to the two-dimensional membership value f (i, j) at the mesh position of (i, yj), and the two-dimensional member for the separation region is assigned. A set of ship values is obtained, and the maximum value of f (i, j) of each separation region is assigned to the membership value F (i, j) at the mesh position (xi, yj). 2. The dictionary creation method according to claim 1, wherein a two-dimensional fuzzy dictionary is created for all areas of each separation area by a set of (i, j).
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63120340A JP2643293B2 (en) | 1988-05-17 | 1988-05-17 | Dictionary creation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63120340A JP2643293B2 (en) | 1988-05-17 | 1988-05-17 | Dictionary creation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01290090A JPH01290090A (en) | 1989-11-21 |
JP2643293B2 true JP2643293B2 (en) | 1997-08-20 |
Family
ID=14783828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63120340A Expired - Lifetime JP2643293B2 (en) | 1988-05-17 | 1988-05-17 | Dictionary creation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2643293B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2909604B2 (en) * | 1990-10-12 | 1999-06-23 | 株式会社山武 | Fuzzy pattern recognition method and apparatus |
-
1988
- 1988-05-17 JP JP63120340A patent/JP2643293B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH01290090A (en) | 1989-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738207B (en) | Character detection method for fusing character area edge information in character image | |
CN111914834B (en) | Image recognition method, device, computer equipment and storage medium | |
JP3027321B2 (en) | Method and apparatus for online recognition of unrestricted handwritten alphanumeric characters | |
JP3618796B2 (en) | Pattern recognition method and apparatus | |
GB2190778A (en) | Character recognition with variable subdivision of a character region | |
EP0483343A1 (en) | A polygon-based method for automatic extraction of selected text in a digitized document | |
JPH05500284A (en) | Polygon-based techniques for automatic classification of text and graphical components from digitized paper-based formats | |
JP2608571B2 (en) | Apparatus and method for vectorizing input scanned image data | |
JPH05242292A (en) | Separating method | |
JPH096970A (en) | Outline extraction method by mixed technique of effective outline and start/guidance | |
CN114529925A (en) | Method for identifying table structure of whole line table | |
RU2626656C2 (en) | Method and system of determining orientation of text image | |
JP2643293B2 (en) | Dictionary creation method | |
JP3819236B2 (en) | Pattern recognition method and computer-readable storage medium storing program for performing pattern recognition | |
JP3720892B2 (en) | Image processing method and image processing apparatus | |
JP6546385B2 (en) | IMAGE PROCESSING APPARATUS, CONTROL METHOD THEREOF, AND PROGRAM | |
JP2853168B2 (en) | Pattern recognition device | |
KR0186025B1 (en) | Candidate character classification method | |
JP2643294B2 (en) | Dictionary creation method | |
JP2845107B2 (en) | Image processing device | |
JP2853169B2 (en) | Pattern recognition device | |
JP2853167B2 (en) | Dictionary creation device for pattern recognition | |
Fletcher et al. | Segmentation of binary images into text strings and graphics | |
CN117095423B (en) | Bank bill character recognition method and device | |
JP3104355B2 (en) | Feature extraction device |