JPH01290090A - 辞書作成方法 - Google Patents

辞書作成方法

Info

Publication number
JPH01290090A
JPH01290090A JP63120340A JP12034088A JPH01290090A JP H01290090 A JPH01290090 A JP H01290090A JP 63120340 A JP63120340 A JP 63120340A JP 12034088 A JP12034088 A JP 12034088A JP H01290090 A JPH01290090 A JP H01290090A
Authority
JP
Japan
Prior art keywords
mesh
region
dictionary
area
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63120340A
Other languages
English (en)
Other versions
JP2643293B2 (ja
Inventor
Keisuke Goto
啓介 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP63120340A priority Critical patent/JP2643293B2/ja
Publication of JPH01290090A publication Critical patent/JPH01290090A/ja
Application granted granted Critical
Publication of JP2643293B2 publication Critical patent/JP2643293B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明は文字や図形等のパターンを認識するために用い
られる辞書を作成する方法に関するものである。
B4発明の概要 本発明は、文字や図形等のパターンを認識するために用
いられ、前記パターンの照合の対象となる辞書を作成す
る方法において、 パターンの特徴点の位置関係を表現するためにあいまい
集合(ファジィ集合)の概念を取り入れ、メツシュ領域
を割り当てて各メツシュ毎に特徴点の出現頻度を求める
と共に、メツシュ領域を分離して分離領域毎にメツシュ
領域の全体を正規化し、分離領域毎に1次元ファジィ辞
書を作成し、更に各分離領域の全領域に対する2次元フ
ァジィ辞書を作成することによって、 辞書を自動的に生成することができ、しかも辞書登録の
ためのマニュアル作業時間を短縮することができ、更に
記憶容量の低減化を図ることができるようにしたもので
ある。
C8従来の技術 文字や図形等のパターンを認識する場合、例えば、書類
や図面等をイメージスキャナ等の入力装置で操作して得
られる黒と白の2値画像データ(入カバターン)に基づ
いて、予め記憶されている文字や図形の標準パターン(
辞書パターン)と位置等を照合し、辞書パターンの中か
ら最も重なり合うものを最終的に認識結果として求めて
いる。
認識方法の具体例として、例えば、人カバターンと辞書
パターンをそれぞれ小さな正方格子状(メツシュ)に区
切り、格子点が文字や図形である場合には黒(1)、そ
うでないときは白(0)と表す場合において、入力と辞
書の2つのパターンの重なりの程度をハミング距離を用
いて求めることができる。これは、入力と辞書が黒と黒
または白と白の場合には0、黒と白または白と黒の場合
にはlとおき、その総和を求めるものである。
つまり、黒と黒、白と白のように重なり合っていればい
るほど、その総和(ハミング距離)が小さくなる。この
性質により、多数の辞書パターンの中から入カバターン
と最も重なり合っているもの、すなわち、ハミング距離
が最も小さいものを認識結果とするものである。
D 発明が解決しようとする課題 この方法だと入カバターンの位置が辞書パターンの位置
とずれていたり、大きさが異なっていたり、傾きが異な
っていたりすると、重なりの程度が変わってしまい、認
識の誤りが生じやすい欠点がある。
また、記憶容量の点でも問題がある。1文字あるいは1
図形パターンの必要空間は表示のための文字フォントの
ように8×8画素(英数字)や24×24画素(漢字)
の空間では済まず、線の切れやつぶれを極力避けるため
少なくともその3〜5倍の空間を特徴とする特に、漢字
や複雑な図形の場合128x128画素程度以上確保し
ないと安定な処理が望めないことになる。
文字や図形パターンの辞書種別は漢字の場合第二水準を
含めると6000字種以上に及び、図形の場合でも多い
ときには1000字種以上になる。
このような膨大な辞書種別に対して、■辞書毎に128
XI28画素を確保するとすれば、メモリとして2にバ
イトが必要となる。つまり、先の漢字では12Mバイト
以上、図形で2Mバイト以上もの記憶領域が必要となる
ハードウェア構成上この容量は無視できないほど大きく
、また、辞書の探索や整合処理にも処理時間などで影響
を与えることになる。
更に、辞書種別の点からいえば、上述の膨大な種別につ
いてひとつひとつ辞書をマニュアルで登録する作業が必
要とされており、そのための作業時間も膨大となる問題
点がある。
以上まとめると、従来技術には以下の大きな3つの課題
が残されている。
■認識精度の高い認識手法の確立 ■記憶容量低減のための辞書構成方法の確立■辞書の自
動生成方法の確立 本発明は、このうち特に■の問題点の解決に主眼をおい
たものである。
E0課題を解決するための手段 文字や図形パターンは人間の歴史的または経験的規則に
従って記述された位置関係にあるが、パターンを特徴づ
ける点(特徴点)そのものはあいまい性を有している。
例えば、第3図2の○印で示す文字“Δ”の代−8〜 表的な特徴点の場合(これを頂点と呼ぶものとする)、
頂点の位置そのものは他の特徴点からみて左に振れたり
(同図b)、右に振れたり(同図C)する。また、頂点
のところで切れたり(同図d)もする。
しかし、同図eのように、頂点の部分だけが他の特徴点
より下の方に位置することはありえない。
結局、文字“A”の頂点というものは、他の特徴点より
位置関係でいうと上の方でかつまん中付近にある、とい
う極めてあいまいな尺度で規則性を持っているというこ
とになる。
本発明は、このように文字や図形パターンの特徴点の位
置関係にあいまい性があることを考慮して、その位置関
係をあいまい集合(ファジィ集合)の概念を取り入れて
表現し、これを辞書に登録しようとするものである。
第1図に本発明方法のフローを示すと、先ずあるパター
ンに対して多数のサンプルを作成しノイズ処理等の前処
理を行った後、各サンプルにおけるパターンの特徴点を
抽出する。そしてパターンが描かれる平面領域にm x
 n個(m、nは整数)のメツシュ領域を割り当てると
共に、このメソシュ領域内の各メツシュ毎に前記特徴点
の出現回数である出現頻度を求めて、メツシュ領域に対
応する出現頻度分布を作成する。
しかる後に各メツシュの出現頻度のうち最大値をとるメ
ツシュを第1の領域の探索開始点として予め定めた規則
に従い第1の領域に含まれるメツシュを探索し、次いで
第1の領域以外のメツシュの中から出現頻度の最大値を
とるメツシュを第2の領域の探索開始点として、同様に
第2の領域に含まれるメソシュを探索し、こうした処理
を繰り返すことにより前記メツシュ領域を1以上の領域
に分離する。一方出現頻度を正規化するために例えば出
現頻度の総数にもとすいて基準頻度を求める。
続いて分離領域□毎にその分離領域のみを含む前記メツ
シュ領域について各出現頻度を基準頻度を用いて正規化
してメンバーシップ値を求め、その後当該メツシュ領域
の各メツシュの1行づつについてその行に含まれるメン
バーシップ値の中から最大値を求めると共に、1列づつ
についてその列に含まれるメンバーシップ値の中から最
大値を求め、これら最大値を分離領域毎に組にして1次
元ファジィデータを作成し、これを1次元ファジィ辞書
として登録する。
更にはまた1次元ファジィデータにもとずいて2次元フ
ァジィ辞書を次のようにして作成する。
即ち、メツシュ領域の端からi番目のメツシュ列にX座
標xiを、端からj番目の行にY座標yjを夫々割り当
てると共に、分離領域毎に作成した1次元ファジィデー
タについて、xi、yjに夫々対応するメンバーシップ
値をx(1)、Y(j)と表示したとき、分離領域毎に
(xi、yDのメツシュ位置における2次元のメンバー
シップ値f(i、j)に対してX(i)、Y(j)のう
ちの小さい方の値を割り当てて、分離領域に対する2次
元のメンバーシップ値の集合を得る。
次いでメツシュ位置(xi、yj)におけるメンバーシ
ップ値F(i、j)に対して、各分離領域のf(i、コ
)のうちの最大値を割り当て、このF(1,j)の集合
によって各分離領域の全領域に対する2次元ファジィ辞
書を作□成する。
F、実施例 本発明方法の具体的手順を以下に説明する。
(1)辞書作成準備 辞書を作成するため、同一の文字、または、図形に対し
て複数のサンプルを準備する。
それらはあるひとつの辞書を作成するときの辞書作成用
パターンとなる。
(2)特徴点出現頻度分布(2次元ヒストグラム)の作
成 サンプルを繰り返し入力して、それぞれ特徴点を抽出す
る。
辞書空間と同じm×n(m、nは整数)のメッシュ空間
をとり、第2図に示すようにそれらの特徴点が出現する
頻度を分布させる。
例えば、辞書空間が10xlOのメツシュ空間であると
き、ヒストグラムも10xlOのメツシュ空間を取る。
このとき、ある特徴点の位置がZ(x、y)−(5,3
)と得られた場合には、ヒストグラム上の位置Z(5,
3)の頻度に1を加えたものとなる。
特徴点位置をz (x、y)とすれば、2次元ヒストグ
ラム上で対応する位置z(x、y)における頻度P(x
、y)は、次式で示される。
P (x、y) −P (X、 y)+ 1(P (x
、y)の初期値0)  (1)(3)特徴点出現頻度分
布における領域分離同一の文字、または、図形に対して
、複数サンプルによる頻度分布を取ると、似通った位置
に特徴点が出現しやすいため、その付近に頻度のピーク
が存在することが多い。
一般的に、活字のような定形パターンの場合にはピーク
値は鋭く高いが、手書き文字のような不定形パターンの
場合にはバラツキによりピーク値が緩やかで低くなる傾
向がある。
そこで、特徴点が出現しやすい領域を考慮して、辞書に
反映する必要がある。
本発明方法は、特徴点出現頻度分布を用いて領域を分離
するものである。領域の分離方法は以下の手順を繰り返
すことで行う。
■探索開始点の検出 特徴点出現頻度分布における最大ピーク値(出現頻度の
最大値)をとる点Z(x、y)を第1の領域Aにおける
探索開始点(第4図の○印の点に相当する。)とする。
■開始点近傍における領域の検出 探索開始点Zにおける頻度をP、Zに関する8近傍の任
意の近傍点Ziにおける頻度をPiとしたとき、次の条
件により領域Aをひろげる。なお8近傍とは第5図に示
すようにZについて縦、横。
斜め方向に隣接することである。
Pi≠O P≧Pi    ならば  ZieA   (2)ただ
し、i=0.1.・・・・・、7 実際には、探索開始点Zは最大ピーク値であり、その近
傍でP<P iとはならないため、通常の場合、Pi≠
0を満たす近傍点Z1は領域Aに含まれる。
この処理を8近傍すべてについて行う。
■探索点の移動と領域の検出 Ziが領域Aの点であれば、探索点をZjに移す。
これを改めてZとおき、その頻度をPとする。
またこの新しい探索点Zの8近傍の任意の近傍点を改め
てZiとおき、その頻度をPiとする。
このとき探索点Zに対して近傍点Ziが領域Aに含まれ
るかどうかは、次の条件式により求める。
Pi≠O,P>Pi P≧P I −1ならば  ZieA    (3)P
≧P1.I ただし、i=0.l、・・・・・、7 1−0 のとき Pl−1=P? 1−7 のとき Pi++=P。
この新しい探索点Zに対しても8近傍すべてについて行
う。
■探索点移動と領域検出の繰り返し処理0項の処理を繰
り返して行うことで、領域の探索を進めることができる
これにより、どの近傍点をとっても領域Aに含まれなく
なるまで実行すれば、最終的に領域Aが定まることにな
る。
この様子を第4図に示している。
図では、2つのピークを持つ特徴点出現頻度分布を表し
ているが、その中で最大ピーク値は○印で囲んだ頻度で
あり、その位置が探索開始点となる。この開始点の8近
傍の点はすべて■の手順により、領域Aに含まれる。そ
れらはすべて新しい探索点となるので、各探索点に対し
て■の手順を繰り返して行うことができる。これにより
さらに新しく探索点が見いだされ、また■の手順により
、・・・・・・・と処理が続いていく。
このようにして探索点がすべて見いだされて行くが、第
4図の矢印は探索点が■の手順で移っていく様子を示し
たものである。
ここまでの処理で、最大ピーク点に属する領域が矩形の
実線で囲まれたものと決定される。
■特徴点頻度分布から求めた領域に対する後処理 求めた領域に対し後処理として、境界条件を考慮したク
リア処理を次のように行う。なおこの領域は一時記憶メ
モリにコピーする。
領域の境界にある点は他の領域と接してし)る場合、そ
ちら側に含まれても不思議でない場合もあり、あいまい
な部分である。
従ってこの点を考慮し、第6図の4近傍で示す近傍点で
他の領域と接しているかどうかを調べることにより、次
のような処理を行っている。
領域境界点をZとし、その4近傍の任意の近傍点をZi
とする。またそれらの位置における頻度をそれぞれP、
Piとする。
このとき次のように定義する。
定義=4つの近傍点のうち1つでも自己領域になくかつ
その点が0でないならば、その点は他の領域に含まれる
この定義に基づき領域境界点が他と接する場合、次式に
より領域境界点の頻度を下げる処理を行っている。
P=P−1(4) −2〇− 領域境界以外の点及び境界点のうち他の領域と接してい
ない点のすべてについては、頻度をOとクリアする。
この様子を第7図に示している。点線で囲んだ矩形領域
の処理がこの処理にあたる。
■全領域の検出(■〜■の繰り返し処理)■で境界を考
慮したクリア処理を行ったことにより、特徴点出現頻度
分布上では既に検出した領域が取り除かれたことになる
そこで、残された特徴点の頻度分布に基づいて最大ピー
ク点を求めると、これは次の領域に対する領域開始点と
なる。
つまり■の処理に戻って次の領域を探索するという繰り
返し処理となる。
■〜■の繰り返し処理を行って、領域が見いだされなく
なった時点で領域検出処理は終わる。第7図の例では、
第2の領域を検出した時点で他の領域がなくなるため、
第8図のように頻度がすべて0となり、検出処理が終了
する。
(4)ファジィ集合におけるメンバーシップ値の定義と
辞書の作成 上で求めた特徴点出現頻度分布は、特徴点がどの様な位
置に出現しやすいかという傾向を示したものである。
そしてまた、頻度分布に基づき特徴点を含む領域が検出
・分離できることを示した。
同一の文字、または、図形に対して、複数のサンプルに
よる頻度分布を取ると、似通った位置に特徴点が出現し
やすく、その付近に頻度のピークが存在することが多い
ことを示している。
このことから逆に、ピーク位置を抽出することで特徴点
位置を推定することができる。
本発明は、この考え方をファジィ集合におけるメンバー
シップ値の設定に応用したものである。
ここでは、正規化、1次元・2次元ファジィ集合のメン
バーシップ値の定義方法について、手順を追って以下に
示す。
■特徴点頻度分布の正規化 頻度分布は、ひとつのパターンに対するサンプル数が多
ければ多いほど、全体の頻度が高くなり、客観的な判断
をすることがむずかしくなるため、頻度分布の正規化が
必要である。
特徴点が頻度分布のピークに対応する場合が多いことを
ヒントにして、次のように正規化処理を行っている。
まず、正規化の考え方を述べる。上のヒントは、特徴点
出現頻度を横軸に取り、その頻度が現れる回数(頻度)
を縦軸に取った1次元ヒストグラムを考えたとき、横軸
は特徴点出現頻度の高いものほど右側に表されるので、
横軸のある基準点の右側に占める特徴点出現頻度は特徴
点として期待の高いものばかり集まっていることを示し
ている。
但し実際にはこうしたヒストグラムは取らず、次のよう
にして簡単に基準点を求めている。
全サンプルの特徴点数(出現頻度の合計値)をKとした
とき、ある一定の割合Ckを乗じたものを基準点までの
ピーク抽出数にとして求める。
k−Ck−K        (5) 次に、特徴点出現頻度分布において、頻度の大きいもの
から順に捜していき、k番目の頻度の値を取るものを求
め、これを基準頻度Pkとする。
これは先の1次元ヒストグラムにおいて、横軸の最も右
側から順に求めたものと同様の考え方となる。
Pkをもとに、正規化は上記の項目(3)で分離した分
離領域毎に次式のように行う。
分離領域中のある頻度をPr(i、j)、正規化後の頻
度をMr(i、j)とすれば、Mr(i、D−1,0−
Pr(i、D≧PkのときPr(i、j)/Pk−Pr
(i、j)<PkのときここにPr (i、j)、Mr
 (i、j)は夫々メツシュ領域の位置(xi、yj)
における頻度及び正規化後の頻度であり、1≦l≦m、
1≦j≦nである。またI≦r≦Rであり、Rは領域数
である。
こうして分離領域毎に、その分離領域のみを含むメツシ
ュ領域(その分離領域以外の頻度をOにクリアしたメツ
シュ領域)の総てのメツシュの頻度について正規化を行
う。
■1次元ファジィ集合におけるメンバーシップ値の定義 ■で求めた正規化した頻度Mr(i、j)は、0〜1の
実数区間にあり1.0に近づくほど特徴点出現頻度が高
く、含まれる位置は特徴をよく表した点である可能性が
高い。つまり、1.0に近づくほど、その確信度が高い
といえるので、特徴点位置というあいまいな尺度を示す
指標となり得、そのままメンバーシップ値として使用す
ることも可能である。
ここでは、更にこの考え方を発展させて、分離領域毎に
求めたMr(i、j)をもとに、X軸。
y軸に射影させて、1次元のファジィ集合におけるメン
バーシップ値を求める方法を示す。
X方向メンバーシップ値即ち座標xiに対応するメンバ
ーシップ値をXr (i)とすれば、次の計算で求める
x r(i)−max (Mr(j 、 1)、 Mr
(i 、 2)、 −、Mr(i 、 n))X方向メ
ンバーシップ値即ち座標yjに対応するメンバーシップ
値をYr (j)とすれば、次の計算で求める。
Y r(j)−max (Mr(1,D、 Mr(2,
j)、 −、Mr(m、 D)ただしmax(a、 b
、 c)はa、b、cの中の最=27− 大値を表現している。また1≦i≦m、1≦j≦nであ
る。
これにより、あるひとつの分離領域rにおいてx、yの
各1次元方向に対するメンバーシップ値の組が、それぞ
れm、n個得られ、以て1次元ファジィデータが得られ
る。
■2次元ファジィ辞書の作成 上記のメンバーシップ値を用いて、あるひとつの領域r
における2次元のメンバーシップ値を次のようにして求
める。
f r(i、 j)−min(Xr(+)、 Yr(j
))     (9)ただしmin (a 、b 、 
c )はa、b、cの中の最小値を表現している。
例えばfr(4,0)のときはXr(4)とYr(0)
を比較してその小さいものを選び、Xr(4)が小さい
場合はf r (4,0)はXr (4)の値を取る。
また同様にfr(6,3)のとき、Xr (6)とYr
 (3)を比較してYr (3)が小さい場合は、fr
(6,3)はYr (3)の値を取る。このようにして
、mxnについて求めることにより、領域rに対する2
次元のメンバーシップ値の集合が得られる。これを全領
域について求める。
ファジィ集合の概念により、全領域に対する和集合を次
のように取れば、ひとつのパターンに対してひとつの辞
書が得られる。
F (i、  j) −max(L(L  D、  L
(i、  j)、−−・・・、 fR(i、 j)) 
     (10)例えば、F(2,5)のとき、r、
(2,5)からfR(2,5)  までの各値を比較し
て、その中で最大値を取るものをF(2,5)とする。
ずなわち、f、(2,5)からfR(2,5)までのう
ち最大値がf、(2,5)であれば、F (2,5)は
f4(2,5)の値を取ればよい。
以上のようにして、ひとつのパターンの複数個のサンプ
ルから辞書を作成できる。
(4)複数パターン辞書作成 複数のパターンを取り扱う場合は、(1)〜(3)を繰
り返せばよい。
(5)辞書作成例 第9図は文字rAJの特徴点頻度分布を示す図であり、
この例ではある領域に9×9のメツシュ領域をとり、文
字FAJの最上端の位置を特徴点としたものである。第
1O図は、第9図に示す特徴点頻度分布に対して上記(
3)項で述べた処理を実行することによりメツシュ領域
を複数の領域に分離し、更に上記(4)■、■項で述べ
た処理を実行することにより作成した1次元ファジィデ
ータを示す図である。第11図は第10図に示す1次元
ファジィデータに対して上記(4)0項で述べた処理を
実行することにより作成した2次元ファジィ辞書である
次に本発明方法を実行するための回路について述べると
、第12図に示すように文字や図形等のサンプルパター
ンに対して走査回路2により走査が行われ、次いでその
走査結果に対してノイズ処理や大きさの正規化といった
前処理が前処理回路3により施される。なお走査回路2
はコントローラ6の制御の下に多数のサンプルについて
走査を行う。前処理回路3から出力されたデータは特徴
点抽出回路4に入力され、特徴点抽出回路4は特徴点を
抽出し、その位置を正規化して特徴点出現頻度分布作成
器5に出力すると共に、特徴点数を特徴点数カウンタ回
路9に渡ず。特徴点出現頻度分布作成器5では、特徴点
抽出回路4によって得られる特徴点出現位置にもとづき
、−時記憶メモリ50.51に記憶された頻度をカウン
トアツプして特徴点出現頻度分布を作成する。コントロ
ーラ6は、辞書のサンプル数によって走査回路2への入
力を繰り返し、特徴点出現頻度分布の作成処理をコント
ロールすると共に、作成処理終了後基準頻度検出回路I
Oに処理を進める。基準頻度検出回路10では、特徴点
数カウンタ回路7から得られる全特徴点数(出現頻度の
合計値)とコントローラ6から与えられる設定値により
、基準頻度を求めるためのピーク数を決定し、そのピー
ク数をもとに一時記憶メモリ51に記憶されている特徴
点出現頻度分布からピーク頻度を順次大きいものから読
み出すとともに、与えられたピーク数に達した頻度を基
準頻度として検出する。
一方領域検出回路7は、−時記憶メモリ50に記憶され
た特徴点出現頻度分布から分離領域探索開始点となるメ
ツシュ位置を見い出し、所定の条件を満たず分離領域を
検出すると共に、分離領域がそれ以」1見い出せなくな
った時点で領域正規化回路11に処理を進める。また領
域検出回路7により検出された分離領域は領域分離回路
8により一時記憶メモリ52に順次記憶される。そして
領域分離回路8は領域境界の条件を考慮した当該領域の
後処理、即ち上記(3)■項の領域を−時記憶メモリ5
0内の出現頻度分布に対して行う。
こうして領域検出回路7と基準頻度検出回路10におけ
る処理が終了したのち、領域正規化回路8により一時記
憶メモリ52に記憶された領域単位の頻度分布を基準頻
度検出回路10で検出された基準頻度を用いて正規化処
理を行うとともに、正規化された領域単位の頻度分布を
再度−時記憶メモリ52に記憶する。
更にX方向メンバーシップ値演算器12は、−時記憶メ
モリ52に記憶された領域単位の正規化された頻度分布
を用いて領域ごとに式(7)によりX方向メンバーシッ
プ値を求めるとともに、−時記憶メモリ53に記憶し、
またy方向メンバーシップ値演算器13は一時記憶メモ
リ52に記憶された領域単位の正規化された頻度分布を
用いて、領域ごとに式(8)によりX方向メンバーシッ
プ値を求めるとともに、−時記憶メモリ53に記憶する
こうして−時記憶メモリ53に記憶されたX方向メンバ
ーシップ値、および、X方向メンバーシップ値をもとに
、合成回路14は式(9)により領域単位の2次元メン
バーシップ値を合成して2次元ファジィ辞書をメモリ5
4に記憶する。
G1発明の効果 本発明によれば、文字や図形等のパターンの特徴点の出
現頻度分布を、多数のサンプルを用意することにより作
成し、この出現頻度分布の各頻度を正規化して、その値
をメンパーツツブ値として登録するようにしているため
、辞書を自動的に作成することができると共に辞書登録
のためのマニユアル作業が大幅に低減し、また入カバタ
ーンの位置や傾きにばらつきがあっても認識の誤りが生
じにくい。
更に辞書空間としては、表示のための文字フォントの1
.2倍〜1゜5倍程度のメツシュ空間があれば十分認識
できる。例えば英数字の場合9×9程度、複雑な漢字の
場合32X32程度のメツシュ空間で済む。そして例え
ばメンバーシップ値を、0〜1までを0.1で刻んだ値
により表現した場合、データ表現としては0−10の整
数で持てばよいから4ビツトで構成することができる。
従ってメモリ量としては漢字1文字光たり32X32×
4ビット−512バイトとなり、従来必要であった2に
バイトと比較して1X4程度で済み、記憶容量の低減化
を図ることができる。
【図面の簡単な説明】
第1図は本発明方法のフローを示すフローチャート、第
2図は特徴点出現頻度分布を示す分布図、第3図は特徴
点のあいまい性を示す説明図、第4図は第1の領域の検
出と分離の様子を示す説明図、第5図及び第6図はメツ
シュの近傍点を示す説明図、第7図は第2の領域の検出
と分離の様子を示す説明図、第8図は第1.第2の領域
分離後の特徴点出現頻度分布を示すデータ図、第9図は
特徴点出現頻度分布を示すデータ図、第10図は1次元
ファジィデータを示すデータ図、第11図は2次元ファ
ジィデータを示すデータ図、第12図は辞書作成回路を
示すブロック図である。 1・・入カバターン、2・・・走査回路、3・・・前処
理回路、4・・・特徴点抽出回路、5・・特徴点出現頻
度分布作成器、6・・・コントローラ、7・・・領域検
出回路、8・・・領域分離回路、9・・・特徴点数カウ
ンタ回路、10・・・基準頻度検出回路、11・・・領
域正規化回路、12・・・X方向メンバーシップ値演算
器、13・・・y方向メンバーシップ値演算器、14・
・・2次元メンバーシップ値合成回路、50〜54・・
・メモリ。 第1図 本発明方法のフローチャート 第2図 特徴点出現頻度分布 第3図 特徴点のあいまい性の説明図 a           b          cd
           e 第4図 第1の領域の検出と分離の説明図 第5図     第6図 第7図 第2の領域の検出と分離の説明図 第8図 第1.第2の領域分離後の出現頻度分布因果 ソ 凶 手続補正書(、え。 1.事件の表示 昭和63年特許願第12034 Q号 2 発明の名称 辞書作成方法 3 補正をする者 事件との関係  出願人 (610)株式会社明電舎 4代理人〒104 東京都中央区明石町1番29号 液済会ビル56補正の
対象 明細書の発明の詳細な説明の欄 6 補正の内容 (1)明細書第32頁第1O行の「パターン」を「パタ
ーン1」と訂正する。

Claims (2)

    【特許請求の範囲】
  1. (1)文字や図形等のパターンを認識するために用いら
    れ、前記パターンの照合の対象となる辞書を作成する方
    法において、 あるパターンに対して多数のサンプルを作成し、各サン
    プルにおけるパターンの特徴点を抽出し、パターンが描
    かれる平面領域にm×n個(m、nは整数)のメッシュ
    領域を割り当てると共に、このメッシュ領域内の各メッ
    シュ毎に前記特徴点の出現回数である出現頻度を求めて
    、メッシュ領域に対応する出現頻度分布を作成し、 しかる後に各メッシュの出現頻度のうち最大値をとるメ
    ッシュを第1の領域の探索開始点として予め定めた規則
    に従い第1の領域に含まれるメッシュを探索し、次いで
    第1の領域以外のメッシュの中から出現頻度の最大値を
    とるメッシュを第2の領域の探索開始点として、同様に
    第2の領域に含まれるメッシュを探索し、こうした処理
    を繰り返すことにより前記メッシュ領域を1以上の領域
    に分離し、 続いて分離領域毎にその分離領域のみを含む前記メッシ
    ュ領域について各出現頻度を基準頻度を用いて正規化し
    てメンバーシップ値を求め、その後当該メッシュ領域の
    各メッシュの1行づつについてその行に含まれるメンバ
    ーシップ値の中から最大値を求めると共に、1列づつに
    ついてその列に含まれるメンバーシップ値の中から最大
    値を求め、これら最大値を分離領域毎に組にして1次元
    ファジィデータを作成することを特徴とする辞書作成方
    法。
  2. (2)メッシュ領域の端からi番目のメッシュ列にX座
    標xiを、端からj番目の行にY座標yjを夫々割り当
    てると共に、分離領域毎に作成した1次元ファジィデー
    タについて、xi、yjに夫々対応するメンバーシップ
    値をX(i)、Y(j)と表示したとき、分離領域毎に
    (xi、yj)のメッシュ位置における2次元のメンバ
    ーシップ値f(i、j)に対してX(i)、Y(j)の
    うちの小さい方の値を割り当てて、分離領域に対する2
    次元のメンバーシップ値の集合を得、 次いでメッシュ位置(xi、yj)におけるメンバーシ
    ップ値F(i、j)に対して、各分離領域のf(i、j
    )のうちの最大値を割り当て、このF(i、j)の集合
    によって各分離領域の全領域に対する2次元ファジィ辞
    書を作成する請求項1記載の辞書作成方法。
JP63120340A 1988-05-17 1988-05-17 辞書作成方法 Expired - Lifetime JP2643293B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63120340A JP2643293B2 (ja) 1988-05-17 1988-05-17 辞書作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63120340A JP2643293B2 (ja) 1988-05-17 1988-05-17 辞書作成方法

Publications (2)

Publication Number Publication Date
JPH01290090A true JPH01290090A (ja) 1989-11-21
JP2643293B2 JP2643293B2 (ja) 1997-08-20

Family

ID=14783828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63120340A Expired - Lifetime JP2643293B2 (ja) 1988-05-17 1988-05-17 辞書作成方法

Country Status (1)

Country Link
JP (1) JP2643293B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04148482A (ja) * 1990-10-12 1992-05-21 Yamatake Honeywell Co Ltd ファジイパターン認識方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04148482A (ja) * 1990-10-12 1992-05-21 Yamatake Honeywell Co Ltd ファジイパターン認識方法及び装置

Also Published As

Publication number Publication date
JP2643293B2 (ja) 1997-08-20

Similar Documents

Publication Publication Date Title
Wenyin et al. From raster to vectors: extracting visual information from line drawings
JP3027321B2 (ja) 拘束のない手書き英数字のオンライン認識の方法及び装置
US7437001B2 (en) Method and device for recognition of a handwritten pattern
JP2933801B2 (ja) 文字の切り出し方法及びその装置
CN114529925B (zh) 一种全线表表格结构识别方法
Boussellaa et al. Unsupervised block covering analysis for text-line segmentation of Arabic ancient handwritten document images
Zhou et al. Discrimination of characters by a multi-stage recognition process
Chi et al. Separation of single-and double-touching handwritten numeral strings
Anami et al. Combined Hu moments, orientation knowledge, and grid intersections feature based identification of Bharatanatyam mudra images
KR0186025B1 (ko) 후보 문자 분류 방법
JPH01290090A (ja) 辞書作成方法
JP2853168B2 (ja) パターン認識装置
CN117710985B (zh) 光学字符识别方法、装置及智能终端
JP2853169B2 (ja) パターン認識装置
JP2643294B2 (ja) 辞書作成方法
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP3285837B2 (ja) 文字列の切り出し装置および方法
JP2976426B2 (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
CN112183538A (zh) 一种满文识别方法及系统
JPH07109612B2 (ja) 画像処理方法
JPH033091A (ja) パターン認識用辞書作成装置
JPH03269691A (ja) 光学式文字認識システム
JPH0757047A (ja) 文字切出し方式
JPH01187684A (ja) 文字認識装置