JP2853168B2 - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JP2853168B2
JP2853168B2 JP1138746A JP13874689A JP2853168B2 JP 2853168 B2 JP2853168 B2 JP 2853168B2 JP 1138746 A JP1138746 A JP 1138746A JP 13874689 A JP13874689 A JP 13874689A JP 2853168 B2 JP2853168 B2 JP 2853168B2
Authority
JP
Japan
Prior art keywords
pattern
dictionary
mesh
value
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1138746A
Other languages
English (en)
Other versions
JPH033089A (ja
Inventor
啓介 後藤
哲也 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Original Assignee
Meidensha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp filed Critical Meidensha Corp
Priority to JP1138746A priority Critical patent/JP2853168B2/ja
Publication of JPH033089A publication Critical patent/JPH033089A/ja
Application granted granted Critical
Publication of JP2853168B2 publication Critical patent/JP2853168B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 A.産業上の利用分野 本発明は文字や図形等のパターンを認識する装置に関
するものである。
B.発明の概要 本発明は、文字や図形等のパターンを、照合対象とな
る辞書を用いて認識する装置において、 パターンの特徴点の位置的特徴をあいまい集合(ファ
ジイ集合)で表した辞書を用い、認識対象のパターンの
特徴点の位置に対応するメンバーシップ値について演算
を行い、演算結果にもとづいて認識結果を得ることによ
って、 パターンの認識を高い精度でかつ高速に実行できるよ
うにしたものである。
C.従来の技術 文字や図形等のパターンを認識する場合、例えば、書
類や図面等をイメージスキャナ等の入力装置で操作して
得られる黒と白の2値画像データ(入力パターン)に基
づいて、予め記憶されている文字や図形の標準パターン
(辞書パターン)と位置等を照合し、辞書パターンの中
から最も重なり合うものを最終的に認識結果として求め
ている。
認識方法の具体例として、例えば、入力パターンと辞
書パターンをそれぞれ小さな正方格子状(メッシュ)に
区切り、格子点が文字や図形である場合には黒(1)、
そうでないときは(0)と表す場合において、入力と辞
書の2つのパターンの重なりの程度をハミング距離を用
いて求めることができる。これは、入力と辞書が黒と黒
または白と白の場合には0、黒と白または白と黒の場合
には1とおき、その総和を求めるものである。つまり、
黒と黒、白と白のように重なり合っていればいるほど、
その総和(ハミング距離)が小さくなる。この性質によ
り、多数の辞書パターンの中から入力パターンと最も重
なり合っているもの、すなわち、ハミング距離が最も小
さいものを認識結果とするものである。
D.発明が解決しようとする課題 この方法だと入力パターンの位置が辞書パターンの位
置とずれていたり、大きさが異なっていたり、傾きが異
なっていたりすると、重なりの程度が変わってしまい、
認識の誤りが生じやすい欠点がある。
また記憶容量の点でも問題がある。1文字あるいは1
図形パターンの必要空間は表示のための文字フォントの
ように8×8画素(英数字)や24×24画素(漢字)の空
間では済まず、線の切れやつぶれを極力避けるため少な
くともその3〜5倍の空間を必要とする。特に、漢字や
複雑な図形の場合128×128画素程度以上確保しないと安
定な処理が望めないことになる。
文字や図形パターンの辞書種別は漢字の場合第二水準
を含めると6000字種以上に及び、図形の場合でも多いと
きには1000字種以上になる。
このような膨大な辞書種別に対して、1辞書毎に128
×128画素を確保するとすれば、メモリとして2Kバイト
が必要となる。つまり、先の漢字では12Mバイト以上、
図形で2Mバイト以上もの記憶領域が必要となる。
ハードウェア構成上この容量は無視できないほど大き
く、また、辞書の探索や整合処理にも処理時間などで影
響を与えることになる。
更に、辞書種別の点からいえば、上述の膨大な種別に
ついてひとつひとつ辞書をマニュアルで登録する作業が
必要とされており、そのための作業時間も膨大となる問
題点がある。
以上まとめると、従来技術には以下の大きな3つの課
題が残されている。
認識精度の高い認識手法の確立 記憶容量低減のための辞書構成方法の確立 辞書の自動生成方法の確立 本発明は、このような課題を解決することを目的とす
る。
E.課題を解決するための手段 文字や図形パターンは人間の歴史的または経験的規則
に従って記述された位置関係にあるが、パターンを特徴
づける点(特徴点)そのものはあいまい性を有してい
る。
例えば、第2図aの○印で示す文字“A"の代表的な特
徴点の場合(これを頂点と呼ぶものとする)、頂点の位
置そのものは他の特徴点からみて左に振れたり(同図
b)、右に振れたり(同図c)する。また、頂点のとこ
ろで切れたり(同図d)もする。
しかし、同図eのように、頂点の部分だけが他の特徴
点より下の方に位置することはありえない。
結局、文字“A"の頂点というものは、他の特徴点より
位置関係で言うと上の方でかつ真ん中付近にある、とい
う極めてあいまいな尺度で規則性を持っているというこ
とになる。
本発明は、このように文字や図形パターンの特徴点の
位置関係にあいまい性があることを考慮して、その位置
関係をあいまい集合(ファジイ集合)の概念を取り入れ
て表現することによりパターン毎に2次元ファジイ辞書
を登録し、認識対象のパターンと各パターンの2次元フ
ァジイ辞書とを比較してその比較結果にもとづいて認識
結果を得ようとするものである。
具体的には本発明は、あるパターンに対して多数のサ
ンプルを作成し、各サンプルにおけるパターンの特徴点
を抽出し、 パターンが描かれる平面領域にa×b個(a,bは整
数)のメッシュ領域を割り当てると共に、これに対応し
て辞書記憶部内にメッシュ領域を設定し、このメッシュ
領域内の各メッシュ毎に前記特徴点の出現回数である出
現頻度を求めて、メッシュ領域に対応する出現頻度分布
を作成し、 前記出現頻度分布上の各頻度を基準頻度を用いること
により正規化してこの正規化した値をメンバーシップ値
とし、このメンバーシップ値にもとづいて、辞書記憶部
内のメッシュ領域の各メッシュにメンバーシップ値を割
り当てて2次元ファジイ辞書を作成し、こうして得られ
る2次元ファジイ辞書を特徴点の基準個数jと共に予め
パターン毎に辞書記憶部内に登録しておき、 認識対象であるパターンについて特徴点を抽出し、そ
の特徴点の総数mと各特徴点のメッシュ領域におけるメ
ッシュ位置(xi,yi)(1≦i≦m)とを求め、 辞書記憶部内のあるパターンPTkを照合対象として、
これの2次元ファジイ辞書の前記メッシュ位置(xi
yi)に対応するメンバーシップ値fk(xi,yi)を求め、 各メンバーシップ値fk(xi,yi)を確信度1.0から差
し引いた値の合計値 と前記特徴点の基準個数jと前記特徴点の総数mとにも
とづいて、認識対象のパターンと照合対象のパターンPT
kとの離れている度合いに相当する距離Dkを演算し、 この距離Dkを辞書記憶部内の総てのパターンについて
計算し、そのうちの小さい値から順にパターンを適数選
んで認識結果とすることを特徴とする。
ここで前記距離Dkの意味について説明する。今認識対
象であるパターン(入力パターン)の特徴点の総数が
m、各特徴点のメッシュ位置が(x1,y1),(x2,y2
……(xm,ym)であったとする。先ず辞書記憶部内に登
録されているあるパターンPTkを照合対象として、その
2次元ファジイ辞書について前記メッシュ位置(xi
yi)(ただし1≦i≦m)に対応するメンバーシップ値
fk(xi,yi)を拾い出す。このfk(xi,yi)は、(xi
yi)に位置する入力パターンの特徴点がパターンPTk
ひとつの特徴点であることの確信度を示すものである。
そこで本発明では、例えば確信度1.0からfk(xi,yi
を差し引いた値を入力パターンの全特徴点数mあるいは
パターンPTkに係る特徴点の基準個数jで割った値を、
(xi,yi)に位置する特徴点とパターンPTkとの距離と
いう概念で捉え、そして入力パターンの全特徴点につい
ての前記距離の合計値を当該パターンと照合対象である
パターンPTkとの距離Dkとして捉える。このDkの演算式
の一例を示すと、jとmが等しいときには となる。またjとmとが異なるときは となる。これらの式をまとめると次式となる。
ただしmax(m.j)はm.jの大きい方の値である。
F.実施例 本発明装置の具体的手順を以下に説明する。
(1)辞書作成準備 辞書を作成するため、同一の文字、または、図形に対
して複数のサンプルを準備する。
それらはあるひとつの辞書を作成するときの辞書作成
用パターンとなる。
(2)特徴点出願頻度分布(2次元ヒストグラム)の作
成 サンプルを繰り返し入力して、それぞれ特徴点を抽出
する。一方、パターンが描かれる平面領域にa×b個
(a,bは整数)のメッシュ領域を割り当てると共に、こ
れに対応して辞書記憶部内にメッシュ領域を設定する。
そしてこのメッシュ領域内の各メッシュ毎に前記特徴点
の出現回数である出現頻度を求めて、第1図に示すよう
にメッシュ領域に対応する出現頻度分布を作成する。
例えば、パターンが描かれる平面領域に10×10のメッ
シュ領域を割り当てたとき、辞書記憶部内にも10×10の
メッシュ領域を設定する。このとき、ある特徴点の位置
がz(x,y)=(5,3)と得られた場合には、ヒストグラ
ム上の位置z(5,3)の頻度に1を加えたものとなる。
特徴点位置をz(x,y)とすれば、2次元ヒストグラ
ム上で対応する位置Z(x,y)における頻度P(x,y)
は、次式で示される。
P(x,y)=P(x,y)+1 (P(x,y)の初期値0) (3)2次元ファジイ集合におけるメンバーシップ値の
定義と辞書の作成 上で求めた特徴点出現頻度分布は、特徴点がどの様な
位置に出現しやすいかという傾向を示している。つま
り、同一の文字、または、図形に対して、複数のサンプ
ルによる頻度分布を取ると、似通った位置に特徴点が出
現しやすく、その付近にピークが存在することが多いこ
とを示している。
このことから逆に、ピーク位置を抽出することで特徴
点位置を推定することができる。
本発明は、この考え方をファジイ集合におけるメンバ
ーシップ値の設定に応用したものである。
さて、頻度分布は、ひとつのパターンに対するサンプ
ル数が多ければ多いほど、全体の頻度が高くなり、客観
的な判断をすることがむずかしくなるため、頻度分布の
正規化が必要である。
一方、ファジイ集合におけるメンバーシップ値は、あ
いまいな尺度のものを[0,1]区間の実数領域における
主観的な量として表現したものである。
メンバーシップ値の定義は、[0,1]区間の実数領域
をヒントに、また、特徴点が頻度分布のピークに対応す
る場合が多いことをヒントにしている。
つまり、頻度分布のピーク値は特徴点位置というあい
まいな尺度を示す指標となりうるため、0〜1の実数区
間で正規化すればそのまま2次元のファジイ集合に関す
るメンバーシップ値として用いることができることにな
る。
そこで、特徴点出現頻度の正規化と辞書記憶部への登
録を次のように行う。
全サンプルの特徴点数をKとしたとき、ある一定の割
合Ckを乗じたものを基準点までのピーク数kとして求め
る。
k=Ck・K 次に、特徴点出現頻度分布において、頻度の大きいも
のから順に捜していき、k番目の頻度の値を取るものを
求め、これを基準点の頻度Pkとする。
Pkをもとに、特徴点頻度分布を次式により正規化を行
う。
分布上の頻度をP、正規化後の頻度をMとすれば、 M=1.0 ……P≧Pkのとき P/Pk……P<Pkのとき 分布上の全ての頻度について行うことで、正規化した結
果が得られる。この結果は、0〜1区間にあり、2次元
ファジイ辞書として辞書記憶部に登録する。
以上で、ひとつのパターンに対する辞書作成手続きが
終了する。
このようにして得られた2次元ファジイ辞書の一例を
図示すると、第3図は文字「A」の特徴点頻度分布を示
す図、第4図は第3図に示す分布を正規化したものを示
す図であり、この例ではある領域に9×9のメッシュ領
域をとっている。ここで特徴点とは、例えば黒画素に接
する白画素を輪郭画素として抜き出し、これらを直線近
似処理等を行って情報圧縮化し、こうして得られた輪郭
画素に相当するものである。
次に認識対象であるパターンを入力して、辞書記憶部
内のパターン群と照合する手段の一例について述べる。
第5図中辞書記憶部1内にはパターン毎にファジイ辞書
と特徴点の基準個数jとが登録されている。特徴点の基
準個数jは、例えばファジイ辞書を作成するときに用い
たパターンのサンプルの特徴点の平均個数である。
先ずパターン入力部2にてパターンを入力し、特徴点
個数加算部3により当該パターンの特徴点の総数(全特
徴点数)mを求める。続いてメンバーシップ値加算部4
により辞書記憶部1内のあるパターンPTkについて、パ
ターン入力部2に入力したパターン(認識対象のパター
ン)の特徴点のメッシュ位置(xi,yi)(1≦i≦m)
に対応するメンバーシップ値fk(xi,yi)を求め、これ
らfk(xi,yi)の総てを加算し、その加算値 を距離演算部5に出力する。そして最大値検出部6によ
りj,mのうちの大きい方max(j.m)を出力し、距離演算
部5にて先述した(1)式の演算を実行して距離Dkを求
める。こうした試行を登録されているすべてのパターン
について行い、近距離判定部7にてDkの小さい順にl個
のパターンを取り出し、これを認識結果として認識結果
出力部8より出力する。
以上において、2次元ファジイ辞書としては、第3図
に示す出現頻度分布を正規化して得られた第4図に示す
メンバーシップ値の配列をそのまま用いてもよいが、次
のような処理を施して得られたものを用いてもよい。
先ず各メッシュの出現頻度のうち最大値をとるメッシ
ュを第1の領域の探索開始点として予め定めた規則に従
い第1の領域に含まれるメッシュを探索し、次いで第1
の領域以外のメッシュの中から出現頻度の最大値をとる
メッシュを第2の領域の探索開始点として、同様に第2
の領域に含まれるメッシュを探索し、こうした処理を繰
り返すことにより前記メッシュ領域を1以上の領域に分
離する。一方出現頻度を正規化するために例えば出現頻
度の総数にもとづいて基準頻度を求める。
続いて分離領域毎にその分離領域のみを含む前記メッ
シュ領域について各出現頻度を基準頻度を用いて正規化
してメンバーシップ値を求め、その後当該メッシュ領域
の各メッシュの1行づつについてその行に含まれるメン
バーシップ値の中から最大値を求めると共に、1列づつ
についてその列に含まれるメンバーシップ値の中から最
大値を求め、これら最大値を分離領域毎に組にして第6
図に示すような1次元ファジイ辞書を作成する。
次いでメッシュ領域の端からi番目のメッシュ列にX
座標xiを、端からj番目の行にY座標yjを夫々割り当て
ると共に、分離領域毎に作成した1次元ファジイ辞書に
ついて、xi,yjに夫々対応するメンバーシップ値をX
(i),Y(j)と表示したとき、分離領域毎に(xi
yj)のメッシュ位置における2次元のメンバーシップ値
f(i,j)に対してX(i),Y(j)のうちの小さい方
の値を割り当てて、分離領域に対する2次元のメンバー
シップ値の集合を得る。
次いでメッシュ位置(xi,yj)におけるメンバーシッ
プ値F(i,j)に対して、各分離領域のf(i,j)のうち
の最大値を割り当て、このF(i,j)の集合によって第
7図に示すように各分離領域の全領域に対する2次元フ
ァジイ辞書を得る。
G.発明の効果 本発明によれば、文字や図形等のパターンの特徴点の
出現頻度分布を、多数のサンプルを用意することにより
作成し、この出現頻度分布の各頻度を正規化して、その
値をメンバーシップ値として登録するようにしているた
め、辞書を自動的に作成することができると共に辞書登
録のためのマニュアル作業が大幅に低減し、また入力パ
ターンの位置や傾きにばらつきがあっても認識の誤りが
生じにくい。
更に辞書空間としては、表示のための文字フォントの
1.2倍〜1.5倍程度のメッシュ空間があれば十分認識でき
る。例えば英数字の場合9×9程度、複雑な漢字の場合
32×32程度のメッシュ空間で済む。そして例えばメンバ
ーシップ値を、0〜1までを0.1で刻んだ値により表現
した場合、データ表現としては0〜10の整数で持てばよ
いから4ビットで構成することができる。従ってメモリ
量としては漢字1文字当たり32×32×4ビット=512バ
イトとなり、従来必要であった2Kバイトと比較して1/4
程度で済み、記憶容量の低減化を図ることができる。
また入力パターンを認識するにあたっては、入力パタ
ーンの特徴点のメッシュ位置に対応するメンバーシップ
値を辞書より求めるだけで確信度が得られ、その確信度
を確信度1.0から差し引いた値を特徴点個々の照合対象
であるパターンとの距離として捉え、この距離を用いて
例えば(1)式により2つのパターンの距離Dkを演算
し、その値が小さい程パターンのマッチングの程度が高
いとして認識しているため、演算が簡単であって、高速
なパターン認識を実現できる。そして辞書そのものにあ
いまい性があるので、位置ずれに極めて強い特性があ
る。
【図面の簡単な説明】
第1図は特徴点出現頻度を示す概念図、第2図は特徴点
のあいまい性を示す説明図、第3図は特徴点出現頻度分
布を示すデータ図、第4図は正規化後の特徴点出現頻度
分布を示すデータ図、第5図は本発明の実施例を実行す
る回路のブロック図、第6図は1次元ファジイ辞書のデ
ータ図、第7図は2次元ファジイ辞書のデータ図であ
る。 1…辞書記憶部、3…特徴点個数加算部、4…メンバー
シップ値加算部、5…距離演算部。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−3091(JP,A) 特開 平3−3090(JP,A) 特開 平1−290090(JP,A) 特開 昭63−108480(JP,A) 特開 昭62−192886(JP,A) 特開 昭64−15885(JP,A) 特許2643293(JP,B2) 特許2643294(JP,B2) 特公 平7−104938(JP,B2) (58)調査した分野(Int.Cl.6,DB名) G06K 9/68 G06K 9/62 特許ファイル(PATOLIS) JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】照合対象パターン毎のファジイ辞書とパタ
    ーンを特徴づける特徴点の基準個数jとが登録され、パ
    ターンが描かれる平面領域にメッシュ領域を割り当てる
    とともに、これに対応してメッシュ領域が設定された辞
    書記憶部と、 パターン入力部に入力された認識対象パターンの特徴点
    の個数を加算して総数mを求める特徴点個数加算部と、 前記辞書記憶部内の、あるパターンについて、前記パタ
    ーン入力部に入力されたパターンの特徴点のメッシュ位
    置に対応するメンバーシップ値fkを求め、これらfkを総
    てを加算した加算値を求めるメンバーシップ値加算部
    と、 メンバーシップ値加算部で求められた加算値と、前記基
    準個数jと総数mのうち最大値検出部で得た大きい方の
    出力とが供給され、両者から下記式の演算を実行して認
    識対象パターンと照合対象パターンとの離れている度合
    いに相当する距離Dkを求める距離演算部と、 この距離演算部で演算された距離Dkを前記辞書記憶部内
    に登録されている総てのパターンについて演算し、その
    うちの小さい値から順にパターンを適数選んで認識結果
    として取り出す近距離判定部とを備えたことを特徴とす
    るパターン認識装置。 ただしmax(m.j)はm,jの大きい方の値
JP1138746A 1989-05-31 1989-05-31 パターン認識装置 Expired - Lifetime JP2853168B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1138746A JP2853168B2 (ja) 1989-05-31 1989-05-31 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1138746A JP2853168B2 (ja) 1989-05-31 1989-05-31 パターン認識装置

Publications (2)

Publication Number Publication Date
JPH033089A JPH033089A (ja) 1991-01-09
JP2853168B2 true JP2853168B2 (ja) 1999-02-03

Family

ID=15229210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1138746A Expired - Lifetime JP2853168B2 (ja) 1989-05-31 1989-05-31 パターン認識装置

Country Status (1)

Country Link
JP (1) JP2853168B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2590414B2 (ja) * 1991-03-12 1997-03-12 科学技術庁長官官房会計課長 ファジィパターン認識方法
JPH0812684B2 (ja) * 1991-08-05 1996-02-07 科学技術庁長官官房会計課長 パターン認識装置
US11270066B2 (en) 2010-04-30 2022-03-08 Microsoft Technology Licensing, Llc Temporary formatting and charting of selected data
US9367198B2 (en) 2010-04-30 2016-06-14 Microsoft Technology Licensing, Llc Spin control user interface for selecting options
EP3118813B1 (en) * 2014-03-14 2021-06-02 Omron Corporation Image recognition device, image sensor, and image recognition method

Also Published As

Publication number Publication date
JPH033089A (ja) 1991-01-09

Similar Documents

Publication Publication Date Title
US7369702B2 (en) Template-based cursive handwriting recognition
CN110180186B (zh) 一种地形图转换方法及系统
US20100189316A1 (en) Systems and methods for graph-based pattern recognition technology applied to the automated identification of fingerprints
US5515455A (en) System for recognizing handwritten words of cursive script
Mahmud et al. A complete OCR system for continuous Bengali characters
CN109800746A (zh) 一种基于cnn的手写英文文档识别方法
WO2001054054A9 (en) Word recognition using silhouette bar codes
Zhu et al. Text detection based on convolutional neural networks with spatial pyramid pooling
JPH06301781A (ja) コンピュータによるパターン認識のためのイメージ変換方法及び装置
JP2853168B2 (ja) パターン認識装置
Fu Recent advances in syntactic pattern recognition
JP2853169B2 (ja) パターン認識装置
Srinivas et al. An overview of OCR research in Indian scripts
JP2643294B2 (ja) 辞書作成方法
Rahman et al. Notice of violation of IEEE publication principles: Modified syntactic method to recognize Bengali handwritten characters
CN112329389A (zh) 一种基于语义分割与禁忌搜索的汉字笔画自动提取方法
JP2853167B2 (ja) パターン認識用辞書作成装置
CN117095423B (zh) 一种银行单据字符的识别方法及装置
JP2643293B2 (ja) 辞書作成方法
CN109189966A (zh) 一种基于形状特征的服饰纹样检索方法
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
Dhanikonda et al. Research Article An Efficient Deep Learning Model with Interrelated Tagging Prototype with Segmentation for Telugu Optical Character Recognition
JP2766205B2 (ja) 文字認識装置
JP3514085B2 (ja) 文字列入力方法及び装置、並びに、文字列入力プログラムを格納した記憶媒体
Ahmed et al. A novel intelligent system for defining similar symbols