JP2853168B2

JP2853168B2 - パターン認識装置

Info

Publication number: JP2853168B2
Application number: JP1138746A
Authority: JP
Inventors: 啓介後藤; 哲也安田
Original assignee: Meidensha Corp
Current assignee: Meidensha Corp
Priority date: 1989-05-31
Filing date: 1989-05-31
Publication date: 1999-02-03
Anticipated expiration: 2014-02-03
Also published as: JPH033089A

Description

【発明の詳細な説明】 A.産業上の利用分野本発明は文字や図形等のパターンを認識する装置に関
するものである。

B.発明の概要本発明は、文字や図形等のパターンを、照合対象とな
る辞書を用いて認識する装置において、パターンの特徴点の位置的特徴をあいまい集合（ファ
ジイ集合）で表した辞書を用い、認識対象のパターンの
特徴点の位置に対応するメンバーシップ値について演算
を行い、演算結果にもとづいて認識結果を得ることによ
って、パターンの認識を高い精度でかつ高速に実行できるよ
うにしたものである。

C.従来の技術文字や図形等のパターンを認識する場合、例えば、書
類や図面等をイメージスキャナ等の入力装置で操作して
得られる黒と白の２値画像データ（入力パターン）に基
づいて、予め記憶されている文字や図形の標準パターン
（辞書パターン）と位置等を照合し、辞書パターンの中
から最も重なり合うものを最終的に認識結果として求め
ている。

認識方法の具体例として、例えば、入力パターンと辞
書パターンをそれぞれ小さな正方格子状（メッシュ）に
区切り、格子点が文字や図形である場合には黒（１）、
そうでないときは（０）と表す場合において、入力と辞
書の２つのパターンの重なりの程度をハミング距離を用
いて求めることができる。これは、入力と辞書が黒と黒
または白と白の場合には０、黒と白または白と黒の場合
には１とおき、その総和を求めるものである。つまり、
黒と黒、白と白のように重なり合っていればいるほど、
その総和（ハミング距離）が小さくなる。この性質によ
り、多数の辞書パターンの中から入力パターンと最も重
なり合っているもの、すなわち、ハミング距離が最も小
さいものを認識結果とするものである。

D.発明が解決しようとする課題この方法だと入力パターンの位置が辞書パターンの位
置とずれていたり、大きさが異なっていたり、傾きが異
なっていたりすると、重なりの程度が変わってしまい、
認識の誤りが生じやすい欠点がある。

また記憶容量の点でも問題がある。１文字あるいは１
図形パターンの必要空間は表示のための文字フォントの
ように８×８画素（英数字）や24×24画素（漢字）の空
間では済まず、線の切れやつぶれを極力避けるため少な
くともその３〜５倍の空間を必要とする。特に、漢字や
複雑な図形の場合128×128画素程度以上確保しないと安
定な処理が望めないことになる。

文字や図形パターンの辞書種別は漢字の場合第二水準
を含めると6000字種以上に及び、図形の場合でも多いと
きには1000字種以上になる。

このような膨大な辞書種別に対して、１辞書毎に128
×128画素を確保するとすれば、メモリとして2Kバイト
が必要となる。つまり、先の漢字では12Mバイト以上、
図形で2Mバイト以上もの記憶領域が必要となる。

ハードウェア構成上この容量は無視できないほど大き
く、また、辞書の探索や整合処理にも処理時間などで影
響を与えることになる。

更に、辞書種別の点からいえば、上述の膨大な種別に
ついてひとつひとつ辞書をマニュアルで登録する作業が
必要とされており、そのための作業時間も膨大となる問
題点がある。

以上まとめると、従来技術には以下の大きな３つの課
題が残されている。

認識精度の高い認識手法の確立記憶容量低減のための辞書構成方法の確立辞書の自動生成方法の確立本発明は、このような課題を解決することを目的とす
る。

E.課題を解決するための手段文字や図形パターンは人間の歴史的または経験的規則
に従って記述された位置関係にあるが、パターンを特徴
づける点（特徴点）そのものはあいまい性を有してい
る。

例えば、第２図ａの○印で示す文字“A"の代表的な特
徴点の場合（これを頂点と呼ぶものとする）、頂点の位
置そのものは他の特徴点からみて左に振れたり（同図
ｂ）、右に振れたり（同図ｃ）する。また、頂点のとこ
ろで切れたり（同図ｄ）もする。

しかし、同図ｅのように、頂点の部分だけが他の特徴
点より下の方に位置することはありえない。

結局、文字“A"の頂点というものは、他の特徴点より
位置関係で言うと上の方でかつ真ん中付近にある、とい
う極めてあいまいな尺度で規則性を持っているというこ
とになる。

本発明は、このように文字や図形パターンの特徴点の
位置関係にあいまい性があることを考慮して、その位置
関係をあいまい集合（ファジイ集合）の概念を取り入れ
て表現することによりパターン毎に２次元ファジイ辞書
を登録し、認識対象のパターンと各パターンの２次元フ
ァジイ辞書とを比較してその比較結果にもとづいて認識
結果を得ようとするものである。

具体的には本発明は、あるパターンに対して多数のサ
ンプルを作成し、各サンプルにおけるパターンの特徴点
を抽出し、パターンが描かれる平面領域にａ×ｂ個（a,bは整
数）のメッシュ領域を割り当てると共に、これに対応し
て辞書記憶部内にメッシュ領域を設定し、このメッシュ
領域内の各メッシュ毎に前記特徴点の出現回数である出
現頻度を求めて、メッシュ領域に対応する出現頻度分布
を作成し、前記出現頻度分布上の各頻度を基準頻度を用いること
により正規化してこの正規化した値をメンバーシップ値
とし、このメンバーシップ値にもとづいて、辞書記憶部
内のメッシュ領域の各メッシュにメンバーシップ値を割
り当てて２次元ファジイ辞書を作成し、こうして得られ
る２次元ファジイ辞書を特徴点の基準個数ｊと共に予め
パターン毎に辞書記憶部内に登録しておき、認識対象であるパターンについて特徴点を抽出し、そ
の特徴点の総数ｍと各特徴点のメッシュ領域におけるメ
ッシュ位置（x_i，y_i）（１≦ｉ≦ｍ）とを求め、辞書記憶部内のあるパターンPT_kを照合対象として、
これの２次元ファジイ辞書の前記メッシュ位置（x_i，
y_i）に対応するメンバーシップ値f_k（x_i，y_i）を求め、各メンバーシップ値f_k（x_i，y_i）を確信度1.0から差
し引いた値の合計値と前記特徴点の基準個数ｊと前記特徴点の総数ｍとにも
とづいて、認識対象のパターンと照合対象のパターンPT
_kとの離れている度合いに相当する距離D_kを演算し、この距離D_kを辞書記憶部内の総てのパターンについて
計算し、そのうちの小さい値から順にパターンを適数選
んで認識結果とすることを特徴とする。

ここで前記距離Dkの意味について説明する。今認識対
象であるパターン（入力パターン）の特徴点の総数が
ｍ、各特徴点のメッシュ位置が（x₁，y₁），（x₂，y₂）
……（x_m，y_m）であったとする。先ず辞書記憶部内に登
録されているあるパターンPT_kを照合対象として、その
２次元ファジイ辞書について前記メッシュ位置（x_i，
y_i）（ただし１≦ｉ≦ｍ）に対応するメンバーシップ値
f_k（x_i，y_i）を拾い出す。このf_k（x_i，y_i）は、（x_i，
y_i）に位置する入力パターンの特徴点がパターンPT_kの
ひとつの特徴点であることの確信度を示すものである。
そこで本発明では、例えば確信度1.0からf_k（x_i，y_i）
を差し引いた値を入力パターンの全特徴点数ｍあるいは
パターンPT_kに係る特徴点の基準個数ｊで割った値を、
（x_i，y_i）に位置する特徴点とパターンPT_kとの距離と
いう概念で捉え、そして入力パターンの全特徴点につい
ての前記距離の合計値を当該パターンと照合対象である
パターンPT_kとの距離D_kとして捉える。このD_kの演算式
の一例を示すと、ｊとｍが等しいときにはとなる。またｊとｍとが異なるときはとなる。これらの式をまとめると次式となる。

ただしmax（m.j）はm.jの大きい方の値である。

F.実施例本発明装置の具体的手順を以下に説明する。

（１）辞書作成準備辞書を作成するため、同一の文字、または、図形に対
して複数のサンプルを準備する。

それらはあるひとつの辞書を作成するときの辞書作成
用パターンとなる。

（２）特徴点出願頻度分布（２次元ヒストグラム）の作
成サンプルを繰り返し入力して、それぞれ特徴点を抽出
する。一方、パターンが描かれる平面領域にａ×ｂ個
（a,bは整数）のメッシュ領域を割り当てると共に、こ
れに対応して辞書記憶部内にメッシュ領域を設定する。
そしてこのメッシュ領域内の各メッシュ毎に前記特徴点
の出現回数である出現頻度を求めて、第１図に示すよう
にメッシュ領域に対応する出現頻度分布を作成する。

例えば、パターンが描かれる平面領域に10×10のメッ
シュ領域を割り当てたとき、辞書記憶部内にも10×10の
メッシュ領域を設定する。このとき、ある特徴点の位置
がｚ（x,y）＝（5,3）と得られた場合には、ヒストグラ
ム上の位置ｚ（5,3）の頻度に１を加えたものとなる。

特徴点位置をｚ（x,y）とすれば、２次元ヒストグラ
ム上で対応する位置Ｚ（x,y）における頻度Ｐ（x,y）
は、次式で示される。

Ｐ（x,y）＝Ｐ（x,y）＋１（Ｐ（x,y）の初期値０）（３）２次元ファジイ集合におけるメンバーシップ値の
定義と辞書の作成上で求めた特徴点出現頻度分布は、特徴点がどの様な
位置に出現しやすいかという傾向を示している。つま
り、同一の文字、または、図形に対して、複数のサンプ
ルによる頻度分布を取ると、似通った位置に特徴点が出
現しやすく、その付近にピークが存在することが多いこ
とを示している。

このことから逆に、ピーク位置を抽出することで特徴
点位置を推定することができる。

本発明は、この考え方をファジイ集合におけるメンバ
ーシップ値の設定に応用したものである。

さて、頻度分布は、ひとつのパターンに対するサンプ
ル数が多ければ多いほど、全体の頻度が高くなり、客観
的な判断をすることがむずかしくなるため、頻度分布の
正規化が必要である。

一方、ファジイ集合におけるメンバーシップ値は、あ
いまいな尺度のものを［0,1］区間の実数領域における
主観的な量として表現したものである。

メンバーシップ値の定義は、［0,1］区間の実数領域
をヒントに、また、特徴点が頻度分布のピークに対応す
る場合が多いことをヒントにしている。

つまり、頻度分布のピーク値は特徴点位置というあい
まいな尺度を示す指標となりうるため、０〜１の実数区
間で正規化すればそのまま２次元のファジイ集合に関す
るメンバーシップ値として用いることができることにな
る。

そこで、特徴点出現頻度の正規化と辞書記憶部への登
録を次のように行う。

全サンプルの特徴点数をＫとしたとき、ある一定の割
合C_kを乗じたものを基準点までのピーク数ｋとして求め
る。

ｋ＝C_k・Ｋ次に、特徴点出現頻度分布において、頻度の大きいも
のから順に捜していき、ｋ番目の頻度の値を取るものを
求め、これを基準点の頻度P_kとする。

P_kをもとに、特徴点頻度分布を次式により正規化を行
う。

分布上の頻度をＰ、正規化後の頻度をＭとすれば、Ｍ＝1.0 ……Ｐ≧P_kのとき P/P_k……Ｐ＜P_kのとき分布上の全ての頻度について行うことで、正規化した結
果が得られる。この結果は、０〜１区間にあり、２次元
ファジイ辞書として辞書記憶部に登録する。

以上で、ひとつのパターンに対する辞書作成手続きが
終了する。

このようにして得られた２次元ファジイ辞書の一例を
図示すると、第３図は文字「Ａ」の特徴点頻度分布を示
す図、第４図は第３図に示す分布を正規化したものを示
す図であり、この例ではある領域に９×９のメッシュ領
域をとっている。ここで特徴点とは、例えば黒画素に接
する白画素を輪郭画素として抜き出し、これらを直線近
似処理等を行って情報圧縮化し、こうして得られた輪郭
画素に相当するものである。

次に認識対象であるパターンを入力して、辞書記憶部
内のパターン群と照合する手段の一例について述べる。
第５図中辞書記憶部１内にはパターン毎にファジイ辞書
と特徴点の基準個数ｊとが登録されている。特徴点の基
準個数ｊは、例えばファジイ辞書を作成するときに用い
たパターンのサンプルの特徴点の平均個数である。

先ずパターン入力部２にてパターンを入力し、特徴点
個数加算部３により当該パターンの特徴点の総数（全特
徴点数）ｍを求める。続いてメンバーシップ値加算部４
により辞書記憶部１内のあるパターンPT_kについて、パ
ターン入力部２に入力したパターン（認識対象のパター
ン）の特徴点のメッシュ位置（x_i，y_i）（１≦ｉ≦ｍ）
に対応するメンバーシップ値f_k（x_i，y_i）を求め、これ
らf_k（x_i，y_i）の総てを加算し、その加算値を距離演算部５に出力する。そして最大値検出部６によ
りj,mのうちの大きい方max（j.m）を出力し、距離演算
部５にて先述した（１）式の演算を実行して距離D_kを求
める。こうした試行を登録されているすべてのパターン
について行い、近距離判定部７にてD_kの小さい順にｌ個
のパターンを取り出し、これを認識結果として認識結果
出力部８より出力する。

以上において、２次元ファジイ辞書としては、第３図
に示す出現頻度分布を正規化して得られた第４図に示す
メンバーシップ値の配列をそのまま用いてもよいが、次
のような処理を施して得られたものを用いてもよい。

先ず各メッシュの出現頻度のうち最大値をとるメッシ
ュを第１の領域の探索開始点として予め定めた規則に従
い第１の領域に含まれるメッシュを探索し、次いで第１
の領域以外のメッシュの中から出現頻度の最大値をとる
メッシュを第２の領域の探索開始点として、同様に第２
の領域に含まれるメッシュを探索し、こうした処理を繰
り返すことにより前記メッシュ領域を１以上の領域に分
離する。一方出現頻度を正規化するために例えば出現頻
度の総数にもとづいて基準頻度を求める。

続いて分離領域毎にその分離領域のみを含む前記メッ
シュ領域について各出現頻度を基準頻度を用いて正規化
してメンバーシップ値を求め、その後当該メッシュ領域
の各メッシュの１行づつについてその行に含まれるメン
バーシップ値の中から最大値を求めると共に、１列づつ
についてその列に含まれるメンバーシップ値の中から最
大値を求め、これら最大値を分離領域毎に組にして第６
図に示すような１次元ファジイ辞書を作成する。

次いでメッシュ領域の端からｉ番目のメッシュ列にＸ
座標x_iを、端からｊ番目の行にＹ座標y_jを夫々割り当て
ると共に、分離領域毎に作成した１次元ファジイ辞書に
ついて、x_i，y_jに夫々対応するメンバーシップ値をＸ
（ｉ）,Y（ｊ）と表示したとき、分離領域毎に（x_i，
y_j）のメッシュ位置における２次元のメンバーシップ値
ｆ（i,j）に対してＸ（ｉ）,Y（ｊ）のうちの小さい方
の値を割り当てて、分離領域に対する２次元のメンバー
シップ値の集合を得る。

次いでメッシュ位置（x_i，y_j）におけるメンバーシッ
プ値Ｆ（i,j）に対して、各分離領域のｆ（i,j）のうち
の最大値を割り当て、このＦ（i,j）の集合によって第
７図に示すように各分離領域の全領域に対する２次元フ
ァジイ辞書を得る。

G.発明の効果本発明によれば、文字や図形等のパターンの特徴点の
出現頻度分布を、多数のサンプルを用意することにより
作成し、この出現頻度分布の各頻度を正規化して、その
値をメンバーシップ値として登録するようにしているた
め、辞書を自動的に作成することができると共に辞書登
録のためのマニュアル作業が大幅に低減し、また入力パ
ターンの位置や傾きにばらつきがあっても認識の誤りが
生じにくい。

更に辞書空間としては、表示のための文字フォントの
1.2倍〜1.5倍程度のメッシュ空間があれば十分認識でき
る。例えば英数字の場合９×９程度、複雑な漢字の場合
32×32程度のメッシュ空間で済む。そして例えばメンバ
ーシップ値を、０〜１までを0.1で刻んだ値により表現
した場合、データ表現としては０〜10の整数で持てばよ
いから４ビットで構成することができる。従ってメモリ
量としては漢字１文字当たり32×32×４ビット＝512バ
イトとなり、従来必要であった2Kバイトと比較して1/4
程度で済み、記憶容量の低減化を図ることができる。

また入力パターンを認識するにあたっては、入力パタ
ーンの特徴点のメッシュ位置に対応するメンバーシップ
値を辞書より求めるだけで確信度が得られ、その確信度
を確信度1.0から差し引いた値を特徴点個々の照合対象
であるパターンとの距離として捉え、この距離を用いて
例えば（１）式により２つのパターンの距離D_kを演算
し、その値が小さい程パターンのマッチングの程度が高
いとして認識しているため、演算が簡単であって、高速
なパターン認識を実現できる。そして辞書そのものにあ
いまい性があるので、位置ずれに極めて強い特性があ
る。

【図面の簡単な説明】

第１図は特徴点出現頻度を示す概念図、第２図は特徴点
のあいまい性を示す説明図、第３図は特徴点出現頻度分
布を示すデータ図、第４図は正規化後の特徴点出現頻度
分布を示すデータ図、第５図は本発明の実施例を実行す
る回路のブロック図、第６図は１次元ファジイ辞書のデ
ータ図、第７図は２次元ファジイ辞書のデータ図であ
る。１…辞書記憶部、３…特徴点個数加算部、４…メンバー
シップ値加算部、５…距離演算部。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平３−3091（ＪＰ，Ａ) 特開平３−3090（ＪＰ，Ａ) 特開平１−290090（ＪＰ，Ａ) 特開昭63−108480（ＪＰ，Ａ) 特開昭62−192886（ＪＰ，Ａ) 特開昭64−15885（ＪＰ，Ａ) 特許2643293（ＪＰ，Ｂ２) 特許2643294（ＪＰ，Ｂ２) 特公平７−104938（ＪＰ，Ｂ２) (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06K 9/68 G06K 9/62 特許ファイル（ＰＡＴＯＬＩＳ) ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】照合対象パターン毎のファジイ辞書とパタ
ーンを特徴づける特徴点の基準個数ｊとが登録され、パ
ターンが描かれる平面領域にメッシュ領域を割り当てる
とともに、これに対応してメッシュ領域が設定された辞
書記憶部と、パターン入力部に入力された認識対象パターンの特徴点
の個数を加算して総数ｍを求める特徴点個数加算部と、前記辞書記憶部内の、あるパターンについて、前記パタ
ーン入力部に入力されたパターンの特徴点のメッシュ位
置に対応するメンバーシップ値f_kを求め、これらf_kを総
てを加算した加算値を求めるメンバーシップ値加算部
と、メンバーシップ値加算部で求められた加算値と、前記基
準個数ｊと総数ｍのうち最大値検出部で得た大きい方の
出力とが供給され、両者から下記式の演算を実行して認
識対象パターンと照合対象パターンとの離れている度合
いに相当する距離D_kを求める距離演算部と、この距離演算部で演算された距離D_kを前記辞書記憶部内
に登録されている総てのパターンについて演算し、その
うちの小さい値から順にパターンを適数選んで認識結果
として取り出す近距離判定部とを備えたことを特徴とす
るパターン認識装置。ただしmax（m.j）はm,jの大きい方の値