JP2853167B2 - パターン認識用辞書作成装置 - Google Patents
パターン認識用辞書作成装置Info
- Publication number
- JP2853167B2 JP2853167B2 JP1138741A JP13874189A JP2853167B2 JP 2853167 B2 JP2853167 B2 JP 2853167B2 JP 1138741 A JP1138741 A JP 1138741A JP 13874189 A JP13874189 A JP 13874189A JP 2853167 B2 JP2853167 B2 JP 2853167B2
- Authority
- JP
- Japan
- Prior art keywords
- feature point
- mesh
- appearance frequency
- frequency distribution
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
【発明の詳細な説明】 A.産業上の利用分野 本発明は文字や図形等のパターンを認識するために用
いられる辞書を作成する装置に関するものである。
いられる辞書を作成する装置に関するものである。
B.発明の概要 本発明は、文字や図形等のパターンを認識するために
用いられ、前記パターンの照合の対象となる辞書を作成
する装置において、 パターンの特徴点の位置的特徴及び方向的特徴を表現
するためにあいまい集合(ファジイ集合)の概念を取り
入れ、位置及び方向を特定するメッシュ空間を割り当て
て各メッシュ毎に特徴点の出現頻度を求め、これを正規
化してファジイ辞書として登録することによって、 辞書を自動的に生成することができ、しかも辞書登録
のためのマニュアル作業時間を短縮することができ、更
に記憶容量の低減化を図ることができるようにしたもの
である。
用いられ、前記パターンの照合の対象となる辞書を作成
する装置において、 パターンの特徴点の位置的特徴及び方向的特徴を表現
するためにあいまい集合(ファジイ集合)の概念を取り
入れ、位置及び方向を特定するメッシュ空間を割り当て
て各メッシュ毎に特徴点の出現頻度を求め、これを正規
化してファジイ辞書として登録することによって、 辞書を自動的に生成することができ、しかも辞書登録
のためのマニュアル作業時間を短縮することができ、更
に記憶容量の低減化を図ることができるようにしたもの
である。
C.従来の技術 文字や図形等のパターンを認識する場合、例えば、書
類や図面等をイメージスキャナ等の入力装置で操作して
得られる黒と白の2値画像データ(入力パターン)に基
づいて、予め記憶されている文字や図形の標準パターン
(辞書パターン)と位置等を照合し、辞書パターンの中
から最も重なり合うものを最終的に認識結果として求め
ている。
類や図面等をイメージスキャナ等の入力装置で操作して
得られる黒と白の2値画像データ(入力パターン)に基
づいて、予め記憶されている文字や図形の標準パターン
(辞書パターン)と位置等を照合し、辞書パターンの中
から最も重なり合うものを最終的に認識結果として求め
ている。
認識方法の具体例として、例えば、入力パターンと辞
書パターンをそれぞれ小さな正方格子状(メッシュ)に
区切り、格子点が文字や図形である場合には黒(1)、
そうでないときは(0)と表す場合において、入力と辞
書の2つのパターンの重なりの程度をハミング距離を用
いて求めることができる。これは、入力と辞書が黒と黒
または白と白の場合には0、黒と白または白と黒の場合
には1とおき、その総和を求めるものである。つまり、
黒と黒、白と白のように重なり合っていればいるほど、
その総和(ハミング距離)が小さくなる。この性質によ
り、多数の辞書パターンの中から入力パターンと最も重
なり合っているもの、すなわち、ハミング距離が最も小
さいものを認識結果とするものである。
書パターンをそれぞれ小さな正方格子状(メッシュ)に
区切り、格子点が文字や図形である場合には黒(1)、
そうでないときは(0)と表す場合において、入力と辞
書の2つのパターンの重なりの程度をハミング距離を用
いて求めることができる。これは、入力と辞書が黒と黒
または白と白の場合には0、黒と白または白と黒の場合
には1とおき、その総和を求めるものである。つまり、
黒と黒、白と白のように重なり合っていればいるほど、
その総和(ハミング距離)が小さくなる。この性質によ
り、多数の辞書パターンの中から入力パターンと最も重
なり合っているもの、すなわち、ハミング距離が最も小
さいものを認識結果とするものである。
D.発明が解決しようとする課題 この方法だと入力パターンの位置が辞書パターンの位
置とずれていたり、大きさが異なっていたり、傾きが異
なっていたりすると、重なりの程度が変わってしまい、
認識の誤りが生じやすい欠点がある。
置とずれていたり、大きさが異なっていたり、傾きが異
なっていたりすると、重なりの程度が変わってしまい、
認識の誤りが生じやすい欠点がある。
また記憶容量の点でも問題がある。1文字あるいは1
図形パターンの必要空間は表示のための文字フォントの
ように8×8画素(英数字)や24×24画素(漢字)の空
間では済まず、線の切れやつぶれを極力避けるため少な
くともその3〜5倍の空間を必要とする。特に、漢字や
複雑な図形の場合128×128画素程度以上確保しないと安
定な処理が望めないことになる。
図形パターンの必要空間は表示のための文字フォントの
ように8×8画素(英数字)や24×24画素(漢字)の空
間では済まず、線の切れやつぶれを極力避けるため少な
くともその3〜5倍の空間を必要とする。特に、漢字や
複雑な図形の場合128×128画素程度以上確保しないと安
定な処理が望めないことになる。
文字や図形パターンの辞書種別は漢字の場合第二水準
を含めると6000字種以上に及び、図形の場合でも多いと
きには1000字種以上になる。
を含めると6000字種以上に及び、図形の場合でも多いと
きには1000字種以上になる。
このような膨大な辞書種別に対して、1辞書毎に128
×128画素を確保するとすれば、メモリとして2Kバイト
が必要となる。つまり、先の漢字では12Mバイト以上、
図形で2Mバイト以上もの記憶領域が必要となる。
×128画素を確保するとすれば、メモリとして2Kバイト
が必要となる。つまり、先の漢字では12Mバイト以上、
図形で2Mバイト以上もの記憶領域が必要となる。
ハードウェア構成上この容量は無視できないほど大き
く、また、辞書の探索や整合処理にも処理時間などで影
響を与えることになる。
く、また、辞書の探索や整合処理にも処理時間などで影
響を与えることになる。
更に、辞書種別の点からいえば、上述の膨大な種別に
ついてひとつひとつ辞書をマニュアルで登録する作業が
必要とされており、そのための作業時間も膨大となる問
題点がある。
ついてひとつひとつ辞書をマニュアルで登録する作業が
必要とされており、そのための作業時間も膨大となる問
題点がある。
以上まとめると、従来技術には以下の大きな3つの課
題が残されている。
題が残されている。
認識精度の高い認識手法の確立 記憶容量低減のための辞書構成方法の確立 辞書の自動生成方法の確立 本発明は、このうち特にの問題点の解決に主眼をお
いたものである。
いたものである。
E.課題を解決するための手段及び作用 文字や図形パターンは人間の歴史的または経験的規則
に従って記述された位置関係にあるが、パターンを特徴
づける点(特徴点)そのものはあいまい性を有してい
る。
に従って記述された位置関係にあるが、パターンを特徴
づける点(特徴点)そのものはあいまい性を有してい
る。
例えば、第3図aの○印で示す文字“A"の代表的な特
徴点の場合(これを頂点と呼ぶものとする)、頂点の位
置そのものは他の特徴点からみて左に振れたり(同図
b)、右に振れたり(同図c)する。また、頂点のとこ
ろで切れたり(同図d)もする。
徴点の場合(これを頂点と呼ぶものとする)、頂点の位
置そのものは他の特徴点からみて左に振れたり(同図
b)、右に振れたり(同図c)する。また、頂点のとこ
ろで切れたり(同図d)もする。
しかし、同図cのように、頂点の部分だけが他の特徴
点より下の方に位置することはありえない。
点より下の方に位置することはありえない。
結局、文字“A"の頂点というものは、他の特徴点より
位置関係で言うと上の方でかつ真ん中付近にある、とい
う極めてあいまいな尺度で規則性を持っているというこ
とになる。
位置関係で言うと上の方でかつ真ん中付近にある、とい
う極めてあいまいな尺度で規則性を持っているというこ
とになる。
本発明は、このように文字や図形パターンの特徴点の
位置関係にあいまい性があることを考慮して、その位置
関係をあいまい集合(ファジイ集合)の概念を取り入れ
て表現し、これを辞書に登録しようとするものである。
位置関係にあいまい性があることを考慮して、その位置
関係をあいまい集合(ファジイ集合)の概念を取り入れ
て表現し、これを辞書に登録しようとするものである。
第1図に本発明装置のフローを示すと、先ずあるパタ
ーンに対して多数のサンプルを作成し、各サンプル毎に
光学的走査によりパターンを入力する。
ーンに対して多数のサンプルを作成し、各サンプル毎に
光学的走査によりパターンを入力する。
次いでこの入力したパターン即ち画像情報に対してノ
イズ処理等の前処理を行う。続いてこの画像情報にもと
づいて例えば白画素に隣接する黒画像群を輪郭画素群と
して抜き出し、これらについて直線近似処理等の情報圧
縮化を行った後、各輪郭画素群を例えば右回りに結合し
て隣接画素同士Pn,Pn+1を結ぶベクトルを抽出し、この
ベクトルを画素Pnの位置とベクトルの方向とにより特定
して記憶する。ここでPnの位置についてはX,Y座標によ
り表され、方向については、次のように量子化した方向
コードθとして表される。一般に座標点a(Xs,Ys)を
始点とし、座標点b(Xe,Ye)を終点とする線分の方向
αは次式で表される。
イズ処理等の前処理を行う。続いてこの画像情報にもと
づいて例えば白画素に隣接する黒画像群を輪郭画素群と
して抜き出し、これらについて直線近似処理等の情報圧
縮化を行った後、各輪郭画素群を例えば右回りに結合し
て隣接画素同士Pn,Pn+1を結ぶベクトルを抽出し、この
ベクトルを画素Pnの位置とベクトルの方向とにより特定
して記憶する。ここでPnの位置についてはX,Y座標によ
り表され、方向については、次のように量子化した方向
コードθとして表される。一般に座標点a(Xs,Ys)を
始点とし、座標点b(Xe,Ye)を終点とする線分の方向
αは次式で表される。
α=tan-1{(Ye−Ys)/(Xe−Xs)} ここに方向コードθは例えば方向αを45度単位に量子
化したものであり、第2図(a)に示すようにθ=0,1,
2……7としたとき、次の条件を満たすときのθを求め
ることにより得られる。
化したものであり、第2図(a)に示すようにθ=0,1,
2……7としたとき、次の条件を満たすときのθを求め
ることにより得られる。
(2θ−1)π/8≦α<(2θ+1)π/8 なお向きを考慮しない場合には第2図(b)に示すよ
うにθ=0,1,2,3の4つのコードとして取り扱うことも
できる。
うにθ=0,1,2,3の4つのコードとして取り扱うことも
できる。
一方、パターンが描かれる領域をm×n(m,nは整
数)のメッシュに区分して、このメッシュ群よりなる領
域(メッシュ領域)に対応する領域を方向コードの数だ
けメモリ内に確保し、確保したメッシュ領域に夫々方向
コードを割り当てる。例えば方向コードθが第2図
(a)に示すように0〜7までの8通りある場合、メモ
リ内にm×nのメッシュ領域を8個確保し、そのうちの
1つをθ=0に対応したメッシュ領域、他の1つをθ=
1に対応したメッシュ領域、………といった具合に割り
当てる。
数)のメッシュに区分して、このメッシュ群よりなる領
域(メッシュ領域)に対応する領域を方向コードの数だ
けメモリ内に確保し、確保したメッシュ領域に夫々方向
コードを割り当てる。例えば方向コードθが第2図
(a)に示すように0〜7までの8通りある場合、メモ
リ内にm×nのメッシュ領域を8個確保し、そのうちの
1つをθ=0に対応したメッシュ領域、他の1つをθ=
1に対応したメッシュ領域、………といった具合に割り
当てる。
次に各サンプルにおけるパターンの特徴点例えば先述
した輪郭画素群を抽出し、メモリ内の8つのメッシュ領
域の中でその特徴点の位置及び方向コードに対応するメ
ッシュ位置(メッシュ領域内のメッシュの位置)に出現
頻度つまり出現回数を書き込む。例えばサンプルの数が
100個あり、そのうちの1個についてのみメッシュ位置
(2,3)にθ=0の特徴点が現れた場合、θ=0の方向
コードにおけるメッシュ領域のメッシュ位置に出現回数
(出現頻度)1が書き込まれる。出現頻度の計算は、特
徴点の位置を特定するX座標及びY座標と方向コードと
により規定される3次元空間つまりm×n×k(kは方
向コードの数)のメッシュ空間において、あるサンプル
についてメッシュ位置(X1,Y1,θ1)に特徴点が現れ
たとすると、当該メッシュ位置における今までの出現頻
度に1を加えることによって実行される。
した輪郭画素群を抽出し、メモリ内の8つのメッシュ領
域の中でその特徴点の位置及び方向コードに対応するメ
ッシュ位置(メッシュ領域内のメッシュの位置)に出現
頻度つまり出現回数を書き込む。例えばサンプルの数が
100個あり、そのうちの1個についてのみメッシュ位置
(2,3)にθ=0の特徴点が現れた場合、θ=0の方向
コードにおけるメッシュ領域のメッシュ位置に出現回数
(出現頻度)1が書き込まれる。出現頻度の計算は、特
徴点の位置を特定するX座標及びY座標と方向コードと
により規定される3次元空間つまりm×n×k(kは方
向コードの数)のメッシュ空間において、あるサンプル
についてメッシュ位置(X1,Y1,θ1)に特徴点が現れ
たとすると、当該メッシュ位置における今までの出現頻
度に1を加えることによって実行される。
例えばパターンが描かれる領域を5×5のメッシュ群
に分割し、θを第2図(a)のように8つに規定した場
合、5×5×8のメッシュ空間をとる。そしてある特徴
点の位置(メッシュ領域のメッシュに対応する位置)の
X座標,Y座標が(5,3)、その方向コードがθ=6であ
る場合には、メッシュ空間上の位置(5,3,6)に対応す
る頻度に1を加えたものとなる。特徴点の位置のX座
標,Y座標を(X,Y)、方向コードをθとすれば、メッシ
ュ空間上のメッシュ位置(X,Y,θ)における出現頻度P
(X,Y,θ)は次式のようにカウントアップされる。
に分割し、θを第2図(a)のように8つに規定した場
合、5×5×8のメッシュ空間をとる。そしてある特徴
点の位置(メッシュ領域のメッシュに対応する位置)の
X座標,Y座標が(5,3)、その方向コードがθ=6であ
る場合には、メッシュ空間上の位置(5,3,6)に対応す
る頻度に1を加えたものとなる。特徴点の位置のX座
標,Y座標を(X,Y)、方向コードをθとすれば、メッシ
ュ空間上のメッシュ位置(X,Y,θ)における出現頻度P
(X,Y,θ)は次式のようにカウントアップされる。
P(X,Y,θ)=P(X,Y,θ)+1 ただしP(X,Y,θ)の初期値は0である。
こうして前記メッシュ空間の各メッシュ位置毎に特徴
点の出現頻度を求め、出現頻度分布を作成する。第4図
は、作成された出現頻度分布の一例を示す分布図であ
る。
点の出現頻度を求め、出現頻度分布を作成する。第4図
は、作成された出現頻度分布の一例を示す分布図であ
る。
こうして求めた特徴点出現頻度分布は、特徴点がどの
様な位置に出現し、どの様な方向性を持っているかとい
う傾向を示している。つまり、同一の文字、または、図
形に対して、複数のサンプルによる頻度分布を取ると、
似通った位置と似通った方向性を持って特徴点が出現し
やすく、その付近にピークが存在することが多いことを
示している。
様な位置に出現し、どの様な方向性を持っているかとい
う傾向を示している。つまり、同一の文字、または、図
形に対して、複数のサンプルによる頻度分布を取ると、
似通った位置と似通った方向性を持って特徴点が出現し
やすく、その付近にピークが存在することが多いことを
示している。
本発明は、この考え方をファジイ集合におけるメンバ
ーシップ値の設定に応用したものである。
ーシップ値の設定に応用したものである。
ファジイ集合におけるメンバーシップ値は、あいまい
な尺度のものを[0,1]区間の実数領域における主観的
な量として表現したものである。
な尺度のものを[0,1]区間の実数領域における主観的
な量として表現したものである。
メンバーシップ値の定義は、[0,1]区間の実数領域
をヒントに、また、特徴点が頻度分布のピーク値周辺に
現れやすいことをヒントにしている。
をヒントに、また、特徴点が頻度分布のピーク値周辺に
現れやすいことをヒントにしている。
つまり、頻度分布は出現しやすい位置と方向性を、特
徴点の評価に反映した指標となりうるため、0〜1の実
数区間で正規化すればそのままメンバーシップ値として
用いることができることになる。本発明はこのようにし
て正規化した特徴点頻度分布をファジイ辞書として登録
し、パターンの認識に活用しようとするものである。
徴点の評価に反映した指標となりうるため、0〜1の実
数区間で正規化すればそのままメンバーシップ値として
用いることができることになる。本発明はこのようにし
て正規化した特徴点頻度分布をファジイ辞書として登録
し、パターンの認識に活用しようとするものである。
F.実施例 第5図は本発明装置の実施例を実行するための回路の
ブロック図である。この例における特徴点出現頻度分布
の正規化の方法についてはじめに述べておくと、全サン
プルの特徴点数をNとしたとき、次式に示すようにある
一定の割合Cnを乗じたものを基準点までのピーク抽出数
nとして求める。
ブロック図である。この例における特徴点出現頻度分布
の正規化の方法についてはじめに述べておくと、全サン
プルの特徴点数をNとしたとき、次式に示すようにある
一定の割合Cnを乗じたものを基準点までのピーク抽出数
nとして求める。
n=Cn・N 次に、特徴点出現頻度分布において、頻度の大きいも
のから順に捜していき、n番目の頻度の値を取るものを
求め、これを基準点の頻度Pnとする。
のから順に捜していき、n番目の頻度の値を取るものを
求め、これを基準点の頻度Pnとする。
Pnをもとに、特徴点頻度分布を次式により正規化す
る。分布上の頻度をP、正規化後の頻度をMとすれば、 M=1.0 ……P≧Pnのとき P/Pn ……P<Pnのとき 分布上の全ての頻度について行うことで、正規化した結
果が得られる。
る。分布上の頻度をP、正規化後の頻度をMとすれば、 M=1.0 ……P≧Pnのとき P/Pn ……P<Pnのとき 分布上の全ての頻度について行うことで、正規化した結
果が得られる。
第5図中1は文字や図形等のサンプルパターンであ
り、このサンプルパターン1に対して走査回路2により
走査が行われ、次いでその走査結果に対してノイズ処理
や大きさの正規化といった前処理が前処理回路3により
施される。なお走査回路2はコントローラ6の制御の下
に多数のサンプルについて走査を行う。前処理回路3か
ら出力されたデータは特徴点抽出回路4に入力され、特
徴点抽出回路4は、文字や図形の黒白境界に沿って輪郭
画素群を抽出し、これらを直線近似処理等により情報圧
縮化し、こうして得られた特徴点群を、文字,図形を常
に右側(または左側)に見るようにして輪郭ベクトルと
して結合する。第6図は文字「A」について得られた輪
郭ベクトルを示す図であり、ベクトル群より構成される
閉じた線分を1つの輪郭ベクトル系列と呼ぶならば、こ
の例では2つの輪郭ベクトル系列A1,A2を有している。
更に特徴点抽出回路4は、特徴点の位置を正規化すると
共に当該特徴点を始点とする輪郭ベクトルの方向コード
を求め、その結果を特徴点出現頻度分布作成器5に出力
すると共に、特徴点数を特徴点数カウンタ回路7に渡
す。特徴点出現頻度分布作成器5では、特徴点抽出回路
4によって得られる特徴点出現位置及びその方向コード
にもとづき、一時記憶メモリ50に記憶された頻度をカウ
ントアップして第7図に示すような特徴点出現頻度分布
を作成する。コントローラ6は、辞書のサンプル数によ
って走査回路2への入力を繰り返し、特徴点出現頻度分
布の作成処理をコントロールすると共に、作成処理終了
後基準頻度検出回路8に処理を進める。基準頻度検出回
路8では、特徴点数カウンタ回路7から得られる全特徴
点数(出現頻度の合計値)とコントローラ6から与えら
れる設定値により、基準頻度を求めるためのピーク数を
決定し、そのピーク数をもとに一時記憶メモリ50に記憶
されている特徴点出現頻度分布からピーク頻度を順次大
きいものから読み出すとともに、与えられたピーク数に
達した頻度を基準頻度として検出する。基準頻度検出回
路8における処理が終了したのち、特徴点出現頻度分布
正規化回路9は、一時記憶メモリ50に記憶されている特
徴点出現頻度分布を基準頻度検出回路8で検出された基
準頻度を用いて第8図に示すように正規化された頻度分
布をメンバーシップ値として自動的にファジイ辞書51に
記憶する。
り、このサンプルパターン1に対して走査回路2により
走査が行われ、次いでその走査結果に対してノイズ処理
や大きさの正規化といった前処理が前処理回路3により
施される。なお走査回路2はコントローラ6の制御の下
に多数のサンプルについて走査を行う。前処理回路3か
ら出力されたデータは特徴点抽出回路4に入力され、特
徴点抽出回路4は、文字や図形の黒白境界に沿って輪郭
画素群を抽出し、これらを直線近似処理等により情報圧
縮化し、こうして得られた特徴点群を、文字,図形を常
に右側(または左側)に見るようにして輪郭ベクトルと
して結合する。第6図は文字「A」について得られた輪
郭ベクトルを示す図であり、ベクトル群より構成される
閉じた線分を1つの輪郭ベクトル系列と呼ぶならば、こ
の例では2つの輪郭ベクトル系列A1,A2を有している。
更に特徴点抽出回路4は、特徴点の位置を正規化すると
共に当該特徴点を始点とする輪郭ベクトルの方向コード
を求め、その結果を特徴点出現頻度分布作成器5に出力
すると共に、特徴点数を特徴点数カウンタ回路7に渡
す。特徴点出現頻度分布作成器5では、特徴点抽出回路
4によって得られる特徴点出現位置及びその方向コード
にもとづき、一時記憶メモリ50に記憶された頻度をカウ
ントアップして第7図に示すような特徴点出現頻度分布
を作成する。コントローラ6は、辞書のサンプル数によ
って走査回路2への入力を繰り返し、特徴点出現頻度分
布の作成処理をコントロールすると共に、作成処理終了
後基準頻度検出回路8に処理を進める。基準頻度検出回
路8では、特徴点数カウンタ回路7から得られる全特徴
点数(出現頻度の合計値)とコントローラ6から与えら
れる設定値により、基準頻度を求めるためのピーク数を
決定し、そのピーク数をもとに一時記憶メモリ50に記憶
されている特徴点出現頻度分布からピーク頻度を順次大
きいものから読み出すとともに、与えられたピーク数に
達した頻度を基準頻度として検出する。基準頻度検出回
路8における処理が終了したのち、特徴点出現頻度分布
正規化回路9は、一時記憶メモリ50に記憶されている特
徴点出現頻度分布を基準頻度検出回路8で検出された基
準頻度を用いて第8図に示すように正規化された頻度分
布をメンバーシップ値として自動的にファジイ辞書51に
記憶する。
以上において特徴点数カウンタ回路7にて求める全特
徴点数としては、方向コードθ=0〜8毎に特徴点数を
合計した値であってもよいし、あるいは各合計値を合計
した値であってもよく、前者の場合全特徴点数が方向コ
ード毎に独立した値となる。
徴点数としては、方向コードθ=0〜8毎に特徴点数を
合計した値であってもよいし、あるいは各合計値を合計
した値であってもよく、前者の場合全特徴点数が方向コ
ード毎に独立した値となる。
G.発明の効果 本発明によれば、文字や図形等のパターンの特徴点の
出現頻度分布を、多数のサンプルを用意することにより
作成し、この出現頻度分布の各頻度を正規化して、その
値をメンバーシップ値として登録するようにしているた
め、辞書を自動的に作成することができると共に辞書登
録のためのマニュアル作業が大幅に低減し、また入力パ
ターンの位置や傾きにばらつきがあっても認識の誤りが
生じにくい。
出現頻度分布を、多数のサンプルを用意することにより
作成し、この出現頻度分布の各頻度を正規化して、その
値をメンバーシップ値として登録するようにしているた
め、辞書を自動的に作成することができると共に辞書登
録のためのマニュアル作業が大幅に低減し、また入力パ
ターンの位置や傾きにばらつきがあっても認識の誤りが
生じにくい。
しかも特徴点の位置的特徴に加えて方向的特徴の考え
方を導入したものであるため、m×n×kのメッシュ空
間で辞書を構成することからメッシュのとり方によって
は大きな辞書構成となるが、実際には方向的特徴を加え
たことで、m,nのメッシュのとり方は可成り粗くとって
も問題なく、英数字で5×5×8メッシュ,漢字でも15
×15×8メッシュ程度で十分である。この場合漢字1文
字当たり15×15×8×4ビット=900バイトとなり、従
来の技術における2Kバイトと比較して1/2程度以下であ
る。従って辞書の記憶容量の低減化を図ることができ
る。
方を導入したものであるため、m×n×kのメッシュ空
間で辞書を構成することからメッシュのとり方によって
は大きな辞書構成となるが、実際には方向的特徴を加え
たことで、m,nのメッシュのとり方は可成り粗くとって
も問題なく、英数字で5×5×8メッシュ,漢字でも15
×15×8メッシュ程度で十分である。この場合漢字1文
字当たり15×15×8×4ビット=900バイトとなり、従
来の技術における2Kバイトと比較して1/2程度以下であ
る。従って辞書の記憶容量の低減化を図ることができ
る。
また上記のm,nを大幅に粗くとった場合、例えば英数
字で3×3×8メッシュ,漢字で5×5×8メッシュと
した場合、得られたファジイ辞書はブロック化した方向
的特徴の傾向を記述した辞書と見なすことができる。そ
こで、位置的特徴のみを記述した辞書と組み合わせた辞
書を用いることが実用的である。その場合、位置的特徴
を漢字の場合32×32メッシュ、本方法による方向的特徴
を5×5×8メッシュによる空間を構成すると、漢字1
字当たり32×32×4ビット+5×5×8×4ビット=61
2バイトとなり、辞書が小さくて済む。
字で3×3×8メッシュ,漢字で5×5×8メッシュと
した場合、得られたファジイ辞書はブロック化した方向
的特徴の傾向を記述した辞書と見なすことができる。そ
こで、位置的特徴のみを記述した辞書と組み合わせた辞
書を用いることが実用的である。その場合、位置的特徴
を漢字の場合32×32メッシュ、本方法による方向的特徴
を5×5×8メッシュによる空間を構成すると、漢字1
字当たり32×32×4ビット+5×5×8×4ビット=61
2バイトとなり、辞書が小さくて済む。
第1図は本発明装置のフローを示すフローチャート図、
第2図は方向コードを示す説明図、第3図は特徴点のあ
いまい性を示す説明図、第4図は特徴点出現頻度分布
図、第5図は本発明の実施例に係る回路のブロック図、
第6図は輪郭ベクトル系列を示す説明図、第7図,第8
図は夫々正規化前後の特徴点出現頻度分布図である。 1…パターン、2…走査回路、4…特徴点抽出回路、5
…特徴点出現頻度分布作成器、8…基準頻度検出回路、
9…特徴点出現頻度分布正規化回路。
第2図は方向コードを示す説明図、第3図は特徴点のあ
いまい性を示す説明図、第4図は特徴点出現頻度分布
図、第5図は本発明の実施例に係る回路のブロック図、
第6図は輪郭ベクトル系列を示す説明図、第7図,第8
図は夫々正規化前後の特徴点出現頻度分布図である。 1…パターン、2…走査回路、4…特徴点抽出回路、5
…特徴点出現頻度分布作成器、8…基準頻度検出回路、
9…特徴点出現頻度分布正規化回路。
フロントページの続き (56)参考文献 特開 平3−3089(JP,A) 特開 平3−3090(JP,A) 特開 平1−290090(JP,A) 特開 昭63−108480(JP,A) 特開 昭62−192886(JP,A) 特開 昭64−15885(JP,A) 特許2643293(JP,B2) 特許2643294(JP,B2) 特公 平7−104938(JP,B2) (58)調査した分野(Int.Cl.6,DB名) G06K 9/68 G06K 9/62 特許ファイル(PATOLIS) JICSTファイル(JOIS)
Claims (1)
- 【請求項1】文字や図形等のパターンを認識するために
用いられ、前記パターンの照合の対象となる辞書を作成
する装置において、 あるパターンに対して多数のサンプルを作成し、各サン
プルにおけるパターンについて特徴点群P1,P2,…P
N(Nは整数)を抽出するとともに、隣接する特徴点
Pi,Pi+1(i≧1)を結ぶ線分の方向を量子化してその
値を特徴点Piの方向コードとして求める特徴点抽出回路
と、 パターンが描かれる平面領域に横縦m×n(m,nは整
数)個のメッシュ領域を割り当てるとともに、メッシュ
領域の横方向、縦方向の座標をメッシュに対応させて
(X(1≦X≦m),Y(1≦Y≦n))とし、また方向
コードの数及び値をそれぞれk,θとし、 メモリにm×n×kのメッシュ空間に対応する領域を設
定するとともに、当該メッシュ空間におけるメッシュ位
置を(X,Y,θ)とし、前記特徴点抽出回路から出力され
た特徴点をX,Y,θにより特定してその特徴点の出現をメ
ッシュ位置(X,Y,θ)における出現とし、 各メッシュ位置毎に特徴点の出現回数である出現頻度
を、前記特徴点抽出回路の出力から求めて出現頻度分布
を作成するとともに、作成された出現頻度分布を前記メ
モリに記憶させる特徴点出現頻度分布作成器と、 前記メモリに記憶されている出現頻度分布を、前記特徴
点抽出回路から得られた特徴点と設定値とにより求めた
基準頻度から正規化する特徴点出現頻度分布正規化回路
と、 この特徴点出現頻度分布正規化回路により正規化された
出現頻度分布をメンバーシップ値として自動的に登録す
るファジイ辞書とを備えたことを特徴とするパターン認
識用辞書作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1138741A JP2853167B2 (ja) | 1989-05-31 | 1989-05-31 | パターン認識用辞書作成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1138741A JP2853167B2 (ja) | 1989-05-31 | 1989-05-31 | パターン認識用辞書作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH033091A JPH033091A (ja) | 1991-01-09 |
JP2853167B2 true JP2853167B2 (ja) | 1999-02-03 |
Family
ID=15229091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1138741A Expired - Lifetime JP2853167B2 (ja) | 1989-05-31 | 1989-05-31 | パターン認識用辞書作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2853167B2 (ja) |
-
1989
- 1989-05-31 JP JP1138741A patent/JP2853167B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH033091A (ja) | 1991-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Abuhaiba et al. | Recognition of handwritten cursive Arabic characters | |
CN110738207A (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
US5515455A (en) | System for recognizing handwritten words of cursive script | |
US4817187A (en) | Apparatus and method for vectorization of incoming scanned image data | |
EP0483343A1 (en) | A polygon-based method for automatic extraction of selected text in a digitized document | |
Chang et al. | Feature analysis using line sweep thinning algorithm | |
Pervouchine et al. | Handwritten character skeletonisation for forensic document analysis | |
JP2853167B2 (ja) | パターン認識用辞書作成装置 | |
EP3702958A1 (en) | Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image | |
JP2853168B2 (ja) | パターン認識装置 | |
Ablameyko et al. | Vectorization and representation of large-size 2-D line-drawing images | |
JP2853169B2 (ja) | パターン認識装置 | |
Frischknecht et al. | A raster-based approach for the automatic interpretation of topographic maps | |
Hu et al. | A multiple point boundary smoothing algorithm | |
JP2643293B2 (ja) | 辞書作成方法 | |
JP2643294B2 (ja) | 辞書作成方法 | |
Zeki et al. | New primitives to reduce the effect of noise for handwritten features extraction | |
Dhanikonda et al. | Research Article An Efficient Deep Learning Model with Interrelated Tagging Prototype with Segmentation for Telugu Optical Character Recognition | |
JP3446794B2 (ja) | 文字認識における多角形近似法および文字認識装置 | |
Zheng et al. | An Overlapping NAM Segmentation Approach for Grayscale Images and Its Applications to Moment Calculation | |
JP3104355B2 (ja) | 特徴抽出装置 | |
Balachandran et al. | LR-to-HR Face Hallucination with an Adversarial Progressive Attribute-Induced Network | |
KR200331200Y1 (ko) | 프렉탈 차원을 이용한 문자인식장치 | |
Yamada et al. | Recognition of human kidney ultrasonic organ images by two‐dimensional dp matching method |