JP2719202B2 - 線図形特徴抽出及び認識方法 - Google Patents

線図形特徴抽出及び認識方法

Info

Publication number
JP2719202B2
JP2719202B2 JP1245507A JP24550789A JP2719202B2 JP 2719202 B2 JP2719202 B2 JP 2719202B2 JP 1245507 A JP1245507 A JP 1245507A JP 24550789 A JP24550789 A JP 24550789A JP 2719202 B2 JP2719202 B2 JP 2719202B2
Authority
JP
Japan
Prior art keywords
line
curve
singular point
elements
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1245507A
Other languages
English (en)
Other versions
JPH03108079A (ja
Inventor
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1245507A priority Critical patent/JP2719202B2/ja
Priority to US07/584,800 priority patent/US5204915A/en
Publication of JPH03108079A publication Critical patent/JPH03108079A/ja
Application granted granted Critical
Publication of JP2719202B2 publication Critical patent/JP2719202B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は線図形の特徴抽出及び認識方法に係り、特に
手書き文字や手書き図面などの手書きに線図形のオフラ
イン認識処理に好適な線図形特徴抽出及び認識方法に関
する。
〔従来の技術及びその課題〕
オフラインの手書き文字や図面認識技術の研究は古く
から行われているが、その技術開発を困難にしている第
一の要因は、変形のパターンの多様さにある。
従来から、手書き線図形の特徴抽出や認識処理には輪
郭解析や背景解析を中心に様々な手法が提案されてきた
が、いずれの手法も座標系の設定に強く依存する特徴パ
ラメータベクトルを用いて決定を下すために、解析の前
に正規化によって、標準座標系への変換をすることが必
要不可欠であった。そのため、正規化がうまく作用しな
いときには、特にパラメータベクトルが大きくひずむた
め、誤読や拒絶をもたらす問題があった。
このような問題に対処する方法の一つに、座標軸の方
向の設定にのみ依存し、計量の取り方に依存しない準位
相的方法がある(森 俊二:手書き文字の非計量モデ
ル、電子通信学会文誌,Vol.J62−D,No.10,pp.641−64
6、1979年10月)。この方法は、曲線のプリミティブ系
列を考え、線(ストローク)によって構成される背景の
領域を面的に解析するものである。しかし、プリミティ
ブ系列の計算方法が複雑で、拡張が困難であることや、
系列要素同士の接続規則が明確でないこと、さらに重要
なこととして、背景の特徴は人間の直感をうまく反映し
たものではないために、変形の大きい手書き文字を認識
できないという問題点があった。
本発明の目的は、上記問題を解決し、より人間の直感
に近い手書き線図形の解析を可能にして、認識処理の容
易性、認識率の向上を図ることにある。
〔課題を解決するための手段〕
上記目的を達成するために、請求項(1)は、入力さ
れた線図形から骨格線を抽出し、該骨格線上の、接続す
る線素(枝)の数が3以上の点を特異点とし、該特異点
の構造により特異点を分解して複数のストローク成分を
得、特異点の構造とストローク成分の接続関係により線
図形を特徴付けることを特徴とする。
請求項(2)は、特異点を分解して得られたストロー
ク成分を、単純な曲線構成要素(以下、プリミティブと
いう)の連鎖よりなるプリミティブ系列とし、その系列
要素の組合せと、系列要素間の接続関係及び特異点での
系列要素の接続関係などの、系列要素間の2項関係を求
めて線図形を特徴付けることを特徴とする。
請求項(3)は各線図形のカテゴリーのモデルを、請
求項(2)に記載の曲線のプリミティブ系列要素と要素
間の2項関係で記述し、入力線図形から求めた系列要素
とその2項関係との関係構造マッチングによって当該入
力線図形を認識することを特徴とする。
〔作用〕
請求項(1)では、より人間の直感に近い手書き線図
形の解析のために、特異点の構造の解析により、曲線の
疑似的なストロークの流れ(書き順)を抽出する。これ
により、オフライン認識の手法を、オンラインのものに
近付けることによって、認識を容易にし、かつ、認識率
を向上させることができる。
従来のプリミティブ系列の構成方法は、準凸関数を基
礎としているため、複雑で、高位のものへの拡張が容易
ではなかった。また、系列要素同士の接続法則が明確で
ないため、曲線構造の表現が曖昧であるという欠点があ
った。請求項(2)では、より簡潔で、高位のものへの
拡張が容易な、曲線のプリミティブ系列の構成法を与
え、さらに、系列要素同士の明確な接続法則を与える。
また、特異点でのプリミティブ系列要素の構造を解析す
る方法を与えることによって、点と線による双対的な準
位相的曲線構造解析により線図形を特徴付けることがで
きる。
請求項(3)では、特異点の分解と準位相的曲線構造
解析により、ストロークの流れを考慮し、しかも、座標
系にのみ依存し特徴パラメータベクトルに依存しない、
柔軟な構造的線図形認識法を提供できる。これは、正規
化処理を必要とせず、位置ずれにも影響されないで、変
形の大きな文字をも認識できることを意味する。
なお、準位相的曲線構造だけでは認別できないパター
ンに対して、適応的に曲線形状を記述するパラメータを
抽出して、統計解析を行い、断層的に計量的パラメータ
を認識処理に取り入れることにより、認識率を向上させ
ることができる。
〔実施例〕
以下、本発明の一実施例について図面により説明す
る。
第1図は本発明の一実施例のブロック図である。画像
入力部11はスキャナなどからなり、手書きの文字や図面
等の線図形を読み取る。骨格線抽出部12は画像入力部11
からのディジタル画像情報を入力して骨格線を抽出す
る。線図形構造解析部13は骨格線抽出部12からの骨格線
情報を入力して曲線構造の解析等を行い、線図形の特徴
を抽出する。線図形モデル部15には線図形の標準モデル
(特徴)があらかじめ登録されている。マッチング部14
は、線図形構造解析部13で得られた入力線図形の特徴と
線図形モデル部15の座標モデルとのマッチングをとり、
入力された線図形を認識する。以下では、線図形構造解
析部13、及び、それに関連のあるマッチング部14と線図
形モデル部15について記述する。
線図形構造解析部13: 第2図は線図形構造解析部13の処理手順を示したもの
である。線図形構造解析部13の処理は特異点の解消と曲
線構造の解析に大別される。
特異点の解消 特異点の解消処理では、曲線の特異点の構造を解析
し、特異点を解消して複数のストローク成分を得る。
(i)特異点の分解 骨格線抽出部12からの出力は、区分的線分(折れ線)
表現された曲線であるとする。これは、無向グラフG=
(V,E)で記述される。ただし、Vは点の集合で、Eは
枝の集合である。すなわち、EはV2の部分集合で、(x,
w)がEの要素であり、かつ、その時に限り、2点vと
wの間に、辺が存在するものとし、Eの2要素(v,w)
と(w,v)は、同一視される。また、グラフGに(V,E)
は、単純なグラフ(自己閉路と、並列枝を含まない)と
する。さらに、Vの各々の要素vに対して、座標関数co
ord:V→R2が定義される。coord(v)はvの座標を表
す。
上記無向グラフG=(V,E)において、その点におけ
る線度(接続する枝の数)が3以上のVの要素をGの特
異点と呼ぶ。例えば、骨格線抽出部12のからの骨格化線
図形を第3図とした場合、p,q,rがそれぞれ特異点であ
る。ここで、(a)と(b)図における特異点p,qの線
度は4であり、(c)図における特異点rの線度は3で
ある。
それぞれの特異点vに対し、新たに、coord(vi)=c
oord(v),i=1,2,…,n(nはvの線度)を満たす、n
個の点v1,v2,…,vnを導入する。次に、vに接続する
n個の点w1,w2,…,wnに対して、新たに、枝(vi
wi)(i=1,2,…,n)を付加し、点vを除去する。点vi
(i=1,2,…,n)は、vと同じ座標を持つが、それぞれ
異なる点と見なされる。この操作によって、入力グラフ
Gは、初等的な道(同じ点と枝を一度しか通らない様な
パス)から成る連結成分に分解される。第4図は、これ
を示したもので、(a)図は線度5の特異点vの例であ
り、該特異点xは、(b)図のようにv1,v2,v3,v4
v5に分解される。なお、(c)図は後述の特異点の解消
結果を示したものである。
(ii)特異点の解消 分解された特異点vについて、coord(v)=(x0,y
0)、また、vに接続するn個の点wi(i=1,2,…,n)
に対して、coord(wi)=(xi,yi)とする。I={1,
2,…,n}として、Iの2つの要素i,j(i<j)に対し
て、ベクトル(xi−x0,yi,y0)と(xj,x0,yj-0)の
余弦を計算し、cosθijが最小になるi,jの組をi0,j
0(i0<j0)とする。このi0とj0に対して、2点vi0とv
j0を同一視する。即ち、枝(vj0とwj0)を(vi0,wj0
でおきかえて、vj0を除去する。つぎに、IをI−
{i0,j0}でおきかえて、同様の操作を行い、IをI−
{i0,j0}で再帰的に置き換えながら、Iの大きさが1
以下になるまで、繰り返す。この操作の終了時には、v
は「n/2 (「rはr以上の整数で、最小のもの)
個の点に分解され、また、入力グラフGは、初等的な
道、または、初等的に閉路(同じ点と枝を一度しか通ら
ない様な閉路)から成る連結成分に分解される。入力グ
ラフGにこのような操作を施すことによって得られるグ
ラフを、Gのストロークグラフとよび、その各々の連結
成分をストローク成分と呼ぶ。線度nの特異点は、「n/
2個のストローク成分から構成される。第4図(c)
は、(b)図のv1とv3あるいはv2とv4を結合して特異点
を解消することを示している。
第3図の各図形(入力グラフ)について上記の手続き
を施こし、特異点を解消することにより、第5図のよう
なストロークグラフが得られる。即ち、第5図(a)は
第3図(a)の特異点pがa1とa2に、第5図(b)は第
3図(b)の特異点qがb1とb4に、第5図(c)は第3
図(c)の特異点rがc1とc3に、それぞれ分解されるこ
とを示している。
曲線構造の解析 曲線構造の解析処理では、ストロークグラフを構成す
る各ストローク成分を、単調な曲線構成要素(プリミテ
ィブ)の連鎖(プリミティブ系列)によって表現し、系
列要素の組合せと系列要素間の接続関係、及び、特異点
での系列要素の接続関係などの、系列要素間の2項関係
により、線図形の特徴を曲線構造として後述する。
(i)曲線のプリミティブ xy単調曲線とは、その曲線に沿って進むときに、x,y
座標値が共に、常に非増加であるか、または、非減少で
ある曲線である。あるxy単調曲線の2つの端点の座標を
それぞれP(x0,y0)とQ(x1,y1)(ただし、x0<x1
または(x0=x1かつy0<y1))とするとき、Pを曲線の
head(先頭)、Qは曲線のtail(末尾)とよびy0=y1
あるものをy一定曲線、(x0−x1)×(y0−y1)>0で
あるものをxy共変曲線、x0=x1であるものをx一定曲
線、また、(x0−x1)×(y0−y1)<0であるものをxy
反変曲線とよぶ。第6図にxy単調曲線の一例を示す。
(a)はy一定曲線で、これは水平線分(以下、“−”
で示す)にほかならない。(b)はxy共変曲線の例で、
右上がり左下がり曲線(以下、“/"で示す)である。
(c)はx一定曲線で、これは垂直成分(以下、“|"で
示す)にほかならない。(d)はxy反変曲線の例で、左
上がり右下がり(以下、 で示す)である。
(ii)プリミティブの結合 これら4個のプリミティブの結合により、さらに、高
位のプリミティブを定義する。そのために、プリミティ
ブの局所結合則を導入する。今、xy単調曲線でない曲線
上に、曲線を被覆する2個のxy単調曲線を見だすことが
でき、かつ、互いに1つが他を含まないとする。これら
2つのxu単調曲線をそれぞれa,bとする。ただし、、P
をaとbの両方に含まれる点、QとRはPのある近傍の
中の任意の点で、Qをaのみに含まれる点、Rをbのみ
に含まれる点として、coord(P)=(xp,yp),coord
(Q)=(xq,yq),coord(R)=(xr,yr)としたと
き、ベクトル(xq−xp,yq−yp)と(xr−xp,yr−yp
の外積が正、すなわち (xq−xp)×(yr−yp)−(xr−xp)×(yq−yp)>0
であるものとする。この仮定の下で、aとbの結合 を以下のように定義する。ただし、A,Bを のいずれか、またα,βを、headとtailのいずれかとす
るとき、記号[A,α,B,β]は、aの性質がAで、bの
性質がBであり、aのαとbのβで、aとbが結合して
いることを表す。
第7図は2つのプリミティブの結合を説明する図であ
る。即ち、2つのプリミティブa,bは、ベクトルの組 が右手系をなす向きに結合 する。ここで、Pはaと.bの交差上にとられた点、Pa,P
bはそれぞれa,bの上の点で、Paは先のQに、PbはRに対
応する。
第8図乃至第11図に前記規則1〜4が適用される例を
示す。第8図は が適用される場合、第9図は が適用される場合、第10図は が適用される場合、第11図は が適用される場合をそれぞれ示している。
(iii)曲線のプリミティブ系列 以上のように結合則を定義すると、任意の曲線上で、
その曲線を被覆し、かつ、互いに1つが他を含まないよ
うなxy単調曲線を抽出し、上記の結合則によって、プリ
ミティブの系列を形成することができる。即ち、結合 を有向ネットワークとみなすと、推移律を適用すること
によって、次のような系列を生成することができる。
ただし、 となる、b,cは存在しないとする。
2個以上のxy単調曲線が抽出され、かつ、上の性質を
満たす系列(1)がないときには、この曲線にラベル<
0,0>を与える。例えば、円はラベル<0,0>をもつとす
る。
2個以上のxy単調曲線が抽出され、かつ、ラベル<0,
0>をもたない任意の曲線は、(1)式の形にした、い
くつかの要素に分解される。その各々をps要素と呼び、
(1)式で表わされるps要素において、aiをそれぞれbr
anchと呼び、特に、a0をhead branch,anをtail branch
とよぶ。また、ps要素の端点で、head branchにあるも
のをh−端点、tail branchにあるものをt−端点とよ
び、端点以外の点を内点と呼ぶ。このn+1個のxy単調
曲線からなる系列に対して、次のような規則でプリミテ
ィブ系列のラベル(psラベルと略す)<ps,id>を与え
る。
ps=(n+1)+L+M (2) id=j1 (3) ただし、 L=(aiとai+1(i=0,1,…,n−1)の性質が同じ M=(性質が“|"または“−”であるai,i=1,2,…,n−
1の数) また、その曲線からxy単調曲線が1個だけ抽出される
とき、“−”にラベル<1,1>、“/"にラベル<1,2>、
“|"にラベル<1,3>、そして、 にラベル<1,4>を与える。この場合、h−端点、t−
端点は、それぞれ、xy単調曲線のhead,tailと定義さ
れ、head branch,tail branchは定義されない。
具体例として、第3図の例についてpsラベルの付与手
順を以下に説明する。
第3図の(a),(b),(c)について、ストロー
ク成分のプリミティブ(xy単調曲線)への分解を示す
と、第12図のようになる。ここで、A0,A2,A4,B0
B2,C0,C2,C4は“/"のタイプ、他は のタイプである。第12図より、プリミティブの結合は、 となる。これより、次の(1)〜(6)のプリミティブ
系列要素(ps要素)が得られる。
従って、psラベルは、各々(1)が<6,3>、(2)
が<2,2>、(3)が<1,2>、(4)が<2,2>、
(5)が<3,4>、(6)が<1,2>となる。
別に具体例として、psラベルが<5,1>を持つ曲線の例
を第13図に示す。(a)はL=M=0、(b)と(c)
はそれぞれL=1とL=2、(d)はM=1の場合であ
る。(b)では、(a)におけるプリミティブ2が、そ
して、(c)では、(a)におけるプリミティブ2と4
がない。一方、(d)では、(a)におけるプリミティ
ブ2と4が、垂直のプリミティブに併合されている。さ
らに特殊な場合として、psラベルが<0,0>を持つ曲線
の例を第14図に示す。即ち、第14図のように、プリミテ
ィブ系列が のような巡回列になるときは、その曲線は、psラベル<
0,0>をもつとする。
(iv)ps要素の接続(特徴パラメータC) 特異点の解消で形成されたストローク成分は、初等的
な道又は初等的な閉路であるから、ps要素のつながり
(リスト)で形状を表現することができる。ラベル<ps
0,id0>,<ps1,id1>をそれぞれもつ、2つのps要素
e0,e1間の接続には、次の2つの場合がある。
(h−接続);id0−id1≡2(mod4)で、e0のhaad bra
nchとe1head branchが等しい。これを、 と書く。ここで、hはhead(先頭)を意味する。(t−
接続);ps0+id0≡ps1+id1+2(mod4)で、e0のtail
branchとe1とtail branchが等しい。これを、 と書く。ここで、tはtail(末尾)を意味する。これを
特徴パラメータCとする。
分かり易くいうと、2つのストローク成分a,bのプリ
ミティブ系列を とし、aとbが接続していて、a0とb0が同じプリミティ
ブである場合、h−接続で と書き、amとbnが同じである場合、i−接続で と書く。例えば、第12図(b)の場合、先の2つのps要
素(4)と(5)、 は、系列の先頭のプリミティブC1を共有(接続)するの
で、 である。
(v)特異点の構造とストローク成分の接続 (特徴パラメータS) i番目のストローク成分から上記の方法によって得ら
れたj番目のps要素をeijとする。入力グラフGの特異
点の構造を、それを構成するps要素の接続関係で表現す
る。2つのps要素の特異点での接続には、交差すなわち
X型(特異点がそれぞれのps要素の内点となっている場
合)と、T型(特異点が1つのps要素の端点と、もう1
つのps要素の内点である場合)とがある。特異点vの構
造は、vを含むeij間の二項関係で、次のように記述さ
れる。
ただし、n∈{X,T}はvにおける、eijとeij′の
接続状態を示し、“X"は交差、“T"はT型を表す。α,
β∈{h,t,“−”}で、“h"はhead branch,“t"はtail
branch、そして、“−”はhead branchとtail branch
以外のbranchを示す。これは、特異点vが、eijのαに
よって示されるbranchに含まれる点(または、α一端
点)と、eij′のβによって示されるbranchに含られ
る点(または、β一端点)とによって構成されることを
表す。さらに、これは、異なったストローク成分間の接
続構造を表現している。これを特徴パラメータSとす
る。一般に、線度がmの特異点v上には、「m/2個の
ストローク成分が存在するので、vの構造は、「m/2
×(「m/2−1)/2個以上の(6)の形式の2項関係
で記述される。
第3図の例について特徴パラメータSを記述すると、
以下のようになる。
第3図(a)のグラフには、ラベル<6,3>を持つps
要素e(第12図で説明したps要素(1))があり、 で表現される。第3図(b)のグラフには、ラベル<2,
2>を持つps要素e1(同ps要素(2))と、ラベル<1,2
>を持つps要素e2(同ps要素(3))があり、 で表現される。第3図(c)のグラフには、ラベル<2,
2>を持つps要素e1(同ps要素(4))と、ラベル<1,2
>を持つps要素e2(同ps要素(6))とによって、 で表現される。
(vi)ps要素の重心間の位置関係 (特徴パラメータR) 以上に述べたps要素の接続法則と特異点の構造表現
は、互いに接続しているps要素の二項関係を記述するも
のである。さらに、接続していない2つのps要素、たと
えば、入力グラフGにおいて、異なった連結成分に属す
るもの同士の関係を重心間の位置関係で表す。これを特
徴パラメータRとして、次のようなeij間の二項関係で
記述する。
eij(rx,ry)eij′ (7) ただし、rx,ryは“<,"“>”、または“=”で、そ
れぞれeij,eij′の重心のx,y方向の座標の大小を表
す。
線図形モデル部15: ある文字カテゴリーI対するモデルM(I)は、次の
ように定義される。
M(I)=(P,C,S,R,mp,ms) ただし、Pは核の集合で、p∈Pは、 {<0,0>}∪{<ps,id>|id ∈1,2,3,4},psは自然
数}の部分集合で、核pに許容される、プリミティブ系
列のラベルの集合である。
Cは、2つの核の間に成り立たなければならないps要
素接続の集合で、 ここで、式(9)において、 は、式(4)と(5)と同じ意味を持つ。
SはIの特異点の構造の集合で、 ここで、式(10)において、 は、式(6)と同じ意味を持ち、また、 n=XT は、X型、又は、T型の両方が許されることを示し、 α=φ は、その特異点が、piの任意のbranchに含まれ、かつ、
piの内点であることを示す。
β=φ も、pjに対して、同様の意味を持つ。また、カテゴリー
Iに存在する特異点をvi(i=1,2,…,l)とし、viの線
度をmiとする。さらに、 ただし、 ki=「mi/2(mi/2−1)/2 ▲vj i▼は、2つのストローク成分sj0,sj1の交点に対
応し、▲vj i▼≠▲vk i▼ならば、{sj0,sj1}≠{s
k0,sk1}とする。ここで、Sの要素と、SVの要素は1
対1に対応している。
Rは2つの核の重心の位置関係の集合で、 R⊆{pi(rx,ry)pj|pi,Pj∈P,rx,ry∈{<,>
φ}} (12) ここで、式(12)において、 pi(rx,ry)pj(pi,pj∈P,rx,ry∈{<,>}) は、式(7)と同じ意味を持ち、また、 rx=φ はx座標の大小関係が任意であることを示す。
ry=φ も、y座標に対して、同様の意味を持つ。
そして、mp,msは、それぞれP,Sで定義された写像 mp→{0,1} (13) ms→{0,1} (14) であり、認識対象となる図形(入力グラフG=(V,E)
を、線図形構造解析部13を解析した結果、それに対応す
るものが必ず存在しなければならないものか(必須要
素)、又は、どちらでもよいのか(選択的要素)を示
す。必須要素であるp∈Pに対しては、mp(P)=1、
そして、選択的要素であるp∈Pに対しては、mp(P)
=0である。
msも同様である。
第3図の例に対応するカテゴリー「2」,「4」,
「5」のモデルの構造例を示すと、以下の通りである。
なお、φは任意のものが許されることを示している。ま
た、psラベル<ps,is>を10×Ps+id−1となる整数で
表わしている。
マッチング部14: 入力グラフGを線図形構造解析部13で解析した結果得
られるps要素の集合をPo={o1,o2,…,om}とし、oi
j=1,2,…,m)のpsラベルを、lab(oi)で表す。ま
た、入力グラフGに存在する特異点をvi(i=1,2,…,
l)とし、viの線度をmiとする。さらに、 ただし、 ki=「mi/2(「mi/2−1)/2 とし、▲vj i▼は、式(11)と同様の意味を持つとす
る。
モデルM(I)とのマッチングは、以下の条件を満た
す写像 f:P→Po∪{φ} (16) と全射 g:S→So∪{φ} (17) を求める問題に定式化される。
(条件1)任意のo∈Poに対して、 lab(f(p))∈p が成立する。
(条件2)mp(P)=1であるような任意のp∈Pに対
して、 f(p)≠φ. が成立する。
(条件4)pi(rx,ry)pj≠Rに対して、f(pi)≠
φ,f(pj)≠φのとき f(pi)(rx,ry)f(pj) が成立する。
(条件6)ms(s)=1であるような任意のs∈Sに対
して、g(s)≠φ、かつg(s0),g(s1)∈S0である
ような任意のs0,s1)∈Sに対して、g(s0)=g
(S1)ならば、S0=s1が成り立つ。
写像f,gを求めるには、バックトラック法などによっ
て、(条件1)から(条件4)を満足するfを計算し、
そのfのもとで、(条件5)と(条件6)を満足するg
を同様に計算すればよい。例として、カテゴリー「5」
と、第3図(c)の線図形の整合を行ってみる。第3図
(c)のグラフを変換したストローグラフ(第5図
(c))に、曲線構造解析を適用すると、3つのps要素
e1,e2,e3 (lab(e1)=<2,2>,lab(e2)=<3,4>,(lab(e
3)=<1,2>が得られる。これは、第12図で説明したps
要素(4),(5),(6)に該当する。今、 f(e1)=1 f(e2)=2 f(e3)=0 として、(条件1)から(条件6)をチェックする。
(条件1),(条件2)は明らかに満たされる。(条件
3)はCの要素 に対して、先に説明したように、 が成り立ち、(条件4)は、Rの要素0(>φ)1に対
して、e3(>>)e1が成り立つので、満足される。ま
た、(条件5),(条件6)は、Sの要素 に対して、同じく先に説明したように が成り立つので、はやり満足される。したがって、関数
f,gが見つかったことになる。
さらに、第15図に示したpsラベル<5,3>をもつ曲線
のように、変形の仕方によって、文字「0」にも「6」
にも整合する可能性のあるものに対しては、曲線の形を
記述するパラメータベクトルに対して、統計解析を適用
することによって、詳細な識別を行うことができる。具
体的には、線図形をちようど囲むような長方形を定め
て、曲線の形状を記載するパラメータを、プリミティブ
系列については、その2つの端点の位置、そのプリミテ
ィブ系列をちようど囲むような長方形の中心の位置と、
その幅と高さを求め、また、各特異点については、その
位置を求めることで、計算する。入力線図形から抽出さ
れる、プリミティブ系列と特異点について、このように
して求めた、すべてのパラメータを並べることによっ
て、曲線の形を記述するパラメータベクトルを構成でき
る。学習データから、このようなパラメータベクトルの
各要素について、統計的分布の平均値や標準偏差などを
計算しておく。例えば、第15図に示したような曲線につ
いては、「0」について学習データから求められた統計
量と、「6」について学習データから求められた統計量
は異なるはずである。第15図に示したpsラヘル<5,3>
をもつ曲線を入力線図形とすると、 として、プリミティブ系列に対するパラメータベクトル
(d0/d,d1/d,・・・,d5/d)が求められる。このパラメ
ータベクトルを、「0」と「6」について統計量をもと
にして、統計的な識別、例えば、線形判別分析を行うこ
とによって、入力図形を「0」または「6」に識別でき
る。
〔発明の効果〕
(1)請求項(1)では、曲線の特異点において、その
特異点に接続する線素の局所的な変化方向の解析によ
り、滑らかにつながる線素の対を構成するように特異点
を分解・解消して、複数ストローク成分を得る。これ
は、特異点での方向変化の滑らかさを考慮して、曲線を
一筆がきできる成分に分解していることであるので、人
間の直感にあった表現を得ることができる。
(2)請求項(2)では、プリミティブ系列とその上で
の2項関係を簡潔に、しかも、代数的に定義したので、
拡張が容易であり、線図形についてコンパクトな曲線構
造記述を得ることができる。
(3)請求項(2)では、疑似的なストロークに対し
て、座標軸の方向にのみ依存し、原点の設定にも影響さ
れない解析結果により認識を行うので、背景的手法では
認識できないような、変形の度合いの大きい文字も、よ
り小さな辞書を用いて認識できる。
(4)上記請求項(3)においては、辞書は、各々のカ
テゴリーに対して、要素(核)に許されるラベルの組
と、要素の2項関係によって記述されているので、辞書
を解析することによって、一つの入力に同時に整合する
可能性のあるカテゴリーを事前に知ることができる。な
お、これらの構造的記述方法だけでは識別できないもの
に対してだけ、例えば階層的に統計的認識を適用すれば
よく、効率的であり、しかも、確実である。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は第1
図の線図形構造解析部の処理フロー図、第3図は骨格化
された線図形の具体例を示す図、第4図は特異点の分解
及び解消を説明する図、第5図は第3図の場合の特異点
の解消例を示す図、第6図はプリミティブの種類を説明
する図、第7図はプリミティブの結合を説明する図、第
8図乃至第11図はプリミティブの結合規則を説明する
図、第12図は第3図の場合のストローク成分のプリミテ
ィブへの分解例を示す図、第13図及び第14図はプリミテ
ィブ系列の別の例を示す図、第15図は階層的線図形認識
処理が適用される具体例を示す図である。 11…画像入力部、12…骨格線抽出部、13…線図形構造解
析部、14…マッチング部、15…線図形モデル部。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された線図形から骨格線を抽出し、該
    骨格線上の、接続する線素(枝)の数が3以上の点を特
    異点とし、該特異点の構造により特異点を分解して複数
    のストローク成分を得、特異点の構造とストローク成分
    の接続関係により線図形を特徴付けることを特徴とする
    線図形特徴抽出方法。
  2. 【請求項2】請求項(1)記載の線図形特徴抽出方法に
    おいて、特異点を分解して得られたストローク成分を、
    単純な曲線構成要素(以下、プリミティブという)の連
    鎖よりなるプリミティブ系列とし、その系列要素の組合
    せと、系列要素間の接続関係及び特異点での系列要素の
    接続関係などの、系列要素間の2項関係を求めて線図形
    を特徴付けることを特徴とする線図形特徴抽出方法。
  3. 【請求項3】各線図形のカテゴリーのモデルを、請求項
    (2)に記載の曲線のプリミティブ系列要素と要素間の
    2項関係で記述し、入力線図形から求めた系列要素とそ
    の2項関係との関係構造マッチングによって当該入力線
    図形を認識することを特徴とする線図形認識方法。
JP1245507A 1989-09-21 1989-09-21 線図形特徴抽出及び認識方法 Expired - Lifetime JP2719202B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1245507A JP2719202B2 (ja) 1989-09-21 1989-09-21 線図形特徴抽出及び認識方法
US07/584,800 US5204915A (en) 1989-09-21 1990-09-19 Method of extracting feature from line pattern and line pattern recognition method using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1245507A JP2719202B2 (ja) 1989-09-21 1989-09-21 線図形特徴抽出及び認識方法

Publications (2)

Publication Number Publication Date
JPH03108079A JPH03108079A (ja) 1991-05-08
JP2719202B2 true JP2719202B2 (ja) 1998-02-25

Family

ID=17134705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1245507A Expired - Lifetime JP2719202B2 (ja) 1989-09-21 1989-09-21 線図形特徴抽出及び認識方法

Country Status (2)

Country Link
US (1) US5204915A (ja)
JP (1) JP2719202B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535806A (ja) * 1991-07-29 1993-02-12 Toshiba Corp 線分解釈方式
EP0578432A3 (en) * 1992-07-06 1994-06-22 Canon Kk Similarity determination among patterns using affine-invariant features
JP3260843B2 (ja) * 1992-08-25 2002-02-25 株式会社リコー 文字認識方法
EP0898240B1 (en) * 1993-01-11 2003-03-05 Canon Kabushiki Kaisha Image processing method and apparatus
JPH07200735A (ja) * 1993-12-28 1995-08-04 Nec Corp 図形認識装置
US5859929A (en) * 1995-12-01 1999-01-12 United Parcel Service Of America, Inc. System for character preserving guidelines removal in optically scanned text
US6876765B2 (en) 2000-03-30 2005-04-05 Ricoh Company, Ltd. Character recognition method and computer-readable storage medium
JP4169522B2 (ja) * 2002-03-22 2008-10-22 株式会社リコー 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
JP4259949B2 (ja) 2003-08-08 2009-04-30 株式会社リコー 画像作成装置、画像作成プログラムおよび記録媒体
US20090208055A1 (en) * 2008-02-20 2009-08-20 Lockheed Martin Corporation Efficient detection of broken line segments in a scanned image
US8238658B2 (en) * 2009-01-21 2012-08-07 The United States Of America, As Represented By The Secretary Of The Navy Boundary extraction method
US8872828B2 (en) 2010-09-16 2014-10-28 Palo Alto Research Center Incorporated Method for generating a graph lattice from a corpus of one or more data graphs
US8724911B2 (en) * 2010-09-16 2014-05-13 Palo Alto Research Center Incorporated Graph lattice method for image clustering, classification, and repeated structure finding
US9317125B2 (en) 2013-04-24 2016-04-19 Microsoft Technology Licensing, Llc Searching of line pattern representations using gestures
US9275480B2 (en) 2013-04-24 2016-03-01 Microsoft Technology Licensing, Llc Encoding of line pattern representation
US9721362B2 (en) * 2013-04-24 2017-08-01 Microsoft Technology Licensing, Llc Auto-completion of partial line pattern

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS51118333A (en) * 1975-04-11 1976-10-18 Hitachi Ltd Pattern recognition system
US4777651A (en) * 1984-06-25 1988-10-11 Tektronix, Inc. Method of pixel to vector conversion in an automatic picture coding system
JPS6165290A (ja) * 1984-09-07 1986-04-03 株式会社日立製作所 ベクトル文字フオントの作成装置
US4685124A (en) * 1985-04-30 1987-08-04 Data General Corporation Microprocessor based control and switching device
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
JPH07107708B2 (ja) * 1986-09-26 1995-11-15 株式会社日立製作所 パタ−ン認識方法
US4891750A (en) * 1986-10-29 1990-01-02 Pitney Bowes Inc. Optical character recognition by forming and detecting matrices of geo features
US4905295A (en) * 1986-11-13 1990-02-27 Ricoh Company, Ltd. Code sequence matching method and apparatus
US4987603A (en) * 1988-09-22 1991-01-22 Glory Kogyo Kabushiki Kaisha Recognition method for letter patterns

Also Published As

Publication number Publication date
US5204915A (en) 1993-04-20
JPH03108079A (ja) 1991-05-08

Similar Documents

Publication Publication Date Title
JP2719202B2 (ja) 線図形特徴抽出及び認識方法
Suen et al. Computer recognition of unconstrained handwritten numerals
Cordella et al. Symbol recognition in documents: a collection of techniques?
Suen et al. Building a new generation of handwriting recognition systems
Hu et al. Writer independent on-line handwriting recognition using an HMM approach
Rocha et al. A shape analysis model with applications to a character recognition system
Wang et al. Optical recognition of handwritten Chinese characters by hierarchical radical matching method
Mantas Methodologies in pattern recognition and image analysis—a brief survey
Fu Recent developments in pattern recognition
Pavlidis Analysis of set patterns
Fahn et al. A topology-based component extractor for understanding electronic circuit diagrams
Bunke Structural and syntactic pattern recognition
Chen et al. Handwritten character recognition using a 2-layer random graph model by relaxation matching
Matan et al. Reading handwritten digits: A zip code recognition system
Den Hartog et al. Knowledge-based interpretation of utility maps
Cheng et al. Research on chinese OCR in Taiwan
Zhou et al. Learning-based scientific chart recognition
Kang et al. Utilization of hierarchical, stochastic relationship modeling for Hangul character recognition
Lin et al. On-line recognition by deviation-expansion model and dynamic programming matching
Simistira et al. A system for recognition of on-line handwritten mathematical expressions
Samanta et al. Script independent online handwriting recognition
Ramel et al. A structural representation adapted to handwritten symbol recognition
Wang et al. Recursive hierarchical radical extraction for handwritten Chinese characters
Hsieh et al. A probabilistic stroke-based Viterbi algorithm for handwritten Chinese characters recognition
Pavlidis Syntactic pattern recognition on the basis of functional approximation

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071114

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081114

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081114

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091114

Year of fee payment: 12

EXPY Cancellation because of completion of term