JP2991768B2 - 文字ストローク検出方法 - Google Patents

文字ストローク検出方法

Info

Publication number
JP2991768B2
JP2991768B2 JP2332592A JP33259290A JP2991768B2 JP 2991768 B2 JP2991768 B2 JP 2991768B2 JP 2332592 A JP2332592 A JP 2332592A JP 33259290 A JP33259290 A JP 33259290A JP 2991768 B2 JP2991768 B2 JP 2991768B2
Authority
JP
Japan
Prior art keywords
stroke
curve
flow
character
complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2332592A
Other languages
English (en)
Other versions
JPH04199387A (ja
Inventor
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2332592A priority Critical patent/JP2991768B2/ja
Publication of JPH04199387A publication Critical patent/JPH04199387A/ja
Application granted granted Critical
Publication of JP2991768B2 publication Critical patent/JP2991768B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明はオフライン文字認識などにおいて、文字スト
ロークの流れを検出する方法に関する。
〔従来の技術〕
オフライン文字認識において、従来から交差点や分岐
点などの特異点の周囲の局所的なストロークの方向変化
の滑らかさに注目した。文字ストロークの流れの検出が
考案されてきた(S.Mori,K.Yamamoto,and M.Yasuda,“R
esearch on Machine Recognition of Handprinted Char
acters",IEEE Transactions on Pattern Analysis and
Machine Intelligence,Vol.PAMI−6,No.4,pp.386−405,
July 1984)。
これは、例えば第2図に示すように、特異点をP0,そ
してP0にn個(第2図では3個)の線素が接続している
ものとして、P0の近傍の点をP1,P2,…,Pnベクトル▲
▼と▲▼のなす角をθij(第2図ではθ
122331)としたとき、 を最小にする(i,j)の組を見つけるものである。
〔発明が解決しようとする課題〕
ところが、この方式では、第2図に示したように、θ
122331が互いほぼ等しい場合や、第3図に示した
ように、θ1223がほぼ等しい場合には、特異点P0
位置が少しずれただけで、それぞれ第4図および第5図
に示したように、3種類および2種類のストロークの流
れが検出され、構造的に不安定となる。さらに、第6図
に示したような形の文字“8"においては、特異点P0とQ0
が共に第2図と第4図に示したように性質を持つので、
特異点P0とQ0の位置が少しずれただけで、第7図のよう
に、9種類のストロークの流れが検出されることにな
り、認識のためのモデルを大幅に増やさなければならな
くなる。この不安定さが、実際にストローク抽出方法を
適用する際の問題点となっていた。
本発明の目的は、オフライン文字認識などにおいて、
人間の直感にあったストロークの流れの検出を行うこと
ができる文字ストローク検出方法を提供することにあ
る。
本発明の他の目的は、曲線の複雑度の計算を簡単かつ
高速に行うことができる文字ストローク検出方法を提供
することにある。
〔課題を解決するための手段〕
上記目的達成するために、本発明は、認識対象文字を
骨格線化し、該骨格線について特異点を分解し、それぞ
れについてストロークの流れを検出して複雑度を計算
し、複雑度が最小のストロークの流れを選択することを
特徴とする。
また、本発明は、ストロークの流れを複数の単調な曲
線構成要素に分割し、各要素の特徴と要素間の関係によ
り、ストロークの流れの複雑度を計算することを特徴と
する。
〔作 用〕
従来方法の問題点は、ストロークの流れの検出の際に
特異点の周囲の局所的な性質のみを考慮していることか
ら生じている。本発明においては、ストロークの流れを
特異点の周囲の局所的な性質のみから決定することが難
しい場合には、そのストロークの流れを仮定したとき
の、文字曲線全体としての複雑さを計算して、その複雑
さが最小になるようなものを見つけることによって、特
異点の周りのストロークの流れを検出する。また、曲線
の複雑度の計算においては、曲線の準位相的構造の代数
的表現に基づき、複雑度の簡単な計算を実現している。
〔実施例〕
以下、本発明の一実施例について図面により説明す
る。
第1図は本発明の一実施例の機能ブロック図である。
画像入力部11はスキャナなどからなり、手書き文字など
の認識対象文字10をディジタル画像情報として読み取
る。骨格線抽出部12は画像入力部11からディジタル画像
情報を入力して骨格線(線図形)を抽出する。ストロー
ク検出部13は、抽出された骨格線に基づいて分岐点、交
差点などの特異点を検出・分解し、それぞれについてス
トロークの流れを検出する。曲線構造解析部14は、検出
された文字ストロークの曲線構造解析を行い、文字形状
の特徴を抽出する。即ち、検出されたストロークの流れ
(文字曲線)全体としての複雑さを計算して、その複雑
さが最小になるものを見つける。マッチング部15は、曲
線構造解析部14で得られた文字形状の特徴と文字形状辞
書16にあらかじめ登録されている文字形状の標準モデル
とのマッチングをとって認識対象文字を認識し、認識結
果17を出力する。
ここで、本発明はストローク検出部13にかかわる。該
ストローク検出部13の処理は、(i)特異点の分析、
(ii)ストロークの流れの検出に大別される。以下、こ
れらの処理について詳述する。
(i)特異点の分解 特異点をP0、そして、P0にn個(n≧3)の線素が接
続しているものとする。P0の近傍の点を、Q1,Q2,…,
Qn、ベクトル▲▼と▲▼のなす角をθ
ijとしたとき、θij(i<j)を次式で計算する。
さらに、Qi(i=1,2,…,n)のそれぞれに対して、P0
と同じ座標を持つPiを導入し、PiとQiをつなぎ、P0を除
去する。ここで、Pi(i=1,2,…,n)は同じ座標を持つ
が、相異なる点とみなす。これにより、例えば、第8図
の特異点P0(n=4)は、第9図のように分解される。
(ii)ストロークの流れの検出 ここでは、簡単のため、n=3またはn=4とする。
n=4のときは、 なる列を見つけ、 とを同一視くる。ただし、 である( は、r以下の数で、もっとも大きいもの)。例えば、第
8図の特異点P0(n=4)の上では、第9図のP1とP3
および、P2とP4とを同一視することによって、第10図の
ようにストロークの流れが得られる。
n=3のとき、第2図と第3図ののような状況は、そ
れぞれ次のように定式化できる。
(1)120゜−ε<θ122331<120゜+ε (2)θ12+θ23>240゜かつ|θ12−θ23|<ε (1)も(2)も満足されない場合は、n≧4のとき
と同様にして、ストロークの流れを検出する。
ここでは、(1)のときのストロークの流れを検出す
る方法を、第6図を例にとって説明する。
(i)の特異点の分解によって、第6図の二つの特異点
P0とQ0が、第11図に示すように、それぞれPi,Qi(i=
1,2,3)に分解されたとする。P0におけるストロークの
流れには、第12図、第13図、第14図に示すように、3通
りがある。第12図は、P1とP2を同一視した場合、第13図
は、P1とP3を同一視した場合、そして、第14図は、P2
P3を同一視した場合である。
曲線構造解析部14では、検出されたストロークグラフ
を構成する各ストローク成分を、単調な曲線構成要素
(プリミティブ)の連鎖(プリミティブ系列)によって
表現し、系列要素の組合せと系列要素時間の接続関係、
及び、特異点での系列要素の接続関係などの、系列要素
間の2項関数により、線図形の文字形状の特徴を曲線構
造として記述する。これについては、本出願人が先に出
願した特願平1−245507号に詳述されているが、以下に
概要を説明する。
(i) 曲線のプリミティブ xy単調曲線とは、その曲線に沿って進むときに、x,y
座標値が共に、常に非増加であるか、または、非減少で
ある曲線である。あるxy単調曲線の2つの端点の座標を
それぞれP(x0,y0)とQ(x1,y1)(ただし、x0<x1
たは(x0=x1かつy0<y1))とするとき、Pを曲線のhe
ad(先頭)、Qを曲線のtail(末尾)とよび、y0=y1
あるものをy一定曲線、(x0−x1)×(y0−y1)>0で
あるものをxy共変曲線、x0=x1であるものをx一定曲
線、また、(x0−x1)×(y0−y1)<0であるものをxy
反変曲線とよぶ。第15図にxy単調曲線の一例を示す。
(a)はy一定曲線で、これは水平線分(以下、“−”
で示す)にほかならない。(b)はxy共変曲線の例で、
右上がり左上がり曲線(以下、“/"で示す)である。
(c)はx一定曲線で、これは垂直成分(以下、“|"で
示す)にほかならない。(d)はxy反変曲線の例で、左
上がり右下がり(以下、“/"で示す)である。
(ii) プリミティブの結合 これら4個のプリミティブの結合により、さらに、高
位のプリミティブを定義する。そのために、プリミティ
ブの局所結合則を導入する。今、xy単調曲線でない曲線
上に、曲線を被覆する2個の性質の異ったxy単調曲線を
見いだすことができ、かつ、互いに1つが他を含まない
とする。これら2つのxy単調曲線をそれぞれa,bとす
る。ただし、Pをaとbの両方に含まれる点、QとRは
Pのある近傍の中の任意の点で、Qをaのみに含まれる
点、Rをbのみに含まれる点として、 coord(P)=(xp,yp),coord(Q)=(xq,yq),coor
d(R)=(xr,yr)としたとき、ベクトル(xq−xp,yq
−yp)と(xr−xp,yr−yp)の外積が正、すなわち (xq−xp)×(yr−yp)−(xr−xp)×(yq−yp)>0 であるものとする。この仮定の下で、aとbの結合 を以下のように定義する。ただし、A,Bを“/",“/",
“|",“−”のいずれか、またα,βを、headとtailの
いずれかとするとき、記号[A,α,B,β]は、aの性質
がAで、bの性質がBであり、aのαとbのβで、aと
bが結合していることを表す。
(規則1) [/,head,\,tail],[|,head,\,tail],[/,hea
d,|,thead],または、[/,head,/,head]のとき (規則2) [\,head,/,head],[\,head,−,head],[−,he
ad,/,head],または、[\,head,\,head]のとき (規則3) [/,tail,\,head],[/,tail,|,tail],[|,tail,
\,head],または、[/,tail,/,tail]のとき (規則4) [\,tail,/,tail],[\,tail,−,tail],[−tai
l,/,tail],または、[\,tail,\,tail]のとき 第16図は2つのプリミティブの結合を説明する図であ
る。即ち、2つのプリミティブa,bは、ベクトルの組
(▲▼,▲▼)が右手系をなす向きに結合 する。ここで、Pはaとbの交差上にとられた点、Pa,P
bはそれぞれa,b上の点で、Paは先のQに、PbはRに対応
する。
(iii) 曲線のプリミティブ系列 以上のように結合則を定義すると、任意の曲線上で、
その曲線を被覆し、かつ、互いに1つが他を含まないよ
うなxy単調曲線を抽出し、上記の結合則によって、プリ
ミティブの系列を形成することができる。即ち、結合 を有向ネットワークとみなすと、推移律を適用すること
によって、次のような系列を生成することができる。
ただし、 となる、b,cは存在しないとする。
2個以上のxy単調曲線が抽出され、かつ、上の性質を
満たす系列(1)がないときには、この曲線にラベル<
0,0>を与える。例えば、円はラベル<0,0>をもつとす
る。
2個以上のxy単調曲線が抽出され、かつ、ラベル<0,
0>をもたない任意の曲線は、(1)式の形をした、い
くつかの要素に分解される。その各々をps要素呼び、
(1)式で表わされるps要素において、aiをそれぞれbr
anchと呼び、特に、a0をhead branch,anをtail branch
とよぶ。また、ps要素の端点で、head branchにあるも
のをh−端点、tail branchにあるものをt−端点とよ
び、端点以外の点を内点と呼ぶ。このn+1個のxy単調
曲線からなる系列に対して、次のような規則でプリミテ
ィブ系列のラベル(psラベルと略す)<ps,id>を与え
る。
ps=(n+1)+L+M (2) id=j1 (3) ただし、 L=(aiとai+1(i=0,1,…,n−1) の性質が同じ M=(性質が“|"または“−”であるai,i=1,2,…,n
−1の数) また、その曲線からxy単調曲線が1個だけ抽出される
とき、“−”にラベル<1,1>、“/"にラベル<1,2>、
“|"にラベル<1,3>、そして、“/"にラベル<1,4>を
与える。この場合、h−端点、t−端点は、それぞれ、
xy単調曲線のhead,tailと定義され、head branch,tail
branchは定義されない。
さて、第12図、第13図及び第14図の曲線をプリミティ
ブに分解すると、それぞれ第17図、第18図のようにな
る。これらのプリミティブに、プリミティブの結合規則
を適用し、プリミティブ系列を構成する。これにより、 第17図では、二つのプリミティブ系列 が構成され、それぞれラベル<4,1>と<4,3>をもつ。
第18図では、二つのプリミティブ系列 が構成され、これぞれラベル<4,1>と<4,3>をもつ。
第19図では、4つのプリミティブ系列 が構成され、それぞれラベル<4,1>,<2,3>,<4,3
>、そして、<1,0>をもつ。
ここで、n個のプリミティブ系列S1,S2,…,Snからな
る曲線の複雑度Cを、次の式で定義する。
ただし、Siのラベルを、<psi,idi>とする。
PiとPj(i<j)を同一視してできる曲線の複雑度
を、C(Pi,Pj)とする。
第11図の例について、C(Pi,Pj)を計算すると、 第17図より、 C(P1,P2)=4+4=8 第18図より、 C(P1,P3)=4+4=8 第19図より、 C(P2,P3)=4+2+4+1=11 となる。これから明らかなように、第17図と第18図のよ
うな書き方は、第19図の書き方より単純であり、人間の
書き方に一致している。そこで、 min C(Pi,Pj),i<j とするような、Pi,Pjを同一視することによって、スト
ロークの流れを検出することできる。
もし、 min C(Pi,Pj),i<j となるような、組(i,j)が複数あるならばθijの大き
い方を選んで、Pi,Pjを同一視すればよい。
第11図の点Qi;i=1,2,3)についても、同図の点P
i(i=1,2,3)と同様のことを行うと、第6図の曲線の
ストロークの流れとして、同図の(a),(b),
(g),(h)の4通りのみの可能性だけ残る。これか
ら、特異点の周りの局所的な方向連続性のみを考慮した
場合と比較して、人間の直感にあった書き方のみが残っ
ていることがわかる。
以上は、ストロークの流れ検出で述べた(1)を満足
する場合であるが、(2)の場合も同様で、このときに
は、C(P1,P2)とC(P2,P3)の大小を調べればよい。
〔発明の効果〕
以上の説明から明らかなように、本発明では、分岐
点、交差点の局所的な性質だけからは、ストロークの流
れが検出できないときには、全体的性質を調べることに
よって、人間の直感にあったストロークの流れの検出を
行なうことができる。また、曲線の複雑度の計算を簡単
に高速に行なうことができる。
【図面の簡単な説明】
第1図は本発明の一実施例の機能ブロック図、第2図乃
至第7図は従来の文字ストロークの流れの検出を説明す
る図、第8図及び第9図は特異点の分解を説明する図、
第10図乃至第14図は本発明によるストロークの流れの検
出を説明する図、第15図はプリミティブの種類を説明す
る図、第16図はプリミティブの結合を説明する図、第17
図乃至第19図は第12図乃至第14図の例のプリミティブ系
列を示す図である。 11……画像入力部、12……骨格線抽出部、 13……ストローク検出部、 14……曲線構造解析部、15……マッチング部、 16……文字形状辞書。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】文字認識処理において、認識対象文字の分
    岐点、交差点などの特異点に着目してストロークの流れ
    を検出する方法であって、 認識対象文字を骨格線化し、該骨格線について特異点を
    分解し、それぞれについてストロークの流れを検出して
    複雑度を計算し、複雑度が最小のストロークの流れを選
    択することを特徴とする文字ストローク検出方法。
  2. 【請求項2】請求項(1)記載の文字ストローク検出方
    法において、ストロークの流れを複数の単調な曲線構成
    要素に分割し、各要素の特徴と要素間の関係により、ス
    トロークの流れの複雑度を計算することを特徴とする文
    字ストローク検出方法。
JP2332592A 1990-11-29 1990-11-29 文字ストローク検出方法 Expired - Fee Related JP2991768B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2332592A JP2991768B2 (ja) 1990-11-29 1990-11-29 文字ストローク検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2332592A JP2991768B2 (ja) 1990-11-29 1990-11-29 文字ストローク検出方法

Publications (2)

Publication Number Publication Date
JPH04199387A JPH04199387A (ja) 1992-07-20
JP2991768B2 true JP2991768B2 (ja) 1999-12-20

Family

ID=18256664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2332592A Expired - Fee Related JP2991768B2 (ja) 1990-11-29 1990-11-29 文字ストローク検出方法

Country Status (1)

Country Link
JP (1) JP2991768B2 (ja)

Also Published As

Publication number Publication date
JPH04199387A (ja) 1992-07-20

Similar Documents

Publication Publication Date Title
Srihari Recognition of handwritten and machine-printed text for postal address interpretation
Fan et al. Combining local appearance and holistic view: Dual-source deep neural networks for human pose estimation
Cheung et al. An Arabic optical character recognition system using recognition-based segmentation
Chen et al. Human action recognition using star skeleton
Suen et al. Building a new generation of handwriting recognition systems
Antoine et al. Analysis of technical documents: The REDRAW system
Diba et al. Deepcamp: Deep convolutional action & attribute mid-level patterns
JP2718485B2 (ja) 文字認識方法
Zhu et al. A novel OCR-RCNN for elevator button recognition
Hossain et al. Recognition and solution for handwritten equation using convolutional neural network
Mahdavi et al. Visual parsing with query-driven global graph attention (QD-GGA): preliminary results for handwritten math formula recognition
JP2719202B2 (ja) 線図形特徴抽出及び認識方法
Yang et al. Real time hand gesture recognition via finger-emphasized multi-scale description
Basu et al. A fuzzy technique for segmentation of handwritten Bangla word images
Hamdi et al. Hybrid neural network and genetic algorithm for off-lexicon online Arabic handwriting recognition
Fang et al. Pedestrian attributes recognition in surveillance scenarios with hierarchical multi-task CNN models
Cao et al. Handwritten numeral recognition with multiple features and multistage classifiers
JP2991768B2 (ja) 文字ストローク検出方法
Foggia et al. Combining statistical and structural approaches for handwritten character description
Ramel et al. Automatic reading of handwritten chemical formulas from a structural representation of the image
Sulong et al. Dynamic programming based hybrid strategy for offline cursive script recognition
Ramel et al. A structural representation adapted to handwritten symbol recognition
Sulong et al. Improved offline connected script recognition based on hybrid strategy
Hsieh et al. A probabilistic stroke-based Viterbi algorithm for handwritten Chinese characters recognition
Schimmels et al. The robustness of an admittance control law designed for force guided assembly to the disturbance of contact friction

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071015

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101015

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees