JPS63301382A - 文字成分分離方法 - Google Patents

文字成分分離方法

Info

Publication number
JPS63301382A
JPS63301382A JP62137725A JP13772587A JPS63301382A JP S63301382 A JPS63301382 A JP S63301382A JP 62137725 A JP62137725 A JP 62137725A JP 13772587 A JP13772587 A JP 13772587A JP S63301382 A JPS63301382 A JP S63301382A
Authority
JP
Japan
Prior art keywords
point
character
line segment
points
angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62137725A
Other languages
English (en)
Inventor
Keisuke Goto
啓介 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Electric Manufacturing Co Ltd
Priority to JP62137725A priority Critical patent/JPS63301382A/ja
Publication of JPS63301382A publication Critical patent/JPS63301382A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 人、 産業上の利用分骨 本発明は、文字を認識する場合において、文字認識の判
断処理を簡略化した文字成分分離方法に関する。
B、 発明の概要 本発明は、従来から存在する輪郭ベクトルによる文字v
s識処理を一歩進めて、文字の特徴部分は文字の折れ目
、分岐点等の節目であることに鑑み、ベクトルの偏角を
求めて、偏角の最大最小を求め、しかも近傍の部分での
最大最小をも求めることにより、文字の節目を見出すこ
とで輪郭線分数より大幅に少ない特徴点数の処理のみに
て文字の認識処理を可能とした。
C0従来の技術とその問題点 文字を認識するに当っては、従来より文字成分に線分ベ
クトルをあてはめ、線分ベクトル系列を取扱う方法が用
いられている。この線分ベクトル系列としては、次の二
つの方法が知られている。すなわち、文字の細線化ベク
トル系列と文字の輪郭ベクトル系列である。
細線化ベクトル系列は、第6図(a)に示すように文字
成分の太さを捨象してslのみとじてとらえ、その上に
ベクトル系列を配列するものである。また、輪郭ベクト
ル系列は、第6図(blに示すように文字成分の輪郭に
沿ってベクトル2を配列するものである。いずれにして
も、ベクトル系列は、文字成分の線分の構造や配置関係
に基づく構造解析的な認識の基礎となるものである。
ところが、上述の線分ベクトル系列の取扱いには、次の
問題を含んでいる。すなわち、細線化ベクトル系列にあ
っては、文字の細線化の過程でのひげの発生や不要なル
ープの発生あるいは交点の分岐など、線分の端点や交点
近傍で特徴抽出が不安定となってしまう。
そして、この不安定によって後に続く認識処理に大きな
影響を及ぼしひいては認識率の向上に対する障害となっ
ている。
また、輪郭ベクトル系にあっては、細線化ベクトルとは
異なりひげなどのノイズ発生はなく安定であるが、線分
ベクトル2が文字゛成分の側部両側に存在するので細線
化ベクトルに比べて処理が2倍程度となってしまい、入
カバターンと辞書パターンの対応付けは難しくて複雑な
処理が必要となり、処理時間からみて不利である。
したがって、本発明は、上述の問題点に鑑み、細線化ベ
クトルによる処理の如き不安定さはなく、かつ輪郭ベク
トルの如き複雑な処理を阻止した文字成分分離方法に関
する。
D、 問題点を解決するための手段 上述の目的を達成する本発明の基本思想は、輪郭ベクト
ル系列の応用であって、このベクトル系列の隣接するベ
クトルどおしの偏角の大小により文字成分の節目を判断
し、文字の特徴点数を減少するようにしたものである。
E、  作    用 文字の認識に当っては、文字成分の曲りや分岐の抽出の
みによっても充分に認識可能であることから、この曲り
や分岐などの節目のみの抽出によって、処理を簡略化で
きる。
F、実施例 ここで、第1図ないし第5図を参照して本発明の詳細な
説明する。まず、原理から説明する。輪郭線分系列の線
分ベクトルを文字の輪郭に沿い第6図(b)に示すよう
に配列する。
この場合、文字成分は線分ベクトル2の進行方向片側に
(例えば右側に)常にあるように線分ベクトルを決める
。こうして配列した線分ベクトル系列にあっては、文字
成分の任意の一つの線分i(1≦l≦nでiは自然数)
において、線分ベクトルは座標値系列にて与えられる。
そして、文字認識の特徴量としては、線分lの始点ZM
l(”Il、y、、)、終点Zal (”at” at
)、長さ11、方向θ;で示され、次式をも得る。
1 、 = ll Z、、  Z、、ll = F[;
)耳7】■ヱθ2= taa−’ ((y、、−y、、
)/(x、、−x、、))こうして特定されろ線分の諸
量につき、文字認識の最も特徴とする曲がりや分岐、交
点などを抽出するために、輪郭線分の偏角を求める。す
なわち、具体的には隣接する線分ベクトルとおしをlと
i −1とした場合、ベクトルi −1とベクトルlと
が成す偏角φ、を次式にて求める。
この場合、θ=0の基準面としては水平線分とし、その
水平線分に対し反時計方向に角度θを採る。このように
して得られた偏角φ1は、輪郭線分ベクトル1の始点を
中心として一180°くφ、≦180°の範囲を採る。
実際に隣接するベクトルi −1と1にて偏角を求める
。第1図にて、(C)に示す基準面をθ=0とする。文
字成分がベクトルの右側に存在する場合、第1図(c)
に示すようにベクトルi −1とiとが水平の場合には
θ1−1=θ;=0となり、上記(11(21式にて偏
角φ、=0となる。
また、第1図(alに示すようにθ =180”0m 
Q ”の例では、ベクトル1−1と1との間に文字成分
以外の空白領域があるようにもとれるが、ペクi・ルi
 −1及びl双方の右側部分が文字成分であることを鑑
みれば、実際上ベクトルi −1とiとの同は隙間なく
全て文字成分で塗り潰されろことになる。仮に、ベクト
ル1−1と1との間に隙間があればベクトル1−1は1
800にならず少なくともθ、−、= i s o″″
″以上ってベクトル1−1とiと空隙を閉塞することに
なる。こうして、実際上θ、、=180”θ1=Oの如
き凹部を形成する空隙は存在しない。
つぎに、第1図(b−1) (b−2) (b−3)に
つき説明する。まず(b−1)ではベクトルi−1と1
との間でθ、−、=270’、θ、=oとなってφIは
−906、(b−2)ではθ、−、= 135°、θ−
45°とナラT $、 =  90@、アルイtj (
b−3) テハl、−。
=90°、θ、=180’となってφ、=−90’″、
すなわち、ベクトル1−1に対し左方向に曲がる直角な
ベクトルiではφ、==−90°となってベクトルで囲
まれる部分が凹部を形成する空隙が存在する。
第1図(d−1) (d−2) (d−3)においては
、(d−1)ではθ、−、=90°、θ、二〇となって
φ1=90°、(d−2) 1’ +! θ、、=45
’ 、 θ、=315°トナツテφI=90°、更ニ(
d−3) テl! e、−、=O,e、=270”とな
ってφ、=90’となる。すなわち、ベクトルi −1
に対し右方向に直角に曲がるベクトルiではφ、=90
@となって、ベクトルで囲まれる部分が文字成分となり
凸部を形成する。
更に、第1図(e−1) (e−2) (e−3)にお
いては、(e−1)ではθ、−、= 180°、θ1=
0となってφ、=180’、(e−2)ではθ、−、=
225°、θ、=245゜となってφ、−180°、(
e −3)ではθ、−、=135”。
θ、=315°となってφ、=180”となる。この場
合は、ベクトルによって囲まれる部分が最も突状の文字
成分となって凸部を形成する。
こうして、偏角φ、が0くφI≦180°の場合は凸部
、偏角φ1が0〉へ) −180°の場合には凹部を形
成し、そのφ1の角度が太き(180’に近づく程凸部
が極端になり、φ1の角度が小さく一180°に近づく
程凹部が極端になる。
こうして得られた偏角により文字成分の凹部や凸部を得
た状態で、次に凹領域更には凸領域を求める。ここで凹
領域とは、基準となる凹点とその近傍領域内で少なくと
も1つ以上の近傍凹点を持つ領域をいい、凸領域とは、
基準となる凸点が存在する領域をいい、この場合凹点が
あっても凸領域とみなす。この凹領域や凸領域は、文字
の切れ目や分岐等の人間の視線が集中する特徴点では少
なくとも凹部が集中し凸部が存在するため決められるも
のである。
まず、基準となる凹点を求めろ場合には、第2図[al
の如く前述する偏角φ、を調べ、この偏角φ1が任意に
設定する値β、(β、は負)との間でφl≦β1のとき
、その1点における連続する線分ベクトルの局所区jl
l (i −に、 i+k) ニて、最小偏角となる点
i’(i−に≦1′≦i + k )を基準凹点とする
。すなわち、偏角がある値以上小さな箇所の区間で最も
小さな偏角をなす所を基準凹点i′とする。
ついで、この基準凹点i′を中心として半径rの円内に
ある近傍領域に着目する。すな□ゎち、基準凹点i′の
座標をZ、’ (x、’ y、’ )としたとき、近傍
領域半径r内の輪郭線分mの始点座標をZ−(x、y、
)としたとき次の式を満なす領域を決めろ。
112、’ −Z、II =  (x、’ −x、)2
−(y、’ −y、)2≦rそこで、近傍凹点l′を次
のようにして求める。この近傍領域にある輪郭線分の偏
角φを調べ、φ、≦β2(β2は負)となるj点に8け
る連続した線分ベクトルの局所区間(j−に、j+k)
で、最小値をとる点j’H−に≦1′≦j+k)を近傍
凹点とする。
基準凹点i′以外に1つ以上の近傍凹点】′が領域内で
見出されたとき、電殺がら凹領域である。もし、見出さ
れないときは凹領域ではない。
こうして、凹領域が見出されたとき、領域内の凹点数に
従って、その個数分だけ文字成分を分離する。第2図(
alは凹領域の決定状態を示し、第3図にて分離の状態
を示す。
以上の様にして凹領域による文字成分の分離によって、
分離された文字成分は第4図に示すような(a)の直線
部分とか(b)の曲線部分となる。この直線部分3と曲
線部分4の特徴点は両端点と曲線部分に存在する屈曲点
である。
この両端点と屈曲点を特徴点として抽出するため上述の
凸領域の定義を導入している。
まず、基準となる凸点を求める。すなわち、文字分離成
分の線分系列について側角φ1を調べ、φ1≧β3(β
つは正数)となるi点における連続した線分ベクトルの
局所区間(i −k 、 i + k )で最大値をと
る点i’(i−に≦1′≦i + k )を基準となる
凸点とする。この基準凸点を中心として半径rの円内が
凸領域である。凸領域内で基準凸点と同様の処理を行な
い、近傍凸点をすべて見出し特徴点とする。なお、第2
図(b)に示す近傍領域に凹点を含んでも凸領域とし、
第2図(C)に示すように基準凸点のみからなる場合に
も凸領域とする。こうして、抽出された特徴点は第5図
(11(blの黒丸に示すようになる。
以上のようにして文字成分の特徴点が抽出され、文字成
分系列の特徴点座標、次の特徴点座標、これら特徴点間
の長さとその方向が特徴量となる。
G、 発明の詳細 な説明したように本発明においては、線分ベクトルの偏
角を求め、その最大値を求め、基準凹点と凹領域を求め
、ついて凹領域を求めることにより、ms化ベクトルの
如く特徴抽出に不安定さはない輪郭ベクトル系列を用い
、ついて複雑な処理にならないように輪郭線分数に対し
て特徴点数を大幅に削減したので、後段の!!1ifi
処理が容易となりしかも処理時間も節約で−ろ。
【図面の簡単な説明】
第1図は本発明による偏角を求める具体例の説明図、第
2図は凹領域、凸領域の説明図、第3図は凹領域による
文字分離の説明図、第4図は分a後の凸領域の説明図、
第5図は分離後の特徴点の説明図、第6図は従来例の説
明図である。 図     中、 1′は基準凹点、基準凸点、 」′は近傍凹点である。

Claims (1)

    【特許請求の範囲】
  1. 文字成分をベクトル進行方向片側にみながら文字の輪郭
    に沿ってベクトルを配列し、この配列されたベクトル列
    のうち隣接するベクトルどおしで偏角を求め、この偏角
    のうちベクトルの連続する局所区間内にて一定偏角以上
    の最大偏角及び一定偏角以下の最小偏角を基準点とし、
    この基準点を中心とした近傍領域にて同様の最大又は最
    小偏角からなる近傍点を求め、この基準点及び近傍点と
    のまとまりを文字の節目とした文字成分分離方法。
JP62137725A 1987-06-02 1987-06-02 文字成分分離方法 Pending JPS63301382A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62137725A JPS63301382A (ja) 1987-06-02 1987-06-02 文字成分分離方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62137725A JPS63301382A (ja) 1987-06-02 1987-06-02 文字成分分離方法

Publications (1)

Publication Number Publication Date
JPS63301382A true JPS63301382A (ja) 1988-12-08

Family

ID=15205370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62137725A Pending JPS63301382A (ja) 1987-06-02 1987-06-02 文字成分分離方法

Country Status (1)

Country Link
JP (1) JPS63301382A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195513A (ja) * 1992-08-12 1994-07-15 Internatl Business Mach Corp <Ibm> 光学式文字認識システム用折曲点抽出方法
JP2009193361A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、画像処理プログラム、及び、記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195513A (ja) * 1992-08-12 1994-07-15 Internatl Business Mach Corp <Ibm> 光学式文字認識システム用折曲点抽出方法
JP2009193361A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、画像処理プログラム、及び、記録媒体
US8238686B2 (en) 2008-02-14 2012-08-07 Canon Kabushiki Kaisha Image processing apparatus, method and recording medium

Similar Documents

Publication Publication Date Title
US7068843B2 (en) Method for extracting and matching gesture features of image
JPS63301382A (ja) 文字成分分離方法
Tosue et al. Towards a qualitative reasoning on shape change and object division
JPH07200735A (ja) 図形認識装置
JPH07160870A (ja) 近似曲線生成装置
US5790700A (en) Method for automatically recognizing line symmetry of a figure
JP2679601B2 (ja) デジタル画像フィルタリング方法
JPS63170789A (ja) パタ−ン類似度検出回路
JPS62282379A (ja) 図形認識装置
JP3344791B2 (ja) 線分抽出方法
JP2507413B2 (ja) パタ−ンデ−タ圧縮方法
Lam et al. Automatic evaluation of skeleton shapes
JPS63143681A (ja) 部品画像認識方式
JP2867650B2 (ja) シンボル候補領域の検出方法
JPH02138677A (ja) 画像特徴点検出方法
JP3066667B2 (ja) アウトライン文字補正処理方式
JPS63213088A (ja) 円弧抽出装置
JPH04236678A (ja) 領域整形方法
JP2795733B2 (ja) 細線化方法
JPS62154078A (ja) オンライン手書文字認識における特徴点の抽出方式
JPH04142679A (ja) 点線抽出方式
JP2921838B2 (ja) 手書き文字認識方式
JPH0830783A (ja) 2次元物体の認識方法
JPH07129772A (ja) 円弧の始終点認識方法および装置
JPH0452989A (ja) 文字認識装置