JP2792655B2 - 手書き数字認識における下線処理方法 - Google Patents

手書き数字認識における下線処理方法

Info

Publication number
JP2792655B2
JP2792655B2 JP63227544A JP22754488A JP2792655B2 JP 2792655 B2 JP2792655 B2 JP 2792655B2 JP 63227544 A JP63227544 A JP 63227544A JP 22754488 A JP22754488 A JP 22754488A JP 2792655 B2 JP2792655 B2 JP 2792655B2
Authority
JP
Japan
Prior art keywords
branch
underline
handwritten
candidate
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63227544A
Other languages
English (en)
Other versions
JPH0276089A (ja
Inventor
博史 亀山
章司 三木
和彦 大西
勝司 魚崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP63227544A priority Critical patent/JP2792655B2/ja
Publication of JPH0276089A publication Critical patent/JPH0276089A/ja
Application granted granted Critical
Publication of JP2792655B2 publication Critical patent/JP2792655B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 発明の目的; (産業上の利用分野) この発明は、数字記入領域を下線により指定した部分
に記入された手書き数字認識における下線の処理方法に
関する。
(従来の技術) 手書き数字を読取って細線化処理をした後に端点,分
岐点によりブランチを決定し、その決定されたブランチ
の構成を分析して、例えばブランチの形状によってブラ
ンチを直線,円(ループ),円弧(アーク)の3種類に
分類して、その組合せパターンに基づいて数字を認識す
る方法を、本出願人は特願昭62−274797号で出願してい
る。すなわち、文字(数字)パターンを前処理してルー
プ,直線及びアークの要素による特徴抽出を行ない、規
格化を行なってから予め登録されている分類コードと比
較し、その比較結果に基づいて必要時にバランスチェッ
ク,ストロークチェックを行ない、それでも文字が特定
できないときには更に前記アークの回転方向,前記要素
の長さ比等の詳細分類を行なって前記文字パターンを認
識するようにしている。
(発明が解決しようとする課題) 帳票によっては手書き数字の記入指定が枠ではなく、
下線のみによる場合がある。つまり、予め印刷された下
線の上部分に手書きで数字を記入することがある。この
場合、下線の色が赤色等のドロップアウトカラーで印刷
されているならば機械読取上問題はないが、手書き数字
と同一色の黒色で下線が印刷されている帳票では、機械
で手書き数字を読取る際に問題となる。
数字と下線の両方を読取って細線化処理した後、下線
方向についての画素のヒストグラムから大体下線の位置
を判断できるが、これから下線に相当すると思われる部
分を削除してしまうと、数字が下線に交差している場合
には数字の一部が切断されてしまう。このため、後の数
字認識処理が非常に難かしくなり、また数字と下線が接
触している場合には、数字の一部が除去されてしまい、
その後の数字認識が不可能となってしまう。
アンダーラインや枠等の下線と文字とを分離して処理
する方式として、特開昭62−217385号公報に記載された
ものがあるが、これは細線化処理をしないで2値化され
た図形そのもので認識をするもので、方式が全く異なっ
ており、また下線と交差した文字には適用できない欠点
がある。
この発明は上記問題点に鑑みなされたものであり、下
線が存在している記入領域において、手書き数字の下部
が下線に接しているときには下線を数字の一部分として
残し、下線が数字の一部と交差しているとき又は全く交
差していないときには、その下線のみを判断して除去す
るようにした手書き数字認識における下線処理方法を提
供することを目的とするものである。
発明の構成: (課題を解決するための手段) この発明は、手書き数字を読取って細線化処理をした
後、端点,分岐点によりブランチを決定し、前記ブラン
チのデータ構成を分析して前記手書き数字を認識する方
法における下線処理方法に関するもので、この発明の上
記目的は、数字記入領域を下線により指定した部分に記
入された前記手書き数字を前記下線と共に読取って細線
化し、下線方向の画素のヒストグラムに基づいて下線領
域を決定し、前記下線領域における前記下線方向につい
ての連続性から下線候補ブランチを判定し、この下線候
補ブランチの両端の分岐点に別のブランチが接続されて
いるとき、前記別のブランチの下線方向に対する角度に
より前記下線候補ブランチが前記手書き数字の一部であ
るか否かを判定し、その判定結果に基づいて前記下線候
補ブランチから下線ブランチのみを除去し、前記手書き
数字と前記下線の共通ブランチは除去しないようにする
ことによって達成される。
(作用) この発明では、手書き数字を読取って細線化処理をし
た後、端点,分岐点によりブランチを決定すると共に、
下線のみを構成するブランチと下線及び数字を共通に構
成するブランチとを全体のブランチから判別して取出
し、下線のみのブランチを判別して取出す。その後に下
線のみを構成するブランチを除去して、新たに画像デー
タを再作成して数字認識を行なうようになっている。
(実施例) 第1図に数字認識の全体のフローを示して説明する
と、先ず機械で読取処理(ステップS1)を行なって手書
き数字及び下線の読取データをメモリに記憶し、2値化
処理(ステップS2)により読取部の黒い部分を決定し
(読取と同時に行なっても良い)、次に細線化処理(ス
テップS3)を行なって幅を有しない一本のデータ構造と
する(第3図の(A)参照)。この後、細線化データか
ら第3図の(B)に示すようなy座標(下線方向を意味
する)のヒストグラムの最大となるy座標WY0を求め、
このy座標WY0から下線が含まれているであろうと思わ
れる下線領域ULを決定する(ステップS4)。なお、第3
図において、Sは文字線を示し、Wは下線を示している
(後述する判断結果による)。
次に、ブランチ(ブランチはノードとノードとの間の
線分であり、ノードには端点,分岐点が含まれる)毎に
特徴量を演算する(ステップS5)。この特徴量から、予
め定めた判定式(後述する)に合うか否かに基づいて下
線候補ブランチを判定する(ステップS6)。そして、こ
の下線候補ブランチから下線のみのブランチを更に判定
し(ステップS7)、細線化データから下線のみのブラン
チを除去して細線化データを再構成し(ステップS8)、
その後に数字の認識処理を行なう(ステップS9)。
ところで、ブランチ毎の特徴量としては以下に示すも
のがある。
上記ステップS6においては、下記I〜IVの場合に分け
て下線候補ブランチを判定する。尚、各場合、その中の
判定式を全て満足した場合に限り下線候補ブランチとす
る。
Iの場合: |lty−WY0|≦3…ブランチの左端点のy座標がWY0から
3ビット以内 |rty−WY0|≦3…ブランチの右端点のy座標がWY0から
3ビット以内 hcnt>5…水平成分は6ビット以上 otcnt<5…y座標WY0近傍±1ビット以外に5画素以上
あってはいけない。
第4図(A)の細線化データでは|lty−WY0|=2,|rty
−WY0|=1,hcnt=6,otcnt=1で、上記判定式Iを全て
満足するので下線候補ブランチとする。また、同図
(B)の細線化データは、|lty−WY0|=3,|rty−WY0|=
2,hcnt=0,otcnt=3であり、上記判定式Iを満たさな
いので下線候補ブランチではない。
IIの場合: |lty−WY0|≦4又は|rty−WY0|≦4…ブランチの両端点
のずれを少し甘くする ln>50…横方向に長い hcnt>10…水平成分は11ビット以上 incnt>10…y座標WY0近傍に11ビット以上 otcnt<20…y座標WY0から離れたものが19ビット以下 IIIの場合: |lty−WY0|≦5又は|rty−WY0|≦5…上記IIより甘くす
る ln>80…横方向は81ビット以上 hcnt>70…水平成分は71ビット以上 incnt>10…y座標WY0近傍に11ビット以上でy座標WY0
から離れたもの(otcnt)は考えないII、IIIともに長い
ブランチを対象としており、データ取り込み時の斜行な
どの影響で横方向に長いブランチの端点はy座標WY0
らずれることが多い為、lty,rtyに関する条件をゆる
め、一方hcnt,incntに関する条件を用いて判別してい
る。
IVの場合: |cgy−WY0|≦2…ブランチのy重心がy座標WY0より2
ビット以下 hcnt>5…水平成分は6ビット以上 たとえば太字で接触したり、一部下へ出たときに細線化
すると、otcntが5ビット以上となり条件Iを満たさな
いが、この条件IVを満たす。
第4図(C)の細線化データでは、cgy=1.7,hcnt=
6で、otcnt=9となり、判定式Iを満たさないが、判
定式IVは全て満足するので下線候補ブランチとする。
上述のようにして下線候補ブランチを判定するが、下
線のみのブランチと下線及び文字の共通ブランチの両方
を含む。
次に、上記ステップS7で下線候補ブランチから下線の
みのブランチを判定する動作を、第2図のフローチャー
ト及び第3図を参照して説明する。
まず候補ブランチの両端が共に分岐点であるか否かを
判別して(ステップS701)、少なくともいずれか一方の
端が端点ならばそのブランチは下線のみのブランチとす
る(ステップS720)。したがって、第3図ではブランチ
BR1及びBR11の各端は端点となっているので、ブランチB
R1及びBR11は下線のみのブランチ(W)となる。上記ス
テップS701において、もし共に分岐点であるならば(ブ
ランチBR3,BR6,BR9)、これら各候補ブランチの両端点
と同じ端点を持つブランチが他に存在するか否かを判断
し(ステップS702)、存在するときにはこの2つのブラ
ンチの長さの各々の1/2の中点におけるy座標を比較し
て(ステップS703)、上方のブランチを下線のみのブラ
ンチとし、下方のブランチは数字の一部が下線から突き
出て交差しているものと判断して数字のみのブランチと
する(ステップS704)。第3図の例ではブランチBR8,及
びBR9の両端点E5,E6が共通であり、ブランチBR8,の中点
M1及びブランチBR9の中点M2のy座標を比較すると、中
点M2の方が大きいのでブランチBR9を下線のみのブラン
チ(W)とし、ブランチBR8を数字のみのブランチ
(S)とする。
また、上記ステップS702において端点を同じくする別
のブランチがないときには、候補ブランチの両端に接続
する各ブランチの画素数が共に5ビット以上であるか否
かを判断する(ステップS710)。もし5ビット未満のブ
ランチが存在するときには、当該ブランチを下線のみの
ブランチとする。また、全て5ビット以上ならば更に分
岐点から5ビット離れた2つのブランチの各y座標を比
較し、上方にあるブランチを数字のブランチlb,rbとす
る(ステップS711)。そして、両分岐点から5ビットず
つ離れたブランチlb,rbの点と各分岐点とを結ぶ線分の
水平方向に対する角度θlを求める(ステップS71
2)。角度θlが共に90゜以上のとき(但しθ
θ=90゜の場合を除く)には、そのブランチを一応下
線及び数字を共通に構成するブランチとする。第3図の
例ではブランチBR3に関して、θ>90゜でθ′>90
゜であるのでブランチBR3を下線及び数字を共通にする
ブランチ(W,S)とする。また、ブランチBR6に関しては
θ<90゜,θ′<90゜になっているので、下線及び
数字を共通にするブランチとはしない。
しかし、この判断式には例外処理がある。つまり,例
えば第5図のような例ではθ=90゜,θ=120゜と
なるが、このとき“1"と“7"の間の下線UL1を数字の一
部と誤ってしまうので、候補ブランチの画素数が24ビッ
ト以上で、かつブランチlb又はγの端点のいずれかが
分岐点ではなく(第4図の例では共に分岐点ではな
い)、かつ下線(WY0)からその端点までの距離(y座
標)が30ビット以上である場合(ステップS714)には、
下線のみのブランチとしている(ステップS715)。
このようにして下線候補ブランチから下線のみのブラ
ンチを判定するようにして、細線化データからこの下線
のみのブランチを除去してデータを再構成した後に、数
字認識処理へ引き渡している。尚、下線候補ブロックを
判定するときの判定式、ならびに各場合は実施例に限定
されず、適宜修正,追加してよい。
発明の効果: 以上のようにこの発明の下線処理方法によれば、下線
と文字線とが交差した場合でも確実に数字と下線とを分
離できるので、文字パターンの認識上大きな効果を奏す
る。
【図面の簡単な説明】
第1図はこの発明の処理と数字認識を示すフローチャー
ト,第2図はこの発明の一例を示すフローチャート,第
3図,第4図(A)〜(C)及び第5図はこの発明を説
明するための図である。 UL……下線領域、S……文字線、W,UL1……下線、BR1
BR13……ブランチ、E1〜E7……分岐点。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−27877(JP,A) 特開 昭60−167072(JP,A) 特開 平1−36384(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/20 G06K 9/34

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】手書き数字を読取って細線化処理をした
    後、端点,分岐点によりブランチを決定し、前記ブラン
    チのデータ構成を分析して前記手書き数字を認識する方
    法において、数字記入領域を下線により指定した部分に
    記入された前記手書き数字を前記下線と共に読取って細
    線化し、下線方向の画素のヒストグラムに基づいて下線
    領域を決定し、前記下線領域における前記下線方向につ
    いての連続性から下線候補ブランチを判定し、この下線
    候補ブランチの両端の分岐点に別のブランチが接続され
    ているとき、前記別のブランチの下線方向に対する角度
    により前記下線候補ブランチが前記手書き数字の一部で
    あるか否かを判定し、その判定結果に基づいて前記下線
    候補ブランチから下線ブランチのみを除去し、前記手書
    き数字と前記下線の共通ブランチは除去しないようにし
    たことを特徴とする手書き数字認識における下線処理方
    法。
JP63227544A 1988-09-13 1988-09-13 手書き数字認識における下線処理方法 Expired - Lifetime JP2792655B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63227544A JP2792655B2 (ja) 1988-09-13 1988-09-13 手書き数字認識における下線処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63227544A JP2792655B2 (ja) 1988-09-13 1988-09-13 手書き数字認識における下線処理方法

Publications (2)

Publication Number Publication Date
JPH0276089A JPH0276089A (ja) 1990-03-15
JP2792655B2 true JP2792655B2 (ja) 1998-09-03

Family

ID=16862562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63227544A Expired - Lifetime JP2792655B2 (ja) 1988-09-13 1988-09-13 手書き数字認識における下線処理方法

Country Status (1)

Country Link
JP (1) JP2792655B2 (ja)

Also Published As

Publication number Publication date
JPH0276089A (ja) 1990-03-15

Similar Documents

Publication Publication Date Title
Cheung et al. An Arabic optical character recognition system using recognition-based segmentation
US5907631A (en) Document image processing method and system having function of determining body text region reading order
US5859929A (en) System for character preserving guidelines removal in optically scanned text
JPH04195692A (ja) 文書読取装置
EP0079251B1 (en) Geometric character recognition using skeleton and stroke width representation
JP2792655B2 (ja) 手書き数字認識における下線処理方法
JPH05334490A (ja) 表認識装置
JP2554187B2 (ja) 基本ライン抽出方法
JP3090070B2 (ja) 帳票識別方法及び装置
JPH01209585A (ja) 指紋照合装置
JPS615383A (ja) 文字パタ−ン分離装置
JP2615153B2 (ja) 切断分離を伴う文字認識方法
JP2792656B2 (ja) 手書き数字認識における細線化データの途切れ修復方式
JP2795222B2 (ja) 文字切り出し方法および文字切り出し装置
JPH04260980A (ja) 図形認識装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JPS63269267A (ja) 文字認識方法
JP4055974B2 (ja) パターン辞書作成方法及び装置、並びに記録媒体
JPH02230484A (ja) 文字認識装置
JPS61206089A (ja) ドツト表記文字の読取り方法
JPH03282985A (ja) 手書き数字認識における雑音処理方式
JPH05314309A (ja) 文字列方向判別方法
Jingbo et al. Segmentation of stick text based on sub connected area analysis
JPH02128292A (ja) 光学文字読取装置
JP2002230481A (ja) 光学式文字読取装置