JPH04112284A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH04112284A
JPH04112284A JP2232222A JP23222290A JPH04112284A JP H04112284 A JPH04112284 A JP H04112284A JP 2232222 A JP2232222 A JP 2232222A JP 23222290 A JP23222290 A JP 23222290A JP H04112284 A JPH04112284 A JP H04112284A
Authority
JP
Japan
Prior art keywords
points
character
contour
connection processing
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2232222A
Other languages
English (en)
Other versions
JP2720588B2 (ja
Inventor
Toshifumi Yamauchi
山内 俊史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2232222A priority Critical patent/JP2720588B2/ja
Publication of JPH04112284A publication Critical patent/JPH04112284A/ja
Application granted granted Critical
Publication of JP2720588B2 publication Critical patent/JP2720588B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字認識装置に関し、特に、ボールペンで記入
させれなかすれ文字など低品質な手書き文字を認識する
文字認識装置に関する。
(従来の技m) 従来、手で書かれた変形を有する文字パターンを認識す
る文字認識装置では、文字パターンに対する特徴抽出・
処理が行われる。特徴抽出処理(こよって文字パターン
の変形が吸収されかつ該文字パターンの次元数が低減さ
れ、文字パターンに対する高い認識精度が少ない計算量
で得られる。従来の文字認識装置に用いられている特徴
抽出処理として、文字輪郭部をトレースし、輪郭部の特
徴を抽出する文字輪郭特徴抽出処理がある。
従来の文字認識装置で行われている文字輪郭特徴抽出処
理を第2図に基づき説明する。
従来の文字認識装置では、手書きの文字パターンを光学
的にスキャンすることによって該文字パターンに対応す
る文字画像データを生成し、該文字画像データに対し白
黒の2値レベルに2値化処理が行われる。文字パターン
は、第2図に示すように、個々の文字に切り出される0
本図では、数字の「5」が示され、「5」を表わす斜線
部は黒点部に対応する。
文字輪郭特徴抽出処理は、文字スキャン処理、文字輪郭
トレース処理から成る0文字スキャン処理は左上部より
右下方向に第2図の点線10に沿って探索し、文字黒点
部に到達した時点で文字スキャンを終了する。到達した
最初の点12をトレーススタート点Sとした時、文字輪
郭トレース処理はトレーススタート点Sから文字輪郭1
1に沿って輪郭の追跡処理を行い、再びトレーススター
ト点Sに戻ってきたとき輪郭の追跡処理を終了する。
(発明が解決しようとする課題) しかし、従来の文字認識装置では、文字にかすれ等が発
生した場合、かすれの有無により特徴量が大きく異なっ
てしまうという欠点がある。
以下に、かすれがある文字およびかすれがない文字に対
して行なわれる文字輪郭特徴抽出処理を第3図に基づき
説明する。第3図(a)に示す数字「6」には、かすれ
が発生していないが、第3図(b)に示す数字「6」に
は、かすれが発生している。また、一方の数字「6」の
輪郭点1314 15.16.17は他方の数字「6」
の輪郭点18,19,20,22.21にそれぞれ対応
する。しかし、第3図(a)に示す数字「6」に対する
文字輪郭特徴抽出処理では点 13→14→15→16の順序でトレースされるが、第
3図(b)に示す数字「6」に対しては点18→19→
20→21→22の順序でトレース処理が行われる。そ
の結果、かすれがない文字の輪郭部の各点のトレースの
順序とかすれがある文字の輪郭部の各点のトレースの順
序とは互いに異なり、かすれの有無によって文字の特徴
が大きく異なる。
本発明の目的は、かすれなどがある文字を高い精度で認
識することができる文字認識装置を提供することにある
(課題を解決するための手段) 本発明は、文字の輪郭の特徴を抽出することによって文
字を認識する文字認識装置において、前記輪郭を規定す
る複数の輪郭点の内の2つの輪郭点と該2つの輪郭点の
間に位置する参照輪郭点とを設定し、該参照輪郭点から
前記2つの輪郭点の一方に向けて伸びる直線と前記参照
輪郭点から前記2つの輪郭点の他方に向けて伸びる直線
とがなす角度を計算する文字輪郭角度計算部と、該文字
輪郭角度計算部で計算された各角度の内のから設定角度
以下の角度を検出し、該検出された角度に対応する参照
輪郭点を連結処理候補点として求める連結処理候補点検
出部と、該連結処理候補点検出部で2つ以上の連結処理
候補点が求められたとき、各連結処理候補点間のユーク
リッド距離を計算する連結処理候補点間距離計算部と、
該連結処理候補点間距離部で計算された各ユークリッド
距離の内から設定距離以上のユークリッド距離を検出し
、該検出されたユークリッド距離に対応する連結処理候
補点の対を連結処理点の対として求め、該連結処理点の
一方と他方とを連結する処理を行う連結処理部と、該連
結処理部の処理が輪郭に施された文字に対し、該輪郭に
基づき文字のカテゴリーの判定処理を行う判定部とを有
することを特徴とする。
(実施例) 以下に、本発明の実施例について図面を参照上ながら説
明する。
第1図は本発明の文字認識装置の一実施例を示すブロッ
ク図である。スキャナ部1は、光学的にスキャンされた
帳票イメージデータに対し2値化処理を行い、白黒2値
レベルの文字列パターンを生成する0文字切り出し部2
では、文字列パターンのピッチ情報などに基づき文字列
パターンから個々の文字を切り出す処理が行われる。次
に、文字輪郭トレース部3は、各文字パターンに対し白
点から黒点に変化している輪郭部のトレース処理を行う
0例えば、ボールペン等で記入した文字には、第3図(
b)に示すように、かすれが発生することがある。この
様なかすれが発生した場合、文字の輪郭の特徴を示す値
が大きく変化する。第3図(a)に示す数字「6」の輪
郭部には、点13.14.15.16を含む黒点部の外
周ループと点17を含む黒点部の内周ループとが存在す
る。
これに対し、第3図(b)に示す数字「6」の輪郭部に
は、点18,19.20,21.22を含む黒点部の1
つの外周ループだけが存在する。
本発明の文字認識装置では輪郭点間の角度が小さい輪郭
点が近接する領域に対になって存在するとき輪郭点間を
接続することによりかすれの補正処理を行う。文字輪郭
角度計算部4では、第4図に示すように、参照点P1に
対し6点数だけ離れたP + −a−P I+aを検出
し、直線P、P、−,と直線P+P++#とがなす角度
θ+=PI−zP+P、oを求める。
連結処理候補点検出部5では予め認定されている角度の
閾値θ、に対しθ、くθ、となる点P。
が連結処理候補点として抽出される。また、θ、くθ、
となる点が連続して存在する場合には両端の点の中点を
連結処理候補点として代表させる0例えば、θ、〈θ、
となる点か1つの場合、第5図<a>に示すように、点
P、が連結処理候補点27として抽出される。これに対
し、θ、くθ、となる点が連続して存在する場合には、
第5図(b)に示すように、点p +−+ と点P I
l+との間の中点P1が連結処理候補点28として代表
する。
次に、連結処理候補点間距離計算部6は、連結処理候補
点間のユークリッド距離の計算を行う。
第6図に示す文字例では、連結処理候補点検出部5で抽
出された閾値θ、より角度の小さい部分く図中の太線で
示す部分>31.32.33の点集合から連結処理候補
点Pr  (x+ 、 yl ) 。
PJ  (XJ 、 3/J )、 Pm (xm 、
 3’k)がそれぞれ選択される。連結処理候補点間距
離計算部6は(1)、(2)、(3)式に示す距離計算
を行う。
dP+、PJ = XI  XJ  2+(y+  yj)”−(1)d 
 PJ 、Pk = XJ  Xm  ” + <VJ−yh ) 2− (
2)d  Pk、PL  = Xk−XI  ”+(37に一:yl)”−(3)次に
、予め認定されている連結処理候補点間距離の閾値dt
とd (P+ 、 PJ ) 、 d (PJPk )
、d (P、、P、)とそれぞれ比較される。
例えば、d (P+ 、PJ )<dt、d(PaP、
)>dt、d (Pk 、PL >>dtとなる関係を
満足するとき、閾値dtより小さい距離値をとるP、、
P、が連結処理点として定義される。
連結処理部7は連結処理点PI、PJの連結を行う。第
7図は第6図の点P、、P、の近傍を拡大して示す図で
ある。まず、連結処理点P。
PJに対しxli標差ΔXおよびyMjh標差Δyが求
められる。連結処理部7は、文字原パターンと連結処理
ブロックとの論理和をとりながら連結処理ブロックを連
結処理点間で移動させる。
連結処理ブロックの移動は下記の規則に基づき行われる
Δx=Oのとき Δy>Oならば連結処理ブロックは上方向に移動Δy 
< Oならば連結処理ブロックは下方向に移動Δy=o
のとき Δx>Oならば連結処理ブロックは右方向に移動Δx<
Oならば連結処理ブロックは左方向に移動Δx1〉1Δ
y1のとき(ΔX≠0.Δy≠0)(int[]は切り
捨ての整数化関数)Δx>OかつΔy>Oならば連結処
理ブロックは右方向に1□メツシユ移動したとき上方向
に1メツシユ移動 Δx>OかつΔy<Oならば連結処理ブロックは右方向
に1.メツシュ移動したとき下方向に1メツシユ移動 Δx<OかつΔy>oならば連結処理ブロックは左方向
に1.メツシュ移動したとき上方向に1メツシユ移動 Δx<OかつΔy<oならば連結処理プロ・ンクは左方
向に11メツシユ移動したとき下方向に1メツシユ移動 ΔX1〈1Δy1のとき(ΔX≠0.Δy≠0)Δx>
OかつΔy>Oならば連結処理プロ・ンクは上方向に1
□メツシユ移動したとき右方向に1メツシユ移動 Δx>OかつΔyくOならば連結処理ブロックは下方向
に(2メツシユ移動しなとき右方向に1メツシユ移動 Δx<OかつΔy>oならば連結処理ブロックは上方向
に12メツシユ移動したとき左方向に1メツシユ移動 Δx<OかつΔy>oならば連結処理ブロックは下方向
に1□メツシユ移動したとき左方向に1メツシユ移動 第7図の例ではP+に対するP、の相対的位置かΔx=
5.Δy=2であることより、連結処理ブロックをP、
から右方向に2メツシユ移動した後に、該連結処理ブロ
ックを上方向に1メツシユ移動させる処理か行われる。
連結処理ブロックがP、の4つの近傍点の内の1つの点
へ到達するまで連結処理ブロックの移動処理は続けられ
る。連結処理ブロックかP、の4近傍点に到達した時、
連結処理ブロックはPJ点の方向に移動され、連結処理
ブロックの移動処理は終了される。
次に連結処理ブロックについての説明を行う。
連結処理ブロックの移動方向は、第9図に示すように、
8方向に量子化される。また、連結処理プロッタのパタ
ーンは、第10図に示すように、連結処理ブロックの移
動方向に応じて選択される。
第7図の例では、連結処理ブロックの移動方向は1方向
となり、(1)の連結処理ブロックパターンが選択され
る。連結処理ブロックは、第8図に示すように、上述の
移動規則に基づきかつ文字パターンと連結処理ブロック
との論理和をとりなからP、からP、へ経路42に沿っ
て移゛動される。
連結処理ブロックの移動処理の完了後、第11図に示す
ように、点Plと点P、とはパターン43で連結される
次に、文字のかすれ部分に対し連結処理を行った後、判
定部8は、カテゴリーの判定処理を行い、判定結果を出
力する。
(発明の効果) 以上に説明したように、本発明によれば、かすれた文字
に存在する輪郭点間のなす角度の小さい輪郭点の対を検
出しかつ該検出された輪郭点の対を互いに連結する処理
を行うことによってかすれた文字の輪郭を補正すること
ができ、ボールペン等で記入されたかすれ文字に対し高
い精度で認識することができる。
【図面の簡単な説明】
第1図は本発明の文字認識装置の一実施例を示すブロッ
ク図、第2図は文字輪郭トレース処理を説明するための
図、第3図はかすれの発生の有無と輪郭トレースの順序
を説明するための図、第4図は文字輪郭角度計算部にお
ける近接する輪郭点となす角度θ1を説明するための図
、第5図は連結処理候補点を説明するための図、第6図
は連結処理候補点間の距離計算を説明するための図、第
7図は連結処理点を説明するための図、第8図は連結処
理ブロックの移動を示す図、第9図は連結処理ブロック
の移動方向を示す図、第10図は連結処理ブロックのパ
ターンを示す図、第11図は連結処理待付加されるパタ
ーンを説明するな−めの図である。 4・・・文字輪郭角度計算部、5・・・連結処理候補点
検出部、 6・・・連結処理候補点間距離計算部、7・・・ 連結処理部、 8・・・判定部。

Claims (1)

    【特許請求の範囲】
  1. 文字の輪郭の特徴を抽出することによって文字を認識す
    る文字認識装置において、前記輪郭を規定する複数の輪
    郭点の内の2つの輪郭点と該2つの輪郭点の間に位置す
    る参照輪郭点とを設定し、該参照輪郭点から前記2つの
    輪郭点の一方に向けて伸びる直線と前記参照輪郭点から
    前記2つの輪郭点の他方に向けて伸びる直線とがなす角
    度を計算する文字輪郭角度計算部と、該文字輪郭角度計
    算部で計算された各角度の内のから認定角度以下の角度
    を検出し、該検出された角度に対応する参照輪郭点を連
    結処理候補点として求める連結処理候補点検出部と、該
    連結処理候補点検出部で2つ以上の連結処理候補点が求
    められたとき、各連結処理候補点間のユークリッド距離
    を計算する連結処理候補点間距離計算部と、該連結処理
    候補点間距離部で計算された各ユークリッド距離の内か
    ら設定距離以上のユークリッド距離を検出し、該検出さ
    れたユークリッド距離に対応する連結処理候補点の対を
    連結処理点の対として求め、該連結処理点の一方と他方
    とを連結する処理を行う連結処理部と、該連結処理部の
    処理が輪郭に施された文字に対し、該輪郭に基づき文字
    のカテゴリーの判定処理を行う判定部とを有することを
    特徴とする文字認識装置。
JP2232222A 1990-08-31 1990-08-31 文字認識装置 Expired - Lifetime JP2720588B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2232222A JP2720588B2 (ja) 1990-08-31 1990-08-31 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2232222A JP2720588B2 (ja) 1990-08-31 1990-08-31 文字認識装置

Publications (2)

Publication Number Publication Date
JPH04112284A true JPH04112284A (ja) 1992-04-14
JP2720588B2 JP2720588B2 (ja) 1998-03-04

Family

ID=16935900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2232222A Expired - Lifetime JP2720588B2 (ja) 1990-08-31 1990-08-31 文字認識装置

Country Status (1)

Country Link
JP (1) JP2720588B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0744649A (ja) * 1993-07-30 1995-02-14 Nec Corp 文字読取装置
US5896470A (en) * 1993-07-16 1999-04-20 Sharp Kabushiki Kaisha Image processor providing improved readability of characters

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59116884A (ja) * 1982-12-23 1984-07-05 Nec Corp 文字ストロ−ク接続方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59116884A (ja) * 1982-12-23 1984-07-05 Nec Corp 文字ストロ−ク接続方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5896470A (en) * 1993-07-16 1999-04-20 Sharp Kabushiki Kaisha Image processor providing improved readability of characters
JPH0744649A (ja) * 1993-07-30 1995-02-14 Nec Corp 文字読取装置

Also Published As

Publication number Publication date
JP2720588B2 (ja) 1998-03-04

Similar Documents

Publication Publication Date Title
JP3006466B2 (ja) 文字入力装置
JPH04112284A (ja) 文字認識装置
JP4543675B2 (ja) 文字・図形の認識方法
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2871590B2 (ja) 画像抽出方式
Mizukami et al. A handwritten character recognition system using hierarchical displacement extraction algorithm
Chang et al. Skeletonization of binary digital patterns using a fast Euclidean distance transformation
Abuhaiba et al. Straight line approximation and 1D representation of off-line handwritten text
JP2976426B2 (ja) 文字認識装置
JP2863530B2 (ja) 線画像認識装置
JP2899383B2 (ja) 文字切出し装置
JP3077929B2 (ja) 文字切出し方式
JP6244755B2 (ja) 文字補正装置及び文字補正方法とプログラム
JP2885476B2 (ja) 画像処理方法および装置
Abuhaiba et al. Processing of text documents: straight line approximation and lost loop recovery
JP3446794B2 (ja) 文字認識における多角形近似法および文字認識装置
Lau et al. EDT based tracing maximum thinning algorithm on grey scale images
JPH1040333A (ja) 帳票認識装置
JPH0632080B2 (ja) 文字認識方式
JPH096909A (ja) 文字読取装置
JP2962984B2 (ja) 文字認識装置
CN117252767A (zh) 文本图片矫正方法及装置
JP2001060250A (ja) 文字認識方法および装置
JP2888885B2 (ja) 文字切出し装置
JPH0632081B2 (ja) 文字認識方式