JP2720588B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2720588B2
JP2720588B2 JP2232222A JP23222290A JP2720588B2 JP 2720588 B2 JP2720588 B2 JP 2720588B2 JP 2232222 A JP2232222 A JP 2232222A JP 23222290 A JP23222290 A JP 23222290A JP 2720588 B2 JP2720588 B2 JP 2720588B2
Authority
JP
Japan
Prior art keywords
connection processing
character
points
outline
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2232222A
Other languages
English (en)
Other versions
JPH04112284A (ja
Inventor
俊史 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP2232222A priority Critical patent/JP2720588B2/ja
Publication of JPH04112284A publication Critical patent/JPH04112284A/ja
Application granted granted Critical
Publication of JP2720588B2 publication Critical patent/JP2720588B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字認識装置に関し、特に、ボールペンで記
入されたかすれ文字など低品質な手書き文字を認識する
文字認識装置に関する。
(従来の技術) 従来、手で書かれた変形を有する文字パターンを認識
する文字認識装置では、文字パターンに対する特徴抽出
処理が行われる。特徴抽出処理によって文字パターンの
変形が吸収されかつ該文字パターンの次元数が低減さ
れ、文字パターンに対する高い認識精度が少ない計算量
で得られる。従来の文字認識装置に用いられている特徴
抽出処理として、文字輪郭部をトレースし、輪郭部の特
徴を抽出する文字輪郭特徴抽出処理がある。
従来の文字認識装置で行われている文字輪郭特徴抽出
処理を第2図に基づき説明する。
従来の文字認識装置では、手書きの文字パターンを光
学的にスキャンすることによって該文字パターンに対応
する文字画像データを生成し、該文字画像データに対し
白黒の2値レベルに2値化処理が行われる。文字パター
ンは、第2図に示すように、個々の文字に切り出され
る。本図では、数字の「5」が示され、「5」を表わす
斜線部は黒点部に対応する。
文字輪郭特徴抽出処理は、文字スキャン処理、文字輪
郭トレース処理から成る。文字スキャン処理は左上部よ
り右下方向に第2図の点線10に沿って探索し、文字黒点
部に到達した時点で文字スキャンを終了する。到達した
最初の点12をトレーススタート点Sとした時、文字輪郭
トレース処理はトレーススタート点Sから文字輪郭11に
沿って輪郭の追跡処理を行い、再びトレーススタート点
Sに戻ってきたとき輪郭の追跡処理を終了する。
(発明が解決しようとする課題) しかし、従来の文字認識装置では、文字にかすれ等が
発生した場合、かすれの有無により特徴量が大きく異な
ってしまうという欠点がある。
以下に、かすれがある文字およびかすれがない文字に
対して行なわれる文字輪郭特徴抽出処理を第3図に基づ
き説明する。第3図(a)に示す数字「6」には、かす
れが発生していないが、第3図(b)に示す数字「6」
には、かすれが発生している。また、一方の数字「6」
の輪郭点13,14,15,16,17は他方の数字「6」の輪郭点1
8,19,20,22,21にそれぞれ対応する。しかし、第3図
(a)に示す数字「6」に対する文字輪郭特徴抽出処理
では点13→14→15→16の順序でトレースされるが、第3
図(b)に示す数字「6」に対しては点18→19→20→21
→22の順序でトレース処理が行われる。その結果、かす
れがない文字の輪郭部の各点のトレースの順序とかすれ
がある文字の輪郭部の各点のトレースの順序とは互いに
異なり、かすれの有無によって文字の特徴が大きく異な
る。
本発明の目的は、かすれなどがある文字を高い精度で
認識することができる文字認識装置を提供することにあ
る。
(課題を解決するための手段) 本発明は、文字の輪郭の特徴を抽出することによって
文字を認識する文字認識装置において、前記輪郭を規定
する複数の輪郭点の内の2つの輪郭点と該2つの輪郭点
の間に位置する参照輪郭点とを設定し、該参照輪郭点か
ら前記2つの輪郭点の一方に向けて伸びる直線と前記参
照輪郭点から前記2つの輪郭点の他方に向けて伸びる直
線とがなす角度を計算する文字輪郭角度計算部と、該文
字輪郭角度計算部で計算された各角度の内から設定角度
以下の角度を検出し、該検出された角度に対応する参照
輪郭点を連結処理候補点として求める連結処理候補点検
出部と、該連結処理候補点検出部で2つ以上の連結処理
候補点が求められたとき、各連結処理候補点間のユーク
リッド距離を計算する連結処理候補点間距離計算部と、
該連結処理候補点間距離部で計算された各ユークリッド
距離の内から設定距離以下のユークリッド距離を検出
し、該検出されたユークリッド距離に対応する連結処理
候補点の対を連結処理点の対として求め、連結処理点対
の位置関係に基づき、連結処理ブロックの形状と移動方
向を算出し、該連結処理点の一方と他方とを連結する処
理を行う連結処理部と、該連結処理部において連結処理
ブロックの該連結処理部の処理が輪郭に施された文字に
対し、該輪郭に基づき文字のカテゴリーの判定処理を行
う判定部とを有することを特徴とする。
(実施例) 以下に、本発明の実施例について図面を参照しながら
説明する。
第1図は本発明の文字認識装置の一実施例を示すブロ
ック図である。スキャナ部1は、光学的にスキャンされ
た帳票イメージデータに対し2値化処理を行い、白黒2
値レベルの文字列パターンを生成する。文字切り出し部
2では、文字列パターンのピッチ情報などに基づき文字
列パターンから個々の文字を切り出す処理が行われる。
次に、文字輪郭トレース部3は、各文字パターンに対し
白点から黒点に変化している輪郭部のトレース処理を行
う。例えば、ボールペン等で記入した文字には、第3図
(b)に示すように、かすれが発生することがある。こ
の様なかすれが発生した場合、文字の輪郭の特徴を示す
値が大きく変化する。第3図(a)に示す数字「6」の
輪郭部には、点13,14,15,16を含む黒点部の外周ループ
と点17を含む黒点部の内周ループとが存在する。これに
対し、第3図(b)に示す数字「6」の輪郭部には、点
18,19,20,21,22を含む黒点部の1つの外周ループだけが
存在する。
本発明の文字認識装置では輪郭点間の角度が小さい輪
郭点が近接する領域に対になって存在するとき輪郭点間
を接続することによりかすれの補正処理を行う。文字輪
郭角度計算部4では、第4図に示すように、参照点Pi
対しδ点数だけ離れたPi−δ、Pi+δを検出し、直
線Pi Pi−δと直線Pi Pi+δとがなす角度θi=P
i−δi+δを求める。
連結処理候補点検出部5では予め設定されている角度
の閾値θtに対しθi<θtとなる点Piが連結処理候補点
として抽出される。また、i<θtとなる点が連続して存
在する場合には両端の点の中点を連結処理候補点として
代表させる。例えば、θi<θtとなる点が1つの場合、
第5図(a)に示すように、点Piが連結処理候補点27と
して抽出される。これに対し、θi<θtとなる点が連続
して存在する場合には、第5図(b)に示すように、P
i-1と点Pi+1との間の中点Piが連結処理候補点28として
代表する。
次に、連結処理候補点間距離計算部6は、連結処理候
補点間のユークリッド距離の計算を行う。第6図に示す
文字列では、連結処理候補点検出部5で抽出された閾値
θtより角度の小さい部分(図中の太線で示す部分)31,
32,33の点集合から連結処理候補点Pi(xi,yi),Pj(x
j,yj),Pk(xk,yk)がそれぞれ選択される。連結処
理候補点間距離計算部6は(1),(2),(3)式に
示す距離計算を行う。
d(Pi,Pj)= (xi−xj2+(yi−yj2 …(1) d(Pj,Pk)= (xj−xk2+(yj−yk2 …(2) d(Pk,Pi)= (xk−xi2+(yk−yi2 …(3) 次に、予め認定されている連結処理候補点間距離の閾
値dtとd(Pi,Pj),d(Pj,Pk),d(Pk,Pi)とそれぞ
れ比較される。例えば、d(Pi,Pj)<dt,d(Pj,Pk
>dt,,d(Pk,Pi)>dtとなる関係を満足するとき、閾
値dtより小さい距離値をとるPi,Pjが連結処理点として
定義される。
連結処理部7は連結処理点Pi,Pjの連結を行う。第7
図は第6図の点Pi,Pjの近傍を拡大して示す図である。
まず、連結処理点Pi,Pjに対しx座標差Δxおよびy座
標差Δyが求められる。連結処理部7は、文字原パター
ンと連結処理ブロックとの論理和をとりながら連結処理
ブロックを連結処理点間で移動させる。
連結処理ブロックの移動は下記の規則に基づき行われ
る。
Δx=0のとき Δy>0ならば連結処理ブロックは上方向に移動 Δy<0ならば連結処理ブロックは下方向に移動 Δy=0のとき Δx>0ならば連結処理ブロックは右方向に移動 Δx<0ならば連結処理ブロックは左方向に移動 |Δx|>|Δy|のとき(Δx≠0,Δy≠0) としたとき (int[ ]は切り捨ての整数化関数) Δx>0かつΔy>0ならば連結処理ブロックは右方向
にliメッシュ移動したとき上方向に1メッシュ移動 Δx>0かつΔy<0ならば連結処理ブロックは右方向
にliメッシュ移動したとき下方向に1メッシュ移動 Δx<0かつΔy>0ならば連結処理ブロックは左方向
にliメッシュ移動したとき上方向に1メッシュ移動 Δx<0かつΔy<0ならば連結処理ブロックは右方向
にliメッシュ移動したとき下方向に1メッシュ移動 |Δx|<|Δy|のとき(Δx≠0,Δy≠0) としたとき Δx>0かつΔy>0ならば連結処理ブロックは上方向
にl2メッシュ移動したとき右方向に1メッシュ移動 Δx>0かつΔy<0ならば連結処理ブロックは下方向
にl2メッシュ移動したとき右方向に1メッシュ移動 Δx<0かつΔy>0ならば連結処理ブロックは上方向
にl2メッシュ移動したとき左方向に1メッシュ移動 Δx<0かつΔy>0ならば連結処理ブロックは下方向
にl2メッシュ移動したとき左方向に1メッシュ移動 第7図の例ではPiに対するPjの相対的位置がΔx=5,
Δy=2であることより、連結処理ブロックをPiから右
方向に2メッシュ移動した後に、該連結処理ブロックを
上方向に1メッシュ移動させる処理が行われる。連結処
理ブロックがPjの4つの近傍点の内の1つの点へ到達す
るまで連結処理ブロックの移動処理は続けられる。連結
処理ブロックがPjの4近傍点に到達した時、連結処理ブ
ロックはPj点の方向に移動され、連結処理ブロックの移
動処理は終了される。
次に連結処理ブロックについての説明を行う。連結処
理ブロックの移動方向は、第9図に示すように、8方向
に量子化される。また、連結処理ブロックのパターン
は、第10図に示すように、連結処理ブロックの移動方向
に応じて選択される。第7図の例では、連結処理ブロッ
クの移動方向は1方向となり、(1)の連結処理ブロッ
クパターンが選択される。連結処理ブロックは、第8図
に示すように、上述の移動規則に基づきかつ文字パター
ンと連結処理ブロックとの論理和をとりながらPiからPj
へ経路42に沿って移動される。連結処理ブロックの移動
処理の完了後、第11図に示すように、点PiとPjとはパタ
ーン43で連結される。
次に、文字のかすれ部分に対し連結処理を行った後、
判定部8は、カテゴリーの判定処理を行い、判定結果を
出力する。
(発明の効果) 以上に説明したように、本発明によれば、かすれた文
字に存在する輪郭点間のなす角度の小さい輪郭点の対を
検出しかつ該検出された輪郭点の対を互いに連結する処
理を行うことによってかすれた文字の輪郭を補正するこ
とができ、ボールペン等で記入されたかすれ文字に対し
高い精度で認識することができる。
【図面の簡単な説明】
第1図は本発明の文字認識装置の一実施例を示すブロッ
ク図、第2図は文字輪郭トレース処理を説明するための
図、第3図はかすれの発生の有無と輪郭トレースの順序
を説明するための図、第4図は文字輪郭角度計算部にお
ける近接する輪郭点となす角度θiを説明するための
図、第5図は連結処理候補点を説明するための図、第6
図は連結処理候補点間の距離計算を説明するための図、
第7図は連結処理点を説明するための図、第8図は連結
処理ブロックの移動を示す図、第9図は連結処理ブロッ
クの移動方向を示す図、第10図は連結処理ブロックのパ
ターンを示す図、第11図は連結処理時付加されるパター
ンを説明するための図である。 4…文字輪郭角度計算部、5…連結処理候補点検出部、
6…連結処理候補点間距離計算部、7…連結処理部、8
…判定部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字の輪郭の特徴を抽出することによって
    文字を認識する文字認識装置において、 前記輪郭を規定する複数の輪郭点の内の2つの輪郭点と
    該2つの輪郭点の間に位置する参照輪郭点とを設定し、
    該参照輪郭点から前記2つの輪郭点の一方に向けて伸び
    る直線と前記参照輪郭点から前記2つの輪郭点の他方に
    向けて伸びる直線とがなす角度を計算する文字輪郭角度
    計算部と、 該文字輪郭角度計算部で計算された各角度の内から設定
    角度以下の角度を検出し、該検出された角度に対応する
    参照輪郭点を連結処理候補点として求める連結処理候補
    点検出部と、 該連結処理候補点検出部で2つ以上の連結処理候補点が
    求められたとき、各連結処理候補点間のユークリッド距
    離を計算する連結処理候補点間距離計算部と、 該連結処理候補点間距離計算部で計算された各ユークリ
    ッド距離の内から設定距離以下のユークリッド距離を検
    出し、該検出されたユークリッド距離に対応する連結処
    理候補点の対を連結処理点の対として求め、連結処理点
    対の位置関係に基づき、連結処理ブロックの形状と移動
    方向を算出し、該連結処理点の一方と他方とを連結する
    処理を行う連結処理部と、 該連結処理部において連結処理ブロックの該連結処理部
    の処理が輪郭に施された文字に対し、該輪郭に基づき文
    字のカテゴリーの判定処理を行う判定部とを有すること
    を特徴とする文字認識装置。
JP2232222A 1990-08-31 1990-08-31 文字認識装置 Expired - Lifetime JP2720588B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2232222A JP2720588B2 (ja) 1990-08-31 1990-08-31 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2232222A JP2720588B2 (ja) 1990-08-31 1990-08-31 文字認識装置

Publications (2)

Publication Number Publication Date
JPH04112284A JPH04112284A (ja) 1992-04-14
JP2720588B2 true JP2720588B2 (ja) 1998-03-04

Family

ID=16935900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2232222A Expired - Lifetime JP2720588B2 (ja) 1990-08-31 1990-08-31 文字認識装置

Country Status (1)

Country Link
JP (1) JP2720588B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69424096T2 (de) * 1993-07-16 2000-11-16 Sharp Kk Bildprozessor
JP2674475B2 (ja) * 1993-07-30 1997-11-12 日本電気株式会社 文字読取装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59116884A (ja) * 1982-12-23 1984-07-05 Nec Corp 文字ストロ−ク接続方法

Also Published As

Publication number Publication date
JPH04112284A (ja) 1992-04-14

Similar Documents

Publication Publication Date Title
EP1456811B1 (en) Reconstruction of virtual raster
CN1260676C (zh) 单据处理方法和装置
JP2720588B2 (ja) 文字認識装置
JP3006466B2 (ja) 文字入力装置
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2899383B2 (ja) 文字切出し装置
JP6244755B2 (ja) 文字補正装置及び文字補正方法とプログラム
JP3077929B2 (ja) 文字切出し方式
JP3188580B2 (ja) 文字切り出し回路、及び文字切り出し方法
JP2963508B2 (ja) 文字切出し装置
JP2976426B2 (ja) 文字認識装置
JPH0468481A (ja) 文字切出し装置
JP2863530B2 (ja) 線画像認識装置
JP2002334301A (ja) 2値イメージの特徴点抽出方法及び特徴点抽出プログラム
JP3343305B2 (ja) 文字切り出し装置、及び文字切り出し方法
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
JP3285837B2 (ja) 文字列の切り出し装置および方法
JPH1040333A (ja) 帳票認識装置
JP2959054B2 (ja) パターン認識装置における線種判別方式
JP2888885B2 (ja) 文字切出し装置
JP2677007B2 (ja) 線判別システム
JPS58165178A (ja) 文字読取り装置
JP4878057B2 (ja) 文字認識方法,プログラム及び記録媒体
JPS603078A (ja) 文字認識方法
JP3084833B2 (ja) 特徴抽出装置