JPH0981680A - 文字補完装置 - Google Patents

文字補完装置

Info

Publication number
JPH0981680A
JPH0981680A JP7231642A JP23164295A JPH0981680A JP H0981680 A JPH0981680 A JP H0981680A JP 7231642 A JP7231642 A JP 7231642A JP 23164295 A JP23164295 A JP 23164295A JP H0981680 A JPH0981680 A JP H0981680A
Authority
JP
Japan
Prior art keywords
character
frame
contact
line
complementing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7231642A
Other languages
English (en)
Inventor
Misako Suwa
美佐子 諏訪
Satoshi Naoi
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP7231642A priority Critical patent/JPH0981680A/ja
Publication of JPH0981680A publication Critical patent/JPH0981680A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 本発明は、帳票などから読み取った文字画像
が枠によって欠けた部分を補完する文字補完装置に関
し、帳票などから読み取った文字画像が枠と重なって一
部が切れてしまった場合にその切れた部分をより自然な
形に再現するように補完することを目的とする。 【解決手段】 帳票などに記載された文字を読み取る読
み取り手段と、この読み取った文字画像上で枠を除去す
る枠除去手段と、この枠の除去した文字画像のうち、枠
によってループ部分の除去された文字画像について、枠
に接触していた文字画像の線分の傾きと、枠と接してい
た部分の幅とをもとに枠によって除去された部分を補完
する補完手段とを備えるように構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票などから読み
取った文字画像が文字と同色の枠によって欠けた部分を
補完する文字補完装置に関するものである。
【0002】
【従来の技術】従来、帳票の枠内に記載された手書き文
字をOCRで2値画像として読み込み、この2値画像上
で文字のみを切り出す際に、文字枠内に記入された文字
が枠からはみ出したり、接触したりしていた場合、枠と
文字とが同色であると枠を除去して切り出した文字の一
部が欠けてしまう。この欠けることによる誤読を防ぐた
めに、一部が欠けた図5の(a)の切り出した文字を、
図5の(b)に示すように、欠けた枠の部分のみを付加
して文字の欠けを無くしていた。
【0003】
【発明が解決しようとする課題】このため、文字が枠に
かかって一部が欠けてしまった場合、その欠けた部分を
枠の太さで文字に付加し補完していたため、図5の
(b)の補完パターンから判明するように、枠の太さと
なり、不自然なパターンとなってしまうという問題があ
った。
【0004】本発明は、これらの問題を解決するため、
帳票などから読み取った文字画像が枠と重なって一部が
切れてしまった場合にその切れた部分をより自然な形に
再現するように補完することを目的としている。
【0005】
【課題を解決するための手段】図1および図2を参照し
て課題を解決するための手段を説明する。図1および図
2において、読取部3は、帳票などから文字画像を読み
取るものである。
【0006】文字切出部3は、文字画像上で文字を切り
出すものであって、枠除去部11、補完部16などから
構成されるものである。枠除去部11は、文字画像上で
枠を除去するものである。
【0007】補完部16は、文字画像上で枠の除去によ
って欠けた文字画像についてループ部分を補完するもの
である。次に、動作を説明する。
【0008】読取部3が帳票などに記載された文字を読
み取り、枠除去部11が読み取った文字画像上で枠を除
去し、補完部16が枠の除去した文字のうち、枠に重な
っていたためにループ部分の一部が除去された文字画像
について、枠に接触していた線分の傾きと、枠と接して
いた部分の幅とをもとに、枠に重なっていたために除去
された文字線部分を補完する。
【0009】この際、補完する文字線幅は、文字画像が
枠に接触していた文字線分の枠接触部付近の内側の輪郭
点列を直線近似したときの接触箇所付近の輪郭点列を直
線近似したときの直線の傾きと、接触部分の幅で決定す
るようにしている。ただし、文字線幅の計算値が枠線幅
を超えた場合は、補完線幅として枠線幅を用いる。
【0010】また、補完は、文字画像が枠に接触してい
た文字線分の内側の輪郭点上の接触点同士を直線で連結
し、かつ外側の輪郭点上の接触点から前述の直線に平行
な線分を引いていき、補完文字線分の幅が、求めた線幅
あるいは枠線幅と等しくなるまで延長し、それらの終点
同士を直線で連結し、文字の欠けたループ部分を補完す
るようにしている。
【0011】従って、帳票などから読み取った文字画像
が枠と重なって一部が切れてしまった場合にその切れた
部分をより自然な形に再現するように補完することが可
能となる。
【0012】
【発明の実施の形態】次に、図1から図4を用いて本発
明の実施の形態および動作を順次詳細に説明する。
【0013】図1は、本発明の全体ブロック図を示す。
図1において、OCR1は、帳票を読み取って認識結果
を出力する装置であって、2ないし8から構成されるも
のである。
【0014】読取部2は、帳票上に書かれた文字を読み
取って文字画像を生成するものであって、例えばスキャ
ナーである。文字切出部3は、読取部2によって読み取
った文字画像上で文字を既知の方法によって切り出すも
のであって、所定の枠毎あるいは文字のサイズの平均を
求めてその平均の枠毎に文字を切り出すものである。
【0015】正規化部4は、文字の大きさや文字の変形
を正規化して統一するものである。特徴抽出部5は、文
字画像の特徴を抽出するものであって、例えば輪郭線、
分割してその方向特徴などを抽出して続く照合を行うた
めの情報を抽出するものである。
【0016】照合部6は、特徴抽出部5によって抽出さ
れた特徴と、辞書部7のパターンとを照合して距離が最
も小さい文字と認識するものである。辞書部7は、文字
の特徴を例えばパターンとして予め登録したものであ
る。
【0017】後処理部8は、照合部6によって照合した
照合結果について、その照合結果の適否を判断、例えば
帳票から読取った枠が住所の判明しているときに図示外
の住所辞書を参照して登録されている住所か判別したり
などするものである。そして、その結果を認識結果とし
て出力する。
【0018】図2は、本発明の要部ブロック部を示す。
これは、図1の文字切出部3の詳細なブロック図であ
る。図2において、枠抽出部10は、読取部2によって
読取った帳票画像から枠を抽出するものである。枠は、
例えば公知の投影グラフの頻度の高いもの、あるいはラ
ンレングスの長いものを枠として抽出する。
【0019】枠除去部11は、枠抽出部10によって抽
出された枠を帳票画像から除去した文字画像を生成する
ものである。1文字切出部12は、枠の除去した文字画
像から1文字毎に切り出すものであって、例えば帳票の
予め判明している枠サイズで1文字毎に切り出したり、
文字の間隔の平均を求めてその平均のサイズで1文字毎
に切り出したりするものである。
【0020】文字線補完部13は、枠の外に文字画像が
はみ出している場合に、当該枠の部分で切断された文字
画像を枠の内と外とを結んで補完するものである。ルー
プ形状判定部14は、枠内にループ状の文字の部分が入
っていることを判定するものであって、後述する図4の
(c−1)に示すように文字のループ状の一部が欠けた
ものを判定(判定の方法は、例えば文字と枠とが接触す
る部分が2箇所あるときにループ部分が枠で欠けたと判
定)するものである。
【0021】ループ状形状補完部15は、文字が枠で欠
けた部分をループ状の形状(例えば台形)で補完するも
のである(図3を用いて後述する)。この補完後の文字
画像は、切出文字画像として出力し、図1の正規化部4
の入力となる。
【0022】補完部16は、文字線補完部13、ループ
形状判定部14、およびループ形状補完部15から構成
されるものである。次に、図3のフローチャートに示す
順序に従い、文字が枠で欠けた場合の補完について詳細
に説明する。
【0023】図3は、本発明の要部動作説明フローチャ
ートを示す。図3において、S21は、ループ形状部の
内側の輪郭線の追跡を行う。これは、例えば図4の(c
−1)のループ部分が枠で欠けた文字画像について、当
該文字画像の欠けたループ部分の内側の輪郭線の追跡を
行う(数字の“8”の下半分のループ部分の欠けた内側
の輪郭線を追跡する)。
【0024】S22は、枠線との接触部分の幅w1、w
2の導出を行う。これは、図4の(a)に示すように、
図4の(c−1)の原画像の枠によって欠けた下半分の
内側の輪郭線上の枠接触点i1、i2と、外側の輪郭線
上の接触点o1、o2間の距離を求めることにより、幅
w1、w2の導出を行う。
【0025】S23は、内側の接触点i1、i2の付近
の輪郭点数画素から文字線の近似直線l1、l2及び、
それらと垂線とのなす角度θ1、θ2を求める。これ
は、図4の(a)に示すように、S22で線幅w1、w
2を求めた後、この線幅を求めた内側の接触点i1、i
2を通り、かつ文字画像に接触する接線である近似直線
l1、l2をそれぞれ求めると共に、これら求めた近似
直線l1、l2と、点線で示した垂線との角度θ1、θ
2をそれぞれ求める。
【0026】S24は、文字線幅s1、s2の計算を行
う。これは、図示の下式によって求める。 s1=w1×cosθ1 s2=w2×cosθ2 S25は、平均の文字線幅sの計算を行う。これは、図
示の下式によって平均の文字線幅sを求める。
【0027】s=(s1+s2)/2 S26は、内側の接触点i1、i2を直線で結ぶ。S2
7は、o1、o2から近似直線l1、l2に平行に直線
l1’、l2’を引く。
【0028】S28は、補完文字線幅がsとなる点e
1、e2でl1’、l2’を止める。これらS22から
S28により、図4の(b)に示す、黒枠でぬりつぶす
前の外側の台形の線分が求められたこととなる。
【0029】S29は、台形o1e1o2e2の内部を
黒画素でうめる。以上のS21からS29の手順によっ
て、図4の(c−1)の枠で欠けた文字画像が、図4の
(b)に示す黒で塗りつぶした部分を補完し、結果とし
て図4の(c−3)に示すように自然な形で補完される
こととなる。
【0030】図4は、本発明の具体例説明図を示す。図
4の(a)は、文字線幅の決定の説明図を示す。これ
は、図4の(c−1)の枠でループ状の一部分が欠けた
文字画像の欠けた部分を拡大して判り易く模式的に表示
したものである。ここで、 ・i1、i2は図4の(c−1)の枠で欠けたループ部
分の輪郭線の内側を追跡し、枠で欠けたとして見つけた
点である。
【0031】・w1、w2は、欠けた文字画像の枠に接
触した部分の長さである。 ・f1、f2は、i1、i2を通り、文字画像のループ
部分の内側に接する近似直線である。
【0032】・θ1、θ2は、点線で表わした垂線とf
1、f2とのなす角度(傾き)である。 ・s1、s2は、線幅である。
【0033】図4の(b)は、ループ形状部の補完の説
明図を示す。これは、既述した図3のS21からS29
の手順によってループ形状の補完したものであって、図
4の(a)の枠で欠けた文字画像について、o1、o2
からそれぞれl1、l2に平行な画像l1’、l2’を
引き、その延長度合いは、台形o1e1e2o2の高さ
が線幅s1とs2の平均(s=(s1+s2)/2)と
なるように補完したものである。
【0034】図4の(c)は、画像例を示す。図4の
(c−1)は、枠で欠けた原画像例を示す。図4の(c
−2)は、従来の補完画像例を示す。この従来の補完画
像は、枠線の部分をそのまま原画像に付加したので、図
示のように不自然な形に補完されてしまっており、この
後に続く処理で誤認識や誤読取りの原因となってしまう
問題が発生する。
【0035】図4の(c−3)は、本発明の補完画像例
を示す。この本発明の補完画像は、枠で欠けた部分よ
り、自然な形に補完されているので、この後に続く処理
で正確に認識や正確に読み取ったりすることが可能とな
る。
【0036】
【発明の効果】以上説明したように、本発明によれば、
帳票などに記載された文字を読み取って枠を除去した
ときに、枠によってループ部分の除去された文字画像に
ついて、枠に接触していた文字画像の線分の傾きと、枠
と接していた部分の幅とをもとに枠によって除去された
部分を補完する構成を採用しているため、読み取った文
字画像が枠と重なって一部が切れてしまった場合にその
切れた部分をより自然な形に再現するように補完するこ
とができる。これにより、枠を除去した時に切れてしま
った文字ループ部分が自然な形で補完され、正確に文字
認識したり、読み取ったりすることが可能となる。
【図面の簡単な説明】
【図1】本発明の全体ブロック図である。
【図2】本発明の要部ブロック図である。
【図3】本発明の要部動作説明フローチャートである。
【図4】本発明の具体例説明図である。
【図5】従来技術の説明図である。
【符号の説明】
1:OCR 2:読取部 3:文字切出部 4:正規化部 5:特徴抽出部 6:照合部 7:辞書部 8:後処理部 10:枠抽出部 11:枠除去部 12:1文字切出部 13:文字線補完部 14:ループ形状判定部 15:ループ形状補完部 16:補完部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】帳票などから読み取った文字画像が文字と
    同色の枠によって欠けた部分を補完する文字補完装置に
    おいて、 帳票などに記載された文字を読み取る読み取り手段と、 この読み取った文字画像上で枠を除去する枠除去手段
    と、 この枠の除去した文字画像のうち、上記枠によってルー
    プ部分の一部が除去された文字画像について、枠に接触
    していた文字画像の線分の傾きと、枠と接していた部分
    の幅とをもとに上記枠によって除去された部分を補完す
    る補完手段とを備えたことを特徴とする文字補完装置。
  2. 【請求項2】上記補完する文字線幅は、文字画像が枠に
    接触していた文字線分の接触箇所付近の内側の輪郭点列
    を直線近似したときの直線の傾きと、接触部の幅とを決
    定することを特徴とする請求項1記載の文字補完装置。
  3. 【請求項3】上記補完は、文字画像が枠に接触していた
    文字線分の内側の輪郭点上の接触点同士を直線で連結
    し、かつ外側の輪郭点上の接触点から請求項2記載の直
    線に平行な線分を引いていき、補完文字線の幅が請求項
    2記載の線幅あるいは枠線幅と等しくなるまで延長して
    終点同士を連結し、文字の欠けたループ部分を補完する
    ことを特徴とする文字補完装置。
JP7231642A 1995-09-08 1995-09-08 文字補完装置 Pending JPH0981680A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7231642A JPH0981680A (ja) 1995-09-08 1995-09-08 文字補完装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7231642A JPH0981680A (ja) 1995-09-08 1995-09-08 文字補完装置

Publications (1)

Publication Number Publication Date
JPH0981680A true JPH0981680A (ja) 1997-03-28

Family

ID=16926703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7231642A Pending JPH0981680A (ja) 1995-09-08 1995-09-08 文字補完装置

Country Status (1)

Country Link
JP (1) JPH0981680A (ja)

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3170299B2 (ja) 画像読取処理装置
JP2823882B2 (ja) 線画像ベクトル化方法
JPH0981680A (ja) 文字補完装置
JP3130869B2 (ja) 指紋画像処理装置、指紋画像処理方法、および記録媒体
JPH02293989A (ja) 文字認識装置
JP2868134B2 (ja) 画像処理方法及び装置
JPH07200735A (ja) 図形認識装置
JP2002056356A (ja) 文字認識装置、文字認識方法および記録媒体
JP3466899B2 (ja) 文字認識装置及び方法並びにプログラム記憶媒体
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP3339239B2 (ja) 画像データの芯線化処理方法
JP2786044B2 (ja) 光学的文字読み取り装置
Schneider Combining morphological and histogram based text line segmentation in the OCR Context
JP2963508B2 (ja) 文字切出し装置
JP3848792B2 (ja) 文字列認識方法及び記録媒体
JP2683026B2 (ja) 線図形ベクトル化装置
JPS5958589A (ja) 線切れデ−タのつなぎ修正方式
JPS58201183A (ja) 手書き文字認識における特徴抽出方法
JP2002334301A (ja) 2値イメージの特徴点抽出方法及び特徴点抽出プログラム
JPH09114925A (ja) 光学式文字読取装置
JP2867650B2 (ja) シンボル候補領域の検出方法
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JPH04329492A (ja) 文字切り出し方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010213