JP4180148B2 - 文字・枠線分離方法 - Google Patents

文字・枠線分離方法 Download PDF

Info

Publication number
JP4180148B2
JP4180148B2 JP13257798A JP13257798A JP4180148B2 JP 4180148 B2 JP4180148 B2 JP 4180148B2 JP 13257798 A JP13257798 A JP 13257798A JP 13257798 A JP13257798 A JP 13257798A JP 4180148 B2 JP4180148 B2 JP 4180148B2
Authority
JP
Japan
Prior art keywords
character
frame line
density
border
pixel point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13257798A
Other languages
English (en)
Other versions
JPH11312217A (ja
Inventor
千尋 植木
好幸 松山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP13257798A priority Critical patent/JP4180148B2/ja
Publication of JPH11312217A publication Critical patent/JPH11312217A/ja
Application granted granted Critical
Publication of JP4180148B2 publication Critical patent/JP4180148B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字が文字枠に重なって記載されている場合でも光学文字読取装置(OCR)で文字の読み取りができるように、文字と枠線とを分離する方法に関し、特に、文字と枠線とがどのような形態で重なっていても、的確に分離できるようにするものである。
【0002】
【従来の技術】
文字パターンを光学的に読み取るOCRは、葉書に記入された郵便番号の読み取りなどを始めとして、これまで、多くの分野で利用されている。このOCRでは、対象画像を2値化し、得られた画像のパターンと標準文字パターンとのマッチングを取るなどの方法で、文字を判別している。文字読み取りの手法については、各種の改良が重ねられ、印刷文字だけで無く、手書き文字の読み取りも、殆ど支障無く行なわれている。
【0003】
しかし、帳票に記入された文字の読み取りでは、帳票の枠線に文字が接触したり、交差したり、重なったりすると、誤読する場合がある。
【0004】
文字が文字枠に接触、交差、重複している場合には、文字と枠線とを分離する文字・枠線分離処理が行なわれ、分離した文字に対して読み取りが行なわれる。この文字・枠線分離方法としては、例えば、図6に示すように、文字枠と文字との交点(コーナー点)を検出し、コーナー点の対応関係から文字と枠との連結領域に切れ目を入れ、文字を枠線から切り離す方法などが行なわれている。
【0005】
【発明が解決しようとする課題】
しかし、こうした方法では、図7(a)に示すように、枠と文字とが鋭角的に交差する場合に、コーナー点を安定的に求めることが難しく、また、図7(b)のように、文字と枠線とが並行して重なる場合には、文字を枠線から分離することが出来なくなる。
【0006】
本発明は、こうした従来の問題点を解決するものであり、文字が枠線とどのような形態で重なるときでも、文字を枠線から分離することができる文字・枠線分離方法を提供することを目的としている。
【0007】
【課題を解決するための手段】
そこで、本発明では、文字と枠線とが重なる部分を多値階調で表示し、この画像の濃度勾配が大きい画素点を追跡して文字の輪郭線を求めている。
【0008】
そのため、文字が枠線に、どのような形で接触、交差または重複していても、文字部分を枠線から正しく分離することができる。
【0009】
【発明の実施の形態】
本発明の請求項1に記載の発明は、枠線に接触、交差または重複する文字部分を枠線から分離する文字・枠線分離方法において、文字と枠線とが重なる部分を含む領域の画像を多値階調で解析し、この画像の各画素点の中から、隣接するX方向の画素の濃度差分の絶対値と隣接するY方向の画素の濃度差分の絶対値とを加算した濃度勾配を用い、前記濃度勾配が大きい画素点を追跡して文字の輪郭線を求めるようにしたものであり、文字と枠線とがどのような形態で重なっていても分離することができる。
【0010】
請求項2に記載の発明は、画素点において、前記X方向の画素の濃度差分と前記Y方向の画素の濃度差分との比である勾配方向を求め、前記勾配方向の法線方向を求めて、前記法線方向に存在する次の濃度勾配の大きい画素点を予測するようにしたものであり、濃度勾配が大きい画素点を容易に追跡することができる。
【0011】
請求項3に記載の発明は、文字と枠線との交差点を求め、この交差点から、画素点の追跡を開始するようにしたものであり、画素点の追跡が容易になる。
【0013】
以下、本発明の実施の形態について、図面を用いて説明する。
【0014】
本発明の文字・枠線分離方法では、文字や枠線の色の濃度変化に着目して文字と枠線とを分離する。
【0015】
枠線の色の濃さは一様に見えても、拡大して見れば、図5に示すように、線の両側で徐々に濃度が変化している。図5(a)は、枠線を直交する線に沿って切断し、その切断面から見た枠線の色の濃さを表しており、また、図5(b)は、枠線を上から見たときの枠線の濃度変化を丸印と矢印とで示している。矢印は丸印の位置における濃度変化の大きさと方向とを表している。
【0016】
また、図5(c)は、枠線11と文字12のように、2つの色が重なったときの濃度変化を、図5(a)と同様の切り口から示しており、図5(d)は、2つの色が帯状に重なっているときの濃度変化を平面図で示している。
【0017】
このように、2つの色が重なっているときでも、濃度変化が大きい点を繋ぎ合わせることによって、重なった色の輪郭線を求めることができる。
【0018】
この濃度変化の求め方を図4に示している。
【0019】
点(x,y)の画素の濃度をP(x,y)とし、その周囲の画素点(x,y+1)、(x,y−1)、(x+1,y)及び(x−1,y)の濃度を、それぞれP(x,y+1)、P(x,y−1)、P(x+1,y)及びP(x−1,y)とする。このとき画素点(x,y)における濃度差分は次式で与えられる。
濃度差分X=P(x+1,y)−P(x−1,y) (数1)
濃度差分Y=P(x,y+1)−P(x,y−1) (数2)
【0020】
また、画素点(x,y)において、濃度変化の大きさを表す濃度勾配、濃度変化の方向を表す勾配方向、及び、勾配方向に直交する法線方向は、それぞれ、
濃度勾配=|濃度差分X|+|濃度差分Y| (数3)
勾配方向= Y/X (X≠0) (数4)
法線方向=−X/Y (Y≠0) (数5)
で与えられる。
【0021】
図1は、濃度変化に着目して文字と枠線とを分離する方法の手順を示している。図2を参照しながら、この手順について説明する。
【0022】
ステップ1:対象画像を2値で画像化し、この2値画像を用いて、文字12と枠線11との交差点(黒丸)を求める。枠線11は一般的に直線で構成されているから、その直線を辿ることにより、文字との交差点を求めることができる。交差点を求めた後、各交差点を含むように交差領域13を抽出する。
【0023】
ステップ2:交差領域13の画像に対して、例えば、階調数256の多値画像の抽出を行なう。
ステップ3:交差領域13の各画素点の濃度勾配を(数3)によって求める。
【0024】
ステップ4:交差点から順次、濃度勾配が大きい画素点を追跡することにより、文字12のエッジを検出する。このとき、求めた画素点における濃度勾配の法線方向(矢印に直交する方向)を(数5)によって算出し、この法線方向に基づいて、追跡すべき次の画素点を予測する。
【0025】
ステップ5:こうして求めた濃度勾配が大きい画素点を繋ぐことにより文字領域を抽出、分離する。
【0026】
枠線から分離された文字部分は、2値画像で求めた、枠線と重複していない領域の文字部分と合体され、OCRによって文字認識される。
【0027】
また、図3に示すように、ステップ1で求めた交差点(黒丸)が4箇所である場合には、文字12が枠線11に交差していることが明らかであるから、枠線11の長さ方向(x方向)にスキャンし、濃度差分Xを有する画素点を求めることによって文字エッジの検出が可能となる。
【0028】
このように、この実施形態の文字・枠線分離方法では、文字と枠線とが接触、交差または重複している場合に、色の濃度差に基づいて、文字と枠線とを分離することができる。
【0029】
なお、交差領域を多階調で解析する場合の階調数は、256階調以外の数であってもよい。
【0030】
また、ステップ3では、濃度勾配の法線方向に基づいて予測した画素点とその周囲の画素点の濃度勾配だけを算出するようにしてもよい。
【0031】
【発明の効果】
以上の説明から明らかなように、本発明の文字・枠線分離方法では、文字の線が枠線と鋭角的に交差する場合でも、あるいは、文字の線が枠線と並行して重なり合う場合でも、文字部分を枠線から正確に分離することができる。
【図面の簡単な説明】
【図1】実施形態の文字・枠線分離方法における手順を示す図、
【図2】実施形態の文字・枠線分離方法での文字・枠線の分離の仕方を説明する図、
【図3】実施形態の文字・枠線分離方法での簡便な輪郭線の求め方を説明する図、
【図4】実施形態の文字・枠線分離方法での濃度勾配の求め方を説明する図、
【図5】枠線の濃度勾配を説明する図、
【図6】従来の文字・枠線分離方法を説明する図、
【図7】従来の方法で分離が困難な事例を説明する図である。
【符号の説明】
11 枠線
12 文字
13 交差領域

Claims (3)

  1. 枠線に接触、交差または重複する文字部分を枠線から分離する文字・枠線分離方法において、
    文字と枠線とが重なる部分を含む領域の画像を多値階調で解析し、
    前記画像の各画素点の中から、
    隣接するX方向の画素の濃度差分の絶対値と隣接するY方向の画素の濃度差分の絶対値とを加算した濃度勾配を用い、
    前記濃度勾配が大きい画素点を追跡して文字の輪郭線を求める
    ことを特徴とする文字・枠線分離方法。
  2. 前記画素点において、前記X方向の画素の濃度差分と前記Y方向の画素の濃度差分との比である勾配方向を求め、
    前記勾配方向の法線方向を求めて、
    前記法線方向に存在する次の濃度勾配の大きい画素点を予測する
    ことを特徴とする請求項1に記載の文字・枠線分離方法。
  3. 文字と枠線との交差点を求め、
    前記交差点から前記画素点の追跡を開始する
    ことを特徴とする請求項1または請求項2に記載の文字・枠線分離方法。
JP13257798A 1998-04-28 1998-04-28 文字・枠線分離方法 Expired - Fee Related JP4180148B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13257798A JP4180148B2 (ja) 1998-04-28 1998-04-28 文字・枠線分離方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13257798A JP4180148B2 (ja) 1998-04-28 1998-04-28 文字・枠線分離方法

Publications (2)

Publication Number Publication Date
JPH11312217A JPH11312217A (ja) 1999-11-09
JP4180148B2 true JP4180148B2 (ja) 2008-11-12

Family

ID=15084584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13257798A Expired - Fee Related JP4180148B2 (ja) 1998-04-28 1998-04-28 文字・枠線分離方法

Country Status (1)

Country Link
JP (1) JP4180148B2 (ja)

Also Published As

Publication number Publication date
JPH11312217A (ja) 1999-11-09

Similar Documents

Publication Publication Date Title
US6778703B1 (en) Form recognition using reference areas
JP2951814B2 (ja) 画像抽出方式
JP6080259B2 (ja) 文字切り出し装置及び文字切り出し方法
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US5748809A (en) Active area identification on a machine readable form using form landmarks
US20090046950A1 (en) System and method of determining image skew using connected components
EP0266140B1 (en) Optical character recognition by forming and detecting matrices of geographical features
WO1997020285A9 (en) System for character preserving guideline removal in optically scanned text
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
JP2776340B2 (ja) 指紋特徴抽出装置
JP3728224B2 (ja) 文書処理装置及び方法
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
US7251349B2 (en) Automatic table locating technique for documents
JP3936436B2 (ja) 表認識方法
JP3416058B2 (ja) 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体
JP4180148B2 (ja) 文字・枠線分離方法
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JPH07230526A (ja) 文字読取装置
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPH0449148B2 (ja)
JPH11250256A (ja) 図形認識処理方法及びそのプログラムを記録した記録媒体
EP1237115B1 (en) Automatic table location in documents
JPH096909A (ja) 文字読取装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050425

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080729

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080827

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120905

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130905

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees