JP4180148B2 - 文字・枠線分離方法 - Google Patents
文字・枠線分離方法 Download PDFInfo
- Publication number
- JP4180148B2 JP4180148B2 JP13257798A JP13257798A JP4180148B2 JP 4180148 B2 JP4180148 B2 JP 4180148B2 JP 13257798 A JP13257798 A JP 13257798A JP 13257798 A JP13257798 A JP 13257798A JP 4180148 B2 JP4180148 B2 JP 4180148B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- frame line
- density
- border
- pixel point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
【発明の属する技術分野】
本発明は、文字が文字枠に重なって記載されている場合でも光学文字読取装置(OCR)で文字の読み取りができるように、文字と枠線とを分離する方法に関し、特に、文字と枠線とがどのような形態で重なっていても、的確に分離できるようにするものである。
【0002】
【従来の技術】
文字パターンを光学的に読み取るOCRは、葉書に記入された郵便番号の読み取りなどを始めとして、これまで、多くの分野で利用されている。このOCRでは、対象画像を2値化し、得られた画像のパターンと標準文字パターンとのマッチングを取るなどの方法で、文字を判別している。文字読み取りの手法については、各種の改良が重ねられ、印刷文字だけで無く、手書き文字の読み取りも、殆ど支障無く行なわれている。
【0003】
しかし、帳票に記入された文字の読み取りでは、帳票の枠線に文字が接触したり、交差したり、重なったりすると、誤読する場合がある。
【0004】
文字が文字枠に接触、交差、重複している場合には、文字と枠線とを分離する文字・枠線分離処理が行なわれ、分離した文字に対して読み取りが行なわれる。この文字・枠線分離方法としては、例えば、図6に示すように、文字枠と文字との交点(コーナー点)を検出し、コーナー点の対応関係から文字と枠との連結領域に切れ目を入れ、文字を枠線から切り離す方法などが行なわれている。
【0005】
【発明が解決しようとする課題】
しかし、こうした方法では、図7(a)に示すように、枠と文字とが鋭角的に交差する場合に、コーナー点を安定的に求めることが難しく、また、図7(b)のように、文字と枠線とが並行して重なる場合には、文字を枠線から分離することが出来なくなる。
【0006】
本発明は、こうした従来の問題点を解決するものであり、文字が枠線とどのような形態で重なるときでも、文字を枠線から分離することができる文字・枠線分離方法を提供することを目的としている。
【0007】
【課題を解決するための手段】
そこで、本発明では、文字と枠線とが重なる部分を多値階調で表示し、この画像の濃度勾配が大きい画素点を追跡して文字の輪郭線を求めている。
【0008】
そのため、文字が枠線に、どのような形で接触、交差または重複していても、文字部分を枠線から正しく分離することができる。
【0009】
【発明の実施の形態】
本発明の請求項1に記載の発明は、枠線に接触、交差または重複する文字部分を枠線から分離する文字・枠線分離方法において、文字と枠線とが重なる部分を含む領域の画像を多値階調で解析し、この画像の各画素点の中から、隣接するX方向の画素の濃度差分の絶対値と隣接するY方向の画素の濃度差分の絶対値とを加算した濃度勾配を用い、前記濃度勾配が大きい画素点を追跡して文字の輪郭線を求めるようにしたものであり、文字と枠線とがどのような形態で重なっていても分離することができる。
【0010】
請求項2に記載の発明は、画素点において、前記X方向の画素の濃度差分と前記Y方向の画素の濃度差分との比である勾配方向を求め、前記勾配方向の法線方向を求めて、前記法線方向に存在する次の濃度勾配の大きい画素点を予測するようにしたものであり、濃度勾配が大きい画素点を容易に追跡することができる。
【0011】
請求項3に記載の発明は、文字と枠線との交差点を求め、この交差点から、画素点の追跡を開始するようにしたものであり、画素点の追跡が容易になる。
【0013】
以下、本発明の実施の形態について、図面を用いて説明する。
【0014】
本発明の文字・枠線分離方法では、文字や枠線の色の濃度変化に着目して文字と枠線とを分離する。
【0015】
枠線の色の濃さは一様に見えても、拡大して見れば、図5に示すように、線の両側で徐々に濃度が変化している。図5(a)は、枠線を直交する線に沿って切断し、その切断面から見た枠線の色の濃さを表しており、また、図5(b)は、枠線を上から見たときの枠線の濃度変化を丸印と矢印とで示している。矢印は丸印の位置における濃度変化の大きさと方向とを表している。
【0016】
また、図5(c)は、枠線11と文字12のように、2つの色が重なったときの濃度変化を、図5(a)と同様の切り口から示しており、図5(d)は、2つの色が帯状に重なっているときの濃度変化を平面図で示している。
【0017】
このように、2つの色が重なっているときでも、濃度変化が大きい点を繋ぎ合わせることによって、重なった色の輪郭線を求めることができる。
【0018】
この濃度変化の求め方を図4に示している。
【0019】
点(x,y)の画素の濃度をP(x,y)とし、その周囲の画素点(x,y+1)、(x,y−1)、(x+1,y)及び(x−1,y)の濃度を、それぞれP(x,y+1)、P(x,y−1)、P(x+1,y)及びP(x−1,y)とする。このとき画素点(x,y)における濃度差分は次式で与えられる。
濃度差分X=P(x+1,y)−P(x−1,y) (数1)
濃度差分Y=P(x,y+1)−P(x,y−1) (数2)
【0020】
また、画素点(x,y)において、濃度変化の大きさを表す濃度勾配、濃度変化の方向を表す勾配方向、及び、勾配方向に直交する法線方向は、それぞれ、
濃度勾配=|濃度差分X|+|濃度差分Y| (数3)
勾配方向= Y/X (X≠0) (数4)
法線方向=−X/Y (Y≠0) (数5)
で与えられる。
【0021】
図1は、濃度変化に着目して文字と枠線とを分離する方法の手順を示している。図2を参照しながら、この手順について説明する。
【0022】
ステップ1:対象画像を2値で画像化し、この2値画像を用いて、文字12と枠線11との交差点(黒丸)を求める。枠線11は一般的に直線で構成されているから、その直線を辿ることにより、文字との交差点を求めることができる。交差点を求めた後、各交差点を含むように交差領域13を抽出する。
【0023】
ステップ2:交差領域13の画像に対して、例えば、階調数256の多値画像の抽出を行なう。
ステップ3:交差領域13の各画素点の濃度勾配を(数3)によって求める。
【0024】
ステップ4:交差点から順次、濃度勾配が大きい画素点を追跡することにより、文字12のエッジを検出する。このとき、求めた画素点における濃度勾配の法線方向(矢印に直交する方向)を(数5)によって算出し、この法線方向に基づいて、追跡すべき次の画素点を予測する。
【0025】
ステップ5:こうして求めた濃度勾配が大きい画素点を繋ぐことにより文字領域を抽出、分離する。
【0026】
枠線から分離された文字部分は、2値画像で求めた、枠線と重複していない領域の文字部分と合体され、OCRによって文字認識される。
【0027】
また、図3に示すように、ステップ1で求めた交差点(黒丸)が4箇所である場合には、文字12が枠線11に交差していることが明らかであるから、枠線11の長さ方向(x方向)にスキャンし、濃度差分Xを有する画素点を求めることによって文字エッジの検出が可能となる。
【0028】
このように、この実施形態の文字・枠線分離方法では、文字と枠線とが接触、交差または重複している場合に、色の濃度差に基づいて、文字と枠線とを分離することができる。
【0029】
なお、交差領域を多階調で解析する場合の階調数は、256階調以外の数であってもよい。
【0030】
また、ステップ3では、濃度勾配の法線方向に基づいて予測した画素点とその周囲の画素点の濃度勾配だけを算出するようにしてもよい。
【0031】
【発明の効果】
以上の説明から明らかなように、本発明の文字・枠線分離方法では、文字の線が枠線と鋭角的に交差する場合でも、あるいは、文字の線が枠線と並行して重なり合う場合でも、文字部分を枠線から正確に分離することができる。
【図面の簡単な説明】
【図1】実施形態の文字・枠線分離方法における手順を示す図、
【図2】実施形態の文字・枠線分離方法での文字・枠線の分離の仕方を説明する図、
【図3】実施形態の文字・枠線分離方法での簡便な輪郭線の求め方を説明する図、
【図4】実施形態の文字・枠線分離方法での濃度勾配の求め方を説明する図、
【図5】枠線の濃度勾配を説明する図、
【図6】従来の文字・枠線分離方法を説明する図、
【図7】従来の方法で分離が困難な事例を説明する図である。
【符号の説明】
11 枠線
12 文字
13 交差領域
Claims (3)
- 枠線に接触、交差または重複する文字部分を枠線から分離する文字・枠線分離方法において、
文字と枠線とが重なる部分を含む領域の画像を多値階調で解析し、
前記画像の各画素点の中から、
隣接するX方向の画素の濃度差分の絶対値と隣接するY方向の画素の濃度差分の絶対値とを加算した濃度勾配を用い、
前記濃度勾配が大きい画素点を追跡して文字の輪郭線を求める
ことを特徴とする文字・枠線分離方法。 - 前記画素点において、前記X方向の画素の濃度差分と前記Y方向の画素の濃度差分との比である勾配方向を求め、
前記勾配方向の法線方向を求めて、
前記法線方向に存在する次の濃度勾配の大きい画素点を予測する
ことを特徴とする請求項1に記載の文字・枠線分離方法。 - 文字と枠線との交差点を求め、
前記交差点から前記画素点の追跡を開始する
ことを特徴とする請求項1または請求項2に記載の文字・枠線分離方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13257798A JP4180148B2 (ja) | 1998-04-28 | 1998-04-28 | 文字・枠線分離方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13257798A JP4180148B2 (ja) | 1998-04-28 | 1998-04-28 | 文字・枠線分離方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11312217A JPH11312217A (ja) | 1999-11-09 |
JP4180148B2 true JP4180148B2 (ja) | 2008-11-12 |
Family
ID=15084584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13257798A Expired - Fee Related JP4180148B2 (ja) | 1998-04-28 | 1998-04-28 | 文字・枠線分離方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4180148B2 (ja) |
-
1998
- 1998-04-28 JP JP13257798A patent/JP4180148B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11312217A (ja) | 1999-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6778703B1 (en) | Form recognition using reference areas | |
JP2951814B2 (ja) | 画像抽出方式 | |
JP6080259B2 (ja) | 文字切り出し装置及び文字切り出し方法 | |
EP1497787B1 (en) | System and method for identifying and extracting character strings from captured image data | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US5748809A (en) | Active area identification on a machine readable form using form landmarks | |
US20090046950A1 (en) | System and method of determining image skew using connected components | |
EP0266140B1 (en) | Optical character recognition by forming and detecting matrices of geographical features | |
WO1997020285A9 (en) | System for character preserving guideline removal in optically scanned text | |
JP3830998B2 (ja) | 罫線除去方法及びこれを用いた文字認識装置 | |
JP2776340B2 (ja) | 指紋特徴抽出装置 | |
JP3728224B2 (ja) | 文書処理装置及び方法 | |
JPH07105312A (ja) | 光学式文字読取装置における文字イメージのごみ除去方法及び装置 | |
US7251349B2 (en) | Automatic table locating technique for documents | |
JP3936436B2 (ja) | 表認識方法 | |
JP3416058B2 (ja) | 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体 | |
JP4180148B2 (ja) | 文字・枠線分離方法 | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
JPH07230526A (ja) | 文字読取装置 | |
JP2004094427A (ja) | 帳票画像処理装置及び該装置を実現するためのプログラム | |
JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
JPH0449148B2 (ja) | ||
JPH11250256A (ja) | 図形認識処理方法及びそのプログラムを記録した記録媒体 | |
EP1237115B1 (en) | Automatic table location in documents | |
JPH096909A (ja) | 文字読取装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050425 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080403 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080827 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110905 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110905 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120905 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130905 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |