JP4571447B2 - 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 - Google Patents

文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 Download PDF

Info

Publication number
JP4571447B2
JP4571447B2 JP2004181279A JP2004181279A JP4571447B2 JP 4571447 B2 JP4571447 B2 JP 4571447B2 JP 2004181279 A JP2004181279 A JP 2004181279A JP 2004181279 A JP2004181279 A JP 2004181279A JP 4571447 B2 JP4571447 B2 JP 4571447B2
Authority
JP
Japan
Prior art keywords
ruled line
character image
character
contact
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004181279A
Other languages
English (en)
Other versions
JP2006004271A (ja
Inventor
美佐子 諏訪
克仁 藤本
浩司 黒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004181279A priority Critical patent/JP4571447B2/ja
Publication of JP2006004271A publication Critical patent/JP2006004271A/ja
Application granted granted Critical
Publication of JP4571447B2 publication Critical patent/JP4571447B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

この発明は、罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置に関し、特に、罫線に接触する文字線と罫線との成す角度が浅い場合にも精度よく文字画像を抽出することができる文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置に関するものである。
OCR(Optical Character Reader:光学的文字認識装置)などで枠線内、あるいは、アンダーライン上に記入された文字列を認識する場合に、罫線接触文字画像から罫線を除去して文字列だけの画像を抽出する必要がある。
図18は、このような罫線接触文字画像の一例を示す図である。同図は、文字列「神奈川県横須賀市小矢部」がアンダーラインと接触している画像を示しており、文字列「神奈川県横須賀市小矢部」を認識するためには、事前にアンダーラインを取り除く必要がある。
従来、このような罫線接触文字画像から罫線を除去して文字列だけの画像を抽出する技術としては、罫線の除去後に、罫線除去によって欠損した文字線を復元する技術(例えば、特許文献1〜2および非特許文献1参照。)や、文字線に欠損部分を生じさせることなく罫線のみを除去する技術(例えば、特許文献3〜4参照。)が開発されている。
特開平6−309498号公報 特開平11−232382号公報 特開平9−185676号公報 特開平7−57047号公報 D. Guillevic and C. Y. Suen, "Cursive Script Recognition:A fast reader scheme," Proceedings of ICDAR, 1993, pp. 311-322
しかしながら、かかる従来技術では、帳票に記入された漢字のように罫線と文字線のなす角度が浅いときがある場合には、文字画像を精度よく抽出することができないという問題があった。
例えば、罫線の除去後に欠損した文字線を復元する技術では、図19に示すように、罫線と文字線のなす角度が浅い場合には、欠損部分が大きくなり、文字線を復元することができない。また、罫線のみを除去する技術では、罫線と文字線のなす角度が浅い場合には、罫線を正しく抽出することができない。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、罫線に接触する文字線と罫線との成す角度が浅い場合にも精度よく文字画像を抽出することができる文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出プログラムであって、文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成手順と、前記構造要素生成手順により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去手順と、をコンピュータに実行させることを特徴とする。
また、本発明は、罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出プログラムを記録したコンピュータ読み取り可能な記録媒体であって、文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成手順と、前記構造要素生成手順により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去手順と、をコンピュータに実行させる文字画像抽出プログラムを記録したことを特徴とする。
また、本発明は、罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出方法であって、文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成工程と、前記構造要素生成工程により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去工程と、を含んだことを特徴とする。
また、本発明は、罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出装置であって、文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成手段と、前記構造要素生成手段により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去手段と、を備えたことを特徴とする。
かかる発明によれば、文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成し、生成した複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出するよう構成したので、罫線に接触する文字線と罫線との成す角度が浅い場合にも罫線だけを除去することができる。
本発明によれば、罫線に接触する文字線と罫線との成す角度が浅い場合にも罫線だけを除去するので、精度良く文字画像を抽出することができるという効果を奏する。
以下に添付図面を参照して、この発明に係る文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置の好適な実施例を詳細に説明する。なお、ここでは、帳票に含まれる罫線接触文字画像から罫線を除去する文字画像抽出装置を中心に説明する。
まず、本実施例に係る文字画像抽出装置の構成について説明する。図1は、本実施例に係る文字画像抽出装置の構成を示す機能ブロック図である。同図に示すように、この文字画像抽出装置100は、入力部110と、画像記憶部120と、文字列切出部130と、罫線接触判定部140と、罫線領域推定部150と、罫線幅推定部160と、罫線除去用構造要素生成部170と、罫線除去用構造要素記憶部180と、罫線除去部190とを有する。
入力部110は、帳票をスキャナで走査して画像データを読み込み、読み込んだ画像データを二値の画像データに変換して画像記憶部120に格納する処理部である。
画像記憶部120は、入力部110によって帳票画像から得られた二値の画像データを記憶する記憶部である。図2は、画像記憶部120が記憶する画像データの一例を示す図である。同図に示すように、この画像記憶部120は、「1」または「0」を値とする二次元配列によって画像データを記憶する。ここで、「1」は黒画素を示し、「0」は白画素を示す。
文字列切出部130は、画像記憶部120が記憶する画像データを用いて帳票画像の中の所定の領域の文字列を切出す処理部である。この文字列切出部130は、罫線が文字列と接触している場合には、罫線が接触しているままの状態で文字列を切出す。
罫線接触判定部140は、文字列切出部130によって切出された文字画像に対して罫線と文字との接触の有無を判定する処理部である。具体的には、この罫線接触判定部140は、まず、切出された文字画像に対して、連結成分ごとに異なるラベルを与えるラベリングを行い、各連結成分の外接矩形サイズを求める。
そして、図3に示すように、連結成分の外接矩形の高さをH、幅をW、縦横比をR=W/H、縦横比の閾値をRth、高さの閾値をHthとすると、
R<Rth、H>Hthの場合:連結成分は文字部分
R>Rth、H<Hthの場合:連結成分は罫線部分
R>Rth、H>Hthの場合:連結成分は文字と罫線の接触部分
と判定する。
罫線領域推定部150は、罫線接触判定部140によって罫線と文字との接触があると判定された文字画像に対して罫線の位置やその中心線などを求める処理部である。具体的には、この罫線領域推定部150は、文字と罫線が接触する連結成分に対し、罫線方向に走査して黒画素をカウントし、黒画素のヒストグラムを求める。
そして、図4に示すように、ヒストグラム値Vが閾値Vth以上の座標領域を罫線領域とし、罫線領域に所定の幅のマージンをとった領域の画像を罫線削除処理の対象とする。
罫線幅推定部160は、罫線幅を推定する処理部である。例えば、水平罫線の場合、この罫線幅推定部160は、図5に示すように、上部輪郭点と下部輪郭点を求め、各x座標における幅Hwのヒストグラムを求める。そして、最頻値をとる幅Hw0を罫線幅の推定値とする。
罫線除去用構造要素生成部170は、21種類の罫線除去用構造要素を生成する処理部である。ここで、罫線除去用構造要素とは、罫線接触文字画像から罫線を削除する際に使用する画素パターンである。
図6は、罫線除去用構造要素生成部170が生成する21種類の罫線除去用構造要素を示す図である。同図に示すように、罫線除去用構造要素生成部170は、水平方向を0°として22.5°、45°、67.5°、90°、112.5°、135°および157.5°の7方向のそれぞれに対して中央、下端および上端の3種類の中心を有する計21種類の罫線除去用構造要素を生成する。同図において、ハッチングで示す画素が中心を示す。
なお、ここでは、罫線除去用構造要素の構造要素サイズは「3」であるが、罫線除去用構造要素生成部170は、罫線幅推定部160が推定した罫線幅をWとすると、構造要素サイズSをS=aWを用いて決定する。ここで、aは「1.0」より大きい定数値である。
罫線除去用構造要素記憶部180は、罫線除去用構造要素生成部170が生成した罫線除去用構造要素を記憶する記憶部である。図7−1は、罫線除去用構造要素記憶部180が記憶する罫線除去用構造要素のデータ構造の一例を示す図である。
同図に示すように、罫線除去用構造要素記憶部180は、各罫線除去用構造要素について、構造要素サイズSと、中心x座標と、中心y座標と、画素パターンを含むS×S個の画素の値e11、e12、・・・、eSSとを記憶する。ここで、座標としては、S×S個の画素のうちの左上端を原点とし、右方向をx軸の正方向、下方向をy軸の正方向とする。
図7−2は、罫線除去用構造要素記憶部180が記憶する罫線除去用構造要素の一例を示す図である。同図は、構造要素サイズが「3」であり、中心の座標が(1、0)すなわち中心が「真中上」の90°方向構造要素を示している。
罫線除去部190は、罫線除去用構造要素生成部170によって生成された21種類の罫線除去用構造要素を用いて罫線接触文字画像の罫線およびその近傍領域の各画素に対してエロージョンを行い、罫線を削除する処理部である。
ここで、罫線除去部190が罫線接触文字画像の罫線およびその近傍領域の各画素に対して行うエロージョンについて説明する。二値画像に対するエロージョンとは、画像処理での膨張処理を一般化したものであり、構造要素(Structuring Element)と呼ばれるM×Nの画素パターンの中心と画像の着目画素とを重ね合わせ、黒画素が完全合致するときは着目画素をそのまま残し、合致しないときは着目画素を白画素に反転させる。
図8は、エロージョンを説明するための説明図である。同図は、原画像、構造要素およびエロージョン画像を示している。ここでは、原画像に対して構造要素を用いてエロージョンを行うことによって、原画像の黒画素領域の縁にあたる領域が白画像に反転している。
図9は、中央垂直文字線が罫線と接触する場合の構造要素の中心位置と接触位置との関係を示す図である。同図に示すように、中央垂直文字線が罫線と下端付近で接触する場合には、中心が下にある構造要素を用いることによって中央垂直文字線を抽出することができ、中央垂直文字線が罫線と上端付近で接触する場合には、中心が上にある構造要素を用いることによって中央垂直文字線を抽出することができ、中央垂直文字線が罫線と中ほどで接触する場合には、中心が中央にある構造要素を用いることによって中央垂直文字線を抽出することができる。
図10は、構造要素の中心の相異によるエロージョン結果の相異を示す図である。同図の原画像は、文字「木」の中央の垂直文字線の下端近くが罫線に接触している場合を示している。同図に示すように、中心が中央の垂直構造要素を用いて原画像に対してエロージョンを行うと、原画像の垂直文字線の下から二つの画素については、垂直構造要素の中心と重ね合わせた場合に黒画素が全ては合致しないため、原画像の垂直文字線の下から二つの画素部分が欠損してしまう。
一方、中心が下端の垂直構造要素を用いて原画像に対してエロージョンを行うと、原画像の垂直文字線の下から二つの画素についても、垂直構造要素の中心と重ね合わせた場合に黒画素が全て合致するため、原画像の垂直文字線の下から二つの画素も正しく抽出することができる。
このように、中心が下端の罫線除去用構造要素を用いることによって、文字線の下端部分の欠損を防ぎ、中心が上端の罫線除去用構造要素を用いることによって、文字線の上端部分の欠損を防ぐことができる。
罫線除去部190は、罫線除去用構造要素生成部170によって生成された各罫線除去用構造要素で罫線接触文字画像の罫線および罫線近傍領域の各画素に対してエロージョンを行い、それらの画素値のOR(論理和)をとることで罫線を除去した文字画像を出力することができる。
ただし、罫線接触文字画像の着目画素が、ある中心の22.5°方向の罫線除去用構造要素と157.5°方向の罫線除去用構造要素の双方にマッチした場合には、文字線ではないと判定し、出力画素値は黒画素とせず、反転させた白画素とする。
すなわち、罫線接触文字画像の罫線および罫線近傍領域の黒画素の集合をXとし、i番目の方向の罫線除去用構造要素の黒画素の集合をAiとし、AiによるXのエロージョン演算をX□Aiとすると、罫線除去部190が出力する抽出文字画像Yは
Figure 0004571447
で表される。ここで、A1およびA7はそれぞれ22.5°方向の罫線除去用構造要素と157.5°方向の罫線除去用構造要素を表わす。
このように、罫線除去部190が21種類の罫線除去用構造要素を用いて罫線接触文字画像の罫線およびその近傍領域の各画素に対してエロージョンを行い、罫線を除去した文字画像を生成することによって、罫線との成す角度が浅い文字線を精度良く抽出することができる。
図11は、罫線除去部190によって抽出される文字画像の一例を示す図である。同図に示すように、原画像に対して、135°方向構造要素、90°方向構造要素および45°方向構造要素を用いてエロージョンを行った結果の画素値のORをとることによって罫線が除去された抽出文字列画像が得られる。
次に、本実施例に係る文字画像抽出装置100の処理手順について説明する。図12は、本実施例に係る文字画像抽出装置100の処理手順を示すフローチャートである。同図に示すように、この文字画像抽出装置100は、入力部110がスキャナを用いて帳票画像を入力し(ステップS101)、二値の画像データに変換する。
そして、文字列切出部130が所定の領域の文字列を罫線とともに切出し(ステップS102)、罫線接触判定部140が文字列に罫線が接触しているか否かを判定する(ステップS103)。
その結果、文字列に罫線が接触している場合には、罫線領域推定部150が罫線の位置および中心線を推定し(ステップS104)、罫線幅推定部160が罫線幅を推定する(ステップS105)。
そして、罫線除去用構造要素生成部170が罫線幅に基づいて21種類の罫線除去用構造要素を生成し(ステップS106)、罫線除去部190が、21種類の罫線除去用構造要素を用いて罫線を除去し、文字列を抽出する(ステップS107)。
一方、文字列に罫線が接触していない場合には、罫線を除去して文字列を抽出する(ステップS108)。
このように、罫線除去部190が、21種類の罫線除去用構造要素を用いて罫線を除去し、文字列を抽出することによって、罫線との成す角度が浅い文字線を精度良く抽出することができる。
図13は、本実施例に係る文字画像抽出装置100による文字画像抽出結果を示す図である。同図は、図18に示した罫線接触文字画像からアンダーラインを除去して文字列だけを抽出した結果を示す。
次に、罫線接触判定部140の処理手順について説明する。図14は、罫線接触判定部140の処理手順を示すフローチャートである。同図に示すように、この罫線接触判定部140は、罫線接触文字画像のラベリングを行い(ステップS201)、ラベルすなわち連結成分を一つ選択する(ステップS202)。
そして、連結成分の外接矩形サイズ(H、W)および縦横比(R=W/H)を計算し(ステップS203)、R>Rth&H>Hthであるか否か、すなわち、縦横比(R)が所定の閾値より大きく高さ(H)が所定の閾値より大きいか否かを判定し(ステップS204)、R>Rth&H>Hthである場合には、連結成分は罫線接触パターンであると判定し(ステップS205)、R>Rth&H>Hthでない場合には、連結成分は罫線接触パターンでないと判定する(ステップS206)。
そして、全てのラベルについて処理が終了したか否かを判定し(ステップS207)、全てのラベルについて処理が終了していない場合には、ステップS202に戻って次のラベルを判定し、全てのラベルについて処理を終了した場合には、罫線接触判定処理を終了する。
次に、罫線領域推定部150の処理手順について説明する。なお、ここでは、罫線が水平線の場合を例として説明する。図15は、罫線領域推定部150の処理手順を示すフローチャートである。同図に示すように、この罫線領域推定部150は、罫線接触文字画像を罫線方向(ここでは、x軸方向)に走査して黒画素のヒストグラムを作成する(ステップS301)。
そして、ヒストグラム値Vjを順番に一つずつ選択し(ステップS302)、Vj<Vth&Vj+1>Vthであるか否か、すなわち、ヒストグラム値が所定の閾値より大きくなり始める場合か否かを判定し(ステップS303)、Vj<Vth&Vj+1>Vthである場合には、Vj+1に対応するy座標を罫線領域開始y座標Ysとして記録する(ステップS304)。
そして、Vj>Vth&Vj+1<Vthであるか否か、すなわち、ヒストグラム値が所定の閾値より小さくなり始める場合か否かを判定し(ステップS305)、Vj>Vth&Vj+1<Vthである場合には、Vjに対応するy座標を罫線領域終了y座標Yeとして記録する(ステップS306)。
そして、罫線領域開始y座標および罫線領域終了y座標を抽出したか否かを判定し(ステップS307)、抽出していない場合には、ステップS302に戻って、次のヒストグラム値を選択し、抽出した場合には、罫線削除処理の処理対象領域の開始点および終了点をYsおよびYeを用いて計算する(ステップS308)。
次に、罫線除去部190の処理手順について説明する。図16は、罫線除去部190の処理手順を示すフローチャートである。同図に示すように、この罫線除去部190は、罫線削除処理の処理対象領域から画素を選択して着目画素とし(ステップS401)、着目画素が黒画素であるか否かを判定する(ステップS402)。
その結果、着目画素が黒画素である場合には、罫線除去用構造要素の中心と着目画素を重ね合わせた場合に、いずれかの罫線除去用構造要素の画素パターンと一致するか否かを判定する(ステップS403)。
そして、いずれの罫線除去用構造要素の画素パターンとも一致しない黒画素を白画素に置き換え(ステップS404)、ステップS407に進む。一方、いずれかの罫線除去用構造要素の画素パターンと一致する場合には、22.5度方向構造要素と157.5度方向構造要素の双方に一致するか否かを判定し(ステップS405)、双方に一致する場合には、水平罫線部分と判断して黒画素を白画素に置き換える(ステップS406)。
これに対して、双方に一致はしない場合には、着目画素は文字線部分であると判定し、黒画素のままとする。そして、処理対象領域の全画素について処理が終了したか否かを判定し(ステップS407)、処理対象領域の全画素について処理が終了していない場合には、ステップS401に戻って、次の画素を選択し、処理対象領域の全画素について処理が終了した場合には、罫線削除処理を終了する。
このように、罫線除去部190が、罫線削除処理の処理対象領域の全黒画素に対して、罫線除去用構造要素の中心と重ね合わせ、いずれかの罫線除去用構造要素の画素パターンと一致するか否かを判定し、全ての罫線除去用構造要素の画素パターンと一致しない場合には、黒画素を白画素に置き換えることによって、罫線接触文字画像から罫線だけを削除することができる。
上述してきたように、本実施例では、罫線除去用構造要素生成部170が、罫線幅推定部160により推定された罫線幅に基づいて21種類の罫線除去用構造要素を生成し、罫線除去部190が、罫線領域推定部150により定められた罫線除去処理の対象領域に対して21種類の罫線除去用構造要素を用いてエロージョン演算を行った結果の論理和をとる事により罫線を除去し、文字列を抽出することとしたので、罫線と文字との成す角度が浅い場合にも、文字画像を精度良く抽出することができる。
なお、本実施例では、文字画像抽出装置について説明したが、この文字画像抽出装置の機能をソフトウェアによって実現することで、同様の機能を有する文字画像抽出プログラムを得ることができる。そこで、この文字画像抽出プログラムを実行するコンピュータについて説明する。
図17は、本実施例に係る文字画像抽出プログラムを実行するコンピュータの構成を示す機能ブロック図である。同図に示すように、このコンピュータ200は、CPU210と、RAM220と、ROM230と、I/Oインタフェース240とを有する。
CPU210は、文字画像抽出プログラムを実行する中央処理装置であり、RAM220は、プログラムの実行途中結果などを保存するメモリである。ROM230は、文字画像抽出プログラムなどを記憶する読出し専用メモリであり、I/Oインタフェース240は、スキャナなどをコンピュータ200に接続するインタフェースである。
なお、本実施例では、7方向の罫線除去用構造要素を用いる場合について説明したが、本発明はこれに限定されるものではなく、15方向の罫線除去用構造要素など他の数の方向の罫線除去用構造要素を用いる場合にも同様に適用することができる。
(付記1)罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出プログラムであって、
文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成手順と、
前記構造要素生成手順により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去手順と、
をコンピュータに実行させることを特徴とする文字画像抽出プログラム。
(付記2)前記罫線除去手順は、前記罫線除去用構造要素のうち罫線とのなす角度が最小および最大の方向に対応する罫線除去用構造要素の両方に合致した画素は文字画像の一部でないと判定することを特徴とする付記1に記載の文字画像抽出プログラム。
(付記3)前記構造要素生成手順は、文字線と罫線との接触位置関係として罫線が文字線の下端付近、上端付近または中央付近に接触する3種類の接触位置関係に対応して複数の罫線除去用構造要素を生成することを特徴とする付記1または2に記載の文字画像抽出プログラム。
(付記4)前記構造要素生成手順は、文字線の複数種類の方向に対応して複数の罫線除去用構造要素を生成することを特徴とする付記1または2に記載の文字画像抽出プログラム。
(付記5)前記構造要素生成手順は、文字線と罫線との接触位置関係として罫線が文字線の下端付近、上端付近または中央付近に接触する3種類の接触位置関係および文字線の7種類の方向に対応して21種類の罫線除去用構造要素を生成することを特徴とする付記1または2に記載の文字画像抽出プログラム。
(付記6)前記構造要素生成手順は、罫線に対する角度が22.5度、45度、67.5度、90度、112.5度、135度、157.5度の7種類の文字線の方向に対応して複数の罫線除去用構造要素を生成することを特徴とする付記5に記載の文字画像抽出プログラム。
(付記7)前記構造要素生成手順は、構造要素サイズが罫線幅の定数倍の罫線除去用構造要素を生成することを特徴とする付記1または2に記載の文字画像抽出プログラム。
(付記8)前記構造要素生成手順は、構造要素サイズが罫線幅の3倍の罫線除去用構造要素を生成することを特徴とする付記7に記載の文字画像抽出プログラム。
(付記9)罫線幅を推定する罫線幅推定手順をさらにコンピュータに実行させ、
前記構造要素生成手順は、前記罫線幅推定手順により推定された罫線幅を用いて構造要素サイズを算出して罫線除去用構造要素を生成することを特徴とする付記1または2に記載の文字画像抽出プログラム。
(付記10)罫線領域を推定し、該推定した罫線領域に基づいて罫線接触文字画像のうちのエロージョン演算を行う対象領域を定める罫線領域推定手順をさらにコンピュータに実行させ、
前記罫線除去手順は、前記罫線領域推定手順により定められた対象領域に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出することを特徴とする付記1または2に記載の文字画像抽出プログラム。
(付記11)前記罫線領域推定手順は、罫線接触文字画像を罫線方向に走査して黒画素の個数を計数し、該計数した個数に基づいて罫線領域を推定することを特徴とする付記10に記載の文字画像抽出プログラム。
(付記12)罫線と文字が接触するか否かを判定する罫線接触判定手順をさらにコンピュータに実行させ、
前記罫線領域推定手順は、前記罫線接触判定手順により罫線と文字が接触すると判定された場合に、罫線領域を推定することを特徴とする付記10に記載の文字画像抽出プログラム。
(付記13)罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成手順と、
前記構造要素生成手順により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去手順と、
をコンピュータに実行させる文字画像抽出プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
(付記14)罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出方法であって、
文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成工程と、
前記構造要素生成工程により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去工程と、
を含んだことを特徴とする文字画像抽出方法。
(付記15)罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出装置であって、
文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成手段と、
前記構造要素生成手段により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去手段と、
を備えたことを特徴とする文字画像抽出装置。
以上のように、本発明に係る文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置は、OCRに有用であり、特に、帳票に記入された漢字など複雑な文字を認識するOCRに適している。
本実施例に係る文字画像抽出装置の構成を示す機能ブロック図である。 画像記憶部が記憶する画像データの一例を示す図である。 罫線接触判定部による罫線接触判定手法を説明するための説明図である。 罫線領域推定部による罫線領域推定手法を説明するための説明図である。 罫線幅推定部による罫線幅推定手法を説明するための説明図である。 罫線除去用構造要素生成部が生成する21種類の罫線除去用構造要素を示す図である。 罫線除去用構造要素記憶部が記憶する罫線除去用構造要素のデータ構造の一例を示す図である。 罫線除去用構造要素記憶部が記憶する罫線除去用構造要素の一例を示す図である。 エロージョンを説明するための説明図である。 中央垂直文字線が罫線と接触する場合の構造要素の中心位置と接触位置との関係を示す図である。 構造要素の中心の相異によるエロージョン結果の相異を示す図である。 罫線除去部190によって抽出される文字画像の一例を示す図である。 本実施例に係る文字画像抽出装置の処理手順を示すフローチャートである。 本実施例に係る文字画像抽出装置による文字画像抽出結果を示す図である。 罫線接触判定部の処理手順を示すフローチャートである。 罫線領域推定部の処理手順を示すフローチャートである。 罫線除去部の処理手順を示すフローチャートである。 本実施例に係る文字画像抽出プログラムを実行するコンピュータの構成を示す機能ブロック図である。 罫線接触文字画像の一例を示す図である。 罫線と文字線のなす角度が浅い場合の文字線の欠損を示す図である。
符号の説明
100 文字画像抽出装置
110 入力部
120 画像記憶部
130 文字列切出部
140 罫線接触判定部
150 罫線領域推定部
160 罫線幅推定部
170 罫線除去用構造要素生成部
180 罫線除去用構造要素記憶部
190 罫線除去部
200 コンピュータ
210 CPU
220 RAM
230 ROM
240 I/Oインタフェース

Claims (5)

  1. 罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出プログラムであって、
    文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成手順と、
    前記構造要素生成手順により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去手順と、
    をコンピュータに実行させることを特徴とする文字画像抽出プログラム。
  2. 前記罫線除去手順は、前記罫線除去用構造要素のうち罫線とのなす角度が最小および最大の方向に対応する罫線除去用構造要素の両方に合致した画素は文字画像の一部でないと判定することを特徴とする請求項1に記載の文字画像抽出プログラム。
  3. 前記構造要素生成手順は、文字線と罫線との接触位置関係として罫線が文字線の下端付近、上端付近または中央付近に接触する3種類の接触位置関係に対応して複数の罫線除去用構造要素を生成することを特徴とする請求項1または2に記載の文字画像抽出プログラム。
  4. 罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出方法であって、
    文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成工程と、
    前記構造要素生成工程により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去工程と、
    を含んだことを特徴とする文字画像抽出方法。
  5. 罫線が接触した文字の画像である罫線接触文字画像から罫線を除去して文字画像を抽出する文字画像抽出装置であって、
    文字線と罫線との接触位置関係および文字線の方向に対応して複数の罫線除去用構造要素を罫線幅に基づく構造要素サイズで生成する構造要素生成手段と、
    前記構造要素生成手段により生成された複数の罫線除去用構造要素を用いて罫線接触文字画像に対してエロージョン演算を行った結果の論理和をとる事により罫線を除去して文字画像を抽出する罫線除去手段と、
    を備えたことを特徴とする文字画像抽出装置。

JP2004181279A 2004-06-18 2004-06-18 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 Expired - Fee Related JP4571447B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004181279A JP4571447B2 (ja) 2004-06-18 2004-06-18 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004181279A JP4571447B2 (ja) 2004-06-18 2004-06-18 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置

Publications (2)

Publication Number Publication Date
JP2006004271A JP2006004271A (ja) 2006-01-05
JP4571447B2 true JP4571447B2 (ja) 2010-10-27

Family

ID=35772608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004181279A Expired - Fee Related JP4571447B2 (ja) 2004-06-18 2004-06-18 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置

Country Status (1)

Country Link
JP (1) JP4571447B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03282895A (ja) * 1990-03-30 1991-12-13 Toshiba Corp 光学的文字読取装置
JPH10254991A (ja) * 1997-03-06 1998-09-25 Ricoh Co Ltd 罫線消去方法及び機械読み取り可能な媒体
JP2001060247A (ja) * 1999-06-14 2001-03-06 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
JP2003108921A (ja) * 2001-10-01 2003-04-11 Fujitsu Ltd 上書きパターン分離装置及び記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03282895A (ja) * 1990-03-30 1991-12-13 Toshiba Corp 光学的文字読取装置
JPH10254991A (ja) * 1997-03-06 1998-09-25 Ricoh Co Ltd 罫線消去方法及び機械読み取り可能な媒体
JP2001060247A (ja) * 1999-06-14 2001-03-06 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
JP2003108921A (ja) * 2001-10-01 2003-04-11 Fujitsu Ltd 上書きパターン分離装置及び記録媒体

Also Published As

Publication number Publication date
JP2006004271A (ja) 2006-01-05

Similar Documents

Publication Publication Date Title
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
US5410611A (en) Method for identifying word bounding boxes in text
JP2001092919A (ja) 2次元バーコードのねじれ角決定法
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JP6754120B2 (ja) プログラム、情報記憶媒体及び文字分割装置
JP5322517B2 (ja) 画像処理装置および方法
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP3615333B2 (ja) 罫線消去装置
JP4049560B2 (ja) 網点除去方法及びシステム
JP2010191724A (ja) 画像処理装置および制御プログラム
Lehal et al. Text segmentation of machine-printed Gurmukhi script
JP4571447B2 (ja) 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置
Nguyen et al. Enhanced character segmentation for format-free Japanese text recognition
JP3798179B2 (ja) パターン抽出装置及び文字切り出し装置
JP3904397B2 (ja) 表認識方法
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP7338159B2 (ja) 情報処理装置及びプログラム
JP2871590B2 (ja) 画像抽出方式
JP4847378B2 (ja) 画像処理装置、画像処理方法、プログラム及びコンピュータ読取可能な記録媒体
JP2796561B2 (ja) 表形式文書認識方式
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP3077929B2 (ja) 文字切出し方式
JP2002074264A (ja) 画像処理装置、画像処理方法および記録媒体
JP3343305B2 (ja) 文字切り出し装置、及び文字切り出し方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070518

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100810

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100812

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130820

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees