JP3551004B2 - 罫線抽出方法および装置 - Google Patents

罫線抽出方法および装置 Download PDF

Info

Publication number
JP3551004B2
JP3551004B2 JP02977798A JP2977798A JP3551004B2 JP 3551004 B2 JP3551004 B2 JP 3551004B2 JP 02977798 A JP02977798 A JP 02977798A JP 2977798 A JP2977798 A JP 2977798A JP 3551004 B2 JP3551004 B2 JP 3551004B2
Authority
JP
Japan
Prior art keywords
potential
ruled line
image
value
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP02977798A
Other languages
English (en)
Other versions
JPH11232457A (ja
Inventor
敬 平野
康裕 岡田
文夫 依田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP02977798A priority Critical patent/JP3551004B2/ja
Publication of JPH11232457A publication Critical patent/JPH11232457A/ja
Application granted granted Critical
Publication of JP3551004B2 publication Critical patent/JP3551004B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像上の様々な罫線(実線や点線、破線、一点鎖線等)を抽出する装置に関する。
【0002】
【従来の技術】
文字認識装置や文書のファイリング装置では、処理の一部として、文書画像上にある罫線(点線や実線)を抽出するものがある。このような従来の罫線抽出技術として、例えば特開平7−230525に示された方法がある。以下、この従来方法について図13を用いて説明する。
【0003】
図13は、従来の罫線抽出方法の全体構成を示すブロック図である。図13において100は2値画像入力部、101は2値イメージメモリ、102は黒ラン抽出部、103は黒ランメモリ、104は実線罫線認識部、105は実線罫線メモリ、106は矩形抽出部、107は矩形メモリ、108は点線要素抽出部、109は点線要素メモリ、110は点線罫線抽出部、111は点線候補メモリ、112は点線罫線判断部、113は分散計算部、114は点線罫線メモリ、115は罫線出力部である。
【0004】
以下、従来の罫線抽出方法の動作を図13に基づいて説明する。図13において、ブロック102〜105は実線罫線を抽出するための部分、ブロック106〜114は点線罫線を抽出するための部分、ブロック100、101、115は点線罫線と実線罫線の抽出に共通な部分である。
【0005】
まず、2値画像入力部100は、イメージスキャナやファクシミリ等で文書を読み取って2値の文書画像を作成し、それを2値イメージメモリ101に格納する。次に、黒ラン抽出部102は、2値イメージメモリ101に格納した文書画像から、注目する罫線方向(通常、主走査方向および副走査方向)に一定長以上連続する黒ランを抽出する。そして、抽出した黒ランのデータ(始点・終点の座標、方向等)を黒ランメモリ103に格納する。次に、実線罫線認識部104は、黒ランメモリ103に格納した黒ランデータを基に、実線の罫線を抽出する。具体的には、同一の方向を持ち、近傍に位置する黒ラン同士を統合し、その外接矩形を罫線とする。そして、抽出した罫線のデータ(始点・終点の座標、方向等)を実線罫線メモリ105に格納する。
【0006】
次に、矩形抽出部106は、2値イメージメモリ101に格納された文書画像から、注目する罫線方向(通常、主走査方向および副走査方向)に連続した黒画素を包含する矩形を生成し、その矩形データを矩形メモリ107に格納する。次に、点線要素抽出部108は矩形メモリ107を参照し、抽出された矩形の中で幅と高さが規定した閾値よりも小さい矩形のみを点線要素として点線要素メモリ109に格納する。次に、点線罫線抽出部110は点線要素メモリ109を参照し、隣接する点線要素同士の間隔があらかじめ定められた閾値よりも小さい点線要素群を一本の点線候補として点線候補メモリ111に格納する。次に、点線罫線判断部112は、罫線以外の文字領域等から誤って点線を抽出することを避けるため、点線候補メモリ111に格納した点線候補の中で点線罫線らしいものだけを、点線罫線メモリ114に格納する。点線罫線らしさの判断は、分散計算部113で点線候補を構成する黒画素の幅と高さの分散値を求めた際、その分散値が所定の閾値を越える点線候補は点線罫線でないと判定することで行う。
【0007】
最後に罫線出力部115は、実線罫線メモリ105に格納した実線罫線のデータと、点線罫線メモリ114に格納した点線罫線のデータを、外部に出力する。
【0008】
【発明が解決しようとする課題】
上記のように構成される従来の罫線抽出方法では、注目する罫線方向に連続した黒画素を包含する矩形を生成し、抽出された矩形の中で幅と高さが規定された閾値よりも小さい矩形のみを点線要素としている。そのため、一点鎖線や破線のように、注目する罫線方向に連続する黒画素の幅が大きい場合、これらの罫線を抽出できないという問題がある。
【0009】
さらに、点線罫線判断部112では、点線候補を構成する黒画素の幅と高さの分散値が所定の閾値を越える点線候補は点線罫線でないと判断する。そのため、一点鎖線や二点鎖線のように罫線を構成する黒画素の幅がまちまちで、その分散値が大きくなる場合、罫線として抽出できない問題点がある。この問題点を避けるために分散値の閾値を大きく設定すると、罫線以外の周囲の領域(文字列等)から誤って余計な罫線が抽出される問題が生じる。
【0010】
加えて、従来の罫線抽出方法では、2値化した画像からしか罫線を抽出できない問題がある。
【0011】
本発明は、上述の問題を解決するためになされたものであり、2値画像と多値画像の双方から実線や点線,破線,一点鎖線,二点鎖線等のさまざまな罫線を抽出できる罫線抽出方法を提供することを目的とする。
【0012】
【課題を解決するための手段】
第1の発明にかかる罫線認識方法は、画像入力部で入力された画像を読み取り、画像入力部で読み取った画像をイメージメモリに格納し、イメージメモリに格納された画像を参照して、ポテンシャル算出部で画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求め、ポテンシャル算出部で求めたポテンシャルをポテンシャルメモリに格納し、ポテンシャルメモリに格納されたポテンシャルの値を、ポテンシャル更新部が状態方程式に従って変更し、その変更値を再度ポテンシャルメモリに格納し、ポテンシャルメモリに格納されたポテンシャルの値を基に罫線抽出部で画像上の罫線を抽出し、罫線抽出部で抽出された罫線の情報を罫線出力部が外部に出力するように構成され、ポテンシャル更新部が以下の式3に示す状態方程式に従い、ポテンシャルメモリに格納したポテンシャルの値を変更するように構成される。
【数5】
ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
【0013】
第2の発明にかかる罫線認識方法は、画像入力部で入力された画像を読み取り、画像入力部で読み取った画像をイメージメモリに格納し、イメージメモリに格納された画像を参照して、ポテンシャル算出部で画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求め、ポテンシャル算出部で求めたポテンシャルをポテンシャルメモリに格納し、ポテンシャルメモリに格納されたポテンシャルの値を、ポテンシャル更新部が状態方程式に従って変更し、その変更値を再度ポテンシャルメモリに格納し、ポテンシャルメモリに格納されたポテンシャルの値を基に罫線抽出部で画像上の罫線を抽出し、罫線種類判定部 は、前記の罫線抽出部で抽出された罫線から、罫線の外接矩形領域内の画像上で閾値以上の濃度を持つ画素の連続領域を罫線要素として抽出し、この罫線要素の長さの度数分布を求め、この度数分布と予め罫線の種類毎に用意した度数分布と比較することにより、罫線の種類を判別し、前記の罫線種類判定部で判別された罫線の情報を罫線出力部が外部に出力するように構成され、ポテンシャル更新部が以下の式3に示す状態方程式に従い、ポテンシャルメモリに格納したポテンシャルの値を変更するように構成される。
【数6】
ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
【0014】
第3の発明にかかる罫線認識方法におけるポテンシャル算出部においては、方向性を持ち大きさの異なる複数のマスクを画像に畳み込んだ結果からポテンシャルの値を算出するように構成され、罫線認識方法は、式1に基づいて、小領域(x,y)の中心にマスクの中心を合わせて、次の式1から方向性検出マスクを畳み込んだときのマスクの出力値O di rj (x,y)を求め、得られたマスクの出力値O di rj (x,y)から式2によって全領域のポテンシャルP di (x,y)を計算するように構成される。
di rj(x,y)= I(x,y)・Mdi rj (1)
di(x,y)= Max{ Odi rj(x,y))} (2)
ここで、i=1〜D,j=1〜R
ここで、Iは文書画像であり、I(x,y)・M di rj は小領域(x,y)の中心画素と方向性検出マスクM di rj の中心位置を合わせて、文書画像に方向性検出マスクを畳み込む処理を示す。O di rj (x,y)は、この畳み込み処理で計算されたマスク出力値である。ポテンシャルP di (x,y)は、同じ方向diを持ち、方向性検出マスクの大きさrjが異なるマスク出力値O di rj (x,y)の最大値である。
【0015】
第4の発明にかかる罫線認識装置は、画像を読み取る画像入力部と、画像入力部で読み取った画像を格納するイメージメモリと、イメージメモリに格納した画像を参照して画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求めるポテンシャル算出部と、ポテンシャル算出部で求めたポテンシャルを格納するポテンシャルメモリと、ポテンシャルメモリに格納したポテンシャルの値を、状態方程式に従い変更し、再度前記のポテンシャルメモリに格納するポテンシャル更新部と、ポテンシャルメモリに格納したポテンシャルの値を基に画像上の罫線を抽出する罫線抽出部と、罫線抽出部で抽出した罫線の情報を外部に出力する罫線出力部を備えるように構成され、ポテンシャル更新部は、ポテンシャルメモリに格納したポテンシャルの値を、以下の式3に示す状態方程式に従い変更するように構成される。
【数7】
ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
【0016】
第5の発明にかかる罫線認識装置は、画像を読み取る画像入力部と、画像入力部で読み取った画像を格納するイメージメモリと、イメージメモリに格納した画像を参照して画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求めるポテンシャル算出部と、ポテンシャル算出部で求めたポテンシャルを格納するポテンシャルメモリと、ポテンシャルメモリに格納したポテンシャルの値を、状態方程式に従い変更し、再度前記のポテンシャルメモリに格納するポテンシャル更新部と、ポテンシャルメモリに格納したポテンシャルの値を基に画像上の罫線を抽出する罫線抽出部と、罫線の外接矩形領域内の画像上で閾値以上の濃度を持つ画素の連続領域を罫線要素として抽出し、この罫線要素の長さの度数分布を求め、この度数分布と予め罫線の種類毎に用意した度数分布と比較することにより、罫線の種類を判別する罫線種類判定部と、罫線種類判定部で判定した罫線の情報を外部に出力する罫線出力部とを備えるように構成され、ポテンシャル更新部は、ポテンシャルメモリに格納したポテンシャルの値を、以下の式3に示す状態方程式に従い変更するように構成される。
【数8】
ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
【0017】
第6の発明にかかる罫線認識装置におけるポテンシャル算出部は、方向性を持ち大きさの異なる複数のマスクを画像に畳み込んだ結果からポテンシャルの値を算出するように構成され、ポテンシャル算出部は、式1に基づいて、小領域(x,y)の中心にマスクの中心を合わせて、次の式1から方向性検出マスクを畳み込んだときのマスクの出力値O di rj (x,y)を求め、得られたマスクの出力値O di rj (x,y)から式2によって全領域のポテンシャルP di (x,y)を計算するように構成される。
di rj(x,y)= I(x,y)・Mdi rj (1)
di(x,y)= Max{ Odi rj(x,y))} (2)
ここで、i=1〜D,j=1〜R
ここで、Iは文書画像であり、I(x,y)・M di rj は小領域(x,y)の中心画素と方向性検出マスクM di rj の中心位置を合わせて、文書画像に方向性検出マスクを畳み込む処理を示す。O di rj (x,y)は、この畳み込み処理で計算されたマスク出力値である。ポテンシャルP di (x,y)は、同じ方向diを持ち、方向性検出マスクの大きさrjが異なるマスク出力値O di rj (x,y)の最大値である。
【0018】
【発明の実施の形態】
実施の形態1.
本発明の実施の形態1の罫線抽出方法について図1から図5を用いて説明する。図1はこの実施の形態1の罫線抽出方法を実現するための機能ブロックを示す図である。図1中、図13に示す前記従来例と同一または相当部分は同一の符号を付しその説明を省略する。図1において、201は画像を読み取るための画像入力部、202は読み取った画像を格納するイメージメモリ、203はイメージメモリ202に格納した画像を参照して画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求めるポテンシャル算出部、204はポテンシャル算出部203で求めたポテンシャルを格納するポテンシャルメモリ、206はポテンシャルメモリ204に格納したポテンシャルの値をもとに画像上の罫線を抽出する罫線抽出部である。
【0019】
図2は、ポテンシャル算出部203の動作を説明するフローチャートである。図2については以下で詳細に説明する。
【0020】
図3は、ポテンシャル算出部203で用いる方向性検出マスクの一例である。図3において、301〜303は横の方向性を持つ方向性検出マスク、304〜306は縦の方向性を持つ方向性検出マスク、307〜309は斜め方向性を持つ方向性検出マスクの例である。方向性検出マスク301,304,307はそれぞれ3×3のマトリクスを構成する画素から構成される。方向性検出マスク302,305,308はそれぞれ5×5のマトリクスを構成する画素から構成される。方向性検出マスク303,306,309はそれぞれ7×7のマトリクスを構成する画素から構成される。
【0021】
図4は、縦横方向の罫線を含む文書画像の例であり、401と403は小さい方向性検出マスクを、402と404は大きい方向性検出マスクを示す。410は「ユーザサポート用紙」の文字部分を示し、411は横実線罫線を示し、412,413,414はそれぞれ横点線罫線を示し、420,421はそれぞれ縦実線罫線を示し、423,424,425,426はそれぞれ縦点線罫線を示す。
【0022】
図5は、ポテンシャル算出部203において文書画像例(図4)から求めたポテンシャルを示す。図5において、500は図4の用紙全体に対応して検出された横方向のポテンシャルのみを示し、501は「ユーザサポート用紙」の文字列領域部分410から抽出された横ポテンシャル、502は横実線罫線411から抽出された横ポテンシャル、503,504,505はそれぞれ横点線罫線412,413,414から抽出された横ポテンシャル、506部分は一点鎖線414から抽出した部分的な横ポテンシャルである。一方、520は図4の用紙全体に対応して検出された縦方向のポテンシャルのみを示し、521,522はそれぞれ縦実線罫線420,421から抽出された縦ポテンシャル、523,524,525,526はそれぞれ縦点線罫線423,424,425,426から抽出された縦ポテンシャル、527は「ユーザサポート用紙」の文字列領域部分410からから抽出された縦ポテンシャルである。
【0023】
以下に図1乃至図5を用いて、本実施の形態1の罫線抽出方法の動作を説明する。まず、図1中の画像入力部201は、イメージスキャナやファクシミリ等で文書を読み取って多値、もしくは2値の文書画像を作成し、イメージメモリ202に格納する。
【0024】
次に、ポテンシャル算出部203は、イメージメモリ202に格納された文書画像を基に、そのポテンシャルの状態を求め、その結果をポテンシャルメモリ204に格納する。このポテンシャル算出部203の動作を、図2のフローチャートに従って説明する。
【0025】
まず、ステップS1では、方向性diと大きさrjを持つ複数の方向性検出マスクMdi rjを作成する(i=1〜D、j=1〜R)。ここで、方向性検出マスクMdi rjは(2j+1)×(2j+1)サイズの2次元マスクである。
【0026】
例えば、R=3{r1=3,r2=5,r3=7}、D=3{d1=横方向,d2=右上方向,d3=縦方向}における方向性検出マスクの例を図3に示す。図3において、方向性検出マスク上の黒い四角形は正の値、灰色の四角形はゼロ、白い四角形は負の値を示す。横方向を持つ方向性検出マスク301〜303では、黒い四角が横方向に並び、同じく縦方向を持つ方向性検出マスク304〜306では、黒い四角が縦方向に並ぶ。
【0027】
次に、ステップS2では、画像入力部201で読み取られイメージメモリ202に蓄えられた文書画像を参照し、その文書画像をM×M個の小領域に分割する。
【0028】
次に、ステップS3とS4では、変数xをx=1〜Mまで変化させ、変数yをy=1〜Mまで変化させることによってM×M個の小領域全体をスキャンするようにループを作る。
【0029】
次に、ステップS5では、小領域(x,y)の中心にマスクの中心を合わせて、ステップS1で作成した各方向性検出マスクを畳み込み、マスクの出力値Odi rj(x,y)を求める。この処理は次の式1で表わすことができる。
di rj(x,y)= I(x,y)・Mdi rj (1)
ここで、i=1〜D,j=1〜R
【0030】
式1において、I(x,y)は点x,yにおける文書画像であり、この文書画像上の黒画素は大きな正の値を、白画素がゼロ又は小さな正の値を持つ。Mdi rjは、di方向の(2j+1)×(2j+1)の面積を有する方向性検出マスクである。I(x,y)・Mdi rjは小領域(x,y)(画素または所定の大きさの画素の集合のいずれでもよい)の中心画素と方向性検出マスクMdi rjの中心位置を合わせて、文書画像に方向性検出マスクを畳み込む(重ね合わせる)処理を示す。Odi rj(x,y)は、この畳み込み処理で計算されたマスク出力値である。例えば、図4上で、x軸y軸がそれぞれ8,5および9,5で特定される小領域(8,5)および(9,5)では横方向の罫線が横切っているので、この場合は、たとえば、図3の横方向マスク301の中央の黒線部分が小領域(8,5),(9,5),(10,5)の上になるように重ね合わせると、横方向のマスク出力値Odi rj(x,y)が図5の小領域(8,5),(9,5)上に大きく出力される。出力値Odi rj(x,y)が大きいので、式1と式2から計算されたポテンシャルPdi(x,y)は、図5(a)上では黒色で表示される。
【0031】
一方、上と同様に、図4上の同じ領域に図3の縦方向マスク304を重ね合わせると、罫線が横方向であるために、縦方向のマスク出力値Odi rj(x,y)は小さく出力される。出力値Odi rj(x,y)が小さいので、式1と式2から計算されたポテンシャルPdi(x,y)は、図5(b)上では白色で表示される。このように、小領域(8,5)および(9,5)では、マスク出力値Odi rj(x,y)は、diが横方向の場合は大きく、diが縦方向の場合は小さくなることが分かる。同様に、小領域(x,y)の近傍に罫線が無い場合や、罫線以外の要素(文字列等)がある場合、マスク出力値は小さな値を取る。このような畳込みを図4に示す領域全体について行って得られたマスク出力値Odi rj(x,y)が図5(a)および図5(b)に示される。
【0032】
次に、ステップS6では、マスク出力値Odi rj(x,y)から、小領域(x,y)が持つポテンシャルPdi(x,y)を求める。ここで、Pdi(x,y)は、小領域(x,y)が持つ方向性の強さを示す値であり、次の式2に従って求める。
di(x,y)= Max{ Odi rj(x,y))} (2)
ここで、i=1〜D,j=1〜R
【0033】
式2では、同じ方向diを持ち、方向性検出マスクの大きさrjが異なるマスク出力値Odi rj(x,y)の最大値がPdi(x,y)として得られる。式2において、たとえば、方向diにおいて、jを1からRまで変化させることによって、方向性検出マスクの大きさrjを変化させ、各方向diについてのマスク出力値Odi rj(x,y)を計算し、その最大値を各方向diについてのポテンシャルPdi(x,y)として求める。ここで、さらに、iを1からDまで変化させることによって、各方向のdiについての最大ポテンシャルPdi(x,y)を求める。このような演算を行うことによって、小領域(x,y)を方向diの罫線が横切る際、その罫線の種類(点線、破線、実線、一点鎖線等)によらず、ポテンシャルPdi(x,y)の値を高くすることができる。
【0034】
例えば、文書画像例(図4)において、小領域(x,y)を破線が横切る領域に注目する。ここで大きな方向性検出マスク402は、そのサイズ内に破線の一部しか含まないためにマスク出力値は小さい。しかし、小さな方向性検出マスク401(jが小さい)では、そのサイズいっぱいに破線を構成する黒線が含まれるためマスク出力値は大きい。逆に、大きな方向性検出マスク404(jが大きい)では、そのサイズ内にある程度の黒線が含まれるためマスク出力値は大きいが、小さい方向性検出マスク403(jが小さい)では、サイズ内に黒線がなくマスク出力値は小さい。同様に、小領域(x,y)を点線が横切る場合を考える。ここで小さな方向性検出マスクのサイズ内には、1又は2点の黒点しかないためマスク出力値は小さい。しかし大きな方向性検出マスクのサイズ内には多くの黒点が並んでいるためマスク出力値が大きくなる。
【0035】
このように、小領域(x,y)を方向diの罫線が横切る場合、サイズの異なる方向性検出マスクのいずれかが大きなマスク出力値を持つ。そのためにポテンシャルPdi(x,y)の値は大きくなる。
【0036】
以降、ステップS7およびステップS8では、各々yとxの値を1づつ歩進した後に、それぞれステップS4およびS3に戻ることによって、全ての小領域のポテンシャルを求める。上述のように、図5(a),(b)は文書画像例(図4)に本処理を適用して得たポテンシャルを示す。図5(a)において、500は横方向(di=1)のポテンシャルPdi(x,y)、図5(b)において、520は縦方向(di=3)のポテンシャルPdi(x,y)を示す。ここで小さな四角形が各小領域(x,y)を示し、四角形内部の色は、その小領域が持つポテンシャルの値を表わす(黒色部分が最大のポテンシャル値を有し、灰色部分は中間のポテンシャル値を有し、白色部分は最小のポテンシャル値を有する)。
【0037】
最後にステップS9では、求めたポテンシャル値をポテンシャルメモリ204に格納し、ポテンシャル算出部203の処理を終わる。
【0038】
次に、図1の罫線抽出部206は、ポテンシャルメモリ204を参照して罫線を抽出し、罫線のデータを罫線出力部115に送出する。具体的には、まずポテンシャルメモリ204に格納したdi方向を持つポテンシャルPdiをdi方向に走査し、ある閾値以上のPdiの値を持つ小領域が連続する領域を黒ランとして抽出する。次に、抽出した黒ランに対してラベリングを行い、同じラベルの値を持つ黒ラン群を包括する外接矩形を1本の罫線とする。この処理を全てのdi方向(i=1〜D)に対して行うことで、帳票画像上にある様々な方向を持った罫線を抽出する。その後、罫線抽出部206は、抽出した罫線のデータ(外接矩形の左上点、幅および高さ等)を罫線出力部115に送出する。罫線出力部115は、罫線抽出部206で得た罫線データを外部に出力する。
【0039】
本発明の実施の形態1の罫線抽出方法によれば、大きさの異なる複数の方向性検出マスクから得られたマスク出力値を基に、画像上の小領域が持つポテンシャルの値を求める。そのため小領域上を罫線が横切る場合、罫線の種類によらず、安定的に高いポテンシャルの値が得られる。そのため点線や破線,一点鎖線等の様々な罫線を誤り無く抽出できる。
【0040】
さらに、方向性検出マスクと文書画像との畳み込み処理により各小領域が持つポテンシャルの値を算出する。マスクの畳み込みは2値画像と多値画像双方で可能な処理であるため、文書画像が2値や多値でも罫線を抽出できる。
【0041】
実施の形態2.
実施の形態2においては、上記の実施の形態1の罫線抽出方法に、ポテンシャルメモリに格納したポテンシャルの値を更新するためのポテンシャル更新部を加えたものである。このような構成とすることによって、罫線を構成する黒線と黒線の間隔が最も大きな方向性検出マスクより広い実線以外の罫線(点線や破線,一点鎖線等)の場合でも、誤り無く抽出することができる。また、罫線以外の領域(文字列等)で高いポテンシャルの値が検出された場合でも、誤って余計な罫線を抽出することもなくなる。以下、本発明の実施の形態2の罫線抽出方法について、図6乃至図8を用いて説明する。
【0042】
図6は、実施の形態2の罫線抽出方法を実現する機能ブロックを示す図である。図6中、前記実施の形態1と同一または相当部分は同一の符号を付し、その説明を省略する。図6において、205はポテンシャルメモリに格納したポテンシャルの値を更新するポテンシャル更新部である。
【0043】
図7において、700は、図5に示すポテンシャルにポテンシャル更新部205によって、図4の用紙全体に対応して演算された横方向のポテンシャルを示す。702は横実線罫線502から演算された横ポテンシャル、703,704,705はそれぞれ図5の横点線罫線503,504,505から演算された横ポテンシャル、706部分は図5の一点鎖線506部分から演算された横ポテンシャルである。一方、720は、図5に示すポテンシャルにポテンシャル更新部205によって、図4の用紙全体に対応して演算された縦方向のポテンシャルを示す。721,722はそれぞれ図5の縦実線罫線521,522から演算された縦ポテンシャル、723,724,725,726はそれぞれ図5の縦点線罫線523,524,525,526から演算された縦ポテンシャルである。
【0044】
図8は、図7に示したポテンシャルの状態を基に罫線抽出部206が抽出した罫線である。図8中の罫線は、図7の各横および縦のポテンシャルの外郭から得られた罫線を示す。811は横実線罫線を示し、812,813,814はそれぞれ横点線罫線を示し、820,821はそれぞれ縦実線罫線を示し、823,824,825,826は、それぞれ縦点線罫線を示す。
【0045】
以下に、図6乃至図8を用いて、本実施の形態2の罫線抽出方法の動作を説明する。ここでポテンシャル更新部205は、ポテンシャルメモリ204を参照して、ポテンシャル算出部203で求めたポテンシャルの値を更新する。更新したポテンシャルの値を再びポテンシャルメモリ204に格納する。具体的には、ポテンシャル更新部205は、例えば、次の式3の状態方程式に従ってポテンシャルの値を更新する。
【0046】
【数9】
【0047】
ここで、τは時定数、tは更新回数、Φxyは小領域(x,y)の近傍領域、CとZは正の定数である。U(x,y)はポテンシャルPdi(x,y)の関数であり、Pdi(x,y)の値が発散しないようにする働きを持つ。またWdi(x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す。具体的に、Wdi(x’,y’)は小領域(x’,y’)が小領域(x,y)からdi方向に位置する場合は正の値を、その他の場合は0の値を持つ。Wdi(x’,y’)の働きにより、小領域(x,y)が持つポテンシャルPdi(x,y)は、そこからdi方向に位置する小領域(x’,y’)が持つポテンシャルPdi(x’,y’)により強められる。
【0048】
式3の状態方程式に従って状態を更新すると、ポテンシャルの値は徐々に変化し、安定状態へと収束する。ここで小領域(x,y)からdi方向に位置する複数個の小領域(x’,y’)が持つPdi(x’,y’)の値が高い場合は、Pdi(x,y)の値は徐々に増加する。逆に、小領域(x’,y’)が持つPdi(x’,y’)の値が小さい場合は、Pdi(x,y)の値は、式3の定数Cと時定数τの働きで徐々に減少する。例えば、初期のポテンシャル(図5)に対して本処理を適用すると、図7に示すポテンシャルに収束する。図7(a)において、700はdiが横方向のポテンシャル、図7(b)において、720はdiが縦方向のポテンシャルである。
【0049】
次に、状態方程式に従いポテンシャルの状態を更新することの効果を具体的に述べる。まず、小領域(x,y)上をdi方向の長い罫線が横切る場合を考える。この時、小領域(x,y)からdi方向に位置する複数個の小領域(x’,y’)が持つPdi(x’,y’)の値は高い。そのため小領域(x,y)が持つPdi(x,y)の値は徐々に増加する。例えば、図5(a)に示す初期のポテンシャルにおいて、一点鎖線上の小領域506が持つポテンシャルの値は小さいが、状態を更新することにより、ポテンシャルの値は、図5と比べると分かるように、図7(a)の706のように全体的に高くなる。逆に、図5(a)の小領域507のように、小領域(x,y)上に罫線がない場合は、Pdi(x’,y’)の値が小さく、そのため図7(a)の707の小領域に示すように、Pdi(x,y)の値は徐々に減少し、最終的には消失する。
【0050】
同様に、小領域(x,y)上に、di方向に伸びた文字列がある場合、小領域(x,y)からdi方向に位置する複数個の小領域(x’,y’)が持つポテンシャルPdi(x’,y’)は一部に高い値を持つが、全体的には低い。そのためPdi(x,y)の値は徐々に減少する。例えば、図5(a)の初期のポテンシャルにおいて、文字列領域上の小領域501は、一部に高いポテンシャルの値を持つ。しかし状態を更新することによって、ポテンシャルの値は図7(a)の701に示すように小さくなる。
【0051】
その後、罫線抽出部206は、実施の形態1と同様に、ポテンシャルメモリ204に格納されたポテンシャルの値を参照して罫線を抽出する。例えば、ポテンシャル更新部205で更新したポテンシャル(図7)に本処理を適用すると、図8に示す罫線群が抽出される。この場合、図8に示すように、罫線群としては、罫線の外接矩形が抽出される。
【0052】
実施の形態2によれば、式3の状態方程式に従ってポテンシャルの値を更新することにより、罫線以外の領域が持つポテンシャルの値は減少する。逆に、罫線上の領域が持つポテンシャルの値は増加する。特に、実線以外の罫線(点線や破線,一点鎖線等)において、罫線を構成する黒線と黒線の間隔が広いためにポテンシャルの値が小さい白画素の領域でも、状態を更新するに従ってポテンシャルの値が増加する。そのため、罫線以外の領域(文字列等)から誤って余計な罫線を抽出する問題を避け、かつ点線や破線,一点鎖線等の様々な罫線を精度良く抽出できる。
【0053】
実施の形態3.
実施の形態1と2では、様々な種類の罫線を抽出できるが、その罫線の種類を判別することは難しい。そこで罫線の種類を判別するための罫線種別判定部を加えた例が実施の形態3である。以下、本発明の実施の形態3を図9乃至図12に基づいて説明する。
【0054】
図9は実施の形態2の罫線抽出処理に罫線種別判定部を加えた構成を示すブロック図である。図9において、図6と同一または相当部分は同一の符号を付し、その説明を省略する。ここで901は罫線の種類を判別する罫線種類判定部である。
【0055】
図10は罫線要素の抽出例である。図10において、1001は罫線の外接矩形領域内にある文書画像、1002はその文書画像中の一個の罫線要素、たとえば、一点鎖線を示す図である。図10において、一点鎖線はa2の長さを有する長線とa1の長さを有する短線a2とから構成される。図11は、図10中の罫線要素の長さの度数分布を示す図である。図11において、横軸は一点鎖線の罫線要素の長さaを示し、縦軸は一点鎖線の特定の長さの罫線要素が生じる度数を示す。横軸に長さa1を中心に短い方の罫線要素が分布し、a2を中心に長い方の罫線要素が分布していることが分かる。ここで、a1およびa2の部分のみでなく、その周囲に罫線要素の発生が分布しているのは、それぞれの検出された罫線要素の長さにバラツキがあるためである。
【0056】
罫線種類判定部901は、イメージメモリ202を参照して、罫線抽出部206で得た各罫線の外接矩形領域内にある文書画像1001を抽出する。次に、文書画像1001の内部を走査し、濃度が閾値以上の画素をラベリングする。ここで同じラベルを持つ画素の集合を罫線要素とする。図10中の1002は一個の罫線要素を示す。次に、各罫線要素の長さの度数分布(図11)を作成する。次に、この度数分布と、予め罫線の種類毎に用意した度数分布とを比較する。検出された形状の度数分布が最も類似する罫線の度数分布から、その罫線の種類(たとえば、点線、破線,一点鎖線等)を決定する。罫線種類判定部901は、求めた罫線のデータ(罫線の外接矩形左上点と幅高さ、および罫線の種類)を罫線出力部115に送出する。罫線出力部115は、罫線種類判定部901で得た罫線データを外部に出力する。
【0057】
ここで度数分布の類似性は、例えば以下の方法で判定する。図12は検出された罫線要素の特徴ベクトルと予め用意された罫線要素の特徴ベクトルを示す図である。図12(a)は、図11の罫線の長さを示す水平軸をM個のエリアに分割し、各エリアに含まれる罫線発生度数から作成されたM次元の特徴ベクトルである。同様に、図12(b)は、予め罫線の種類毎に用意した度数分布から作成されたM次元の特徴ベクトルである。これらの、図12(a)および図12(b)の2つの特徴ベクトルを用いて、一般的なベクトル間の距離計算法である2つの特徴ベクトルの差を求めるシテイブロック距離法や2つの特徴ベクトルの差の2乗を求めるユークリッド距離法等によって、2つの特徴ベクトル間の距離を求める。そして距離値が小さいほど類似性が高いと判定することによって、検出された罫線要素が予め用意されたどの罫線要素に該当するかを判定する。
【0058】
実施の形態3によれば、罫線の外接矩形領域内の画像上で閾値以上の濃度を持つ画素をラベリングして罫線要素を抽出し、この罫線要素の長さの度数分布を求め、この度数分布と予め罫線の種類毎に用意した度数分布と比較して、その類似性を調べることで、罫線の種類を判定できる。
【0059】
【発明の効果】
以上説明したように、本発明によれば以下の効果を得ることができる。
および第の発明によれば、画像を読み取る画像入力部と、読み取った画像を格納するイメージメモリと、イメージメモリに格納した画像を参照して画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求めるポテンシャル算出部と、求めたポテンシャルを格納するポテンシャルメモリと、ポテンシャルメモリに格納したポテンシャルの値を基に画像上の罫線を抽出する罫線抽出部と、抽出した罫線の情報を外部に出力する罫線出力部を備えると共に、更に、ポテンシャルメモリに格納したポテンシャルの値を状態方程式に従い変更するポテンシャル更新部を追加し、ポテンシャルメモリに格納したポテンシャルの値を、ポテンシャル更新部が以下の式3に示す状態方程式に従い変更するように構成されるので、実線以外の罫線(点線や破線,一点鎖線等)をより精度良く抽出し、かつ罫線領域でない領域からの余分な情報を抽出しないようにできる。
【数10】
ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
【0060】
および第の発明によれば、第1および第4の発明に、罫線の外接矩形領域内の画像上で閾値以上の濃度を持つ画素をラベリングして罫線要素を抽出し、この罫線要素の長さの度数分布を求め、この度数分布と予め罫線の種類毎に用意した度数分布と比較することにより、罫線の種類を判別する罫線種類判定部を追加し、ポテンシャルメモリに格納したポテンシャルの値を、ポテンシャル更新部が以下の式3に示す状態方程式に従い変更するように構成されるので、実線以外の罫線(点線や破線,一点鎖線等)をより精度良く抽出し、かつ罫線領域でない領域からの余分な情報を抽出しないようにできる。
【数11】
ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
【0061】
および第の発明によれば、ポテンシャル算出部は、方向性を持ち、大きさの異なる複数のマスクを画像に畳み込んだ結果からポテンシャルの値を算出し、式1に基づいて、小領域(x,y)の中心にマスクの中心を合わせて、方向性検出マスクを畳み込んだときのマスクの出力値O di rj (x,y)を求め、得られたマスクの出力値O di rj (x,y)から式2によって全領域のポテンシャルP di (x,y)を計算するため、2値画像および多値画像のどちらからでも罫線を抽出できる。
di rj(x,y)= I(x,y)・Mdi rj (1)
di(x,y)= Max{ Odi rj(x,y))} (2)
ここで、i=1〜D,j=1〜R
ここで、Iは文書画像であり、I(x,y)・M di rj は小領域(x,y)の中心画素と方向性検出マスクM di rj の中心位置を合わせて、文書画像に方向性検出マスクを畳み込む処理を示す。O di rj (x,y)は、この畳み込み処理で計算されたマスク出力値である。ポテンシャルP di (x,y)は、同じ方向diを持ち、方向性検出マスクの大きさrjが異なるマスク出力値O di rj (x,y)の最大値である。
【図面の簡単な説明】
【図1】実施の形態1の罫線抽出方法を実現するブロック構成を示す図である。
【図2】実施の形態1に記載したポテンシャル算出部のフローチャートを示す図である。
【図3】実施の形態1に記載した方向性検出マスクの例を示す図である。
【図4】実施の形態1に記載した文書の画像例を示す図である。
【図5】実施の形態1に記載したポテンシャルの状態を示す図である。
【図6】実施の形態2の罫線抽出方法を実現するブロック構成を示す図である。
【図7】実施の形態2に記載したポテンシャルの状態を示す図である。
【図8】実施の形態2に記載した罫線抽出結果の例を示す図である。
【図9】実施の形態3の罫線抽出方法を実現するブロック構成を示す図である。
【図10】実施の形態3に記載した罫線要素の例を示す図である。
【図11】実施の形態3に記載した度数分布の例を示す図である。
【図12】実施の形態3における度数分布の類似性を判定する方法を概念的に説明する図である。
【図13】従来装置の構成を示すブロック図である。
【符号の説明】
115 罫線出力部、201 画像入力部、202 イメージメモリ、203ポテンシャル算出部、204 ポテンシャルメモリ、205 ポテンシャル更新部、206 罫線抽出部、301〜303 横方向性を持つ方向性検出マスクの例、304〜306 縦方向性を持つ方向性検出マスクの例、307〜309斜め方向性を持つ方向性検出マスクの例、401,403 小さい方向性検出マスク、402,404 大きい方向性検出マスク、500 横方向を持つポテンシャル、520 縦方向を持つポテンシャル、700 横方向を持つポテンシャル、720 縦方向を持つポテンシャル、901 罫線種類判定部、1001罫線の外接矩形領域内にある文書画像、1002 罫線要素

Claims (6)

  1. 画像入力部で入力された画像を読み取り、
    画像入力部で読み取った画像をイメージメモリに格納し、
    イメージメモリに格納された画像を参照して、ポテンシャル算出部で画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求め、
    ポテンシャル算出部で求めたポテンシャルをポテンシャルメモリに格納し、
    ポテンシャルメモリに格納されたポテンシャルの値を、ポテンシャル更新部が状態方程式に従って変更し、その変更値を再度ポテンシャルメモリに格納し、
    ポテンシャルメモリに格納されたポテンシャルの値を基に罫線抽出部で画像上の罫線を抽出し、
    罫線抽出部で抽出された罫線の情報を罫線出力部が外部に出力する罫線抽出方法であり、
    前記ポテンシャルメモリに格納したポテンシャルの値を、ポテンシャル更新部が以下の式3に示す状態方程式に従い変更することを特徴とする罫線抽出方法。
    ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
  2. 画像入力部で入力された画像を読み取り、
    画像入力部で読み取った画像をイメージメモリに格納し、
    イメージメモリに格納された画像を参照して、ポテンシャル算出部で画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求め、
    ポテンシャル算出部で求めたポテンシャルをポテンシャルメモリに格納し、
    ポテンシャルメモリに格納されたポテンシャルの値を、ポテンシャル更新部が状態方程式に従って変更し、その変更値を再度ポテンシャルメモリに格納し、
    ポテンシャルメモリに格納されたポテンシャルの値を基に罫線抽出部で画像上の罫線を抽出し、
    罫線種類判定部で、前記の罫線抽出部で抽出された罫線から、罫線の外接矩形領域内の画像上で閾値以上の濃度を持つ画素の連続領域を罫線要素として抽出し、この罫線要素の長さの度数分布を求め、この度数分布と予め罫線の種類毎に用意した度数分布と比較することにより、罫線の種類を判別し、
    前記の罫線種類判定部で判別された罫線の情報を罫線出力部が外部に出力する罫線抽出方法であり、
    前記ポテンシャルメモリに格納したポテンシャルの値を、ポテンシャル更新部が以下の式3に示す状態方程式に従い変更することを特徴とする罫線抽出方法。
    ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは
    正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
  3. 前記のポテンシャル算出部においては、方向性を持ち大きさの異なる複数のマスクを画像に畳み込んだ結果からポテンシャルの値を算出し、
    式1に基づいて、小領域(x,y)の中心にマスクの中心を合わせて、次の式1から方向性検出マスクを畳み込んだときのマスクの出力値O di rj (x,y)を求め、得られたマスクの出力値O di rj (x,y)から式2によって全領域のポテンシャルP di (x,y)を計算することを特徴とする請求項1または2に記載の罫線抽出方法。
    di rj(x,y)= I(x,y)・Mdi rj (1)
    di(x,y)= Max{ Odi rj(x,y))} (2)
    ここで、i=1〜D,j=1〜R
    ここで、Iは文書画像であり、I(x,y)・M di rj は小領域(x,y)の中心画素と方向性検出マスクM di rj の中心位置を合わせて、文書画像に方向性検出マスクを畳み込む処理を示す。O di rj (x,y)は、この畳み込み処理で計算されたマスク出力値である。ポテンシャルP di (x,y)は、同じ方向diを持ち、方向性検出マスクの大きさrjが異なるマスク出力値O di rj (x,y)の最大値である。
  4. 画像を読み取る画像入力部と、
    画像入力部で読み取った画像を格納するイメージメモリと、
    イメージメモリに格納した画像を参照して画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求めるポテンシャル算出部と、
    ポテンシャル算出部で求めたポテンシャルを格納するポテンシャルメモリと、
    ポテンシャルメモリに格納したポテンシャルの値を、状態方程式に従い変更し、再度前記のポテンシャルメモリに格納するポテンシャル更新部と、
    ポテンシャルメモリに格納したポテンシャルの値を基に画像上の罫線を抽出する罫線抽出部と、
    罫線抽出部で抽出した罫線の情報を外部に出力する罫線出力部を備え、
    前記のポテンシャル更新部は、ポテンシャルメモリに格納したポテンシャルの値を、以下の式3に示す状態方程式に従い変更することを特徴とする罫線抽出装置。
    ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
  5. 画像を読み取る画像入力部と、
    画像入力部で読み取った画像を格納するイメージメモリと、
    イメージメモリに格納した画像を参照して画像上の各領域毎に局所的な方向性の強さを示すポテンシャルを求めるポテンシャル算出部と、
    ポテンシャル算出部で求めたポテンシャルを格納するポテンシャルメモリと、
    ポテンシャルメモリに格納したポテンシャルの値を、状態方程式に従い変更し、再度前記のポテンシャルメモリに格納するポテンシャル更新部と、
    ポテンシャルメモリに格納したポテンシャルの値を基に画像上の罫線を抽出する罫線抽出部と、
    罫線の外接矩形領域内の画像上で閾値以上の濃度を持つ画素の連続領域を罫線要素として抽出し、この罫線要素の長さの度数分布を求め、この度数分布と予め罫線の種類毎に用意した度数分布と比較することにより、罫線の種類を判別する罫線種類判定部と、
    罫線種類判定部で判定した罫線の情報を外部に出力する罫線出力部を備え、
    前記のポテンシャル更新部は、ポテンシャルメモリに格納したポテンシャルの値を、以下の式3に示す状態方程式に従い変更することを特徴とする罫線抽出装置。
    ここで、τは時定数、tは更新回数、Φ xy は小領域(x,y)の近傍領域、CとZは正の定数、P di (x,y)はポテンシャル、U(x,y)はポテンシャルP di (x,y)の関数、W di (x’,y’)は小領域(x’,y’)が小領域(x,y)に及ぼす影響を示す関数である。
  6. 前記のポテンシャル算出部は、方向性を持ち大きさの異なる複数のマスクを画像に畳み込んだ結果からポテンシャルの値を算出するように構成され、
    前記のポテンシャル算出部は、小領域(x,y)の中心にマスクの中心を合わせて、方向性検出マスクを畳み込みこむことによってマスクの出力値O di rj (x,y)を次の式1から求め、得られたマスクの出力値O di rj (x,y)から式2によって全領域のポテンシャルP di (x,y)を計算することを特徴とする請求項4または5に記載の罫線抽出装置。
    di rj(x,y)= I(x,y)・Mdi rj (1)
    di(x,y)= Max{ Odi rj(x,y))} (2)
    ここで、i=1〜D,j=1〜R
    ここで、Iは文書画像であり、I(x,y)・M di rj は小領域(x,y)の中心画素と方向性検出マスクM di rj の中心位置を合わせて、文書画像に方向性検出マスクを畳み込む処理を示す。O di rj (x,y)は、この畳み込み処理で計算されたマスク出力値である。ポテンシャルP di (x,y)は、同じ方向diを持ち、方向性検出マスクの大きさrjが異なるマスク出力値O di rj (x,y)の最大値である。
JP02977798A 1998-02-12 1998-02-12 罫線抽出方法および装置 Expired - Lifetime JP3551004B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02977798A JP3551004B2 (ja) 1998-02-12 1998-02-12 罫線抽出方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02977798A JP3551004B2 (ja) 1998-02-12 1998-02-12 罫線抽出方法および装置

Publications (2)

Publication Number Publication Date
JPH11232457A JPH11232457A (ja) 1999-08-27
JP3551004B2 true JP3551004B2 (ja) 2004-08-04

Family

ID=12285461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02977798A Expired - Lifetime JP3551004B2 (ja) 1998-02-12 1998-02-12 罫線抽出方法および装置

Country Status (1)

Country Link
JP (1) JP3551004B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4791295B2 (ja) * 2006-08-31 2011-10-12 富士通株式会社 罫線抽出プログラム、罫線抽出装置、罫線抽出方法

Also Published As

Publication number Publication date
JPH11232457A (ja) 1999-08-27

Similar Documents

Publication Publication Date Title
US6185341B1 (en) Image processing using vector data to reduce noise
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
RU2621601C1 (ru) Устранение искривлений изображения документа
CN101697228A (zh) 一种文本图像处理方法
US6968085B2 (en) Document matching and annotation lifting
US6947596B2 (en) Character recognition method, program and recording medium
US7680329B2 (en) Character recognition apparatus and character recognition method
US8150185B2 (en) Image processing for generating a thin line binary image and extracting vectors
JPH09311905A (ja) 行検出方法および文字認識装置
JP3551004B2 (ja) 罫線抽出方法および装置
JP3006466B2 (ja) 文字入力装置
JP2006309402A (ja) 文字列認識方法、ナンバープレート認識方法、及び装置
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
US20020164087A1 (en) System and method for fast rotation of binary images using block matching method
JP2000076378A (ja) 文字認識方法
JP2899383B2 (ja) 文字切出し装置
JP2715930B2 (ja) 線分検出方法
JP3100825B2 (ja) 線認識方法
KR100226804B1 (ko) 문서형식 판별방법
JP2022041468A (ja) 識別方法、情報処理システム、方法、およびプログラム
JP3210224B2 (ja) 文字認識装置
AU742875B2 (en) Method and apparatus for generating a distance image of an original image
JPH09147125A (ja) 輪郭線抽出方法と抽出装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20031217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040412

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term