JPH11232457A - 罫線抽出方法および装置 - Google Patents

罫線抽出方法および装置

Info

Publication number
JPH11232457A
JPH11232457A JP2977798A JP2977798A JPH11232457A JP H11232457 A JPH11232457 A JP H11232457A JP 2977798 A JP2977798 A JP 2977798A JP 2977798 A JP2977798 A JP 2977798A JP H11232457 A JPH11232457 A JP H11232457A
Authority
JP
Japan
Prior art keywords
potential
image
ruled line
memory
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2977798A
Other languages
English (en)
Other versions
JP3551004B2 (ja
Inventor
Takashi Hirano
敬 平野
Yasuhiro Okada
康裕 岡田
Fumio Yoda
文夫 依田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP02977798A priority Critical patent/JP3551004B2/ja
Publication of JPH11232457A publication Critical patent/JPH11232457A/ja
Application granted granted Critical
Publication of JP3551004B2 publication Critical patent/JP3551004B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 画像から、余計な罫線を誤って抽出すること
なく、様々な種類の罫線を抽出する。 【解決手段】 画像を読み取る画像入力部と、読み取っ
た画像を格納するイメージメモリと、イメージメモリに
格納した画像を参照して画像上の各領域毎に局所的な方
向性の強さを示すポテンシャルを求めるポテンシャル算
出部と、求めたポテンシャルを格納するポテンシャルメ
モリと、ポテンシャルメモリに格納したポテンシャルの
値をもとに画像上の罫線を抽出する罫線抽出部と、抽出
した罫線の情報を外部に出力する罫線出力部を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像上の様々な罫
線(実線や点線、破線、一点鎖線等)を抽出する装置に
関する。
【0002】
【従来の技術】文字認識装置や文書のファイリング装置
では、処理の一部として、文書画像上にある罫線(点線
や実線)を抽出するものがある。このような従来の罫線
抽出技術として、例えば特開平7−230525に示さ
れた方法がある。以下、この従来方法について図13を
用いて説明する。
【0003】図13は、従来の罫線抽出方法の全体構成
を示すブロック図である。図13において100は2値
画像入力部、101は2値イメージメモリ、102は黒
ラン抽出部、103は黒ランメモリ、104は実線罫線
認識部、105は実線罫線メモリ、106は矩形抽出
部、107は矩形メモリ、108は点線要素抽出部、1
09は点線要素メモリ、110は点線罫線抽出部、11
1は点線候補メモリ、112は点線罫線判断部、113
は分散計算部、114は点線罫線メモリ、115は罫線
出力部である。
【0004】以下、従来の罫線抽出方法の動作を図13
に基づいて説明する。図13において、ブロック102
〜105は実線罫線を抽出するための部分、ブロック1
06〜114は点線罫線を抽出するための部分、ブロッ
ク100、101、115は点線罫線と実線罫線の抽出
に共通な部分である。
【0005】まず、2値画像入力部100は、イメージ
スキャナやファクシミリ等で文書を読み取って2値の文
書画像を作成し、それを2値イメージメモリ101に格
納する。次に、黒ラン抽出部102は、2値イメージメ
モリ101に格納した文書画像から、注目する罫線方向
(通常、主走査方向および副走査方向)に一定長以上連
続する黒ランを抽出する。そして、抽出した黒ランのデ
ータ(始点・終点の座標、方向等)を黒ランメモリ10
3に格納する。次に、実線罫線認識部104は、黒ラン
メモリ103に格納した黒ランデータを基に、実線の罫
線を抽出する。具体的には、同一の方向を持ち、近傍に
位置する黒ラン同士を統合し、その外接矩形を罫線とす
る。そして、抽出した罫線のデータ(始点・終点の座
標、方向等)を実線罫線メモリ105に格納する。
【0006】次に、矩形抽出部106は、2値イメージ
メモリ101に格納された文書画像から、注目する罫線
方向(通常、主走査方向および副走査方向)に連続した
黒画素を包含する矩形を生成し、その矩形データを矩形
メモリ107に格納する。次に、点線要素抽出部108
は矩形メモリ107を参照し、抽出された矩形の中で幅
と高さが規定した閾値よりも小さい矩形のみを点線要素
として点線要素メモリ109に格納する。次に、点線罫
線抽出部110は点線要素メモリ109を参照し、隣接
する点線要素同士の間隔があらかじめ定められた閾値よ
りも小さい点線要素群を一本の点線候補として点線候補
メモリ111に格納する。次に、点線罫線判断部112
は、罫線以外の文字領域等から誤って点線を抽出するこ
とを避けるため、点線候補メモリ111に格納した点線
候補の中で点線罫線らしいものだけを、点線罫線メモリ
114に格納する。点線罫線らしさの判断は、分散計算
部113で点線候補を構成する黒画素の幅と高さの分散
値を求めた際、その分散値が所定の閾値を越える点線候
補は点線罫線でないと判定することで行う。
【0007】最後に罫線出力部115は、実線罫線メモ
リ105に格納した実線罫線のデータと、点線罫線メモ
リ114に格納した点線罫線のデータを、外部に出力す
る。
【0008】
【発明が解決しようとする課題】上記のように構成され
る従来の罫線抽出方法では、注目する罫線方向に連続し
た黒画素を包含する矩形を生成し、抽出された矩形の中
で幅と高さが規定された閾値よりも小さい矩形のみを点
線要素としている。そのため、一点鎖線や破線のよう
に、注目する罫線方向に連続する黒画素の幅が大きい場
合、これらの罫線を抽出できないという問題がある。
【0009】さらに、点線罫線判断部112では、点線
候補を構成する黒画素の幅と高さの分散値が所定の閾値
を越える点線候補は点線罫線でないと判断する。そのた
め、一点鎖線や二点鎖線のように罫線を構成する黒画素
の幅がまちまちで、その分散値が大きくなる場合、罫線
として抽出できない問題点がある。この問題点を避ける
ために分散値の閾値を大きく設定すると、罫線以外の周
囲の領域(文字列等)から誤って余計な罫線が抽出され
る問題が生じる。
【0010】加えて、従来の罫線抽出方法では、2値化
した画像からしか罫線を抽出できない問題がある。
【0011】本発明は、上述の問題を解決するためにな
されたものであり、2値画像と多値画像の双方から実線
や点線,破線,一点鎖線,二点鎖線等のさまざまな罫線
を抽出できる罫線抽出方法を提供することを目的とす
る。
【0012】
【課題を解決するための手段】第1の発明にかかる罫線
認識方法は、画像入力部で入力された画像を読み取り、
画像入力部で読み取った画像をイメージメモリに格納
し、イメージメモリに格納された画像を参照して、ポテ
ンシャル算出部で画像上の各領域毎に局所的な方向性の
強さを示すポテンシャルを求め、ポテンシャル算出部で
求めたポテンシャルをポテンシャルメモリに格納し、ポ
テンシャルメモリに格納されたポテンシャルの値を基に
罫線抽出部で画像上の罫線を抽出し、罫線抽出部で抽出
された罫線の情報を罫線出力部が外部に出力するように
構成される。
【0013】第2の発明にかかる罫線認識方法は、画像
入力部で入力された画像を読み取り、画像入力部で読み
取った画像をイメージメモリに格納し、イメージメモリ
に格納された画像を参照して、ポテンシャル算出部で画
像上の各領域毎に局所的な方向性の強さを示すポテンシ
ャルを求め、ポテンシャル算出部で求めたポテンシャル
をポテンシャルメモリに格納し、ポテンシャルメモリに
格納されたポテンシャルの値を、ポテンシャル更新部が
状態方程式に従って変更し、その変更値を再度ポテンシ
ャルメモリに格納し、ポテンシャルメモリに格納された
ポテンシャルの値を基に罫線抽出部で画像上の罫線を抽
出し、罫線抽出部で抽出された罫線の情報を罫線出力部
が外部に出力するように構成される。
【0014】第3の発明にかかる罫線認識方法は、画像
入力部で入力された画像を読み取り、画像入力部で読み
取った画像をイメージメモリに格納し、イメージメモリ
に格納された画像を参照して、ポテンシャル算出部で画
像上の各領域毎に局所的な方向性の強さを示すポテンシ
ャルを求め、ポテンシャル算出部で求めたポテンシャル
をポテンシャルメモリに格納し、ポテンシャルメモリに
格納されたポテンシャルの値を、ポテンシャル更新部が
状態方程式に従って変更し、その変更値を再度ポテンシ
ャルメモリに格納し、ポテンシャルメモリに格納された
ポテンシャルの値を基に罫線抽出部で画像上の罫線を抽
出し、罫線種類判定部は、前記の罫線抽出部で抽出され
た罫線から、罫線の外接矩形領域内の画像上で閾値以上
の濃度を持つ画素の連続領域を罫線要素として抽出し、
この罫線要素の長さの度数分布を求め、この度数分布と
予め罫線の種類毎に用意した度数分布と比較することに
より、罫線の種類を判別し、前記の罫線種類判定部で判
別された罫線の情報を罫線出力部が外部に出力するよう
に構成される。
【0015】第4の発明にかかる罫線認識方法における
ポテンシャル算出部においては、方向性を持ち大きさの
異なる複数のマスクを画像に畳み込んだ結果からポテン
シャルの値を算出するように構成される。
【0016】第5の発明にかかる罫線認識方法は、式1
に基づいて、小領域(x,y)の中心にマスクの中心を
合わせて、次の式1から方向性検出マスクを畳み込んだ
ときのマスクの出力値Odi rj(x,y)を求め、得ら
れたマスクの出力値Odi rj(x,y)から式2によっ
て全領域のポテンシャルPdi(x,y)を計算するよう
に構成される。 Odi rj(x,y)= I(x,y)・Mdi rj (1) Pdi(x,y)= Max{ Odi rj(x,y))} (2) ここで、i=1〜D,j=1〜R ここで、Iは文書画像であり、I(x,y)・Mdi rj
は小領域(x,y)の中心画素と方向性検出マスクM
di rjの中心位置を合わせて、文書画像に方向性検出マ
スクを畳み込む処理を示す。Odi rj(x,y)は、こ
の畳み込み処理で計算されたマスク出力値である。ポテ
ンシャルPdi(x,y)は、同じ方向diを持ち、方向
性検出マスクの大きさrjが異なるマスク出力値O
di rj(x,y)の最大値である。
【0017】第6の発明にかかる罫線認識方法は、ポテ
ンシャル更新部が以下の式3に示す状態方程式に従い、
ポテンシャルメモリに格納したポテンシャルの値を変更
するように構成される。
【数3】 ここで、τは時定数、tは更新回数、Φxyは小領域
(x,y)の近傍領域、CとZは正の定数、Pdi(x,
y)はポテンシャル、U(x,y)はポテンシャルPdi
(x,y)の関数、Wdi(x’,y’)は小領域
(x’,y’)が小領域(x,y)に及ぼす影響を示す
関数である。
【0018】第7の発明にかかる罫線認識装置は、画像
を読み取る画像入力部と、画像入力部で読み取った画像
を格納するイメージメモリと、イメージメモリに格納し
た画像を参照して画像上の各領域毎に局所的な方向性の
強さを示すポテンシャルを求めるポテンシャル算出部
と、ポテンシャル算出部で求めたポテンシャルを格納す
るポテンシャルメモリと、ポテンシャルメモリに格納し
たポテンシャルの値を基に画像上の罫線を抽出する罫線
抽出部と、罫線抽出部で抽出した罫線の情報を外部に出
力する罫線出力部を備えるように構成される。
【0019】第8の発明にかかる罫線認識装置は、画像
を読み取る画像入力部と、画像入力部で読み取った画像
を格納するイメージメモリと、イメージメモリに格納し
た画像を参照して画像上の各領域毎に局所的な方向性の
強さを示すポテンシャルを求めるポテンシャル算出部
と、ポテンシャル算出部で求めたポテンシャルを格納す
るポテンシャルメモリと、ポテンシャルメモリに格納し
たポテンシャルの値を、状態方程式に従い変更し、再度
前記のポテンシャルメモリに格納するポテンシャル更新
部と、ポテンシャルメモリに格納したポテンシャルの値
を基に画像上の罫線を抽出する罫線抽出部と、罫線抽出
部で抽出した罫線の情報を外部に出力する罫線出力部を
備えるように構成される。
【0020】第9の発明にかかる罫線認識装置は、画像
を読み取る画像入力部と、画像入力部で読み取った画像
を格納するイメージメモリと、イメージメモリに格納し
た画像を参照して画像上の各領域毎に局所的な方向性の
強さを示すポテンシャルを求めるポテンシャル算出部
と、ポテンシャル算出部で求めたポテンシャルを格納す
るポテンシャルメモリと、ポテンシャルメモリに格納し
たポテンシャルの値を、状態方程式に従い変更し、再度
前記のポテンシャルメモリに格納するポテンシャル更新
部と、ポテンシャルメモリに格納したポテンシャルの値
を基に画像上の罫線を抽出する罫線抽出部と、罫線の外
接矩形領域内の画像上で閾値以上の濃度を持つ画素の連
続領域を罫線要素として抽出し、この罫線要素の長さの
度数分布を求め、この度数分布と予め罫線の種類毎に用
意した度数分布と比較することにより、罫線の種類を判
別する罫線種類判定部と、罫線種類判定部で判定した罫
線の情報を外部に出力する罫線出力部とを備えるように
構成される。
【0021】第10の発明にかかる罫線認識装置におけ
るポテンシャル算出部は、方向性を持ち大きさの異なる
複数のマスクを画像に畳み込んだ結果からポテンシャル
の値を算出するように構成される。
【0022】第11の発明にかかる罫線認識装置におけ
るポテンシャル算出部は、式1に基づいて、小領域
(x,y)の中心にマスクの中心を合わせて、次の式1
から方向性検出マスクを畳み込んだときのマスクの出力
値Odi rj(x,y)を求め、得られたマスクの出力値
di rj(x,y)から式2によって全領域のポテンシ
ャルPdi(x,y)を計算するように構成される。 Odi rj(x,y)= I(x,y)・Mdi rj (1) Pdi(x,y)= Max{ Odi rj(x,y))} (2) ここで、i=1〜D,j=1〜R ここで、Iは文書画像であり、I(x,y)・Mdi rj
は小領域(x,y)の中心画素と方向性検出マスクM
di rjの中心位置を合わせて、文書画像に方向性検出マ
スクを畳み込む処理を示す。Odi rj(x,y)は、こ
の畳み込み処理で計算されたマスク出力値である。ポテ
ンシャルPdi(x,y)は、同じ方向diを持ち、方向
性検出マスクの大きさrjが異なるマスク出力値O
di rj(x,y)の最大値である。
【0023】第12の発明にかかる罫線認識装置におい
て、ポテンシャル更新部は、ポテンシャルメモリに格納
したポテンシャルの値を、以下の式3に示す状態方程式
に従い変更するように構成される。
【数4】 ここで、τは時定数、tは更新回数、Φxyは小領域
(x,y)の近傍領域、CとZは正の定数、Pdi(x,
y)はポテンシャル、U(x,y)はポテンシャルPdi
(x,y)の関数、Wdi(x’,y’)は小領域
(x’,y’)が小領域(x,y)に及ぼす影響を示す
関数である。
【0024】
【発明の実施の形態】実施の形態1.本発明の実施の形
態1の罫線抽出方法について図1から図5を用いて説明
する。図1はこの実施の形態1の罫線抽出方法を実現す
るための機能ブロックを示す図である。図1中、図13
に示す前記従来例と同一または相当部分は同一の符号を
付しその説明を省略する。図1において、201は画像
を読み取るための画像入力部、202は読み取った画像
を格納するイメージメモリ、203はイメージメモリ2
02に格納した画像を参照して画像上の各領域毎に局所
的な方向性の強さを示すポテンシャルを求めるポテンシ
ャル算出部、204はポテンシャル算出部203で求め
たポテンシャルを格納するポテンシャルメモリ、206
はポテンシャルメモリ204に格納したポテンシャルの
値をもとに画像上の罫線を抽出する罫線抽出部である。
【0025】図2は、ポテンシャル算出部203の動作
を説明するフローチャートである。図2については以下
で詳細に説明する。
【0026】図3は、ポテンシャル算出部203で用い
る方向性検出マスクの一例である。図3において、30
1〜303は横の方向性を持つ方向性検出マスク、30
4〜306は縦の方向性を持つ方向性検出マスク、30
7〜309は斜め方向性を持つ方向性検出マスクの例で
ある。方向性検出マスク301,304,307はそれ
ぞれ3×3のマトリクスを構成する画素から構成され
る。方向性検出マスク302,305,308はそれぞ
れ5×5のマトリクスを構成する画素から構成される。
方向性検出マスク303,306,309はそれぞれ7
×7のマトリクスを構成する画素から構成される。
【0027】図4は、縦横方向の罫線を含む文書画像の
例であり、401と403は小さい方向性検出マスク
を、402と404は大きい方向性検出マスクを示す。
410は「ユーザサポート用紙」の文字部分を示し、4
11は横実線罫線を示し、412,413,414はそ
れぞれ横点線罫線を示し、420,421はそれぞれ縦
実線罫線を示し、423,424,425,426はそ
れぞれ縦点線罫線を示す。
【0028】図5は、ポテンシャル算出部203におい
て文書画像例(図4)から求めたポテンシャルを示す。
図5において、500は図4の用紙全体に対応して検出
された横方向のポテンシャルのみを示し、501は「ユ
ーザサポート用紙」の文字列領域部分410から抽出さ
れた横ポテンシャル、502は横実線罫線411から抽
出された横ポテンシャル、503,504,505はそ
れぞれ横点線罫線412,413,414から抽出され
た横ポテンシャル、506部分は一点鎖線414から抽
出した部分的な横ポテンシャルである。一方、520は
図4の用紙全体に対応して検出された縦方向のポテンシ
ャルのみを示し、521,522はそれぞれ縦実線罫線
420,421から抽出された縦ポテンシャル、52
3,524,525,526はそれぞれ縦点線罫線42
3,424,425,426から抽出された縦ポテンシ
ャル、527は「ユーザサポート用紙」の文字列領域部
分410からから抽出された縦ポテンシャルである。
【0029】以下に図1乃至図5を用いて、本実施の形
態1の罫線抽出方法の動作を説明する。まず、図1中の
画像入力部201は、イメージスキャナやファクシミリ
等で文書を読み取って多値、もしくは2値の文書画像を
作成し、イメージメモリ202に格納する。
【0030】次に、ポテンシャル算出部203は、イメ
ージメモリ202に格納された文書画像を基に、そのポ
テンシャルの状態を求め、その結果をポテンシャルメモ
リ204に格納する。このポテンシャル算出部203の
動作を、図2のフローチャートに従って説明する。
【0031】まず、ステップS1では、方向性diと大
きさrjを持つ複数の方向性検出マスクMdi rjを作成
する(i=1〜D、j=1〜R)。ここで、方向性検出
マスクMdi rjは(2j+1)×(2j+1)サイズの
2次元マスクである。
【0032】例えば、R=3{r1=3,r2=5,r
3=7}、D=3{d1=横方向,d2=右上方向,d
3=縦方向}における方向性検出マスクの例を図3に示
す。図3において、方向性検出マスク上の黒い四角形は
正の値、灰色の四角形はゼロ、白い四角形は負の値を示
す。横方向を持つ方向性検出マスク301〜303で
は、黒い四角が横方向に並び、同じく縦方向を持つ方向
性検出マスク304〜306では、黒い四角が縦方向に
並ぶ。
【0033】次に、ステップS2では、画像入力部20
1で読み取られイメージメモリ202に蓄えられた文書
画像を参照し、その文書画像をM×M個の小領域に分割
する。
【0034】次に、ステップS3とS4では、変数xを
x=1〜Mまで変化させ、変数yをy=1〜Mまで変化
させることによってM×M個の小領域全体をスキャンす
るようにループを作る。
【0035】次に、ステップS5では、小領域(x,
y)の中心にマスクの中心を合わせて、ステップS1で
作成した各方向性検出マスクを畳み込み、マスクの出力
値Odirj(x,y)を求める。この処理は次の式1で表
わすことができる。 Odi rj(x,y)= I(x,y)・Mdi rj (1) ここで、i=1〜D,j=1〜R
【0036】式1において、I(x,y)は点x,yに
おける文書画像であり、この文書画像上の黒画素は大き
な正の値を、白画素がゼロ又は小さな正の値を持つ。M
di rjは、di方向の(2j+1)×(2j+1)の面
積を有する方向性検出マスクである。I(x,y)・M
di rjは小領域(x,y)(画素または所定の大きさの
画素の集合のいずれでもよい)の中心画素と方向性検出
マスクMdi rjの中心位置を合わせて、文書画像に方向
性検出マスクを畳み込む(重ね合わせる)処理を示す。
di rj(x,y)は、この畳み込み処理で計算された
マスク出力値である。例えば、図4上で、x軸y軸がそ
れぞれ8,5および9,5で特定される小領域(8,
5)および(9,5)では横方向の罫線が横切っている
ので、この場合は、たとえば、図3の横方向マスク30
1の中央の黒線部分が小領域(8,5),(9,5),
(10,5)の上になるように重ね合わせると、横方向
のマスク出力値Odi rj(x,y)が図5の小領域
(8,5),(9,5)上に大きく出力される。出力値
di rj(x,y)が大きいので、式1と式2から計算
されたポテンシャルPdi(x,y)は、図5(a)上で
は黒色で表示される。
【0037】一方、上と同様に、図4上の同じ領域に図
3の縦方向マスク304を重ね合わせると、罫線が横方
向であるために、縦方向のマスク出力値Odi rj(x,
y)は小さく出力される。出力値Odi rj(x,y)が
小さいので、式1と式2から計算されたポテンシャルP
di(x,y)は、図5(b)上では白色で表示される。
このように、小領域(8,5)および(9,5)では、
マスク出力値Odi rj(x,y)は、diが横方向の場
合は大きく、diが縦方向の場合は小さくなることが分
かる。同様に、小領域(x,y)の近傍に罫線が無い場
合や、罫線以外の要素(文字列等)がある場合、マスク
出力値は小さな値を取る。このような畳込みを図4に示
す領域全体について行って得られたマスク出力値O
di rj(x,y)が図5(a)および図5(b)に示さ
れる。
【0038】次に、ステップS6では、マスク出力値O
di rj(x,y)から、小領域(x,y)が持つポテン
シャルPdi(x,y)を求める。ここで、Pdi(x,
y)は、小領域(x,y)が持つ方向性の強さを示す値
であり、次の式2に従って求める。 Pdi(x,y)= Max{ Odi rj(x,y))} (2) ここで、i=1〜D,j=1〜R
【0039】式2では、同じ方向diを持ち、方向性検
出マスクの大きさrjが異なるマスク出力値O
di rj(x,y)の最大値がPdi(x,y)として得ら
れる。式2において、たとえば、方向diにおいて、j
を1からRまで変化させることによって、方向性検出マ
スクの大きさrjを変化させ、各方向diについてのマ
スク出力値Odi rj(x,y)を計算し、その最大値を
各方向diについてのポテンシャルPdi(x,y)とし
て求める。ここで、さらに、iを1からDまで変化させ
ることによって、各方向のdiについての最大ポテンシ
ャルPdi(x,y)を求める。このような演算を行うこ
とによって、小領域(x,y)を方向diの罫線が横切
る際、その罫線の種類(点線、破線、実線、一点鎖線
等)によらず、ポテンシャルPdi(x,y)の値を高く
することができる。
【0040】例えば、文書画像例(図4)において、小
領域(x,y)を破線が横切る領域に注目する。ここで
大きな方向性検出マスク402は、そのサイズ内に破線
の一部しか含まないためにマスク出力値は小さい。しか
し、小さな方向性検出マスク401(jが小さい)で
は、そのサイズいっぱいに破線を構成する黒線が含まれ
るためマスク出力値は大きい。逆に、大きな方向性検出
マスク404(jが大きい)では、そのサイズ内にある
程度の黒線が含まれるためマスク出力値は大きいが、小
さい方向性検出マスク403(jが小さい)では、サイ
ズ内に黒線がなくマスク出力値は小さい。同様に、小領
域(x,y)を点線が横切る場合を考える。ここで小さ
な方向性検出マスクのサイズ内には、1又は2点の黒点
しかないためマスク出力値は小さい。しかし大きな方向
性検出マスクのサイズ内には多くの黒点が並んでいるた
めマスク出力値が大きくなる。
【0041】このように、小領域(x,y)を方向di
の罫線が横切る場合、サイズの異なる方向性検出マスク
のいずれかが大きなマスク出力値を持つ。そのためにポ
テンシャルPdi(x,y)の値は大きくなる。
【0042】以降、ステップS7およびステップS8で
は、各々yとxの値を1づつ歩進した後に、それぞれス
テップS4およびS3に戻ることによって、全ての小領
域のポテンシャルを求める。上述のように、図5
(a),(b)は文書画像例(図4)に本処理を適用し
て得たポテンシャルを示す。図5(a)において、50
0は横方向(di=1)のポテンシャルPdi(x,
y)、図5(b)において、520は縦方向(di=
3)のポテンシャルPdi(x,y)を示す。ここで小さ
な四角形が各小領域(x,y)を示し、四角形内部の色
は、その小領域が持つポテンシャルの値を表わす(黒色
部分が最大のポテンシャル値を有し、灰色部分は中間の
ポテンシャル値を有し、白色部分は最小のポテンシャル
値を有する)。
【0043】最後にステップS9では、求めたポテンシ
ャル値をポテンシャルメモリ204に格納し、ポテンシ
ャル算出部203の処理を終わる。
【0044】次に、図1の罫線抽出部206は、ポテン
シャルメモリ204を参照して罫線を抽出し、罫線のデ
ータを罫線出力部115に送出する。具体的には、まず
ポテンシャルメモリ204に格納したdi方向を持つポ
テンシャルPdiをdi方向に走査し、ある閾値以上のP
diの値を持つ小領域が連続する領域を黒ランとして抽出
する。次に、抽出した黒ランに対してラベリングを行
い、同じラベルの値を持つ黒ラン群を包括する外接矩形
を1本の罫線とする。この処理を全てのdi方向(i=
1〜D)に対して行うことで、帳票画像上にある様々な
方向を持った罫線を抽出する。その後、罫線抽出部20
6は、抽出した罫線のデータ(外接矩形の左上点、幅お
よび高さ等)を罫線出力部115に送出する。罫線出力
部115は、罫線抽出部206で得た罫線データを外部
に出力する。
【0045】本発明の実施の形態1の罫線抽出方法によ
れば、大きさの異なる複数の方向性検出マスクから得ら
れたマスク出力値を基に、画像上の小領域が持つポテン
シャルの値を求める。そのため小領域上を罫線が横切る
場合、罫線の種類によらず、安定的に高いポテンシャル
の値が得られる。そのため点線や破線,一点鎖線等の様
々な罫線を誤り無く抽出できる。
【0046】さらに、方向性検出マスクと文書画像との
畳み込み処理により各小領域が持つポテンシャルの値を
算出する。マスクの畳み込みは2値画像と多値画像双方
で可能な処理であるため、文書画像が2値や多値でも罫
線を抽出できる。
【0047】実施の形態2.実施の形態2においては、
上記の実施の形態1の罫線抽出方法に、ポテンシャルメ
モリに格納したポテンシャルの値を更新するためのポテ
ンシャル更新部を加えたものである。このような構成と
することによって、罫線を構成する黒線と黒線の間隔が
最も大きな方向性検出マスクより広い実線以外の罫線
(点線や破線,一点鎖線等)の場合でも、誤り無く抽出
することができる。また、罫線以外の領域(文字列等)
で高いポテンシャルの値が検出された場合でも、誤って
余計な罫線を抽出することもなくなる。以下、本発明の
実施の形態2の罫線抽出方法について、図6乃至図8を
用いて説明する。
【0048】図6は、実施の形態2の罫線抽出方法を実
現する機能ブロックを示す図である。図6中、前記実施
の形態1と同一または相当部分は同一の符号を付し、そ
の説明を省略する。図6において、205はポテンシャ
ルメモリに格納したポテンシャルの値を更新するポテン
シャル更新部である。
【0049】図7において、700は、図5に示すポテ
ンシャルにポテンシャル更新部205によって、図4の
用紙全体に対応して演算された横方向のポテンシャルを
示す。702は横実線罫線502から演算された横ポテ
ンシャル、703,704,705はそれぞれ図5の横
点線罫線503,504,505から演算された横ポテ
ンシャル、706部分は図5の一点鎖線506部分から
演算された横ポテンシャルである。一方、720は、図
5に示すポテンシャルにポテンシャル更新部205によ
って、図4の用紙全体に対応して演算された縦方向のポ
テンシャルを示す。721,722はそれぞれ図5の縦
実線罫線521,522から演算された縦ポテンシャ
ル、723,724,725,726はそれぞれ図5の
縦点線罫線523,524,525,526から演算さ
れた縦ポテンシャルである。
【0050】図8は、図7に示したポテンシャルの状態
を基に罫線抽出部206が抽出した罫線である。図8中
の罫線は、図7の各横および縦のポテンシャルの外郭か
ら得られた罫線を示す。811は横実線罫線を示し、8
12,813,814はそれぞれ横点線罫線を示し、8
20,821はそれぞれ縦実線罫線を示し、823,8
24,825,826は、それぞれ縦点線罫線を示す。
【0051】以下に、図6乃至図8を用いて、本実施の
形態2の罫線抽出方法の動作を説明する。ここでポテン
シャル更新部205は、ポテンシャルメモリ204を参
照して、ポテンシャル算出部203で求めたポテンシャ
ルの値を更新する。更新したポテンシャルの値を再びポ
テンシャルメモリ204に格納する。具体的には、ポテ
ンシャル更新部205は、例えば、次の式3の状態方程
式に従ってポテンシャルの値を更新する。
【0052】
【数5】
【0053】ここで、τは時定数、tは更新回数、Φxy
は小領域(x,y)の近傍領域、CとZは正の定数であ
る。U(x,y)はポテンシャルPdi(x,y)の関数
であり、Pdi(x,y)の値が発散しないようにする働
きを持つ。またWdi(x’,y’)は小領域(x’,
y’)が小領域(x,y)に及ぼす影響を示す。具体的
に、Wdi(x’,y’)は小領域(x’,y’)が小領
域(x,y)からdi方向に位置する場合は正の値を、
その他の場合は0の値を持つ。Wdi(x’,y’)の働
きにより、小領域(x,y)が持つポテンシャルP
di(x,y)は、そこからdi方向に位置する小領域
(x’,y’)が持つポテンシャルPdi(x’,y’)
により強められる。
【0054】式3の状態方程式に従って状態を更新する
と、ポテンシャルの値は徐々に変化し、安定状態へと収
束する。ここで小領域(x,y)からdi方向に位置す
る複数個の小領域(x’,y’)が持つPdi(x’,
y’)の値が高い場合は、Pdi(x,y)の値は徐々
に増加する。逆に、小領域(x’,y’)が持つPdi
(x’,y’)の値が小さい場合は、Pdi(x,y)の
値は、式3の定数Cと時定数τの働きで徐々に減少す
る。例えば、初期のポテンシャル(図5)に対して本処
理を適用すると、図7に示すポテンシャルに収束する。
図7(a)において、700はdiが横方向のポテンシ
ャル、図7(b)において、720はdiが縦方向のポ
テンシャルである。
【0055】次に、状態方程式に従いポテンシャルの状
態を更新することの効果を具体的に述べる。まず、小領
域(x,y)上をdi方向の長い罫線が横切る場合を考
える。この時、小領域(x,y)からdi方向に位置す
る複数個の小領域(x’,y’)が持つPdi(x’,
y’)の値は高い。そのため小領域(x,y)が持つP
di(x,y)の値は徐々に増加する。例えば、図5
(a)に示す初期のポテンシャルにおいて、一点鎖線上
の小領域506が持つポテンシャルの値は小さいが、状
態を更新することにより、ポテンシャルの値は、図5と
比べると分かるように、図7(a)の706のように全
体的に高くなる。逆に、図5(a)の小領域507のよ
うに、小領域(x,y)上に罫線がない場合は、P
di(x’,y’)の値が小さく、そのため図7(a)の
707の小領域に示すように、Pdi(x,y)の値は徐
々に減少し、最終的には消失する。
【0056】同様に、小領域(x,y)上に、di方向
に伸びた文字列がある場合、小領域(x,y)からdi
方向に位置する複数個の小領域(x’,y’)が持つポ
テンシャルPdi(x’,y’)は一部に高い値を持つ
が、全体的には低い。そのためPdi(x,y)の値は徐
々に減少する。例えば、図5(a)の初期のポテンシャ
ルにおいて、文字列領域上の小領域501は、一部に高
いポテンシャルの値を持つ。しかし状態を更新すること
によって、ポテンシャルの値は図7(a)の701に示
すように小さくなる。
【0057】その後、罫線抽出部206は、実施の形態
1と同様に、ポテンシャルメモリ204に格納されたポ
テンシャルの値を参照して罫線を抽出する。例えば、ポ
テンシャル更新部205で更新したポテンシャル(図
7)に本処理を適用すると、図8に示す罫線群が抽出さ
れる。この場合、図8に示すように、罫線群としては、
罫線の外接矩形が抽出される。
【0058】実施の形態2によれば、式3の状態方程式
に従ってポテンシャルの値を更新することにより、罫線
以外の領域が持つポテンシャルの値は減少する。逆に、
罫線上の領域が持つポテンシャルの値は増加する。特
に、実線以外の罫線(点線や破線,一点鎖線等)におい
て、罫線を構成する黒線と黒線の間隔が広いためにポテ
ンシャルの値が小さい白画素の領域でも、状態を更新す
るに従ってポテンシャルの値が増加する。そのため、罫
線以外の領域(文字列等)から誤って余計な罫線を抽出
する問題を避け、かつ点線や破線,一点鎖線等の様々な
罫線を精度良く抽出できる。
【0059】実施の形態3.実施の形態1と2では、様
々な種類の罫線を抽出できるが、その罫線の種類を判別
することは難しい。そこで罫線の種類を判別するための
罫線種別判定部を加えた例が実施の形態3である。以
下、本発明の実施の形態3を図9乃至図12に基づいて
説明する。
【0060】図9は実施の形態2の罫線抽出処理に罫線
種別判定部を加えた構成を示すブロック図である。図9
において、図6と同一または相当部分は同一の符号を付
し、その説明を省略する。ここで901は罫線の種類を
判別する罫線種類判定部である。
【0061】図10は罫線要素の抽出例である。図10
において、1001は罫線の外接矩形領域内にある文書
画像、1002はその文書画像中の一個の罫線要素、た
とえば、一点鎖線を示す図である。図10において、一
点鎖線はa2の長さを有する長線とa1の長さを有する
短線a2とから構成される。図11は、図10中の罫線
要素の長さの度数分布を示す図である。図11におい
て、横軸は一点鎖線の罫線要素の長さaを示し、縦軸は
一点鎖線の特定の長さの罫線要素が生じる度数を示す。
横軸に長さa1を中心に短い方の罫線要素が分布し、a
2を中心に長い方の罫線要素が分布していることが分か
る。ここで、a1およびa2の部分のみでなく、その周
囲に罫線要素の発生が分布しているのは、それぞれの検
出された罫線要素の長さにバラツキがあるためである。
【0062】罫線種類判定部901は、イメージメモリ
202を参照して、罫線抽出部206で得た各罫線の外
接矩形領域内にある文書画像1001を抽出する。次
に、文書画像1001の内部を走査し、濃度が閾値以上
の画素をラベリングする。ここで同じラベルを持つ画素
の集合を罫線要素とする。図10中の1002は一個の
罫線要素を示す。次に、各罫線要素の長さの度数分布
(図11)を作成する。次に、この度数分布と、予め罫
線の種類毎に用意した度数分布とを比較する。検出され
た形状の度数分布が最も類似する罫線の度数分布から、
その罫線の種類(たとえば、点線、破線,一点鎖線等)
を決定する。罫線種類判定部901は、求めた罫線のデ
ータ(罫線の外接矩形左上点と幅高さ、および罫線の種
類)を罫線出力部115に送出する。罫線出力部115
は、罫線種類判定部901で得た罫線データを外部に出
力する。
【0063】ここで度数分布の類似性は、例えば以下の
方法で判定する。図12は検出された罫線要素の特徴ベ
クトルと予め用意された罫線要素の特徴ベクトルを示す
図である。図12(a)は、図11の罫線の長さを示す
水平軸をM個のエリアに分割し、各エリアに含まれる罫
線発生度数から作成されたM次元の特徴ベクトルであ
る。同様に、図12(b)は、予め罫線の種類毎に用意
した度数分布から作成されたM次元の特徴ベクトルであ
る。これらの、図12(a)および図12(b)の2つ
の特徴ベクトルを用いて、一般的なベクトル間の距離計
算法である2つの特徴ベクトルの差を求めるシテイブロ
ック距離法や2つの特徴ベクトルの差の2乗を求めるユ
ークリッド距離法等によって、2つの特徴ベクトル間の
距離を求める。そして距離値が小さいほど類似性が高い
と判定することによって、検出された罫線要素が予め用
意されたどの罫線要素に該当するかを判定する。
【0064】実施の形態3によれば、罫線の外接矩形領
域内の画像上で閾値以上の濃度を持つ画素をラベリング
して罫線要素を抽出し、この罫線要素の長さの度数分布
を求め、この度数分布と予め罫線の種類毎に用意した度
数分布と比較して、その類似性を調べることで、罫線の
種類を判定できる。
【0065】
【発明の効果】以上説明したように、本発明によれば以
下の効果を得ることができる。第1および第7の発明に
よれば、画像を読み取る画像入力部と、読み取った画像
を格納するイメージメモリと、イメージメモリに格納し
た画像を参照して画像上の各領域毎に局所的な方向性の
強さを示すポテンシャルを求めるポテンシャル算出部
と、求めたポテンシャルを格納するポテンシャルメモリ
と、ポテンシャルメモリに格納したポテンシャルの値を
基に画像上の罫線を抽出する罫線抽出部と、抽出した罫
線の情報を外部に出力する罫線出力部を備えることで、
画像から実線や点線,破線等の様々な罫線を抽出するこ
とができる。
【0066】第2および第8の発明によれば、第1およ
び第2の発明に、ポテンシャルメモリに格納したポテン
シャルの値を状態方程式に従い変更するポテンシャル更
新部を追加することで、実線以外の罫線(点線や破線,
一点鎖線等)をより精度良く抽出し、かつ誤った領域か
ら余分な罫線を抽出しないようにできる。
【0067】第3および第9の発明によれば、第2およ
び第8の発明に、罫線の外接矩形領域内の画像上で閾値
以上の濃度を持つ画素をラベリングして罫線要素を抽出
し、この罫線要素の長さの度数分布を求め、この度数分
布と予め罫線の種類毎に用意した度数分布と比較するこ
とにより、罫線の種類を判別する罫線種類判定部を追加
したことで、抽出した罫線の種類(実線、点線、破線、
一点鎖線等)を正しく判別できる。
【0068】第4および第10の発明によれば、ポテン
シャル算出部は、方向性を持ち、大きさの異なる複数の
マスクを画像に畳み込んだ結果からポテンシャルの値を
算出するため、2値画像および多値画像のどちらからで
も罫線を抽出できる。
【0069】第5および第11の発明によれば、式1に
基づいて、小領域(x,y)の中心にマスクの中心を合
わせて、方向性検出マスクを畳み込んだときのマスクの
出力値Odi rj(x,y)を求め、得られたマスクの出
力値Odi rj(x,y)から式2によって全領域のポテ
ンシャルPdi(x,y)を計算するため、2値画像およ
び多値画像のどちらからでも罫線を抽出できる。 Odi rj(x,y)= I(x,y)・Mdi rj (1) Pdi(x,y)= Max{ Odi rj(x,y))} (2) ここで、i=1〜D,j=1〜R ここで、Iは文書画像であり、I(x,y)・Mdi rj
は小領域(x,y)の中心画素と方向性検出マスクM
di rjの中心位置を合わせて、文書画像に方向性検出マ
スクを畳み込む処理を示す。Odi rj(x,y)は、こ
の畳み込み処理で計算されたマスク出力値である。ポテ
ンシャルPdi(x,y)は、同じ方向diを持ち、方向
性検出マスクの大きさrjが異なるマスク出力値O
di rj(x,y)の最大値である。
【0070】第6および第12の発明によれば、ポテン
シャルメモリに格納したポテンシャルの値を、ポテンシ
ャル更新部が以下の式3に示す状態方程式に従い変更す
るように構成されるので、実線以外の罫線(点線や破
線,一点鎖線等)をより精度良く抽出し、かつ罫線領域
でない領域からの余分な情報を抽出しないようにでき
る。
【数6】 ここで、τは時定数、tは更新回数、Φxyは小領域
(x,y)の近傍領域、CとZは正の定数、Pdi(x,
y)はポテンシャル、U(x,y)はポテンシャルPdi
(x,y)の関数、Wdi(x’,y’)は小領域
(x’,y’)が小領域(x,y)に及ぼす影響を示す
関数である。
【図面の簡単な説明】
【図1】 実施の形態1の罫線抽出方法を実現するブロ
ック構成を示す図である。
【図2】 実施の形態1に記載したポテンシャル算出部
のフローチャートを示す図である。
【図3】 実施の形態1に記載した方向性検出マスクの
例を示す図である。
【図4】 実施の形態1に記載した文書の画像例を示す
図である。
【図5】 実施の形態1に記載したポテンシャルの状態
を示す図である。
【図6】 実施の形態2の罫線抽出方法を実現するブロ
ック構成を示す図である。
【図7】 実施の形態2に記載したポテンシャルの状態
を示す図である。
【図8】 実施の形態2に記載した罫線抽出結果の例を
示す図である。
【図9】 実施の形態3の罫線抽出方法を実現するブロ
ック構成を示す図である。
【図10】 実施の形態3に記載した罫線要素の例を示
す図である。
【図11】 実施の形態3に記載した度数分布の例を示
す図である。
【図12】 実施の形態3における度数分布の類似性を
判定する方法を概念的に説明する図である。
【図13】 従来装置の構成を示すブロック図である。
【符号の説明】
115 罫線出力部、201 画像入力部、202 イ
メージメモリ、203ポテンシャル算出部、204 ポ
テンシャルメモリ、205 ポテンシャル更新部、20
6 罫線抽出部、301〜303 横方向性を持つ方向
性検出マスクの例、304〜306 縦方向性を持つ方
向性検出マスクの例、307〜309斜め方向性を持つ
方向性検出マスクの例、401,403 小さい方向性
検出マスク、402,404 大きい方向性検出マス
ク、500 横方向を持つポテンシャル、520 縦方
向を持つポテンシャル、700 横方向を持つポテンシ
ャル、720 縦方向を持つポテンシャル、901 罫
線種類判定部、1001罫線の外接矩形領域内にある文
書画像、1002 罫線要素

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 画像入力部で入力された画像を読み取
    り、 画像入力部で読み取った画像をイメージメモリに格納
    し、 イメージメモリに格納された画像を参照して、ポテンシ
    ャル算出部で画像上の各領域毎に局所的な方向性の強さ
    を示すポテンシャルを求め、 ポテンシャル算出部で求めたポテンシャルをポテンシャ
    ルメモリに格納し、 ポテンシャルメモリに格納されたポテンシャルの値を基
    に罫線抽出部で画像上の罫線を抽出し、 罫線抽出部で抽出された罫線の情報を罫線出力部が外部
    に出力することを特徴とする罫線抽出方法。
  2. 【請求項2】 画像入力部で入力された画像を読み取
    り、 画像入力部で読み取った画像をイメージメモリに格納
    し、 イメージメモリに格納された画像を参照して、ポテンシ
    ャル算出部で画像上の各領域毎に局所的な方向性の強さ
    を示すポテンシャルを求め、 ポテンシャル算出部で求めたポテンシャルをポテンシャ
    ルメモリに格納し、 ポテンシャルメモリに格納されたポテンシャルの値を、
    ポテンシャル更新部が状態方程式に従って変更し、その
    変更値を再度ポテンシャルメモリに格納し、 ポテンシャルメモリに格納されたポテンシャルの値を基
    に罫線抽出部で画像上の罫線を抽出し、 罫線抽出部で抽出された罫線の情報を罫線出力部が外部
    に出力することを特徴とする罫線抽出方法。
  3. 【請求項3】 画像入力部で入力された画像を読み取
    り、 画像入力部で読み取った画像をイメージメモリに格納
    し、 イメージメモリに格納された画像を参照して、ポテンシ
    ャル算出部で画像上の各領域毎に局所的な方向性の強さ
    を示すポテンシャルを求め、 ポテンシャル算出部で求めたポテンシャルをポテンシャ
    ルメモリに格納し、 ポテンシャルメモリに格納されたポテンシャルの値を、
    ポテンシャル更新部が状態方程式に従って変更し、その
    変更値を再度ポテンシャルメモリに格納し、 ポテンシャルメモリに格納されたポテンシャルの値を基
    に罫線抽出部で画像上の罫線を抽出し、 罫線種類判定部で、前記の罫線抽出部で抽出された罫線
    から、罫線の外接矩形領域内の画像上で閾値以上の濃度
    を持つ画素の連続領域を罫線要素として抽出し、この罫
    線要素の長さの度数分布を求め、この度数分布と予め罫
    線の種類毎に用意した度数分布と比較することにより、
    罫線の種類を判別し、 前記の罫線種類判定部で判別された罫線の情報を罫線出
    力部が外部に出力することを特徴とする罫線抽出方法。
  4. 【請求項4】 前記のポテンシャル算出部においては、
    方向性を持ち大きさの異なる複数のマスクを画像に畳み
    込んだ結果からポテンシャルの値を算出することを特徴
    とする請求項1乃至3のいずれかに記載の罫線抽出方
    法。
  5. 【請求項5】 式1に基づいて、小領域(x,y)の中
    心にマスクの中心を合わせて、次の式1から方向性検出
    マスクを畳み込んだときのマスクの出力値O
    di rj(x,y)を求め、得られたマスクの出力値O
    di rj(x,y)から式2によって全領域のポテンシャ
    ルPdi(x,y)を計算することを特徴とする請求項4
    記載の罫線抽出方法。 Odi rj(x,y)= I(x,y)・Mdi rj (1) Pdi(x,y)= Max{ Odi rj(x,y))} (2) ここで、i=1〜D,j=1〜R ここで、Iは文書画像であり、I(x,y)・Mdi rj
    は小領域(x,y)の中心画素と方向性検出マスクM
    di rjの中心位置を合わせて、文書画像に方向性検出マ
    スクを畳み込む処理を示す。Odi rj(x,y)は、こ
    の畳み込み処理で計算されたマスク出力値である。ポテ
    ンシャルPdi(x,y)は、同じ方向diを持ち、方向
    性検出マスクの大きさrjが異なるマスク出力値O
    di rj(x,y)の最大値である。
  6. 【請求項6】 ポテンシャルメモリに格納したポテンシ
    ャルの値を、ポテンシャル更新部が以下の式3に示す状
    態方程式に従い変更することを特徴とする請求項2また
    は3記載の罫線抽出方法。 【数1】 ここで、τは時定数、tは更新回数、Φxyは小領域
    (x,y)の近傍領域、CとZは正の定数、Pdi(x,
    y)はポテンシャル、U(x,y)はポテンシャルPdi
    (x,y)の関数、Wdi(x’,y’)は小領域
    (x’,y’)が小領域(x,y)に及ぼす影響を示す
    関数である。
  7. 【請求項7】 画像を読み取る画像入力部と、 画像入力部で読み取った画像を格納するイメージメモリ
    と、 イメージメモリに格納した画像を参照して画像上の各領
    域毎に局所的な方向性の強さを示すポテンシャルを求め
    るポテンシャル算出部と、 ポテンシャル算出部で求めたポテンシャルを格納するポ
    テンシャルメモリと、 ポテンシャルメモリに格納したポテンシャルの値を基に
    画像上の罫線を抽出する罫線抽出部と、 罫線抽出部で抽出した罫線の情報を外部に出力する罫線
    出力部を備えたことを特徴とする罫線抽出装置。
  8. 【請求項8】 画像を読み取る画像入力部と、 画像入力部で読み取った画像を格納するイメージメモリ
    と、 イメージメモリに格納した画像を参照して画像上の各領
    域毎に局所的な方向性の強さを示すポテンシャルを求め
    るポテンシャル算出部と、 ポテンシャル算出部で求めたポテンシャルを格納するポ
    テンシャルメモリと、 ポテンシャルメモリに格納したポテンシャルの値を、状
    態方程式に従い変更し、再度前記のポテンシャルメモリ
    に格納するポテンシャル更新部と、 ポテンシャルメモリに格納したポテンシャルの値を基に
    画像上の罫線を抽出する罫線抽出部と、 罫線抽出部で抽出した罫線の情報を外部に出力する罫線
    出力部を備えたことを特徴とする罫線抽出装置。
  9. 【請求項9】 画像を読み取る画像入力部と、 画像入力部で読み取った画像を格納するイメージメモリ
    と、 イメージメモリに格納した画像を参照して画像上の各領
    域毎に局所的な方向性の強さを示すポテンシャルを求め
    るポテンシャル算出部と、 ポテンシャル算出部で求めたポテンシャルを格納するポ
    テンシャルメモリと、 ポテンシャルメモリに格納したポテンシャルの値を、状
    態方程式に従い変更し、再度前記のポテンシャルメモリ
    に格納するポテンシャル更新部と、 ポテンシャルメモリに格納したポテンシャルの値を基に
    画像上の罫線を抽出する罫線抽出部と、 罫線の外接矩形領域内の画像上で閾値以上の濃度を持つ
    画素の連続領域を罫線要素として抽出し、この罫線要素
    の長さの度数分布を求め、この度数分布と予め罫線の種
    類毎に用意した度数分布と比較することにより、罫線の
    種類を判別する罫線種類判定部と、 罫線種類判定部で判定した罫線の情報を外部に出力する
    罫線出力部を備えたことを特徴とする罫線抽出装置。
  10. 【請求項10】 前記のポテンシャル算出部は、方向性
    を持ち大きさの異なる複数のマスクを画像に畳み込んだ
    結果からポテンシャルの値を算出するように構成したこ
    とを特徴とする請求項7乃至9記載の罫線抽出装置。
  11. 【請求項11】 前記のポテンシャル算出部は、小領域
    (x,y)の中心にマスクの中心を合わせて、方向性検
    出マスクを畳み込みこむことによってマスクの出力値O
    di rj(x,y)を次の式1から求め、得られたマスク
    の出力値Odirj(x,y)から式2によって全領域のポ
    テンシャルPdi(x,y)を計算することを特徴とする
    請求項10記載の罫線抽出装置。 Odi rj(x,y)= I(x,y)・Mdi rj (1) Pdi(x,y)= Max{ Odi rj(x,y))} (2) ここで、i=1〜D,j=1〜R ここで、Iは文書画像であり、I(x,y)・Mdi rj
    は小領域(x,y)の中心画素と方向性検出マスクM
    di rjの中心位置を合わせて、文書画像に方向性検出マ
    スクを畳み込む処理を示す。Odi rj(x,y)は、こ
    の畳み込み処理で計算されたマスク出力値である。ポテ
    ンシャルPdi(x,y)は、同じ方向diを持ち、方向
    性検出マスクの大きさrjが異なるマスク出力値O
    di rj(x,y)の最大値である。
  12. 【請求項12】 前記のポテンシャル更新部は、ポテン
    シャルメモリに格納したポテンシャルの値を、以下の式
    3に示す状態方程式に従い変更することを特徴とする請
    求項8または9記載の罫線抽出装置。 【数2】 ここで、τは時定数、tは更新回数、Φxyは小領域
    (x,y)の近傍領域、CとZは正の定数、Pdi(x,
    y)はポテンシャル、U(x,y)はポテンシャルPdi
    (x,y)の関数、Wdi(x’,y’)は小領域
    (x’,y’)が小領域(x,y)に及ぼす影響を示す
    関数である。
JP02977798A 1998-02-12 1998-02-12 罫線抽出方法および装置 Expired - Lifetime JP3551004B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02977798A JP3551004B2 (ja) 1998-02-12 1998-02-12 罫線抽出方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02977798A JP3551004B2 (ja) 1998-02-12 1998-02-12 罫線抽出方法および装置

Publications (2)

Publication Number Publication Date
JPH11232457A true JPH11232457A (ja) 1999-08-27
JP3551004B2 JP3551004B2 (ja) 2004-08-04

Family

ID=12285461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02977798A Expired - Lifetime JP3551004B2 (ja) 1998-02-12 1998-02-12 罫線抽出方法および装置

Country Status (1)

Country Link
JP (1) JP3551004B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059298A (ja) * 2006-08-31 2008-03-13 Fujitsu Ltd 罫線抽出プログラム、罫線抽出装置、罫線抽出方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059298A (ja) * 2006-08-31 2008-03-13 Fujitsu Ltd 罫線抽出プログラム、罫線抽出装置、罫線抽出方法

Also Published As

Publication number Publication date
JP3551004B2 (ja) 2004-08-04

Similar Documents

Publication Publication Date Title
US6185341B1 (en) Image processing using vector data to reduce noise
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US4903311A (en) Character region extracting method and apparatus capable of implementing the method
US5212739A (en) Noise tolerant optical character recognition system
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US20120134591A1 (en) Image processing apparatus, image processing method and computer-readable medium
JP2008198157A (ja) 表認識プログラム、表認識方法および表認識装置
US6968085B2 (en) Document matching and annotation lifting
US6771842B1 (en) Document image skew detection method
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
US20070041643A1 (en) Character recognition apparatus and character recognition method
JP2008310817A (ja) テキストマップの中からライン構造を検出する方法および画像処理装置
US20020006224A1 (en) Computer automated process for vectorization of raster images
US8150185B2 (en) Image processing for generating a thin line binary image and extracting vectors
JP4756436B2 (ja) パターン認識装置とそのパターン認識方法、及びパターン認識プログラム
JP5347793B2 (ja) 文字認識装置、文字認識プログラムおよび文字認識方法
JP3551004B2 (ja) 罫線抽出方法および装置
JP2006309402A (ja) 文字列認識方法、ナンバープレート認識方法、及び装置
JP2001222683A (ja) 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体
JP2827960B2 (ja) 宛名行抽出装置
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP3663659B2 (ja) 画像処理方法および画像処理装置
JP2009164897A (ja) 二値化装置及び二値化処理プログラム
JP2000076378A (ja) 文字認識方法
JPH0916713A (ja) 画像領域分割方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20031217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040412

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term