JP4270767B2 - 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体 - Google Patents

罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体 Download PDF

Info

Publication number
JP4270767B2
JP4270767B2 JP2001069561A JP2001069561A JP4270767B2 JP 4270767 B2 JP4270767 B2 JP 4270767B2 JP 2001069561 A JP2001069561 A JP 2001069561A JP 2001069561 A JP2001069561 A JP 2001069561A JP 4270767 B2 JP4270767 B2 JP 4270767B2
Authority
JP
Japan
Prior art keywords
ruled line
line
ruled
crossing
line information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001069561A
Other languages
English (en)
Other versions
JP2002269575A (ja
Inventor
裕子 杉浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001069561A priority Critical patent/JP4270767B2/ja
Publication of JP2002269575A publication Critical patent/JP2002269575A/ja
Application granted granted Critical
Publication of JP4270767B2 publication Critical patent/JP4270767B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、画像に描かれた罫線の識別情報を処理する罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体、特に識別精度の向上に関するものである。
【0002】
【従来の技術】
例えば短い罫線(桁線)を識別するために特開2000−222571号公報に示すように、2値画像データを圧縮し、圧縮後の所定値以上のランで相互に接触しているランを罫線として認識し、認識したランを基に矩形を抽出し、その矩形から文字に相当する矩形を抽出して文字矩形に接触している所定値以下の長さの罫線を無効として罫線の誤判別が生じないようにしている。また、特開2000−306102号公報に示すように、桁線として交差線の有無のみを判断して枠情報を抽出するようにしている。
【0003】
【発明が解決しようとする課題】
しかしながら桁線として交差線の有無のみを判断していると短罫線含む全罫線の識別精度を向上させることは困難である。
【0004】
この発明は係る短所を改善し、表などの画像に対して処理された罫線識別後の罫線に対して、交差線の有無情報を抽出し、識別された実線の情報を付加することにより、識別された罫線の誤判定等の判断情報を提供するとともに付加された情報より、誤識別した罫線か否かの判定をして罫線の識別精度を向上させることができる罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び処理プログラムを格納した記憶媒体を提供することを目的とするものである。
【0005】
【課題を解決するための手段】
この発明に係る罫線情報処理方法は、制御装置が、入力した画像データの黒画素の連結を調べてランを抽出する工程と、抽出したランの長さが閾値以上のものを罫線ランとしてメモリに登録する工程と、登録した各罫線ラン同士が接触しているかどうかを判別し、罫線ラン同士が接触していれば罫線としてメモリに登録する工程と、登録した罫線に対して交差線が存在するか否を判定し、交差線が存在する罫線情報に交差線情報を付加する工程と、登録した全ての罫線に対して交差線情報により交差線の有無を調べる工程と、交差線がない罫線の長さが第2の閾値以下であるかどうかを判定し、交差線がない罫線の長さが第2の閾値以下の罫線を無効にして罫線情報を修正する工程とを実行することを特徴とする。
【0006】
この発明の罫線情報処理プログラムは、罫線情報処理を行うために制御装置を、入力した画像データの黒画素の連結を調べてランを抽出する手段と、抽出したランの長さが閾値以上のものを罫線ランとしてメモリに登録する手段と、登録した各罫線ラン同士が接触しているかどうかを判別し、罫線ラン同士が接触していれば罫線としてメモリに登録する手段と、登録した罫線に対して交差線が存在するか否を判定し、交差線が存在する罫線情報に交差線情報を付加する手段と、登録した全ての罫線に対して交差線情報により交差線の有無を調べる手段と、交差線がない罫線の長さが第2の閾値以下であるかどうかを判定し、交差線がない罫線の長さが第2の閾値以下の罫線を無効にして罫線情報を修正する手段として機能させることを特徴とする。
【0007】
この発明に係る画像処理装置は、上記罫線情報処理プログラムを有することを特徴とする。
【0008】
また、この発明に係る画像処理装置の制御装置で読み取り可能な記憶媒体は、上記罫線情報処理プログラムを記憶したことを特徴とする。
【0009】
【発明の実施の形態】
図1はこの発明の画像処理装置の構成を示すブロック図である。図に示すように画像処理装置は、装置全体の処理を制御するCPU1と、CPU1の処理プログラムを記憶したROM2と、CPU1のワークメモリとして使用するRAM3と、表示装置4とハードデイスク5とキーボード6とマウス7とCD−ROMドライブ8とCD−ROM9及びスキャナ10を有し、これらがバス11で接続されている。
【0010】
上記のように構成した画像処理装置において、例えばスキャナ10で読み取った画像データの罫線を識別するとこの処理を図2のフローチャートを参照して説明する。
【0011】
スキャナ10で原稿の画像を読み取り画像データが入力すると(ステップS1)、CPU1は入力した画像データを2値化し2値画像データを高速化のために圧縮して圧縮した圧縮画像データをRAM3に一時格納する(ステップS2)。ここで圧縮画像データは、1/4に圧縮する場合には、4画素のうち全て白画素であった場合にのみ白画素ひとつに置き換え、4画素中1つでも黒画素が含まれていれば、黒画素1つ置き換える。この圧縮画像データに対して罫線認識処理を行い罫線を認識し、認識した罫線情報をRAM3に書き込む(ステップS3)。
【0012】
この罫線認識処理をするときは、例えば図3のフローチャートに示すように、主走査方向の全ライン数を確認し(ステップS11)、主走査方向の1ライン毎に黒画素の連結を調べ(ステップS12,S13)、黒画素連結が途切れたときに黒画素一塊をランとして登録する(ステップS14)。この処理を全ラインにわたって繰返す(ステップS15)。また、他の罫線認識処理方法としては、図4のフローチャートに示すように、主走査方向の1ライン毎に黒画素の連結を調べ、黒画素連結が途切れたときに黒画素一塊をランとして抽出し(ステップS21)、その長さがあらかじめ定めた閾値であるA値以上のものを罫線ランとしてRAM3に登録する(ステップS23,S24)。この処理を全ラインに渡って繰り返した後(ステップS24,S25)、次に各罫線ラン同士が接触しているか否かを調べ(ステップS26)、接触していれば罫線としてRAM3に登録する(ステップS27)。この処理を全罫線ランとして登録された数だけ繰返す(ステップS28)。この罫線認識方法はいずれの方法でもよいが、罫線認識情報として認識した罫線の位置を示すアドレス情報を提供する処理であることが必要である。
【0013】
この罫線認識情報で認識した罫線に対して交差線が存在するか否かを調べて、罫線情報に交差先情報を付加する(ステップS4)。この交差線を認識するときは、図5のフローチャートに示すように、全ての罫線に対して交差線が存在するかどうかを判定し(ステップS31,S32)、交差線が存在する罫線情報には交差線情報を付加する(ステップS33)。この処理を全ての罫線について行う(ステップS34)。この付加された交差線情報を基に認識した罫線が誤認識されたものであるか、または罫線の種類、例えば下線なのか桁線なのか枠を形成するのかを判断して罫線情報を追加修正する(ステップS5)。このように識別した罫線の交差線情報を罫線情報に付加することにより、その後の処理判断に有益な情報を提供することができる。
【0014】
次に交差線情報を付加した罫線情報を修正するときの処理を図6のフローチャートを参照して説明する。上記のように交差線情報を付加した全ての罫線に対して交差線情報より交差線の有無を調べる(ステップS41,S42)。そして交差線がない場合には、その罫線の長さがあらかじめ設定された閾値であるB値以下であれば、文字上に誤抽出された短罫線として、その罫線を無効化して罫線情報の修正を行う(ステップS43,S44)。この処理を全ての罫線情報について行い、処理を終了する(ステップS45)。このように付加された交差線情報により識別した罫線を修正することにより、罫線認識の精度を向上させることができる。
【0015】
次に、抽出された罫線の交差線情報をもとに桁線か否かの判断をするときの処理を図7のフローチャートを参照して説明する。まず、交差線情報を付加した全ての罫線に対して交差線情報より交差線の有無を調べる(ステップS51,S52)。そして認識した全罫線に対して、長さがあらかじめ定めた桁線に相当する閾値であるC値以下の短罫線に対して、付加した交差線情報より交差線の有無を調べる(ステップS52,S53)。この結果、交差線があった場合に、その交差線において同様に交差線の有無を調べる(ステップS53,S54)。そして交差線に対して交差線がない場合には桁線として登録する(ステップS55)。この処理を全ての罫線情報について行い、処理を終了する(ステップS56)。ここで桁線は文字相当サイズより小さいことが多いため、閾値であるC値としては文字相当サイズ以下を設定すると良い。
【0016】
上記罫線認識処理はあらかじめROM2に格納した処理プログラムによりCPU1が処理を行った場合について説明したが、この罫線処理プログラムをCD−ROM9に格納しておき、CPU1でCD−ROM9から罫線処理プログラムを読み出して処理ようにしても良い。
【0017】
【発明の効果】
この発明は以上説明したように、入力した画像データの罫線識別後の罫線に対して交差線の有無情報を抽出して識別された罫線に交差線情報を付加することにより、その後の処理判断に有益な情報を提供することができる。
【0018】
また、付加した交差線情報により、識別した罫線を修正するか否かの判定を行うことにより、罫線認識の精度をより向上することができる。
【0019】
さらに、交差線情報により、あらかじめ定めた閾値以下の罫線に対する交差線の有無を調べ桁線情報を付加することにより、桁罫線を明確に判別することができる。
【0020】
また、この罫線情報処理方法の処理プログラムを記憶媒体に記憶しておくことにより、既設の画像処理装置に適用することができ、既設の画像処理装置の罫線認識処理を精度良く行うことができる。
【図面の簡単な説明】
【図1】この発明の画像処理装置の構成を示すブロック図である。
【図2】罫線の識別処理と交差線情報付加処理を示すフローチャートである。
【図3】罫線の識別処理を示すフローチャートである。
【図4】他の罫線の識別処理を示すフローチャートである。
【図5】交差先情報の付加処理を示すフローチャートである。
【図6】罫線の修正処理を示すフローチャートである。
【図7】桁線の検出処理を示すフローチャートである。
【符号の説明】
1;CPU、2;ROM、3;RAM、4;表示装置、5;ハードデイスク、
6;キーボード、7;マウス、8;CD−ROMドライブ、
9;CD−ROM、10;スキャナ。

Claims (4)

  1. 制御装置が、入力した画像データの黒画素の連結を調べてランを抽出する工程と、
    抽出したランの長さが閾値以上のものを罫線ランとしてメモリに登録する工程と、
    登録した各罫線ラン同士が接触しているかどうかを判別し、罫線ラン同士が接触していれば罫線としてメモリに登録する工程と、
    登録した罫線に対して交差線が存在するか否を判定し、交差線が存在する罫線情報に交差線情報を付加する工程と、
    登録した全ての罫線に対して交差線情報により交差線の有無を調べる工程と、
    交差線がない罫線の長さが第2の閾値以下であるかどうかを判定し、交差線がない罫線の長さが第2の閾値以下の罫線を無効にして罫線情報を修正する工程と、
    実行することを特徴とする罫線情報処理方法。
  2. 罫線情報処理を行うために制御装置を、
    入力した画像データの黒画素の連結を調べてランを抽出する手段と、
    抽出したランの長さが閾値以上のものを罫線ランとしてメモリに登録する手段と、
    登録した各罫線ラン同士が接触しているかどうかを判別し、罫線ラン同士が接触していれば罫線としてメモリに登録する手段と、
    登録した罫線に対して交差線が存在するか否を判定し、交差線が存在する罫線情報に交差線情報を付加する手段と、
    登録した全ての罫線に対して交差線情報により交差線の有無を調べる手段と、
    交差線がない罫線の長さが第2の閾値以下であるかどうかを判定し、交差線がない罫線の長さが第2の閾値以下の罫線を無効にして罫線情報を修正する手段、
    として機能させるための罫線情報処理プログラム。
  3. 請求項2記載の罫線情報処理プログラムを有することを特徴とする画像処理装置。
  4. 請求項2記載の罫線情報処理プログラムを記憶したことを特徴とする画像処理装置の制御装置で読み取り可能な記憶媒体。
JP2001069561A 2001-03-13 2001-03-13 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体 Expired - Fee Related JP4270767B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001069561A JP4270767B2 (ja) 2001-03-13 2001-03-13 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001069561A JP4270767B2 (ja) 2001-03-13 2001-03-13 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2002269575A JP2002269575A (ja) 2002-09-20
JP4270767B2 true JP4270767B2 (ja) 2009-06-03

Family

ID=18927581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001069561A Expired - Fee Related JP4270767B2 (ja) 2001-03-13 2001-03-13 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体

Country Status (1)

Country Link
JP (1) JP4270767B2 (ja)

Also Published As

Publication number Publication date
JP2002269575A (ja) 2002-09-20

Similar Documents

Publication Publication Date Title
JPH1139428A (ja) 文書映像の方向修正方法
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP5677139B2 (ja) 帳票文字認識装置
JP4270767B2 (ja) 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3090070B2 (ja) 帳票識別方法及び装置
JP4253265B2 (ja) 影検出装置、影検出方法及び影検出プログラム、影検出装置を用いた画像処理装置、影検出方法を用いた画像処理方法及び影検出プログラムを用いた画像処理プログラム
JP7532124B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JPH0490083A (ja) 文字認識装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP4248700B2 (ja) 罫線識別方法、罫線識別装置および記録媒体
JP4974794B2 (ja) 文書認識装置、文書認識方法、コンピュータプログラム
JP2002366900A (ja) 光学式文字読取装置
JP2923004B2 (ja) 画像生成装置
JP4094240B2 (ja) 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2674475B2 (ja) 文字読取装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JP2963474B2 (ja) 類似文字識別方法
JP2002042138A (ja) 画像照合装置、画像照合方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH07168911A (ja) 文書認識装置
JPH0850631A (ja) 文字認識装置
JPH04276888A (ja) 文字読取装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050928

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090224

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120306

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130306

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140306

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees