JP2000172780A - 帳票登録装置および図形認識装置 - Google Patents

帳票登録装置および図形認識装置

Info

Publication number
JP2000172780A
JP2000172780A JP10351158A JP35115898A JP2000172780A JP 2000172780 A JP2000172780 A JP 2000172780A JP 10351158 A JP10351158 A JP 10351158A JP 35115898 A JP35115898 A JP 35115898A JP 2000172780 A JP2000172780 A JP 2000172780A
Authority
JP
Japan
Prior art keywords
graphic
image
extracting
ruled
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10351158A
Other languages
English (en)
Inventor
Hiroaki Kubota
浩明 久保田
Mieko Matsuda
三恵子 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10351158A priority Critical patent/JP2000172780A/ja
Publication of JP2000172780A publication Critical patent/JP2000172780A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 罫線や枠などの要素をできるだけ正確に抽出
し、未抽出や過抽出を抑え、手作業による図形入力を削
減すること。 【解決手段】 読み込まれた帳票画像から罫線を抽出
し、罫線情報から罫線枠を抽出した後、抽出された罫線
枠に相当する部分の画像データを前記帳票画像から消去
し、生成された枠消去画像から再び罫線を抽出し、さら
に抽出された罫線に相当する部分の画像データを消去
し、生成された罫線消去画像から文字列を抽出すること
を特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票処理システ
ム、帳票入力システムなどにおいて既存の帳票のフォー
マットをデータ化し、データを書き込んで印刷したり、
手書きのデータを読み取ったりするための帳票登録装置
および図形認識装置に関する。
【0002】
【従来の技術】既存の帳票のフォーマットをデータ化
し、データベース等に登録する場合には、従来から対象
となる帳票の画像を取り込んで、その画像を画面上に表
示し、画像に基づいて罫線や枠、プレ印字文字など要素
をCADで入力し、フォーマットを定義する方法があっ
た。この方法では、要素の入力に多大な労力を必要と
し、省力化が望まれていた。
【0003】これを解決するために、取り込まれた画像
に対して画像処理を施し、帳票内の罫線や枠を図形とし
て自動抽出する方法が提案された。この方法では、罫線
や枠の位置やサイズをユーザが逐次画像に合わせて入力
することなく、自動で行えるために効率化を実現でき
た。
【0004】また、プレ印字に対しても、文字列抽出技
術により文字部分の切り出しが自動化され、文字認識技
術により文字部分のコード変換が自動化され、一層の効
率化が実現できた。
【0005】ところが、この方法では比較的シンプルな
帳票フォーマットであれば、全ての要素やプレ印字文字
を抽出し認識できるが、複雑な帳票になると未抽出や過
抽出が非常に多くなり、依然と同様のCADによる要素
入力を行わなければならなく、完全な自動化ができな
い。
【0006】
【発明が解決しようとする課題】本発明は、既存の帳票
のフォーマットを登録する際、罫線や枠などの図形要素
を自動で抽出することによってフォーマットを定義する
場合において、図形要素の数が多い複雑な帳票に対して
も、罫線や枠などの要素をできるだけ正確に抽出し、未
抽出や過抽出を抑え、手作業による要素入力を削減する
ことを目的とする。
【0007】
【課題を解決するための手段】本発明の帳票登録装置
は、帳票のフォーマットを定義して、帳票テンプレート
として登録しておく帳票登録装置において、登録すべき
帳票の画像データを読み込む帳票画像入力手段と、読み
込まれた帳票画像から罫線を抽出し、罫線情報から罫線
枠を抽出する枠抽出手段と、抽出された罫線枠に相当す
る部分の画像データを前記帳票画像から消去する枠消去
手段と、前記枠消去手段によって生成された枠消去画像
から再び罫線を抽出する罫線抽出手段と、抽出された罫
線に相当する部分の画像データを前記枠消去画像から消
去する罫線消去手段と、前記罫線消去手段によって生成
された罫線消去画像から文字列を抽出する文字列抽出手
段とを具備することを特徴とする。
【0008】また、入力された画像から複数の図形要素
を抽出する図形認識装置において、ある一定の特徴を持
った図形要素を抽出する図形要素抽出手段と、前記図形
要素抽出手段によって抽出された図形要素に相当する部
分を対象画像から消去する図形消去手段とを具備し、前
記図形要素抽出手段における図形抽出と図形消去手段に
よる図形消去を、抽出すべき図形特徴を変えながら繰り
返して行うことを特徴とする。
【0009】また、入力された画像から複数の図形要素
を抽出し、登録する図形認識装置において、ある一定の
特徴を持った図形要素を抽出する図形要素抽出手段と、
前記図形要素抽出手段によって抽出された図形要素に相
当する部分を対象画像から消去する図形消去手段と、前
記図形消去手段によって残された画素を画面上に呈示
し、その呈示にしたがって新たなる図形要素を編集する
図形編集手段とを具備することを特徴とする。
【0010】入力された画像から複数の図形要素を抽出
し、登録する図形認識装置において、ある一定の特徴を
持った図形要素を抽出する図形要素抽出手段と、前記図
形要素抽出手段によって抽出された図形要素に相当する
画素を色などの表示方法を変えて画面上に表示する画像
表示手段と、前記画像表示手段によって表示される画面
上で、新たなる図形要素を編集する図形編集手段とを具
備することを特徴とする。
【0011】
【発明の実施の形態】図1は、本発明の帳票登録装置の
ハードウェア構成図である。この帳票登録装置装置は、
システム全体をコントロールする制御装置1、制御装置
1に指示を与えるなどのためのキーボードなどの指示装
置2、帳票の画像を入力するための画像入力装置3、帳
票のフォーマット情報を修正するために画面上の位置を
指示するためのマウスなどのポインティング装置3、帳
票の画像や登録されたフォーマット情報などをシステム
内に保持しておくメモリ装置4、帳票の画像や登録され
たフォーマット情報などを表示するためのディスプレイ
装置5、登録されたフォーマット情報を外部に記録する
ための外部記憶装置6より構成される。
【0012】まず、図2を用いて帳票のフォーマットを
帳票画像から図形抽出によって登録する場合に、抽出さ
れた図形要素から順次その図形要素に相当する画像を消
去しながら、精度良く図形抽出を行う帳票登録装置の第
1の実施例を説明する。すなわち、最初に罫線枠を抽出
し、抽出された罫線枠に相当する画像を消去してから、
次に消去された画像に対して罫線を抽出し、抽出された
罫線に相当する画像を消去してから、最後にプレ印字文
字を抽出し、抽出された罫線枠、罫線、プレ印字文字の
情報を帳票フォーマットとして登録する。
【0013】図2は、第1の実施例にかかわる帳票登録
装置の処理ブロック図である。この帳票登録装置は、画
像入力装置3から画像データを取り込む画像取り込み部
101、取り込んだ画像から罫線を抽出する罫線抽出部
102、抽出された罫線情報を組み合わせて枠を抽出す
る罫線枠抽出部103、罫線以外の画素より文字領域を
抽出するプレ印字文字抽出部104、抽出された罫線の
情報を用いて罫線に相当する画像部分を消去する罫線消
去部105、抽出された枠の情報を用いて枠に相当する
画像部分を消去する罫線枠消去部106、プレ印字文字
領域として抽出された領域の文字認識を行うプレ印字文
字認識部107、抽出された罫線の修正や新たな罫線の
追加を行う罫線修正部108、抽出された枠の修正や新
たな枠の追加を行う罫線枠修正部109、プレ印字文字
領域の追加・修正および文字認識されたプレ印字文字コ
ードの修正を行うプレ印字文字修正部110、抽出ある
いは修正された罫線、枠、文字の情報をメモリ装置4に
格納する帳票情報格納部111、取り込んだ画像、罫
線、枠、文字帳票情報表示部112からなる。
【0014】図3は、第1の実施例にかかわる帳票登録
装置における図形抽出のためのフローチャートであり、
図4はその図形抽出における画像の変化の例を示したも
のである。まず、画像取り込み部101により入力され
た帳票画像A(たとえば401)から、罫線抽出部10
2により罫線を抽出する(ST201)。罫線を抽出す
るには、例えば画像の連結成分の輪郭線や中心線を線分
近似することにより行う。次いで、抽出された罫線の情
報を使って、罫線枠抽出部103により罫線枠を抽出す
る(ST202)。たとえば、帳票画像401に対して
は402に示される罫線枠が抽出される。ここで、罫線
から罫線枠を抽出するには、その一手法として特開平0
8−221506号で示されているように長方形を形成
するような罫線同士の交差点を4つずつ拾い出し、この
4点を頂点とするような枠が存在するかを検査すること
により行う方法がある。次いで、抽出された罫線枠の情
報を使って、罫線枠消去部106により帳票画像Aから
罫線枠に相当する画素を消去し、枠消去画像B(たとえ
ば帳票画像401に対して403)を得る(ST20
3)。罫線枠に相当する画像の消去は、たとえば図5に
示すように、入力された画像501に対して抽出された
罫線枠502を形成する各辺の線分からマスク503を
つくり、このマスク503に重なった入力画像501の
画素を消去することで実現できる。次いで、枠消去画像
Bから、罫線抽出部102により再び罫線を抽出する
(ST204)。抽出された罫線の情報を使って、罫線
消去部105により枠消去画像Bから罫線に相当する画
素を消去し、罫線消去画像C(たとえば帳票画像401
に対して404)を得る(ST205)。抽出された罫
線を使ってその罫線に相当する画素を消去するには、ス
テップST203と同様に罫線消去のためのマスクを生
成し、そのマスクに重なった画素を消去する。最後に、
得られた罫線消去画像Cから、プレ印字文字抽出部10
4によりプレ印字文字列を抽出する(ST206)。こ
の手順では、罫線修正部108・罫線枠修正部109・
プレ印字文字修正部110において、罫線枠、罫線、プ
レ印字文字の抽出後に各図形要素の修正を行うことも可
能であるし、最終的に登録する直前に各図形要素に修正
を加えることもできる。また、抽出されたプレ印字文字
領域については、プレ印字文字認識部107において、
その領域を文字認識することにより文字コードに変換
し、プレ印字文字修正部110において、その変換結果
を修正することができる。これら抽出・認識後に修正を
加えた結果獲得された罫線枠、罫線、プレ印字文字の各
情報を最後に帳票フォーマットとして登録する。
【0015】以上のように、罫線枠を含む画像から、罫
線、罫線枠、文字列を抽出する際に、罫線枠、罫線、文
字列の順に、図形的に厳しい条件を持った図形から抽出
し、抽出後に抽出された図形に相当する画素を入力画像
から順次消去することにより、これらの図形を高精度に
抽出することができる。すなわち、罫線枠は罫線が上下
左右に4本集まったものであり、それだけ抽出する際の
条件が厳しくため、多くのノイズが存在する画像からも
比較的精度よく抽出することができる。但し、条件が厳
しいために抽出できなかった個所が残る。この未抽出の
部分からなおも精度よく抽出するために、すでに抽出さ
れた部分の画像成分を取り除いて、条件を緩めた上で再
び抽出処理を行う。ここでは、罫線枠から罫線の抽出に
変更することで条件を緩めている。さらに、罫線を抽出
した後に、抽出された部分の画像成分を取り除いて、画
像上の条件があいまいな文字部分の抽出を残された画像
から抽出するのである。
【0016】次に、この考え方を一般図形の抽出する場
合に拡張した場合における、本発明にかかわる第二の実
施例について説明する。図6は、この実施例にかかわる
図形抽出処理のフローチャートである。まず、装置は最
初に抽出すべき図形特徴Aがもつ条件をメモリに読み込
む(ST601)。次いで、入力画像に対して読み込ま
れた図形特徴Aがもつ条件に当てはまる図形を抽出する
(ST602)。もし、ここで図形が抽出されたならば
(ST603)、抽出された図形に相当する画素を入力
画像から消去する(ST604)。次に、同じ図形特徴
Aであるが一部条件を緩めた図形特徴A'を生成する(S
T605)。もし、ここで緩和する条件がない、あるい
は、条件の緩和をすでに終わっている場合ならば(ST
606)、次に抽出すべき図形特徴Bの条件を読み込む
(ST607)。新しい図形特徴の条件が設定された
ら、ステップST602に戻って、現在の図形特徴がも
つ条件に当てはまる図形を抽出する。最終的に、抽出す
べき図形特徴に対して抽出が修了した時点で処理を終了
する(ST608)。このように、図形抽出の条件の設
定、図形抽出、抽出された図形に相当する画素の削除を
繰り返すことによって、精度よく獲得したい図形データ
を得ることができる。
【0017】この考え方は、人間系についても効果を発
揮する。すなわち、入力画像から図形を抽出する装置に
おいて、まず、獲得したい図形を抽出する処理を行い、
自動で図形を抽出し、その後抽出された図形に相当する
部分を消去することにより、抽出できなかった部分をわ
かりやすく表示することができ、その後の編集作業を容
易にすることができる。
【0018】また、上記の考え方において画像に相当す
る部分の画素を消去する代わりに、色を変えて表示する
こともできる。たとえば、入力された画像501に対し
て抽出された罫線枠502に相当する部分の画素を薄く
して、図7の画像701のように表示することによっ
て、どの部分が抽出されなかったことをわかりやすく表
示することができる。また、同様にカラーを使って、図
7の画像702のように残された画素を別の色で表示す
ることにより、さらに抽出されなかった部分を明示でき
る。また、前述した実施の形態と同様に、抽出された罫
線枠に相当する部分の画素を消去して、図7の画像70
3に示すように抽出されなかった部分だけを表示し、修
正や確認を容易に行わせることができる。また、図7の
画像703の表示に対して、抽出された図形要素のデー
タ、すなわち罫線枠を重ねることによって図7の画像7
04に示すような表示ができ、現時点でのフォーマット
の登録の様子をうかがうことができる。
【0019】
【発明の効果】以上説明したように、本発明によれば、
複雑な帳票の登録においても、図形抽出できた要素から
順に、画像からその図形に相当する部分を画像から消去
することが可能であり、その後に、再び図形抽出を行っ
た場合に正確に抽出を行うことができる。
【0020】また、抽出された図形に相当する部分を画
像から消去したり、図形に相当する部分の色を変えたり
して、それを画面に呈示することによって、認識できな
かった部分が一目で理解することができ、編集する際の
労力を削減する効果をもたらす。
【図面の簡単な説明】
【図1】本発明の帳票登録装置のハードウェア構成図で
ある。
【図2】本発明の帳票登録装置の処理ブロック図であ
る。
【図3】本発明の帳票登録装置における図形抽出のため
のフローチャートである。
【図4】本発明の帳票画像からの罫線枠抽出例を示す図
である。
【図5】本発明の罫線枠に相当する画素を消去する際の
説明図である。
【図6】本発明の図面認識装置における図形抽出のため
のフローチャートである。
【図7】本発明の抽出された図形要素に対応する部分の
色を変えた場合の表示例を示す図である。
【符号の説明】
101…図形データ入力部 102…描画制御部 103…描画問い合わせ部 104…描画方法設定部 105…画像描画部 106…画像出力部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 帳票のフォーマットを定義して、帳票テ
    ンプレートとして登録しておく帳票登録装置において、 登録すべき帳票の画像データを読み込む帳票画像入力手
    段と、 読み込まれた帳票画像から罫線を抽出し、罫線情報から
    罫線枠を抽出する枠抽出手段と、 抽出された罫線枠に相当する部分の画像データを前記帳
    票画像から消去する枠消去手段と、 前記枠消去手段によって生成された枠消去画像から再び
    罫線を抽出する罫線抽出手段と、 抽出された罫線に相当する部分の画像データを前記枠消
    去画像から消去する罫線消去手段と、 前記罫線消去手段によって生成された罫線消去画像から
    文字列を抽出する文字列抽出手段とを具備することを特
    徴とする帳票登録装置。
  2. 【請求項2】 入力された画像から複数の図形要素を抽
    出する図形認識装置において、 ある一定の特徴を持った図形要素を抽出する図形要素抽
    出手段と、前記図形要素抽出手段によって抽出された図
    形要素に相当する部分を対象画像から消去する図形消去
    手段とを具備し、 前記図形要素抽出手段における図形抽出と図形消去手段
    による図形消去を、抽出すべき図形特徴を変えながら繰
    り返して行うことを特徴とする図形認識装置。
  3. 【請求項3】 入力された画像から複数の図形要素を抽
    出し、登録する図形認識装置において、 ある一定の特徴を持った図形要素を抽出する図形要素抽
    出手段と、 前記図形要素抽出手段によって抽出された図形要素に相
    当する部分を対象画像から消去する図形消去手段と、 前記図形消去手段によって残された画素を画面上に呈示
    し、その呈示にしたがって新たなる図形要素を編集する
    図形編集手段とを具備することを特徴とする図形認識装
    置。
  4. 【請求項4】 入力された画像から複数の図形要素を抽
    出し、登録する図形認識装置において、 ある一定の特徴を持った図形要素を抽出する図形要素抽
    出手段と、 前記図形要素抽出手段によって抽出された図形要素に相
    当する画素を色などの表示方法を変えて画面上に表示す
    る画像表示手段と、 前記画像表示手段によって表示される画面上で、新たな
    る図形要素を編集する図形編集手段とを具備することを
    特徴とする図形認識装置。
JP10351158A 1998-12-10 1998-12-10 帳票登録装置および図形認識装置 Pending JP2000172780A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10351158A JP2000172780A (ja) 1998-12-10 1998-12-10 帳票登録装置および図形認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10351158A JP2000172780A (ja) 1998-12-10 1998-12-10 帳票登録装置および図形認識装置

Publications (1)

Publication Number Publication Date
JP2000172780A true JP2000172780A (ja) 2000-06-23

Family

ID=18415450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10351158A Pending JP2000172780A (ja) 1998-12-10 1998-12-10 帳票登録装置および図形認識装置

Country Status (1)

Country Link
JP (1) JP2000172780A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7564197B2 (en) 2003-01-29 2009-07-21 Sanken Electric Co., Ltd. Discharge tube operation device
US8769406B2 (en) 2006-08-14 2014-07-01 Konica Minolta, Inc. Image display apparatus capable of displaying image while retaining confidentiality
US11715018B2 (en) 2019-04-01 2023-08-01 Fujifilm Business Innovation Corp. Image processing apparatus and non-transitory computer readable medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7564197B2 (en) 2003-01-29 2009-07-21 Sanken Electric Co., Ltd. Discharge tube operation device
US8769406B2 (en) 2006-08-14 2014-07-01 Konica Minolta, Inc. Image display apparatus capable of displaying image while retaining confidentiality
US11715018B2 (en) 2019-04-01 2023-08-01 Fujifilm Business Innovation Corp. Image processing apparatus and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
US6628832B2 (en) Table recognition method and apparatus, and storage medium
US20090202144A1 (en) Music score deconstruction
JPS6159568A (ja) 文書処理装置
JP3602596B2 (ja) ドキュメントファイリング装置および方法
US6178264B1 (en) Image cutout method and apparatus
JP2006277001A (ja) 入力イメージ表示方法および入力イメージ表示プログラム
JP2000172780A (ja) 帳票登録装置および図形認識装置
JP2003223610A (ja) 文字認識装置及び文字認識方法
JP2000029198A (ja) 検版装置、画像処理装置および記録媒体
JP2004062351A (ja) レイアウト情報登録システム、レイアウト情報登録プログラム、およびレイアウト情報登録方法
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JPS594358Y2 (ja) 文字修正における文字制御装置
JP2705972B2 (ja) 文書処理装置
JPH01292586A (ja) 文字認識支援装置
JPH1166232A (ja) 帳票定義方法
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JPH07160811A (ja) 文字認識装置
JP2931041B2 (ja) 表内文字認識方法
JP2002032713A (ja) 文字認識処理方法
JP2001118030A (ja) 書式データ編集方法および装置
JPH0778053A (ja) 手書きコマンド入力装置
JP3168793B2 (ja) 手書き文字入力装置
JPS6292080A (ja) 文字パターン認識修正装置
JPH07334611A (ja) 非認識文字の表示方法
JPH07210623A (ja) 文書画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050314

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071022

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071113