JPH07282193A - 表を含む帳票処理装置 - Google Patents

表を含む帳票処理装置

Info

Publication number
JPH07282193A
JPH07282193A JP6076795A JP7679594A JPH07282193A JP H07282193 A JPH07282193 A JP H07282193A JP 6076795 A JP6076795 A JP 6076795A JP 7679594 A JP7679594 A JP 7679594A JP H07282193 A JPH07282193 A JP H07282193A
Authority
JP
Japan
Prior art keywords
ruled line
ruled
format
processing apparatus
lines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6076795A
Other languages
English (en)
Other versions
JP3179280B2 (ja
Inventor
Takashi Hirano
敬 平野
Yasuhiro Okada
康裕 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP07679594A priority Critical patent/JP3179280B2/ja
Publication of JPH07282193A publication Critical patent/JPH07282193A/ja
Application granted granted Critical
Publication of JP3179280B2 publication Critical patent/JP3179280B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 類似した表や手書き文字等外乱を含む表、罫
線の切れた表、歪んだり傾いた表、拡大・縮小された表
に対しても高精度の表照合を行い、文字読取り領域位置
を正確に算出する表を含む帳票処理装置を提供する。 【構成】 表を含む帳票処理装置が罫線抽出手段1、表
構造解析手段2、表フォーマットデータベース3、表照
合手段4、フィールド位置探索手段5、結果表示手段6
で構成される。罫線抽出手段1では表を含む帳票が読取
られ、読取った画像中の表領域に含まれる罫線が抽出さ
れる。表構造解析手段2では抽出された罫線から表フォ
ーマットが作成される。表フォーマットデータベース3
では表フォーマットが格納される。表照合手段4では前
記罫線と表フォーマットとが照合される。フィールド位
置探索手段5では画像上の文字読取り領域位置が算出さ
れる。結果表示手段6では表照合結果及びフィールド位
置探索結果が出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は帳票処理装置に関する。
特に本発明は帳票上の表に記入された文字や記号を読取
る帳票処理装置に関する。
【0002】
【従来の技術】帳票上の表に記入された文字、記号等を
読取るには、まず表の形式を判定する表照合処理が行わ
れる。次に表の形式から規定される表中の文字読取り領
域(以下、フィールド領域という。)の画像上での位置
が算出される。最後にフィールド領域内の文字を切り出
し、切り出された文字が認識される。
【0003】従来このような要求に応える帳票処理装置
が特開平2−217977号公報に開示されている。こ
の開示された帳票処理装置において表照合処理を行うブ
ロック構成を図15に示す。図中、符号201は光電変
換部、202はイメージバッファ、203は線分検出
部、204はフレーム構造抽出部、205はフレーム構
造辞書格納部、206はフレーム構造マッチング部、2
07はフィールドイメージ抽出部、208は文字検出切
出し部、209は文字認識部である。
【0004】前記帳票処理装置において表照合処理は以
下の手順で行われる。
【0005】まず、光電変換部201において図16に
示す表を含む帳票210が光学的走査に基づき帳票画像
として読取られる。この読取られた帳票画像はイメージ
バッファ202に格納される。次に、線分検出部203
において予め定められた線分検出領域211内から図1
7に示す水平方向罫線H1〜H6が検出される。次に、
フレーム構造抽出部204において検出された水平方向
罫線H1〜H6に基づきフレーム構造が抽出される。こ
こでフレーム構造は水平方向罫線の本数、各罫線の長
さ、太さ及び位置関係で表わされる。
【0006】前記フレーム構造が抽出された後、予めフ
レーム構造辞書格納部205に格納されたフレーム構造
情報が表フォーマットとして読出される。フレーム構造
マッチング部206において読出された表フォーマット
とフレーム構造抽出部204で抽出されたフレーム情報
との表照合が行われる。表照合の結果、異なった表であ
ると判定された場合には別の表フォーマットがフレーム
構造辞書格納部205から読出され、再度表照合が行わ
れる。また表照合の結果、同一の表であると判定された
場合にはフレーム構造辞書格納部205から帳票上のフ
ィールド領域位置を示す読取りフィールド位置情報が読
出される。読出された読取りフィールド位置情報はフィ
ールドイメージ抽出部207に出力される。
【0007】そして、フィールドイメージ抽出部207
において読取りフィールド位置情報が示すフィールド領
域位置のイメージが画像から抽出される。次に、文字検
出切出し部208においてフィールド領域内に存在する
文字イメージが切出される。最後に、文字認識部209
において文字検出切出し部208で切り出された文字イ
メージが認識される。
【0008】
【発明が解決しようとする課題】前述の開示された帳票
処理装置で行なわれる表照合処理においては以下の点の
配慮がなされていない。
【0009】第1に、前記表フォーマットには線分検出
領域211として指定された領域内で検出された罫線の
本数、各罫線の長さ、太さ及び位置関係等、罫線の属性
を示す罫線属性情報が使用される。このため、罫線属性
情報が類似する場合には構造的に異なる表が区別できな
い。例えば、図18(A)、(D)にそれぞれ示す2つ
の表イメージ220及び221は構造的に異なる。とこ
ろが、罫線属性情報においては図18(B)及び(E)
に示す水平方向罫線H1とH2とがかなり類似してお
り、図18(C)及び(F)に示す垂直方向罫線V1と
V2とは同一であるので、罫線属性情報の水平方向罫線
H1とH2との間の差では表イメージ220と221と
の間の相違性が表現できない。
【0010】第2に、表に歪が存在する場合、表が傾い
た場合、表が拡大や縮小された場合には罫線属性情報で
ある罫線の位置情報や長さ情報に狂いが生じるので、正
しく表照合処理ができない。
【0011】第3に、手書き文字等を表に記入した場
合、文字部分から多数の余分な罫線が検出される。ま
た、その文字部分から検出された罫線と表罫線とが接触
して、見かけの表罫線長さが長くなる。これにより罫線
の本数と長さの情報に狂いが生じるので、表照合処理が
困難になる。
【0012】第4に、表罫線に切れ、かすれ等が存在す
る場合には罫線の長さや本数が実際の表と異なり、正し
く表照合処理ができない。
【0013】第5に、フィールド領域を抽出する場合に
おいて読取りフィールド位置情報に示したフィールド領
域位置のイメージが画像から直接抽出される。フィール
ド領域位置は一般に表領域を基準とした座標値等で示さ
れ、表の拡大、縮小、表の傾き、表の歪みは考慮されな
い。このため、歪んだ表、傾いた表、拡大や縮小された
表においては予め格納されたフィールド領域位置と実際
の画像上での位置との間にずれが生じ、正確なフィール
ド領域位置が得られない。
【0014】本発明は、このような課題を解決するため
になされたもので、類似した罫線属性情報を持つ表、手
書き文字等の外乱を含む表、歪んだ表、傾いた表、拡大
や縮小された表、切れやかすれを持つ表に対しても高精
度な表照合が得られ、かつ正確なフィールド領域位置が
得られる帳票処理装置の提供を目的する。
【0015】
【課題を解決するための手段】上記目的を達成するため
に、本発明に係る表を含む帳票処理装置は、罫線抽出手
段、表構造解析手段、表フォーマットデータベース、表
照合手段、フィールド位置探索手段、及び結果出力手段
を備えたことを特徴とする。
【0016】前記罫線抽出手段は画像入力手段、表領域
抽出手段、及び罫線属性情報算出手段で構成され、帳票
上の表領域に含まれる罫線が抽出される。
【0017】前記表構造解析手段は表外接罫線検出手
段、罫線構造情報算出手段、及び表フォーマット作成手
段で構成され、前記罫線抽出手段で抽出された罫線から
表フォーマットが作成される。前記表フォーマットデー
タベースにおいては前記表構造解析手段で作成された表
フォーマットが格納される。前記表照合手段は罫線対応
付け手段及び確信度算出手段で構成され、読取った帳票
に含まれる表と表フォーマットとが同一表であるか否か
を判定する。
【0018】前記フィールド位置探索手段においては画
像上のフィールド位置が探索される。
【0019】前記結果出力手段においては表照合結果及
びフィールド位置探索結果が出力される。
【0020】
【作用】本発明に係る表を含む帳票処理装置において
は、罫線抽出手段で表を含む帳票が画像として読込ま
れ、帳票上の表領域に含まれる罫線が抽出される。表構
造解析手段においては前記罫線抽出手段で抽出された罫
線から表フォーマットが作成される。表フォーマットデ
ータベースは前記表構造解析手段で作成された表フォー
マットを格納する。表照合手段においては表フォーマッ
トデータベースに格納された表フォーマットに記載され
る表構造と帳票上の表領域から罫線抽出手段で抽出され
た罫線とが照合される。フィールド位置探索手段におい
ては前記表照合結果及び表フォーマットに記載された読
取りフィールド位置情報に基づき帳票画像上のフィール
ド領域位置が算出される。結果出力手段は確信度及びフ
ィールド領域位置を出力する。
【0021】前記罫線抽出手段の画像入力手段において
は表を含む帳票が読込まれる。前記画像入力手段で読込
んだ帳票画像上の表領域は表領域抽出手段で抽出され
る。罫線属性情報算出手段においては前記表領域抽出手
段で抽出された表領域内に含まれる罫線が抽出され、罫
線属性情報が算出される。
【0022】前記表外接罫線検出手段においては前記罫
線抽出手段で抽出された罫線中から表外接罫線が検出さ
れ、この検出された表外接罫線に基づき罫線構造情報算
出手段で表構造を解析して罫線構造情報が算出される。
表フォーマット作成手段においては罫線構造情報算出手
段で算出された罫線構造情報及び前記罫線属性情報算出
手段で算出された罫線属性情報からなる罫線情報に基づ
き表フォーマットが作成される。前記表外接罫線検出手
段においては表が複数の矩形表に分割され、この矩形表
を構成する外接罫線が表外接罫線として登録される。
【0023】前記罫線対応付け手段においては前記罫線
抽出手段で抽出された罫線と表フォーマットに記載され
た罫線とが対応付けられ、この罫線対応付け手段で得ら
れた罫線同士の対応関係から確信度算出手段で確信度が
算出される。
【0024】前記罫線対応付け手段では対応付けが段階
的に行われ、同一の罫線構造情報を持つ表フォーマット
に記載された罫線群と前記罫線抽出手段で抽出された罫
線群とが対応付けられる。前記罫線対応付け手段におい
ては現段階以前に得られた罫線同士の対応関係を指標と
して現段階での罫線対応付けが行われる。
【0025】前記罫線対応付け手段は前記罫線抽出手段
で表領域から抽出された罫線に切れやかすれがある場合
に複数罫線を組合わせて仮想罫線を作成し、前記表フォ
ーマットに記載された罫線との類似性が高い組合わせ結
果に基づいて表フォーマットに記載された罫線と仮想罫
線との対応付けが行われる。
【0026】前記確信度算出手段においては前記罫線抽
出手段で表領域から抽出された罫線毎に表フォーマット
との相違性が算出され、これら各罫線毎に算出された相
違性から表の確信度が算出される。
【0027】前記表フォーマット作成手段においては表
照合に用いる表構造情報に加えて表フォーマットに記載
した罫線の組合わせによりフィールド領域を示す読取り
フィールド位置情報が表フォーマットに格納される。前
記フィールド位置探索手段においては前記表照合手段で
得られた罫線対応付け結果と表フォーマットに記載され
た読取りフィールド位置情報に基づき画像上でのフィー
ルド領域位置が算出される。
【0028】
【実施例】以下、本発明に係る実施例について、図面を
参照し説明する。
【0029】本発明に係る表を含む帳票処理装置の全体
構成を図1に示す。図1に示すように、表を含む帳票処
理装置は罫線抽出手段1、表構造解析手段2、表フォー
マットデータベース3、表照合手段4、フィールド位置
探索手段5及び結果出力手段6を備える。
【0030】前記罫線抽出手段1においては表を含む帳
票が画像として読込まれ、この帳票画像中の表領域に含
まれる罫線が抽出される。この罫線抽出手段1は画像入
力手段1a、表領域抽出手段1b及び罫線属性情報算出
手段1cで構成される。
【0031】前記表構造解析手段2においては前記罫線
抽出手段1で抽出された罫線から表フォーマットが作成
される。この表構造解析手段2は表外接罫線検出手段2
a、罫線構造情報算出手段2b及び表フォーマット作成
手段2cで構成される。
【0032】前記表フォーマットデータベース3におい
ては前記表構造解析手段2で作成された表フォーマット
が格納される。
【0033】前記表照合手段4においては前記罫線抽出
手段1で表領域内から抽出された罫線と表フォーマット
データベース3に格納された表フォーマットに記載され
た表構造とが照合される。この表照合手段4は罫線対応
付け手段4a及び確信度算出手段4bで構成される。
【0034】前記フィールド位置探索手段5においては
前記表フォーマットに記載された読取りフィールド位置
情報及び表照合手段4で得られた罫線対応付け結果に基
づいて画像上のフィールド領域位置が求められる。前記
結果出力手段6においては前記表照合手段4で算出され
た確信度及びフィールド位置探索手段5で求められたフ
ィールド領域位置が出力される。
【0035】このように構成される表を含む帳票処理装
置においては表フォーマット作成処理、表読取り処理の
2通りの処理が行われる。ここで、表フォーマット作成
処理は空の表を含む帳票から表フォーマットを作成する
処理である。また、表読取り処理は、文字の記入された
表を含む帳票を読込み、表フォーマットと照合して同一
表と判定した場合にフィールド領域を探索する処理であ
る。以降、上記表を含む帳票処理装置の表フォーマット
作成処理、表読取り処理について各々別々に説明する。
【0036】表フォーマット作成処理 まず、表フォーマット作成処理の手順について説明す
る。この表フォーマット作成処理は図1に示す罫線抽出
手段1、表構造解析手段2及び表フォーマットデータベ
ース3で行なわれる。表フォーマット作成処理の手順の
概要は、最初に罫線抽出手段1において何も記入されて
いない空表を含む帳票の表領域内に含まれる罫線を抽出
する。この罫線抽出手段1で抽出された罫線に基づき表
構造解析手段2で空表に対する表フォーマットが作成さ
れる。最後に表構造解析手段2で作成した表フォーマッ
トが表フォーマットデータベース3に格納される。
【0037】次に、表フォーマット作成処理の詳細な手
順について図1乃至図8を使用し説明する。図2は画像
として読込まれた表を含む帳票画像を示す。図3は帳票
画像上の表領域から抽出された縦横罫線を示す。図4は
罫線同士の交点特徴例を示す。図5は表の外接罫線を示
す。図6には罫線構造情報算出手段2bで行なわれる処
理のフローチャートが示される。図7は罫線構造情報算
出手段2bで行なわれる構造解析例を示す。図8には表
フォーマット作成手段2cで作成された表フォーマット
例を示す。
【0038】最初に、罫線抽出手段1の画像入力手段1
aにおいて空表を含む帳票40(図2参照)が読込まれ
る。画像入力手段1aにはファクシミリ(FAX)、イ
メージリーダ等の光学的画像読取り装置が使用される。
次に、表領域抽出手段1bにおいて帳票画像40上の表
領域41が抽出される。表領域41は例えば「陸、李、
“A Table Processing Algorithm for Printed
Document Analysis ”、D−610、信学論春季全
大、1990年」に示される方法で抽出できる。次に、
罫線属性情報算出手段1cにおいて表領域41内の縦横
方向(垂直水平方向)罫線が抽出される。そして同時
に、抽出された各罫線の長さ、始終点、線種、罫線同士
の接続関係、交点位置、交点特徴等の罫線属性情報が算
出される。これら罫線及び罫線属性情報は例えば「林、
下辻、他、“特徴パターン情報検出による図面の効果的
自動入力法について”、PRL83−8、第57頁−第
64頁、1983年」に示される方法で抽出できる。こ
れらの方法によって、表領域41内から図3に示す横罫
線h0〜h6及び縦罫線v0〜v11を有する罫線群が
得られる。前述の交点特徴は横罫線h及び縦罫線vの2
罫線の接触状態を表し、図4(A)〜(I)に示す9形
態がある。横罫線hと縦罫線vとの交点は符号cで示
す。罫線属性情報算出後には罫線抽出手段1での処理が
終了する。
【0039】次に、表構造解析手段2での処理が実行さ
れる。表構造解析手段2においては図1に示す表外接罫
線検出手段2a、罫線構造情報算出手段2b及び表フォ
ーマット作成手段2cで処理が行われる。
【0040】表構造解析手段2の表外接罫線検出手段2
aにおいては罫線抽出手段1で抽出された罫線中から表
外接罫線が検出される。ここで、表外接罫線は表を複数
の矩形表に分解した際に各矩形表の外枠をなす4罫線と
定義する。表外接罫線は以下の手順で求められる。
【0041】まず、図3において、所定長以上の長さを
持つ罫線中、最上位及び最下位に位置する2本の横罫線
h0、h6と最左位及び最右位に位置する2本の縦罫線
v0、v11とが外接罫線候補として選択される。次
に、外接罫線候補の平行な2本の罫線に両端が接触する
罫線、横罫線h1、h3、h4、h5、h6及び縦罫線
v0を罫線群から検出する。この検出された罫線のうち
最上位及び最下位に位置する横罫線と最左位及び最右位
に位置する縦罫線を求め、その罫線を外接罫線候補に追
加する。これにより横罫線h1及びh6と縦罫線v0が
外接罫線候補に追加される。
【0042】次に、求められた外接罫線候補すなわち縦
罫線v0、v11、横罫線h0、h1及びh6が組合わ
され、仮想矩形が設定される。仮想矩形は2本の縦罫線
及び2本の横罫線を含む合計4本の仮想外接罫線で指定
される矩形である。前述の外接罫線候補においては3つ
の仮想矩形(v0、v11、h0、h1)、(v0、v
11、h1、h6)及び(v0、v11、h0、h6)
が設定できる。
【0043】次に、各仮想矩形が正しい矩形表であるか
否かが調べられる。ここで、仮想矩形を構成する4本の
外接罫線候補が端点同士で接続して1矩形を構成する場
合に正しい矩形表であると定義する。そして、正しい矩
形表であると判定された仮想矩形において外接罫線候補
を外接罫線として仮想矩形が矩形表として登録される。
本実施例においては外接罫線候補v0、v11、h1及
びh6から構成される矩形表が正しい矩形表であると判
定され、登録される。
【0044】その後、正しい矩形表であると判定されな
かった各仮想矩形領域内において外接罫線候補の探索が
行われ、再度上記処理が実行される。この処理は仮想矩
形領域が探索不能になるまで繰返され、処理が繰返され
ると複雑な外形の表が複数の矩形表に分割され、この複
数に分割された矩形表において各々外接罫線が求められ
る。この結果、図5に示すように、外接罫線v0、v
4、h0及びh1で囲まれた矩形表Aと外接罫線v0、
v11、h1及びh6で囲まれた矩形表Bとが求められ
る。
【0045】次に、前記表外接罫線算出手段2aで求め
られた表外接罫線及び罫線抽出手段1で抽出された罫線
に基づき罫線構造情報算出手段2bにおいて表構造が解
析され、罫線構造情報が算出される。この罫線構造情報
算出手段2で行われる処理の流れは図6に示すフローチ
ャート及び図7に示す構造解析例を使用し具体的に説明
する。
【0046】まず、図6に示す初期化手段7において段
階i=0が設定される。次に、外接罫線登録手段8にお
いて表外接罫線検出手段2aで得られた外接罫線が検出
済み罫線として登録される。図7(A)〜(D)中、実
線は現段階以前に検出された罫線を示し、点線は未検出
罫線を示す。ここでは例えば図7(A)に示す6本の罫
線v0、v4、v11、h0、h1及びh6が登録され
る。
【0047】次に、分割罫線検出手段9において登録済
み罫線に両端が接触する罫線が検出され、図7(B)に
示す横罫線h3、h4及びh5と縦罫線v1、v2及び
v7が検出される。そして、判定手段10において処理
の終了判定が行われる。ここでは罫線が検出されない場
合に処理が終了し、逆に罫線が検出された場合に段階i
がインクリメントされ罫線情報読取り手段11が実行さ
れる。罫線情報読取り手段11では検出された罫線が持
つ罫線構造情報が求められる。罫線構造情報は罫線が検
出された段階i及び罫線の両端が接触する直交方向の2
罫線(以下、この2罫線は親罫線という。)の罫線番号
で構成される。
【0048】そして、罫線登録手段12において現段階
で検出された罫線が追加登録され、処理が繰返される。
この処理の繰返しにより、図7(C)に示す段階を経て
表を構成する全罫線を有する罫線構造情報が段階的に得
られる。最終的には図7(D)に示すように最終段階i
max=3までに全罫線が検出される。
【0049】前記罫線構造情報算出手段2bでの処理が
終了すると、表フォーマット作成手段2cでの処理が実
行される。表フォーマット作成手段2cにおいては罫線
属性情報算出手段1cで算出された罫線属性情報及び罫
線構造情報算出手段2bで算出された罫線構造情報に基
づいて表フォーマットが作成される。図8には図3に示
す罫線群から作成された表フォーマット例を示す。この
表フォーマットは同図8に示すように表構造情報部及び
読取りフィールド位置情報部で構成される。表構造情報
部は表照合に用いる表構造情報を格納する部分である。
表構造情報は表を構成する各罫線が有する罫線番号、始
終点、長さ、線種、親罫線番号、段階等の罫線情報を罫
線構造情報算出手段2bで検出された全罫線分において
まとめたものである。読取りフィールド位置情報部はフ
ィールド位置探索手段で用いる読取りフィールド位置情
報を格納する部分である。読取りフィールド位置情報は
フィールドを構成する罫線番号であ。例えば図3に示す
フィールド20の位置を探索する場合にはフィールド2
0を構成する罫線番号h1、h3、v0、v2が読取り
フィールド位置情報として使用される。表中の何処をフ
ィールドとするかについては表構造情報に基づき人為的
に指定が行われる。
【0050】表フォーマット作成手段2cでの処理が終
了すると作成された表フォーマットが表フォーマットデ
ータベース3に格納され、表フォーマット作成処理が終
了する。
【0051】表読取り処理 次に、表読取り処理の手順について説明する。表読取り
処理は図1に示す罫線抽出手段1、表フォーマットデー
タベース3、表照合手段4、フィールド位置探索手段5
及び結果出力手段6で行われる。この表読取り処理の手
順の概要は、最初に罫線抽出手段1において文字を記入
した表を含む帳票が画像として読込まれ、表領域中に含
まれる罫線が抽出される。次に、表照合手段4において
表フォーマットデータベース3に格納された表フォーマ
ットに記載される表構造情報と罫線抽出手段1で抽出さ
れた罫線とが照合され確信度が算出される。表照合手段
4において表フォーマットと同一表であると判定された
場合には表照合結果及び表フォーマットに記載される読
取りフィールド位置情報に基づきフィールド位置探索手
段5で画像上のフィールド領域位置が算出される。最後
に結果出力手段6において表照合手段4で算出された確
信度及びフィールド位置探索手段5で求められた画像上
のフィールド領域位置が出力される。
【0052】次に、表読取り処理の手順の詳細について
図1、図3及び図9〜図14を使用し説明する。図9は
文字が記入された表領域から抽出された縦横罫線を示
す。図10は罫線対応付け手段4aで行われる処理の流
れを示すフローチャートである。図11は分割罫線率の
算出例を示す。図12は分割罫線率が同じとなる例を示
す。図13は切れた罫線の補間例を示す。図14はフィ
ールド領域抽出例を示す。
【0053】最初に、罫線抽出手段1において文字が記
入された表を含む帳票が画像として読込まれ、表領域が
抽出された後、表領域内の縦横方向罫線が抽出される。
罫線抽出手段1での処理は先に述べた表フォーマット作
成処理の場合と同じであり、結果として図9に示す縦横
方向罫線が表領域内で抽出される。
【0054】前記罫線抽出手段1において処理が終了す
ると表照合手段4での処理が実行される。表照合手段4
は図1に示す罫線対応付け手段4a及び確信度算出手段
4bで構成される。以降には、罫線抽出手段1で抽出さ
れた図9に示す罫線群と図3に示す表から作成された表
フォーマットとが照合される場合を想定し、各処理の内
容を順に説明する。
【0055】罫線対応付け手段4aにおいては罫線抽出
手段1で画像から抽出された罫線(以下、表イメージ罫
線という。)及び表フォーマットに記述された罫線(以
下、表フォーマット罫線という。)が対応付けられる。
この対応付けは段階的に行われ、1回の対応付けで同一
の罫線構造情報を持つ表フォーマット罫線群と表イメー
ジ罫線から選出された罫線候補群とが対応付けられる。
【0056】この罫線対応付け手段4aで行われる処理
の詳細について図10に示すフローチャートを使用し説
明する。まず、初期化手段13において対応段階m=0
が設定される。次に、表フォーマット読込み手段15に
おいて同一の罫線構造情報を持つ表フォーマット罫線で
構成された罫線組が作成される。罫線組は、対応段階m
と同じ段階iを持つ表フォーマット罫線が表フォーマッ
トから読込まれ、この読込まれた罫線が親罫線別に分類
されることで作成される。例えば対応段階m=1の場合
には図8に示す段階i=1を持つ表フォーマット罫線v
1、v2、v7、h3、h4、h5の情報が読込まれ、
親罫線(v0、v11)、(h0、h1)及び(h1、
h6)を持つ3つの罫線組が作成できる。
【0057】次に、罫線候補算出手段16において各罫
線組に属する表フォーマット罫線と対応付ける罫線候補
が表イメージ罫線群から選出される。各罫線組を構成す
る親罫線はm−1以前の対応段階で既に表イメージ罫線
と対応付いていることが図6に示す罫線構造情報算出フ
ローから明らかである。従って、例えば親罫線(h1、
h6)を持つ罫線組に対応付けるための罫線候補は親罫
線(h1、h6)に対応する図9の親罫線に対応付けた
表イメージ罫線46、47を含む罫線候補探索領域48
内に一部が掛る表イメージ罫線を罫線候補として求めら
れる。これにより搾り込まれた罫線候補iv0〜iv1
3及び罫線候補数CNが得られる。
【0058】前記罫線候補の算出処理が終了すると分割
罫線算出手段17での処理が実行される。分割罫線算出
手段17においては罫線候補算出手段16で得られた各
罫線候補毎に分割罫線率が算出される。分割罫線率とは
任意の罫線候補が親罫線に対応する表イメージ罫線に両
端を接する罫線である確率を表す。ここで、罫線候補j
(j=1〜CN)の分割罫線確率Cpjは例えば0〜1に
正規化された値に設定され、分割罫線である確率が高い
ものは1に近い値、低いものは0に近い値をとる。この
場合、親罫線(h1、h6)に対する罫線候補iv0〜
iv13の分割罫線確率は図11に示す値をとる。分割
罫線率は罫線の長さ及び交点特徴に基づき算出され、式
(1)に示すように罫線候補の両端が親罫線に接触する
場合にはCp =1になる。
【0059】逆に罫線候補の両端が親罫線に接触せずに
長さが短い場合や罫線の両端が親罫線に接触するものの
親罫線をはみ出す場合には式(2)に示すようにCp は
0に近い値になる。表フォーマット罫線の両端は常に親
罫線に接触するため、Cp の値が1に近い程、表フォー
マット罫線と罫線候補との間の類似性が高いことを表
す。ここで、Cp を算出する際に用いる罫線の長さには
帳票画像サイズを基準とした絶対的長さではなく、平行
な親罫線同士の間隔を基準長とした相対的長さが使用さ
れる。親罫線同士の間隔は対応付けにより定まる値であ
る。従って、罫線間隔が変化したような歪んだ表、拡大
された表、縮小された表であっても表フォーマットと構
造的に等しい罫線はCp =1になる。
【0060】もし罫線候補の両端が親罫線に接触し、は
み出さない場合: Cp =1 … (1) その他の場合: 0≦Cp <1 … (2) 前記分割罫線が算出された後には罫線照合手段18での
処理が実行される。罫線照合手段18においては表フォ
ーマット罫線群と罫線候補群とが照合され表フォーマッ
ト罫線と罫線候補とが対応付けられる。照合にはDPマ
ッチング、ボルツマンマシン等の一般的最適化手法が使
用できるが、本実施例はDPマッチングを用いた例を示
す。DPマッチングを用いた場合にはある罫線組を構成
する表フォーマット罫線群と罫線候補とが対応付けら
れ、経路のエネルギが最小になる対応関係が照合結果と
される。ここで、最小となる経路のエネルギEmは表フ
ォーマット罫線群F、罫線候補群Iとした場合に式
(3)で求められる。式(3)においてFNは表フォー
マット罫線本数、CNは罫線候補本数である。またFは
罫線組を構成する表フォーマット罫線群に加え親罫線で
指定された罫線候補探索領域を通り対応段階m−1以前
に対応済みの表フォーマット罫線を含む。例えば対応段
階m=1で親罫線(h1、h6)の場合には図7(B)
に示すように罫線組を構成する表フォーマット罫線群は
v2、v7であり、罫線候補探索領域を通り対応段階m
−1以前に対応済みの表フォーマット罫線はv0、v1
1である。従って、F=(v0、v2、v7、v11)
になる。
【0061】 Em=h(FN, CN) … (3) h( n, j) =min[h( n, j−1) +Pe 1, h( n−i, j) +P e 2, h( n−1, j−1) +d( n, j) ] … (4) もしjが既にm−1以前の対応段階でnと対応付いた罫
線である場合: d(n, j)=0 … (5) その他の場合: d2 (n, j)=α1・( Cpn −Cpj )+α2・f( Pn −Pj ) +α3・δ( Ltn −Ltj ) … (6) ここで、h(n,j)は表フォーマット罫線nと表イメ
ージ罫線jが対応付く場合のエネルギ値を示す。Pe
1、Pe 2はペナルティ値(定数)である。表フォーマ
ット罫線と表イメージ罫線との多対1対応を避けるため
にPe 2は大きな値をとる。d(n,j)は罫線nと罫
線jとの相違度であり、罫線同士が類似する場合にはd
(n,j)は0に近い値を、類似しない場合には大きな
値に設定される。Cp は分割罫線率、Pは表サイズで正
規化した罫線位置である。Lt は線種であり、例えば実
線でLt =0、点線でLt =1等線種により異なる値が
設定される。α1、α2、α3は定数である。表イメー
ジ罫線は常にその親罫線に両端を接するので、Cpn(n
=0〜FN)は1に設定される。従って、式(6)にお
いて右辺第1項は分割罫線としての相違性を示し、第2
項は位置ずれ量を示し、第3項は線種の相違性を示す。
またδ(x)はクロネッカのデルタであり、x=0でδ
(x)=0となり、それ以外の場合にはδ(x)=1に
なる。
【0062】前記式(6)において右辺第2項が評価に
加えられることで拡大された表、縮小された表又は歪ん
だ表に対して位置ずれの影響から照合精度が低下する。
しかし、第2項は手書き文字等の外乱により生じた罫線
と表罫線が同一の分割罫線率を持つ場合にそれらを区別
するために必要である。例えば図12に示すように両端
が親罫線と接触する数字“1”を表に記入した場合にお
いては、表罫線も数字も分割罫線率Cp =1になり、第
2項無しでは表罫線と数字との区別ができない。そこ
で、第2項の罫線位置Pにおいては表の幅、高さで正規
化された値が使用される。これにより罫線位置Pは表の
拡大や縮小に影響を受けず、拡大された表、縮小された
表も正しく照合ができる。また相違度d(n,j)を算
出する際、jが既にm−1以前の対応段階でnと対応付
いた罫線である場合にはd(n,j)=0に設定され
る。これは対応段階m−1以前に対応付いた罫線同士を
対応段階mで強制的に対応付けることを意味し、過去の
照合結果を指標として現対応段階での照合を補正する働
きがある。従って、罫線の位置ずれが吸収され、歪んだ
表も精度良く照合ができる。ここで関数f(x)は位置
ずれが少ない場合に小さな値を示し、例えば式(7)で
表すことができる。
【0063】もし |x| <閾値: f(x)= |x| … (7) その他の場合: f(x)=1 … (8) しかし、一般に手書きで描かれた表や解像度の低い画像
入力装置で読取った表においては切れ、かすれが生じ易
い。この場合には本来1本の表イメージ罫線が複数本に
分割された認識が行われ、上記の罫線対応付け手段では
対応付けが困難になる。罫線に切れが生じた場合に一般
に画像処理的手法が使用され、単純に補間することが考
えられる。しかし、これは誤った補間を行う可能性があ
り、照合精度が低下する要因になる。
【0064】そこで、画像処理的手法によらない切れの
補間処理が罫線対応付け手段の前処理として付加され
る。この付加される前処理は以下の手順で行われる。ま
ず、罫線候補算出手段16において図13(A)に示す
11本の罫線候補が得られたと仮定する。図13(A)
において符号50、51は親罫線に対応する表イメージ
罫線を示す。ch1〜ch11は罫線候補を示す。ここ
で、罫線候補群chの罫線候補ch1〜ch11中で同
一罫線を構成すると考えられる罫線候補を用い仮想罫線
p1が設定される。具体的には仮想罫線p11=(ch
3,ch4)及びp12=(ch7,ch8,ch9,
ch10)が設定される。
【0065】次に、各仮想罫線p1i毎に式(9)によ
り相違度d2(p1i)が算出される。式(9)におい
て右辺第1項は式(6)の右辺第1項と等価である。た
だし、第2項PL(p1i)は新たに付加されたもの
で、このPL(p1i)は分裂した罫線から仮想罫線p
1iを作成することに対する損失を表す。これは仮想罫
線を構成する罫線間の間隙が大きい場合や罫線間の交点
特徴が連続性を損う場合に大きな値をとる。例えば図1
3(B)に示すように親罫線50a、51aに対する仮
想罫線53は52より連続性が低いとみなされ、PLは
大きな値をとる。
【0066】次に、相違度d2(p1i)が最小となる
罫線候補の組合わせが最適化手法で算出される。例え
ば、最適化の結果p11を構成するch4やp12を構
成するch10は取り除かれ、仮想罫線を構成する罫線
の組合せはp11=(ch3)及びp12=(ch7,
ch8,ch9)に設定される。最後に作成された仮想
罫線が使用され、新たな罫線候補群I=(ch1,ch
2,p11,ch5,ch6,p12,ch11)とし
て対応付けが行われる。ただし、対応付けを行う場合に
は仮想罫線と表フォーマット罫線との類似度算出時に式
(6)に右辺第4項として損失PLが付加される。上記
処理により罫線に切れやかすれが存在する場合でも表フ
ォーマットに基づいた最適な補間結果が作成され、精度
よく罫線の対応付けが行われる。
【0067】 d22 (p1)=α1・(Cpn −Cppl)+PL(p1) … (9) 前述の罫線照合手段18により対応段階mでの表フォー
マット罫線と表イメージ罫線との対応付けが終了すると
対応段階インクリメント手段19において対応段階mに
1を加え、再度上記処理14から19(図10参照)を
繰り返す。終了判定手段14においては対応段階mが表
フォーマットに記述された最大段階imaxよりも大き
いか、罫線候補算出手段16での罫線候補数CN=0の
場合に確信度算出手段4bが終了する。
【0068】前記罫線対応付け手段4bが終了すると、
確信度算出手段4cにおいて表の確信度Cfが算出され
る。確信度Cfは帳票上の表が表フォーマットと同一表
である確率を表す指標であり、式(10)で表される。
【0069】 Cf=Cm+Cu … (10) ここで、g1は表フォーマット罫線と対応付けた表イメ
ージ罫線本数である。L1は表フォーマット罫線と対応
付けた表イメージ罫線である。Z(L1n )は表イメー
ジ罫線L1n と対応する表フォーマット罫線番号であ
る。d(x,y)は式(6)と同じ関数である。これに
よりCmは対応付けた表イメージ罫線と表フォーマット
罫線との相違性を表す。逆にg2は表フォーマット罫線
と対応付かない表イメージ罫線本数を表わす。L2は表
フォーマット罫線と対応付かない表イメージ罫線であ
る。Cp ´L2は全対応段階m=0〜imax中で算出
された表イメージ罫線L2の最大分割罫線率である。こ
のため、表フォーマット罫線と対応付かない罫線の両端
が他の2罫線と接触する場合(表構造を歪める場合)に
Cp ´L2は大きな値をとる。Cuは表フォーマット罫
線と対応付かない表イメージ罫線による表フォーマット
とのずれを示す。各Cm、Cuは表フォーマットと画像
上の表が類似する場合に小さな値をとる。ゆえに確信度
Cfが0に近い場合には入力された表が表フォーマット
で記述された表と同一のものであると判断される。ここ
で、相違度を算出するための罫線情報は罫線の属性を示
す罫線属性情報に加えて表構造を表す罫線構造情報を含
む。罫線構造情報によりこれら罫線同士の相違度は表の
構造的な相違性を反映したものとなる。
【0070】このような罫線情報を用いて罫線同士の照
合が行われ、罫線同士の類似性を用いて確信度が算出さ
れると、手書き文字等の外乱が存在する場合、表が歪ん
だ場合、拡大、縮小された場合、傾いた場合、さらに罫
線属性情報が類似する場合でも精度良く表照合が行え
る。
【0071】前記確信度が算出されると、表照合処理4
が終了する。ここで、確信度Cfがある値より大きい場
合には表フォーマットと一致しないとして表読取り処理
が終了する。逆に確信度Cfが小さい場合には次段のフ
ィールド位置探索手段5での処理が実行される。
【0072】前記フィールド位置探索手段5においては
表フォーマットに記載された読取りフィールド位置情報
及び表照合手段4の結果に基づいて画像上でのフィール
ド領域位置が探索される。読取りフィールド位置情報に
は図8に示すように探索するフィールドを構成する複数
本の表フォーマット罫線番号が記述される。ここで、図
8に示すフィールド20の画像上位置を探索する場合を
考える。この場合、まずフィールド20を構成する表フ
ォーマット罫線h1、h3、v0及びv2が表フォーマ
ットから読込まれる。次に、これらの表フォーマット罫
線と対応する表イメージ罫線が求められる。これは表照
合手段4による表フォーマット罫線及び表イメージ罫線
の対応付け結果から明らかである。例えば図14に示す
ように表フォーマット罫線h1、h3、v0及びv2に
対応する表イメージ罫線60、61、62、63が得ら
れる。次に、表イメージ罫線60、61、62、63で
構成される交点位置から画像上のフィールド領域位置が
求められる。交点位置は罫線属性情報算出手段1cで算
出された罫線属性情報から既知である。
【0073】以上の処理により、フィールド20に対応
する画像上のフィールド領域64が求められる。これは
罫線同士の対応結果に基づいたフィールド位置探索法で
あるため、歪んだ表、傾いた表、拡大、縮小された表で
も表照合結果に基づいて正確なフィールド領域位置が算
出できる。またフィールドを構成する表フォーマット罫
線を増やすことで複雑な形状のフィールドが定義でき
る。
【0074】前記フィールド位置が算出されるとフィー
ルド位置探索手段5が終了し、最後に結果出力手段6で
の処理が実行される。結果出力手段6においては表照合
手段4で算出された確信度、フィールド位置探索手段5
で求めた画像上のフィールド位置等が結果として出力さ
れる。
【0075】前記結果出力手段6での処理が終了する
と、表読取り処理が終了する。
【0076】なお、本発明は、前記実施例に限定される
ものではなく、その要旨を逸脱しない範囲において、種
々変更できる。
【0077】
【発明の効果】以上説明したように、本発明によれば、
罫線属性情報が類似した表、手書き文字等外乱を含む
表、罫線の切れた表、歪んだり傾いた表、拡大、縮小さ
れた表に対しても高精度の表照合が行え、正確なフィー
ルド領域位置が得られる帳票処理装置が実現できる。
【図面の簡単な説明】
【図1】 本発明に係る帳票処理装置の構成図である。
【図2】 表を含む帳票画像を示した図である。
【図3】 表領域内で抽出される縦横方向罫線を示す図
である。
【図4】 (A)〜(I)は罫線同士の交点特徴を示す
図である。
【図5】 表を構成する矩形表を示す図である。
【図6】 罫線構造情報算出手段の処理フローチャート
を示す図である。
【図7】 (A)〜(D)は罫線構造情報算出手段の処
理例を示す図である。
【図8】 表フォーマット例を示す図である。
【図9】 文字を記入した表から抽出された罫線を示す
図である。
【図10】 罫線対応付け処理のフローチャートを示す
図である。
【図11】 罫線候補の分割罫線率算出例を示す図であ
る。
【図12】 分割罫線率が同じになることを示す図であ
る。
【図13】 (A)及び(B)は罫線の切れ、かすれの
補間例を示す図である。
【図14】 フィールド領域抽出例を示す図である。
【図15】 従来例の帳票処理装置の構成を示す図であ
る。
【図16】 表を含む帳票画像を示した図である。
【図17】 表領域内で抽出される水平方向罫線であ
る。
【図18】 (A)〜(F)は表照合困難となる例を示
す図である。
【符号の説明】
1 罫線抽出手段、1a 画像入力手段、1b 表領域
抽出手段、1c 罫線属性情報算出手段、2 表構造解
析手段、2a 表外接罫線検出手段、2b 罫線構造情
報算出手段、2c 表フォーマット作成手段、3 表フ
ォーマットデータベース、4 表照合手段、4a 罫線
対応付け手段、4b 確信度算出手段、5 フィールド
位置探索手段、6 結果出力手段、7、13 初期化手
段、8 外接罫線登録手段、9 分割罫線検出手段、1
0 判定手段、11 罫線情報読取り手段、12 罫線
登録手段、14 終了判定手段、15 表フォーマット
読込み手段、16 罫線候補算出手段、17 分割罫線
算出手段、18 罫線照合手段、19 対応段階インク
リメント手段、20 フィールド、40 表を含む帳票
画像、41 帳票画像中の表領域、46、47 親罫線
に対応付けた表イメージ罫線、48 罫線候補探索領
域、50、50a、51、51a 表イメージ、52、
53 仮想罫線、60〜63フィールドを構成する表イ
メージ罫線、64 フィールド領域。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 表を含む帳票を画像として読込み、前記
    画像中の表領域に含まれる罫線を抽出する罫線抽出手段
    と、 前記罫線抽出手段で抽出された罫線から表構造及び文字
    読取り領域位置を示す表フォーマットを作成する表構造
    解析手段と、 前記表構造解析手段で作成された表フォーマットを格納
    する表フォーマットデータベースと、 前記表フォーマットデータベースに格納された表フォー
    マットに記載される表構造と帳票上の表領域から前記罫
    線抽出手段で抽出した罫線とを照合する表照合手段と、 前記表照合手段で照合された表照合結果及び前記表フォ
    ーマットに記載された文字読取り領域位置情報に基づき
    画像上での表中の文字読取り領域位置を算出するフィー
    ルド位置探索手段と、 前記表照合手段で照合された表照合結果と前記フィール
    ド位置探索手段で算出された表中の文字読取り領域位置
    とを出力する結果出力手段と、 を備えたことを特徴とする表を含む帳票処理装置。
  2. 【請求項2】 前記請求項1に記載される表を含む帳票
    処理装置において、 前記罫線抽出手段が、 表を含む帳票を画像として読込む画像入力手段、前記画
    像入力手段で読込んだ画像中の表領域を抽出する表領域
    抽出手段、及び前記表領域抽出手段で抽出された表領域
    内に含まれる罫線を抽出すると同時に罫線の属性を表す
    罫線属性情報を算出する罫線属性情報算出手段を備えた
    ことを特徴とする表を含む帳票処理装置。
  3. 【請求項3】 前記請求項2に記載される表を含む帳票
    処理装置において、 前記表構造解析手段が、前記罫線抽出手段で抽出された
    罫線中から表の外形を構成する罫線である表外接罫線を
    検出する表外接罫線検出手段、前記表外接罫線検出手段
    で検出された表外接罫線に基づき表構造を解析して表の
    構造を表す罫線構造情報を算出する罫線構造情報算出手
    段、及び前記罫線構造情報算出手段で算出された罫線構
    造情報と前記罫線属性情報算出手段で算出された罫線属
    性情報からなる罫線情報とを用いて表フォーマットを作
    成する表フォーマット作成手段を備えたことを特徴とす
    る表を含む帳票処理装置。
  4. 【請求項4】 前記請求項3に記載される表を含む帳票
    処理装置において、 前記表外接罫線検出手段は、前記表を複数の矩形表に分
    割し、前記矩形表を構成する外接罫線を表の外接罫線と
    して登録することを特徴とする表を含む帳票処理装置。
  5. 【請求項5】 前記請求項1乃至請求項4のいずれかに
    記載される表を含む帳票処理装置において、 前記表照合手段が、 前記罫線抽出手段で抽出された罫線と前記フォーマット
    データベースに格納された表フォーマットに記載される
    罫線とを対応付ける罫線対応付け手段、及び前記罫線対
    応付け手段で得た罫線同士の対応関係に基づいて帳票上
    の表が表フォーマットと同一表であるか否かを示す確信
    度を算出する確信度算出手段を備えたことを特徴とする
    表を含む帳票処理装置。
  6. 【請求項6】 前記請求項5に記載される表を含む帳票
    処理装置において、 前記罫線対応付け手段は、対応付けを段階的に行い、同
    一の罫線構造情報を持つ表フォーマットに記載の罫線群
    と前記罫線抽出手段で抽出された罫線群とを対応付ける
    ことを特徴とする表を含む帳票処理装置。
  7. 【請求項7】 前記請求項6に記載される表を含む帳票
    処理装置において、 前記罫線対応付け手段は、現段階以前に得られた罫線同
    士の対応関係を指標とし、現段階での罫線対応付けを行
    うことを特徴とする表を含む帳票処理装置。
  8. 【請求項8】 前記請求項7に記載される表を含む帳票
    処理装置において、 前記罫線対応付け手段は、前記罫線抽出手段により表領
    域から抽出された罫線に切れ又はかすれがある場合に複
    数罫線を組合わせて仮想罫線を作成し、前記表フォーマ
    ットに記載された罫線との類似性が高い組合わせ結果を
    用いて表フォーマットに記載された罫線と前記仮想罫線
    との対応付けを行うことを特徴とする表を含む帳票処理
    装置。
  9. 【請求項9】 前記請求項5乃至請求項8のいずれかに
    記載される表を含む帳票処理装置において、 前記確信度算出手段は、前記罫線抽出手段により表領域
    から抽出された罫線毎に表フォーマットとの相違性を算
    出し、これら各罫線毎に算出された相違性から表全体の
    確信度を算出することを特徴とする表を含む帳票処理装
    置。
  10. 【請求項10】 前記請求項3乃至請求項9のいずれか
    に記載される表を含む帳票処理装置において、 前記表フォーマット作成手段は、表構造を示す表構造情
    報に加え、罫線の組合わせにより表中の文字読取り領域
    を示す読取りフィールド位置情報を表フォーマットに格
    納し、前記フィールド位置探索手段は、前記表照合手段
    の罫線対応付け結果及び前記読取りフィールド位置情報
    に基づき画像上での表中の文字読取り領域位置を算出す
    ることを特徴とする表を含む帳票処理装置。
JP07679594A 1994-04-15 1994-04-15 表を含む帳票処理装置 Expired - Fee Related JP3179280B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07679594A JP3179280B2 (ja) 1994-04-15 1994-04-15 表を含む帳票処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07679594A JP3179280B2 (ja) 1994-04-15 1994-04-15 表を含む帳票処理装置

Publications (2)

Publication Number Publication Date
JPH07282193A true JPH07282193A (ja) 1995-10-27
JP3179280B2 JP3179280B2 (ja) 2001-06-25

Family

ID=13615581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07679594A Expired - Fee Related JP3179280B2 (ja) 1994-04-15 1994-04-15 表を含む帳票処理装置

Country Status (1)

Country Link
JP (1) JP3179280B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6111984A (en) * 1997-06-10 2000-08-29 Fujitsu Limited Method for matching input image with reference image, apparatus for the same, and storage medium storing program for implementing the method
JP2003030583A (ja) * 2001-07-11 2003-01-31 Oki Electric Ind Co Ltd 表種別識別方法および表種別識別装置、フォーマット種別識別方法およびフォーマット種別識別装置
US6567545B1 (en) 1999-05-28 2003-05-20 Fujitsu Limited Format recognition method, apparatus and storage medium
JP2008083846A (ja) * 2006-09-26 2008-04-10 Oki Electric Ind Co Ltd 認識対象領域決定方法及び装置
JP2008152719A (ja) * 2006-12-20 2008-07-03 Oki Electric Ind Co Ltd 帳票辞書作成装置
US10262202B2 (en) 2016-04-25 2019-04-16 Fujitsu Limited Form recognition method, form recognition device, and non-transitory computer-readable medium

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6111984A (en) * 1997-06-10 2000-08-29 Fujitsu Limited Method for matching input image with reference image, apparatus for the same, and storage medium storing program for implementing the method
US6567545B1 (en) 1999-05-28 2003-05-20 Fujitsu Limited Format recognition method, apparatus and storage medium
JP2003030583A (ja) * 2001-07-11 2003-01-31 Oki Electric Ind Co Ltd 表種別識別方法および表種別識別装置、フォーマット種別識別方法およびフォーマット種別識別装置
JP2008083846A (ja) * 2006-09-26 2008-04-10 Oki Electric Ind Co Ltd 認識対象領域決定方法及び装置
JP2008152719A (ja) * 2006-12-20 2008-07-03 Oki Electric Ind Co Ltd 帳票辞書作成装置
US10262202B2 (en) 2016-04-25 2019-04-16 Fujitsu Limited Form recognition method, form recognition device, and non-transitory computer-readable medium

Also Published As

Publication number Publication date
JP3179280B2 (ja) 2001-06-25

Similar Documents

Publication Publication Date Title
US6470336B1 (en) Document image search device and recording medium having document search program stored thereon
US5907631A (en) Document image processing method and system having function of determining body text region reading order
US4903311A (en) Character region extracting method and apparatus capable of implementing the method
KR100412317B1 (ko) 문자인식/수정방법및장치
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
JP2019169025A (ja) 情報処理装置、文字認識エンジン選択方法及びプログラム
JP2019169026A (ja) 情報処理装置、文字認識エンジン最適化方法及びプログラム
JP3179280B2 (ja) 表を含む帳票処理装置
JP3216800B2 (ja) 手書き文字認識方法
JP4849883B2 (ja) 行方向判定プログラム、方法及び装置
US7130487B1 (en) Searching method, searching device, and recorded medium
JP2002063548A (ja) 手書き文字認識方法
JPH08221510A (ja) 帳票文書処理装置および帳票文書処理方法
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JP3812719B2 (ja) 文書検索装置
JP3466899B2 (ja) 文字認識装置及び方法並びにプログラム記憶媒体
JPH07319880A (ja) キーワード抽出・検索装置
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JPH0728935A (ja) 文書画像処理装置
JP3817442B2 (ja) 画像認識装置、画像認識方法、及び画像認識方法を実現するプログラムとこのプログラムの記録媒体
JP3526821B2 (ja) 文書検索装置
JP2002297638A (ja) 文書画像からのタイトル抽出方法
JP3897999B2 (ja) 手書き文字認識方法
JPH05174187A (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080413

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090413

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100413

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100413

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110413

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130413

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130413

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140413

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees