JP2006127451A - 帳票処理装置 - Google Patents
帳票処理装置 Download PDFInfo
- Publication number
- JP2006127451A JP2006127451A JP2005086086A JP2005086086A JP2006127451A JP 2006127451 A JP2006127451 A JP 2006127451A JP 2005086086 A JP2005086086 A JP 2005086086A JP 2005086086 A JP2005086086 A JP 2005086086A JP 2006127451 A JP2006127451 A JP 2006127451A
- Authority
- JP
- Japan
- Prior art keywords
- sub
- pattern
- table structure
- data
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】罫線により構成される表構造を持つ帳票の基準表構造データを保持する表構造データ辞書と、帳票と同種別の帳票イメージが入力されると、対応する前記表構造データを用いて処理対象のセル領域を特定する処理対象領域決定部を有する帳票処理装置において、さらに前記基準表構造データのバリエーション情報を格納したサブパターン辞書を備え、処理対象領域決定部は、前記帳票イメージの表構造に含まれる罫線情報と前記基準表構造データに含まれる罫線情報が一致しない場合に、前記サブパターン辞書を参照し、処理対象領域の決定を行う。
【選択図】図1
Description
(例えば、非特許文献1参照)。
「沖電気研究開発」、沖電気工業株式会社、Vol.65 NO.1 JAN.1998、p.51、「OCR制限緩和技術」(石川、清水、田辺)
そこで、セルの構造の一部にバリエーションがある場合は、その部分のみのバリエーション情報を登録し、その情報より処理対象セルを特定する帳票処理装置が望まれていた。
<構成1>
罫線により構成される表構造を持つ帳票の基準表構造データを保持する表構造データ辞書と、前記帳票と同種別の帳票イメージが入力されると、対応する前記表構造データを用いて処理対象のセル領域を特定する処理対象領域決定部を有する帳票処理装置において、さらに前記基準表構造データのバリエーション情報を格納したサブパターン辞書を備え、前記処理対象領域決定部は、前記帳票イメージの表構造に含まれる罫線情報と前記基準表構造データに含まれる罫線情報が一致しない場合に、前記サブパターン辞書を参照し、処理対象領域の決定を行う。
<構成2>
前記表構造データは親セル領域ごとに複数の子セル領域の情報を含む階層構造からなり、親セル領域は子セル領域の構造にバリエーションがあるかどうかを示すサブパターン有無情報を持ち、サブパターン辞書に格納された前記バリエーション情報とは前記親セル領域に対応する部分の表構造からなるサブパターンデータであり、前記処理対象領域決定部は、各親セル領域ごとに、前記帳票イメージの表構造に含まれる罫線の数が前記基準表構造データに含まれる罫線の数と一致しない場合、対応する前記サブパターンデータと比較を行う。
<構成3>
前記処理対象領域決定部は、前記親セルごとに、前記帳票イメージの表構造と前記基準表構造データとを比較して子セルの罫線が一致するか否かを判定する対応関係判定手段と、一致しない場合には、前記位置情報により正しい罫線を特定するサブパターン判定手段とを備えており、前記サブパターン判定手段は、前記帳票イメージの各子セルを形成する罫線と、前記サブパターンデータに含まれる罫線一致する場合に該サブパターンを使用すべきことを判定する。
<構成4>
前記サブパターン辞書は1つの親セル領域ごとに1または2以上のサブパターンデータを登録可能であり、前記サブパターン判定手段は、サブパターンデータが複数存在する場合には、前記帳票イメージの各子セルを形成する罫線と、各サブパターンデータとを順次比較し、一致するサブパターンを選択する。
<構成5>
前記表構造データは親セル領域ごとに複数の子セル領域の情報を含む階層構造からなり、親セル領域は子セル領域の構造にバリエーションがあるかどうかを示すサブパターン有無情報を持ち、サブパターン辞書に格納された前記バリエーション情報とは前記親セル領域に対応する部分の表構造からなるサブパターンデータであり、前記処理対象領域決定部は、各親セル領域ごとに、前記帳票イメージの表構造に含まれる罫線の数が前記基準表構造データに含まれる罫線の数と罫線の位置の少なくともいずれか一方が一致しない場合、対応する前記サブパターンデータと比較を行う。
<構成6>
前記処理対象領域決定部は、
前記親セルごとに、前記帳票イメージの表構造と前記基準表構造データとを比較して子セルの罫線が一致するか否かを判定する対応関係判定手段と、一致しない場合には、前記位置情報により正しい罫線を特定するサブパターン判定手段とを備えており、前記サブパターン判定手段は、前記帳票イメージの各子セルを形成する罫線と、前記サブパターンデータに含まれる罫線の数と罫線の位置の少なくともいずれか一方が一致する場合に該サブパターンを使用すべきことを判定する。
<構成7>
前記サブパターン辞書は1つの親セル領域ごとに1または2以上のサブパターンデータを登録可能であり、前記サブパターン判定手段は、サブパターンデータが複数存在する場合には、前記帳票イメージの各子セルを形成する罫線と、各サブパターンデータとを順次比較し、一致するサブパターンを選択する。
図1は、本発明の第1の実施例を示す構成図である。
図のとおり、サブパターン帳票は基準帳票のT22に相当する部分440aの子セル領域のパターンが異なっており、罫線420cと罫線420dにより3つの子セル領域に分割され、処理対象領域は真ん中のセルになっている。その他の部分は基準帳票と同じである。
各階層ごとに、親セル領域における子セル領域の解析方向、セル領域名、親セル領域名、孫セル領域の有無、サブパターン有無、処理対象セル情報の各情報を含んでいる。
処理対象セル領域を特定すべき入力帳票として、図4に示すサブパターン帳票が入力されたとする。図のとおり基準帳票と比べ、領域440aの部分が異なっている。対応関係判定手段24は入力帳票の罫線の方が多いので、領域440aは領域T22と一致しないと判定し、図示しない記憶部に当該領域が基準表構造データと一致しなかった旨を記録する。
次に、本実施例の動作について説明する。図8は、本実施例のフローチャートである。
第2の実施例として、サブパターンが複数存在する場合について説明する。
<実施例2の構成>
本実施例の構成は、第1の実施例と同様である。
次に、本実施例の動作について説明する。本実施例の動作は、サブパターン検出を除き第1の実施例と同じである。図12は、本実施例のサブパターン検出のフローチャートである。
本実施例の構成は、実施例1と同様であるが、表構造データ辞書21、サブパターン辞書27、対応関係判定手段24、サブパターン判定手段25の構成が異なっている。これらの差異については後述する。
まず、サイズ情報について説明する。
図13は図2に示した基準帳票のサイズ情報を表したものである。表中、Ixxxで示しているものが各セルのサイズ情報である。これらのサイズ情報は、図5に示したものと同じものである。また、図14は、図4に示したサブパターン帳票のサイズ情報をあらわしたものである。
図15は、帳票イメージ200における表構造データ辞書21のデータ構成の例である。実施例1におけるデータ構造(図6)に対し、前述のサイズ情報が追加されている。そのほかは図6と同様である。
図16は、帳票イメージ400すなわちサブパターン帳票におけるサブパターン辞書27のデータ構成の例である。実施例1におけるデータ構造(図7)に対し、前述のサイズ情報が追加されている。そのほかは図7と同様である。
処理対象セル領域を特定すべき入力帳票として、図13に示すサブパターン帳票が入力されたとする。図のとおり基準帳票と比べ、領域440aの部分が異なっている。対応関係判定手段24は入力帳票の罫線の方が多く、サイズ情報も一致しないのでので、領域440aは領域T22と一致しないと判定し、図示しない記憶部に当該領域が基準表構造データと一致しなかった旨を記録する。
その場合、図13に示すサブパターン帳票が入力された場合と同じく、サブパターン辞書27が参照されるが、帳票イメージ401の場合、罫線の本数は一致するが、サイズ情報が一致しない。このため、サブパターン判定手段25は、サブパターン決定を行わずに終了する。
次に、本実施例の動作について説明する。全体の流れは図8と同様であるが、上述のとおり対応関係判定手段24が罫線のサイズ情報を判定基準に加えるところが異なっている。
図17は、本実施例におけるサブパターン検出処理を表したフローチャートであり、実施例1の図9に対応するものである。
<実施例4の構成>
本実施例においては、実施例3の図14に示すサブパターン(以降第1のサブパターン)に加え、図18に示す第2のサブパターンが存在する。第1のサブパターンとの違いは、罫線の位置である。すなわち、サイズ情報が異なっている。
図19は、本実施例における第2のサブパターンのサブパターン辞書27である。
次に、本実施例の動作について説明する。本実施例の動作は、サブパターン検出を除き第1の実施例と同じである。図12は、本実施例のサブパターン検出のフローチャートである。
20 認識対象領域決定部
21 表構造データ辞書
23 表別処理制御手段
22 罫線検出手段
24 対応関係判定手段
25 サブパターン判定手段
26 セル決定手段
27 サブパターン辞書
61 罫線データメモリ
63 認識領域データメモリ
71 スキャナ
73 帳票イメージメモリ
Claims (7)
- 罫線により構成される表構造を持つ帳票の基準表構造データを保持する表構造データ辞書と、前記帳票と同種別の帳票イメージが入力されると、対応する前記表構造データを用いて処理対象のセル領域を特定する処理対象領域決定部を有する帳票処理装置において、
さらに前記基準表構造データのバリエーション情報を格納したサブパターン辞書を備え、
前記処理対象領域決定部は、前記帳票イメージの表構造に含まれる罫線情報と前記基準表構造データに含まれる罫線情報が一致しない場合に、前記サブパターン辞書を参照し、処理対象領域の決定を行う、
帳票処理装置。 - 前記表構造データは親セル領域ごとに複数の子セル領域の情報を含む階層構造からなり、親セル領域は子セル領域の構造にバリエーションがあるかどうかを示すサブパターン有無情報を持ち、サブパターン辞書に格納された前記バリエーション情報とは前記親セル領域に対応する部分の表構造からなるサブパターンデータであり、
前記処理対象領域決定部は、各親セル領域ごとに、前記帳票イメージの表構造に含まれる罫線の数が前記基準表構造データに含まれる罫線の数と一致しない場合、対応する前記サブパターンデータと比較を行う、
請求項1に記載の帳票処理装置。 - 前記処理対象領域決定部は、
前記親セルごとに、前記帳票イメージの表構造と前記基準表構造データとを比較して子セルの罫線が一致するか否かを判定する対応関係判定手段と、
一致しない場合には、前記位置情報により正しい罫線を特定するサブパターン判定手段とを備えており、
前記サブパターン判定手段は、前記帳票イメージの各子セルを形成する罫線と、前記サブパターンデータに含まれる罫線とが一致する場合に該サブパターンを使用すべきことを判定する、
請求項2に記載の帳票処理装置。 - 前記サブパターン辞書は1つの親セル領域ごとに1または2以上のサブパターンデータを登録可能であり、
前記サブパターン判定手段は、サブパターンデータが複数存在する場合には、前記帳票イメージの各子セルを形成する罫線と、各サブパターンデータとを順次比較し、一致するサブパターンを選択する、
請求項3に記載の帳票処理装置。 - 前記表構造データは親セル領域ごとに複数の子セル領域の情報を含む階層構造からなり、親セル領域は子セル領域の構造にバリエーションがあるかどうかを示すサブパターン有無情報を持ち、サブパターン辞書に格納された前記バリエーション情報とは前記親セル領域に対応する部分の表構造からなるサブパターンデータであり、
前記処理対象領域決定部は、各親セル領域ごとに、前記帳票イメージの表構造に含まれる罫線の数が前記基準表構造データに含まれる罫線の数と罫線の位置の少なくともいずれか一方が一致しない場合、対応する前記サブパターンデータと比較を行う、
請求項1に記載の帳票処理装置。 - 前記処理対象領域決定部は、
前記親セルごとに、前記帳票イメージの表構造と前記基準表構造データとを比較して子セルの罫線が一致するか否かを判定する対応関係判定手段と、
一致しない場合には、前記位置情報により正しい罫線を特定するサブパターン判定手段とを備えており、
前記サブパターン判定手段は、前記帳票イメージの各子セルを形成する罫線と、前記サブパターンデータに含まれる罫線の数と罫線の位置の少なくともいずれか一方が一致する場合に該サブパターンを使用すべきことを判定する、
請求項5に記載の帳票処理装置。 - 前記サブパターン辞書は1つの親セル領域ごとに1または2以上のサブパターンデータを登録可能であり、
前記サブパターン判定手段は、サブパターンデータが複数存在する場合には、前記帳票イメージの各子セルを形成する罫線と、各サブパターンデータとを順次比較し、一致するサブパターンを選択する、
請求項6に記載の帳票処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005086086A JP2006127451A (ja) | 2004-09-30 | 2005-03-24 | 帳票処理装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004288007 | 2004-09-30 | ||
JP2005086086A JP2006127451A (ja) | 2004-09-30 | 2005-03-24 | 帳票処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006127451A true JP2006127451A (ja) | 2006-05-18 |
Family
ID=36722108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005086086A Pending JP2006127451A (ja) | 2004-09-30 | 2005-03-24 | 帳票処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006127451A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008015702A (ja) * | 2006-07-04 | 2008-01-24 | Tokyo Soft Kk | 帳票処理装置 |
JP2014228914A (ja) * | 2013-05-20 | 2014-12-08 | 永和 飯島 | 業務処理システム |
WO2020044537A1 (ja) * | 2018-08-31 | 2020-03-05 | 株式会社Pfu | 画像照合装置、画像照合方法、及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH064717A (ja) * | 1992-06-19 | 1994-01-14 | Pfu Ltd | 漢字住所補正処理方法 |
JPH11175654A (ja) * | 1997-12-08 | 1999-07-02 | Oki Electric Ind Co Ltd | セル領域の決定方法、セル領域の決定装置 |
JPH11282957A (ja) * | 1998-03-26 | 1999-10-15 | Oki Electric Ind Co Ltd | 認識対象領域の決定方法 |
-
2005
- 2005-03-24 JP JP2005086086A patent/JP2006127451A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH064717A (ja) * | 1992-06-19 | 1994-01-14 | Pfu Ltd | 漢字住所補正処理方法 |
JPH11175654A (ja) * | 1997-12-08 | 1999-07-02 | Oki Electric Ind Co Ltd | セル領域の決定方法、セル領域の決定装置 |
JPH11282957A (ja) * | 1998-03-26 | 1999-10-15 | Oki Electric Ind Co Ltd | 認識対象領域の決定方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008015702A (ja) * | 2006-07-04 | 2008-01-24 | Tokyo Soft Kk | 帳票処理装置 |
JP2014228914A (ja) * | 2013-05-20 | 2014-12-08 | 永和 飯島 | 業務処理システム |
WO2020044537A1 (ja) * | 2018-08-31 | 2020-03-05 | 株式会社Pfu | 画像照合装置、画像照合方法、及びプログラム |
JPWO2020044537A1 (ja) * | 2018-08-31 | 2021-03-18 | 株式会社Pfu | 画像照合装置、画像照合方法、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4926004B2 (ja) | 文書処理装置、文書処理方法及び文書処理プログラム | |
US8908969B2 (en) | Creating flexible structure descriptions | |
US10503993B2 (en) | Image processing apparatus | |
JP2008021068A (ja) | 帳票認識装置及び帳票認識プログラム | |
CN112100979A (zh) | 基于电子书的排版处理方法、电子设备及存储介质 | |
JP4834351B2 (ja) | 文字認識装置及び文字認識方法 | |
JP2006127451A (ja) | 帳票処理装置 | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
US7756872B2 (en) | Searching device and program product | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2008282094A (ja) | 文字認識処理装置 | |
JP2010102734A (ja) | 画像処理装置及びプログラム | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP2008310531A (ja) | 帳票識別方法及び帳票識別プログラム並びに該帳票識別方法を用いた光学文字読取システム | |
JP3467437B2 (ja) | 文字認識装置及びその方法とプログラム記録媒体 | |
JP2006099681A (ja) | 帳票処理装置 | |
US8923625B2 (en) | Original image searching device, original image searching method, and computer readable medium | |
JP2006072520A (ja) | 情報処理装置及びその方法及びそのプログラム記録媒体 | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
JP2009223391A (ja) | 画像処理装置及び画像処理プログラム | |
JPH0728935A (ja) | 文書画像処理装置 | |
JP2000132635A (ja) | 認識データ確認方法 | |
JP3575969B2 (ja) | セル領域の決定方法、セル領域の決定装置 | |
JP2007026263A (ja) | 文字認識装置及びコンピュータプログラム | |
JPH08202711A (ja) | 文書編集操作電子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060923 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060929 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061013 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091222 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100420 |