JP2006099681A - 帳票処理装置 - Google Patents

帳票処理装置 Download PDF

Info

Publication number
JP2006099681A
JP2006099681A JP2004288006A JP2004288006A JP2006099681A JP 2006099681 A JP2006099681 A JP 2006099681A JP 2004288006 A JP2004288006 A JP 2004288006A JP 2004288006 A JP2004288006 A JP 2004288006A JP 2006099681 A JP2006099681 A JP 2006099681A
Authority
JP
Japan
Prior art keywords
table structure
ruled line
structure data
ruled
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004288006A
Other languages
English (en)
Inventor
Junichi Makino
順一 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2004288006A priority Critical patent/JP2006099681A/ja
Publication of JP2006099681A publication Critical patent/JP2006099681A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract


【課題】辞書に表構造データを登録する際、各セル領域に分割する罫線の位置情報を登録し、その情報より表構造を推測し処理対象セルを特定する帳票処理装置を提供する。
【解決手段】 罫線により構成される表構造を持つ帳票の基準表構造データを保持する表構造データ辞書と、前記帳票と同種別の帳票イメージが入力されると、対応する前記表構造データを用いて処理対象のセル領域を特定する処理対象領域決定部を有する帳票処理装置において、前記表構造データには罫線の位置情報を含み、処理対象領域決定部は、前記帳票イメージの表構造に含まれる罫線情報と前記基準表構造データに含まれる罫線情報が一致しない場合に、前記罫線の位置情報を用いて罫線の補間または特定を行う。
【選択図】 図1

Description

本発明は、罫線により構成される表構造を持つ帳票の、文字認識等の処理対象領域を効率よく決定する帳票処理装置に関するものである。
一般に複数の項目によって構成される帳票は、各項目を罫線によって区切ったセルとして表現した、表構造を持つことが多い。このような帳票を表形式帳票と呼ぶ。近年文字認識分野では、このような表形式の帳票に書かれた文字の認識も行われている。表形式の帳票の例としては、例えば以下の2種類の帳票がある。第1は、縦横の罫線で区分けされているセルの寸法や、帳票の基準点(例えば、画像左上端点)に対する各セルの位置が、所定通りに固定されている帳票(以下、書式固定帳票とする)である。第2は各セル寸法や各セルの帳票基準点に対する絶対的な位置は固定されていないが、各セルの並び順など、各セルの論理的な位置関係が所定通りとされている帳票(以下、様式固定帳票とする)である。具体的には、○○項目の欄の下には△△項目欄があり、かつこれらの項目欄の右側にはそれぞれ、記入欄があるというように論理的な位置関係が所定通りとされている帳票である。
従来方法として、帳票のセルを検出する方法として次のようなものがある。まず、文字認識等の処理を行うべきセル(処理対象セル)を持つ帳票の、基準となる帳票(基準帳票)の罫線情報・セル情報等を基準表構造データとして、予め表構造データ辞書に格納しておく。そして、同種別の帳票のイメージが入力されると、該帳票イメージから罫線を抽出する。そして、該帳票イメージの前記検出した罫線により区分けされるセル領域から、前記表構造データに基づいて、処理対象セル領域を特定する。
(例えば、非特許文献1参照)。
「沖電気研究開発」、沖電気工業株式会社、Vol.65 NO.1 JAN.1998、p.51、「OCR制限緩和技術」(石川、清水、田辺)
ところが、従来方法では、手書きの記入等により罫線らしきものが増えてしまったり、帳票イメージがかすれて罫線が消えたりしてしまうと、表の構造が変わり、辞書の情報と照合が取れなくなり、特定載せる領域を決定できなくなる。
そこで、辞書に表構造データを登録する際、各セル領域に分割する罫線の位置情報を登録し、その情報より表構造を推測し処理対象セルを特定する帳票処理装置が望まれていた。
本発明の帳票処理装置は以下の構成を備える。
<構成1>
罫線により構成される表構造を持つ帳票の基準表構造データを保持する表構造データ辞書と、前記帳票と同種別の帳票イメージが入力されると、対応する前記表構造データを用いて処理対象のセル領域を特定する処理対象領域決定部を有する帳票処理装置において、前記表構造データには罫線の位置情報を含み、処理対象領域決定部は、前記帳票イメージの表構造に含まれる罫線情報と前記基準表構造データに含まれる罫線情報が一致しない場合に、前記罫線の位置情報を用いて前記帳票イメージの表構造に含まれる罫線情報を修正する。
<構成2>
前記表構造データは親セル領域ごとに複数の子セル領域の情報を含む階層構造からなり、前記処理対象領域決定部は、各親セル領域ごとに、前記帳票イメージの表構造に含まれる罫線の数が前記基準表構造データに含まれる罫線の数より多い場合には、基準表構造データに含まれる罫線の位置情報によって罫線を特定する。
<構成3>
前記処理対象領域決定部は、前記親セルごとに、前記帳票イメージの表構造と前記基準表構造データとを比較して子セルの罫線の多少を判定する対応関係判定手段と、罫線が多い場合には、前記位置情報により正しい罫線を特定する多検出時判定手段とを備えており、前記多検出時判定手段は、前記帳票イメージの各子セルを形成する罫線ごとの位置情報を求め、前記基準表構造データとの差異が一定の基準値以下であるものを罫線として特定する。
<構成4>
前記表構造データは親セル領域ごとに複数の子セル領域の情報を含む階層構造からなり、前記処理対象領域決定部は、各親セル領域ごとに、前記帳票イメージの表構造に含まれる罫線の数が前記基準表構造データに含まれる罫線の数より少ない場合には、基準表構造データに含まれる罫線の位置情報によって罫線を補完する。
<構成5>
前記処理対象領域決定部は、前記親セルごとに、前記帳票イメージの表構造と前記基準表構造データとを比較して子セルの罫線の多少を判定する対応関係判定手段と、罫線が少ない場合には、前記位置情報により仮罫線を補完する仮罫線補完手段とを備えており、前記仮罫線補完手段は、前記帳票イメージの各子セルを形成する罫線ごとの位置情報を求め、前記基準表構造データ中に対応する罫線があるかどうかを確認し、前記基準表構造データ中の対応しなかった罫線によって帳票イメージの表構造を補完する。
辞書に表構造データを登録する際、各セル領域に分割する罫線の位置情報を登録し、その情報より表構造を推測し処理対象セルを特定することにより、罫線の増減があっても正しく処理対象セルの特定を行うことが可能となる。
以下に、本発明の各実施例について説明する。
本実施例において、処理対象セルに対して行う処理は文字認識であり、文字認識装置10に、本実施例の処理対象セル決定処理を行う認識対象領域決定部20を適応している。
<実施例1の構成>
図1は、本発明の第1の実施例を示す構成図である。
文字認識装置10は、認識対象領域決定部20を備える。認識対象領域決定部20は、罫線に区分けされている多数のセルを含む表(すなわち決定対象である入力帳票内の表)のイメージから、特定の1又は複数のセルに対応する領域および又はセル以外の認識対象領域を決定する。
認識対象領域決定部20は、表構造データ辞書21、表別処理制御手段23、罫線検出手段22、対応関係判定手段24、多検出時判定手段25、セル決定手段26を具える。
表構造データ辞書21は、基準帳票内の表の罫線情報・セル情報等を基準表構造データとして格納している。表構造データについては後述する。
なお、基準帳票内の表数は複数の場合もあり得る。その場合は、表別処理制御手段23にて、罫線検出手段22、対応関係判定手段24とセル決定手段26を制御し、基準帳票内の各表ごとに罫線検出、対応関係判定を行う。
また、罫線検出手段22は、処理対象領域を決定すべき入力帳票(入力帳票)のイメージから罫線を検出し、その罫線データを罫線データメモリ61に格納する。
また、対応関係判定手段24は罫線検出手段22で検出し、罫線データメモリ61に格納されている罫線と表構造データ辞書21に格納してある基準表構造データとを比較し、罫線の位置関係が正しいか判定する。
また、多検出時判定手段25は、対応関係判定手段24が正しいと判定できなかった場合でかつ入力帳票の罫線の方が多い場合、どの罫線が正しい罫線であるかを判定することにより、正しい罫線を特定し、罫線データメモリ61の罫線データを更新する。対応関係判定手段24が正しいと判定した場合は、この処理は行われない。
また、セル領域決定手段26は、罫線データメモリ61の罫線データの罫線より区分けされる前記イメージ上の各セル領域から、表構造データ辞書21に格納してある表構造データに基づいて、処理対象セル領域を決定し、その領域データを認識領域データメモリ63に格納する。
また、文字認識手段40は、認識対象領域決定部20で決定され、認識領域データメモリ63に格納されている領域データ内に記入されている文字を認識する。例えば、認識対象領域の文字列から文字を切り出し、該切り出した文字の特徴を抽出する。そして、該抽出した認識対象の文字の特徴を、予め用意した辞書内の各文字の特徴と照合して、候補文字を決定するという手段で構成できる。
また、CPU50は、認識対象領域決定部20および文字認識手段30を制御する。
また、罫線データメモリ61、帳票イメージメモリ62、認識領域データメモリ63は、メモリやハードディスク等、任意好適な記憶媒体で構成されている。
また、この文字認識装置10には、帳票のイメージを該帳票から読み取るためのスキャナ71が備わっている。また、スキャナから読み取ったイメージを格納するための、帳票イメージメモリ73を備えている。
以下、上記の構成についてさらに詳細に説明する。
図2は本発明において処理対象となる表形式帳票の基準帳票の例である。帳票イメージ200は、処理対象となる帳票の基準帳票のイメージである。ここで基準帳票とは、処理対象となる帳票と同じ表構造を持つ帳票を指す。前述の書式固定帳票の場合は、例えば複数枚存在する中から1枚を選択して基準帳票とする。前述の様式固定帳票の場合は、罫線の長さや各セルのサイズがその様式の中で最も平均的な帳票を選択して基準帳票とする。
表領域210aは、表全体を指す。罫線220a〜220dは、表領域210aを各セル領域に区切っている。処理対象領域230aは、セル領域の中で処理対象とすべき領域である。本実施例においては文字認識の対象とする領域であるが、例えば手入力によるデータ入力を行うシステムであれば、イメージを切り出す領域であっても良い。
次に、表構造データ辞書21に格納する表構造データについて説明する。図3は、帳票イメージ200における表領域210aの表構造を解析する過程を示したものである。
まず、図3(a)第1階層では、表領域210aは縦方向の3つのセル領域に分割される。それぞれのセル領域はT1、T2、T3と呼ぶ。次に、図3(b)第2階層では、第1階層の3つのセル領域それぞれに対して、横方向にセル領域に分割する。ここではT1に対してT11、T12の2つのセル領域に、T2に対してT21、T22の2つのセル領域に分割される。T3は内部に罫線を含まないのでこれ以上分割されず、第2階層のセルは含まれない。同様にして、T22はT221、T222の2つのセル領域に分割される。これ以上は内部に罫線を持たないので、この表の階層は3までとなる。また、この表での処理対象領域はT221である。
このように、それぞれのセルを親セルとし、その中に含まれたセルを子セルとし、このような関係を階層的に繰り返すことにより、表構造データを表現する。なお、第1階層のT1、T2、T3の親セル領域は表領域210aが相当し、ここではT0として表現する。
図4は、図3の前述したT0、T1、…T222までのセル領域の階層構造を示す概念図である。ここで、ITxxxは各セル領域のサイズ情報である。具体的には、各親セルにおける各子セルのサイズ情報であり、その子セルの罫線が、親セルの基準罫線からどの位置にあるかを示す情報と、各子セルの縦横の幅の情報である。また、どのセルが処理対象セルであるかの情報も含んでいる。この情報は表構造データとして表構造データ辞書21に格納してある。
図5は帳票イメージ200における表構造データ辞書21のデータ構成の例である。
各階層ごとに、親セル領域における子セル領域の解析方向、セル領域名、親セル領域名、孫セル領域の有無、サイズ情報、処理対象セル情報の各情報を含んでいる。
セル領域名とは、親領域内に存在する子セルの領域を指す。例えば、T0内にはT1、T2、T3のセル領域が存在している。
孫セル領域有無とは、その階層における子セルがさらに子セルを持つかどうかを示す。「あり」の場合はさらに子セルが存在することを示し、「なし」の場合は、その階層が最後であることを示す。
サイズ情報とは、前記各セル領域のサイズ情報のことである。
処理対象セル情報は、そのセルが処理対象セルであることを示す情報であり、図5では「○」で表現している。なお、処理対象セルは、子セルを持たないセル領域に限られる。
次に、多検出時判定手段25の処理について詳細を述べる。
図6は処理対象セル領域を特定すべき、入力帳票である。基準帳票と比べ、罫線320aが余計な罫線として検出される。ただし、罫線320aはここでは実際には罫線ではなく、手書きの文字等が罫線と誤検出されてしまうような場合を想定している。例えば、数字の「1」を縦に長く書いてしまい、上下の罫線に接触してしまった場合等が相当する。
これにより、対応関係判定手段24は入力帳票の罫線の方が多いと判定するので、多検出時判定手段25にて、どの罫線が表構造データ辞書21の罫線情報と照合の取れるものかを判別する。今回の入力帳票の場合、T1の第2階層にて照合の一致が取れない。このため下記に示す計算式よって、正しいものを検出する。
なおここで、Lo:T1の横幅、La:罫線320aで区切られる第1のセル領域の横幅、Lb:罫線320aと320bとで区切られる第2のセル領域の横幅、Lc:罫線320bで区切られる第3のセル領域の横幅、を指す。

|(La/Lo)−(IT11/(IT11+IT12))| ・・・・差分1

|(Lb/Lo)−(IT11/(IT11+IT12))| ・・・・差分2

差分1と差分2を比較し、値の大きさが予め定めた一定の閾値以下のものを正しい罫線とする。ここでは、差分1が一定以下となり、罫線320aが正しい罫線であり、T11に相当するセル領域であることが分かる。
T1に含まれる子セル領域は他にはT12のみであるため、残りの領域はT12であるとみなしてもよいが、さらにT12について同様な比較を行っても良い。

|(Lb/Lo)−(IT12/(IT11+IT12))| ・・・・差分3

|(Lc/Lo)−(IT12/(IT11+IT12))| ・・・・差分4

罫線320bは正しい罫線ではないから、差分3、4とも一定以上となり一致しない。
このため、次にLb、Lcの組み合わせを試す。ここでは以下の1通りのみとなる。

|(Lb+Lc/Lo)−(IT12/(IT11+IT12))| ・・・・差分5

差分5は罫線320bを除いたセル領域を比較したものであるから、一定以下となり、T12に相当することが分かる。このため、罫線320bが無視すべき罫線であると判定できるので、多検出時判定手段25は罫線データメモリ61の罫線データから320bを削除する。
<実施例1の動作>
次に、本実施例の動作について説明する。図7は、本実施例のフローチャートである。
S401:変数iに1をセットする。変数iは現在の階層を示す。
S402:変数nに表構造データ辞書から、対照となる最下階層数をセットする。
S403:iがnを超えたかどうかを確認する。超えた場合はS412に進む。そうでなければS404に進む。
S404:変数jに1をセットする。jは各階層内のセル数のカウンタである。
S405:変数mに変数iの階層におけるセルの数をセットする。
S406:jがmを超えたかどうかを確認する。超えた場合は次の階層へ移る。なお、このときiは1インクリメントされる。超えない場合はS47へ進む。
S407:罫線検出手段22は、入力帳票のイメージから該当する階層の罫線を検出し、罫線データメモリ61に保存するとともに、次段の処理に罫線情報として渡す。なお、この際最初の1回に表全体の罫線を検出して罫線データメモリ61に保存し、2回目以降は実際には罫線検出処理は行わず、必要な罫線情報は罫線データメモリ61から読み出して渡すこととしてもよい。
S408:対応関係判定手段24は罫線検出手段22で検出した罫線と表構造データ辞書21に格納してある表構造データと照合を行い、検出した罫線が正しいか判定する。罫線が正しくなく、数が多い場合はS409に進む。
S409:多検出時判定手段25にて、どの罫線が表構造データ辞書21の罫線情報と照合の取れるものかを判別する。不要な罫線は罫線データメモリ61から削除される。
S410:セル領域決定手段26は、罫線検出手段22が検出した罫線のうち、対応関係判定手段24が正しいと判定した罫線により区分けされる前記イメージ上の各領域から、表構造データ辞書21に格納してある表構造データに基づいて、処理対象セル領域を決定し、そのデータを認識領域データメモリ63に格納する。文字認識手段40は、認識領域データメモリ63に格納されている入力帳票イメージの上記決定された読み取りフィールドに相当する部分から、公知の方法で文字を切り出し、さらに公知の方法で文字認識を行う。処理したセル中に処理対象セル領域が含まれない場合は、この処理は行われない。
S411:jを1インクリメントする。これにより、同一階層の次のセルに対してS407〜S410の処理が繰り返される。
S412:すべての階層について処理が完了すると、終了する。
以上の動作を行うことにより、入力帳票より検出した罫線がノイズや手書き記入などにより、登録した辞書情報よりも多くなっていても、処理対象セル領域を検出することができる。
このように、各セルのサイズ情報が一致した場合にはそのセル領域を構成する罫線を正しいものとし、一致しない場合には各セル領域を組み合わせて表構造データ辞書21と比較し、一致する組み合わせによって余分な罫線を削除するので、誤検出により発生した罫線を無視して正しくセル領域を処理することができる。
<実施例2の構成>
図8は、本発明の第2の実施例を示す構成図である。
実施例1と異なる点は、多検出時判定手段25に替えて、仮罫線補完手段28を備えている点である。
図9は処理対象セル領域を特定すべき、入力帳票である。基準帳票と比べ、罫線820dがかすれてしまい、罫線として検出されない。
これにより、対応関係判定手段24は入力帳票の罫線の方が少ないと判定するので、仮罫線補完手段28にて、罫線の補完を行う。今回の入力帳票の場合、第1階層にて照合の一致が取れない。下記に示す計算式よって、正しいものを検出する。
表構造データ辞書21に格納してある罫線情報より、検出した罫線が少ない場合、仮罫線補完手段27にて、表構造データ辞書21の罫線情報と照合の取れるものを一時的に作成して、処理の補間を行う。今回の入力帳票の場合、第1階層にて罫線の一本が検出できない為、照合の一致が取れない。下記に示す計算式よって、一致のとれるものを検出する。
なおここで、Lo:表810aの縦幅、Ld:罫線820bで区切られる第1のセル領域の縦幅、Le:罫線820bと820dとで区切られる第2のセル領域の横幅、を指す。
|(Ld/Lo)−(IT1/(IT1+IT2+IT3))|≦d(d:任意の値)
|(Ld/Lo)−(IT2/(IT1+IT2+IT3))|>d(d:任意の値)
上記の式が当てはまる為、表構造データ辞書21の220bと入力帳票820b対応している。第1階層において、他に検出できた罫線はないので、基準帳票のうち罫線220dが対応する罫線がなかったことになる。
このため、検出できなかった罫線は表構造データ辞書21の罫線220dに対応するものであるとみなして、以下の式で表される位置に仮の罫線を作成する。すなわち、セルの端(この場合810aの上端)より、(Lo×(La+Lb)/Lo)分だけ進んだ位置に仮の罫線をセットする。
<実施例2の動作>
次に、本実施例の動作について説明する。図10は、本実施例のフローチャートである。
なお、本フローチャートのS901〜S907、S910〜S912は、図7のS401〜S407、S410〜S412と同じであるので、説明を割愛する。
S908:対応関係判定手段24は罫線検出手段22で検出した罫線と表構造データ辞書21に格納してある表構造データと照合を行い、検出した罫線が正しいか判定する。罫線が正しくなく、数が少ない場合はS909に進む。
S909:仮罫線補完手段28にて、表構造データ辞書21のどの罫線が、入力イメージに対応しないものかを判別する。入力イメージに対応する罫線がなかったものは、罫線データメモリ61に仮罫線として追加される。仮罫線は、以降の処理で実際に検出された罫線と同様に扱われる。
以上の動作を行うことにより、入力帳票より検出した罫線が画質の問題等により罫線がかすれて、登録した辞書情報よりも少なくなっても、処理対象セル領域を検出することができる。
このように、各セルのサイズ情報が一致した場合にはそのセル領域を構成する罫線を正しいものとし、一致しない場合には各セル領域を組み合わせて表構造データ辞書21と比較し、一致する組み合わせによって罫線を補完するので、誤検出により発生した罫線を無視して正しくセル領域を処理することができる。
なお、上記の2つの実施例において入力される帳票と基準表構造データとの関係については、入力される帳票の様式の種別が複数種類存在する場合、基準構造データを様式数分用意して表構造データ辞書21に登録しておき、図示しない帳票識別手段によって帳票の様式を特定した後、該当する基準表構造データを選択して上述の処理を行なえばよい。帳票識別の方法には、既知の方式が使用可能である。入力される帳票の様式の種別が1つのみの場合は、帳票識別は必要なく、上述の方法のみで帳票処理を実現できる。
実施例1の構成 基準帳票 解析過程 階層構造を示す概念図 表構造データ辞書21のデータ構成 実施例1の入力帳票 実施例1のフローチャート 実施例2の構成 実施例2の入力帳票 実施例2のフローチャート
符号の説明
10 文字認識装置
20 認識対象領域決定部
21 表構造データ辞書
23 表別処理制御手段
22 罫線検出手段
24 対応関係判定手段
25 多検出時判定手段
26 セル決定手段
28 仮罫線補完手段
61 罫線データメモリ
63 認識領域データメモリ
71 スキャナ
73 帳票イメージメモリ

Claims (5)

  1. 罫線により構成される表構造を持つ帳票の基準表構造データを保持する表構造データ辞書と、前記帳票と同種別の帳票イメージが入力されると、対応する前記表構造データを用いて処理対象のセル領域を特定する処理対象領域決定部を有する帳票処理装置において、
    前記表構造データには罫線の位置情報を含み、
    処理対象領域決定部は、前記帳票イメージの表構造に含まれる罫線情報と前記基準表構造データに含まれる罫線情報が一致しない場合に、前記罫線の位置情報を用いて前記帳票イメージの表構造に含まれる罫線情報を修正する、帳票処理装置。
  2. 前記表構造データは親セル領域ごとに複数の子セル領域の情報を含む階層構造からなり、
    前記処理対象領域決定部は、各親セル領域ごとに、前記帳票イメージの表構造に含まれる罫線の数が前記基準表構造データに含まれる罫線の数より多い場合には、基準表構造データに含まれる罫線の位置情報によって罫線を特定する、
    請求項1に記載の帳票処理装置。
  3. 前記処理対象領域決定部は、
    前記親セルごとに、前記帳票イメージの表構造と前記基準表構造データとを比較して子セルの罫線の多少を判定する対応関係判定手段と、
    罫線が多い場合には、前記位置情報により正しい罫線を特定する多検出時判定手段とを備えており、
    前記多検出時判定手段は、前記帳票イメージの各子セルを形成する罫線ごとの位置情報を求め、前記基準表構造データとの差異が一定の基準値以下であるものを罫線として特定する、
    請求項2に記載の帳票処理装置。
  4. 前記表構造データは親セル領域ごとに複数の子セル領域の情報を含む階層構造からなり、
    前記処理対象領域決定部は、各親セル領域ごとに、前記帳票イメージの表構造に含まれる罫線の数が前記基準表構造データに含まれる罫線の数より少ない場合には、基準表構造データに含まれる罫線の位置情報によって罫線を補完する、
    請求項1に記載の帳票処理装置。
  5. 前記処理対象領域決定部は、
    前記親セルごとに、前記帳票イメージの表構造と前記基準表構造データとを比較して子セルの罫線の多少を判定する対応関係判定手段と、
    罫線が少ない場合には、前記位置情報により仮罫線を補完する仮罫線補完手段とを備えており、
    前記仮罫線補完手段は、前記帳票イメージの各子セルを形成する罫線ごとの位置情報を求め、前記基準表構造データ中に対応する罫線があるかどうかを確認し、前記基準表構造データ中の対応しなかった罫線によって帳票イメージの表構造を補完する、
    請求項1に記載の帳票処理装置。
JP2004288006A 2004-09-30 2004-09-30 帳票処理装置 Pending JP2006099681A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004288006A JP2006099681A (ja) 2004-09-30 2004-09-30 帳票処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004288006A JP2006099681A (ja) 2004-09-30 2004-09-30 帳票処理装置

Publications (1)

Publication Number Publication Date
JP2006099681A true JP2006099681A (ja) 2006-04-13

Family

ID=36239387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004288006A Pending JP2006099681A (ja) 2004-09-30 2004-09-30 帳票処理装置

Country Status (1)

Country Link
JP (1) JP2006099681A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008262368A (ja) * 2007-04-11 2008-10-30 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2013015909A (ja) * 2011-06-30 2013-01-24 Fujitsu Ltd 表構造自動認識プログラム、表構造自動認識方法及び表構造自動認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008262368A (ja) * 2007-04-11 2008-10-30 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2013015909A (ja) * 2011-06-30 2013-01-24 Fujitsu Ltd 表構造自動認識プログラム、表構造自動認識方法及び表構造自動認識装置

Similar Documents

Publication Publication Date Title
US8908969B2 (en) Creating flexible structure descriptions
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
JP2002042143A (ja) 枠認識装置及び記録媒体
US7680329B2 (en) Character recognition apparatus and character recognition method
JP6116531B2 (ja) 画像処理装置
US9189461B2 (en) Page frame and page coordinate determination method and system based on sequential regularities
US20140126812A1 (en) Detecting a junction in a text line of cjk characters
JP4720529B2 (ja) 画像処理装置、画像形成装置、画像処理方法及びプログラム
JP2008108114A (ja) 文書処理装置および文書処理方法
JP2006099681A (ja) 帳票処理装置
CN112287763A (zh) 图像处理方法、装置、设备及介质
JP4518212B2 (ja) 画像処理装置及びプログラム
JP2009223612A (ja) 画像認識装置及びプログラム
JP2006127451A (ja) 帳票処理装置
JP4517822B2 (ja) 画像処理装置及びプログラム
JPH06215184A (ja) 抽出領域のラベリング装置
JPH0728935A (ja) 文書画像処理装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP2009223391A (ja) 画像処理装置及び画像処理プログラム
JP2002014981A (ja) 文書ファイリング装置
CN118865406A (zh) 一种基于深度学习的文本识别模型的训练方法
JP2022186250A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2005275820A (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
JPH11242716A (ja) 画像処理方法および記録媒体
JP2683116B2 (ja) 罫線の除去方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060923

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061013

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090901

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100105