JP2006244526A - 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム - Google Patents
帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム Download PDFInfo
- Publication number
- JP2006244526A JP2006244526A JP2006154163A JP2006154163A JP2006244526A JP 2006244526 A JP2006244526 A JP 2006244526A JP 2006154163 A JP2006154163 A JP 2006154163A JP 2006154163 A JP2006154163 A JP 2006154163A JP 2006244526 A JP2006244526 A JP 2006244526A
- Authority
- JP
- Japan
- Prior art keywords
- format information
- partial
- information
- format
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】帳票を部分領域に分割し,領域ごとに複数の部分書式情報を作成する。帳票認識時には,部分領域ごとに入力画像と部分書式との照合処理を行ない,最適な部分書式を選択する。各部分領域における最適な部分書式を合成することにより帳票全体の書式情報を生成する。このように動的に生成された書式情報から枠の座標を抽出する。
【効果】準定型帳票を,部分書式情報を利用することにより精度良く認識することができる。さらに,従来に比べて書式情報の作成工数を削減し書式情報の容量を削減できる。
【選択図】 図2
Description
第1の従来技術として,「フォーマットジェネレータ」がある(例えば、非特許文献1参照)。ここで利用されている書式情報は,帳票種ごとに文字枠やフィールド枠の位置を厳密に指定されている。既存のOCRには,フォーマットジェネレータと同様の書式情報を採用している機種が多い。
本発明では,準定型帳票を認識することを課題とする。準定型帳票の課題について,図3に示す「源泉徴収票」を例に説明する。源泉徴収票は,枠の配置がほぼ決まっているものの,帳票ごとに枠の位置が微妙に異なっている。これは,記載項目の配置の順序などのおおまかな書式は決まっているものの,枠の大きさなどの厳密な書式は発行元の企業(事業主)が独自に決めているためである。図18に書式の違いの具体例を示す。図18(a)は,同じ項目でも枠の大きさが異なる例である。図18(b)は,主に金額欄において桁線の有無や長さが異なる例である。図18(c)は枠の配置自体が異なる例である。このような書式の違いの他に,帳票認識共通の課題として,画質の問題がある。帳票の印字品質や状態は様々なので,画像入力時の画質は一定でなく,かすれやノイズが発生する場合がある。かすれやノイズが発生すると,帳票画像から罫線や枠の位置を判断する際に,誤った対応付けをする確率が高くなる。
第1の従来例では,枠や文字の位置が同じであることを前提としているため,準定型帳票の認識は困難である。認識対象となる帳票の書式情報を全て登録することにより,原理的には準定型帳票の認識は可能である。しかし,以下の3つの理由により現実的には認識が非常に困難である。第1の理由は,作成すべき帳票の書式情報の数が膨大となるため,書式情報作成のコストが多くなることである。
第2の理由は,全ての帳票を事前に収集して書式情報を作成することが困難なことである。源泉徴収票の例では,国内の全ての事業者が発行する源泉徴収票を収集しなければならない。その上,同じ事業者でも年度ごとに書式を変える可能性もあるため,全てを収集することは不可能である。第3の理由は,仮に上記の2つの問題を解決できたとしても,微妙な書式の違いを判別して適切な書式情報を自動的に選択する技術を実現することは非常に困難であるためである。
第3の従来例では,文字枠やフィールド枠の位置の違いや大きさの違いには対応できるものの,帳票の一部の領域の枠の配置だけが異なる場合でも,帳票全面分の帳票書式情報を新たに作成しなければならない。このため,帳票ごとに微妙な枠の配置が異なる準定型帳票を認識するには帳票書式情報の数が膨大になるという問題がある。また,この方式で用いているモデルは矩形以外の枠を記述できないため,モデルとして記述できない帳票が多く存在するという問題がある。さらに,この方式は枠の配置情報に基づいた照合をしているため,かすれやノイズがあるために枠を正しく抽出できない帳票画像には不向きであるという問題がある。
又、帳票画像を表示し、該帳票画像に記載されるレイアウトを解析して格子点情報を抽出して記録手段に記録し,
入力手段を介して指定された帳票画像中の部分領域の格子点情報を上記記憶手段から読み出し、入力される属性情報と上記格子点情報とを対応づけて上記記憶手段に記録する処理を各領域について繰り返す帳票書式作成方法を実行するためのプログラム。
図1は,本発明の一実施例である帳票処理装置のハードウェア構成の一例である。図1において,10はコマンドやコードデータなどを入力するための入力装置,20は処理対象の帳票画像を入力するための画像入力装置,30は書式解析や書式照合などを行なう帳票認識装置,40は部分書式情報を格納するデータベース,50は認識結果を表示する表示装置である。なお,20の画像入力装置の代わりに60の画像データベースから帳票画像を入力してもよい。
本発明では,前述の課題を解決するために,帳票を部分領域に分割し,その部分領域ごとに帳票書式情報を作成する。本発明では,これを部分書式情報と呼ぶことにする。同じ領域内で異なる書式があれば,その数だけ部分書式情報を作成する。
帳票処理の際には,部分領域ごとに帳票画像と部分書式情報を照合して,最適な部分書式情報を動的に選択し,その結果を合成することにより帳票全面の書式情報を得ることができる。この部分書式情報を用いた帳票処理の詳細については図2を用いて後述する。
この帳票処理により,以下に示すように準定型帳票の課題を解決することができる。
まず,照合において枠の位置や大きさの違いを吸収する方式を採用することにより,準定型帳票の課題の図18(a)を解決できる。次に,照合において不要な線分と枠の罫線を区別する方式を採用することにより,図18(b)の課題を解決できる。さらに,このような照合方式を採用して罫線のかすれやノイズ線分を本来の罫線と区別することにより,低品質画像に対しても高精度な処理が可能である。
部分領域ごとの書式情報が決定すれば,書式情報に記録された情報を利用して,帳票画像から文字枠やフィールド枠の位置を検出することができる。このように,部分書式情報を利用した書式照合を採用することにより,準定型帳票を認識する帳票処理装置を実現することができる。
部分書式情報を作成する手段は以下の通りである。まず,帳票画像を入力し,罫線抽出などの書式解析をすることにより,帳票書式を記述するための特徴量を生成する。次に,ユーザにより部分書式情報を生成したい部分領域が選択される。
選択された部分領域内について,かすれやノイズに起因する特徴量の誤りがユーザにより修正される。最後に,部分領域内の特徴量に基づいて個々の枠領域を特定し,それぞれの枠領域の属性がユーザにより指定されることにより,部分書式情報が生成できる。この部分書式情報作成処理の詳細については図16を用いて後述する。
図2は,本発明の帳票処理装置による帳票処理の概略を示すフロー図である。ステップ200では,画像入力装置20もしくは画像データベース60より帳票画像を入力する。ステップ210では,帳票画像のレイアウトを解析しステップ220で利用する特徴量を抽出する。この特徴量については図7と図8を用いて後述する。ステップ220では,帳票画像の部分領域ごとに,部分書式情報データベース40に記憶された部分書式情報を照合し,照合類似度が最大となる部分書式情報を選択する。この部分書式情報については図5を,照合処理については図6を用いて後述する。ステップ230では,部分領域ごとに決定された部分書式情報から帳票全体の書式情報を決定する。
帳票処理の詳細について説明する前に,本発明で用いる部分領域と部分書式情報の具体例について,図3から図5を用いて説明する。
次に,図6を用いて,図2のステップ220の部分書式照合処理の詳細について説明する。ステップ600では,処理対象とする帳票種の数だけステップ610から650の処理を繰り返す。例えば,入力帳票が源泉徴収票と確定申告票の2種類であれば,2回繰り返す。ステップ610では,部分領域の数だけステップ620から640の処理を繰り返す。図4に示す源泉徴収票の例では5つの部分領域に分けられているので,5回繰り返す。ステップ620では,各部分領域内で定義された部分書式の数だけステップ630の処理を繰り返す。ステップ630では,入力画像と部分書式との照合を行ない,照合類似度を求める。照合処理の詳細については図11から16を用いて後述する。ステップ640では,各領域において最適な部分書式を選択する。選択方法の一例としては,ステップ630で求められた部分書式の中から,照合類似度が最も高い部分書式選択する方式が挙げられる。ステップ650では,帳票種ごとに帳票全面での最適な書式情報を決定する。この処理の一例としては,ステップ640で求められた最適な部分書式を合成する方式が挙げられる。ステップ660では,入力画像の帳票種を決定する。この処理の一例としては,ステップ650で求められた帳票全面の書式に対して,帳票種ごとに類似度を計算し,最もその類似度が高い帳票種を選択する方式が挙げられる。これらの一連の処理により,帳票種と書式情報を決定できる。
図7に示すように,帳票の枠構造は格子点情報を用いて記述することができる。
直交する罫線の交点座標は,該当する格子点の座標値から獲得することができる。平行する2本の縦罫線間の距離は,罫線が存在する格子点の列間の距離から算出できる。帳票上の矩形枠は,枠の四隅に相当する格子点の組合せにより表現することができる。
なお,格子点情報を作成するための実線の抽出方式の例としては特開平11-232382号公報に,点線の抽出方式の例としては特開平09-319824号公報に開示されている。
図9は,部分書式情報に対応する帳票の部分領域の画像と,その格子点情報の例である。図10は,この格子点情報に基づいて生成された部分書式情報のデータの例である。
図10の部分書式情報のデータの例として,まず,帳票種番号が記憶されている。次に,部分領域番号が記憶されている。次に,水平垂直方向の格子点の数が記憶されている。図9の例では,格子点情報は4行3列に配置されているため,水平方向が3,垂直方向が4となる。次に,帳票上の任意の位置を原点とした水平垂直方向の格子点の座標値が記録されている。この値を利用することにより,平行な罫線間の距離,すなわち枠の幅や高さを求めることができる。次に,各格子点での交点符号が記憶されている。この交点符号は図8に示す通りである。例えば,図9の格子点情報において,0行2列の格子点の交点符号は8となる。次に,この部分領域内の枠数が記憶されている。図9の例では,4つの枠が存在しているため,4となる。最後に,各枠の四隅の格子点の位置と読取項目が記憶されている。i行j列の格子点を(i,j)と記載することにすると,図9の「フリガナ」欄の枠の四隅は,左上から反時計回りに(1,1),(1,2),(2,2),(2,1)となる。この他に,罫線や領域の色情報,格子点での罫線に対する実線と点線の区別などの情報を付加してもよい。
次に,部分書式照合処理のアルゴリズムについて説明する。
本実施例では,照合処理の一例として音声認識などに利用されている動的計画法(Dynamic Programing)を用いたDPマッチングによる照合方式を説明する。動的計画法の原理については,T.コルメン,C.ライザーソン,R.リベスト共著,、「アルゴリズムイントロダクション」第2巻,P5〜29、近代科学社,1995年出版をはじめ,さまざまな文献において解説されている。
照合アルゴリズムにDPマッチングを採用する理由は次の2つである。第1は,照合対象の特徴量間の距離の大小に依存しない照合ができるため,図18(a)に示すような罫線間距離の大小,すなわち枠の大きさの違いに対応できるからである。第2は,特徴量の数の増減の影響を受けにくい照合ができるため,図18(b)や低品質画像に起因する罫線の本数の増減に対応できるからである。
なお,通常DPマッチングは1次元のデータに対して適用される。部分書式情報は2次元の情報であるため,本実施例では横方向と縦方向に分けて処理を行なう。具体的には,格子点情報を横方向にDPマッチングを行い,ここで得られた結果を縦方向に検証するという方式をとる。なお,2次元のDPマッチングの手法も提案されているので,この方式を適用することも可能である。
ステップ1110では,書式格子点情報の各行ごとにステップ1120から1140の処理を繰り返す。図9(b)の例では,0から3行目まで繰り返す。
ステップ1120では,部分領域格子点情報の各行ごとにステップ1130の処理を繰り返す。図12(b)の例では,0から6行目まで繰り返す。
ステップ1130では,書式格子点情報と部分領域格子点情報の行同士をDPマッチングし,格子点の列同士の対応関係とその際の照合スコアを求める。この処理において,照合類似度があらかじめ設定された基準以下であれば,照合失敗としてリジェクトにすることができる。このDPマッチングによる照合処理の詳細については,図13と図14を用いて後述する。
ステップ1140では,ステップ1130にて求められた照合結果の中から,照合スコアが最大となる部分領域格子点情報の行を選択する。図9と図12の例では,書式情報格子点の0行目に対して,部分領域格子点情報の0から6行目までの行を照合した結果,照合類似度が最大になる行として2行目が選択される。書式格子点情報の1行目以下についても同様である。
ステップ1150では,ステップ1140にて求められた最適な部分領域格子点情報の行の照合結果に基づいて,列ごとに照合の正当性を検証する。この処理の詳細については後述する。
なお,1140で照合類似度が基準を超える行がない場合や,1150で列方向の正当性が検証できない場合は,領域単位での照合失敗としてリジェクトにすることができる。
次に、照合スコアの計算方法から,DPネットワーク内での最適な照合経路の求め方を説明する。照合マトリクス内のノードのスコアは,左列から右列に向かって順々に計算していく。最初に照合マトリクスの最左列を0に初期化する。その他のノードのスコアは,左から,上から,左上からの3通りの遷移のうち、遷移元のスコアとその遷移のスコアとの和が最大になる遷移を選択し,そのスコアをノードのスコアとする。
ノードのスコア計算について,図14を用いて具体的に説明する。ノード1430のスコアを求めるには,ノード1400から,1410から,1420からの3通りの遷移のスコアを比較する。ここで,ノード内の値をノードのスコア,遷移の線上の値を遷移のスコアとすると,1400からの遷移のスコアが8で最大となる。この結果,1430への遷移は1400からとなり,1430のスコアは8に決定する。なお,遷移のスコア計算の詳細については後述する。
このようにして全てのノードのスコアを計算する。最右列のうち最もスコアの高いノード選択し,このノードを終端とする経路を最適な照合結果を示す経路とする。図13では,太線で示した経路が最適な経路である。この最適経路の終端ノードのスコアをDPマッチングの照合類似度とする。
最後に,欠損を意味する右方向の遷移について説明する。この遷移は照合対象の格子点が存在しないことを意味するので,照合スコアはペナルティとして(-γ)と定義する。ここでγは定数である。
次に,列方向の検証について図16の例を用いて説明する。図16は,ステップ1140で得られた書式情報格子点の各行における照合結果である。書式格子点情報の0行目は部分領域格子点情報の2行目に対応している。書式情報格子点の0,1,2列は,部分領域格子点情報の42,44,54列に対応している。ここで,書式格子点情報の0列目と2列目は,全ての行で同じ結果が出ているため,42,54列が対応していると判定する。しかし,1列目は,0,1,3行目での照合結果は44であるのに対し,2行目の照合結果49となっており矛盾が生じている。このような矛盾に対応する一例としては多数決が挙げられる。この場合には44が3つ,49が1つであるため44が選択される。その他の対応策としては,44の結果を出した行の照合スコアの和と,49の結果を出した照合スコアの和を比較するということも挙げられる。
書式情報格子点の行と列が決定すれば,図10の枠の頂点位置・枠属性を利用して入力画像上での枠座標を得ることができる。フリガナ欄を例にすると,入力画像の格子点情報の中で,部分書式情報に登録された枠の四隅に対応する格子点は左上から反時計回りに(44,3),(44,4),(54,4),(54,3)である。この格子点における入力画像上の座標を検出することにより,フリガナ欄の四隅座標を得ることができる。
なお,部分書式ごとの照合類似度は,各行で計算された照合スコアの和などで定義することができる。同じ部分領域内に部分書式が複数ある場合には,照合類似度が最大となる部分書式を選択する。
帳票種ごとの照合類似度は,部分領域ごとに計算された部分書式の照合類似度の和などで定義することができる。処理対象の帳票の種類が複数である場合には,帳票種の照合類似度が最大となる帳票を選択する。
図17は,部分書式情報作成のフロー図である。ステップ1700では,画像入力装置20もしくは画像データベース60より帳票画像を入力する。ステップ1710では,帳票画像に対して罫線抽出等のレイアウト解析を実行し,格子点情報を生成する。ステップ1720では,入力装置10により入力される部分書式作成対象の領域指定に基づき,1710で作成された格子点情報から,指定領域内の格子点情報を抽出する。この格子点情報の抽出結果を表示装置50で表示する。この段階での格子点情報は,画像上のかすれやノイズなどに起因する誤りを含んでいる可能性がある。このため,ステップ1730では,入力装置10により指定された誤りの修正内容に基づき,1720にて得られた格子点情報を修正する。格子点の修正結果は表示装置50に表示される。この修正作業は,ユーザが誤りがないと判断するまで繰り返される。抽出された格子点情報は記録手段に記録される。ステップ1740では,1730にて修正された格子点情報に対して,部分領域の識別情報,読取項目の位置や項目名などの属性情報を,入力装置10により入力する。ステップ1750では,1740までの情報を適当な装置に保持される変換ルールを用いて所定のデータフォーマットに変換して部分書式情報を生成する。なお,図17のフローにおいて,部分書式情報として帳票全面を対象とする場合には,ステップ1720を省略することが可能である。また,1710にて得られた格子点情報に誤りがなければ,ステップ1730を省略することが可能である。また,帳票画像の品質が低いために1710にて得られた格子点情報に誤りが多ければ,帳票画像を替えて1700から再試行することも可能である。さらに,1710の書式解析を行なわずに,全ての情報を入力装置10により入力することも可能である。
まず,追加作成したい帳票画像を入力し,既存の部分書式情報を用いて認識をする。既存の部分書式情報で対応できる部分領域については,照合により特定できた部分領域を表示する。この表示方法の例としては,帳票画像上に照合できた部分領域を色分けして表示することが挙げられる。この表示の結果,色分けされていない領域が既存の部分書式情報で対応できなかった領域と判断できる。この領域を自動的に検出,もしくは入力装置10から指定することにより,追加する部分書式情報の領域を特定できる。以降は,図17のステップ1730以降の処理をすることにより,部分書式情報の追加をすることができる。
Claims (8)
- 帳票画像を構成する複数の領域毎に、それぞれの領域について照合に必要な情報および該領域内の読取項目を特定する項目情報を含む、該帳票の書式情報を記憶する記憶する記憶手段と、
帳票画像を取得する入力手段と、
上記記憶手段から上記書式情報を読み出し、上記取得した帳票画像を構成する複数の部分領域のそれぞれを前記書式情報のいずれかと照合して該当する書式情報を判定する書式情報判定手段と、
前記複数の部分領域毎に、前記該当すると判定された書式情報に含まれる項目情報を参照して該部分領域内において認識する文字の位置を決定する文字位置決定手段とを有することを特徴とする帳票処理装置。 - 請求項1記載の帳票処理装置であって、前記決定された位置の文字を認識して項目読取結果とする項目読取手段を有することを特徴とする帳票処理装置。
- 請求項1記載の帳票処理装置であって、前記項目情報は、該領域内における読取項目とその記載位置を特定する情報を対応付けたものであることを特徴とする帳票処理装置。
- 請求項1記載の帳票処理装置であって、前記記憶手段には、帳票画像を構成する複数の部分領域のうちの少なくとも一部の複数の部分領域について、該部分領域と対応付けて複数種類の書式情報が記憶され、また、複数の帳票種類について、該帳票種類に対応する前記部分領域の書式情報の組み合わせである帳票種類情報が記憶され、
前記書式情報判定手段は、前記取得した帳票画像の部分領域が、該部分領域に対応する書式情報のいずれに該当するかを判定し、前記取得した帳票画像の各部分領域が該当すると判定された書式情報の組み合わせを用いて前記帳票種類情報を参照し、前記取得した帳票画像の帳票種類を判定することを特徴とする帳票処理装置。 - 帳票画像を構成する複数の領域毎に、それぞれの領域について照合に必要な情報および該領域内の読取項目を特定する項目情報を含む、該帳票の書式情報を記憶する記憶する記憶手段と、帳票画像を取得する入力手段と、帳票処理部とを有する帳票処理装置における帳票処理方法であって、
上記記憶手段から上記書式情報を読み出し、上記取得した帳票画像を構成する複数の部分領域のそれぞれを前記書式情報のいずれかと照合して該当する書式情報を判定する第1のステップと、
前記複数の部分領域毎に、前記該当すると判定された書式情報に含まれる項目情報を参照して該部分領域内において認識する文字の位置を決定する第2のステップと、
を有することを特徴とする帳票処理方法。 - 請求項5記載の帳票処理方法であって、前記決定された位置の文字を認識して項目読取結果とする第3のステップを有することを特徴とする帳票処理方法。
- 請求項5記載の帳票処理方法であって、前記項目情報は、該領域内における読取項目とその記載位置を特定する情報を対応付けたものであることを特徴とする帳票処理方法。
- 請求項5記載の帳票処理方法であって、前記記憶手段には、帳票画像を構成する複数の部分領域のうちの少なくとも一部の複数の部分領域について、該部分領域と対応付けて複数種類の書式情報が記憶され、また、複数の帳票種類について、該帳票種類に対応する前記部分領域の書式情報の組み合わせである帳票種類情報が記憶され、
前記第1のステップは、前記取得した帳票画像の部分領域が、該部分領域に対応する書式情報のいずれに該当するかを判定し、前記取得した帳票画像の各部分領域が該当すると判定された書式情報の組み合わせを用いて前記帳票種類情報を参照し、前記取得した帳票画像の帳票種類を判定することを特徴とする帳票処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006154163A JP4521377B2 (ja) | 2006-06-02 | 2006-06-02 | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006154163A JP4521377B2 (ja) | 2006-06-02 | 2006-06-02 | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002305283A Division JP2004139484A (ja) | 2002-10-21 | 2002-10-21 | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006244526A true JP2006244526A (ja) | 2006-09-14 |
JP4521377B2 JP4521377B2 (ja) | 2010-08-11 |
Family
ID=37050801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006154163A Expired - Fee Related JP4521377B2 (ja) | 2006-06-02 | 2006-06-02 | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4521377B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012059226A (ja) * | 2010-09-13 | 2012-03-22 | Ricoh Co Ltd | 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体 |
JP2013164740A (ja) * | 2012-02-10 | 2013-08-22 | Hiroaki Ono | 会計情報読取りシステム、会計情報読取り方法、及びプログラム |
-
2006
- 2006-06-02 JP JP2006154163A patent/JP4521377B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012059226A (ja) * | 2010-09-13 | 2012-03-22 | Ricoh Co Ltd | 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体 |
JP2013164740A (ja) * | 2012-02-10 | 2013-08-22 | Hiroaki Ono | 会計情報読取りシステム、会計情報読取り方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4521377B2 (ja) | 2010-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
US11182604B1 (en) | Computerized recognition and extraction of tables in digitized documents | |
CN111325110A (zh) | 基于ocr的表格版式恢复方法、装置及存储介质 | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
US8418050B2 (en) | Computer readable recording medium on which form data extracting program is recorded, form data extracting apparatus, and form data extracting method | |
JP4834351B2 (ja) | 文字認識装置及び文字認識方法 | |
CN114005126A (zh) | 表格重构方法、装置、计算机设备及可读存储介质 | |
JP4521466B2 (ja) | 帳票処理装置 | |
JP4521377B2 (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP2003109007A (ja) | 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置 | |
JP5712415B2 (ja) | 帳票処理システム及び帳票処理方法 | |
JPH1173472A (ja) | フォーマット情報登録方法及びocrシステム | |
JPH08320914A (ja) | 表認識方法および装置 | |
JP2009223612A (ja) | 画像認識装置及びプログラム | |
JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
JP4160206B2 (ja) | 文字認識装置を利用したデータベース登録方法 | |
KR20060007204A (ko) | 방대한 데이터의 디지털화를 위한 문서영상처리 및검증시스템 및 그 방법 | |
JP2023003887A (ja) | 書類画像処理システム、書類画像処理方法、および書類画像処理プログラム | |
US11256760B1 (en) | Region adjacent subgraph isomorphism for layout clustering in document images | |
JPH1063744A (ja) | 文書のレイアウト解析方法及びシステム | |
JPH11328306A (ja) | 文書画像の論理要素抽出方法、装置および記録媒体 | |
JP4221960B2 (ja) | 帳票識別装置及びその識別方法 | |
JPH10207981A (ja) | 帳票認識方法 | |
JP4213558B2 (ja) | 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060607 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081006 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081217 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090128 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20090220 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100524 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130528 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130528 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |