JP2004178108A - 帳票認識装置 - Google Patents

帳票認識装置 Download PDF

Info

Publication number
JP2004178108A
JP2004178108A JP2002341497A JP2002341497A JP2004178108A JP 2004178108 A JP2004178108 A JP 2004178108A JP 2002341497 A JP2002341497 A JP 2002341497A JP 2002341497 A JP2002341497 A JP 2002341497A JP 2004178108 A JP2004178108 A JP 2004178108A
Authority
JP
Japan
Prior art keywords
page
image
format data
block
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002341497A
Other languages
English (en)
Inventor
Keiko Nakanishi
恵子 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002341497A priority Critical patent/JP2004178108A/ja
Publication of JP2004178108A publication Critical patent/JP2004178108A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)

Abstract

【課題】複数頁で構成される帳票を認識できるようにする。
【解決手段】帳票認識装置は、複数の頁画像で構成される帳票画像を入力する画像入力手段と、前記入力された複数の頁画像で構成される帳票画像から、1つの合体書式データを生成する書式データ生成手段と、前記書式データ生成手段で生成した合体書式データを、登録帳票の書式データと比較して類似度を算出する類似度算出手段と、前記類似度算出手段で算出された類似度に基づいて、前記帳票画像に最も類似する登録帳票を識別する識別手段とを有することにより、複数ページで構成される帳票を認識できる。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は帳票認識装置に関する。
【0002】
【従来の技術】
従来、帳票認識装置は、スキャナ等で読み取った帳票画像データに対し、1枚ごとに特徴量の抽出、この特徴量からの帳票書式データ生成を順次実行した後に、生成された帳票書式データと登録帳票の書式データとの類似度を1枚ごとに算出し、最も類似する登録帳票の書式データを識別することによって帳票認識を行う。
【0003】
【発明が解決しようとする課題】
つまり、従来の帳票認識装置では、1枚で構成される帳票しか認識できず、複数枚で1つの帳票が構成されるような帳票(複数ページで構成される帳票)の認識を行うことはできなかった。
【0004】
本発明は、複数頁で構成される帳票を認識することを目的とする。
【0005】
【課題を解決するための手段】
本発明に係る帳票認識装置は、複数の頁画像で構成される帳票画像を入力する画像入力手段と、前記入力された複数の頁画像で構成される帳票画像から、1つの合体書式データを生成する書式データ生成手段と、前記書式データ生成手段で生成した合体書式データを、登録帳票の書式データと比較して類似度を算出する類似度算出手段と、前記類似度算出手段で算出された類似度に基づいて、前記帳票画像に最も類似する登録帳票を識別する識別手段とを有することを特徴とする。
【0006】
【発明の実施の形態】
[第1の実施形態]
次に本発明に係る帳票認識装置の一実施形態を図面に基づいて説明する。
【0007】
図1は、本発明に係る帳票認識装置の一実施形態を示すブロック図、図2は、帳票画像における複数の頁画像を示す図、図3Aは、1枚の頁画像についての書式データを示す図、図3Bは、他の頁画像についての書式データを示す図、図4Aは、2枚の頁画像の書式データを合体した書式データを示す図、図4Bは、3枚の頁画像の書式データを合体した書式データを示す図である。
【0008】
図1において、帳票認識装置は、スキャナ、カメラ、あるいはファイル読み込み装置などの画像入力手段11を有し、この画像入力手段11から1頁または複数頁の帳票を画像データとして入力する。
【0009】
画像入力手段11はバス17に接続され、バス17を介して帳票認識の処理を実行するプロセッサ12に接続されている。
【0010】
バス17にはさらにキーボード13、ディスク14、メモリ15、出力手段16が接続されている。
【0011】
メモリ15は、プロセッサ12において処理制御情報を作成する際の一時データ記憶、あるいは画像入力手段11で読み込んだ帳票画像を蓄積する。また登録帳票(帳票テンプレート)の書式データ等が、ディスク14等から読み込まれて、登録済みデータ15dとして保持される。また、後述するフローチャートに対応するような処理をコンピュータに実行させるための制御プログラム15cが格納される。
【0012】
プロセッサ12は、メモリ15に格納された制御プログラム15cを実行することにより、画像特徴量抽出手段12a、書式データ作成手段12b、書式データ合体手段12c、画像データ合体手段12d、類似度算出・識別手段12eとして機能する。
【0013】
キーボード13は、帳票の登録や検索などの指示操作を行い、ディスク14は、補助記憶装置として機能する。
【0014】
出力手段16は、ディスプレイ、プリンタ等であり、認識結果等の各種情報を出力する。
【0015】
スキャナ11で読み取った帳票の画像は、帳票画像15bとしてメモリ15に格納される。帳票画像15bはプロセッサ12に設けられた画像処理手段(図示せず。)等により2値化処理されて、画像特徴量抽出手段12aに送られる。
【0016】
画像特徴量抽出手段12aは、黒ドットのヒストグラムを取るなどして帳票画像に含まれる領域を識別し、帳票画像15bに含まれる領域(ブロック)をテーブル、テキスト、ピクチャ等に属性分類し、さらに解像度、ブロック情報を抽出する。ブロック情報は帳票画像15bに含まれるブロックの位置情報、大きさ情報等よりなる。
【0017】
各ブロックの属性情報等の特徴量は、書式データ作成手段12bに入力され、書式データ作成手段12bは、属性情報、解像度、ブロック情報に基づいて、帳票画像15bの書式データを生成し、メモリ11およびディスク14に保存する。
【0018】
図2は、3頁、すなわち3枚の画像15b1、15b2、15b3で構成される帳票画像15bの例を示す。この帳票画像について、特徴量抽出手段12aによってブロックの属性分類が為される。ここで1頁の帳票画像を頁画像と呼ぶことにする。
【0019】
頁画像15b1は3個のブロックB11、B12、B13を含み、頁画像15b2は4個のブロックB21、B22、B23、B24を含み、頁画像15b3は3個のブロックB31、B32、B33を含む。
【0020】
頁画像15b1は帳票頁幅W1、帳票頁高さH1であり、そのブロックB11はブロック左端位置の水平座標がX11、ブロック上端位置の垂直座標がY11、ブロック幅がW11、ブロック高さH11、ブロックB12はブロック左端位置の水平座標がX12、ブロック上端位置の垂直座標がY12、ブロック幅がW12、ブロック高さH12、そのブロックB13はブロック左端位置の水平座標がX13、ブロック上端位置の垂直座標がY13、ブロック幅がW13、ブロック高さH13である。
【0021】
頁画像15b2は帳票頁幅W2、帳票頁高さH2であり、そのブロックB21はブロック左端位置の水平座標がX21、ブロック上端位置の垂直座標がY21、ブロック幅がW21、ブロック高さH21、ブロックB22はブロック左端位置の水平座標がX22、ブロック上端位置の垂直座標がY22、ブロック幅がW22、ブロック高さH22、そのブロックB23はブロック左端位置の水平座標がX23、ブロック上端位置の垂直座標がY23、ブロック幅がW23、ブロック高さH23、そのブロックB24はブロック左端位置の水平座標がX24、ブロック上端位置の垂直座標がY24、ブロック幅がW24、ブロック高さH24である。
【0022】
頁画像15b3は帳票頁幅W3、帳票頁高さH3であり、そのブロックB31はブロック左端位置の水平座標がX31、ブロック上端位置の垂直座標がY31、ブロック幅がW31、ブロック高さH31、ブロックB32はブロック左端位置の水平座標がX32、ブロック上端位置の垂直座標がY32、ブロック幅がW32、ブロック高さH32、そのブロックB33はブロック左端位置の水平座標がX33、ブロック上端位置の垂直座標がY33、ブロック幅がW33、ブロック高さH33である。
【0023】
書式データ作成手段12bは、頁画像15b1、15b2、15b3について、帳票頁幅、帳票頁高さ、解像度等の頁書式と、ブロック左端位置、ブロック上端位置等の位置情報、ブロック幅、ブロック高さなどの大きさ情報よりなるブロック情報とを含む書式データを生成する。
【0024】
図3Aは頁画像15b1の書式データを示す。同書式データにおいて、頁書式は、帳票頁幅W1、帳票頁高さH1、解像度D1であり、ブロック情報は、各ブロックB11、B12、B13の位置情報であるブロック左端位置、ブロック上端位置と、大きさ情報であるブロック幅、ブロック高さを含む。
【0025】
図3Bは頁画像15b2の書式データを示す。同書式データにおいて、頁書式は、帳票頁幅W2、帳票頁高さH2、解像度D2であり、ブロック情報は、各ブロックB21、B22、B23、B24の位置情報であるブロック左端位置、ブロック上端位置と、大きさ情報であるブロック幅、ブロック高さを含む。
【0026】
頁画像15b3の書式データは、頁画像15b1、15b2の書式データと同様にして作成されるので図示を省略する。
【0027】
書式データ合体手段12cは複数の頁画像の書式データを合体し、1個の書式データ(以下合体書式データという。)を生成する。合体は、帳票頁高さを合計した頁高さと、最も大きい帳票頁幅とを有する帳票を生成するように、書式データを設定する。
【0028】
図4Aは頁画像15b1、15b2の合体書式データを示し、図4Bは頁画像15b1、15b2、15b3の合体書式データを示す。
【0029】
図4Aにおいて、合体書式データは、合体された頁画像15b1、15b2の各帳票頁幅を示す帳票頁幅(W1:W2)、頁画像15b1、15b2の帳票頁高さの和よりなる帳票頁高さ(H1+H2)、解像度DD1を頁書式とする。なお、本実施形態では、読み込んだ各頁画像の解像度は同じとして扱っているが、読み込んだ頁画像の解像度が異なっている場合、好適には頁画像の解像度を登録帳票の解像度と一致するように変換した後、合体する(その際、頁画像のブロック情報も解像度変換に合わせて変換されている)。さらに合体書式データは、1頁目の頁画像15b1のブロックB11〜B13のブロック情報を配列し、これに続いて、2頁目の頁画像15b2のブロックB21〜B24のブロック情報を配列してなる。頁画像15b2のブロック情報において、頁画像15b2は頁画像15b1の下に連結されているので、ブロックB21〜B24のブロック上端位置は、頁画像15b1の帳票頁高さH1だけ加算される。
【0030】
すなわち、ブロックB21はブロック左端位置の水平座標がX21、ブロック上端位置の垂直座標がY21+H1、ブロック幅がW21、ブロック高さH21、ブロックB22はブロック左端位置の水平座標がX22、ブロック上端位置の垂直座標がY22+H1、ブロック幅がW22、ブロック高さH22、そのブロックB23はブロック左端位置の水平座標がX23、ブロック上端位置の垂直座標がY23+H1、ブロック幅がW23、ブロック高さH23、そのブロックB24はブロック左端位置の水平座標がX24、ブロック上端位置の垂直座標がY24+H1、ブロック幅がW24、ブロック高さH24である。
【0031】
図4Bにおいて、頁書式は、頁画像15b1、15b2、15b3の各帳票頁幅を示す帳票頁幅(W1:W2)、頁画像15b1、15b2、15b3の帳票頁高さの和よりなる帳票頁高さ(H1+H2+H3)、解像度DD3よりなる。
【0032】
ブロック情報としては、1頁目の頁画像15b1のブロックB11〜B13のブロック情報、2頁目の頁画像15b2のブロックB21〜B24のブロック情報、3頁目の頁画像15b3のブロックB31〜B33のブロック情報を順次配列してなる。ブロックB21〜B24はブロック上端位置がH1だけ加算され、ブロックB31〜B33はブロック上端位置がH1+H2だけ加算される。
【0033】
すなわち、頁画像15b2の各ブロック情報は図4Aと同様であり、頁画像15b3において、ブロックB31はブロック左端位置の水平座標がX31、ブロック上端位置の垂直座標がY31+H1+H2、ブロック幅がW31、ブロック高さH31、ブロックB32はブロック左端位置の水平座標がX32、ブロック上端位置の垂直座標がY32+H1+H2、ブロック幅がW32、ブロック高さH32、そのブロックB33はブロック左端位置の水平座標がX33、ブロック上端位置の垂直座標がY33+H1+H2、ブロック幅がW33、ブロック高さH33である。
【0034】
同様にn枚の頁画像の書式データを合体するときには、n−1枚目まで合体した合体書式データの頁書式を修正し、さらにn枚の頁画像15bnのブロック情報におけるブロック上端位置に15b1〜15bn−1の帳票頁高さの和(H1+H2+....+Hn−1)を加える。
【0035】
画像データ合体手段12dは、以上の書式データの合体に対応して、頁画像15b1〜15b3を1頁の帳票画像に合体する。
【0036】
このように合体書式データを生成することにより、複数頁の帳票画像を1頁の帳票画像と同様に取り扱うことが可能になり、その後の処理は、従来の帳票認識処理と同様に処理し得る。
【0037】
合体書式データは類似度算出・識別手段12eによって、登録済みの書式データ15aとの類似度が算出され、クラスタリングされる。
【0038】
図5において、帳票認識処理は、以下の各ステップにより、合体書式データを生成するための書式データ生成処理を実行する。
【0039】
ステップS51:ステップS53〜S57の処理回数を制御するループカウンタjを「1」に初期化する。
【0040】
ステップS52:全体の帳票画像15bを構成する頁画像の枚数nを指定する。枚数nを含むマルチページデータが供給されたときは、枚数nはマルチページデータから直接取得でき、また枚数nをユーザが指定することも可能である。
【0041】
ステップS53:画像入力手段11からj枚目の頁画像を読み込み、頁画像15bjとしてメモリ15に転送する。
【0042】
ステップS54:画像特徴量抽出手段12bによって、頁画像15bjの特徴量を抽出する。
【0043】
ステップS55:ステップS54で抽出された特徴量に基づき、書式データ作成手段12bによって、頁画像15bjの書式データを生成する。
【0044】
ステップS56:書式データ合体手段12cによって、1枚目から(j−1)枚目の頁画像書式データを合体した合体書式データに対して、j枚目の頁画像15bjの書式データを合体する。
【0045】
ステップS57:ル―プカウンタjを「1」インクリメントする。
【0046】
ステップS58:j>nの判断を行い、n枚の頁画像15b1〜15bnの合体書式データ生成処理が完了したか否か判断する。合体書式データ生成処理が完了していなかったときは、ステップS53に戻り、完了していたときは、そのまま処理を終了する。
【0047】
以上の合体書式データ生成処理の後に、合体書式データと登録済みの合体書式データ(帳票テンプレートの登録合体書式データ)との類似度を算出し、最も類似する登録合体書式データ(登録済みデータ15d)を識別することによって帳票認識を行う。
【0048】
なお、本実施形態では頁画像を縦方向に順次合体するように書式データを合体したが、横方向に合体することも可能である。
【0049】
横方向の合体は、後述する第3の実施形態(図9)と同様である。合体書式データにおいて、帳票頁高さには、頁画像の帳票頁高さの最大値が採用され、帳票頁幅は頁画像の帳票頁幅の合計となる。
【0050】
なお帳票認識において、予め帳票を登録するときや、算出された類似度が充分高くないとき、すなわち生成された合体書式データに対応する合体書式データが登録されていなかったときは、生成された合体書式データを登録する処理が必要である。
【0051】
図6において、合体書式データを登録する処理は以下の各ステップにより実行される。
【0052】
ステップS61:合体書式データを登録する必要があるか否か判断し、登録要のときはステップS62に移行し、登録不要のときはそのまま処理を終了する。
【0053】
ステップS62:合体書式データを登録する。
【0054】
以上の登録処理により、以後対応する合体書式データに対応するような帳票画像を認識し得るようになる。
【0055】
[第2の実施形態]
図5の合体書式データ生成処理では個々の頁画像について書式データを生成し、書式データを順次合体したが、図1の帳票認識装置において、頁画像を順次合体した後に、全体の書式データを生成することも可能である。
【0056】
図7は、図1の帳票認識装置で実行される書式データ生成処理の第2の実施形態を示すフローチャート、図8は、第2の実施形態により生成された合成画像データを示す図である。
【0057】
図7に示すように、頁画像の合体後に書式データを生成する処理は以下の各ステップにより実行される。
【0058】
ステップS71:ステップS73〜S75の処理回数を制御するループカウンタjを「1」に初期化する。
【0059】
ステップS72:図5のステップS52と同様、全体の帳票画像15bを構成する頁画像の枚数nを指定する。
【0060】
ステップS73:図5のステップS53と同様、画像入力手段11からj枚目の頁画像を読み込み、頁画像15bjとしてメモリ15に転送する。
【0061】
ステップS74:画像データ合体手段12dによって、1枚目から(j−1)枚目の頁画像を合体した画像データ(以下合体画像データという。)に対して、j枚目の頁画像15bjを合体する。1枚目の頁画像15b1はそのまま合体画像データとし、2枚目の頁画像ときは、1枚目の頁画像と合体する。1枚目の頁画像15b1が帳票頁幅W1、帳票頁高さH1であり、2枚目の頁画像15b2が帳票頁幅W2、帳票頁高さH1のとき、合体画像データは、W1、W2のうちの大きい方を帳票頁幅とし、H1とH2を加えた高さを帳票頁高さとする。幅、高さは、余白を考慮して決めてもよい。3枚目の頁画像15b3が入力されたときは、2枚目までの合体画像に合体する。同様にn枚目のときは、n−1枚目までの合体画像に合体する。
【0062】
図8は、図2の頁画像15b1〜15b3を合体した合体画像データを示す。合体画像データの帳票頁幅WcはW1、W2、W3中最大のW2に設定され、帳票頁高さHcは(H1+H2+H3)に設定されている。
【0063】
ステップS75:ル―プカウンタjを「1」インクリメントする。
【0064】
ステップS76:j>nの判断を行い、n枚の頁画像15b1〜15bnの合体画像データ生成処理が完了したか否か判断する。合体画像データ生成処理が完了していなかったときは、ステップS73に戻り、完了していたときは、ステップS77に移行する。
【0065】
ステップS77:画像特徴量抽出手段12bによって、合体画像の特徴量を抽出する。
【0066】
ステップS78:ステップS77で抽出された特徴量に基づき、書式データ作成手段12bによって、合体画像データの書式データを生成し、処理を終了する。
【0067】
合体画像データは類似度算出・識別手段12eによって、登録済みの帳票画像(登録済みデータ15d)との類似度が算出され、最も類似する登録帳票が識別される。
【0068】
以後必要に応じて、図6の処理と同様に、新たな合体書式データを登録する。
【0069】
[第3の実施形態]
第2の実施形態では頁画像を縦方向に順次合体したが、頁画像を横方向に順次合体することも可能である。
【0070】
第3の実施形態の処理は図7のフローチャートにおけるステップS74を以下のとおり訂正することにより実現される。
【0071】
すなわち、画像データ合体手段12dによって、1枚目から(j−1)枚目の頁画像を合体した画像データ(以下合体画像データという。)に対して、j枚目の頁画像15bjを合体する。1枚目の頁画像15b1はそのまま合体画像データとし、2枚目の頁画像ときは、1枚目の頁画像と合体する。1枚目の頁画像15b1が帳票頁幅W1、帳票頁高さH1であり、2枚目の頁画像15b2が帳票頁幅W2、帳票頁高さH1のとき、合体画像データは、H1、H2うちの大きい方を帳票頁高さし、W1とW2を加えた幅を帳票頁幅とする。幅、高さは、余白を考慮して決めてもよい。3枚目の頁画像15b3が入力されたときは、2枚目までの合体画像に合体する。同様にn枚目のときは、n−1枚目までの合体画像に合体する
図9は、第3の実施形態により生成された合成画像データを示す図である。
【0072】
図9の合体画像データの帳票頁高さHcはH1、H2、H3中最大のH2に設定され、帳票頁幅Wcは(W1+W2+W3)に設定されている。
【0073】
以上の実施形態に示したように、複数の頁画像の画像そのもののデータあるいは書式データを合体して合体データを生成することにより、一体の帳票画像として取り扱うことが可能になる。すなわち、頁画像のデータを書式データ合体手段あるいは画像データ合体手段(以下これらを総称して合体手段という。)により合体すれば、一体帳票画像としての処理が可能になる。
【0074】
また本発明の趣旨と範囲は、本発明の特定の説明と図に限定されるものではなく、本願特許請求の範囲に述べられた内容の様々な修正および変更に及ぶことは当業者にとって理解されるであろう。
【0075】
本発明の実施態様の例を以下に総括する。
【0076】
[実施態様1]
複数の頁画像で構成される帳票画像を入力する画像入力手段と、前記入力された複数の頁画像で構成される帳票画像から、1つの合体書式データを生成する書式データ生成手段と、前記書式データ生成手段で生成した合体書式データを、登録帳票の書式データと比較して類似度を算出する類似度算出手段と、前記類似度算出手段で算出された類似度に基づいて、前記帳票画像に最も類似する登録帳票を識別する識別手段とを有することを特徴とする帳票認識装置。
【0077】
[実施態様2]
前記書式データ生成手段は、前記入力された複数の頁画像それぞれから特徴量を抽出し、当該抽出した特徴量に基づいて各頁画像の書式データを作成し、当該作成した各頁画像の書式データを合体することにより、前記合体書式データを生成することを特徴とする実施態様1に記載の帳票認識装置。
【0078】
[実施態様3]
前記書式データ生成手段は、前記入力された複数の頁画像を合体して合体画像を作成し、当該作成した合体画像から特徴量を抽出し、当該抽出した特徴量に基づいて前記合体書式データを生成することを特徴とする実施態様1に記載の帳票認識装置。
【0079】
[実施態様4]
前記類似度が所定値よりも低いときに、入力された帳票画像の合体データを新たに登録する登録手段をさらに有することを特徴とする実施態様1記載の帳票認識装置。
【0080】
[実施態様5]
前記書式データ生成手段は、前記作成した各頁画像の書式データを、予め定められた方向で合体することにより、前記合体書式データを生成することを特徴とする実施態様2に記載の帳票認識装置。
【0081】
[実施態様6]
前記書式データ生成手段は、前記入力された複数の頁画像を、予め定められた方向で合体することにより、前記合体画像を作成することを特徴とする実施態様3に記載の帳票認識装置。
【0082】
[実施態様7]
複数の頁画像で構成される帳票画像を入力する画像入力ステップと、前記入力された複数の頁画像で構成される帳票画像から、1つの合体書式データを生成する書式データ生成ステップと、前記書式データ生成ステップで生成した合体書式データを、登録帳票の書式データと比較して類似度を算出する類似度算出ステップと、前記類似度算出ステップで算出された類似度に基づいて、前記帳票画像に最も類似する登録帳票を識別する識別ステップとを有することを特徴とする帳票認識方法。
【0083】
[実施態様8]
複数の頁画像で構成される帳票画像を入力する画像入力ステップと、前記入力された複数の頁画像で構成される帳票画像から、1つの合体書式データを生成する書式データ生成ステップと、前記書式データ生成ステップで生成した合体書式データを、登録帳票の書式データと比較して類似度を算出する類似度算出ステップと、前記類似度算出ステップで算出された類似度に基づいて、前記帳票画像に最も類似する登録帳票を識別する識別ステップとの各ステップを、コンピュータで実現させるためのコンピュータ実行可能なプログラム。
【0084】
[実施態様9]
前記実施態様8に記載のコンピュータプログラムが格納されたコンピュータ読取可能な記憶媒体。
【0085】
【発明の効果】
本発明によれば、複数頁で構成される帳票を認識し得る。
【図面の簡単な説明】
【図1】本発明に係る帳票認識装置の一実施形態を示すブロック図である。
【図2】帳票画像における複数の頁画像を示す図である。
【図3A】1枚の頁画像についての書式データを示す図である。
【図3B】他の頁画像についての書式データを示す図である。
【図4A】2枚の頁画像の書式データを合体した書式データを示す図である。
【図4B】3枚の頁画像の書式データを合体した書式データを示す図である。
【図5】図1の帳票認識装置で実行される書式データ生成処理の第1の実施形態を示すフローチャートである。
【図6】図1の実施形態における登録処理の一実施形態を示すフローチャートである。
【図7】図1の帳票認識装置で実行される書式データ生成処理の第2の実施形態を示すフローチャートである。
【図8】第2の実施形態により生成された合成画像データを示す図である。
【図9】第3の実施形態により生成された合成画像データを示す図である。
【符号の説明】
11 スキャナ、カメラ等の画像入力手段
12 プロセッサ
12a 画像特徴量抽出手段
12b 書式データ作成手段
12c 書式データ合体手段
12d 画像データ合体手段
12e 類似度算出・判定手段
13 キーボード
14 ディスク
15 メモリ
16 ディスプレイ、プリンタ等の出力手段

Claims (1)

  1. 複数の頁画像で構成される帳票画像を入力する画像入力手段と、
    前記入力された複数の頁画像で構成される帳票画像から、1つの合体書式データを生成する書式データ生成手段と、
    前記書式データ生成手段で生成した合体書式データを、登録帳票の書式データと比較して類似度を算出する類似度算出手段と、
    前記類似度算出手段で算出された類似度に基づいて、前記帳票画像に最も類似する登録帳票を識別する識別手段と
    を有することを特徴とする帳票認識装置。
JP2002341497A 2002-11-25 2002-11-25 帳票認識装置 Pending JP2004178108A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002341497A JP2004178108A (ja) 2002-11-25 2002-11-25 帳票認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002341497A JP2004178108A (ja) 2002-11-25 2002-11-25 帳票認識装置

Publications (1)

Publication Number Publication Date
JP2004178108A true JP2004178108A (ja) 2004-06-24

Family

ID=32703840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002341497A Pending JP2004178108A (ja) 2002-11-25 2002-11-25 帳票認識装置

Country Status (1)

Country Link
JP (1) JP2004178108A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250425A (ja) * 2007-03-29 2008-10-16 Oki Electric Ind Co Ltd 帳票処理装置
KR101093072B1 (ko) 2005-05-10 2011-12-13 삼성전자주식회사 스캔할 문서 상에서 기 설정된 영역 내의 이미지만을스캔하는 호스트 단말장치 및 그 스캔 방법
CN106161829A (zh) * 2014-08-20 2016-11-23 富士施乐株式会社 图像处理设备和方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101093072B1 (ko) 2005-05-10 2011-12-13 삼성전자주식회사 스캔할 문서 상에서 기 설정된 영역 내의 이미지만을스캔하는 호스트 단말장치 및 그 스캔 방법
JP2008250425A (ja) * 2007-03-29 2008-10-16 Oki Electric Ind Co Ltd 帳票処理装置
CN106161829A (zh) * 2014-08-20 2016-11-23 富士施乐株式会社 图像处理设备和方法
CN106161829B (zh) * 2014-08-20 2018-12-28 富士施乐株式会社 图像处理设备和方法

Similar Documents

Publication Publication Date Title
CN110348294B (zh) Pdf文档中图表的定位方法、装置及计算机设备
JP4427342B2 (ja) 文書分析情報を使用して文書を再フォーマット化する方法及び製造物
CN107886074A (zh) 一种人脸检测方法以及人脸检测系统
US20050223319A1 (en) Layout-rule generation system, layout system, layout-rule generation program, layout program, storage medium, method of generating layout rule, and method of layout
US8965125B2 (en) Image processing device, method and storage medium for storing and displaying an electronic document
JPH10162150A (ja) ページ解析システム
US20150228045A1 (en) Methods for embedding and extracting a watermark in a text document and devices thereof
US20100315681A1 (en) Image processing apparatus, image processing method, and computer-readable storage medium
WO2023151237A1 (zh) 人脸位姿估计方法、装置、电子设备及存储介质
CN115131797A (zh) 一种基于特征增强金字塔网络的场景文本检测方法
WO2024027349A1 (zh) 一种印刷体数学公式识别方法、装置及存储介质
JP3616256B2 (ja) 画像処理装置
US6978046B2 (en) Systems and methods for automated template creation using scanned input
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
JP2007164513A (ja) 画像処理装置
WO2024012289A1 (zh) 视频生成方法、装置、电子设备及介质
JP2004178108A (ja) 帳票認識装置
CN111241891A (zh) 一种人脸图像切图方法、装置及计算机可读存储介质
CN114283442A (zh) 一种二次接线图智能识别方法、装置及存储介质
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP4261883B2 (ja) 帳票処理装置及び帳票処理方法並びにプログラム
US20020031270A1 (en) Image processing apparatus, image processing method, and computer readable storage medium
Yi et al. Automatic image matting and fusing for portrait synthesis
Chen et al. Massive figure extraction and classification in electronic component datasheets for accelerating PCB design preparation
JP2011141664A (ja) 文書比較装置、文書比較方法、及びプログラム