JP4998220B2 - 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法 - Google Patents
帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法 Download PDFInfo
- Publication number
- JP4998220B2 JP4998220B2 JP2007292619A JP2007292619A JP4998220B2 JP 4998220 B2 JP4998220 B2 JP 4998220B2 JP 2007292619 A JP2007292619 A JP 2007292619A JP 2007292619 A JP2007292619 A JP 2007292619A JP 4998220 B2 JP4998220 B2 JP 4998220B2
- Authority
- JP
- Japan
- Prior art keywords
- form data
- logical
- registered
- data
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
まず最初に、実施例1に係る帳票データ抽出の概要および特徴を説明する。実施例1に係る帳票データ抽出装置は、複数の帳票(例えば、決算帳票、会計帳票、人事帳票など)を予め記憶する登録帳票記憶DBと、各種の帳票における論理要素と論理要素の位置情報と各論理要素の間の関係と示した論理構造を記憶する共通論理構造DBと、活字の文書の画像をコンピュータが編集できる形式(文字コードの列)に変換するOCR(Optical Character Recognition)とを備える。
次に、図1を用いて、帳票データ抽出装置の構成を説明する。図1は、実施例1に係る帳票データ抽出装置の構成を示すブロック図である。図1に示すように、この帳票データ抽出装置10は、入力受付部11と、表示部12と、記憶部20と、制御部30とから構成される。
次に、図7〜図18を用いて、帳票データ抽出装置による処理を説明する。まず、図7を用いて、帳票データ抽出装置における全体的な処理の流れを説明する。図7は、実施例1に係る帳票データ抽出装置における全体的な処理の流れを示すフローチャートである。
図7に示すように、入力受付部11により入力帳票が受け付けられると(ステップS101肯定)、帳票データ抽出装置10は、受け付けられた入力帳票の種類を判定し、共通論理構造DB22に記憶される判定した種類の論理構造に従って、入力帳票の論理構造である入力帳票データを抽出する論理構造認識処理を行う(ステップS102)。なお、登録帳票の論理構造認識処理は、共通論理構造DB22に記憶される論理構造に従って、予め実施されて登録帳票データDB23に格納されていてもよく、入力受付部11により入力帳票が受け付けられるタイミングで実施されて登録帳票データDB23に格納されてもよい。
次に、図8を用いて、論理構造認識処理を説明する。図8は、実施例1に係る帳票データ抽出装置における論理構造認識処理の流れを示すフローチャートである。
次に、図9〜図12を用いて、論理要素照合処理および最適登録帳票選択処理を説明する。図9は、実施例1に係る帳票データ抽出装置における論理要素照合処理の流れを示すフローチャートである。
次に、図13〜図18を用いて、データ抽出処理を説明する。図13は、実施例1に係る帳票データ抽出装置における最適登録帳票からのデータ抽出処理の流れを示すフローチャートである。
このように、実施例1によれば、登録帳票DB21に記憶される各種の帳票に対応付けて、共通論理構造DB22に記憶される論理構造に基づいて取得された当該登録帳票上の論理要素と論理要素の位置情報と各論理要素間の関係とを示した登録帳票データを記憶し、入力帳票に対して、共通論理構造DB22に記憶される論理構造に基づいて、当該入力帳票上の論理要素と論理要素の位置以上と各論理要素間の関係とを示した入力帳票データを抽出し、抽出された入力帳票データに基づいて、当該入力帳票データに類似する登録帳票データを登録帳票データDB23から特定し、特定された入力帳票データに類似する登録帳票データの論理要素の位置情報と各論理要素間の関係とに基づいて、入力帳票から入力帳票データを再抽出し、再抽出できない論理要素については入力帳票データから抽出して、再抽出した入力帳票データを新たな登録帳票データとして生成するので、登録してある帳票でなくても容易にデータを抽出することが可能であることと、新たな登録帳票を容易に作成することが可能である。
まず、図19〜図23を用いて、二次登録帳票選択処理の流れについて説明する。図19は、実施例2に係る帳票データ抽出装置における二次登録帳票選択処理の流れを示すフローチャートである。
次に、図24〜図27を用いて、二次登録帳票データ抽出処理の流れについて説明する。図24は、実施例2に係る帳票データ抽出装置における二次登録帳票データ抽出の流れを示すフローチャートである。
このように、実施例2によれば、入力帳票データに類似する登録帳票データ以外にさらに入力帳票データに類似する登録帳票データの特定を要求する帳票特定要求を受信した場合に、特定された登録帳票データ以外の登録帳票データから入力帳票データに類似する二次登録帳票データを特定し、特定された入力帳票データに類似する登録帳票データの論理要素の位置情報と各論理要素間の関係とに基づいて、入力帳票から入力帳票データを再抽出し、入力帳票から再抽出できない論理要素がある場合に、帳票特定要求を送信して得られた二次登録帳票データの論理要素の位置情報と各論理要素間の関係とに基づいて、入力帳票から入力帳票データを再抽出し、再抽出した入力帳票データを新たな登録帳票データとして生成するので、入力帳票に最も類似する登録帳票データからデータが抽出できない場合でも、二次登録帳票データを用いてデータ抽出を行うことができる結果、入力帳票を再現する登録帳票データを高精度に生成することが可能である。
例えば、本発明は、抽出された入力帳票データの複数の領域において、それぞれの領域のみ一致する複数の登録帳票データを登録帳票データDB23から特定し、特定された複数の登録帳票データの論理要素の位置情報と各論理要素間の関係とのそれぞれに基づいて、入力帳票から複数の入力帳票データを再抽出し、再抽出した複数の入力帳票データを組み合わせて新たな登録帳票データとして生成することもできる。
また、本発明は、抽出された入力帳票データにおける各論理要素の外接矩形の4頂点と、登録帳票データDB23に記憶される登録帳票データにおける各論理要素の外接矩形の4頂点とを比較以外にも、抽出された入力帳票データにおける各論理要素の重心と、登録帳票データDB23に記憶される登録帳票データの重心とを比較することで、入力帳票データにおける各論理要素が登録帳票データにおける各論理要素のどれに該当するかを判断して、当該入力帳票データに類似する登録帳票データを登録帳票データDB23から特定することが可能である。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
ところで、上記の実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータシステムを他の実施例として説明する。
前記登録帳票記憶部に記憶される各種の帳票に対応付けて、前記共通論理構造記憶部に記憶される論理構造に基づいて取得された当該登録帳票上の論理要素と論理要素の位置情報と各論理要素間の関係とを示した登録帳票データを記憶する登録帳票データ記憶手段と、
前記入力帳票に対して、前記共通論理構造記憶部に記憶される論理構造に基づいて、当該入力帳票上の論理要素と論理要素の位置以上と各論理要素間の関係とを示した入力帳票データを抽出する入力帳票データ抽出手順と、
前記入力帳票データ抽出手順により抽出された入力帳票データに基づいて、当該入力帳票データに類似する登録帳票データを前記登録帳票データ記憶手段から特定する帳票特定手順と、
前記帳票特定手順により特定された入力帳票データに類似する登録帳票データの論理要素の位置情報と各論理要素間の関係とに基づいて、前記入力帳票から入力帳票データを再抽出し、再抽出できない論理要素については前記入力帳票データから抽出して、再抽出した入力帳票データを新たな登録帳票データとして生成するデータ生成手順と、
をコンピュータに実行させることを特徴とする帳票データ抽出プログラム。
前記帳票特定手順は、前記入力帳票データ抽出手順により抽出された入力帳票データと前記登録帳票データの論理要素の評価値とに基づいて、前記入力帳票データ抽出手順により抽出された入力帳票データに類似する登録帳票データを前記登録帳票データ記憶手段から特定することを特徴とする付記1に記載の帳票データ抽出プログラム。
前記データ生成手順は、前記帳票特定手順により特定された入力帳票データに類似する登録帳票データの論理要素の位置情報と各論理要素間の関係とに基づいて、前記入力帳票から入力帳票データを再抽出し、前記入力帳票から再抽出できない論理要素がある場合に、前記帳票特定手順に対して帳票特定要求を送信して得られた第二の登録帳票データの論理要素の位置情報と各論理要素間の関係とに基づいて、前記入力帳票から入力帳票データを再抽出し、再抽出した入力帳票データを新たな登録帳票データとして生成することを特徴とする付記1に記載の帳票データ抽出プログラム。
前記データ生成手順は、前記帳票特定手順により特定された入力帳票データに類似する登録帳票データの論理要素の位置情報と各論理要素間の関係とに基づいて、前記入力帳票から入力帳票データを再抽出し、前記入力帳票から再抽出できない論理要素がある場合に、前記帳票特定手順に対して帳票特定要求を送信することを所定の回数繰り返した後に、再抽出した入力帳票データを新たな登録帳票データとして生成することを特徴とする付記1に記載の帳票データ抽出プログラム。
前記データ生成手順は、前記帳票特定手順により特定された複数の登録帳票データの論理要素の位置情報と各論理要素間の関係とのそれぞれに基づいて、前記入力帳票から複数の入力帳票データを再抽出し、再抽出した複数の入力帳票データを組み合わせて新たな登録帳票データとして生成することを特徴とする付記1に記載の帳票データ抽出プログラム。
前記登録帳票記憶部に記憶される各種の帳票に対応付けて、前記共通論理構造記憶部に記憶される論理構造に基づいて取得された当該登録帳票上の論理要素と論理要素の位置情報と各論理要素間の関係とを示した登録帳票データを記憶する登録帳票データ記憶手段と、
前記入力帳票に対して、前記共通論理構造記憶部に記憶される論理構造に基づいて、当該入力帳票上の論理要素と論理要素の位置以上と各論理要素間の関係とを示した入力帳票データを抽出する入力帳票データ抽出手段と、
前記入力帳票データ抽出手段により抽出された入力帳票データに基づいて、当該入力帳票データに類似する登録帳票データを前記登録帳票データ記憶手段から特定する帳票特定手段と、
前記帳票特定手段により特定された入力帳票データに類似する登録帳票データの論理要素の位置情報と各論理要素間の関係とに基づいて、前記入力帳票から入力帳票データを再抽出し、再抽出できない論理要素については前記入力帳票データから抽出して、再抽出した入力帳票データを新たな登録帳票データとして生成するデータ生成手段と、
を備えたことを特徴とする帳票データ抽出装置。
前記登録帳票記憶部に記憶される各種の帳票に対応付けて、前記共通論理構造記憶部に記憶される論理構造に基づいて取得された当該登録帳票上の論理要素と論理要素の位置情報と各論理要素間の関係とを示した登録帳票データを記憶する登録帳票データ記憶手段と、
前記入力帳票に対して、前記共通論理構造記憶部に記憶される論理構造に基づいて、当該入力帳票上の論理要素と論理要素の位置以上と各論理要素間の関係とを示した入力帳票データを抽出する入力帳票データ抽出工程と、
前記入力帳票データ抽出工程により抽出された入力帳票データに基づいて、当該入力帳票データに類似する登録帳票データを前記登録帳票データ記憶手段から特定する帳票特定工程と、
前記帳票特定工程により特定された入力帳票データに類似する登録帳票データの論理要素の位置情報と各論理要素間の関係とに基づいて、前記入力帳票から入力帳票データを再抽出し、再抽出できない論理要素については前記入力帳票データから抽出して、再抽出した入力帳票データを新たな登録帳票データとして生成するデータ生成工程と、
を含んだことを特徴とする帳票データ抽出方法。
11 入力受付部
12 表示部
20 記憶部
21 登録帳票DB
22 共通論理構造DB
23 登録帳票データDB
30 制御部
31 入出力制御I/F部
32 論理構造認識部
33 論理構造照合部
34 最適登録帳票選択部
35 登録帳票生成部
100 コンピュータシステム
101 RAM
102 HDD
102a 登録帳票テーブル
102b 共通論理構造テーブル
102c 登録帳票データテーブル
103 ROM
103a 入力帳票データ抽出プログラム
103b 帳票判定プログラム
103c データ生成プログラム
104 CPU
104a 入力帳票データ抽出プロセス
104b 帳票判定プロセス
104c データ生成プロセス
Claims (7)
- コンピュータに、
共通論理構造記憶部に記憶される、各種の帳票における論理要素と各論理要素の間の関係とを示した論理構造に基づいて、入力帳票の論理構造を示す入力帳票データを抽出する入力帳票データ抽出手順と、
前記各種の帳票各々の論理構造を示す登録帳票データを記憶する登録帳票データ記憶部から、前記入力帳票データ抽出手順により抽出された入力帳票データに基づいて、前記入力帳票データに類似する登録帳票データを特定する帳票特定手順と、
前記帳票特定手順により特定された登録帳票データと前記入力帳票データとを用いて、前記入力帳票データの論理要素のうち前記登録帳票データに含まれる論理要素と同じ位置関係に位置する論理要素を特定する特定手順と、
前記特定手順により特定された入力帳票データにおける各論理要素の位置情報と、当該論理要素と同じ位置関係に位置する前記登録帳票データにおける論理要素の位置情報との差分を抽出し、前記登録帳票データに含まれる論理要素の位置情報に前記差分を加算した位置情報を用いて、前記特定手順によって特定された論理要素以外の論理要素を前記入力帳票から再抽出する再抽出手順と、
前記特定手順により特定された論理要素と、前記再抽出手順により再抽出された論理要素とを組み合わせた新たな登録帳票データを生成するデータ生成手順と、
を実行させることを特徴とする帳票データ抽出プログラム。 - 前記登録帳票データ記憶部は、前記登録帳票データの論理構造を形成する論理要素それぞれについて、当該論理要素の重み付けを示す評価値を記憶し、
前記帳票特定手順は、前記入力帳票データ抽出手順により抽出された入力帳票データと前記登録帳票データの論理要素の評価値とに基づいて、前記入力帳票データ抽出手順により抽出された入力帳票データに類似する登録帳票データを前記登録帳票データ記憶部から特定することを特徴とする請求項1に記載の帳票データ抽出プログラム。 - 前記帳票特定手順は、前記再抽出手順が前記入力帳票から論理要素を再抽出できない場合には、前記特定された登録帳票データ以外の登録帳票データから前記入力帳票データに類似する第二の登録帳票データを特定し、
前記特定手順は、前記第二の登録帳票データと前記入力帳票データと用いて、同じ位置関係に位置する論理要素を特定し、
前記再抽出手順は、前記入力帳票データ上の論理要素の位置情報と前記第二の登録帳票データ上の論理要素の位置情報との差分を抽出し、前記第二の登録帳票データに含まれる論理要素の位置情報に前記差分を加算した位置情報を用いて、前記特定手順によって特定された論理要素以外の論理要素を前記入力帳票から再抽出することを特徴とする請求項1に記載の帳票データ抽出プログラム。 - 前記帳票特定手順は、前記再抽出手順が前記入力帳票から論理要素を再抽出できない場合には、予め定めた所定の回数繰り返して、前記入力帳票データに類似する登録帳票データを特定し、
前記特定手順は、前記帳票特定手順により特定された各登録帳票データと前記入力帳票データと用いて、同じ位置関係に位置する論理要素を特定し、
前記再抽出手順は、前記入力帳票データ上の論理要素の位置情報と前記各登録帳票データ上の論理要素の位置情報との差分を抽出し、前記各登録帳票データに含まれる論理要素の位置情報に前記差分を加算した位置情報を用いて、前記特定手順によって前回までに特定された論理要素以外の論理要素を前記入力帳票から再抽出することを特徴とする請求項3に記載の帳票データ抽出プログラム。 - 前記帳票特定手順は、前記入力帳票データ抽出手順により抽出された入力帳票データにおける各論理要素の外接矩形の4頂点と、前記登録帳票データ記憶部に記憶される登録帳票データにおける各論理要素の外接矩形の4頂点とを比較することで、前記入力帳票データにおける各論理要素が登録帳票データにおける各論理要素のどれに該当するかを判断して、前記入力帳票データに類似する登録帳票データを前記登録帳票データ記憶部から特定することを特徴とする請求項1〜4のいずれか一つに記載の帳票データ抽出プログラム。
- 各種の帳票における論理要素と各論理要素の間の関係とを示した論理構造を記憶する共通論理構造記憶手段と、
前記各種の帳票各々の論理構造を示す登録帳票データを記憶する登録帳票データ記憶手段と、
前記共通論理構造記憶手段に記憶される、各種の帳票における論理要素と各論理要素の間の関係とを示した論理構造に基づいて、入力帳票の論理構造を示す入力帳票データを抽出する入力帳票データ抽出手段と、
前記登録帳票データ記憶手段から、前記入力帳票データ抽出手段により抽出された入力帳票データに基づいて、前記入力帳票データに類似する登録帳票データを特定する帳票特定手段と、
前記帳票特定手段により特定された登録帳票データと前記入力帳票データとを用いて、前記入力帳票データの論理要素のうち前記登録帳票データに含まれる論理要素と同じ位置関係に位置する論理要素を特定する特定手段と、
前記特定手段により特定された入力帳票データにおける各論理要素の位置情報と、当該論理要素と同じ位置関係に位置する前記登録帳票データにおける論理要素の位置情報との差分を抽出し、前記登録帳票データに含まれる論理要素の位置情報に前記差分を加算した位置情報を用いて、前記特定手段によって特定された論理要素以外の論理要素を前記入力帳票から再抽出する再抽出手段と、
前記特定手段により特定された論理要素と、前記再抽出手段により再抽出された論理要素とを組み合わせた新たな登録帳票データを生成するデータ生成手段と、
を備えたことを特徴とする帳票データ抽出装置。 - コンピュータが、
共通論理構造記憶部に記憶される、各種の帳票における論理要素と各論理要素の間の関係とを示した論理構造に基づいて、入力帳票の論理構造を示す入力帳票データを抽出する入力帳票データ抽出工程と、
前記各種の帳票各々の論理構造を示す登録帳票データを記憶する登録帳票データ記憶部から、前記入力帳票データ抽出工程により抽出された入力帳票データに基づいて、前記入力帳票データに類似する登録帳票データを特定する帳票特定工程と、
前記帳票特定工程により特定された登録帳票データと前記入力帳票データとを用いて、前記入力帳票データの論理要素のうち前記登録帳票データに含まれる論理要素と同じ位置関係に位置する論理要素を特定する特定工程と、
前記特定工程により特定された入力帳票データにおける各論理要素の位置情報と、当該論理要素と同じ位置関係に位置する前記登録帳票データにおける論理要素の位置情報との差分を抽出し、前記登録帳票データに含まれる論理要素の位置情報に前記差分を加算した位置情報を用いて、前記特定工程によって特定された論理要素以外の論理要素を前記入力帳票から再抽出する再抽出工程と、
前記特定工程により特定された論理要素と、前記再抽出工程により再抽出された論理要素とを組み合わせた新たな登録帳票データを生成するデータ生成工程と、
を含んだことを特徴とする帳票データ抽出方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007292619A JP4998220B2 (ja) | 2007-11-09 | 2007-11-09 | 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法 |
US12/267,253 US8418050B2 (en) | 2007-11-09 | 2008-11-07 | Computer readable recording medium on which form data extracting program is recorded, form data extracting apparatus, and form data extracting method |
CN2008101741087A CN101430761B (zh) | 2007-11-09 | 2008-11-07 | 表格数据提取装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007292619A JP4998220B2 (ja) | 2007-11-09 | 2007-11-09 | 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009122723A JP2009122723A (ja) | 2009-06-04 |
JP4998220B2 true JP4998220B2 (ja) | 2012-08-15 |
Family
ID=40624894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007292619A Expired - Fee Related JP4998220B2 (ja) | 2007-11-09 | 2007-11-09 | 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8418050B2 (ja) |
JP (1) | JP4998220B2 (ja) |
CN (1) | CN101430761B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5428967B2 (ja) * | 2010-03-15 | 2014-02-26 | 富士ゼロックス株式会社 | 文書処理システム及び文書処理プログラム |
CN102375978A (zh) * | 2010-08-17 | 2012-03-14 | 富士通株式会社 | 处理图像的方法和设备 |
US8977971B2 (en) * | 2010-12-24 | 2015-03-10 | General Electric Company | Metadata generation systems and methods |
JP6222541B2 (ja) * | 2013-03-05 | 2017-11-01 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
CN104346616B (zh) * | 2013-08-09 | 2017-12-12 | 北大方正集团有限公司 | 字符识别装置和字符识别方法 |
JP6194781B2 (ja) * | 2013-12-11 | 2017-09-13 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP6965657B2 (ja) * | 2017-09-22 | 2021-11-10 | カシオ計算機株式会社 | 帳票管理装置及びプログラム |
CN108710602A (zh) * | 2018-05-15 | 2018-10-26 | 深圳市继尧信息技术有限公司 | 成绩数据的处理方法、装置、计算机设备及存储介质 |
JP7131488B2 (ja) * | 2018-07-20 | 2022-09-06 | 株式会社リコー | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2021028770A (ja) * | 2019-08-09 | 2021-02-25 | 株式会社日立製作所 | 情報処理装置及び表認識方法 |
JP2021043775A (ja) * | 2019-09-12 | 2021-03-18 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434962A (en) * | 1990-09-07 | 1995-07-18 | Fuji Xerox Co., Ltd. | Method and system for automatically generating logical structures of electronic documents |
JP3602596B2 (ja) * | 1995-02-22 | 2004-12-15 | 株式会社東芝 | ドキュメントファイリング装置および方法 |
WO1997005561A1 (fr) * | 1995-07-31 | 1997-02-13 | Fujitsu Limited | Processeur de supports et procede de traitement de supports |
JPH11328306A (ja) * | 1998-03-09 | 1999-11-30 | Ricoh Co Ltd | 文書画像の論理要素抽出方法、装置および記録媒体 |
JP4141556B2 (ja) * | 1998-12-18 | 2008-08-27 | 株式会社日立製作所 | 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体 |
JP3851742B2 (ja) | 1999-03-31 | 2006-11-29 | 株式会社東芝 | 帳票処理方法及び装置 |
JP3860389B2 (ja) * | 2000-04-21 | 2006-12-20 | 日立オムロンターミナルソリューションズ株式会社 | 帳票イメージ処理装置 |
JP3886720B2 (ja) * | 2000-11-15 | 2007-02-28 | グローリー株式会社 | 辞書作成装置、辞書作成方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
EP1603072A1 (de) * | 2004-06-02 | 2005-12-07 | CCS Content Conversion Specialists GmbH | Verfahren und Einrichtung zur Strukturanalyse eines Dokuments |
JP2006004005A (ja) * | 2004-06-15 | 2006-01-05 | Fuji Xerox Co Ltd | 文書処理装置、文書処理方法及びプログラム |
US7725814B2 (en) * | 2005-08-04 | 2010-05-25 | Microsoft Corporation | Form merging |
US7840891B1 (en) * | 2006-10-25 | 2010-11-23 | Intuit Inc. | Method and system for content extraction from forms |
CN101276412A (zh) * | 2007-03-30 | 2008-10-01 | 夏普株式会社 | 信息处理装置、信息处理系统和信息处理方法 |
US8260049B2 (en) * | 2007-09-28 | 2012-09-04 | Abbyy Software Ltd. | Model-based method of document logical structure recognition in OCR systems |
US8411956B2 (en) * | 2008-09-29 | 2013-04-02 | Microsoft Corporation | Associating optical character recognition text data with source images |
-
2007
- 2007-11-09 JP JP2007292619A patent/JP4998220B2/ja not_active Expired - Fee Related
-
2008
- 2008-11-07 US US12/267,253 patent/US8418050B2/en not_active Expired - Fee Related
- 2008-11-07 CN CN2008101741087A patent/CN101430761B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8418050B2 (en) | 2013-04-09 |
US20090125797A1 (en) | 2009-05-14 |
CN101430761B (zh) | 2012-10-10 |
JP2009122723A (ja) | 2009-06-04 |
CN101430761A (zh) | 2009-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4998220B2 (ja) | 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法 | |
JP6938228B2 (ja) | 計算機、文書識別方法、及びシステム | |
JP4998219B2 (ja) | 帳票認識プログラム、帳票認識装置および帳票認識方法 | |
US6721451B1 (en) | Apparatus and method for reading a document image | |
KR101083557B1 (ko) | 장표 인식 장치, 방법, 데이터베이스 작성 장치, 방법, 및 기록 매체 | |
JP5271667B2 (ja) | メタデータ抽出装置およびその方法 | |
US20090226090A1 (en) | Information processing system, information processing apparatus, information processing method, and storage medium | |
JP6938408B2 (ja) | 計算機及びテンプレート管理方法 | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP4473893B2 (ja) | 作業項目抽出装置、作業項目抽出方法、および、作業項目抽出プログラム | |
WO2005073886A1 (ja) | 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置 | |
CN106164932A (zh) | 用于识别音乐符号的方法和装置 | |
JPH11282955A (ja) | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2005085077A (ja) | Cadデータ変換装置、cadデータ変換方法、及びcadデータ変換プログラム | |
JP4521466B2 (ja) | 帳票処理装置 | |
JP7312646B2 (ja) | 情報処理装置、文書識別方法、及び情報処理システム | |
JP4213558B2 (ja) | 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 | |
JP7015706B2 (ja) | 計算機及び文書データの処理方法 | |
JP4521377B2 (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP4614568B2 (ja) | コード検索処理システム | |
JP4405604B2 (ja) | 情報処理装置及び定義方法 | |
JP7377565B2 (ja) | 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム | |
WO2016046988A1 (ja) | 文書処理装置および項目抽出方法 | |
KR20220142901A (ko) | 반정형 문서로부터 정보를 추출하는 방법 및 시스템 | |
CN115759020A (zh) | 表格信息提取方法、表格模板配置方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120417 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120430 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150525 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |