JP4750802B2 - 帳票処理プログラムおよび帳票処理装置 - Google Patents
帳票処理プログラムおよび帳票処理装置 Download PDFInfo
- Publication number
- JP4750802B2 JP4750802B2 JP2007553802A JP2007553802A JP4750802B2 JP 4750802 B2 JP4750802 B2 JP 4750802B2 JP 2007553802 A JP2007553802 A JP 2007553802A JP 2007553802 A JP2007553802 A JP 2007553802A JP 4750802 B2 JP4750802 B2 JP 4750802B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- item
- data
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 107
- 238000000034 method Methods 0.000 claims description 79
- 238000000605 extraction Methods 0.000 claims description 70
- 230000014509 gene expression Effects 0.000 claims description 52
- 239000000284 extract Substances 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 22
- 238000011156 evaluation Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 238000013075 data extraction Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
定型帳票入力は、入力される帳票の種類が既知の場合の入力方法で、入力される帳票のキーワード位置などが記されたレイアウト定義体が予め作成される。そして、スキャンされた帳票画像に対してフォーム識別を行い、フォームに対応するレイアウト定義体に基づきキーワードを自動抽出する。しかしながら、定型帳票入力は、帳票の種類が既知でない場合には対応できないという問題点がある。したがって、対象とする帳票それぞれについてレイアウト定義体を予め人手で作成しておかなければならないが、それには非常にコストがかかる。
そこで、帳票のイメージを認識し、予め設定されたキーワードに基づき、読み取り領域を検索して抽出するとともに、その領域内の認識データを取得する帳票処理装置が提案されている(たとえば、特許文献1参照)。
図20は、項目とデータの対応付けが難しいケースを示した図である。(A)は、1つのデータに2つの項目が対応する可能性がある場合、(B)は、1つの項目に2つのデータが対応する可能性がある場合を示している。
また、上記課題を解決するために、スキャンされた帳票画像から所定のキーワードを抽出する帳票処理のための帳票処理プログラムにおいて、コンピュータを、前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段、抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段、項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段、前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段、として機能させ、前記帳票論理定義体には、前記キーワードを構成する前記データに対応し、データ文字種とデータ正規表現を含むデータ領域属性が定義されており、前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、前記データ文字列候補抽出手段は、前記文字認識結果に前記データ正規表現における各要素が検出された場合は、該当する前記データ正規表現の要素に投票し、投票された要素間において前記データ正規表現としての関係を満たす組み合わせを前記データ文字列候補として抽出し、前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、ことを特徴とする帳票処理プログラムが提供される。
また、上記課題を解決するために、スキャンされた帳票画像から所定のキーワードを抽出する帳票処理装置において、前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段と、抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段と、項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段と、前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段と、を有し、前記帳票論理定義体には、前記キーワードを構成する前記データに対応し、データ文字種とデータ正規表現を含むデータ領域属性が定義されており、前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、前記データ文字列候補抽出手段は、前記文字認識結果に前記データ正規表現における各要素が検出された場合は、該当する前記データ正規表現の要素に投票し、投票された要素間において前記データ正規表現としての関係を満たす組み合わせを前記データ文字列候補として抽出し、前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、ことを特徴とする帳票処理装置が提供される。
図1は、実施の形態に適用される発明の概念図である。
文字認識手段13は、抽出された読み取り領域の文字画像について、認識辞書データベース12を参照して文字認識を行い、認識された文字を文字認識結果として文字列候補抽出手段15へ出力する。文字認識処理は、通常は全字種を認識対象として行うが、帳票論理定義体データベース14の帳票論理定義体に定義される文字列および文字種に認識対象を限定して文字認識を行うこともできる。文字種が限定されれば、文字認識の確度を上げることができる。
帳票論理定義体データベース14には、予め、対象の帳票の論理構造を定義した帳票論理定義体を格納しておく。
このように、本発明にかかる帳票処理装置1では、キーワードを定義した帳票論理定義体に基づき、文字認識された各文字が帳票論理定義体に定義される文字列としての関係を満たす組み合わせの文字集合のうち、最もマッチング度の高いものを選択する。このため、文字認識結果が一部誤っていても、他の正しい文字認識結果によってマッチングがとれるので、正しいマッチングが可能となる。また、同様にして、レイアウト認識が誤り、文字認識結果が正しい並びをしていなくても、正しいマッチングが可能となる。そして、項目文字列とデータ文字列の組み合わせが複数考えられるときでも、全体として最も整合性のある組み合わせを取り出せるので、正しい結果が得られることになる。
図2は、本実施の形態の帳票処理装置のハードウェア構成例を示した図である。
帳票処理装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、通信インタフェース106が接続されている。
次に、帳票処理装置100の処理機能を実現するソフトウェア構成について説明する。図3は、本実施の形態の帳票処理装置のソフトウェア構成例を示した図である。
認識辞書データベース120には、文字認識に用いる辞書情報が格納される。
論理定義体データベース150には、同種の帳票に共通する論理構造を定義するよう帳票論理定義体(以下、論理定義体とする)が格納される。たとえば、見積書であれば、「日付情報」、「依頼番号」などが含まれるというように、同じ種類の帳票であれば、レイアウトは異なっていても含まれる情報項目など、共通する箇所が多くある。これらをまとめたものが論理構造である。帳票の論理構造は、意味、項目、データからなる組と、それらの間に成り立つ関係からなる。意味は、帳票における表現機能を表す。項目は、その意味に対応する表現機能が実際に帳票で表現される文字列を表す。データは、意味に対応する表現機能において、実際の値を表す。それらの間に成り立つ関係は、組同士の関係を表し、対応関係や、数式が成立する関係などがある。詳細は後述するが、論理定義体データベース150には、項目については項目文字列が定義され、データについてはデータ領域属性が定義されている。
まず、論理定義体データベース150に格納される論理定義体について説明する。図4は、本実施の形態の論理定義体の一例を示した図である。
キーワードは、意味に応じてカテゴリ201に分類される。図の例では、日付210と帳票番号220が定義されている。
帳票画像300は、「御見積書」の一部であり、レイアウト認識部110は、帳票画像300を入力し、レイアウト認識処理を行って読み取り領域を抽出する。文字認識部130は、全字種を認識対象として読み取り領域の文字認識を行う。帳票画像300の場合、「御見積書」301、「2005年9月25日」302、「B株式会社御中」303、「貴社受付番号」304、「20050925−0101」305、「A株式会社」306、「電話番号」307、「044−123−4445」308が文字認識結果として出力される。
項目抽出処理では、論理定義体に定義される項目文字列に基づき、文字認識結果から項目を表す項目文字列を抽出する。
項目文字列「貴社受付番号」310については、「貴」にa、「社」にbとgとj、「受」にc、「付」にd、「番」にeとh、「号」にfとiが投票される。同様に、項目文字列「注文番号」320については、「番」にeとh、「号」にfとiが投票され、「受付No.」330については、「受」にc、「付」にdが投票される。
|yA−yB| ≦ m/2 ・・・(1)
を満たすときとする。平均文字サイズは、全文字について、その外接矩形の長辺の平均とする。
|yA−yB| ≦ m ・・・(2)
として整合性を判定する。このように、整合性の基準は、帳票に応じて適宜設定する。
図8は、本実施の形態において生成されるグラフの一例を示した図である。各ノード、a、b、c、d、e、f、g、h、i、jは、図6で文字に付与されたアルファベットを示す。
たとえば、図の例では、abcdef、ag、ei、hi、jがクリークとして抽出される。
さらに、項目文字列候補決定164は、項目文字列ごとに決定された最大クリークのマッチング率を比較し、最も高いマッチング率のクリークを項目文字列候補として決定する。複数のクリークが同じマッチング率を有する場合には、それらをすべて出力する。マッチング率は、たとえば、文字集合に含まれるノードの数や、文字列がマッチングしている箇所の割合などによって算出する。
なお、抽出されたクリークについて、ノードの個数、文字配置、ノイズによる検証をした後、残ったクリークに対し、字種を限定した再認識によって評価を行うこともできる。具体的には、この項目文字列を構成する文字集合に認識対象を限定して文字認識を行う。文字認識結果のうち、認識信頼度がある閾値を上回った場合のみを残し、それ以外を捨てる。そして、残った文字認識結果に対し、投票、グラフ生成、クリーク抽出を行い、最大クリークの個数を求め、この個数をクリークの評価値とする。そして、評価値が最大のものを出力する。複数のクリークにおいて同じ評価値を有する場合は、それらをすべて出力する。
2つのクリークに対応する2つの文字列、「御見積」501と「番号」502について、上下には重ならない、かつ、左右には重なる場合であって、一方の先頭部の文字が、他方の最後尾の文字よりも後ろにあり、順序が後ろの文字列は、前の文字列よりの画像上で下にあるという条件を満たすときに、整合性があると判定される。
ここで、項目抽出処理の手順について、フローチャートを用いて説明する。図12は、本実施の形態における項目抽出処理の手順を示したフローチャートである。
[ステップS11] 論理定義体に定義される全カテゴリの処理を繰り返すため、処理中のi番目のカテゴリ(Ciとする)を指示するiを初期化(i=0)する。
[ステップS13] カテゴリCiの項目文字列Sjに対する項目文字列マッチング処理を行う。処理の詳細は後述するが、マッチング処理により、カテゴリCiの項目文字列Sjに対する最大クリークが決定される。
[ステップS15] jを論理定義体に定義される項目文字列の数と比較する。jが項目文字列の数に到達していなければ、ステップS13に戻って、次の項目文字列に対するマッチング処理を行う。到達していれば、全項目文字列終了とする。
[ステップS18] iを論理定義体に定義されるカテゴリの数と比較する。iがカテゴリの数に到達していなければ、ステップS12に戻って、次のカテゴリの処理を行う。全カテゴリの処理が終了していれば、処理を終了する。
項目文字列Sjが指定された後、処理が開始される。
[ステップS132] 投票結果に基づき、投票された文字をノードとしたグラフを生成する。まず、投票された文字の集合に対して、すべての2文字の組について文字列としての関係と、位置に関する整合性を調べ、整合性が成立する場合にノード間にパスを張ることによってグラフを生成する。
次に、項目文字列候補決定処理手順について説明する。図14は、本実施の形態における項目文字列候補決定処理の手順を示したフローチャートである。
[ステップS161] Piをi番目の項目文字列のマッチング度、Ptを最大のマッチング度、配列qを項目文字列候補の個数分の配列、nを項目文字列候補の個数として、各値を初期化する。すなわち、i=0、n=0、Pt=0とし、配列qを初期化する。
[ステップS163] iは項目文字列の個数となっていないので、i番目の項目文字列のマッチング度Piと、最大のマッチング度Ptとを比較する。PiがPt以上であるかどうかを調べ、Pt以上でない場合は、現在設定されているPtのマッチング度が最も高いとし、処理をステップS167へ進める。
以上の処理手順が実行されることにより、項目文字列候補の個数nと、項目文字列候補q[i](iは、0≦i<nを満たす)が得られる。
データ抽出処理では、論理定義体のデータ正規表現とデータ種別に基づき、文字認識結果からデータ正規表現によって記述されているデータを抽出する。
ここで、データ抽出処理の手順について、フローチャートを用いて説明する。図16は、本実施の形態におけるデータ抽出処理の手順を示したフローチャートである。
[ステップS21] 論理定義体に定義される全カテゴリの処理を繰り返すため、処理中のi番目のカテゴリ(Ciとする)を指示するiを初期化(i=0)する。
[ステップS23] カテゴリCiの正規表現Rjに対するデータ文字列マッチング処理を行う。処理の詳細は後述するが、マッチング処理により、カテゴリCiの正規表現Rjに対する最大クリークが決定される。
[ステップS25] jを論理定義体に定義される正規表現の個数と比較する。jが正規表現の個数に到達していなければ、ステップS23に戻って、次の正規表現に対するマッチング処理を行う。到達していれば、全正規表現終了とする。
[ステップS27] iを論理定義体に定義されるカテゴリの数と比較する。iがカテゴリの数に到達していなければ、ステップS22に戻って、次のカテゴリの処理を行う。全カテゴリの処理が終了していれば、処理を終了する。
正規表現Rjが指定された後、処理が開始される。
[ステップS233] 投票された各文字と*部分をノードとして、ノード間に整合性が成立すれば、ノード間をパスで接続することによって、グラフを生成する。
(3)項目・データ対応付け処理
項目・データ対応付け処理では、論理定義体に定義される項目から見たデータの相対的位置などに基づき、項目抽出部160によって抽出された項目と、データ抽出部170によって抽出されたデータについて、対応関係のある可能性を数え上げ、全体の整合性を考慮することにより対応関係を決定する。全体の整合性の評価は、項目抽出部160およびデータ抽出部170と同様に、グラフを生成し、クリークを抽出して行う。
[ステップS31] 論理定義体に定義される項目から見たデータの相対的位置に基づき、カテゴリが同じ項目文字列候補とデータ文字列候補を対応付け、項目文字列候補とデータ文字列候補の組み合わせを数え上げる。
[ステップS34] ステップS33で抽出されたクリークから最大クリークを抽出する。最大クリークの抽出では、クリークを構成するノードの個数が最大のものを出力する。
11 レイアウト認識手段
12 認識辞書データベース(DB)
13 文字認識手段
14 帳票論理定義体データベース(DB)
15 文字列候補抽出手段
15a 項目文字列候補抽出手段
15b データ文字列候補抽出手段
16 対応付け手段
Claims (9)
- スキャンされた帳票画像から所定のキーワードを抽出する帳票処理のための帳票処理プログラムにおいて、
コンピュータを、
前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段、
抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段、
項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段、
前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段、として機能させ、
前記帳票論理定義体には、前記キーワードを構成する前記項目に対応する項目文字列が定義されており、
前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、
前記項目文字列候補抽出手段は、前記文字認識結果に前記項目文字列の文字が検出された場合は、該当する前記項目文字列の文字に投票し、投票された文字間において前記項目文字列としての関係を満たす組み合わせを前記項目文字列候補として抽出し、
前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、
ことを特徴とする帳票処理プログラム。 - スキャンされた帳票画像から所定のキーワードを抽出する帳票処理のための帳票処理プログラムにおいて、
コンピュータを、
前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段、
抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段、
項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段、
前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段、として機能させ、
前記帳票論理定義体には、前記キーワードを構成する前記データに対応し、データ文字種とデータ正規表現を含むデータ領域属性が定義されており、
前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、
前記データ文字列候補抽出手段は、前記文字認識結果に前記データ正規表現における各要素が検出された場合は、該当する前記データ正規表現の要素に投票し、投票された要素間において前記データ正規表現としての関係を満たす組み合わせを前記データ文字列候補として抽出し、
前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、
ことを特徴とする帳票処理プログラム。 - 前記対応付け手段は、前記項目文字列候補と前記データ文字列候補が対応する可能性を数え上げ、前記項目文字列候補と前記データ文字列候補が対応する個数が全体で最大となるよう対応関係を決定する、
ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。 - 前記文字列候補抽出手段は、前記文字列候補を構成する文字の文字配置の妥当性を検証し、妥当性が検証されたものを前記文字列候補とする、
ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。 - 前記文字認識手段は、前記帳票論理定義体に基づき、前記帳票画像に出現する可能性のある文字種に認識対象を限定して文字認識を行う、
ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。 - 前記文字列候補抽出手段は、前記文字列候補が抽出された後、前記文字列候補に対応する前記キーワードについて前記帳票論理定義体に定義される前記文字列を構成する文字の集合に認識対象を限定して文字認識を行って前記文字認識結果を更新し、更新された前記文字認識結果を用いて、再び文字認識された文字が前記文字列としての関係を満たす文字列候補を抽出する、
ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。 - 前記文字列候補抽出手段は、任意の行に配置された前記キーワードを構成する文字列としての位置関係を満たす組み合わせを第1の文字列単位、前記第1の文字列単位とは異なる行に配置された第2の組み合わせを第2の文字列単位とし、前記第1の文字列単位と前記第2の文字列単位が前記帳票論理定義体に定義される文字列としての関係を満たす組み合わせを複数行にわたる前記文字列候補として抽出する、
ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。 - スキャンされた帳票画像から所定のキーワードを抽出する帳票処理装置において、
前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段と、
抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段と、
項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段と、
前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段と、を有し、
前記帳票論理定義体には、前記キーワードを構成する前記項目に対応する項目文字列が定義されており、
前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、
前記項目文字列候補抽出手段は、前記文字認識結果に前記項目文字列の文字が検出された場合は、該当する前記項目文字列の文字に投票し、投票された文字間において前記項目文字列としての関係を満たす組み合わせを前記項目文字列候補として抽出し、
前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、
ことを特徴とする帳票処理装置。 - スキャンされた帳票画像から所定のキーワードを抽出する帳票処理装置において、
前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段と、
抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段と、
項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段と、
前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段と、を有し、
前記帳票論理定義体には、前記キーワードを構成する前記データに対応し、データ文字種とデータ正規表現を含むデータ領域属性が定義されており、
前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、
前記データ文字列候補抽出手段は、前記文字認識結果に前記データ正規表現における各要素が検出された場合は、該当する前記データ正規表現の要素に投票し、投票された要素間において前記データ正規表現としての関係を満たす組み合わせを前記データ文字列候補として抽出し、
前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、
ことを特徴とする帳票処理装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2006/300325 WO2007080642A1 (ja) | 2006-01-13 | 2006-01-13 | 帳票処理プログラムおよび帳票処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007080642A1 JPWO2007080642A1 (ja) | 2009-06-11 |
JP4750802B2 true JP4750802B2 (ja) | 2011-08-17 |
Family
ID=38256057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007553802A Expired - Fee Related JP4750802B2 (ja) | 2006-01-13 | 2006-01-13 | 帳票処理プログラムおよび帳票処理装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8131087B2 (ja) |
JP (1) | JP4750802B2 (ja) |
CN (1) | CN101356541B (ja) |
WO (1) | WO2007080642A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714338A (zh) * | 2012-09-28 | 2014-04-09 | 欧姆龙株式会社 | 图像处理装置和图像处理方法 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8064703B2 (en) * | 2006-03-17 | 2011-11-22 | Data Trace Information Services, Llc | Property record document data validation systems and methods |
WO2008012845A1 (en) * | 2006-07-26 | 2008-01-31 | Stmicroelectronics S.R.L. | Use of nitroaniline derivatives for the production of nitric oxide |
JP5098504B2 (ja) * | 2007-08-09 | 2012-12-12 | 富士通株式会社 | 文字認識プログラム、文字認識装置および文字認識方法 |
JP4998237B2 (ja) * | 2007-12-06 | 2012-08-15 | 富士通株式会社 | 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法 |
JP5125573B2 (ja) | 2008-02-12 | 2013-01-23 | 富士通株式会社 | 領域抽出プログラム、文字認識プログラム、および文字認識装置 |
JP4825243B2 (ja) * | 2008-06-20 | 2011-11-30 | 富士通フロンテック株式会社 | 帳票認識装置、方法、データベース作成装置、方法、及びプログラム |
JP5462017B2 (ja) * | 2010-02-08 | 2014-04-02 | 沖電気工業株式会社 | 帳票処理システム、エントリ端末および帳票データ処理方法 |
CN102402693B (zh) * | 2010-09-09 | 2014-07-30 | 富士通株式会社 | 处理包含字符的图像的方法和设备 |
CN102509115B (zh) * | 2011-11-22 | 2014-06-25 | 北京京北方信息技术有限公司 | 一种分层带回溯查找机制的票据类型识别方法 |
JP6303531B2 (ja) * | 2014-01-22 | 2018-04-04 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
CN106650715B (zh) * | 2016-10-26 | 2019-07-12 | 西安电子科技大学 | 一种根据允许集对字符串ocr识别结果检错与纠错的方法 |
WO2020054067A1 (ja) * | 2018-09-14 | 2020-03-19 | 三菱電機株式会社 | 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム |
JP2020027598A (ja) * | 2018-12-27 | 2020-02-20 | 株式会社シグマクシス | 文字認識装置、文字認識方法及び文字認識プログラム |
JP2020123925A (ja) | 2019-01-31 | 2020-08-13 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7318248B2 (ja) * | 2019-03-20 | 2023-08-01 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
JP7370733B2 (ja) * | 2019-05-30 | 2023-10-30 | キヤノン株式会社 | 情報処理装置、制御方法、及びプログラム |
JP7282603B2 (ja) * | 2019-06-05 | 2023-05-29 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
JP7516024B2 (ja) * | 2019-09-06 | 2024-07-16 | キヤノン株式会社 | 情報処理装置、その制御方法及びプログラム |
US10832656B1 (en) * | 2020-02-25 | 2020-11-10 | Fawzi Shaya | Computing device and method for populating digital forms from un-parsed data |
CN111444906B (zh) * | 2020-03-24 | 2023-09-29 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像识别方法和相关装置 |
CN111832396B (zh) * | 2020-06-01 | 2023-07-25 | 北京百度网讯科技有限公司 | 文档布局的解析方法、装置、电子设备和存储介质 |
US11593417B2 (en) * | 2021-01-21 | 2023-02-28 | International Business Machines Corporation | Assigning documents to entities of a database |
JP7317886B2 (ja) * | 2021-04-12 | 2023-07-31 | 株式会社プリマジェスト | 情報処理装置及び情報処理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1078997A (ja) * | 1996-09-03 | 1998-03-24 | Matsushita Electric Ind Co Ltd | 文字認識装置及びその方法並びにその方法を記録した記録媒体 |
JP2001312691A (ja) * | 2000-05-01 | 2001-11-09 | Canon Inc | 画像処理方法および装置並びに記憶媒体 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0589279A (ja) * | 1991-09-30 | 1993-04-09 | Sharp Corp | 文字認識装置 |
JP3076731B2 (ja) * | 1994-12-26 | 2000-08-14 | 株式会社ピーエフユー | 帳票出力処理方法 |
JP3380136B2 (ja) * | 1997-04-22 | 2003-02-24 | 富士通株式会社 | 表画像のフォーマットを識別するフォーマット識別装置および方法 |
US6104500A (en) * | 1998-04-29 | 2000-08-15 | Bcl, Computer Inc. | Networked fax routing via email |
US6614931B1 (en) * | 1998-10-08 | 2003-09-02 | Hewlett-Packard Development Company, Lp. | Handwritten instructions for messaging appliances |
JP2000251012A (ja) * | 1999-03-01 | 2000-09-14 | Hitachi Ltd | 帳票処理方法およびシステム |
JP3425408B2 (ja) * | 2000-05-31 | 2003-07-14 | 株式会社東芝 | 文書読取装置 |
JP3919617B2 (ja) * | 2002-07-09 | 2007-05-30 | キヤノン株式会社 | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 |
-
2006
- 2006-01-13 WO PCT/JP2006/300325 patent/WO2007080642A1/ja active Application Filing
- 2006-01-13 JP JP2007553802A patent/JP4750802B2/ja not_active Expired - Fee Related
- 2006-01-13 CN CN2006800509316A patent/CN101356541B/zh not_active Expired - Fee Related
-
2008
- 2008-07-08 US US12/216,632 patent/US8131087B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1078997A (ja) * | 1996-09-03 | 1998-03-24 | Matsushita Electric Ind Co Ltd | 文字認識装置及びその方法並びにその方法を記録した記録媒体 |
JP2001312691A (ja) * | 2000-05-01 | 2001-11-09 | Canon Inc | 画像処理方法および装置並びに記憶媒体 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714338A (zh) * | 2012-09-28 | 2014-04-09 | 欧姆龙株式会社 | 图像处理装置和图像处理方法 |
CN103714338B (zh) * | 2012-09-28 | 2017-03-01 | 欧姆龙株式会社 | 图像处理装置和图像处理方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2007080642A1 (ja) | 2009-06-11 |
US20080273802A1 (en) | 2008-11-06 |
CN101356541B (zh) | 2012-05-30 |
US8131087B2 (en) | 2012-03-06 |
WO2007080642A1 (ja) | 2007-07-19 |
CN101356541A (zh) | 2009-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4750802B2 (ja) | 帳票処理プログラムおよび帳票処理装置 | |
US11501061B2 (en) | Extracting structured information from a document containing filled form images | |
US20200081899A1 (en) | Automated database schema matching | |
JP2006244309A (ja) | 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 | |
US20230237395A1 (en) | Apparatus and methods for matching video records with postings using audiovisual data processing | |
US20240296691A1 (en) | Image reading systems, methods and storage medium for performing geometric extraction | |
Crawford et al. | A clustering method for graphical handwriting components and statistical writership analysis | |
US20230289396A1 (en) | Apparatuses and methods for linking posting data | |
WO2023177723A1 (en) | Apparatuses and methods for querying and transcribing video resumes | |
US11574629B1 (en) | Systems and methods for parsing and correlating solicitation video content | |
JP5812534B2 (ja) | 質問応答装置、方法、及びプログラム | |
JPH11328317A (ja) | 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体 | |
KR20110039900A (ko) | 지능형 인식 라이브러리 및 관리 도구를 활용한 고문서 이미지 데이터 인식 및 처리 방법 | |
US20160162732A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN117195319A (zh) | 保函文件电子件的验真方法、装置、电子设备和介质 | |
US20240028952A1 (en) | Apparatus for attribute path generation | |
US20230297963A1 (en) | Apparatus and method of opportunity classification | |
Lund | Ensemble Methods for Historical Machine-Printed Document Recognition | |
US12125318B1 (en) | Apparatus and a method for detecting fraudulent signature inputs | |
CN118522017B (zh) | 文本提取方法、装置及电子设备 | |
US20230419367A1 (en) | Apparatus and method for communicating with users | |
US12100393B1 (en) | Apparatus and method of generating directed graph using raw data | |
US12045649B1 (en) | Apparatus and method for task allocation | |
US20240330583A1 (en) | Apparatus and method for generating an article | |
US20240346068A1 (en) | Drawing search device, drawing database construction device, drawing search system, drawing search method, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110407 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110517 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110519 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4750802 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140527 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |