JP4750802B2 - 帳票処理プログラムおよび帳票処理装置 - Google Patents

帳票処理プログラムおよび帳票処理装置 Download PDF

Info

Publication number
JP4750802B2
JP4750802B2 JP2007553802A JP2007553802A JP4750802B2 JP 4750802 B2 JP4750802 B2 JP 4750802B2 JP 2007553802 A JP2007553802 A JP 2007553802A JP 2007553802 A JP2007553802 A JP 2007553802A JP 4750802 B2 JP4750802 B2 JP 4750802B2
Authority
JP
Japan
Prior art keywords
character string
character
item
data
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007553802A
Other languages
English (en)
Other versions
JPWO2007080642A1 (ja
Inventor
浩明 武部
克仁 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2007080642A1 publication Critical patent/JPWO2007080642A1/ja
Application granted granted Critical
Publication of JP4750802B2 publication Critical patent/JP4750802B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は帳票処理プログラムおよび帳票処理装置に関し、特にスキャンされた帳票画像から所定のキーワードを抽出する帳票処理のための帳票処理プログラムおよび帳票処理装置に関する。
従来、紙文書を電子化する帳票入力業務には、定型帳票入力と非定型帳票入力の2つのパターンがあった。
定型帳票入力は、入力される帳票の種類が既知の場合の入力方法で、入力される帳票のキーワード位置などが記されたレイアウト定義体が予め作成される。そして、スキャンされた帳票画像に対してフォーム識別を行い、フォームに対応するレイアウト定義体に基づきキーワードを自動抽出する。しかしながら、定型帳票入力は、帳票の種類が既知でない場合には対応できないという問題点がある。したがって、対象とする帳票それぞれについてレイアウト定義体を予め人手で作成しておかなければならないが、それには非常にコストがかかる。
一方、非定型帳票入力は、入力される帳票の種類が既知でない場合の入力方法で、レイアウト定義体を作成しておくことができない。このため、人手によって入力作業を行わなければならず、入力コストが膨大となっていた。
このように、定型帳票入力および非定型帳票入力ともに問題点があり、帳票入力業務を効率化するため、非定型の帳票からキーワードを自動抽出する手法が求められていた。
そこで、帳票のイメージを認識し、予め設定されたキーワードに基づき、読み取り領域を検索して抽出するとともに、その領域内の認識データを取得する帳票処理装置が提案されている(たとえば、特許文献1参照)。
また、キーワード抽出の確度を上げるため、文書画像から罫線などの形状に応じた仮のセル領域を抽出してセル内の画像を文字認識し、認識結果から指定キーワードに対応する文字列を検索し、検索された文字列からセル領域を特定する画像処理方法も提案されている(たとえば、特許文献2参照)。
特開平11−238165号公報(段落番号〔0009〕〜〔0012〕、図3) 特開2001−312691号公報(段落番号〔0013〕〜〔0018〕、図2)
従来、非定型の帳票からキーワードを自動抽出する場合には、帳票画像に対して、レイアウト認識を行って読み取り領域を決め、決められた読み取り領域の文字認識を行い、認識された文字列からキーワードに相当するものを単語マッチングで検索していた。ところが、レイアウト定義のない非定型の帳票画像に対してレイアウト認識と文字認識を正しく行うことは容易ではなく、失敗する可能性が常にある。しかしながら、従来の帳票処理は、レイアウト認識および文字認識が行われて抽出された文字列でマッチングを行うため、認識が正しくないとキーワードを抽出することができなくなるという問題点がある。
一例を挙げて説明する。図19は、レイアウト認識失敗でキーワードを正しく抽出できないケースを示した図である。(A)は、帳票イメージであり、(B)は、(A)の帳票イメージについてレイアウト認識されたテキストブロックを示した図である。
図の例では、帳票の汚れなどによって、スキャナで読み取った帳票イメージ901にノイズ902が発生している。この帳票イメージ901についてレイアウト認識を行うと、「御見積(金額)」と「御見積(品名)」との間にノイズ902があるため、これらを1つのブロックと認識してしまい、ノイズを含めたテキストブロック903が誤って抽出される。これにより、「御見積」と「金額」および「御見積」と「品名」が分離されてしまう。続いて、このテキストブロックに対して文字認識を行うと、たとえば、テキストブロック903は「御見積・・・と御見積」、テキストブロック904は「金額」、テキストブロック905は「品名」、テキストブロック906は「¥120,000」およびテキストブロック907は「パソコン」と文字認識が行われる。したがって、マッチング検索を行うキーワードに「御見積金額」や「御見積品名」があっても、文字認識結果からは検出されないため、キーワードが抽出されないことになる。
このように、レイアウト認識に失敗すれば、文字を正しく認識しても文字の並びが正しくなくなるので、キーワードを抽出することができなくなるという問題がある。また、レイアウト認識が正しくても、文字認識が失敗すれば同様の問題が発生する。
さらに、キーワードには、項目とデータの2種類の要素があるが、従来の帳票処理では、項目とデータの正しい対応付けを行うことができない場合があるという問題点がある。
図20は、項目とデータの対応付けが難しいケースを示した図である。(A)は、1つのデータに2つの項目が対応する可能性がある場合、(B)は、1つの項目に2つのデータが対応する可能性がある場合を示している。
(A)の場合、帳票イメージ910に対するレイアウト認識処理および文字認識処理が行われ、項目「金額」911および「合計」915と、データ「¥40,000」912、「¥42,000」913および「¥82,000」914を得る。それぞれのテキストブロックの位置関係に基づき、垂直方向または水平方向の座標値がほぼ等しい項目とデータ、すなわち、垂直方向または水平方向に並んでいると見なせる項目とデータを対応付けする。図の例では、「¥40,000」912と「¥42,000」913は、垂直方向に並んで配置されている「金額」911と対応付けることができる。ところが、「¥82,000」914については、垂直方向に並ぶ「金額」911と、水平方向に並ぶ「合計」915のどちらにも対応付けることができる。どちらが正しいかは、位置関係からは判定できない。
一方、(B)の場合、帳票イメージ920に対するレイアウト認識処理と文字認識処理により、項目「発行日」921および「見積有効期限」923と、データ「2005年12月02日」922および「2005年12月16日」924が得られる。それぞれのテキストブロックの位置関係に基づき、「見積有効期限」923と「2005年12月16日」924を対応付けることができる。ところが、「発行日」921には、水平方向に並ぶ「2005年12月02日」922と、垂直方向に並ぶ「2005年12月16日」924のどちらも対応付けることができる。どちらが正しいかは、位置関係からは判定できない。なお、「2005年12月16日」924について見れば、「発行日」921および「見積有効期限」923の両方と組になる可能性がある。
このように、抽出されたキーワードの項目とデータを正しく対応付けすることが難しい場合があるが、従来方式では、どれが正しい対応なのかを選択する方法が開示されていない。
本発明はこのような点に鑑みてなされたものであり、認識結果の欠損やノイズがあってもキーワード抽出を安定的に行うことが可能な帳票処理プログラムを提供することを目的とする。また、本発明の他の目的は、キーワードの項目とデータの対応関係を全体の整合性を考慮して決定することが可能な帳票処理装置にある。
上記課題を解決するために、スキャンされた帳票画像から所定のキーワードを抽出する帳票処理のための帳票処理プログラムにおいて、コンピュータを、前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段、抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段、項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段、前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段、として機能させ、前記帳票論理定義体には、前記キーワードを構成する前記項目に対応する項目文字列が定義されており、前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、前記項目文字列候補抽出手段は、前記文字認識結果に前記項目文字列の文字が検出された場合は、該当する前記項目文字列の文字に投票し、投票された文字間において前記項目文字列としての関係を満たす組み合わせを前記項目文字列候補として抽出し、前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、ことを特徴とする帳票処理プログラムが提供される。
また、上記課題を解決するために、スキャンされた帳票画像から所定のキーワードを抽出する帳票処理のための帳票処理プログラムにおいて、コンピュータを、前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段、抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段、項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段、前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段、として機能させ、前記帳票論理定義体には、前記キーワードを構成する前記データに対応し、データ文字種とデータ正規表現を含むデータ領域属性が定義されており、前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、前記データ文字列候補抽出手段は、前記文字認識結果に前記データ正規表現における各要素が検出された場合は、該当する前記データ正規表現の要素に投票し、投票された要素間において前記データ正規表現としての関係を満たす組み合わせを前記データ文字列候補として抽出し、前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、ことを特徴とする帳票処理プログラムが提供される。
また、上記課題を解決するために、スキャンされた帳票画像から所定のキーワードを抽出する帳票処理装置において、前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段と、抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段と、項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段と、前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段と、を有し、前記帳票論理定義体には、前記キーワードを構成する前記項目に対応する項目文字列が定義されており、前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、前記項目文字列候補抽出手段は、前記文字認識結果に前記項目文字列の文字が検出された場合は、該当する前記項目文字列の文字に投票し、投票された文字間において前記項目文字列としての関係を満たす組み合わせを前記項目文字列候補として抽出し、前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、ことを特徴とする帳票処理装置が提供される。
また、上記課題を解決するために、スキャンされた帳票画像から所定のキーワードを抽出する帳票処理装置において、前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段と、抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段と、項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段と、前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段と、を有し、前記帳票論理定義体には、前記キーワードを構成する前記データに対応し、データ文字種とデータ正規表現を含むデータ領域属性が定義されており、前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、前記データ文字列候補抽出手段は、前記文字認識結果に前記データ正規表現における各要素が検出された場合は、該当する前記データ正規表現の要素に投票し、投票された要素間において前記データ正規表現としての関係を満たす組み合わせを前記データ文字列候補として抽出し、前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、ことを特徴とする帳票処理装置が提供される。
本発明の帳票処理は、帳票のレイアウトに対応するレイアウト定義体ではなく、帳票の有する論理構造を定義した帳票論理定義体に基づきキーワードを自動抽出することにより、同じ論理構造を備えた帳票であればレイアウトが異なっていてもキーワードを自動抽出することができる。また、キーワードを抽出する場合には、キーワードとして定義された文字列に含まれる文字を文字認識結果から抽出し、各文字間の関係が帳票論理定義体に定義された文字列としての関係を満たす組み合わせを文字列候補として抽出し、キーワードを構成する文字列候補同士を対応付ける。このため、キーワードとして定義される文字列と完全に一致しなくても、文字列としての関係を満たすと見なされれば、キーワードとして抽出される。この結果、レイアウト認識の失敗や文字認識の失敗に影響を受けることなく、安定的なキーワード抽出が可能となる。
本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。
実施の形態に適用される発明の概念図である。 本実施の形態の帳票処理装置のハードウェア構成例を示した図である。 本実施の形態の帳票処理装置のソフトウェア構成例を示した図である。 本実施の形態の論理定義体の一例を示した図である。 本実施の形態の帳票処理装置に入力される帳票画像の一例である。 本実施の形態における文字認識結果からの文字抽出を示した図である。 本実施の形態における項目文字列マッチングの投票結果を示した図である。 本実施の形態において生成されるグラフの一例を示した図である。 本実施の形態の帳票処理装置における整合性グラフテーブルの一例を示した図である。 本実施の形態における文字配置の妥当性検証の一例を示した図である。 複数行にわたる項目文字列の一例を示した図である。 本実施の形態における項目抽出処理の手順を示したフローチャートである。 本実施の形態における項目文字列マッチング処理の手順を示したフローチャートである。 本実施の形態における項目文字列候補決定処理の手順を示したフローチャートである。 本実施の形態における*部抽出の一例を示した図である。 本実施の形態におけるデータ抽出処理の手順を示したフローチャートである。 本実施の形態におけるデータ文字列マッチング処理の手順を示したフローチャートである。 本実施の形態における項目・データ対応付け処理の手順を示したフローチャートである。 レイアウト認識失敗でキーワードを正しく抽出できないケースを示した図である。 項目とデータの対応付けが難しいケースを示した図である。
以下、本発明の実施の形態を図面を参照して説明する。まず、実施の形態に適用される発明の概念について説明し、その後、実施の形態の具体的な内容を説明する。
図1は、実施の形態に適用される発明の概念図である。
本発明にかかる帳票処理装置1は、読み取り領域を抽出するレイアウト認識手段11、読み取り領域の文字認識を行う文字認識手段13、文字列候補を抽出する文字列候補抽出手段15、および文字列候補の対応付けを行う対応付け手段16の処理手段と、認識辞書データベース12および帳票論理定義体データベース14の記憶手段を有する。なお、帳票処理装置1の各処理手段は、コンピュータが帳票処理プログラムを実行することによって、その処理機能が実現される。
レイアウト認識手段11は、入力された帳票画像のレイアウトを認識し、文字画像を含む読み取り領域を抽出し、文字認識手段13に通知する。レイアウト認識手法は、様々な手法が知られており、ここでは、そのうちの任意の手法を用いるとする。
認識辞書データベース12は、文字画像の文字認識に用いる認識辞書が格納される。
文字認識手段13は、抽出された読み取り領域の文字画像について、認識辞書データベース12を参照して文字認識を行い、認識された文字を文字認識結果として文字列候補抽出手段15へ出力する。文字認識処理は、通常は全字種を認識対象として行うが、帳票論理定義体データベース14の帳票論理定義体に定義される文字列および文字種に認識対象を限定して文字認識を行うこともできる。文字種が限定されれば、文字認識の確度を上げることができる。
帳票論理定義体データベース14には、キーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体が格納される。帳票の論理構造は、意味、項目およびデータと、それらの間に成り立つ関係からなる。帳票論理構造定義体には、キーワードを構成する2種類の要素である項目とデータに関する定義がカテゴリごとに設定されている。項目は、キーワードの意味に対応する表現で、帳票に記述される項目文字列が定義される。データは、キーワードの意味に対応する実際の値であり、帳票に記述される際の正規表現と文字種などを含むデータ領域属性が定義される。
文字列候補抽出手段15は、帳票論理定義体データベース14に格納される帳票論理定義体に基づき、文字認識された文字が帳票論理定義体に定義される文字列としての関係を満たす組み合わせを文字列候補として抽出する。具体的には、項目文字列候補抽出手段15aは、帳票論理定義体に定義される項目文字列をキーとして、文字認識結果から定義された文字列に含まれる文字を抽出する。そして、項目文字列を構成する各文字に投票し、投票された文字間の位置関係の整合性を評価し、互いに文字列としての位置関係を満たす組み合わせを求める。整合性の評価には、グラフ理論を用いて、たとえば、投票された文字をノードとし、すべての2つのノードに対し、対応する文字について位置に関する整合性を判定し、整合性があると判断されたとき、それらのノードをパスで結ぶことによりグラフを作成する。次に、このグラフから、グラフの極大完全部分グラフであるクリークを抽出する。クリークを構成するすべてのノードは、自分以外のノードとパスで結ばれているので、クリークを構成するノードはすべて整合性を満たしている。各クリークの評価値を計算し、最も良いクリークを決定することにより、項目文字列のマッチング度が定まる。そして、最も良いマッチング度の項目文字列を項目文字列候補として出力する。また、データ文字列候補抽出手段15bは、帳票論理定義体に定義されるデータ領域属性に基づき、文字認識結果からデータ文字列候補を抽出する。まず、データ領域属性に定義されるデータの正規表現のうち、値を表す部分を文字認識結果から抽出し、値部としてまとめておく。さらに、まとめられた値部と、正規表現に含まれる文字列について、データ文字列候補抽出手段15bと同様の処理を行い、データ文字列候補を決定する。
対応付け手段16は、キーワードを構成する文字列として、項目文字列候補抽出手段15aにより決定された項目文字列候補と、データ文字列候補抽出手段15bにより決定されたデータ文字列候補について、帳票論理定義体に基づき、位置関係に応じた対応付けを行い、項目文字列とデータ文字列の組み合わせを決定する。たとえば、項目文字列とデータ文字列の相対的な位置関係から組み合わせを生成し、生成された組み合わせをノードとし、2つの組み合わせ間の組み合わせ上の整合性を調べ、整合性があると判断されたとき、それらをパスで結ぶことにより、グラフを生成する。そして、グラフからクリークを抽出し、各クリークの評価値を計算し、最も良いクリークを決定することにより、項目文字列とデータ文字列の組み合わせを決定する。
このような構成の帳票処理装置1の動作について説明する。
帳票論理定義体データベース14には、予め、対象の帳票の論理構造を定義した帳票論理定義体を格納しておく。
帳票画像が入力されると、レイアウト認識手段11は、レイアウト認識を行って文字画像の読み取り領域を抽出する。文字認識手段13は、認識辞書データベース12に格納される認識辞書を参照し、抽出された読み取り領域の文字認識を行い、認識された文字から文字認識結果を生成する。ここまでの処理で、帳票画像上の文字が文字認識され、文字認識結果として文字列候補抽出手段15へ出力される。
項目文字列候補抽出手段15aは、文字認識結果から、帳票論理定義体データベース14に格納される帳票論理定義体に定義される項目文字列に含まれる文字を抽出し、抽出された各文字に投票する。そして、投票された文字の間で、位置に関する整合性を判定し、互いに文字列としての関係を満たす組み合わせを求め、項目文字列候補を決定する。一方、データ文字列候補抽出手段15bは、文字認識結果から、帳票論理定義体に定義されるデータ領域属性に基づき、正規表現のうち値を表す部分を文字認識結果から抽出し、値部としてまとめておく。さらに、文字認識結果から、正規表現の文字列と合わせ、項目文字列候補抽出手段15aと同様に、互いに文字列としての関係を満たす組み合わせを求め、データ文字列候補として抽出する。対応付け手段16は、文字列候補抽出手段15が決定した項目文字列候補とデータ文字列候補を、帳票論理定義体に定義される項目とデータの位置関係に基づいて対応付けし、項目文字列候補とデータ文字列候補の組み合わせを決定する。
以上の処理手順をカテゴリごとに繰り返し、全カテゴリのキーワードが抽出される。
このように、本発明にかかる帳票処理装置1では、キーワードを定義した帳票論理定義体に基づき、文字認識された各文字が帳票論理定義体に定義される文字列としての関係を満たす組み合わせの文字集合のうち、最もマッチング度の高いものを選択する。このため、文字認識結果が一部誤っていても、他の正しい文字認識結果によってマッチングがとれるので、正しいマッチングが可能となる。また、同様にして、レイアウト認識が誤り、文字認識結果が正しい並びをしていなくても、正しいマッチングが可能となる。そして、項目文字列とデータ文字列の組み合わせが複数考えられるときでも、全体として最も整合性のある組み合わせを取り出せるので、正しい結果が得られることになる。
以下、実施の形態を図面を参照して詳細に説明する。
図2は、本実施の形態の帳票処理装置のハードウェア構成例を示した図である。
帳票処理装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、通信インタフェース106が接続されている。
RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションのプログラムが格納される。グラフィック処理装置104には、モニタ108が接続されており、CPU101からの命令に従って画像をモニタ108の画面に表示させる。入力インタフェース105には、キーボード109aやマウス109bが接続されており、キーボード109aやマウス109bから送られてくる信号を、バス107を介してCPU101に送信する。通信インタフェース106は、スキャナ20に接続されており、スキャナ20が読み取った帳票画像データが送られてきたら、バス107を介してCPU101に送信する。なお、スキャナ20は、直接バス107を介して接続するとしてもよい。
このようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。
次に、帳票処理装置100の処理機能を実現するソフトウェア構成について説明する。図3は、本実施の形態の帳票処理装置のソフトウェア構成例を示した図である。
帳票処理装置100は、レイアウト認識部110、文字認識部130およびキーワード抽出部140の処理部と、認識辞書データベース120と論理定義体データベース150のデータベースを有している。
キーワード抽出部140は、項目文字列候補を抽出する項目抽出部160、データ文字列候補を抽出するデータ抽出部170および項目文字列候補とデータ文字列候補とを対応付ける対応付け部180を有する。
レイアウト認識部110は、スキャナが読み取った帳票画像のレイアウトを認識し、文字画像を含む読み取り領域を抽出するレイアウト認識手段である。
認識辞書データベース120には、文字認識に用いる辞書情報が格納される。
文字認識部130は、レイアウト認識部110が抽出した読み取り領域に対し文字認識を行い、文字認識結果を出力する文字認識手段である。
論理定義体データベース150には、同種の帳票に共通する論理構造を定義するよう帳票論理定義体(以下、論理定義体とする)が格納される。たとえば、見積書であれば、「日付情報」、「依頼番号」などが含まれるというように、同じ種類の帳票であれば、レイアウトは異なっていても含まれる情報項目など、共通する箇所が多くある。これらをまとめたものが論理構造である。帳票の論理構造は、意味、項目、データからなる組と、それらの間に成り立つ関係からなる。意味は、帳票における表現機能を表す。項目は、その意味に対応する表現機能が実際に帳票で表現される文字列を表す。データは、意味に対応する表現機能において、実際の値を表す。それらの間に成り立つ関係は、組同士の関係を表し、対応関係や、数式が成立する関係などがある。詳細は後述するが、論理定義体データベース150には、項目については項目文字列が定義され、データについてはデータ領域属性が定義されている。
項目抽出部160は、文字認識結果投票161、グラフ生成(整合性評価)162、最大クリーク決定163および項目文字列候補決定164のモジュールによってその処理機能を実現している。文字認識結果投票161は、文字認識結果と論理定義体に定義される項目文字列に含まれる文字を照合し、検出された場合は、定義されている項目文字列を構成する文字に投票する。グラフ生成(整合性評価)162は、文字認識結果投票により得られた各文字間の整合性を評価し、グラフを生成する。具体的には、投票された文字をノードとし、各文字間に文字列としての位置関係の整合性があるかどうかを判断する。たとえば、2文字間における論理定義体データベース150に定義される項目文字列としての文字の並び順に基づく位置関係(項目文字列に「注文番号」が定義されているとすると、「文」に対し「番」または「号」が文字の並び順で後ろに配置されていればよい)、文字同士の位置関係(同一行にあるか)などに基づき、整合性を判断し、整合性があれば、ノード間をパスで結ぶ。この手順を各文字(ノード)について順次実行し、グラフを生成する。最大クリーク決定163は、グラフ生成(整合性評価)162によって作成されたグラフからクリークを抽出し、クリークの中から妥当なものを選択し、最も高いマッチング率の最大クリークを決定する。マッチング率は、たとえば、クリークを含む文字集合に含まれるノードの割合などにより算出される。1つのカテゴリに複数の項目文字列が定義されている場合、それぞれの項目文字列ごとに最大クリークが決定される。そこで、カテゴリで1つの項目文字列候補を選択する。項目文字列候補決定164は、カテゴリに属する項目文字列の中で、最大クリーク決定163により決定された最大クリークのうち、最も良いマッチング度のものを項目文字列候補として出力する。
ここで、グラフについて説明する。グラフは、ノード(節点・頂点)の集合と、ノードをつなぐパス(枝、辺)の集合で構成される「つながり方」に着目して抽象化された「点とそれを結ぶ線」の概念であり、グラフが持つ様々な性質を探求するのがグラフ理論である。また、グラフ中の任意の2頂点間にパスが張られている頂点集合はクリークと呼ばれ、クリークの中で最大のものを見つける手法を最大クリーク抽出と呼ぶ。グラフから最大クリークを抽出する手法はよく知られており、たとえば、「C.Bron and J.Kerbosch,“Finding all cliques of an undirected graph”, Commun.ACM,Vol.16,No.9,pp575−577,1973」に開示されている。
データ抽出部170は、*部抽出171、文字認識結果投票172、グラフ生成(整合性評価)173およびデータ文字列候補決定(最大クリーク決定)174のモジュールによってその処理機能を実現している。固定の文字列で表現される項目と異なり、データを表す文字を限定することはできないが、データを表現する形式(以下、正規表現とする)とデータの文字種は定義することができる。たとえば、日付は、「*年*月*日」と表現できる。*は、任意の数字または記号を表す。以下、「*」で示したあらゆる文字の代わりになる記号をワイルドカードと呼ぶ。*部抽出171は、文字認識結果からデータのワイルドカード部分をまとめて抽出し、全体を*部としておく。文字認識結果投票172は、文字認識結果から抽出されるデータの正規表現に含まれる文字列と、*部について、文字認識結果投票161と同様に投票処理を行う。そして、グラフ生成(整合性評価)173では、グラフ生成(整合性評価)162と同様にグラフを作成し、データ文字列候補決定(最大クリーク決定)174において項目文字列候補決定164と同様にして最も高いマッチング率の最大クリークをデータ文字列候補として決定する。
対応付け部180は、項目・データ組み合わせ181、グラフ生成(整合性評価)182、組み合わせ決定(最大クリーク決定)183のモジュールによってその処理機能を実現している。項目・データ組み合わせ181は、項目抽出部160が抽出した項目文字列候補と、データ抽出部170が抽出したデータ文字列候補について、対応付けられる可能性のあるものを数え上げる。グラフ生成(整合性評価)182は、数え上げられた組み合わせをノードとし、組み合わせの位置関係における整合性がある場合にはノード間をパスで結ぶことによってグラフを作成する。組み合わせ決定183は、グラフから最も整合性の高い最大クリークを決定する。すなわち、最も整合性のある項目文字列とデータ文字列の組み合わせを決定する。
以下、本発明の実施の形態の帳票処理装置100の動作および帳票処理手順について説明する。
まず、論理定義体データベース150に格納される論理定義体について説明する。図4は、本実施の形態の論理定義体の一例を示した図である。
論理定義体は、帳票論理構造をなす意味、項目およびデータを定義する。
キーワードは、意味に応じてカテゴリ201に分類される。図の例では、日付210と帳票番号220が定義されている。
項目に関し、意味を表現する文字列、項目文字列202としてカテゴリごとに定義される。図の例では、日付210には、「年月日」、「発行日」および「作成日」が定義される。また、帳票番号220には、「注文番号」および「貴社受付番号」が定義されている。
データに関し、意味に対応する実際の値、データ領域属性として、データで使用される文字203、データで使用される正規表現204がカテゴリごとに定義される。データで使用される文字203は、実際の値を表す文字の種類が定義される。たとえば、日付210には、データが「数字」で表されることが定義されている。データで使用される正規表現204には、データの表現形式が定義されている。たとえば、日付210では、「*年*月*日」、「平成*年*月*日」という表現形式がとられることを示している。
さらに、項目から見たデータの相対的位置205や項目とデータの間に存在してもよい文字206などが、カテゴリごとに必要に応じて定義される。たとえば、日付210には、「右」、「下」が定義されている。これは、項目が配置される領域から右方向または下方向にデータが配置されることを表している。また、項目とデータの間に存在してもよい文字206には、「:」が定義されており、抽出された項目文字列候補とデータ文字列候補の間に「:」が存在していても、整合性が成り立つことを示している。
次に、帳票画像が入力されてからの処理手順を説明する。帳票画像が入力されると、レイアウト認識部110によるレイアウト認識処理と、文字認識部130による文字認識処理が順次実行される。以下、帳票画像の一例を用いて説明する。
図5は、本実施の形態の帳票処理装置に入力される帳票画像の一例である。
帳票画像300は、「御見積書」の一部であり、レイアウト認識部110は、帳票画像300を入力し、レイアウト認識処理を行って読み取り領域を抽出する。文字認識部130は、全字種を認識対象として読み取り領域の文字認識を行う。帳票画像300の場合、「御見積書」301、「2005年9月25日」302、「B株式会社御中」303、「貴社受付番号」304、「20050925−0101」305、「A株式会社」306、「電話番号」307、「044−123−4445」308が文字認識結果として出力される。
なお、文字認識において、論理定義体データベース150の論理定義体に基づき、認識対象の文字を限定することができる。たとえば、図4に示した日付210は、文字として「年」、「月」、「日」、「発」、「行」、「作」、「成」、「平」および数字だけを使用するので、字種をこれらに限定しても文字認識されることがわかる。同様に、帳票番号220は、「注」、「文」、「番」、「号」、「貴」、「社」、「受」、「付」および数字に限定することができる。このように、すべてのカテゴリに関する認識対象の文字を取り出し、全カテゴリの和をとり、これを認識対象とする。これにより、文字認識の確度が高くなる。
続いて、キーワード抽出部140が処理を開始する。キーワード抽出処理は、項目抽出部160による項目文字列候補の抽出と、データ抽出部170によるデータ文字列候補の抽出が行われた後、対応付け部180による項目文字列候補とデータ文字列候補の対応付けが行われる。
(1)項目抽出
項目抽出処理では、論理定義体に定義される項目文字列に基づき、文字認識結果から項目を表す項目文字列を抽出する。
まず、文字認識結果投票161が、論理定義体データベース150に格納される論理定義体に基づき、文字認識結果から定義される項目文字列に含まれる文字を抽出し、投票を行う。ここでは、帳票画像300の帳票について、項目文字列として「貴社受付番号」、「注文番号」および「受付No.」が定義されているとする。そこで、文字認識結果から項目文字列の定義に含まれる文字を抽出する。
図6は、本実施の形態における文字認識結果からの文字抽出を示した図である。図6は、帳票画像300から文字が抽出された箇所を抜き出した図で、図5と同じものには同じ番号を付す。
項目文字列に含まれる文字と一致したものを順次抽出する。このとき、便宜的に抽出された文字をアルファベットでラベル付けする。たとえば、「貴社受付番号」304からは、「貴(a)」、「社(b)」、「受(c)」、「付(d)」、「番(e)」、「号(f)」、「A株式会社」306から「社(g)」、「電話番号」307から「番(h)」と「号(i)」、「B株式会社御中」303から「社(j)」が抽出される。続いて、抽出された文字を、項目文字列の各文字に投票する。
図7は、本実施の形態における項目文字列マッチングの投票結果を示した図である。図6と同じものには同じ符号を付す。
項目文字列「貴社受付番号」310については、「貴」にa、「社」にbとgとj、「受」にc、「付」にd、「番」にeとh、「号」にfとiが投票される。同様に、項目文字列「注文番号」320については、「番」にeとh、「号」にfとiが投票され、「受付No.」330については、「受」にc、「付」にdが投票される。
グラフ生成(整合性評価)162では、投票結果に基づき、投票された文字をノードとしたグラフを生成する。まず、投票された文字の集合に対して、すべての2文字の組について文字列としての関係と、位置に関する整合性を調べる。2つの文字AとBの位置関係に整合性があるとは、それぞれの文字が、該当する項目文字列のi番目の文字であり、j番目の文字である(ただしi<jであるとする)とき、Aのx座標<Bのx座標であり、かつ、Aのy座標とBのy座標がほぼ等しいということを満たすときである。なお、xは水平方向、yは垂直方向の座標軸であるとする。
具体的には、平均文字サイズをm、yをAのy座標値、yをBのy座標値とした場合に、
|y−y| ≦ m/2 ・・・(1)
を満たすときとする。平均文字サイズは、全文字について、その外接矩形の長辺の平均とする。
なお、手書きの文字の場合は、Aのy座標とBのy座標がほぼ等しいという条件は厳しすぎることもあるので、この条件を緩和し、式(1)を
|y−y| ≦ m ・・・(2)
として整合性を判定する。このように、整合性の基準は、帳票に応じて適宜設定する。
2つの文字に対して、それらの関係の整合性が成立するとき、それらの2文字に相当するノードをパスで結ぶことによりグラフを生成する。
図8は、本実施の形態において生成されるグラフの一例を示した図である。各ノード、a、b、c、d、e、f、g、h、i、jは、図6で文字に付与されたアルファベットを示す。
たとえば、「貴(a)」に対しては、項目文字列「貴社受付番号」に含まれる「社」、「受」、「付」、「番」、「号」であって、位置関係が式(1)を満たすものが整合性を有すると判断される。したがって、「社(b)」、「受(c)」、「付(d)」、「番(e)」、「号(f)」、「社(g)」が整合性を有すると見なし、パスで結ぶ。同様の処理をノードごとに繰り返すと、図8に示したグラフが得られる。
こうして生成されたグラフから、グラフの極大完全部分グラフであるクリークを抽出する。クリークを構成するすべてのノードは、自分以外のノードとパスで結ばれている。
たとえば、図の例では、abcdef、ag、ei、hi、jがクリークとして抽出される。
なお、実際に帳票処理装置100が処理を行う場合には、グラフは、図8に示した図形を表形式で表現した整合性グラフテーブルなどを用いる。図9は、本実施の形態の帳票処理装置における整合性グラフテーブルの一例を示した図である。
整合性グラフテーブル350では、縦と横にノードを配置し、交点に当たる欄にパスの状態を設定している。1は、パスが結ばれていることを表し、0はパスが結ばれていないことを表している。1が設定される欄をたどっていけば、クリークを抽出することができる。
そして、最大クリーク決定163では、まず、抽出されたクリークから妥当なものだけを選択する。たとえば、クリークを構成するノードの個数が、ある閾値以上のものだけを選択する。これにより、項目文字列に対して、ある一定以上マッチングできたクリークだけが残る。図の例で閾値を2とする場合、クリークとして抽出されたabcdef、ag、ei、hi、jのうち、jが除外される。項目文字列に対して1文字しかマッチングしないものは、項目文字列である可能性が低いので、このようにしてクリークから除外する。
さらに、残ったクリークについて、文字配置による妥当性を検証する。クリークに対応する画像上の文字集合に対し、それらを囲む領域の長さを文字数で割り、領域を構成する文字の中心点(領域の中心点)を算出する。算出した中心点と、実際の文字の中心点のずれを求め、ある閾値を超えていれば、そのクリークは不適合と判断して削除する。具体的には、平均文字サイズをm、文字数をn、各文字のずれをdとするとき、
Figure 0004750802
を満たすときとする。なお、平均文字サイズは、全文字について、その外接矩形の長辺の平均とする。一例を挙げて説明する。図10は、本実施の形態における文字配置の妥当性検証の一例を示した図である。
クリークに対応する文字集合「見積有効期限: 2004年9月30日」400は、「見」401、「積」402および「日」403がマッチングしている。文字集合400に対し、これを囲む外枠420の長さを文字数で割り、領域を構成する文字の個数を用いて文字の中心点を算出する。この場合、外枠420の中心431が算出されるとする。これに対し、実際にマッチングした「見」、「積」、「日」の文字の中心点432が得られる。この外枠420の中心431と、マッチングした文字の中心432とのずれ433を評価する。図の例では、ずれ433は、式(3)により不適合と判定される。
また、クリークにおいて隣り合う2文字に対応する画像上の2文字の間に、その2文字の以外にも字があるとき、そのクリークを不適合と判断して削除する。図の例で、項目文字列は「見積日」であるとすると、「積」402と「日」403の間には、他の文字があるので不適合と判断される。
以上のような処理を行い、妥当でないクリークは削除する。そして、残ったクリークについて、最も高いマッチング率のクリークを最大クリークとして出力する。
さらに、項目文字列候補決定164は、項目文字列ごとに決定された最大クリークのマッチング率を比較し、最も高いマッチング率のクリークを項目文字列候補として決定する。複数のクリークが同じマッチング率を有する場合には、それらをすべて出力する。マッチング率は、たとえば、文字集合に含まれるノードの数や、文字列がマッチングしている箇所の割合などによって算出する。
以上の処理により、項目文字列候補が決定される。
なお、抽出されたクリークについて、ノードの個数、文字配置、ノイズによる検証をした後、残ったクリークに対し、字種を限定した再認識によって評価を行うこともできる。具体的には、この項目文字列を構成する文字集合に認識対象を限定して文字認識を行う。文字認識結果のうち、認識信頼度がある閾値を上回った場合のみを残し、それ以外を捨てる。そして、残った文字認識結果に対し、投票、グラフ生成、クリーク抽出を行い、最大クリークの個数を求め、この個数をクリークの評価値とする。そして、評価値が最大のものを出力する。複数のクリークにおいて同じ評価値を有する場合は、それらをすべて出力する。
また、上記では、キーワードを構成する文字列が同一行にある場合について説明したが、項目が複数行にわたるようなレイアウトで構成される帳票も存在する。このような場合、抽出されたクリークをノードとし、2つのノード間に整合性が成り立つ場合には、ノード間をパスで結びグラフを作成し、最大クリークを抽出することによって、複数行にわたる文字列候補とその位置を識別する。
図11は、複数行にわたる項目文字列の一例を示した図である。
2つのクリークに対応する2つの文字列、「御見積」501と「番号」502について、上下には重ならない、かつ、左右には重なる場合であって、一方の先頭部の文字が、他方の最後尾の文字よりも後ろにあり、順序が後ろの文字列は、前の文字列よりの画像上で下にあるという条件を満たすときに、整合性があると判定される。
図の例では、2つの文字列をy方向に射影した501yと502yの範囲が重ならないので上下には重ならないと判断できる。また、x方向に射影した501xと502xの範囲が重なるので、左右には重なると判断される。また、項目文字列「御見積番号」に対し、順序が後ろの「番号」502は「御見積」501の後にあり、画像上の下にある。
このように、条件を満たすノード(クリーク)間にパスを張り、グラフを生成する。その後、グラフからクリークを抽出し、最大クリークを抽出する。
ここで、項目抽出処理の手順について、フローチャートを用いて説明する。図12は、本実施の形態における項目抽出処理の手順を示したフローチャートである。
文字認識結果が入力された後、処理を開始する。
[ステップS11] 論理定義体に定義される全カテゴリの処理を繰り返すため、処理中のi番目のカテゴリ(Ciとする)を指示するiを初期化(i=0)する。
[ステップS12] カテゴリCiに定義される全項目文字列の処理を繰り返すため、処理中のi番目の項目文字列(Sj)を指示するjを初期化(j=0)する。
[ステップS13] カテゴリCiの項目文字列Sjに対する項目文字列マッチング処理を行う。処理の詳細は後述するが、マッチング処理により、カテゴリCiの項目文字列Sjに対する最大クリークが決定される。
[ステップS14] 次の項目文字列に対する処理を行うため、jを1増加させる。
[ステップS15] jを論理定義体に定義される項目文字列の数と比較する。jが項目文字列の数に到達していなければ、ステップS13に戻って、次の項目文字列に対するマッチング処理を行う。到達していれば、全項目文字列終了とする。
[ステップS16] ステップS13からステップS15までの処理を繰り返すことにより、カテゴリCiのすべての項目文字列に対応する最大クリークが決定されるので、カテゴリCiに対する項目文字列候補決定処理を行う。処理の詳細は後述する。
[ステップS17] 次のカテゴリに対する処理を行うため、iを1増加させる。
[ステップS18] iを論理定義体に定義されるカテゴリの数と比較する。iがカテゴリの数に到達していなければ、ステップS12に戻って、次のカテゴリの処理を行う。全カテゴリの処理が終了していれば、処理を終了する。
項目文字列マッチング処理手順について説明する。図13は、本実施の形態における項目文字列マッチング処理の手順を示したフローチャートである。
項目文字列Sjが指定された後、処理が開始される。
[ステップS131] 論理定義体データベース150に格納される論理定義体に基づき、文字認識結果から定義される項目文字列Sjに含まれる文字を抽出し、投票を行う。
[ステップS132] 投票結果に基づき、投票された文字をノードとしたグラフを生成する。まず、投票された文字の集合に対して、すべての2文字の組について文字列としての関係と、位置に関する整合性を調べ、整合性が成立する場合にノード間にパスを張ることによってグラフを生成する。
[ステップS133] ステップS132において生成されたグラフから、グラフの極大完全部分グラフであるクリークを抽出する。クリークを構成するすべてのノードは、自分以外のノードとパスで結ばれる。
[ステップS134] ステップS133において抽出されたクリークのうち、クリークを構成するノードの個数が、ある閾値以上のものだけを選択する。さらに、クリークの文字配置における妥当性を調べ、妥当でないクリークは削除する。そして、残ったクリークについて、最も高いマッチング率のクリークを選択し、最大クリークとして出力する。
以上の処理手順が実行されることにより、カテゴリCiの項目文字列Sjについての最大クリークが抽出される。
次に、項目文字列候補決定処理手順について説明する。図14は、本実施の形態における項目文字列候補決定処理の手順を示したフローチャートである。
カテゴリに属する項目文字列に対応する最大クリークが決定され、処理が開始される。
[ステップS161] Piをi番目の項目文字列のマッチング度、Ptを最大のマッチング度、配列qを項目文字列候補の個数分の配列、nを項目文字列候補の個数として、各値を初期化する。すなわち、i=0、n=0、Pt=0とし、配列qを初期化する。
[ステップS162] iとカテゴリに定義される項目文字列の個数を比較する。iが項目文字列の個数となっていれば、処理を終了する。
[ステップS163] iは項目文字列の個数となっていないので、i番目の項目文字列のマッチング度Piと、最大のマッチング度Ptとを比較する。PiがPt以上であるかどうかを調べ、Pt以上でない場合は、現在設定されているPtのマッチング度が最も高いとし、処理をステップS167へ進める。
[ステップS164] PiがPt以上である場合、さらに、PiがPtより大きいかどうかを調べる。PiがPtより大きくない(Pi=Pt)場合、処理をステップS166へ進める。
[ステップS165] PiがPtより大きい場合、PtにPiを設定し(Pt=Pi)、項目文字列候補の個数nを1にし、配列q[0]=iとし、処理をステップS167へ進める。これにより、i番目が現時点で唯一の項目文字列候補q[0]=iとなる。
[ステップS166] PiとPtが等しい場合、Ptはそのままとし、配列q[n]にiを設定し(q[n]=i)、項目文字列候補の個数nを1増加させる。これにより、項目文字列候補は、n個となり、配列qには、Ptがともに最大となる項目文字列の番号が並ぶ。
[ステップS167] iを1増加させ、ステップS162に戻って次の項目文字列の処理を行う。
以上の処理手順が実行されることにより、項目文字列候補の個数nと、項目文字列候補q[i](iは、0≦i<nを満たす)が得られる。
(2)データ抽出処理
データ抽出処理では、論理定義体のデータ正規表現とデータ種別に基づき、文字認識結果からデータ正規表現によって記述されているデータを抽出する。
帳票におけるキーワードのデータは、文字列の種類や配置の構成が限定されていることが多い。論理定義体では、データの属性が正規表現として記述されている。たとえば、日付キーワードのデータは*年*月*日、金額は*円、¥*などと記述される。*部抽出171では、正規表現に記述されている*部分の種類(数字、アルファベットなど)と、他の文字列(「年」、「月」、「日」、「.(ピリオド)」、「−(ハイフン)」など)を論理定義体データベース150から読み出し、文字認識結果から該当するものを取り出す。ただし、ピリオド、ハイフン以外については、ある大きさ以上という条件を課す。取り出した文字の集合をAとおく。そして、Aに属する文字の外接矩形に対して、近傍領域(左右マージンm、上下マージンn)をとり、その中に存在するAの要素の中で、自分以外で最も近いものであり、かつ、y座標に射影したときに重複するものに対してリンクを張る。リンクで連結されたAの要素を結合して、その領域の*部として抽出する。
一例を挙げて説明する。図15は、本実施の形態における*部抽出の一例を示した図である。図は、「*年*月*日」(*は数字)という正規表現で定義されたデータを抽出する場合を示している。
論理定義体に定義されたデータの種別と正規表現に基づき、数字、「年」、「月」、「日」が文字認識結果から抽出される。ここでは、「2004年9月30日」という文字集合A(601)が取り出されたとする。Aに属する文字について、隣接する文字とリンクを張る。「2」を例にとると、「2」の外接矩形602に対し、左右マージンmと上下マージンnをとった近傍領域603を設定し、近傍領域に存在するAの要素で自分以外で最も近いものであり、かつy座標がほぼ等しい文字にリンクを張る。この場合、「0」にリンクが張られる。なお、y座標がほぼ等しいとは、式(1)を満たす関係をいう。同様の処理を繰り返すことにより、この場合は、文字集合A(601)の「2004年9月30日」に含まれる文字すべてにリンクが張られ、「2004年9月30日」が*部として抽出される。
文字認識結果投票172は、項目抽出部160の文字認識結果投票161と同様に、文字部分と正規表現で*で表される*部分のそれぞれに投票する。文字部分は文字ごとに、*部分はひとつにまとめて投票を行う。文字集合A(601)の例であれば、文字部分「年」、「月」、「日」と、*部「2004 9 30」のそれぞれに投票する。
グラフ生成(整合性評価)173およびデータ文字列候補決定(最大クリーク決定)174は、項目抽出部160のグラフ生成(整合性評価)162および最大クリーク決定163と同様に、グラフ生成、クリーク抽出、最大クリークの決定を行う。グラフ生成では、投票された各文字と、*部分をノードとし、ノード間の位置関係による整合性が成立した場合には、パスを張る。最大クリークの抽出では、クリークを構成するノードの個数が、ある閾値以上のものだけを選択する。さらに、クリークにおいて隣り合う2文字に対応する画像上の2文字の間に、その2文字以外の文字がある場合は、そのクリークを不適合と判断し削除する。そして、残ったクリークについて、ノードの個数がある閾値よりも大きいとき、それらのクリークに対応する領域と文字をすべて出力する。
なお、項目抽出部160と同様に、出力されたクリークに対して、字種限定再認識によって、出力文字を修正することもできる。
ここで、データ抽出処理の手順について、フローチャートを用いて説明する。図16は、本実施の形態におけるデータ抽出処理の手順を示したフローチャートである。
文字認識結果が入力された後、処理を開始する。
[ステップS21] 論理定義体に定義される全カテゴリの処理を繰り返すため、処理中のi番目のカテゴリ(Ciとする)を指示するiを初期化(i=0)する。
[ステップS22] カテゴリCiに定義される全項目文字列の処理を繰り返すため、処理中のi番目の正規表現(Rj)を指示するjを初期化(j=0)する。
[ステップS23] カテゴリCiの正規表現Rjに対するデータ文字列マッチング処理を行う。処理の詳細は後述するが、マッチング処理により、カテゴリCiの正規表現Rjに対する最大クリークが決定される。
[ステップS24] 次の正規表現に対する処理を行うため、jを1増加させる。
[ステップS25] jを論理定義体に定義される正規表現の個数と比較する。jが正規表現の個数に到達していなければ、ステップS23に戻って、次の正規表現に対するマッチング処理を行う。到達していれば、全正規表現終了とする。
[ステップS26] 次のカテゴリに対する処理を行うため、iを1増加させる。
[ステップS27] iを論理定義体に定義されるカテゴリの数と比較する。iがカテゴリの数に到達していなければ、ステップS22に戻って、次のカテゴリの処理を行う。全カテゴリの処理が終了していれば、処理を終了する。
データ文字列マッチング処理手順について説明する。図17は、本実施の形態におけるデータ文字列マッチング処理の手順を示したフローチャートである。
正規表現Rjが指定された後、処理が開始される。
[ステップS231] 論理定義体データベース150に格納されるデータ正規表現に記述されている*部分の種類と、他の文字列を文字認識結果から取り出し、隣接する文字をリンクで連結して文字統合を行い、ひとかたまりの文字集合を*部として抽出する。
[ステップS232] *部として抽出された文字集合に含まれる文字と、正規表現において*(数字など)で表される部分のそれぞれに投票する。
[ステップS233] 投票された各文字と*部分をノードとして、ノード間に整合性が成立すれば、ノード間をパスで接続することによって、グラフを生成する。
[ステップS234] ステップS233において生成されたグラフから、グラフの極大完全部分グラフであるクリークを抽出する。クリークを構成するすべてのノードは、自分以外のノードとパスで結ばれる。
[ステップS235] ステップS234において抽出されたクリークのうち、クリークを構成するノードの個数が、ある閾値以上のものだけを選択する。さらに、クリークの文字配置における妥当性を調べ、妥当でないクリークは削除する。そして、残ったクリークについて、ノードの個数がある閾値よりも大きいとき、それらのクリークに対応する領域と文字をすべて出力する。
以上の処理手順が実行されることにより、カテゴリCiのデータ正規表現Rjに対応するデータ文字列が抽出される。
(3)項目・データ対応付け処理
項目・データ対応付け処理では、論理定義体に定義される項目から見たデータの相対的位置などに基づき、項目抽出部160によって抽出された項目と、データ抽出部170によって抽出されたデータについて、対応関係のある可能性を数え上げ、全体の整合性を考慮することにより対応関係を決定する。全体の整合性の評価は、項目抽出部160およびデータ抽出部170と同様に、グラフを生成し、クリークを抽出して行う。
項目・データ組み合わせ181は、項目抽出部160によって抽出された項目文字列候補Iに対し、項目文字列候補IがカテゴリCから求められたものとすると、論理定義体に記述されているカテゴリCの項目とデータとの関係(項目から見たデータの相対的位置205)に基づき、項目文字列候補Iの近傍領域を設定する。たとえば、「下」が定義されていれば、近傍領域を項目文字列候補Iの領域の下に取る。また、「右」が定義されていれば、近傍領域を項目文字列候補Iの領域の右に取る。そして、設定された近傍領域にあり、かつ、カテゴリCのデータの正規表現を満たすものに対して、項目文字列候補とデータ文字列候補の組み合わせを生成する。ただし、項目文字列候補とデータ文字列候補の両方を含む外接矩形に、論理定義体に記述されているカテゴリCの項目とデータの間に入っていてもよい文字以外の文字が入っていれば、その項目文字列候補とデータ文字列候補の組み合わせは生成されない。
グラフ生成(整合性評価)182では、項目・データ組み合わせ181で抽出された項目文字列とデータ文字列の組み合わせをノードとしたグラフを生成する。項目文字列候補とデータ文字列候補の組み合わせの集合に対して、すべての2つの組み合わせについて整合性を調べる。2つの組み合わせAとBの関係は整合性があるとは、それぞれの組み合わせを構成する項目文字列候補とデータ文字列候補が重複しないことである。2つの組み合わせに対して、それらの関係の整合性が成立するとき、それらの2つの組み合わせに相当するノードをパスで結ぶことによりグラフを生成する。
組み合わせ決定(最大クリーク決定)183では、項目文字列マッチング処理と同様に、クリーク抽出、最大クリーク決定を行う。最大クリークの抽出では、クリークを構成するノードの個数が最大のものを出力する。
ここで、項目とデータの対応付け処理の手順について、フローチャートを用いて説明する。図18は、本実施の形態における項目・データ対応付け処理の手順を示したフローチャートである。
項目文字列とデータ文字列が抽出された後、処理を開始する。
[ステップS31] 論理定義体に定義される項目から見たデータの相対的位置に基づき、カテゴリが同じ項目文字列候補とデータ文字列候補を対応付け、項目文字列候補とデータ文字列候補の組み合わせを数え上げる。
[ステップS32] ステップS31で抽出された項目文字列とデータ文字列の組み合わせをノードとし、すべての2つの組み合わせについて整合性(それぞれの組み合わせを構成する項目文字列候補とデータ文字列候補が重複しないこと)を調べ、整合性が成り立つ場合には、ノード間にパスを張ってグラフを生成する。
[ステップS33] ステップS32において生成されたグラフから、グラフの極大完全部分グラフであるクリークを抽出する。
[ステップS34] ステップS33で抽出されたクリークから最大クリークを抽出する。最大クリークの抽出では、クリークを構成するノードの個数が最大のものを出力する。
以上の処理手順が実行されることにより、全体の整合性を考慮して項目文字列候補とデータ文字列候補の組み合わせが決定される。これにより、複数の対応の可能性が存在する場合でも、正しい対応を選択することができる。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、帳票処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
プログラムを流通させる場合には、たとえば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
上記については単に本発明の原理を示すものである。さらに、多数の変形、変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応するすべての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。
符号の説明
1 帳票処理装置
11 レイアウト認識手段
12 認識辞書データベース(DB)
13 文字認識手段
14 帳票論理定義体データベース(DB)
15 文字列候補抽出手段
15a 項目文字列候補抽出手段
15b データ文字列候補抽出手段
16 対応付け手段

Claims (9)

  1. スキャンされた帳票画像から所定のキーワードを抽出する帳票処理のための帳票処理プログラムにおいて、
    コンピュータを、
    前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段、
    抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段、
    項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段、
    記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段、として機能させ、
    前記帳票論理定義体には、前記キーワードを構成する前記項目に対応する項目文字列が定義されており、
    前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、
    前記項目文字列候補抽出手段は、前記文字認識結果に前記項目文字列の文字が検出された場合は、該当する前記項目文字列の文字に投票し、投票された文字間において前記項目文字列としての関係を満たす組み合わせを前記項目文字列候補として抽出し、
    前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、
    ことを特徴とする帳票処理プログラム。
  2. スキャンされた帳票画像から所定のキーワードを抽出する帳票処理のための帳票処理プログラムにおいて、
    コンピュータを、
    前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段、
    抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段、
    項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段、
    前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段、として機能させ、
    前記帳票論理定義体には、前記キーワードを構成する前記データに対応し、データ文字種とデータ正規表現を含むデータ領域属性が定義されており、
    前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、
    前記データ文字列候補抽出手段は、前記文字認識結果に前記データ正規表現における各要素が検出された場合は、該当する前記データ正規表現の要素に投票し、投票された要素間において前記データ正規表現としての関係を満たす組み合わせを前記データ文字列候補として抽出し、
    前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、
    ことを特徴とする帳票処理プログラム。
  3. 前記対応付け手段は、前記項目文字列候補と前記データ文字列候補が対応する可能性を数え上げ、前記項目文字列候補と前記データ文字列候補が対応する個数が全体で最大となるよう対応関係を決定する、
    ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。
  4. 前記文字列候補抽出手段は、前記文字列候補を構成する文字の文字配置の妥当性を検証し、妥当性が検証されたものを前記文字列候補とする、
    ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。
  5. 前記文字認識手段は、前記帳票論理定義体に基づき、前記帳票画像に出現する可能性のある文字種に認識対象を限定して文字認識を行う、
    ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。
  6. 前記文字列候補抽出手段は、前記文字列候補が抽出された後、前記文字列候補に対応する前記キーワードについて前記帳票論理定義体に定義される前記文字列を構成する文字の集合に認識対象を限定して文字認識を行って前記文字認識結果を更新し、更新された前記文字認識結果を用いて、再び文字認識された文字が前記文字列としての関係を満たす文字列候補を抽出する、
    ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。
  7. 前記文字列候補抽出手段は、任意の行に配置された前記キーワードを構成する文字列としての位置関係を満たす組み合わせを第1の文字列単位、前記第1の文字列単位とは異なる行に配置された第2の組み合わせを第2の文字列単位とし、前記第1の文字列単位と前記第2の文字列単位が前記帳票論理定義体に定義される文字列としての関係を満たす組み合わせを複数行にわたる前記文字列候補として抽出する、
    ことを特徴とする請求項1または2の何れか一項に記載の帳票処理プログラム。
  8. スキャンされた帳票画像から所定のキーワードを抽出する帳票処理装置において、
    前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段と、
    抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段と、
    項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段と、
    前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段と、を有し、
    前記帳票論理定義体には、前記キーワードを構成する前記項目に対応する項目文字列が定義されており、
    前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、
    前記項目文字列候補抽出手段は、前記文字認識結果に前記項目文字列の文字が検出された場合は、該当する前記項目文字列の文字に投票し、投票された文字間において前記項目文字列としての関係を満たす組み合わせを前記項目文字列候補として抽出し、
    前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、
    ことを特徴とする帳票処理装置。
  9. スキャンされた帳票画像から所定のキーワードを抽出する帳票処理装置において、
    前記帳票画像のレイアウトを認識し、前記帳票画像における文字画像の読み取り領域を抽出するレイアウト認識手段と、
    抽出された前記読み取り領域の文字画像に対し文字認識を施し、認識された文字を文字認識結果として出力する文字認識手段と、
    項目とデータの2要素から成るキーワードを構成する文字列を同種の帳票に共通する論理構造に応じて定義した帳票論理定義体に基づき、前記帳票論理定義体に前記キーワードとして定義される文字列に含まれる文字を前記文字認識結果から抽出し、抽出された文字間の関係が前記キーワードを構成する文字列としての位置関係を満たす組み合わせを文字列候補とする文字列候補抽出手段と、
    前記キーワードについて、要素に応じた前記文字列候補を前記帳票画像上の位置関係に応じて対応付け、前記キーワードを構成する前記文字列候補の組み合わせを決定する対応付け手段と、を有し、
    前記帳票論理定義体には、前記キーワードを構成する前記データに対応し、データ文字種とデータ正規表現を含むデータ領域属性が定義されており、
    前記文字列候補抽出手段は、前記項目に関する項目文字列候補を抽出する項目文字列候補抽出手段、および前記データに関するデータ文字列候補を抽出するデータ文字列候補抽出手段として機能し、
    前記データ文字列候補抽出手段は、前記文字認識結果に前記データ正規表現における各要素が検出された場合は、該当する前記データ正規表現の要素に投票し、投票された要素間において前記データ正規表現としての関係を満たす組み合わせを前記データ文字列候補として抽出し、
    前記対応付け手段は、前記項目文字列候補と前記データ文字列候補を対応付ける処理を実行する、
    ことを特徴とする帳票処理装置。
JP2007553802A 2006-01-13 2006-01-13 帳票処理プログラムおよび帳票処理装置 Expired - Fee Related JP4750802B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/300325 WO2007080642A1 (ja) 2006-01-13 2006-01-13 帳票処理プログラムおよび帳票処理装置

Publications (2)

Publication Number Publication Date
JPWO2007080642A1 JPWO2007080642A1 (ja) 2009-06-11
JP4750802B2 true JP4750802B2 (ja) 2011-08-17

Family

ID=38256057

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007553802A Expired - Fee Related JP4750802B2 (ja) 2006-01-13 2006-01-13 帳票処理プログラムおよび帳票処理装置

Country Status (4)

Country Link
US (1) US8131087B2 (ja)
JP (1) JP4750802B2 (ja)
CN (1) CN101356541B (ja)
WO (1) WO2007080642A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714338A (zh) * 2012-09-28 2014-04-09 欧姆龙株式会社 图像处理装置和图像处理方法

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8064703B2 (en) * 2006-03-17 2011-11-22 Data Trace Information Services, Llc Property record document data validation systems and methods
EP2051935B1 (en) * 2006-07-26 2016-09-07 STMicroelectronics Srl Use of nitroaniline derivatives for the production of nitric oxide
JP5098504B2 (ja) * 2007-08-09 2012-12-12 富士通株式会社 文字認識プログラム、文字認識装置および文字認識方法
JP4998237B2 (ja) * 2007-12-06 2012-08-15 富士通株式会社 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法
JP5125573B2 (ja) 2008-02-12 2013-01-23 富士通株式会社 領域抽出プログラム、文字認識プログラム、および文字認識装置
JP4825243B2 (ja) * 2008-06-20 2011-11-30 富士通フロンテック株式会社 帳票認識装置、方法、データベース作成装置、方法、及びプログラム
JP5462017B2 (ja) * 2010-02-08 2014-04-02 沖電気工業株式会社 帳票処理システム、エントリ端末および帳票データ処理方法
CN102402693B (zh) * 2010-09-09 2014-07-30 富士通株式会社 处理包含字符的图像的方法和设备
CN102509115B (zh) * 2011-11-22 2014-06-25 北京京北方信息技术有限公司 一种分层带回溯查找机制的票据类型识别方法
JP6303531B2 (ja) * 2014-01-22 2018-04-04 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN106650715B (zh) * 2016-10-26 2019-07-12 西安电子科技大学 一种根据允许集对字符串ocr识别结果检错与纠错的方法
CN112639816A (zh) * 2018-09-14 2021-04-09 三菱电机株式会社 图像信息处理装置、图像信息处理方法和图像信息处理程序
JP2020027598A (ja) * 2018-12-27 2020-02-20 株式会社シグマクシス 文字認識装置、文字認識方法及び文字認識プログラム
JP2020123925A (ja) * 2019-01-31 2020-08-13 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7318248B2 (ja) * 2019-03-20 2023-08-01 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP7370733B2 (ja) * 2019-05-30 2023-10-30 キヤノン株式会社 情報処理装置、制御方法、及びプログラム
JP7282603B2 (ja) * 2019-06-05 2023-05-29 キヤノン株式会社 画像処理装置、その制御方法及びプログラム
JP2021043478A (ja) * 2019-09-06 2021-03-18 キヤノン株式会社 情報処理装置、その制御方法及びプログラム
US10832656B1 (en) * 2020-02-25 2020-11-10 Fawzi Shaya Computing device and method for populating digital forms from un-parsed data
CN111444906B (zh) * 2020-03-24 2023-09-29 腾讯科技(深圳)有限公司 基于人工智能的图像识别方法和相关装置
CN111832396B (zh) 2020-06-01 2023-07-25 北京百度网讯科技有限公司 文档布局的解析方法、装置、电子设备和存储介质
US11593417B2 (en) * 2021-01-21 2023-02-28 International Business Machines Corporation Assigning documents to entities of a database
JP7317886B2 (ja) * 2021-04-12 2023-07-31 株式会社プリマジェスト 情報処理装置及び情報処理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1078997A (ja) * 1996-09-03 1998-03-24 Matsushita Electric Ind Co Ltd 文字認識装置及びその方法並びにその方法を記録した記録媒体
JP2001312691A (ja) * 2000-05-01 2001-11-09 Canon Inc 画像処理方法および装置並びに記憶媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0589279A (ja) * 1991-09-30 1993-04-09 Sharp Corp 文字認識装置
JP3076731B2 (ja) * 1994-12-26 2000-08-14 株式会社ピーエフユー 帳票出力処理方法
JP3380136B2 (ja) * 1997-04-22 2003-02-24 富士通株式会社 表画像のフォーマットを識別するフォーマット識別装置および方法
US6104500A (en) * 1998-04-29 2000-08-15 Bcl, Computer Inc. Networked fax routing via email
US6614931B1 (en) * 1998-10-08 2003-09-02 Hewlett-Packard Development Company, Lp. Handwritten instructions for messaging appliances
JP2000251012A (ja) * 1999-03-01 2000-09-14 Hitachi Ltd 帳票処理方法およびシステム
JP3425408B2 (ja) * 2000-05-31 2003-07-14 株式会社東芝 文書読取装置
JP3919617B2 (ja) * 2002-07-09 2007-05-30 キヤノン株式会社 文字認識装置および文字認識方法、プログラムおよび記憶媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1078997A (ja) * 1996-09-03 1998-03-24 Matsushita Electric Ind Co Ltd 文字認識装置及びその方法並びにその方法を記録した記録媒体
JP2001312691A (ja) * 2000-05-01 2001-11-09 Canon Inc 画像処理方法および装置並びに記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714338A (zh) * 2012-09-28 2014-04-09 欧姆龙株式会社 图像处理装置和图像处理方法
CN103714338B (zh) * 2012-09-28 2017-03-01 欧姆龙株式会社 图像处理装置和图像处理方法

Also Published As

Publication number Publication date
JPWO2007080642A1 (ja) 2009-06-11
US20080273802A1 (en) 2008-11-06
CN101356541B (zh) 2012-05-30
US8131087B2 (en) 2012-03-06
WO2007080642A1 (ja) 2007-07-19
CN101356541A (zh) 2009-01-28

Similar Documents

Publication Publication Date Title
JP4750802B2 (ja) 帳票処理プログラムおよび帳票処理装置
US11501061B2 (en) Extracting structured information from a document containing filled form images
US20200081899A1 (en) Automated database schema matching
JP4443443B2 (ja) 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法
US8300942B2 (en) Area extraction program, character recognition program, and character recognition device
US11507901B1 (en) Apparatus and methods for matching video records with postings using audiovisual data processing
Crawford et al. A clustering method for graphical handwriting components and statistical writership analysis
US20230298630A1 (en) Apparatuses and methods for selectively inserting text into a video resume
CN114612921B (zh) 表单识别方法、装置、电子设备和计算机可读介质
US11538462B1 (en) Apparatuses and methods for querying and transcribing video resumes
JP2020173779A (ja) 文書における見出しのシーケンスの識別
JP5812534B2 (ja) 質問応答装置、方法、及びプログラム
JPH11328317A (ja) 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体
KR101118628B1 (ko) 지능형 인식 라이브러리 및 관리 도구를 활용한 고문서 이미지 데이터 인식 및 처리 방법
US20230178073A1 (en) Systems and methods for parsing and correlating solicitation video content
US20230289396A1 (en) Apparatuses and methods for linking posting data
WO2023177723A1 (en) Apparatuses and methods for querying and transcribing video resumes
Lund Ensemble Methods for Historical Machine-Printed Document Recognition
Xu et al. Estimating similarity of rich internet pages using visual information
US20220319216A1 (en) Image reading systems, methods and storage medium for performing geometric extraction
US20230419367A1 (en) Apparatus and method for communicating with users
US20230297963A1 (en) Apparatus and method of opportunity classification
US20240028952A1 (en) Apparatus for attribute path generation
US20240127577A1 (en) Generating templates using structure-based matching
Naoum Article Segmentation in Digitised Newspapers

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110517

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110519

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4750802

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140527

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees