JP2017010069A - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP2017010069A
JP2017010069A JP2015121238A JP2015121238A JP2017010069A JP 2017010069 A JP2017010069 A JP 2017010069A JP 2015121238 A JP2015121238 A JP 2015121238A JP 2015121238 A JP2015121238 A JP 2015121238A JP 2017010069 A JP2017010069 A JP 2017010069A
Authority
JP
Japan
Prior art keywords
field
processing apparatus
format
form image
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015121238A
Other languages
English (en)
Inventor
吉田 一
Hajime Yoshida
一 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2015121238A priority Critical patent/JP2017010069A/ja
Publication of JP2017010069A publication Critical patent/JP2017010069A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】フィールドのデータ型を学習機能により半自動的に設定可能とすることで、より詳細なOCR制約条件を容易に課すことができ、これによって、文字認識の精度を向上させることが可能な情報処理装置を提供する。【解決手段】情報処理装置100は、サンプル帳票のフォーマット情報、当該サンプル帳票のフィールドに記入されたデータ値、及び当該データ値に基づいて生成された当該フィールドの記入上の制約条件を互いに関連付けて記憶するフォーマットモデル記憶部118bを含む。情報処理装置100は、入力された帳票画像に対応するフォーマット情報及び制約条件をフォーマットモデル記憶部118bから読出し、読出したフォーマット情報により特定されたフィールドにおける帳票画像の記入値を当該フィールドの制約条件の範囲内で文字認識してそのデータ値を出力する。【選択図】図7

Description

本発明は、情報処理装置に関し、特に、帳票画像を処理する技術に関する。
従来、帳票を処理する情報処理装置が知られている。こうした情報処理装置は、紙の帳票をスキャナ等の画像読取装置で読取り、読取った画像をOCR(Optical Character Recognition:光学文字認識)処理することでテキスト情報を得る。帳票は、通常、文字、数字等を記入する記入欄であるフィールドを含む。OCR処理では、フィールドに記入された値が文字認識される。OCR処理によって文字認識されたデータ値は、構造化データの形で外部システム等に出力される。
また従来、帳票画像の特徴点を抽出することによって帳票のフォーマットを推定し、帳票内のフィールドを特定する技術も知られている。この技術では、フィールドを特定することにより、特定したフィールドに対してOCR処理が行なわれる。そのため、帳票画像の全体に対してOCR処理を行なう場合に比べて、OCR処理の時間が短縮される。
後掲の特許文献1には、こうした情報処理装置の一種であるデータエントリシステムが開示されている。このデータエントリシステムは、帳票画像をOCR処理し、その結果を利用してデータエントリのための入力フォーマットを作成する。OCR処理では、予め設定された属性(文字又はイメージの種別)に基づいて各フィールドのデータが文字、数字に変換され、変換された文字又は数字からフィールドの文字属性(文字種、文字数)が読取られる。OCR処理の結果は入力フォーマット作成プログラムに入力される。入力フォーマット作成プログラムは、入力されたOCR処理の結果に基づいて、自動的に入力フォーマットのフィールドを作成し、作成したフィールドに対して属性を設定する。
特開2002−150219号公報
上記した従来の技術では、OCR処理を行なう領域の特定は可能である。しかし、特定した領域に対してOCR処理を行なったとしても、OCR処理による文字認識の精度を向上させることは困難である。そのため、例えばメールアドレス欄に対する文字認識の結果が、メールアドレスとして使用できないような文字列となるおそれがある。すなわち、フィールドに記入された値を文字認識した結果に、妥当でない認識結果が含まれるおそれがある。こうした場合、ユーザによる修正が必要となるため手間がかかる。そこで、各フィールド値の制約条件として、さまざまなデータ型をあらかじめ指定し、その条件のもとで文字認識を行うことで、認識精度を高める方策が考えられる。しかし、各フォーマットに対するデータ型を事前に詳細に設定することもまた手間がかかる。
特許文献1に開示のデータエントリシステムでは、属性設定に基づいて各フィールドのデータが文字、数字に変換される。しかし、特許文献1において設定される属性は文字又はイメージの種別であるため、こうした属性設定に基づいてOCR処理を行なったとしても文字認識の精度を向上させる効果は大きくない。特許文献1では、属性設定は事前に行なわれる必要があり、この手間を軽減するには至っていない。そのため、特許文献1に開示の技術を用いても、上記した従来の技術の問題は解決できない。
本発明は、上記のような課題を解決するためになされたものであり、本発明の1つの目的は、フィールドのデータ型を学習機能により半自動的に設定可能とすることで、より詳細なOCR制約条件を容易に課すことができ、これによって、文字認識の精度を向上させることが可能な情報処理装置を提供することである。
本発明の一の局面に係る情報処理装置は、帳票内のフィールドに記入された値を文字認識して出力する情報処理装置である。この情報処理装置は、サンプル帳票のフォーマット情報、当該サンプル帳票のフィールドに記入されたデータ値、及び当該データ値に基づいて生成された当該フィールドの記入上の制約条件を互いに関連付けて記憶するための記憶手段と、帳票画像を入力するための帳票入力手段と、帳票入力手段を介して帳票画像が入力されたことに応答して、当該帳票画像に対応するフォーマット情報及び制約条件を記憶手段から読出し、読出したフォーマット情報により特定されたフィールドにおける帳票画像の記入値を当該フィールドの制約条件の範囲内で文字認識するための文字認識制約手段と、文字認識制約手段により文字認識されたデータ値を出力するためのデータ出力手段とを含む。
記憶手段には、サンプル帳票のフォーマット情報、当該サンプル帳票のフィールドに記入されたデータ値、及び当該データ値に基づいて生成された当該フィールドの記入上の制約条件が互いに関連付けて記憶されている。帳票画像が入力されると、文字認識制約手段が、当該帳票画像に対応するフォーマット情報及び制約情報を記憶手段から読出し、読出したフォーマット情報により特定されたフィールドの記入値を対応する制約条件の範囲内で文字認識する。文字認識されたデータ値はデータ出力手段によって出力される。
入力された帳票画像のフィールドの記入値に対し、当該制約条件の範囲内で文字認識が行なわれるため、文字認識の精度が向上する。例えば、特定されたフィールドの制約条件がメールアドレス型である場合、当該記入値がメールアドレスで使用される文字種の範囲で文字認識される。文字認識において、想定される文字種から大きく乖離する文字が入力された場合、無効な文字として扱われる。そのため、メールアドレスとして使用できないような文字列として文字認識されるのを抑制できる。すなわち、フィールドに記入された値を文字認識した結果に、妥当でない認識結果が含まれるのを抑制できる。これにより、認識結果を修正する手間を低減できる。
好ましくは、情報処理装置はさらに、記入済みのサンプル帳票画像を入力するためのサンプル帳票入力手段と、サンプル帳票入力手段を介して記入済みのサンプル帳票画像が入力されたことに応答して、当該記入済みのサンプル帳票画像に対応するフォーマット情報を記憶手段から読出し、読出したフォーマット情報に基づいて、入力された当該サンプル帳票画像のフィールドに記入された値を文字認識するための文字認識手段と、文字認識手段により認識されたデータ値を対応するフィールドの有効値として記憶手段に記憶し、当該有効値に基づいて、記憶手段に記憶されている制約条件を更新するための制約条件更新手段を含む。
より好ましくは、情報処理装置はさらに、文字認識手段により認識されたデータ値を含むリストを制約条件として生成するためのリスト生成手段を含み、制約条件更新手段は、文字認識手段により認識されたデータ値をリストに追加することにより、制約条件を更新するためのリスト更新手段を含み、文字認識制約手段は、帳票入力手段を介して帳票画像が入力されたことに応答して、当該帳票画像に対応するフォーマット情報及び制約条件を記憶手段から読出し、読出したフォーマット情報に基づいて特定された所定のフィールドにおける帳票画像の記入値がリストに含まれるか否かに基づいて、当該フィールドの記入上の制約条件を満たすことを検証するためのリスト検証手段と、リスト検証手段の検証結果に応じて、入力された帳票画像のフィールドの記入値を、リストに含まれるデータ値の範囲内で文字認識するための認識手段と、を含む。
さらに好ましくは、情報処理装置はさらに、記入済みのサンプル帳票画像を入力するためのサンプル帳票入力手段と、サンプル帳票入力手段を介して記入済みのサンプル帳票画像が入力されたことに応答して、当該記入済みのサンプル帳票画像に対応するフォーマット情報を記憶手段から読出し、読出したフォーマット情報に基づいて、入力された当該サンプル帳票画像のフィールドに記入された値を文字認識するための文字認識手段と、文字認識制約手段により認識されたデータ値、及び文字認識手段により認識されたデータ値を対応するフィールドの有効値として記憶手段に蓄積するためのデータ蓄積手段と、データ蓄積手段により蓄積されたフィールドの有効値の集合からこれら有効値を許容する書式の制約条件を推定することにより、当該フィールドの記入上の制約条件を生成するための制約条件生成手段とを含む。
さらに好ましくは、文字認識制約手段はさらに、入力された帳票画像のフィールドの記入値に対して当該フィールドの制約条件を満たすような文字認識が可能か否かを判定し、情報処理装置はさらに、文字認識制約手段による判定結果が否定であることに応答して、当該フィールドに対してエラーフラグを設定するためのフラグ設定手段を含む。
以上より、本発明によれば、フィールドのデータ型を学習機能により半自動的に設定可能とすることで、より詳細なOCR制約条件を容易に課すことができ、これによって、文字認識の精度を向上させることが可能な情報処理装置を得ることができる。
本発明の第1の実施の形態に係る帳票処理システムの全体構成を示す図である。 図1に示す情報処理装置のハードウェア構成を示す制御ブロック図である。 図2に示すHDD(Hard Disk Drive)の構成を示す図である。 図1に示す画像処理装置のハードウェア構成を示す制御ブロック図である。 図1に示す画像処理装置の操作パネルに表示される帳票フォーマット登録画面例を示す図である。 図1に示す画像処理装置の操作パネルに表示されるモード設定画面例を示す図である。 図1に示す情報処理装置の機能的構成を示すブロック図である。 フォーマットモデルのデータ構造を示す図である。 出力データセットのデータ構造を示す図である。 図1に示す情報処理装置で実行されるプログラムの制御構造を示すフローチャートである。 図10のステップS1010の詳細なフローである。 図10のステップS1020の詳細なフローである。 図12のステップS1234の詳細なフローである。 図10のステップS1030の詳細なフローである。 図14のステップS1434の詳細なフローである。 サンプル帳票の例を示す図である。 記入済みのサンプル帳票の例を示す図である。 本発明の第3の実施の形態に係る情報処理装置の機能的構成を示すブロック図である。 本発明の第4の実施の形態に係る画像処理装置のハードウェア構成を示す制御ブロック図である。 図19に示す記憶装置の構成を示す図である。
以下の実施の形態では、同一の部品には同一の参照番号を付してある。それらの機能及び名称も同一である。したがって、それらについての詳細な説明は繰返さない。
(第1の実施の形態)
[全体システム構成]
図1を参照して、本実施の形態に係る帳票処理システム50は、勤怠管理表、注文票、日報、及びアンケートシート等の種々の帳票画像を処理する情報処理装置100と、紙の帳票の画像を読取り、読取った帳票画像のデータ(以下「帳票画像データ」と呼ぶ。)を情報処理装置100に送信する画像処理装置200とを含む。情報処理装置100はサーバ装置であり、画像処理装置200から送信された帳票画像データを受信することにより帳票画像を自装置に入力する。画像処理装置200は、スキャン送信モード、スキャナモード、コピーモード、及びプリンタモード等の複数の動作モードを備える複合機(Multifunction Peripheral:MFP)である。情報処理装置100及び画像処理装置200は、ネットワーク60を介して互いに通信可能に接続されている。帳票処理システム50を構成する画像処理装置の台数は複数台であってもよい。
帳票処理システム50が処理する帳票は、1以上の記入項目(以下、単に「項目」と呼ぶ場合がある。)及び個々の項目に対応するフィールド(記入欄)を含む文書である。帳票上の各フィールドの近傍には、当該フィールド及び当該フィールドの記入値がどの項目に対応するのかを示す項目名が印刷されている。帳票のフィールドには、手書き、タイプ打ち、又はパーソナルコンピュータ上のアプリケーション経由での印刷等により値が記入される。
画像処理装置200は、帳票の画像を読取る画像読取機能を持つ。帳票の処理時には、画像処理装置200は、主としてスキャン送信モードで動作する。スキャン送信モードでは、画像処理装置200は、帳票の画像を読取り、読取った帳票画像データを、ネットワーク60を介して情報処理装置100に送信する。
情報処理装置100は、帳票画像データを受信することにより入力された帳票画像に対して、OCR処理を実行するOCR機能を持つ。情報処理装置100はさらに、サンプルとなる帳票(以下「サンプル帳票」と呼ぶ場合がある。)の認識結果のデータを蓄積するデータベースを含む。サンプル帳票の認識結果のデータは、サンプル帳票のフォーマット(フォーマットの特徴情報)、当該サンプル帳票のフォーマット名、当該サンプル帳票のフィールドに記入されたデータ値、及び当該データ値に基づいて生成された当該フィールドの記入上の制約条件を互いに関連付けてモデル化されたフォーマットモデルを含む。データベースには、このようなフォーマットモデルが予め登録されている。制約条件は、制約情報としてデータベースに登録されている。この制約情報は、各フィールドが取得るデータ型(例えば、文字列、整数、日付、住所、電話番号、メールアドレス等)、及び、サンプル帳票のフィールドに記入されたデータ値をフィールド単位で記録したリストを含む。
記入済みの帳票画像が情報処理装置100に入力されると、当該情報処理装置100は、当該帳票画像の特徴点を利用したパターン認識処理を行なう。情報処理装置100は、データベースに登録されているフォーマット情報の中から、入力された帳票画像に対応するフォーマットを推定し、そのフォーマットに関連付けられた各フィールドの制約条件(制約情報)を読出す。情報処理装置100はさらに、読出したフォーマット情報に基づいて、入力された帳票画像のフィールド出現場所を特定する。情報処理装置100は、特定したフィールドに対してOCR処理を実行し、制約条件の範囲内で当該フィールドの記入値を文字認識する。OCR処理により認識されたデータ値(文字又は文字列)は、内部の記憶装置に出力され、当該記憶装置に保存される。以下では、OCR処理(文字認識処理)により得られた文字、整数、日付等の文字の列を文字列と総称する。
データベースに登録されたサンプル帳票の認識結果のデータは、情報処理装置100に入力されたサンプル帳票画像を当該情報処理装置100が認識することによって生成される。本実施の形態では、サンプル帳票のフォーマットの登録時、並びに、サンプル帳票のフィールドに記入されたデータ値及び当該フィールドの制約条件の登録時のそれぞれにおいて、画像処理装置200から情報処理装置100にサンプル帳票画像が送信される。すなわち、サンプル帳票のフォーマットが情報処理装置100のデータベースに登録された後に、各フィールドに有効な値が記入された記入済みのサンプル帳票画像が別途、情報処理装置100に入力されることにより、サンプル帳票のフィールドに記入されたデータ値及び当該フィールドの制約条件がデータベースに登録される。記入済みのサンプル帳票で用いられる文字は、文字認識に適しているのが好ましい。
より詳細には、サンプル帳票画像の入力によるフォーマットの登録後に、別途、記入済みのサンプル帳票画像が情報処理装置100に入力されると、当該情報処理装置100は、データベースに登録されているフォーマットの中から、入力された記入済みのサンプル帳票画像に対応するフォーマット情報を読出す。情報処理装置100は、読出したフォーマット情報に基づいて、入力されたサンプル帳票画像のフィールドの配置領域を特定し、特定したフィールドに対してOCR処理を実行することにより当該フィールドの記入値を文字認識する。文字認識により得られたデータ値は当該フィールドの有効な値としてデータベースに登録され、登録されたデータ値の特徴に基づいて、当該フィールドの制約条件が生成される。制約条件の生成では推定を行ってもよく、あらかじめ登録済みのデータ型(例えば日付、金額、電話番号)の特徴に入力データ値の多くが一致する場合、当該フィールドの制約条件を特定のデータ型として扱う。生成された制約条件は、サンプル帳票のフォーマット等と関連付けられてデータベースに登録される。複数の記入済みのサンプル帳票画像が情報処理装置100に入力されると、各フィールドのデータ値が有効な値としてフォーマットモデルに蓄積されて、各フィールドの記入上の制約条件が更新される。このようにして、情報処理装置100は、帳票画像の各フィールドの制約条件を学習する。なお、記入済みのサンプル帳票は、全てのフィールドに値が記入されているのが好ましい。ただし、記入済みのサンプル帳票は、一部のフィールドに値が記入されていない帳票であってもよい。
[ハードウェア構成]
《情報処理装置100》
図2を参照して、帳票処理システム50を構成する情報処理装置100は、制御部110、光ディスクドライブ120、入力インターフェイス(以下「インターフェイス」を「I/F」と呼ぶ。)130、ディスプレイI/F140、及びネットワークI/F150を含む。
制御部110は、実質的にコンピュータであって、情報処理装置100全体を制御するCPU(Central Processing Unit)112、プログラム等を記憶するためのROM(Read−Only Memory)114、揮発性の記憶装置であるRAM(Random Access Memory)116、及び通電が遮断された場合にもデータを保持する不揮発性記憶装置であるHDD118を含む。CPU112にはバス160が接続されており、このバス160には、ROM114、RAM116及びHDD118が電気的に接続される。
バス160にはさらに、光ディスクドライブ120、入力I/F130、ディスプレイI/F140、及びネットワークI/F150が接続されている。各部間のデータ(制御情報を含む)交換は、バス160を介して行なわれる。
光ディスクドライブ120は、光ディスク122が装着可能であって、光ディスク122に対する情報の書込及び光ディスク122からの情報の読出を行なう。入力I/F130は、マウス132及びキーボード134との間の接続に関するインターフェイスを提供する。ディスプレイI/F140は、ディスプレイ142との間の接続に関するインターフェイスを提供する。ネットワークI/F150は、有線又は無線(本実施の形態においては有線)によりネットワーク60への接続を提供する。ネットワークI/F150は、帳票画像データを受信することにより、受信した帳票画像データ(帳票画像(サンプル帳票画像を含む。))を情報処理装置100に入力する。
ROM114、RAM116、HDD118、光ディスクドライブ120、入力I/F130、ディスプレイI/F140及びネットワークI/F150は、いずれもCPU112の制御のもとに協調して動作し、情報処理装置100において種々のコンピュータプログラムによる処理を実現する。それらコンピュータプログラムは、例えば、入力された帳票画像のフィールドの記入値を文字認識して出力する帳票処理等を実行する。HDD118には、情報処理装置100の一般的な動作等を実現するためのコンピュータプログラムとともに、帳票処理を実現するためのコンピュータプログラムが記憶される。
図3を参照して、HDD118はさらに、サンプル帳票の認識結果のデータを蓄積する上記データベース118aを含む。データベース118aは、上記したフォーマットモデルを記憶するフォーマットモデル記憶部118b、及び出力されたデータセット(OCR処理により認識されたデータ値)を記憶する出力データセット記憶部118cを含む。HDD118は、他に、帳票画像データ等の種々のデータを記憶する。
再び図2を参照して、情報処理装置100に上述したような処理を行なわせるためのコンピュータプログラムは、光ディスクドライブ120に挿入される光ディスク122に記憶され、さらにHDD118に転送される。又は、プログラムはネットワーク60を通じて情報処理装置100に送信されHDD118に記載されてもよい。プログラムは実行の際にRAM116にロードされる。光ディスク122から、又はネットワーク60を介して、直接にRAM116にプログラムをロードしてもよい。
これらのプログラムは、情報処理装置100に所定の処理を行なわせる複数の命令を含む。この動作を行なわせるのに必要な基本的機能のいくつかは情報処理装置100上で動作するオペレーティングシステム(OS)若しくはサードパーティのプログラム、又は情報処理装置100にインストールされる各種ツールキットのモジュールにより提供される。したがって、このプログラムはこの実施の形態のシステムを実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られるように制御されたやり方で適切な機能又は「ツール」を呼出すことにより、上記した情報処理装置100として所定の処理を実行する命令のみを含んでいればよい。情報処理装置100の実体であるコンピュータの一般的動作は周知であるので、ここでは繰返して説明しない。
《画像処理装置200》
図4を参照して、帳票処理システム50を構成する画像処理装置200は、制御部210、操作ユニット220、画像読取部230、画像処理部240、画像形成部250、給紙部260、及びNIC(Network Interface Card)270を含む。
制御部210は、実質的にコンピュータであって、画像処理装置200全体を制御するCPU212、プログラム等を記憶するためのROM214、揮発性の記憶装置であるRAM216、及び記憶装置218を含む。CPU212には、BUSライン280が接続されており、このBUSライン280には、ROM214、RAM216及び記憶装置218が電気的に接続される。記憶装置218は、通電が遮断された場合にもデータを保持する不揮発性記憶装置であり、例えばハードディスクドライブ(HDD)又はフラッシュメモリ等である。
CPU212は、操作ユニット220等からの指示に応じて各種コンピュータプログラムを実行することによって、画像処理装置200の各部の動作及び情報処理装置100等の外部機器との通信等の所望の処理を実行する。上記の各種コンピュータプログラムは、予めROM214又は記憶装置218に記憶されており、所望の処理の実行時において、当該ROM214又は記憶装置218から読出されてRAM216に転送される。CPU212は、CPU212内の図示しないプログラムカウンタと呼ばれるレジスタに格納された値によって指定される、RAM216内のアドレスからプログラムの命令を読出し、解釈する。CPU212はまた、読出された命令によって指定されるアドレスから演算に必要なデータを読出し、そのデータに対し命令に対応する演算を実行する。実行の結果も、RAM216、記憶装置218及びCPU212内のレジスタ等の、命令によって指定されるアドレスに格納される。
ROM214又は記憶装置218には、画像処理装置200の一般的な動作等を実現するためのコンピュータプログラムが記憶される。このコンピュータプログラムは、画像処理装置200の製造時にROM214又は記憶装置218に書込まれる。なお、このコンピュータプログラムは、NIC270を介して、外部機器等から提供されてもよい。さらにこのコンピュータプログラムは、そのコンピュータプログラムが記録された、例えばDVD等の記憶媒体によって提供されてもよい。すなわち、例えばコンピュータプログラムの記録媒体としてのDVDが、画像処理装置200内に内蔵されるDVDドライブ(図示せず。)に装着され、そのDVDからコンピュータプログラムが読出されて記憶装置218にインストールされてもよい。記憶装置218は、他に、画像データ等の各種データを記憶する。
BUSライン280には、さらに、操作ユニット220、画像読取部230、画像処理部240、画像形成部250、給紙部260、及びNIC270が電気的に接続される。
操作ユニット220はユーザによる操作を受付ける。操作ユニット220は、入出力インターフェイス(図示せず。)を介して、CPU212と通信を行なう。この操作ユニット220は、操作パネル222を含む。操作パネル222は、液晶パネル等で構成された表示パネルと、表示パネルの上に配置され、タッチされた位置を検出するタッチパネルとを含む。表示パネルは、画像処理装置200の状態及び各種処理の状態に関する情報等の各種情報をユーザに提供する。この操作パネル222は、ユーザに対して対話的な操作インターフェイス(UI)を提供する。この対話的な操作インターフェイスは、タッチパネルから画像処理装置200全体の動作に対するユーザの指示を受付け、その指示の内容を表示パネルに表示するとともに、その指示に応じた制御信号を制御部210等に対して出力する。
画像読取部230は、光源を含む原稿走査ユニット、反射ミラー、光学レンズ及びCCD(Charge−Coupled Device)ラインセンサ(以上いずれも図示せず。)を含む。原稿走査ユニットは、原稿載置台(図示せず。)上に載置された原稿の画像表面に対し光源から光を照射することによって反射光像を得る。反射ミラー及び光学レンズは、得られる反射光像をCCDラインセンサ上に結像させる。CCDラインセンサは、結像した反射光像を順次光電変換して画像データとして画像処理部240に対して出力する。すなわち、画像読取部230は、原稿のコピー時又はスキャン時に、原稿載置台に載置される原稿から画像情報を読取り、読取った画像情報を電気信号に変換して画像データとして画像処理部240に対して出力する。
画像処理部240は、MPU(Micro Processing Unit、図示せず。)を含む。画像処理部240は、画像読取部230から入力される画像データに対して、例えば、ラスタライズ処理等の所定の画像処理を施して所定の階調の印刷データを作成する。印刷処理時には、画像処理部240は、作成した印刷データを画像形成部250に対して出力する。
画像形成部250は、印刷データによって示される画像をカラー又は単色で記録用紙に印刷する。給紙部260は、給紙トレイに収納された記録用紙を1枚ずつ引出して記録用紙を画像形成部250に供給する。NIC270は、ネットワーク60とのインターフェイスをとる。画像処理装置200は、このNIC270を介して、ネットワーク60上の情報処理装置100等と、所定の通信プロトコルにしたがったデータ通信を行なうことができる。
画像処理装置200はさらに、帳票画像を情報処理装置100に提供する機能に加えて、帳票のフォーマットを情報処理装置100のデータベース118a(図3参照)に登録する機能、及び、フィールドの制約条件を情報処理装置100に学習させる機能を持つ。これらの機能は、いずれも、スキャン送信モードにおいて実行される。
図5を参照して、サンプル帳票のフォーマットの登録は、操作パネル222に表示される帳票フォーマット登録画面300を操作することにより行なわれる。帳票フォーマット登録画面300は、フォーマット名を入力する入力欄302、フォーマットを登録するための「登録」キー304、及びフォーマットの登録をキャンセルするための「キャンセル」キー306を含む。入力欄302にフォーマット名が入力された後に「登録」キー304が操作されると、セットされたサンプル帳票の画像が画像読取部230で読取られて、その帳票画像データが情報処理装置100に送信される。送信される帳票画像データには、入力欄302に入力されたフォーマット名、及び、フォーマット登録を指示する指示情報が付加される。入力欄302に入力されたフォーマット名は、帳票画像データのファイル名に設定される構成であってもよい。
フィールドの制約条件を情報処理装置100に学習させる機能は、各フィールドに有効な値が記入された記入済みのサンプル帳票画像を情報処理装置100に提供する機能である。記入済みのサンプル帳票画像を情報処理装置100に提供する機能は、帳票画像を情報処理装置100に提供する機能と区別するために、学習モードにおいて実行される。学習モードの設定は、操作パネル222に表示されるモード設定画面310(図6参照)を操作することにより行なわれる。
図6を参照して、モード設定画面310は、学習モードを設定する際にチェックが入れられるチェックボックス312、設定を確定するための「OK」キー314、及び設定をキャンセルするための「キャンセル」キー316を含む。学習モードに設定された状態で記入済みのサンプル帳票の画像が画像読取部230で読取られると、読取られた帳票画像データが情報処理装置100に送信される。送信される帳票画像データには、各フィールドの制約条件の学習(登録)を指示する指示情報が付加される。一方、学習モードが設定されていない記入済みの帳票の画像が画像読取部230で読取られた場合は、指示情報が付加されずに、読取られた帳票画像データが情報処理装置100に送信される。
[機能的構成]
図7を参照して、情報処理装置100の制御部110は、フォーマットモデルを記憶するフォーマットモデル記憶部118bに加えて、機能部として、フォーマット学習部110a、フォーマット判定部110b、及びフィールド認識部110cを含む。フォーマット学習部110aは、入力されたサンプル帳票画像に対して画像処理を行なうことにより、当該サンプル帳票画像からフォーマットの特徴情報を抽出する機能、及び、抽出した特徴情報を指定(入力)されたフォーマット名と関連付けてモデル化し、フォーマットモデル記憶部118bに登録する機能を持つ。特徴抽出処理の過程では、フィールドが存在すると推定される矩形領域が特定され、フィールド候補が列挙される。フォーマット学習部110aはさらに、入力されたサンプル帳票画像に対してOCR処理を行なうことにより、フィールドの項目名候補を認識し、認識した項目名をフィールド候補の一つに割り当てることで、フォーマットモデルを構成するフィールド形式情報を構築してフォーマットモデル記憶部118bに登録する機能を持つ。
フォーマット判定部110bは、入力された帳票画像、又は入力された記入済みのサンプル帳票画像に対して画像処理(パターン処理)を行なうことにより、データベース118aに登録されているフォーマットの中から、入力された帳票画像(サンプル帳票画像を含む)がどのフォーマットに対応するかを判定する機能を持つ。フィールド認識部110cは、フォーマット判定部110bによって判定されたフォーマット(特徴情報)をフォーマットモデル記憶部118bから読出し、読出したフォーマットに基づいて、各フィールドの位置及び大きさ等を特定する機能を持つ。このフィールド認識部110cは、入力される帳票画像が、サンプル帳票画像か否かによって異なる処理を実行する。記入済みのサンプル帳票画像が入力された場合、フィールド認識部110cは、当該サンプル帳票画像の各フィールドの記入値をOCR処理により文字認識し、文字認識により得たデータ値を対応するフォーマットモデルに有効な値として追加する。フィールド認識部110cはさらに、フォーマットモデルに含まれるデータ値に基づいて各フィールドの記入上の制約条件を生成し、生成した制約条件に基づいてフォーマットモデルを更新する。制約条件の生成では推定を行ってもよく、あらかじめ登録済みのデータ型(例えば日付、金額、電話番号)の特徴に入力データ値の多くが一致する場合、当該フィールドの制約条件を特定のデータ型として扱う。
一方、記入済みの帳票画像が入力された場合、フィールド認識部110cは、フォーマット判定部110bによって判定されたフォーマットと関連付けられた制約条件をフォーマットモデル記憶部118bから読出し、当該帳票画像の各フィールドの記入値が制約条件を満たすことを検証する。検証処理では、制約条件に応じてOCR処理の文字セットが制限され、制限された文字セットの下でOCR処理による文字認識が実行される。文字認識によって得られたデータ値は出力データセット320として出力される。
[データ構造]
図8を参照して、フォーマットモデル記憶部118bに蓄積される各フォーマットモデル330は、属性情報として、フォーマット名、フォーマットの特徴情報であるフォーマット特徴点332、及びフィールド毎の形式を示すフィールド形式情報334を含む。フォーマットモデル330は、フォーマット特徴点332、及びフィールド形式情報334を複数含む場合がある。
フォーマット特徴点332は、属性情報として、オブジェクト領域、及びオブジェクトタイプを含む。オブジェクト領域は、オブジェクトが配置される領域の情報であって、例えばフィールド等のオブジェクトの位置、大きさ等の情報を含む。フィールド形式情報334は、属性情報として、フィールド名、フィールド値領域、制約情報(制約条件)336、及びフィールド値履歴を含む。フィールド値履歴は、文字認識により得られたデータ値の履歴情報である。制約情報336は、推定フィールド型、及びリストを含む。推定フィールド型は、有効なデータ値の集合であるフィールド値履歴から推定された、当該フィールドが取得るデータ型である。リストは、フィールド値履歴に含まれるデータ値をリスト化したものであって、予め設定された項目に対応するフィールドに対して生成される制約情報である。フィールド形式情報334はさらに、操作情報として、フィールド型推定を含む。
図9を参照して、フィールド認識部110cによって出力される出力データセット320は、属性情報として、入力された帳票画像のフォーマット名、及び各フィールドのフィールド情報322を含む。出力データセット320は、フィールド情報322を複数含む場合がある。フィールド情報322は、属性情報として、フィールド名、及び、当該フィールドのデータ値であるフィールド値を含む。
[ソフトウェア構成]
図10を参照して、帳票処理を行なうために、情報処理装置100で実行されるコンピュータプログラムの制御構造について説明する。このプログラムは、画像処理装置200から送信される帳票画像データを受信したことに応じて開始する。
このプログラムは、受信した帳票画像データに指示情報が付加されているか否か、又は、どういった内容の指示情報が付加されているかに応じて、実行する処理を判定するステップS1000と、ステップS1000において、実行する処理が帳票のフォーマットを登録する処理であると判定された場合に実行され、フォーマット登録処理を実行するステップS1010と、ステップS1000において、実行する処理が制約条件の学習であると判定された場合に実行され、制約条件の学習処理を実行するステップS1020と、ステップS1000において、実行する処理が帳票画像の処理であると判定された場合に実行され、帳票処理を実行するステップS1030とを含む。ステップS1010、ステップS1020、又はステップS1030の処理が終了すると、このプログラムは終了する。
図11は、図10のステップS1010の詳細なフローである。図11を参照して、このルーチンは、受信した帳票画像データ(サンプル帳票画像)、及び当該帳票画像データに付加されているフォーマット名をフォーマット学習部110aに入力するステップS1100と、ステップS1100の後に実行され、フォーマット学習部110aにおいて、入力されたサンプル帳票画像からフォーマットの特徴情報を抽出し、抽出した特徴情報を入力されたフォーマット名と関連付けてモデル化するステップS1110と、ステップS1110の後に実行され、フォーマットの特徴情報をフォーマット名とともにフォーマットモデル記憶部118bに記憶(登録)するステップS1120とを含む。ステップS1120の処理が終了すると、このルーチンは終了する。
図12は、図10のステップS1020の詳細なフローである。図12を参照して、このルーチンは、受信した帳票画像データ(記入済みのサンプル帳票画像)をフォーマット判定部110bに入力するステップS1200と、ステップS1200の後に実行され、フォーマット判定部110bにおいて、入力された記入済みのサンプル帳票画像に対して画像処理(パターン処理)を行なうことにより、当該サンプル帳票画像がデータベース118aに登録されているフォーマットの中のいずれのフォーマットに対応するかを判定するステップS1210と、ステップS1210の後に実行され、判定されたフォーマット(特徴情報)をフォーマットモデル記憶部118bから読出し、読出したフォーマットに基づいて、入力されたサンプル帳票画像の各フィールドを特定するステップS1220と、ステップS1220の後に実行され、フィールド認識部110cにおいて、以下に説明するステップS1232〜ステップS1238を、特定されたフィールドのそれぞれについて、全てのフィールドに対する処理が終了するまで繰返すステップS1230と、ステップS1230の後に実行され、次のサンプル帳票画像があるか否かを判定し、判定結果に応じて制御の流れを分岐させるステップS1240とを含む。ステップS1240において、次のサンプル帳票画像があると判定された場合は、制御はステップS1210に戻る。ステップS1240において、次の帳票画像がないと判定された場合は、このルーチンは終了する。
ステップS1230において、特定されたフィールドのそれぞれについて全てのフィールドに対する処理が終了するまで繰返される処理は、特定されたフィールドに対してOCR処理を行なうことにより、当該フィールドの記入値を文字認識するステップS1232と、ステップS1232の後に実行され、文字認識により得られたデータ値(認識文字)を記憶するステップS1234と、ステップS1234の後に実行され、文字認識により得られたデータ値に基づいて、フィールドのデータ型を推定するステップS1236と、ステップS1236の後に実行され、推定したデータ型に基づいて、制約条件(推定フィールド型)を更新するステップS1238とを含む。ステップS1236では、フィールド値履歴に蓄積された有効値(データ値)の集合から、これらの有効値を許容するデータ型(書式の制約条件)を推定する。
図13は、図12のステップS1234の詳細なフローである。図13を参照して、このルーチンは、当該フィールドが、リストを作成するよう予め設定された項目に対応するフィールドであるか否かを判定し、判定結果に応じて制御の流れを分岐させるステップS1300と、ステップS1300において、リストを作成する項目に対応するフィールドであると判定された場合に実行され、文字認識により得られた文字列をリストに記録するステップS1310と、ステップS1310の後、又は、ステップS1300において、当該フィールドがリストを作成する項目に対応するフィールドではないと判定された場合に実行され、文字認識により得られたデータ値(文字列)をフィールド値履歴に追加するステップS1320とを含む。ステップS1320の処理が終了すると、このルーチンは終了する。ステップS1320では、文字認識により得られた各フィールドのデータ値が有効値としてフィールド値履歴に蓄積される。
図14は、図10のステップS1030の詳細なフローである。図14を参照して、このルーチンは、受信した帳票画像データ(帳票画像)をフォーマット判定部110bに入力するステップS1400と、ステップS1400の後に実行され、フォーマット判定部110bにおいて、入力された帳票画像に対して画像処理(パターン処理)を行なうことにより、当該帳票画像がデータベース118aに登録されているフォーマットの中のいずれのフォーマットに対応するかを判定するステップS1410と、ステップS1410の後に実行され、判定されたフォーマット(特徴情報)及び当該フォーマットに関連付けられた制約条件をフォーマットモデル記憶部118bから読出し、読出したフォーマットに基づいて、入力された帳票画像の各フィールドを特定するステップS1420と、ステップS1420の後に実行され、フィールド認識部110cにおいて、以下に説明するステップS1432〜ステップS1436を、特定されたフィールドのそれぞれについて、全てのフィールドに対する処理が終了するまで繰返すステップS1430と、ステップS1430の後に実行され、次の帳票画像があるか否かを判定し、判定結果に応じて制御の流れを分岐させるステップS1440とを含む。ステップS1440において、次の帳票画像があると判定された場合は、制御はステップS1410に戻る。ステップS1440において、次の帳票画像がないと判定された場合は、このルーチンは終了する。
ステップS1430において、特定されたフィールドのそれぞれについて全てのフィールドに対する処理が終了するまで繰返される処理は、特定されたフィールドの制約条件を確認するステップS1432と、ステップS1432の後に実行され、制約条件に基づいて、OCR処理を実行するステップS1434と、ステップS1434の後に実行され、OCR処理によって得られたデータ値を含む出力データセット320(図9参照)をデータベース118a(出力データセット記憶部118c)に出力するステップS1436とを含む。
図15は、図14のステップS1434の詳細なフローである。図15を参照して、このルーチンは、フィールドの記入値が制約条件を満たすか否かを判定し、判定結果に応じて制御の流れを分岐させるステップS1500と、ステップS1500において、フィールドの記入値が制約条件を満たすと判定された場合に実行され、当該フィールドに対してOCR処理を実行し、制約条件に基づいて、すなわち制約条件の範囲内で当該フィールドの記入値を文字認識するステップS1510と、ステップS1500において、フィールドの記入値が制約条件を満たさないと判定された場合に実行され、当該フィールドに対してエラーフラグを設定するステップS1520とを含む。ステップS1510又はステップS1520の処理が終了すると、このルーチンは終了する。
[動作]
本実施の形態に係る帳票処理システム50は以下のように動作する。
《フォーマットの登録動作》
例えば、図16に示すような帳票(サンプル帳票350)のフォーマットを情報処理装置100に登録するものとする。図16を参照して、サンプル帳票350は、紙の帳票であって、複数の記入項目、及び個々の記入項目に対応する複数のフィールドを含む。複数のフィールドは、「日付」項目に対応するフィールド352、「担当者」項目に対応するフィールド354、「住所」項目に対応するフィールド356、「電話番号」項目に対応するフィールド358、「メールアドレス」項目に対応するフィールド360、「商品コード」項目に対応するフィールド362、「商品名」項目に対応するフィールド364、「単価」項目に対応するフィールド366、「数量」項目に対応するフィールド368、及び「合計」項目に対応するフィールド370を含む。各フィールドの近傍には、当該フィールドがどの項目に対応するのかを示す項目名(「日付」、「担当者」、「住所」、「TEL」、「e−mail」、「商品コード」、「商品名」、「単価」、「数量」及び「合計」)が印刷されている。
サンプル帳票350は画像処理装置200にセットされる。画像処理装置200の操作パネル222には図5に示される帳票フォーマット登録画面300が表示される。ユーザによって、帳票フォーマット登録画面300の入力欄302にフォーマット名が入力され、「登録」キー304が操作される。画像処理装置200は、セットされたサンプル帳票350の画像を画像読取部230で読取り、読取った帳票画像データを情報処理装置100に送信する。送信される帳票画像データには、入力されたフォーマット名、及びフォーマット登録を指示する指示情報が付加される。
情報処理装置100は、画像処理装置200から送信された帳票画像データを受信すると、受信した帳票画像データに付加されている指示情報にしたがってフォーマット登録処理を実行する(図10に示すステップS1010)。
具体的には、情報処理装置100は、まず、帳票画像データが示すサンプル帳票画像、及び当該帳票画像データに付加されているフォーマット名をフォーマット学習部110aに入力する(図11に示すステップS1100)。フォーマット学習部110aは、入力されたサンプル帳票画像からフォーマットの特徴情報(フォーマット特徴点)を抽出し、抽出した特徴情報を入力されたフォーマット名と関連付けてモデル化する(ステップS1110)。この際、フォーマット学習部110aは、入力されたサンプル帳票画像に対してOCR処理を行なうことにより、各フィールドの項目名を認識し、認識した項目名をフィールド名として、特徴情報及びフォーマット名とともにモデル化する。フォーマット学習部110aはさらに、モデル化されたフォーマットモデルをフォーマットモデル記憶部118bに登録する(ステップS1120)。
《制約条件の学習動作》
図17を参照して、サンプル帳票350と同じフォーマットの帳票であって、各フィールドに有効な値が記入された記入済みのサンプル帳票380が複数枚予め用意されているものとする。これら記入済みのサンプル帳票380は、画像処理装置200にセットされる。モード設定画面310(図6参照)のチェックボックス312はチェックが入れられた状態となっている。すなわち、画像処理装置200は学習モードに設定されている。情報処理装置100には、例えば「担当者」の項目がリストを作成する項目として予め設定されているものとする。
画像処理装置200は、セットされたサンプル帳票380の画像を画像読取部230で読取り、読取った帳票画像データを情報処理装置100に送信する。送信される帳票画像データには、制約条件の学習を指示する指示情報が付加される。情報処理装置100は、画像処理装置200から送信された帳票画像データを受信すると、受信した帳票画像データに付加されている指示情報にしたがって制約条件の学習処理を実行する(図10に示すステップS1020)。
具体的には、情報処理装置100は、まず、帳票画像データが示す記入済みのサンプル帳票画像をフォーマット判定部110bに入力する(ステップS1200)。フォーマット判定部110bは、入力された記入済みのサンプル帳票画像に対して画像処理(パターン処理)を行ない、当該サンプル帳票画像がデータベース118aに登録されているフォーマットの中のいずれのフォーマットに対応するかを判定する(ステップS1210)。フォーマット判定部110bはさらに、判定したフォーマット(特徴情報)をフォーマットモデル記憶部118bから読出し、読出したフォーマットに基づいて、入力されたサンプル帳票画像の各フィールドを特定する(ステップS1220)。サンプル帳票画像の各フィールドを特定すると、フィールド認識部110cが、特定された各フィールドに対してOCR処理を行なうことにより、当該各フィールドの記入値を文字認識する(ステップS1232)。
フィールド認識部110cは、OCR処理を行なったフィールドが、リストを作成するよう設定された項目に対応するフィールドであるか否かを判定する。OCR処理を行なったフィールドがリストを作成するよう設定された項目に対応するフィールドである場合(図13に示すステップS1300においてYES)、フィールド認識部110cは、文字認識により得られたデータ値をリストに記録する(ステップS1310)。例えば、OCR処理を行なったフィールドが「担当者」項目に対応するフィールドである場合、フィールド認識部110cは、担当者リストを作成して、文字認識により得られた文字列(「山田太郎」)を担当者リストに記録する。文字認識により得られたデータ値はまた、有効値としてフィールド値履歴に蓄積される(ステップS1320)。一方、OCR処理を行なったフィールドがリストを作成するよう設定された項目に対応するフィールドではない場合(ステップS1300においてNO)、フィールド認識部110cは、文字認識により得られたデータ値を有効値としてフィールド値履歴に蓄積する(ステップS1320)。
フィールド認識部110cは、フィールド値履歴に蓄積された有効値の集合から、これら有効値を許容するデータ型をフィールド毎に推定する(図12に示すステップS1236)。図17を参照して、サンプル帳票380の「日付」項目のフィールド352は、有効値の集合から日付型と推定され、「担当者」項目のフィールド354及び「住所」項目のフィールド356は例えばテキスト(文字列)型と推定され、「電話」項目のフィールド358は例えば数値型と推定される。さらに「メールアドレス」項目のフィールド360はメールアドレス型と推定される。さらに「商品コード」項目のフィールド362は例えば英数字型と推定され、「商品名」項目のフィールド364は例えばテキスト型と推定される。「単価」項目のフィールド366及び「合計」項目のフィールド370は例えば通貨型と推定され、「数量」項目のフィールド368は例えば数値型又は整数型と推定される。こうして各フィールドのデータ型が推定されると、推定されたデータ型に基づいて、各フィールドの制約条件(推定フィールド型)が更新される(ステップS1238)。このように、情報処理装置100は、有効な値が記入された記入済みのサンプル帳票画像を認識することによりフォーマットモデルを更新する。これにより、情報処理装置100は、帳票画像の各フィールドの制約条件を学習する。
《帳票画像の文字認識動作》
上記したフォーマットの登録動作及び制約条件の学習動作により、情報処理装置100のデータベース118a(フォーマットモデル記憶部118b)には複数のフォーマットモデル(図8参照)が予め登録されているものとする。例えば、図16に示す帳票と同じフォーマットの帳票を処理する場合を考える。帳票の各フィールドには文字等の値が記入されている。記入済みの紙の帳票は、画像処理装置200にセットされる。モード設定画面310(図6参照)のチェックボックス312は、チェックが外された状態となっている。すなわち、画像処理装置200は学習モードが解除されている。
画像処理装置200は、セットされた帳票の画像を画像読取部230で読取り、読取った帳票画像データを情報処理装置100に送信する。この場合、送信される帳票画像データには指示情報は付加されない。情報処理装置100は、画像処理装置200から送信された帳票画像データを受信すると、受信した帳票画像データに指示情報が付加されていないことから、実行する処理は帳票画像の処理であると判定する。この判定結果に基づいて、情報処理装置100は帳票処理を実行する(図10に示すステップS1030)。
具体的には、情報処理装置100は、まず、記入済みの帳票画像をフォーマット判定部110bに入力する(図14に示すステップS1400)。フォーマット判定部110bは、入力された記入済みの帳票画像に対して画像処理(パターン処理)を行ない、当該帳票画像がデータベース118aに登録されているフォーマットの中のいずれのフォーマットに対応するかを判定する(ステップS1410)。フォーマット判定部110bはさらに、判定したフォーマット(特徴情報)及び当該フォーマットと関連付けられた制約条件(制約情報336)をフォーマットモデル記憶部118bから読出し、読出したフォーマットに基づいて、入力された帳票画像の各フィールドを特定する(ステップS1420)。
帳票画像の各フィールドを特定すると、フィールド認識部110cは、フィールドの記入値が対応する制約条件に応じて、当該フィールドに対して文字セットを限定したOCR処理を実行し、制約条件の範囲内でそのフィールドの記入値を文字認識する(ステップS1510)。例えば、「メールアドレス」項目のフィールドの記入値に対しては、メールアドレス型のデータ型にしたがって、当該フィールドの記入値が文字認識される。さらに例えば、「担当者」項目のフィールドの記入値(担当者名)に対しては、担当者リストの該当する担当者名のいずれかにのみ合致する条件で、当該フィールドの記入値(文字列)が文字認識される。一方、フィールド認識部110cは、フィールドの記入値が制約条件を満たさないと判定すると(図15に示すステップS1500においてNO)、当該フィールドに対してエラーフラグを設定する(ステップS1520)。
OCR処理が終了すると、フィールド認識部110cは、OCR処理によって得られたデータ値を含む出力データセットをデータベース118a(出力データセット記憶部118c)に出力する(図14に示すステップS1436)。なお、全てのフィールドに対してエラーフラグが設定された場合、データ値を含まない出力データセットが出力される。
出力データセットは、データベース118a(出力データセット記憶部118c)に保存される。出力データセット記憶部118cに保存された出力データセットは、画像処理装置200を含む外部機器から閲覧及び編集等が可能である。なお、エラーフラグが設定されたフィールドには、データの閲覧時に、データ値に代えてエラーメッセージが表示されるように構成されていると好ましい。さらに、エラーフラグが設定された出力データセットは、エラーフラグが設定されていない出力データセットとは異なるフォルダに保存されるように構成されていてもよい。
[本実施の形態の効果]
以上の説明から明らかなように、本実施の形態に係る情報処理装置100を利用することにより、以下に述べる効果を奏する。
情報処理装置100は、入力された帳票画像のフィールドの記入値を制約条件の範囲内で文字認識を行なう。これにより、文字認識の精度が向上する。例えば、特定されたフィールドの制約条件がメールアドレス型である場合、帳票画像の対応するフィールドの記入値がメールアドレス型であるか否かが検証される。記入値がメールアドレス型であれば、当該記入値がメールアドレス型となるように文字認識される。そのため、メールアドレスとして使用できないような文字列として文字認識されるのを抑制できる。すなわち、フィールドに記入された値を文字認識した結果に、妥当でない認識結果が含まれるのを抑制できる。これにより、認識結果を修正する手間を低減できる。
情報処理装置100はまた、記入済みのサンプル帳票画像を入力することによって、制約条件を学習する。これにより、各フィールドの制約条件を効率よく設定できる。さらに情報処理装置100は、文字認識されたデータ値を対応するフィールドの有効値としてフィールド値履歴(フォーマットモデル記憶部118b)に蓄積し、蓄積された有効値(データ値)の集合からこれらの有効値を許容するデータ型(書式の制約条件)を推定する。これにより、各フィールドの制約条件をより精度よく生成できる。したがって、このような制約条件の範囲内で文字認識を行なうことによって、文字認識の精度をより向上させることができる。
さらに、有効値が記録されたリストを制約条件として用いることにより、OCR処理の文字セットがリストに記録されたデータ(文字列)に制限される。そのため、制約条件の範囲内で文字認識を行なった場合に、文字認識の精度をさらに向上させることができる。
情報処理装置100は、画像処理装置200から送信されるサンプル帳票画像を入力することにより、制約条件としてのリストを更新する。ユーザは、画像処理装置200を学習モードに設定した後に、当該画像処理装置200から情報処理装置100に帳票画像データを送信することにより、リストにデータを追加できる。これにより、例えば担当者リストに担当者を容易に追加できる。
(第2の実施の形態)
本実施の形態に係る情報処理装置は、入力されたサンプル帳票画像のフィールドの項目名(フィールド名)からも各フィールドのデータ型を推定する点において、第1の実施の形態に係る情報処理装置100とは異なる。その他の点では、各情報処理装置は同一の構成である。
情報処理装置は、第1の実施の形態と同様、フォーマットの登録時に、入力されたサンプル帳票画像に対してOCR処理を行なうことにより、各フィールドの項目名(フィールド名)を認識する。情報処理装置は、認識したフィールド名に基づいて、当該フィールド名が付されたフィールドのデータ型を推定する。情報処理装置は、フィールド名が例えば「商品コード」等の「xxコード」の場合、英数字及びハイフンのみからなる文字列をデータ型として推定する。
本実施の形態では、フィールド名に基づくデータ型の推定処理は、フォーマットの登録時に実行される。なお、フィールド名に基づくデータ型の推定処理は、制約条件の学習時に行なうように構成されていてもよい。
(第3の実施の形態)
本実施の形態に係る情報処理装置は、各フィールドに有効な値が記入された記入済みのサンプル帳票画像が入力されることにより、帳票のフォーマットの登録、並びに、フィールドに記入されたデータ値及び当該フィールドの制約条件の登録を行なう点において、第1の実施の形態に係る情報処理装置100とは異なる。その他の点では、各情報処理装置は同一の構成である。
図18を参照して、情報処理装置400は、図7に示される制御部110に代えて、制御部410を含む。制御部410は、第1の実施の形態と同様、フォーマット学習部110a、フォーマット判定部110b、フィールド認識部110c、及びフォーマットモデル記憶部118bを含む。本実施の形態では、画像処理装置から送信された帳票画像データが示すサンプル帳票画像は、フォーマット学習部110a及びフォーマット判定部110bに入力される。
画像処理装置は、各フィールドに有効な値が記入された記入済みのサンプル帳票の画像を画像読取部230(図4参照)で読取り、読取った帳票画像データを情報処理装置400に送信する。こうした処理は、画像処理装置の操作パネル222(図4参照)に表示される帳票フォーマット登録画面300(図5参照)をユーザが操作することによって実行される。
情報処理装置400は、画像処理装置から送信された帳票画像データを受信すると、受信した帳票画像データが示すサンプル帳票画像及び当該帳票画像データに付加されているフォーマット名をフォーマット学習部110aに入力するとともに、受信した帳票画像データが示すサンプル帳票画像をフォーマット判定部110bに入力する。サンプル帳票画像が入力されると、フォーマット学習部110aは、第1の実施の形態と同様のフォーマット登録処理を実行する。フォーマット登録処理が終了すると、フォーマット判定部110b及びフィールド認識部110cは、第1の実施の形態と同様の制約条件の学習処理を実行する。
このように、本実施の形態では、各フィールドに有効な値が記入された記入済みのサンプル帳票画像が情報処理装置400に入力されることにより、帳票のフォーマットを登録する処理、及び帳票画像に含まれる各フィールドの制約条件を学習する処理が実行される。処理毎にサンプル帳票の帳票画像データを情報処理装置400に送信する必要がないため、帳票画像データを送信する手間が省かれる。
なお、各フィールドに有効な値が記入された記入済みのサンプル帳票画像を情報処理装置400に送信する場合、操作パネル222に表示される帳票フォーマット登録画面300が操作される。画像処理装置は学習モードが不要となる。そのため、本実施の形態では、当該画像処理装置に学習モードを設定する機能が省かれている。
本実施の形態に係る情報処理装置400はさらに、第2の実施の形態で示したように、入力されたサンプル帳票画像のフィールドの項目名(フィールド名)から各フィールドのデータ型を推定するように構成されていてもよい。
(第4の実施の形態)
図19を参照して、本実施の形態に係る画像処理装置500は、帳票画像を処理する情報処理装置としての機能を持つ。すなわち、本実施の形態では、第1の実施の形態において情報処理装置100が行なっていた帳票画像の処理を、画像処理装置500が実行する。帳票画像の処理時には、画像処理装置500は、主としてスキャナモードで動作する。画像処理装置500はさらに、画像読取部230で読取った帳票(サンプル帳票を含む)の画像に対して、OCR処理を実行するOCR機能を持つ。
この画像処理装置500は、図4に示される制御部210に代えて、制御部510を含む。制御部510は、機能部としての、フォーマット学習部、フォーマット判定部、及びフィールド認識部を含む。これら機能部は、図7に示されるフォーマット学習部110a、フォーマット判定部110b、及びフィールド認識部110cと同様の構成である。制御部510はさらに、図4に示される記憶装置218に代えて、記憶装置520を含む。
記憶装置520は、通電が遮断された場合にもデータを保持する不揮発性記憶装置であり、例えばハードディスクドライブ(HDD)又はフラッシュメモリ等である。図20を参照して、記憶装置520は、サンプル帳票の認識結果のデータを蓄積するデータベース520aを含む。データベース520aは、フォーマットモデルを記憶するフォーマットモデル記憶部520b、及び出力されたデータセット(OCR処理により認識されたデータ値)を記憶する出力データセット記憶部520cを含む。データベース520a、フォーマットモデル記憶部520b及び出力データセット記憶部520cは、それぞれ、図3に示されるデータベース118a、フォーマットモデル記憶部118b及び出力データセット記憶部118cと同様の構成である。
画像処理装置500は、帳票又はサンプル帳票の画像を読取ることによって帳票画像(サンプル帳票画像を含む)を自装置に入力する。帳票画像が入力されると、画像処理装置500は、第1の実施の形態に係る情報処理装置100と同様にして、帳票のフォーマットを登録する処理、及び帳票画像に含まれる各フィールドの制約条件を学習する処理を実行する。
このように構成された本実施の形態に係る画像処理装置500は、第1の実施の形態に係る情報処理装置と同様の効果を奏する。
(変形例)
上記実施の形態では、情報処理装置の一種であるサーバ装置に本発明を適用した例について示したが、本発明はそのような実施の形態には限定されない。情報処理装置は、サーバ装置以外の処理装置であってもよい。例えば、情報処理装置はPC等の処理装置であってもよいし、MFPのような画像処理装置であってもよい。
上記実施の形態では、帳票処理システムを構成する画像処理装置に複合機を用いた例について示したが、本発明はそのような実施の形態には限定されない。例えば複合機に代えて、又は複合機とともに、スキャナ装置等の画像処理装置を含むように帳票処理システムを構成してもよい。スキャナ装置等の画像処理装置で読取った帳票画像データは、直接、情報処理装置に送信される構成であってもよいし、PC等を介して、情報処理装置に送信される構成であってもよい。さらに、画像処理装置は、デジタルカメラ等の画像を撮像する機能を持つ処理装置であってもよい。
上記実施の形態では、画像処理装置で読取ったサンプル帳票画像を情報処理装置に送信することにより、フォーマットモデルをデータベースに登録する例について示したが、本発明はそのような実施の形態には限定されない。フォーマットモデルの登録は、画像処理装置以外の装置を用いて登録するようにしてもよい。さらに、帳票処理システムの運用前、例えば情報処理装置の出荷前にフォーマットモデルを登録しておくようにしてもよい。
上記実施の形態では、画像処理装置の操作パネルに表示される画面を操作することによって、帳票のフォーマットの登録、及び制約条件の学習を情報処理装置に指示する例について示したが、本発明はそのような実施の形態には限定されない。例えば、情報処理装置の設定等を切替えることによって、当該情報処理装置に、フォーマットの登録、制約条件の学習、及び帳票の値を認識する処理等を実行させるようにしてもよい。
上記実施の形態では、サンプル帳票画像の各フィールドの近傍に印刷された項目名を認識することにより、各フィールド及び各フィールドの記入値がどの項目に対応するかを判別する例について示したが、本発明はそのような実施の形態には限定されない。例えば、各フィールドが帳票上のどの位置に配置されているか等を示す帳票定義情報を参照することにより、各フィールド及び各フィールドの記入値がどの項目に対応するかを判別するようにしてもよい。
上記で開示された技術を適宜組合せて得られる実施の形態についても、本発明の技術的範囲に含まれる。
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに限定されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内での全ての変更を含む。
50 帳票処理システム
60 ネットワーク
100、400 情報処理装置
110、210、410、510 制御部
110a フォーマット学習部
110b フォーマット判定部
110c フィールド認識部
118 HDD
130 入力I/F
140 ディスプレイI/F
150 ネットワークI/F
200、500 画像処理装置
218、520 記憶装置
220 操作ユニット
230 画像読取部
240 画像処理部
250 画像形成部

Claims (5)

  1. 帳票内のフィールドに記入された値を文字認識して出力する情報処理装置であって、
    サンプル帳票のフォーマット情報、当該サンプル帳票のフィールドに記入されたデータ値、及び当該データ値に基づいて生成された当該フィールドの記入上の制約条件を互いに関連付けて記憶するための記憶手段と、
    帳票画像を入力するための帳票入力手段と、
    前記帳票入力手段を介して帳票画像が入力されたことに応答して、当該帳票画像に対応するフォーマット情報及び制約条件を前記記憶手段から読出し、読出したフォーマット情報により特定されたフィールドにおける前記帳票画像の記入値を当該フィールドの制約条件の範囲内で文字認識するための文字認識制約手段と、
    前記文字認識制約手段により文字認識されたデータ値を出力するためのデータ出力手段とを含む、情報処理装置。
  2. 前記情報処理装置はさらに、
    記入済みのサンプル帳票画像を入力するためのサンプル帳票入力手段と、
    前記サンプル帳票入力手段を介して記入済みのサンプル帳票画像が入力されたことに応答して、当該記入済みのサンプル帳票画像に対応するフォーマット情報を前記記憶手段から読出し、読出したフォーマット情報に基づいて、入力された当該サンプル帳票画像のフィールドに記入された値を文字認識するための文字認識手段と、
    前記文字認識手段により認識されたデータ値を対応するフィールドの有効値として前記記憶手段に記憶し、当該有効値に基づいて、前記記憶手段に記憶されている制約条件を更新するための制約条件更新手段を含む、請求項1に記載の情報処理装置。
  3. 前記情報処理装置はさらに、前記文字認識手段により認識されたデータ値を含むリストを制約条件として生成するためのリスト生成手段を含み、
    前記制約条件更新手段は、前記文字認識手段により認識されたデータ値を前記リストに追加することにより、前記制約条件を更新するためのリスト更新手段を含み、
    前記文字認識制約手段は、
    前記帳票入力手段を介して帳票画像が入力されたことに応答して、当該帳票画像に対応するフォーマット情報及び制約条件を前記記憶手段から読出し、読出したフォーマット情報に基づいて特定された所定のフィールドにおける前記帳票画像の記入値が前記リストに含まれるか否かに基づいて、当該フィールドの記入上の制約条件を満たすことを検証するためのリスト検証手段と、
    前記リスト検証手段の検証結果に応じて、入力された前記帳票画像のフィールドの記入値を、前記リストに含まれるデータ値の範囲内で文字認識するための認識手段と、を含む、請求項2に記載の情報処理装置。
  4. 前記情報処理装置はさらに、
    記入済みのサンプル帳票画像を入力するためのサンプル帳票入力手段と、
    前記サンプル帳票入力手段を介して記入済みのサンプル帳票画像が入力されたことに応答して、当該記入済みのサンプル帳票画像に対応するフォーマット情報を前記記憶手段から読出し、読出したフォーマット情報に基づいて、入力された当該サンプル帳票画像のフィールドに記入された値を文字認識するための文字認識手段と、
    前記文字認識制約手段により認識されたデータ値、及び前記文字認識手段により認識されたデータ値を対応するフィールドの有効値として前記記憶手段に蓄積するためのデータ蓄積手段と、
    前記データ蓄積手段により蓄積されたフィールドの有効値の集合からこれら有効値を許容する書式の制約条件を推定することにより、当該フィールドの記入上の制約条件を生成するための制約条件生成手段とを含む、請求項1に記載の情報処理装置。
  5. 前記文字認識制約手段はさらに、入力された前記帳票画像のフィールドの記入値に対して当該フィールドの制約条件を満たすような文字認識が可能か否かを判定し、
    前記情報処理装置はさらに、前記文字認識制約手段による判定結果が否定であることに応答して、当該フィールドに対してエラーフラグを設定するためのフラグ設定手段を含む、請求項1〜請求項4のいずれかに記載の情報処理装置。
JP2015121238A 2015-06-16 2015-06-16 情報処理装置 Pending JP2017010069A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015121238A JP2017010069A (ja) 2015-06-16 2015-06-16 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015121238A JP2017010069A (ja) 2015-06-16 2015-06-16 情報処理装置

Publications (1)

Publication Number Publication Date
JP2017010069A true JP2017010069A (ja) 2017-01-12

Family

ID=57763746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015121238A Pending JP2017010069A (ja) 2015-06-16 2015-06-16 情報処理装置

Country Status (1)

Country Link
JP (1) JP2017010069A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934244A (zh) * 2017-12-15 2019-06-25 京瓷办公信息系统株式会社 格式类别学习系统以及图像处理装置
JP2019133719A (ja) * 2019-05-09 2019-08-08 株式会社 みずほ銀行 帳票対応システム、帳票対応方法及び帳票対応プログラム
JP2019133320A (ja) * 2018-01-30 2019-08-08 三菱電機インフォメーションシステムズ株式会社 記入領域抽出装置および記入領域抽出プログラム
JP2019133218A (ja) * 2018-01-29 2019-08-08 株式会社 みずほ銀行 帳票対応システム、帳票対応方法及び帳票対応プログラム
JP2019169026A (ja) * 2018-03-26 2019-10-03 株式会社Pfu 情報処理装置、文字認識エンジン最適化方法及びプログラム
JP2019204401A (ja) * 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム
CN111582282A (zh) * 2020-05-13 2020-08-25 科大讯飞股份有限公司 一种文本识别方法、装置、设备及存储介质
JP2020154997A (ja) * 2019-03-22 2020-09-24 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2020173819A (ja) * 2020-06-03 2020-10-22 Tis株式会社 財務諸表読取装置、財務諸表読取方法及びプログラム
JPWO2020071558A1 (ja) * 2018-10-05 2021-10-07 Arithmer株式会社 帳票レイアウト解析装置、その解析プログラムおよびその解析方法
JP7115279B2 (ja) 2018-12-11 2022-08-09 トヨタ自動車株式会社 燃料電池システム

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934244B (zh) * 2017-12-15 2023-04-28 京瓷办公信息系统株式会社 格式类别学习系统以及图像处理装置
CN109934244A (zh) * 2017-12-15 2019-06-25 京瓷办公信息系统株式会社 格式类别学习系统以及图像处理装置
JP2019133218A (ja) * 2018-01-29 2019-08-08 株式会社 みずほ銀行 帳票対応システム、帳票対応方法及び帳票対応プログラム
GB2583258B (en) * 2018-01-30 2021-03-24 Mitsubishi Electric Corp Entry field extraction device and entry field extraction program
JP2019133320A (ja) * 2018-01-30 2019-08-08 三菱電機インフォメーションシステムズ株式会社 記入領域抽出装置および記入領域抽出プログラム
WO2019150628A1 (ja) * 2018-01-30 2019-08-08 三菱電機株式会社 記入領域抽出装置および記入領域抽出プログラム
US11430241B2 (en) 2018-01-30 2022-08-30 Mitsubishi Electric Corporation Entry field extraction device and computer readable medium
GB2583258A (en) * 2018-01-30 2020-10-21 Mitsubishi Electric Corp Entry area extraction device and entry area extraction program
JP2019169026A (ja) * 2018-03-26 2019-10-03 株式会社Pfu 情報処理装置、文字認識エンジン最適化方法及びプログラム
JP2019204401A (ja) * 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム
JPWO2020071558A1 (ja) * 2018-10-05 2021-10-07 Arithmer株式会社 帳票レイアウト解析装置、その解析プログラムおよびその解析方法
JP7396568B2 (ja) 2018-10-05 2023-12-12 Arithmer株式会社 帳票レイアウト解析装置、その解析プログラムおよびその解析方法
JP7115279B2 (ja) 2018-12-11 2022-08-09 トヨタ自動車株式会社 燃料電池システム
JP2020154997A (ja) * 2019-03-22 2020-09-24 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7118923B2 (ja) 2019-05-09 2022-08-16 株式会社 みずほ銀行 帳票対応システム、帳票対応方法及び帳票対応プログラム
JP2019133719A (ja) * 2019-05-09 2019-08-08 株式会社 みずほ銀行 帳票対応システム、帳票対応方法及び帳票対応プログラム
CN111582282A (zh) * 2020-05-13 2020-08-25 科大讯飞股份有限公司 一种文本识别方法、装置、设备及存储介质
CN111582282B (zh) * 2020-05-13 2024-04-12 科大讯飞股份有限公司 一种文本识别方法、装置、设备及存储介质
JP2020173819A (ja) * 2020-06-03 2020-10-22 Tis株式会社 財務諸表読取装置、財務諸表読取方法及びプログラム

Similar Documents

Publication Publication Date Title
JP2017010069A (ja) 情報処理装置
JP5311873B2 (ja) ドキュメント生成装置、ドキュメント生成方法及びプログラム
JP2013235595A (ja) エラー通知方法およびエラー通知装置
JP2006229670A (ja) 画像形成装置およびプログラム
JP4959501B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2021047792A (ja) 情報処理装置及びプログラム
JP2010039542A (ja) 業務情報管理システム
US11363162B2 (en) System and method for automated organization of scanned text documents
US11170211B2 (en) Information processing apparatus for extracting portions filled with characters from completed document without user intervention and non-transitory computer readable medium
CN114564931A (zh) 基于tinymce的电子证明文件生成方法及系统
JP7271987B2 (ja) 情報処理装置及びプログラム
JP5851962B2 (ja) 中継サーバ
JP5712012B2 (ja) 入力シートシステム、入力シート処理方法、及び入力シート処理プログラム
JP2009070246A (ja) 情報処理システム,情報処理装置,プログラム,および記録媒体
JP6281739B2 (ja) 処理装置及びプログラム
JP2003036260A (ja) データ管理装置およびデータ管理装置の制御方法およびプログラムおよび記憶媒体
JP2021072490A (ja) 画像処理装置、その制御方法及びプログラム
US20240320996A1 (en) Information processing apparatus, information processing method, and storage medium
JP6736742B1 (ja) 帳票処理プログラム、帳票処理装置、帳票処理方法
US20230325126A1 (en) Information processing apparatus and method and non-transitory computer readable medium
US20220269855A1 (en) Information generation system, workflow system, computer-readable non-transitory recording medium storing information generation program, and computer-readable non-transitory recording medium storing workflow program
JP2005011146A (ja) 操作画面表示装置、操作画面表示方法及び操作画面表示プログラム
JP2001202362A (ja) 文字編集処理装置
JP2007265358A (ja) 情報処理装置、プログラム及び業務アプリケーション導入方法
JP5107203B2 (ja) 情報処理装置、情報処理方法、情報処理システム、及びプログラム