JP2012043334A - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP2012043334A
JP2012043334A JP2010186005A JP2010186005A JP2012043334A JP 2012043334 A JP2012043334 A JP 2012043334A JP 2010186005 A JP2010186005 A JP 2010186005A JP 2010186005 A JP2010186005 A JP 2010186005A JP 2012043334 A JP2012043334 A JP 2012043334A
Authority
JP
Japan
Prior art keywords
image
evaluation
information
column
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010186005A
Other languages
English (en)
Inventor
Yoshihide Koya
嘉英 甲谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2010186005A priority Critical patent/JP2012043334A/ja
Publication of JP2012043334A publication Critical patent/JP2012043334A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】第1の画像内の情報と第2の画像内の情報とが対応している度合に基づいて、第1の画像と第2の画像を選択するようにした画像処理装置を提供する。
【解決手段】画像処理装置の抽出手段は、画像内の予め定められた領域を抽出し、認識手段は、前記抽出手段によって抽出された領域内の画像を文字認識し、評価点決定手段は、第1の画像に対して前記認識手段によって文字認識された第1の情報と、第2の画像に対して前記認識手段によって文字認識された第2の情報とが対応している度合を示す評価点を決定し、選択手段は、前記評価点決定手段によって決定された評価点に基づいて、前記第1の画像と前記第2の画像の組を選択する。
【選択図】図1

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
特許文献1には、領収書の帳簿への記帳等の労力を軽減できるとともに、税務申告の下となる領収書の真偽の判別を容易に行える税務チェックシステムを提供することを課題とし、発行される領収書に対してシリアルナンバーを付与するとともに、発行された領収書データを記憶しておく第三者機関のホストコンピュータと、前記第三者機関のホストコンピュータから割り当てられたシリアルナンバーを記載して領収書を発行する領収書発行手段と、発行された領収書のシリアルナンバーを前記第三者機関のホストコンピュータへ送信して対応する領収書データを引き出して照合させる領収書内容照合手段と、領収書のシリアルナンバーと対応させて支払金額の集計をする支払金額集計手段と、前記第三者機関のホストコンピュータに記憶された領収書データを受信して、売上金額を把握する売上金額把握手段と、を含むことが開示されている。
特開2002−109156号公報
本発明は、第1の画像内の情報と第2の画像内の情報とが対応している度合に基づいて、第1の画像と第2の画像を選択するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像内の予め定められた領域を抽出する抽出手段と、前記抽出手段によって抽出された領域内の画像を文字認識する認識手段と、第1の画像に対して前記認識手段によって文字認識された第1の情報と、第2の画像に対して前記認識手段によって文字認識された第2の情報とが対応している度合を示す評価点を決定する評価点決定手段と、前記評価点決定手段によって決定された評価点に基づいて、前記第1の画像と前記第2の画像の組を選択する選択手段を具備することを特徴とする画像処理装置である。
請求項2の発明は、前記評価点決定手段は、第1の画像の種類、第1の項目、演算子、第2の画像の種類、第2の項目、評価点によって構成されている規則を抽出し、該第1の画像の種類と該第2の画像の種類によって前記第1の画像と前記第2の画像を特定し、該第1の項目と対になっている前記第1の情報と該第2の項目と対になっている前記第2の情報とが該演算子の関係を満たすか否かによって、前記評価点を決定することを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記規則には、さらに、演算子の関係を満たす範囲を示す許容値を含み、前記評価点決定手段は、前記第1の項目名と対になっている第1の情報と前記第2の項目名と対になっている第2の情報とが、前記許容値が示す範囲内で前記演算子の関係を満たすか否かによって、前記評価点を決定することを特徴とする請求項2に記載の画像処理装置である。
請求項4の発明は、業務と該業務で必要とする書類の種類と該書類に対応する書類の種類を記憶している業務書類情報を用いて、前記規則を生成する規則生成手段をさらに具備することを特徴とする請求項2又は3に記載の画像処理装置である。
請求項5の発明は、前記評価点決定手段は、前記第1の画像を読み取った際の属性を前記第1の情報として又は前記第2の画像を読み取った際の属性を前記第2の情報として、評価点を決定することを特徴とする請求項1から4に記載の画像処理装置である。
請求項6の発明は、コンピュータを、画像内の予め定められた領域を抽出する抽出手段と、前記抽出手段によって抽出された領域内の画像を文字認識する認識手段と、第1の画像に対して前記認識手段によって文字認識された第1の情報と、第2の画像に対して前記認識手段によって文字認識された第2の情報とが対応している度合を示す評価点を決定する評価点決定手段と、前記評価点決定手段によって決定された評価点に基づいて、前記第1の画像と前記第2の画像の組を選択する選択手段として機能させるための画像処理プログラムである。
請求項1の画像処理装置によれば、第1の画像内の情報と第2の画像内の情報とが対応している度合に基づいて、第1の画像と第2の画像を選択することができる。
請求項2の画像処理装置によれば、規則に基づいて評価点を決定することができる。
請求項3の画像処理装置によれば、許容値が示す範囲内で規則内の演算子の関係を満たすか否かによって、評価点を決定することができる。
請求項4の画像処理装置によれば、業務書類情報を用いて規則を生成することができる。
請求項5の画像処理装置によれば、画像を読み取った際の属性を用いて評価点を決定することができる。
請求項6の画像処理プログラムによれば、第1の画像内の情報と第2の画像内の情報とが対応している度合に基づいて、第1の画像と第2の画像を選択することができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態による評価までの処理例を示すフローチャートである。 ログ情報テーブルのデータ構造例を示す説明図である。 解析パラメータテーブルのデータ構造例を示す説明図である。 認識結果テーブルのデータ構造例を示す説明図である。 評価パラメータテーブルのデータ構造例を示す説明図である。 証跡データテーブルのデータ構造例を示す説明図である。 本実施の形態による評価後の処理例を示すフローチャートである。 ワークフローの例を示す説明図である。 ワークフロー必要書類テーブルのデータ構造例を示す説明図である。 本実施の形態が対象とする画像の例を示す説明図である。 本実施の形態が対象とする画像の例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶している」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である画像処理装置は、図1の例に示すように、画像受付モジュール110、レイアウト解析モジュール120、解析パラメータ記憶モジュール125、文字認識モジュール130、認識結果記憶モジュール135、評価モジュール140、評価パラメータ記憶モジュール145、証跡データ記憶モジュール150、候補選択モジュール155、出力モジュール160、評価パラメータ生成モジュール170、ワークフロー記憶モジュール175を有している。
本実施の形態は、企業の統制活動である財務内部統制に主に利用される。
財務内部統制とは、1992年にCOSO(トレッドウェイ委員会組織委員会)が発表した「内部統制−統合的枠組み」が、事実上の標準となっており、「(1)業務の有効性・効率性、(2)財務諸表の信頼性、(3)関連法規の遵守の3つの目的を達成するために、合理的な保証を提供することを意図した、取締役会、経営者及びその他の職員によって遂行される1つのプロセス」と定義されている。
そして、財務内部統制の評価においては、業務プロセス内で発生した取引の内容が正しいかどうかを確認することが一般的に実施される。取引の内容が正しいかどうかは、取引で使用された証跡(例えば、請求書)に対して証憑(例えば、領収証)をつき合わせることで確認される。証跡と証憑の対(例えば、請求書とその請求書に対する領収書)に対する確認は、証跡と証憑が画像である場合(つまり、証跡と証憑が紙の書類であり、それをスキャナー等の画像読取装置によって読み込ませた場合)、担当者による目視での確認が必要である。本実施の形態は、この目視での確認を必要とする証跡の画像と証憑の画像を選択するものである。
画像受付モジュール110は、レイアウト解析モジュール120と接続されており、画像を受け付けて、その画像をレイアウト解析モジュール120へ渡す。画像を受け付けるとは、例えば、スキャナー、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、CCD(Charge−Coupled Device)等で映像を撮影すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、複数枚の画像である。また、画像の内容として、主にビジネスに用いられる文書等であり、特に財務内部統制の評価の対象となる文書である。画像受付モジュール110が受け付ける証跡の画像として図11に例示する請求書画像1100、証憑の画像として図12に例示する領収書画像1200等がある。
また、画像受付モジュール110は、画像とともにその画像を読み取った際の属性(いわゆるログ情報)を受け取るようにしてもよい。受け取る属性として、例えば、ログ情報テーブル300がある。図3は、ログ情報テーブル300のデータ構造例を示す説明図である。ログ情報テーブル300は、画像ID欄310、読取日時欄320、操作者ID欄330、読取機器ID欄340、読取機器の場所欄350、読取操作種別欄360を有している。画像ID欄310は、その画像を示す画像ID(IDentification)を記憶している。読取日時欄320は、その画像をスキャナーが読み込んだ日時(日時に限らず、年、月、日、分、秒、秒以下を含めてもよい)を記憶している。操作者ID欄330は、そのスキャナーの操作者を示す操作者IDを記憶している。操作者IDを取得するのに、例えば、そのスキャナーを使用するにあたって、操作者が所持しているICカード内の操作者IDをスキャナーに備え付けられているICカードリーダーで読み取る。読取機器ID欄340は、そのスキャナーを示す読取機器IDを記憶している。読取機器の場所欄350は、そのスキャナーが設置されている場所を記憶している。読取操作種別欄360は、そのスキャナーでの操作種別を記憶している。操作種別として、例えば、スキャナーで読み取った際の一連の操作、又は読み取った際のスキャナーの設定情報(カラー又は白黒、読取濃度等)等がある。
なお、画像を読み取った際の属性は、評価モジュール140によって利用される。
レイアウト解析モジュール120は、画像受付モジュール110、解析パラメータ記憶モジュール125、文字認識モジュール130と接続されている。画像受付モジュール110によって受け付けられた画像内の予め定められた領域を抽出する。そして、抽出した領域内の画像を文字認識モジュール130へ渡す。例えば、予め定められた領域として、解析パラメータ記憶モジュール125内に記憶されている解析パラメータを用いる。抽出領域として、例えば、図11に示す請求書画像1100からは領域1102〜1120、図12に示す領収書画像1200からは領域1202〜1214がある。
解析パラメータ記憶モジュール125は、レイアウト解析モジュール120と接続されている。例えば、画像毎に解析パラメータテーブル400を記憶している。図4は、解析パラメータテーブル400のデータ構造例を示す説明図である。解析パラメータテーブル400は、領域欄410、領域種欄420を有している。領域欄410は、X欄412、Y欄414、W欄416、H欄418を有している。画像をXY座標系で表し、領域の位置を示すものである。X欄412は、領域の左上のX座標を記憶している。Y欄414は、領域の左上のY座標を記憶している。W欄416は、領域の幅を記憶している。H欄418は、領域の高さを記憶している。領域種欄420は、その領域の種類を記憶している。領域の種類として、例えば、作成日付、書類番号、宛先、発行元、請求先、金額(請求金額、支払金額等)、品目、数量、単価、連絡先、書類名等がある。例えば、図11に例示した請求書画像1100内の領域1102は作成日付である。なお、書類名の領域の文字認識結果を後述する書類の種類としてもよい。
文字認識モジュール130は、レイアウト解析モジュール120、認識結果記憶モジュール135と接続されている。レイアウト解析モジュール120によって抽出された領域内の画像を文字認識する。文字認識は既存の技術を用いる。文字認識結果を認識結果記憶モジュール135に記憶させる。
認識結果記憶モジュール135は、文字認識モジュール130、評価モジュール140と接続されている。文字認識モジュール130による文字認識結果を、例えば画像毎に認識結果テーブル500のように記憶している。図5は、認識結果テーブル500のデータ構造例を示す説明図である。認識結果テーブル500は、項目名欄510、値欄520を有している。項目名欄510は、解析パラメータテーブル400の領域種欄420から取得した領域の種類を記憶している。また、領域内の画像に項目名が含まれている場合は、その文字認識結果である項目名を記憶するようにしてもよい。値欄520は、その領域内の画像を文字認識した結果を記憶している。
評価モジュール140は、認識結果記憶モジュール135、評価パラメータ記憶モジュール145、証跡データ記憶モジュール150と接続されている。第1の画像に対して文字認識モジュール130によって文字認識された第1の情報と、第2の画像に対して文字認識モジュール130によって文字認識された第2の情報とが対応している度合を示す評価点を決定する。具体的には、例えば、認識結果記憶モジュール135内の証跡の画像に対して文字認識された結果である認識結果テーブル500内の値欄520の情報と、認識結果記憶モジュール135内のその証跡の画像に対応している証憑の画像に対して文字認識された結果である認識結果テーブル500内の値欄520の情報を用いて、評価値を決定する。
より具体的には、評価モジュール140は、第1の画像の種類、第1の項目、演算子、第2の画像の種類、第2の項目、評価点によって構成されている規則を評価パラメータ記憶モジュール145から抽出し、その第1の画像の種類とその第2の画像の種類によって第1の画像と第2の画像を特定し、その第1の項目と対になっている第1の情報とその第2の項目と対になっている第2の情報とがその演算子の関係を満たすか否かによって、評価点を決定するようにしてもよい。
また、評価モジュール140は、第1の項目名と対になっている第1の情報と第2の項目名と対になっている第2の情報とが、規則内の許容値が示す範囲内で演算子の関係を満たすか否かによって、評価点を決定するようにしてもよい。
また、評価モジュール140は、第1の画像を読み取った際の属性を第1の情報として又は第2の画像を読み取った際の属性を第2の情報として、評価点を決定するようにしてもよい。
評価パラメータ記憶モジュール145は、評価モジュール140、評価パラメータ生成モジュール170と接続されている。評価パラメータ記憶モジュール145は、例えば、評価パラメータテーブル600を記憶している。図6は、評価パラメータテーブル600のデータ構造例を示す説明図である。評価パラメータテーブル600は、評価パラメータID欄610、画像の種類A欄620、項目名A欄630、演算子欄640、画像の種類B欄650、項目名B欄660、許容値欄670、評価点欄680を有している。評価パラメータID欄610は、評価パラメータを示す評価パラメータIDを記憶している。画像の種類A欄620は、第1の画像の種類を記憶している。画像の種類として、例えば、文書の書類名(請求書、領収書等)、第1の文書を示す文書IDであってもよい。項目名A欄630は、画像の種類A欄620の第1の文書における第1の項目名であり、比較対象となる情報の項目名を記憶している。認識結果テーブル500の項目名欄510に対応する。演算子欄640は、項目名A欄630の第1の項目名に対応する情報と項目名B欄660の第2の項目名に対応する情報とを比較する演算子を記憶している。画像の種類B欄650は、画像の種類A欄620の第1の画像と対応している第2の画像の種類を記憶している。項目名B欄660は、画像の種類B欄650の第2の文書における第2の項目名であり、比較対象となる情報の項目名を記憶している。認識結果テーブル500の項目名欄510に対応する。許容値欄670は、演算子欄640の演算子の関係を満たす範囲を示す許容値を記憶している。なお、許容値欄670はなくてもよい。評価点欄680は、評価点を記憶している。
例えば、画像の種類A欄620は証跡の画像である“請求書”、項目名B欄660には証憑の画像である請求書に対応する“領収書”を記憶する。
例えば、項目名A欄630、項目名B欄660は“金額”を記憶する。つまり、請求書の請求額(図11に例示する請求書画像1100内の領域1120)と領収書の金額(図12に例示する領収書画像1200内の領域1206)とを比較対象とすることを示している。
例えば、演算子欄640は“=”(等しい)、“!=”(異なる)、“>”(前が大きい)、“<”(前が小さい)、“>=”(前が後ろ以上)、“<=”(前が後ろ以下)等を記憶する。
例えば、許容値欄670は演算子によって評価された結果の揺らぎをどの程度まで許容するかを示す許容値を記憶する。例えば、許容値には、−100から100まで指定し得る。許容値が−5の場合、後者の属性値が前者の属性値の−5%までの範囲なら問題無いと見なす。使い方としては、請求金額3000円に対し、領収金額が2950円といったことが現実には存在する。演算子に“=”を指定し、許容値の値が−5の場合、領収書金額が2850円から3000円までは等しいと評価される。
例えば、評価点欄680は評価点として0から4294967295(32bit値の最大値)までの値を記憶する。ここでの評価点は、両者が演算子欄640の関係を有していない場合(又は、許容値を適用しても演算子欄640の関係を有していない場合)に適用されるものである。また、評価点が高い点であることは、証跡の画像と証憑の画像が適合していないこと、つまり、人が目視によって確認する必要が高いことを示している。なお、評価点を、両者が演算子欄640の関係を有している場合(又は、許容値を適用して演算子欄640の関係を有している場合)に適用されるものであるとしてもよい。また、評価点が低い点であることは、証跡の画像と証憑の画像が適合していないこと、つまり、人が目視によって確認する必要が高いことを示しているとしてもよい。
評価パラメータの例を示す。なお、この例は、評価パラメータテーブル600の画像の種類A欄620から右側の欄に記憶されているパラメータを順に示している。
(1) 請求書,金額,=,領収書,金額,−5,100
(2) 請求書,発行元,=,領収書,発行元,0,50
(3) 請求書,スキャナーを操作した人物,=,請求書,宛先,0,10
(1)の例では、領収書の金額が請求書の金額の95%から100%でなければ評価点が100となることを示している。
(2)の例では、請求書と領収書の発行元が異なれば重みが50となることを示している。
(3)の例では、請求書の読取りに際してスキャナーを操作した人物の情報と、宛先の人物が異なれば10となることを示している。なお、スキャナーを操作した人物は、前述のログ情報内のデータである「スキャナーの操作者を示す操作者ID」から操作者IDと人物名を対応させて記憶しているID・氏名テーブルを用いて、抽出することができる。また、宛先が組織名である場合は、操作者IDとその操作者が属している組織を対応させて記憶している組織テーブルを用いて、操作者IDが示す操作者はその宛先の組織に属しているか否かを判断するようにしてもよい。
これらの例の他に、請求書の日付よりも領収書の日付の方が先である、金額が100万以上である等の条件を評価パラメータによって定義してもよい。
このように、評価モジュール140は、評価パラメータに定義されている条件から算出される評価点を加算する。そして、合計された評価点を、評価パラメータID(複数ある場合もある)、対象とした画像IDと共に、証跡データ記憶モジュール150へ登録する。
証跡データ記憶モジュール150は、評価モジュール140、候補選択モジュール155と接続されている。証跡データ記憶モジュール150は、評価点を、評価パラメータID、対象とした画像IDと共に、例えば、証跡データテーブル700のように記憶する。図7は、証跡データテーブル700のデータ構造例を示す説明図である。証跡データテーブル700は、評価パラメータID欄710、画像A−ID欄720、画像B−ID欄730、評価点欄740を有している。評価パラメータID欄710は、評価モジュール140で適用された評価パラメータの評価パラメータID(評価パラメータテーブル600の評価パラメータID欄610)を記憶する。画像A−ID欄720は、評価モジュール140で評価の対象となった画像の画像IDを記憶する。画像B−ID欄730は、評価モジュール140で評価の対象となった画像の画像IDを記憶する。評価点欄740は、評価点を記憶する。
候補選択モジュール155は、証跡データ記憶モジュール150と出力モジュール160と接続されている。候補選択モジュール155は、評価モジュール140によって決定された評価点に基づいて、第1の画像と第2の画像の組を選択する。具体的には、例えば、証跡データ記憶モジュール150内の証跡データテーブル700の評価点欄740を降順にソートし、上位から予め定められた個数の画像A−ID欄720と画像B−ID欄730の画像の組を出力モジュール160へ渡す。また、予め定められた点数以上の評価点欄740である画像A−ID欄720と画像B−ID欄730の画像の組を出力モジュール160へ渡すようにしてもよい。
出力モジュール160は、候補選択モジュール155と接続されており、候補選択モジュール155によって選択された2枚の画像の組(複数組であってもよい)を受け取り、その画像を出力する。画像を出力するとは、例えば、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること、ファックス等の画像送信装置で画像を送信すること、画像データベース等の画像記憶装置へ画像を書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置へ渡すこと等が含まれる。特に、ディスプレイ等の表示装置に表示する場合は、2つの画像を比較しやすいように並べて表示し、評価モジュール140による評価処理において両者の画像で比較した領域を対応付けて表示してもよい。例えば、比較した領域は同じ色を付すようにしてもよい。
評価パラメータ生成モジュール170は、評価パラメータ記憶モジュール145、ワークフロー記憶モジュール175と接続されている。業務とその業務で必要とする書類の種類とその書類に対応する書類の種類を記憶している業務書類情報を用いて、評価パラメータを生成する。具体的には、例えば、業務の工程がワークフローとして定義されており、ワークフローの定義には、各業務において必要とする書類(例えば、証跡)とその書類に対応する書類(例えば、証憑)が少なくとも含まれている。このワークフローの定義から評価パラメータの内、評価パラメータテーブル600の画像の種類A欄620と画像の種類B欄650を生成する。業務において必要とする書類の種類と画像の種類A欄620へ記憶させ、その書類に対応する書類の種類と画像の種類A欄620へ記憶させる。また、他の評価パラメータ(評価パラメータテーブル600の項目名A欄630、演算子欄640、項目名B欄660、許容値欄670、評価点欄680)は、画像の種類A欄620と画像の種類B欄650の組に対応して予め定められた値としてもよいし、管理者によって設定されてもよい。
図9は、ワークフローの例を示す説明図である。このワークフローは、見積依頼業務910、見積業務920、発注業務930、納品業務940、検収業務950、請求業務960、領収業務970の各業務が順に行われるように定義されている。例えば、請求業務960で必要とする書類として請求書があり、請求額に対応する書類として領収書があることが、請求業務960の業務に設定されている。
ワークフロー記憶モジュール175は、評価パラメータ生成モジュール170と接続されており、業務書類情報を記憶している。例えば、ワークフロー必要書類テーブル1000を記憶している。図10は、ワークフロー必要書類テーブル1000のデータ構造例を示す説明図である。ワークフロー必要書類テーブル1000は、業務ID欄1010、必要書類欄1020、対応書類欄1030を有している。業務ID欄1010は、業務を示す業務IDを記憶している。必要書類欄1020は、その業務で必要となる書類の種類を記憶している。対応書類欄1030は、必要書類欄1020の書類に対応している書類の種類を記憶している。
図2は、本実施の形態による評価までの処理例を示すフローチャートである。なお、このフローチャートによる処理は、図8を用いて後述するフローチャートによる処理より前に行うことはもちろんであるが、繰り返し行った後に、図8に例示するフローチャートによる処理を行うようにしてもよい。つまり、図2に例示のフローチャートは書類の収集過程の処理であり、図8に例示するフローチャートは目視すべき書類の選択の処理である。
ステップS202では、画像受付モジュール110が、画像とその画像を読み取った際のログ情報を受け付ける。画像としては、例えば、図11に示す証跡である請求書画像1100、図12に示す証憑である領収書画像1200がある。
ステップS204では、レイアウト解析モジュール120は、解析パラメータ(解析パラメータ記憶モジュール125内の解析パラメータテーブル400)にしたがって、ステップS202で受け付けた画像を解析する。例えば、図11に例示する請求書画像1100から領域1102を作成日付として、領域1104を書類番号として、領域1106を宛先として、領域1108を発行元として、領域1110を連絡先として、領域1112を品目として、領域1114を数量として、領域1116を単価として、領域1118を金額として、領域1120を合計金額として抽出する。また、例えば、図12に例示する領収書画像1200から領域1202を書類番号として、領域1204を宛先として、領域1206を金額として、領域1208を品目として、領域1210を作成日付として、領域1212を連絡先として、領域1214を発行元として抽出する。
ステップS206では、文字認識モジュール130は、ステップS204での解析結果を用いて文字認識を行う。そして、文字認識結果を認識結果記憶モジュール135に記憶させる。
ステップS208では、評価モジュール140は、ステップS206での認識結果に対して、評価パラメータ(評価パラメータ記憶モジュール145内の評価パラメータテーブル600)を用いて評価を行う。例えば、領域1106と領域1214、領域1120と領域1206、領域1112と領域1208等の比較がある。また、ログ情報との比較として、請求書画像1100がスキャナーによって読み込まれた日時と領収書画像1200がスキャナーによって読み込まれた日時、請求書画像1100の読み込みをしたスキャナーを操作した人物と領域1106等の比較がある。
図8は、本実施の形態による評価後の処理例を示すフローチャートである。
ステップS802では、候補選択モジュール155が、評価パラメータ記憶モジュール145に対して、評価点でソートする。
ステップS804では、候補選択モジュール155が、候補を選択する。ステップS802でソートされた候補の上位から予め定められた数の画像の組を候補として選択する。
ステップS806では、出力モジュール160が、ステップS804で選択された候補を目視できるように出力する。
図13を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図13に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナー等のデータ読み取り部1317と、プリンタなどのデータ出力部1318を備えたハードウェア構成例を示している。
CPU1301は、前述の実施の形態において説明した各種のモジュール、すなわち、レイアウト解析モジュール120、文字認識モジュール130、評価モジュール140、証跡データ記憶モジュール150、評価パラメータ生成モジュール170等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1302は、CPU1301が使用するプログラムや演算パラメータ等を格納する。RAM1303は、CPU1301の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1304により相互に接続されている。
ホストバス1304は、ブリッジ1305を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1306に接続されている。
キーボード1308、マウス等のポインティングデバイス1309は、操作者により操作される入力デバイスである。ディスプレイ1310は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1311は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1301によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けた画像、解析パラメータ、認識結果、評価パラメータ、証跡データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1312は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1313に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1307、外部バス1306、ブリッジ1305、及びホストバス1304を介して接続されているRAM1303に供給する。リムーバブル記録媒体1313も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1314は、外部接続機器1315を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1314は、インタフェース1307、及び外部バス1306、ブリッジ1305、ホストバス1304等を介してCPU1301等に接続されている。通信部1316は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1317は、例えばスキャナーであり、ドキュメントの読み取り処理を実行する。データ出力部1318は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図13に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図13に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図13に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナー、プリンタ、複合機(スキャナー、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…画像受付モジュール
120…レイアウト解析モジュール
125…解析パラメータ記憶モジュール
130…文字認識モジュール
135…認識結果記憶モジュール
140…評価モジュール
145…評価パラメータ記憶モジュール
150…証跡データ記憶モジュール
155…候補選択モジュール
160…出力モジュール
170…評価パラメータ生成モジュール
175…ワークフロー記憶モジュール

Claims (6)

  1. 画像内の予め定められた領域を抽出する抽出手段と、
    前記抽出手段によって抽出された領域内の画像を文字認識する認識手段と、
    第1の画像に対して前記認識手段によって文字認識された第1の情報と、第2の画像に対して前記認識手段によって文字認識された第2の情報とが対応している度合を示す評価点を決定する評価点決定手段と、
    前記評価点決定手段によって決定された評価点に基づいて、前記第1の画像と前記第2の画像の組を選択する選択手段
    を具備することを特徴とする画像処理装置。
  2. 前記評価点決定手段は、第1の画像の種類、第1の項目、演算子、第2の画像の種類、第2の項目、評価点によって構成されている規則を抽出し、該第1の画像の種類と該第2の画像の種類によって前記第1の画像と前記第2の画像を特定し、該第1の項目と対になっている前記第1の情報と該第2の項目と対になっている前記第2の情報とが該演算子の関係を満たすか否かによって、前記評価点を決定する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記規則には、さらに、演算子の関係を満たす範囲を示す許容値を含み、
    前記評価点決定手段は、前記第1の項目名と対になっている第1の情報と前記第2の項目名と対になっている第2の情報とが、前記許容値が示す範囲内で前記演算子の関係を満たすか否かによって、前記評価点を決定する
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 業務と該業務で必要とする書類の種類と該書類に対応する書類の種類を記憶している業務書類情報を用いて、前記規則を生成する規則生成手段
    をさらに具備することを特徴とする請求項2又は3に記載の画像処理装置。
  5. 前記評価点決定手段は、前記第1の画像を読み取った際の属性を前記第1の情報として又は前記第2の画像を読み取った際の属性を前記第2の情報として、評価点を決定する
    ことを特徴とする請求項1から4に記載の画像処理装置。
  6. コンピュータを、
    画像内の予め定められた領域を抽出する抽出手段と、
    前記抽出手段によって抽出された領域内の画像を文字認識する認識手段と、
    第1の画像に対して前記認識手段によって文字認識された第1の情報と、第2の画像に対して前記認識手段によって文字認識された第2の情報とが対応している度合を示す評価点を決定する評価点決定手段と、
    前記評価点決定手段によって決定された評価点に基づいて、前記第1の画像と前記第2の画像の組を選択する選択手段
    として機能させるための画像処理プログラム。
JP2010186005A 2010-08-23 2010-08-23 画像処理装置及び画像処理プログラム Pending JP2012043334A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010186005A JP2012043334A (ja) 2010-08-23 2010-08-23 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010186005A JP2012043334A (ja) 2010-08-23 2010-08-23 画像処理装置及び画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2012043334A true JP2012043334A (ja) 2012-03-01

Family

ID=45899529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010186005A Pending JP2012043334A (ja) 2010-08-23 2010-08-23 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP2012043334A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014049069A (ja) * 2012-09-04 2014-03-17 Fuji Xerox Co Ltd 情報処理装置、証跡収集システム及びプログラム
JP2018073323A (ja) * 2016-11-04 2018-05-10 セイコーエプソン株式会社 財務帳票作成システム、財務帳票作成端末、及び財務帳票作成プログラム
JP2018517222A (ja) * 2015-06-12 2018-06-28 ビルトレイダー プロプライエタリー リミテッドBilltrader Pty Ltd コンピュータ実施多通貨インボイス取得、トレード、アクセス及び支払システム
JP2020187613A (ja) * 2019-05-16 2020-11-19 ブラザー工業株式会社 プログラム及び、端末装置
US11276778B2 (en) 2019-12-03 2022-03-15 Kabushiki Kaisha Toshiba Semiconductor device
JP7492358B2 (ja) 2020-03-27 2024-05-29 株式会社日本総合研究所 金融情報処理装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014049069A (ja) * 2012-09-04 2014-03-17 Fuji Xerox Co Ltd 情報処理装置、証跡収集システム及びプログラム
JP2018517222A (ja) * 2015-06-12 2018-06-28 ビルトレイダー プロプライエタリー リミテッドBilltrader Pty Ltd コンピュータ実施多通貨インボイス取得、トレード、アクセス及び支払システム
JP2022116218A (ja) * 2015-06-12 2022-08-09 ビルトレイダー プロプライエタリー リミテッド コンピュータ実施多通貨インボイス取得、トレード、アクセス及び支払システム
JP7246788B2 (ja) 2015-06-12 2023-03-28 ビルトレイダー プロプライエタリー リミテッド コンピュータ実施多通貨インボイス取得、トレード、アクセス及び支払システム
JP2018073323A (ja) * 2016-11-04 2018-05-10 セイコーエプソン株式会社 財務帳票作成システム、財務帳票作成端末、及び財務帳票作成プログラム
JP2020187613A (ja) * 2019-05-16 2020-11-19 ブラザー工業株式会社 プログラム及び、端末装置
JP7279504B2 (ja) 2019-05-16 2023-05-23 ブラザー工業株式会社 プログラム及び、端末装置
US11276778B2 (en) 2019-12-03 2022-03-15 Kabushiki Kaisha Toshiba Semiconductor device
JP7492358B2 (ja) 2020-03-27 2024-05-29 株式会社日本総合研究所 金融情報処理装置

Similar Documents

Publication Publication Date Title
US20190279170A1 (en) Dynamic resource management associated with payment instrument exceptions processing
JP2012043334A (ja) 画像処理装置及び画像処理プログラム
Fröhlich et al. Don’t stop me now! exploring challenges of first-time cryptocurrency users
CN109685477A (zh) 账务处理系统及处理方法
Lee et al. The role of fintech in mitigating information friction in supply chain finance
CN106327321A (zh) 一种自动生成财务数据的方法
KR102437026B1 (ko) 데이터베이스 내에 정보를 등록하는 진보된 방법, 시스템 및 디바이스
KR20180080408A (ko) 정형 및 비정형 데이터 추출 시스템 및 방법
CN106056418A (zh) 一种发票报送方法、装置及系统
CN101512571A (zh) 用于处理图像退回票据的方法和系统
JP7419628B2 (ja) 情報をデータベースに登録する先進的な方法、システム及びデバイス
JP6506652B2 (ja) 帳票読取装置、帳票読取方法および帳票読取システム
BE1026870B1 (nl) Systeem en werkwijze voor automatische verificatie van onkostennota
JP2011028370A (ja) 画像処理装置及び画像処理プログラム
US20190080305A1 (en) Information processing apparatus and display method
US10614068B2 (en) Transaction slip search method, information processing apparatus, and computer product
JP5157309B2 (ja) 情報処理システム及び情報処理プログラム
JP2011008584A (ja) 情報処理装置及び情報処理プログラム
Sretenovic et al. Model payment order in the SEPA system
CN111768547A (zh) 对发票自动验真验重的方法、装置及系统
JP2010157137A (ja) 情報処理装置、情報処理方法、プログラム
US20230137138A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium that stores program
EP3407533A1 (en) Advanced methods, systems and devices for registering information in a database
JP2013058168A (ja) 情報処理装置及び情報処理プログラム
JP6886083B1 (ja) データ処理装置、データ処理方法及びプログラム