JP2009223391A - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP2009223391A
JP2009223391A JP2008064319A JP2008064319A JP2009223391A JP 2009223391 A JP2009223391 A JP 2009223391A JP 2008064319 A JP2008064319 A JP 2008064319A JP 2008064319 A JP2008064319 A JP 2008064319A JP 2009223391 A JP2009223391 A JP 2009223391A
Authority
JP
Japan
Prior art keywords
image
information
extraction
extracted
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008064319A
Other languages
English (en)
Inventor
Katsuhiko Itonori
勝彦 糸乘
Masahiro Kato
雅弘 加藤
Daisuke Tatsumi
大祐 辰巳
Etsuko Ito
悦子 伊藤
Hironari Konno
裕也 今野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2008064319A priority Critical patent/JP2009223391A/ja
Publication of JP2009223391A publication Critical patent/JP2009223391A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】複数枚の画像からの情報抽出結果に対して、その中からどの画像の情報抽出結果に誤りがあるかの確認ができるようにした画像処理装置を提供する。
【解決手段】画像処理装置の画像取得手段は、第1の画像を複数取得し、情報抽出手段は、前記画像取得手段によって取得された第1の画像から所定の情報を抽出し、抽出情報判定手段は、前記情報抽出手段によって所定の情報が抽出されたか否かを判定し、画像情報記憶手段は、前記抽出情報判定手段によって所定の情報が抽出されていないと判定された場合、その対象とした画像を特定するための情報を記憶する。
【選択図】図1

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
従来、紙に印刷されている文書の画像から情報を抽出するために文字認識装置を使う方法が知られている。文字認識装置の認識率は100%ではないため、その文字認識結果を確認する作業が必要である。
また、画像取得装置であるスキャナでは、自動文書送り装置を備えているものがある。自動文書送り装置(ADF:Auto Document Feeder、オートシートフィーダー、オートフィーダーともいわれる。以下、ADFともいう)とは、積み重ねられた文書をスキャナに読み込ませるために、その文書を1枚ずつスキャナに送り込む装置である。この自動文書送り装置を使用して大量の文書を一度に入力することができるようになってきている。
これに関連する技術として、例えば、特許文献1には、文字認識装置等から送信される文書データの誤認をオペレータが簡単に発見することを可能とすることを目的とし、文字コード化された文書データを格納する文書記憶部と、予め定義された文字コード集合を格納する文字コード集合記憶部と、前記文字コード集合記憶部に格納された文字コード集合を検索して、前記文書記憶部に格納された文書データの各文字が前記文字コード集合記憶部に格納されているかを検出する検出部と、前記検出部の検出結果に基づいて、前記文字コード集合に属するか前記文字コード集合に属さないかを判定する判定部とを具備してなる文書処理装置が開示されている。
また、例えば、特許文献2には、登録済みのフォーマット情報に誤りがあるかどうかを容易に判断することができるようにすることを目的とし、帳票を読み取る画像読取手段と、フォーマット情報が格納された記憶装置と、制御装置と、表示装置とを有し、制御装置は、画像読取手段によって読み取られた帳票に対応する帳票イメージを格納するイメージメモリと、帳票イメージを表示装置に表示するイメージ表示手段と、イメージメモリに格納された帳票イメージに、フォーマット情報に対応するダミーデータを重ねて書き込むダミーデータ書込手段とを備え、制御装置は、画像読取手段によって帳票を読み取り、帳票イメージをイメージメモリに格納し、次に、記憶装置から帳票のフォーマット情報を読み出し、フォーマット情報に対応するダミーデータを帳票イメージに重ねて書き込むことが開示されている。
また、例えば、特許文献3には、文書や帳票の読み取りにおいて、手書き文字でも正確に認識するとともに、認識結果の誤認識や判読困難な文字を精度よく棄却する文字認識装置を提供することを課題とし、文字画像抽出部は、文書画像入力受付部で受け付けられた文書画像から文字画像を切り出し、特徴量抽出部は文字画像から特徴量を抽出し、候補文字選択部は分類辞書の基準特徴量と抽出された特徴量との類似度を算出し候補文字を選択し、候補文字判定部は選択された候補文字同士が類似候補文字識別辞書に記載されているとき、いずれの文字が適切かを判定し、個別文字検証部は、候補文字を個別検証辞書の肯定条件又は否定条件に示されるルールに従い「有効」又は「棄却」とし、認識検証部は、同一文字行に複数の同一候補文字があるとき、文字画像同士の類似度を用いて、候補文字の変更処理を行うことが開示されている。
特開平07−93471号公報 特開平08−202818号公報 特開2007−133850号公報
ところで、従来の文字認識結果の修正については、1枚の文書の画像に対しての文字認識誤りを発見するものであり、複数枚の文書画像の認識結果に対して、その中からどの文書画像の認識結果に誤りが潜んでいるかの判定を容易にすることはできなかった。
本発明は、複数枚の画像からの情報抽出結果に対して、その中からどの画像の情報抽出結果に誤りがあるかの確認ができるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、第1の画像を複数取得する画像取得手段と、前記画像取得手段によって取得された第1の画像から所定の情報を抽出する情報抽出手段と、前記情報抽出手段によって所定の情報が抽出されたか否かを判定する抽出情報判定手段と、前記抽出情報判定手段によって所定の情報が抽出されていないと判定された場合、その対象とした画像を特定するための情報を記憶する画像情報記憶手段を具備することを特徴とする画像処理装置である。
請求項2の発明は、前記画像取得手段は、第2の画像を複数取得し、前記情報抽出手段は、前記画像取得手段によって取得された第2の画像を、前記画像情報記憶手段に記憶された画像を特定するための情報によって特定し、該特定された画像から所定の情報を抽出することを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記画像情報記憶手段に記憶された画像を特定するための情報を選択する画像選択手段をさらに具備し、前記情報抽出手段は、前記画像取得手段によって取得された第2の画像を、前記画像選択手段によって選択された画像を特定するための情報によって特定し、該特定された画像から所定の情報を抽出することを特徴とする請求項2に記載の画像処理装置である。
請求項4の発明は、前記情報抽出手段は、前記画像内の所定の位置にある情報又は画像内の所定の属性名に対応する情報を抽出することを特徴とする請求項1から3のいずれか一項に記載の画像処理装置である。
請求項5の発明は、前記抽出情報判定手段は、前記情報抽出手段によって抽出された情報の有無又は該抽出された情報が所定の文字列を含むか否かによって、所定の情報が抽出されたか否かを判定することを特徴とする請求項1から4のいずれか一項に記載の画像処理装置である。
請求項6の発明は、前記画像情報記憶手段は、前記画像を特定するための情報として、前記画像取得手段によって取得された第1の画像の順番又は該第1の画像の縮小画像を記憶することを特徴とする請求項1から5のいずれか一項に記載の画像処理装置である。
請求項7の発明は、前記画像取得手段は、自動文書送り装置を用いて複数の文書を読み込むことによって、複数の第1の画像及び複数の第2の画像を取得し、前記第2の画像に対応する前記文書は、前記第1の画像に対応する前記文書であることを特徴とする請求項3から6のいずれか一項に記載の画像処理装置である。
請求項8の発明は、前記画像取得手段は、前記第1の画像の取得条件とは異なる条件によって前記第2の画像を取得することを特徴とする請求項2から7のいずれか一項に記載の画像処理装置である。
請求項9の発明は、前記画像情報記憶手段に記憶されている画像を特定するための情報に基づいて、利用者に再度読み込ませるべき画像を選択させるための第3の画像を出力する画像出力手段をさらに具備し、前記画像選択手段は、前記画像出力手段によって出力された画像内の前記利用者によって付された符号に基づいて、前記第2の画像を選択することを特徴とする請求項3から8のいずれか一項に記載の画像処理装置である。
請求項10の発明は、前記画像取得手段によって取得された第1の画像の特徴を抽出する特徴抽出手段と、前記特徴抽出手段によって抽出された特徴に基づいて、前記第1の画像内で類似している画像を抽出する類似画像抽出手段をさらに具備し、前記画像出力手段は、前記類似画像抽出手段によって抽出された類似する画像を他のものと異なるように出力することを特徴とする請求項9に記載の画像処理装置である。
請求項11の発明は、前記画像取得手段によって取得された第1の画像の特徴を抽出する特徴抽出手段と、前記特徴抽出手段によって抽出された第1の画像の特徴に基づいて、該第1の画像を分類する画像分類手段と、前記画像取得手段によって取得された第1の画像から切り出すべき領域を前記分類毎に記憶する領域記憶手段をさらに具備し、前記画像出力手段は、前記第1の画像に対しての前記画像分類手段による分類結果に基づいて、前記領域記憶手段に記憶されている領域を該第1の画像から切り出して、前記第3の画像を出力することを特徴とする請求項9に記載の画像処理装置である。
請求項12の発明は、第1の画像を複数取得する画像取得手段と、前記画像取得手段によって取得された第1の画像から所定の情報を抽出する情報抽出手段と、前記情報抽出手段によって所定の情報が抽出されたか否かを判定する抽出情報判定手段と、前記抽出情報判定手段によって所定の情報が抽出されていないと判定された場合、前記画像取得手段によって取得された第1の画像を記憶する画像情報記憶手段を具備することを特徴とする画像処理装置である。
請求項13の発明は、前記画像取得手段は、第2の画像を取得し、前記第2の画像は、前記画像情報記憶手段に記憶されている第1の画像と類似しているか否かを判断する類似画像判断手段をさらに具備し、前記情報抽出手段は、前記類似画像判断手段によって類似していると判断された前記第2の画像から所定の情報を抽出することを特徴とする請求項12に記載の画像処理装置である。
請求項14の発明は、前記情報抽出手段は、前記第2の画像から抽出した情報を、前記類似画像判断手段によって該第2の画像と類似していると判断された第1の画像の情報として抽出することを特徴とする請求項13に記載の画像処理装置である。
請求項15の発明は、コンピュータを、第1の画像を複数取得する画像取得手段と、前記画像取得手段によって取得された第1の画像から所定の情報を抽出する情報抽出手段と、前記情報抽出手段によって所定の情報が抽出されたか否かを判定する抽出情報判定手段と、前記抽出情報判定手段によって所定の情報が抽出されていないと判定された場合、その対象とした画像を特定するための情報を記憶する画像情報記憶手段として機能させることを特徴とする画像処理プログラムである。
請求項16の発明は、コンピュータを、第1の画像を複数取得する画像取得手段と、前記画像取得手段によって取得された第1の画像から所定の情報を抽出する情報抽出手段と、前記情報抽出手段によって所定の情報が抽出されたか否かを判定する抽出情報判定手段と、前記抽出情報判定手段によって所定の情報が抽出されていないと判定された場合、前記画像取得手段によって取得された第1の画像を記憶する画像情報記憶手段として機能させることを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、複数枚の画像の情報抽出結果に対して、その中からどの画像の情報抽出結果に誤りがあるかの確認ができるようになる。
請求項2の画像処理装置によれば、情報抽出結果に誤りがあった画像を再度取得して、その画像の情報抽出ができるようになる。
請求項3の画像処理装置によれば、情報抽出結果に誤りがあった画像を選択して、その選択した画像の情報抽出ができるようになる。
請求項4の画像処理装置によれば、本構成を有していない場合に比較して、情報抽出結果に誤りがあるか否かを容易に判断できるようになる。
請求項5の画像処理装置によれば、本構成を有していない場合に比較して、情報抽出結果に誤りがあるか否かを容易に判断できるようになる。
請求項6の画像処理装置によれば、本構成を有していない場合に比較して、情報抽出結果に誤りがあった画像の特定が容易にできるようになる。
請求項7の画像処理装置によれば、自動文書送り装置を用いた画像取得に対しても、情報抽出結果に誤りがあった画像を選択して、その選択した画像の情報抽出ができるようになる。
請求項8の画像処理装置によれば、本構成を有していない場合に比較して、再度取得した画像の情報抽出の精度を高めることができるようになる。
請求項9の画像処理装置によれば、本構成を有していない場合に比較して、情報抽出結果に誤りがあった画像の選択が容易にできるようになる。
請求項10の画像処理装置によれば、本構成を有していない場合に比較して、類似した画像があっても、情報抽出結果に誤りがあった画像の選択が容易にできるようになる。
請求項11の画像処理装置によれば、本構成を有していない場合に比較して、注目すべき画像を切り出すことができ、情報抽出結果に誤りがあった画像の選択が容易にできるようになる。
請求項12の画像処理装置によれば、複数枚の画像の情報抽出結果に対して、その中からどの画像の情報抽出結果に誤りがあるかの確認ができるようになる。
請求項13の画像処理装置によれば、情報抽出結果に誤りがあった画像を再度取得して、その画像の情報抽出ができるようになる。
請求項14の画像処理装置によれば、情報抽出結果に誤りがあった画像の情報抽出結果を、その誤りがあった画像の情報抽出結果として扱うことができるようになる。
請求項15の画像処理プログラムによれば、複数枚の画像の情報抽出結果に対して、その中からどの画像の情報抽出結果に誤りがあるかの確認ができるようになる。
請求項16の画像処理プログラムによれば、複数枚の画像の情報抽出結果に対して、その中からどの画像の情報抽出結果に誤りがあるかの確認ができるようになる。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。
なお、所定という用語は、予め定められたの意の他に、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じての意を含めて用いる。
第1の実施の形態は、図1に示すように、画像取得モジュール101、情報抽出モジュール102、抽出情報判定モジュール103、文書情報記憶モジュール104、文書選択モジュール105、文字認識モジュール106を有している。これらのモジュールは、それぞれ接続されている。
また、図2は、第1の実施の形態を実現するためのハードウェア例の構成図である。つまり、画像入力装置201、CPU202、表示装置203、入力装置204、記憶装置205、外部記憶装置206を有している。これらは、バスを介してそれぞれ接続されている。
画像取得モジュール101は画像入力装置201によって実現され、情報抽出モジュール102、抽出情報判定モジュール103、文書選択モジュール105、文字認識モジュール106はCPU202、記憶装置205によって実現され、文書情報記憶モジュール104は外部記憶装置206によって実現される。また、利用者による操作、設定等は、入力装置204によって行われ、その表示は表示装置203によって行われる。
画像取得モジュール101は、まず、文書の画像を複数取得する。また、同一文書に対して2回目の画像を取得する。つまり、2回目に取得した画像は、最初に取得した画像に対応する。そして、取得した画像を1枚ずつ順に情報抽出モジュール102へ渡す。例えば、画像取得モジュール101は、自動文書送り装置を設けたスキャナであり、その自動文書送り装置を用いて複数の文書の画像を1枚ずつ読み取る。なお、文書とは、文字(記号等を含む)、図形等が印刷(手書きを含む)された紙等の媒体であり、その内容は問わず、またそのサイズも問わない。以下、主に、文書として帳票を例示するが、その帳票には請求書、領収書等がある。
情報抽出モジュール102は、画像取得モジュール101によって取得された画像から所定の情報を抽出する。つまり、所定の指定情報に基づいて、画像内の情報を文字認識モジュール106によって抽出する。所定の指定情報とは、例えば、文書画像中の情報を読み取る場所を座標値で指定した情報である読取領域テーブル300である。
図3に示すように、読取領域テーブル300は、文書名欄301、座標値欄310(左欄311、上欄312、右欄313、下欄314で矩形領域の左上、右下を指定)、名前欄321、文字種欄331で構成される。また、読取領域テーブル300は、その領域内に記載されているべき文字種(数字、記号、漢字、ひらがな(図3では「かな」)、カタカナ(図3では「カナ」)、アルファベット等)が記憶されている。
これらの座標値は、図4に示すような各領域に対応し、それぞれの領域から切り出された画像に対して文字認識モジュール106により文字認識処理が行われ、情報が抽出される。図3に示す読取領域テーブル300内の各領域は、図4の点線で示した領域に相当する。つまり、文書名が請求書である文書400に対して、読取領域テーブル300の日付行351、金額行352、会社名行353は、文書400の読取領域(日付)451、読取領域(金額)452、読取領域(会社名)453に対応する。
情報抽出の結果は、図5に示すような読取領域テーブル500として文書情報記憶モジュール104に一時的に記憶される。読取領域テーブル500は、文書名欄501、名前欄502、文字種欄503、値欄504を有している。文字認識モジュール106による文字認識処理の結果は、読取領域テーブル500の値欄504に設定される。
文字認識モジュール106は、情報抽出モジュール102からの指示に基づいて、画像取得モジュール101によって取得された画像内の指定された部分の領域の文字認識を行う。
抽出情報判定モジュール103は、情報抽出モジュール102によって所定の情報が抽出されたか否かを判定する。より具体的には、例えば、情報抽出モジュール102によって抽出された情報の有無又はその抽出された情報が所定の文字列を含むか否かによって、所定の情報が抽出されたか否かを判定するようにしてもよい。つまり、文書情報記憶モジュール104に記憶された情報抽出の結果から、所定の情報が抽出されたかを判定する。判定の基準は、値欄504に情報が入っていない、又は文字種欄503に指定された以外の文字種が値欄504に設定されているときに、情報抽出に失敗したと判定する。例えば、図5に示す読取領域テーブル500では、名前欄502が金額の値欄504に何も設定されていないので、この画像に対しての情報抽出は失敗していると判定する。また、名前欄502が日付の文字種欄503に指定されている文字種は“数字”と“記号”であるが、値欄504に設定されている文字列の中に漢字“日”が含まれているため、ここでも情報抽出に失敗したと判定することとなる。
文書情報記憶モジュール104は、抽出情報判定モジュール103によって所定の情報が抽出されていないと判定された場合、その対象とした画像を特定するための情報を記憶する。つまり、抽出情報判定モジュール103による処理結果、情報抽出に失敗した画像を特定するための情報を外部記憶装置206に記憶する。ここで記憶する画像を特定するための情報として、画像取得モジュール101によって1回目(後述の図6に示すフローチャートのステップS604)に取得された画像の順番又はその画像のサムネイル画像(縮小画像)がある。つまり、自動文書送り装置上に設定された文書中の何枚目(ページ数)であるかという情報又はそのサムネイル画像を記憶する。また、サムネイル画像の他に、画像そのものを記憶するようにしてもよい。
第1の実施の形態において、画像を取得し、その画像から情報を抽出し、その情報抽出の判定をする等の処理フローを図6に示す。
まず、自動文書送り装置に設定された文書の何枚目を処理しているかをカウントするページカウンタを記憶装置205に用意し、その値をリセットする(ステップS601)。
次に自動文書送り装置上に文書が残っているかを判断し(ステップS602)、文書がある場合にはステップS603の処理へ進み、それ以外の場合は終了する(ステップS699)。
ステップS603では、ページカウンタの値を1つ増加させた値に更新する。そして、画像を読み取る(ステップS604)。
情報抽出モジュール102によって情報抽出処理(ステップS605)を実行し、読み取った画像から情報を取得する。
抽出情報判定モジュール103によって、所定の情報が抽出されているか否かを判定し(ステップS606)、情報が抽出されていれば(ステップS606でYes)、抽出した情報とともに読み取った画像を記憶する(ステップS607)。このとき、記憶する場所は、予め指定してある文書管理サーバーなど、外部の機器としてもよい。
情報が抽出されていないと判断された場合(ステップS606でNo)には、記憶装置205の現在のページカウンタの値を文書情報記憶モジュール104に記憶する(ステップS608)。このとき、ページカウンタの値だけでなく、取得した画像のサムネイル画像を一緒に記憶するようにしてもよい。
以上の処理を自動文書送り装置に設定された文書がなくなるまで続ける(ステップS602)。
次に情報抽出に失敗した文書がある場合の処理を説明する。
文書選択モジュール105は、文書情報記憶モジュール104に記憶された画像を特定するための情報を選択する。より具体的には、例えば、情報の抽出に失敗した文書がある場合には、情報抽出に失敗したと判定された文書の一覧を表示装置203上に表示する。このとき文書の一覧は、記憶されているページカウンタの値を表示する。利用者は、マウスやキーボードなどの入力装置204を使って、もう一度取得が必要な文書を表示されたページカウンタの値を指定することで選択する。このとき、ページカウンタの値だけでなく、記憶したサムネイル画像を表示装置203上に表示して、具体的に文書が利用者に分かるようにしてもよい。選択した文書に対応するページカウンタの値は、記憶装置205に記憶される。
選択した後、利用者は最初に自動文書送り装置に設定したすべての文書をもう一度同じ順番で、自動文書送り装置に設定し、再読み取りの処理を実行する。つまり、画像取得モジュール101は、同一文書の画像を再度取得する。
そして、情報抽出モジュール102は、画像取得モジュール101によって再度取得されたその画像を、文書情報記憶モジュール104に記憶された画像を特定するための情報によって特定し、その特定された画像から、文字認識モジュール106を用いて所定の情報を抽出する。また、画像取得モジュール101によって再度取得されたその画像を、文書選択モジュール105によって選択された画像を特定するための情報によって特定し、その特定された画像から所定の情報を抽出するようにしてもよい。つまり、ステップS608によって記憶されたページ(情報の抽出に失敗した文書のページ)に対して、情報抽出を行う。
第1の実施の形態において、再読み取りの処理フローを図7に示す。
まず、ページカウンタを記憶装置205上に用意し、その値をリセットする(ステップS701)。
自動文書送り装置に設定された文書が残っているかを判断し(ステップS702)、文書がある場合にはステップS703の処理へ進み、それ以外の場合は終了する(ステップS799)。
ステップS703では、ページカウンタの値を1つ増加させた値に更新する。
次に、先の処理(ステップS608)で記憶されている選択文書に対応するページカウンタの値と現在のページカウンタの値を比較し、一致していれば先の処理で情報抽出に失敗し、再取得を指定された文書であると判断し(ステップS704でYes)、画像取得モジュール101は画像の読み取りを行う(ステップS705)。
再取得を指定された文書ではない場合(ステップS704でNo)には、ステップS702へ戻り、自動文書送り装置に設定されている次の文書の処理を行う。
次に、情報抽出モジュール102は、ステップS705で読み取った画像中から情報を抽出し(ステップS706)、抽出された情報を記憶する(ステップS707)。なお、ステップS706、ステップS707の処理は、それぞれステップS605、ステップS607と同等の処理である。
以上の処理を自動文書送り装置に設定された文書がなくなるまで続ける(ステップS702)。
画像取得モジュール101による画像の再取得処理(ステップS705)の場合、画像内の文字を認識しやすくするために、解像度、コントラストなどの読取条件を変更して、画像の取得を行うようにしてもよい。つまり、1回目に取得した画像の取得条件とは異なる条件によって、2回目の画像を取得する。第2の実施の形態から第4の実施の形態でも同等である。
第1の実施の形態では、予め情報抽出の座標を指定する方法を用いている。つまり、情報抽出モジュール102は、画像内の所定の位置にある情報を抽出するようにしているが、画像内の所定の属性名に対応する情報を抽出するようにしてもよい。つまり、情報抽出すべき領域を指定するために必要なキーワードを与えて、そのキーワードに相当する領域を文字認識モジュール106による文字認識対象とする方法としてもよい。例えば、このような情報抽出方法は、特開2006−92207号公報に開示の方法を利用することができる。
<第2の実施の形態>
次に、第2の実施の形態を説明する。
第2の実施の形態は、図8に示すように、画像取得モジュール801、情報抽出モジュール802、抽出情報判定モジュール803、文書情報記憶モジュール804、文書選択モジュール805、文字認識モジュール806、非抽出情報印刷モジュール807を有している。これらのモジュールは、それぞれ接続されている。
また、図9は、第2の実施の形態を実現するためのハードウェア例の構成図である。つまり、画像入力装置901、CPU902、表示装置903、入力装置904、記憶装置905、外部記憶装置906、印刷装置907を有している。これらは、バスを介してそれぞれ接続されている。
画像取得モジュール801は画像入力装置901によって実現され、情報抽出モジュール802、抽出情報判定モジュール803、文書選択モジュール805、文字認識モジュール806はCPU902、記憶装置905によって実現され、文書情報記憶モジュール804は外部記憶装置906によって実現され、非抽出情報印刷モジュール807は印刷装置907によって実現される。また、利用者による操作、設定等は、入力装置904によって行われ、その表示は表示装置903によって行われる。
なお、第2の実施の形態は、前述の第1の実施の形態に非抽出情報印刷モジュール807を加え、同様に、ハードウェア構成では、印刷装置907を加えたものである。同等の名称のもの(例えば、画像取得モジュール801と画像取得モジュール101等)は、第1の実施の形態と同等の機能・働きをする。ただし、同等の名称のものであっても、特に、以下に説明するものは、第1の実施の形態の機能・働きに置換又は付加したものである。
非抽出情報印刷モジュール807は、文書情報記憶モジュール804に記憶されている画像を特定するための情報に基づいて、利用者に再度読み取らせるべき画像を選択させるための画像を出力する。つまり、非抽出情報印刷モジュール807は、抽出情報判定モジュール803で情報の抽出に失敗したとして、文書情報記憶モジュール804に記憶されているページカウンタの値に対応するサムネイル画像を所定の書式で印刷を行う。
そして、画像取得モジュール801は、非抽出情報印刷モジュール807によって出力された画像(後述するように、利用者によって符号が付されている)を取得する。
文書選択モジュール805は、画像取得モジュール801によって取得された画像内の利用者によって付された符号に基づいて、2回目に取得された画像を選択する。
情報抽出モジュール802は、文書選択モジュール805によって選択された画像内から所定の情報を抽出する。
次に、非抽出情報印刷モジュール807によって出力された画像に対して、利用者によって符号が付されることについて説明する。
非抽出情報印刷モジュール807によって印刷された紙を用いて、利用者が再取得の指示を行う。再取得の指定の位置の判定を行いやすいような書式を用いる。例えば、図10の例に示す印刷書式1000のように紙面を格子状に区切り、各区分に対してサムネイル画像を印刷するサムネイル画像表示領域1001を設定し、その中にサムネイル画像を印刷する。図11に示す例は、図10に示した印刷書式1000に従って、サムネイル画像1101からサムネイル画像1108を配置したものである。このとき、各サムネイル画像の下にページカウンタの値を印刷してもよい。
利用者は、このサムネイル画像印刷文書1100に対して図12の例に示すように再取得が必要なサムネイル画像にチェックマーク1122、1128を記入する。
利用者は、自動文書送り装置に設定したすべての文書の一番上(読み取られる順番が最初)にこの用紙をセットして、再度自動文書送り装置にすべての文書と共に設定する。
画像取得モジュール801による再読取が始まると、最初の文書からチェックされている場所を文書選択モジュール805が判定する。
チェックの有無の判定は、取得文書と文書情報記憶モジュール804に記憶されているサムネイル画像との差分を取り(EOR論理演算等)、チェックマークが付されている場所には、差分の画素が多く残るので、画素の残っている区画を検索することで、どの文書が選択されているかを容易に判断することができる。例えば、区画に左上から右方向へ順に1番目、2番目としておくことで、その区画に画素が残っているかで、どの画像かを判断することができる。つまり、N番目の区画に画素が残っていると、文書情報記憶モジュール804に記憶されている情報のN番目の情報が選択されていることが判明するので、N番目に記憶されている情報のページカウンタの値を取得することで、選択された文書を特定することができる。
次に、第2の実施の形態の変形例を説明する。サムネイル画像は小さく、類似した文書であると、利用者がその文書の区別がつかないということがあり得る。変形例は、これに対応したものである。
第2の実施の形態の変形例は、図13に示すように、画像取得モジュール1301、情報抽出モジュール1302、抽出情報判定モジュール1303、文書情報記憶モジュール1304、文書選択モジュール1305、文字認識モジュール1306、非抽出情報印刷モジュール1307、特徴量計算モジュール1308、類似度計算モジュール1309を有している。これらのモジュールは、それぞれ接続されている。同等の名称のもの(例えば、画像取得モジュール1301と画像取得モジュール801等)は、第2の実施の形態と同等の働きをする。この変形例を実現するためのハードウェア例は、図9の例に示したものと同等である。
非抽出情報印刷モジュール1307には、特徴量計算モジュール1308、類似度計算モジュール1309も接続されている。非抽出情報印刷モジュール1307は、特徴量計算モジュール1308、類似度計算モジュール1309を制御して、情報の抽出に失敗した画像のサムネイル画像を印刷する。
つまり、類似度計算モジュール1309によって抽出された類似する画像を他のものと異なるように出力する。これは、利用者に類似した画像の区別がつきやすいように出力する場合に用いる。
例えば、画像間又はサムネイル画像間で類似度の高いものは、似ている文書であるとしてそれらのサムネイル画像だけ、サイズを変更して(例えば拡大して)印刷する。図16に、サムネイル画像のサイズを変更して印刷した例を示す。つまり、類似しているサムネイル画像1601とサムネイル画像1604は、他のサムネイル画像1602等よりも大きく拡大して印刷したサムネイル画像印刷文書1600の例である。
また、類似度の高いサムネイルの間で差分を取るようにしてもよい。そして、その差分の大きい部分を似ている文書の中での相違が大きい部分としてその領域を切り出して、その切り出した画像を拡大して印刷するようにしてもよい。図17に、差分の大きい部分を拡大して印刷した例を示す。つまり、類似しているサムネイル画像1701とサムネイル画像1704については、差分が大きい部分である差異部分画像1711、1714を拡大して、それぞれサムネイル画像1701、1704の近辺に配置して印刷したサムネイル画像印刷文書1700の例である。
特徴量計算モジュール1308は、非抽出情報印刷モジュール1307と接続されており、画像取得モジュール1301によって1回目に取得された画像(ステップS604に相当)の特徴を抽出する。特徴抽出する画像は、サムネイル画像であってもよい。特徴量計算モジュール1308で抽出する特徴としては、画像を複数の格子状に区切り、各矩形内での画素密度、又は画像の射影を特徴量とするなどの、比較的簡単な特徴量を用いることができる。より複雑な、文書構造を利用した特徴量などを用いてもよい。図14に対象画像1400を格子状に区分した例、図15に対象画像1500の射影(射影(横)1501、射影(縦)1502)を計算した例を示す。
類似度計算モジュール1309は、非抽出情報印刷モジュール1307と接続されており、特徴量計算モジュール1308によって抽出された特徴に基づいて、その画像内で類似している画像を抽出する。類似しているか否かの判断は、所定の閾値を用いて、その閾値との比較によって判断する。
第2の実施の形態では、サムネイル画像が1枚の用紙に収まっている例を示している。そして、この用紙を、自動文書送り装置に設定したすべての文書の一番上にセットして、1枚目の画像を画像取得モジュール801(1301)が文書選択モジュール805(1305)に渡すようにしている。
しかし、情報の抽出に失敗する画像が多数出現し、複数の用紙に渡ってサムネイル画像を印刷することがある。そのような場合には、情報抽出に失敗した画像であることを示す情報が表されている情報画像(例えば、QRコードやバーコード等)をその用紙に印刷する。そして、画像取得モジュール801(1301)は、その情報を探知することでサムネイル画像が印刷されている画像であるかどうかを判定する。サムネイル画像が印刷されている画像であると判定された場合は、その複数の画像を画像取得モジュール801(1301)が文書選択モジュール805(1305)に渡すようにしてもよい。帳票内で異なる部分としては、例えば、件名、商品名、金額等の欄を用いることができる。
<第3の実施の形態>
次に、第3の実施の形態を説明する。ここでは、文書として特に帳票を例示する。取得される帳票の種別は、ある程度決まっている場合が多い。そのため、第3の実施の形態では、同等の種類の帳票に対しては、その帳票内で最も異なる部分を予め指定し、その部分を拡大してサムネイル画像を作成する。
第3の実施の形態は、図18に示すように、画像取得モジュール1801、情報抽出モジュール1802、抽出情報判定モジュール1803、文書情報記憶モジュール1804、文書選択モジュール1805、文字認識モジュール1806、非抽出情報印刷モジュール1807、特徴量計算モジュール1808、帳票分類モジュール1809、帳票辞書モジュール1810、帳票特定領域辞書モジュール1811を有している。これらのモジュールは、それぞれ接続されている。同等の名称のもの(例えば、画像取得モジュール1801と画像取得モジュール801等)は、第2の実施の形態と同等の機能・働きをする。この第3の実施の形態を実現するためのハードウェア例は、図9の例に示したものと同等である。ただし、同等の名称のものであっても、特に、以下に説明するものは、第2の実施の形態の機能・働きに置換又は付加したものである。
第3の実施の形態では、前述の第2の実施の形態に特徴量計算モジュール1808、帳票分類モジュール1809、帳票辞書モジュール1810、帳票特定領域辞書モジュール1811を加えたものである。これらは、非抽出情報印刷モジュール1807に接続されており、非抽出情報印刷モジュール1807によって制御される。
非抽出情報印刷モジュール1807は、1回目に取得した画像に対しての帳票分類モジュール1809による分類結果に基づいて、帳票特定領域辞書モジュール1811に記憶されている領域をその画像から切り出して、情報抽出に失敗した画像を出力する。つまり、非抽出情報印刷モジュール1807は、帳票分類モジュール1809により分類した帳票に対応する切り出し領域を帳票特定領域辞書モジュール1811により決定し、1回目の取得画像から指定された領域を切り出し、サムネイル画像を作成して印刷する。
特徴量計算モジュール1808は、非抽出情報印刷モジュール1807と接続されており、画像取得モジュール1801によって取得された1回目の画像の特徴を抽出する。つまり、帳票辞書モジュール1810に記憶されている特徴をその取得した画像から計算する。特徴としては、図14、15に示したような画像特徴を用いて、パターンマッチングする方法を採ることができる。また、帳票内の各セルの位置情報から帳票を分類する方法(例えば、特開2000−339406号公報に開示されている方法)により、各セルの関係と属性を決定し、帳票辞書モジュール1810に記憶されている同等の情報を比較して判定することもできる。
帳票分類モジュール1809は、非抽出情報印刷モジュール1807と接続されており、特徴量計算モジュール1808によって抽出された1回目に取得した画像の特徴に基づいて、その画像を分類する。つまり、画像取得モジュール1801によって取得された1回目の画像の特徴と帳票辞書モジュール1810に記憶されている特徴とを比較して、その画像がどの帳票であるかを判定する。
帳票辞書モジュール1810は、非抽出情報印刷モジュール1807と接続されており、予め取得される帳票の特徴をそれぞれ記憶している。
帳票特定領域辞書モジュール1811は、非抽出情報印刷モジュール1807と接続されており、画像取得モジュール1801によって取得された1回目の画像から切り出すべき領域を帳票の分類毎に記憶する。例えば、図20に示す帳票特定領域テーブル2000のようなデータ構造を有している。帳票特定領域テーブル2000は、分類欄2001、特定領域欄2010を有している。さらに、特定領域欄2010は、左欄2011、上欄2012、右欄2013、下欄2014を有している。つまり、帳票の分類毎に、切り出す位置を特定領域欄2010に記憶している。
なお、第3の実施の形態では、帳票の分類処理が必要となるため、文書情報記憶モジュール1804には画像取得モジュール1801が取得した画像のサムネイル画像ではなく、取得画像そのものを記憶する。
第3の実施の形態において、非抽出情報印刷モジュール1807が行う処理フローについて図19を用いて説明する。
文書情報記憶モジュール1804に記憶されている情報抽出に失敗したと判定されたすべての画像を、帳票分類モジュール1809において分類を行う(ステップS1901)。
ステップS1902では、未処理の文書(サムネイル画像が生成されていない画像)があるか否かを判断する。かかる判断によって残っていると判断した場合(Yes)はステップS1903へ進み、それ以外の場合(No)はステップS1907へ進む。
そして、分類済みの文書から一つ選び、その画像の分類名から切り出す領域を決定する。画像を外部記憶装置906に一時的に記憶する。切り出し位置は、帳票特定領域辞書モジュール1811に図20の例に示すようなデータ構造で記憶されているため、その画像の分類(分類欄2001)に対応する領域の座標(特定領域欄2010)を取り出し、その領域の画像を切り出す(ステップS1903)。
次に、その画像のサムネイル画像を生成し、同様に外部記憶装置906に一時的に記憶する(ステップS1904)。
切り出した特定領域とサムネイル画像を合成し(ステップS1905)、印刷すべき画像上に配置する(ステップS1906)。
文書情報記憶モジュール1804に記憶されている画像に対して、前述の処理を行い、処理すべき画像がなくなった場合(ステップS1902でNo)は、印刷装置907から画像を印刷する(ステップS1907)。
以上の処理は、類似している画像に対して、サムネイル画像では判別できないような文書の差を、利用者にとってより的確に把握されるようなサムネイル画像の一覧を作成するものである。例えば、ステップS1907で印刷される画像は、図21の例に示すサムネイル画像印刷文書2100のようなものである。つまり、サムネイル画像印刷文書2100には、情報の抽出に失敗した画像のサムネイル画像2101等が印刷され、その近辺には非抽出情報印刷モジュール1807によって切り出された差異部分画像2111等が印刷されている。
<第4の実施の形態>
次に、第4の実施の形態を説明する。第4の実施の形態は、1回目の画像取得後に再度の画像取得のために自動文書送り装置にすべての文書を設定しなおしたときに、文書の順番が異なっていたり、文書に過不足があったりする場合(例えば、いくつかの文書を載せ忘れた場合)に対処するものである。
第4の実施の形態は、図22に示すように、画像取得モジュール2201、情報抽出モジュール2202、抽出情報判定モジュール2203、文書情報記憶モジュール2204、文書選択モジュール2205、文字認識モジュール2206、類似度計算モジュール2207を有している。これらのモジュールは、それぞれ接続されている。
また、図23は、第4の実施の形態を実現するためのハードウェア例の構成図である。つまり画像入力装置2301、CPU2302、表示装置2303、入力装置2304、記憶装置2305、外部記憶装置2306を有している。これらは、バスを介してそれぞれ接続されている。
画像取得モジュール2201は画像入力装置2301によって実現され、情報抽出モジュール2202、抽出情報判定モジュール2203、文書選択モジュール2205、文字認識モジュール2206、類似度計算モジュール2207はCPU2302、記憶装置2305によって実現され、文書情報記憶モジュール2204は外部記憶装置2306によって実現される。また、利用者による操作、設定等は、入力装置2304によって行われ、その表示は表示装置2303によって行われる。
なお、第4の実施の形態は、前述の第1の実施の形態に類似度計算モジュール2207を加えたものである。同等の名称のもの(例えば、画像取得モジュール2201と画像取得モジュール101等)は、第1の実施の形態と同等の機能・働きをする。ただし、同等の名称のものであっても、特に、以下に説明するものは、第1の実施の形態の機能・働きに置換又は付加したものである。
文書情報記憶モジュール2204は、文書選択モジュール2205によって所定の情報が抽出されていないと判定された場合、画像取得モジュール2201によって1回目に取得された画像を記憶する。また、その画像とともに画像を特定するための情報を記憶するようにしてもよい。
類似度計算モジュール2207は、画像取得モジュール2201によって2回目に取得された画像は、情報抽出モジュール2202に記憶されている1回目に取得された画像と類似しているか否かを判断する。
情報抽出モジュール2202は、類似度計算モジュール2207によって類似していると判断され、2回目に取得された画像から所定の情報を抽出する。また、その2回目に取得された画像から抽出した情報を、類似度計算モジュール2207によってその2回目に取得された画像と類似していると判断された1回目に取得された画像の情報として抽出するようにしてもよい。
第4の実施の形態において、画像を取得し、その画像から情報を抽出し、その情報抽出の判定をする等の処理フローを図24に示す。
ステップS2401からステップS2406までの処理は、図6の例に示した第1の実施の形態のフローチャートのステップS601からステップS606までと同等である。ステップS2406以降の処理について説明する。
抽出情報判定モジュール2203によって、所定の情報が抽出されているか否かを判定し(ステップS2406)、情報が抽出されていれば(ステップS2406でYes)、抽出した情報とともに読み取った画像を記憶する(ステップS2407)。このとき、記憶する場所は、予め指定してある文書管理サーバーなど、外部の機器としてもよい。
情報が抽出されていないと判断された場合(ステップS2406でNo)には、文書情報記憶モジュール2204に現在のページカウンタの値とその画像を記憶しておく。このとき、取得した画像のサムネイル画像を一緒に記憶するようにしてもよい。
以上の処理を自動文書送り装置に設定された文書がなくなるまで続ける(ステップS2402)。
第4の実施の形態において、再読み取りの処理フローを図25に示す。このときに、利用者は、第1の実施の形態と同様に、最初に自動文書送り装置に設定したすべての文書をもう一度自動文書送り装置に設定し、再読み取りの処理を実行する。このとき、第4の実施の形態では、例えば、文書の順番が変わっていたり自動文書送り装置に載せ忘れていた文書があったりしても対応できる。
まず、ページカウンタを記憶装置2305上に用意し、その値をリセットする(ステップS2501)。
自動文書送り装置に設定された文書が残っているかを判断し(ステップS2502)、文書がある場合(Yes)にはステップS2503の処理へ進み、それ以外の場合(No)は終了する(ステップS2599)。
ステップS2503では、ページカウンタの値を1つ増加させた値に更新する。
次に、自動文書送り装置に設定された文書を1枚読み取る(ステップS2504)。
読み取られた画像と文書情報記憶モジュール2204に記憶されている全ての画像(ステップS2408で記憶された画像)との類似度を計算し、類似度の一覧を記憶装置2305に記憶する(ステップS2505)。
その類似度の一覧の中から、類似度が最大のものであり、かつその類似度が所定の閾値以上であることを条件として、その画像がステップS2504で読み取られた画像に一致するかを判断する(ステップS2506)。一致する文書である場合(Yes)は、ステップS2507へ進み、それ以外の場合(No)はステップS2502へ戻り、自動文書送り装置に設定されている次の文書の処理を行う。
次に、情報抽出モジュール2202は、ステップS2504で読み取った画像中から情報を抽出し(ステップS2507)、抽出された情報を記憶する(ステップS2508)。なお、ステップS2507、ステップS2508の処理は、ステップS2405、ステップS2407と同等の処理である。
以上の処理を自動文書送り装置に設定された文書がなくなるまで続ける(ステップS2502)。
第1の実施の形態と同様に、再度取得すべき文書を利用者が選択するようにしてもよい。また、第2、第3の実施の形態と同様に、文書情報記憶モジュール2204に記憶されているサムネイル画像を印刷し、用紙上で再度取得すべき文書を選択する構成としてもよい。
また、第1から第4の実施の形態は、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
また、第4の実施の形態は、文書選択モジュール2205によって選択されたと判定された文書に対応している文書情報記憶モジュール2204に記憶されているページカウンタの値を用いることで、1回目に自動文書送り装置に設定した順番で抽出した情報を並べ替えることができる。例えば、抽出した情報を文書毎にファイルに保存し、そのファイル名にページ番号を使用する場合に、文書情報記憶モジュール2204に記憶されているページカウンタの値を用いることができる。
また、抽出した情報を何らかの書式で1つのファイルにまとめている場合、抽出したページカウンタの値を用いて適切な場所に抽出情報を挿入することができる。例えば、図26(a)に示すように、XMLで記述された抽出情報ファイル2600に抽出された情報がまとめられており、XMLのタグに各文書毎にpageタグ(抽出情報ファイル2600内の<Page num=1>等、</Page>)が設けられている書式の場合を例示する。この場合、図26(b)に示すような再取得画像2610をページNの次(つまり、N+1)に挿入するとする。そして、図26(c)に示すように、ページNのpageタグを探索して、ページカウンタに対応する場所に抽出情報である挿入情報2621を挿入できる。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 第1の実施の形態を実現するためのハードウェア例の構成図である。 第1の実施の形態に係わる読取領域テーブルの例を示す説明図である。 文書画像と読取領域の対応例を示す説明図である。 第1の実施の形態に係わる情報抽出の結果の例を示す説明図である。 第1の実施の形態による情報抽出等の処理例を示すフローチャートである。 第1の実施の形態による再度の情報抽出等の処理例を示すフローチャートである。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態を実現するためのハードウェア例の構成図である。 サムネイル画像を印刷する書式の例を示す説明図である。 サムネイル画像を印刷した例を示す説明図である。 利用者によって文書が選択された場合の例を示す説明図である。 第2の実施の形態の変形例の構成例についての概念的なモジュール構成図である。 画像を格子状に区切った例を示す説明図である。 画像の射影を計算した例を示す説明図である。 サムネイル画像のサイズを変更した印刷例を示す説明図である。 差分の大きい部分を拡大処理した印刷例を示す説明図である。 第3の実施の形態の構成例についての概念的なモジュール構成図である。 第3の実施の形態の非抽出情報印刷モジュールによる処理例を示すフローチャートである。 第3の実施の形態に係わる帳票の特定領域指定テーブルの例を示す説明図である。 第3の実施の形態に係わる印刷例を示す説明図である。 第4の実施の形態の構成例についての概念的なモジュール構成図である。 第4の実施の形態を実現するためのハードウェア例の構成図である。 第4の実施の形態による情報抽出等の処理例を示すフローチャートである。 第4の実施の形態による再度の情報抽出等の処理例を示すフローチャートである。 第4の実施の形態による再度の情報抽出によって得た情報を挿入した例を示す説明図である。
符号の説明
101…画像取得モジュール
102…情報抽出モジュール
103…抽出情報判定モジュール
104…文書情報記憶モジュール
105…文書選択モジュール
106…文字認識モジュール
201…画像入力装置
202…CPU
203…表示装置
204…入力装置
205…記憶装置
206…外部記憶装置

Claims (16)

  1. 第1の画像を複数取得する画像取得手段と、
    前記画像取得手段によって取得された第1の画像から所定の情報を抽出する情報抽出手段と、
    前記情報抽出手段によって所定の情報が抽出されたか否かを判定する抽出情報判定手段と、
    前記抽出情報判定手段によって所定の情報が抽出されていないと判定された場合、その対象とした画像を特定するための情報を記憶する画像情報記憶手段
    を具備することを特徴とする画像処理装置。
  2. 前記画像取得手段は、第2の画像を複数取得し、
    前記情報抽出手段は、前記画像取得手段によって取得された第2の画像を、前記画像情報記憶手段に記憶された画像を特定するための情報によって特定し、該特定された画像から所定の情報を抽出する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記画像情報記憶手段に記憶された画像を特定するための情報を選択する画像選択手段
    をさらに具備し、
    前記情報抽出手段は、前記画像取得手段によって取得された第2の画像を、前記画像選択手段によって選択された画像を特定するための情報によって特定し、該特定された画像から所定の情報を抽出する
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記情報抽出手段は、前記画像内の所定の位置にある情報又は画像内の所定の属性名に対応する情報を抽出する
    ことを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。
  5. 前記抽出情報判定手段は、前記情報抽出手段によって抽出された情報の有無又は該抽出された情報が所定の文字列を含むか否かによって、所定の情報が抽出されたか否かを判定する
    ことを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。
  6. 前記画像情報記憶手段は、前記画像を特定するための情報として、前記画像取得手段によって取得された第1の画像の順番又は該第1の画像の縮小画像を記憶する
    ことを特徴とする請求項1から5のいずれか一項に記載の画像処理装置。
  7. 前記画像取得手段は、自動文書送り装置を用いて複数の文書を読み込むことによって、複数の第1の画像及び複数の第2の画像を取得し、
    前記第2の画像に対応する前記文書は、前記第1の画像に対応する前記文書である
    ことを特徴とする請求項3から6のいずれか一項に記載の画像処理装置。
  8. 前記画像取得手段は、前記第1の画像の取得条件とは異なる条件によって前記第2の画像を取得する
    ことを特徴とする請求項2から7のいずれか一項に記載の画像処理装置。
  9. 前記画像情報記憶手段に記憶されている画像を特定するための情報に基づいて、利用者に再度読み込ませるべき画像を選択させるための第3の画像を出力する画像出力手段
    をさらに具備し、
    前記画像選択手段は、前記画像出力手段によって出力された画像内の前記利用者によって付された符号に基づいて、前記第2の画像を選択する
    ことを特徴とする請求項3から8のいずれか一項に記載の画像処理装置。
  10. 前記画像取得手段によって取得された第1の画像の特徴を抽出する特徴抽出手段と、
    前記特徴抽出手段によって抽出された特徴に基づいて、前記第1の画像内で類似している画像を抽出する類似画像抽出手段
    をさらに具備し、
    前記画像出力手段は、前記類似画像抽出手段によって抽出された類似する画像を他のものと異なるように出力する
    ことを特徴とする請求項9に記載の画像処理装置。
  11. 前記画像取得手段によって取得された第1の画像の特徴を抽出する特徴抽出手段と、
    前記特徴抽出手段によって抽出された第1の画像の特徴に基づいて、該第1の画像を分類する画像分類手段と、
    前記画像取得手段によって取得された第1の画像から切り出すべき領域を前記分類毎に記憶する領域記憶手段
    をさらに具備し、
    前記画像出力手段は、前記第1の画像に対しての前記画像分類手段による分類結果に基づいて、前記領域記憶手段に記憶されている領域を該第1の画像から切り出して、前記第3の画像を出力する
    ことを特徴とする請求項9に記載の画像処理装置。
  12. 第1の画像を複数取得する画像取得手段と、
    前記画像取得手段によって取得された第1の画像から所定の情報を抽出する情報抽出手段と、
    前記情報抽出手段によって所定の情報が抽出されたか否かを判定する抽出情報判定手段と、
    前記抽出情報判定手段によって所定の情報が抽出されていないと判定された場合、前記画像取得手段によって取得された第1の画像を記憶する画像情報記憶手段
    を具備することを特徴とする画像処理装置。
  13. 前記画像取得手段は、第2の画像を取得し、
    前記第2の画像は、前記画像情報記憶手段に記憶されている第1の画像と類似しているか否かを判断する類似画像判断手段
    をさらに具備し、
    前記情報抽出手段は、前記類似画像判断手段によって類似していると判断された前記第2の画像から所定の情報を抽出する
    ことを特徴とする請求項12に記載の画像処理装置。
  14. 前記情報抽出手段は、前記第2の画像から抽出した情報を、前記類似画像判断手段によって該第2の画像と類似していると判断された第1の画像の情報として抽出する
    ことを特徴とする請求項13に記載の画像処理装置。
  15. コンピュータを、
    第1の画像を複数取得する画像取得手段と、
    前記画像取得手段によって取得された第1の画像から所定の情報を抽出する情報抽出手段と、
    前記情報抽出手段によって所定の情報が抽出されたか否かを判定する抽出情報判定手段と、
    前記抽出情報判定手段によって所定の情報が抽出されていないと判定された場合、その対象とした画像を特定するための情報を記憶する画像情報記憶手段
    として機能させることを特徴とする画像処理プログラム。
  16. コンピュータを、
    第1の画像を複数取得する画像取得手段と、
    前記画像取得手段によって取得された第1の画像から所定の情報を抽出する情報抽出手段と、
    前記情報抽出手段によって所定の情報が抽出されたか否かを判定する抽出情報判定手段と、
    前記抽出情報判定手段によって所定の情報が抽出されていないと判定された場合、前記画像取得手段によって取得された第1の画像を記憶する画像情報記憶手段
    として機能させることを特徴とする画像処理プログラム。
JP2008064319A 2008-03-13 2008-03-13 画像処理装置及び画像処理プログラム Pending JP2009223391A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008064319A JP2009223391A (ja) 2008-03-13 2008-03-13 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008064319A JP2009223391A (ja) 2008-03-13 2008-03-13 画像処理装置及び画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2009223391A true JP2009223391A (ja) 2009-10-01

Family

ID=41240137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008064319A Pending JP2009223391A (ja) 2008-03-13 2008-03-13 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP2009223391A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010056624A (ja) * 2008-08-26 2010-03-11 Kyocera Mita Corp 画像表示装置、画像形成装置、および画像表示方法
JP2015176410A (ja) * 2014-03-17 2015-10-05 株式会社日立システムズ 情報処理装置、帳票読取方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010056624A (ja) * 2008-08-26 2010-03-11 Kyocera Mita Corp 画像表示装置、画像形成装置、および画像表示方法
JP2015176410A (ja) * 2014-03-17 2015-10-05 株式会社日立システムズ 情報処理装置、帳票読取方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP4926004B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
US20160055376A1 (en) Method and system for identification and extraction of data from structured documents
US8213717B2 (en) Document processing apparatus, document processing method, recording medium and data signal
US20070065011A1 (en) Method and system for collecting data from a plurality of machine readable documents
JP2005018678A (ja) 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム
US11182604B1 (en) Computerized recognition and extraction of tables in digitized documents
JP6795195B2 (ja) 文字種推定システム、文字種推定方法、および文字種推定プログラム
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
Clausner et al. ICDAR2019 competition on recognition of early Indian printed documents–REID2019
JP2015005100A (ja) 情報処理装置、テンプレート生成方法、およびプログラム
WO2007070010A1 (en) Improvements in electronic document analysis
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
JP2018042067A (ja) 画像処理システム、画像処理方法、情報処理装置
JP2009223391A (ja) 画像処理装置及び画像処理プログラム
US20100134851A1 (en) Image processing apparatus, method for performing image processing and computer readable medium
JP4518212B2 (ja) 画像処理装置及びプログラム
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP6007720B2 (ja) 情報処理装置及び情報処理プログラム
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JP2023003887A (ja) 書類画像処理システム、書類画像処理方法、および書類画像処理プログラム
JP2021140831A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
JP5510221B2 (ja) 情報処理装置及び情報処理プログラム