JP5476884B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP5476884B2
JP5476884B2 JP2009213979A JP2009213979A JP5476884B2 JP 5476884 B2 JP5476884 B2 JP 5476884B2 JP 2009213979 A JP2009213979 A JP 2009213979A JP 2009213979 A JP2009213979 A JP 2009213979A JP 5476884 B2 JP5476884 B2 JP 5476884B2
Authority
JP
Japan
Prior art keywords
image
entry area
entry
module
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009213979A
Other languages
English (en)
Other versions
JP2011065311A (ja
Inventor
雅夫 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2009213979A priority Critical patent/JP5476884B2/ja
Publication of JP2011065311A publication Critical patent/JP2011065311A/ja
Application granted granted Critical
Publication of JP5476884B2 publication Critical patent/JP5476884B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
文書の画像を用いて、その文書の種別を判定することが行われている。
これに関連する技術として、例えば、特許文献1には、帳票の種類を示すマークや記号の印刷を不要とし、イメージデータの伸縮を許容する帳票書式を識別するための帳票書式識別情報及び装置を提供することを目的とし、帳票データの基準となる罫線間隔を求め、該各罫線間隔を基準罫線間隔との比率で置き換えて正規化した結果を登録する書式情報登録手段と、入力データの基準となる罫線間隔を求め、各罫線間隔を基準罫線間隔との比率で置き換えて入力書式情報とする入力書式情報生成手段と、登録書式情報と入力書式情報とを照合し、入力データが登録書式情報中のどの書式であるかを識別する書式識別手段とを有することが開示されている。
また、例えば、特許文献2には、類似した表や手書き文字等外乱を含む表、罫線の切れた表、歪んだり傾いた表、拡大・縮小された表に対しても高精度の表照合を行い、文字読取領域位置を正確に算出する表を含む帳票処理装置を提供することを目的とし、表を含む帳票処理装置が罫線抽出手段、表構造解析手段、表フォーマットデータベース、表照合手段、フィールド位置探索手段、結果表示手段で構成され、罫線抽出手段では表を含む帳票が読み取られ、読み取った画像中の表領域に含まれる罫線が抽出され、表構造解析手段では抽出された罫線から表フォーマットが作成され、表フォーマットデータベースでは表フォーマットが格納され、表照合手段では前記罫線と表フォーマットとが照合され、フィールド位置探索手段では画像上の文字読取領域位置が算出され、結果表示手段では表照合結果及びフィールド位置探索結果が出力されることが開示されている。
また、例えば、特許文献3には、文字認識用ではない帳票であっても安定した仮想ページマークを生成し、安定した帳票の識別が可能な技術を提供することを課題とし、仮想ページマークの検出にあたって、帳票の中で安定して検出できるキー線分を予め定義し、このキー線分をベースに仮想ページマーク(外接矩形)を生成し、また、キー線分の検出には冗長性を持たせ、汚れ、欠け等によってキー線分が検出できなかった場合であっても代替線分を定義してこの代替線分をベースに仮想ページマークを生成し、選択するキー線分は(1)帳票のかすれに耐えられる太さを持つ線分であること、(2)帳票周囲から十分な距離を持った位置にあり、スキューや帳票端の欠けにも安定な線分であること、(3)帳票の原紙の折り目と重ならない線分であること、の条件に合致するものとすることが開示されている。
特開平08−315068号公報 特開平07−282193号公報 特開2002−366895号公報
本発明は、記入が行われている文書の種別を判定するための前処理であって、文書の種別判定のための特徴量の抽出を行うようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、記入が行われていない文書の画像を受け付ける第1の画像受付手段と、前記第1の画像受付手段によって受け付けられた画像から記入領域を抽出する第1の記入領域抽出手段と、前記第1の画像受付手段によって受け付けられた画像の特徴量を抽出する第1の特徴量抽出手段と、前記第1の記入領域抽出手段によって抽出された記入領域に関する情報と前記特徴量抽出手段によって抽出された特徴量を記憶する記憶手段を具備し、前記第1の記入領域抽出手段は、前記第1の画像受付手段によって受け付けられた画像を、当該画像中の1文字ずつに該当する画素塊の大きさの平均値のブロックに分割し、該ブロック内に黒画素があるか否かを判定し、黒画素がない隣接するブロックを統合して、統合結果が矩形領域となるように記入領域を抽出することを特徴とする画像処理装置である。
請求項2の発明は、記入が行われた文書の画像を受け付ける第2の画像受付手段と、前記記憶手段に記憶されている記入領域に関する情報に基づいて、前記第2の画像受付手段によって受け付けられた画像から該記入領域を削除する記入領域削除手段と、前記記入領域削除手段によって削除された画像から特徴量を抽出する第2の特徴量抽出手段と、前記第2の特徴量抽出手段によって抽出された特徴量と前記記憶手段に記憶されている特徴量を比較して、前記第2の画像受付手段によって受け付けられた文書の種別を判定する判定手段を具備することを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、記入が行われた文書の画像を受け付ける第3の画像受付手段と、前記記憶手段に記憶されている記入領域に関する情報に基づいて、前記第3の画像受付手段によって受け付けられた画像から該記入領域を抽出する第2の記入領域抽出手段と、前記第2の記入領域抽出手段によって抽出された記入領域を順序付けする順序付手段と、前記順序付手段によって順序付けされた記入領域を出力する出力手段を具備することを特徴とする請求項1又は2に記載の画像処理装置である。
請求項4の発明は、前記第2の記入領域抽出手段は、前記判定手段によって判定された文書の種別に基づいて、前記記憶手段に記憶されている記入領域に関する情報を取り出し、該記入領域を抽出することを特徴とする、請求項2に従属する請求項3に記載の画像処理装置である。
請求項5の発明は、コンピュータを、記入が行われていない文書の画像を受け付ける第1の画像受付手段と、前記第1の画像受付手段によって受け付けられた画像から記入領域を抽出する第1の記入領域抽出手段と、前記第1の画像受付手段によって受け付けられた画像の特徴量を抽出する第1の特徴量抽出手段と、前記第1の記入領域抽出手段によって抽出された記入領域に関する情報と前記特徴量抽出手段によって抽出された特徴量を記憶する記憶手段として機能させ、前記第1の記入領域抽出手段は、前記第1の画像受付手段によって受け付けられた画像を、当該画像中の1文字ずつに該当する画素塊の大きさの平均値のブロックに分割し、該ブロック内に黒画素があるか否かを判定し、黒画素がない隣接するブロックを統合して、統合結果が矩形領域となるように記入領域を抽出することを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、記入が行われている文書の種別を判定するための前処理であって、文書の種別判定のための特徴量の抽出を行うことができる。
請求項2の画像処理装置によれば、記入が行われた文書の画像であっても、その文書の種別を判定することができる。
請求項3の画像処理装置によれば、順序付けされた記入領域を出力することができる。
請求項4の画像処理装置によれば、不要な記入領域の抽出を抑制することができる。
請求項5の画像処理プログラムによれば、記入が行われている文書の種別を判定するための前処理であって、文書の種別判定のための特徴量の抽出を行うことができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 帳票特徴テーブルのデータ構造例を示す説明図である。 記入領域テーブルのデータ構造例を示す説明図である。 登録モジュールが行う処理例を示すフローチャートである。 帳票フォーム判定モジュールが行う処理例を示すフローチャートである。 記入領域出力モジュールが行う処理例を示すフローチャートである。 登録モジュールが行う処理例(1)を示す説明図である。 登録モジュールが行う処理例(1)を示す説明図である。 登録モジュールが行う処理例(2)を示す説明図である。 登録モジュールの対象画像と記入領域の例を示す説明図である。 帳票フォーム判定モジュールが行う処理例を示す説明図である。 記入領域出力モジュールが行う処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
本実施の形態である画像処理装置は、図1に例示するように、登録モジュール110、帳票フォーム判定モジュール130、記入領域出力モジュール150を有している。
登録モジュール110は、画像受付モジュール112、記憶モジュール114、記入領域抽出モジュール116、特徴量抽出モジュール118を有している。
画像受付モジュール112は、文書の画像を受け付ける。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。なお、以下の説明においては、2値画像を例示して説明する。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。
また、画像の内容として、ビジネスに用いられる文書等であってもよい。ただし、記入が行われていない文書、記入が行われた文書を対象とする。記入が行われていない文書とは、書式が予め定められた文書であって、利用者による記入が行われるべきものであるが、その記入が未だ行われていない状態であるものをいう。いわゆるフォーム、テンプレート、ひな型といわれる文書であり、例えば、請求書、申請書等の書面である帳票等がある。以下、文書として帳票を用いて説明する。記入が行われた文書とは、記入が行われていない文書に対して利用者が記入したものである。なお、この記入は手書きであってもよいし、手書き以外の記入、例えば、記入が行われていない文書の文書データを用いてテキストデータ等を記入したものであってもよい。登録モジュール110における画像受付モジュール112は、記入が行われていない文書を受け取り、帳票フォーム判定モジュール130、記入領域出力モジュール150における画像受付モジュール112は、記入が行われた文書を受け取る。
記入領域抽出モジュール116は、画像受付モジュール112によって受け付けられた画像から記入領域を抽出する。そして、抽出した記入領域に関する情報を記憶モジュール114に記憶させる。記入領域とは、利用者によって記入が予定されている領域であって、物理的には、フォームの画像において予め定められた面積以上の空白領域である。記入領域抽出モジュール116は、この特徴を有する領域を抽出する。また、利用者によって空白領域から選択されたものであってもよい。なお、空白領域には、予め定められた値以下の濃度である領域を含めてもよい。
また、記入領域抽出モジュール116は、その記入領域の順序を決定してもよい。例えば、横書きの文書の場合、その記入領域の順序が左から右へ、上から下へとなるようにする。そのために、例えば、座標系として、画像の左上角を原点として、右方向へX座標の正方向、下方向にY座標の正方向としたものを用い、記入領域の左上角の座標を代表座標として説明する。代表座標が画像の左上にある記入領域を1番とし、その記入領域の代表座標のY座標と予め定められた範囲内にある記入領域を順に左から右へ(X座標順に)整列し、さらに、前述の範囲外にあり、残りの画像で代表座標が左上にある記入領域を次の順番とし、同様に順序付けを行うようにしてもよい。また、縦書きの文書の場合は、その記入領域の順序が上から下へ、右から左へとなるように、同等の処理を行う。
特徴量抽出モジュール118は、画像受付モジュール112によって受け付けられた画像の特徴量を抽出する。そして、抽出した特徴量を記憶モジュール114に記憶させる。その抽出した特徴量は、後に、帳票フォーム判定モジュール130が、文書の種別を判定するのに用いられるものである。文書の種別とは、例えば、帳票のフォームの種別のことである。例えば、画素塊の数、サイズ、分布(座標)等である。ここで、画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は一定間隔で切り出した画像領域等がある。
なお、1つの画素塊として、1文字の画像となる場合が多い。したがって、画素塊の数は文字の数、画素塊の分布は文字の分布に該当することになる。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。
記憶モジュール114は、記入領域抽出モジュール116によって抽出された記入領域に関する情報と特徴量抽出モジュール118によって抽出された特徴量を記憶する。
記入領域抽出モジュール116によって抽出された記入領域に関する情報としては、例えば、記入領域テーブル300がある。図3は、記入領域テーブル300のデータ構造例を示す説明図である。記入領域テーブル300は、文書として帳票を例示した場合であり、帳票ID欄310、記入領域ID欄320、記入領域位置欄330、記入領域サイズ欄340、順序欄350を有している。
帳票ID欄310は、その帳票を一意に識別する帳票ID(IDentification)を記憶する。
記入領域ID欄320は、その帳票内における記入領域を一意に識別する記入領域IDを記憶する。
記入領域位置欄330は、その記入領域の予め定められた位置(例えば左上角の座標)を記憶する。記入領域位置欄330は、X欄331、Y欄332を有している。X欄331は、X座標を記憶する。Y欄332は、Y座標を記憶する。
記入領域サイズ欄340は、その記入領域のサイズを記憶する。記入領域サイズ欄340は、W欄341、H欄342を有している。W欄341は、その記入領域の幅を記憶する。H欄342は、その記入領域の高さを記憶する。
順序欄350は、その記入領域の順序を記憶する。
特徴量抽出モジュール118によって抽出された特徴量としては、例えば、帳票特徴テーブル200がある。図2は、帳票特徴テーブル200のデータ構造例を示す説明図である。帳票特徴テーブル200は、文書として帳票を例示した場合であり、帳票ID欄210、帳票名欄220、サムネイル画像欄230、画像欄240、特徴量A欄250、特徴量B欄252、特徴量C欄254等を有している。
帳票ID欄210は、帳票IDを記憶する。
帳票名欄220は、その帳票の名称を記憶する。
サムネイル画像欄230は、その帳票画像のサムネイル画像(縮小画像)又はそのサムネイルが記憶されている位置(ファイル名、URL(Uniform Resource Locator)等)を記憶する。
画像欄240は、その帳票画像又はその帳票画像が記憶されている位置を記憶する。
特徴量A欄250、252、254等は、その帳票画像の特徴量を記憶する。
帳票フォーム判定モジュール130は、画像受付モジュール112、記憶モジュール114、記入領域削除モジュール132、特徴量抽出モジュール134、フォーム判定モジュール136を有している。
記入領域削除モジュール132は、記憶モジュール114に記憶されている記入領域に関する情報に基づいて、画像受付モジュール112によって受け付けられた画像からその記入領域を削除する。つまり、記入が施された帳票から記入領域を削除(空白に)して、その帳票のフォームの状態にするものである。ただし、帳票フォーム判定モジュール130の画像受付モジュール112によって受け付けられた帳票の画像は、どのフォームであるのかは、この時点では不明であるので、記入領域テーブル300内の帳票毎にこの削除処理を行う。
特徴量抽出モジュール134は、記入領域削除モジュール132によって削除された画像から特徴量を抽出する。登録モジュール110の特徴量抽出モジュール118と同等の特徴量抽出を行う。したがって、登録モジュール110と帳票フォーム判定モジュール130の間で、特徴量抽出モジュール118(134)を共有して用いてもよい。
フォーム判定モジュール136は、特徴量抽出モジュール134によって抽出された特徴量と記憶モジュール114に記憶されている特徴量を比較して、画像受付モジュール112によって受け付けられた文書の種別を判定する。文書の種別を判定するとは、記憶モジュール114に記憶されている特徴量に対応する文書とのマッチングを図ることである。つまり、帳票フォームの特徴量と、帳票フォーム判定モジュール130の画像受付モジュール112が受け付けた帳票の画像が、その帳票フォームに記入されたものだとした場合に、記入領域を削除した画像の特徴量とを比較する。
また、判定には、1つを選び出すことの他に、複数の候補を抽出すること、その認識の信頼度の高い候補から順に並べること等が含まれる。なお、このように判定の補充的なものも含み、最終的に利用者によって選択、確認等されてもよい。例えば、具体的には、比較した結果、その差分が予め定められた値以下である場合は、その帳票IDを記入された帳票画像のフォームであると認識してもよい。また、その差分が小さい順(一致度が高い順)に、ディスプレイ等の表示装置にその帳票フォームのサムネイル(帳票特徴テーブル200のサムネイル画像欄230)を提示し、利用者の操作に応じて選択してもよい。
記入領域出力モジュール150は、画像受付モジュール112、記憶モジュール114、記入領域抽出モジュール152、順序付モジュール154、出力モジュール156を有している。
記入領域抽出モジュール152は、記憶モジュール114に記憶されている記入領域に関する情報に基づいて、画像受付モジュール112によって受け付けられた画像からその記入領域を抽出する。記入領域削除モジュール132とは逆の処理を行うものである。また、記入領域抽出モジュール152は、フォーム判定モジュール136によって判定された文書の種別に基づいて、記憶モジュール114に記憶されている記入領域に関する情報を取り出し、その記入領域を抽出するようにしてもよい。つまり、帳票フォーム判定モジュール130による処理が終了した後に、記入領域出力モジュール150の処理を行うものである。
順序付モジュール154は、記入領域抽出モジュール152によって抽出された記入領域を順序付けする。つまり、記入領域テーブル300の順序欄350を用いて、記入領域を順序付けする。
出力モジュール156は、順序付モジュール154によって順序付けされた記入領域を出力する。記入領域を出力するとは、例えば、文字認識装置へその記入領域を渡すこと、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること、ファックス等の画像送信装置で画像を送信すること、画像データベース等の画像記憶装置へ画像を書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置へ渡すこと等が含まれる。
図4は、登録モジュール110が行う処理例を示すフローチャートである。
ステップS400では、登録モジュール110が、登録処理を開始する。
ステップS402では、画像受付モジュール112が、未記入帳票(フォーム)を読み込む。
ステップS404では、記入領域抽出モジュール116が、空白領域(記入領域)を抽出する。空白領域の第1の抽出処理例として、図7、8の例を用いて説明する。
図7、図8は、記入領域抽出モジュール116が行う処理例(1)を示す説明図である。
図7(a)に例示する帳票画像(フォーム)700は、ステップS402で読み込まれた画像である。申請書という帳票のフォームであり、各項目名称は記載されているが、記入はされていない。
記入領域抽出モジュール116は、帳票画像(フォーム)700の横方向に計数した黒画素のヒストグラムである投影結果710を生成する。そして、投影結果710の谷部分(横方向に黒画素が予め定められた値以下の部分)の中間で帳票画像(フォーム)700を分割する。つまり、図7(b)に例示するように、帳票画像(フォーム)700を、分割点721と分割点722とを結ぶ線、分割点723と分割点724とを結ぶ線、分割点725と分割点726とを結ぶ線、分割点727と分割点728とを結ぶ線、分割点729と分割点730とを結ぶ線で区切って、6つの領域に分割する。そして、それぞれの領域で縦方向に計数した黒画素のヒストグラムである投影結果711から投影結果716を生成する(図7(c)参照)。
次に、縦方向に計数した黒画素のヒストグラムである投影結果711等の山部分(縦方向に黒画素が予め定められた値以上の部分)を囲むように、各領域を分割する。山部分を囲む領域とは、予め定められた値のマージンを取り、画素塊を囲むようにするものである。つまり、図8(d)に例示するように、例えば、分割点731、732、734、735によって囲まれる領域(画素塊である「請求書」という文字を囲む領域)、分割点721、733、723、736によって囲まれる領域(画素塊である「日付」という文字を囲む領域)等を生成する。そして、それ以外の領域を空白領域として抽出する。つまり、例えば、帳票画像(フォーム)700の左上角、分割点731、721、733によって囲まれる領域(図8(e)に例示する記入領域候補751)、分割点732、帳票画像(フォーム)700の右上角、分割点735、722によって囲まれる領域(図8(e)に例示する記入領域候補752)、分割点733、722、736、724によって囲まれる領域(図8(e)に例示する記入領域候補753)等である。
次に、空白領域の第2の抽出処理例として、図9を用いて説明する。
図9(a)に例示する帳票画像(フォーム)800は、ステップS402で読み込まれた画像である。図7(a)に例示した帳票画像(フォーム)700と同じものである。
記入領域抽出モジュール116は、帳票画像(フォーム)800を予め定められたサイズのブロックに分割する。ここで、予め定められたサイズとしては、例えば、帳票画像(フォーム)800内の画素塊のサイズを算出し、その平均サイズに基づいた値のサイズを採用するようにしてもよい。
そして、各ブロック内に黒画素があるか否かを判定する。図9(b)に例示するものは、黒画素がないブロックには斜線をひき、黒画素があるブロックはそのままにしているものである。
次に、黒画素がないブロックを統合して、空白領域を抽出する。例えば、図9(c)に例示するように、黒画素がないブロックで隣接するもの同士を統合して、その統合結果が矩形となるようにして、空白領域を抽出する。ただし、画素塊を囲むのに必要なブロックを統合したサイズ(横書き文書の場合は、その統合したブロック群の高さであり、縦書き文書の場合は、その統合したブロック群の幅)に応じて、空白領域を抽出する。例えば、図9(c)に例示するように、記入領域候補856、857、858は、左側にある画素塊である「住所」、「金額」、「備考」という文字を囲むブロック群(2×2)の高さに応じて抽出したものである。
ステップS406では、記入領域抽出モジュール116が、利用者の操作に応じて、抽出した領域から不要な領域を削除する。ステップS404で抽出した空白領域を登録モジュール110のディスプレイ等の表示装置に表示し、利用者が不要な領域(記入領域ではない空白領域)を選択して、その選択した領域を削除する。例えば、図8(e)に例示した記入領域候補751、752が削除対象の領域として選択され得る。
ステップS408では、記入領域抽出モジュール116が、抽出した領域(ステップS406で削除された領域以外の領域)を確定記入領域として記憶モジュール114(記入領域テーブル300)に保存する。また、ステップS404で抽出した空白領域を記入領域テーブル300に記憶してもよい。その場合、記入領域テーブル300に有効領域情報(フラグ)を記憶する欄を付加して、確定記入領域に対応する、その欄にフラグを立てるようにしてもよい。つまり、その欄のフラグが立っている空白領域を確定記入領域として扱うようにする。
ステップS410では、記入領域抽出モジュール116が、読み取り画像をプレビュー用に記憶モジュール114(帳票特徴テーブル200)に保存する。また、サムネイル画像を保存してもよい。
ステップS412では、特徴量抽出モジュール118が、未記入帳票の特徴量を抽出し、記憶モジュール114(帳票特徴テーブル200)に保存する。
ステップS499では、登録モジュール110が、登録処理を終了する。
前述の記入領域抽出例では、罫線のない帳票(図10(a)に例示する帳票画像(罫線なしフォーム)900)で説明したが、罫線のある帳票(図10(b)に例示する帳票画像(罫線ありフォーム)910)を対象としてもよい。その場合、罫線によって囲まれた領域を取り出し、その領域内で、図7(c)以降の処理で示したような処理を行うことによって、空白領域(図10(c)に例示する記入領域951から記入領域958)を抽出するようにしてもよい。
図5は、帳票フォーム判定モジュール130が行う処理例を示すフローチャートである。
ステップS500では、帳票フォーム判定モジュール130が、フォーム判定処理を開始する。
ステップS502では、画像受付モジュール112が、記入された帳票を読み込む。
ステップS504では、記入領域削除モジュール132が、記憶モジュール114内に一致度を計算していない登録帳票があるか否かを判断する。ある場合はステップS506へ進み、それ以外の場合はステップS514へ進む。
ステップS506では、記入領域削除モジュール132が、登録帳票の確定記入領域のマスク画像を作成する。つまり、ステップS502で読み込まれた画像と同じサイズの空画像を用意し、記憶モジュール114内の記入領域テーブル300に記憶されている確定記入領域の情報(記入領域位置欄330、記入領域サイズ欄340)を用いて、その確定記入領域に該当する空画像の領域内を黒画素で埋めた画像をマスク画像として作成する。
ステップS508では、記入領域削除モジュール132が、記入済み画像と反転マスク画像を合成する。まず、ステップS506で作成されたマスク画像を反転する。つまり、黒画素を白画素にし、白画素を黒画素にする。そして、ステップS502で読み込まれた画像と、反転したマスク画像との論理積(AND)をとる。これによって、その登録帳票における記入領域が削除された画像が生成される。この合成処理について図11の例を用いて説明する。
図11は、帳票フォーム判定モジュール130が行う処理例を示す説明図である。
図11(a)に例示する帳票画像(記入あり)1000は、ステップS502で読み込まれた画像である。申請書という帳票のフォームに記入が施された画像である。
図11(b)に例示する記入領域951から記入領域958は、フォーム判定された帳票の記入領域に基づいて作成されたマスク画像である。そして、このマスク画像を反転した反転マスク画像を生成する。
図11(c)に例示する帳票画像(記入領域削除)1030は、図11(a)の帳票画像(記入あり)1000と図11(b)のマスク画像を反転させた反転マスク画像とを合成した結果の画像である。つまり、記入領域が削除された画像が生成される。
ステップS510では、特徴量抽出モジュール134が、ステップS508で合成された画像から特徴量を抽出する。
ステップS512では、特徴量抽出モジュール134が、2つの特徴量(記憶モジュール114の帳票特徴テーブル200内の特徴量とステップS510で抽出された特徴量)の一致度を計算し、記憶する。例えば、それぞれの特徴量を比較した差異の逆数を一致度とする。
ステップS514では、フォーム判定モジュール136が、一致度の高い帳票から順に提示する。つまり、ステップS502で読み込まれた画像に類似する記憶モジュール114(帳票特徴テーブル200のサムネイル画像欄230又は画像欄240)内の登録帳票(フォーム)を類似する順に、帳票フォーム判定モジュール130のディスプレイ等の表示装置に表示する。そして、利用者の操作に応じて、登録帳票(フォーム)を確定してもよい。
ステップS599では、帳票フォーム判定モジュール130が、フォーム判定処理を終了する。
図6は、記入領域出力モジュール150が行う処理例を示すフローチャートである。このフローチャートは、図5に例示する処理が終了した後に行うものである。
ステップS600では、記入領域出力モジュール150が、記入領域の抽出処理を開始する。
ステップS602では、記入領域抽出モジュール152が、フォーム判定モジュール136によるフォーム判定結果を用いて、該当帳票の確定記入領域のマスク画像を作成する。つまり、ステップS502で読み込まれた画像と同じサイズの空画像を用意し、記憶モジュール114内の記入領域テーブル300に記憶されている該当帳票の確定記入領域の情報(記入領域位置欄330、記入領域サイズ欄340)を用いて、その確定記入領域に該当する空画像の領域内を黒画素で埋めた画像をマスク画像として作成する。
ステップS604では、記入領域抽出モジュール152が、記入済み画像とマスク画像を合成する。ステップS502で読み込まれた画像と、マスク画像との論理積(AND)をとる。これによって、その登録帳票における記入領域だけの画像が生成される。この合成処理について図12の例を用いて説明する。
図12は、記入領域出力モジュール150が行う処理例を示す説明図である。
図12(a)に例示する帳票画像(記入あり)1000は、ステップS502で読み込まれた画像である。
図12(b)に例示する記入領域951から記入領域958は、フォーム判定された帳票の記入領域に基づいて作成されたマスク画像である。
図12(c)に例示する帳票画像(記入領域)1130は、図12(a)の帳票画像(記入あり)1000と図12(b)のマスク画像とを合成した結果の画像である。つまり、記入領域だけが残された画像が生成される。
ステップS606では、順序付モジュール154が、記憶モジュール114内の順序付けの情報(記入領域テーブル300の順序欄350)に基づいて、記入領域の順序付けを行う。
ステップS608では、出力モジュール156が、順序付けされた記入領域を出力する。
ステップS699では、記入領域出力モジュール150が記入領域の抽出処理を終了する。
図13を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図13に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1317と、プリンタなどのデータ出力部1318を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1301は、前述の実施の形態において説明した各種のモジュール、すなわち、記入領域抽出モジュール116、特徴量抽出モジュール118、記入領域削除モジュール132、特徴量抽出モジュール134、フォーム判定モジュール136、記入領域抽出モジュール152、順序付モジュール154等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1302は、CPU1301が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1303は、CPU1301の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1304により相互に接続されている。
ホストバス1304は、ブリッジ1305を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1306に接続されている。
キーボード1308、マウス等のポインティングデバイス1309は、操作者により操作される入力デバイスである。ディスプレイ1310は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1311は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1301によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けた画像、サムネイル画像、帳票特徴テーブル200、記入領域テーブル300などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1312は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1313に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1307、外部バス1306、ブリッジ1305、及びホストバス1304を介して接続されているRAM1303に供給する。リムーバブル記録媒体1313も、ハードディスクと同等のデータ記録領域として利用可能である。
接続ポート1314は、外部接続機器1315を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1314は、インタフェース1307、及び外部バス1306、ブリッジ1305、ホストバス1304等を介してCPU1301等に接続されている。通信部1316は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1317は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1318は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図13に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図13に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図13に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
前述の実施の形態においては、登録モジュール110、帳票フォーム判定モジュール130、記入領域出力モジュール150が1つの筐体(画像処理装置)にある場合を示したが、それぞれを異なる筐体に設置してもよい。その場合、画像受付モジュール112はそれぞれの筐体に備えられる。そして、記憶モジュール114をそれぞれの筐体に備える場合は、その記憶する内容は、通信手段等を介して同等のものとするための複写モジュールを有している。また、記憶モジュール114は、いずれか1つ以上の筐体又は別の記憶装置に備えてもよいが、他の筐体から通信手段等を介して利用できるようにしてもよい。なお、登録モジュール110、帳票フォーム判定モジュール130、記入領域出力モジュール150の2つ以上の組み合わせ(例えば、帳票フォーム判定モジュール130と記入領域出力モジュール150)を1つの筐体に設置してもよい。
なお、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。
また、前述の実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…登録モジュール
112…画像受付モジュール
114…記憶モジュール
116…記入領域抽出モジュール
118…特徴量抽出モジュール
130…帳票フォーム判定モジュール
132…記入領域削除モジュール
134…特徴量抽出モジュール
136…フォーム判定モジュール
150…記入領域出力モジュール
152…記入領域抽出モジュール
154…順序付モジュール
156…出力モジュール

Claims (5)

  1. 記入が行われていない文書の画像を受け付ける第1の画像受付手段と、
    前記第1の画像受付手段によって受け付けられた画像から記入領域を抽出する第1の記入領域抽出手段と、
    前記第1の画像受付手段によって受け付けられた画像の特徴量を抽出する第1の特徴量抽出手段と、
    前記第1の記入領域抽出手段によって抽出された記入領域に関する情報と前記特徴量抽出手段によって抽出された特徴量を記憶する記憶手段
    を具備し、
    前記第1の記入領域抽出手段は、前記第1の画像受付手段によって受け付けられた画像を、当該画像中の1文字ずつに該当する画素塊の大きさの平均値のブロックに分割し、該ブロック内に黒画素があるか否かを判定し、黒画素がない隣接するブロックを統合して、統合結果が矩形領域となるように記入領域を抽出する
    ことを特徴とする画像処理装置。
  2. 記入が行われた文書の画像を受け付ける第2の画像受付手段と、
    前記記憶手段に記憶されている記入領域に関する情報に基づいて、前記第2の画像受付手段によって受け付けられた画像から該記入領域を削除する記入領域削除手段と、
    前記記入領域削除手段によって削除された画像から特徴量を抽出する第2の特徴量抽出手段と、
    前記第2の特徴量抽出手段によって抽出された特徴量と前記記憶手段に記憶されている特徴量を比較して、前記第2の画像受付手段によって受け付けられた文書の種別を判定する判定手段
    を具備することを特徴とする請求項1に記載の画像処理装置。
  3. 記入が行われた文書の画像を受け付ける第3の画像受付手段と、
    前記記憶手段に記憶されている記入領域に関する情報に基づいて、前記第3の画像受付手段によって受け付けられた画像から該記入領域を抽出する第2の記入領域抽出手段と、
    前記第2の記入領域抽出手段によって抽出された記入領域を順序付けする順序付手段と、
    前記順序付手段によって順序付けされた記入領域を出力する出力手段
    を具備することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記第2の記入領域抽出手段は、前記判定手段によって判定された文書の種別に基づいて、前記記憶手段に記憶されている記入領域に関する情報を取り出し、該記入領域を抽出する
    ことを特徴とする、請求項2に従属する請求項3に記載の画像処理装置。
  5. コンピュータを、
    記入が行われていない文書の画像を受け付ける第1の画像受付手段と、
    前記第1の画像受付手段によって受け付けられた画像から記入領域を抽出する第1の記入領域抽出手段と、
    前記第1の画像受付手段によって受け付けられた画像の特徴量を抽出する第1の特徴量抽出手段と、
    前記第1の記入領域抽出手段によって抽出された記入領域に関する情報と前記特徴量抽出手段によって抽出された特徴量を記憶する記憶手段
    として機能させ、
    前記第1の記入領域抽出手段は、前記第1の画像受付手段によって受け付けられた画像を、当該画像中の1文字ずつに該当する画素塊の大きさの平均値のブロックに分割し、該ブロック内に黒画素があるか否かを判定し、黒画素がない隣接するブロックを統合して、統合結果が矩形領域となるように記入領域を抽出する
    ことを特徴とする画像処理プログラム。
JP2009213979A 2009-09-16 2009-09-16 画像処理装置及び画像処理プログラム Expired - Fee Related JP5476884B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009213979A JP5476884B2 (ja) 2009-09-16 2009-09-16 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009213979A JP5476884B2 (ja) 2009-09-16 2009-09-16 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2011065311A JP2011065311A (ja) 2011-03-31
JP5476884B2 true JP5476884B2 (ja) 2014-04-23

Family

ID=43951508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009213979A Expired - Fee Related JP5476884B2 (ja) 2009-09-16 2009-09-16 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP5476884B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6119140B2 (ja) * 2012-08-03 2017-04-26 日本電気株式会社 画像処理装置、画像処置方法及び画像処理プログラム
US11438477B2 (en) 2020-01-16 2022-09-06 Fujifilm Business Innovation Corp. Information processing device, information processing system and computer readable medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3294995B2 (ja) * 1996-06-21 2002-06-24 三菱電機株式会社 帳票読取装置
JPH11288445A (ja) * 1998-04-02 1999-10-19 Nippon Telegr & Teleph Corp <Ntt> 帳票認識方法及び装置
JP2003187217A (ja) * 2001-12-20 2003-07-04 Nef:Kk 画像検索システム

Also Published As

Publication number Publication date
JP2011065311A (ja) 2011-03-31

Similar Documents

Publication Publication Date Title
JP4539756B2 (ja) 画像処理装置及び画像処理プログラム
US20180225541A1 (en) Image processing apparatuses and non-transitory computer readable medium
KR101248449B1 (ko) 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체
JP5476884B2 (ja) 画像処理装置及び画像処理プログラム
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
JP6780271B2 (ja) 画像処理装置及び画像処理プログラム
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
JP5720182B2 (ja) 画像処理装置及び画像処理プログラム
JP5742283B2 (ja) 画像処理装置及び画像処理プログラム
JP5742367B2 (ja) 画像処理装置及び画像処理プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP5923981B2 (ja) 画像処理装置及び画像処理プログラム
JP4840388B2 (ja) 画像処理装置及び画像処理プログラム
JP5924035B2 (ja) 情報処理装置及び情報処理プログラム
JP5434273B2 (ja) 画像処理装置及び画像処理プログラム
JP2010049531A (ja) 画像処理装置及び画像処理プログラム
JP5434272B2 (ja) 情報処理装置及び情報処理プログラム
JP5062076B2 (ja) 情報処理装置及び情報処理プログラム
JP5531661B2 (ja) 画像処理装置及び画像処理プログラム
JP6676955B2 (ja) 画像処理装置及び画像処理プログラム
JP2013161158A (ja) 画像処理装置及び画像処理プログラム
JP6435636B2 (ja) 情報処理装置及び情報処理プログラム
JP2008046833A (ja) 画像処理システムおよび画像処理プログラム
JP2010283536A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140127

R150 Certificate of patent or registration of utility model

Ref document number: 5476884

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees