JPWO2020044537A1

JPWO2020044537A1 - 画像照合装置、画像照合方法、及びプログラム

Info

Publication number: JPWO2020044537A1
Application number: JP2020539985A
Authority: JP
Inventors: 智洋林; 郷道場; 幸代川幡; 央佐々木; 起一郎渡邊; 智也萩原
Original assignee: PFU Ltd; Fujitsu Computer Technologies Ltd
Current assignee: PFU Ltd; Fujitsu Computer Technologies Ltd
Priority date: 2018-08-31
Filing date: 2018-08-31
Publication date: 2021-03-18
Also published as: WO2020044537A1

Abstract

画像照合装置は、同一の書類の画像データに対して、互いに異なる領域に加工処理を施して生成された複数の比較画像を互いに関連付けて格納する比較画像格納部と、該比較画像格納部に格納されている比較画像それぞれと、新たに入力された入力画像とを比較して、一致度を判定する一致度判定部とを有し、該比較画像格納部は、書類の書式を定義する書式定義情報を、該比較画像に関連付けて格納し、該比較画像格納部に格納されている書式定義情報の中から、該一致度判定部による判定結果に基づいて、適用する書式定義情報を選択する書式定義選択部と、該書式定義選択部により選択された書式定義情報に基づいて、新たに入力された入力画像から情報を抽出する抽出部とをさらに有する。

Description

本発明は、画像照合装置、画像照合方法、及びプログラムに関する。

例えば、特許文献１には、個人の情報を複数のユーザに公開して、情報の共有を支援する情報共有システムにおいて、個人の公開情報を蓄積する蓄積手段と、この蓄積手段で蓄積された公開情報と、前記公開情報を提供した情報提供者にその公開情報に対するユーザの利用状態を通知するための通知条件をユーザの要求に応じて提供する情報提供手段と、前記通知条件に基づき、前記情報提供手段で提供された公開情報に対するユーザの利用状態を検知したとき、その検知したユーザの利用状態を前記情報提供者に通知する通知手段と、を具備し、前記通知条件は、前記情報提供者のみ変更可能であることを特徴とする情報共有支援システムが開示されている。

また、特許文献２には、文書内の領域の座標と、前記領域に対応する識別情報とを保存する保存手段と、新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成手段であって、前記作成手段によって作成される領域が、文書に対するブロックセレクション処理によって抽出される領域と、ユーザが指定する任意の領域とを含む、作成手段と、前記作成手段によって作成された領域の座標と、前記保存手段によって保存された領域の座標とを比較する比較手段と、前記比較手段による比較の結果と、前記保存手段によって保存された領域に対応する識別情報とに基づいて、前記作成手段によって作成された領域の座標に対応する識別情報を決定する決定手段と、前記決定手段によって決定された前記識別情報と、前記作成手段によって作成された領域に対する文字認識に基づくテキスト情報とを送信する送信手段と、前記送信手段によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行手段と、を有し、前記保存手段は、前記送信手段による送信の結果に基づいて、前記作成手段によって作成された領域の座標と、前記領域に対応する識別情報とを保存することを特徴とするシステムが開示されている。

また、特許文献３には、項目名と、この項目名に対応するデータとを含む帳票の画像を記憶する記憶部と、前記帳票の画像から所定の項目名を探索する探索部と、前記帳票の画像上のデータを選択する情報を受け取る入力部と、前記選択されたデータと前記探索された項目名を関連付ける関連付け部と、前記関連付けられたデータを文字認識する文字認識部と、を具備する帳票読取装置が開示されている。

特開２００９−１２２７２３号公報特開２０１７−８４１９８号公報特開２０１８−３７０３６号公報

画像の照合を支援する画像照合システムを提供することを目的とする。

本発明に係る画像照合装置は、同一の書類の画像データに対して、互いに異なる領域に加工処理を施して生成された複数の比較画像を互いに関連付けて格納する比較画像格納部と、前記比較画像格納部に格納されている比較画像それぞれと、新たに入力された入力画像とを比較して、一致度を判定する一致度判定部とを有する。

好適には、前記比較画像格納部は、書類の書式を定義する書式定義情報を、前記比較画像に関連付けて格納し、前記比較画像格納部に格納されている書式定義情報の中から、前記一致度判定部による判定結果に基づいて、適用する書式定義情報を選択する書式定義選択部と、前記書式定義選択部により選択された書式定義情報に基づいて、新たに入力された入力画像から情報を抽出する抽出部とをさらに有する。

好適には、前記一致度判定部により判定された一致度が、いずれの比較画像についても基準以下であった場合に、前記入力画像に対して、互いに異なる領域に加工処理を施して、複数の比較画像を生成する比較画像生成部と、前記比較画像生成部により生成された複数の比較画像を、前記比較画像格納部に追加登録する比較画像登録部とをさらに有する。

好適には、前記比較画像生成部は、同一の入力画像に対して、生成される複数の比較画像が互いに異なるデータサイズとなるような加工処理を施す。

好適には、前記比較画像生成部は、同一の入力画像に対して、互いに異なる領域の画像を削除して、複数の比較画像を生成する。

好適には、前記比較画像格納部は、前記入力画像と同一の比較画像、前記入力画像の任意の領域が削除された比較画像、前記入力画像から罫線枠内が削除された比較画像、前記入力画像から罫線枠外のみが抽出された比較画像、及び、前記入力画像に含まれる罫線のみを抽出した比較画像、のうち、少なくとも２つを格納している。

好適には、比較対象から除外される画像領域について、画像領域の数、画像領域の大きさ、及び、画像領域の位置のうち、少なくとも一つを変更する除外領域変更部をさらに有し、前記一致度判定部は、前記比較画像の少なくとも一つについて、前記除外領域変更部により変更された画像領域を比較対象から除外して、前記入力画像と前記比較画像とを比較して一致度を判定する。

本発明に係る画像照合方法は、同一の書類の画像データに対して、互いに異なる領域に加工処理を施して生成された複数の比較画像を生成するステップと、前記生成された複数の比較画像を互いに関連付けてデータベースに登録するステップと、前記データベースに登録された比較画像それぞれと、新たに入力された入力画像とを比較して、一致度を判定するステップとを有する。

本発明に係るプログラムは、同一の書類の画像データに対して、互いに異なる領域に加工処理を施して生成された複数の比較画像を生成するステップと、前記生成された複数の比較画像を互いに関連付けてデータベースに登録するステップと、前記データベースに登録された比較画像それぞれと、新たに入力された入力画像とを比較して、一致度を判定するステップとをコンピュータに実行させる。

画像の照合を支援することができる。

画像照合システム１における学習データを例示する図である。画像照合システム１におけるＯＣＲ認識の概要を説明する図である。画像照合システム１のシステム構成を例示する図である。画像照合装置５のハードウェア構成を例示する図である。画像照合装置５の機能構成を例示する図である。ＯＣＲ認識結果確認画面を例示する図である。レイアウト補正画面を例示する図である。パターン化された比較画像の例を示す図である。画像照合システム１における、学習データ生成処理（Ｓ１０）を説明するフローチャートである。画像照合システム１における、画像照合処理（Ｓ３０）を説明するフローチャートである。比較例におけるＯＣＲ認識の概要を説明する図である。

［背景］
本発明がなされた背景を説明する。
顧客との取引で発生する書類は紙であり、多種多様な書類となっている。これらの書類を画像データから準定型の書類としてＯＣＲ（ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ）認識するにあたり、書類の種類毎に準定型のＯＣＲ認識用の書式定義を行う必要がある。書類としてのＯＣＲ認識時、ＯＣＲ認識用の書式定義が照合できなかったり、ＯＣＲ認識されない部分があったりなど、ＯＣＲ認識の不具合が発生することがある。ＯＣＲ認識の不具合が発生した場合、ＯＣＲ認識結果の修正や、ＯＣＲ認識する範囲定義の修正などを行なわなければならず、作業効率が悪い。また、紙からの電子データ化などの事務作業における効率化のニーズも高まっている。
準定型書類とは、請求書などの書類において、請求する会社によりフォーマットが微妙に異なる書類をいう。

図１１は、比較例におけるＯＣＲ認識処理の概要を説明する図である。
図１１に例示するように、比較例のＯＣＲ認識処理では、書類の種類毎にＯＣＲ認識のための書式定義をユーザが作成し、作成された書式定義に基づいてＯＣＲ認識を行っている。また、準定型の書類として認識し、運用時にＯＣＲ認識に不具合があったとき、ＯＣＲ認識する範囲を修正しても、修正した情報は書式定義に反映されなかった。そのため、ＯＣＲ認識後に書式定義を修正し忘れたり、ＯＣＲ認識を行うたびに、認識不良部分の範囲が発生するため、認識する範囲を再設定しなければならないという問題があった。なお、ＯＣＲ認識する範囲の抽出率を向上するためには、認識する書類毎に書式定義が必要となり、書式定義が膨大な量となった。そのため、書式定義の照合時に、合致する書式定義が見つからなかったり、書式定義の照合に時間がかかったりした。修正したＯＣＲ認識用の書式定義の管理も煩雑になるという問題もあった。

図１は、本発明の画像照合装置５が管理する学習データを例示する図である。
図２は、画像照合システム１におけるＯＣＲ認識の概要を説明する図である。
上記課題に対して、本発明は、図１に例示するように、一つの書類に対して情報量の異なる複数の画像データ（比較画像）を保持し、複数の画像データは、一つの書式定義に関連付けられている。本発明の画像照合装置５は、ＯＣＲ認識の対象書類と完全に一致しなくとも、これらの複数の画像データに一致する書類を特定することにより、ＯＣＲ認識の対象書類に適した書式定義に基づいた文字認識を行い、照合率を上げるものである。
また本発明の画像照合システムは、図２に例示するように、ユーザがＯＣＲ認識する範囲を修正した場合、すなわち、文字認識するレイアウトを補正した場合、修正した内容に基づいて、学習データを生成するため、ユーザによる書式定義の再設定が不要である。

本発明の実施形態を、図面を参照して説明する。
図３は、画像照合システム１の全体構成を例示する図である。
図３に例示するように、画像照合システム１は、複数のスキャナ３a、スキャナ３ｂ、スキャナ３ｃ及び画像照合装置５を含み、ネットワーク７を介して互いに接続している。
スキャナ３ａ、スキャナ３ｂ、スキャナ３ｃを合わせてスキャナ３と称する。スキャナ３は、光学式の読取装置で取得した画像データ（以下、入力画像という）を画像照合装置５に送信する。
画像照合装置５は、コンピュータ端末であり、スキャナ３から受信した画像データの文字認識を行う。具体的には、画像照合装置５は、文字認識するために使用する、入力画像に適した書式定義を特定し、特定した書式定義を適用して入力画像の文字認識を行う。より具体的には、画像照合装置５が生成した比較画像に基づいて入力画像に適した書式定義を特定する。

図４は、画像照合装置５のハードウェア構成を例示する図である。
図４に例示するように、画像照合装置５は、ＣＰＵ２００、メモリ２０２、ＨＤＤ２０４、ネットワークインタフェース２０６（ネットワークＩＦ２０６）、表示装置２０８、及び入力装置２１０を有し、これらの構成はバス２１２を介して互いに接続している。
ＣＰＵ２００は、例えば、中央演算装置である。
メモリ２０２は、例えば、揮発性メモリであり、主記憶装置として機能する。
ＨＤＤ２０４は、例えば、ハードディスクドライブ装置であり、不揮発性の記録装置としてコンピュータプログラムやその他のデータファイルを格納する。
ネットワークＩＦ２０６は、有線又は無線で通信するためのインタフェースである。
表示装置２０８は、例えば、液晶ディスプレイである。
入力装置２１０は、例えば、キーボード及びマウスである。

図５は、画像照合装置５の機能構成を例示する図である。
図５に例示するように、画像照合装置５には、画像照合プログラム５０がインストールされ、画像照合プログラム５０は、例えば、ＣＤ−ＲＯＭ等の記録媒体に格納されており、この記録媒体を介して、画像照合装置５にインストールされると共に学習データデータベース６００（学習データＤＢ６００）が構成される。
学習データＤＢ６００とは、図２に例示するように、書類毎のレイアウトデータを管理する。レイアウトデータとは、入力画像の文字認識をするための書式定義、書式定義に関連付けられる比較画像、及び書式定義に関連付けられる特長点データを含む。比較画像及び特長点データは、入力画像に対する文字認識のために使用する書式定義を決定する要素である。
なお、画像照合プログラム５０の一部又は全部は、ＡＳＩＣなどのハードウェアにより実現されてもよく、また、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）の機能を一部借用して実現されてもよい。また、このプログラム全体が一台のコンピュータ端末にインストールされてもよいし、クラウド上の仮想マシンにインストールされてもよい。

画像照合プログラム５０は、画像取得部５００、比較画像格納部５０２、一致度判定部５０４、書式定義選択部５０６、抽出部５０８、レイアウト補正部５１０、比較画像生成部５１２、定型書式定義生成部５１４、特長点データ抽出部５１６、及び比較画像登録部５１８を有する。

画像照合プログラム５０において、画像取得部５００は、スキャナ３によりスキャンされた書類の画像データを取得し、入力画像とする。
比較画像格納部５０２は、同一の書類の画像データに対して、互いに異なる領域に加工処理を施して生成された複数の比較画像を互いに関連付けて格納する。具体的には、比較画像格納部５０２は、一つの書類に対してパターン化された比較画像５種類のうち、少なくとも２つを格納する。また、比較画像格納部５０２は、書類の書式を定義する書式定義情報（以下、書式定義とする。）を、比較画像に関連付けて格納する。書式定義とは、同じ種類の準定型書類を複数取り込んだ画像データから１つを使用し、ＯＣＲ認識するために書類の種類を特定する情報、及びＯＣＲ認識する範囲を特定する情報である。例えば、書式定義とは、ＯＣＲ認識する範囲を、キーワードである「お客様名」とキーワードからの位置(上、下、左、右からなる条件)に基づいて特定する情報である。書式定義はユーザにより定義される。

一致度判定部５０４は、比較画像格納部５０２に格納されている比較画像それぞれと、新たに入力された入力画像とを比較して、一致度を判定する。一致度判定部５０４は、比較画像と入力画像との一致度が基準を超える場合に両者が一致していると判定する。また、一致度判定部５０４は、特長点データに基づいて、入力画像に対する文字認識に使用する学習データの候補を抽出し、比較画像と入力画像との一致度に基づいて抽出した候補の中から基準を超える一致度を有する学習データを決定する。

書式定義選択部５０６は、比較画像格納部５０２に格納されている書式定義の中から、一致度判定部５０４による判定結果に基づいて、適用する書式定義を選択する。具体的には、書式定義選択部５０６は、一致度判定部５０４により決定された学習データの書式定義を、入力画像の文字認識に使用する書式定義として選択する。

抽出部５０８は、書式定義選択部５０６により選択された書式定義に基づいて、新たに入力された入力画像から、情報を抽出する。具体的には、抽出部５０８は、入力画像を書式定義に基づいて文字認識し、図６に例示するように、認識結果をＯＣＲ認識結果確認画面に表示する。ＯＣＲ認識結果確認画面では、書類の各項目名（日付、電話番号、名前等）と項目の値が表示される。ユーザは、ＯＣＲ認識結果確認画面で文字認識の結果を確認し、誤りがある場合は、修正する。

レイアウト補正部５１０は、入力画像の文字認識する範囲、または文字認識する範囲に記載されている項目の意味（日付、電話番号、名前等の値）を変更する。具体的には、図７に例示するように、レイアウト補正画面には、入力画像のイメージが表示され、ユーザにより文字認識範囲が再設定された場合に、レイアウト補正部５１０は、変更を受け付け、文字認識する範囲を変更する。

比較画像生成部５１２は、一致度判定部５０４により判定された一致度が、いずれの比較画像についても基準以下であった場合に、入力画像に対して、互いに異なる領域に加工処理を施して、複数の比較画像を生成する。具体的には、比較画像生成部５１２は、同一の入力画像に対して、生成される複数の比較画像が互いに異なるデータサイズとなるような加工処理を施す。また、比較画像生成部５１２は、同一の入力画像に対して、互いに異なる領域の画像を削除して、複数の比較画像を生成する。

定型書式定義生成部５１４は、レイアウト補正部５１０により文字認識する範囲を変更された場合に、または、書類の項目の意味が変更された書式定義を比較画像に関連付けて学習データＤＢ６００に保存する。
特長点データ抽出部５１６は、レイアウト補正部５１０により補正された比較画像の特長点を抽出し、比較画像に関連付けて学習データＤＢ６００に保存する。
比較画像登録部５１８は、比較画像生成部５１２により生成された複数の比較画像を、比較画像格納部５０２に追加登録する。具体的には、生成された複数の比較画像を定型書式定義生成部５１４により生成された書式定義、及び特長点データ抽出部５１６により抽出された特長点データに関連付けて学習データＤＢ６００に保存する。

次に比較画像について説明する。
図８は、パターン化された比較画像の例を示す図である。
本例では、図８に例示するように、学習データＤＢ６００は、一つの書類に対して５段階の比較画像を有する。５段階の比較画像とは、入力画像と同一の比較画像（オリジナル画像データ）、入力画像の任意の領域が削除された比較画像（パターン１）、入力画像から罫線枠内が削除された比較画像（パターン２）、入力画像から罫線枠外のみ抽出された比較画像、及び、入力画像に含まれる罫線のみを抽出した比較画像（パターン４）である。
書類毎に５段階の比較画像が用意されているため、軽微な変更がなされた書類が入力画像である場合でも、５段階のいずれかと一致すると判定されれば、書式定義を特定することができ、入力画像に対する文字認識が可能となり、照合率が向上する。
また、パターン１の比較画像は、オリジナルの画像データから照合しない領域をランダムに作成した画像データである。具体的には、画像データ中に、照合しない領域は、ランダムな位置(ｘ座標及びｙ座標は(０，０)から書類の画像データの最大ピクセルの範囲)に、ランダムな大きさ(書類の画像データにおける１辺当たり(ピクセル)の５％〜２０％の範囲の大きさ)の矩形で、複数個(個数は１〜１０の範囲でランダム)存在する。

図９は、学習データ生成処理（Ｓ１０）を説明するフローチャートである。
図９に例示するように、ステップ１００（Ｓ１００）において、画像取得部５００は、スキャナ３によりスキャンされた書類の画像データを取得し、入力画像とする。
ステップ１０５（Ｓ１０５）において、一致度判定部５０４は、入力画像と比較画像とを比較し、一致度が基準を超える比較画像を検索する。一致度が基準を超える比較画像がない場合は、Ｓ１１０へ移行し、一致度が基準を超える比較画像が存在する場合は、画像照合処理（Ｓ３０）に移行する。
ステップ１１０（Ｓ１１０）において、書式定義選択部５０６は、準定型書類に関連付けられる書式定義を取得する。
ステップ１１５（Ｓ１１５）において、抽出部５０８は、入力画像の文字認識を書式定義選択部５０６により選択された書式定義に基づいて行う。
ステップ１２０（Ｓ１２０）において、抽出部５０８は、文字認識結果を、ＯＣＲ認識結果確認画面に表示し、ユーザは結果を確認する。

ステップ１２５（Ｓ１２５）において、認識されていない文字列がある場合は、Ｓ１４５へ移行し、すべて認識されている場合は、Ｓ１３０に移行する。
ステップ１３０（Ｓ１３０）において、比較画像生成部５１２は、抽出部５０８により文字認識に使用された準定型書類の画像データに基づいて、５段階の情報量の異なる比較画像を生成する。
ステップ１３５（Ｓ１３５）において、定型書式定義生成部５１４は、文字認識に使用した準定型書類の書式定義に基づいて、定型書類の書式定義を生成する。
ステップ１４０（Ｓ１４０）において、特長点データ抽出部５１６は、抽出部５０８により文字認識に使用された準定型書類の画像データの特長点を抽出する。比較画像登録部５１８は、生成された書式定義とＳ１３０において生成した比較画像と特長点データとを関連づけて学習データＤＢ６００に格納する。
ステップ１４５（Ｓ１４５）において、レイアウト補正部５１０は、レイアウト補正画面に対してなされたユーザの操作に基づいて、文字列を認識させたい範囲を再設定する。
ステップ１５０（Ｓ１５０）において、抽出部５０８は、レイアウト補正部５１０により再設定された範囲において文字認識を行う。
ステップ１５５（Ｓ１５５）において、文字認識の結果に誤りがある場合は、Ｓ１６０へ移行し、誤りがない場合は、Ｓ１６５へ移行する。
ステップ１６０（Ｓ１６０）において、抽出部５０８は、ユーザによる文字認識結果の修正を受け付け、反映する。
ステップ１６５（Ｓ１６５）において、比較画像生成部５１２は、抽出部５０８により文字認識に使用された準定型書類の画像データに基づいて、５段階の情報量の異なる比較画像を生成する。

ステップ１７０（Ｓ１７０）において、定型書式定義生成部５１４は、文字認識に使用した準定型書類の書式定義、及びレイアウト補正部５１０による補正情報に基づいて定型書類の書式定義を生成する。
ステップ１７５（Ｓ１７５）において、特長点データ抽出部５１６は再設定された補正レイアウトの特長点を抽出する。比較画像登録部５１８は、生成された書式定義とＳ１６５において生成した比較画像と特長点データとを関連づけて学習データＤＢ６００に格納する。
ステップ１８０（Ｓ１８０）において、比較画像格納部５０２は、学習データＤＢ６００に格納される学習データを管理する。
従来では、ＯＣＲ認識後に文字認識の範囲の書式定義の修正が必要であったが、画像照合装置５は、ユーザによる文字認識範囲の再設定、または書類の項目の意味が変更された場合に、再設定された情報に基づいて学習データを生成するため、ユーザが書式定義の再設定をする必要はなく、従来のようなユーザによる書式定義の修正の手間が省け、さらに、書式定義の修正のし忘れが生じることもない。つまり、膨大な数のＯＣＲ認識に必要な書式定義のメンテナンスが不要となる。

図１０は、画像照合処理（Ｓ３０）を説明するフローチャートである。
図１０に例示するように、ステップ３００（Ｓ３００）において、画像取得部５００は、スキャナ３によりスキャンされた書類の画像データを取得し、入力画像とする。
ステップ３０５（Ｓ３０５）において、学習データがない場合は、学習データ生成処理（Ｓ１０）へ移行し、学習データが存在する場合は、Ｓ３１０へ移行する。
ステップ３１０（Ｓ３１０）において、一致度判定部５０４は、入力画像と学習データＤＢ６００に保持される特長点データとを比較し、一致度が基準を超える習データの候補を抽出する。
ステップ３１５（Ｓ３１５）において、一致度判定部５０４は、抽出された候補となる学習データの５段階の比較画像と入力画像とを比較する。一致度判定部５０４は、比較画像の情報量の多い順に入力画像と比較する。具体的には、一致度判定部５０４は、第１段階の比較画像、第２段階の比較画像、第３段階の比較画像、第４段階の比較画像、第５段階の比較画像の順に入力画像と比較する。情報量の多い比較画像の順に入力画像と比較することでより正確性の高い照合が可能になる。

ステップ３２０（Ｓ３２０）において、一致度判定部５０４により、入力画像との一致度が基準を超える比較画像が存在すると判定された場合に、画像照合処理（Ｓ３０）は、Ｓ３２５へ移行し、一致度が基準を超える比較画像がない場合に、画像照合処理（Ｓ３０）は、学習データ生成処理（Ｓ１０）のＳ１１０へ移行する。
ステップ３２５（Ｓ３２５）において、書式定義選択部５０６は、比較画像との一致度が基準を超える比較画像に関連付けられる書式定義を取得する。
ステップ３３０（Ｓ３３０）において、抽出部５０８は、書式定義選択部５０６により選択された書式定義に基づいて入力画像の文字認識を行う。
ステップ３３５（Ｓ３３５）において、ユーザは、ＯＣＲ認識結果確認画面において認識結果を確認する。
ステップ３４０（Ｓ３４０）において、認識されていない文字列が存在する場合に、画像照合処理（Ｓ３０）は、学習データ生成処理（Ｓ１０）のＳ１３０へ移行し、すべて認識されている場合は、処理を終了する。

以上説明したように、本実施形態の画像照合システム１によれば、一つの書類に対して複数のパターンの比較画像が生成されるため、オリジナルの画像データと軽微な違いがある入力画像であっても、ユーザがその都度文字の認識範囲を補正することなく、複数パターンの比較画像のいずれかに一致することで書式定義を特定できる。すなわち、文字認識処理の作業効率、照合性能、及び文字認識の照合率が高くなる。
また、複数のパターンの比較画像を生成する場合に、ランダムに照合しない領域を作成するため、書類毎に照合しない領域が異なり、比較画像のパターンが定型化しない。
そして、入力画像に適する学習データが存在しない場合でも、ユーザによる比較画像の補正操作を認識し、補正情報に基づいて、新たに学習データを生成し、管理するため、書式定義のメンテナンスが不要となる。
さらに、スキャナ３の機種が変更されたことにより、スキャナの特性が変わり、これまでの書式定義が使用できない場合でも、画像照合装置５によれば、学習により新たな書式定義を生成するため、新規にユーザによる書式定義を作成する必要はない。

上記実施形態では、比較画像生成部５１２により作成された５段階の学習データと入力画像とを比較していたが、一つの書類に関連付けられるパターン１の比較画像を変更してもよい。
具体的には、変形例における画像照合装置５は、図５に例示する機能構成に加え、除外領域変更部５２０を有する。比較画像生成部５１２は、書類毎にパターン１の照合しない領域をランダムに作成するが、除外領域変更部５２０は、既に作成されたパターン1の照合領域を変更する。具体的には、除外領域変更部５２０は、比較対象から除外される画像領域について、画像領域の数、画像領域の大きさ、及び画像領域の位置のうち、少なくとも一つを変更する。例えば、比較画像生成部５１２により、一つの書類に対して一つのパターン１の比較画像が生成されており、管理されていた場合、パターン１の比較画像と入力画像を照合する際に、照合しない領域が固定されているため、照合率の高い書類と低い書類とが出てくるが、除外領域変更部５２０により、既に存在するパターン１の照合しない領域を変更することにより、照合率の高い書類と低い書類とのバラつきを軽減することが可能となる。

本実施形態では、スキャナ３がスキャンした画像を画像照合装置５に送信して画像照合装置５が入力画像と比較画像とを比較しているが、これに限定されず、例えば、スキャナ３に画像照合プログラム５０がインストールされ、スキャナ３が画像をスキャンし、入力画像と比較画像とを比較してもよい。

１…画像照合システム
３…スキャナ
５…画像照合装置
５０…画像照合プログラム

Claims

同一の書類の画像データに対して、互いに異なる領域に加工処理を施して生成された複数の比較画像を互いに関連付けて格納する比較画像格納部と、
前記比較画像格納部に格納されている比較画像それぞれと、新たに入力された入力画像とを比較して、一致度を判定する一致度判定部と
を有する画像照合装置。
前記比較画像格納部は、書類の書式を定義する書式定義情報を、前記比較画像に関連付けて格納し、
前記比較画像格納部に格納されている書式定義情報の中から、前記一致度判定部による判定結果に基づいて、適用する書式定義情報を選択する書式定義選択部と、
前記書式定義選択部により選択された書式定義情報に基づいて、新たに入力された入力画像から情報を抽出する抽出部と
をさらに有する請求項１に記載の画像照合装置。
前記一致度判定部により判定された一致度が、いずれの比較画像についても基準以下であった場合に、前記入力画像に対して、互いに異なる領域に加工処理を施して、複数の比較画像を生成する比較画像生成部と、
前記比較画像生成部により生成された複数の比較画像を、前記比較画像格納部に追加登録する比較画像登録部と
をさらに有する請求項１に記載の画像照合装置。
前記比較画像生成部は、同一の入力画像に対して、生成される複数の比較画像が互いに異なるデータサイズとなるような加工処理を施す
請求項３に記載の画像照合装置。
前記比較画像生成部は、同一の入力画像に対して、互いに異なる領域の画像を削除して、複数の比較画像を生成する
請求項３に記載の画像照合装置。
前記比較画像格納部は、前記入力画像と同一の比較画像、前記入力画像の任意の領域が削除された比較画像、前記入力画像から罫線枠内が削除された比較画像、前記入力画像から罫線枠外のみが抽出された比較画像、及び、前記入力画像に含まれる罫線のみを抽出した比較画像、のうち、少なくとも２つを格納している
請求項１に記載の画像照合装置。
比較対象から除外される画像領域について、画像領域の数、画像領域の大きさ、及び、画像領域の位置のうち、少なくとも一つを変更する除外領域変更部
をさらに有し、
前記一致度判定部は、前記比較画像の少なくとも一つについて、前記除外領域変更部により変更された画像領域を比較対象から除外して、前記入力画像と前記比較画像とを比較して一致度を判定する
請求項１に記載の画像照合装置。
同一の書類の画像データに対して、互いに異なる領域に加工処理を施して生成された複数の比較画像を生成するステップと、
前記生成された複数の比較画像を互いに関連付けてデータベースに登録するステップと、
前記データベースに登録された比較画像それぞれと、新たに入力された入力画像とを比較して、一致度を判定するステップと
を有する画像照合方法。
同一の書類の画像データに対して、互いに異なる領域に加工処理を施して生成された複数の比較画像を生成するステップと、
前記生成された複数の比較画像を互いに関連付けてデータベースに登録するステップと、
前記データベースに登録された比較画像それぞれと、新たに入力された入力画像とを比較して、一致度を判定するステップと
をコンピュータに実行させるプログラム。