JP7247496B2

JP7247496B2 - 情報処理装置及びプログラム

Info

Publication number: JP7247496B2
Application number: JP2018172599A
Authority: JP
Inventors: 重和笹川
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2018-09-14
Filing date: 2018-09-14
Publication date: 2023-03-29
Anticipated expiration: 2038-09-14
Also published as: CN110909723B; US11200410B2; CN110909723A; JP2020046734A; US20200089944A1

Description

本発明は、情報処理装置及びプログラムに関する。

手書きで記入された文字や記号や図形等の情報に対して認識処理が行われ、作業者がその認識結果を訂正する場合がある。例えば、文字の認識結果やチェックボックスに記入された記号の認識結果等が、作業者によって訂正されることが考えられる。

特許文献１には、文字認識の結果に含まれる文字を、同一の文字カテゴリ毎にまとめて修正する装置が記載されている。

特許文献２には、文字認識処理による文字認識の確からしさを示す値に基づいて、手書き欄に加えて当該手書き欄の周辺領域を含む領域を表示対象に含めるか否かを制御する方法が記載されている。

特開６－３６０６６号公報特開２０１５－４９６５３号公報

ところで、作業者が文字や記号や図形等の認識結果を訂正するために、作業者がすべての訂正箇所を探すとなると作業者の手間が増える。

本発明の目的は、記入領域に記入された情報に対する認識結果のすべての訂正箇所を作業者が探す場合と比較して、作業者の手間を減らすことにある。

請求項１に記載の発明は、記入者によって手書きで情報が記入される記入領域を含む抽出領域を表す抽出領域画像を受け付ける受付手段と、前記抽出領域画像に表された前記記入領域に記入されている情報に対する認識結果に対して訂正の指示が与えられた場合、前記抽出領域画像に類似する他の抽出領域画像を表示手段に表示させる制御手段と、を有し、前記制御手段は、前記記入領域が形成された文書を表す画像、及び、前記文書の画像の生成時間を基準として予め定められた時間内に生成された他の文書を表す画像から、前記他の抽出領域画像を検索して前記表示手段に表示させる、ことを特徴とする情報処理装置である。

請求項２に記載の発明は、前記記入領域は文書に形成された領域であり、前記制御手段は、前記記入者によって情報が記入された複数の文書を表す画像から前記他の抽出領域画像を検索して前記表示手段に表示させる、ことを特徴とする請求項１に記載の情報処理装置である。

請求項３に記載の発明は、前記制御手段は、前記訂正の指示が与えられた場合、更に、前記他の抽出領域画像が表す他の記入領域に前記訂正を反映させる、ことを特徴とする請求項１又は請求項２に記載の情報処理装置である。

請求項４に記載の発明は、前記制御手段は、前記他の記入領域に記入されている情報に対する認識結果の確信度に応じて、前記訂正を反映させる、ことを特徴とする請求項３に記載の情報処理装置である。

請求項５に記載の発明は、前記制御手段は、前記訂正の指示が与えられた場合、前記記入領域の属性に応じて、前記訂正を反映させる、ことを特徴とする請求項３に記載の情報処理装置である。

請求項６に記載の発明は、コンピュータを、記入者によって手書きで情報が記入される記入領域を含む抽出領域を表す抽出領域画像を受け付ける受付手段、前記抽出領域画像に表された前記記入領域に記入されている情報に対する認識結果に対して訂正の指示が与えられた場合、前記抽出領域画像に類似する他の抽出領域画像を表示手段に表示させる制御手段、として機能させ、前記制御手段は、前記記入領域が形成された文書を表す画像、及び、前記文書の画像の生成時間を基準として予め定められた時間内に生成された他の文書を表す画像から、前記他の抽出領域画像を検索して前記表示手段に表示させる、ことを特徴とするプログラムである。

請求項１，８に記載の発明によれば、記入領域に記入された情報に対する認識結果のすべての訂正箇所を作業者が探す場合と比較して、作業者の手間を減らすことができる。

請求項２に記載の発明によれば、同一の記入者によって情報が記入された複数の文書から検索された抽出領域画像が作業者に提示される。

請求項１，６に記載の発明によれば、文書の画像の生成時間を基準として検索された抽出領域画像が作業者に提示される。

請求項３に記載の発明によれば、他の記入領域に記入された情報に対する認識結果を作業者が訂正する場合と比較して、作業者の手間を減らすことができる。

請求項４に記載の発明によれば、認識結果の確信度を利用して認識結果を訂正することができる。

請求項５に記載の発明によれば、記入領域の属性を利用して認識結果を訂正することができる。

本実施形態に係る情報処理システムを示す図である。本実施形態に係る画像処理装置を示す図である。端末装置を示す図である。画像処理装置の動作に関するフローチャートを示す図である。帳票を示す図である。抽出領域を示す図である。認識結果の表示例を示す図である。認識結果の表示例を示す図である。類似画像を示す図である。類似画像を示す図である。類似画像を示す図である。認識結果の表示例を示す図である。抽出領域設定画面を示す図である。

図１を参照して、本発明の実施形態に係る情報処理システムについて説明する。図１は、本実施形態に係る情報処理システムの一例としての画像処理システムを示す。

画像処理システムは、一例として、情報処理装置の一例としての画像処理装置１０と、１又は複数の端末装置１２を含む。画像処理装置１０と端末装置１２は、例えば、インターネット又は他のネットワーク等の通信経路Ｎを介して互いに通信する機能を有する。なお、サーバ等の装置が画像処理システムに含まれてもよい。

画像処理装置１０は、画像データに認識処理（文字認識処理や図形認識処理）を適用することで、当該画像データから文字や記号や図形等を認識する装置である。認識処理として、例えば、ＯＣＲ（Optical Character Recognition）処理やＯＭＲ（Optical Mark Recognition）処理が実行される。

認識対象となる画像データは特に限定されるものではない。例えば、画像読取装置（例えばスキャナ）によって文書に対して画像読取処理が行われ、その画像読取処理によって生成された画像データが、認識対象の画像データとして用いられてもよいし、撮像装置（例えばカメラ）によって文書が撮像されることで生成された画像データが、認識対象の画像データとして用いられてもよい。もちろん、これら以外の方法によって生成された画像データが、認識対象の画像データとして用いられてもよい。

端末装置１２は、例えば、ＰＣ（パーソナルコンピュータ）、タブレットＰＣ、スマートフォン、携帯電話等である。例えば、画像データの認識結果を示す情報が画像処理装置１０から端末装置１２に送られて、その認識結果が端末装置１２に表示される。

以下、図２を参照して画像処理装置１０について詳しく説明する。図２は、画像処理装置１０の構成を示す。

画像受付部１４は、画像データを受け付けて当該画像データを認識処理部１６に出力するように構成されている。画像受付部１４は、例えば、通信経路Ｎを介して外部装置から送られてきた画像データを受け付けてもよいし、画像読取装置や撮像装置から出力された画像データを受け付けてもよい。なお、画像読取装置や撮像装置は画像処理装置１０に含まれてもよい。

認識処理部１６は、画像受付部１４が受け付けた画像データに対して認識処理（文字認識処理や図形認識処理）を適用することで、当該画像データから文字や記号や図形等の情報を認識するように構成されている。例えば、認識処理部１６は、画像データにおいて、情報（文字や記号や図形等）が記入されると想定される記入領域（例えば、文字が記入される記入欄やチェックボックス等）を特定し、その記入領域に記入されている情報（文字や記号や図形等）を認識する。認識処理部１６は、予め定められた領域を記入領域として認識してもよいし、予め定められた形状及び大きさを有する領域を記入領域として認識してもよい。例えば、記入領域内には記入者によって手書きで文字や記号や図形等が記入され、認識処理部１６は、その記入領域内に手書きで記入された文字や記号や図形等を認識する。

また、認識処理部１６は、記入領域を含む抽出領域を表す画像データ（以下、「抽出領域画像データ」と称する）を認識対象の画像データから抽出する。認識処理部１６は、記入領域と、当該記入領域を含む抽出領域を表す抽出領域画像データとを互いに紐付ける。抽出領域は、例えば予め定められた領域である。ユーザ（例えば、画像データを画像処理装置１０に入力した画像入力者や認識結果を確認及び訂正する訂正者等の作業者）によって抽出領域が定められてもよい。認識処理部１６は、各記入領域に記入されている情報を認識し、また、記入領域毎の抽出領域画像データを抽出する。認識処理部１６は、各認識結果を示す情報を確認訂正処理部２０に出力し、各抽出領域画像データを類似度判定部１８に出力する。

類似度判定部１８は、認識処理部１６が抽出した各抽出領域画像データ同士の類似度を計算する。類似度の計算として、例えば公知の技術が用いられる。例えば、画像同士の特徴点のマッチング、テンプレートを用いたマッチング、各画像のヒストグラムの比較等によって、類似度が計算される。もちろん、これら以外の手法によって類似度が計算されてもよい。

確認訂正処理部２０は、認識処理部１６による認識結果の訂正を行うように構成されている。例えば、確認訂正処理部２０は、訂正者から訂正指示を受けると、その訂正指示に従って認識結果を訂正する。その訂正指示は、例えば端末装置１２を用いて与えられる。また、確認訂正処理部２０は、認識対象の画像データの表示や認識結果の表示等を行うように構成されている。例えば、認識対象の画像データや認識結果は、端末装置１２に表示される。

また、確認訂正処理部２０は、訂正対象の認識結果が得られた記入領域に紐付く抽出領域画像データを特定し、その抽出領域画像データに類似する抽出領域画像データの表示や訂正を行うように構成されている。例えば、確認訂正処理部２０は、抽出領域画像データとの間の類似度が閾値以上となる抽出領域画像データを類似画像データとして特定し、その類似画像データの表示を行う。類似度の閾値は、例えば予め定められた値であり、訂正者等によって変更されてもよい。類似画像データは、例えば端末装置１２に表示される。なお、確認訂正処理部２０は、受付手段及び制御手段の一例に相当する。

また、確認訂正処理部２０は、訂正対象の認識結果に対する訂正を、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果に反映させてもよい。つまり、確認訂正処理部２０は、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果を、訂正対象の認識結果に対する訂正と同様に訂正してもよい。確認訂正処理部２０は、訂正対象の認識結果に対する訂正の指示が訂正者によって与えられた場合に、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果を同様に訂正してもよい（一括訂正）。また、確認訂正処理部２０は、その訂正の指示が訂正者によって与えられた場合に、類似画像データの表示を行い、その後、訂正対象の類似画像データが訂正者によって選択されて、訂正を反映させる指示が訂正者によって与えられた場合に、訂正者によって選択された類似画像データが表す抽出領域に含まれる記入領域に対する認識結果を同様に訂正してもよい（個別訂正）。

出力部２２は、確認訂正処理部２０による処理が施された認識結果を示す情報を出力するように構成されている。出力部２２は、例えば、訂正された認識結果を示す情報や、訂正されずに確認済みの認識結果を示す情報を出力する。例えば、これらの情報は端末装置１２に表示されてもよいし、端末装置１２やサーバ等に格納されてもよい。

領域設定部２４は、抽出領域を設定するように構成されている。認識処理部１６は、領域設定部２４による設定に従って抽出領域画像データを抽出する。領域設定部２４は、記入領域の種類（例えば文字の記入枠やチェックボックス等）に応じて抽出領域のサイズ（大きさ）を変えてもよい。例えば、領域設定部２４は、記入領域を含み記入領域よりも大きい領域を抽出領域として設定する。記入領域のサイズに対する抽出領域のサイズの割合（比率）は、予め定められてもよいし、訂正者等によって設定されてもよい。また、その割合は訂正者等によって変更されてもよい。なお、領域設定部２４は、記入領域よりも狭い領域を抽出領域として設定してもよい。もちろん、訂正者等によって、抽出領域のサイズが任意のサイズに設定されてもよい。例えば、文字の記入枠については、その記入枠よりも狭い領域が抽出領域として設定されてもよい。

以下、図３を参照して端末装置１２について詳しく説明する。図３は、端末装置１２の構成を示す。

通信部２６は通信インターフェースであり、情報を他の装置に送信する機能、及び、他の装置から送信されてきた情報を受信する機能を有する。通信部２６は、無線通信機能を有していてもよいし、有線通信機能を有していてもよい。

ＵＩ部２８はユーザインターフェースであり、表示部と操作部とを含む。表示部は、液晶ディスプレイやＥＬディスプレイ等の表示装置である。操作部は、キーボード等の入力装置である。また、表示部と操作部とを兼ね備えたユーザインターフェース（例えばタッチパネル等）が、ＵＩ部２８として用いられてもよい。また、ＵＩ部２８は、音を発生させるスピーカ等の音声発生部や、音声の入力を受けるマイク等の音声入力部等を含んでもよい。

例えば、認識対象の画像データ、認識結果を示す情報、抽出領域画像データ、類似画像データ等が、ＵＩ部２８の表示部に表示される。また、訂正者は、ＵＩ部２８を操作することで、認識結果の訂正指示を与えてもよい。

記憶部３０は、各種の情報（データやプログラム等）を格納する１又は複数の格納領域であり、１又は複数の記憶装置（例えばハードディスクドライブやメモリ等）によって構成される。

制御部３２は、端末装置１２の各部の動作を制御するように構成されている。例えば、制御部３２は、通信部２６による通信の制御、ＵＩ部２８（表示部）への各種情報の表示制御、ＵＩ部２８（操作部）を介して入力された情報の受付制御、等を行う。具体的には、制御部３２は、認識対象の画像データ、認識結果を示す情報、抽出領域画像データ、類似画像データ等をＵＩ部２８の表示部に表示させる。

なお、図１に示す例では、画像処理装置１０と端末装置１２とが別々のハードウェアとして構成されているが、画像処理装置１０に端末装置１２が組み込まれてもよい。つまり、画像処理装置１０は、端末装置１２が有する構成（例えばＵＩ部２８等）を有していてもよい。この場合、認識対象の画像データや認識結果を示す情報等は、画像処理装置１０に設けられた表示部に表示されてもよい。また、訂正者は画像処理装置１０に設けられたＵＩ部を操作することで認識結果を訂正してもよい。

以下、図４を参照して画像処理装置１０の動作について説明する。図４は、当該動作に関するフローチャートを示す。

まず、認識対象の画像データが画像処理装置１０に入力され、画像受付部１４は、画像データを受け付ける（ステップＳ０１）。

次に、認識処理部１６は、画像データにおいて記入領域を特定し、その記入領域内に記入されている文字や記号や図形等を認識し、更に、記入領域毎に抽出領域を表す抽出領域画像データを抽出する（ステップＳ０２）。

次に、類似度判定部１８は、認識処理部１６が抽出した各抽出領域画像データ同士の類似度を計算する（ステップＳ０３）。

次に、確認訂正処理部２０は、認識対象の画像データの表示や認識結果の表示等を行う（ステップＳ０４）。例えば、認識対象の画像データや認識結果を示す情報が、画像処理装置１０から端末装置１２に送信され、端末装置１２の制御部３２は、これらの情報をＵＩ部２８の表示部に表示させる。

訂正者は、端末装置１２に表示された認識結果を確認し、その認識結果を訂正する必要がある場合には端末装置１２を操作して訂正指示を与える。その訂正指示を示す情報は、端末装置１２から画像処理装置１０に送信され、確認訂正処理部２０は、その訂正指示を受け付けて、訂正対象の認識結果をその訂正指示に従って訂正する（ステップＳ０５）。

次に、確認訂正処理部２０は、訂正対象の認識結果が得られた記入領域に紐付く抽出領域画像データを特定し、その抽出領域画像データに類似する類似画像データ（その抽出領域画像データとの間の類似度が閾値以上となる類似画像データ）を検索する（ステップＳ０６）。

類似画像データが検索された場合（ステップＳ０７，Ｙｅｓ）、確認訂正処理部２０は、類似画像データの表示を行う（ステップＳ０８）。例えば、類似画像データが画像処理装置１０から端末装置１２に送信され、端末装置１２の制御部３２は、類似画像データをＵＩ部２８の表示部に表示させる。

次に、確認訂正処理部２０は、ステップＳ０５にて訂正者によって指示された訂正を、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果に反映させる（ステップＳ０９）。つまり、確認訂正処理部２０は、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果を、訂正対象の認識結果に対する訂正と同様に訂正する。確認訂正処理部２０は、訂正者が訂正指示を与えた場合に訂正してもよいし、自動的に訂正してもよい。

類似画像データが検索されない場合（ステップＳ０７，Ｎｏ）、処理はステップＳ１０に移行する。

認識結果に対する確認訂正が終了しない場合（ステップＳ１０，Ｎｏ）、処理はステップＳ０４に戻り、それ以降の処理が実行される。

認識結果に対する確認訂正が終了した場合（ステップＳ１０，Ｙｅｓ）、出力部２２は、確認済みの認識結果を示す情報（訂正された場合には訂正後の認識結果を示す情報）を出力する（ステップＳ１１）。例えば、これらの情報は端末装置１２に格納や表示されてもよいし、サーバ等の外部装置に格納されてもよい。

以下、具体例を挙げて画像処理装置１０の動作について更に詳しく説明する。以下では、「画像データ」を「画像」と称し、「抽出領域画像データ」を「抽出領域画像」と称し、「類似画像データ」を「類似画像」と称することとする。

図５を参照して、認識対象の画像について説明する。ここでは、一例として、文書を表す画像（文書画像）が認識対象の画像として用いられるものとする。具体的には、帳票を表す文書画像が認識対象の画像として用いられる。図５は、その帳票の一例を示す。帳票３３は、ある手続きを行うための文書である。

帳票３３には、記入者によって手書きで情報（文字や記号や図形等）が記入される記入欄が形成（例えば印刷）されている。例えば、児童１の氏名が記入される氏名記入欄３４、児童１の続柄が記入される続柄記入欄３６、児童１の生年月日が記入される生年月日記入欄３８、及び、住所に関して図形（例えばチェックマーク）が記入されるチェックボックス４０が、帳票３３に予め形成されている。児童２に関しても同様に、氏名記入欄４２、続柄記入欄４４、生年月日記入欄４６及びチェックボックス４８が、帳票３３に予め形成されている。児童３，４等についても同様である。これらの記入欄及びチェックボックスが、記入領域の一例に相当する。

図５に示す例では、児童１～４について、記入者による手書きによって、氏名記入欄、続柄記入欄及び生年月日記入欄のそれぞれに、児童の氏名を表す文字列、続柄を表す文字列及び生年月日を表す文字列が記入されている。

また、児童１についてのチェックボックス４０からはみ出るようにチェックマーク５４が記入されている。つまり、チェックマーク５４の一部がチェックボックス４０内に記入されているが、その他の部分がチェックボックス４０の外側に記入されている。児童２についてのチェックボックス４８に記入されたチェックマーク５６、及び、児童４についてのチェックボックス５２に記入されたチェックマーク５８についても同様である。児童３についてのチェックボックス５０はチェックされていない。

例えば、帳票が画像読取装置（例えばスキャナ）によって読み取られることで、帳票３３を表す画像（以下、「帳票画像」と称する）が生成される。帳票が撮像装置（例えばカメラ）によって撮像されることで帳票画像が生成されてもよい。

帳票画像が画像処理装置１０に入力されて画像受付部１４によって受け付けられて、認識処理が行われる。

認識処理部１６は、例えば、帳票画像に表されている各記入欄に文字認識処理を適用することで、各記入欄内に記入されている文字を認識し、各チェックボックスに図形認識処理を適用することで、各チェックボックス内に記入されている図形（チェックマーク）を認識する。例えば、例えば、氏名記入欄等の記入欄やチェックボックス等が、認識対象の記入領域として画像入力者や訂正者等によって予め指定されており、認識処理部１６は、このようにして指定された各入力欄や各チェックボックスを対象として認識処理を実行する。

もちろん、認識処理部１６は、上記以外の認識技術として公知の認識技術を用いることで、文字や図形等を認識してもよい。認識処理部１６は、例えば、帳票画像において矩形状の領域（直線状の枠線で囲まれた長方形や正方形の領域等）を記入欄又はチェックボックスとして認識し、その記入欄又はチェックボックスに記入されている文字や図形を認識する。例えば、氏名記入欄３４やチェックボックス４０等は矩形状の領域を有し、認識処理部１６は、氏名記入欄３４内に記入されている文字を認識し、チェックボックス４０内に記入されているチェックマークを認識する。その他の氏名記入欄やチェックボックス等についても同様である。もちろん、認識処理部１６は、矩形状以外の形状を有する領域（例えば円形状や楕円形状等の形状を有する領域や括弧で囲まれた領域等）を記入領域として認識し、その領域内に記入されている文字や図形等を認識してもよい。また、帳票画像上における各記入欄や各チェックボックスの位置（座標）が予め定められていてもよい。この場合、認識処理部１６は、各記入欄や各チェックボックスの座標に基づいて帳票画像上の各記入欄や各チェックボックスの位置を特定し、各記入欄内や各チェックボックス内に記入された文字や図形等を認識する。

また、認識処理部１６は、帳票画像から、記入欄毎に記入欄を含む抽出領域を表す抽出領域画像を抽出し、チェックボックス毎にチェックボックスを含む抽出領域を表す抽出領域画像を抽出する。

ここで、図６を参照して、チェックボックス４０に対する抽出領域について説明する。図６は、その抽出領域の一例を示す。抽出領域６０は、チェックボックス４０に対して設定された領域であって、チェックボックス４０とその周辺の領域を含む領域である。例えば、チェックボックス４０よりも数％～数十％程度大きい領域が抽出領域６０として設定される。抽出領域６０は、チェックボックス４０と相似形の形状を有する領域であってもよいし、チェックボックス４０とは異なる形状を有する領域であってもよい。抽出領域６０の大きさや形状は、予め定められてもよいし、訂正者等によって定められてもよい。例えば、記入領域からはみ出して文字や図形等が記入されることが想定される場合、そのはみ出しが想定される領域を含むように抽出領域が設定される。

チェックボックス４０に対する抽出領域として抽出領域６０が設定されると、認識処理部１６は、その抽出領域６０を表す画像を抽出領域画像として帳票画像から抽出する。図６に示す例では、抽出領域６０内にチェックボックス４０とチェックマーク５４が表されているため、認識処理部１６は、チェックボックス４０とチェックマーク５４とを表す抽出領域画像を帳票画像から抽出する。

認識処理部１６は、氏名記入欄３４や続柄記入欄３６等についても抽出領域６０と同様に抽出領域画像を帳票画像から抽出する。

類似度判定部１８は、認識処理部１６によって抽出された各抽出領域画像同士の類似度を計算する。例えば、類似度判定部１８は、チェックボックス４０とチェックマーク５４とを表す抽出領域画像と、他の抽出領域画像（例えば、チェックボックス４８とチェックマーク５６とを表す抽出領域画像や、氏名記入欄についての抽出領域画像等）との間の類似度を計算する。他のチェックボックスや氏名記入欄や続柄記入欄や生年月日記入欄についての抽出領域画像についても同様である。

上記のようにして認識処理が行われると、その認識結果が端末装置１２に表示される。以下、図７を参照して認識結果の表示例について説明する。図７は、認識結果が表示される画面の一例を示す。

画面６２には認識結果が表示される。例えば、画面６２の情報が画像処理装置１０から端末装置１２に送信され、端末装置１２のＵＩ部２８に画面６２が表示される。

図７に示す例では、画面６２には、帳票３３を表す帳票画像６４と、認識結果の表示欄６６とが表示される。表示欄６６には、帳票画像６４において認識処理の対象となった画像（例えばスキャンによって生成されたスキャン画像）と、その画像に対する認識処理の結果を示す情報とが表示される。

画像６８は、氏名記入欄３４を表す画像であって、氏名記入欄３４に手書きで記入された文字列そのものを表す画像である。画像６８として、氏名記入欄３４とその周辺とを表す抽出領域画像が表示されてもよい。認識結果７０は、氏名記入欄３４に対して文字認識処理を適用することで認識された結果である。ここでは、認識結果７０として文字列（例えば文字列「富士みなと」）が表示されている。

また、画像７２は、チェックボックス４０とその周辺とを表す画像であって、チェックボックス４０及びその周辺に対して手書きで記入されたチェックマークそのものを表す画像である。ここでは、チェックボックス４０からはみ出して手書きで記入されたチェックマークそのものが表示されている。画像７２として、チェックボックス４０とその周辺とを表す抽出領域画像（図６中の抽出領域６０を表す画像）が表示されてもよい。認識結果７４は、チェックボックス４０に対して図形認識処理を適用することで認識された結果である。ここでは、チェックマークがチェックボックス４０からはみ出して記入されており、チェックボックス４０内に記入されたチェックマークの面積の割合が、チェックボックス４０内に記入された図形をチェックマークとして認識する程度の面積の割合に至っていない。そのため、チェックボックス４０に対してチェックマークは記入されていないと認識されており（チェックがオフであると認識されており）、認識結果７４として空欄のチェックボックスが表示されている。

その他の記入欄やチェックボックス等についても同様に、画像と認識結果が表示される。

上記のように、実際はチェックボックス４０に対してチェックマークが記入されているにも関わらず、そのチェックマークの記入位置によっては、チェックマークが記入されていないと認識される場合がある。例えば、記入者の記入の癖等に起因して、チェックマークが記入されていないと認識される場合がある。

また、帳票３３に折り目が形成されている場合、その折り目が線として誤認識されることがある。例えば、折り目がチェックボックスを跨いで形成されている場合、そのチェックボックスにチェックマークが記入されていないにも関わらず、その折り目がチェックマークとして認識され、そのチェックボックスにチェックマークが記入されていると誤認識される場合がある。文字の記入欄等についても同様である。このように、記入者の癖や、帳票３３の状態（例えば折り目やゴミの付着等）に起因して、文字や記号や図形等の誤認識が発生する場合がある。

訂正者は、端末装置１２のＵＩ部２８を操作することで、画面６２上で認識結果を訂正することができる。例えば、訂正者は、認識結果としての文字列を訂正してもよいし、認識結果としての空欄のチェックボックスにチェックマークを追加してもよいし、チェックマークが認識されたチェックボックスからチェックマークを削除してもよい。訂正者によって訂正指示が与えられると、その訂正指示を示す情報が、端末装置１２から画像処理装置１０に送信され、確認訂正処理部２０は、その訂正指示に従って認識結果を訂正する。

例えば、訂正者が画面６２上で認識結果７４として表示されている空欄のチェックボックスにチェックマークを追加した場合、確認訂正処理部２０は、チェックボックス４０に対するチェックマークの有無に関する認識結果を、チェックマーク無し（チェックがオフ）からチェックマーク有り（チェックがオン）に訂正する。図８は、その訂正の結果を示す。訂正者によって、認識結果７４として表示されているチェックボックスにチェックマークが追加されており、これにより、確認訂正処理部２０は、チェックボックス４０に対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。

また、確認訂正処理部２０は、訂正対象となった認識結果７４が得られたチェックボックス４０に紐付く抽出領域画像（図６中の抽出領域６０を表す画像）に類似する類似画像を検索する。そして、確認訂正処理部２０は、その類似画像が表す抽出領域に含まれる記入領域（例えばチェックボックス）に対する認識結果を、訂正対象の認識結果７４に対する訂正と同様に訂正する（一括訂正）。つまり、訂正対象の認識結果７４に対する訂正の指示が与えられた場合、類似画像に紐付く記入領域に対する認識結果も一括して訂正される。

例えば、チェックボックス４８に紐付く抽出領域画像（チェックボックス４８とその周辺とを表す画像）と、チェックボックス５２に紐付く抽出領域画像（チェックボックス５２とその周辺とを表す画像）が、チェックボックス４０に紐付く抽出領域画像と類似するものとする。つまり、チェックボックス４８に紐付く抽出領域画像及びチェックボックス５２に紐付く抽出領域画像のそれぞれについて、チェックボックス４０に紐付く抽出領域画像との間の類似度が閾値以上である。チェックボックス４８に紐付く抽出領域画像には、チェックボックス４８と、そのチェックボックス４８からはみ出して記入されたチェックマーク５６とが表されている。チェックボックス５２に紐付く抽出領域画像には、チェックボックス５２と、そのチェックボックス５２からはみ出してチェックマーク５８とが表されている。

この場合、確認訂正処理部２０は、チェックボックス４８，５２のそれぞれに対するチェックマークの有無に関する認識結果を、訂正対象のチェックボックス４０に対する訂正と同様に訂正する（一括訂正）。例えば、チェックボックス４８，５２のそれぞれにおいてチェックマークが認識されていない場合（チェックがオフの場合）、確認訂正処理部２０は、チェックボックス４８，５２のそれぞれに対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する（一括訂正）。

確認訂正処理部２０は、例えば、訂正者がチェックボックス４０に対する認識結果を訂正した場合に、その訂正の指示に応じて、チェックボックス４８，５２のそれぞれに対する認識結果を訂正してもよいし、チェックボックス４０に対する認識結果の訂正指示に加えて、チェックボックス４８，５２のそれぞれへの訂正の反映を訂正者が指示した場合に、チェックボックス４８，５２のそれぞれに対する認識結果を訂正してもよい。

確認訂正処理部２０は、訂正結果を帳票画像６４の表示に反映させてもよい。例えば、確認訂正処理部２０は、帳票画像６４において、訂正が行われた記入領域に記入された文字や図形等を表す記入画像を強調表示（例えばハイライト表示、他の部分とは異なる色（例えば赤色等）で表示等）する。この場合において、確認訂正処理部２０は、類似画像に紐付く記入領域であって訂正が反映された記入領域に記入された文字や図形等を表す記入画像を強調表示してもよい。例えば、チェックボックス４８，５２のそれぞれに対してチェックボックス４０と同じ訂正が反映されているため、図８に示す例では、確認訂正処理部２０は、チェックマーク５６を表すチェックマーク画像７６と、チェックマーク５８を表すチェックマーク画像７８とを強調表示している。チェックマーク画像７６，７８は記入画像の一例である。例えば、確認訂正処理部２０は、文字や記号や図形等が記入される前の帳票画像と、記入後の帳票画像との間の差分を算出することで、記入された文字や記号や図形等を抽出する。そして、確認訂正処理部２０は、訂正が行われた文字等を表す記入画像を強調表示する。なお、確認訂正処理部２０は、訂正の対象となったチェックマーク５４を表すチェックマーク画像を強調表示してもよい。

以上のように、訂正対象の認識結果が訂正者によって訂正された場合、類似画像に紐付く記入領域に対する認識結果も同様に訂正される。それ故、訂正者がマニュアル操作で類似画像を探して訂正する場合と比較して、訂正者の手間が軽減される。

また、確認訂正処理部２０は、類似画像を表示してもよい。例えば、訂正者が画面６２上で認識結果に対する訂正を指示した場合に、確認訂正処理部２０は、その訂正の対象となった認識結果が得られた記入領域に紐付く抽出領域画像に類似する類似画像を検索し、その類似画像を表示する。

具体例を挙げて説明すると、訂正者が画面６２上で認識結果７４として表示されている空欄のチェックボックスにチェックマークを追加した場合、確認訂正処理部２０は、チェックボックス４０に紐付く抽出領域画像（図６中の抽出領域６０を表す画像）に類似する類似画像を表示する。

図９を参照して類似画像の表示例について説明する。図９は、類似画像の表示領域（表示ウィンドウ）の一例を示す。表示ウィンドウ８０内には、チェックボックス４０に紐付く抽出領域画像に類似する類似画像が表示されている。表示ウィンドウ８０の情報は画像処理装置１０から端末装置１２に送信されて、表示ウィンドウ８０が端末装置１２のＵＩ部２８に表示される。画面６２がＵＩ部２８に表示されている状態で、表示ウィンドウ８０がポップアップ形式で表示されてもよい。例えば、訂正者が画面６２上で認識結果７４として表示されている空欄のチェックボックスにチェックマークを追加した場合（つまり、認識結果７４に対する訂正を指示した場合）、確認訂正処理部２０は、表示ウィンドウ８０をＵＩ部２８に表示させる。チェックボックス４０に紐付く抽出領域画像との間の類似度を示す情報が、各類似画像に紐付けて表示されている。

例えば、表示ウィンドウ８０内には、抽出領域画像８２，８４，８６が類似画像として表示されている。チェックボックス４０に紐付く抽出領域画像と抽出領域画像８２，８４，８６との間の類似度はそれぞれ、９０％、８５％、５０％である。類似度が高い画像ほど、チェックボックス４０に紐付く抽出領域画像に似ている画像であるといえる。確認訂正処理部２０は、類似度順に抽出領域画像を並べて表示してもよい。図９に示す例では、類似度が高い抽出領域画像ほど上方に表示されている。

例えば、抽出領域画像８２は、チェックボックス４８とその周辺（チェックマーク５６）とを表す画像であり、抽出領域画像８４は、チェックボックス５２とその周辺（チェックマーク５８）とを表す画像であり、抽出領域画像８６は、チェックボックス５０とその周辺とを表す画像であるものとする。また、チェックボックス４８，５０，５２からチェックマークが認識されていないものとする。

訂正者が、端末装置１２を操作することで、抽出領域画像８２，８４，８６の中から訂正を反映させる抽出領域画像を選択して訂正を指示した場合（例えばＯＫボタンを押した場合）、確認訂正処理部２０は、チェックボックス４０についての認識結果７４に対する訂正を、選択された抽出領域画像に紐付くチェックボックスに対する認識結果に反映させる。つまり、確認訂正処理部２０は、選択された抽出領域画像に紐付くチェックボックスに対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。例えば、抽出領域画像８２，８４が訂正対象として訂正者によって選択されて訂正の指示が与えられた場合、確認訂正処理部２０は、抽出領域画像８２に紐付くチェックボックス４８に対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。抽出領域画像８４に紐付くチェックボックス５２に対する認識結果についても同様である。

上記の例では、チェックボックスに対する認識結果を訂正しているが、文字列が記入される記入欄（例えば氏名記入欄や生年月日記入欄等）についても同様に、ある記入欄に対する認識結果が訂正された場合、類似画像が表示される。また、類似画像に紐付く記入欄に対する認識結果が一括訂正されてもよい。

上記のように、訂正対象の認識結果に対する訂正の指示が訂正者によって与えられた場合に、類似画像が表示される。それ故、訂正者がマニュアル操作で類似画像を探す場合と比べて、訂正者の手間が軽減される。

上記の例では、確認訂正処理部２０は、同一の文書画像（帳票画像）内を対象として類似画像を検索しているが、別の文書画像を対象として類似画像を検索してもよい。例えば、確認訂正処理部２０は、同一の記入者によって文字等が記入された他の文書を表す他の文書画像から類似画像を検索してもよいし、同一の種類の文書を表す文書画像から類似画像を検索してもよい。

例えば、画像受付部１４は、文書画像と、当該文書画像が表す文書の種類を示す種類情報と、当該文書に文字等を記入した記入者を識別するための記入者識別情報とを受け付け、文書画像と種類情報と記入者識別情報とを互いに対応付けて記憶装置（図示しない）に記憶させる。記憶装置は、画像処理装置１０に設けられていてもよいし、サーバ等の外部装置に設けられていてもよい。画像受付部１４は、文書画像と種類情報と記入者識別情報とを受け付ける度に、文書画像と種類情報と記入者識別情報とを互いに対応付けて記憶装置に記憶させる。文書の種類としては、例えば、ある手続きを行うための帳票、報告書、稟議書、上申書、議事録、案内書等が挙げられる。記入者識別情報は、例えば、記入者の氏名やＩＤ等を示す情報である。例えば、記入者や他の作業者が、図示しない端末装置を用いて種類情報と記入者識別情報を入力し、画像受付部１４は、その種類情報と記入者識別情報を受け付ける。もちろん、文書画像に予め種類情報と記入者識別情報とが紐付けられていてもよい。文書画像に記入者識別情報を対応付けておくことで、同一の記入者によって記入された文書を表す文書画像が特定される。また、文書画像に種類情報を対応付けておくことで、同一の種類の文書を表す文書画像が特定される。文書画像には、種類情報と記入者識別情報の両方が対応付けられていてもよいし、種類情報又は記入者識別情報のいずれか一方の情報が対応付けられていてもよい。

以下、図１０を参照して、同一種類の文書を表す文書画像から類似画像を検索する処理について説明する。図１０は、類似画像の表示ウィンドウの一例を示す。例えば、訂正者が、図７に示されている画面６２上で、認識結果７４として表示されている空欄のチェックボックスにチェックマークを追加した場合（つまり、認識結果７４を訂正した場合）、確認訂正処理部２０は、表示ウィンドウ８８をＵＩ部２８に表示させる。表示ウィンドウ８８内には、チェックボックス４０に紐付く抽出領域画像に類似する類似画像が表示されている。表示ウィンドウ８８の情報は画像処理装置１０から端末装置１２に送信されて、表示ウィンドウ８８が端末装置１２のＵＩ部２８に表示される。画面６２がＵＩ部２８に表示されている状態で、表示ウィンドウ８８がポップアップ形式で表示されてもよい。チェックボックス４０に紐付く抽出領域画像との間の類似度を示す情報が、各類似画像に紐付けて表示されている。

例えば、表示ウィンドウ８８内には、抽出領域画像９０，９２，９４が類似画像として表示されている。チェックボックス４０に紐付く抽出領域画像と抽出領域画像９０，９２，９４との間の類似度はそれぞれ、９０％、８５％、５０％である。類似度が高い画像ほど、チェックボックス４０に紐付く抽出領域画像に似ている画像であるといえる。確認訂正処理部２０は、類似度順に抽出領域画像を並べて表示してもよい。図１０に示す例では、類似度が高い抽出領域画像ほど上方に表示されている。

ここでは、確認訂正処理部２０は、帳票３３（確認対象の文書画像が表す文書）と同一種類の帳票を表す帳票画像から類似画像を検索している。例えば、文書「帳票１」は、記入者「富士太郎」によって文字等が記入された文書であって、帳票３３と同一種類の文書である。ここでは、文書「帳票１」は帳票３３のことである。抽出領域画像９０は、「帳票１」を表す帳票画像から検索された類似画像である。文書「帳票２」は、記入者「富士太郎」によって文字等が記入された文書であって、帳票３３と同一種類の文書である。文書「帳票２」は帳票３３とは異なる文書である。抽出領域画像９２は、「帳票２」を表す帳票画像から検索された類似画像である。文書「帳票３」は、記入者「富士花子」によって文字等が記入された文書であって、帳票３３と同一種類の文書である。文書「帳票３」は帳票３３とは異なる文書である。抽出領域画像９４は、「帳票３」を表す帳票画像から検索された類似画像である。表示ウィンドウ８８内には、記入者名を示す情報と、帳票名を示す情報と、類似画像とが互いに対応付けられて表示されている。抽出領域画像９０，９２，９４はそれぞれ、チェックボックスとその周辺とを表す画像である。また、抽出領域画像９０，９２，９４のそれぞれに紐付くチェックボックスからチェックマークが認識されていないものとする。

訂正者が、端末装置１２を操作することで、抽出領域画像９０，９２，９４の中から訂正を反映させる抽出領域画像を選択して訂正を指示した場合（例えばＯＫボタンを押した場合）、確認訂正処理部２０は、チェックボックス４０についての認識結果７４に対する訂正を、選択された抽出領域画像に紐付くチェックボックスに対する認識結果に反映させる。つまり、確認訂正処理部２０は、選択された抽出領域画像に紐付くチェックボックスに対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。例えば、抽出領域画像９０，９２が訂正対象として訂正者によって選択されて訂正の指示が与えられた場合、確認訂正処理部２０は、抽出領域画像９０に紐付くチェックボックスに対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。抽出領域画像９２に紐付くチェックボックスに対する認識結果についても同様である。

以上のように、訂正対象の文書と同一種類の文書を表す文書画像から類似画像を検索して表示することで、訂正者がマニュアル操作でその類似画像を探す場合と比較して、訂正者の手間が軽減される。例えば、同一種類の文書であれば誤認識の傾向が似ている場合があるので、同一種類の文書を表す文書画像から検索された類似画像を表示することで、そのような傾向を有する類似画像が訂正者に提示される。

以下、図１１を参照して、同一の記入者によって文字等が記入された文書を表す文書画像から類似画像を検索する処理について説明する。図１１は、類似画像の表示ウィンドウの一例を示す。例えば、訂正者が、図７に示されている画面６２上で、認識結果７４として表示されている空欄のチェックボックスにチェックマークを追加した場合（つまり、認識結果７４を訂正した場合）、確認訂正処理部２０は、表示ウィンドウ９６をＵＩ部２８に表示させる。表示ウィンドウ９６内には、チェックボックス４０に紐付く抽出領域画像に類似する類似画像が表示されている。表示ウィンドウ９６の情報は画像処理装置１０から端末装置１２に送信されて、表示ウィンドウ９６が端末装置１２のＵＩ部２８に表示される。画面６２がＵＩ部２８に表示されている状態で、表示ウィンドウ９６がポップアップ形式で表示されてもよい。チェックボックス４０に紐付く抽出領域画像との間の類似度を示す情報が、各類似画像に紐付けて表示されている。

例えば、表示ウィンドウ９６内には、抽出領域画像９０，９２，９８が類似画像として表示されている。チェックボックス４０に紐付く抽出領域画像と抽出領域画像９０，９２，９８との間の類似度はそれぞれ、９０％、８５％、５０％である。類似度が高い画像ほど、チェックボックス４０に紐付く抽出領域画像に似ている画像であるといえる。確認訂正処理部２０は、類似度順に抽出領域画像を並べて表示してもよい。図１１に示す例では、類似度が高い抽出領域画像ほど上方に表示されている。

ここでは、確認訂正処理部２０は、帳票３３（確認対象の文書画像が表す文書）に文字等を記入した記入者「富士太郎」によって文字等が記入された帳票を表す帳票画像から類似画像を検索している。例えば、図１０に示す例と同様に、文書「帳票１」と「帳票２」は、記入者「富士太郎」によって文字等が記入された文書である。文書「契約書１」は、記入者「富士太郎」によって文字等が記入された文書である。文書「契約書１」は、帳票３３とは異なる種類の文書であるが、帳票３３に文字等を記入した「富士太郎」によって文字等が記入された文書である。抽出領域画像９８は、「契約書１」を表す文書画像（契約書画像）から検索された類似画像である。表示ウィンドウ９６内には、記入者名を示す情報と、帳票名を示す情報と、類似画像とが互いに対応付けられて表示されている。記入者名や書類名によって類似画像のフィルタリングを行ってもよい。抽出領域画像９０，９２，９８はそれぞれ、チェックボックスとその周辺とを表す画像である。また、抽出領域画像９０，９２，９８のそれぞれに紐付くチェックボックスからチェックマークが認識されていないものとする。

図９及び図１０に示す例と同様に、抽出領域画像９０，９２，９８から訂正者によって抽出領域画像が選択されて訂正が指示された場合、チェックボックス４０についての認識結果７４に対する訂正が、選択された抽出領域画像に紐付くチェックボックスに対する認識結果に反映される。

以上のように、同一の記入者によって文字等が記入された文書を表す文書画像から類似画像を検索して表示することで、訂正者がマニュアル操作でその類似画像を探す場合と比較して、訂正者の手間が軽減される。例えば、同一の記入者であれば、他の文書画像においてもその記入者の癖によって同じような誤認識が発生する場合があるので、同一記入者によって文字等が記入された文書を表す文書画像から検索された類似画像を表示することで、そのような誤認識が発生し得る類似画像が訂正者に提示される。

確認訂正処理部２０は、同一種類の文書であって同一の記入者によって文字等が記入された文書を表す文書画像から類似画像を検索してもよい。この場合、図１０及び図１１に示す例では、確認訂正処理部２０は、記入者「富士太郎」によって文字等が記入された文書「帳票１」と「帳票２」のそれぞれを表す帳票画像から類似画像を検索する。その結果、抽出領域画像９０，９２が検索されて表示ウィンドウ内に表示され、抽出領域画像９４，９８は表示されない。

なお、記憶装置に記憶されている文書画像の一覧が端末装置１２のＵＩ部２８に表示され、訂正者によって確認対象の文書画像が指定されると、当該文書画像がＵＩ部２８に表示されて、当該文書画像に対する認識結果の確認や訂正が行われてもよい。

また、確認訂正処理部２０は、類似画像の数を画面６２に表示させてもよい。図１２は、その表示例を示す。例えば、認識結果７４が得られたチェックボックス４０に紐付く抽出領域画像（図６中の抽出領域６０を表す画像）に類似する３つの類似画像が検索された場合、その数を示すマーク１００が、その抽出領域画像に紐付けて画面６２に表示される。こうすることで、３つの類似画像が検索されたことが訂正者に提示される。

訂正者が画面６２上でマーク１００を指定した場合（例えばクリックした場合）、確認訂正処理部２０は、図９に示されている表示ウィンドウ８０や、図１０に示されている表示ウィンドウ８８や、図１１に示されている表示ウィンドウ９６をＵＩ部２８に表示させる。

また、確認訂正処理部２０は、文書画像が生成された時間に基づいて類似画像を検索してもよい。例えば、確認訂正処理部２０は、確認対象の文書画像が生成された時間を基準として、予め定められた時間内に生成された文書画像から類似画像を検索する。文書画像が生成された時間は、例えば、当該文書画像を生成するために文書がスキャンされた時間や、当該文書が撮像された時間である。例えば、帳票画像６４が確認対象の文書画像として指定されて画面６２に表示されている場合、確認訂正処理部２０は、その帳票画像６４が生成された時間を基準として、予め定められた時間内に生成された文書画像から類似画像を検索する。確認訂正処理部２０は、帳票画像６４が生成される前において予め定められた時間内に生成された文書画像から類似画像を検索してもよいし、帳票画像６４が生成された後において予め定められた時間内に生成された文書画像から類似画像を検索してもよいし、前後両方において予め定められた時間内に生成された文書画像から類似画像を検索してもよい。確認訂正処理部２０は、帳票画像６４からも類似画像を検索する。

また、確認訂正処理部２０は、帳票画像６４が生成された時間を基準として予め定められた時間内に生成された文書画像であって、帳票３３に文字等を記入した記入者と同一人物によって文字等が記入された文書を表す文書画像から類似画像を検索してもよい。

また、確認訂正処理部２０は、訂正対象の認識結果に対する訂正の指示が訂正者から与えられた場合、記入領域の属性に応じて、類似画像に紐付く記入領域に当該訂正を反映させてもよい。例えば、類似画像に紐付く記入領域が、一文字枠（例えば、１つの文字や１つの数字や１つの記号や１つの図形等）が記入されることが想定されている記入領域に該当する場合、確認訂正処理部２０は、訂正対象の認識結果に対する訂正指示が訂正者によって与えられると、類似画像に紐付く記入領域に対する認識結果も同様に訂正する。つまり、一文字枠に対しては一括訂正が行われる。一方、類似画像に紐付く記入領域が、氏名記入欄等のように人文字枠ではない場合、確認訂正処理部２０は、訂正対象の認識結果に対する訂正指示が訂正者によって与えられた場合、図９等に示すように、類似画像が表された表示ウィンドウをＵＩ部２８に表示させる。そして、類似画像への訂正の反映の指示が訂正者によって与えられた場合、確認訂正処理部２０は、類似画像に紐付く記入領域に対する認識結果も同様に訂正する。なお、記入領域の属性を示す属性情報は、文書画像中の記入領域の表示位置に予め紐付けられていてもよい。また、確認訂正処理部２０は、文書画像に表されている特定の文字列に基づいて、その文字列に紐付く記入領域の属性を推測してもよい。例えば、「氏名」、「名前」、「おなまえ」、「Ｎａｍｅ」等の文字列は、属性「氏名」を表現する文字列であるため、そのような文字列に紐付く記入領域（例えばその文字列の近くに配置されている記入領域）は、「氏名」という属性を有する。その他の属性として、属性「住所」、属性「電話番号」、属性「ＩＤ」等が用いられてもよい。また、確認訂正処理部２０は、記入領域の大きさや形状に基づいて、当該記入領域の属性を推測してもよい。例えば、記入領域の大きさが、１つの文字や１つの記号や１つの図形等に適合した大きさである場合、その記入領域は一文字枠として認識される。

また、確認訂正処理部２０は、認識の確信度に基づいて類似画像に紐付く記入領域に対する認識結果を一括訂正してもよい。確信度は、認識処理によって認識された文字や記号や図形等が正しいものであると確信される度合（認識結果の確からしさを示す度合）である。例えば、文書画像から抽出された文字の特徴と、その文字の認識候補の標準特徴との距離の逆数が確信度として用いられる。確信度が大きいほど、抽出された文字の特徴と認識候補の標準特徴とが近いことを意味しており、認識結果が誤りである確率が低くなる。別の定義として、特徴間の類似度を確信度として用いてもよい。もちろん、これら以外の別の定義が用いられてもよい。

例えば、確認訂正処理部２０は、確信度が閾値未満となる類似画像に紐付く記入領域に対する認識結果を一括訂正する。こうすることで、誤りである確率が高い認識結果が一括して訂正される。もちろん、確認訂正処理部２０は、確信度が閾値以上となる類似画像に紐付く記入領域に対する認識結果を一括訂正してもよい。確信度の閾値は、例えば予め定められた値であり、訂正者等によって変更されてもよい。

以下、図１３を参照して、抽出領域の設定画面について説明する。図１３は、抽出領域設定画面の一例を示す。抽出領域設定画面においては、抽出領域の幅と高さをピクセル量で設定することができる。別の例として、記入領域に対する比率（％）によって抽出領域の幅と高さが設定されてもよい。また、認識対象（文字や記号や図形等）毎に抽出領域の幅と高さが設定されてもよい。この場合、認識対象毎に抽出領域の幅と高さを変えてもよい。例えば、抽出領域設定画面は端末装置１２のＵＩ部２８に表示され、訂正者によって抽出領域の幅と高さが設定される。認識処理部１６は、ここでの設定内容に従って抽出領域画像を抽出する。

上記の画像処理装置１０及び端末装置１２のそれぞれは、一例としてハードウェアとソフトウェアとの協働により実現される。具体的には、画像処理装置１０及び端末装置１２のそれぞれは、図示しないＣＰＵ等の１又は複数のプロセッサを備えている。当該１又は複数のプロセッサが、図示しない記憶装置に記憶されたプログラムを読み出して実行することにより、画像処理装置１０及び端末装置１２のそれぞれの各部の機能が実現される。上記プログラムは、ＣＤ又はＤＶＤ等の記録媒体を経由して、又は、ネットワーク等の通信経路を経由して、記憶装置に記憶される。別の例として、画像処理装置１０及び端末装置１２のそれぞれの各部は、例えばプロセッサ、電子回路又はＡＳＩＣ（Application Specific Integrated Circuit）等のハードウェア資源により実現されてもよい。その実現においてメモリ等のデバイスが利用されてもよい。更に別の例として、画像処理装置１０及び端末装置１２のそれぞれの各部は、ＤＳＰ（Digital Signal Processor）又はＦＰＧＡ（Field Programmable Gate Array）等によって実現されてもよい。

１０画像処理装置、１２端末装置、１４画像受付部、１６認識処理部、１８類似度判定部、２０確認訂正処理部、２２出力部、２４領域設定部。

Claims

記入者によって手書きで情報が記入される記入領域を含む抽出領域を表す抽出領域画像を受け付ける受付手段と、
前記抽出領域画像に表された前記記入領域に記入されている情報に対する認識結果に対して訂正の指示が与えられた場合、前記抽出領域画像に類似する他の抽出領域画像を表示手段に表示させる制御手段と、
を有し、
前記制御手段は、前記記入領域が形成された文書を表す画像、及び、前記文書の画像の生成時間を基準として予め定められた時間内に生成された他の文書を表す画像から、前記他の抽出領域画像を検索して前記表示手段に表示させる、
ことを特徴とする情報処理装置。
前記記入領域は文書に形成された領域であり、
前記制御手段は、前記記入者によって情報が記入された複数の文書を表す画像から前記他の抽出領域画像を検索して前記表示手段に表示させる、
ことを特徴とする請求項１に記載の情報処理装置。
前記制御手段は、前記訂正の指示が与えられた場合、更に、前記他の抽出領域画像が表す他の記入領域に前記訂正を反映させる、
ことを特徴とする請求項１又は請求項２に記載の情報処理装置。
前記制御手段は、前記他の記入領域に記入されている情報に対する認識結果の確信度に応じて、前記訂正を反映させる、
ことを特徴とする請求項３に記載の情報処理装置。
前記制御手段は、前記訂正の指示が与えられた場合、前記記入領域の属性に応じて、前記訂正を反映させる、
ことを特徴とする請求項３に記載の情報処理装置。
コンピュータを、
記入者によって手書きで情報が記入される記入領域を含む抽出領域を表す抽出領域画像を受け付ける受付手段、
前記抽出領域画像に表された前記記入領域に記入されている情報に対する認識結果に対して訂正の指示が与えられた場合、前記抽出領域画像に類似する他の抽出領域画像を表示手段に表示させる制御手段、
として機能させ、
前記制御手段は、前記記入領域が形成された文書を表す画像、及び、前記文書の画像の生成時間を基準として予め定められた時間内に生成された他の文書を表す画像から、前記他の抽出領域画像を検索して前記表示手段に表示させる、
ことを特徴とするプログラム。