以下、図面に基づいて、本発明の好適な実施の形態について説明する。
実施の形態1.
図1は、本実施の形態において帳票の確認訂正を行うための情報処理システムの全体構成及び本発明に係る情報処理装置の一実施の形態を示すブロック構成図である。図1には、確認訂正者用クライアント1、承認者用クライアント3及び情報処理装置10がネットワーク4で接続された構成が示されている。
なお帳票は、複数の項目等の予め定められた形式がある文書であり、例えば商品の注文書や申請書があげられる。
本実施の形態における情報処理システムでは、帳票上の文字に対して文字認識処理を施して文字を認識し、この認識された文字を確認訂正者であるユーザにより確認訂正させ、承認者であるユーザに、文字認識処理による認識結果及び確認訂正者による確認訂正結果を確認させることで、文字の認識結果を最終的に確認するためのシステムである。
ここで、「確認訂正」とは、文字認識対象となる文字の読取画像(手入力された文字の画像)を確認し、必要に応じて訂正することをいう。なお、具体的には、読取画像を確認し、読取画像で示されている文字を入力すること、読取画像の認識結果を確認し、その認識結果が正しいと判断した際は、その結果の確定をすること、読取画像の認識結果を確認し、その認識結果が誤りと判断した際は、その認識結果を訂正して入力することがあげられる。なおここでいう「確認」は、正しいと判断した場合に入力させない場合、更に正しいと判断した場合でも文字認識処理の結果と同じ文字を入力させる場合も含む。なお、ここでいう「文字」というのは、厳密に言うと1又は複数の文字から成る文字列のことをいう。
確認訂正者用クライアント1は、帳票への記載内容を確認訂正するユーザ(確認訂正者)によって使用されるクライアントコンピュータである。承認者用クライアント3は、文字認識処理の結果(文字認識結果)、またユーザにより訂正入力がされていた場合にはその入力された内容を見て、文字認識対象に対する文字認識結果の最終的な確認を行うユーザ(承認者)によって使用されるクライアントコンピュータである。確認訂正者及び承認者は、異なる人物であっても良いし、同一人物であってもよい。
本実施の形態における情報処理システムでは、1台の確認訂正者用クライアント1を設けて1人の確認訂正者によって帳票を確認訂正させる、いわゆるシングルエントリーによるシステム形態を形成している。なお、2人の確認訂正者によるダブルエントリー、若しくはそれ以上の確認訂正者により帳票を確認訂正させてもよい。2人以上の確認訂正者で帳票を確認訂正させる場合、各確認訂正者は同じ確認訂正作業を行うことになる。
本実施の形態では、各コンピュータ1,3,10を接続するネットワーク4としてLANを想定しているが、例えばインターネットを利用して外部にあるクライアント1,3を接続するよう構成してもよい。
情報処理装置10は、各クライアント1,3と連携して、帳票の項目の記入欄に手書き入力された文字の正しい認識結果を得るために全体的な制御を行うコンピュータである。図2は、本実施の形態における情報処理装置10を形成するコンピュータのハードウェア構成図である。本実施の形態における情報処理装置10は、パーソナルコンピュータ(PC)等の従前から存在する汎用的なハードウェア構成で実現できる。すなわち、情報処理装置10は、図2に示すCPU21、ROM22、RAM23、ハードディスクドライブ(HDD)24、ネットワーク4を接続し、各クライアント1,3との間でデータ通信を行うためのネットワークコントローラ25を内部バス26に接続して構成される。また、必要により、ユーザインタフェースとしてマウス27、キーボード28及びディスプレイ29をそれぞれ接続する入出力コントローラ30を内部バス26に接続して構成してもよい。
各クライアント1,3も情報処理装置10と同じコンピュータであることから、図2に示すハードウェア構成を有している。
図1に戻り、本実施の形態における情報処理装置10は、帳票画像取得部11、認識処理部12、画面生成処理部13、確認訂正処理制御部14、最終確認処理制御部15、最終結果出力部16、差分抽出部17、処理判定部18,帳票情報記憶部19及び認識結果情報記憶部20を有している。
帳票画像取得部11は、処理対象とする帳票の画像を取得する。認識処理部12は、取得された帳票画像に含まれる文字認識対象(帳票の項目の記入欄に手書き入力された文字)に対して文字認識処理を実行することで得られる文字認識結果(文字を示すテキストコード)を出力する。認識処理部12は、文字認識処理として、例えば文字認識対象となる文字の読取画像(入力画像データ)に対して公知のOCR(光学文字認識)処理を行い、これにより入力画像データ内に含まれる文字(文字列)を認識する。
画面生成処理部13は、生成指示に応じて認識処理部12による文字認識結果を確認訂正させるための確認訂正用画面を生成する。また、文字認識対象に対する認識結果の最終的な確認を承認者にさせるための最終確認用画面を生成する。確認訂正処理制御部14は、確認訂正処理の全体制御を行う。例えば、認識処理部12が出力する認識結果を取得すると、確認訂正処理制御部14は、確認訂正者用クライアント1に表示させる確認訂正用画面を画面生成処理部13に生成させると共に、生成された確認訂正用画面の表示制御を行う。最終確認処理制御部15は、文字認識対象に対する認識結果の最終的な確認を承認者にさせるための処理の全体制御を行う。例えば、確認訂正作業が終了すると承認者用クライアント3に表示させる最終確認用画面を画面生成処理部13に生成させると共に、生成された最終確認用画面の表示制御を行う。最終結果出力部16は、帳票画像取得部11が取得した帳票画像に含まれる各文字認識対象の最終的な認識結果を出力する。
差分抽出部17は、同じ項目に対する、差し戻し後の帳票であって処理対象となる帳票(第1文書)から切り出した文字認識対象に対する認識結果と、差し戻し前の帳票(第2文書)から切り出した文字認識対象に対する認識結果と、の差分を抽出する。処理判定部18は、差し戻し後の帳票に対する確認訂正が必要かどうかを判定する。帳票情報記憶部19及び認識結果情報記憶部20については、動作の説明と合わせて説明する。
情報処理装置10における各構成要素11~16は、情報処理装置10を形成するコンピュータと、コンピュータに搭載されたCPU21で動作するプログラムとの協調動作により実現される。
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD-ROMやUSBメモリ等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPU21がプログラムを順次実行することで各種処理が実現される。
次に、本実施の形態において帳票に対して実施する確認訂正処理について図3に示すフローチャートを用いて説明する。まず、ここで説明する確認訂正処理は、差し戻し前における処理である。
帳票画像取得部11は、外部から送られてきた帳票の画像を受け付ける(ステップ101)。帳票画像には、当該帳票を識別するための帳票識別情報(以下、「帳票ID」)が割り振られている。例えば、帳票IDが帳票のスキャン時(帳票画像生成時)に生成される場合、帳票画像取得部11は、帳票IDを帳票画像と合わせて取得するようにしてもよい。割り振られていない場合には、帳票画像取得部11が情報処理装置10においてユニークとなる帳票IDを割り振るようにしてもよい。帳票IDは、帳票画像の送信元の装置(帳票をスキャンした画像形成装置等)、帳票画像取得部11、また後述する最終確認処理制御部15が連携して各帳票を識別可能なように生成、管理される。本実施の形態において取り扱う帳票画像一の例を図4に示す。
続いて、認識処理部12は、取得された帳票画像から抽出対象の項目の領域に記載されている文字の読取画像(以下、「文字画像」)を切り出す(ステップ102)。抽出対象となる項目の領域は、通常、帳票設計時などで定義される。このようにして切り出された文字画像が文字認識対象となる。認識処理部12は、切り出した文字画像に当該文字画像を識別するための文字画像識別情報(以下、「文字画像ID」)を割り振る。文字画像IDと文字画像との対応関係を図5に示す。認識処理部12は、更に文字画像に対して文字認識処理を実行することで各文字画像の認識結果を取得する(ステップ103)。
続いて、確認訂正処理制御部14は、確認訂正者に確認訂正させるために確認訂正用画面を画面生成処理部13に生成させる(ステップ104)。そして、確認訂正処理制御部14は、確認訂正者に確認訂正を依頼する(ステップ105)。依頼の方法は、特に限定する必要はなく、例えば電子メールや専用のアプリケーション等を利用して確認訂正者用クライアント1に通知するようにしてもよい。
図6は、本実施の形態における確認訂正用画面の一例を示す図である。確認訂正用画面は、確認訂正処理制御部14による表示制御のもとに確認訂正者用クライアント1に表示される。ウェブページにて生成されてもよい。
確認訂正用画面には、帳票画像取得部11が取得した帳票画像31と、確認訂正作業を行うための作業用テーブル32との各表示領域が形成される。帳票画像31の表示領域には、帳票IDが合わせて表示される。作業用テーブル32は、項目名及び文字画像/認識結果の各項目が対応付けられている。
項目名は、帳票に含まれる項目であって、帳票上文字が手入力される記入欄が対応付けられている項目の名称である。文字画像/認識結果には、文字画像と認識結果が表示される。文字画像33は、帳票上の当該項目に対応する記入欄に手入力された文字の読取画像である。認識結果は、当該文字画像の認識処理部12による文字認識結果であるが、図6は表示させない画面例を示している。文字画像/認識結果には、更に、文字画像に対応させて確認訂正者により訂正内容を入力させる入力欄34が表示される。
本実施の形態においては、以上説明したように確認訂正者が確認訂正を要する項目の文字画像33に対応させて入力欄34が表示されるよう確認訂正用画面を生成し、確認訂正処理制御部14は、確認訂正者用クライアント1に対して確認訂正用画面の表示制御を行う。
確認訂正者は、確認訂正用画面の文字画像33を見て記載されている文字を認識し、その認識した文字を入力欄34に入力する。このように、図6に示す確認訂正用画面を用いた確認訂正作業では、認識処理部12による認識結果を確認することなく入力が要求される。
確認訂正者は、確認すべき文字画像に対応する全ての入力欄34に入力すると、画面下方の確定ボタン35を選択して作業終了を情報処理装置10に通知する。全ての入力欄34に文字が入力されていないと、確定ボタン35が選択できないように制御してもよい。
確認訂正者により確定ボタン35が選択されることで確認訂正作業が終了したことを認識すると、確認訂正処理制御部14は、確認訂正者用クライアント1から入力欄34に入力されている認識結果を取得する(ステップ106)。なお、認識処理部12による認識結果との違いを明確にするために、確認訂正者が確認訂正作業において入力欄34に入力した認識結果を「作業結果」と称する場合もある。
確認訂正者による確認訂正作業が終了すると、最終確認処理制御部15は、前述したように最終確認用画面を画面生成処理部13に生成させた後(ステップ107)、文字画像に対する認識文字の最終確認を承認者に依頼する(ステップ108)。
承認者は、最終確認用画面(図示せず)を参照して、文字画像に対する認識結果を確認する。そして、認識結果に問題(誤認識)がないと判断した場合、あるいは問題があったしても承認者が自ら訂正をすることで差し戻しを指示することなく確認処理を終了させた場合(ステップ110でN)、最終結果出力部16は、承認者により確認された認識結果を最終的な認識結果として出力する(ステップ113)。最終結果出力部16における出力先は、特に限定する必要はない。例えば、帳票画像の提供元、印刷装置、HDD24等の記憶手段、ネットワーク4を介して接続されているコンピュータ等でよい。
一方、最終確認用画面に表示されている認識結果に問題があり、かつ承認者が自ら訂正を行うことなく差し戻しを指示したとする。例えば、帳票上の確認訂正の対象となる記入欄が空欄の場合や記入された文字が文字認識処理でも、確認訂正者でも判読不能の場合などは差し戻しが指示される。なお差し戻しの指示は、承認者だけでなく、確認訂正者が行ってもよい。差し戻しが指示された場合(ステップ110でY)、帳票が帳票記入者に返却されて再記入を要求することになる。これに伴い、認識処理部12による文字認識処理は必要により実施される。また、確認訂正者による確認訂正作業は再度実施される。
差し戻しが指示されると、最終確認処理制御部15は、帳票情報及び認識結果情報を設定登録する(ステップ111)。
図7は、本実施の形態における帳票情報のデータ構成の一例を示す図である。帳票情報は、帳票毎に生成される帳票情報記憶部19に登録される。帳票情報は、帳票ID、関連帳票ID、帳票名、登録日時、登録ユーザ、差し戻し及びコメントを含む。帳票IDは、当該帳票に割り振られている識別情報である。関連帳票IDは当該帳票に関連付けする帳票の帳票IDである。関連帳票IDに関しては後述する。帳票名は当該帳票の名称である。登録日時は当該帳票を情報処理装置10が受け付けた日時情報である。登録ユーザは、当該帳票の記入者の識別情報であり、当該記入者のユーザIDが設定される。差し戻しは、当該帳票の差し戻しの指示の有無を示すフラグ情報である。コメントは、当該帳票に対してコメントが承認者に記入された場合にはそのコメントが登録される。例えば、判読不能な項目を記入者に伝えるようなコメントが想定できる。
帳票情報は、帳票画像取得部11が帳票を取得した時点で生成し、差し戻しの指示の有無が明確になった時点で最終確認処理制御部15が関連帳票ID、差し戻し及びコメントの各項目に情報を設定するようにしてもよい。また、本実施の形態では、情報処理装置10が取り扱う帳票に対して帳票情報を生成するが、差し戻しが指示された帳票に対してのみ帳票情報を生成するようにしてもよい。
ここで、関連帳票IDについて説明する。帳票が差し戻されると、記入者は、その差し戻された帳票の空欄に必要事項を記入することが想定できる。ただ、判読不能な文字を記入していた場合、あるいは正しく文字認識された文字であっても、差し戻しされたことにより記入者が誤った情報を差し戻し前の帳票に入力していたことに気づいた場合などは、同じ帳票の新しい帳票に書き直すことも想定できる。新しい帳票に書き直される場合、その新しい帳票には、差し戻し対象の帳票(例えば、帳票ID=001)とは異なる帳票IDが割り振られることになる。このため、差し戻し前後の帳票を関連付けるために帳票情報に関連帳票IDの項目を設けている。差し戻し後の帳票に対しては、図7に例示したように帳票IDが“002”の帳票情報が別途生成される。そして、差し戻し対象の帳票の帳票ID(例えば、帳票ID=001)が差し戻し後の関連帳票IDに設定される。
なお、帳票IDは、帳票のスキャン時若しくは情報処理装置10が帳票画像を取得したときに割り振られると説明した。ただ、差し戻しの場合には、差し戻し前後の帳票が関連付けられるように帳票IDを管理する必要がある。例えば、差し戻し時に、差し戻し後の帳票に指定の帳票ID(例えば、帳票ID=002)を割り振ることを指示する。そして、差し戻し後の帳票をスキャンにより読み取らせることで帳票の画像を生成する画像形成装置等は、情報処理装置10に指示された帳票IDを差し戻し後の帳票の画像に割り当てる。または、差し戻しに関連帳票IDを伝え、差し戻し後の帳票をスキャンで読み取る際に、ユーザに関連帳票IDを入力するようにしても良い。
図8は、本実施の形態における認識結果情報のデータ構成の一例を示す図である。認識結果情報は、文字画像毎に生成される。認識結果情報は、認識結果情報記憶部20に登録される。認識結果情報は、帳票ID、項目名、文字画像ID、認識結果、確認訂正及び最終確認を含む。帳票IDは、当該文字画像が切り出された帳票の帳票IDである。項目名は、当該文字画像に対応する項目の名称である。文字画像IDは、認識処理部12により割り振られた当該文字画像の文字画像IDである。認識結果は、認識処理部12による当該文字画像の認識結果である。確認訂正は、確認訂正者による認識結果(作業結果)である。最終確認は、承認者による最終確認の結果である。「氏名1」や「生年月日1」のように当該文字画像に対する認識処理部12及び確認訂正者による当該文字画像の認識結果が正しいと判断して承認者が入力しなかった場合、最終確認の項目は空欄となる。なお、「生年月日2」は、帳票上の記入欄が空白であったために確認訂正者が確認訂正できず、これにより確認訂正の項目は空欄となる。また、承認者は、「氏名1」や「生年月日1」の場合と異なり、最終確認をしたものの「生年月日2」の記入欄が空白であったために確認訂正者と同様に最終確認の項目は空欄となる。
認識結果情報は、認識処理部12が文字画像を切り出した時点で生成し、差し戻しの指示の有無が明確になった時点で確認訂正処理制御部14及び最終確認処理制御部15が取り扱う情報を各項目に設定するようにしてもよい。また、本実施の形態では、情報処理装置10が取り扱う帳票を認識結果情報の生成対象とするが、差し戻しが指示された帳票に対してのみ認識結果情報の生成対象としてもよい。
以上のようにして、最終確認処理制御部15は、帳票情報及び認識結果情報を設定登録すると、記入者に対して帳票の確認を指示する(ステップ112)。これは、帳票情報の登録ユーザに基づき帳票をスキャンした装置等に指示するようにしてもよい。
以下、本実施の形態における差し戻し後に実施する処理について図9に示すフローチャートを用いて説明する。
記入者は、帳票の差し戻しに応じて帳票の所定の記入欄に手書き入力する。その帳票には、指示した帳票IDが割り振られており、帳票画像取得部11は、その帳票の画像及び帳票IDを受け付ける(ステップ131)。
続いて、認識処理部12は、取得された帳票画像から抽出対象の項目の領域に記載されている文字画像を切り出す(ステップ132)。そして、切り出した文字画像に対して文字認識処理を実行することで各文字画像の認識結果を取得する(ステップ133)。
続いて、確認訂正処理制御部14は、変数Nを0に初期化し(ステップ134)、その後、Nを1ずつインクリメントすることになるが(ステップ137)、Nがステップ132において切り出した文字画像の数に達するまで(ステップ135でY)、確認訂正判定処理を繰り返し実行する(ステップ136)。
確認訂正判定処理は、処理対象の文字画像(文字認識対象)の確認訂正が必要かどうかを判定する処理である。前述したように、差し戻し前に各文字画像に対して確認訂正者により確認訂正作業が実施され、その後、承認者により最終確認作業が実施されている。そして、差し戻しに応じて記入者によって何らかの手が加えられた帳票に対して、図3を用いて説明した各項目に対する確認訂正作業を確認訂正者に再度実施させるかどうかを確認訂正判定処理において判定する。
例えば、差し戻し前の帳票に空欄があったとすると、その空欄には何も記入されていないので、差し戻しによって帳票に新たに記入された文字の読取画像を文字認識する処理は必要となる。しかしながら、差し戻し前の帳票に記入済みの内容が承認者により文字認識の認識結果が正しいと判断された文字画像に対して確認訂正作業を確認訂正者に再度実施させることは二度手間であり、処理効率が悪化してしまうことになりかねない。そこで、本実施の形態においては、重複した確認訂正作業を防止するようにしたことを特徴としている。以下、本実施の形態における確認訂正判定処理について図10に示すフローチャートを用いて説明する。
処理判定部18は、各文字画像の認識結果を認識処理部12から順次取得する(ステップ1361)。続いて、処理判定部18は、帳票情報記憶部19に記憶されている帳票情報を参照し、当該帳票に関連帳票があるかどうかを判定する。現在処理中の帳票に関連帳票がない場合(ステップ1362でN)、確認訂正処理制御部14は、図3を用いて説明したように帳票に対して確認訂正者に確認訂正作業を実施させればよい(ステップ1365)。
一方、当該帳票に関連帳票がある場合(ステップ1362でY)、例えば、現在処理中の帳票の帳票IDが002の場合、当該帳票を関連帳票としている帳票(帳票ID=001)は存在しているので、差分抽出部17は、同じ項目に対する差し戻し後の帳票画像(帳票ID=002)から切り出された文字画像の認識結果と、認識結果情報に登録されている差し戻し前の関連帳票(帳票ID=001)における当該文字画像の文字認識結果の差分を抽出する(ステップ1363)。
帳票ID=001と帳票ID=002の帳票が同じ帳票(用紙)の場合、例えば空欄に必要事項を記入した場合などは、各帳票は同じ用紙となるが、この場合、認識処理部12は、同じ文字画像に対して文字認識処理を行うので、処理対象の帳票画像(帳票ID=002)に対する認識結果は、差し戻し前の帳票画像(帳票ID=001)と同じ認識結果を得ることになる。つまり、差分は抽出されないので(ステップ1364でN)、当該項目(文字画像)に対する確認訂正は不要と判定する(ステップ1366)。
また、異なる帳票であっても、処理対象の帳票画像(帳票ID=002)に対する認識結果が、差し戻し前の帳票画像(帳票ID=001)に対する認識結果と同じになる場合(ステップ1364でN)、当該項目(文字画像)に対する確認訂正は不要と判定する(ステップ1366)。
一方、差分が抽出された場合(ステップ1364でY)、当該項目(文字画像)に対する確認訂正は必要と判定する(ステップ1365)。図8に示す項目「生年月日2」の設定例によると、差し戻し前の認識処理部12による認識結果は空欄である。一方、差し戻しにより「生年月日2」には何らかの記入がされているはずなので、差分は抽出されるはずであり、これにより当該項目に対する確認訂正作業が新たに必要と判定される。
以上のようにして、各文字画像(文字認識対象)に対して確認訂正の有無が判定されると(ステップ135でN)、処理判定部18は、確認訂正が必要かどうかを判定する。すなわち、少なくとも1つの文字画像に対して確認訂正が必要と判定した場合、換言すると全ての文字画像に対して確認訂正が不要と判定しなかった場合、処理判定部18は、差し戻しに伴う確認訂正者による確認訂正作業は必要と判断し(ステップ138でY)、以下に説明する処理に移行し、一方、全ての文字画像に対して確認訂正は不要と判断した場合(ステップ138でN)、承認者による最終確認に処理を移行する(ステップ142,143)。
差し戻しに伴う確認訂正者による確認訂正作業が必要な場合において(ステップ138でY)、確認訂正処理制御部14は、差し戻し前後の帳票から切り出された各項目の文字画像の一致・不一致に応じて各項目を確認訂正の対象とするか否かを明確にした確認訂正用画面を画面生成処理部13に生成させ、確認訂正者に確認訂正を依頼する(ステップ140)。
図11は、本実施の形態における確認訂正用画面の一例を示す図である。確認訂正用画面は、確認訂正処理制御部14による表示制御のもとに確認訂正者用クライアント1に表示される。ウェブページにて生成されてもよい。
図11は、図6と基本的には同じ画面でよいため、同じ要素には同じ符号を付け説明を省略する。なお、文字画像33には、差し戻し後の帳票から切り出した文字画像を表示させる。
図11において、確認訂正者が作業用テーブル32内において項目行を選択すると、その項目行の表示形態を他の項目行と異ならせて選択されたことを視認しやすくしている。例えば、図11おける項目行「氏名1」に例示するように背景色を付けたり、ハイライト表示してもよい。また、帳票画像上において、選択された項目行の項目に該当する項目の表示形態を他の項目と異ならせることによって、確認訂正者がどの項目を確認訂正作業の対象としているかが視認しやすくしてもよい。例えば、図11に例示するように囲み線(破線)を付けたり、該当する項目の枠を強調表示したりしてもよい。
差し戻し後の確認訂正用画面の場合、差し戻し前の最終確認作業において正しい文字認識結果と判断されている項目に対しては、確認訂正者に対して、確認訂正作業を再度行わせないようにすることを特徴としている。なお、確認訂正処理制御部14は、確認訂正判定処理の結果を得ており、その判定結果に基づき確認訂正用画面を生成させる。例えば、図11において項目「氏名1」、「生年月日1」及び「氏名2」は、差し戻し前後における認識処理部12による文字認識結果が一致しているので、確認訂正対象外とする。このうち、項目行「氏名1」では、入力欄34を表示させないことで確認訂正対象外であることを明確にした例を示している。また、項目「生年月日1」、「氏名2」では、入力欄34を表示させるものの確認訂正対象とする項目(例えば「生年月日2」)とは異なる表示形態にて表示することで確認訂正対象外であることを明確にした例を示している。
確認訂正対象外としての表示の例としては、項目自体を表示しないようにしても良いし、項目を表示させてもグレーアウト等の色を変化させて、確認訂正対象外である旨を示してもよい。さらには、項目と入力欄を表示させつつ、入力欄には、差し戻し後における文字認識結果を表示してもよい。ただ、確認訂正対象外なので表示内容を編集不能に表示させる。
ただ、編集不能としつつも確認訂正者が訂正したい場合を考慮して、本実施の形態では、入力欄34に対応させて解除ボタン36を表示させている。確認訂正者は、確認訂正対象外ではあるものの認識結果を訂正したい場合、対応する解除ボタン36を選択する。これにより、入力欄34に表示されている文字は編集可能に変更され、確認訂正者は、入力欄34に表示されている文字を編集する。
項目「生年月日2」に対しては、差し戻しに伴い記入者により何らかの文字が手入力されているはずである。従って、差し戻し前後の文字認識結果は一致しない。これにより、確認訂正処理制御部14は、確認訂正対象である旨を示すように、対応する入力欄34を、通常の入力欄34とは異なる表示形態にて表示させることによって強調表示し、入力が必須であることを確認訂正者に知らせる。
ところで、本実施の形態では、作業用テーブル32に表示する項目数が多い場合、画面内に全ての項目を表示できない可能性が生じてくる。この場合、選択ボタン37を操作して、例えば確認訂正対象となる項目のみを抽出して表示させるようにしてもよい。
確認訂正者は、確認すべき文字画像に対応する全ての入力欄34に入力すると、画面下方の確定ボタン35を選択して作業終了を情報処理装置10に通知する。全ての入力欄34に文字が入力されていないと、確定ボタン35が選択できないように制御してもよい。
確認訂正者が確定ボタン35を選択すること確認訂正作業が終了したことを認識すると、確認訂正処理制御部14は、確認訂正者用クライアント1から入力欄34に入力されている認識結果(作業結果)を取得する(ステップ141)。
確認訂正者による確認訂正作業が終了すると、最終確認処理制御部15は、前述したように最終確認用画面を画面生成処理部13に生成させ(ステップ142)、文字画像に対する認識文字の最終確認を承認者に依頼する(ステップ143)。
承認者は、承認者用クライアント3に表示させた最終確認用画面を参照して、文字画像に対する認識結果を確認する。最終確認処理制御部15が承認者用クライアント3から最終確認の結果を取得すると(ステップ144)、最終結果出力部16は、承認者により確認された最終認識の結果を最終的な認識結果として出力する(ステップ145)。最終結果出力部16における出力先は、特に限定する必要はない。例えば、帳票画像の提供元、印刷装置、HDD24等の記憶手段、ネットワーク4を介して接続されているコンピュータ等でよい。
なお、差し戻し後においてもなお、差し戻しが必要となる場合には、図3に示す処理ステップ110~112を実施すればよい。
以下、確認訂正用画面の変形例について説明する。
図12は、本実施の形態における確認訂正用画面の他の例を示す図である。図11と異なる点は、項目行の文字画像/認識結果の欄に、当該文字画像33の認識処理部12による認識結果38を参考までに表示させたことである。前述したように帳票を差し戻す場合、記入者が別用紙の帳票に新たに書き直す場合もある。これにより、差し戻し前後における認識処理部12による認識結果に差異が生じうる。そのため、図12の項目「生年月日2」に例示したように、差し戻し前の認識結果38aと、差し戻し後の認識結果38bを並べて表示させるようにした。
図13は、本実施の形態における確認訂正用画面の他の例を示す図である。図11と異なる点は、作業用テーブル32に、文字画像/認識結果の欄に関連帳票最終結果の欄39を並べて常時表示させるようにしたことである。これにより、差し戻し前の承認者による最終確認の内容を参考にして差し戻し後における確認訂正作業を行うことができる。
図14は、本実施の形態における確認訂正用画面の他の例を示す図である。この画面が提供する機能は、図13と同じであるが、図14示す確認訂正用画面では、参照ボタン40が選択されると、関連帳票最終結果を別ウィンドウ(図示せず)にて表示できるようにしたことである。
図15は、本実施の形態における確認訂正用画面の他の例を示す図である。図11と異なる点は、作業用テーブル32に対し、コメント欄41及び確認フラグ欄42を追加したことである。コメント欄41には、項目行毎にコメントを記入するためのコメント領域43が設けられている。また、確認フラグ欄42には、項目行毎にチェックボックス44が設けられている。
確認訂正者が帳票上の項目や当該項目の文字画像等に対して何らかのコメントをしたい場合、当該項目のコメント領域43にコメントを書き込む。また、項目行に対する確認訂正作業が終了した旨を確認訂正者に入力させるために、作業が終了した項目に対応するチェックボックス44にチェックを入れさせる。全ての項目のチェックボックス44にチェックがされてはじめて確定ボタン35が選択できるようになる。
なお、作業用テーブル32に含まれる項目数が多いと、全ての項目のチェックボックス44にチェックをさせると作業効率が悪化するかもしれないので、確認フラグ欄42の先頭に設けられているチェックボックス45にチェックを入れることで、全ての項目のチェックボックス44がチェックされたこととしてもよい。
また、コメント欄43は、各項目に対するコメントを記入させるために設けられているが、複数の項目に該当するコメントが記入できるようにコメント欄46を確認訂正用画面に設けている。
なお、図12~図15に確認訂正用画面の変形例を示したが、各画面における特徴事項を適宜組み合わせて確認訂正用画面を生成するようにしてもよい。また、差し戻し後に限らず、差し戻し前に使用する確認訂正用画面にも適用してもよい。
実施の形態2.
上記実施の形態1では、文字が手書きにより記入される複数の項目を含む文書として、帳票を例にして説明した。手書きされる用紙としては、帳票に限らず多種に及ぶ。例えば、商品の注文書や諸手続の申請書等がある。これらの用紙は、帳票が定型化されており、個人情報として、氏名、住所、電話番号、また署名等の所定事項が記入されたりする。これらの所定事項は、注文書の場合、商品名や注文数とは異なり滅多に変更されない記入事項であり、注文の度に記入するのが大変であるため、1枚の用紙に所定事項を書き込んでおき、必要時(注文時)にその用紙をコピーするなどして使い回したりする場合がある。
所定事項が予め記入されている用紙(以下、「原紙」ともいう)をコピーして生成される用紙(第2文書)が確認訂正の対象になると、確認訂正者は、その用紙(第2文書)に記入されている所定事項に対して確認訂正作業を実施する。その後、原紙をコピーして生成された別の用紙(第1文書)が確認訂正の対象になると、確認訂正者は、その用紙(第1文書)に記入されている所定事項に対して確認訂正作業を実施する。なお、第1文書及び第2文書は、同じ原紙から生成されていることから同じ複数の項目から構成され、用紙上における各項目の位置も同じである。ただ、原紙を使い回す場合、上記所定事項は、認識処理部12における文字認識処理により同じ文字認識結果が得られるはずである。すなわち、第1文書における項目に記入された文字の認識結果と、第2文書における当該項目に記入された文字の認識結果とは一致する。確認訂正者は、過去に確認訂正の対象となった用紙(第2文書)に対しては、確認訂正作業を実施しているため、その後に確認訂正の対象となる用紙(第1文書)における所定事項に対して確認訂正作業を実施することは無駄な作業になる。そこで、本実施の形態では、この無駄な確認訂正作業を防止できるようにした。
図16は、本実施の形態において帳票の確認訂正を行うための情報処理システムの全体構成及び本実施の形態における情報処理装置の一実施の形態を示すブロック構成図である。なお、実施の形態1と同じ構成要素には、同じ符号を付け説明を省略する。本実施の形態における情報処理装置10は、実施の形態1に原紙情報記憶部53を追加した構成を有している。なお、実施の形態1では、文書として帳票を例にしたので、「帳票画像取得部」11及び「帳票情報記憶部」19としたが、本実施の形態では、帳票を例にして説明しないので「用紙画像取得部」51及び「用紙情報記憶部」52と称するが、機能や取り扱うデータ構成は、実施の形態1と同じでよい。
図17は、本実施の形態における原紙情報記憶部53に記憶される原紙情報のデータ構成の一例を示す図である。原紙情報は、原紙情報記憶部53に予め設定登録される。原紙情報は、原紙ID及び項目情報を含む。原紙IDは、原紙の識別情報である。項目情報は、項目ID、項目名、位置情報及び確認訂正を含む。項目IDは、用紙上に設けられ、文字が入力される領域(記入欄)が対応付けされている項目の識別情報である。項目名は、当該項目の名称である。位置情報は、原紙上における当該項目の記入欄の位置を示す情報である。原紙上の領域を座標で表す場合、図17に例示するように座標情報で表す。確認訂正は、差し戻し後において当該項目に対する確認訂正が必要か否かを示すフラグ情報である。確認訂正に“不要”と設定される項目が、上記説明した所定事項に相当する項目である。
本実施の形態おける確認訂正者による確認訂正処理及び承認者による最終確認処理は、実施の形態1と同じでよい。そして、差し戻しが指示されると、用紙への記入者は、空欄を埋めたり、判読不能な文字を訂正したりする。そして、差し戻し後の用紙の画像には、指定された用紙IDが割り当てられる。用紙画像取得部51は、差し戻し後の用紙の画像を取得するが、差し戻し後の場合、用紙の画像及び当該用紙の用紙IDに加えて、原紙IDが付加されている。なお、本実施の形態においては、原紙IDが付加されていることによって当該用紙は差し戻し後であること、及び情報処理装置10に原紙情報が登録済みであることから当該用紙に含まれる各項目が後述する方法にて確認訂正の要不要が判定されることがわかる。
すなわち、実施の形態1においては、図10を用いて説明したように、処理判定部18は、各項目に対し差分の有無により確認訂正が必要かどうかを判定するが(ステップ1364~1366)、本実施の形態における処理判定部18は、取得した原紙IDに対応する原紙情報を参照して、確認訂正が不要と設定されている項目に対しては、差分の有無にかかわらず確認訂正が不要と判定する。
あるいは、実施の形態1においては、差分抽出部17は、同じ項目に対する、差し戻し後の用紙(第1文書)から切り出した文字認識対象に対する認識結果と、認識結果情報記憶部20に保存されている差し戻し前の用紙(第2文書)から切り出した文字認識対象に対する認識結果と、の差分を抽出するが(ステップ1363)、本実施の形態における差分抽出部17は、取得した原紙IDに対応する原紙情報を参照して、確認訂正が不要と設定されている項目に対しては、差分の抽出処理を実施しないようにしてもよい。この場合、処理判定部18は、差分の抽出対象とされなかった項目は確認訂正が不要と判定する。
あるいは、認識処理部12は、図9を用いて説明したように、各項目に対して文字認識処理を実施して文字認識結果を出力するが(ステップ133)、本実施の形態における認識処理部12は、取得した原紙IDに対応する原紙情報を参照して、確認訂正が不要と設定されている項目に対しては、文字認識処理を実施しないようにしてもよい。この場合、処理判定部18は、文字認識結果が得られていない項目は確認訂正が不要と判定する。
このように、本実施の形態によれば、原紙から得られる差し戻し後の用紙に関しては、確認訂正が不要と設定されている項目を最初から確認訂正対象外とし、確認訂正処理の実施の有無の判定対象外、あるいは文字認識結果の差分抽出対象外、あるいは文字認識処理の対象外とする。
なお、本実施の形態においては、原紙情報を情報処理装置10に予め登録しておくようにしたが、この構成に限る必要はない。例えば、差し戻し後における確認訂正処理において確認訂正対象外とする項目を特定させるために、差し戻し後の用紙の画像を提供する画像形成装置等は、上記原紙情報を用紙の画像にその都度付加して用紙画像取得部51に取得させるようにしてもよい。あるいは、用紙上のどの項目を確認訂正対象外とするかを特定するための情報、すなわち上記原紙情報に含まれる項目情報に相当する情報を用紙の画像に付加して用紙画像取得部51に取得させるようにしてもよい。