以下、本発明の実施形態について、図面を参照して説明する。
なお、本実施形態において、氏名または名称、住所または所在地、納付金額および受領印等、各帳票に個別に記載される情報のことを「記載情報」と称し、各記載情報が記載されている、または、記載され得る領域のことを「記載領域」と称する。また、記載領域に記載されるべき記載情報を文字認識するための設定値のことを「文字認識設定」と称する。また、帳票の罫線レイアウトなど、帳票の種別を特定するための情報を「参照特徴情報」と称する。参照特徴情報は、罫線レイアウトに関する情報の他に、帳票のタイトルを表すキーワード、下地の色などの情報を含んでいてもよい。参照特徴情報で特定される帳票の種別ごとに、記載情報、記載領域および文字認識設定が対応づけられて、帳票画像処理システムを構成する各装置に記憶される。
参照特徴情報、記載領域、および文字認識設定を纏めて、特に、「定義情報」と称する場合もある。また、記載領域および文字認識設定を纏めて、特に、「読取設定」と称する場合もある。帳票画像処理システムを構成する各装置は、定義情報を共有する。
図2は、帳票画像処理システムの環境ブロック図である。
帳票画像処理システムは、帳票定義装置1と、帳票消去装置2と、帳票処理装置3と、を備える。帳票消去装置2と、帳票処理装置3は、金融機関内の内部ネットワーク4で接続される。また、帳票定義装置1と、帳票消去装置2は、外部ネットワーク5で接続される。内部ネットワーク4および外部ネットワーク5は、LAN等の有線または無線の通信回線である。
帳票消去装置2は、帳票の画像から、記載情報を消去する装置である。帳票消去装置2は、たとえば、金融機関の営業店内や銀行の事務センター内に設置されている。帳票消去装置2は、たとえば、金融機関のオペレーターなどにより操作される。
後述のように、帳票消去装置2は、帳票処理装置3から帳票(税金、公共料金等の納付書等)の画像を受信する。帳票消去装置2は、受信した帳票の画像に対し、オペレーターによる操作に基づいて、記載情報を消去する。そして、記載情報を消去した帳票の画像(以下、「消去済みの画像」という)を帳票定義装置1に対し、送信する。
参照特徴情報は、記載領域と、文字認識設定とともに、帳票の種別ごとに帳票定義装置1、帳票消去装置2および帳票処理装置3に記憶されている。定義情報は、後述の処理により、帳票定義装置1において作成され、帳票消去装置2に提供される。帳票消去装置2は、受信した定義情報を記憶するとともに、定義情報を帳票処理装置3に送信する。
帳票定義装置1は、消去済みの画像から定義情報を作成する機能を有する。また、帳票定義装置1は、帳票の画像を管理する。上記のように、消去済みの画像は、帳票消去装置2から帳票定義装置1に送信される。帳票定義装置1は、たとえば、金融機関などが定義情報の作成を委託する外部のアウトソーシングセンターに設置されている。
帳票定義装置1は、オペレーターの操作に応じて、消去済みの画像から定義情報を作成する。帳票定義装置1は、作成した定義情報を記憶部13(図3参照)に記憶する。さらに、帳票定義装置1は、作成した定義情報を帳票消去装置2に送信する。その後、帳票消去装置2から、帳票処理装置3に対し、定義情報が送信される。
帳票処理装置3は、帳票を処理する自動機である。帳票処理装置3は、たとえば、金融機関の店舗に設置されている。帳票処理装置3は、帳票消去装置2から受信した定義情報を記憶している。帳票処理装置3は、払込人によりセットされた帳票を受け付けて、帳票の画像を取得する。その後、当該定義情報を用いて、後述する処理により帳票に記載された金額などの記載情報を読み取る。
次に、図2を用いて、帳票画像処理システムにおける処理の概要を示す。便宜上、図2には、処理の流れを示すステップ番号(S1〜S7)が付記されている。
帳票処理装置3は、帳票の挿入口により受け付けた帳票に対し、内蔵しているスキャナなどを用いてスキャンを行い、帳票の画像を取得する(ステップS1)。帳票処理装置3は、取得した帳票の画像と、予め帳票処理装置3に記憶した参照特徴情報を用いて、帳票の種別を確定する。具体的には、帳票処理装置3は、取得した帳票の画像にマッチングする参照特徴情報を抽出し、抽出した参照特徴情報に対応する帳票の種別を当該帳票の種別に確定する。
次に、帳票処理装置3は、確定した種別の帳票について、記載領域、および、文字認識設定をもとに、帳票の記載情報を文字認識する。そして、帳票処理装置3は、文字認識した金額情報等の記載情報に基づき、顧客に料金の支払いを要求し、精算処理を実行する。
ここで、帳票処理装置3は、帳票の種別が確定できないと判定した場合や、文字認識が行えなかった場合に、顧客に対し、受け付けた帳票を処理できない旨の報知を行い、帳票を返却する処理を行う。その後、このような帳票と同じ種別の帳票を受け付けた場合に、帳票の種別が確定できない状況を減らす必要がある。そのために、当該帳票に対応する定義情報を作成する必要がある。
本実施形態では、このような場合に、定義情報の作成作業が、該帳票処理装置3が設置された金融機関とは異なる外部のアウトソーシングセンターに委託される。この場合、個人情報保護の観点から、作成に直接必要とはならない氏名、住所、口座番号等、その情報によって個人が特定され得る個人情報等の記載が、アウトソーシングセンターに提供される帳票の画像から消去されるべきである。
そこで、本実施形態では、帳票処理装置3で取得された帳票の画像を外部のアウトソーシングセンターに送信する前に、営業店内の帳票消去装置2において、帳票の画像から記載情報が消去され、記載情報が消去された帳票の画像が、帳票消去装置2から帳票定義装置1に送信される。すなわち、帳票処理装置3と同じ内部ネットワーク4上にある帳票消去装置2を用いて、帳票画像の記載が消去される。記載情報の消去は、たとえば、営業店のオペレーターによるマニュアル操作よって行われる。また、消去される記載情報は、個人が特定され得る情報であって、金額や納付期限等の数字や年月日は、消去される記載情報には含まれない。
帳票処理装置3は、ステップ1にて取得した帳票の画像を、内部ネットワーク4を介して、帳票消去装置2に対し送信する(ステップS2)。帳票消去装置2は、受信した帳票の画像から記載情報の少なくとも一部を消去する(ステップS3)。その後、帳票消去装置2は、記載情報の一部を消去した帳票の画像(消去済みの画像)を、外部ネットワーク5を介して、帳票定義装置1に対して送信する(ステップS4)。
このようにすることで、個人情報の保護に配慮しつつ、外部のアウトソーシングセンターに対し、定義情報の作成を委託することができる。
次に、帳票定義装置1は、外部アウトソーシングセンターのオペレーターの操作に応じて、受信した帳票の画像から定義情報を作成する(ステップS5)。そして、帳票定義装置1は、作成した定義情報を、外部ネットワーク5を介して、帳票消去装置2に送信する(ステップS6)。
次に、帳票消去装置2は、帳票定義装置1から受信した定義情報を記憶部に記憶し、さらに、受信した定義情報を、内部ネットワーク4を介して、帳票処理装置3に対し送信する(ステップS7)。帳票処理装置3は、受信した定義情報を記憶部に記憶する。これにより、帳票処理装置3は、以前は、帳票の種別が確定できなかった帳票について、該帳票の定義情報を取得できる。これにより、帳票処理装置3は、当該帳票と同じ種別の帳票について、帳票の種別を確定できる。こうして、帳票処理装置3は、新たに記憶された定義情報の種別と同じ種別の帳票について、記載情報を文字認識することが可能となり、精算処理を実行できるようになる。
図3は、帳票定義装置1の構成を示すブロック図である。
帳票定義装置1は、通信部11と、制御部12と、記憶部13と、操作部14と、表示部15とから構成される。
記憶部13は、ROM(Read Only Memory)、RAM(Random Access Memory)やハードディスク等の記憶媒体を備える。記憶部13は、制御部12の動作プログラムを記憶し、また、制御部12の制御処理の際にワーク領域として利用される。当該動作プログラムは、帳票画像処理プログラム135であり、たとえば、CD−ROM(Compact Disc Read Only Memory)やUSBメモリ〔USB(Universal Serial Bus) flash drive〕などの外部記憶媒体を介して、記憶部13に記憶される。
また、記憶部13は、消去済み画像データベース131と、参照特徴情報データベース132と、読取設定データベース133、領域抽出設定134とを記憶している。消去済み画像データベース131は、帳票消去装置2から受信した消去済みの画像を管理する。参照特徴情報データベース132および読取設定データベース133は、それぞれ、当該帳票の画像から作成された参照特徴情報および読取設定を管理する。領域抽出設定134は、帳票の画像に対し、操作部14を介し、オペレーターにより指定された領域に対応する他の領域を抽出するかについての設定である。
オペレーターが、指定した領域に対応する他の領域を抽出する必要があると判断した場合には、オペレーターにより、他の領域を抽出する旨の設定がなされて、領域抽出設定134にそのことを示す情報(フラグ等)が保持される。この場合、制御部12は、オペレーターにより指定された領域に対応する他の領域を抽出する処理を実行する。一方、オペレーターが、指定した領域に対応する他の領域を抽出する必要がないと判断した場合には、オペレーターにより、他の領域を抽出しない旨の設定がなされて、領域抽出設定134にそのことを示す情報(フラグ等)が保持される。この場合、制御部12は、オペレーターにより指定された領域に対応する他の領域を抽出する処理を実行しなくなる。この設定は、オペレーターにより領域の設定がなされる全ての帳票の画像に対し、適用される。
操作部14は、キーボードやマウス等の操作手段を備える。操作部14は、ディスプレイに対するオペレーターの操作を受け付ける。表示部15は、画像を表示するためのディスプレイを備える。表示部15は、ディスプレイに各種の画像(画面)を表示する。オペレーターは、表示部15に表示された消去済みの画像を参照しながら操作部14を操作して、定義情報を生成する。
次に、帳票定義装置1において帳票の画像から定義情報を作成する処理について説明する。
図4は、帳票画像処理のフローチャートである。以下の例では、便宜上、参照特徴情報が罫線レイアウトのみであるとして説明を行う。
制御部12は、通信部11を介し帳票消去装置2から取得した帳票の画像を、表示部15に表示する(S101)。次に、制御部12は、表示部15に表示された帳票の画像に対し、操作部14を介し、オペレーターによる領域の指定を受け付ける領域指定受付処理を行う(S102)。なお、ここでいう領域とは、記載情報が記載されている記載領域のことを示す。次に、制御部12は、ステップS102にて指定された領域に含まれる記載情報について、文字認識設定の入力を受け付ける(S103)。
次に、制御部12は、ステップS102にて指定された領域について、公知の非定型文字認識処理などにより文字認識を行う(S104)。制御部12は、ステップS104にて文字認識をした領域に所定の文字が含まれているか否かを判定し(S105)、当該領域に所定の文字が含まれていない場合(S105:NO)、ステップS102にて受け付けた領域に対応する他の領域を抽出する必要があるかについて、領域抽出設定134を参照し、確認する(S108)。
なお、ここでいう、所定の文字とは、後述する、当該領域に対し設定された文字認識設定からすると、記載されていると想定され得ない文字のことである。たとえば、金額の設定という文字認識設定に対しては、算用数字などが記載されていると想定される。これに対し、指定領域内に日付を表す「年月日」の文字が含まれていた場合、この文字が、想定され得ない文字に該当する。すなわち、所定の文字とは、当該領域に設定された文字認識設定に適合しない文字のことである。
一方、ステップS105にて文字認識をした領域に所定の文字が含まれている場合(S105:YES)、制御部12は、後述する図6の画面などにより、オペレーターに対し、定義情報を作成する処理を続行してもよいか確認する(S106)。続行許可がなされなかった場合(S107:NO)、制御部12は、再度、ステップS104の処理を行う。これにより、オペレーターは、再度指定領域に対する文字認識設定をやり直すことができる。
一方、続行許可がなされた場合(S107:YES)、制御部12は、ステップS108へ移行する。ステップS108の処理において、制御部12は、領域抽出設定134を参照し、ステップS102にて指定された領域に対応する他の領域を抽出するように設定がなされているかを確認する。他の領域を抽出するように設定がなされていない場合(S108:NO)、制御部12は、後述するステップS112の処理により、ステップS102にてオペレーターにより指定された領域に対し、文字認識設定を適用してもよいか確認する。
一方、他の領域を抽出するように設定がなされている場合(S108:YES)、制御部12は、ステップS102にて指定された領域の領域特徴(ここでは、罫線レイアウト)を抽出する(S109)。罫線レイアウトとは、たとえば、枠の形状や大きさ、枠を区切る線の数、枠および区切り線の種類(実線や破線)等を含む。その後、制御部12は、ステップS109にて抽出した罫線レイアウト(領域特徴)に対応する罫線レイアウト(他の領域の領域特徴)を有する他の領域(以下、単に「他の領域」を称する)を抽出する(S110)。ここでいう対応する罫線レイアウトとは、ステップS109で抽出した罫線レイアウトとの類似度が、一定の値を超える罫線レイアウトのことをいう。
その後、制御部12は、ステップS110に抽出した他の領域を、帳票消去装置2から取得した帳票の画像と重ね合わせて、表示部15に表示する。そして、制御部12は、他の領域のいずれに対し、ステップS103にて設定した文字認識処理を適用するのかの選択を、操作部14を介し、オペレーターから受け付ける領域選択受付処理を行う(S111)。
オペレーターによる領域の選択を受け付けた後に、制御部12は、選択を受け付けた領域について、ステップS103にてオペレーターにより、入力された文字認識設定を適用してもよいかについて、表示部15を介し、オペレーターに確認を行う(S112)。オペレーターにより確認の入力がなされると、制御部12は、ステップS102にて指定された領域、および、ステップS111にて選択された領域に対し、文字認識設定を適用する(S113)。
なお、領域抽出設定134において、他の領域を抽出するように設定されていない場合(S108:NO)においては、制御部12は、ステップS102にて指定された領域に対してのみ文字認識設定を適用する。
そして、制御部12は、文字認識設定のために、他に指定したい領域がないかについて、図示しない確認画面を表示部15に表示し、オペレーターに確認をする(S114)。オペレーターにより、領域の指定が完了している旨を受け付けると(S114:YES)、ステップS113にて適用した文字認識設定に、当該文字認識設定を適用した領域(記載領域)に関する情報を紐付けて、読取設定として読取設定データベース133に記憶する。また、これに際し、帳票の画像から取得され得る参照特徴情報も参照特徴情報データベース132に記憶する(S115)。
こうして、帳票画像に関する定義情報(参照特徴情報、記載領域、および文字認識設定)を作成する処理が終了する。なお、制御部12が、記憶された読取設定と参照特徴情報を、通信部11を介して帳票消去装置2に送信することは、図2のステップS6にて説明したとおりである。
一方、ステップS114の確認処理において、文字認識設定のために他に指定したい領域があること、すなわち、領域の指定が完了していない旨を受け付けた場合(S114:NO)、制御部12は、再度、ステップS102の処理を行う。
なお、ステップS112の確認処理において、オペレーターが、ステップS111にて選択した領域に対する文字認識の適用を許可しない場合がある。この場合、制御部12は、ステップS113の処理において、いずれの領域に対しても、文字認識設定を適用しない。
また、ステップS107において、続行許可がなかった場合(S107:NO)、制御部12は、処理をステップS104に戻して、再度、文字認識処理を実行したが、これに限らず、ステップS107の判定がNOの場合に、処理をステップS102に戻して、再度、領域指定受付処理を行うようにしてもよい。
図5(a)〜(c)は、ステップS102の処理にて、指定された領域から領域特徴(ここでは、罫線レイアウト)を抽出する処理を示す図である。図5(a)は、オペレーターが、合計額の記載領域の枠のやや内側を指定領域として指定した場合を示している。ここでは、指定領域の枠と、記載領域の枠との間に隙間がある。この場合、制御部12は、図5(c)に示すように、指定領域の特徴情報として、当該指定領域を含む、最小の枠である合計額の記載領域の枠の罫線レイアウトを自動的に抽出する。さらに、図5(b)に示すように、指定領域の枠が、記載領域の枠よりも大きい場合もある。この場合も、制御部12は、図5(c)に示すように当該指定領域に含まれる最大の枠である合計額の記載領域の枠を指定領域の罫線レイアウトを自動的に抽出する。
図5(a)に基づく領域特徴を抽出する処理、および、図5(b)に基づく領域特徴を抽出する処理は選択的に用いられる。たとえば、制御部12は、指定した領域と指定した領域を含む最小の枠との隙間と、指定した領域と指定した領域に含まれる最大の枠との隙間の大きさを比較し、前者の隙間が小さいのであれば、図5(a)による処理により罫線レイアウトを抽出する。一方、後者の隙間が小さいのであれば、制御部12は、図5(b)による処理により罫線レイアウトを抽出する。
図6は、ステップS107の処理において、オペレーターに対し、定義情報を作成する処理を続行してもよいかを確認する画面である。たとえば、図6左上図にあるように、ステップS102の処理において、指定された「納付限」の記載領域に対し、ステップS103の処理において、「金額情報」という項目名で文字認識設定がされたものとする。この場合、制御部12は、ステップS104の処理の文字認識処理により、指定された領域を文字認識する。これにより、平成29年5月10日との文字認識結果が抽出される。
ここで、制御部12は、「金額情報」と設定された項目に対して、不適切な文字(ここでいう年、月、日といった文字)が含まれていないかを確認する。今回のように、文字認識した結果に年月日という文字が含まれている場合、制御部12は、図6右下にあるように、指定した領域が、本当に文字認識設定の対象とされるべき項目であるかについて、表示部15を介し、確認表示を行う(ステップS106)。確認表示は、たとえば、「はいボタン」と「いいえボタン」とにより構成される。
当該画面において、オペレーターが「はいボタン」を押下した場合、制御部12は、文字認識設定の適用が許可されたものと判断する(S107:YES)。一方、「いいえボタン」が押下された場合、制御部12は、文字認識設定の適用が許可されていないものと判断する(S107:NO)。この場合、制御部12は、画面を図示しない文字認識設定の設定画面へと遷移させ、オペレーターに対し、再度の文字認識設定を促す。なお、ステップS106の確認処理においては、文字に限らず、特定の記号(住所という項目名に対する郵便番号の記号など)があるかを確認してもよい。
なお、領域の指定においては、文字認識の結果以外にも、領域内に枠を構成する実線(点線除く)など、所定の種別の線が含まれている場合に、ステップS106において、オペレーターに対し、領域の抽出を誤っていないか確認をしてもよい。
図7は、ステップS111において、抽出された領域を選択するための選択画面を示す図である。この図では、ステップS102にて領域指定された領域A1に対応する(罫線レイアウトが類似する)他の領域が、表示部15に表示される。オペレーターは、当該他の領域のいずれに対し、領域A1に設定しようとする文字認識設定を適用するのかを選択する。指定された領域と、抽出された領域のうち選択された領域、および抽出された領域のうち選択されなかった領域は、それぞれ別々の態様にて表示される。選択後、「選択完了ボタン」が押下されると、領域A1、および、選択された領域に対し、文字認識設定が適用される(ステップS113)。
なお、制御部12は、ステップS110の処理において領域抽出処理を行う場合には、図8(a)、(b)に示された抽出処理によって、領域を抽出してもよい。
図8(a)は、指定された領域と領域内の文字が同一である領域の抽出処理を示す図である。制御部12は、他の領域を抽出するに際し、図5において説明した処理に基づいて、指定領域に対応する記載領域の枠を導き出す。次に制御部12は、当該枠内の文字(記号を含む)を公知の非定型文字認識技術などを用いて文字認識する。そして、制御部12は、罫線レイアウトが対応しているだけでなく、罫線レイアウトを構成する枠内の文字も同一である他の領域を抽出する。すなわち、指定した領域の領域特徴に、罫線レイアウトだけでなく、文字認識によって認識した文字も含めて、他の領域を抽出する。これにより、記載情報が同一の領域に対して文字認識の設定を適用できる。よって、不要に文字認識の設定が適用されることを防止できる。なお、指定された領域内の文字を認識できなかった場合は、他の領域を抽出するに際して、罫線レイアウトが整合し、且つ、領域内の文字を認識できなかった領域を、他の領域として抽出してもよい。
図8(b)は、指定された領域から帳票の画像の長手方向に他の領域を抽出する処理を示す図である。制御部12は、他の領域を抽出するに際し、指定領域を構成する枠と罫線レイアウトが対応している領域を、指定領域から帳票の画像の長手方向に探索することにより、他の領域を抽出する。図1に示すような同一または類似する領域が複数ある帳票のように、記載情報が同じ枠は、帳票の画像上の短手方向の位置がほぼ同一である位置において、帳票の画像の長手方向に並ぶように配置される場合が多い。このような場合に、指定領域に対応する領域の抽出を、指定領域から帳票の画像の長手方向にのみ探索することにより行うことで、処理時間を短縮できるとの効果が奏され得る。
図8(a)に示す抽出処理、図8(b)に示す抽出処理の何れか1つの処理にて他の領域の抽出を行ってもよい。それに加え、両方ともの処理にて他の領域の抽出を行ってもよい。たとえば、図8(a)に示した抽出処理において、指定領域内の文字認識が行えなかった場合のみ、図8(b)による処理を行ってもよい。また、図8(b)による処理を行ったあと、抽出された領域のうち、指定領域内に含まれている文字が同じ領域のみ他の領域として抽出してもよい。
図8(b)に示す抽出処理においては、指定領域から帳票の画像の長手方向に、他の領域抽出を探索する場合を説明した。これに限らず、帳票の画像の短手方向の位置がほぼ同一である他の領域を抽出してもよい。
<実施形態の効果>
本実施形態によれば、以下の効果が奏される。
(1)図4を参照して説明したように、帳票定義装置1は、制御部12による処理により、オペレーターが、指定した領域に対して付した文字認識処理の設定が、自動で、当該領域に対応する他の領域に対し適用される。このため、図1に示されているような、同一または類似する領域が複数ある帳票であっても、帳票の画像に対して、効率良くかつ適切に設定作業を行うことができる。
(2)図5(a)〜(c)に示したように、制御部12は、指定された領域の領域特徴として、指定された領域を含む最小の枠または指定された領域に含まれる最大の枠の罫線レイアウトを検出する。これにより、オペレーターが、枠よりやや小さい領域または枠よりやや大きい領域を指定した場合も、指定された領域に対応する枠の罫線レイアウトを領域特徴として適切に検出できる。
(3)図8(a)を参照して説明したように、制御部12は、領域特徴として、操作部14により指定された領域に対応する枠に含まれる文字を検出する。これにより、指定された領域に対応する枠と罫線レイアウトが同一または類似である領域であっても、その領域に含まれる文字が異なる場合に、その領域を誤って抽出することを防止できる。
(4)図7を参照して説明したように、制御部12により抽出された他の領域が、オペレーターにより指定された領域A1に対応付けて表示される。そして、制御部12は、操作部14を介して、他の領域の選択を受け付け、選択された他の領域に対して、領域A1の設定を適用する。これにより、抽出された他の領域のうち、オペレーターにより選択された領域についてのみ設定を適用できるため、不要な設定の適用を防ぐことができる。
(5)図6を参照して説明したように、操作部14により指定された領域に、当該領域に付された文字認識設定に適さない文字がある場合、制御部12は、表示部15を介して、確認のための報知を行う。このように、オペレーターに確認が行われことにより、不適切な設定の適用を防ぐことができる。
なお、本発明は、上記実施形態によって何ら制限されるものではなく、また、本発明の実施形態も、以下に示す通り、上記以外に種々の変更が可能である。
<変更例1>
変更例1に係る帳票画像処理システムにおいては、上記実施形態と異なり、図2に示した帳票消去装置2において、帳票の画像上の所定の領域を塗り潰して消去する(マスクする)処理について説明する。すなわち、帳票消去装置2が帳票処理装置3から受信した帳票の画像に対し、所定の記載情報を消去する処理について説明する。なお、図5(a)〜(c)、図8(a)、(b)に示したような処理等、上記実施形態と同じ部分については、説明を省略する。
図9は、帳票消去装置2の構成を示すブロック図である。
帳票消去装置2は、記憶部21と、制御部22と、通信部23と、操作部24と、表示部25とを備える。
記憶部21は、記憶部13と同じく、ROM(Read Only Memory)、RAM(Random Access Memory)やハードディスク等の記憶媒体を備える。記憶部21は、制御部22の動作プログラムを記憶し、また、制御部22の制御処理の際にワーク領域として利用される。当該動作プログラムは、帳票画像処理プログラム213であり、たとえば、CD−ROM(Compact Disc Read Only Memory)やUSBメモリ〔USB(Universal Serial Bus) flash drive〕などの外部記憶媒体を介して、記憶部21に記憶される。
また、記憶部21は、消去済み画像データベース211と、領域抽出設定212とを記憶している。消去済み画像データベース211は、帳票処理装置3から受信した帳票の画像に対する消去済みの画像を管理する。領域抽出設定212は、領域抽出設定134と同様に、他の領域を抽出するかについての設定であり、ここでは詳細な説明を省略する。
操作部24は、操作部14と同じく、キーボードやマウス等の操作手段を備える。操作部24は、ディスプレイに対するオペレーターの操作を受け付ける。表示部25は、ディスプレイを備える。表示部25は、ディスプレイに各種の画像(画面)を表示する。オペレーターは、表示部25に表示された帳票の画像を参照しながら操作部24を操作して、消去済みの画像を生成する。
次に、帳票消去装置2において帳票の画像から、所定の記載情報を消去し、消去済みの画像を作成する処理について説明する。
図10は、帳票画像処理のフローチャートである。以下の例では、便宜上、参照特徴情報が罫線レイアウトのみであるとして説明を行う。
制御部22は、通信部23を介して帳票処理装置3から取得した帳票の画像を、表示部25に表示する(S201)。次に、制御部22は、表示部25に表示された帳票の画像に対し、操作部24を介して、オペレーターによる領域の指定を受け付ける領域指定受付処理を行う(S202)。なお、ここでいう領域とは、記載情報が記載されている記載領域のことを示す。
次に、制御部22は、ステップS202にて、指定された領域について、公知の非定型文字認識処理などにより文字認識を行う(S203)。そして、制御部22は、ステップS203にて文字認識をした領域に所定の文字が含まれているか否かを判定し(S204)、当該領域に所定の文字が含まれていない場合(S204:NO)、ステップS202にて受け付けた領域に対応する他の領域を抽出する必要があるかについて、領域抽出設定212を参照し、確認する(S207)。
なお、ここでいう、所定の文字とは、後述する、領域の名称に関連する文字のことである。たとえば、制御部22が、ステップS203の処理において指定された領域に対し文字認識を行った結果、指定された領域に「名称」という文言が含まれていた場合、当該「名称」という文字が所定の文字に該当する。他にも「氏名」、「領収印」、「金額」などが領域の名称として想定され得る。さらに、これらの一部を構成する「名」、「領収」、「印」「金」なども領域の名称に関連し得る。これらの所定の文字は、オペレーターによる操作により任意に設定されてもよい。
一方、ステップS203にて文字認識をした領域に所定の文字が含まれている場合(S204:YES)、制御部22は、後述する図11の画面図などにより、オペレーターに対し、定義情報を作成する処理を続行してもよいか確認する(S205)。続行許可がなされなかった場合(S206:NO)、制御部22は、再度、ステップS202の処理を行う。これにより、オペレーターは、領域の指定をやり直すことができる。
一方、続行許可がなされた場合(S206:YES)、制御部22は、ステップS207へ移行する。ステップS207の処理において、制御部22は、領域抽出設定212を参照し、ステップS202にて指定された領域に対応する他の領域を抽出するように設定されているかを確認する。他の領域を抽出するように設定されていない場合(S207:NO)、制御部22は、後述するステップS211の処理により、ステップS202にてオペレーターにより指定された領域に対し、帳票の画像を消去してもよいか確認をする。
一方、他の領域を抽出するように設定がなされている場合(S207:YES)、制御部22は、ステップS202にて指定された領域の領域特徴(ここでは、罫線レイアウト)を抽出する(S208)。その後、制御部22は、ステップS208にて抽出した罫線レイアウト(領域特徴)に対応する罫線レイアウト(他の領域の領域特徴)を有する他の領域(以下、単に「他の領域」を称する)を抽出する(S209)。ここでいう対応する罫線レイアウトとは、ステップS208で抽出した罫線レイアウトとの類似度が、一定の値を超える罫線レイアウトのことをいう。
その後、制御部22は、ステップS209にて抽出した他の領域を、帳票消去装置2から取得した帳票の画像と重ね合わせて、表示部25に表示する。そして、制御部22は、他の領域のいずれに対し、画像を消去するのかの選択を、操作部24を介し、オペレーターから受け付ける領域選択受付処理を行う(S210)。オペレーターによる領域の選択を受け付けた後に、制御部22は、受け付けた領域について、画像を消去してもよいかについて、表示部25を介し、オペレーターに確認を行う(S211)。そして、制御部12は、ステップS202にて指定された領域、および、ステップS210にて選択された領域に対し、画像を消去する処理(マスク処理)を実行する(S212)。
そして、制御部22は、画像を消去するために、他に指定したい領域がないかについて、図示しない確認画面を表示部25に表示し、オペレーターに確認する(S213)。オペレーターにより、領域の指定が完了している旨を受け付けると(S213:YES)、制御部22は、消去済みの画像を消去済み画像データベース131に記憶する(S214)。こうして、帳票の画像を消去する処理が終了する。なお、記憶された消去済みの画像を、通信部23を介して帳票定義装置1に送信することは、図2のステップS4にて説明したとおりである。
一方、ステップS213の確認処理において、帳票画像の消去のために他に指定したい領域があること、すなわち、領域の指定が完了していない旨を受け付けた場合(S213:NO)、制御部22は、再度、ステップS202の処理を行う。
なお、ステップS211の確認処理において、オペレーターが、ステップS210にて選択した領域に対する画像の消去を許可しない場合がある。この場合には、制御部22は、ステップS212の処理において、いずれの領域に対しても、画像を消去しない。なお、領域抽出設定134において、他の領域を抽出するように設定されていない場合(S108:NO)、制御部12は、ステップS102にて指定された領域に対してのみ画像を消去する。
図11は、ステップS205の処理において、オペレーターに対し、帳票の画像を消去する処理を続行してもよいかを確認する画面である。たとえば、図11左上図にあるように、ステップS202の処理において、オペレーターによる操作により、「名称…鈴木 一郎様」の文字が印字された領域が指定されたものとする。この場合、制御部12は、ステップS203の処理の文字認識処理により、当該指定領域には、「名称…鈴木 一郎様」という文字を認識する。
ここで、制御部22は、認識した文字のうち「名称」という文字については、領域の名称である可能性がある場合があるため、本当に当該文字を含めて指定された領域を消去してよいかをオペレーターに確認をする。今回のように、文字認識した結果に「名称」という文字が含まれている場合、制御部22は、図11右下にあるように、指定した領域が、本当に消去の対象とされるべき範囲であるかについて、表示部25を介し、確認表示を行う(ステップS205)。確認表示は、たとえば、「はいボタン」と「いいえボタン」とを含んでいる。
当該画面において、オペレーターが「はいボタン」を押下した場合、制御部12は、画像の消去が許可されたものと判断する(S206:YES)。一方、「いいえボタン」が押下された場合、制御部12は、画像の消去が許可されていないものと判断する(S206:NO)。この場合、制御部12は、ステップS202に示す処理に戻り、オペレーターに対し、再度の領域指定を促す。
<変更例1の効果>
本変更例によれば、以下の効果が奏される。
(1)図10を参照して説明したように、オペレーターが、領域を指定して設定したマスクを付する設定が、制御部22による処理により、自動で、当該領域に対応する他の領域に対し適用される。これにより、帳票の画像に対して、効率良くかつ適切に設定作業を行うことができる。
(2)更に、図11を参照して説明したように、制御部22は、操作部24により指定された領域に領域の名称を構成する文字が含まれる場合に、当該領域に対して消去処理を適用してよいかの報知を行う。これにより、不適切な設定(消去)の適用を防ぐことができる。
(3)更に、帳票から個人情報等の記載が消去された状態で帳票の画像が外部の帳票定義装置1に送信されるため、個人情報等の記載が外部に漏洩することを防ぐことができる。
<その他の変更例>
図12は、変更例1において、領域抽出設定212において、他の領域を抽出しない旨の設定がなされている場合に、オペレーターが指定した消去領域に誤りがないかの確認処理の態様を示す図である。この場合は、ステップS209に示されるような他の領域を自動で抽出する処理はなされない。
図12上図にあるように、オペレーターによる操作により、帳票の長手方向に3つの領域B1、B2、B3が指定されているものとする。この場合、ステップS203の処理によって、各領域の文字認識処理がなされる。この場合、制御部12は、領域B1から「鈴木 一郎 様」、領域B2から「鈴木 一郎 様」、領域B3から「木 一郎 様」という文字を文字認識することになる。
ここで、領域B3が含んでいる文字が、長手方向に並んである他の領域B1、B2が含んでいる文字と異なっている。制御部22は、図12下図にあるような画面を用いて、領域の指定に問題がないかを、ステップS211の確認処理において、表示部25を介し、オペレーターに確認する。これにより、オペレーターは、領域B3における領域の指定に誤りがあることに気付くことが可能となる。
なお、図12下図に示しているように、消去しても問題ないと判断する領域(長手方向に並んである複数の指定領域の文字認識結果がそれぞれ一致している領域)と、消去の適否を確認すべきと判断する領域(文字認識結果が一致していない領域)とが、互いに異なる態様で表示されてもよい。
また、オペレーターが消去対象として3つの領収印の領域を指定した場合は、文字認識ではなく、領収印を指定する領域内の画像のマッチングにより、各領域に同じ印影が含まれているかの確認を行ってもよい。
図12の説明においては、画像の消去について説明を行ったが、帳票定義装置1における定義情報の作成処理においても、他の領域を抽出しない旨の設定がなされている場合に、同様に確認処理を実行してもよい。この場合も本変更例の場合と同様に、オペレーターは、指定した複数の領域の何れかに指定の誤りがあることに気付くことが可能となる。
なお、画像の消去は、必ずしも、塗り潰す(マスクする)作業により行われなくてもよく、消去対象の領域に対し、モザイクを施す、あるいは、切り出すなどの方法によって、記載情報の消去が行われてもよい。
また、上記実施形態および変更例では、通信により他の装置から帳票の画像を取得したが、帳票の画像の取得方法はこれに限られるものではない。たとえば、帳票消去装置2においてスキャナにより、帳票から帳票の画像が取得されてもよく、あるいは、帳票定義装置1においてスキャナにより、記載情報が消去された帳票から帳票の画像が取得されてもよい。
その他、本発明の実施形態は、特許請求の範囲に記載の範囲で適宜変更可能である。