JP2006201965A - 帳票識別システム - Google Patents
帳票識別システム Download PDFInfo
- Publication number
- JP2006201965A JP2006201965A JP2005011878A JP2005011878A JP2006201965A JP 2006201965 A JP2006201965 A JP 2006201965A JP 2005011878 A JP2005011878 A JP 2005011878A JP 2005011878 A JP2005011878 A JP 2005011878A JP 2006201965 A JP2006201965 A JP 2006201965A
- Authority
- JP
- Japan
- Prior art keywords
- ruled line
- line feature
- registered
- unit
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
【課題】被登録帳票と被識別帳票とで、押印の有無や位置に違いがある場合であっても、被登録帳票として識別可能となる。
【解決手段】 帳票の画像から罫線特徴データを抽出する罫線特徴抽出部と、ノイズを除去するノイズ除去部と、罫線特徴データを帳票フォーマットデータベースに登録する帳票フォーマット登録部と、被識別帳票の画像から被識別罫線特徴データを抽出して帳票フォーマットデータベースと比較することにより帳票を識別するフォーマット識別部とを備えた帳票識別システムにおいて、登録帳票と追記帳票との罫線特徴データの差分情報を登録し、罫線特徴データの差異が差分情報の範囲内であれば一致したとみなすことを特徴とする。
【選択図】 図1
【解決手段】 帳票の画像から罫線特徴データを抽出する罫線特徴抽出部と、ノイズを除去するノイズ除去部と、罫線特徴データを帳票フォーマットデータベースに登録する帳票フォーマット登録部と、被識別帳票の画像から被識別罫線特徴データを抽出して帳票フォーマットデータベースと比較することにより帳票を識別するフォーマット識別部とを備えた帳票識別システムにおいて、登録帳票と追記帳票との罫線特徴データの差分情報を登録し、罫線特徴データの差異が差分情報の範囲内であれば一致したとみなすことを特徴とする。
【選択図】 図1
Description
本発明は、帳票の上に印刷されている罫線の特徴を用いて帳票を特定する「罫線特徴識別」の対象となる帳票上の、不特定の位置に四角等、直線で構成された押印等の追記がなされている場合でも、正しく帳票識別ができるような帳票識別方法に関するものである。
光学的文字読取装置やイメージ処理システムにて、処理方法や出力先等が異なる複数種の帳票を、同じ種類ごとに仕分ける方法としては、システム導入者側が作成した専用の定型帳票に、帳票の種類毎にユニークな「シートID」を付与する方法がある。「シートID」を使用する場合、光学的文字読取装置やイメージ処理システムでは、各帳票上のシートIDを文字認識し、その認識結果に従って帳票の種類を特定し、後続の処理を判断する。
「シートID」による仕分けを行なう対象は、システム導入側がシートIDを管理できる「定型帳票」の範囲となる。しかし、対象ソリューションの拡大に伴い、取引先側等が作成した、シートIDのない「非定型帳票」を処理しなければならなくなってきた。
これらの非定型帳票を仕分ける方法のひとつとして、「罫線特徴識別」がある。これは、帳票全体の罫線の特徴を自動的に抽出して識別を行なうものである。日本の非定型帳票は多くの場合表で構成されており、罫線が多用されているので、この方法は非常に効果的である。
罫線特徴識別では、処理対象帳票の罫線特徴をあらかじめフォーマットデータベース中に登録しておき、識別処理対象である帳票の画像から抽出した罫線特徴とのマッチングを行い、両者の一致度に応じて正解か否かを決定している。(例えば、特許文献1参照)。
特許3276554
「シートID」による仕分けを行なう対象は、システム導入側がシートIDを管理できる「定型帳票」の範囲となる。しかし、対象ソリューションの拡大に伴い、取引先側等が作成した、シートIDのない「非定型帳票」を処理しなければならなくなってきた。
これらの非定型帳票を仕分ける方法のひとつとして、「罫線特徴識別」がある。これは、帳票全体の罫線の特徴を自動的に抽出して識別を行なうものである。日本の非定型帳票は多くの場合表で構成されており、罫線が多用されているので、この方法は非常に効果的である。
罫線特徴識別では、処理対象帳票の罫線特徴をあらかじめフォーマットデータベース中に登録しておき、識別処理対象である帳票の画像から抽出した罫線特徴とのマッチングを行い、両者の一致度に応じて正解か否かを決定している。(例えば、特許文献1参照)。
各金融機関にて処理される非定型の私製為替帳票では、光学的文字読取装置やイメージ処理システムに入力する前に、金融機関にて確認印や承認印を押印するための「押印枠」や、「受付」を示す印や、「日付印」等が押印される場合がある。これらの印の印影に直線が含まれ、かつ、帳票の四辺に対し略平行に押印されている場合、その印影は帳票上に印刷されている罫線と同様に、罫線特徴の一部として抽出される。
このため、前記のような罫線特徴識別を用いて帳票識別を行なう場合、フォーマットデータベース中に登録済の帳票と同種の帳票であっても、登録されている罫線特徴と、識別処理対象である帳票画像より抽出した罫線特徴との間に差分が生じてしまい、両者の一致度が低くなり「未登録の別帳票」と見なされてしまう場合がある。その場合、以降の登録済帳票としての処理が行われなくなってしまう。
このように、予め登録されている罫線特徴を取得した帳票画像と、識別処理対象帳票の画像とで、押印の有無や位置に違いがある場合、当該処理対象帳票は「未登録の別帳票」とされる可能性があり、帳票識別率を低下させる原因となる。
このため、被識別帳票に上記のような押印の有無や位置に違いがある場合であっても、登録帳票として識別可能な帳票識別システムが必要であった。
このため、前記のような罫線特徴識別を用いて帳票識別を行なう場合、フォーマットデータベース中に登録済の帳票と同種の帳票であっても、登録されている罫線特徴と、識別処理対象である帳票画像より抽出した罫線特徴との間に差分が生じてしまい、両者の一致度が低くなり「未登録の別帳票」と見なされてしまう場合がある。その場合、以降の登録済帳票としての処理が行われなくなってしまう。
このように、予め登録されている罫線特徴を取得した帳票画像と、識別処理対象帳票の画像とで、押印の有無や位置に違いがある場合、当該処理対象帳票は「未登録の別帳票」とされる可能性があり、帳票識別率を低下させる原因となる。
このため、被識別帳票に上記のような押印の有無や位置に違いがある場合であっても、登録帳票として識別可能な帳票識別システムが必要であった。
このような課題を解決するために、本発明の帳票識別システムは以下の構成を備える。
<構成1>
帳票の画像から罫線特徴データを抽出する罫線特徴抽出部と、罫線特徴データからノイズを除去するノイズ除去部と、被登録帳票の画像から抽出しノイズを除去した登録罫線特徴データを、前記被登録帳票の帳票フォーマット情報とともに登録した帳票フォーマットデータベースと、前記罫線特徴抽出部に被識別帳票の画像から被識別罫線特徴データを抽出させ、前記ノイズ除去部によりノイズを除去した後、前記帳票フォーマットデータベースに含まれる登録罫線特徴データと比較することにより前記被識別帳票を識別するフォーマット識別部とを備えた帳票識別装置において、前記帳票フォーマットデータベースにはさらに、前記被登録帳票に対して追記されるべき、罫線からなる追記図形の罫線特徴データを差分情報として登録し、前記フォーマット識別部は、罫線特徴データの差異が前記差分情報の範囲内であれば罫線特徴データが一致したとみなす。
<構成2>
前記罫線特徴抽出部に被登録帳票の画像から罫線特徴データを抽出させ、前記ノイズ除去部によりノイズを除去して登録罫線特徴データとするとともに、前記罫線特徴抽出部に前記追記図形を含む追記帳票の画像から罫線特徴データを抽出させ、前記ノイズ除去部によりノイズを除去して追記罫線特徴データとし、前記被登録帳票と前記追記帳票との罫線特徴データとの差分情報を帳票フォーマット情報と前記登録罫線特徴データとともに登録する、帳票フォーマット登録部を備える。
<構成3>
前記罫線特徴データは罫線の特徴量情報を含み、前記追記帳票の画像上で追記部分を指定する追記指定部を備え、前記帳票フォーマット登録部は、前記追記指定部によって指定された追記部分の罫線の特徴量を前記罫線特徴抽出部に抽出させ、前記ノイズ除去部によりノイズを除去した後、前記差分情報として登録する。
<構成4>
前記被登録帳票の画像は、前記追記帳票の画像から前記指定された追記部分を削除した画像である。
<構成5>
前記罫線特徴データは罫線の特徴量情報を含み、前記追記帳票は前記被登録帳票に対して前記追記図形の追記がなされた帳票であり、前記帳票フォーマット登録部は、追記帳票の全体の罫線の特徴量を前記罫線特徴抽出部に抽出させ、前記ノイズ除去部によりノイズを除去した後、前記登録罫線特徴データの特徴量との差分を、前記差分情報として登録する。
<構成6>
前記帳票フォーマット登録部は、前記差分情報を全帳票共通情報として格納する。
<構成7>
前記追記図形とは、罫線からなる検印の押印欄である。
<構成1>
帳票の画像から罫線特徴データを抽出する罫線特徴抽出部と、罫線特徴データからノイズを除去するノイズ除去部と、被登録帳票の画像から抽出しノイズを除去した登録罫線特徴データを、前記被登録帳票の帳票フォーマット情報とともに登録した帳票フォーマットデータベースと、前記罫線特徴抽出部に被識別帳票の画像から被識別罫線特徴データを抽出させ、前記ノイズ除去部によりノイズを除去した後、前記帳票フォーマットデータベースに含まれる登録罫線特徴データと比較することにより前記被識別帳票を識別するフォーマット識別部とを備えた帳票識別装置において、前記帳票フォーマットデータベースにはさらに、前記被登録帳票に対して追記されるべき、罫線からなる追記図形の罫線特徴データを差分情報として登録し、前記フォーマット識別部は、罫線特徴データの差異が前記差分情報の範囲内であれば罫線特徴データが一致したとみなす。
<構成2>
前記罫線特徴抽出部に被登録帳票の画像から罫線特徴データを抽出させ、前記ノイズ除去部によりノイズを除去して登録罫線特徴データとするとともに、前記罫線特徴抽出部に前記追記図形を含む追記帳票の画像から罫線特徴データを抽出させ、前記ノイズ除去部によりノイズを除去して追記罫線特徴データとし、前記被登録帳票と前記追記帳票との罫線特徴データとの差分情報を帳票フォーマット情報と前記登録罫線特徴データとともに登録する、帳票フォーマット登録部を備える。
<構成3>
前記罫線特徴データは罫線の特徴量情報を含み、前記追記帳票の画像上で追記部分を指定する追記指定部を備え、前記帳票フォーマット登録部は、前記追記指定部によって指定された追記部分の罫線の特徴量を前記罫線特徴抽出部に抽出させ、前記ノイズ除去部によりノイズを除去した後、前記差分情報として登録する。
<構成4>
前記被登録帳票の画像は、前記追記帳票の画像から前記指定された追記部分を削除した画像である。
<構成5>
前記罫線特徴データは罫線の特徴量情報を含み、前記追記帳票は前記被登録帳票に対して前記追記図形の追記がなされた帳票であり、前記帳票フォーマット登録部は、追記帳票の全体の罫線の特徴量を前記罫線特徴抽出部に抽出させ、前記ノイズ除去部によりノイズを除去した後、前記登録罫線特徴データの特徴量との差分を、前記差分情報として登録する。
<構成6>
前記帳票フォーマット登録部は、前記差分情報を全帳票共通情報として格納する。
<構成7>
前記追記図形とは、罫線からなる検印の押印欄である。
被登録帳票と被識別帳票とで、押印の有無や位置に違いがある場合であっても、被登録帳票として識別可能となる。
本発明の実施例について、金融機関での伝票処理を例にとって、以下のとおり説明する。
本発明における帳票識別装置5は、入力された帳票画像により帳票識別を行うためのものであるが、そのための帳票フォーマットデータベース6を登録する機能も備えている。
以降の記述において前記帳票識別を行う業務を「帳票識別業務」と呼び、帳票フォーマットデータベース6の登録を行う業務を「帳票登録業務」と呼ぶ。
<実施例1の構成>
図1は、本発明のシステム構成図である。
図1は、本発明のシステム構成図である。
帳票1は、金融取引等に必要な情報を記入するための非定型の私製帳票である。図3は帳票1の例である。図3に示す帳票1は、たとえば企業等が従業員の給与を各従業員の指定講座に振り込ませるために、企業ごとに作成して、金融機関に渡す給与振込依頼書と呼ばれる非定型の私製帳票である。図3に示す給与振込書は、前記必要な情報が記入または印字される前の状態である。
このような帳票は図3に示すような罫線による表構造を持っていることが多い。また、ここでは例示しないが、図3に示す伝票だけではなく、他の企業の給与振込依頼書も存在しており、それぞれ特有の表構造を有している。すなわち、罫線の特徴によって、どの企業の振込依頼書であるかを特定可能である。さらに、罫線による表構造を持つ帳票は、給与振込依頼書以外にも単記式の振込依頼書等さまざまな帳票が存在するが、本実施例の帳票識別システムは、それらの金融取引に使用する帳票のうち罫線に特徴があるものすべてを対象とすることが可能である。
ところで、金融機関の業務においては、前述のような帳票を処理する場合、担当者が当該帳票を処理したことを示すために、検印の押印を行う場合がある。金融機関側で作成した振込依頼書や入金伝票や出金伝票のいわゆる制定帳票であれば、作成時に必要な検印欄を設けることが可能であるが、前述の非定型の私製帳票のような顧客が作成する帳票には、必ずしも検印欄が設けられてはいない。このため、金融機関では、図4に示すような検印欄(図4の例では係員欄も含んでいる)のスタンプを作成しておき、図3のような帳票を受け取った場合に、帳票上に前記スタンプを押し、検印欄を追加する。このようなスタンプを検印欄スタンプと呼ぶ。なお、図4は検印欄スタンプが押された箇所に、実際に検印が押印されたときの様子を示す例である。
なお、検印欄スタンプがない場合には手書き等で同じような検印欄を設ける場合も考えられる。本実施例では、このような検印欄の追加を「追記」と称する。かかる追記は、行う場所が厳密に定められているわけではないので、同じ種類の帳票であっても場所は一定でない場合がある。(たとえば図5(a)(b))
このような検印欄は、罫線によって構成されているため、後述する罫線特徴の抽出の際、もともと帳票に存在した罫線と一緒に、罫線特徴として抽出される。
スキャナ2は、スキャナ端末3に接続され、帳票等の画像を取得するためのものであり、連続読み取り可能なロット型スキャナ、フラットベッドスキャナ、スタンド型スキャナ、あるいはデジタルカメラ、ビデオカメラ等であるが、その他の同様な画像取得機能を持つものであっても良い。大量の帳票1を一度に処理する場合はロット型スキャナを用いるのが望ましいが、1枚ごとに処理するような場合は、フラットベッドスキャナ、スタンド方スキャナ等を用いても良い。本実施例では、前記のロット型スキャナを用いることを前提とする。
スキャナ端末3は、前記スキャナ2を制御して帳票1の画像を取得するための端末であり、図示しないCRT等の表示部やキーボードマウス等の操作部を備えた、一般的なPC等が使用される。スキャナ端末3にはスキャナ制御用のプログラムであるスキャナ制御部が備えられている。スキャナ制御部は、スキャナ端末3の表示部にスキャナ2の操作画面を表示する。このとき、操作画面は、読み取る帳票が後述する被登録帳票であるか、追記帳票であるか、被識別帳票であるかの画像種別情報を指定させるようになっている。
ここで、被登録帳票とは、帳票登録業務の際、後述する帳票フォーマットデータベース6の登録に用いる帳票である。また、追記帳票とは、帳票登録業務の際、同じく帳票フォーマットデータベース6の登録に用いる帳票であり、かつ前記追記がなされた帳票でる。
また、被識別帳票とは、帳票識別業務の際、登録された帳票フォーマットデータベース6を用いて、帳票の種類を決定(帳票識別)される帳票であり、すなわち前述の金融機関の業務の対象となる帳票である。被識別帳票には、前記検印欄スタンプが押されている。
スキャナ端末3は、取得した画像を前記画像種別情報とともに、後述する帳票識別装置5に送信する。
スキャナ端末3は、取得した画像を前記画像種別情報とともに、後述する帳票識別装置5に送信する。
帳票登録端末4は、帳票フォーマットデータベース6に帳票フォーマット情報61を、登録罫線特徴データ62、特徴差分情報63とともに登録するための端末であり、図示しないメモリやCRT等の表示部やキーボードマウス等の操作部を備えた、一般的なPC等が使用される。
前記登録の際、帳票登録端末4は、帳票識別装置5に備わる帳票フォーマット登録部53の機能を使用する。その際の操作画面等も帳票フォーマット登録部53から提供されるものとする。帳票登録端末4は、起動時もしくはスキャナ端末3による帳票登録業務開始時点までに自動もしくは手動にて帳票フォーマット登録部53の機能を呼び出しておくものとする。これにより、帳票登録端末4と帳票識別装置5とのコネクションが確立され、帳票識別装置5から帳票登録端末4への通知や画面表示等が可能となる。
また、帳票登録業務の際、オペレータは業務の開始から終了までのいずれかの時点に、操作画面から登録を行う帳票の種類および付加情報(後述)を指定しておく。例えば、スキャナPC3から帳票フォーマット登録部53に被登録帳票画像が送信されたとき、帳票フォーマット登録部53が帳票登録端末4の操作画面に設定画面を表示することによって、オペレータに指定させる。このとき表示画面には被登録帳票の画面を同時に表示するようにすれば、帳票を参照しながら指定を行うことができる。指定した情報は、帳票フォーマットデータベース6への登録の際、帳票フォーマット情報61内に登録される。
帳票識別装置5は、入力された帳票画像を帳票フォーマットデータベース6を参照することにより識別する装置であり、図示しないメモリやCRT等の表示部やキーボードマウス等の操作部を備えた、一般的なPCやサーバー等が使用される。ここでは帳票識別装置5の各機能はプログラムを想定しているが、同等の機能を提供するものであればハードウェアによって実現されるものであっても構わない。帳票識別装置5は、被識別画像と、帳票識別の結果を帳票識別結果情報として出力情報作成装置7に通知する。
さらに、帳票識別装置5にはハードディスク等によって実現される記憶部が備わっており、当該記憶部には帳票フォーマットデータベース6が格納されている。帳票識別装置5は、被識別帳票画像の帳票識別を行って、帳票識別結果情報を被識別帳票画像とともに、出力情報作成装置7に通知する。また帳票識別装置5には、帳票フォーマットデータベース6に対し新規の帳票の登録を行う機能が備わっている。帳票識別装置5の詳細については後述する。
帳票フォーマットデータベース6には、帳票識別に必要な情報が登録されている。帳票フォーマットデータベース6の詳細については、後述する。
出力情報作成装置7は、帳票識別装置5によって通知された帳票識別結果情報を元に、出力情報を作成する装置であり、図示しないメモリやCRT等の表示部やキーボードマウス等の操作部を備えた、一般的なPCやサーバー等が使用される。
ここでは出力情報作成装置7の各機能はプログラムを想定しているが、同等の機能を提供するものであればハードウェアによって実現されるものであっても構わない。
ここでは出力情報作成装置7の各機能はプログラムを想定しているが、同等の機能を提供するものであればハードウェアによって実現されるものであっても構わない。
また、各端末及び装置は図示しない通信機能を備えており、図に示すとおりLANにより接続されている。
ここで、スキャナ2およびスキャナ端末3による、帳票画像の取得について説明する。
帳票登録業務を行う際、オペレータは、スキャナ2に処理対象となる被登録帳票または追記帳票をセットし、スキャナ端末3の操作画面より帳票の種別が被登録帳票または追記帳票である旨を指定し、画像の読み取り開始を指示する。これによりセットされた被登録帳票または追記帳票が読み込まれて被登録帳票画像または追記帳票画像が取得され、順次帳票識別装置5に送信される。このとき被登録帳票画像または追記帳票画像である旨の画像種別情報が同時に送信される。
帳票識別業務を行う際、オペレータは、スキャナ2に処理対象となる被識別帳票をセットし、スキャナ端末3の操作画面より帳票の種別が被識別帳票である旨を指定し、画像の読み取り開始を指示する。これによりセットされた被識別帳票が順次読み込まれて被識別帳票画像が取得され、順次帳票識別装置5に送信される。このとき被識別帳票である旨の画像種別情報が同時に送信される。
このように、スキャナ端末3へのオペレータ指示がトリガーとなり、帳票登録業務あるいは帳票識別業務が開始される。
なお、ここでは、オペレータは操作画面から「帳票の種別を指定する」としたが、帳票の種別の指定に代えて業務が帳票識別業務であるか、帳票登録業務であるかを指定させることとしても良い。なお、帳票登録業務の場合は、最初に被登録帳票を読み込ませた後、次に読み込ませた帳票を追記帳票として扱うようにしても良い。いずれの場合も、それぞれに対応する画像種別情報が画像と同時に帳票識別装置5に送信されるのは同様である。
ここで、図2により、帳票識別装置5および帳票フォーマットデータベース6について詳細に説明する。
まず、帳票フォーマットデータベース6について説明する。
帳票フォーマットデータベース6には、各帳票ごとに、帳票フォーマット情報61、登録罫線特徴データ62、特徴差分情報63が格納されている。
帳票フォーマット情報61は、帳票の種類と付加情報が格納される。帳票の種類としては、例えば図3の帳票であれば「給与振込依頼書−○○株式会社」のように登録する。また、付加情報としては、当該帳票と識別されたときの画像の格納先や、文字認識可能な領域がある場合にその領域の文字認識指定等、被識別帳票画像に対する処理方法を指定可能である。
登録罫線特徴データ62とは、当該帳票の罫線特徴情報である。特徴差分情報63は、当該帳票において、許容される特徴量の差分を示す情報である。
次に、帳票識別装置5について説明する。
帳票識別装置5は、罫線特徴抽出部51、ノイズ除去部52、帳票フォーマット登録部53、フォーマット識別部54、罫線特徴抽出範囲指定部55を備えている。
罫線特徴抽出部51は、スキャナ端末3から受信した帳票画像から、罫線特徴情報を抽出するための機能部である。罫線特徴抽出部51は、既知の手段により、画像の傾きの補正、帳票部分の特定を行い、特定された帳票部分について罫線特徴情報を抽出する。罫線特徴情報には、各罫線が縦方向および横方向に1本ずつ分解されて、それぞれの罫線の位置情報や長さ情報によって表現され格納される。
ノイズ除去部52は、前記罫線特徴抽出部51によって抽出された罫線特徴情報からノイズを除去するものである。ここでいうノイズとは、例えば、実際には罫線ではない文字や汚れにより発生し、前記罫線特徴情報に含まれてしまった微小な罫線のことを指す。ノイズの除去は、一定の長さに満たない罫線を削除することにより行われる。
帳票フォーマット登録部53は、帳票フォーマットデータベース6に帳票フォーマット情報61を登録罫線特徴データ62、特徴差分情報63とともに登録するためのものである。
帳票フォーマット登録部53はまず、スキャナ端末3から受信した被登録帳票画像から、前記罫線特徴抽出部51を用いて罫線特徴情報を取得し、ノイズ除去部52によってノイズ除去を行ったのち、登録罫線特徴情報として図示しないメモリ上に保持する。
次に、帳票フォーマット登録部53は、スキャナ端末3から受信した追記帳票画像を、罫線特徴抽出範囲指定部55を使用して帳票登録端末4の表示部の操作画面に表示し、オペレータに抽出部分を指定させる。ここでは、追記帳票は図5(a)や(b)に示すようなものを想定しているが、図4の検印欄スタンプを含むものであれば、必ずしも被登録帳票と同じ種類の帳票である必要はない。オペレータの操作は直ちに帳票フォーマット登録部53に伝えられ、帳票フォーマット登録部53は指定された部分を追記帳票画像より切り出し、罫線特徴抽出部51を用いて罫線特徴情報を取得し、ノイズ除去部52によってノイズ除去を行ったのち、追記罫線特徴情報として図示しないメモリ上に保持する。
このとき、帳票フォーマット登録部53は、前記追記罫線特徴情報から特徴量を算出し、同じくメモリ上に保持する。特徴量とは、ここでは罫線情報中に含まれる長さ情報の合計であるとする。ただし、罫線特徴全体の大きさを示すものであれば他の量でも構わない。
帳票フォーマット登録部53は別途帳票登録端末4のオペレータに被登録帳票のタイトル等の情報を入力させ、帳票フォーマット情報61として帳票フォーマットデータベース6に登録する。その際、前記登録罫線情報を登録罫線特徴データ62として、前記追記罫線特徴情報から求めた特徴量を、特徴差分情報63として登録する。
なお、ここでは追記部分を帳票登録端末4のオペレータに指定させるとしたが、前述のように追記帳票は追記される図形である検印欄スタンプを含んでいれば良く、このため白紙に検印欄スタンプのみを押したものであってもよい。この場合、他に罫線が含まれないのであるから、オペレータによる指定操作を行わずに、前記特徴差分情報63を抽出することができる。
なお、ここでは被登録帳票と追記帳票とは別の帳票であり、別途スキャナで取得させるとしたが、追記帳票が被登録帳票と同じ種類の帳票であれば、追記帳票のみにて上述の処理が可能である。すなわち、帳票フォーマット登録部53は、追記帳票画像に対して帳票登録端末4のオペレータに追記部分の指定を行わせ、追記帳票画像から選択範囲を切り出すと同時に帳票の背景色(あるいは白)で選択範囲を塗りつぶし、塗りつぶし後の追記帳票画像を前記被登録帳票画像として扱えばよい。このようにすれば、登録のための帳票画像取得が1回ですみ、効率が良い。
フォーマット識別部54は、スキャナ端末3から受信した被識別帳票画像を、帳票フォーマットデータベース6を参照することにより識別し、帳票の種類を特定するためのものである。
フォーマット識別部54はまず、スキャナ端末3から受信した被識別帳票画像から、前記罫線特徴抽出部51を用いて罫線特徴情報を取得し、ノイズ除去部52によってノイズ除去を行ったのち、被識別罫線特徴情報として図示しないメモリ上に保持する。
次に、フォーマット識別部54は、帳票フォーマットデータベース6から各帳票ごとの帳票フォーマット情報61、登録罫線特徴データ62、特徴差分情報63を取得して、順次比較し罫線特徴が一致した場合に、当該帳票フォーマット情報61を識別結果として出力する。このとき、前記被識別罫線特徴情報と登録罫線特徴データ62について、前記特徴量の比較を行い、特徴量の差異が特徴差分情報63より小さい場合は一致したものとみなす。
このときの罫線特徴情報の様子を図6、図7(a)(b)に示す。図6は、図3に示す帳票から抽出し、帳票フォーマットデータベース6に登録した、登録罫線特徴データ62である。図7(a)(b)は、図5(a)(b)に示す被識別帳票から抽出した、被識別罫線特徴情報である。このように図6と図7(a)(b)には、検印欄スタンプによる差異が存在するが、特徴差分情報63として検印欄スタンプの特徴量が登録されており、当該特徴量の範囲で罫線特徴の差異が無視されるため、図5(a)(b)のような帳票も図3に示す帳票として識別される。
罫線特徴抽出範囲指定部55は、帳票登録端末4の操作画面に対して追記帳票を表示し、オペレータに抽出すべき範囲を指定させる機能部である。オペレータは、操作画面にて、たとえばマウスのドラッグ操作等により検印スタンプの範囲を選択する。すると、罫線特徴抽出範囲指定部55は指定された追記画像上の座標情報(左上の座標および縦横のサイズ情報)を、帳票フォーマット登録部53に通知する。
なお、帳票登録端末4から帳票識別装置5上の機能を使用するための方法は、RPC(Remote Procedure Call)等既知の技術が使用される。
<実施例1の動作>
次に、本実施例の動作を説明する。
次に、本実施例の動作を説明する。
図8は、帳票登録業務のフローチャートである。なお、以下の処理は、すべて前述の処理に従って行われる。
S101:オペレータの指示により、スキャナ端末3はスキャナを制御して被登録帳票1の画像を取得し、帳票識別装置5の帳票フォーマット登録部53に送信する。
S102:帳票フォーマット登録部53は、受信した被登録帳票画像から、罫線特徴情報を抽出し、ノイズ除去を行った後、登録罫線特徴情報としてメモリ上に保持する。
S103:オペレータの指示により、スキャナ端末3はスキャナを制御して追記帳票1の画像を取得する。
S104:帳票フォーマット登録部53は、スキャナ端末3から受信した追記帳票画像について、帳票登録端末4のオペレータに追記部分の指定を行わせる。
S105:帳票フォーマット登録部53は、指定された追記部分の罫線特徴情報を抽出し、ノイズ除去を行った後、追記罫線特徴情報としてメモリ上に保持する。さらに追記罫線特徴情報から追記部分の特徴量を算出する。
S106:帳票フォーマット登録部53は、帳票フォーマットデータベース6に、帳票名等を帳票フォーマット情報61として、登録罫線特徴情報を登録罫線特徴データ62として、追記部分の特徴量を特徴差分情報63として登録する。
次に、帳票識別の動作について説明する。
図9は、帳票識別業務のフローチャートである。お、以下の処理は、すべて前述の処理に従って行われる。
S201:オペレータの指示により、スキャナ端末3はスキャナを制御して被識別帳票1の画像を取得し、帳票識別装置5のフォーマット識別部54に送信する。
S202:フォーマット識別部54は、受信した被識別帳票画像から、罫線特徴情報を抽出し、ノイズ除去を行った後、被識別罫線特徴情報としてメモリ上に保持する。
S203:フォーマット識別部54は、帳票フォーマットデータベース6を参照し、次に処理すべき帳票フォーマット情報61が存在するかどうかを確認する。存在する場合は、S204に移行する。存在しない場合は、S207に移行する。
S204:フォーマット識別部54は、帳票フォーマットデータベース6から1帳票分の帳票フォーマット情報61、登録罫線特徴データ62、特徴差分情報63を取得し、登録罫線特徴データ62と前記被識別罫線特徴情報とを比較する。このとき、両罫線特徴情報から特徴量を算出し、それぞれの差を求め、特徴差分情報63と比較する。
S205:特徴量の差が特徴差分情報63より小さい場合、一致するものとみなし、S206へ移行する。大きい場合は、一致しないものとみなし、S203に移行する。
S206:フォーマット識別部54は、一致した帳票フォーマット情報61の帳票の種類と付加情報を、帳票識別結果情報として出力情報作成装置7に送信する。出力情報作成装置は、受信した帳票名および付加情報に従って、出力処理を行う。
ところで、被識別帳票として、前記追記が行われていない帳票が入力された場合は、前記特徴量の差は特徴差分情報63より小さくなるのは明らかであるから、帳票識別が妨げられることはない。
このように、本実施例によれば、追記部分のない帳票の罫線特徴情報とともに、追記部分の罫線特徴情報の特徴量を差分情報として帳票フォーマットデータベース6に持たせ、帳票識別の際には前記差分情報を許容するようにしたので、検印欄スタンプのような罫線として抽出されてしまうような追記がなされてしまった帳票でも、識別が可能となる。
また、追記部分については、オペレータが指定した部分を追記部分として扱うようにしたので、検印欄スタンプ等の追記があれば、実帳票であろうと白紙であろうと追記部分の特徴量を差分情報として登録することができる。
また、追記部分については、オペレータが指定した部分を追記部分として扱うようにしたので、検印欄スタンプ等の追記があれば、実帳票であろうと白紙であろうと追記部分の特徴量を差分情報として登録することができる。
実施例2においては、実施例1のように追記部分を選択するのではなく、追記帳票として被登録帳票と同じ種類の帳票に追記がなされたものを用いて、自動的に特徴量の差分を抽出する。すなわち、図3の帳票を被登録帳票とすれば、図5(a)のような帳票を追記帳票として使用し、それぞれの罫線特徴の特徴量の差分を自動的に求める。
<実施例2の構成>
実施例2の構成について、実施例1との差異を中心に説明する。実施例1と同じ構成については、説明を省略する。
実施例2の構成について、実施例1との差異を中心に説明する。実施例1と同じ構成については、説明を省略する。
実施例2のシステム構成は実施例1と同じく図1で表される。
スキャナ端末3による、帳票画像の取得の操作は実施例1と同じである。ただし、追記帳票として使用する帳票は、前述のとおり被登録帳票と同じ種類の帳票に追記がなされたものが用いられる。
スキャナ端末3による、帳票画像の取得の操作は実施例1と同じである。ただし、追記帳票として使用する帳票は、前述のとおり被登録帳票と同じ種類の帳票に追記がなされたものが用いられる。
帳票登録端末4は、帳票フォーマットデータベース6に帳票フォーマット情報61を登録する際、実施例1と同じく帳票識別装置5に備わる帳票フォーマット登録部53の機能を使用する。ただし、操作画面には実施例1のような追記部分の指定を行う画面は表示されず、オペレータは、帳票の種類および付加情報の指定のみ行う。
ここで、帳票識別装置5について詳細を説明する。
図10は、実施例2における帳票識別装置5の機能ブロック図である。
罫線特徴抽出部51、ノイズ除去部52、フォーマット識別部54については実施例1と同じであるので説明は省略する。
実施例2においては、罫線特徴抽出範囲指定部55は存在せず、替わって特徴差分抽出部56が備えられる。
特徴差分抽出部56は、二つの罫線特徴情報から特徴量を算出し、差分を出力するものである。本実施例においては、帳票フォーマット登録部53から被登録罫線特徴情報と追記罫線特徴情報を受けとり、両者の特徴量の差分を返す。
帳票フォーマット登録部53はスキャナ端末3から受信した被登録帳票画像から、前記罫線特徴抽出部51を用いて罫線特徴情報を取得し、ノイズ除去部52によってノイズ除去を行ったのち、登録罫線特徴情報として図示しないメモリ上に保持する。
次に、帳票フォーマット登録部53は、スキャナ端末3から受信した追記帳票画像を、罫線特徴抽出部51を用いて罫線特徴情報を取得し、ノイズ除去部52によってノイズ除去を行ったのち、追記罫線特徴情報として図示しないメモリ上に保持する。
次に、帳票フォーマット登録部53は、特徴差分抽出部56を使用して、前記登録罫線特徴情報および追記罫線特徴情報から、特徴量の差分を抽出し、同じくメモリ上に保持する。
帳票フォーマット登録部53は別途帳票登録端末4のオペレータに被登録帳票のタイトル等の情報を入力させ、帳票フォーマット情報61として帳票フォーマットデータベース6に登録する。その際、前記登録罫線情報を登録罫線特徴データ62として、特徴差分抽出部56を使用して求めた特徴量の差分を、特徴差分情報63として登録する。
<実施例2の動作>
次に、本実施例の動作を説明する。
次に、本実施例の動作を説明する。
図11は、帳票登録業務のフローチャートである。なお、以下の処理は、すべて前述の処理に従って行われる。
S301〜S303は実施例1におけるS101〜S103と同じであるので省略する。
S304:帳票フォーマット登録部53は、スキャナ端末3から受信した追記帳票画像から、罫線特徴情報を抽出し、ノイズ除去を行った後、追記罫線特徴情報としてメモリ上に保持する。
S305:帳票フォーマット登録部53は、特徴差分抽出部56を使用して登録罫線特徴情報と追記罫線特徴情報から特徴量の差分を抽出して、メモリに保存する。
S306:帳票フォーマット登録部53は、帳票フォーマットデータベース6に、帳票名等を帳票フォーマット情報61として、登録罫線特徴情報を登録罫線特徴データ62として、特徴差分抽出部56を使用して抽出した特徴量の差分を特徴差分情報63として登録する。
帳票識別の動作については実施例と同じなので説明を省略する。
このように、本実施例によれば、前記前記差分情報の登録の際、追記部分のない帳票の罫線特徴情報と追記部分のある帳票の罫線特徴情報との特徴量の差分を自動的に算出して登録するようにしたので、オペレータは追記部分の指定を行う必要がなく、操作が簡便になる。
なお、同じ追記が想定されるのであれば、特徴差分情報63は各帳票ごとに設定するのでなく、帳票フォーマットデータベースの共通情報として登録するようにしてもよい。そのようにすれば、前述の追記部分の登録にかかる処理は1回のみでよく、それ以後は追記なしの帳票の罫線特徴情報を登録するのみでよい。
なお、帳票登録端末4は独立した端末として説明したが、帳票フォーマット登録部53は帳票識別装置5に存在するのであるから、帳票識別装置5に備わった表示部や操作部を使用して、帳票識別装置5上で前述の操作を行わせることもできる。逆に、帳票フォーマット登録部53および、罫線特徴抽出範囲指定部55または特徴差分抽出部56を帳票登録端末4に設け、前述の処理を帳票登録端末4で行うことにより、帳票識別の機能と帳票登録の機能を別の端末上に独立させることもできる。その場合、スキャナ端末3は帳票登録業務の際には画像を帳票登録端末4に送信する。また、罫線特徴抽出部51、ノイズ除去部52は帳票登録端末4にも設けても良いし、帳票識別装置5の機能を使用するようにしてもよい。
なお、前述の実施例では追記される対象として検印欄のスタンプ例にとって説明したが、「受付」を示す印や、「日付印」等、直線が含まれるものであれば、他のスタンプ等であっても本発明を適用可能である。
なお、前述の実施例では金融機関での伝票処理を例にとって説明したが、本発明は罫線によって構成される帳票ないしはその画像を罫線の特徴によって識別ないしは分類する場合に適用できるので、金融機関での使用に限定されない。
1 帳票
2 スキャナ
3 スキャナ端末
4 帳票登録端末
5 帳票識別装置
51 罫線特徴抽出部
52 ノイズ除去部
53 帳票フォーマット登録部
54 フォーマット識別部
55 罫線特徴抽出範囲指定部
56 特徴差分抽出部
6 帳票フォーマットデータベース
61 帳票フォーマット情報
62 登録罫線特徴データ
63 特徴差分情報
7 出力情報作成装置
2 スキャナ
3 スキャナ端末
4 帳票登録端末
5 帳票識別装置
51 罫線特徴抽出部
52 ノイズ除去部
53 帳票フォーマット登録部
54 フォーマット識別部
55 罫線特徴抽出範囲指定部
56 特徴差分抽出部
6 帳票フォーマットデータベース
61 帳票フォーマット情報
62 登録罫線特徴データ
63 特徴差分情報
7 出力情報作成装置
Claims (7)
- 帳票の画像から罫線特徴データを抽出する罫線特徴抽出部と、
罫線特徴データからノイズを除去するノイズ除去部と、
被登録帳票の画像から抽出しノイズを除去した登録罫線特徴データを、前記被登録帳票の帳票フォーマット情報とともに登録した帳票フォーマットデータベースと、
前記罫線特徴抽出部に被識別帳票の画像から被識別罫線特徴データを抽出させ、前記ノイズ除去部によりノイズを除去した後、前記帳票フォーマットデータベースに含まれる登録罫線特徴データと比較することにより前記被識別帳票を識別するフォーマット識別部とを備えた
帳票識別装置において、
前記帳票フォーマットデータベースにはさらに、前記被登録帳票に対して追記されるべき、罫線からなる追記図形の罫線特徴データを差分情報として登録し、
前記フォーマット識別部は、罫線特徴データの差異が前記差分情報の範囲内であれば罫線特徴データが一致したとみなす、
帳票識別システム。 - 前記罫線特徴抽出部に被登録帳票の画像から罫線特徴データを抽出させ、前記ノイズ除去部によりノイズを除去して登録罫線特徴データとするとともに、
前記罫線特徴抽出部に前記追記図形を含む追記帳票の画像から罫線特徴データを抽出させ、前記ノイズ除去部によりノイズを除去して追記罫線特徴データとし、
前記被登録帳票と前記追記帳票との罫線特徴データとの差分情報を帳票フォーマット情報と前記登録罫線特徴データとともに登録する、帳票フォーマット登録部を備えた、
請求項1に記載の帳票識別システム。 - 前記罫線特徴データは罫線の特徴量情報を含み、
前記追記帳票の画像上で追記部分を指定する追記指定部を備え、
前記帳票フォーマット登録部は、前記追記指定部によって指定された追記部分の罫線の特徴量を前記罫線特徴抽出部に抽出させ、前記ノイズ除去部によりノイズを除去した後、前記差分情報として登録する、
請求項2に記載の帳票識別システム。 - 前記被登録帳票の画像は、前記追記帳票の画像から前記指定された追記部分を削除した画像である、
請求項3に記載の帳票識別システム。 - 前記罫線特徴データは罫線の特徴量情報を含み、
前記追記帳票は前記被登録帳票に対して前記追記図形の追記がなされた帳票であり、
前記帳票フォーマット登録部は、追記帳票の全体の罫線の特徴量を前記罫線特徴抽出部に抽出させ、前記ノイズ除去部によりノイズを除去した後、前記登録罫線特徴データの特徴量との差分を、前記差分情報として登録する、
請求項2に記載の帳票識別システム。 - 前記帳票フォーマット登録部は、前記差分情報を全帳票共通情報として格納する、
請求項2から5のいずれかに記載の帳票識別システム。 - 前記追記図形とは、罫線からなる検印の押印欄である請求項1から5のいずれかに記載の帳票識別システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005011878A JP2006201965A (ja) | 2005-01-19 | 2005-01-19 | 帳票識別システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005011878A JP2006201965A (ja) | 2005-01-19 | 2005-01-19 | 帳票識別システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006201965A true JP2006201965A (ja) | 2006-08-03 |
Family
ID=36959920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005011878A Pending JP2006201965A (ja) | 2005-01-19 | 2005-01-19 | 帳票識別システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006201965A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009048499A (ja) * | 2007-08-21 | 2009-03-05 | Canon Inc | 画像処理装置、画像処理方法、及び、画像処理プログラム |
JP2009265903A (ja) * | 2008-04-24 | 2009-11-12 | Hitachi Ltd | 情報管理システム、帳票定義管理サーバ及び情報管理方法 |
JP2013206323A (ja) * | 2012-03-29 | 2013-10-07 | Fujitsu Ltd | 帳票画像管理システム、帳票画像管理方法、及びプログラム |
-
2005
- 2005-01-19 JP JP2005011878A patent/JP2006201965A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009048499A (ja) * | 2007-08-21 | 2009-03-05 | Canon Inc | 画像処理装置、画像処理方法、及び、画像処理プログラム |
JP2009265903A (ja) * | 2008-04-24 | 2009-11-12 | Hitachi Ltd | 情報管理システム、帳票定義管理サーバ及び情報管理方法 |
JP2013206323A (ja) * | 2012-03-29 | 2013-10-07 | Fujitsu Ltd | 帳票画像管理システム、帳票画像管理方法、及びプログラム |
US9002135B2 (en) | 2012-03-29 | 2015-04-07 | Fujitsu Limited | Form image management system and form image management method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7003157B2 (en) | Sheet handling system | |
US7505178B2 (en) | Semantic classification and enhancement processing of images for printing applications | |
TWI522933B (zh) | 一種訊息識別方法、相關裝置及其系統 | |
US20140348394A1 (en) | Photograph digitization through the use of video photography and computer vision technology | |
US7844080B2 (en) | Image processing system and image processing method, and computer program | |
JP2006201965A (ja) | 帳票識別システム | |
JP2000349999A (ja) | 画像処理方法 | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JP4102365B2 (ja) | アプリケーション間のデータ連携支援方法 | |
JP2003223610A (ja) | 文字認識装置及び文字認識方法 | |
US11380032B2 (en) | Image information processing apparatus, method and non-transitory computer readable medium storing program | |
JP2017097859A (ja) | 情報処理装置と、その処理方法及びプログラム | |
JP5673277B2 (ja) | 画像処理装置およびプログラム | |
US20060188863A1 (en) | Material processing apparatus, material processing method, and material processing program product | |
GB2404471A (en) | Processing a document based on data contained in its image | |
US6678427B1 (en) | Document identification registration system | |
JP4535176B2 (ja) | 作業制御プログラム及び作業制御システム | |
JP4894184B2 (ja) | 教材処理装置、教材処理方法および教材処理プログラム | |
JP2021034772A (ja) | 画像処理装置、画像処理方法、画像処理装置用プログラム、および、書類管理システム | |
JP3090070B2 (ja) | 帳票識別方法及び装置 | |
JP2007011762A (ja) | 領域抽出装置及び領域抽出方法 | |
JP2018077838A (ja) | 情報処理装置、その処理方法及びプログラム | |
JP4983489B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2007174523A (ja) | 画像処理装置、画像処理方法、プログラムコード及び記憶媒体 | |
JP2008123446A (ja) | ログ情報管理システム、ログ情報管理装置、ログ情報管理方法及びログ情報管理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060923 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060929 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061013 |