JP2013206323A - 帳票画像管理システム、帳票画像管理方法、及びプログラム - Google Patents

帳票画像管理システム、帳票画像管理方法、及びプログラム Download PDF

Info

Publication number
JP2013206323A
JP2013206323A JP2012076983A JP2012076983A JP2013206323A JP 2013206323 A JP2013206323 A JP 2013206323A JP 2012076983 A JP2012076983 A JP 2012076983A JP 2012076983 A JP2012076983 A JP 2012076983A JP 2013206323 A JP2013206323 A JP 2013206323A
Authority
JP
Japan
Prior art keywords
image
difference data
data
common
master
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012076983A
Other languages
English (en)
Other versions
JP5884597B2 (ja
Inventor
Shohei Yoshida
昇平 吉田
Hirobumi Kamimaru
博文 神丸
Tsutomu Togo
努 藤後
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012076983A priority Critical patent/JP5884597B2/ja
Priority to US13/848,554 priority patent/US9002135B2/en
Publication of JP2013206323A publication Critical patent/JP2013206323A/ja
Application granted granted Critical
Publication of JP5884597B2 publication Critical patent/JP5884597B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

【課題】証跡情報として利用される帳票画像データの保管のためのデータ量を削減する。
【解決手段】マスタ画像格納部10は複数種類のマスタ画像を格納しておく。帳票画像取得部11は帳票画像を取得する。高相関マスタ画像検索部12は、複数種類のマスタ画像のうちで前記帳票画像取得部が取得した帳票の画像との相関が最も高いものをマスタ画像格納部10から検索する。共通差分生成部13は、その複数の帳票画像間の差分と、検索されたマスタ画像と複数の帳票画像のうちの1つとの差分をとの間で共通して存在している共通差分部分を表している共通差分データを生成する。共通差分データ格納部14は、その共通差分データを格納する。差分データ生成部15は、帳票画像取得部11が取得したそれぞれの帳票画像についての、検索されたマスタ画像に共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成する。差分データ格納部20は、差分データ生成部15が生成した差分データを格納する。
【選択図】図1

Description

本明細書で議論される実施態様は、画像情報の管理技術に関し、特に、帳票画像情報の圧縮技術に関する。
銀行のような、帳票を扱う分野では、データセンターを使った帳票管理システムが使われている。このようなシステムでは、イメージスキャナ装置で紙の帳票の読み取りを行って電子文書化し、得られた帳票画像データを証跡情報として保管する作業が行われている。しかし、帳票画像データの保管用のストレージの容量が肥大化しており、それを解決する方法が考えられている。
帳票画像データのデータ量を減らすために、例えばJPEG(Joint Photographic Experts Group)方式のような、静止画像の圧縮技術を用いた帳票画像データの圧縮が行われている。しかしながら、昨今の帳票管理システムにおけるストレージ容量の肥大化は深刻であり、静止画像の圧縮技術を流用して得られる程度のデータ圧縮率では、十分な対策とならないのが現状である。
ところで、帳票画像の保存データ量を減らす技術として、例えば、以下のような帳票画像処理の技術が知られている。この技術は、まず、記入済みの帳票画像を取得する。次に、この記入済み帳票画像と未記入の帳票画像との間で画素毎に排他的論理和演算処理を行うことによって、記述部のみの帳票画像である差分帳票画像を抽出する。そして、このようにして抽出された差分帳票画像を圧縮して保存しておくようにする。その後、元の記入済み帳票画像を復元するには、まず、保存しておいた圧縮差分帳票画像を読み出して伸張処理を行うことで圧縮前の差分帳票画像を得る。次に、この差分画像と前述の未記入の帳票画像との間で画素毎に排他的論理和演算処理を行うことによって、元の記入済み帳票画像が復元される。すなわち、この技術では2値画像を処理対象としており、未記入の帳票画像データと記入済み帳票画像データとの間で排他的論理和演算を行うことによって抽出される記述部のみの帳票画像を圧縮保存するようにして、保存データサイズを小さくしている。以下の説明では、この技術を「第一の技術」と称することとする。
また、未記入の帳票画像を作成する技術として、以下のような帳票画像作成装置が知られている。この帳票画像作成装置では、まず、同一形式の帳票に記入された複数枚の記入後帳票画像を取得する。次に、この記入後帳票画像間の位置合わせを行う。この位置合わせ後、記入後帳票画像間のAND画像を作成する。次に、作成されたAND画像と位置合わせ済みの記入後帳票画像とから、黒ラン(黒データが並んでいるデータ)の連結成分を囲む領域を抽出することによって、未記入状態の帳票の画像を作成する。以下の説明では、この技術を「第二の技術」と称することとする。この第二の技術では、更に、AND画像から抽出した矩形領域と記入後帳票画像から抽出した矩形領域とを対応付けると共に、矩形領域の大きさ、黒画素数、若しくは矩形領域の抽出数を用いて不要な画像領域を特定し削除することで、未記入の帳票画像の作成精度を向上させる。
また、イメージスキャナ等で読み取った帳票画像が、既に登録されている帳票画像と同一のフォーマットか判断する帳票識別システムが知られている。このシステムは、イメージスキャナ等で読み取った帳票画像が、既に登録されている帳票画像と同一のフォーマットか判断するときに、記入や押印等のノイズを識別前に取り除くことで、読み取った帳票画像のフォーマットを認識するというものである。このシステムの動作は、登録モードと識別モードの2つに分かれている。登録モードでの動作では、まず、被登録帳票画像データを読み込み、識別に利用する罫線特徴を抽出する。次に、抽出した罫線特徴のうち、例えば、罫線の長さが閾値よりも短いものをノイズとして除去する。また、追記帳票と称されている、被登録帳票画像データに手書きで押印欄等が追加された帳票にも対応可能にするために、そのような追記帳票も読み込んで、指定された追記部分を許容差分量として罫線特徴と共に登録する。一方、識別モードでの動作では、まず、被識別帳票画像データを読み込み、登録時と同様の方法で罫線特徴の抽出、ノイズ除去を行う。そして、全ての登録帳票フォーマットに対して罫線特徴のマッチングを行い、このマッチングにおいて、罫線特徴量の差異が許容差分量より小さいフォーマットを、対応した帳票として出力する。なお、特徴量の差異が全ての登録帳票フォーマットに対して許容差分量より大きい場合には、マッチング失敗として出力する。以下の説明では、この技術を「第三の技術」と称することとする。
特開2000−152009号公報 特開平10−40312号公報 特開2006−201965号公報
前述した第一の技術では、記入済み帳票画像と未記入の帳票画像との差分画像のデータを保存するようにしている。しかし、記入済み帳票画像の読み取りを、イメージスキャナ等の読取装置を用いて行うと、この読取装置自身で発生するノイズも記入データとして扱ってしまうこととなり、保存する差分画像のデータ量を増加させる要因となる。また、読取装置自身によるノイズの発生には個体差があり、取得画像上におけるノイズの位置や大きさは、個々の読取装置によって区々である。
ここで、例えば、読み取り装置ごとに未記入帳票画像を用意すれば、この差分画像のデータ量の増加は防ぐことができるが、このようにするには、多数の未記入帳票画像のデータを予め用意しておく必要が生じ、これらのデータの保存量が増加してしまう。
また、帳票画像データの証跡情報としての管理では、読み取った帳票画像データに対して書き換え等の変更が行われていないことを明確にしたいという要望がある。ところが、前述したような、読取装置自身での発生ノイズを除去するための処理を帳票画像データに対して施すと、帳票画像データに対する変更がなされていないことを照明することが難しくなってしまう。
一方、前述した第二の技術は、あくまでも未記入帳票を生成するための技術に過ぎないため、記入後帳票画像の保存データ量を減らすことは出来ない。また、前述のようにして第二の技術を用いて未記入の帳票画像の作成精度の向上を試みても、読み取りによる差分以外の記入情報も除去してしまうことがあるため、読み取りによる差分の除去はできない。
また、前述した第三の技術は、データ量を減らすことはできない。また、この第三の技術でノイズ除去に用いている罫線特徴は、罫線以外の情報を除去するために用いられているものであるから、文字情報も除去してしまうため、読み取りによる差分のみを除去することはできない。
したがって、帳票画像管理システムであって、証跡情報として利用される帳票画像データの保管のためのデータ量を削減するシステムが望まれている。
本明細書で後述する帳票画像管理システムに、マスタ画像格納部と、帳票画像取得部と、高相関マスタ画像検索部と、共通差分生成部と、共通差分データ格納部と、差分データ生成部と、差分データ格納部と、を備えているというものがある。ここで、マスタ画像格納部は、複数種類のマスタ画像を格納しておく。帳票画像取得部は、帳票画像を取得する。高相関マスタ画像検索部は、その複数種類のマスタ画像のうちで帳票画像取得部が取得した帳票の画像との相関が最も高いものを、マスタ画像格納部から検索する。共通差分生成部は、その複数の帳票画像間の差分と、検索されたマスタ画像と複数の帳票画像のうちの1つとの差分との間で共通して存在している共通差分部分を表している画像のデータを共通差分データとして生成する。共通差分データ格納部は、その共通差分データを格納する。差分データ生成部は、帳票画像取得部が取得したそれぞれの帳票画像についての、検索されたマスタ画像に共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成する。差分データ格納部は、差分データ生成部が生成した差分データを格納する。
また、本明細書で後述する帳票画像管理方法のひとつは、まず、帳票の画像を取得する。次に、複数種類のマスタ画像から、取得した帳票の画像との相関が最も高いマスタ画像を検索する。次に、その複数の帳票画像間の差分と、検索されたマスタ画像と複数の帳票画像のうちの1つとの差分との間で共通して存在している共通差分部分を表している画像のデータを共通差分データとして生成して共通差分データ格納部に格納する。そして、複数の帳票画像の各々についての、検索されたマスタ画像に共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成して差分データ格納部に格納する。
また、本明細書で後述するプログラムのひとつは、以下の処理をコンピュータに実行させる。この処理は、まず、帳票の画像を取得する。次に、複数種類のマスタ画像から、取得した帳票の画像との相関が最も高いマスタ画像を検索する。次に、その複数の帳票画像間の差分と、検索されたマスタ画像と複数の帳票画像のうちの1つとの差分との間で共通して存在している共通差分部分を表している画像のデータを共通差分データとして生成して共通差分データ格納部に格納する。そして、複数の帳票画像の各々についての、検索されたマスタ画像に共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成して差分データ格納部に格納する。
本明細書で後述する帳票画像管理システムは、証跡情報として利用される帳票画像データの保管のためのデータ量が削減されるという効果を奏する。
帳票画像管理システムの一実施例の機能ブロック図である。 共通差分データの生成の方法を説明するための図である。 差分データの生成の方法を説明するための図である。 差分データ格納部での差分データの管理の様子を表した模式図である。 図1の帳票管理システムの実装例である。 帳票画像管理システムに使用可能なコンピュータの一例の構成図である。 読み取り差分の説明図である。 帳票画像圧縮処理の第一の例の処理内容を図解したフローチャートである。 共通差分データ生成処理の処理内容を図解したフローチャートである。 圧縮効率を考慮した帳票画像圧縮処理の第二の例の処理内容を図解したフローチャートである。
以下の説明では図面を適宜参照するが、図中で類似の部分または類似の機能を果たす部分については、同一または類似の参照符号を付与して重複した説明を省略する。
まず、「帳票」の語の意味について定義する。帳票とは、一般的には、各種の事務処理・会計処理のために使用される帳簿や伝票の総称を意味する。但し、本願では、帳票とは、上述した一般的な意味だけではなく、各種試験に用いる答案用紙や、選挙に用いる投票用紙などといった、所定の様式の画像が予め印刷されており、手書き、押印、印刷等によって情報が追加される用紙一般を意味するものとする。
また、以下では「情報を送る」というフレーズを用いることがある。以下では信号を用いて情報の遣り取りを行うことを想定するので、「情報を送る」というフレーズは、より詳細には「情報を含む信号を送る」ことを意味する。情報の伝達のために用いられる信号は電気信号には限定されず、光などであってもよい。
<システムの全般的説明>
図1は、帳票画像管理システム1の一実施例の機能ブロック図である。
この帳票画像管理システム1は、マスタ画像格納部10、帳票画像取得部11、高相関マスタ画像検索部12、共通差分データ生成部13、共通差分データ格納部14、差分データ生成部15、及び差分データ格納部20を備えている。これらは組み合わさって、帳票画像取得部11で取得した帳票画像に関する情報を、マスタ画像、共通差分データ、および差分データに分割することによって、帳票画像を保管するためのデータ量を削減する。
マスタ画像格納部10は、複数種類のマスタ画像を格納する。なお、本実施形態において、マスタ画像は、手書き、押印、印刷等によって情報が追加される前の、所定の様式の画像が予め印刷されている帳票の画像である。後述のマスタ画像400aは、そのようなマスタ画像の一例である。
帳票画像取得部11は、手書き、押印、印刷等によって情報が追加された後の帳票の画像を、イメージスキャナ装置等の画像読取装置から取得する。後述の記入後帳票画像データ500aは、そのような帳票の画像データの一例である。記入後帳票画像データ500aでは、マスタ画像400aの所定の位置に、手書きで住所、氏名、金額等のデータが書き込まれている。これらのデータは手書きである必要はないが、書き込まれる位置は決められていることが多い。
高相関マスタ画像検索部12は、マスタ画像格納部10に格納されている複数種類のマスタ画像のうちで、帳票画像取得部11が取得した帳票の画像との相関が最も高いマスタ画像を、マスタ画像格納部10から検索する。
共通差分データ生成部13は、帳票画像取得部11で取得された帳票画像の間で共通している画像領域部分である共通差分を表している画像データである共通差分データを生成する。なお、この共通差分データは、読取装置自身が発生させるノイズ成分を含んでいる。
共通差分データ生成部13によって行われる共通差分データの生成の方法について図2を参照しながら説明する。
図2には、マスタ画像400aと、記入後帳票画像データ500a、500b、…、500nとが示されている。
前述の共通差分を得るために、まず、記入後帳票画像データ500a、500b、…、500nが互いに比較されて、それらの間で共通している画像領域部分を除いた画像を表している記入後帳票差分データ600aが生成される。なお、図2においては、記入後帳票差分データ600aにおける網掛けが付された部分が、この差分として残されている領域を表現している。
この記入後帳票差分データ600aは、記入によって追加された情報は含まれているが、帳票の罫線と、帳票画像取得部11自身が発生させたノイズとは含まれていないこのノイズは、帳票画像取得部11毎に特有のものであるため、記入後帳票画像データ500a、500b、…、500nを全て同一の帳票画像取得部11で取得したものである場合には、記入後帳票画像データ500a、500b、…、500nの全てに共通に含まれている。従って、このノイズは、記入後帳票画像データ500a、500b、…、500nを比較しても罫線などの帳票のフォーマットと区別が付かない。このために、このノイズは、記入後帳票共通データ600aには含まれない。
次に、記入後帳票画像データの一つ500aと、マスタ画像格納部10に格納されているマスタ画像400aとを比較し、それらの間で共通している画像領域部分を除いた画像を表しているマスタ画像差分データ420aを生成する。なお、図2においては、マスタ画像差分データ420aにおける網掛けが付された部分が、この差分として残されている領域を表現している。
このマスタ画像差分データ420aは、帳票の罫線は含まれないが、記入によって追加された情報及び前述のノイズは含まれている。そして、マスタ画像差分データ420aと記入後帳票差分データ600aとを比較して、この両者に共通して含まれているデータを、共通差分データ700aとして得る。なお、図2においては、共通差分データ700aにおける網掛けが付された部分が、この差分として残されている領域を表現している。
この共通差分データ700aには、前述した帳票画像取得部11自身が発生させたノイズが含まれているのみならず、帳票のフォーマットの変更箇所も含まれている。ここで、帳票のフォーマットの変更箇所とは、例えば図2の場合には、帳票のバージョンを示す箇所である。すなわち、図2の場合において、マスタ画像400aは「2011年01版」であり、記入後帳票共通データ600aでは「2009年12版」であるので、帳票のフォーマットの変更箇所は、「09」と「12」との箇所が該当する。
共通差分データ格納部14は、共通差分データ生成部13によって以上のようにして生成された共通差分データ700aを保存する。
差分データ生成部15は、帳票画像取得部11が取得した帳票の画像についての、高相関マスタ画像検索部12が検索したマスタ画像に対する差分データを生成する画像処理を行う。
共通差分データ生成部13が生成した共通差分データ700aを用いて差分データ生成部15が行う差分データの生成の方法について、図3を参照しながら説明する。
図3には、マスタ画像400a、図2の共通差分データ700aで表されている画像をマスタ画像400aに重畳した画像440a、および記入後帳票画像データ500a、500b、…、500nが示されている。
差分データは、マスタ画像400aに共通差分データ700aで表されている画像を重畳した画像440aと、前述の記入後帳票画像データ500a、500b、…、500nとの間の差分を求めることで生成される。このようにして生成された差分データは、帳票のフォーマットの変更箇所を含まず、また、帳票画像取得部11に特有のノイズも含まない。なお、ここで、この差分データのみを圧縮、保存することによって、そのデータ量が更に削減される。
差分データを使った画像の圧縮手法としては、例えば動画像符号化の手法を用いる。すなわち、最初のマスタ画像をIピクチャ(Intra Picture)(過去の画像を参照しない)で符号化し、次のマスタ画像に共通差分を重畳した画像をPピクチャ(Predictive Picture)(Iピクチャを参照するピクチャ)とし、個別の記入後帳票の画像を、そのPピクチャを参照するPピクチャとして圧縮する。このように、2段階の参照構造を持たせることで、帳票画像取得部11に特有の共通差分は、最初のPピクチャのみに押し込められる結果、冗長な共通差分情報の繰り返しの符号化が回避すされる。
上記では、共通差分データの段階を1段階だけ設けた例を示したが、共通差分情報を2段階以上設けてもよい。例えば、帳票画像を読み取る際に、マスタ画像と帳票のバージョンが異なる帳票を使用している場合には、帳票のバージョンが違うことによる差分が常に発生する。その差分を第一共通差分とし、さらに読み取り装置によって発生する差分を第二共通差分とすれば、帳票のバージョンによる差分と、読み取り装置によって発生する差分との2つを共通化でき、共通差分情報を2段階設けることになる。
また、差分データ生成部15は、データ圧縮処理の後、圧縮効率が低下したかどうかを判断する機能を有していてもよい。この機能を備えることによって、圧縮効率が低下した場合には共通差分データを更新するような構成とすることができる。
差分データ格納部20は、高画像マスタ画像探索部12で探索されたマスタ画像および差分データ生成部15で生成された差分データを格納する。
差分データ格納部20では、マスタ画像格納部10に格納されている複数種類のマスタ画像から、高相関マスタ画像検索部12が検索したマスタ画像を特定する識別情報と、差分データ生成部15が生成した差分データとが対応付けて格納されている。この様子を図4に示す。
図4では、支店毎に帳票画像取得部11が異なる場合が示されている。この場合、マスタ画像400aに対して、複数の帳票画像取得部11に対する共通差分700a、700b、…が関連付けられている。さらに、共通差分700a、700b、…のそれぞれに対して、ある支店の帳票画像取得部11に対する差分データ800a、800b、…が関連付けられている。
なお、マスタ画像格納部110に格納されたマスタ画像の画像データは、例えば、各画像データを個々に識別する識別情報であるID(Identification Data)情報を用いることで個々に識別可能である。なお、このID情報として、例えば、マスタ画像の画像データファイルのファイル名や、当該ファイル名と関連付けされているインデックス情報が利用可能である。
上述のように、帳票画像管理システムでは、予め用意されている複数種類のマスタ画像400a、400b、…、400mから、帳票画像取得部11が取得した帳票の画像の相関が最高であるマスタ画像が選択される。そして、その帳票の画像についての、選択されたマスタ画像に対する差分データ800が生成されて差分データ格納部20に格納されて保管される。つまり、この帳票画像管理システム1では、差分データ800の生成対象として、保管対象である帳票の画像との相関が高いマスタ画像400a、400b、…、400mが選択され、マスタ画像400a、400b、…、400mに対して相違する部分だけが差分データ800として抽出されるので、記録、保管すべきデータ量が少なくなる。
なお、この帳票画像管理システム1において、差分データ生成部15が、帳票画像取得部11により取得された帳票の画像に基づいて、高相関マスタ画像検索部12により検索されたマスタ画像に基づく動き補償フレーム間予測を行うようにしてもよい。この場合には、差分データ生成部15は、差分データとして、帳票画像取得部11が取得した帳票の画像についての、高相関マスタ画像検索部12が検索したマスタ画像400a、400b、…、400mに対する、動きベクトルの情報と動き補償フレーム間予測誤差の情報とを生成するようにする。この場合には、前述したような、帳票画像取得部11が取得した帳票の画像とマスタ画像400a、400b、…、400mとの位置合わせを行わなくても、生成される差分データのデータ量が少なくなる。具体的な処理としては、前記両画像をブロック単位(画像の処理単位である、4×4画素単位,8×8画素単位あるいは16×16画素単位等の所定のブロック単位)に処理を行う。
また、この帳票画像管理システムにおいて、差分データ生成部15が、更に、生成した差分データに対してデータ圧縮処理を施すようにしてもよい。なお、この場合には、差分データ格納部20は、差分データ生成部15によってデータ圧縮処理が施された差分データを格納するようにする。
なお、図1の帳票画像管理システム1に、マスタ画像をマスタ画像格納部10に新たに格納するマスタ画像新規格納部を更に備えてもよい。マスタ画像新規格納部は、例えば、帳票画像取得部11が取得した帳票の画像のうちで、その帳票の画像について差分データ生成部15が生成した差分データのデータ量が所定閾値以上のものを、マスタ画像として、マスタ画像格納部10に新たに格納する。
なお、このようにする場合において、マスタ画像新規格納部が新たなマスタ画像をマスタ画像格納部10へ格納した場合には、差分データ生成部15は、帳票画像取得部11が取得した帳票の画像についての、新たなマスタ画像に対する差分データを生成する。また、この場合には、差分データ格納部20は、マスタ画像格納部10に格納されている複数種類のマスタ画像から新たなマスタ画像を特定する識別情報と、差分データ生成部15が生成した該新たなマスタ画像に対する差分データとを対応付けて格納する。
ところで、上記の共通差分データ生成部13及び差分データ生成部15で用いられる画像間の差分を求める方法として、ベクトル探索の技術を用いてもよい。
ベクトル探索は、動画像圧縮のフレーム間予測の主要技術である動き補償に使用され、参照画像から注目画像までの動き量の推定を行う技術である。本実施例では、参照画像(マスタ画像や注目画像以外の記入後帳票)と記入帳票(注目画像)とを動画像中の2フレームと見立ててベクトル探索を行う。動き探索は例えば16×16画像単位の矩形(マクロブロック)単位で行われ、現在処理中の画像に対し、参照画像上の所定の範囲を探索して、一番似ている画像位置ベクトルの決定を行う。なお、“一番似ている画像位置”の判断方法としては、例えば、SAD(画素間差分絶対値和)を用いる方法が知られている。このSADが小さければ、マスタ画像と非常に似ていることになり、動画像圧縮を利用した帳票画像圧縮では、圧縮効率が高くなる。一方、参照画像に含まれない画像(記入部分やノイズなど)を含むマクロブロックでベクトル探索を行った場合には、似た画像が参照画像上に無く、ベクトル探索で求められる最適位置のSAD値は非常に大きくなる。すなわち、SAD値の大小を見ることで、“一番似ている画像位置”の判断を行うことができる。
なお、ベクトル探索にSADを用いる代わりに、参照画像との相関を求める他の手法を用いてもよい。
ところで、図1に示されているように、帳票画像管理システム1は、差分データ読出部31、特定マスタ画像読出部32、特定共通差分データ読出部33、および帳票画像復元部34を更に備えてもよい。これらは、組み合わされて、差分データ格納部20に格納されたデータからの元の帳票の画像の復元を行う。
差分データ読出部31は、前述した差分データと識別情報とが対応付けられて格納されている差分データ格納部20から、差分データと、その差分データに対応付けられている識別情報とを読み出す。
特定マスタ画像読出部32は、差分データ読出部31が読み出した識別情報により特定されるマスタ画像を、マスタ画像格納部10から読み出す。
特定共通差分データ読出部33は、差分データ読出部31が読み出した差分データの生成に使用した共通差分データを、共通差分データ格納部14から読み出す。
帳票画像復元部34は、差分データ読出部31が読み出した差分データと、特定共通差分データ読出部33が読み出した共通差分データと、特定マスタ画像読出部32が読み出したマスタ画像とから、帳票の画像を復元する画像処理を行う。
例えば、差分データ生成部15が、前述のように動き補償フレーム間予測を行って、差分データとして、動きベクトルの情報と動き補償フレーム間予測誤差の情報とを生成していた場合には、帳票画像復元部34は、以下の動作を行う。
すなわち、この場合、帳票画像復元部34は、まず、特定マスタ画像読出部32が読み出したマスタ画像と、特定共通差分データ読出部33が読み出した共通差分データと、差分データに含まれている動きベクトルの情報とを用いて予測画像を生成する。次に、生成された予測画像に対し、差分データに含まれている動き補償フレーム間予測誤差の情報を用いて予測誤差分の加算を行う。すると、帳票画像取得部11が取得していた帳票の画像が復元される。
なお、図1には示されていないが、帳票画像復元部34には表示部が接続されていてもよい。表示部は、帳票画像復元部34で復元された帳票を、システム1の利用者向けに表示をする。
<帳票画像管理システムの実装例>
図5は、図1の帳票管理システム1の実装例である。
図5に示されているように、帳票管理システム1の各部は、支店A、データセンター、および支店Cに分けて配置される。
支店Aは、記入後帳票51をスキャンして記入後帳票51に関する情報を取得するためのスキャナ50、スキャナ50で取得された記入後帳票51に関する情報の符号化処置を行う認識・点検端末装置100、認識・点検端末装置100で生成されたデータを格納するAEサーバ120を含んでいる。
データセンターは、マスタ画像、共通差分データ、および差分データ等のデータを格納するためのストレージ装置200、登録用サーバ220、および検索用サーバ240を含んでいる。登録用サーバ220、および検索用サーバ240はストレージ装置200に接続されている。登録用サーバ220は、支店Aのサーバ120に接続されており、認識・点検端末装置100で生成されたデータをストレージ装置200に転送し記憶させる。検索用サーバ240は、外部からの要求に応じて、ストレージ装置200に格納されているデータの検索を行う。また、検索用サーバ240は、ストレージ装置200格納されているマスタ画像、共通差分データ、および差分データを用いてもとの記入後帳票51を復号化する復号化処理を行う。
支店Cは、検索・表示端末装置300を含んでいる。検索・表示端末装置300は、検索・表示端末装置300の利用者からの入力をデータサーバに送り、その応答としてデータセンターの検索用サーバ240から送られてきた復号化されたデータを、利用者に表示をする。
スキャナ50はマスタ画像格納部10を構成する。
サーバ120は、高相関マスタ画像検索部12、共通差分データ生成部13、差分データ生成部15を構成する。
ストレージ装置200は、図1のマスタ画像格納部10、共通差分データ格納部14および差分データ格納部20の機能を有しており、マスタ画像61、共通差分データ71および差分データ72を格納している。
検索用サーバ240は、差分データ読出部31、特定マスタ画像読出部32、特定共通差分データ読出部33、および帳票画像復元部34を構成する。
スキャナ50によって取り込まれた記入後帳票51は、認識・点検端末装置100で、データセンターのストレージ装置200に格納されているマスタ画像群のひとつであるマスタ画像61と比較されて、共通差分データ71及び差分データ72が生成される。認識・点検端末装置100で生成された共通差分データ71及び差分データ72は、サーバ120を介して、登録用サーバ220に送られる。登録用サーバ220に送られた共通差分データ71及び差分データ72はそれぞれ、ストレージ装置200の共通差分データ群及び差分データ群の一要素として格納される。
支店Cの検索・表示端末装置300は、所定の帳票の表示を要求する入力を受けると、データセンターの検索用サーバ240にその要求を送る。検索用サーバ240は、ストレージ装置200から該当するマスタ画像61、共通差分データ71及び差分データ72を読み出して復号化処理を行い、支店Cの検索・表示端末装置300に送る。
<コンピュータの構成>
図6は、図1の帳票管理システム1に使用可能なコンピュータの一例の構成図である。
このコンピュータ80は、MPU81、ROM82、RAM83、ハードディスク装置84、入力装置85、表示装置86、インタフェース装置87、及び記録媒体駆動装置88を備えている。なお、これらの構成要素はバスライン89を介して接続されており、MPU81の管理の下で各種のデータを相互に授受することができる。
MPU(Micro Processing Unit)81は、このコンピュータ80全体の動作を制御する演算処理装置であり、コンピュータ80の制御処理部として機能する。
ROM(Read Only Memory)82は、所定の基本制御プログラムが予め記録されている読み出し専用半導体メモリである。MPU81は、この基本制御プログラムをコンピュータ80の起動時に読み出して実行することにより、このコンピュータ80の各構成要素の動作制御が可能になる。
RAM(Random Access Memory)83は、MPU81が各種の制御プログラムを実行する際に、必要に応じて作業用記憶領域として使用する、随時書き込み読み出し可能な半導体メモリである。
ハードディスク装置84は、MPU81によって実行される各種の制御プログラムや各種のデータを記憶しておく記憶装置である。MPU81は、ハードディスク装置84に記憶されている所定の制御プログラムを読み出して実行することにより、後述する各種の制御処理を行えるようになる。例えば、このコンピュータ80を図5のストレージ装置200として使用する場合には、このハードディスク装置84が、マスタ画像格納部10、共通差分データ格納部14、差分データ格納部20として利用される。
入力装置85は、例えばマウス装置やキーボード装置であり、図5の認識・点検端末装置100または検索・表示端末装置300の利用者により操作されると、その操作内容に対応付けられている各種情報の入力を取得し、取得した入力情報をMPU81に送付する。
表示装置86は、例えば液晶ディスプレイであり、MPU81から送付される表示データに応じて各種のテキストや画像を表示する。例えば、このコンピュータ80を図5の認識・点検端末装置100または検索・表示端末装置300として使用する場合には、帳票画像復元部34により復元された表示画像データで表される、スキャナ50が読み取った帳票の復元画像の表示を行う。
インタフェース装置87は、このコンピュータ80に接続される各種機器との間での各種情報の授受の管理を行う。より具体的には、インタフェース装置87は、例えば、図5のスキャナ50、認識・点検端末装置100、サーバ120、登録用サーバ220、ストレージ装置200、検索用サーバ240、検索・表示端末装置300の間で通信ネットワークを介して行われる、マスタ画像61、共通差分データ71、差分データ72等の各種のデータの授受の管理を行う。また、このコンピュータ80を図6のサーバ120として使用する場合には、スキャナ装置50から出力されるスキャンデータを受け取ってMPU81に送付する。
記録媒体駆動装置88は、可搬型記録媒体90に記録されている各種の制御プログラムやデータの読み出しを行う装置である。MPU81は、可搬型記録媒体90に記録されている所定の制御プログラムを、記録媒体駆動装置88を介して読み出して実行することによって、後述する各種の制御処理を行うようにすることもできる。なお、可搬型記録媒体90としては、例えばUSB(Universal Serial Bus)規格のコネクタが備えられているフラッシュメモリ、CD−ROM(Compact Disc Read Only Memory)、DVD−ROM(Digital Versatile Disc Read Only Memory)などがある。
このようなコンピュータ80を用いて認識・点検端末装置100、AEサーバ120、登録用サーバ220、ストレージ装置200、検索用サーバ240、および検索・表示端末装置300の各々を構成するには、例えば、後述する各種の制御処理をMPU81に行わせるための制御プログラムを作成する。作成された制御プログラムはハードディスク装置84若しくは可搬型記録媒体90に予め格納しておく。そして、MPU81に所定の指示を与えてこの制御プログラムを読み出させて実行させる。こうすることで、認識・点検端末装置100、サーバ120、登録用サーバ220、ストレージ装置200、検索用サーバ240、および検索・表示端末装置300が各々備えている機能がMPU81により提供される。従って、このコンピュータ80が認識・点検端末装置100、サーバ120、登録用サーバ220、ストレージ装置200、検索用サーバ240、検索・表示端末装置300として機能するようになる。
<システムに必要な保存データ量の比較>
以下では、帳票画像管理システム1の効果を、幾つかの比較例を用いて説明する。
まず、背景技術として前述した第一の技術を用いた場合にシステムに必要となる保存データ量について検討する。
まず、システムで扱うマスタ画像枚数をNm[枚]、システムを利用する店舗数をNb[店]、店舗内に設置してあるイメージスキャナ台数をNs[台]、システム全体で扱う記入後帳票の枚数をNi[枚]とする。また、マスタ画像の平均データ量をSm1[bit/枚]、マスタ画像と記入後帳票画像との差分量の平均をSi[bit/枚]、読み取りによって発生する差分量の平均をSb[bit/枚]とする。
このとき、システムに必要な保存データ量S1[bit]は次式で表される。
上記の[数1]式ではSi中に読み取り差分の平均値であるSb[bit]が含まれ、常にSb×Niの差分が差分データとして保存されることになる。また、読取装置ごとに未記入帳票の画像を用意する場合における、システムに必要な保存データ量S2[bit]は下記の[数2]式で表される。
ここでSm2[bit/(店×台×枚)]は、マスタ画像の平均データ量である。ここではマスタ画像枚数を読取装置ごとに用意するため、この平均データ量は、店舗数×スキャナ台数×マスタ画像枚数分のマスタ画像の平均を取ったものとする。また、Sp[bit/枚]は、読み取り装置による差分が発生しない場合のマスタ画像と記入後帳票との差分量の平均である。
上記[数1]式と[数2]式とから、(Si−Sp)×Ni>Nm×(Sm2×Nb×Ns−Sm1)の場合には、S1>S2となる。これは、読み取り装置ごとにマスタ画像を用意することによって増加するデータ数よりも、読み取りによって発生するマスタ画像との差分量の合計が多くなるときS1>S2になることを示している。ここで、Sm1とSm2、Sp、Siは平均値であるため変化が小さいと考えられる。従って、NmやNb、Nsが一定であるとすれば、記入後帳票の枚数Niが増加すするほど、S2はS1よりデータ量が減少することになる。帳票画像を扱うシステムでは、膨大な帳票画像を扱うため、読取装置ごとにマスタ画像を用意する方がデータ量は少なくなる。但し、このようにする場合には、Nb×Ns枚のマスタ画像が必要になる。
ここで、この[数1]式及び[数2]式の各パラメータに対して、下記の[表1]の設定値を与える。
上記の[表1]について説明する。
Nm[枚]は、全体で1つ持っている共通のマスタの数である。
Nb[店]は、システムを利用する店舗数である。
Ns[台]は、各店舗内に設置されたスキャナ台数である。
Ni[枚]は、システム全体で扱う帳票数である。
Sm1[bit/枚]は、システム全体で1つのマスタ画像を持つ場合のマスタ画像1枚の平均データサイズである。
Sm2[bit/(店×台×枚)]は、スキャナごとに個別でマスタ画像を持つ場合のマスタ画像1枚の平均データサイズである。
Sb[bit]は、マスタ画像と別のスキャナで読み取ったマスタ画像との差分である。
Sp[bit]は、スキャナの違いを加味して差分を取った場合の情報量である。
Si[bit]は、スキャナの違いを加味せず差分を取った場合の情報量である。
下記の[表2]は、[数1]式及び[数2]式の各パラメータに対して[表1]の設定値を与えたときの、システムに必要な保存データ量を表したものである。
[表2]において、S1は、同一フォーマットの帳票についてシステム全体で1つのマスタ画像を持ち、マスタ画像と記入済み帳票との差分を求める方式である。また、S2は、スキャナごとにマスタ画像を持ち、マスタ画像と記入済み帳票との差分を求める方式である。
なお、[表1]におけるマスタ画像枚数Nm[枚]、店舗数Nb[店]、スキャナ台数Ns[台]、記入後帳票枚数Ni[枚]の各設定値は、システムが銀行で利用されることを想定し、調査した値である。また、読み取りによって発生する差分量の平均Sb[bit/枚]、マスタ画像と記入後帳票との差分量Si[bit/枚]、読み取り装置による差分が発生しない場合のマスタ画像と記入後帳票との差分量Sp[bit/枚]の各設定値は、帳票画像を読み取って算出した値である。なお、マスタ画像の平均データ量Sm1[bit/枚]、Sm2[bit/(店×台×枚)]については、同じとして算出している。データ量S1、S2は、単位をbitからGbyteに変換して表記している。
次に、図1の帳票画像管理システム1において、システム実現に必要な保存データ量について検討する。
帳票画像管理システム1では、共通差分データを用いることにより、読取装置ごとに発生する差分を、共通差分データとしてまとめることで、差分データ量の増加を削減する。また、マスタ画像は、読取装置ごとに複数保存しておく必要が無い。マスタ画像と共通差分データと差分データとは対応付けを行い、帳票画像を復元する場合には、差分データを生成したときに使用したマスタ画像と共通差分データを使用して復元を行う。
ここで、帳票画像管理システム1において、システムに必要な保存データ量の算出を試みる。
帳票画像管理システム1で扱うマスタ画像枚数をNm[枚]、システムを利用する店舗数をNb[店]、店舗内に設置してあるイメージスキャナ台数をNs[台]、システム全体で扱う記入後帳票の枚数をNi[枚]とする。また、マスタ画像の平均データ量をSm1[bit/枚]、マスタ画像と記入後帳票画像との差分量の平均をSi[bit/枚]、読み取りによって発生する共通差分量の平均をSb[bit/枚]、読み取る装置ごとに取得する未記入帳票と記入後帳票との差分量の平均をSp[bit/枚]とすると、システムに必要な保存データ量S3[bit]は次式で表される。
この[数3]式のS3を、[数2]式のS2と比較すると、
となり、Nm×(Sm2×Nb×Ns−Sm1)−Sb×Nm×Nb×Ns>0の場合には、S2>S3となる。これは、読取装置ごとにマスタ画像を用意することで増加するデータ量が、読取装置ごとに発生する差分量よりも大きい場合には、S2>S3となることを示している。ここで、Sbは読取装置ごとに発生する差分量であるため、マスタ画像のデータ量よりも小さい。従って、マスタ画像数Nmやシステムを利用する店舗数Nb、及び、店舗内に設置してあるイメージスキャナ台数Nsが多ければ、S2>S3となるといえる。
ここで、[数1]式のS1と、[数3]式のS3とを比較すると、
となり、Ni×(Si−Sp)−Sb×Nm×Nb×Ns>0となればS3のデータ量が小さくなる。つまり、読み取りによって発生する差分量の合計が共通差分データよりも大きくなるときには、S1>S3となる。ここで、Niが十分大きければS1よりもS3のデータ量が小さくなる。帳票画像を扱う場合には記入後帳票Niは膨大な数となるので、システムに必要なデータ量は削減される。
ここで、[表1]のパラメータを[数3]式に与えたときのシステムに必要とされる保存データ量の算出結果と、前掲した[表2]とをまとめたものを、[表3]に示す。
S3は、図1の帳票画像管理システム1の方式、すなわち、同一フォーマットの帳票についてシステム全体で1つのマスタ画像を持ち、スキャナ等の違いによる差分を共通化して、マスタ画像と記入済み帳票との差分を求める方式である。
なお、データ量S3は、[表2]のS1、S2と同様にGbyteで表記している。このように、[表1]のパラメータを与えると図1の帳票画像管理システム1の方が従来技術よりもデータ量が小さくなることが分る。
なお、[表1]のパラメータは、運用シーンによって変化することが考えられる。そこで、各パラメータを変化させた場合における、図1の帳票画像管理システム1の方式([数3]式のS3)と前述した従来方式([数1]式のS1、[数2]式のS2)との差分量の変化量を表4に示す。
ここで、Sm2を変化させてS2とS3とを比較する場合には、Sm1とSm2とが異なりマスタ画像1枚あたりのデータ量が違うことなるため、Sm1=Sm2=Smとして算出している。また、図1の帳票画像管理システム1の方式では、読み取りによって差分が発生する場合について考えているため、Si−Sp>0且つSb≠0とする。
[表4]を参照すると、「S1−S3」は、マスタ画像Nmや店舗数Nb、スキャナ台数Nsの増加に伴って減少し、扱う帳票枚数Niが増加する場合に増加することが分かる。ここで、Nm、Nb、Nsが増加すると、Niが大きく増加することが考えられる。従って、図1の帳票画像管理システム1の方式は多くの帳票を扱うシステムで従来方式のS1よりも圧縮効果が高くなる。
また、「S2−S3」は、マスタ画像のデータ量Smに対する読み取りによって発生する共通差分量Sbの量が小さい程増加し、逆に大きくなると減少することが分かる。図1の帳票画像管理システム1の方式は共通差分量Sbの量が小さいほど従来方式のS2に比べて圧縮効率が高くなる。また、マスタ画像のデータ量よりも共通差分量の方が大きくなることは考えにくいため、S2よりも常に圧縮効率が高くなる。
以上のように、本実施例の帳票画像管理システム1は、読み取りによって発生する差分を考慮しない従来方式(S1の方式)に比べて、必要な保存データ量が70.8%で済む。また、本実施例の帳票画像管理システム1は、読み取りによって差分が発生しないようにマスタ画像をイメージスキャナごとに持つ従来方式(S2の方式)と比較しても、必要な保存データ量が95.7%で済む。従って、本実施例の帳票画像管理システム1は、記憶装置の容量を減らすことができる。また、本実施例の帳票画像管理システム1は、保存した帳票データをネットワークで伝送する際には、より短時間で伝送を完了させることができる。
なお、参考までに、[表1]に示した各設定値を[数5]式に代入して得られる、図1の帳票管理システム1による、システムに必要とされる保存データ量の従来方式に対する削減量S1−S3は、−2193.367[Gbyte]となる。また、[表1]に示した各設定値を[数4]式に代入して得られる、図1の帳票管理システム1による、システムに必要とされる保存データ量の従来方式に対する削減量S2−S3は、−235.616[Gbyte]となる。
<処理の流れ>
次に、図8、図9、及び図10を参照して、帳票画像管理システム1において行われる処理の流れを説明する。 図8は、帳票画像管理システム1において行われる帳票画像圧縮処理の第一の例の処理内容を図解したフローチャートである。
まず、S101で、記入後帳票画像を取得する処理を帳票画像取得部11が行う。
次にS102で、マスタ画像を検索する処理を高相関マスタ画像検索部12が行う。前述したように、高相関マスタ画像検索部12は、マスタ画像格納部10に格納されている複数種類のマスタ画像のうちで、帳票画像取得部11が取得した帳票の画像との相関が最も高いマスタ画像を、マスタ画像格納部10から検索する。
S103では、帳票画像取得部11により取得された記入後帳票画像についての共通差分データが既に求められているか判断する処理を共通差分データ生成部13が行う。ここで、共通差分データ生成部13は、取得した記入後帳票と同じフォーマットを持った帳票画像を以前に圧縮したことがあると判定した場合、すなわちS103の判断の結果がYesであると判定した場合、S104に処理を進める。一方、共通差分データ生成部13は、既に取得した記入後帳票と同じフォーマットを持った帳票画像を圧縮したことがないと判定した場合、すなわちS103の判断の結果がNoであると判定した場合、S106に処理を進める。
S104では、共通差分データを更新するかを判断する処理を共通差分データ生成部13が行う。
帳票画像取得部11により取得された記入後帳票画像についての共通差分データが既に存在していれば、新たに共通差分データを生成する必要はない。しかし、既に共通差分データが存在していても、装置に付いた汚れや、ごみ等の影響により共通差分データが変化する可能性がある。そこで、S104の処理によって、共通差分データを更新するかの判断が行われる。
共通差分データ生成部13は、S104での判断の結果がNoであると判定した場合、すなわち共通差分データを更新しないと判定した場合は、既に生成している共通差分データを使用すると決定し、S105に処理を進める。一方、共通差分データ生成部13は、S104での判断の結果がYesであると判定した場合、すなわち既に生成した共通差分データが無いと判定した場合、あるいは、共通差分データを更新すると判定した場合は、S106に処理を進める。なお、このS104の判定処理では、定期的に共通差分データを更新するために、一定の周知で定期的に判定結果をYesとしてもよい。この場合、例えば、年度の変わり目等に合わせて、1年毎に更新すること等が考えられる。
S105では、S104で使用すると決定した共通差分データを検索する処理を差分データ生成部15が行う。そして、S107に処理を進める。
一方、S106では、共通差分データの生成する処理を共通差分データ生成部13が行う。S106の処理の詳細について、図9を用いて説明する。
図9は、共通差分データ生成処理の処理内容を図解したフローチャートである。このフローチャートは、図2を用いて説明した共通差分データの生成の方法に従うものである。
共通差分データは同一フォーマットであって、マスタ画像との相関が高い複数枚の記入後帳票画像データを使用して生成される。
まず、S201で、記入後帳票画像データ間の差分を求める処理が行われる。記入後帳票画像データ間で差分を取れば、画像間で共通して写っているフォーマット部分と、読取装置が発生させたノイズ等の共通差分部分とは無くなり、各帳票画像にのみ写っている記入部分が各帳票画像に対応して残される。
次に、S202で、マスタ画像と各記入後帳票画像データとの間で差分を求める処理が行われる。マスタ画像と各記入後帳票画像間で差分を取ることで、画像間で共通して写っているフォーマット部分が無くなり、各帳票画像に対応している記入部分と、共通差分部分とが残る。
S203で、S201で求められた記入後帳票画像間の差分と、S202で求められたマスタ画像と各記入後帳票画像との間の差分とを比較して、マスタ画像には存在しないが各記入後帳票画像間では共通に存在している共通差分部分を抽出する処理が行われる。
S204では、S203で抽出された共通差分部分を共通差分データとして共通差分データ格納部14に保存する処理が行われる。
図9のS204の処理が終わると、図8のS106の処理が終了する。S106の処理が終了すると、S107に進む。
S107では、差分データを生成する処理を差分データ生成部15が行う。差分データ生成部15は、差分データは、マスタ画像に共通差分データで表されている画像を重畳した画像と、記入後帳票画像データとの間の差分を求めることによって、差分データを生成する。
S108では、S107の処理で生成された差分データに対して圧縮処理(符号化処理)を施し、圧縮処理後の差分データを差分データ格納部20に保存する処理を差分データ生成部15が行う。その後、この図8の処理が終了する。
続いて図10について説明する。図10は、帳票画像管理システム1において行われる帳票画像圧縮処理の第二の例の処理内容を図解したフローチャートである。この第二の例の処理は、帳票画像を圧縮したときの圧縮効率が低下したと判定された場合には、共通差分データの更新を行うというものである。
なお、図10におけるS301〜S308の処理は、図8のフローチャートにおけるS101〜S108の処理と同様のものである。
まず、S301で、記入後帳票画像を取得する処理を帳票画像取得部11が行う。
次にS302で、マスタ画像を検索する処理を高相関マスタ画像検索部12が行う。
S303では、帳票画像取得部11により取得された記入後帳票画像についての共通差分データが既に求められているか判断する処理を共通差分データ生成部13が行う。ここで、共通差分データ生成部13は、取得した記入後帳票と同じフォーマットを持った帳票画像を以前に圧縮したことがあると判定した場合、すなわちS303の判断の結果がYesであると判定した場合、S304に処理を進める。一方、共通差分データ生成部13は、既に取得した記入後帳票と同じフォーマットを持った帳票画像を圧縮したことがないと判定した場合、すなわちS303の判断の結果がNoであると判定した場合、S306に処理を進める。
S304では、共通差分データを更新するかを判断する処理を共通差分データ生成部13が行う。ここで、共通差分データ生成部13は、S304での判断の結果がNoであると判定した場合、すなわち共通差分データを更新しないと判定した場合は、既に生成している共通差分データを使用すると決定し、S305に処理を進める。一方、共通差分データ生成部13は、S304での判断の結果がYesであると判定した場合、すなわち既に生成した共通差分データが無い場合、あるいは、共通差分データを更新すると判定した場合は、S306に処理を進める。なお、このS304の判定処理では、定期的に共通差分データを更新するために、一定の周知で定期的に判定結果をYesとしてもよい。この場合、例えば、年度の変わり目等に合わせて、1年毎に更新すること等が考えられる。
S305では、S304で使用すると決定した共通差分データを検索する処理を差分データ生成部15が行う。そして、S307に処理を進める。
一方、S306では、共通差分データの生成する処理を共通差分データ生成部13が行う。このS306の処理の詳細については、図9を用いて説明した通りである。
図9のS201〜S204の処理が終わると、図10のS306の処理が終了する。S306の処理が終了すると、S307に処理が進む。
S307では、差分データを生成する処理を差分データ生成部15が行う。
S308では、S307の処理で生成された差分データに対して圧縮処理(符号化処理)を施し、圧縮処理後の差分データを差分データ格納部20に保存する処理を差分データ生成部15が行う。
その後、S309で圧縮効率が低下したかどうかを判断する処理を差分データ生成部15が行う。ここで、差分データ生成部15は、この判断の結果がYesであると判断した場合、すなわち、圧縮効率が低下したと判断した場合は、S306に処理を戻す。一方、差分データ生成部15は、この判断の結果がNoであると判断した場合、すなわち、圧縮効率が低下していないと判断した場合は、この図10の処理が終了する。
なお、圧縮効率の低下を判断する方法としては、例えば、圧縮効率に閾値を設けて、その閾値を超えた場合にS306に戻って共通差分データを生成するようにする。すなわち、例えば、この閾値を5%と設定し、5%以上圧縮効率が低下した場合には、S306に処理を戻して、共通差分データを生成し直すようにする。このようにした場合には、その後、新たに生成された共通差分データを用いて、再度S306で差分データの生成をし、S307で符号化処理を行うようにする。
次に、検索・表示端末装置300の使用者に指定された帳票の画像を表現している表示画像データ73を復元する処理について説明する。この処理は、特に限定されるものではないが、例えば、具体的には以下のように行われる。
まず、前述した図5の符号化処理101の実行において行われた動き補償フレーム間予測処理において生成されたものと同一の予測画像を生成する処理を行う。この予測画像は、取得したマスタ画像データ61と、復号化処理201の実行によって読み出された共通差分データ及び差分データのうちの動きベクトルの情報とを用いることで生成することができる。
次に、生成された予測画像に対し、復号化処理201の実行によって読み出された共通差分データ及び差分データに含まれている動き補償フレーム間予測誤差の情報に表されている予測誤差を加算する処理が行われる。
以上の処理によって表示画像データ73が復元される。この復号化処理201の実行により、図1の帳票画像復元部34に相当する機能の提供が行われる。
次に、この処理の実行によって復元された表示画像データ73で表現されている元の帳票の画像を、検索・表示端末装置300に表示させる処理を行う。この処理が完了すると、帳票画像表示制御処理が終了する。
以上の帳票画像表示制御処理をMPU81が行うことにより、図6のコンピュータ80が検索・表示端末装置300として動作し、ストレージ装置200で保管されているデータの読み出しと、当該データで表現されている元の帳票の画像表示とが行えるようになる。
なお、前述した図1の構成を備える帳票画像管理システムにおいて、マスタ画像格納部10,210に格納されているマスタ画像の画像データを、例えば、前述のJPEG方式等のデータ圧縮処理が施された状態で格納しておくようにしてもよい。このようにすることで、マスタ画像格納部10,210の記憶容量の節約となる。なお、このようにする場合には、マスタ画像の画像データをマスタ画像格納部10,210から読み出したときに、データ伸張処理を行って元の画像データの復元を行うようにする。
なお、前述した図5の帳票画像管理システムの構成において、符号化処理101は、スキャンデータである記入後帳票51についてのマスタ画像データ61に対する共通差分データ71及び差分データ72の生成を、動き補償フレーム間予測を行うことによって実現している。また、複合化処理201は、元の帳票の画像を復元するために、符号化処理101で行われた動き補償フレーム間予測処理において生成されたものと同一の予測画像の生成を行っている。この動き補償フレーム間予測の手法としては、広く知られている各種の手法を用いてもよく、前述したものに限定されるものではない。例えば、この動き補償フレーム間予測の手法として、各種の汎用の動画圧縮符号化方式(例えば、ITU−T(国際電気通信連合−電気通信標準化部門)によって標準化されたH.262規格やH.264規格など)で採用されているものを採用してもよい。
なお、以上までに説明した実施形態に関し、更に以下の付記を開示する。
(付記1)
複数種類のマスタ画像を格納しておくマスタ画像格納部と、
帳票画像を取得する帳票画像取得部と、
前記複数種類のマスタ画像のうちで前記帳票画像取得部が取得した帳票の画像との相関が最も高いものを、前記マスタ画像格納部から検索する高相関マスタ画像検索部と、
複数の前記帳票画像間の差分と、前記検索されたマスタ画像と複数の前記帳票画像のうちの1つとの差分との間で共通して存在している共通差分部分を表している画像のデータを共通差分データとして生成する共通差分生成部と、
前記共通差分データを格納する共通差分データ格納部と、
前記帳票画像取得部が取得したそれぞれの帳票画像についての、前記検索されたマスタ画像に前記共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成する差分データ生成部と、
前記差分データ生成部が生成した差分データを格納する差分データ格納部と、
を備えていることを特徴とする帳票画像管理システム。
(付記2)
前記差分データ生成部は、前記帳票画像取得部が取得した帳票の画像について、前記高相関マスタ画像検索部が検索したマスタ画像に基づく動き補償フレーム間予測を行い、前記差分データとして、該帳票の画像についての該マスタ画像に対する動きベクトルの情報と動き補償フレーム間予測誤差の情報とを生成する、
ことを特徴とする付記1に記載の帳票画像管理システム。
(付記3)
前記差分データ生成部において、Iピクチャとして前記マスタ画像を用い、次のPピクチャとして、前記マスタ画像及び前記共通差分データで作成された画像を用い、その次のPピクチャとして、前記複数の帳票画像を用い、動画像符号化によって差分データの生成及び圧縮を行うことを特徴とする付記1または2に記載の帳票画像管理システム。
(付記4)
前記差分データ生成部は、更に、生成した差分データに対してデータ圧縮処理を施し、
前記差分データ格納部は、前記差分データ生成部によってデータ圧縮処理が施された差分データを格納する、
ことを特徴とする付記1から3のうちのいずれか一項に記載の帳票画像管理システム。
(付記5)
前記生成された差分データと、前記検索されたマスタ画像とを対応付ける、前記共通差分データを1つの帳票画像に対し1つ以上持つ、
ことを特徴とする付記1から4のうちのいずれか一項に記載の帳票画像管理システム。
(付記6)
前記共通差分生成部は、前記共通差分データの生成を定期的に行って、前記共通差分データ格納部に格納されている共通差分データを更新する、
ことを特徴とする付記1から5のうちのいずれか一項に記載の帳票画像管理システム。
(付記7)
前記共通差分生成部は、前記差分データ生成部が前記差分データに対して行った前記データ圧縮処理における圧縮効率に応じて前記共通差分データの生成を再度行って前記共通差分データ格納部に格納されている共通差分データを更新する、
ことを特徴とする付記4に記載の帳票画像管理システム。
(付記8)
前記差分データ格納部から、対応する差分データを読み出す差分データ読出部と、
前記マスタ画像格納部から、前記検索された特定のマスタ画像を読み出す特定マスタ画像読出部と、
前記共通差分データ生成部から、対応する特定の共通差分データを読み出す特定共通差分データ読出部と、
前記差分データ読出部が読み出した差分データと、前記特定共通差分データ読出部が読み出した特定の共通差分データと、前記特定マスタ画像読出部が読み出した特定のマスタ画像とから前記帳票の画像を復元する帳票画像復元部と、
を更に備えていることを特徴とする付記1から7のうちのいずれか一項に記載の帳票画像管理システム。
(付記9)
複数の帳票画像を取得し、
複数種類のマスタ画像から、前記取得した帳票の画像との相関が最も高いマスタ画像を検索し、
前記複数の帳票画像間の差分と、前記検索されたマスタ画像と前記複数の帳票画像のうちの1つとの差分との間で共通して存在している共通差分部分を表している画像のデータを共通差分データとして生成して共通差分データ格納部に格納し、
前記複数の帳票画像の各々についての、前記検索されたマスタ画像に前記共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成して差分データ格納部に格納する、
ことを特徴とする帳票画像管理方法。
(付記10)
複数の帳票画像を取得し、
複数種類のマスタ画像から、前記取得した帳票の画像との相関が最も高いマスタ画像を検索し、
前記複数の帳票画像間の差分と、前記検索されたマスタ画像と前記複数の帳票画像のうちの1つとの差分との間で共通して存在している共通差分部分を表している画像のデータを共通差分データとして生成して共通差分データ格納部に格納し、
前記複数の帳票画像の各々についての、前記検索されたマスタ画像に前記共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成して差分データ格納部に格納する、
処理をコンピュータに実行させるプログラム。
(付記11)
前記差分データを生成する処理は、前記帳票画像取得部が取得した帳票の画像について、前記高相関マスタ画像検索部が検索したマスタ画像に基づく動き補償フレーム間予測を行い、前記差分データとして、該帳票の画像についての該マスタ画像に対する動きベクトルの情報と動き補償フレーム間予測誤差の情報とを生成する処理である、
ことを特徴とする付記10に記載のプログラム。
(付記12)
前記差分データを生成する処理において、Iピクチャとして前記マスタ画像を用い、次のPピクチャとして、前記マスタ画像及び前記共通差分データで作成された画像を用い、その次のPピクチャとして、前記複数の帳票画像を用い、動画像符号化によって差分データの生成及び圧縮を行う処理を更に前記コンピュータに実行させる、
ことを特徴とする付記10または11に記載のプログラム。
(付記13)
前記差分データを生成する処理は、更に、生成した差分データに対してデータ圧縮処理を施す処理を更に前記コンピュータに実行させ、
前記差分データを格納する処理は、前記データ圧縮処理が施された差分データを格納する処理を更に前記コンピュータに実行させる、
ことを特徴とする付記10から12のうちのいずれか一項に記載のプログラム。
(付記14)
前記生成された差分データと、前記検索されたマスタ画像とを対応付ける、前記共通差分データを1つの帳票画像に対し1つ以上持つ、
ことを特徴とする付記10から13のうちのいずれか一項に記載のプログラム。
(付記15)
前記共通差分を生成する処理は、前記共通差分データの生成を定期的に行って、前記共通差分データ格納部に格納されている共通差分データを更新する処理を更に前記コンピュータに実行させる、
ことを特徴とする付記10から14のうちのいずれか一項に記載のプログラム。
(付記16)
前記共通差分を生成する処理は、前記差分データ生成処理によって前記差分データに対して行われた前記データ圧縮処理における圧縮効率に応じて前記共通差分データの生成を再度行って前記共通差分データ格納部に格納されている共通差分データを更新する、
ことを特徴とする付記13に記載のプログラム。
10、210 マスタ画像格納部
11 帳票画像取得部
12 高相関マスタ画像検索部
13 差分データ生成部
14 共通差分データ格納部
15 差分データ生成部
20 差分データ格納部
31 差分データ読出部
32 特定マスタ画像読出部
33 特定共通差分データ読出部
34 帳票画像復元部
50 スキャナ
51 記入後帳票
61 マスタ画像データ
71 共通差分データ
72 差分データ
73 表示画像データ
80 コンピュータ
81 MPU
82 ROM
83 RAM
84 ハードディスク装置
85 入力装置
86 表示装置
87 インタフェース装置
88 記録媒体駆動装置
89 バスライン
90 可搬型記録媒体
100 認識・点検端末装置
101 符号化処理
120 サーバ
200 ストレージ装置
220 登録用サーバ
240 検索用サーバ
201 復号化処理
300 検索・表示端末装置

Claims (10)

  1. 複数種類のマスタ画像を格納しておくマスタ画像格納部と、
    帳票画像を取得する帳票画像取得部と、
    前記複数種類のマスタ画像のうちで前記帳票画像取得部が取得した帳票の画像との相関が最も高いものを、前記マスタ画像格納部から検索する高相関マスタ画像検索部と、
    複数の前記帳票画像間の差分と、前記検索されたマスタ画像と複数の前記帳票画像のうちの1つとの差分との間で共通して存在している共通差分部分を表している画像のデータを共通差分データとして生成する共通差分生成部と、
    前記共通差分データを格納する共通差分データ格納部と、
    前記帳票画像取得部が取得したそれぞれの帳票画像についての、前記検索されたマスタ画像に前記共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成する差分データ生成部と、
    前記差分データ生成部が生成した差分データを格納する差分データ格納部と、
    を備えていることを特徴とする帳票画像管理システム。
  2. 前記差分データ生成部は、前記帳票画像取得部が取得した帳票の画像について、前記高相関マスタ画像検索部が検索したマスタ画像に基づく動き補償フレーム間予測を行い、前記差分データとして、該帳票の画像についての該マスタ画像に対する動きベクトルの情報と動き補償フレーム間予測誤差の情報とを生成する、
    ことを特徴とする請求項1に記載の帳票画像管理システム。
  3. 前記差分データ生成部において、Iピクチャとして前記マスタ画像を用い、次のPピクチャとして、前記マスタ画像及び前記共通差分データで作成された画像を用い、その次のPピクチャとして、前記複数の帳票画像を用い、動画像符号化によって差分データの生成及び圧縮を行う、
    ことを特徴とする請求項1または2に記載の帳票画像管理システム。
  4. 前記差分データ生成部は、更に、生成した差分データに対してデータ圧縮処理を施し、
    前記差分データ格納部は、前記差分データ生成部によってデータ圧縮処理が施された差分データを格納する、
    ことを特徴とする請求項1から3のうちのいずれか一項に記載の帳票画像管理システム。
  5. 前記生成された差分データと、前記検索されたマスタ画像とを対応付ける、前記共通差分データを1つの帳票画像に対し1つ以上持つ、
    ことを特徴とする請求項1から4のうちのいずれか一項に記載の帳票画像管理システム。
  6. 前記共通差分生成部は、前記共通差分データの生成を定期的に行って、前記共通差分データ格納部に格納されている共通差分データを更新する、
    ことを特徴とする請求項1から5のうちのいずれか一項に記載の帳票画像管理システム。
  7. 前記共通差分生成部は、前記差分データ生成部が前記差分データに対して行った前記データ圧縮処理における圧縮効率に応じて前記共通差分データの生成を再度行って前記共通差分データ格納部に格納されている共通差分データを更新する、
    ことを特徴とする請求項4に記載の帳票画像管理システム。
  8. 前記差分データ格納部から、対応する差分データを読み出す差分データ読出部と、
    前記マスタ画像格納部から、前記検索された特定のマスタ画像を読み出す特定マスタ画像読出部と、
    前記共通差分データ生成部から、対応する特定の共通差分データを読み出す特定共通差分データ読出部と、
    前記差分データ読出部が読み出した差分データと、前記特定共通差分データ読出部が読み出した特定の共通差分データと、前記特定マスタ画像読出部が読み出した特定のマスタ画像とから前記帳票の画像を復元する帳票画像復元部と、
    を更に備えていることを特徴とする請求項1から7のうちのいずれか一項に記載の帳票画像管理システム。
  9. 複数の帳票画像を取得し、
    複数種類のマスタ画像から、前記取得した帳票の画像との相関が最も高いマスタ画像を検索し、
    前記複数の帳票画像間の差分と、前記検索されたマスタ画像と前記複数の帳票画像のうちの1つとの差分との間で共通して存在している共通差分部分を表している画像のデータを共通差分データとして生成して共通差分データ格納部に格納し、
    前記複数の帳票画像の各々についての、前記検索されたマスタ画像に前記共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成して差分データ格納部に格納する、
    ことを特徴とする帳票画像管理方法。
  10. 複数の帳票画像を取得し、
    複数種類のマスタ画像から、前記取得した帳票の画像との相関が最も高いマスタ画像を検索し、
    前記複数の帳票画像間の差分と、前記検索されたマスタ画像と前記複数の帳票画像のうちの1つとの差分との間で共通して存在している共通差分部分を表している画像のデータを共通差分データとして生成して共通差分データ格納部に格納し、
    前記複数の帳票画像の各々についての、前記検索されたマスタ画像に前記共通差分データが表している画像を重畳したデータに対する、それぞれの差分データを生成して差分データ格納部に格納する、
    処理をコンピュータに実行させるプログラム。
JP2012076983A 2012-03-29 2012-03-29 帳票画像管理システム、帳票画像管理方法、及びプログラム Expired - Fee Related JP5884597B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012076983A JP5884597B2 (ja) 2012-03-29 2012-03-29 帳票画像管理システム、帳票画像管理方法、及びプログラム
US13/848,554 US9002135B2 (en) 2012-03-29 2013-03-21 Form image management system and form image management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012076983A JP5884597B2 (ja) 2012-03-29 2012-03-29 帳票画像管理システム、帳票画像管理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013206323A true JP2013206323A (ja) 2013-10-07
JP5884597B2 JP5884597B2 (ja) 2016-03-15

Family

ID=49235124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012076983A Expired - Fee Related JP5884597B2 (ja) 2012-03-29 2012-03-29 帳票画像管理システム、帳票画像管理方法、及びプログラム

Country Status (2)

Country Link
US (1) US9002135B2 (ja)
JP (1) JP5884597B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019036107A (ja) * 2017-08-15 2019-03-07 カシオ計算機株式会社 情報処理装置及びプログラム
JP2019175217A (ja) * 2018-03-29 2019-10-10 株式会社大和総研ビジネス・イノベーション 帳票再作成システムおよびプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9374501B2 (en) * 2014-03-04 2016-06-21 Xerox Corporation Methods and devices for form-independent registration of filled-out content

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1040312A (ja) * 1996-07-19 1998-02-13 Ricoh Co Ltd 帳票画像作成装置
JP2000152009A (ja) * 1998-11-12 2000-05-30 Nec Corp 帳票処理方法および装置
JP2006201965A (ja) * 2005-01-19 2006-08-03 Oki Electric Ind Co Ltd 帳票識別システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5542007A (en) * 1993-10-27 1996-07-30 International Business Machines Corporation Form dropout compression method which handles form white-out and writing in shaded and white-out areas of the form
JP3602596B2 (ja) * 1995-02-22 2004-12-15 株式会社東芝 ドキュメントファイリング装置および方法
US7016536B1 (en) * 1999-11-24 2006-03-21 Gtx Corporation Method and apparatus for automatic cleaning and enhancing of scanned documents

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1040312A (ja) * 1996-07-19 1998-02-13 Ricoh Co Ltd 帳票画像作成装置
JP2000152009A (ja) * 1998-11-12 2000-05-30 Nec Corp 帳票処理方法および装置
JP2006201965A (ja) * 2005-01-19 2006-08-03 Oki Electric Ind Co Ltd 帳票識別システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019036107A (ja) * 2017-08-15 2019-03-07 カシオ計算機株式会社 情報処理装置及びプログラム
JP2021120894A (ja) * 2017-08-15 2021-08-19 カシオ計算機株式会社 情報処理装置、分析方法及びプログラム
JP7136269B2 (ja) 2017-08-15 2022-09-13 カシオ計算機株式会社 情報処理装置、分析方法及びプログラム
JP2019175217A (ja) * 2018-03-29 2019-10-10 株式会社大和総研ビジネス・イノベーション 帳票再作成システムおよびプログラム

Also Published As

Publication number Publication date
US20130259388A1 (en) 2013-10-03
US9002135B2 (en) 2015-04-07
JP5884597B2 (ja) 2016-03-15

Similar Documents

Publication Publication Date Title
CN112070649A (zh) 一种去除特定字符串水印的方法及系统
JP5884597B2 (ja) 帳票画像管理システム、帳票画像管理方法、及びプログラム
US9509862B2 (en) Image processing system, image output device, and image processing method
US20100310192A1 (en) Document storage system
US9380316B2 (en) Image processing apparatus, image processing system and image processing method
JP5703898B2 (ja) 帳票管理システム、帳票画像管理方法、及びプログラム
EP3362945A1 (en) Method and device for clustering patches of a degraded version of an image
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
US8705871B2 (en) Form image managing system and method
CN111369557A (zh) 图像处理方法、装置、计算设备和存储介质
JP2018045359A (ja) 画像処理装置及び画像処理プログラム
US20120300976A1 (en) Image processing device, image generation device, image processing method, and image generation method
CN110958460B (zh) 一种视频存储方法、装置、电子设备及存储介质
JP4101712B2 (ja) 図面の電子化保管方法と図面の電子化保管システム及び図面データ提供システム
CN117176979B (zh) 多源异构视频的内容帧提取方法、装置、设备及存储介质
US20100266209A1 (en) Image processing apparatus, image processing method, and program
US20240193217A1 (en) Information processing apparatus, method of controlling information processing apparatus, and storage medium
CN116110056B (zh) 信息抽取方法及装置、电子设备和存储介质
JP5696531B2 (ja) 帳票画像管理システム、帳票画像管理方法、及びプログラム
JP2000059612A (ja) 画像処理装置及びその方法
JP6569242B2 (ja) 画像処理装置、画像処理システム及び画像処理プログラム
JP2006309781A (ja) 帳票イメージ処理方法及びその装置
CN114881063A (zh) 图形化信息解析方法、装置、设备、存储介质及程序产品
JP5807464B2 (ja) 画像識別装置および画像識別方法
CN115699725A (zh) 视频图像处理方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160125

R150 Certificate of patent or registration of utility model

Ref document number: 5884597

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees