JP4185699B2 - 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム - Google Patents

帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム Download PDF

Info

Publication number
JP4185699B2
JP4185699B2 JP2002109904A JP2002109904A JP4185699B2 JP 4185699 B2 JP4185699 B2 JP 4185699B2 JP 2002109904 A JP2002109904 A JP 2002109904A JP 2002109904 A JP2002109904 A JP 2002109904A JP 4185699 B2 JP4185699 B2 JP 4185699B2
Authority
JP
Japan
Prior art keywords
profile
reading
definition
form image
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002109904A
Other languages
English (en)
Other versions
JP2003303315A (ja
Inventor
直広 古川
竜治 嶺
裕 酒匂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Omron Terminal Solutions Corp
Original Assignee
Hitachi Omron Terminal Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Omron Terminal Solutions Corp filed Critical Hitachi Omron Terminal Solutions Corp
Priority to JP2002109904A priority Critical patent/JP4185699B2/ja
Priority to CNB021513759A priority patent/CN1198236C/zh
Priority to KR1020020083862A priority patent/KR20030080998A/ko
Publication of JP2003303315A publication Critical patent/JP2003303315A/ja
Application granted granted Critical
Publication of JP4185699B2 publication Critical patent/JP4185699B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00034Measuring, i.e. determining a quantity by comparison with a standard

Description

【0001】
【発明の属する技術分野】
本発明は、帳票に記載された金額や支払者名などの情報を読み取る帳票処理システムに関する。特に帳票処理システムで用いられる帳票の事前知識である、帳票定義の作成・管理・利用方法に関する。
【0002】
【従来の技術】
振込伝票や税金納付書などの帳票の画像を光学式スキャナ等で読み込み、そのイメージデータから帳票上に記載された金額や支払者名などの情報を読み取るシステムを、帳票処理システムという。
【0003】
上記帳票処理システムでは正しく帳票を処理するために、事前知識として、入力装置において,読取り帳票のサイズ,読取り行数,位置,字種,文字数等の帳票を読取るために必要なパラメータレイアウト等の帳票の特徴や、帳票を処理する上で必要な取扱方法を記した情報が必要である。
この情報には、たとえば
(1)帳票種情報、
・帳票種ID、
・帳票発行者名、
・帳票発行者口座番号、
(2)レイアウト情報、
・罫線位置、
・枠位置、
・枠属性(金額記載枠、日付記載枠、など)、
・枠記載文字種(数字、漢字、カタカナ、など)、
(3)アプリケーション情報、
・帳票取扱手順、
・帳票カット位置、
・領収印押印位置、
などの情報のうち何れかが含まれ、本願においては、少なくとも枠位置情報と枠属性の情報を含むレイアウト情報を帳票定義として扱う。
【0004】
高精度の帳票処理を実現するためには、帳票定義の(a)作成方法、(b)管理方法、(c)利用方法、が重要となる。
前記(a)帳票定義作成方法に関する従来方法として、たとえば特開2000-172779号公報には、帳票定義作成対象の帳票種の入力画像から、枠を自動抽出し、事前に登録された枠のフォーマット知識を利用して、有効な枠を確定し、レイアウト情報を作成する方法が開示されている。
【0005】
また、特開平11-184965号公報には、文字パターン等の条件をみたす構成要素を画像内から自動的に抽出することにより、帳票種を区別するための帳票定義の抽出を可能にした方法が開示されている。
【0006】
前記(b)の帳票定義管理方法に関し、帳票定義を蓄積した帳票定義DBを管理する方法として、特開平9-73502号公報に、複数台の帳票処理装置をネットワークで結び、そのうち一台の帳票処理装置のみに帳票定義DBを持たせ、ネットワーク経由で他の帳票処理装置に送信するという方法が開示されている。
【0007】
また特開2001-307008号公報には、帳票定義を必要に応じて帳票処理装置に提供することにより、帳票定義DBの構築コストを低減する方法が開示されている。
【0008】
前記(c)の帳票定義利用方法に関しては、帳票定義に記載されたフィールド枠や記載文字種などのレイアウト情報に従い文字列認識処理を実行させ、読取対象フィールドを読取るのが一般的である。
【0009】
【発明が解決しようとする課題】
しかし、たとえば罫線情報を用いて読取項目の位置決めを行う際、各スキャナのスキャン特性により罫線の出現が定義時画像と異なる場合があり、定義に記載された通りに罫線が抽出できず、読取項目の位置決めを失敗することがあった。このように従来方法では、取り込む画像データの輝度値や、解像度等使用する入力装置毎に異なる特性値を考慮せずに記載された帳票定義の情報をそのまま利用するため、帳票定義を作成する際に用いるスキャナと帳票処理装置のスキャナとの特性が異なる場合、高精度な帳票読取が困難になるという課題がある。
また、帳票処理システムの現実的構成として、
(i) 1台のみでなく複数台や複数種類のスキャナを使用して帳票画像を収集し、帳票定義を作成する場合、
(ii) 1つの帳票定義DBを複数台や複数種類の帳票処理装置で利用する場合、
が考えられる。このような種々のスキャナが混在する場合、従来の帳票定義の作成・利用方法では対処することが事実上不可能であった。
【0010】
このように、帳票定義時と帳票読取取時とでスキャン環境が異なる場合や、複数のスキャナを用いて帳票定義もしくは帳票読取を行う場合、従来の方法では高精度な帳票読取が実現できないという問題点1があった。
【0011】
さらに、高精度な読取りを常に維持させるために、帳票処理システム内のスキャナ状態を把握する必要がある。一般的に光学式スキャナは使用時間とともに劣化する。また搬送系不良などにより、スキャン画像に伸縮などの異常が現れる場合がある。画質が悪化したスキャナは速やかに交換しなければならない。しかし経年劣化や故障などを自動的に検出する方法は存在しないという問題点2があった。
本発明は、前記問題点に鑑みてなされたものであって、
帳票定義時と帳票読取取時とでスキャン環境が異なる場合や、複数のスキャナを用いて帳票定義もしくは帳票読取を行う場合でも、単一の帳票定義DBを作成・利用できる方法を提供することを、課題とする。
【0012】
さらに前記問題点2に対し、経年劣化や故障などのスキャナ状態を自動的に検出できる方法を提供することも、本発明の課題とする。
【0013】
【課題を解決するための手段】
本発明は、上記課題を解決するために、各帳票定義内にその定義を作成した入力装置の特性値もしくはそれへのリンク情報を記録し、帳票読取時に定義作成と帳票読取装置との特性を比較し、その結果に応じた文字列認識・照合などを行うことにより、読取精度を維持したままの単一帳票定義DB利用を可能にしている。
【0014】
また、各スキャン環境のプロファイルを観測することにより、プロファイルに大きな変化が生じた際は当該スキャナに経年劣化や故障が発生したと判断するなど、スキャナ状態の自動検出を可能にしている。
【0015】
【発明の実施の形態】
本発明に係る関係者やシステム構成、各機能などについて以下詳細に説明する。まず、本発明の実施形態の概略について述べる(図1)。本実施形態に登場する関係者は4者である。
第1の関係者は帳票処理システム提供者101、
第2の関係者は帳票処理システム利用者102、
第3の関係者は帳票発行者103、
第4の関係者は帳票処理希望者104、である。
例えば電気料金の支払いを例にすると、帳票処理システム提供者はシステム開発・サービス会社、帳票処理システム利用者102が金融機関、帳票発行者103が電力会社、帳票処理希望者104が電気使用者となる。電力会社が電気使用料金の請求・支払いのために帳票を発行、各電気利用者に帳票を送付する。電気利用者は電気料金振込のため送付された帳票を持参して金融機関にいき、帳票処理システムで振込手続きをおこなう。その後金融機関は振り込まれた使用料金を電力会社に送金し、電力会社は金融機関へ帳票処理代を支払う、といった流れとなる。
この場合、金融機関はシステム開発・サービス会社から帳票処理システムを購入、もしくはリースなどして、帳票処理システムを利用、その購入代もしくは利用代を支払う。
次に、図1の帳票処理システム提供者101によって提供される帳票処理システムの構成について説明する。帳票処理システムの構成は大きく分けて、(1)集中型(図2)、(2)分離型(図3)、の2構成がある。
帳票処理システムの第1の構成である集中型(図2)は、スキャナ211〜213と、帳票画像サーバ221、プロファイルサーバ231、帳票定義サーバ241、帳票読取サーバ251とがネットワーク201を介して接続された構成である。
ネットワーク201の実体は、光ケーブルやイーサネットや電話線などの有線ネットワーク、IEEE802.11a/b/gやBluetooth(The Bluetooth SIG Incorporatedの登録商標)などの無線ネットワーク、またはその混在などである。サーバの構成については、1台のハードウェアで、各サーバのうちの複数の機能を兼務してもよい。
帳票処理システムは1台もしくは複数台のスキャナを有す。スキャナの構成の例としては、光学式画像取込装置と、それを制御し、また採取画像をネットワークを介して帳票画像サーバなどに送信できる計算機との組やFAX装置などである。またスキャナはハードウェア構成がいずれかのサーバと融合していても構わない。各スキャナは同一の規格である必要はない。スキャナの設置場所を図1を用いて説明すると、帳票処理システム提供者101、帳票処理システム利用者102、帳票処理希望者104に設置可能である。
ネットワーク201を介し、各スキャナでスキャンされた帳票画像は、帳票画像サーバ221に転送される。帳票画像サーバは、転送された帳票画像は採取に使用したスキャナの情報とともに帳票画像DB 222に格納する。採取に使用した帳票画像入力装置の情報とは、使用するスキャナに依存して、若しくは各入力装置の経年変化より値が異なる可能性のある、取り込まれる画像データ上の特性値であって、例えば解像度、輝度値、濃淡情報、スキャン最小線幅・線間隔の少なくとも何れかを含む。さらに帳票定義に含まれるそのほかの情報の何れかを用いるものであってもよい。以降本願においては、これらの入力装置の情報をプロファイルという。さらに、システム上の各スキャナに固有の番号もしくは文字列(以降、スキャナID)を予め割り振っておけば、そのスキャナIDをプロファイルとして使用することも可能である。
各プロファイルは、プロファイルサーバ231が管理している。プロファイルの例を図7に示す。プロファイルサーバは、個々のスキャナのプロファイルを個々のスキャナIDと対応づけてプロファイルDB 232に格納し、管理する。
帳票定義サーバ241は、帳票画像サーバから帳票画像を受信し、帳票定義を作成し、帳票定義DB 242に格納する。各帳票定義には、各々その定義の作成に使用した帳票画像の採取スキャナのプロファイルを付加しておく。
帳票読取サーバ251は、帳票画像サーバもしくはスキャナから帳票画像を、プロファイルサーバからスキャナのプロファイルを、帳票定義サーバから帳票定義を受信し、帳票定義に基づき帳票上の文字列・数字列などを読取り、その読取り結果を帳票読取結果DBに格納する。帳票読取処理については後で詳細に説明する。尚、上記のように1の装置で構成した場合には、帳票読み取りサーバ251内に帳票画像DB222とプロファイルDB232と帳票定義242を格納しておき、スキャナからの画像データを受け取った場合に上記処理を実現すればよい。以上が、帳票処理システムの第1の構成である集中型の説明である。
帳票処理システムの第2の構成である分散型を図3に示す。第1の構成である集中型との差異は、帳票読取を1台の帳票読取サーバで一括して処理するか、各帳票読取装置内で処理するのか、の違いである。分離型では帳票の定義を行う帳票定義センタと、実際に帳票を読取る1台もしくは複数台の帳票読取装置から構成される。図3の場合、2台の帳票読取装置A, Bからなる場合を示している。
帳票定義センタ300は、帳票読取サーバが必須ではないことと、DB配信サーバが追加されたことを除けば、第1の構成である集中型200と同等である。
DB配信サーバ361は帳票定義DBや帳票定義の作成に使用した帳票画像入力装置のプロファイルDBを、ネットワーク302を用いて、各帳票読取装置に配信するものである。帳票定義の配信方法は、例えば特開2001-307008号公報に記載の帳票定義配信方法を用いる。
帳票読取装置は、1台もしくは複数台のスキャナと帳票読取サーバ、帳票読取結果DBを有す。各帳票読取装置は、ネットワーク302を介してDB配信サーバと接続している。帳票読取装置内のスキャナについてのプロファイルは、各帳票読取装置内に記憶しても良いし、もしくはプロファイルサーバで管理される。
以上が、帳票処理システムの第2の構成である分散型の説明である。
また、帳票処理システムの構成として集中型と分散型との混在型でもよい。すなわち、分散型において、帳票定義センタ内に帳票読取サーバを有し、また帳票読取サーバを有さない帳票読取装置が帳票定義センタに接続されている場合である。この場合、帳票読取装置では帳票画像をスキャンし、ネットワークを介し帳票定義センタに帳票画像を送信。帳票定義センタ内の帳票読取サーバで帳票読取処理を行う。この場合、各スキャナのプロファイルはスキャナ373に記憶手段を設けて保持しておき、読み取り画像をセンタに送信する際には、自動的に添付するようにすることも可能である。このような構成によれば、例えば帳票センタ等に帳票の情報を集中的に蓄積しておくことで効率的に帳票の処理を行うことが可能となる。
次に、帳票定義作成と帳票読取の手順を、従来の例(図4)と本発明(図5)とを比較しながら説明する。
帳票定義作成手順と帳票読取手順の従来例(図4)では、まず帳票処理システムで取扱いたい帳票411を帳票画像入力部A 412で電子的に取込み、帳票画像413を得る。次に帳票定義作成手段414でレイアウト情報などを定義し、帳票定義415を作成する。ここまでが帳票定義作成手順410である。
帳票読取手順420は、まず処理したい帳票421を帳票画像入力部B 422で電子的に取込み、帳票画像423を得る。そして帳票画像423と先の帳票定義作成手順で作成した帳票定義415を入力とし、帳票読取部424で帳票紙面上に記載された読取対象の文字列・数字列などを読み込み、その結果を帳票読取結果425に記憶する。
以上が、帳票定義作成手順と帳票読取手順の従来例である。
しかし、従来例の場合、帳票画像入力部A 412と帳票画像入力部B 422との入力画像中の特性差を考慮しないため、たとえば定義時の画像に存在した罫線が読取時には検出できなかったり、定義されていない罫線まで読み取られるなどの問題が生じ、その結果帳票読取精度が低下してしまう場合があった。
そこで、前記スキャン特性の差異を考慮した帳票読取を実現するのが、本発明方式である。
帳票定義作成と帳票読取の本発明手順(図5)では、帳票処理システムで取扱いたい帳票511を帳票画像入力部A 512で電子的に取込み、帳票画像513を得る。次に帳票定義作成部514でレイアウト情報などを定義し、帳票定義515を作成する。このときに帳票定義515内にその定義作成に使用した帳票画像を採取したプロファイルをあわせて記録する。一方、帳票画像入力部A 512のスキャン特性を知るため、プロファイル作成シート516(図6参照、以降単にシートともよぶ)を帳票画像入力部Aで電子的に取込み、スキャン特性抽出部517でスキャン特性を抽出し、プロファイルA 518を出力する。ここまでが帳票定義作成手順510である。プロファイル作成は帳票をスキャンするたびに毎回実行する必要はなく、その帳票画像入力部を最初に使用する場合や、メンテナンス時に定期的に行う場合、又スキャンした画像に異常が見られた場合などに実行すればよい。スキャナ出荷前にプロファイルを作成し記憶させておくようにすることも可能である。プロファイルおよびスキャン特性抽出部については後に詳しく説明する。
帳票読取手順520は、まず処理したい帳票521を帳票画像入力部B 522で電子的に取込み、帳票画像523を得る。一方、帳票定義作成510と同様に、帳票画像入力部B 522のプロファイルを知るため、シート526を帳票画像入力部Bで電子的に取込み、スキャン特性抽出部527でプロファイルを抽出し、プロファイルB 528を出力しておく。帳票読取の前もしくは帳票読取中に、補正量計算部529で2つのプロファイル518と528との間で例えば輝度値や解像度などについての差異を抽出し、読取時の補正量や補正方法を決定する。そして帳票画像523と先の帳票定義作成手順で作成した帳票定義515、補正量計算部529の結果を入力とし、帳票読取部524で帳票紙面上に記載された読取対象の文字列・数字列などを読み込み、その結果を帳票読取結果525に記憶する。
以上が、帳票定義作成と帳票読取の本発明手順である。
上記のように帳票定義時と帳票読取時とのプロファイルの差異を考慮することにより、帳票画像入力部が異なる場合でも、帳票読取精度の低下を抑えることが可能となる。
次にプロファイル作成シートとプロファイルについて説明する。
プロファイル作成シートとは、各帳票画像入力部で本シートをスキャンして画像を電子化し、その画像に対しスキャン特性抽出手段を実行してプロファイルを得るためのシートである。図6はプロファイル作成シートの例である。
本例では、フィールド610に種々の文字フォントやスタイル、サイズで文字列・数字列が印刷されている。シートをスキャン後、スキャン特性抽出手段がこれら文字を読みことができるか否かから、認識最小文字サイズなど文字列認識に関するスキャン特性を抽出するためのものである。
図形621は認識可能な線密度を知るための図形である。スキャン後、2本の横線の間に存在する線が認識できるか否かを調査することにより、認識最大線密度を抽出する。本例の場合、中央に近い線が認識できればできるほど認識可能な線密度が高いことを意味する。
図形622はグレー階調の特性を調査するための図形である。スキャン後、本図形の輝度値を測定することにより、スキャナのグレー階調特性を抽出する。同様に、図形623〜625はカラーの場合で、各々赤、緑、青階調の特性を調査するための図形である。
フィールド630, 640の各図形は、線の認識特性を調査するためのフィールドである。本例の場合、フィールド630内には線幅の異なる線が描かれている。スキャン後、当該線の実際の線幅を測定することにより、線のつぶれやかすれを抽出する。フィールド640内には、濃度の異なる線が描かれている。スキャン後、当該線が実際に認識できたか否かや、その時の線幅などの特性を抽出する。
プロファイル作成シートの、どこに、どういう図形が記載され、どのようなスキャン特性を、どういう手段で抽出するのか、といったプロファイル作成シート情報の保有方法に関し、
(1)事前知識としてスキャン特性抽出手段内に保持、
(2)プロファイル作成シート上の特定の箇所に記録、
などがある。本例では、前記(2)の場合で、それら情報をシート右上部に二次元バーコード601に符号化して記録した例を示している。この場合、スキャン特性抽出時に、二次元バーコードの復号化手段が必要となるが、事前知識の管理が必要ない、種々のプロファイル作成シートが存在する場合でも対応できる、などの利点がある。
以上、図6の例に示したようなプロファイル作成シートから作成されたプロファイルの例を図7に示す。
まず、フィールド701には、どのスキャナのプロファイルかを示すスキャンID が記載されている。フィールド703にはグレー階調の特性を示し、例えば図6の622から得られる各グレーの輝度値(本例の場合0〜255の256階調)での輝度の実測値が記載されている。同様に、フィールド704〜706には、図6の623〜625を用いて得られる赤、緑、青階調に対する実測値が記載されている。フィールド707,708には線に関する特性を示し、フィールド707には認識可能な最小の線幅が、フィールド708には認識可能な最大の線密度が、各々記載されている。フィールド709,710には文字やパターンに対する特性を示し、フィールド709には各線幅の実測値が、フィールド710には認識可能な最小の文字サイズが、各々記載されている。これらは、各々図6の610,630,640等に示すのパターンを用いて求めることができる。この他例えば、フィールド702は、解像度の実測値を記載することができる。
本例の項目に加え、例えば各文字フォントに対する認識可否などのフィールドが追加されてもよい。
スキャン特性抽出手段(図5:517,527)の処理フローを図8にそって説明する。まずプロファイル作成シート画像を入力する(ステップ801)。次に入力画像中からシートの四隅を検出して、シートの画像中の位置を決定する(ステップ802)。その後、プロファイル作成シート情報を抽出する(ステップ803)。本実施例では図6の二次元バーコード601を復号化する処理がそれに該当する。以降、プロファイル作成シート情報に従い、各スキャン特性を順次抽出していく(ステップ804)。各スキャン特性抽出において、まずその特性の測定領域を決定し(ステップ805)、実測値を測定する(ステップ806)。実測値からスキャン特性を計算し(ステップ807)、その結果をプロファイルに書込む(ステップ808)。以上を繰り返し、すべてのスキャン特性を抽出したら、プロファイルを出力し終了する(ステップ809)。以上の処理は、例えば現在スキャナ出荷時に各製品が仕様をみたしているか確認のために用いている手段等を用いることでも実現できる。
以上が、スキャン特性抽出の処理フローである。
次に、補正量計算手段(図5:529)の処理フローを図9に示す。まず定義作成時のプロファイルを入力する(ステップ901)。また帳票読取時のプロファイルも入力する(ステップ902)。なお、ステップ901と902の実行順は逆であってもよい。その後、2プロファイルの差異を計算(ステップ903)、その差異から入力された帳票画像データの補正量や帳票定義に規定される帳票読み取りを行う際の帳票読取パラメータを決定する(ステップ904)。最後に補正量やパラメータを出力し終了する(ステップ905)。本フローについては後述する。
帳票読取手段(図5:524)の処理フローを説明する(図10)。
まずステップ1001〜1003で、読取るべき帳票の画像、その帳票の定義、補正量計算手段(529)で計算された補正量を入力する。なお各ステップの実行順は問わない。その後、補正量に従い帳票画像データを補正(ステップ1004)し、帳票の四隅を検出して、帳票の画像中の位置を決定する(ステップ1005)。次に帳票定義に記載された各読取項目に対し(ステップ1006)、その読取領域を決定し(ステップ1007)、その領域中から文字パターンを抽出(ステップ1008)、各文字を文字認識することにより読取結果を得る(ステップ1009)。最後に、全ての読取項目を読取った後、その結果を出力する(1010)。
ここで、プロファイルを用いた補正方法について、より詳細に説明する。補正方法には大きく分けて、
(1)画像補正:読取対象の帳票画像を直接補正、
(2)認識補正:罫線抽出結果や、文字切出し・文字識別のパラメータや辞書などを変更、
の2種類がある。前記帳票読取の処理フローにおいて、前記(1)はステップ1004、前記(2)はステップ1007〜1009に反映される。
前記(1)画像補正の1例として、グレー輝度値の補正方法を説明する(図12)。本補正は帳票定義時と帳票読取時とでスキャナが異なる場合、グレー輝度値の特性が変ってしまうことがあるため、帳票読取時の帳票画像を帳票定義時の帳票画像に近づけるための手法である。まず2つのスキャナのプロファイルから、グレーにおける入力値輝度値と実測値との関係がかける。図12の場合、プロファイルA(帳票定義時のスキャン特性)は1201、プロファイルB(帳票読取時のスキャン特性)は1202である。補正方法としては、例えば帳票読取時に注目画素の輝度値がgであった場合、定義時の対応する実測値g'に当該画素の輝度値を変更する。その他、カラーや色の濃さについても同様に処理できる。このように画像補正は帳票定義時に用いた入力装置と読み取り対象の帳票画像データを入力した装置の例えば輝度値等に対する特性による影響を低減するための処理である。前記(2)認識補正の1例として、罫線抽出結果の補正方法を説明する(図13)。前記帳票読取手順の読取領域決定(ステップ1007)で、より正確な領域決定のためには罫線照合が必要である。しかし、帳票定義時と帳票読取時とでスキャナが異なる場合、認識できる線密度が変化してしまう場合には、例えば図13に示したように、帳票定義での罫線登録1301と罫線抽出結果1306とが異なってしまう場合がある。プロファイルの差異から抽出結果を補正して罫線照合するのが、本補正の目的である。
まずプロファイルAとBとの認識最大線密度に着目し、優れている(大きい)方の罫線情報を劣っている方の認識最大線密度にあわせて結果を補正する。図13の場合、帳票定義時の方が優れているため、劣っている方の認識最大線密度における罫線情報にあわせてパラメータを変換し(1304)、罫線補正結果1305を得る。その補正結果と帳票読取時の罫線抽出結果とを罫線照合(1307)するため、前記2スキャン特性が異なる場合でも、高精度な罫線照合が可能となる。
罫線補正の具体的手順の例を図14に示す。まずステップ1401において補正する罫線の集合Lと認識最大線密度dを入力する。補正対象の罫線集合Lは線密度が高精度な方の罫線情報であり、dは劣っている方の線密度である。たとえば図13の場合、Lは帳票定義内の罫線情報、dはプロファイルBの線密度1.6となる。次にL内の各2罫線l1, l2に対し、ステップ1404の各条件が成り立つならば、その2罫線を統合し1罫線とする(ステップ1405)。ステップ1404の条件中の罫線間距離は、図15に示すように、2罫線l1,l2上の各々の任意の点p,qにおいて2点間距離が最小となるときの距離とする。
その他スキャン最小線幅や最小線間隔などに差が在る場合にも同様に、例えば入力帳票画像データのプロファイルの方が劣っている場合には帳票定義をその最小線幅等に合わせて読み取りを行う。その他帳票読み取りのために文字の文字の切り出し又はパターン統合のためのパラメータを変更することも可能である。その他、文字認識にかすれ文字用の辞書を用意しておき、文字識別1009の際に用いる辞書を切り替えることができる。又、差異が大きい場合には出力結果にその旨若しくは信用度を算出して付加しておくことでより高精度な読み取り結果を得ることが可能となる。
最後に、スキャン状態検出手段の処理フローを図11にそって説明する。
まず新しく作成されたプロファイルをプロファイルサーバ221若しくはプロファイルDBを有する処理装置に入力する(ステップ1101)。次にそのプロファイルと同じスキャナの過去のプロファイルをプロファイルDBなどから検索(ステップ1102)、新しいプロファイルと比較して差異を計算する(ステップ1103)。以上のステップを実行した後、スキャナ異常の検出を実行する。まず新しいプロファイルの各特性値を参照し帳票処理システムの仕様をみたすか否かを判定(ステップ1104)、もし満たさない場合は、スキャナ異常としてスキャナ保有者ならびに図1のシステム提供者101に警告する(ステップ1105)。その他プロファイルの差異を計算した結果が所定の値以上の場合に警告するようにしてもよい。警告は例えば、ネットワークを介してメイルを用いたり、若しくは郵送、システム提供者が直接メンテナンスをかねて訪問するのでもよい。本警告により、システム提供者101が該当スキャナを調査して交換・修理などをする。また、該当スキャナがシステム利用者102や帳票処理希望者103のものであった場合には、システム提供者から、仕様を満たさない旨の警告と、仕様をみたすスキャナの紹介などをする。また、新しいプロファイルと過去のプロファイルとの差異がある閾値以上であった場合(ステップ1107)も同様に警告する。
本手段はプロファイル更新時もしくは新規作成時に実行する。なお新規作成時には、ステップ1102,1103,1106,1107は実行されない。実際の実施形態としては、メンテナンスサービスとしてサービス員が定期的に行うこと、もしくはシステム利用者に定期的にプロファイル作成用シートと読み取り画像を送信してもらうようにしてもよい。本構成によって精度の高い読み取りを実施すると同時に、その精度も保証することができる。
以上の様に本願は、帳票定義を該定義に用いた画像データの第1の入力装置のプロファイルと対応づけて記憶する記憶装置と、ネットワークを介して帳票画像データと該帳票画像データの入力に用いた第2の入力装置のプロファイルを取得する手段と、上記記憶装置から該帳票画像データの帳票定義と上記第1の入力装置のプロファイルとを読み出す手段と、
上記第1と第2の入力装置のプロファイルの差異を計算する手段と、上記計算手段の結果を用いて上記帳票画像データ若しくは上記帳票定義を補正する手段と、上記帳票画像データを上記帳票定義を用いて読み取る手段とを有することを特徴とする帳票読み取りシステムを開示する。又、上記システムをネットワークで構成する形態も開示する。
【0016】
【発明の効果】
本発明により、帳票定義時と帳票読取取時とでスキャン環境が異なる場合や、複数のスキャナを用いて帳票定義もしくは帳票読取を行う場合でも、単一の帳票定義DBを作成・利用でき、帳票定義作成作業の低減と帳票読取精度の低下を防ぐ効果がある。
さらに、経年劣化や故障などのスキャナ状態を自動的に検出できるため、システムのメンテナンス作業低減の効果がある。
【図面の簡単な説明】
【図1】図1は、本発明に係る関係者とその関係を示す図である。
【図2】図2は、本発明に係る帳票処理システムの構成例1を示す図である。
【図3】図3は、本発明に係る帳票処理システムの構成例2を示す図である。
【図4】図4は、帳票定義作成手順と帳票読取手順の従来例を示す図である。
【図5】図5は、本発明に係る帳票定義作成手順と帳票読取手順を示す図である。
【図6】図6は、プロファイル作成シートの例を示す図である。
【図7】図7は、プロファイルの例を示す図である。
【図8】図8は、スキャン特性抽出の処理フロー図である。
【図9】図9は、補正量計算手段の処理フロー図である。
【図10】図10は、帳票読取手段の処理フロー図である。
【図11】図11は、スキャン状態検出手段の処理フロー図である。
【図12】図12は、グレー輝度値の画像補正を説明する図である。
【図13】図13は、罫線抽出結果補正を説明する図である。
【図14】図14は、罫線補正の手順を説明する図である。
【図15】図15は、罫線間距離について説明する図である。

Claims (1)

  1. 帳票処理システムで取り扱いたい帳票を第1の帳票画像入力部(512)で電子的に取り込み、第1の帳票画像(513)を得て、さらに前記第1の帳票画像(513)を用いて第1のレイアウト情報を定義し、第1の帳票定義(515)を作成すると共に、前記第1の帳票画像入力部(512)のスキャン特性を知るため、プロファイル作成シートを前記第1の帳票画像入力部(512)で電子的に取り込み第1のスキャン特性抽出部(517)で第1のスキャン特性を抽出し、第1のプロファイル(518)を出力するための帳票定義作成部(510)と、
    処理したい前記帳票を第2の帳票画像入力部(522)で電子的に取り込み、第2の帳票画像(523)を取得し、前記第2の帳票画像入力部(522)のスキャン特性を知るため、前記プロファイル作成シートを前記第2の帳票画像入力部(522)で電子的に取り込み第2のスキャン特性抽出部(527)で第2のスキャン特性を抽出し、第2のプロファイル(528)を出力するための帳票読み取り部(520)とを有し、
    前記プロファイル作成シートには2本の横線と、その2本の横線の間に存在する線とを有する図形を含み、前記プロファイル作成シートを前記第1および前記第2の帳票画像入力部で電子的に取り込むに際し、前記図形の前記電子的な取り込み後に前記2本の横線の間に存在する線を認識できるか否かを調べることにより、第1および第2の認識最大線密度を抽出するものであり、
    前記第2のプロファイル(528)における第2の認識最大線密度d2の方が、前記第1のプロファイル(518)における第1の認識最大線密度d1より低くなっており、
    前記帳票読み取り部(520)で取り込んだ2本の罫線をl1およびl2とし、かつ、l1≠l2であり、かつ、この2罫線の角度差がθ以内であり、かつ、罫線間距離が1/d2未満である場合には、前記l1およびl2を1本の罫線として統合することを特徴とする帳票読み取りシステム。
JP2002109904A 2002-04-12 2002-04-12 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム Expired - Fee Related JP4185699B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002109904A JP4185699B2 (ja) 2002-04-12 2002-04-12 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム
CNB021513759A CN1198236C (zh) 2002-04-12 2002-11-21 单据读出系统和单据读出方法
KR1020020083862A KR20030080998A (ko) 2002-04-12 2002-12-26 장표 판독 시스템, 장표 판독 방법 및 그를 위한 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002109904A JP4185699B2 (ja) 2002-04-12 2002-04-12 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム

Publications (2)

Publication Number Publication Date
JP2003303315A JP2003303315A (ja) 2003-10-24
JP4185699B2 true JP4185699B2 (ja) 2008-11-26

Family

ID=29243212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002109904A Expired - Fee Related JP4185699B2 (ja) 2002-04-12 2002-04-12 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム

Country Status (3)

Country Link
JP (1) JP4185699B2 (ja)
KR (1) KR20030080998A (ja)
CN (1) CN1198236C (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006079513A (ja) * 2004-09-13 2006-03-23 Toppan Printing Co Ltd 生産履歴管理システム
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US8885229B1 (en) 2013-05-03 2014-11-11 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
JP2007141159A (ja) * 2005-11-22 2007-06-07 Fuji Xerox Co Ltd 画像処理装置、画像処理方法、及び画像処理プログラム
JP4977368B2 (ja) 2005-12-28 2012-07-18 富士通株式会社 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9311531B2 (en) 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
CN105095842B (zh) * 2014-05-22 2018-12-11 口碑控股有限公司 一种单据的信息识别的方法和装置
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11972197B2 (en) 2018-08-27 2024-04-30 Kyocera Document Solutions Inc. OCR system

Also Published As

Publication number Publication date
CN1452119A (zh) 2003-10-29
CN1198236C (zh) 2005-04-20
KR20030080998A (ko) 2003-10-17
JP2003303315A (ja) 2003-10-24

Similar Documents

Publication Publication Date Title
JP4185699B2 (ja) 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム
JP5204208B2 (ja) レシートデータ照合支援装置およびレシートデータ照合支援プログラム
JP5997544B2 (ja) 情報処理装置、伝票編集端末、情報処理方法、およびプログラム
CN105182935B (zh) 一种生产管理系统及其控制方法
CN103975342B (zh) 用于移动图像捕获和处理的系统和方法
US20090147988A1 (en) Image transfer with secure quality assessment
US8045791B2 (en) System and method for measuring digital images of a workpiece
US8724925B2 (en) Misalignment detecting apparatus, misalignment detecting method, and computer program product
CN102811863A (zh) 打印图像的自动检查
CN105160339A (zh) 一种二维码打印质量在线评估方法
US7680339B2 (en) Image processing method and apparatus for edge detection in an image
CN105809814A (zh) 支持多种票种的发票认证系统及方法
US8976428B2 (en) Image information managing method, image information managing apparatus and image information managing system for preparing and measuring an evaluation chart
CN107798087A (zh) 数据录入方法、系统、计算机设备及可读存储介质
CN112883858A (zh) 报销发票审核方法、装置和存储介质
CN106295923A (zh) 行政自助查询方法及其终端
US8861019B2 (en) Image evaluating apparatus, image evaluating method, and non-transitory storage medium for reading and quantifying an evaluation chart
CN110991434B (zh) 自助终端证件识别方法及装置
CN110502605B (zh) 基于人工智能技术的电力资产lcc成本归集系统
CN115456984A (zh) 基于二维码高速识别图像识别缺陷检测系统
CN115620329A (zh) 一种基于人工智能的图章跑偏智能识别方法
CN115376139A (zh) 基于ocr高速图像识别的标签采集分析系统
CN106240155B (zh) 在印刷过程的预备级中创建标记的方法
WO2024085229A1 (ja) 画像処理装置、画像処理システム、情報コード検索方法及び情報コード検索プログラム
JP2006195534A (ja) 査定評価システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050203

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050223

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060510

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060510

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080902

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080908

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130912

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees