JP2011022718A - 情報処理システム、情報処理方法 - Google Patents

情報処理システム、情報処理方法 Download PDF

Info

Publication number
JP2011022718A
JP2011022718A JP2009165964A JP2009165964A JP2011022718A JP 2011022718 A JP2011022718 A JP 2011022718A JP 2009165964 A JP2009165964 A JP 2009165964A JP 2009165964 A JP2009165964 A JP 2009165964A JP 2011022718 A JP2011022718 A JP 2011022718A
Authority
JP
Japan
Prior art keywords
information
image data
entry
unit
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009165964A
Other languages
English (en)
Inventor
Makoto Akimoto
誠 秋元
Isao Imai
功 今井
Yoko Sato
容子 佐藤
Katsuhiko Takachio
勝彦 高知尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2009165964A priority Critical patent/JP2011022718A/ja
Publication of JP2011022718A publication Critical patent/JP2011022718A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】文字コードの修正作業が行われる際に個人が特定される情報の漏洩を防ぐ情報処理システムを提供する。
【解決手段】記入欄に記載された帳票情報を画像データに変換し識別情報を付して記憶装置に書込む読込み部と、帳票の種別及び記入欄の位置情報を持つシート定義情報に基づき画像データの記入欄の文字列をコード変換して認識データを作成し、画像データと対応付けて記憶装置に書込む識別/認識部と、認識データの確認、修正を行う作業者を設定するアサイン部と、シート定義情報に、作業者用の画面表示の為の変換ルールを適用して作成された画面定義情報に含まれる、画像データ、認識データ及び文字入力する為のエントリフィールド夫々の表示位置に基づいて画像データ、認識データ、エントリフィールドを画面表示するエントリ部と、作業者による認識データの確認、修正に伴う確定データを画像データと対応付けて記憶装置に書込む登録部とを有する情報処理システムを提供する。
【選択図】図2

Description

本発明は、紙面帳票を電子データに変換し、管理する情報処理システム、情報処理方法に関する。
近年、J−SOX法、個人情報保護法などが施行され、法令遵守の観点で、業務上発生する契約や取引の事実を証明するための「契約書」、「付帯情報」などを電子データ化して保管し、支払業務、監査などの際に参照、分析することが必須業務となっている。
また近年、金融業界、保険業界等で扱う商品は増加しており、契約形態が多様化している。それに伴い帳票の種類、量ともに増大しており、ピーク時は、50万から100万枚の契約帳票が発生する。
一方で、帳票に記入されている事項を電子データ化し、管理するシステムが構築されている。帳票管理システムは、OCR(OCR:Optical Character Recognition)の機能を用いて、紙面である帳票(以下、紙面帳票と称す)を電子データ化する。文字認識により電子データ化された文字列に対し、作業者は目視でOCRでの誤認識の有無を確認する。誤認識とは、誤読や不読のことである。ここで認識誤りがあった場合、作業者は電子データに対して、誤読の場合は修正を行い、不読の場合はデータ補間を行う。
また関連技術として、以下の技術が知られている。
特開平11−167603号公報 特開2008−90536号公報
上述のように、紙面帳票が増加しているため、紙面帳票を搬送するコスト、労力も増加する。また、個人情報保護の観点で、個人が特定される情報を外部へ漏洩させないシステムの構築が急務となっている。
本発明は上述した問題点を解決するためになされたものであり、紙面帳票を動かすための労力やコストを削減し、また、帳票の電子データの修正、補間作業を複数の作業者に従事させ、この際に個人が特定されないよう表示することができる情報処理システム、情報処理方法を提供することを目的とする。
本発明の一態様に係る情報処理システムは、情報を記憶するための記憶装置と、記入欄に記載された帳票の情報を画像データに変換し、当該画像データに識別情報を付して前記記憶装置に書き込む読み込み部(1)と、前記帳票の種別情報および帳票における記入欄の位置情報を有するシート定義情報に基づき、前記画像データの記入欄に記載された文字列を文字コードに変換して認識データを作成し、当該認識データと前記画像データとを対応付けて前記記憶装置に書き込む識別/認識部(2)と、前記認識データの確認又は修正を行う作業者を設定するアサイン部(3)と、前記シート定義情報に、前記作業者が認識データの確認または修正を行う際の画面表示のための変換ルールを適用して作成された画面定義情報に含まれる、前記画像データ、認識データおよび前記作業者が文字を入力するためのエントリフィールドのそれぞれの表示位置に基づいて、前記画像データ、認識データおよびエントリフィールドを画面表示するエントリ部(4)と、前記エントリ部(4)により画面表示された認識データに対する前記作業者による確認または修正に伴い確定したデータを、前記画像データと対応付けて前記記憶装置に書き込む登録部(6)と、を有する。
また、本発明の一態様に係る情報処理システムは、帳票における記入欄の位置情報が該記入欄の識別情報ごとに定義されたシート定義情報(74)と、前記記入欄の識別情報ごとに該記入欄の画像データおよびユーザが文字を入力するためのエントリフィールドをエントリ部(4)の画面に表示すべき位置情報が定義された画面定義情報(75)とを記憶する記憶装置を有する管理部(7)と、前記シート定義情報(74)における前記記入欄の識別情報ごとに該記入欄の位置情報を画面に表示すべき位置情報に変換するための定義情報と表示すべきエントリフィールドの定義情報とを定義した変換ルール(76)に基づいて、前記シート定義情報(74)から前記画面定義情報(75)を作成し、前記記憶装置に記憶させる画面定義作成部(53)と、記入欄に記入済みの帳票を画像データに変換する読み込み部(1)と、該帳票の画像データ内の記入欄の画像データを前記シート定義情報(74)に基づいて取得し、該記入欄の画像データと該記入欄の識別情報とを対応付けて認識データ(73)として抽出する識別/認識部(2)と、前記帳票の記入欄の画像データとエントリフィールドとを前記画面定義情報(75)に基づいて画面に表示するエントリ部(4)と、前記エントリ部(4)により画面に表示されたエントリフィールド上の文字を確定し、該文字と前記記入欄の識別情報とを対応づけ、これらを前記帳票の画像データとともに該帳票ごとにファイリング部(8)の記憶装置に登録する登録部(6)と、を有する。
本発明の一態様に係る情報処理方法は、コンピュータが、帳票記入欄に記入済みの帳票を画像データに変換し、記憶装置に識別情報を付して該画像データを書き込み、少なくとも、前記帳票の種別および帳票内の記入欄の位置情報を含むシート定義情報に基づき、前記画像データの記入欄に記入された文字列を文字コードに変換して認識データを作成し、前記画像データと対応付けて前記記憶装置に書き込み、前記認識データの確認又は修正を行う作業者を設定し、前記作業者による認識データの確認または修正を行う際の表示レイアウトに関する変換ルールと前記シート定義情報に基づき作成された、前記画像データ、認識データおよび前記作業者が文字を入力するためのエントリフィールドの位置情報を含む画像定義情報に基づき、前記画像データ、認識データおよびエントリフィールドを画面表示し、画面表示された認識データの前記作業者による確認または修正に対する確定に伴い、確定したデータを前記画像データおよび認識データと対応付けて前記記憶装置に書き込む処理を実行する。
帳票の画像データから読み込まれた文字コードの確認、修正作業を複数の作業者に従事させることができ、大量の帳票を処理することができる。また、文字コードの確認、修正作業の際に、個人が特定できる情報の漏洩を防ぐことができる。
本実施の形態に係る帳票管理システムのハードウェア構成の一例を示す模式図である。 本実施の形態に係る帳票管理システムの一例を示す機能ブロック図である。 本実施の形態に係る画面定義作成部の表示例を示す図である。 本実施の形態に係る画面定義作成部の処理を説明する図である(マスク処理)。 本実施の形態に係る画面定義作成部の動作を説明するフローチャートである(マスク処理)。 本実施の形態に係るシート定義XMLの表記例を示す図である(マスク処理)。 本実施の形態に係る画面定義XMLの表記例を示す図である(マスク処理)。 本実施の形態に係るシート定義XML、画面定義XML内のデータ構造の一例を示す図である(マスク処理)。 本実施の形態に係るエントリ部の表示例を示す図である(マスク表示処理)。 本実施の形態に係るエントリ部の動作を説明するフローチャートである(マスク表示処理)。 本実施の形態に係る画面定義作成部の処理を説明する図である(切出し処理)。 本実施の形態に係る画面定義作成部の動作を説明するフローチャートである(切出し処理)。 本実施の形態に係るシート定義XML、画面定義XML内のデータ構造の一例を示す図である(切出し処理)。 本実施の形態に係るエントリ部の表示例を示す図である(切出し表示処理)。 本実施の形態に係るエントリ部の動作を説明するフローチャートである(切出し表示処理)。 本実施の形態に係る画面定義作成部の処理を説明する図である(シャッフル処理、タイプ別処理)。 本実施の形態に係る帳票管理システムを保険業務に適用した場合の例を示す図である(センター集中スキャン)。 本実施の形態に係る帳票管理システムを保険業務に適用した場合の例を示す図である(拠点分散スキャン)。 本実施の形態で使用されるコンピュータシステムのハードウェア構成の一例を示す図である。
図1は、本実施の形態に係る帳票管理システム(情報処理システム)のハードウェアの構成を示す模式図である。帳票管理システム100は、定義情報作成端末50A、イメージスキャナ1A、読取端末2A、管理用端末3A、訂正端末4A、エントリ管理サーバ7A、ファイリングサーバ8を有する。これら各装置は、有線または無線のネットワーク200に接続されており、互いにデータ通信を行うことができるものとする。
図2は、図1で示したハードウェア構成で実現することができる機能の一例を示す機能ブロック図である。帳票管理システム100は、イメージスキャナ1Aに該当する読み込み部1、読取端末2Aに該当する識別/認識部2、訂正端末4Aに該当するエントリ部4、管理用端末3Aに該当するアサイン部3、確定部5、登録部6を有する。また、帳票管理システム100は、エントリ管理用サーバ7Aに該当するエントリ管理部7(管理部)、ファイリングサーバ8(ファイリング部)、および定義情報作成端末50Aに該当する定義情報作成部50を有する。尚、図2において、実線矢印はデータのインプット、アウトプットの流れを示し、破線矢印は処理の流れを示している。
読み込み部1は、顧客が情報を記入した紙面帳票である顧客記入済帳票70をスキャンし、顧客記入済帳票70の画像データである帳票画像データ72を出力するイメージスキャナである。
識別/認識部2は、帳票画像データ72を取得し、帳票画像データ72の識別情報を帳票画像データ72内に付与するとともに、手書きの記入事項を文字認識して文字コードに変換するPC(Personal Computer)である。識別/認識部2は、帳票画像データ72がどの様な帳票であるか(例えば新規登録用帳票なのか、変更届け用帳票なのか、等の帳票の種類を示す帳票種別)を識別する。識別方法としては、例えば帳票種別ごとに帳票上に予め付されたバーコードを認識することで識別する。識別/認識部2には、予めバーコードの読み取り値と画像データであるテンプレート画像データの識別情報(後述)との対応関係が保持されており、識別された後に、対応するテンプレート画像データの識別情報を帳票画像データ72に付与する。
また、識別/認識部2は、識別された帳票種別に応じた定義情報であって、XML形式で表記されたシート定義XML74を、あらかじめ記憶されている記憶装置にから取得する。識別/認識部2は、シート定義XML74の定義に基づき、帳票内のいずれの記入欄(氏名、住所、電話番号等、顧客が記入する欄。以下、記入欄のことをフィールドと称す)にどのような文字列が記入されているかを認識し、電子データ化(文字コード化)するOCR機能を有する。なお、ここでいう記入欄への記入とは、顧客が帳票に直接手書きで記入したものに限らず、記入欄に印刷・コピー・転写などによりあらかじめ記載されているものをも含むものとする。識別/認識部2は、このシート定義XML74の定義に基づいて、認識された文字列データ(文字コードの配列)と認識対象のフィールドの識別情報(記入欄の識別情報、またはラベル)とを対応づける。この対応に基づいて、フィールドごとに設けられているタグの値として文字列データを埋め込むことにより、この対応関係とともに認識された文字列データをXML形式に則った認識データXML73として出力する。また識別/認識部2は、認識対象の帳票画像データ72の識別情報を認識データXML73に付して出力する。
アサイン部3は、修正作業やデータ補間作業を行うユーザ(以下、パンチャーと称す)それぞれの業務時間情報(業務開始時間、業務終了時間)をエントリ管理部7内のエントリ管理用DB80(DB:Database)から取得し、この業務時間情報に基づき、いずれのパンチャーにの確認又は修正、データ補間の作業をさせるかを決定する。またアサイン部3は、割り当てられたパンチャーの識別情報(ユーザ名称)、認識データXML73、画面定義XML75(後述)との対応関係をエントリ管理DB80に保持させる。
エントリ部4は、アサイン部3によって割り当てられたパンチャーによる文字列データの確認、修正、補間作業を支援する訂正端末4Aに該当するPCである。識別/認識部2による誤認識があった場合等、データ上の不備を是正するために、文字列データを修正、データ補間する必要がある。エントリ部4は、帳票画像データ72と、対応する認識データXML73の文字列データ(フィールドによってはチェックボックス)をそれぞれ画面定義XML75の定義内容に基づきPCの画面に表示し、パンチャーによる文字列データの修正、補間作業を支援する。
エントリ部4は、Webブラウザを有し、このWebブラウザ上に帳票画像データ72、認識された文字列データをパンチャーが修正できる形式で表示する。帳票画像データ72の表示や文字列データの配置等のレイアウトは、画面定義XML75によって定義されている。
エントリ部4は、さらに、パンチャーごとに、帳票において個人情報が記入されたフィールドのうちの一部のフィールド画像のみ(例えば、氏名のみ、住所のみ、生年月日のみ、または生年月日と性別との組のみ)を表示し、また認識データXML73内の文字コードのうちで、表示された一部のフィールドに対応した文字コードのみを、修正可能な状態で表示する。いずれのフィールドを表示するかは、画面定義XML75によって定義されている。
個人情報は、例えば氏名、電話番号、住所、性別、生年月日、E−Mailアドレス等が該当する。これら個人情報のうちで、例えば性別だけでは個人を特定することはできず、これら個人情報をそれぞれ組み合わせることで、個人が特定される。本実施の形態のエントリ部4は、例えば生年月日のフィールドのみをパンチャーに対して表示し、パンチャーは、表示された生年月日のみのフィールドを連続して修正することで、個人の特定を防ぐことができる。
確定部5は、パンチャーがエントリ部4を用いて必要に応じて修正、補間された文字列データ(以降、修正、補間された文字列データを有するデータ構造をクリーンデータと称する)が、同一帳票内で一律に揃ったかを判定し、揃った場合に、その帳票に関するジョブの完了を確定する。上述のように、本実施の形態ではフィールドごとに修正作業が行われるため、同一の帳票において、氏名の修正作業は完了したが、住所の修正作業が未完であるなど修正作業の進捗状況に差が生ずる。確定部5は、この進捗状況を確認するユニットである。尚、ここでの確定とは、エントリ管理用DB80内の帳票ごとに設けられた所定フラグに値をセットすることを指す。
登録部6は、確定部5によって確定された帳票データ一式(帳票画像データ、クリーンデータ)を、ファイリングサーバ8の確定ファイリングDB81に保持させる。
エントリ管理部7は、修正、補間作業全般を管理するサーバであり、エントリ管理用DB80を有する。エントリ管理用DB80は、アサイン部3によるパンチャーの割り当て結果(パンチャーの識別情報、認識データXML73、画面定義XML75の対応関係)、および、確定部5による帳票画像データ72の識別情報と確定フラグとの対応関係の各データを少なくとも保持する。エントリ管理用DB80は、これら以外にも、帳票画像データ72、シート定義XML74、認識データXML73、画面定義XML75、およびエントリ部4の支援によって修正、補間された文字列データを有するクリーンデータの各データファイルを保持する。また、エントリ管理部7には、WEBサーバプログラムが備えられており、エントリ部4内のWEBブラウザからのデータ要求に応じたデータをエントリ部4に送信する。
尚、本実施の形態では、アサイン部3、確定部5、登録部6は、管理用端末(PC)内に実装される。
ここで、帳票画像データ72、認識データXML73、クリーンデータのデータ構造をまとめ、またエントリ管理用DB80、確定ファイリングDB81内で記憶されているデータをまとめる。尚、以下に示すデータはあくまで一例である。
帳票画像データ72は、以下のデータで構成されている。
・画像データ識別情報(例:ESheet0001)
・テンプレート画像データの識別情報(例:Sheet1)
・JPEG形式の実画像データ
認識データXML73は、以下のデータで構成されている。
・認識データXMLの識別情報(例:ND0001)
・帳票画像データ識別情報(例:ESheet0001)
・フィールドの識別情報,認識された文字列データ
(例:F1,"東芝・・・")
(例:F2,"264687564・・・")
この例では、「F1」というラベルが一つ目のフィールド(記入欄)の識別情報であり、"東芝・・・"がこのフィールド(記入欄)において認識された文字列データである。また、「F2」というラベルが二つ目のフィールド(記入欄)の識別情報であり、"264687564・・・"がこのフィールド(記入欄)において認識された文字列データである。
クリーンデータは、以下のデータで構成されている。
・クリーンデータの識別情報(例:C_0001)
・画像データ識別情報(例:ESheet0001)
・フィールドの識別情報,修正された文字列データ
(例:F1,"東芝・・・")
(例:F2,"264687565・・・")
このクリーンデータの例では、「F2」について認識された文字列データである"264687564・・・"の左から9桁目である「4」が、ユーザによって「5」に修正されたことを表している。
エントリ管理用DB80は、以下のデータをそれぞれ対応関係として記憶する。
・ユーザ識別情報,業務開始時間,業務終了時間,認識データXMLの識別情報(複数),画面定義XMLの識別情報
(例:ユーザA,2009/01/010 9:30-18:30,ND0001,ND0002,・・・,Gdef001)
(例:ユーザB,2009/01/010 9:00-18:00,ND0001,ND0002,・・・,Gdef001)
(例:ユーザC,2009/01/010 17:00-20:00,ND0101,ND0102,・・・,Gdef002)
・画像データ識別情報,確定フラグ(例:ESheet0001,1)
確定ファイリングDB81は、以下のデータを記憶する。
・クリーンデータ
・帳票画像データ72
上述の読み込み部1、識別/認識部2、アサイン部3、エントリ部4、確定部5、登録部6、エントリ管理部7、ファイリングサーバ8は、運用時に用いられる。一方、以下に説明する定義情報作成部50は、帳票管理の運用がなされる際の各種データを、初期設定(または運用中)において作成するための開発環境である。すなわち、定義情報作成部50によって事前に定義情報が作成され、これら定義情報に基づき、帳票の認識、修正作業がなされる。
定義情報作成部50は、シート定義XML74、画面定義XML75を作成する開発環境であり、テンプレート読み込み部51、シート定義作成部52、画面定義作成部53を有する。
テンプレート読み込み部51は、事前に作成された紙面帳票のテンプレート(すなわち、シート定義XML74として未定義の帳票)である帳票テンプレート77を読み込み、画像データであるテンプレート画像データ78を出力するイメージスキャナである。
シート定義作成部52は、このテンプレート画像データ78を表示することで、テンプレート画像データ78内の各フィールドに関する情報を定義したシート定義XML74の作成を支援するPCである。シート定義作成部52は、表示されたテンプレート画像データ78に対するキーボード、マウスを用いたユーザ操作によって、識別/認識部2による処理の際に用いられるシート定義XML74を出力する。シート定義XML74には、識別/認識部2が帳票画像データ72内のいずれのフィールドを認識すべきかが定義されたファイルであり、具体的には以下の情報が少なくとも定義されている。
シート定義XML74ごとに、以下の情報が定義されている。
・テンプレート画像データ78の識別情報(イメージ名)
・当該テンプレート画像データ78の画像サイズ
以下の情報は、テンプレート画像データ78内のフィールドごとに定義される。
・フィールドの識別情報(フィールド名)
・テンプレート画像データ78の左上端を基準点とした当該フィールドの位置情報((x0,y0)、(x1,y1)の座標)
・当該フィールドの読取タイプ(英字、数字、漢字、ひらがな、カタカナ、またはこれら混在なのかの別)
・当該フィールドのフィールド種別(当該フィールドが例えば氏名記入欄なのか、電話番号記入欄なのか、またはチェック印の記入欄なのかの別)
・上限文字数
上記位置情報は、表示されたテンプレート画像データ78に対して、ユーザがマウスのドラッグ、ドロップ操作を行い、フィールド領域を指定することで得られるものとするが、シート定義作成部52が矩形領域を認識し、その矩形領域の各頂点をフィールドの位置情報としてもよい。尚、その他の情報はシート定義作成部52に表示されるユーザインターフェイスを介してユーザが入力する。
画面定義作成部53は、シート定義XML74、テンプレート画像データ78を取得し、エントリ部4によって修正、補間作業がなされる際に使用される画面定義XML75の作成を支援するPCである。画面定義XML75は、エントリ部4のWEBブラウザ上での表示レイアウト(いずれの位置に帳票画像データ72を表示し、いずれの位置に認識データXML73内のデータを表示するか)を定義するとともに、帳票画像データ72内の各フィールドと、テキストボックス、チェックボックスとの対応を定義する。テキストボックスとは、文字をユーザが入力するためのエントリフィールドである。このエントリフィールドは、認識された文字列データがあらかじめ表示され、パンチャーによって必要に応じて修正をさせるものとしてもよいし、または、ブランクの状態で表示され、パンチャーがイメージを見て文字を入力(いわゆるイメージエントリ)するものとしてもよい。
画面定義作成部53の表示例を図3に示す。図3に示すように、画面定義作成部53による表示は、アイテム配置領域90、帳票表示領域91、属性設定表示領域92の3つの領域を表示する。
アイテム配置領域90は、テキストボックス、チェックボックス等のアイテムをユーザに配置させることで、エントリ部4による表示のレイアウトを決定する領域である。帳票表示領域91は、テンプレート画像データ78を表示する領域である。例えば、帳票表示領域91において、帳票のお名前(氏名)の記入欄には「東芝」と記入されており、その部分を含む帳票の画像データが表示されている。属性設定表示領域92は、アイテム配置領域90内の各種アイテムの属性(テキストボックスのサイズ、アイテムの配置位置情報(アイテム配置領域90による配置位置と連動する)、テキストボックス内のデータを修正可能にするか等)をユーザに定義させる領域である。
ユーザは、図3に示す画面を用いて、テンプレート画像データ78の各フィールドと、各アイテムとの対応を決定し、画面定義作成部53は、この対応関係を画面定義XML75に出力する。ユーザは、例えばテンプレート画像データ78のあるフィールドをマウスクリックで選択し、その後対応させたいアイテムを選択することで、フィールド(フィールドの識別情報)とアイテムとの対応関係が構築される。
また、画面定義作成部53は、変換ルール76に基づき、テンプレート画像データ78のイメージサイズを、エントリ部4により訂正端末4AのPCの画面上に表示される表示サイズ(例えば640ピクセル×480ピクセル)となるように変換するとともに、イメージサイズの変換に伴うフィールド位置の座標変換を行う。ここでは、シート定義XML74内のフィールドの位置情報に対し変換がなされ、変換後の位置情報が画面定義XML75に出力される。尚、本実施の形態の変換ルール76は、XSLT(XML Stylesheet Language Transformations)などで表記されているものとする。すなわち、変換ルール76は、記入欄の識別情報ごとに、記入欄の位置情報を画面に表示すべき位置情報に変換するための定義情報と、表示すべきエントリフィールドの定義情報とを、少なくとも定義する。
さらに画面定義作成部53は、変換ルール76に基づき、いずれのフィールドをユーザに表示するかの対応情報を画面定義XML75に付与する。
図4に基づき、一部の情報をマスクした状態で表示させるための画面定義XML75の作成について説明する。図4(A)は、変換ルール76に設定されているユーザ名称とマスク対象フィールドとの関係を示したテーブルであり、図4(B)はデータの入出力を示す模式図である。
変換ルール76には、前述のエントリ部4が表示すべき記入欄やエントリフィールドの位置情報に関する変換ルールの他に、パンチャーに対応した表示情報に関するルールが設定されている。具体的にはパンチャーの識別情報(ユーザ名称)と、当該パンチャーに対してマスクするフィールド種別との対応関係が設定されている(図4(A)参照)。画面定義作成部53は、シート定義XML74を取得し、変換ルール76内の対応関係を付与した画面定義XML75を作成する(図4(B)参照)。
本例における画面定義作成部53の処理について、図5のフローチャートを参照しつつ説明する。以下の例は、パンチャーが「ユーザC」、マスク対象フィールドが「氏名」、「住所」、「電話番号」であるとして説明する。
画面定義作成部53は、シート定義XML74を取得し(S1)、シート定義XML74内で定義されているテンプレート画像データ78の識別情報、フィールドの識別情報、読取タイプ、フィールド種別、上限文字数を流用して画面定義XML75の雛形を作成する(S2)。
画面定義作成部53は、ステップS2で作成した画面定義XML75の雛形に対し、画面定義XML自体の識別情報、アイテムの識別情報、アイテムの属性情報を画面定義XML75に付与する(S3)。また、画面定義作成部53は、表示レイアウトに関する情報、およびフィールドの識別情報とアイテムとの対応関係を付与する(S4)。フィールドの識別情報とアイテムとの対応関係は、フィールドの識別情報の項目の中にアイテムの識別情報を加えることでなされる。
画面定義作成部53は、シート定義XML74から、フィールドの位置情報を取得し、テンプレート画像データの画像サイズと帳票画像の表示サイズとの縦サイズの比率、横サイズの比率を算出し、算出された比率に基づきフィールドの座標変換を行う。画面定義作成部53は、変換後のフィールドの位置情報を画像定義XML75に付与する(S5)。
画面定義作成部53は、変換ルール76のユーザ名称、マスク対象フィールドを1レコード取得する(S6)。ここではユーザ名称が「ユーザC」、マスク対象フィールドが「氏名」、「住所」、「電話番号」のレコードが取得されたものとする。
画面定義作成部53は、フィールド種別が「氏名」、「住所」、「電話番号」であるフィールドの位置情報をシート定義XML74から取得し、取得した位置情報に対し、ステップS5と同様に、イメージサイズの変換に伴う座標変換処理を行う(S7)。
画面定義作成部53は、マスク情報、ユーザ情報の項目を設け、ユーザ情報には「ユーザC」を設定し、マスク情報には、ステップS7で変換された位置情報、マスク対象のフィールドの識別情報を設定し、画面定義XML75に、これらマスク情報、ユーザ情報を付与する(S8)。
画面定義作成部53は、変換ルール76に登録されている全てのレコードに対しステップS2からステップS8までの処理を行う(S9、NoからS2へのループ)。全てのレコードに対しステップS2からステップS8までの処理が行われた場合(S9、Yes)、処理は終了する。
図6にシート定義情報のXML表記例を示す。
各フィールドごとに、フィールドの設定情報がタグを用いて定義されている。field というタグにおいて、field_id はフィールドの識別情報(具体的には「F1」や「F2」なる値)を定義している。また、fieldname は、当該フィールドのフィールド種別(具体的には、「F1」フィールドは「氏名」記入欄であり、「F2」フィールドは「電話番号」記入欄であること)を定義している。また、field_attr は、当該フィールドの読取タイプ(具体的には、「F1」フィールドは漢字、ひらがな、カタカナなどの“混在”タイプであり、「F2」フィールドは“数字”タイプであること)を定義している。
そして、string_data タグは、このシート定義情報においては、値が入っていない。このタグの値として、後に、識別/認識部2(OCR)で読み込まれた文字列データが埋め込まれたものが、認識データXML73となる。その値は、さらに、必要に応じてエントリ部4(訂正端末4A)によって訂正がなされることになる。
string_maxlen タグは、フィールドの上限文字数(具体的には、氏名記入欄である「F1」フィールドは最大256文字であり、電話番号記入欄である「F2」フィールドは最大20文字であること)を定義している。
region タグは、帳票の左上端を基準点とした当該フィールドの位置情報((x0,y0)、(x1,y1)の座標)の値を定義している。
図7に画面定義情報のXML表記例を示す。表示レイアウトに関する情報、マスク情報、そして各フィールドに関する情報が、各タグを用いて表記される。
また図8に、本例によるシート定義XML74の定義情報例(図8(A))、画面定義XML75の定義情報例(図8(B))を示す。図8(A)のシート定義XML74の例は、便宜的に、項目およびその値(例)を表形式で示しているが、各項目はタグとして、その値はそのタグの値として、図6のXML表記のように表記して、XMLデータとして取り扱うことが出来る。図8(B)の画面定義XML75の例についても同様である。
そして、この両者について、各フィールドを対応付ける(紐付ける)ものが、フィールドの識別情報である。このフィールドの識別情報である「F1」「F2」「F3」といった値(ラベル)が、シート定義XML74(図8(A))と画面定義XML75(図8(B))とで同一であれば、両者のフィールドが対応付け(紐付け)られ、前者から後者に、変換ルール76に基づいて変換が可能になる。
例えば、「F1」という識別情報を持つフィールドの位置情報をみると、シート定義XML74(図8(A))では、(560,642),(690,743)との座標により特定される紙面帳票上の画像データを、F1なる氏名記入欄としてOCRで読み込む(認識する)べきことを定義している。そして、この定義された値を変換ルールに基づいて座標変換した値が、画面定義XML75(図8(B))に示されるように、フィールドの位置情報(座標変換後)である(143,171),(176,198)なる座標であって、これが、当該フィールドに対応する「アイテム」(この「F1」記入欄の例では、「アイテムの属性情報」で定義されるように、修正不可のテキストボックス)をエントリ画面上に表示すべきことを定義しているのである。
このように、シート定義情報と変換ルールさえあれば、それに対応するエントリ画面が自動的に作成されることになる。
図9に、マスク処理が施されたエントリ部4による表示例を示す。パンチャーは、作業を行う前に、ユーザID、パスワードをエントリ部4に入力し、ユーザ認証を行う。エントリ管理部7は、パンチャーに対応した画面定義XML75に基づき、帳票画像データ72を画面定義XML75内で定義されたサイズに変換する。その後、エントリ管理部7は、画面定義XML75内で定義されたマスク情報に基づき、表示させない情報についてはマスク処理を施し、また、マスク処理がなされたフィールドに対応するアイテムでは、文字列データが表示しないように制御された画面をエントリ部4に表示させる。図9の例では、住所、電話番号、氏名に関する情報についてはマスク処理が施され、その他の情報は表示されている例である。ここでは、「車名」という記入欄について「スズキ」と記入されており、その記入済みの記入欄の画像データが切り出されて表示され、また、「車名」というテキストボックスには「スズキ」という文字列がエントリされている。尚、エントリ部4は、いずれかのアイテムが選択された場合に、帳票画像データ72の該当するフィールドをポップアップ表示する。
ここで、このマスク表示処理について、図10のフローチャートを参照しつつ説明する。
まず、ユーザID(ユーザ名称)およびパスワードがエントリ部4から入力されることで、エントリ管理部7は、ユーザ認証を行い(S101)、該当するユーザの画面定義XMLの識別情報を、エントリ管理用DB80内に保持されている、ユーザ識別情報と画面定義XMLの識別情報との対応関係から取得する(S102)。
エントリ管理部7は、エントリ管理用DB80内に保持されている対応関係で示された認識データXML73を1つ取得し、取得した認識データXML73から帳票画像データ識別情報を取得する(S103)。エントリ管理部7は、取得された帳票画像データ識別情報を有する帳票画像データ72を取得し、該当する実画像データのサイズをエントリ部4が表示するサイズに変換する(S104)。
エントリ管理部7は、画面定義XML75からマスク対象フィールドの位置情報を取得し(S105)、ステップS104で変換された実画像データに対し、当該位置情報で示された領域をマスクする。その後、エントリ部4は、マスク処理された画像データを表示する(S106)。
エントリ管理部7は、画面定義XML75からマスク対象フィールドの識別情報を取得し、さらに、該当するフィールド以外のアイテム(テキストボックス等)の属性情報を取得し、この属性情報に基づき、エントリ部4に対し該当するアイテムを表示させる(S107)。
エントリ管理部7は、マスク対象以外のフィールド識別情報を画面定義XML75から取得し、さらに、取得された当該フィールド識別情報に対応する文字列データを認識データXML73から取得する。エントリ管理部7は、取得された文字列データを対応するアイテム上に表示する(S108)。尚、フィールドの識別情報が用らいれることで、文字列データとアイテムとが対応する。
パンチャーは、エントリ部4で表示されている帳票画像データと文字列データを比較し、誤りがある場合はアイテム内の文字列データを書き換えることで修正する。
帳票の修正作業が終わり、次の認識データXMLがある場合、すなわち、エントリ管理用DB80内の対応関係で、次の認識データXMLの識別情報がある場合(S109、Yes)、処理はS103に戻り、次の認識データXMLが取得される。一方、次の認識データXMLの識別情報がない場合(S109、No)、処理は終了する。
尚、図10の各処理は、データ等をエントリ管理部7から取得し、処理自体はエントリ部4が行ってもよい。また、ステップS106のマスク処理は、帳票画像データ72の表示レイヤ、マスク用レイヤの2つのレイヤを重ねて表示させる処理であってもよいし、また、帳票画像データ72に対しマスク情報で設定された領域を塗りつぶす処理を行い、この処理が施された画像が表示されてもよい。
次に、他の例について説明する。図11は、一部の情報のみを連続して表示させるための画面定義XML75の作成について説明する図である。本例では、パンチャーに帳票画像データ72内の表示すべきフィールドのみが切り出され、表示される。図11(A)は、変換ルール76に設定されているユーザ名称と切出し対象フィールドとの関係を示したテーブルであり、図11(B)はデータの入出力を示す模式図である。
変換ルール76には、パンチャーの識別情報(ユーザ名称)と、当該パンチャーに表示を許可すべき切り出し対象のフィールド種別の対応関係が設定されている(図11(A)参照)。画面定義作成部53は、上述同様にシート定義XML74を取得し、変換ルール76内の対応関係を付与した画面定義XML75を作成する(図11(B)参照)。
本例における画面定義作成部53の処理について、図12のフローチャートを参照しつつ説明する。以下の例はユーザ名称が「ユーザA」、切り出し対象フィールドが「電話番号」であるとして説明する。また、図12でのステップS11からステップS16までは、図5のステップS1からステップS6までの処理と同様であるため、説明を割愛する。
画面定義作成部53は、画面定義XML75に切出し情報、ユーザ情報の項目を設け、ユーザ情報には「ユーザA」を付与し、切出し情報には、フィールド種別が「電話番号」であるフィールドの位置情報およびフィールドの識別情報を付与する(S17)。ステップS18の判定も、図5のステップS9と同様であるため、説明を割愛する。
図13に、本例によるシート定義XML74(図13(A))、および画面定義XML75(図13(B))のデータ例を示す。図14に、切出し表示の場合におけるエントリ部4の表示例を示す。この表示例では、ある特定のユーザについて、「電話番号」の記入欄のみが切り出され、複数(この例では3つ)の帳票について画面に表示されていることを示している。
エントリ管理部7は、帳票画像データ72を画面定義XML75内で定義されたサイズに変換し、変換後の画像から、画面定義XML75の切出し情報で指定された領域を切り出す。この際、同種の帳票画像データ72が複数あり、対応した認識データXML73もある場合、エントリ管理部7は複数分切出し処理を行う。エントリ管理部7は、これら切出し画像、および対応した認識データXML73内の該当する文字列データをエントリ部4に表示させる。
ここで、上述の切出し表示処理について、図15のフローチャートを参照しつつ説明する。尚、ステップS111からステップS114までの処理は、図10のステップS101からステップS104までの処理と同様であるため、説明を割愛する。
エントリ管理部7は、画面定義XML75から切出し対象フィールドの位置情報を取得し、ステップS114で変換された帳票画像データから当該位置情報の領域を切り出す(S115)。エントリ部4は、この切り出された画像データをエントリ管理部7から取得し、表示する(S116)。
エントリ管理部7は、画面定義XML75から切出し対象フィールドの識別情報を取得し、さらに、該当するフィールドのアイテム(テキストボックス等)の属性情報を取得し、この属性情報に基づき、エントリ部4に対し該当するアイテムを表示させる(S117)。
エントリ管理部7は、切出し対象フィールドの識別情報を画面定義XML75から取得し、さらに、当該フィールド識別情報に対応する文字列データを認識データXML73から取得する。エントリ管理部7は、取得された文字列データを対応するアイテム上に表示する(S118)。尚、フィールドの識別情報が用いられることで、文字列データとアイテムとが対応する。
次の認識データXMLの識別情報がある場合(S119、Yes)、処理はS113に戻り、次の認識データXMLが取得され、切出し、および表示処理がなされる。ここで、切り出されたデータ、およびアイテムは、エントリ部4の画面の上方から順次配置される。一方、次の認識データXMLの識別情報がない場合(S119、No)、処理は終了する。
パンチャーは、図15で示したフローチャートの処理が完了次第、修正作業に入る。
このようにパンチャーに応じて、所定のフィールドに対してのマスク処理や所定のフィールドのみを連続表示し、修正、補間作業をさせることで、個人情報としていた1シートのデータがパンチャーごとに分割して表示されることとなり、パンチャーからの情報漏洩の防止効果が期待できる。また、パンチャーは同一種別のデータを入力するだけでよく、修正作業の効率を向上させることができる。
上述以外の他の例を、図16を参照しつつ説明する。変換ルールにより、フィールド単位でもとのシートでのフィールドのならびをランダムにシャッフルした画面定義XMLを作成する例を図16(A)に示す。本例は、例えば顧客A、B、Cの同種帳票が3つある場合、画面定義作成部53は、氏名欄は顧客A、住所は顧客B、電話番号は顧客Cのものを表示させるための画面定義XML75を作成する。エントリ部4による修正、補間作業では、フィールドごとの適切な切出イメージとあわせてエントリ可能であるため、修正作業自体には支障がない。このようにすることで、オリジナル帳票からは類推可能だった個人情報のならび順を変えることができ、類推が困難となり、情報漏洩の防止効果が期待できる。
また、同一フィールド種別ごとの画面定義XMLを作成する例を図16(B)に示す。図16(B)の例では、1シートの定義からフィールド種別ごとに画面定義が生成される。本例でも、情報漏洩効果が期待でき、フィールド種別(入力モード)ごとにパンチャーを分ることができる。本例では、FEP(カナ漢字変換ソフトウェア)の漢字入力モードや半角英数モード等の入力モードの切替えを行わなくて済むため、修正作業の効率を向上させることができる。
これら以外にも、パンチャーの職種、職位、国籍(得手、不得手とした言語)に応じた画面定義XMLを作成してもよい。
また、マスク処理においては、文字列の1文字ごとにマスク処理を行う等、文字列内の文字ごとにマスク処理を施すことで、より個人の類推が困難となり、情報漏洩の防止効果が期待できる。
図17、図18に、本実施の形態を保険業務に適用させた応用例を示す。
まず、図17の例について説明する。図17は、業務集中センター内で本実施の形態のシステムを用いた例である。契約内容が記入された請求書、証券の申請書等が契約者から業務集中センターに発送される。業務集中センターでは、発送された送付物に必要書類が揃っているかの確認作業が行われるとともに、案件番号が付されたヘッダーシート、送付状、請求書、添付書類(証券の申請書等)の順に、各紙面帳票がソートされる。ここまでの作業は作業員が行うものとする。
次に、イメージスキャナ1Aは、紙面帳票を画像データに変換し、変換された画像データはエントリ管理用サーバ7Aにネットワーク200を介して送信される。読取端末2Aは、定義情報作成端末50Aによって作成されたシート定義XMLに基づき、画像データから帳票の種別に応じて記入されている事項を抽出し、文字コードに変換する。ここで抽出された文字コードはエントリ管理用サーバ7Aに送信される。
管理用端末3Aは、エントリ管理用サーバ7Aに保持されている各パンチャーの勤務時間情報を取得し、いずれのパンチャーに作業を行わせるかを決定する。この決定情報は、エントリ管理用サーバ7Aに送信される。
パンチャーが訂正端末4Aからログインした場合、エントリ管理用サーバ7Aは、当該パンチャーに応じた画面(マスク処理等が施された画像および表示可能な文字列データ)を、定義情報作成端末50Aによって作成された画面定義XMLに基づき訂正端末4Aに表示させる。パンチャーは、表示された画面を参照しつつ、必要に応じて入力不備の箇所を修正し、クリーンデータを作成する。尚、マスク処理等、所定領域のみを表示するように制御する処理は、エントリ管理用サーバ7A内で行われてもよいし、訂正端末4Aで行われてもよい。作成されたクリーンデータは、エントリ管理用サーバ7Aに送信される。
管理用端末3Aは、帳票画像データ内の全てのフィールドに対し修正、補完作業がなされている場合、その帳票画像データに対する作業を終了(確定)させる。また、管理用端末3Aは、エントリ管理用サーバ7A内に保持されている確定した帳票画像データ、クリーンデータを、保険業務基幹システム内のファイリングサーバ8に転送するようエントリ管理用サーバ7Aに指示電文を送信し、エントリ管理用サーバ7Aは指示電文に基づき、確定した帳票画像データ、クリーンデータをファイリングサーバ8に送信する。
その後、手続き完了通知等が作成され、被保険者、保険契約者に完了通知、保険証券が配送される。尚、被保険者、保険契約者から発送された送付物(紙面帳票)は、所定保管場所で厳重に保管される。
次に、図18の例について説明する。図18は、各拠点にイメージスキャナ1Bが設置されている例である。契約者は、各拠点の窓口で請求書、保険証券の申請書を記入する。各拠点の作業員は、必要書類が揃っているかの確認作業を行うとともに、案件番号が付されたヘッダーシート、送付状、請求書、添付書類の順に、各紙面帳票をソートする。
イメージスキャナ1B(読み込み部1に対応)は、紙面帳票を画像データに変換し、変換された画像データは端末300から業務集中センター内のファイル転送サーバ301にファイル転送される。ファイル転送サーバ301は、送信された画像データをエントリ管理用サーバ7Aに送信する。以降の処理は、図17の例と同様であるため、ここでの説明を割愛する。
図17、図18の説明では、事務集中センター内に訂正端末4Aがあるものとして説明したが、エントリ管理用サーバ7AのWEBサーバにアクセス可能な場所であれば、いずれに配置されていてもよい。
図19に本実施の形態に適用可能なコンピュータシステムの内部構成の一例を示す。コンピュータシステム901は、中央演算処理装置であるCPU951、主記憶装置であるメモリ952、CD−ROM等の可搬型記録媒体からデータを読み書きするディスクドライブ953、および不揮発性な記憶装置であるHDD954を有する。またコンピュータシステム901は、キーボード、マウス等のユーザがデータを入力する手段である入力部955、モニター等のユーザに演算結果等を出力する手段である出力部956、外部との通信制御を担うネットワークカードである通信部957を有する。上述の各機能部は、例えばHDD954の不揮発性な記憶手段内に予め記憶されたプログラムが、CPU951、メモリ952等のハードウェア資源と協働することで実現される。また、上述の各データはHDD954もしくはメモリ952に記憶される。
識別/認識部2、エントリ部4、エントリ管理部7、ファイリングサーバ8は、それぞれが図19に示したコンピュータシステム901であり、アサイン部3、確定部5、登録部6は、1つのコンピュータシステム901で構成され、また、シート定義作成部52、画面定義作成部53は、1つのコンピュータシステム901で構成される。
エントリ管理部7のHDD954内にはデータベースが構築されており、当該データベースには、パンチャーの割り当て結果(パンチャーの識別情報、認識データXML73、画面定義XML75の対応関係)、帳票画像データ72の識別情報と確定フラグとが記憶されている。またクリーンデータ、帳票画像データ72、認識データXML73、画面定義XML75の各データは、エントリ管理部7内のHDD954内にファイルとして記憶される。これらデータは、通信部957を介して取得される。また、エントリ管理部7のHDD954には、WEBサーバプログラムが予めインストールされており、エントリ管理部7が起動した際にエントリ管理部7内のメモリ952内にロードされ、CPU951が常時WEBサーバプログラムを実行する。
識別/認識部2の上述の識別機能、認識機能は、それぞれCPU951がHDD954内に記憶されたプログラムをメモリ952にロードし、ロードされたプログラムを実行することで実現される。また、識別/認識部2のHDD954は帳票画像データ72、シート定義XML74を記憶する。また、作成された認識データXML73は、通信部957を介してエントリ管理部7に送信される。
アサイン部3、確定部5、登録部6は、上述のパンチャー割り当て機能、確定機能、登録機能をCPU951、メモリ952、予めインストール済みのプログラムとが協働することで実現される。割り当て結果、確定フラグ、登録指示は通信部957を介してエントリ管理部7に送信される。
エントリ部4は、画面定義XML75に基づいた画面を、CPU951の表示制御に基づき出力部956に表示する。また、エントリ部4は、文字列データ修正のための入力を、CPU951の入力制御に基づき入力部955を介して受け付ける。生成されたクリーンデータは、通信部957を介してエントリ管理部7に送信される。また、エントリ部4は、WEBブラウザプログラムが予めHDD954内にインストールされており、パンチャーの起動操作によってWEBブラウザプログラムがメモリ952に展開され、CPU951によって実行される。
ファイリングサーバ8は、エントリ管理部7内のHDD954で記憶されている帳票画像データ72およびクリーンデータを通信部957を介してエントリ管理部7から取得し、データベースが構築された自己のHDD954に記憶する。
この帳票画像データ72およびクリーンデータは、シート定義XML74および画面定義XMLと同様にXMLの形式で表記されてもよい。これにより、ファイリングサーバ8は、そのXMLの形式による検索要求(XQUERY)に基づいて、HDD954に登録された帳票の画像データ72およびクリーンデータを、高速かつ柔軟に検索することが出来る。
また、ファイリングサーバ8は、さらに、マスクもしくは切り出しをすべき所定の記入欄と該記入欄に対応付けられたユーザとの対応関係に基づいて、HDD954に登録された帳票の画像データ72およびクリーンデータを検索するようにしてもよい。すなわち、帳票の読み取り、認識、そしてエントリの各種作業と同一の、または別個の、マスクもしくは切り出しをすべきユーザに応じた検索をすることが出来る。
シート定義作成部52は、テンプレート画像データ78を自己のHDD954に記憶し、CPU951、メモリ952、HDD954内に予めインストールされたプログラム、および入力部955、出力部956を介したユーザの支援によってシート定義XML74を作成する。
また画面定義作成部53は、自己のHDD954に記憶されたシート定義XML74、変換ルール76に基づき、CPU951、メモリ952、HDD954内に予めインストールされたプログラム、および入力部955、出力部956を介したユーザの支援によって画面定義XML75を作成する。作成されたシート定義XML74は、通信部957を介して識別/認識部2に送信され、また作成された画面定義XML75は、通信部957を介してエントリ管理部7に送信される。
従来のシステムでは、帳票画像データの全てのフィールドをパンチャーに表示し、修正、補完作業が行われていたが、本実施の形態の帳票管理システムでは、一部のみを表示することができ、情報漏洩の防止効果が期待できる。また、本実施の形態によって、説明責任・資産としての情報をデジタル化、統合することができ、紙を動かす労力やコストを削減することができる。さらに、本実施の形態によって、輸送、紙の管理、複数のサーバで管理する際などに発生する二酸化炭素を削減するとともに、金融機関、保険機関等の業務効率化を図ることができる。
また、本実施の形態の帳票の一部分のみを表示させる機能は、上述の修正、補完作業使用以外にも適用可能である。例えば、ファイリングサーバ内に保持されている帳票画像データを、一定の権限を持たない作業員に確認させたい場合、帳票の一部のみを表示させることによって情報漏洩を防止することができる。
1 読み込み部、2 識別/認識部、3 アサイン部、4 エントリ部、5 確定部、6 登録部、7 エントリ管理部、8 ファイリングサーバ、50 定義情報作成部、51 テンプレート読み込み部、52 シート定義作成部、53 画面定義作成部、70 顧客記入済帳票、72 帳票画像データ、73 認識データXML、74 シート定義XML、75 画面定義XML、76 変換ルール、77 帳票テンプレート、78 テンプレート画像データ、80 エントリ管理用DB、81 確定ファイリングDB、100 帳票管理システム。

Claims (10)

  1. 情報を記憶するための記憶装置と、
    記入欄に記載された帳票の情報を画像データに変換し、当該画像データに識別情報を付して前記記憶装置に書き込む読み込み部(1)と、
    前記帳票の種別情報および帳票における記入欄の位置情報を有するシート定義情報に基づき、前記画像データの記入欄に記載された文字列を文字コードに変換して認識データを作成し、当該認識データと前記画像データとを対応付けて前記記憶装置に書き込む識別/認識部(2)と、
    前記認識データの確認又は修正を行う作業者を設定するアサイン部(3)と、
    前記シート定義情報に、前記作業者が認識データの確認または修正を行う際の画面表示のための変換ルールを適用して作成された画面定義情報に含まれる、前記画像データ、認識データおよび前記作業者が文字を入力するためのエントリフィールドのそれぞれの表示位置に基づいて、前記画像データ、認識データおよびエントリフィールドを画面表示するエントリ部(4)と、
    前記エントリ部(4)により画面表示された認識データに対する前記作業者による確認または修正に伴い確定したデータを、前記画像データと対応付けて前記記憶装置に書き込む登録部(6)と、
    を有する情報処理システム。
  2. 請求項1に記載の情報処理システムにおいて、
    前記変換ルールは、前記作業者に対応するマスクまたは切り出しすべき記入欄の情報を持つことを特徴とする情報処理システム。
  3. 帳票における記入欄の位置情報が該記入欄の識別情報ごとに定義されたシート定義情報(74)と、前記記入欄の識別情報ごとに該記入欄の画像データおよびユーザが文字を入力するためのエントリフィールドをエントリ部(4)の画面に表示すべき位置情報が定義された画面定義情報(75)とを記憶する記憶装置を有する管理部(7)と、
    前記シート定義情報(74)における前記記入欄の識別情報ごとに該記入欄の位置情報を画面に表示すべき位置情報に変換するための定義情報と表示すべきエントリフィールドの定義情報とを定義した変換ルール(76)に基づいて、前記シート定義情報(74)から前記画面定義情報(75)を作成し、前記記憶装置に記憶させる画面定義作成部(53)と、
    記入欄に記入済みの帳票を画像データに変換する読み込み部(1)と、
    該帳票の画像データ内の記入欄の画像データを前記シート定義情報(74)に基づいて取得し、該記入欄の画像データと該記入欄の識別情報とを対応付けて認識データ(73)として抽出する識別/認識部(2)と、
    前記帳票の記入欄の画像データとエントリフィールドとを前記画面定義情報(75)に基づいて画面に表示するエントリ部(4)と、
    前記エントリ部(4)により画面に表示されたエントリフィールド上の文字を確定し、該文字と前記記入欄の識別情報とを対応づけ、これらを前記帳票の画像データとともに該帳票ごとにファイリング部(8)の記憶装置に登録する登録部(6)と、
    を有する情報処理システム。
  4. 請求項3に記載の情報処理システムにおいて、
    前記識別/認識部(2)は、該識別された記入欄の画像データ内の記入された文字を認識して文字コードに変換し、該記入欄の識別情報とさらに対応付けて認識データ(73)として抽出し、
    前記エントリ部(4)は、前記認識された文字コードの文字を前記フィールド上に表示することを特徴とする情報処理システム。
  5. 請求項3または請求項4に記載の情報処理システムにおいて、さらに、
    前記変換ルールは(76)、さらに、所定のユーザに対応してマスクまたは切り出しをすべき記入欄の識別情報の対応関係の定義を有し、
    前記画面定義作成部(53)は、さらに、該変換ルール(76)に基づいて、シート定義情報(74)から所定のユーザに対応する画面定義情報(75)を作成することを特徴とする情報処理システム。
  6. 請求項3乃至請求項5のいずれか1項に記載の情報処理システムにおいて、さらに、
    前記シート定義情報(74)として未定義の帳票を画像データであるテンプレート画像データに変換するテンプレート読み込み部と、
    該テンプレート画像データにおける記入欄の識別情報および位置情報が少なくとも定義されたシート定義情報をユーザが作成するためのシート定義作成部と、を有し、
    前記シート定義作成部により作成されたシート定義情報をさらに前記管理部(7)の記憶装置に記憶することを特徴とする情報処理システム。
  7. 請求項3乃至請求項6のいずれか1項に記載の情報処理システムにおいて、
    前記シート定義情報(74)、前記画面定義情報(75)、および前記登録部(6)により前記ファイリング部(8)の記憶装置に登録される帳票の画像データおよび該帳票の記入欄の文字は、XMLの形式で記載されており、
    前記ファイリング部(8)は、さらに、前記XMLの形式による検索要求に基づいて、該ファイリング部(8)の記憶装置に登録された帳票の画像データおよび該帳票の記入欄の文字を検索することを特徴とする情報処理システム。
  8. 請求項3乃至請求項7のいずれか1項に記載の情報処理システムにおいて、
    前記ファイリング部(8)には、さらに、マスクもしくは切り出しをすべき所定の記入欄と該記入欄に対応付けられたユーザとの対応関係に基づいて、該ファイリング部(8)の記憶装置に登録された帳票の画像データおよび該帳票の記入欄の文字を検索することを特徴とする情報処理システム。
  9. 請求項3乃至請求項8のいずれか1項に記載の情報処理システムにおいて、
    前記エントリ部(4)は、画面定義情報(75)に基づいて画面に表示する記入欄以外の記入欄がマスクした帳票の画像データを表示することを特徴とする情報処理システム。
  10. 情報を記憶するための記憶装置を備えた情報処理システムにおいて、
    記入欄に記載された帳票の情報を画像データに変換し、当該画像データに識別情報を付して前記記憶装置に書き込み、
    前記帳票の種別情報および帳票における記入欄の位置情報を有するシート定義情報に基づき、前記画像データの記入欄に記載された文字列を文字コードに変換して認識データを作成し、当該認識データと前記画像データとを対応付けて前記記憶装置に書き込み、
    前記認識データの確認又は修正を行う作業者を設定し、
    前記シート定義情報に、前記作業者が認識データの確認または修正を行う際の画面表示のための変換ルールを適用して作成された画面定義情報に含まれる、前記画像データ、認識データおよび前記作業者が文字を入力するためのエントリフィールドの表示位置に基づいて、前記画像データ、認識データおよびエントリフィールドを画面表示し、
    画面表示された認識データに対する前記作業者による確認または修正に伴い確定したデータを、前記画像データと対応付けて前記記憶装置に書き込む
    処理を実行する情報処理方法。
JP2009165964A 2009-07-14 2009-07-14 情報処理システム、情報処理方法 Pending JP2011022718A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009165964A JP2011022718A (ja) 2009-07-14 2009-07-14 情報処理システム、情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009165964A JP2011022718A (ja) 2009-07-14 2009-07-14 情報処理システム、情報処理方法

Publications (1)

Publication Number Publication Date
JP2011022718A true JP2011022718A (ja) 2011-02-03

Family

ID=43632751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009165964A Pending JP2011022718A (ja) 2009-07-14 2009-07-14 情報処理システム、情報処理方法

Country Status (1)

Country Link
JP (1) JP2011022718A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013250730A (ja) * 2012-05-31 2013-12-12 Pfu Ltd 文書作成システム、文書作成装置、文書作成方法、及びプログラム
JP2020181365A (ja) * 2019-04-25 2020-11-05 株式会社ミック 帳票作成システム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004318453A (ja) * 2003-04-16 2004-11-11 Hitachi Ltd 帳票画像処理装置および課金方法
JP2005050094A (ja) * 2003-07-28 2005-02-24 Toshiba Corp 光学的文字読取装置
JP2006085213A (ja) * 2004-09-14 2006-03-30 Inter Db:Kk 作業スケジュール管理システム
JP2006244315A (ja) * 2005-03-04 2006-09-14 Aidekku:Kk データエントリーシステム
JP2007011656A (ja) * 2005-06-30 2007-01-18 Hitachi Computer Peripherals Co Ltd 文字認識システム及び文字認識方法
JP2007241442A (ja) * 2006-03-06 2007-09-20 Oki Electric Ind Co Ltd 個人情報読取記憶装置及び個人情報読取記憶システム
JP2008084126A (ja) * 2006-09-28 2008-04-10 Canon Inc 文字認識システムにおける文字修正確認方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004318453A (ja) * 2003-04-16 2004-11-11 Hitachi Ltd 帳票画像処理装置および課金方法
JP2005050094A (ja) * 2003-07-28 2005-02-24 Toshiba Corp 光学的文字読取装置
JP2006085213A (ja) * 2004-09-14 2006-03-30 Inter Db:Kk 作業スケジュール管理システム
JP2006244315A (ja) * 2005-03-04 2006-09-14 Aidekku:Kk データエントリーシステム
JP2007011656A (ja) * 2005-06-30 2007-01-18 Hitachi Computer Peripherals Co Ltd 文字認識システム及び文字認識方法
JP2007241442A (ja) * 2006-03-06 2007-09-20 Oki Electric Ind Co Ltd 個人情報読取記憶装置及び個人情報読取記憶システム
JP2008084126A (ja) * 2006-09-28 2008-04-10 Canon Inc 文字認識システムにおける文字修正確認方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013250730A (ja) * 2012-05-31 2013-12-12 Pfu Ltd 文書作成システム、文書作成装置、文書作成方法、及びプログラム
JP2020181365A (ja) * 2019-04-25 2020-11-05 株式会社ミック 帳票作成システム

Similar Documents

Publication Publication Date Title
JP4561474B2 (ja) 電子化文書保管システム
JP2007087322A (ja) ワークフローシステム、サーバ装置、ワークフローシステムの処理方法及びワークフロープログラム
US20080030800A1 (en) Electronic document management system
JP2013164740A (ja) 会計情報読取りシステム、会計情報読取り方法、及びプログラム
JP2012008942A (ja) 文書管理システム、文書管理装置、文書管理方法、及び文書管理プログラム
US20170076070A1 (en) Methods for securely processing non-public, personal health information having handwritten data
JP2012098878A (ja) 帳票作成処理システムと帳票作成処理方法およびプログラム
JP2016192223A (ja) 会計情報読取りシステム及びプログラム
JP4959501B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP4807702B2 (ja) 電子印鑑処理装置等
US20190361962A1 (en) A method and a system for providing an extract document
JP2011022718A (ja) 情報処理システム、情報処理方法
JP2010061279A (ja) データ処理制御プログラム、データ処理制御装置及びデータ処理システム
JPH11282612A (ja) 情報入力方法及びシステム
JP6993200B2 (ja) データ表示装置、データ表示方法およびデータ表示プログラム
JP4809637B2 (ja) 文字認識システム及び文字認識方法
JP5565075B2 (ja) 情報処理装置およびプログラム
KR20180025402A (ko) 오프라인 문서 추적 방법 및 문서 추적 시스템
US20160259957A1 (en) System And Method For Monitoring And Protecting Healthcare Data
JP6190549B1 (ja) 文書処理システム
US8223369B2 (en) Information processing apparatus, information processing system and computer readable medium
JP2002055985A (ja) 文書属性識別装置及び方法
JP7473900B2 (ja) フォーマット作成装置、フォーマット作成方法およびフォーマット作成プログラム
WO2023074008A1 (ja) 文書マスキング装置、文書マスキング方法およびプログラム記憶媒体
JP4329896B2 (ja) 固定資産管理装置、固定資産管理システム、プログラム、及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130618

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130819

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131022