JP2019032645A - 書類管理装置、書類管理方法、および、書類管理装置用のプログラム - Google Patents

書類管理装置、書類管理方法、および、書類管理装置用のプログラム Download PDF

Info

Publication number
JP2019032645A
JP2019032645A JP2017152390A JP2017152390A JP2019032645A JP 2019032645 A JP2019032645 A JP 2019032645A JP 2017152390 A JP2017152390 A JP 2017152390A JP 2017152390 A JP2017152390 A JP 2017152390A JP 2019032645 A JP2019032645 A JP 2019032645A
Authority
JP
Japan
Prior art keywords
divided
width
image
division
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017152390A
Other languages
English (en)
Inventor
直人 針谷
Naoto Harigai
直人 針谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2017152390A priority Critical patent/JP2019032645A/ja
Publication of JP2019032645A publication Critical patent/JP2019032645A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

【課題】記載内容を読み取ることができ、セキュリティを向上させた書類管理装置等を提供する。【解決手段】複数の記号が並んだ情報が記載された記載領域を書類の画像データから検出し(S1)、記載領域における情報の記載幅wを算出し(S3)、記載幅wの2分の1より長い第1分割幅d1を決定し(S4)、記載領域の所定の基点b1から、記載領域を第1分割幅毎に分割して複数の第1分割画像を生成し(S6)、所定の基点b1からずらして、第1分割幅d1に対応する第2分割幅d2毎に記載領域を分割して複数の第2分割画像を生成する(S8)。【選択図】図10

Description

本発明は、書類の電子データを管理する書類管理装置、書類管理方法、および、書類管理装置用のプログラムに関する。
書類のデータの管理において、情報漏洩防止のために画像分割が行われている。例えば、特許文献1には、画像データ内の文字領域を複数のブロックに分割した複数の画像ブロックを作成し、画像ブロックの配列順序を変更し、配列順序を変更した後の画像ブロックに基づいて作成された暗号化画像を、OCR処理し、OCR後データに基づいて文字領域のテキストデータを作成する文字画像処理システムが開示されている。
特開2016−118909号公報
しかしながら、上記従来技術は、白画素検出による文字間の空白位置を検出するものであり、比較的に白画素の多い「川」などの文字や、人によって文字間隔に偏りが生まれる手書き文字については、正確に分割ができず、文字の読み取りが正確にできなかった。
そこで、本発明は上記の問題点等に鑑みて為されたもので、その課題の一例は、記載内容を読み取ることができ、セキュリティを向上させた書類管理装置等を提供することを目的とする。
上記の課題を解決するために、請求項1に記載の発明は、複数の記号が並んだ情報が記載された記載領域を書類の画像データから検出する記載領域検出手段と、前記記載領域における前記情報の記載幅を算出する記載幅算出手段と、前記記載幅の2分の1より長い第1分割幅を決定する分割幅決定手段と、前記記載領域の所定の基点から、前記記載領域を前記第1分割幅毎に分割して複数の第1分割画像を生成する第1分割画像生成手段と、前記所定の基点からずらして、前記第1分割幅に対応する第2分割幅毎に前記記載領域を分割して複数の第2分割画像を生成する第2分割画像生成手段と、を備えることを特徴とする。
また、請求項2に記載の発明は、請求項1に記載の書類管理装置において、前記第1分割画像および第2分割画像内に記載された記号を読み取る読取手段と、前記読み取られた記号が属する第1分割画像または第2分割画像における前記読み取られた記号の読取位置に応じて、前記記号が分断されて誤って読み取られる可能性がある分割境界記号であるか否かを判定する分割境界記号判定手段と、を更に備えたことを特徴とする。
また、請求項3に記載の発明は、請求項2に記載の書類管理装置において、前記分割境界記号判定手段が、前記読取位置が、前記第1分割画像または第2分割画像の分割位置から前記記号の記号幅以内である場合、前記分割境界記号と判定することを特徴とする。
また、請求項4に記載の発明は、請求項2または請求項3に記載の書類管理装置において、前記第1分割画像の分割境界記号と、当該第1分割画像に対応する前記第2分割画像の読み取られた記号とを比較して、前記第1分割画像の分割境界記号の適否を判定する記号適否判定手段を、更に備えたことを特徴とする。
また、請求項5に記載の発明は、請求項1から請求項4のいずれか1項に記載の書類管理装置において、前記第1分割画像毎および前記第2分割画像毎の分割位置と、分割画像とを関連付けて記憶する記憶手段を更に備えたことを特徴とする。
また、請求項6に記載の発明は、記載領域検出手段が、複数の記号が並んだ情報が記載された記載領域を書類の画像データから検出する記載領域検出ステップと、記載幅算出手段が、前記記載領域における前記情報の記載幅を算出する記載幅算出ステップと、分割幅決定手段が、前記記載幅の2分の1より長い第1分割幅を決定する分割幅決定ステップと、第1分割画像生成手段が、前記記載領域の所定の基点から、前記記載領域を前記第1分割幅毎に分割して複数の第1分割画像を生成する第1分割画像生成ステップと、第2分割画像生成手段が、前記所定の基点からずらして、前記第1分割幅に対応する第2分割幅毎に前記記載領域を分割して複数の第2分割画像を生成する第2分割画像生成ステップと、を含むことを特徴とする。
また、請求項7に記載の発明は、コンピュータを、複数の記号が並んだ情報が記載された記載領域を書類の画像データから検出する記載領域検出手段、前記記載領域における前記情報の記載幅を算出する記載幅算出手段、前記記載幅の2分の1より長い第1分割幅を決定する分割幅決定手段、前記記載領域の所定の基点から、前記記載領域を前記第1分割幅毎に分割して複数の第1分割画像を生成する第1分割画像生成手段、および、前記所定の基点からずらして、前記第1分割幅に対応する第2分割幅毎に前記記載領域を分割して複数の第2分割画像を生成する第2分割画像生成手段として機能させることを特徴とする。
本発明によれば、記載内容を基点が異なる複数の分割画像に分割して、いずれかの分割画像に分断されない記号があるので、記載内容を読み取ることができ、記載された情報が分割画像に分割されているので、セキュリティを向上させることができる。
本発明の実施形態に係る書類管理システムの概要構成例を示す模式図である。 書類の一例を示す模式図である。 書類の一例を示す模式図である。 書類の一例を示す模式図である。 書類の一例を示す模式図である。 図1の書類管理サーバの概要構成の一例を示すブロック図である。 図1の書類管理サーバにおけるデータベースのデータの一例を示す模式図である。 項目の位置情報の一例を示す模式図である。 図1の画像入力装置の概要構成の一例を示すブロック図である。 図1の照合端末装置の概要構成の一例を示すブロック図である。 記載情報の分割の動作例を示すフローチャートである。 記載領域の一例を示す模式図である。 分割画像の一例を示す模式図である。 分割画像の一例を示す模式図である。 記載領域の一例を示す模式図である。 分割画像の一例を示す模式図である。 分割画像の一例を示す模式図である。 記載領域の一例を示す模式図である。 分割画像の一例を示す模式図である。 分割画像の一例を示す模式図である。 記載領域の一例を示す模式図である。 分割画像の一例を示す模式図である。 分割画像の一例を示す模式図である。 図10の記載領域の検出のサブルーチンを示すフローチャートである。 記載情報の復元の動作例を示すフローチャートである。 照合端末装置での画面の一例を示す模式図である。 照合端末装置での画面の一例を示す模式図である。 照合端末装置での画面の一例を示す模式図である。 照合端末装置での画面の一例を示す模式図である。
以下、図面を参照して本発明の実施形態について説明する。なお、以下に説明する実施の形態は、書類管理システムに対して本発明を適用した場合の実施形態である。
[1.書類管理システムの構成および機能概要]
(1.1 書類管理システムの構成および機能)
まず、本発明の一実施形態に係る書類管理システムの構成および概要機能について、図1から図4を用いて説明する。
図1は、本発明の実施形態に係る書類管理システムの概要構成例を示す模式図である。図2から図4は書類の一例を示す模式図である。
図1に示すように、書類管理システム1は、書類に関する書類情報を管理する書類管理サーバ10と、書類の画像を撮像して画像データを取り込む画像入力装置20と、書類の項目の照合作業をする照合端末装置30と、を備えている。ここで、書類情報の一例として、書類の画像データ、書類の画像データから抽出された特徴量、画像データから作成されたテキストデータ、顧客に納品するための納品用のデータ等の電子データが挙げられる。
書類管理サーバ10は、画像入力装置20、および、照合端末装置30における作業を管理する。
画像入力装置20は、顧客から預かった書類の画像を撮像し、書類に付されるフロントページを作成する。フロントページが付された書類は、保管庫に保管される。
照合端末装置30は、例えば、パーソナルコンピュータやスマートフォンを含む携帯型無線電話機やタブレット端末等の携帯端末である。照合端末装置30は、照合して審査するための書類の画像を表示する。照合端末装置30は、各作業者に応じて、設置されている。
なお、予め、書類の種別のマスタ登録作業、種別毎の書類の項目の切り出し領域の設定作業、項目の照合の難易度の設定作業、作業者の習熟度の設定作業等が行われてもよい。
書類管理サーバ10、画像入力装置20、および、照合端末装置30は、ネットワーク3を介して、例えば、通信プロトコルにTCP/IP等を用いて相互にデータの送受信が可能になっている。なお、ネットワーク3は、例えば、ローカルエリアネットワーク、インターネット、専用通信回線(例えば、CATV(Community Antenna Television)回線)、移動体通信網、およびゲートウェイ等により構築されている。
書類は、例えば、契約書等の申込書類である。また、本人を確認するための書類は、住民票、免許証、戸籍票、健康保険証、パスポート、領収書(例えば、電気、ガス等の公共料金の領収書のように氏名、住所が記載されたもの)、登記簿謄本、納品書等の書類である。なお、書類は、平面の紙のみならず、立体形状でもよく、書類の表面に、読み取り可能な情報が記載されていればよい。
書類の種別の一例として、契約書、住民票、免許証等の種別が挙げられる。さらに、書類の種別は、契約書の場合、顧客毎の契約書のフォーマット毎、住民票の場合、各市町村のフォーマット毎に分類される。
図2に示すように、書類50の表面に、契約内容、氏名、住所、電話番号等が記載されている。同じ形式の契約書の共通領域として、契約内容、氏名の項目、住所の項目、電話番号の項目、印鑑証明用印影の項目(図示せず)等が挙げられる。契約書の非共通領域として、個人情報である氏名、住所、電話番号等が挙げられる。なお、共通領域は、同じ形式の書類に関して、共通している共通フォーマットの部分である。非共通領域は、同じ形式の書類に関して、申請者毎に異なる部分である。
図3Aおよび図3Bに示すように、書類が住民票の場合、書類51の表面に、市町村名、住所、氏名、生年月日、性別等が記載されている。ある市町村の形式の住民票の共通領域として、書類の名称、市町村名、住所の項目、氏名の項目、生年月日の項目、性別の項目等が挙げられる。住民票の非共通領域として、個人情報である住所、氏名、生年月日、性別等が挙げられる。
図3Aおよび図3Bに示すように、書類が住民票の場合、市町村により記載の形式が異なる。
図4に示すように、書類が免許証の場合、書類の表面に、氏名、生年月日、住所、写真等が記載されている。免許証の共通領域として、氏名の項目、住所の項目、生年月日の項目、写真の項目等が挙げられる。免許証の非共通領域として、個人情報である氏名、生年月日、住所、個人の写真等が挙げられる。
関連する複数の書類は、一個人や、一法人において関連する複数の書類である。同一の個人または同一の法人に関する少なくとも2以上の書類である。例えば、一個人や、一法人における、契約書等の申込書類、本人を確認するための書類(住民票、免許証、戸籍票、健康保険証、パスポート、領収書)、納品書等の書類等から少なくとも2以上の書類である。関連する複数の書類の一例として、例えば、契約書、住民票、および、免許証の組み合せ、契約書、住民票、および、パスポートの組み合せ、申込書類、および、健康保険証の組み合せ、申込書類、領収証、契約書、および、登記簿謄本の組み合せ等が挙げられる。これら関連する複数の書類は、例えば、書類のセットが同封された封筒で送られてくる。
なお、氏名、住所等が記載される非共通領域は、記載領域の一例である。氏名の項目、住所の項目等の各項目の記載領域がある。
また、記載された内容は、記載情報の一例で、図2から図4に示すように、複数の(英数字、特殊記号等を含む)記号が並んで記載されている。また、記号の中に、スペース(空白)を含めてもよい。複数の記号が並んで記載されている場合、記号の間(特に、1記号の幅以上)は、スペースの記号としてもよい。
(1.2 書類管理サーバ10の構成および機能)
次に、書類管理サーバ10の構成および機能について、図5から図7を用いて説明する。
図5は、書類管理サーバ10の概要構成の一例を示すブロック図である。図6は、書類管理サーバにおけるデータベースのデータの一例を示す模式図である。図7は、項目の位置情報の一例を示す模式図である。
図5に示すように、コンピュータである書類管理サーバ10は、書類管理サーバ10を制御する制御部11と、様々なデータベースを有する記憶部12と、照合端末装置30等と通信する通信部13と、管理情報等を表示する出力部14と、を備えている。
制御部11は、例えば、CPU(Central Processing Unit)と、ROM(Read Only Memory)と、RAM(Random Access Memory)とを有する。制御部11は、CPUが、ROMや、RAMに記憶された各種制御プログラムを読み出して実行する。制御部11が、書類管理サーバ10の各部(記憶部12、通信部13、出力部14等)を制御する。なお、これらのプログラムを記憶した記録媒体等を制御部11が読み出し実行してもよい。
記憶部12は、例えば、ハードディスクドライブ等により構成されている。記憶部12には、予め登録しておくデータを記憶した登録データベース12a、作業者のレベル等を記憶した作業者データベース12b、撮像された書類の画像データおよび分割画像等を記憶した画像データベース12c、書類の項目を照合した作業者等を記憶した作業結果データベース12d、書類の審査結果を記憶した審査結果データベース12e等が構築されている。
登録データベース12aには、書類種別用の登録データベース、項目切り出し領域用の登録データベース、項目の難易度用の登録データベース等が、構築されている。
書類種別用の登録データベースには、書類種別コードに関連付けられて、住民票、免許証、契約書等の書類の種別が記録されている。さらに、登録データベース12aには、住民票に対して、市町村名、契約書に対して、顧客名等が記憶されている。
また、項目切り出し領域用の登録データベースには、例えば、書類の種別を示す書類種別IDに関連付けられて、書類のフォーマットの各項目に対応した切り出し領域等が関連付けられて記憶されている。切り出し領域が矩形の場合、矩形の対角に位置する頂点の位置情報が、切り出し領域となる。項目切り出し領域用の登録データベースには、顧客毎の契約書、各市町村の住民票等に関する様々なテンプレートが記憶されている。また、項目切り出し領域用の登録データベースには、書類における項目の情報が記載されて無い無記入の各書類の画像が記憶されている。
また、項目の難易度用の登録データベースには、各項目に対する照合の難易度の情報が記憶されている。例えば、項目の一例の性別は、男/女、またはM/Fであるので、照合が楽であるが、氏名の場合、異字があり、住所の場合は、書き方がいくつかあり、照合が難しくなる。また、例えば、氏名は、”氏名 ○○”、”被保険者名 ○○”、”世帯主 ○○”、”被扶養者 ○○”と、記載の仕方が異なることもあり、照合が難しくなる。
また、登録データベース12aには、顧客IDに関連付けられて、顧客名、納品後の書類の裁断の有無、等の情報が記憶されている。
また、作業者データベース12bには、作業者ID毎に、作業レベルが記憶されている。なお、作業レベルは、作業者の習熟度、適正等により決定される。作業レベルは、例えば、”A”、”B”、”C”等に分類される。なお、作業者IDは、ログインIDおよびパスワード、作業者が携帯しているICカードや、名札に印刷されたコード等に関連付けられている。
また、画像データベース12c(記憶手段の一例)には、図6に示すように、書類を特定する書類IDに関連付けられて、書類の各項目に対応した項目ID、記載領域を分割した分割画像を示す分割ID、分割の基点に対応して、分割方向が順方向か逆方向かを示す分割方向ID、各分割画像の分割位置を示す座標、分割画像の画像データ等が関連付けられて記憶されている。
なお、分割位置を示す座標は、図7に示すように、例えば、第1基点b1の座標(x1,y1)、第2基点b2の座標(x2,y1)等が挙げられる。また、分割位置は、第1基点b1から自然数倍の分割幅の位置、第2基点b2から自然数倍の分割幅の位置等が挙げられる。また、分割方向IDは、分割の基点が3以上の場合、分割方向を示すとは限らない。
また、画像データベース12cには、書類ID毎に、撮像された画像データ、画像データから切り出しされた切り出し画像(記載領域の一例)等が記憶されている。切り出し画像は、項目に関連付けられて、画像データベース12cには、記憶されている。
なお、画像データと切り出し画像、分割画像とは別々のデータベースでもよい。また、書類IDは、書類IDの他に、書類の特徴量、作業ID等の書類を特定できるIDならばよい。
また、作業結果データベース12dには、包袋IDおよび項目IDに関連付けられて、項目を照合した作業者の作業者ID、照合に使用した書類の書類ID、書類において、どの部分を照合に使用したかの選択情報等が記憶されている。
また、審査結果データベース12eには、包袋IDおよび項目IDに関連付けられて、項目を照合した作業者の作業者IDおよび審査結果が記憶されている。審査結果は、例えば、セットの書類に記載された内容が同一であるかの照合結果や、記載の有無のデータである。また、審査結果データベース12eには、住民票等から読み取られたテキストデータが記憶されていてもよい。
同じ書類管理サーバ10の同じデータベースにより管理されてもよいし、それぞれのデータベースが、別の管理サーバのデータベースに記憶されてもよい。
また、記憶部12には、オペレーティングシステムおよびサーバプログラム等の各種プログラムが記憶されていてもよい。なお、各種プログラムは、例えば、他のサーバ等からネットワーク3を介して取得されるようにしてもよいし、記録媒体に記録されてドライブ装置を介して読み込まれるようにしてもよい。
通信部13は、ネットワーク3に接続して、画像入力装置20、および、照合端末装置30との通信を制御する。
出力部14は、例えば、液晶表示素子またはEL(Electro Luminescence)素子等によって構成されている。
(1.3 画像入力装置20の構成および機能)
次に、画像入力装置20の構成および機能について、図8を用いて説明する。
図8は、画像入力装置20の概要構成の一例を示すブロック図である。
図8に示すように、画像入力装置20は、制御部21と、記憶部22と、通信部23と、出力部24と、操作部25と、撮像部26と、を備えている。
制御部21は、制御部11と同様の構成を有し、画像入力装置20を制御する。記憶部22は、記憶部12と同様の構成を有し、各種プログラムを記憶する。通信部23は、書類管理サーバ10等と通信を制御する。
出力部24は、例えば、液晶表示素子またはELにより構成されていて、撮像した画像が表示される。さらに、出力部24は、プリンタを有し、書類に付されるフロントページを印刷してもよい。
操作部25は、例えば、キーボードおよびマウス等によって構成されている。さらに、操作部25は、ユーザの足により、撮像部26の撮像の作動を行う画像入力スイッチを有する。
撮像部26は、例えば、CCD(Charge Coupled Device)イメージセンサやCMOS(Complementary Metal Oxide Semiconductor)イメージセンサ等の撮像素子を有するデジタルカメラである。
撮像部26は、複数のデジタルカメラにより構成される。テーブルの上に、書類(例えば、契約書、住民票等)が複数並べられ、解像度を上げるために、各書類を部分的に区切って、複数のデジタルカメラにより撮像する。なお、撮像部26は、スキャナでもよく、書類をスキャニングして撮像する。
(1.4 照合端末装置30の構成および機能)
次に、照合端末装置30の構成および機能について、図9を用いて説明する。
図9に示すように、コンピュータとして機能する照合端末装置30は、例えば、パーソナルコンピュータやスマートフォンを含む携帯型無線電話機やPDA等の携帯端末であり、制御部31と、記憶部32と、通信部33と、出力部34と、操作部35と、を備えている。
制御部31は、制御部21と同様の構成を有し、照合端末装置30を制御する。記憶部32は、記憶部22と同様の構成を有し、各種プログラムを記憶する。通信部33は、書類管理サーバ10等と通信を制御する。出力部34は、出力部24と同様の構成を有し、審査用の画像を表示する。
[2.書類管理システムの動作]
次に、本発明の1実施形態に係る書類管理システムの動作について図を用いて説明する。
(2.1 記載情報の分割の動作例)
まず、書類管理システムにおける記載情報の分割の動作例を、図10を用いて説明する。
図10は、記載情報の分割の動作例を示すフローチャートである。図11A、図12A、図13A、および、図14Aは、記載領域の一例を示す模式図である。図11B、図11C、図12B、図12C、図13B、図13C、図14B、および、図14Cは、分割画像の一例を示す模式図である。
顧客(例えば、カード会社、保険会社等)から、複数の書類が組まれた書類のセットが、まとめて送られてくる。例えば、書類のセットが同封された封筒が詰められた段ボール箱が、顧客から送られてくる。
複数の書類のセットは、例えば、顧客の各ユーザ(例えば、カード会社、保険会社等に申し込みをする個人や法人)から顧客に申し込まれた書類のセットである。書類のセットは、申込書類(例えば、契約書、申込用紙)および本人確認用の書類等である。本人確認用の書類として2通必要な場合、例えば、住民票および免許証、住民票および健康保険証等である。なお、法人の場合、法人確認用の書類として、代表取締役の印が押された書類である。
まず、送付されてきた封筒等の開封作業が行われる。例えば、届けられた段ボールが開けられ、書類のセットが同封された封筒が取り出される。そして、封筒が開封されて、書類のセットが取り出される。
また、各書類にコード等の各書類を識別するための書類IDが付与されてもよい。付与されるコードの一例として、バーコードや2次元コード等が挙げられる。
次に、書類の不備の確認作業が行われる。書類が、書類のセットが全て揃っているか、書類の毀損が無いか等のチェックが行われる。確認作業後、書類のセットが保管庫に搬送される。
次に、書類管理システム1は、書類の画像データを取得する(ステップS1)。具体的には、画像入力装置20が、保管庫から取り出した書類の画像データ化を行うため、画像入力装置20の制御部21が、撮像部26により書類を撮像して画像を取り込む。画画像入力装置20は、通信部23を介して、画像データを、書類管理サーバ10に送信する。書類管理サーバ10の制御部11が、通信部13を介して、画画像入力装置20から画像データを取得する。書類管理サーバ10が、受信した画像データを画像データベース12cに記憶する。
なお、画像入力装置20は、撮像された画像データの傾き等を補正してもよい。例えば、制御部21が、画像処理により画像における書類の枠を検出し、傾きを補正する。なお、画像データ化が終了した書類のセットは、保管庫に保存される。
次に、画画像入力装置20は、通信部23を介して、画像データを、書類管理サーバ10に送信する。
次に、書類管理システム1は、記載領域を検出する(ステップS2)。具体的には、書類管理サーバ10の制御部11が、通信部13を介して、画画像入力装置20から画像データを取得する。制御部11が、後述の記載領域の検出のサブルーチンにより、書類の画像データから項目毎の記載領域を検出する。
このように、書類管理サーバ10は、複数の記号が並んだ情報が記載された記載領域を書類の画像データから検出する記載領域検出手段の一例として機能する。
次に、書類管理システム1は、記載幅を算出する(ステップS3)。具体的には、制御部11が、記載領域に記載された記号を検出し、記号の記載方向の記載幅を算出する。図11Aに示すように、制御部11が、記載幅wを算出する。例えば、制御部11が、記載された記号をそれぞれ検出して、端の文字、例えば、文字“大”を示す領域の最小のx座標と、文字“郎”を示す領域の最大のx座標との差から、記載幅wを算出する。なお、記載幅wの中に記載されている記号の間に、1記号の幅以上の空白があってもよい。
なお、記載幅は、記載された記号の端同士に関連した幅でよい。例えば、図12Aに示すように、記載された記号を含む記載幅wでもよい。また、記載幅は、図13Aに示すように、端の文字“山”の中心部分と、端の文字“冬”の中心部分を結ぶ幅でもよい。また、記載幅は、図14Aに示すように、端の文字“D”の中心部分と、端の文字“o”の端の部分とを結ぶ記載幅wでもよい。
このように、書類管理サーバ10は、前記記載領域における前記情報の記載幅を算出する記載幅算出手段の一例として機能する。
次に、書類管理システム1は、分割幅を決定する(ステップS4)。制御部11が、記載幅wの2分の1より長い第1分割幅d1を決定する。例えば、図11A(図13A、図14A)に示すように、制御部11が、記載幅wの2/3である第1分割幅d1を決定する。
図11Aに示すように、第2分割幅d2は、第1分割幅d1と同じだが、第2分割幅d2と第1分割幅d1とは、記載されている記号の大きさ(平均の大きさ、最大または最小の大きさ等)より短い幅で、互いに多少異なってもよい。また、各分割幅d1は、記載されている記号の大きさより短い幅で、互いに多少異なってもよい。各分割幅d2は、記載されている記号の大きさより短い幅で、互いに多少異なってもよい。
また、第1分割幅d1および第2分割幅は、記載幅wの2分の1より長ければよく、図12Aに示すように、記載幅wの3/5等でもよい。
このように、書類管理サーバ10は、前記記載幅の2分の1より長い第1分割幅を決定する分割幅決定手段の一例として機能する。
次に、書類管理システム1は、第1分割位置を決定する(ステップS5)。具体的には、制御部11が、図11Aに示すように、記載領域の1の端の位置に基点b1となる第1分割位置を決定する。第1分割位置を基点として、分割幅d1の位置に各第1分割位置が定まる。
なお、図11Aに示すように、基点b1となる第1分割位置は、文字“大”のx座標の位置付近でもよい。図14Aに示すように、基点b1となる第1分割位置は、記載領域の端の位置でもよい。
次に、書類管理システム1は、第1分割画像を生成する(ステップS6)。具体的には、制御部11が、分割位置を基点b1として、記載領域の画像を分割幅d1に分割し、図11Bに示すように、4つの第1分割画像を生成する。図12Bに示すように、制御部11が、短めの第1分割幅d1(記載幅wの3/5)により、5つの第1分割画像を生成してもよい。図13Bに示すように、3つの第1分割画像を生成してもよい。ここで、分割位置(基点b1)は、記載領域の所定の基点の一例である。また、所定の基点は、図11A中において、黒丸で示す点のように、第1分割画像の境界部分なら、どこでもよい。
このように、書類管理サーバ10は、前記記載領域の所定の基点から、前記記載領域を前記第1分割幅毎に分割して複数の第1分割画像を生成する第1分割画像生成手段の一例として機能する。
次に、書類管理システム1は、第2分割位置を決定する(ステップS7)。具体的には、制御部11が、図11Aに示すように、記載領域の他の端の位置に基点b2となる第2分割位置を決定する。第2分割位置を基点b2として、分割幅d2の位置に各第2分割位置が定まる。これらの第2分割位置は、所定の基点からずれた第2基点の一例であり、例えば、各第1分割位置の中間(好ましくは、真ん中)に位置する。また、第2基点は、図11A中において、白丸で示す点のように、第2分割画像の境界部分なら、どこでもよい。記載領域に記載された各記号が、第1分割画像または第2分割画像のいずれかに、分断されない状態で入るように、第1分割位置に対して第2分割位置が設定されるならよい。
なお、図12Aに示すように、分割幅d1の真ん中の位置に第2分割位置が設定されてもよい。図14Aに示すように、第2分割位置(基点b2)は、第1分割位置(基点b1)と逆の記載領域の端の位置でもよい。
このように、書類管理サーバ10は、前記所定の基点からずらして、前記第1分割幅に対応する第2分割幅毎に前記記載領域を分割して複数の第2分割画像を生成する第2分割画像生成手段の一例として機能する。
次に、書類管理システム1は、第2分割画像を生成する(ステップS8)。具体的には、制御部11が、分割位置を基点b2として、記載領域の画像を分割幅d2に分割し、図11Cに示すように、4つの第1分割画像を生成する。図12Cに示すように、制御部11が、短めの第1分割幅d2(記載幅wの3/5)により、5つの第2分割画像を生成してもよい。図13Cに示すように、3つの第2分割画像を生成してもよい。
なお、分割画像を生成する際、図11Aに示すように、第1分割位置(基点b1)から分割し第1分割画像を生成し、反対に位置する第2分割位置(基点b2)から分割し第2分割画像を生成しているので、分割方向が2方向あるとみることができる。なお、方向でなくとも、分割の基点(第1分割位置および第2分割位置)で区別してもよい。
特に、図13B、図13C等の分割画像が示すように、記載幅wの2分の1より長い第1分割幅d1および第2分割幅により、各第1分割画像および各第2分割画像のいずれかに、分断されない記載された文字が含まれる。
例えば、図13B、に示すように、第1分割画像に、分断されていない手書きの記号“山”“秋”が含まれている。また、図13Cに示すように、第2分割画像に、分断されていない手書きの記号“川”“冬”が含まれている。
また、図14B、図14Cに示すように、英語の場合、単語は、いずれかの分割画像に含まれているとは限らないが、各文字は、いずれかの分割画像に含まれている。
次に、書類管理システム1は、分割方向と分割位置と各分割画像とを関連付けて記憶する(ステップS9)。具体的には、制御部11が、各第1分割画像および各第2分割画像を、各第1分割位置および各第2分割位置とともに、図6に示すように、書類ID、項目ID、分割ID、分割方向ID(第1分割か第2分割であるかのID)に関連付けられて、画像データベース12c等に記憶される。なお、分割画像は分割画像IDに関連付けられて、別のデータベースに保存されてもよい。
さらに、制御部11が、OCR(Optical Character Recognition)等で、記載された記号があるか否かを判定した結果も、各分割画像を関連付けて記憶してもよい。記載された記号がない分割画像は、出力されなくてもよい。また、制御部11が、OCR等で、各分割画像の両端の分割位置にかかっている記号(分割境界記号)があるか否かを判定し、判定結果を、各分割画像と関連付けて画像データベース12c等に記憶してもよい。
このように、書類管理サーバ10は、前記第1分割画像毎および前記第2分割画像毎の分割位置と、分割画像とを関連付けて記憶する記憶手段の一例として機能する。
(2.2 記載領域の検出のサブルーチン)
次に、記載領域の検出のサブルーチンについて図15を用いて説明する。
図15は、記載領域の検出のサブルーチンを示すフローチャートである。
図15に示すように、書類管理サーバ10は、書類の種別の特定を行う(ステップS10)。例えば、制御部11が、顧客名から契約書の種別(顧客毎の契約書のフォーマット)を特定したりして、受け付けた書類の種別により特定を行う。なお、また、制御部11が、書類の画像データから文字認識をして、契約書、住民票、市町村等を認識し、書類の種別を特定してもよい。
次に、書類管理サーバ10は、書類種別に基づき、無記入の各書類の画像を取得する(ステップS11)。具体的には、制御部11が、項目切り出し領域用の登録データベース等を参照して、書類種別に基づき、項目の情報が記載されて無い無記入の各書類の画像を取得する。
次に、書類管理サーバ10は、無記入の書類の画像との差分画像から、各項目の画像を切り出す(ステップS12)。具体的には、制御部11が、書類における項目の情報が記載されている書類の画像と、無記入の書類の画像との位置合わせをして、差分画像を求める。制御部11は、書類の隅、書類のタイトル等の特徴量の位置により、項目の情報が記載されている画像と無記入の画像との位置合わせを行う。項目の情報が記載されている画像と無記入の画像と差分画像なので、項目の情報が記載されたところの画素以外の画素が、0の値になり、項目の情報が記載されたところの画素が容易に抽出される。記載事項の黒色等の記載部分のパターンのみが容易に抽出される。
制御部11が、項目切り出し領域用の登録データベース等を参照して、特定した書類種別に基づき、書類における記載領域の位置を特定し、項目毎の記載領域の画像として、差分画像から項目毎の画像を切り出す。図2および図3Aに示すように、各項目の記載領域の画像として、切り出し領域50a、50b、50c、切り出し領域51a、51b、51c、51d等の切り出し画像が切り出される。罫線がある場合、記載領域の画像に罫線が含まれても、含まれなくてもよく、また、記載領域の画像に共通領域が含まれても含まれなくてもよく、他の項目が含まれなければよい。
なお、制御部11が、画像処理により、項目毎の画像を切り出してもよい。例えば、制御部11が、項目切り出し領域用の登録データベースのテンプレート等を参照して、パターンマッチングにより、項目毎の画像を切り出してもよい。また、画像認識、OCR等により、記載領域を検出してもよい。
(2.3 記載情報の復元の動作例)
次に、記載情報の復元の動作例について、図16から図17を用いて説明する。
図16は、記載情報の復元の動作例を示すフローチャートである。図17Aから図17Dは、照合端末装置での画面の一例を示す模式図である。
次に、書類管理システム1は、分割画像を出力する(ステップS20)。具体的には、書類管理サーバ10の制御部11が、審査対象の書類の各分割画像を、書類IDおよび分割IDとともに、各照合端末装置30に送信する。なお、記号がない空白の分割画像は送信されなくてもよい。また、第1分割画像であるか、第2分割画像であるかは、分割ID等で特定してもよい。
各照合端末装置30は、書類管理サーバ10から、別々の分割画像の画像データを受信する。各照合端末装置30は、図17Aから図17Dに示すように、それぞれ別々に、検査対象画像として、分割画像を、出力部34の画面34aに表示する。
次に、書類管理システム1は、分割画像の読取結果を取得する(ステップS21)。各照合端末装置30の各作業者は、画面34aの検査対象画像欄に表示された分割画像を見て、読取結果入力欄に、読み取った読取結果を、操作部35により入力する。例えば、図17Aに示すように、第1分割画像の読取結果“大日本”が入力される。なお、記号“:”のように見える分割境界記号は入力されなくてもよい。
また、図17Bに示すように、第1分割画像の読取結果“太郎”が入力される。なお、一部文字が欠けているので、読取結果“郎”のみが入力され、分割境界記号である“太”は入力されなくてもよい。
図17Cに示すように、第2分割画像の読取結果“大”が入力される。なお、一部文字が見えている記号(分割境界記号)から判読して、読取結果“大E” が入力されてもよい。
図17Dに示すように、第2分割画像の読取結果“本 太郎”が入力される。なお、一部文字が見えている記号から判読して、読取結果“1本 太郎” が入力されてもよい。また、記号“1”は、分割境界記号として、別に入力されてもよい。
なお、分割画像の端にある記号の場合、作業者は、その記号を入力しなくてもよいし、分割境界記号として、別に入力してもよい。
各照合端末装置30は、読取結果を、書類IDおよび分割IDとともに、書類管理サーバ10に送信する。なお、照合端末装置30が、OCRで読み取りを行ってもよい。
書類管理サーバ10は、読取結果を、各照合端末装置30から受信する。
次に、書類管理システム1は、分割境界記号を検出する(ステップS22)。具体的には、制御部11が、分割画像IDに基づき、読み取り結果に対応する分割画像を読み出し、OCR等で、分割境界記号を検出する。制御部11が、分割画像の両端から所定距離(例えば、1文字、1記号の大きさ、記載領域に記載された記号の平均の記号幅、記載幅を文字数で割った値等)にある記号を、分割境界記号とする。なお、制御部11が、入力文字の始めと終わりの文字のうち、分割画像の両端から所定距離にある記号を分割境界記号としてもよい。作業者が読み取る場合、分割画像の両端の分割位置にかかっている記号を、分割境界記号として、別入力しておいてもよい。
このように、書類管理サーバ10は、前記読み取られた記号が属する第1分割画像または第2分割画像における前記読み取られた記号の読取位置に応じて、前記記号が分断されて誤って読み取られる可能性がある分割境界記号であるか否かを判定する分割境界記号判定手段の一例として機能する。書類管理サーバ10は、前記読取位置が、前記第1分割画像または第2分割画像の分割位置から前記記号の記号幅以内である場合、前記分割境界記号と判定する分割境界記号判定手段の一例として機能する。
次に、書類管理システム1は、分割境界記号の適切な結果を判定する(ステップS23)。具体的には、制御部11が、第1分割画像と第2分割画像との対応関係から、分割境界記号が適切か判定する。
例えば、図17Aに示すような第1分割画像の左側と図17Cに示すような第2分割画像の右側とは対応する。図17Aに示すように、読み取られた分割境界記号“大”と、図17Cに示すように、読み取られた記号“大”(読み取られた記号の右側)とが同じなので、制御部11が、適切と判定する。
なお、第2分割画像で、読み取られた記号が“大E”の場合、第1分割画像で読み取られた分割境界記号“大”と、第2分割画像で読み取られた分割境界記号“E”と異なるので、不適切と判定されてもよい。この場合、さらに、第1分割画像で読み取られた分割境界記号“大”の隣の記号“日”と、第2分割画像で読み取られた分割境界記号“E”と比較して、異なるので、分割境界記号“E”は不適切と判定され、第2分割画像で読み取られた分割境界記号“E”の隣の記号“大”と、第1分割画像で読み取られた分割境界記号“大”と比較して、同じなので、分割境界記号“大”は適切と判断されてもよい。
また、図17Aに示すような第1分割画像の右側と対応する、図17Dに示すような第2分割画像の左側は対応する。図17Aに示すように、読み取られた分割境界記号“:”と、図17Dに示すように、読み取られた記号“大”とが異なるので、制御部11が、不適切と判定する。
図17Bに示すような第1分割画像の左側と図17Dに示すような第2分割画像の右側とは対応する。図17Bに示すように、読み取られた記号“郎”と、図17Dに示すように、読み取られた分割境界記号“郎”とが同じなので、制御部11が、適切と判定する。また、図17Bに示すように、読み取られた分割境界記号“太”と記号“朗”と、図17Dに示すように、読み取られた記号“太”と分割境界記号“朗”とを対応させて、制御部11が、適切か否かを判定してもよい。
なお、制御部11が、分割位置を考慮して、統計的に2回以上出現した“大”、“本”、“郎”や、”大日本 :”における中間の文字“日本”、”1本 太郎”における中間の文字”本 太”を、適切な記号と判定してもよい。制御部11が、分割方向および分割位置より分割境界記号の適切な結果を判定してもよい。
このように、書類管理サーバ10は、前記第1分割画像の分割境界記号と、当該第1分割画像に対応する前記第2分割画像の読み取られた記号とを比較して、前記第1分割画像の分割境界記号の適否を判定する記号適否判定手段の一例として機能する。
次に、書類管理システム1は、書類の記載内容を復元する(ステップS24)。具体的には、制御部11が、適切な記号と判定された記号より、分割方向および分割位置より並べて、書類の内容を復元する。なお、“大E”と、”大日本 :”と、”1本 太郎”と、”郎”とを分割方向および分割位置に従って順番に並べ、制御部11が、人工知能等により、”大日本 太郎”と復元してもよい。
以上、本実施形態によれば、記載内容を基点b1、b2が異なる複数の分割画像に分割して、いずれかの分割画像に分断されない記号があるので、記載内容を読み取ることができ、記載された情報が分割画像に分割されているので、セキュリティを向上させることができる。
また、「川」や手書き文字といった空白位置により文字分割位置を決めにくい場合も、OCR等により読み取り可能な記号の情報を、いずれかの分割画像に含んだ状態での分割が可能となる。さらに、書式が多岐に渡るため、分割書式を登録できない住民票のような帳票の場合も、OCR等により読み取り可能な記号の情報を、いずれかの分割画像に含んだ状態での分割が可能となる。
第1分割画像および第2分割画像内に記載された記号を読み取り、読み取られた記号が属する第1分割画像または第2分割画像における読み取られた記号の読取位置に応じて、記号が分断されて誤って読み取られる可能性がある分割境界記号であるか否かを判定する場合、読取位置によって、読み取られた記号を、分割境界記号である否かで分けることにより、読み取られた内容が正しいか否かの判断がしやすくなる。
読取位置が、第1分割画像または第2分割画像の分割位置から記号の記号幅以内である場合、分割境界記号と判定する場合、明確に、分割境界記号である否かで分けることができる。
第1分割画像の分割境界記号と、当該第1分割画像に対応する第2分割画像の読み取られた記号とを比較して、第1分割画像の分割境界記号の適否を判定する場合、分割境界記号の適否を判定することで、記号が分断された読み間違った記号を取り除くことができる。
第1分割画像毎および記第2分割画像毎の分割位置と、分割画像とを関連付けて記憶する場合、各分割画像において読み取られた記号から、各分割画像の関係性により、記載内容を復元することができる。
さらに、書類管理サーバ10または書類管理システム1の外部システムのOCRを利用する際は、分割画像でのOCRを行い、その結果を元に分割前画像の記号内容を復元することにより、手書き帳票や非定型帳票などの様々な種類の帳票画像に対して、分割による匿名化・秘匿化を行った上でのデジタルデータ化を実現できる。
1:書類管理システム
10:管理サーバ(書類管理装置)
11:制御部
50、51:書類
50a、50b、50c、51a、51b、51c、51d:切り出し領域(記載領域)
w:記載幅
d1:第1分割幅(分割幅)
d2:第2分割幅(分割幅)

Claims (7)

  1. 複数の記号が並んだ情報が記載された記載領域を書類の画像データから検出する記載領域検出手段と、
    前記記載領域における前記情報の記載幅を算出する記載幅算出手段と、
    前記記載幅の2分の1より長い第1分割幅を決定する分割幅決定手段と、
    前記記載領域の所定の基点から、前記記載領域を前記第1分割幅毎に分割して複数の第1分割画像を生成する第1分割画像生成手段と、
    前記所定の基点からずらして、前記第1分割幅に対応する第2分割幅毎に前記記載領域を分割して複数の第2分割画像を生成する第2分割画像生成手段と、
    を備えることを特徴とする書類管理装置。
  2. 請求項1に記載の書類管理装置において、
    前記第1分割画像および第2分割画像内に記載された記号を読み取る読取手段と、
    前記読み取られた記号が属する第1分割画像または第2分割画像における前記読み取られた記号の読取位置に応じて、前記記号が分断されて誤って読み取られる可能性がある分割境界記号であるか否かを判定する分割境界記号判定手段と、
    を更に備えたことを特徴とする書類管理装置。
  3. 請求項2に記載の書類管理装置において、
    前記分割境界記号判定手段が、前記読取位置が、前記第1分割画像または第2分割画像の分割位置から前記記号の記号幅以内である場合、前記分割境界記号と判定することを特徴とする書類管理装置。
  4. 請求項2または請求項3に記載の書類管理装置において、
    前記第1分割画像の分割境界記号と、当該第1分割画像に対応する前記第2分割画像の読み取られた記号とを比較して、前記第1分割画像の分割境界記号の適否を判定する記号適否判定手段を、更に備えたことを特徴とする書類管理装置。
  5. 請求項1から請求項4のいずれか1項に記載の書類管理装置において、
    前記第1分割画像毎および前記第2分割画像毎の分割位置と、分割画像とを関連付けて記憶する記憶手段を更に備えたことを特徴とする書類管理装置。
  6. 記載領域検出手段が、複数の記号が並んだ情報が記載された記載領域を書類の画像データから検出する記載領域検出ステップと、
    記載幅算出手段が、前記記載領域における前記情報の記載幅を算出する記載幅算出ステップと、
    分割幅決定手段が、前記記載幅の2分の1より長い第1分割幅を決定する分割幅決定ステップと、
    第1分割画像生成手段が、前記記載領域の所定の基点から、前記記載領域を前記第1分割幅毎に分割して複数の第1分割画像を生成する第1分割画像生成ステップと、
    第2分割画像生成手段が、前記所定の基点からずらして、前記第1分割幅に対応する第2分割幅毎に前記記載領域を分割して複数の第2分割画像を生成する第2分割画像生成ステップと、
    を含むことを特徴とする書類管理方法。
  7. コンピュータを、
    複数の記号が並んだ情報が記載された記載領域を書類の画像データから検出する記載領域検出手段、
    前記記載領域における前記情報の記載幅を算出する記載幅算出手段、
    前記記載幅の2分の1より長い第1分割幅を決定する分割幅決定手段、
    前記記載領域の所定の基点から、前記記載領域を前記第1分割幅毎に分割して複数の第1分割画像を生成する第1分割画像生成手段、および、
    前記所定の基点からずらして、前記第1分割幅に対応する第2分割幅毎に前記記載領域を分割して複数の第2分割画像を生成する第2分割画像生成手段として機能させることを特徴とする書類管理装置用のプログラム。
JP2017152390A 2017-08-07 2017-08-07 書類管理装置、書類管理方法、および、書類管理装置用のプログラム Pending JP2019032645A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017152390A JP2019032645A (ja) 2017-08-07 2017-08-07 書類管理装置、書類管理方法、および、書類管理装置用のプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017152390A JP2019032645A (ja) 2017-08-07 2017-08-07 書類管理装置、書類管理方法、および、書類管理装置用のプログラム

Publications (1)

Publication Number Publication Date
JP2019032645A true JP2019032645A (ja) 2019-02-28

Family

ID=65523469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017152390A Pending JP2019032645A (ja) 2017-08-07 2017-08-07 書類管理装置、書類管理方法、および、書類管理装置用のプログラム

Country Status (1)

Country Link
JP (1) JP2019032645A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11170253B2 (en) 2019-09-19 2021-11-09 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
US11410442B2 (en) 2019-09-19 2022-08-09 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11170253B2 (en) 2019-09-19 2021-11-09 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
US11410442B2 (en) 2019-09-19 2022-08-09 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
US11755867B2 (en) Composite code pattern, generating device, reading device, method, and program
US9619701B2 (en) Using motion tracking and image categorization for document indexing and validation
JP2007116469A (ja) 媒体処理方法、複写装置、及びデータファイリング装置
JP4913184B2 (ja) 本人確認書類真贋判定装置、本人確認書類真贋判定方法およびプログラム
TWI725465B (zh) 影像處理系統、影像處理方法及程式產品
TW202006597A (zh) 影像處理系統、影像處理方法及程式產品
JP6694587B2 (ja) 画像読込み装置及びプログラム
JP2019032645A (ja) 書類管理装置、書類管理方法、および、書類管理装置用のプログラム
JP2021060629A (ja) 設問生成装置、設問生成方法、設問生成装置用プログラム、および、書類管理システム
US11188747B2 (en) System and method for masking text within images
CN114283273A (zh) 对照系统、对照方法和信息存储介质
KR102085561B1 (ko) Qr코드 위변조 방지장치 및 방법
JP5998090B2 (ja) 画像照合装置、画像照合方法、画像照合プログラム
JP2012063993A (ja) 画像処理装置及びその制御方法ならびにプログラム
JP7392322B2 (ja) 画像処理装置、画像処理方法、画像処理装置用プログラム、および、書類管理システム
JP2018182664A (ja) 管理装置、管理方法、および、管理装置用のプログラム
JP6547654B2 (ja) 書類撮像装置、書類撮像方法、書類撮像装置用のプログラム、および、管理システム
JP5878004B2 (ja) 複数文書認識システム及び複数文書認識方法
JP2020113240A (ja) ファイル生成装置、ファイル生成方法、ファイル生成装置用プログラム、および、ファイル生成システム
JP2019021981A (ja) 書類生成装置、書類生成方法、および、書類生成装置用のプログラム
JP6561882B2 (ja) 情報処理装置、情報処理方法、情報処理装置用のプログラム、および、書類管理システム
JP6680101B2 (ja) 表示調節装置、表示調節方法、表示調節装置用のプログラム、及び、管理システム
JP6493685B2 (ja) 管理装置、管理方法、管理装置用のプログラム、および、管理システム
JP6493684B2 (ja) 管理装置、管理方法、管理装置用のプログラム、および、管理システム
JP4309881B2 (ja) 身分証認識装置及び身分証認識方法