JP2011210076A - 書類良否判定装置、書類良否判定システム、書類良否判定方法及びプログラム - Google Patents

書類良否判定装置、書類良否判定システム、書類良否判定方法及びプログラム Download PDF

Info

Publication number
JP2011210076A
JP2011210076A JP2010078312A JP2010078312A JP2011210076A JP 2011210076 A JP2011210076 A JP 2011210076A JP 2010078312 A JP2010078312 A JP 2010078312A JP 2010078312 A JP2010078312 A JP 2010078312A JP 2011210076 A JP2011210076 A JP 2011210076A
Authority
JP
Japan
Prior art keywords
document
component
information
image data
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010078312A
Other languages
English (en)
Inventor
Hiroshi Nemoto
博司 根本
Kenji Tanaka
健志 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nifty Corp
Original Assignee
Nifty Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nifty Corp filed Critical Nifty Corp
Priority to JP2010078312A priority Critical patent/JP2011210076A/ja
Publication of JP2011210076A publication Critical patent/JP2011210076A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】書類を点検する業務の効率化を図る技術を提供する。
【解決手段】書類良否判定装置は、書類種別及び書類種別に対応する書類の構成要素の識別子と前記構成要素の当該書類上の領域指定とを含む書類情報と、前記構成要素に対して、少なくとも1つの構成要素についての記載条件を定めた書類構成要素記載条件と、を格納する記憶部と、書類から読み取られた画像データを入力する入力部と、前記画像データ中の書類種別領域から書類種別情報を取得する書類種別情報取得部と、前記取得した書類種別情報に対応する書類情報を前記記憶部から取得する書類情報取得部と、前記取得した書類情報を基に前記画像データ中のそれぞれの構成要素に該当する領域からそれぞれの構成要素情報を取得する構成要素情報取得部と、前記取得したそれぞれの構成要素情報が前記識別子に対応する構成要素記載条件を満足するか否かを判定する判定部と、を備える。
【選択図】図12

Description

本発明は、紙媒体の書類の良否を点検する業務において、画像データ化した書類の良否を判定する技術に関する。
近年、PC等のコンピュータを用いて企業における様々な業務の効率化が図られている。例えば、企業内の設備の利用状況をサーバで管理することで、従業員は、迂遠な手続を行わなくても、自己のPCからサーバにアクセスして利用申請を行うだけで会社内の設備を利用することができる。このようなコンピュータを用いた業務の効率化は、紙媒体で提出された書類の管理についても行われている。
例えば、紙媒体で提出された書類の管理について、特許文献1のような技術がある。特許文献1に記載される技術は、OCR(Optical Character Reader)装置を用いて、業務遂
行に関わる様々な履歴を管理するものである。
特開2009−181225号公報
しかしながら、特許文献1のような技術を用いても、紙媒体で提出された書類の良否を点検する業務自体は人の手によって行わなければならない。このような書類の良否の点検は、一般的に人の眼による点検しかできないものであり、更に紙媒体で提出された書類に付属する文書間との記載の整合性を点検作業については、熟練を要するものである。
したがって、特許文献1のような技術を用いても、紙媒体で提出された書類の点検業務の効率化を図ることはできず、OCRの誤検出を点検しなければならないことを考慮すると
、更に業務が増えてしまうといった問題点が生じていた。
本発明の課題は、このような問題点に鑑み、書類を点検する業務を効率化する技術を提供することにある。
本発明は、上述した課題を解決するために、以下の構成を採用する。すなわち、本発明に係る書類良否判定装置は、書類種別及び書類種別に対応する書類の構成要素の識別子と前記構成要素の当該書類上の領域指定とを含む書類情報と、前記構成要素に対して、少なくとも1つの構成要素についての記載条件を定めた書類構成要素記載条件と、を格納する記憶部と、書類から読み取られた画像データを入力する入力部と、前記画像データ中の書類種別領域から書類種別情報を取得する書類種別情報取得部と、前記取得した書類種別情報に対応する書類情報を前記記憶部から取得する書類情報取得部と、前記取得した書類情報を基に前記画像データ中のそれぞれの構成要素に該当する領域からそれぞれの構成要素情報を取得する構成要素情報取得部と、前記取得したそれぞれの構成要素情報が前記識別子に対応する構成要素記載条件を満足するか否かを判定する判定部とを備えることを特徴とする。
本発明によれば、書類良否判定装置は、画像データとして入力された書類の書類種別と構成要素を、記憶部に格納されている書類情報に基づいて認識することができる。そして、認識した書類の構成要素毎に、記憶部に格納されている書類構成要素記載条件を満たすか否かを判定することができる。
また、本発明に係る書類良否判定装置は、画像データとして入力された書類が有する、当該書類の各構成要素の座標を定める基準箇所に基づいて当該画像データを補正する画像データ補正部を更に備えてもよい。
このように本発明に係る書類良否判定装置の画像データ補正部が、画像データを補正することで、書類を取り込む際のずれやゆがみを解消することができる。
さらに、本発明に係る書類良否判定装置は、画像データとして入力された書類の構成要素には印影欄が含まれる場合、当該印影欄に押印された印影が有する、当該印影の各構成要素の座標を定める基準箇所に基づいて、当該印影を補正する印影補正部を更に備えてもよい。
このように本発明に係る書類良否判定装置の印影補正部が、印影を補正することで、押印された印影のずれやゆがみを解消することができる。
なお、本発明の別態様としては、以上の何れかの構成を実現するシステムであってもよいし、方法であってもよいし、プログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記憶媒体であってもよい。
本発明によれば、書類を点検する業務の効率化を図る技術を提供することができる。
本実施形態における書類良否判定装置を含むシステム全体の構成を例示する図。 本実施形態におけるワークサーバ1の構成要素を例示する図。 書類の例を示す図。 書式管理マスタ21のレコードの例を示す図。 書式レイアウトマスタ22のレコードの例を示す図。 印影の例を示す図。 印影レイアウトマスタ23のレコードの例を示す図。 判定ルールマスタ24のレコードの例を示す図。 書類マスタ25のレコードの例を示す図。 本実施形態における各種マスタのレコードの作成例を示すフローチャート。 本実施形態における書類良否判定方法例を示すフローチャート。 本実施形態における管理部門端末6が存在しない場合の書類良否判定方法例を示すフローチャート。
以下、本発明を実施するための形態としての書類良否判定装置について具体例を挙げて説明する。以下に挙げる実施形態は例示であり、本発明は以下の実施形態の構成に限定されない。
§1 システム構成
図1は、実施形態における書類良否判定装置を含むシステム全体の構成を例示する図である。本実施形態におけるシステム(以下、「本システム」とも表記)は、書類良否判定装置に該当するワークサーバ1、現場部門端末5、管理部門端末6等から構成される。ワークサーバ1、現場部門端末5、管理部門端末6はそれぞれネットワーク7を介して通信可能に接続される。
ネットワーク7は、インターネット等の公衆ネットワークであってもよいし、LAN(Local Area Network)やWAN(Wide Area Network)等の社内ネットワークであってもよい。
本発明は、このようなネットワーク7を限定するものではなく、ネットワーク7上に規定されるプロトコル等を限定するものでもない。
§2 装置構成
§2−1 ワークサーバ1
図2は、本実施形態におけるワークサーバ1の構成を例示する図である。
ワークサーバ1は、ハードウェア構成として図2に示されるように、バス13で接続される、記憶部11、処理部12、通信部14等のハードウェアを有する。記憶部11は、例えばハードディスクであり、処理部12で実行される処理で利用される各種情報を記憶する。処理部12は、CPU(Central Processing Unit)等の1または複数のプロセッサであり、このプロセッサの処理に利用される周辺回路(ROM(Read Only Memory)、RAM(Random Access Memory)、インターフェース回路等)を有する。通信部14は、ネットワーク7に接続され、現場部門端末5と管理部門端末6等とIP(Internet Protocol)パケッ
ト等の送受信を行う。
ワークサーバ1は、PC(Personal Computer)等のような汎用コンピュータで構成され
てもよいし、ネットワーク接続ストレージ(NAS)のような専用コンピュータで構築され
てもよい。本発明は、ワークサーバ1のハードウェア構成を限定するものではない。
ワークサーバ1は、記憶部11に格納されるOS(Operating System)等のプログラムが処理部12において実行されることにより、書類の良否判定を行うワークサーバとして動作する。
また、図3は、本実施形態の説明に用いる例示の書類(01−01完了報告書)である。以下、ワークサーバ1の各構成要素について、書類「01−01完了報告書」(以下、「例示書類」と記載)を用いて説明する。
なお、例示書類は構成要素として、書類枠100、書式番号欄101、書類番号欄102、版数欄103、申請日欄104、件名欄105、チェックボックス欄106、内容欄107、責任者印欄108、担当者印欄109、パンチ穴110を有する。
§2−1−1 記憶部11
記憶部11は、書類良否の判定を行う際に用いる情報として、書式管理マスタ21、書式レイアウトマスタ22、印影レイアウトマスタ23、判定ルールマスタ24、書類マスタ25を格納している。
(1)書式管理マスタ21
書式管理マスタ21には、画像として入力された書類(以下、「判定対象書類」と表記する)を管理するための情報が格納される。図4は、本実施形態における書式管理マスタ21のレコードの例である。本実施形態における書式管理マスタ21のレコードは、項目名フィールド、データ内容フィールドを有する。
項目名フィールドには、書類の構成要素を識別するための識別子が格納される。書式管理マスタ21における項目名フィールドには、後述する書式管理マスタ21の作成時における管理者の入力に応じて、書類の構成要素を識別するための識別子が格納される。例えば、図4において、例示書類の構成要素である書式番号欄101に対応する識別子「書式番号」が格納されている。
データ内容フィールドには、書類の各構成要素に対応する内容情報(データ内容)が格納される。データ内容とは、書類の各構成要素内に記述される情報のことであり、例えば、書式番号欄101に記述されている「01−01完了報告書」である。
書式管理マスタ21のレコードの作成については、§2−1−1(6)において説明する。
(2)書式レイアウトマスタ22
書式レイアウトマスタ22には、書類種別に対応する書類の良否を判定する対象となる書類の構成要素を特定するための情報が格納される。図5は、本実施形態における書式レイアウトマスタ22のレコードの例である。本実施形態における書式レイアウトマスタ22のレコードは、項目名フィールド、位置情報フィールド、必須項目フィールド、補正フィールドを有する。
項目名フィールドには、書式管理マスタ21と同様、書類の構成要素を識別するための識別子が格納される。
位置情報フィールドには、後述する構成要素データ化部34が書類の構成要素のデータ内容を文字データ化する際に利用する位置情報が格納される。本実施形態において、書類枠100の左上頂点の座標を(000.000)とし、右下頂点の座標を(999.999)として、各構成要素の座標が計算される。そして、本実施形態における書類の構成要素の位置情報は、構成要素を長方形とし、左上頂点をA点、右下頂点をB点として、(A点の座標/B点の座標)の形式で表現される。なお、本実施形態における位置情報の表現形式は、本発明を限定するものではなく、直交座標や極座標等の周知の表現形式であってもよい。
必須項目フィールドには、書類の構成要素についての良否を判定する際、当該構成要素を書類の良否判定の必須項目とするか否かを示す識別子が格納される。例示書類においては、「書式番号」、「書類番号」、「版数」、「申請日」、「件名」及び「現場部門責任者印」が書類の良否判定の必須項目とすることを示す識別子を格納している。
補正フィールドには、書類の構成要素について、当該構成要素のデータ内容の補正を行うか否かを示す識別子が格納されている。例示書類においては、「現場部門責任者印」及び「現場部門担当者印」が補正を行うことを示す識別子を格納している。
(3)印影レイアウトマスタ23
図6は、本実施形態において書類に押印された印影例(以下、「例示印影」と記載)である。例示印影は構成要素として、印影外周200、印影上段201、印影中段202、点203、点204、印影下段205を有する。
印影レイアウトマスタ23には、印影を補正するための情報が格納される。図7は、本実施形態における印影レイアウトマスタ23のレコードの例である。本実施形態における印影レイアウトマスタ23のレコードは、項目名フィールド、位置情報フィールドを有す
る。
項目名フィールドには、印影の構成要素を識別するための識別子が格納される。例えば、図7において、印影上段201に対応する「印影上段(部署)」が格納されている。
位置情報フィールドは、印影の構成要素の位置情報が格納される。本実施形態において、印影の構成要素の座標は、印が押印される書類の構成要素の位置情報を用いて表現される。具体的には、当該書類の構成要素の位置情報であるA点を(−100.−100)とし、B点を(100.100)として、印影の構成要素の座標が指定される。座標の表現形式については、書式レイアウトマスタ22と同様である。
(4)判定ルールマスタ24
判例ルールマスタ24には、書類の良否を判定するための条件が書類の構成要素に対応して格納される。図8は、本実施形態における判定ルールマスタ24のレコードの例である。本実施形態における判定ルールマスタ24のレコードは、項目名フィールド、判定条件フィールドを有する。
項目名フィールドには、書式管理マスタ21及び書式レイアウトマスタ22と同様、書類の構成要素を識別するための識別子が格納される。
判定条件フィールドには、当該判定対象となっている構成要素の判定条件が格納される。図8では、自然言語(日本語)で例示しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメタ等で指定される。例えば、項目名「件名」である構成要素の判定条件は「記入されていること」であるが、当該判定条件は「=! null」等
で指定される。
なお、判定条件は複数であってもよく、その数に応じて、判定条件フィールドが設けられる。本実施形態における判定ルールマスタ24では、各構成要素に対応する判定条件が最大2件であるため、判定条件1フィールドと判定条件2フィールドが設けられている。
(5)書類マスタ25
書類マスタ25は、判定が1度でも行われた書類情報を保存するために用いられる。図9は、本実施形態における書類マスタ25のレコードの例である。本実施形態における書類マスタ25のレコードは、項目名フィールド、データ内容フィールド、判定フィールド、コメントフィールドを有する。
項目名フィールドには、書式管理マスタ21、書式レイアウトマスタ22及び判定ルールマスタ23と同様、書類の構成要素を識別するための識別子が格納される。
データ内容フィールドには、書式管理マスタ21と同様、書類の各構成要素に対応する内容情報(データ内容)が格納される。
判定フィールドには、書類の各構成要素に対する書類の良否の判定結果を示す識別子が格納される。書類の良否の判定は、後述する構成要素判定部35が行う。本実施形態において、書類の良否の判定結果は、A、B、Cの3段階で表現されている。A判定は、判定ルールマスタ24の条件を全て満たしていることを示す。B判定は、判定ルールマスタ24の条件を満たしていないこと、または、記入漏れや押印漏れ等の書類自体の不足を示す。C判定は、文字つぶれ等によるOCR解析不能を示す。ただし、これらの判定の表現方法
や判定の種類は本発明を限定するものではない。
コメントフィールドには、書類の各構成要素に対する現場部門端末5による追記事項が格納される。現場部門端末5によって入力される追記事項は、例えば、C判定であった構成要素のデータ内容の文字データ、つまり、解析不能であったデータ内容の文字データである。
(6)各種マスタの作成について
本実施形態において、書式管理マスタ21、書式レイアウトマスタ22、印影レイアウトマスタ23、判定ルールマスタ24は、予め管理者によって作成される。以下、各種マスタのレコードの作成について説明する。図10は、各種マスタのレコード作成方法の例を示す。本実施形態において、管理者は、管理部門端末6を用いて各種マスタのレコードを作成し、ワークサーバ1の各種マスタに登録する。ただし、以下説明される各種マスタのレコードの作成方法は、本発明を限定するものではない。周知の画像認識ソフトを用いて、各種マスタの作成過程を一部自動化してもよい。また、管理者は、管理部門端末6ではなく、ワークサーバ1において各種マスタのレコードを作成してもよい。
書式管理マスタ21及び書式レイアウトマスタ22のレコードは、判定対象書類の見本(以下、「見本書類」と表記する)を用いて作成される。まず、管理者は、見本書類を管理部門端末6に画像データとして取り込む(S301)。見本書類の取り込みにはOCR装
置やスキャナを用いてもよいし、管理部門端末6上で作成した文書ファイルを用いてもよい。次に、管理者は、管理部門端末6上で、書式レイアウトマスタ22のレコードに登録したい、取り込んだ見本書類の構成要素の画像データ上の位置情報を入力し、該当する構成要素名を入力する(S302)。位置情報の入力は管理者のマウス操作等によるクリック操作及びドラッグ操作であってもよい。これらの入力により、管理部門端末6は、書式レイアウトマスタ22のレコードに項目名と位置情報を取得する。また、管理部門端末6は、書式管理マスタ21のレコードの書式番号のデータ内容及び最新版数のデータ内容、書式レイアウトマスタ22の必須項目及び補正フィールドをそれぞれ管理者からの入力に応じて取得する。そして、管理部門端末6は、取得したデータからそれぞれのマスタのレコードを作成する。最後に、管理部門端末6は作成したそれぞれのマスタのレコードをワークサーバ1へ送信し、ワークサーバ1は受信したそれぞれのマスタのレコードをそれぞれのマスタに登録する(S303)。
なお、見本書類の構成要素の画像データ上の位置情報を管理者が指定する際、当該構成要素が印影欄であるならば、当該構成要素よりも大きな位置情報を指定することが好ましい。後述する印影座標補正部33が当該構成要素に押印された印影の座標を補正する際、印影座標補正部33は、当該位置情報を印影の存在する範囲として扱うからである。
印影レイアウトマスタ23のレコードは、見本となる印影(以下、「見本印影」と表記する)を用いて作成される。まず、管理者は、見本印影を管理部門端末6に画像データとして取り込む(S401)。見本印影の取り込みにはOCR装置やスキャナを用いてもよい
し、管理部門端末6上で作成した画像ファイルを用いてもよい。次に、管理者は、管理部門端末6上で、取り込んだ見本印影の構成要素の画像上の位置情報を入力し、該当する構成要素名を入力する(S402)。位置情報の入力は上述と同様にマウス操作等によるクリック操作及びドラッグ操作であってもよい。これらの入力により、管理部門端末6は、印影レイアウトマスタ23の項目名と位置情報を取得する。そして、管理部門端末6は、取得したデータから印影レイアウトマスタ23のレコードを作成する。最後に、管理部門端末6は作成した印影レイアウトマスタ23のレコードをワークサーバ1へ送信し、ワークサーバ1は受信した印影レイアウトマスタ23のレコードを印影レイアウトマスタ23に登録する(S403)。
判定ルールマスタ24のレコードは、書式レイアウトマスタ22のレコードを用いて作
成される。管理者は判例ルールマスタ24のレコードを作成したい書類の書式番号と最新版数を管理部門端末6に入力する。管理部門端末6は、管理者の入力に応じて、ワークサーバ1に当該書類の書式レイアウトマスタ22のレコードを問い合わせる。該当する書式レイアウトマスタ22のレコードがなければ、管理者は判定ルールマスタ24のレコードを作成することはできない。
管理部門端末6は、該当する書式レイアウトマスタ22のレコードをワークサーバ1から取得すると、必須項目に「○」が格納されている項目名を書式レイアウトマスタ22のレコードから取得する(S501)。次に、管理者は、管理部門端末6上で、各項目名に対する判定条件を入力する(S502)。この入力により、管理部門端末6は判定ルールマスタ24のレコードの判定条件を取得する。そして、管理部門端末6は、取得したデータから判定ルールマスタ24のレコードを作成する。最後に、管理部門端末6は、作成した判定ルールマスタ24のレコードをワークサーバ1へ送信し、ワークサーバ1は受信した判定ルールマスタ24のレコードを判定ルールマスタ24に登録する(S503)。
§2−1−2 処理部12
処理部12は、画像として入力された書類(以下、「判定対象書類」と表記する)の良否の判定を行うため、構成要素座標補正部31、構成要素認識部32、印影座標補正部33、構成要素データ化部34、構成要素判定部35、判定通知部36を有する。
(1)構成要素座標補正部31
構成要素座標補正部31は、書類の各構成要素の座標を定める基準箇所を有する判定対象書類の補正を行う。書類の各構成要素の座標を定める基準箇所は、例えば、例示書類でいうパンチ穴110である。以下、判定対象書類が例示書類であるとして説明する。
構成要素座標補正部31は、座標補正後のパンチ穴110の座標を固定座標として保有する。例示書類にはパンチ穴110が2つあり、パンチ穴110を点と見立てると、画像として取り込んだ例示書類にずれや傾きがあっても、例示書類の各構成要素(101〜109)はこの2点からの一定の相対座標で表現される。したがって、当該固定座標と相対座標を用いれば、例示書類の各構成要素(101〜109)は一定の絶対座標で表現される。具体的には、構成要素座標補正部31は、周知の画像認識技術により2つのパンチ穴110を認識し、2つのパンチ穴110の画像データ上の座標と当該固定座標との差分を計算する。構成要素座標補正部31は、当該差分から、周知の数学により、画像データ上の2つのパンチ穴110を当該固定座標に移動する計算式を求める。周知の数学として、行列やベクトル表現を用いてもよい。当該計算式により、構成要素座標補正部31は、判定対象書類の補正を行う。
なお、本発明は、書類の各構成要素の座標を定める基準箇所を例示書類におけるパンチ穴110のような2つの点に限定するものではない。例えば、書類が有する特定の構成要素や直線等を用いても良い。
(2)構成要素認識部32
構成要素座標補正部31が判定対象書類の補正を行った後、構成要素認識部32は、判定対象書類の種別及び判定対象となる構成要素の特定を行う。以下、判定対象書類が例示書類であるとして説明する。
まず、構成要素認識部32は、例示書類の種別を特定するため、例示書類の書式番号欄101のデータ内容、つまり、書式番号を認識する。構成要素認識部32は、例示書類の書式番号欄101のデータ内容である書式番号を周知のOCRソフト等と用いて文字認識し
て、例示書類の書式番号を取得する。そして、構成要素認識部32は、取得した例示書類
の書式番号を用いて、書類管理マスタ21から例示書類のレコードを取得する。
なお、本実施形態において、書式番号欄101のデータ内容の文字認識により、初めて書類の書式番号が認識される。したがって、書式番号欄101の書類上での領域は全ての書類で統一されている。ただし、本実施形態において、書式番号欄101が全ての書類で統一されていることは、本発明を限定するものではない。書式番号は、現場部門端末5から与えられる情報で取得されてもよい。
次に、構成要素認識部32は、例示書類の構成要素のうち、既に1度良否の判定がなされ、A判定となっているものについての処理を省略するため、書類レイアウトマスタ22と書類マスタ25のレコードを用いて、後述する構成要素データ化部34が文字データ化する対象を特定する。構成要素認識部32は、上記取得した書類管理マスタ21のレコードの書式番号及び最新版数を用いて書類レイアウトマスタ22から例示書類のレコードを取得する。また、構成要素認識部32は、例示書類の書類番号欄102のデータ内容(書類番号)を用いて書類マスタ25から例示書類のレコードを取得する。構成要素認識部32は、取得した書類レイアウトマスタ22のレコードの位置情報から書類番号の位置を特定し、書式番号と同様の処理で当該位置の情報を認識することで書類番号を取得する。書類マスタ25に例示書類のレコードが登録されていなければ、例示書類の書類マスタ25のレコードは取得できないので、構成要素認識部32は、例示書類の書類レイアウトマスタ22のレコードに登録されている構成要素全てのデータ内容を文字データ化する対象であると特定する。一方、書類マスタ25に例示書類のレコードが登録されていれば、構成要素認識部32は、書類マスタ25から例示書類のレコードを取得する。そして、構成要素認識部32は、例示書類の書類マスタ25のレコードの判定フィールドを確認して、A判定以外の構成要素のデータ内容を文字データ化する対象であると特定する。
最後に、構成要素認識部32は、例示書類の書類レイアウトマスタ22のレコードの必須項目フィールドに基づいて、上記の文字データ化する構成要素のうち判定対象となる例示書類の構成要素を特定する。
(3)印影座標補正部33
判定対象書類の構成要素が、各構成要素の座標を定める基準箇所を有する印影をデータ内容として有する場合、印影座標補正部33は当該印影の補正を行う。以下、判定対象書類が例示書類であり、例示書類の責任者印欄108または担当者印欄109がデータ内容として有する印影が例示印影であるとして説明する。
例示印影は、点203と点204の2つの点がある。画像として取り込んだ例示印影にずれや傾きがあっても、例示印影の各構成要素は、この2つの点からの一定の相対座標で表現される。印影座標補正部33は、当該2つの点を用いて例示印影の補正を行う。補正の処理は、構成要素座標補正部31の補正の処理と同様である。
なお、本発明は、印影の各構成要素の座標を定める基準箇所を例示印影における2つの点に限定するものではない。例えば、印影を上段、中段、下段に分ける2つの線を用いても良い。
(4)構成要素データ化部34
構成要素データ化部34は、構成要素認識部32が文字データ化をする対象であると特定した判定対象書類の構成要素のデータ内容の文字データ化を行い、判定対象書類の書類マスタ25のレコードの更新を行う。判定対象書類の構成要素のデータ内容が印影を含む場合は、当該印影の構成要素のデータ内容についても文字データ化する。各構成要素の位置は、書式レイアウトマスタ22及び印影レイアウトマスタ23のレコードの位置情報に
よって特定されている。以下、判定対象書類が例示書類であり、例示書類の責任者印欄108または担当者印欄109はデータ内容として例示印影を有するとして説明する。
構成要素データ化部34は、構成要素認定部32が特定した文字データ化を行う例示書類の構成要素のデータ内容を認識する。データ内容の認識には、周知のOCRソフト等を用
いる。データ内容の認識には、例示書類のチェックボックスのようなマークシート処理も含む。例えば、例示書類例の場合であれば、データ内容は「新規開発」として認識される。
また、例示書類の責任者印欄108及び担当者印109は例示印影を有するため、構成要素データ化部34は、例示印影の構成要素のデータ内容についての認識も行う。認識方法については、上記のとおりである。なお、例示印影の構成要素のデータ内容の認識の際、構成要素データ化部34は、例示印影の印影レイアウトマスタ23のレコードから取得した位置情報に基づいて、データ内容の認識を行う。
以上の認識の結果から、構成要素データ化部34は、例示書類の書類マスタ25を更新する。書類マスタ25に例示書類のレコードが存在しない場合は、構成要素データ化部34は、例示書類の書類レイアウトマスタ22のレコードから項目名を取得し、各構成要素の画像データと認識した文字データをデータ内容として例示書類の書類マスタ25のレコードを作成する。書類マスタ25に例示書類のレコードが存在する場合は、構成要素データ化部34は、各構成要素の画像データと認識した文字データを該当する項目名のデータ内容に格納する。
(5)構成要素判定部35
構成要素判定部35は、判定対象書類の良否の判定を行う。以下、判定対象書類が例示書類であるとして説明する。
構成要素認識部32が判定対象として特定した例示書類の構成要素について、構成要素データ化部34が行った認識結果をもとに、判定ルールマスタ24のレコードを用いて、構成要素判定部35は各構成要素の良否の判定を行う。なお、構成要素判定部35は、書式レイアウトマスタ22のレコードと同様に、書式番号及び最新版数を用いて判定ルールマスタ24から例示書類のレコードを取得する。
判定の内容については、判定ルールマスタ24で述べたとおりである。構成要素認識部32は、判定ルールマスタ24のレコードの判定条件を満たさない或いはデータ内容が存在しないものについてはB判定を、構成要素データ化部が文字データ化できなかった構成要素についてはC判定を、判定ルールマスタ24のレコードの判定条件を全て満たす構成要素については、A判定を行う。そして、構成要素認識部32は判定結果を例示書類の書類マスタ25のレコードの判定フィールドに格納する。B判定である構成要素については、構成要素判定部35は、その理由(例えば、記入漏れ)をコメントフィールドに格納する。なお、構成要素判定部35は、文字データ化する対象の構成要素のうち、判定対象ではない構成要素についても良否の判定を行う。この場合、B判定またはC判定でないものは全てA判定となる。
判定対象である構成要素が全てA判定であれば、構成要素判定部35は例示書類の書類マスタ25のレコードに承認日時を書き込む。承認日時は、後述する管理部門端末6からの承認応答を必要とする場合、管理部門端末6からの応答時である。一方、管理部門端末6からの承認応答を必要としない場合、承認日時は、構成要素判定部35が判定を行った日時である。なお、承認日時については、図9では不図示である。
(6)判定通知部36
判定通知部36は、判定対象書類の良否の判定結果を現場部門端末5または管理部門端末6に通知する。通知は、周知の手法で行われればよい。
上述した構成要素判定部35が承認日時を書き込む際、管理部門端末6からの承認応答を必要とする場合、判定通知部36は、管理部門端末6に承認応答を求める通知をする。
判定対象である構成要素にA判定ではないものが存在する場合、判定通知部35は、B判定又はC判定の旨及び当該判定をした構成要素の画像データを現場部門端末5に通知する。
§2−2 現場部門端末5
現場部門端末5は、本実施形態において書類を提出する利用者が用いる端末である。例えば、現場部門端末5は、PCや携帯電話等である。現場部門端末5は、判定対象書類を画像データとして取り込む機能、画像データとして取り込んだ判定対象書類をワークサーバ1に送信し、判定結果をワークサーバ1から受信する一般的な通信機能等を有するものであればよい。本発明は、この現場部門端末5のハードウェア構成及び機能構成を限定するものではない。
本システムの利用者は、スキャナ等を用いて提出する書類を現場部門端末5に取り込み、現場部門端末5を用いてその画像データをワークサーバ1へ送信する。そして、ワークサーバ1において判定対象である書類の構成要素の良否が判定されると、上述のとおり、判定通知部36から現場部門端末5にその結果が通知される。良否の結果がB判定である場合、本システムの利用者は、B判定である書類の構成要素を修正したうえで、現場部門端末5を用いて再度書類の画像データを取り込み、ワークサーバ1へ再度送信することを求められる。良否の結果がC判定である場合、本システムの利用者は、現場部門端末5を用いて書類マスタ25のレコードにおいて、C判定である構成要素のコメントフィールドに追記事項を入力することが求められる。
§2−3 管理部門端末6
管理部門端末6は、本実施形態において書類の管理者が利用する端末である。例えば、管理部門端末6は、PCや携帯電話等である。管理部門端末6は、ワークサーバ1にアクセスしデータを受け得る一般的な通信機能、提供されたデータに基づく画面を表示及び操作することができる一般的なユーザインタフェース機能等を有するものであればよい。本発明は、この管理部門端末6のハードウェア構成及び機能構成を限定するものではない。
構成要素判定部35が書類マスタ25に承認日時を入力する際、ワークサーバ1から管理部門端末6は承認応答を求められる。判定通知部36から管理部門端末6へ判定対象である構成要素が全てA判定である旨の通知がなされると、本システムの管理者は、管理部門端末6を用いて、ワークサーバ1へ承認の許可について応答する。
§3 書類良否判定方法
図11は、本実施形態における書類良否判定方法例を示すフローチャートである。以下、判定対象書類が例示書類であり、例示書類の責任者印欄108または担当者印欄109がデータ内容として有する印影が例示印影であるとし、例示書類は一度本システムにおいて処理され、例示書類の書類マスタ25のレコード(図9)が作成されているものとして、本フローチャートの動作例を説明する。
本システムの利用者は、スキャナ等を用いて、提出する書類(例示書類)を画像データとして現場部門端末5に取り込む(S601)。取り込んだ例示書類は現場部門端末5か
らワークサーバ1へ送信される。
ワークサーバ1が現場部門端末5から例示書類を受信すると、構成要素座標補正部31は、例示書類の各構成要素の座標を補正する(S602)。構成要素座標補正部31は、パンチ穴110を周知の画像認識技術で認識し、パンチ穴110を固定座標に移動する座標変換を当該例示書類に対して行う。
構成要素座標補正部31が例示書類の補正をした後、構成要素認識部32は、例示書類の書式種別を判定する(S603)。構成要素認識部32は、OCRソフト等を用いて、書
類上の領域が前書類で統一されている書式番号欄101のデータ内容「01−01完了報告書」を認識する。記入漏れ等の理由により書式番号が認識不能である場合、構成要素判定部35は当該例示書類についてB判定を行う。書式番号が認識できた場合、構成要素認識部32は、書式番号「01−01完了報告書」を用いて、書式管理マスタ21から例示書類のレコードを取得する。
例示書類の書式管理マスタ21のレコードを取得した後、構成要素認識部32は、判定対象となる例示書類の構成要素を特定する(S604)。
まず、構成要素認識部32は、書類レイアウトマスタ22と書類マスタ25のレコードを用いて、構成要素データ化部34が文字データ化する対象を特定する。構成要素認識部32は、書式管理マスタ21のレコードに格納されている「01−01完了報告書」及び「V1.01」を用いて書類レイアウトマスタ22から例示書類のレコードを取得する。そして、構成要素認識部32は、取得した書類レイアウトマスタ22のレコードから書類番号の位置情報を取得し、当該位置に記述されている内容、つまり、書類番号欄102のデータ内容「A001−001」を認識する。構成要素認識部32は、認識した「A001−001」を用いて書類マスタ25から例示書類のレコードを取得する。取得した例示書類の書類マスタ25のレコードの判定フィールドを参照して、構成要素認識部32は、文字データ化する対象を特定する。本動作例では、構成要素認識部32は、書類マスタ25のレコードの判定フィールドにA以外の判定結果が格納されている構成要素「件名」と「現場部門責任者印」が文字データ化の対象の構成要素であると特定する。
そして、構成要素認識部32は、書類レイアウトマスタ22のレコードの必須項目フィールドに基づいて、上記の文字データ化する構成要素のうち判定対象となる例示書類の構成要素を特定する。構成要素「件名」及び「現場部門責任者印」の必須項目には「○」が格納されているため、構成要素「件名」及び「現場部門責任者印」は共に判定対象であると特定される。
判定対象となる例示書類の構成要素を構成要素認識部32が特定した後、印影座標補正部33は、責任者印欄109及び担当者印欄108の印影を補正する(S605)。印影座標補正部33は、例示印影の点203と点204の2点を認識し、当該2点を、それぞれ(座標000.000/000.000)と(座標000.030/000.030)に移動する座標変換を例示印影に対して行う(図7参照)。
印影座標補正部33が印影の補正をした後、構成要素データ化部34は、構成要素認識部32が特定した構成要素「件名」と「現場部門責任者印」について、文字データ化する(S606)。
構成要素データ化部34が文字データ化を行った後、構成要素判定部35は、判定ルールマスタ24を用いて、判定対象の構成要素について良否の判定を行う(S607)。本動作例では、構成要素「件名」と「現場部門責任者印」の良否判定を行う。
構成要素「件名」と「現場部門責任者印」のデータ内容が例示書類の判定ルールマスタ24のレコードの条件を満たさない、或いは、記入漏れ等であれば、構成要素判定部35は例示書類の書類マスタ25のレコードの当該構成要素についてB判定を示す識別子を格納する。そして、判定通知部36は、当該構成要素の画像データとB判定である旨を現場部門端末5に通知する(S608)。利用者は、現場部門端末5を用いて、書類を修正した上で再度提出することが求められる。
構成要素「件名」と「現場部門責任者印」のデータ内容が解析不能であった場合、構成要素判定部35は例示書類の書類マスタ25のレコードの当該構成要素についてC判定を示す識別子を格納する。そして、判定通知部36は、当該構成要素の画像データとC判定である旨を現場部門端末5に通知する(S609)。利用者は、現場部門端末5を用いて、当該構成要素について追記事項を入力することが求められる。
構成要素「件名」と「現場部門責任者印」のデータ内容が例示書類の判定ルールマスタ24のレコードの条件を満たしている場合、構成要素判定部35は例示書類の書類マスタ25のレコードの当該構成要素についてA判定を示す識別子を格納する。そして、判定対象の構成要素全てにA判定の情報が格納されることになるので、判定通知部36は、管理部門端末6に承認応答を求める通知を行う(S611)。管理者が管理部門端末6を用いて、当該承認を行うと(S612)、構成要素判定部35は、承認日時を例示書類の書類マスタ25のレコードに承認日時を格納し(S613)、判定通知部36は、判定対象の構成要素が全てA判定である旨を現場部門端末5に通知する(S614)。
また、構成要素判定部35が承認日時を書き込む際、管理部門端末6からの承認を必要としない場合、管理部門端末6は不要となる。図12は、管理部門端末6が存在しない場合の書類良否判定装置を含むシステムの動作例を示すフローチャートである。上述した図11のフローチャートと異なり、管理部門端末6からの応答(S611、S612)は存在しない。構成要素判定部35によって例示書類の書類マスタ25のレコードの判定対象の構成要素全てにA判定を示す識別子が格納されると(S615)、当該構成要素判定部35によって書類マスタ25のレコードに承認日時が入力される(S616)。そして、判定通知部36により現場部門端末5に終了通知がなされる(S617)。
§4 作用及び効果
上述したように、本実施形態における書類良否判定装置を含むシステムでは、書類の各構成要素について、書式レイアウトマスタ22のレコード内の必須項目に、その構成要素を判定対象とするか否かの情報が格納される。この必須項目に基づいて、利用者が現場部門端末5を用いて画像データとして取り込んだ書類の各構成要素について、良否判定を行うか否かが特定される。そして、良否判定の対象となった各構成要素について、A判定、B判定、C判定の良否判定が行われる。B判定またはC判定であれば、構成要素とともに判定結果が利用者に現場部門端末5を介して通知される。A判定であれば、承認日時とともに書類マスタ25に格納される。
これにより、本実施形態によれば、利用者の業務は、ワークサーバ1からの通知にしたがって、書類を画像データとして取り込むこと、及び、書類マスタ25のレコードのコメントフィールドに追記事項を入力することだけであり、業務の効率化が図られる。また、書類は書類マスタ25として管理されることも、業務の効率化につながる。
更に、構成要素座標補正部31及び印影座標補正部33では、それぞれ書類及び印影が補正される。
これにより、書類を画像データとして取り込む際のずれやゆがみによる文字データ化の誤認識を防止することができる。また、押印の位置がずれた印影や押印欄からはみ出した印影についての文字データ化の際の誤認識も防止することができる。
1 ワークサーバ
11 記憶部
12 処理部
21 書式管理マスタ
22 書式レイアウトマスタ
23 印影レイアウトマスタ
24 判定ルールマスタ
25 書類マスタ
31 構成要素座標補正部
32 構成要素認識部
33 印影座標補正部
34 構成要素データ化部
35 構成要素判定部
36 判定通知部
5 現場部門端末
6 管理部門端末

Claims (6)

  1. 書類種別及び書類種別に対応する書類の構成要素の識別子と前記構成要素の当該書類上の領域指定とを含む書類情報と、前記構成要素に対して、少なくとも1つの構成要素についての記載条件を定めた書類構成要素記載条件と、を格納する記憶部と、
    書類から読み取られた画像データを入力する入力部と、
    前記画像データ中の書類種別領域から書類種別情報を取得する書類種別情報取得部と、
    前記取得した書類種別情報に対応する書類情報を前記記憶部から取得する書類情報取得部と、
    前記取得した書類情報を基に前記画像データ中のそれぞれの構成要素に該当する領域からそれぞれの構成要素情報を取得する構成要素情報取得部と、
    前記取得したそれぞれの構成要素情報が前記識別子に対応する構成要素記載条件を満足するか否かを判定する判定部と、を備える書類良否判定装置。
  2. 前記書類は当該書類の各構成要素の座標を定める基準箇所を有し、当該書類から読み取られた画像データを前記基準箇所に基づいて補正する画像データ補正部、を更に備える請求項1に記載の書類良否判定装置。
  3. 前記書類の構成要素には印影欄が含まれ、当該印影欄に押印された印影は当該印影の各構成要素の座標を定める基準箇所を有し、前記画像データとして入力された書類の印影欄に押印された印影の画像データを前記基準箇所に基づいて補正する印影補正部、を更に備える請求項1または2に記載の書類良否判定装置。
  4. ネットワークを介して接続される端末およびサーバから構成される書類良否判定システムにおいて、
    前記端末は、
    紙媒体の書類を画像データとして取り込む取り込み手段と、
    取り込んだ前記画像データを送信する送信手段と、
    を備え、
    前記サーバは、
    書類種別及び書類種別に対応する書類の構成要素の識別子と前記構成要素の当該書類上の領域指定とを含む書類情報と、前記構成要素に対して、少なくとも1つの構成要素についての記載条件を定めた書類構成要素記載条件と、を格納する記憶部と、
    前記端末から前記画像データを受信する受信手段と、
    前記画像データ中の書類種別領域から書類種別情報を取得する書類種別情報取得部と、
    前記取得した書類種別情報に対応する書類情報を前記記憶部から取得する書類情報取得部と、
    前記取得した書類情報を基に前記画像データ中のそれぞれの構成要素に該当する領域からそれぞれの構成要素情報を取得する構成要素情報取得部と、
    前記取得したそれぞれの構成要素情報が前記識別子に対応する構成要素記載条件を満足するか否かを判定する判定部と、
    を備える書類良否判定システム。
  5. コンピュータが実行する書類良否判定方法であり、
    前記コンピュータは、
    書類種別及び書類種別に対応する書類の構成要素の識別子と前記構成要素の当該書類上の領域指定とを含む書類情報と、前記構成要素に対して、少なくとも1つの構成要素についての記載条件を定めた書類構成要素記載条件と、を格納する記憶部を備え、
    書類から読み取られた画像データを入力するステップと、
    前記画像データ中の書類種別領域から書類種別情報を取得するステップと、
    前記取得した書類種別情報に対応する書類情報を前記記憶部から取得するステップと、
    前記取得した書類情報を基に前記画像データ中のそれぞれの構成要素に該当する領域からそれぞれの構成要素情報を取得するステップと、
    前記取得したそれぞれの構成要素情報が前記識別子に対応する構成要素記載条件を満足するか否かを判定するステップと、を実行する書類良否判定方法。
  6. 書類良否判定装置のプログラムであって、
    前記書類良否判定装置は、
    書類種別及び書類種別に対応する書類の構成要素の識別子と前記構成要素の当該書類上の領域指定とを含む書類情報と、前記構成要素に対して、少なくとも1つの構成要素についての記載条件を定めた書類構成要素記載条件と、を格納する記憶部を備え、
    前記書類良否判定装置に、
    書類から読み取られた画像データを入力するステップと、
    前記画像データ中の書類種別領域から書類種別情報を取得するステップと、
    前記取得した書類種別情報に対応する書類情報を前記記憶部から取得するステップと、
    前記取得した書類情報を基に前記画像データ中のそれぞれの構成要素に該当する領域からそれぞれの構成要素情報を取得するステップと、
    前記取得したそれぞれの構成要素情報が前記識別子に対応する構成要素記載条件を満足するか否かを判定するステップと、を実行させるためのプログラム。
JP2010078312A 2010-03-30 2010-03-30 書類良否判定装置、書類良否判定システム、書類良否判定方法及びプログラム Withdrawn JP2011210076A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010078312A JP2011210076A (ja) 2010-03-30 2010-03-30 書類良否判定装置、書類良否判定システム、書類良否判定方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010078312A JP2011210076A (ja) 2010-03-30 2010-03-30 書類良否判定装置、書類良否判定システム、書類良否判定方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2011210076A true JP2011210076A (ja) 2011-10-20

Family

ID=44941046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010078312A Withdrawn JP2011210076A (ja) 2010-03-30 2010-03-30 書類良否判定装置、書類良否判定システム、書類良否判定方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2011210076A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020190816A (ja) * 2019-05-20 2020-11-26 京都電子計算株式会社 文字読取装置及び文字読取装置用プログラム
JP2021043500A (ja) * 2019-09-06 2021-03-18 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2021060629A (ja) * 2019-10-02 2021-04-15 大日本印刷株式会社 設問生成装置、設問生成方法、設問生成装置用プログラム、および、書類管理システム
JP7405287B1 (ja) * 2022-09-15 2023-12-26 大日本印刷株式会社 情報処理装置、コンピュータプログラム及び情報処理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020190816A (ja) * 2019-05-20 2020-11-26 京都電子計算株式会社 文字読取装置及び文字読取装置用プログラム
JP7209161B2 (ja) 2019-05-20 2023-01-20 京都電子計算株式会社 文字読取装置及び文字読取装置用プログラム
JP2021043500A (ja) * 2019-09-06 2021-03-18 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2021060629A (ja) * 2019-10-02 2021-04-15 大日本印刷株式会社 設問生成装置、設問生成方法、設問生成装置用プログラム、および、書類管理システム
JP7380039B2 (ja) 2019-10-02 2023-11-15 大日本印刷株式会社 設問生成装置、設問生成方法、設問生成装置用プログラム、および、書類管理システム
JP7405287B1 (ja) * 2022-09-15 2023-12-26 大日本印刷株式会社 情報処理装置、コンピュータプログラム及び情報処理方法

Similar Documents

Publication Publication Date Title
JP7262166B2 (ja) 手書き装置の文書の入力領域に用いる方法およびシステム
US9092758B2 (en) Service providing apparatus, information processing system and methods
TWI374651B (en) Method and apparatus for adding signature information to electronic documents
JP6504234B2 (ja) 情報処理装置、その処理方法及びプログラム
JP2013178748A (ja) 情報処理装置、プログラム、情報処理システム及びデータ変換処理方法
US9652445B2 (en) Methods and systems for creating tasks of digitizing electronic document
JP5893825B2 (ja) ワークフローのための方法及びシステム
JP2011210076A (ja) 書類良否判定装置、書類良否判定システム、書類良否判定方法及びプログラム
US11106908B2 (en) Techniques to determine document recognition errors
JP2007133550A (ja) 情報管理システム、および情報管理方法
JP4925689B2 (ja) 画面再現用データ生成システム、画面再現用データ生成方法、およびコンピュータプログラム
JP2008217545A (ja) コンソール情報取得システム、コンソール情報取得方法及びコンソール情報取得プログラム
JP6784124B2 (ja) 情報処理システム、使用量情報生成方法、情報処理装置及びプログラム
US11257006B1 (en) Auto-annotation techniques for text localization
JP3693328B2 (ja) 回答フォームを使用するデータ取得システムおよび方法
JP2010061279A (ja) データ処理制御プログラム、データ処理制御装置及びデータ処理システム
JP2021036373A (ja) 情報処理装置及びプログラム
CN107861931B (zh) 模板文件处理方法、装置、计算机设备和存储介质
JP2014049098A (ja) 画像形成装置、画像形成装置の制御方法およびプログラム
JP2009176100A (ja) ファイル管理装置
JP2010279040A (ja) 定様式の装置レポートを生成するシステムおよび方法
JP6327061B2 (ja) スケジュール連携情報処理装置
JP2018151729A (ja) 情報処理システム、情報処理方法及びプログラム
JP2013089160A (ja) ネットワーク印刷システム
US11659104B2 (en) Generation of an electronic document capable of receiving user input

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20130604