JP7484176B2 - 情報処理装置、情報処理システムおよびプログラム - Google Patents

情報処理装置、情報処理システムおよびプログラム Download PDF

Info

Publication number
JP7484176B2
JP7484176B2 JP2020005306A JP2020005306A JP7484176B2 JP 7484176 B2 JP7484176 B2 JP 7484176B2 JP 2020005306 A JP2020005306 A JP 2020005306A JP 2020005306 A JP2020005306 A JP 2020005306A JP 7484176 B2 JP7484176 B2 JP 7484176B2
Authority
JP
Japan
Prior art keywords
electronic document
accepted
group
electronic
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020005306A
Other languages
English (en)
Other versions
JP2021114041A (ja
Inventor
浩司郎 猪股
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2020005306A priority Critical patent/JP7484176B2/ja
Priority to US16/997,187 priority patent/US11438477B2/en
Publication of JP2021114041A publication Critical patent/JP2021114041A/ja
Application granted granted Critical
Publication of JP7484176B2 publication Critical patent/JP7484176B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報処理装置、情報処理システム、プログラムに関する。
従来、紙文書に記入箇所が用意され、記入箇所に記入した文書を、予め定められた担当者等に提出することが行われている。そして、紙文書の提出を受けた者は、記入事項の確認作業を行う必要がある。この確認作業の一例として、未記入箇所の有無を確認する作業がある。このとき従来は、担当者は、目視により未記入箇所の有無を確認する必要があり、確認作業に多大な労力を必要とする。一方、文書として、電子文書を使用した場合、文書の受け渡しに要する労力は軽減されるものの、同様に、目視により未記入箇所の有無を確認しなければならない。
特許文献1には、画像処理装置が開示されている。この画像処理装置では、第1の画像受付手段が、記入が行われていない文書の画像を受け付け、記入領域抽出手段が、第1の画像受付手段によって受け付けられた画像から記入領域を抽出する。さらに、第1の特徴量抽出手段が、第1の画像受付手段によって受け付けられた画像の特徴量を抽出する。そして、記憶手段が、記入領域抽出手段によって抽出された記入領域に関する情報と特徴量抽出手段によって抽出された特徴量を記憶する。
特許文献2には、帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データベースに接続される情報処理装置が開示されている。この情報処理装置は、処理対象帳票の画像データを取得する画像データ取得部と、画像データから、処理対象帳票に係る特徴データを取得する特徴データ取得部と、特徴データベースに蓄積されている特徴データから、処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、処理対象帳票の帳票種別を推定する推定部と、推定部によって処理対象帳票の帳票種別が推定されなかった場合に、処理対象帳票に係る特徴データを特徴データベースに追加する特徴データ追加部と、を備える。
特開2011-65311号公報 特開2012-198684号公報
未記入箇所の有無確認の方法として、電子文書の記入箇所を予め登録し、登録された情報を基に未記入箇所を特定する方法があるが、電子文書毎に確認すべき記入箇所を予め登録する作業が必要となる。さらに、電子文書が複数のステップによるフローにより受け渡しが行われる場合、記入箇所は、同一の電子文書であったとしてもステップ毎に異なり、記入箇所をステップ毎に登録する作業は、煩雑である。
本発明は、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができる情報処理装置等を提供することを目的とする。
請求項1に記載の発明は、プロセッサを備え、前記プロセッサは、電子文書の類似度から、過去に処理した電子文書をグループ分けし、受け付けられた電子文書が、グループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分の特徴点を見いだし、当該特徴点が予め定められた条件を満たしたときに、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別し、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定することを特徴とする情報処理装置である。
請求項2に記載の発明は、前記プロセッサは、決定されたグループに属し過去に処理した電子文書で生じた差分と比較して、受け付けられた電子文書で生じた差分が予め定められた変化をしたときに、前記変更版であると推定することを特徴とする請求項1に記載の情報処理装置である。
請求項3に記載の発明は、前記プロセッサは、予め定められた変化として差分の量および電子文書の中で差分の生じた箇所の少なくとも一方が変化したときに、前記変更版であると推定することを特徴とする請求項2に記載の情報処理装置である。
請求項4に記載の発明は、前記特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに差分が同程度である場合であることを特徴とする請求項1に記載の情報処理装置である。
請求項5に記載の発明は、前記特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに予め定められた箇所が変更されない場合であることを特徴とする請求項1に記載の情報処理装置である。
請求項6に記載の発明は、前記プロセッサは、ユーザが記載する箇所である記入箇所とそれ以外の箇所について区別して前記特徴点を見いだすことを特徴とする請求項1に記載の情報処理装置である。
請求項7に記載の発明は、プロセッサを備え、前記プロセッサは、電子文書の類似度から、過去に処理した電子文書をグループ分けし、受け付けられた電子文書が、グループ分けされたグループの何れに対応するかを決定するとともに、電子文書を予め定められた区分に区切り、当該区分毎に比較することで、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別し、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定することを特徴とする情報処理装置である。
請求項8に記載の発明は、前記プロセッサは、電子文書の中の予め定められた記号により前記区分を区切ることを特徴とする請求項7に記載の情報処理装置である。
請求項9に記載の発明は、画像の処理を行う画像処理装置と、前記画像処理装置を利用する際に用いる電子文書について、ユーザが記入しなかった未記入箇所を特定する処理を行う情報処理装置と、を備え、前記情報処理装置は、プロセッサを備え、前記プロセッサは、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分部と、受け付けられた電子文書が、前記振分部によりグループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分の特徴点を見いだし、当該特徴点が予め定められた条件を満たしたときに、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定部と、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定部と、を備える情報処理システムである。
請求項10に記載の発明は、コンピュータに、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、受け付けられた電子文書が、前記振分機能によりグループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分の特徴点を見いだし、当該特徴点が予め定められた条件を満たしたときに、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定機能と、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、を実現させるためのプログラムである。
請求項11に記載の発明は、画像の処理を行う画像処理装置と、前記画像処理装置を利用する際に用いる電子文書について、ユーザが記入しなかった未記入箇所を特定する処理を行う情報処理装置と、を備え、前記情報処理装置は、プロセッサを備え、前記プロセッサは、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分部と、受け付けられた電子文書が、前記振分部によりグループ分けされたグループの何れに対応するかを決定するとともに、電子文書を予め定められた区分に区切り、当該区分毎に比較することで、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定部と、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定部と、を備える情報処理システムである。
請求項12に記載の発明は、コンピュータに、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、受け付けられた電子文書が、前記振分機能によりグループ分けされたグループの何れに対応するかを決定するとともに、電子文書を予め定められた区分に区切り、当該区分毎に比較することで、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定機能と、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、を実現させるためのプログラムである。
請求項1の発明によれば、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができ、変更版の推定、変更版の判別がより容易になる情報処理装置を提供することができる。
請求項2の発明によれば、変更版を、より精度よく推定することができる。
請求項3の発明によれば、予め定められた変化を判断するのに、より適したパラメータを設定することができる。
請求項4の発明によれば、特徴点を判断するのに、より適当なパラメータを設定することができる。
請求項5の発明によれば、特徴点を判断するのに、より適当なパラメータを設定することができる。
請求項6の発明によれば、変更版であるか否かを判別する精度が向上する。
請求項7の発明によれば、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができ、未記入箇所がある電子文書が、次のステップに渡ることを抑制できる情報処理装置を提供することができる。
請求項8の発明によれば、グループの決定の精度が、より向上する。
請求項9の発明によれば、電子文書に対する記入事項の確認作業が軽減できる情報処理システムを提供することができる。
請求項10の発明によれば、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができ、変更版の推定、変更版の判別がより容易になる機能をコンピュータにより実現できる。
請求項11の発明によれば、電子文書に対する記入事項の確認作業が軽減できる情報処理システムを提供することができる。
請求項12の発明によれば、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができ、未記入箇所がある電子文書が、次のステップに渡ることを抑制できる機能をコンピュータにより実現できる。
本実施の形態における情報処理システムの構成例を示す図である。 画像形成装置のハードウェア構成例を示した図である。 情報処理システムの概略動作の例について示した図である。 第1の実施形態の管理サーバの機能構成例について説明したブロック図である。 (a)~(c)は、受け付けられた電子文書の画像と、決定されたグループに属する電子文書の画像とを比較した図である。 (a)~(c)は、ユーザが、書き込みを行う前と後とを比較した図である。 第1の実施形態の変形例における情報処理システムの概略動作について示した図である。 第1の実施形態における管理サーバの動作を説明したフローチャートである。 グループ情報の一例を示した図である。 第2の実施形態における管理サーバの動作を説明したフローチャートである。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
<情報処理システム全体の説明>
図1は、本実施の形態における情報処理システム1の構成例を示す図である。
図示するように本実施の形態の情報処理システム1は、画像形成装置10a、10bと、端末装置20a、20b、20c、20dと、管理サーバ30とが、ネットワーク40を介して接続されることにより構成されている。なお、画像形成装置10a、10bのそれぞれを区別しない場合は、以下、単に、画像形成装置10と言うことがある。また、端末装置20a、20b、20c、20dのそれぞれを区別しない場合は、以下、単に、端末装置20と言うことがある。
なお、図1では、画像形成装置10は、2つ、端末装置20は、4つしか示していないが、それぞれの数はいくつでもよい。
画像形成装置10は、画像の処理を行う画像処理装置の一例である。画像形成装置10は、プリンタ機能を備える。即ち、画像形成装置10は、紙等の記録媒体に画像を形成し、印刷媒体として出力することができる。また、画像形成装置10は、プリンタ機能に加えて、例えば、スキャナ機能、ファクシミリ機能等の他の画像処理機能を備えている。
図2は、画像形成装置10のハードウェア構成例を示した図である。
図示するように、画像形成装置10は、CPU(Central Processing Unit)11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、HDD(Hard Disk Drive)14と、操作パネル15と、画像読み取り部16と、画像形成部17と、通信I/F18とを備える。そしてこれらがバスBを介して必要なデータのやりとりを行なう。
CPU11は、ROM13等に記憶された各種プログラムをRAM12にロードして実行することにより、後述する各機能を実現する。
RAM12は、CPU11の作業用メモリ等として用いられるメモリである。
ROM13は、CPU11が実行する各種プログラム等を記憶するメモリである。
HDD14は、画像読み取り部16が読み取った画像情報や画像形成部17における画像形成にて用いる画像情報等を記憶する例えば磁気ディスク装置である。
操作パネル15は、各種情報の表示やユーザからの操作入力の受付を行なう例えばタッチパネルである。そのため表示機構は、予め定められた領域でコンテンツ(情報内容)を画像として表示する液晶パネル等の表示部を備えるとともに、液晶パネルに人の指、スタイラスペンに代表される接触物が接触したときに、接触物が液晶パネルに接触した位置を検知する機能を備えている。本実施の形態においてタッチパネルは、特に限定されるものではなく、抵抗膜方式や静電容量方式など種々の方式のものを使用することができる。
画像読み取り部16は、原稿に記録された画像を読み取る。ここで、画像読み取り部16は、例えばスキャナであり、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式のものを用いるとよい。
画像形成部17は、記録媒体に画像を形成する印刷機構の一例である。ここで、画像形成部17は、例えばプリンタであり、感光体に付着させたトナーを用紙等の記録媒体に転写して像を形成する電子写真方式や、インクを記録媒体上に吐出して像を形成するインクジェット方式のものを用いるとよい。
通信I/F18は、ネットワークを介して他の装置との間で各種情報の送受信を行なう。
また本実施の形態では、CPU11、RAM12、およびROM13で、自装置である画像形成装置10の各機構部の制御を行なう制御部100を構成する。
端末装置20は、電子文書の処理として、電子文書の作成や認可を行う。
なお、本実施の形態で、「電子文書」とは、文字情報や画像情報を電子化したものである。この電子文書は、画像形成装置10、端末装置20および管理サーバ30のそれぞれで扱うことができるものであれば、形式およびデータ構造等について特に限られるものではない。また、ここでは、端末装置20で表示された電子文書に対し、あるいは電子文書の印刷物に対し、ユーザが、手書きで書き込むことができる。本実施の形態の電子文書としては、例えば、帳票が挙げられる。帳票の具体例としては、見積書、請求書、顛末書、稟議書、申込書などである。
端末装置20は、例えば、汎用のパーソナルコンピュータ(PC)である。そして、端末装置20は、OS(Operating System)による管理下において、各種アプリケーションソフトウェアを動作させることで、電子文書の作成、閲覧等が行われるようになっている。
管理サーバ30は、情報処理装置の一例であり、情報処理システム1の全体の管理をするサーバコンピュータである。管理サーバ30は、例えば、端末装置20のユーザの認証を行い、電子文書を端末装置20に対し送信する。また、端末装置20から電子文書を受信し、受信した電子文書を保存する。そして、詳しくは後述するが、管理サーバ30は、画像形成装置10を利用する際に用いる電子文書について、ユーザが記入しなかった未記入箇所を特定する処理を行う。
端末装置20および管理サーバ30は、演算手段であるCPUと、記憶手段であるメインメモリ、およびHDDやSSD(Solid State Drive)等のストレージを備える。ここで、CPUは、プロセッサの一例であり、OS(基本ソフトウェア)やアプリケーションソフトウェア(応用ソフトウェア)等の各種ソフトウェアを実行する。また、メインメモリは、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域であり、ストレージは、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。
さらに、端末装置20および管理サーバ30は、外部との通信を行うための通信インタフェース(以下、「通信I/F」と表記する)と、ビデオメモリやディスプレイ等からなる表示機構と、キーボード、マウス、タッチパネル、スタイラスペン等の入力デバイスとを備える。この表示機構は、電子文書を閲覧する際に、電子文書を表示する表示手段として機能する。
ネットワーク40は、画像形成装置10、端末装置20および管理サーバ30の間の情報通信に用いられる通信手段であり、例えば、LAN(Local Area Network)やインターネットである。
<情報処理システム1の動作の概略説明>
図3は、情報処理システム1の概略動作の例について示した図である。
まず、端末装置20aを操作するユーザAが、電子文書の作成を行う。このとき、ユーザAは、例えば、文書作成ソフトウェアや表計算ソフトウェア等のアプリケーションソフトウェアを使用して、電子文書の作成を行うことができる。即ち、このユーザAは、電子文書の作成者である。そして、ユーザAは、作成した電子文書を管理サーバ30にアップロードする(1A)。なおこのとき、ユーザAは、電子文書を画像形成装置10aでスキャンし、取り込んだ画像を電子文書としてもよい(1B)。
ユーザAがアップロードした電子文書は、ネットワーク40を介し、管理サーバ30に送られる。そして、管理サーバ30は、この電子文書を保存するとともに、詳しくは後述する方法により、電子文書のグループ分けを行う(1C)。
管理サーバ30に保存された電子文書は、必要に応じ、端末装置20bを操作するユーザBが、ダウンロードする(1D)。
そして、ユーザBは、画像形成装置10bを使用して、ダウンロードした電子文書を印刷し、印刷物とする(1E)。そして、ユーザBは、印刷物に手書きで必要事項を書き込む。
ユーザBは、必要事項を書き込んだ印刷物を、画像形成装置10bを使用してスキャンし、書き込みをした印刷物の画像を取り込む(1F)。そして、ユーザBは、取り込んだ画像を電子文書として、管理サーバ30にアップロードする(1G)。
なお、このとき、ユーザBは、ダウンロードした電子文書を印刷せずに、端末装置20bにて表示し、表示された画面に対し、入力デバイスを使用して、書き込みを行ってもよい。このとき、マウスやスタイラスペンを使用して、手書きで書き込みを行うことができる。
ユーザBがアップロードした電子文書は、ネットワーク40を介し、管理サーバ30に送られる。そして、管理サーバ30は、この電子文書を保存するとともに、詳しくは後述する方法により、過去に保存された電子文書との比較を行う。そして、未記入箇所があるか否かを検出する(1H)。なお、ここで、「未記入箇所」とは、電子文書中で、本来記入すべき箇所であるにもかかわらず、ユーザが記入しなかった箇所を言う。
そして、未記入箇所がある場合は、端末装置20bに対し、通知や警告を行う(1I)。ユーザBは、上述した手順で未記入箇所について記入を行い、修正後の電子文書を、再び管理サーバ30にアップロードする(1J)。そして、修正後の電子文書は、管理サーバ30のストレージに保存される(1K)。
なお、上述した例では、ユーザAが、電子文書を作成したが、電子文書は、情報処理システム1を使用するユーザが作成する必要は必ずしもない。例えば、インターネット上に公開されている電子文書を、利用してもよい。これは、例えば、行政機関で扱う申込書などを、行政機関のホームページからダウンロードして利用する場合が該当する。その場合、上述した1A、1Bの処理は、必要ない。
[第1の実施形態]
次に、管理サーバ30について詳述する。ここではまず、管理サーバ30の第1の実施形態について説明を行う。第1の実施形態では、管理サーバ30が、ユーザが記入した電子文書の中から、未記入箇所を特定する。
<管理サーバ30の機能構成の説明>
図4は、第1の実施形態の管理サーバ30の機能構成例について説明したブロック図である。
なお、ここでは、管理サーバ30が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
管理サーバ30は、外部機器と情報の送受信を行う送受信部31と、電子文書をグループ分けする振分部32と、電子文書を保存する保存部33と、電子文書が属するグループを決定する決定部34と、電子文書の未記入箇所を特定する特定部35とを備える。
送受信部31は、端末装置20との間で電子文書の送受信を行う。即ち、送受信部31は、電子文書を受け付ける受付部の一例である。送受信部31は、例えば、通信I/FやCPUに対応する。
振分部32は、電子文書の類似度から、過去に処理した電子文書をグループ分けし、保存部33に保存する。即ち、振分部32は、過去に処理した電子文書を予め複数のグループにグループ分けする。複数のグループのそれぞれに属する電子文書は、例えば、同じ帳票を基にした電子文書である。つまり、図3で挙げた例では、ユーザAが作成した電子文書と、ユーザBが、この電子文書を基に必要事項を書き込んだ電子文書とは、同じグループにグループ分けされる。対して、異なる帳票の場合、他のグループにグループ分けされる。
振分部32が、グループ分けを行う対象とする電子文書の範囲は、予め定めることもできる。例えば、管理サーバ30が受け付ける電子文書の全てとすることができる。また、予め定められた部署やユーザが扱う電子文書の範囲とすることができる。さらに、予め定められた画像形成装置10でスキャンすることで生成された電子文書とすることができる。この場合、画像形成装置10は、1台を対象としてもよく、複数台を対象としてもよい。また、画像形成装置10でスキャンすることで生成されたスキャンデータの他、画像形成装置10で印刷される印刷用データも対象とする電子文書とすることができる。
保存部33は、振分部32でグループ分けされた電子文書を保存する。また、保存部33は、電子文書に対する作成や提出の履歴を保存してもよい。保存部33は、例えば、メインメモリやストレージに対応する。
また、保存部33は、グループ毎にグループIDを付与することができる。これにより、保存する電子文書をグループ毎に管理する。グループIDは、電子文書ととともに、グループ情報として保存する。また、詳しくは後述するが、他の情報もグループ情報として保存することもできる。
決定部34は、送受信部31により受け付けられた電子文書が、振分部32によりグループ分けされたグループの何れに対応するかを決定する。即ち、決定部34は、送受信部31で電子文書が受け付けられたときに、この電子文書が、振分部32により予めグループ分けされたグループの何れに入るかを決定する。
決定部34が、電子文書の類似度を判断するには、既存の一致判定技術を使用することができる。決定部34は、例えば、電子文書のフォーマットの構造の類似度から判断する。
具体的には、表、図面、文章の位置の類似度を判断する方法がある。そして、表、図面、文章の位置が、ほぼ一致する場合、同じグループに属する電子文書であると判断する。また、表の罫線を基に類似度を判断する方法がある。即ち、電子文書中に記載されている罫線を抽出する。そして、この罫線の交点の数が一致するとともに、電子文書中の交点の座標がほぼ一致する場合、同じグループに属する電子文書であると判断する。
さらに、電子文書の予め定められた箇所をOCR(Optical Character Reader)処理し、この箇所での文字列がほぼ一致する場合、同じグループに属する電子文書であると判断してもよい。この予め定められた箇所は、例えば、電子文書の上部や右上などであり、「見積書」、「請求書」、「顛末書」、「稟議書」、「申込書」など、予め定められた項目が記載される箇所を選択する。
このとき、決定部34は、受け付けられた電子文書と、過去に処理された電子文書との類似度を判断する。そして、類似度が高い場合、受け付けられた電子文書と、過去に処理された電子文書とが、同じグループに属すると判断する。類似度を判断するための過去に処理された電子文書は、それぞれのグループに属する複数の電子文書の中で代表的な1つとすることができる。また、複数の電子文書の中の一部でもよく、全てと比較してもよい。
決定部34は、類似度を判断するのに、例えば、画像の差分を利用する。つまり、受け付けられた電子文書の画像と、過去に処理された電子文書の画像との差分の画像を作成する。この差分の画像は、これらの画像の中で互いに相違する領域が抽出される。そして差分の量が、予め定められた範囲内であるときは、類似度が高く、これらの電子文書は、同じグループに属すると判断する。また、差分の量が予め定められた範囲を外れる場合は、これらの電子文書は、互いに異なるグループに属すると判断する。
この差分の量は、例えば、相違する箇所の画素数や、相違する箇所の画素数の全体の画素数に対する割合である。例えば、決定部34は、差分の量として画素数の割合が、±5%以内であれば、これらの電子文書は、同じグループに属すると判断する。また、この範囲を外れる場合、即ち、差分の量として画素数の割合が、-5%を下回る場合、または5%を超える場合は、これらの電子文書は、互いに異なるグループに属すると判断する。
なお、複数のグループが、この条件を満たした場合は、決定部34は、差分の量が0%により近い方のグループを選択することができる。また、決定部34は、電子文書の中の予め定められた項目が一致するか否かで、グループを選択することができる。この項目は、例えば、電子文書に種類を表す文言であり、具体的には、「見積書」、「請求書」、「顛末書」、「稟議書」、「申込書」などの文言が該当する。
また、決定部34は、電子文書が印刷用データであったときは、電子文書に付与されたファイル名の情報をさらに利用して、何れのグループに対応するかを決定することができる。例えば、電子文書が、印刷用データの場合、元となる電子文書が同じときは、同一または類似のファイル名が付与されることが多い。例えば、ファイル名が、「○×△」、「○×△1」、「○×△修正」、「○×△最終版」などの場合である。この場合、「○×△」の部分が共通である。よって、これを基に、決定部34は、「○×△」を含むファイル名の電子文書が存在するグループを見つけ、受け付けられた電子文書が、このグループに対応すると推定することができる。対して、ユーザがスキャンすることで生成された電子文書は、画像形成装置10が、ファイル名を自動的に付与することが多い。自動的に付与されたファイル名は、元の電子文書のファイル名とは、大きく異なることが多い。例えば、ファイル名を、日付+時刻とするような場合である。よって、電子文書が印刷用データであったときは、電子文書のファイル名の情報を基に、この電子文書が、何れのグループに対応するかを決定することができる。
特定部35は、受け付けられた電子文書と決定部34により決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する。
この比較として、特定部35は、決定部34により決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分により、未記入箇所を特定する。つまり、受け付けられた電子文書の画像と、決定されたグループに属する電子文書のそれぞれの画像との差分を作成する。この差分は、これらの画像の中で互いに異なる領域が抽出される。そして、受け付けられた電子文書について、差分が負になる領域を、未記入箇所とする。ここで、「差分が負になる」とは、過去の電子文書には記載があるが、受け付けられた電子文書には記載がないことを意味する。つまり、受け付けられた電子文書に、未記入箇所があった場合、負の差分を検出することで、この箇所を特定できる。実際には、特定部35は、差分の量が予め定められた範囲内の場合は、差分が存在した箇所を未記入箇所とする。例えば、差分の量Xが、例えば、-5%≦X≦0%のとなった箇所を、特定部35は、未記入箇所とする。なお、逆に、過去の電子文書には記載がないが、受け付けられた電子文書には記載がある場合は、「差分が正になる」と言うことができる。これは、例えば、電子文書が変更になり、記載事項が増加した場合が該当する。
図5(a)~(c)は、受け付けられた電子文書の画像と、決定されたグループに属する電子文書の画像とを比較した図である。
このうち、図5(a)は、受け付けられた電子文書の画像であり、図5(b)は、決定されたグループに属する電子文書の画像である。また、図5(c)は、図5(a)の画像と図5(b)の画像とを基に抽出した未記入領域を示している。
ここで、図5(a)に示すように、受け付けられた電子文書には、未記入箇所M1とユーザが記入した記入箇所K1とが存在する。また、図5(b)では、未記入箇所M1の箇所は、記入箇所K2として記入されている。なお、図5(b)では、図5(a)の記入箇所K1については、同様に記入され、記入箇所K3として図示している。そしてこれらの画像の差分を求めることで、図5(c)に示すように、差分が負になる領域として、図5(a)の未記入箇所M1が抽出される。未記入箇所M1は、例えば、枠で囲われ、赤色で表示したりハイライトで表示することで、ユーザに対し提示することができる。
また、特定部35は、電子文書が印刷用データであったときは、未記入の電子文書とすることができる。対して、特定部35は、電子文書が印刷用データでないときは、記入がある電子文書であるとすることができる。印刷用データは、例えば、文書作成ソフトウェアや表計算ソフトウェア等のアプリケーションソフトウェアで作成された電子文書である。また、電子文書が印刷用データでないときとは、例えば、画像形成装置10でスキャンすることで生成されたスキャンデータやカメラで撮影された写真データの電子文書である。
つまり、電子文書が印刷用データである場合は、ユーザが、必要事項を書き込む前の電子文書である場合が多い。図3で上述した例では、ユーザAが、作成した電子文書に該当し、この電子文書は、ユーザBが、画像形成装置10bを使用して印刷する。対して、画像形成装置10でスキャンすることで生成された電子文書は、ユーザが、必要事項を書き込んだ後の電子文書である場合が多い。図3で上述した例では、ユーザBが、必要事項を書き込んだ印刷物を、画像形成装置10bを使用してスキャンすることで生成された電子文書に該当する。
図6(a)~(c)は、ユーザが、書き込みを行う前と後とを比較した図である。
このうち、図6(a)は、印刷用データの画像であり、ユーザが、書き込みを行う前の状態を示す。また、図6(b)は、スキャンデータの画像であり、ユーザが、書き込みを行った後の状態を示す。また、図6(c)は、図6(a)の画像と図6(b)の画像との差分の画像である。
ここで、図6(a)に示すように、印刷用データの画像は、領域R1の範囲を占める。そして、図6(b)に示すように、記入領域R2にユーザが記入する。そして、これらの画像の差分の画像は、図6(c)に示すようになり、ユーザの記入領域R2が抽出される。
この場合、特定部35は、電子文書が受け付けられたときは、まず印刷用データとの差分を求める。そして、特定部35は、印刷用データと受け付けられた電子文書との差分が存在した箇所をユーザが記入した箇所であるとする。これにより、ユーザが記入する領域である記入領域R2を特定できる。そして、この後、図5で説明したような処理を行うことで、未記入箇所の特定の精度が向上する。
振分部32、決定部34および特定部35は、例えば、CPUに対応する。
<変形例>
次に、第1の実施形態の変形例について説明する。
図7は、第1の実施形態の変形例における情報処理システム1の概略動作について示した図である。
まず、端末装置20aを操作するユーザAが、電子文書の作成を行う。そして、ユーザAは、作成した電子文書の提出を行う(2A)。
電子文書は、管理サーバ30に送られる。そして、管理サーバ30は、予め定められた順に従い、電子文書を他のユーザに送る。この場合、電子文書は、ユーザBに送られる(2B)。ユーザBは、端末装置20bを操作し、ユーザAが作成した電子文書の査閲を行う。即ち、このユーザBは、電子文書の査閲者である。そして、電子文書の内容に問題がなければ、ユーザBは、認可を行う。
ユーザBにより電子文書が認可された場合、電子文書は、管理サーバ30に送られる。さらに、管理サーバ30は、電子文書をユーザCに送る(2C)。ユーザCは、端末装置20cを操作し、さらにユーザBが査閲した電子文書の承認を行う。即ち、このユーザCは、電子文書の承認者である。そして、電子文書の内容に問題がなければ、ユーザCは、認可を行う。
ユーザCにより電子文書が認可された場合、電子文書は、管理サーバ30に送られる。さらに、管理サーバ30は、電子文書をユーザDに送る(2D)。ユーザDは、端末装置20dを操作し、さらにユーザCが承認した電子文書の最終承認を行う。即ち、このユーザDは、電子文書の最終承認者である。そして、電子文書の内容に問題がなければ、ユーザDは、認可を行う。
ユーザDにより電子文書が認可された場合、電子文書は、管理サーバ30に送られ、管理サーバ30のストレージに保管される(2E)。
このように、ここでは、ユーザA~Dにより、電子文書の受け渡しが行われる。そして、このフローは、ユーザA~Dが、電子文書を処理する2A~2Dの4つのステップを含む。
なお、各ユーザが、作成、認可した電子文書は、画像形成装置10によりスキャンしたスキャンデータであってもよく、印刷用データであってもよい。
本実施の形態では、ユーザB、ユーザC、ユーザDのそれぞれから送られる電子文書に対し、管理サーバ30が、未記入箇所の特定を行う。これにより、同じ電子文書の受け渡しが行われるフローのステップ毎に、管理サーバ30によるチェックが行われ、未記入箇所がある電子文書が、次のステップに渡るのを抑制することができる。
また、この場合、振分部32は、同じ電子文書の受け渡しが行われるフローのステップ毎に電子文書をグループ分けすることが必要となる。しかしこの場合、各ステップにおいて、それぞれの電子文書に加えられる書き込みの量は、わずかである場合がある。例えば、ユーザB、ユーザC、ユーザDが、認可する際の印鑑が押印されたか否かの相違しかない場合がある。
この場合、決定部34が、グループを決定するには、決定部34は、電子文書の種類により差分の量を変更する。つまり、決定部34は、このようなフローにより受け渡しが行われる電子文書について、同じグループに属するか否かを判断する差分の量を、小さくする設定を行う。これにより、認可する際の印鑑が押印されたか否かの相違しかない場合でも、グループを決定できる。また、決定部34は、類似度として、予め定められた項目が一致するときに、同じ電子文書であるとすることもできる。例えば、同じ電子文書を基にしているため、「見積書」、「請求書」、「顛末書」、「稟議書」、「申込書」などの文言は、変化しない。そのため、決定部34は、この項目を見ることで、グループを決定できる。ただし、この場合、管理サーバ30を管理する管理者が、項目の設定を予め行う必要がある。
以上説明した変形例は、扱う電子文書の種類が少ない場合に、特に有効である。
また、決定部34は、記入する箇所が変化する電子文書に対し、差分の量を変更するようにしてもよい。記入する箇所が変化する電子文書は、ユーザの状態により記入する箇所が異なる電子文書である。これは、例えば、両親欄の記載を行う電子文書である。この場合、父親と母親の双方を記載するときもあるが、片親の場合、一方しか記載しないときがある。この場合、記入する箇所や記入する量が変化する。このような電子文書に対しても、差分の量をより適した量に設定することで、決定部34は、受け付けられた電子文書が、何れのグループに対応するかを精度よく決定することができる。
<管理サーバ30の動作の説明>
次に、第1の実施形態における管理サーバ30の動作の説明について説明する。
図8は、第1の実施形態における管理サーバ30の動作を説明したフローチャートである。
まず、送受信部31が、端末装置20から、電子文書を受け付ける(ステップ101)。
次に、決定部34が、送受信部31で受け付けられた電子文書が、何れのグループに属するかを決定する(ステップ102)。これは、上述したように、受け付けられた電子文書の画像とグループに属する電子文書の画像との差分や電子文書のファイル名から、類似度を判断することで決定する。
さらに、特定部35が、受け付けられた電子文書の未記入箇所を特定する(ステップ103)。これは、上述したように、受け付けられた電子文書の画像と、決定部34で決定されたグループに属するそれぞれの電子文書の画像との差分として、負の差分が生じた箇所を未記入箇所とする。
そして、特定部35は、未記入箇所が存在したか否かを判断する(ステップ104)。
その結果、未記入箇所が存在しない場合(ステップ104でNo)、振分部32は、受け付けられた電子文書を、決定部34で決定されたグループに振り分け、保存部33に保存する(ステップ105)。また、このとき振分部32は、上述したグループID等をグループ情報として保存する。
図9は、グループ情報の一例を示した図である。
図示するグループ情報は、1つのグループに対するグループ情報であり、実際には、これが、グループの数だけ存在する。
このグループ情報は、グループID、交点の数、OCR結果、交点の座標、保存データ数、保存データ1~n、記入領域座標からなる。
このうち、交点の数は、上述した罫線の交点の数である。また、交点の座標は、罫線の交点の座標である。そして、OCR結果は、上述した電子文書の中の予め定められた箇所のOCRの結果であり、例えば、見積書、請求書などの項目である。そして、保存データ数は、このグループ内に属する電子文書の数である。さらに、保存データ1~nは、電子文書のデータである。ここでは、グループ内にn個の電子文書が属する。なお、保存データ1~nは、グループ情報に含めて保存してもよく、グループ情報とは別に保存してもよい。そして、記入領域座標は、これらの電子文書の中で、記入領域R2(図6参照)の座標であり、ユーザが記入する箇所の座標である。
図8に戻り、ステップ104で、未記入箇所が存在した場合(ステップ104でYes)、端末装置20に対し、警告を発する(ステップ106)。この警告は、未記入箇所をユーザに通知するものである。警告は、例えば、電子文書を表示し、さらに未記入箇所を、赤色で着色したり赤枠で囲うなどして、表示するなどの方法が考えられる。
そして、送受信部31が、修正後の電子文書が受け付けられたか否かを判断する(ステップ107)。
その結果、受け付けられていない場合(ステップ107でNo)、ステップ106に戻る。
対して、受け付けられた場合(ステップ107でYes)、ステップ103に戻る。
管理サーバ30が、このような動作を行うことで、受け付けられた電子文書は、決定部34で決定されたグループに、振分部32が振り分け、保存部33で保存される。よって、1つの電子文書が受け付けられると、何れかのグループに属する電子文書の数が1つ増加する。これにより、処理された電子文書がグループ分けされた上で蓄積されていく。なお、受け付けられた電子文書が、過去の電子文書とは異なる新規の電子文書であった場合は、振分部32は、新たなグループを作成して振り分ける。
[第2の実施形態]
次に、管理サーバ30の第2の実施形態について説明を行う。第2の実施形態では、管理サーバ30が、受け付けられた電子文書hについて、ユーザの未記入箇所の特定を行うだけでなく、電子文書が修正版であるか否かを検出する。
<管理サーバ30の機能構成の説明>
第2の実施形態の管理サーバ30の機能構成例は、図4と同様である。即ち、管理サーバ30は、送受信部31、振分部32、保存部33、決定部34および特定部35を備える。このうち、送受信部31、振分部32、保存部33および特定部35の機能は、第1の実施形態と同様である。一方、決定部34については、第1の実施形態についての機能に加え、第2の実施形態についての機能を備える。よって、以下、決定部34を中心に説明を行う。
決定部34は、第1の実施形態と同様に、受け付けられた電子文書が、振分部32によりグループ分けされたグループの何れに対応するかを決定する。
また第2の実施形態では、これに加え、決定部34は、受け付けられた電子文書が、決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する。ここで、「変更版」とは、元の電子文書に対し、一部が変更された電子文書である。これは、「変更版」は、元の電子文書に対し、マイナーチェンジが行われた電子文書であると言うこともできる。
つまり、電子文書の小さな変更は、日常的に生じることである。例えば、請求書や見積書等について、日付、発注元、担当者名、自社の住所などの変更が行われる場合が生ずる。また、例えば、保育園の入園申請の申込書について、新年度になり制度が変更になった場合や、新設の保育園の項目が加わる場合が該当する。さらに、例えば、金融機関において、法改正に伴い書式が変更になるような場合が該当する。この例としては、国際的なマネーロンダリング防止のため、セキュリティ強化の署名欄が新たに加わる場合などである。また、契約書について、約款の文面が変更になった場合などである。
このように、電子文書の変更があった場合、決定部34で、グループを決定する際に、元の電子文書のグループの類似度よりも、他のグループの類似度が高くなることがある。そして、決定部34は、変更版を、変更前の元の電子文書のグループとは、異なる他のグループに属すると決定する場合がある。よって、受け付けられた電子文書が、変更版であるか否かを判別できれば、グループ分けの精度が、より向上する。
そこで、第2の実施形態では、決定部34は、受け付けられた電子文書が、変更版であるか否かを判別する。
具体的には、決定部34は、第1の実施形態と同様に、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分を求める。そして、この差分により、受け付けられた電子文書が変更版であるか否かを判別する。
以下、この事項のさらに具体的な例について説明する。
決定部34は、差分の傾向が従来とは異なる場合に、受け付けられた電子文書が変更版であると推定する。つまり、決定部34は、グループに属し過去に処理した電子文書で生じた差分と比較して、受け付けられた電子文書で生じた差分が予め定められた変化をしたときに、変更版であると推定する。
「差分が予め定められた変化をしたとき」とは、例えば、以下のような場合である。
(差分の量の変化)
従来の電子文書の差分の量が、例えば、-2%であったのが、受け付けられた電子文書では、-4%になった場合、差分の量が変化している。これは、例えば、記載すべき欄の数が増加した変更版が受け付けられた場合に生じる。欄の数が増加する場合の例としては、承認者が多くなるような場合が該当する。
(差分の量の正負の変化)
従来の電子文書の差分の量が、例えば、-2%であったのが、受け付けられた電子文書では、2%になった場合、差分の正負が、負から正に変化している。これは、例えば、ユーザの選択肢が増加した変更版が受け付けられた場合に生じる。ユーザの選択肢が増加する例としては、保育園の入園申請の申込書について、元の電子文書に対し、変更版では、選択できる保育園の数が増加したような場合が該当する。
(差分が生じた箇所の変化)
従来の電子文書の差分が生じる箇所に比較して、受け付けられた電子文書の差分が生じる箇所が変化した場合である。これは、例えば、印鑑を押下する箇所が、移動した場合が該当する。
また、請求書や見積書などの項目により、電子文書の種別は明確に特定でき、これについての差はないが、変更版では、他の箇所に変化が生じた場合が、これに該当する。
また、一部の領域にだけ大きく正の差分が生じる場合は、従来の電子文書には、なかった事項が、受け付けられた電子文書では、付加されていることを意味する。例えば、契約書の約款以外は同じだが、変更版では、確認すべき約款が新たに追加された場合が、これに該当する。
(色の変化)
従来の電子文書に対して、受け付けられた電子文書は、色を考慮すると差分が生じるが、2値化し白黒とすると差分が生じなくなる場合がある。これは、変更版では、色が変化したことを意味する。例えば、変更版では、印鑑の色が、赤色から青色に変更された場合が該当する。
次に、決定部34は、変更版と推定した電子文書に対し、予め定められた判定を行い、受け付けられた電子文書が、変更版であるか否かを判別する。
「予め定められた判定」は、決定部34が、差分の特徴点を見いだし、この特徴点が予め定められた条件を満たしたときに、変更版であるとする。これは、例えば、以下のような場合である。
(ユーザへの問い合わせ)
ユーザへの問い合わせの結果として、変更版であるとの回答があった場合は、変更版とする。このとき、決定部34は、例えば、従来の電子文書と、受け付けた電子文書とを並べて表示し、差分が生じた箇所をユーザに提示してもよい。これにより、担当者の変更があったような場合でも、ユーザは変更版であるか否かの判定をすることができる。この場合、差分の特徴点は、差分が生じている箇所に対するユーザの回答であり、決定部34は、ユーザの回答が、変更版である旨の回答があったときに、変更版であるとする。
(差分の量)
従来の電子文書の差分の量が、例えば、-2%であったときに、受け付けられた電子文書の差分の量が、従来の電子文書の差分の量である-2%から±1%以内であったとき(すなわち、-1%以下-3%以上であった場合)は、決定部34は、変更版と判定する。この場合、差分の特徴点は、差分の量であり、決定部34は、差分の量が、予め定められた範囲のときに、変更版であるとする。ここでは基準となる差分の量を、従来の電子文書の差分の量としたが、基準を差分がない0%の場合としてもよい。
(受け付けの時期)
予め定められた期間内で、同じような差分の量を有する電子文書が、予め定められた数以上受け付けられた場合は、決定部34は、これらは、変更版と判定する。この場合、差分の特徴点は、同じような差分が生じた時期、差分の量および受け付けられた電子文書の数である。また、この場合、特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに差分が同程度である場合の一例である。そして、決定部34は、予め定められた期間内に、予め定められた範囲内の差分の量を有する電子文書が、予め定められた数以上受け付けられたときに、これらを変更版であるとする。
(複数人からの受け付け)
複数人から、同じような差分の量を有する電子文書が受け付けられた場合は、決定部34は、変更版と判定する。この場合、差分の特徴点は、ユーザの数、および差分の量である。また、この場合、特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに差分が同程度である場合の一例である。そして、決定部34は、複数人から、予め定められた範囲内の差分の量を有する電子文書が受け付けられたときに、これらを変更版であるとする。
(変更の確認)
差分が生じた箇所について、インターネットやデータベースなどで、変更が確認された場合は、決定部34は、変更版と判定する。例えば、本社や支社の移転などによる住所変更などは、インターネットやデータベースなどへの問い合わせで、確認することが可能である。この場合、差分の特徴点は、差分が生じている箇所に対し変更が確認されることであり、決定部34は、差分が生じている箇所に対し変更が確認されたときは、変更版であるとする。
(変更された対象)
差分が生じた箇所が、電子文書のフォームの変更や数字の追加など、予め定められた種別の変更である場合は、決定部34は、変更版と判定する。この場合、差分の特徴点は、差分が生じた箇所が、予め定められた種別であることである。決定部34は、例えば、電子文書の活字部分と手書き部分とを判別し、差分が生じた箇所が、活字部分である場合は、変更版と判定する。即ち、決定部34は、ユーザが記載する箇所である記入箇所とそれ以外の箇所について区別して特徴点を見いだす。この場合は、変更版の登録を予期して、ユーザが事前にフォームや数字の変更や追加が行われうることを示す指示またはモードを作成しておくようにしてもよい。
(予め定められた項目以外の変更)
差分が生じた箇所が、見積書、請求書、顛末書、稟議書、申込書などの項目以外である場合は、決定部34は、変更版と判定する。この場合、差分の特徴点は、差分が生じた箇所が、予め定められた項目以外であることである。特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに予め定められた箇所が変更されない場合の一例である。決定部34は、予め定められた項目を判別し、差分が生じた箇所が、これ以外である場合は、変更版と判定する。
なお、受け付けられた電子文書が対応するグループが、複数あった場合、決定部34は、変更版であると判別されたグループの方を選択する。また、双方とも変更版であったと判別された場合、あるいは双方とも変更版でないと判別された場合は、決定部34は、差分の量が0%により近い方のグループを選択することができる。
また、決定部34は、電子文書を予め定められた区分に区切り、この区分毎に比較して、変更版であるか否かを判別してもよい。つまり、上記差分を求める際に、全体の差分をとる方法を前提とすると、全体の差分をとったときに、大きな差分として表れてしまうことがある。例えば、書かれている文書の行数が変わった場合など、部分的に見ると少しの違いだが、画像がずれることで、大きな差分として表れる。即ち、例え、マイナーチェンジであっても、大きな差分となってしまう場合がある。
これを抑制するには、決定部34は、電子文書の中の予め定められた記号により区分を区切る。この記号は、例えば、単元を表す「I」、「II」、「III」、(1)、(2)、(3)、段落の最初に記載されるスペース、表の罫線などである。つまり、決定部34は、この記号を目印として、区分を区切る。そして、決定部34は、それぞれの区分毎の差分を抽出する。そして、区分の数は同じであるが、一部の区分にしか差分が表れていないようであれば、この電子文書は、変更版であると判別することができる。
<管理サーバ30の動作の説明>
次に、第2の実施形態における管理サーバ30の動作の説明について説明する。
図10は、第2の実施形態における管理サーバ30の動作を説明したフローチャートである。
このうち、ステップ201~ステップ202は、図8のステップ101~ステップ102と同様であるので、説明を省略する。
ステップ203以降は、決定部34が、受け付けられた電子文書で生じた差分が、予め定められた変化をしているか否かを判断する(ステップ203)。予め定められた変化としては、上述した差分の量や電子文書の中で差分の生じた箇所が変化したような場合が該当する。
その結果、差分が、予め定められた変化をしていた場合(ステップ203でYes)、決定部34は、差分の特徴点を見いだし、この特徴点が予め定められた条件を満たすか否かを判断する(ステップ204)。差分の特徴点としては、上述した差分の量や受け付けの時期が該当する。
そして、特徴点が予め定められた条件を満たした場合(ステップ204でYes)、決定部34は、受け付けられた電子文書が、変更版であると判断する(ステップ205)。
対して、差分が、予め定められた変化をしていない場合(ステップ203でNo)、および特徴点が予め定められた条件を満たさない場合(ステップ204でNo)は、決定部34は、受け付けられた電子文書が、変更版ではないと判断する(ステップ206)。
次のステップ207~ステップ211は、図8のステップ103~ステップ107と同様である。ただし、ステップ209では、振分部32は、受け付けられた電子文書をグループに振り分け、保存部33に保存するとともに、受け付けられた電子文書が、変更版であることを示す情報を、グループ情報として保存する。
第1の実施形態では、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができる情報処理装置等を提供することができる。これにより、情報処理システム1を管理する管理者の負担を軽減できる。また、未記入箇所を、ユーザに補充させることができる。さらに、未記入箇所を補充させ、未記入箇所をなくすことで、グループ分けの精度が、より向上する。
また、第2の実施形態では、これに加え、受け付けられた電子文書が、変更版であるか否かを判別することができ、グループ分けの精度が、より向上する。
なお、上述した例では、管理サーバ30が、未記入箇所の特定や変更版の判別を行っていたが、これに限られるものではない。例えば、端末装置20で行うこともできる。さらに、画像形成装置10で行うこともできる。
また、上述した例では、言及しなかったが、管理サーバ30は、未記入箇所を特定し、ユーザに修正をさせるだけでなく、この後に、ユーザが指定した処理など、他の処理を行ってもよい。他の処理の例としては、例えば、スキャンした電子文書を他の機器に転送するなどの処理である。また、未記入箇所について、ユーザに確認を求め、ユーザが未記入事項ではないと判断したときは、この箇所を未記入箇所として扱わないようにすることもできる。
また、振分部32は、グループの中の記入領域R2(図6参照)を抽出し、これが他と異なる電子文書がある場合は、これらの電子文書をそのグループから削除し、新たなグループに振り分けることもできる。これにより、グループ分けの精度が、より向上する。
また、グループ内に電子文書が多く蓄積され、電子文書の中の記入領域R2が、より明確になったときは、特定部35は、図9で示した記入領域座標を用いて、未記入箇所の特定をしてもよい。即ち、記入領域座標により、ユーザが記載する箇所の座標がわかるため、この箇所に記入がない場合は、未記入箇所であると特定する。
そして、記入領域R2についてユーザに確認を求め、記入領域R2についての精度を向上させるようにしてもよい。
<プログラムの説明>
ここで、以上説明を行った本実施の形態の管理サーバ30で行う処理は、例えば、ソフトウェア等のプログラムとして用意される。そして、ソフトウェアとハードウェア資源とが協働することにより実現される。
よって、第1の実施形態で、管理サーバ30が行う処理を実行するプログラムは、コンピュータに、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、電子文書を受け付ける受付機能と、受付機能により受け付けられた電子文書が、振分機能によりグループ分けされたグループの何れに対応するかを決定する決定機能と、受け付けられた電子文書と決定機能により決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、を実現させるためのプログラムとして捉えることもできる。
また、第2の実施形態で、管理サーバ30が行う処理を実行するプログラムは、コンピュータに、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、受け付けられた電子文書が、振分機能によりグループ分けされたグループの何れに対応するかを決定するとともに、グループに属する電子文書が部分的に変更された変更版であることを判別する決定機能と、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、を実現させるためのプログラムとして捉えることもできる。
なお、本実施の形態を実現するプログラムは、通信手段により提供することはもちろん、CD-ROM等の記録媒体に格納して提供することも可能である。
以上、本実施の形態について説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、種々の変更または改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。
1…情報処理システム、10…画像形成装置、20…端末装置、30…管理サーバ、31…送受信部、32…振分部、33…保存部、34…決定部、35…特定部、M1…未記入箇所

Claims (12)

  1. プロセッサを備え、
    前記プロセッサは、
    電子文書の類似度から、過去に処理した電子文書をグループ分けし、
    受け付けられた電子文書が、グループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分の特徴点を見いだし、当該特徴点が予め定められた条件を満たしたときに、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別し、
    受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する
    ことを特徴とする情報処理装置。
  2. 前記プロセッサは、決定されたグループに属し過去に処理した電子文書で生じた差分と比較して、受け付けられた電子文書で生じた差分が予め定められた変化をしたときに、前記変更版であると推定することを特徴とする請求項に記載の情報処理装置。
  3. 前記プロセッサは、予め定められた変化として差分の量および電子文書の中で差分の生じた箇所の少なくとも一方が変化したときに、前記変更版であると推定することを特徴とする請求項に記載の情報処理装置。
  4. 前記特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに差分が同程度である場合であることを特徴とする請求項に記載の情報処理装置。
  5. 前記特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに予め定められた箇所が変更されない場合であることを特徴とする請求項に記載の情報処理装置。
  6. 前記プロセッサは、ユーザが記載する箇所である記入箇所とそれ以外の箇所について区別して前記特徴点を見いだすことを特徴とする請求項に記載の情報処理装置。
  7. プロセッサを備え、
    前記プロセッサは、
    電子文書の類似度から、過去に処理した電子文書をグループ分けし、
    受け付けられた電子文書が、グループ分けされたグループの何れに対応するかを決定するとともに、電子文書を予め定められた区分に区切り、当該区分毎に比較することで、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別し、
    受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する
    ことを特徴とする情報処理装置。
  8. 前記プロセッサは、電子文書の中の予め定められた記号により前記区分を区切ることを特徴とする請求項に記載の情報処理装置。
  9. 画像の処理を行う画像処理装置と、
    前記画像処理装置を利用する際に用いる電子文書について、ユーザが記入しなかった未記入箇所を特定する処理を行う情報処理装置と、
    を備え、
    前記情報処理装置は、プロセッサを備え、
    前記プロセッサは、
    電子文書の類似度から、過去に処理した電子文書をグループ分けする振分部と、
    受け付けられた電子文書が、前記振分部によりグループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分の特徴点を見いだし、当該特徴点が予め定められた条件を満たしたときに、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定部と、
    受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定部と、
    を備える情報処理システム。
  10. コンピュータに、
    電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、
    受け付けられた電子文書が、前記振分機能によりグループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分の特徴点を見いだし、当該特徴点が予め定められた条件を満たしたときに、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定機能と、
    受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、
    を実現させるためのプログラム。
  11. 画像の処理を行う画像処理装置と、
    前記画像処理装置を利用する際に用いる電子文書について、ユーザが記入しなかった未記入箇所を特定する処理を行う情報処理装置と、
    を備え、
    前記情報処理装置は、プロセッサを備え、
    前記プロセッサは、
    電子文書の類似度から、過去に処理した電子文書をグループ分けする振分部と、
    受け付けられた電子文書が、前記振分部によりグループ分けされたグループの何れに対応するかを決定するとともに、電子文書を予め定められた区分に区切り、当該区分毎に比較することで、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定部と、
    受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定部と、
    を備える情報処理システム。
  12. コンピュータに、
    電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、
    受け付けられた電子文書が、前記振分機能によりグループ分けされたグループの何れに対応するかを決定するとともに、電子文書を予め定められた区分に区切り、当該区分毎に比較することで、当該受け付けられた電子文書が決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定機能と、
    受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、
    を実現させるためのプログラム。
JP2020005306A 2020-01-16 2020-01-16 情報処理装置、情報処理システムおよびプログラム Active JP7484176B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020005306A JP7484176B2 (ja) 2020-01-16 2020-01-16 情報処理装置、情報処理システムおよびプログラム
US16/997,187 US11438477B2 (en) 2020-01-16 2020-08-19 Information processing device, information processing system and computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020005306A JP7484176B2 (ja) 2020-01-16 2020-01-16 情報処理装置、情報処理システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP2021114041A JP2021114041A (ja) 2021-08-05
JP7484176B2 true JP7484176B2 (ja) 2024-05-16

Family

ID=77077607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020005306A Active JP7484176B2 (ja) 2020-01-16 2020-01-16 情報処理装置、情報処理システムおよびプログラム

Country Status (1)

Country Link
JP (1) JP7484176B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004086851A (ja) 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd 電子文書有意更新検知装置、方法及びプログラム、並びに、電子文書有意更新検知プログラムを記録した記録媒体
JP2007164452A (ja) 2005-12-13 2007-06-28 Canon Inc 情報処理装置、情報処理方法ならびに記憶媒体、プログラム
JP2014132736A (ja) 2013-01-07 2014-07-17 Canon Inc 情報処理システムおよびその方法
JP2015191382A (ja) 2014-03-28 2015-11-02 日本電気株式会社 画像データ処理装置、方法、及びプログラム
JP2017102915A (ja) 2015-11-20 2017-06-08 キヤノンマーケティングジャパン株式会社 情報処理装置、その処理方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004086851A (ja) 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd 電子文書有意更新検知装置、方法及びプログラム、並びに、電子文書有意更新検知プログラムを記録した記録媒体
JP2007164452A (ja) 2005-12-13 2007-06-28 Canon Inc 情報処理装置、情報処理方法ならびに記憶媒体、プログラム
JP2014132736A (ja) 2013-01-07 2014-07-17 Canon Inc 情報処理システムおよびその方法
JP2015191382A (ja) 2014-03-28 2015-11-02 日本電気株式会社 画像データ処理装置、方法、及びプログラム
JP2017102915A (ja) 2015-11-20 2017-06-08 キヤノンマーケティングジャパン株式会社 情報処理装置、その処理方法及びプログラム

Also Published As

Publication number Publication date
JP2021114041A (ja) 2021-08-05

Similar Documents

Publication Publication Date Title
US8897563B1 (en) Systems and methods for automatically processing electronic documents
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
US20110249905A1 (en) Systems and methods for automatically extracting data from electronic documents including tables
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US8099384B2 (en) Operation procedure extrapolating system, operation procedure extrapolating method, computer-readable medium and computer data signal
US20090313245A1 (en) Mixed Media Reality Brokerage Network With Layout-Independent Recognition
US10528807B2 (en) System and method for processing and identifying content in form documents
CN101542504A (zh) 后光学字符识别处理中的形状聚类
US11657367B2 (en) Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program
CN102637256B (zh) 后光学字符识别处理中的形状聚类
US10922537B2 (en) System and method for processing and identifying content in form documents
US7202965B2 (en) Method of using printed forms to transmit the information necessary to create electronic forms
US11438477B2 (en) Information processing device, information processing system and computer readable medium
JP7484176B2 (ja) 情報処理装置、情報処理システムおよびプログラム
CN112541498A (zh) 信息处理装置以及记录媒体
JP2008257543A (ja) 画像処理システム及びプログラム
JP2021114040A (ja) 情報処理装置、情報処理システムおよびプログラム
CN113870387A (zh) 数据输出系统及其方法,图像处理系统及其方法
JP2009223390A (ja) 画像処理監視システム及びプログラム
US20240161451A1 (en) Information processing system, processing method, and recording medium
US20220012481A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US11659106B2 (en) Information processing apparatus, non-transitory computer readable medium, and character recognition system
US11568659B2 (en) Character recognizing apparatus and non-transitory computer readable medium
JP2006252575A (ja) 財務諸表自動入力装置及び財務諸表自動入力方法
JP2023046684A (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240415

R150 Certificate of patent or registration of utility model

Ref document number: 7484176

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150