JP2021114041A - Information processing apparatus, information processing system, and program - Google Patents

Information processing apparatus, information processing system, and program Download PDF

Info

Publication number
JP2021114041A
JP2021114041A JP2020005306A JP2020005306A JP2021114041A JP 2021114041 A JP2021114041 A JP 2021114041A JP 2020005306 A JP2020005306 A JP 2020005306A JP 2020005306 A JP2020005306 A JP 2020005306A JP 2021114041 A JP2021114041 A JP 2021114041A
Authority
JP
Japan
Prior art keywords
electronic document
information processing
difference
group
modified version
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020005306A
Other languages
Japanese (ja)
Other versions
JP7484176B2 (en
Inventor
浩司郎 猪股
Koshiro Inomata
浩司郎 猪股
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Priority to JP2020005306A priority Critical patent/JP7484176B2/en
Priority to US16/997,187 priority patent/US11438477B2/en
Publication of JP2021114041A publication Critical patent/JP2021114041A/en
Application granted granted Critical
Publication of JP7484176B2 publication Critical patent/JP7484176B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

To provide an information processing apparatus and the like that can specify an unfilled-out part without requiring registration in advance of filled-out parts in an electronic document.SOLUTION: A management server 30 as an information processing apparatus comprises: an allocation unit 32 that classifies electronic documents processed in the past into groups from the similarity among the electronic documents; a determination unit 34 that determines to which of the groups obtained through the classification a received electronic document corresponds, and determines that the electronic document belonging to the determined group is a changed version in which the electronic document is partially changed; and a specification unit 35 that specifies an unfilled-out part in the received electronic document by comparing the received electronic document with the electronic documents belonging to the determined group.SELECTED DRAWING: Figure 4

Description

本発明は、情報処理装置、情報処理システム、プログラムに関する。 The present invention relates to an information processing device, an information processing system, and a program.

従来、紙文書に記入箇所が用意され、記入箇所に記入した文書を、予め定められた担当者等に提出することが行われている。そして、紙文書の提出を受けた者は、記入事項の確認作業を行う必要がある。この確認作業の一例として、未記入箇所の有無を確認する作業がある。このとき従来は、担当者は、目視により未記入箇所の有無を確認する必要があり、確認作業に多大な労力を必要とする。一方、文書として、電子文書を使用した場合、文書の受け渡しに要する労力は軽減されるものの、同様に、目視により未記入箇所の有無を確認しなければならない。 Conventionally, an entry place is prepared in a paper document, and the document entered in the entry place is submitted to a predetermined person in charge or the like. Then, the person who receives the submission of the paper document needs to confirm the entries. As an example of this confirmation work, there is a work of confirming the presence or absence of an unfilled part. At this time, conventionally, the person in charge has to visually confirm the presence or absence of an unfilled part, which requires a great deal of labor for the confirmation work. On the other hand, when an electronic document is used as a document, the labor required for delivering the document is reduced, but similarly, it is necessary to visually confirm the presence or absence of an unfilled part.

特許文献1には、画像処理装置が開示されている。この画像処理装置では、第1の画像受付手段が、記入が行われていない文書の画像を受け付け、記入領域抽出手段が、第1の画像受付手段によって受け付けられた画像から記入領域を抽出する。さらに、第1の特徴量抽出手段が、第1の画像受付手段によって受け付けられた画像の特徴量を抽出する。そして、記憶手段が、記入領域抽出手段によって抽出された記入領域に関する情報と特徴量抽出手段によって抽出された特徴量を記憶する。 Patent Document 1 discloses an image processing apparatus. In this image processing device, the first image receiving means receives an image of a document that has not been filled in, and the entry area extracting means extracts an entry area from the image received by the first image receiving means. Further, the first feature amount extracting means extracts the feature amount of the image received by the first image receiving means. Then, the storage means stores the information about the entry area extracted by the entry area extraction means and the feature amount extracted by the feature amount extraction means.

特許文献2には、帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データベースに接続される情報処理装置が開示されている。この情報処理装置は、処理対象帳票の画像データを取得する画像データ取得部と、画像データから、処理対象帳票に係る特徴データを取得する特徴データ取得部と、特徴データベースに蓄積されている特徴データから、処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、処理対象帳票の帳票種別を推定する推定部と、推定部によって処理対象帳票の帳票種別が推定されなかった場合に、処理対象帳票に係る特徴データを特徴データベースに追加する特徴データ追加部と、を備える。 Patent Document 2 discloses an information processing device connected to a feature database that stores feature data related to the appearance features of a form for each form type. This information processing device has an image data acquisition unit that acquires image data of the form to be processed, a feature data acquisition unit that acquires feature data related to the form to be processed from the image data, and feature data stored in the feature database. From, the estimation unit that estimates the form type of the processing target form by specifying the feature data that matches or is similar to the feature data related to the processing target form, and the case where the estimation unit does not estimate the form type of the processing target form. It also includes a feature data addition unit that adds feature data related to the form to be processed to the feature database.

特開2011−65311号公報Japanese Unexamined Patent Publication No. 2011-65511 特開2012−198684号公報Japanese Unexamined Patent Publication No. 2012-198684

未記入箇所の有無確認の方法として、電子文書の記入箇所を予め登録し、登録された情報を基に未記入箇所を特定する方法があるが、電子文書毎に確認すべき記入箇所を予め登録する作業が必要となる。さらに、電子文書が複数のステップによるフローにより受け渡しが行われる場合、記入箇所は、同一の電子文書であったとしてもステップ毎に異なり、記入箇所をステップ毎に登録する作業は、煩雑である。
本発明は、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができる情報処理装置等を提供することを目的とする。
As a method of confirming the presence or absence of unfilled parts, there is a method of registering the filled-in parts of the electronic document in advance and specifying the unfilled parts based on the registered information. Work is required. Further, when the electronic document is delivered by the flow of a plurality of steps, the entry location is different for each step even if it is the same electronic document, and the work of registering the entry location for each step is complicated.
An object of the present invention is to provide an information processing apparatus or the like capable of identifying an unfilled part without registering an entry part of an electronic document in advance.

請求項1に記載の発明は、プロセッサを備え、前記プロセッサは、電子文書の類似度から、過去に処理した電子文書をグループ分けし、受け付けられた電子文書が、グループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書が部分的に変更された変更版であることを判別し、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定することを特徴とする情報処理装置である。
請求項2に記載の発明は、前記プロセッサは、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分により、受け付けられた電子文書が前記変更版であるとすることを特徴とする請求項1に記載の情報処理装置である。
請求項3に記載の発明は、前記プロセッサは、決定されたグループに属し過去に処理した電子文書で生じた差分と比較して、受け付けられた電子文書で生じた差分が予め定められた変化をしたときに、前記変更版であると推定することを特徴とする請求項2に記載の情報処理装置である。
請求項4に記載の発明は、前記プロセッサは、予め定められた変化として差分の量および電子文書の中で差分の生じた箇所の少なくとも一方が変化したときに、前記変更版であると推定することを特徴とする請求項3に記載の情報処理装置である。
請求項5に記載の発明は、前記プロセッサは、前記差分の特徴点を見いだし、当該特徴点が予め定められた条件を満たしたときに、前記変更版であるとすることを特徴とする請求項2または3に記載の情報処理装置である。
請求項6に記載の発明は、前記特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに差分が同程度である場合であることを特徴とする請求項5に記載の情報処理装置である。
請求項7に記載の発明は、前記特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに予め定められた箇所が変更されない場合であることを特徴とする請求項5に記載の情報処理装置である。
請求項8に記載の発明は、前記プロセッサは、ユーザが記載する箇所である記入箇所とそれ以外の箇所について区別して前記特徴点を見いだすことを特徴とする請求項5に記載の情報処理装置である。
請求項9に記載の発明は、前記プロセッサは、電子文書を予め定められた区分に区切り、当該区分毎に比較することで前記変更版であるか否かを判別することを特徴とする請求項1に記載の情報処理装置である。
請求項10に記載の発明は、前記プロセッサは、電子文書の中の予め定められた記号により前記区分を区切ることを特徴とする請求項9に記載の情報処理装置である。
請求項11に記載の発明は、画像の処理を行う画像処理装置と、前記画像処理装置を利用する際に用いる電子文書について、ユーザが記入しなかった未記入箇所を特定する処理を行う情報処理装置と、を備え、前記情報処理装置は、プロセッサを備え、前記プロセッサは、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分部と、受け付けられた電子文書が、前記振分部によりグループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定部と、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定部と、を備える情報処理システムである。
請求項12に記載の発明は、コンピュータに、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、受け付けられた電子文書が、前記振分機能によりグループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定機能と、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、を実現させるためのプログラムである。
The invention according to claim 1 includes a processor, which groups electronic documents processed in the past based on the similarity of electronic documents, and the received electronic documents are classified into any of the grouped groups. By deciding whether to correspond, determining that the electronic document belonging to the determined group is a partially modified version, and comparing the accepted electronic document with the electronic document belonging to the determined group. , An information processing device characterized in that an unfilled part in an received electronic document is specified.
According to the second aspect of the present invention, in the processor, the received electronic document is a modified version based on the difference between each image of the electronic document belonging to the determined group and the image of the accepted electronic document. The information processing apparatus according to claim 1, wherein the information processing device is characterized by the above.
According to a third aspect of the present invention, the processor belongs to a determined group and makes a predetermined change in the difference generated in the received electronic document as compared with the difference generated in the electronic document processed in the past. The information processing device according to claim 2, wherein the modified version is presumed to be the modified version.
The invention according to claim 4 presumes that the processor is the modified version when the amount of the difference and at least one of the parts where the difference occurs in the electronic document change as a predetermined change. The information processing apparatus according to claim 3, wherein the information processing device is characterized by the above.
The invention according to claim 5 is characterized in that the processor finds a feature point of the difference, and when the feature point satisfies a predetermined condition, the processor is a modified version. The information processing apparatus according to 2 or 3.
The information processing according to claim 5, wherein the feature point is that the plurality of received electronic documents are in the same group and the differences are about the same. It is a device.
The invention according to claim 7, wherein the feature point is a case where a plurality of received electronic documents are in the same group and a predetermined portion is not changed. It is an information processing device.
The invention according to claim 8 is the information processing apparatus according to claim 5, wherein the processor finds the feature point by distinguishing between an entry place which is a place to be described by a user and a place other than the entry place. be.
The invention according to claim 9 is characterized in that the processor divides an electronic document into predetermined categories and compares each of the categories to determine whether or not the electronic document is the modified version. The information processing apparatus according to 1.
The invention according to claim 10, wherein the processor is an information processing apparatus according to claim 9, wherein the division is divided by a predetermined symbol in an electronic document.
The invention according to claim 11 is an information processing device that performs processing for identifying an unfilled portion that has not been filled in by an image processing device that processes an image and an electronic document used when using the image processing device. The information processing apparatus includes a device, and the processor includes a distribution unit for grouping electronic documents processed in the past based on the similarity of electronic documents, and the received electronic document. It was accepted as a determination unit that determines which of the groups grouped by the distribution unit corresponds to, and determines that the electronic document belonging to the determined group is a partially modified modified version. It is an information processing system including a specific unit for identifying an unfilled part in an received electronic document by comparing an electronic document with an electronic document belonging to a determined group.
The invention according to claim 12 has a sorting function for grouping electronic documents processed in the past on a computer based on the similarity of the electronic documents, and the received electronic documents are grouped by the sorting function. A decision function that determines which of the groups corresponds to, and determines whether the electronic document belonging to the determined group is a partially modified version, and the accepted electronic document and the determined group. It is a program for realizing a specific function of identifying an unfilled part in an received electronic document by comparing it with an electronic document to which the document belongs.

請求項1の発明によれば、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができる情報処理装置を提供することができる。
請求項2の発明によれば、変更版の推定が、より容易になる。
請求項3の発明によれば、変更版を、より精度よく推定することができる。
請求項4の発明によれば、予め定められた変化を判断するのに、より適したパラメータを設定することができる。
請求項5の発明によれば、変更版の判別が、より容易になる。
請求項6、7の発明によれば、特徴点を判断するのに、より適当なパラメータを設定することができる。
請求項8の発明によれば、変更版であるか否かを判別する精度が向上する。
請求項9の発明によれば、未記入箇所がある電子文書が、次のステップに渡ることを抑制できる。
請求項10の発明によれば、グループの決定の精度が、より向上する。
請求項11の発明によれば、電子文書に対する記入事項の確認作業が軽減できる情報処理システムを提供することができる。
請求項12の発明によれば、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができる機能をコンピュータにより実現できる。
According to the invention of claim 1, it is possible to provide an information processing apparatus capable of identifying an unfilled part without registering an entry part of an electronic document in advance.
According to the invention of claim 2, it becomes easier to estimate the modified version.
According to the invention of claim 3, the modified version can be estimated more accurately.
According to the invention of claim 4, more suitable parameters can be set for determining a predetermined change.
According to the invention of claim 5, it becomes easier to discriminate the modified version.
According to the inventions of claims 6 and 7, more appropriate parameters can be set for determining the feature points.
According to the invention of claim 8, the accuracy of determining whether or not the version is a modified version is improved.
According to the invention of claim 9, it is possible to prevent an electronic document having an unfilled portion from being passed to the next step.
According to the invention of claim 10, the accuracy of group determination is further improved.
According to the invention of claim 11, it is possible to provide an information processing system that can reduce the work of confirming the entries in the electronic document.
According to the invention of claim 12, it is possible to realize a function of identifying an unfilled part by a computer without registering an entry part of an electronic document in advance.

本実施の形態における情報処理システムの構成例を示す図である。It is a figure which shows the configuration example of the information processing system in this embodiment. 画像形成装置のハードウェア構成例を示した図である。It is a figure which showed the hardware configuration example of the image forming apparatus. 情報処理システムの概略動作の例について示した図である。It is a figure which showed the example of the schematic operation of an information processing system. 第1の実施形態の管理サーバの機能構成例について説明したブロック図である。It is a block diagram explaining the functional structure example of the management server of 1st Embodiment. (a)〜(c)は、受け付けられた電子文書の画像と、決定されたグループに属する電子文書の画像とを比較した図である。(A) to (c) are diagrams comparing the image of the received electronic document with the image of the electronic document belonging to the determined group. (a)〜(c)は、ユーザが、書き込みを行う前と後とを比較した図である。(A) to (c) are diagrams comparing before and after the user writes. 第1の実施形態の変形例における情報処理システムの概略動作について示した図である。It is a figure which showed the schematic operation of the information processing system in the modification of 1st Embodiment. 第1の実施形態における管理サーバの動作を説明したフローチャートである。It is a flowchart explaining the operation of the management server in 1st Embodiment. グループ情報の一例を示した図である。It is a figure which showed an example of group information. 第2の実施形態における管理サーバの動作を説明したフローチャートである。It is a flowchart explaining the operation of the management server in 2nd Embodiment.

以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
<情報処理システム全体の説明>
図1は、本実施の形態における情報処理システム1の構成例を示す図である。
図示するように本実施の形態の情報処理システム1は、画像形成装置10a、10bと、端末装置20a、20b、20c、20dと、管理サーバ30とが、ネットワーク40を介して接続されることにより構成されている。なお、画像形成装置10a、10bのそれぞれを区別しない場合は、以下、単に、画像形成装置10と言うことがある。また、端末装置20a、20b、20c、20dのそれぞれを区別しない場合は、以下、単に、端末装置20と言うことがある。
なお、図1では、画像形成装置10は、2つ、端末装置20は、4つしか示していないが、それぞれの数はいくつでもよい。
Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
<Explanation of the entire information processing system>
FIG. 1 is a diagram showing a configuration example of the information processing system 1 according to the present embodiment.
As shown in the figure, in the information processing system 1 of the present embodiment, the image forming devices 10a and 10b, the terminal devices 20a, 20b, 20c and 20d, and the management server 30 are connected via the network 40. It is configured. When each of the image forming apparatus 10a and 10b is not distinguished, it may be simply referred to as the image forming apparatus 10 below. Further, when each of the terminal devices 20a, 20b, 20c, and 20d is not distinguished, it may be simply referred to as the terminal device 20 below.
In FIG. 1, only two image forming devices 10 and four terminal devices 20 are shown, but the number of each may be any number.

画像形成装置10は、画像の処理を行う画像処理装置の一例である。画像形成装置10は、プリンタ機能を備える。即ち、画像形成装置10は、紙等の記録媒体に画像を形成し、印刷媒体として出力することができる。また、画像形成装置10は、プリンタ機能に加えて、例えば、スキャナ機能、ファクシミリ機能等の他の画像処理機能を備えている。 The image forming apparatus 10 is an example of an image processing apparatus that processes an image. The image forming apparatus 10 has a printer function. That is, the image forming apparatus 10 can form an image on a recording medium such as paper and output it as a printing medium. Further, the image forming apparatus 10 has other image processing functions such as a scanner function and a facsimile function in addition to the printer function.

図2は、画像形成装置10のハードウェア構成例を示した図である。
図示するように、画像形成装置10は、CPU(Central Processing Unit)11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、HDD(Hard Disk Drive)14と、操作パネル15と、画像読み取り部16と、画像形成部17と、通信I/F18とを備える。そしてこれらがバスBを介して必要なデータのやりとりを行なう。
FIG. 2 is a diagram showing a hardware configuration example of the image forming apparatus 10.
As shown in the figure, the image forming apparatus 10 includes a CPU (Central Processing Unit) 11, a RAM (Random Access Memory) 12, a ROM (Read Only Memory) 13, an HDD (Hard Disk Drive) 14, and an operation panel 15. The image reading unit 16, the image forming unit 17, and the communication I / F 18 are provided. Then, these exchange necessary data via the bus B.

CPU11は、ROM13等に記憶された各種プログラムをRAM12にロードして実行することにより、後述する各機能を実現する。 The CPU 11 realizes each function described later by loading and executing various programs stored in the ROM 13 or the like into the RAM 12.

RAM12は、CPU11の作業用メモリ等として用いられるメモリである。
ROM13は、CPU11が実行する各種プログラム等を記憶するメモリである。
HDD14は、画像読み取り部16が読み取った画像情報や画像形成部17における画像形成にて用いる画像情報等を記憶する例えば磁気ディスク装置である。
操作パネル15は、各種情報の表示やユーザからの操作入力の受付を行なう例えばタッチパネルである。そのため表示機構は、予め定められた領域でコンテンツ(情報内容)を画像として表示する液晶パネル等の表示部を備えるとともに、液晶パネルに人の指、スタイラスペンに代表される接触物が接触したときに、接触物が液晶パネルに接触した位置を検知する機能を備えている。本実施の形態においてタッチパネルは、特に限定されるものではなく、抵抗膜方式や静電容量方式など種々の方式のものを使用することができる。
The RAM 12 is a memory used as a working memory of the CPU 11.
The ROM 13 is a memory that stores various programs and the like executed by the CPU 11.
The HDD 14 is, for example, a magnetic disk device that stores image information read by the image reading unit 16 and image information used in image formation in the image forming unit 17.
The operation panel 15 is, for example, a touch panel that displays various information and accepts operation input from the user. Therefore, the display mechanism includes a display unit such as a liquid crystal panel that displays contents (information contents) as an image in a predetermined area, and when a contact object represented by a human finger or a stylus pen comes into contact with the liquid crystal panel. In addition, it has a function to detect the position where the contact object comes into contact with the liquid crystal panel. In the present embodiment, the touch panel is not particularly limited, and various types such as a resistance film type and a capacitance type can be used.

画像読み取り部16は、原稿に記録された画像を読み取る。ここで、画像読み取り部16は、例えばスキャナであり、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式のものを用いるとよい。 The image reading unit 16 reads the image recorded on the original. Here, the image reading unit 16 is, for example, a scanner, and a CCD method in which the reflected light with respect to the light emitted from the light source to the document is reduced by a lens and received by a CCD (Charge Coupled Devices), or the LED light source irradiates the document in order. It is preferable to use a CCD (Contact Image Sensor) that receives the reflected light with respect to the light.

画像形成部17は、記録媒体に画像を形成する印刷機構の一例である。ここで、画像形成部17は、例えばプリンタであり、感光体に付着させたトナーを用紙等の記録媒体に転写して像を形成する電子写真方式や、インクを記録媒体上に吐出して像を形成するインクジェット方式のものを用いるとよい。
通信I/F18は、ネットワークを介して他の装置との間で各種情報の送受信を行なう。
The image forming unit 17 is an example of a printing mechanism that forms an image on a recording medium. Here, the image forming unit 17 is, for example, a printer, and is an electrophotographic method in which toner attached to a photoconductor is transferred to a recording medium such as paper to form an image, or an image is ejected by ejecting ink onto a recording medium. It is preferable to use an inkjet method for forming the above.
The communication I / F 18 transmits and receives various information to and from other devices via a network.

また本実施の形態では、CPU11、RAM12、およびROM13で、自装置である画像形成装置10の各機構部の制御を行なう制御部100を構成する。 Further, in the present embodiment, the CPU 11, the RAM 12, and the ROM 13 constitute a control unit 100 that controls each mechanical unit of the image forming apparatus 10 which is its own device.

端末装置20は、電子文書の処理として、電子文書の作成や認可を行う。
なお、本実施の形態で、「電子文書」とは、文字情報や画像情報を電子化したものである。この電子文書は、画像形成装置10、端末装置20および管理サーバ30のそれぞれで扱うことができるものであれば、形式およびデータ構造等について特に限られるものではない。また、ここでは、端末装置20で表示された電子文書に対し、あるいは電子文書の印刷物に対し、ユーザが、手書きで書き込むことができる。本実施の形態の電子文書としては、例えば、帳票が挙げられる。帳票の具体例としては、見積書、請求書、顛末書、稟議書、申込書などである。
The terminal device 20 creates and authorizes an electronic document as a process of the electronic document.
In the present embodiment, the "electronic document" is an electronic version of character information and image information. The electronic document is not particularly limited in terms of format, data structure, and the like as long as it can be handled by each of the image forming apparatus 10, the terminal apparatus 20, and the management server 30. Further, here, the user can write by hand on the electronic document displayed on the terminal device 20 or on the printed matter of the electronic document. Examples of the electronic document of the present embodiment include a form. Specific examples of forms include quotations, invoices, final statements, approval documents, and application forms.

端末装置20は、例えば、汎用のパーソナルコンピュータ(PC)である。そして、端末装置20は、OS(Operating System)による管理下において、各種アプリケーションソフトウェアを動作させることで、電子文書の作成、閲覧等が行われるようになっている。 The terminal device 20 is, for example, a general-purpose personal computer (PC). The terminal device 20 is managed by an OS (Operating System) to operate various application software to create, view, and the like electronic documents.

管理サーバ30は、情報処理装置の一例であり、情報処理システム1の全体の管理をするサーバコンピュータである。管理サーバ30は、例えば、端末装置20のユーザの認証を行い、電子文書を端末装置20に対し送信する。また、端末装置20から電子文書を受信し、受信した電子文書を保存する。そして、詳しくは後述するが、管理サーバ30は、画像形成装置10を利用する際に用いる電子文書について、ユーザが記入しなかった未記入箇所を特定する処理を行う。 The management server 30 is an example of an information processing device, and is a server computer that manages the entire information processing system 1. The management server 30 authenticates the user of the terminal device 20, for example, and transmits an electronic document to the terminal device 20. In addition, an electronic document is received from the terminal device 20 and the received electronic document is stored. Then, as will be described in detail later, the management server 30 performs a process of identifying an unfilled portion that the user has not filled in the electronic document used when using the image forming apparatus 10.

端末装置20および管理サーバ30は、演算手段であるCPUと、記憶手段であるメインメモリ、およびHDDやSSD(Solid State Drive)等のストレージを備える。ここで、CPUは、プロセッサの一例であり、OS(基本ソフトウェア)やアプリケーションソフトウェア(応用ソフトウェア)等の各種ソフトウェアを実行する。また、メインメモリは、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域であり、ストレージは、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。
さらに、端末装置20および管理サーバ30は、外部との通信を行うための通信インタフェース(以下、「通信I/F」と表記する)と、ビデオメモリやディスプレイ等からなる表示機構と、キーボード、マウス、タッチパネル、スタイラスペン等の入力デバイスとを備える。この表示機構は、電子文書を閲覧する際に、電子文書を表示する表示手段として機能する。
The terminal device 20 and the management server 30 include a CPU as a calculation means, a main memory as a storage means, and storage such as an HDD and an SSD (Solid State Drive). Here, the CPU is an example of a processor, and executes various software such as an OS (basic software) and application software (application software). The main memory is a storage area for storing various software and data used for executing the software, and the storage is a storage area for storing input data for various software and output data from various software.
Further, the terminal device 20 and the management server 30 include a communication interface for communicating with the outside (hereinafter referred to as "communication I / F"), a display mechanism including a video memory, a display, and the like, a keyboard, and a mouse. , Touch panel, stylus pen and other input devices. This display mechanism functions as a display means for displaying an electronic document when the electronic document is viewed.

ネットワーク40は、画像形成装置10、端末装置20および管理サーバ30の間の情報通信に用いられる通信手段であり、例えば、LAN(Local Area Network)やインターネットである。 The network 40 is a communication means used for information communication between the image forming apparatus 10, the terminal apparatus 20, and the management server 30, and is, for example, a LAN (Local Area Network) or the Internet.

<情報処理システム1の動作の概略説明>
図3は、情報処理システム1の概略動作の例について示した図である。
まず、端末装置20aを操作するユーザAが、電子文書の作成を行う。このとき、ユーザAは、例えば、文書作成ソフトウェアや表計算ソフトウェア等のアプリケーションソフトウェアを使用して、電子文書の作成を行うことができる。即ち、このユーザAは、電子文書の作成者である。そして、ユーザAは、作成した電子文書を管理サーバ30にアップロードする(1A)。なおこのとき、ユーザAは、電子文書を画像形成装置10aでスキャンし、取り込んだ画像を電子文書としてもよい(1B)。
<Outline explanation of the operation of the information processing system 1>
FIG. 3 is a diagram showing an example of a schematic operation of the information processing system 1.
First, the user A who operates the terminal device 20a creates an electronic document. At this time, the user A can create an electronic document by using, for example, application software such as document creation software or spreadsheet software. That is, this user A is the creator of the electronic document. Then, the user A uploads the created electronic document to the management server 30 (1A). At this time, the user A may scan the electronic document with the image forming apparatus 10a and use the captured image as the electronic document (1B).

ユーザAがアップロードした電子文書は、ネットワーク40を介し、管理サーバ30に送られる。そして、管理サーバ30は、この電子文書を保存するとともに、詳しくは後述する方法により、電子文書のグループ分けを行う(1C)。 The electronic document uploaded by the user A is sent to the management server 30 via the network 40. Then, the management server 30 stores the electronic documents and groups the electronic documents by a method described in detail later (1C).

管理サーバ30に保存された電子文書は、必要に応じ、端末装置20bを操作するユーザBが、ダウンロードする(1D)。
そして、ユーザBは、画像形成装置10bを使用して、ダウンロードした電子文書を印刷し、印刷物とする(1E)。そして、ユーザBは、印刷物に手書きで必要事項を書き込む。
ユーザBは、必要事項を書き込んだ印刷物を、画像形成装置10bを使用してスキャンし、書き込みをした印刷物の画像を取り込む(1F)。そして、ユーザBは、取り込んだ画像を電子文書として、管理サーバ30にアップロードする(1G)。
なお、このとき、ユーザBは、ダウンロードした電子文書を印刷せずに、端末装置20bにて表示し、表示された画面に対し、入力デバイスを使用して、書き込みを行ってもよい。このとき、マウスやスタイラスペンを使用して、手書きで書き込みを行うことができる。
The electronic document stored in the management server 30 is downloaded by the user B who operates the terminal device 20b, if necessary (1D).
Then, the user B prints the downloaded electronic document using the image forming apparatus 10b and makes it a printed matter (1E). Then, the user B writes the necessary items by hand on the printed matter.
The user B scans the printed matter on which the necessary items are written by using the image forming apparatus 10b, and captures the image of the written printed matter (1F). Then, the user B uploads the captured image as an electronic document to the management server 30 (1G).
At this time, the user B may display the downloaded electronic document on the terminal device 20b without printing it, and write on the displayed screen by using the input device. At this time, writing can be performed by hand using a mouse or a stylus pen.

ユーザBがアップロードした電子文書は、ネットワーク40を介し、管理サーバ30に送られる。そして、管理サーバ30は、この電子文書を保存するとともに、詳しくは後述する方法により、過去に保存された電子文書との比較を行う。そして、未記入箇所があるか否かを検出する(1H)。なお、ここで、「未記入箇所」とは、電子文書中で、本来記入すべき箇所であるにもかかわらず、ユーザが記入しなかった箇所を言う。
そして、未記入箇所がある場合は、端末装置20bに対し、通知や警告を行う(1I)。ユーザBは、上述した手順で未記入箇所について記入を行い、修正後の電子文書を、再び管理サーバ30にアップロードする(1J)。そして、修正後の電子文書は、管理サーバ30のストレージに保存される(1K)。
The electronic document uploaded by the user B is sent to the management server 30 via the network 40. Then, the management server 30 stores the electronic document and compares it with the electronic document stored in the past by a method described in detail later. Then, it is detected whether or not there is an unfilled portion (1H). Here, the “unfilled part” means a part in the electronic document that the user did not fill in even though it should be filled in.
Then, if there is an unfilled part, a notification or a warning is given to the terminal device 20b (1I). The user B fills in the unfilled parts according to the procedure described above, and uploads the corrected electronic document to the management server 30 again (1J). Then, the modified electronic document is stored in the storage of the management server 30 (1K).

なお、上述した例では、ユーザAが、電子文書を作成したが、電子文書は、情報処理システム1を使用するユーザが作成する必要は必ずしもない。例えば、インターネット上に公開されている電子文書を、利用してもよい。これは、例えば、行政機関で扱う申込書などを、行政機関のホームページからダウンロードして利用する場合が該当する。その場合、上述した1A、1Bの処理は、必要ない。 In the above example, the user A creates the electronic document, but the electronic document does not necessarily have to be created by the user who uses the information processing system 1. For example, an electronic document published on the Internet may be used. This corresponds to, for example, the case where an application form handled by an administrative agency is downloaded from the homepage of the administrative agency and used. In that case, the above-mentioned processes 1A and 1B are not necessary.

[第1の実施形態]
次に、管理サーバ30について詳述する。ここではまず、管理サーバ30の第1の実施形態について説明を行う。第1の実施形態では、管理サーバ30が、ユーザが記入した電子文書の中から、未記入箇所を特定する。
[First Embodiment]
Next, the management server 30 will be described in detail. Here, first, the first embodiment of the management server 30 will be described. In the first embodiment, the management server 30 identifies an unfilled portion from the electronic document filled in by the user.

<管理サーバ30の機能構成の説明>
図4は、第1の実施形態の管理サーバ30の機能構成例について説明したブロック図である。
なお、ここでは、管理サーバ30が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
<Explanation of the functional configuration of the management server 30>
FIG. 4 is a block diagram illustrating a functional configuration example of the management server 30 of the first embodiment.
Here, among various functions of the management server 30, those related to the present embodiment are selected and illustrated.

管理サーバ30は、外部機器と情報の送受信を行う送受信部31と、電子文書をグループ分けする振分部32と、電子文書を保存する保存部33と、電子文書が属するグループを決定する決定部34と、電子文書の未記入箇所を特定する特定部35とを備える。 The management server 30 includes a transmission / reception unit 31 that transmits / receives information to / from an external device, a distribution unit 32 that groups electronic documents, a storage unit 33 that stores electronic documents, and a determination unit that determines the group to which the electronic document belongs. 34 and a specific unit 35 for identifying an unfilled part of an electronic document are provided.

送受信部31は、端末装置20との間で電子文書の送受信を行う。即ち、送受信部31は、電子文書を受け付ける受付部の一例である。送受信部31は、例えば、通信I/FやCPUに対応する。 The transmission / reception unit 31 transmits / receives an electronic document to / from the terminal device 20. That is, the transmission / reception unit 31 is an example of a reception unit that accepts electronic documents. The transmission / reception unit 31 corresponds to, for example, a communication I / F or a CPU.

振分部32は、電子文書の類似度から、過去に処理した電子文書をグループ分けし、保存部33に保存する。即ち、振分部32は、過去に処理した電子文書を予め複数のグループにグループ分けする。複数のグループのそれぞれに属する電子文書は、例えば、同じ帳票を基にした電子文書である。つまり、図3で挙げた例では、ユーザAが作成した電子文書と、ユーザBが、この電子文書を基に必要事項を書き込んだ電子文書とは、同じグループにグループ分けされる。対して、異なる帳票の場合、他のグループにグループ分けされる。 The distribution unit 32 groups the electronic documents processed in the past based on the similarity of the electronic documents, and stores the electronic documents in the storage unit 33. That is, the distribution unit 32 divides the electronic documents processed in the past into a plurality of groups in advance. The electronic document belonging to each of the plurality of groups is, for example, an electronic document based on the same form. That is, in the example given in FIG. 3, the electronic document created by the user A and the electronic document in which the user B writes necessary items based on the electronic document are grouped into the same group. On the other hand, different forms are grouped into other groups.

振分部32が、グループ分けを行う対象とする電子文書の範囲は、予め定めることもできる。例えば、管理サーバ30が受け付ける電子文書の全てとすることができる。また、予め定められた部署やユーザが扱う電子文書の範囲とすることができる。さらに、予め定められた画像形成装置10でスキャンすることで生成された電子文書とすることができる。この場合、画像形成装置10は、1台を対象としてもよく、複数台を対象としてもよい。また、画像形成装置10でスキャンすることで生成されたスキャンデータの他、画像形成装置10で印刷される印刷用データも対象とする電子文書とすることができる。 The range of electronic documents to be grouped by the distribution unit 32 can also be predetermined. For example, it can be all electronic documents accepted by the management server 30. In addition, it can be a range of electronic documents handled by a predetermined department or user. Further, it can be an electronic document generated by scanning with a predetermined image forming apparatus 10. In this case, one image forming apparatus 10 may be targeted, or a plurality of image forming devices 10 may be targeted. Further, in addition to the scan data generated by scanning with the image forming apparatus 10, the printing data printed by the image forming apparatus 10 can also be an electronic document to be targeted.

保存部33は、振分部32でグループ分けされた電子文書を保存する。また、保存部33は、電子文書に対する作成や提出の履歴を保存してもよい。保存部33は、例えば、メインメモリやストレージに対応する。
また、保存部33は、グループ毎にグループIDを付与することができる。これにより、保存する電子文書をグループ毎に管理する。グループIDは、電子文書ととともに、グループ情報として保存する。また、詳しくは後述するが、他の情報もグループ情報として保存することもできる。
The storage unit 33 stores the electronic documents grouped by the distribution unit 32. In addition, the storage unit 33 may store the history of creation and submission of the electronic document. The storage unit 33 corresponds to, for example, a main memory or storage.
Further, the storage unit 33 can assign a group ID to each group. As a result, the electronic documents to be saved are managed for each group. The group ID is stored as group information together with the electronic document. Further, as will be described in detail later, other information can also be saved as group information.

決定部34は、送受信部31により受け付けられた電子文書が、振分部32によりグループ分けされたグループの何れに対応するかを決定する。即ち、決定部34は、送受信部31で電子文書が受け付けられたときに、この電子文書が、振分部32により予めグループ分けされたグループの何れに入るかを決定する。 The determination unit 34 determines which of the groups grouped by the distribution unit 32 corresponds to the electronic document received by the transmission / reception unit 31. That is, when the electronic document is received by the transmission / reception unit 31, the determination unit 34 determines which of the groups previously grouped by the distribution unit 32 the electronic document belongs to.

決定部34が、電子文書の類似度を判断するには、既存の一致判定技術を使用することができる。決定部34は、例えば、電子文書のフォーマットの構造の類似度から判断する。
具体的には、表、図面、文章の位置の類似度を判断する方法がある。そして、表、図面、文章の位置が、ほぼ一致する場合、同じグループに属する電子文書であると判断する。また、表の罫線を基に類似度を判断する方法がある。即ち、電子文書中に記載されている罫線を抽出する。そして、この罫線の交点の数が一致するとともに、電子文書中の交点の座標がほぼ一致する場合、同じグループに属する電子文書であると判断する。
The determination unit 34 can use an existing match determination technique to determine the similarity of electronic documents. The determination unit 34 determines, for example, from the similarity of the structure of the format of the electronic document.
Specifically, there is a method of determining the similarity of the positions of tables, drawings, and sentences. Then, when the positions of the table, the drawing, and the text are almost the same, it is determined that the electronic document belongs to the same group. There is also a method of determining the similarity based on the ruled lines of the table. That is, the ruled lines described in the electronic document are extracted. Then, when the number of intersections of the ruled lines is the same and the coordinates of the intersections in the electronic document are substantially the same, it is determined that the electronic document belongs to the same group.

さらに、電子文書の予め定められた箇所をOCR(Optical Character Reader)処理し、この箇所での文字列がほぼ一致する場合、同じグループに属する電子文書であると判断してもよい。この予め定められた箇所は、例えば、電子文書の上部や右上などであり、「見積書」、「請求書」、「顛末書」、「稟議書」、「申込書」など、予め定められた項目が記載される箇所を選択する。 Further, OCR (Optical Character Reader) processing is performed on a predetermined portion of the electronic document, and if the character strings at this portion substantially match, it may be determined that the electronic document belongs to the same group. This predetermined part is, for example, the upper part or the upper right of the electronic document, and is predetermined such as "quotation", "invoice", "final statement", "approval form", "application form", etc. Select the place where the item is described.

このとき、決定部34は、受け付けられた電子文書と、過去に処理された電子文書との類似度を判断する。そして、類似度が高い場合、受け付けられた電子文書と、過去に処理された電子文書とが、同じグループに属すると判断する。類似度を判断するための過去に処理された電子文書は、それぞれのグループに属する複数の電子文書の中で代表的な1つとすることができる。また、複数の電子文書の中の一部でもよく、全てと比較してもよい。 At this time, the determination unit 34 determines the degree of similarity between the received electronic document and the electronic document processed in the past. Then, when the similarity is high, it is determined that the received electronic document and the electronic document processed in the past belong to the same group. The electronic document processed in the past for determining the similarity can be a representative one among a plurality of electronic documents belonging to each group. Further, it may be a part of a plurality of electronic documents and may be compared with all of them.

決定部34は、類似度を判断するのに、例えば、画像の差分を利用する。つまり、受け付けられた電子文書の画像と、過去に処理された電子文書の画像との差分の画像を作成する。この差分の画像は、これらの画像の中で互いに相違する領域が抽出される。そして差分の量が、予め定められた範囲内であるときは、類似度が高く、これらの電子文書は、同じグループに属すると判断する。また、差分の量が予め定められた範囲を外れる場合は、これらの電子文書は、互いに異なるグループに属すると判断する。 The determination unit 34 uses, for example, the difference between images to determine the degree of similarity. That is, an image of the difference between the image of the received electronic document and the image of the electronic document processed in the past is created. In the images of this difference, regions different from each other are extracted from these images. When the amount of difference is within a predetermined range, the similarity is high, and it is determined that these electronic documents belong to the same group. If the amount of difference is out of a predetermined range, it is determined that these electronic documents belong to different groups.

この差分の量は、例えば、相違する箇所の画素数や、相違する箇所の画素数の全体の画素数に対する割合である。例えば、決定部34は、差分の量として画素数の割合が、±5%以内であれば、これらの電子文書は、同じグループに属すると判断する。また、この範囲を外れる場合、即ち、差分の量として画素数の割合が、−5%を下回る場合、または5%を超える場合は、これらの電子文書は、互いに異なるグループに属すると判断する。
なお、複数のグループが、この条件を満たした場合は、決定部34は、差分の量が0%により近い方のグループを選択することができる。また、決定部34は、電子文書の中の予め定められた項目が一致するか否かで、グループを選択することができる。この項目は、例えば、電子文書に種類を表す文言であり、具体的には、「見積書」、「請求書」、「顛末書」、「稟議書」、「申込書」などの文言が該当する。
The amount of this difference is, for example, the number of pixels in different parts or the ratio of the number of pixels in different parts to the total number of pixels. For example, the determination unit 34 determines that these electronic documents belong to the same group if the ratio of the number of pixels as the amount of difference is within ± 5%. Further, if it is out of this range, that is, if the ratio of the number of pixels as the amount of difference is less than -5% or more than 5%, it is determined that these electronic documents belong to different groups.
When a plurality of groups satisfy this condition, the determination unit 34 can select the group whose difference amount is closer to 0%. Further, the determination unit 34 can select a group depending on whether or not the predetermined items in the electronic document match. This item is, for example, a wording indicating the type of an electronic document, and specifically, a wording such as "quotation", "invoice", "final statement", "approval form", "application form" is applicable. do.

また、決定部34は、電子文書が印刷用データであったときは、電子文書に付与されたファイル名の情報をさらに利用して、何れのグループに対応するかを決定することができる。例えば、電子文書が、印刷用データの場合、元となる電子文書が同じときは、同一または類似のファイル名が付与されることが多い。例えば、ファイル名が、「○×△」、「○×△1」、「○×△修正」、「○×△最終版」などの場合である。この場合、「○×△」の部分が共通である。よって、これを基に、決定部34は、「○×△」を含むファイル名の電子文書が存在するグループを見つけ、受け付けられた電子文書が、このグループに対応すると推定することができる。対して、ユーザがスキャンすることで生成された電子文書は、画像形成装置10が、ファイル名を自動的に付与することが多い。自動的に付与されたファイル名は、元の電子文書のファイル名とは、大きく異なることが多い。例えば、ファイル名を、日付+時刻とするような場合である。よって、電子文書が印刷用データであったときは、電子文書のファイル名の情報を基に、この電子文書が、何れのグループに対応するかを決定することができる。 Further, when the electronic document is print data, the determination unit 34 can further use the information of the file name given to the electronic document to determine which group corresponds to the electronic document. For example, when the electronic document is print data and the original electronic document is the same, the same or similar file name is often given. For example, the file name is "○ × △", "○ × △ 1", "○ × △ correction", "○ × △ final version", or the like. In this case, the part of "○ × △" is common. Therefore, based on this, the determination unit 34 can find a group in which an electronic document having a file name including "○ × △" exists, and it can be estimated that the received electronic document corresponds to this group. On the other hand, in many cases, the image forming apparatus 10 automatically assigns a file name to the electronic document generated by scanning by the user. The automatically assigned file name is often very different from the original electronic document file name. For example, the file name may be date + time. Therefore, when the electronic document is print data, it is possible to determine which group the electronic document corresponds to based on the information of the file name of the electronic document.

特定部35は、受け付けられた電子文書と決定部34により決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する。
この比較として、特定部35は、決定部34により決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分により、未記入箇所を特定する。つまり、受け付けられた電子文書の画像と、決定されたグループに属する電子文書のそれぞれの画像との差分を作成する。この差分は、これらの画像の中で互いに異なる領域が抽出される。そして、受け付けられた電子文書について、差分が負になる領域を、未記入箇所とする。ここで、「差分が負になる」とは、過去の電子文書には記載があるが、受け付けられた電子文書には記載がないことを意味する。つまり、受け付けられた電子文書に、未記入箇所があった場合、負の差分を検出することで、この箇所を特定できる。実際には、特定部35は、差分の量が予め定められた範囲内の場合は、差分が存在した箇所を未記入箇所とする。例えば、差分の量Xが、例えば、−5%≦X≦0%のとなった箇所を、特定部35は、未記入箇所とする。なお、逆に、過去の電子文書には記載がないが、受け付けられた電子文書には記載がある場合は、「差分が正になる」と言うことができる。これは、例えば、電子文書が変更になり、記載事項が増加した場合が該当する。
The identification unit 35 identifies an unfilled part in the received electronic document by comparing the received electronic document with the electronic document belonging to the group determined by the determination unit 34.
As this comparison, the identification unit 35 identifies the unfilled portion by the difference between each image of the electronic document belonging to the group determined by the determination unit 34 and the image of the received electronic document. That is, the difference between the image of the received electronic document and each image of the electronic document belonging to the determined group is created. This difference extracts regions that differ from each other in these images. Then, in the received electronic document, the area where the difference is negative is set as an unfilled part. Here, "the difference becomes negative" means that there is a description in the past electronic document, but there is no description in the accepted electronic document. That is, if there is an unfilled part in the received electronic document, this part can be specified by detecting a negative difference. Actually, when the amount of the difference is within a predetermined range, the specific unit 35 sets the place where the difference exists as an unfilled place. For example, a place where the difference amount X is, for example, −5% ≦ X ≦ 0% is set as an unfilled place in the specific unit 35. On the contrary, if there is no description in the past electronic document but there is a description in the accepted electronic document, it can be said that "the difference becomes positive". This applies, for example, when the electronic document has been changed and the items to be described have increased.

図5(a)〜(c)は、受け付けられた電子文書の画像と、決定されたグループに属する電子文書の画像とを比較した図である。
このうち、図5(a)は、受け付けられた電子文書の画像であり、図5(b)は、決定されたグループに属する電子文書の画像である。また、図5(c)は、図5(a)の画像と図5(b)の画像とを基に抽出した未記入領域を示している。
ここで、図5(a)に示すように、受け付けられた電子文書には、未記入箇所M1とユーザが記入した記入箇所K1とが存在する。また、図5(b)では、未記入箇所M1の箇所は、記入箇所K2として記入されている。なお、図5(b)では、図5(a)の記入箇所K1については、同様に記入され、記入箇所K3として図示している。そしてこれらの画像の差分を求めることで、図5(c)に示すように、差分が負になる領域として、図5(a)の未記入箇所M1が抽出される。未記入箇所M1は、例えば、枠で囲われ、赤色で表示したりハイライトで表示することで、ユーザに対し提示することができる。
5 (a) to 5 (c) are diagrams comparing the images of the received electronic documents with the images of the electronic documents belonging to the determined group.
Of these, FIG. 5 (a) is an image of the received electronic document, and FIG. 5 (b) is an image of the electronic document belonging to the determined group. Further, FIG. 5 (c) shows an unfilled area extracted based on the image of FIG. 5 (a) and the image of FIG. 5 (b).
Here, as shown in FIG. 5A, the received electronic document includes an unfilled portion M1 and an filled-in portion K1 filled in by the user. Further, in FIG. 5B, the unfilled portion M1 is entered as the entered portion K2. In addition, in FIG. 5 (b), the entry point K1 of FIG. 5 (a) is similarly filled in and is shown as the entry point K3. Then, by obtaining the difference between these images, as shown in FIG. 5 (c), the unfilled portion M1 in FIG. 5 (a) is extracted as a region where the difference becomes negative. The blank portion M1 can be presented to the user by, for example, being surrounded by a frame and being displayed in red or highlighted.

また、特定部35は、電子文書が印刷用データであったときは、未記入の電子文書とすることができる。対して、特定部35は、電子文書が印刷用データでないときは、記入がある電子文書であるとすることができる。印刷用データは、例えば、文書作成ソフトウェアや表計算ソフトウェア等のアプリケーションソフトウェアで作成された電子文書である。また、電子文書が印刷用データでないときとは、例えば、画像形成装置10でスキャンすることで生成されたスキャンデータやカメラで撮影された写真データの電子文書である。 Further, when the electronic document is print data, the specific unit 35 can make it an unfilled electronic document. On the other hand, when the electronic document is not print data, the specific unit 35 can be regarded as an electronic document with an entry. The print data is, for example, an electronic document created by application software such as document creation software or spreadsheet software. Further, when the electronic document is not print data, it is, for example, an electronic document of scan data generated by scanning with the image forming apparatus 10 or photographic data taken with a camera.

つまり、電子文書が印刷用データである場合は、ユーザが、必要事項を書き込む前の電子文書である場合が多い。図3で上述した例では、ユーザAが、作成した電子文書に該当し、この電子文書は、ユーザBが、画像形成装置10bを使用して印刷する。対して、画像形成装置10でスキャンすることで生成された電子文書は、ユーザが、必要事項を書き込んだ後の電子文書である場合が多い。図3で上述した例では、ユーザBが、必要事項を書き込んだ印刷物を、画像形成装置10bを使用してスキャンすることで生成された電子文書に該当する。 That is, when the electronic document is print data, it is often the electronic document before the user writes the necessary items. In the above-described example in FIG. 3, the user A corresponds to the created electronic document, and the user B prints the electronic document using the image forming apparatus 10b. On the other hand, the electronic document generated by scanning with the image forming apparatus 10 is often an electronic document after the user has written necessary items. In the example described above in FIG. 3, the user B corresponds to an electronic document generated by scanning a printed matter in which necessary items are written by using the image forming apparatus 10b.

図6(a)〜(c)は、ユーザが、書き込みを行う前と後とを比較した図である。
このうち、図6(a)は、印刷用データの画像であり、ユーザが、書き込みを行う前の状態を示す。また、図6(b)は、スキャンデータの画像であり、ユーザが、書き込みを行った後の状態を示す。また、図6(c)は、図6(a)の画像と図6(b)の画像との差分の画像である。
ここで、図6(a)に示すように、印刷用データの画像は、領域R1の範囲を占める。そして、図6(b)に示すように、記入領域R2にユーザが記入する。そして、これらの画像の差分の画像は、図6(c)に示すようになり、ユーザの記入領域R2が抽出される。
6 (a) to 6 (c) are diagrams comparing before and after the user writes.
Of these, FIG. 6A is an image of print data, showing a state before the user writes. Further, FIG. 6B is an image of scan data and shows a state after the user writes the data. Further, FIG. 6 (c) is an image of the difference between the image of FIG. 6 (a) and the image of FIG. 6 (b).
Here, as shown in FIG. 6A, the image of the print data occupies the range of the area R1. Then, as shown in FIG. 6B, the user fills in the entry area R2. Then, the image of the difference between these images is as shown in FIG. 6C, and the user's entry area R2 is extracted.

この場合、特定部35は、電子文書が受け付けられたときは、まず印刷用データとの差分を求める。そして、特定部35は、印刷用データと受け付けられた電子文書との差分が存在した箇所をユーザが記入した箇所であるとする。これにより、ユーザが記入する領域である記入領域R2を特定できる。そして、この後、図5で説明したような処理を行うことで、未記入箇所の特定の精度が向上する。
振分部32、決定部34および特定部35は、例えば、CPUに対応する。
In this case, when the electronic document is accepted, the specific unit 35 first obtains the difference from the print data. Then, it is assumed that the specific unit 35 is a place where the user has entered a place where there is a difference between the print data and the received electronic document. Thereby, the entry area R2, which is the area to be filled by the user, can be specified. Then, after that, by performing the process as described with reference to FIG. 5, the accuracy of identifying the unfilled portion is improved.
The distribution unit 32, the determination unit 34, and the specific unit 35 correspond to, for example, a CPU.

<変形例>
次に、第1の実施形態の変形例について説明する。
図7は、第1の実施形態の変形例における情報処理システム1の概略動作について示した図である。
まず、端末装置20aを操作するユーザAが、電子文書の作成を行う。そして、ユーザAは、作成した電子文書の提出を行う(2A)。
<Modification example>
Next, a modified example of the first embodiment will be described.
FIG. 7 is a diagram showing a schematic operation of the information processing system 1 in the modified example of the first embodiment.
First, the user A who operates the terminal device 20a creates an electronic document. Then, the user A submits the created electronic document (2A).

電子文書は、管理サーバ30に送られる。そして、管理サーバ30は、予め定められた順に従い、電子文書を他のユーザに送る。この場合、電子文書は、ユーザBに送られる(2B)。ユーザBは、端末装置20bを操作し、ユーザAが作成した電子文書の査閲を行う。即ち、このユーザBは、電子文書の査閲者である。そして、電子文書の内容に問題がなければ、ユーザBは、認可を行う。 The electronic document is sent to the management server 30. Then, the management server 30 sends the electronic document to another user in a predetermined order. In this case, the electronic document is sent to user B (2B). The user B operates the terminal device 20b and inspects the electronic document created by the user A. That is, this user B is an electronic document reviewer. Then, if there is no problem with the contents of the electronic document, the user B performs the authorization.

ユーザBにより電子文書が認可された場合、電子文書は、管理サーバ30に送られる。さらに、管理サーバ30は、電子文書をユーザCに送る(2C)。ユーザCは、端末装置20cを操作し、さらにユーザBが査閲した電子文書の承認を行う。即ち、このユーザCは、電子文書の承認者である。そして、電子文書の内容に問題がなければ、ユーザCは、認可を行う。 When the electronic document is approved by the user B, the electronic document is sent to the management server 30. Further, the management server 30 sends an electronic document to the user C (2C). User C operates the terminal device 20c and further approves the electronic document reviewed by User B. That is, this user C is an approver of the electronic document. Then, if there is no problem in the content of the electronic document, the user C performs the authorization.

ユーザCにより電子文書が認可された場合、電子文書は、管理サーバ30に送られる。さらに、管理サーバ30は、電子文書をユーザDに送る(2D)。ユーザDは、端末装置20dを操作し、さらにユーザCが承認した電子文書の最終承認を行う。即ち、このユーザDは、電子文書の最終承認者である。そして、電子文書の内容に問題がなければ、ユーザDは、認可を行う。 When the electronic document is approved by the user C, the electronic document is sent to the management server 30. Further, the management server 30 sends an electronic document to the user D (2D). The user D operates the terminal device 20d, and further performs the final approval of the electronic document approved by the user C. That is, this user D is the final approver of the electronic document. Then, if there is no problem in the content of the electronic document, the user D performs the authorization.

ユーザDにより電子文書が認可された場合、電子文書は、管理サーバ30に送られ、管理サーバ30のストレージに保管される(2E)。
このように、ここでは、ユーザA〜Dにより、電子文書の受け渡しが行われる。そして、このフローは、ユーザA〜Dが、電子文書を処理する2A〜2Dの4つのステップを含む。
なお、各ユーザが、作成、認可した電子文書は、画像形成装置10によりスキャンしたスキャンデータであってもよく、印刷用データであってもよい。
When the electronic document is approved by the user D, the electronic document is sent to the management server 30 and stored in the storage of the management server 30 (2E).
As described above, here, the electronic documents are delivered by the users A to D. Then, this flow includes four steps of 2A to 2D in which the users A to D process the electronic document.
The electronic document created and approved by each user may be scan data scanned by the image forming apparatus 10 or print data.

本実施の形態では、ユーザB、ユーザC、ユーザDのそれぞれから送られる電子文書に対し、管理サーバ30が、未記入箇所の特定を行う。これにより、同じ電子文書の受け渡しが行われるフローのステップ毎に、管理サーバ30によるチェックが行われ、未記入箇所がある電子文書が、次のステップに渡るのを抑制することができる。 In the present embodiment, the management server 30 identifies unfilled parts in the electronic documents sent from each of the user B, the user C, and the user D. As a result, the management server 30 checks each step of the flow in which the same electronic document is delivered, and it is possible to prevent the electronic document having an unfilled portion from passing to the next step.

また、この場合、振分部32は、同じ電子文書の受け渡しが行われるフローのステップ毎に電子文書をグループ分けすることが必要となる。しかしこの場合、各ステップにおいて、それぞれの電子文書に加えられる書き込みの量は、わずかである場合がある。例えば、ユーザB、ユーザC、ユーザDが、認可する際の印鑑が押印されたか否かの相違しかない場合がある。 Further, in this case, the distribution unit 32 needs to group the electronic documents for each step of the flow in which the same electronic document is delivered. However, in this case, the amount of writing added to each electronic document in each step may be small. For example, user B, user C, and user D may only differ in whether or not the seal stamp at the time of authorization is stamped.

この場合、決定部34が、グループを決定するには、決定部34は、電子文書の種類により差分の量を変更する。つまり、決定部34は、このようなフローにより受け渡しが行われる電子文書について、同じグループに属するか否かを判断する差分の量を、小さくする設定を行う。これにより、認可する際の印鑑が押印されたか否かの相違しかない場合でも、グループを決定できる。また、決定部34は、類似度として、予め定められた項目が一致するときに、同じ電子文書であるとすることもできる。例えば、同じ電子文書を基にしているため、「見積書」、「請求書」、「顛末書」、「稟議書」、「申込書」などの文言は、変化しない。そのため、決定部34は、この項目を見ることで、グループを決定できる。ただし、この場合、管理サーバ30を管理する管理者が、項目の設定を予め行う必要がある。
以上説明した変形例は、扱う電子文書の種類が少ない場合に、特に有効である。
In this case, in order for the determination unit 34 to determine the group, the determination unit 34 changes the amount of difference depending on the type of the electronic document. That is, the determination unit 34 sets to reduce the amount of difference for determining whether or not the electronic documents to be delivered by such a flow belong to the same group. As a result, the group can be determined even if there is only a difference in whether or not the seal stamp at the time of approval is stamped. Further, the determination unit 34 may consider the same electronic document as the degree of similarity when predetermined items match. For example, since it is based on the same electronic document, the wording such as "quote", "invoice", "final statement", "approval form", and "application form" does not change. Therefore, the determination unit 34 can determine the group by looking at this item. However, in this case, the administrator who manages the management server 30 needs to set the items in advance.
The modified example described above is particularly effective when the number of types of electronic documents to be handled is small.

また、決定部34は、記入する箇所が変化する電子文書に対し、差分の量を変更するようにしてもよい。記入する箇所が変化する電子文書は、ユーザの状態により記入する箇所が異なる電子文書である。これは、例えば、両親欄の記載を行う電子文書である。この場合、父親と母親の双方を記載するときもあるが、片親の場合、一方しか記載しないときがある。この場合、記入する箇所や記入する量が変化する。このような電子文書に対しても、差分の量をより適した量に設定することで、決定部34は、受け付けられた電子文書が、何れのグループに対応するかを精度よく決定することができる。 Further, the determination unit 34 may change the amount of difference for the electronic document in which the place to be entered changes. An electronic document in which the place to be filled in changes is an electronic document in which the place to be filled differs depending on the state of the user. This is, for example, an electronic document that describes the parents column. In this case, both the father and the mother may be listed, but in the case of one parent, only one may be listed. In this case, the place to be filled in and the amount to be filled in will change. By setting the amount of difference to a more suitable amount even for such an electronic document, the determination unit 34 can accurately determine which group the received electronic document corresponds to. can.

<管理サーバ30の動作の説明>
次に、第1の実施形態における管理サーバ30の動作の説明について説明する。
図8は、第1の実施形態における管理サーバ30の動作を説明したフローチャートである。
まず、送受信部31が、端末装置20から、電子文書を受け付ける(ステップ101)。
次に、決定部34が、送受信部31で受け付けられた電子文書が、何れのグループに属するかを決定する(ステップ102)。これは、上述したように、受け付けられた電子文書の画像とグループに属する電子文書の画像との差分や電子文書のファイル名から、類似度を判断することで決定する。
<Explanation of operation of management server 30>
Next, the description of the operation of the management server 30 in the first embodiment will be described.
FIG. 8 is a flowchart illustrating the operation of the management server 30 in the first embodiment.
First, the transmission / reception unit 31 receives an electronic document from the terminal device 20 (step 101).
Next, the determination unit 34 determines which group the electronic document received by the transmission / reception unit 31 belongs to (step 102). As described above, this is determined by determining the degree of similarity from the difference between the image of the received electronic document and the image of the electronic document belonging to the group and the file name of the electronic document.

さらに、特定部35が、受け付けられた電子文書の未記入箇所を特定する(ステップ103)。これは、上述したように、受け付けられた電子文書の画像と、決定部34で決定されたグループに属するそれぞれの電子文書の画像との差分として、負の差分が生じた箇所を未記入箇所とする。 Further, the specifying unit 35 identifies an unfilled part of the received electronic document (step 103). As described above, as the difference between the image of the received electronic document and the image of each electronic document belonging to the group determined by the determination unit 34, the portion where the negative difference occurs is regarded as the unfilled portion. do.

そして、特定部35は、未記入箇所が存在したか否かを判断する(ステップ104)。
その結果、未記入箇所が存在しない場合(ステップ104でNo)、振分部32は、受け付けられた電子文書を、決定部34で決定されたグループに振り分け、保存部33に保存する(ステップ105)。また、このとき振分部32は、上述したグループID等をグループ情報として保存する。
Then, the specific unit 35 determines whether or not there is an unfilled portion (step 104).
As a result, when there is no unfilled part (No in step 104), the distribution unit 32 distributes the received electronic document to the group determined by the determination unit 34 and stores it in the storage unit 33 (step 105). ). Further, at this time, the distribution unit 32 stores the above-mentioned group ID and the like as group information.

図9は、グループ情報の一例を示した図である。
図示するグループ情報は、1つのグループに対するグループ情報であり、実際には、これが、グループの数だけ存在する。
このグループ情報は、グループID、交点の数、OCR結果、交点の座標、保存データ数、保存データ1〜n、記入領域座標からなる。
このうち、交点の数は、上述した罫線の交点の数である。また、交点の座標は、罫線の交点の座標である。そして、OCR結果は、上述した電子文書の中の予め定められた箇所のOCRの結果であり、例えば、見積書、請求書などの項目である。そして、保存データ数は、このグループ内に属する電子文書の数である。さらに、保存データ1〜nは、電子文書のデータである。ここでは、グループ内にn個の電子文書が属する。なお、保存データ1〜nは、グループ情報に含めて保存してもよく、グループ情報とは別に保存してもよい。そして、記入領域座標は、これらの電子文書の中で、記入領域R2(図6参照)の座標であり、ユーザが記入する箇所の座標である。
FIG. 9 is a diagram showing an example of group information.
The group information shown is group information for one group, and in reality, there are as many group information as there are groups.
This group information includes a group ID, a number of intersections, an OCR result, coordinates of intersections, a number of saved data, saved data 1 to n, and coordinates of an entry area.
Of these, the number of intersections is the number of intersections of the ruled lines described above. The coordinates of the intersections are the coordinates of the intersections of the ruled lines. The OCR result is the result of the OCR of a predetermined portion in the above-mentioned electronic document, and is, for example, an item such as a quotation or an invoice. The number of stored data is the number of electronic documents belonging to this group. Further, the stored data 1 to n are electronic document data. Here, n electronic documents belong to the group. The saved data 1 to n may be included in the group information and saved, or may be saved separately from the group information. The entry area coordinates are the coordinates of the entry area R2 (see FIG. 6) in these electronic documents, and are the coordinates of the points to be entered by the user.

図8に戻り、ステップ104で、未記入箇所が存在した場合(ステップ104でYes)、端末装置20に対し、警告を発する(ステップ106)。この警告は、未記入箇所をユーザに通知するものである。警告は、例えば、電子文書を表示し、さらに未記入箇所を、赤色で着色したり赤枠で囲うなどして、表示するなどの方法が考えられる。
そして、送受信部31が、修正後の電子文書が受け付けられたか否かを判断する(ステップ107)。
その結果、受け付けられていない場合(ステップ107でNo)、ステップ106に戻る。
対して、受け付けられた場合(ステップ107でYes)、ステップ103に戻る。
Returning to FIG. 8, if there is an unfilled portion in step 104 (Yes in step 104), a warning is issued to the terminal device 20 (step 106). This warning notifies the user of the blank part. As a warning, for example, an electronic document may be displayed, and an unfilled portion may be displayed by coloring it in red or enclosing it in a red frame.
Then, the transmission / reception unit 31 determines whether or not the modified electronic document has been accepted (step 107).
As a result, if it is not accepted (No in step 107), the process returns to step 106.
On the other hand, if it is accepted (Yes in step 107), the process returns to step 103.

管理サーバ30が、このような動作を行うことで、受け付けられた電子文書は、決定部34で決定されたグループに、振分部32が振り分け、保存部33で保存される。よって、1つの電子文書が受け付けられると、何れかのグループに属する電子文書の数が1つ増加する。これにより、処理された電子文書がグループ分けされた上で蓄積されていく。なお、受け付けられた電子文書が、過去の電子文書とは異なる新規の電子文書であった場合は、振分部32は、新たなグループを作成して振り分ける。 When the management server 30 performs such an operation, the received electronic document is distributed to the group determined by the determination unit 34 by the distribution unit 32 and stored in the storage unit 33. Therefore, when one electronic document is accepted, the number of electronic documents belonging to any group increases by one. As a result, the processed electronic documents are grouped and accumulated. If the received electronic document is a new electronic document different from the past electronic document, the distribution unit 32 creates a new group and distributes the document.

[第2の実施形態]
次に、管理サーバ30の第2の実施形態について説明を行う。第2の実施形態では、管理サーバ30が、受け付けられた電子文書hについて、ユーザの未記入箇所の特定を行うだけでなく、電子文書が修正版であるか否かを検出する。
[Second Embodiment]
Next, a second embodiment of the management server 30 will be described. In the second embodiment, the management server 30 not only identifies the unfilled part of the user for the received electronic document h, but also detects whether or not the electronic document is a modified version.

<管理サーバ30の機能構成の説明>
第2の実施形態の管理サーバ30の機能構成例は、図4と同様である。即ち、管理サーバ30は、送受信部31、振分部32、保存部33、決定部34および特定部35を備える。このうち、送受信部31、振分部32、保存部33および特定部35の機能は、第1の実施形態と同様である。一方、決定部34については、第1の実施形態についての機能に加え、第2の実施形態についての機能を備える。よって、以下、決定部34を中心に説明を行う。
<Explanation of the functional configuration of the management server 30>
The functional configuration example of the management server 30 of the second embodiment is the same as that in FIG. That is, the management server 30 includes a transmission / reception unit 31, a distribution unit 32, a storage unit 33, a determination unit 34, and a specific unit 35. Of these, the functions of the transmission / reception unit 31, the distribution unit 32, the storage unit 33, and the specific unit 35 are the same as those in the first embodiment. On the other hand, the determination unit 34 has a function for the second embodiment in addition to the function for the first embodiment. Therefore, the following description will be centered on the determination unit 34.

決定部34は、第1の実施形態と同様に、受け付けられた電子文書が、振分部32によりグループ分けされたグループの何れに対応するかを決定する。
また第2の実施形態では、これに加え、決定部34は、受け付けられた電子文書が、決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する。ここで、「変更版」とは、元の電子文書に対し、一部が変更された電子文書である。これは、「変更版」は、元の電子文書に対し、マイナーチェンジが行われた電子文書であると言うこともできる。
Similar to the first embodiment, the determination unit 34 determines which of the groups grouped by the distribution unit 32 corresponds to the received electronic document.
Further, in the second embodiment, in addition to this, the determination unit 34 determines that the received electronic document is a modified version in which the electronic document belonging to the determined group is partially modified. Here, the "modified version" is an electronic document in which a part is modified from the original electronic document. It can also be said that the "modified version" is an electronic document in which minor changes have been made to the original electronic document.

つまり、電子文書の小さな変更は、日常的に生じることである。例えば、請求書や見積書等について、日付、発注元、担当者名、自社の住所などの変更が行われる場合が生ずる。また、例えば、保育園の入園申請の申込書について、新年度になり制度が変更になった場合や、新設の保育園の項目が加わる場合が該当する。さらに、例えば、金融機関において、法改正に伴い書式が変更になるような場合が該当する。この例としては、国際的なマネーロンダリング防止のため、セキュリティ強化の署名欄が新たに加わる場合などである。また、契約書について、約款の文面が変更になった場合などである。 That is, small changes to electronic documents occur on a daily basis. For example, the date, the ordering party, the name of the person in charge, the address of the company, etc. may be changed for the invoice, the quotation, and the like. In addition, for example, when the application form for admission to a nursery school is changed in the new year, or when the item for a newly established nursery school is added. Furthermore, for example, in a financial institution, the format may change due to the revision of the law. An example of this is when a new signature line for enhanced security is added to prevent international money laundering. In addition, when the text of the contract is changed.

このように、電子文書の変更があった場合、決定部34で、グループを決定する際に、元の電子文書のグループの類似度よりも、他のグループの類似度が高くなることがある。そして、決定部34は、変更版を、変更前の元の電子文書のグループとは、異なる他のグループに属すると決定する場合がある。よって、受け付けられた電子文書が、変更版であるか否かを判別できれば、グループ分けの精度が、より向上する。
そこで、第2の実施形態では、決定部34は、受け付けられた電子文書が、変更版であるか否かを判別する。
具体的には、決定部34は、第1の実施形態と同様に、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分を求める。そして、この差分により、受け付けられた電子文書が変更版であるか否かを判別する。
In this way, when the electronic document is changed, when the determination unit 34 determines the group, the similarity of the other group may be higher than the similarity of the group of the original electronic document. Then, the determination unit 34 may determine that the modified version belongs to another group different from the original electronic document group before the modification. Therefore, if it is possible to determine whether or not the received electronic document is a modified version, the accuracy of grouping will be further improved.
Therefore, in the second embodiment, the determination unit 34 determines whether or not the received electronic document is a modified version.
Specifically, the determination unit 34 obtains the difference between each image of the electronic document belonging to the determined group and the image of the accepted electronic document, as in the first embodiment. Then, based on this difference, it is determined whether or not the received electronic document is a modified version.

以下、この事項のさらに具体的な例について説明する。
決定部34は、差分の傾向が従来とは異なる場合に、受け付けられた電子文書が変更版であると推定する。つまり、決定部34は、グループに属し過去に処理した電子文書で生じた差分と比較して、受け付けられた電子文書で生じた差分が予め定められた変化をしたときに、変更版であると推定する。
「差分が予め定められた変化をしたとき」とは、例えば、以下のような場合である。
Hereinafter, a more specific example of this matter will be described.
The determination unit 34 estimates that the received electronic document is a modified version when the tendency of the difference is different from the conventional one. That is, the determination unit 34 is a modified version when the difference generated in the received electronic document has a predetermined change as compared with the difference generated in the electronic document that belongs to the group and has been processed in the past. presume.
"When the difference changes in a predetermined manner" is, for example, the following case.

(差分の量の変化)
従来の電子文書の差分の量が、例えば、−2%であったのが、受け付けられた電子文書では、−4%になった場合、差分の量が変化している。これは、例えば、記載すべき欄の数が増加した変更版が受け付けられた場合に生じる。欄の数が増加する場合の例としては、承認者が多くなるような場合が該当する。
(Change in the amount of difference)
The amount of difference in the conventional electronic document is, for example, -2%, but in the received electronic document, when it becomes -4%, the amount of difference has changed. This happens, for example, when a modified version with an increased number of columns to fill is accepted. As an example of the case where the number of columns increases, the case where the number of approvers increases corresponds to.

(差分の量の正負の変化)
従来の電子文書の差分の量が、例えば、−2%であったのが、受け付けられた電子文書では、2%になった場合、差分の正負が、負から正に変化している。これは、例えば、ユーザの選択肢が増加した変更版が受け付けられた場合に生じる。ユーザの選択肢が増加する例としては、保育園の入園申請の申込書について、元の電子文書に対し、変更版では、選択できる保育園の数が増加したような場合が該当する。
(Positive / negative change in the amount of difference)
When the amount of difference in the conventional electronic document is, for example, -2%, but in the accepted electronic document, the difference becomes 2%, the positive / negative of the difference changes from negative to positive. This happens, for example, when a modified version with more choices for the user is accepted. An example of an increase in user choices is when the number of nursery schools that can be selected has increased in the modified version of the original electronic document for the application form for the nursery school admission application.

(差分が生じた箇所の変化)
従来の電子文書の差分が生じる箇所に比較して、受け付けられた電子文書の差分が生じる箇所が変化した場合である。これは、例えば、印鑑を押下する箇所が、移動した場合が該当する。
また、請求書や見積書などの項目により、電子文書の種別は明確に特定でき、これについての差はないが、変更版では、他の箇所に変化が生じた場合が、これに該当する。
また、一部の領域にだけ大きく正の差分が生じる場合は、従来の電子文書には、なかった事項が、受け付けられた電子文書では、付加されていることを意味する。例えば、契約書の約款以外は同じだが、変更版では、確認すべき約款が新たに追加された場合が、これに該当する。
(Change in the location where the difference occurred)
This is a case where the place where the difference of the accepted electronic document occurs is changed as compared with the place where the difference of the conventional electronic document occurs. This corresponds to, for example, the case where the place where the seal is pressed has moved.
In addition, the type of electronic document can be clearly specified by items such as invoices and quotations, and there is no difference in this, but in the modified version, this corresponds to cases where changes occur in other parts.
In addition, when a large positive difference occurs only in a part of the region, it means that a matter that was not found in the conventional electronic document is added in the accepted electronic document. For example, it is the same except for the terms and conditions of the contract, but in the modified version, this applies when new terms and conditions to be confirmed are added.

(色の変化)
従来の電子文書に対して、受け付けられた電子文書は、色を考慮すると差分が生じるが、2値化し白黒とすると差分が生じなくなる場合がある。これは、変更版では、色が変化したことを意味する。例えば、変更版では、印鑑の色が、赤色から青色に変更された場合が該当する。
(Color change)
Compared to the conventional electronic document, the accepted electronic document has a difference in consideration of color, but if it is binarized to black and white, the difference may not occur. This means that in the modified version, the color has changed. For example, in the modified version, the case where the color of the seal is changed from red to blue is applicable.

次に、決定部34は、変更版と推定した電子文書に対し、予め定められた判定を行い、受け付けられた電子文書が、変更版であるか否かを判別する。
「予め定められた判定」は、決定部34が、差分の特徴点を見いだし、この特徴点が予め定められた条件を満たしたときに、変更版であるとする。これは、例えば、以下のような場合である。
(ユーザへの問い合わせ)
ユーザへの問い合わせの結果として、変更版であるとの回答があった場合は、変更版とする。このとき、決定部34は、例えば、従来の電子文書と、受け付けた電子文書とを並べて表示し、差分が生じた箇所をユーザに提示してもよい。これにより、担当者の変更があったような場合でも、ユーザは変更版であるか否かの判定をすることができる。この場合、差分の特徴点は、差分が生じている箇所に対するユーザの回答であり、決定部34は、ユーザの回答が、変更版である旨の回答があったときに、変更版であるとする。
Next, the determination unit 34 makes a predetermined determination on the electronic document presumed to be the modified version, and determines whether or not the received electronic document is the modified version.
The "predetermined determination" is a modified version when the determination unit 34 finds a feature point of the difference and the feature point satisfies the predetermined condition. This is the case, for example, as follows.
(Inquiry to user)
If, as a result of inquiring to the user, there is a reply that it is a modified version, it will be considered as a modified version. At this time, the determination unit 34 may display, for example, the conventional electronic document and the received electronic document side by side, and present the location where the difference occurs to the user. As a result, even if the person in charge is changed, the user can determine whether or not the version is changed. In this case, the feature point of the difference is the user's answer to the place where the difference occurs, and the determination unit 34 determines that the difference is the modified version when the user's answer is the modified version. do.

(差分の量)
従来の電子文書の差分の量が、例えば、−2%であったときに、受け付けられた電子文書の差分の量が、従来の電子文書の差分の量である−2%から±1%以内であったとき(すなわち、−1%以下−3%以上であった場合)は、決定部34は、変更版と判定する。この場合、差分の特徴点は、差分の量であり、決定部34は、差分の量が、予め定められた範囲のときに、変更版であるとする。ここでは基準となる差分の量を、従来の電子文書の差分の量としたが、基準を差分がない0%の場合としてもよい。
(Amount of difference)
When the amount of difference of the conventional electronic document is, for example, -2%, the amount of difference of the accepted electronic document is within ± 1% from the amount of difference of the conventional electronic document of -2%. When (that is, when it is -1% or less and -3% or more), the determination unit 34 determines that it is a modified version. In this case, the feature point of the difference is the amount of the difference, and the determination unit 34 assumes that the difference is a modified version when the amount of the difference is within a predetermined range. Here, the reference amount of the difference is the amount of the difference of the conventional electronic document, but the reference may be 0% with no difference.

(受け付けの時期)
予め定められた期間内で、同じような差分の量を有する電子文書が、予め定められた数以上受け付けられた場合は、決定部34は、これらは、変更版と判定する。この場合、差分の特徴点は、同じような差分が生じた時期、差分の量および受け付けられた電子文書の数である。また、この場合、特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに差分が同程度である場合の一例である。そして、決定部34は、予め定められた期間内に、予め定められた範囲内の差分の量を有する電子文書が、予め定められた数以上受け付けられたときに、これらを変更版であるとする。
(Time of reception)
If electronic documents having a similar amount of difference are received in a predetermined number or more within a predetermined period, the determination unit 34 determines that these are modified versions. In this case, the feature points of the difference are the time when the similar difference occurred, the amount of the difference, and the number of electronic documents accepted. Further, in this case, the feature point is an example in which a plurality of received electronic documents are in the same group and have the same difference. Then, the determination unit 34 determines that the electronic documents having the amount of difference within the predetermined range are received in a predetermined number or more within the predetermined period, and that the electronic documents are modified versions. do.

(複数人からの受け付け)
複数人から、同じような差分の量を有する電子文書が受け付けられた場合は、決定部34は、変更版と判定する。この場合、差分の特徴点は、ユーザの数、および差分の量である。また、この場合、特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに差分が同程度である場合の一例である。そして、決定部34は、複数人から、予め定められた範囲内の差分の量を有する電子文書が受け付けられたときに、これらを変更版であるとする。
(Reception from multiple people)
When an electronic document having a similar amount of difference is received from a plurality of people, the determination unit 34 determines that it is a modified version. In this case, the feature points of the difference are the number of users and the amount of the difference. Further, in this case, the feature point is an example in which a plurality of received electronic documents are in the same group and have the same difference. Then, when an electronic document having a difference amount within a predetermined range is received from a plurality of persons, the determination unit 34 considers these to be modified versions.

(変更の確認)
差分が生じた箇所について、インターネットやデータベースなどで、変更が確認された場合は、決定部34は、変更版と判定する。例えば、本社や支社の移転などによる住所変更などは、インターネットやデータベースなどへの問い合わせで、確認することが可能である。この場合、差分の特徴点は、差分が生じている箇所に対し変更が確認されることであり、決定部34は、差分が生じている箇所に対し変更が確認されたときは、変更版であるとする。
(Confirmation of change)
When a change is confirmed on the Internet, a database, or the like with respect to the location where the difference has occurred, the determination unit 34 determines that it is a changed version. For example, an address change due to the relocation of the head office or branch office can be confirmed by inquiring about the Internet or a database. In this case, the characteristic point of the difference is that the change is confirmed for the part where the difference occurs, and the determination unit 34 uses the changed version when the change is confirmed for the part where the difference occurs. Suppose there is.

(変更された対象)
差分が生じた箇所が、電子文書のフォームの変更や数字の追加など、予め定められた種別の変更である場合は、決定部34は、変更版と判定する。この場合、差分の特徴点は、差分が生じた箇所が、予め定められた種別であることである。決定部34は、例えば、電子文書の活字部分と手書き部分とを判別し、差分が生じた箇所が、活字部分である場合は、変更版と判定する。即ち、決定部34は、ユーザが記載する箇所である記入箇所とそれ以外の箇所について区別して特徴点を見いだす。この場合は、変更版の登録を予期して、ユーザが事前にフォームや数字の変更や追加が行われうることを示す指示またはモードを作成しておくようにしてもよい。
(Changed target)
If the place where the difference occurs is a change of a predetermined type such as a change in the form of the electronic document or an addition of a number, the determination unit 34 determines that it is a changed version. In this case, the characteristic point of the difference is that the place where the difference occurs is a predetermined type. For example, the determination unit 34 discriminates between the printed portion and the handwritten portion of the electronic document, and if the portion where the difference occurs is the printed portion, it determines that it is a modified version. That is, the determination unit 34 distinguishes between the entry part, which is the part to be described by the user, and the other part, and finds the feature point. In this case, in anticipation of the registration of the modified version, the user may create an instruction or mode indicating that the form or number can be changed or added in advance.

(予め定められた項目以外の変更)
差分が生じた箇所が、見積書、請求書、顛末書、稟議書、申込書などの項目以外である場合は、決定部34は、変更版と判定する。この場合、差分の特徴点は、差分が生じた箇所が、予め定められた項目以外であることである。特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに予め定められた箇所が変更されない場合の一例である。決定部34は、予め定められた項目を判別し、差分が生じた箇所が、これ以外である場合は、変更版と判定する。
(Changes other than predetermined items)
If the place where the difference occurs is other than the items such as the quotation, the invoice, the final statement, the approval form, and the application form, the determination unit 34 determines that it is a modified version. In this case, the characteristic point of the difference is that the place where the difference occurs is other than a predetermined item. The feature point is an example in which a plurality of received electronic documents are in the same group and predetermined parts are not changed. The determination unit 34 determines a predetermined item, and if the place where the difference occurs is other than this, it determines that it is a modified version.

なお、受け付けられた電子文書が対応するグループが、複数あった場合、決定部34は、変更版であると判別されたグループの方を選択する。また、双方とも変更版であったと判別された場合、あるいは双方とも変更版でないと判別された場合は、決定部34は、差分の量が0%により近い方のグループを選択することができる。 If there are a plurality of groups corresponding to the received electronic documents, the determination unit 34 selects the group determined to be the modified version. Further, when it is determined that both are modified versions, or when both are determined not to be modified versions, the determination unit 34 can select the group whose difference amount is closer to 0%.

また、決定部34は、電子文書を予め定められた区分に区切り、この区分毎に比較して、変更版であるか否かを判別してもよい。つまり、上記差分を求める際に、全体の差分をとる方法を前提とすると、全体の差分をとったときに、大きな差分として表れてしまうことがある。例えば、書かれている文書の行数が変わった場合など、部分的に見ると少しの違いだが、画像がずれることで、大きな差分として表れる。即ち、例え、マイナーチェンジであっても、大きな差分となってしまう場合がある。 Further, the determination unit 34 may divide the electronic document into predetermined divisions and compare each division to determine whether or not the electronic document is a modified version. That is, when the above difference is obtained, assuming a method of taking the total difference, when the total difference is taken, it may appear as a large difference. For example, when the number of lines in the written document changes, there is a slight difference when viewed partially, but when the image shifts, it appears as a large difference. That is, even a minor change may result in a large difference.

これを抑制するには、決定部34は、電子文書の中の予め定められた記号により区分を区切る。この記号は、例えば、単元を表す「I」、「II」、「III」、(1)、(2)、(3)、段落の最初に記載されるスペース、表の罫線などである。つまり、決定部34は、この記号を目印として、区分を区切る。そして、決定部34は、それぞれの区分毎の差分を抽出する。そして、区分の数は同じであるが、一部の区分にしか差分が表れていないようであれば、この電子文書は、変更版であると判別することができる。 To suppress this, the determination unit 34 divides the division by a predetermined symbol in the electronic document. This symbol is, for example, "I", "II", "III", (1), (2), (3) representing a unit, a space described at the beginning of a paragraph, a ruled line of a table, and the like. That is, the determination unit 34 divides the division using this symbol as a mark. Then, the determination unit 34 extracts the difference for each division. Then, if the number of divisions is the same, but the difference appears only in some divisions, it can be determined that this electronic document is a modified version.

<管理サーバ30の動作の説明>
次に、第2の実施形態における管理サーバ30の動作の説明について説明する。
図10は、第2の実施形態における管理サーバ30の動作を説明したフローチャートである。
このうち、ステップ201〜ステップ202は、図8のステップ101〜ステップ102と同様であるので、説明を省略する。
ステップ203以降は、決定部34が、受け付けられた電子文書で生じた差分が、予め定められた変化をしているか否かを判断する(ステップ203)。予め定められた変化としては、上述した差分の量や電子文書の中で差分の生じた箇所が変化したような場合が該当する。
その結果、差分が、予め定められた変化をしていた場合(ステップ203でYes)、決定部34は、差分の特徴点を見いだし、この特徴点が予め定められた条件を満たすか否かを判断する(ステップ204)。差分の特徴点としては、上述した差分の量や受け付けの時期が該当する。
そして、特徴点が予め定められた条件を満たした場合(ステップ204でYes)、決定部34は、受け付けられた電子文書が、変更版であると判断する(ステップ205)。
対して、差分が、予め定められた変化をしていない場合(ステップ203でNo)、および特徴点が予め定められた条件を満たさない場合(ステップ204でNo)は、決定部34は、受け付けられた電子文書が、変更版ではないと判断する(ステップ206)。
<Explanation of operation of management server 30>
Next, the description of the operation of the management server 30 in the second embodiment will be described.
FIG. 10 is a flowchart illustrating the operation of the management server 30 in the second embodiment.
Of these, steps 201 to 202 are the same as steps 101 to 102 in FIG. 8, so description thereof will be omitted.
After step 203, the determination unit 34 determines whether or not the difference generated in the received electronic document has a predetermined change (step 203). The predetermined change corresponds to the case where the amount of difference described above or the part where the difference occurs in the electronic document changes.
As a result, when the difference has a predetermined change (Yes in step 203), the determination unit 34 finds the feature point of the difference and determines whether or not the feature point satisfies the predetermined condition. Determine (step 204). As the characteristic points of the difference, the amount of the difference and the timing of acceptance described above correspond.
Then, when the feature points satisfy the predetermined conditions (Yes in step 204), the determination unit 34 determines that the received electronic document is a modified version (step 205).
On the other hand, if the difference does not change in advance (No in step 203) and the feature point does not satisfy the predetermined condition (No in step 204), the determination unit 34 accepts. It is determined that the electronic document is not a modified version (step 206).

次のステップ207〜ステップ211は、図8のステップ103〜ステップ107と同様である。ただし、ステップ209では、振分部32は、受け付けられた電子文書をグループに振り分け、保存部33に保存するとともに、受け付けられた電子文書が、変更版であることを示す情報を、グループ情報として保存する。 The next steps 207 to 211 are the same as steps 103 to 107 in FIG. However, in step 209, the distribution unit 32 distributes the received electronic document into groups and saves the received electronic document in the storage unit 33, and also uses information indicating that the received electronic document is a modified version as group information. save.

第1の実施形態では、電子文書の記入箇所を予め登録しなくても、未記入箇所を特定することができる情報処理装置等を提供することができる。これにより、情報処理システム1を管理する管理者の負担を軽減できる。また、未記入箇所を、ユーザに補充させることができる。さらに、未記入箇所を補充させ、未記入箇所をなくすことで、グループ分けの精度が、より向上する。
また、第2の実施形態では、これに加え、受け付けられた電子文書が、変更版であるか否かを判別することができ、グループ分けの精度が、より向上する。
In the first embodiment, it is possible to provide an information processing device or the like capable of identifying an unfilled portion without registering an filled-in portion of an electronic document in advance. As a result, the burden on the administrator who manages the information processing system 1 can be reduced. In addition, the user can be made to fill in the blank parts. Furthermore, the accuracy of grouping is further improved by replenishing the unfilled parts and eliminating the unfilled parts.
Further, in the second embodiment, in addition to this, it is possible to determine whether or not the received electronic document is a modified version, and the accuracy of grouping is further improved.

なお、上述した例では、管理サーバ30が、未記入箇所の特定や変更版の判別を行っていたが、これに限られるものではない。例えば、端末装置20で行うこともできる。さらに、画像形成装置10で行うこともできる。
また、上述した例では、言及しなかったが、管理サーバ30は、未記入箇所を特定し、ユーザに修正をさせるだけでなく、この後に、ユーザが指定した処理など、他の処理を行ってもよい。他の処理の例としては、例えば、スキャンした電子文書を他の機器に転送するなどの処理である。また、未記入箇所について、ユーザに確認を求め、ユーザが未記入事項ではないと判断したときは、この箇所を未記入箇所として扱わないようにすることもできる。
In the above-mentioned example, the management server 30 identifies the unfilled portion and determines the modified version, but the present invention is not limited to this. For example, it can be performed by the terminal device 20. Further, it can be performed by the image forming apparatus 10.
Further, although not mentioned in the above-mentioned example, the management server 30 not only identifies the unfilled part and causes the user to correct it, but also performs other processing such as the processing specified by the user after that. May be good. An example of another process is, for example, a process of transferring a scanned electronic document to another device. Further, when the user is requested to confirm the unfilled part and the user determines that the unfilled part is not an unfilled item, the unfilled part may not be treated as the unfilled part.

また、振分部32は、グループの中の記入領域R2(図6参照)を抽出し、これが他と異なる電子文書がある場合は、これらの電子文書をそのグループから削除し、新たなグループに振り分けることもできる。これにより、グループ分けの精度が、より向上する。
また、グループ内に電子文書が多く蓄積され、電子文書の中の記入領域R2が、より明確になったときは、特定部35は、図9で示した記入領域座標を用いて、未記入箇所の特定をしてもよい。即ち、記入領域座標により、ユーザが記載する箇所の座標がわかるため、この箇所に記入がない場合は、未記入箇所であると特定する。
そして、記入領域R2についてユーザに確認を求め、記入領域R2についての精度を向上させるようにしてもよい。
Further, the distribution unit 32 extracts the entry area R2 (see FIG. 6) in the group, and if there is an electronic document different from the others, deletes these electronic documents from the group and puts them in a new group. It can also be sorted. As a result, the accuracy of grouping is further improved.
Further, when a large number of electronic documents are accumulated in the group and the entry area R2 in the electronic document becomes clearer, the specific unit 35 uses the entry area coordinates shown in FIG. May be specified. That is, since the coordinates of the place to be described by the user can be known from the coordinates of the entry area, if there is no entry in this place, it is specified as an unfilled place.
Then, the user may be asked to confirm the entry area R2 to improve the accuracy of the entry area R2.

<プログラムの説明>
ここで、以上説明を行った本実施の形態の管理サーバ30で行う処理は、例えば、ソフトウェア等のプログラムとして用意される。そして、ソフトウェアとハードウェア資源とが協働することにより実現される。
<Program description>
Here, the process performed by the management server 30 of the present embodiment described above is prepared as, for example, a program such as software. And it is realized by the cooperation of software and hardware resources.

よって、第1の実施形態で、管理サーバ30が行う処理を実行するプログラムは、コンピュータに、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、電子文書を受け付ける受付機能と、受付機能により受け付けられた電子文書が、振分機能によりグループ分けされたグループの何れに対応するかを決定する決定機能と、受け付けられた電子文書と決定機能により決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、を実現させるためのプログラムとして捉えることもできる。 Therefore, in the first embodiment, the program that executes the processing performed by the management server 30 receives the electronic document and the distribution function for grouping the electronic documents processed in the past based on the similarity of the electronic documents to the computer. The reception function, the decision function that determines which of the groups grouped by the distribution function corresponds to the electronic document received by the reception function, and the group determined by the received electronic document and the decision function. By comparing with the electronic document to which it belongs, it can be regarded as a program for realizing a specific function of identifying an unfilled part in the received electronic document.

また、第2の実施形態で、管理サーバ30が行う処理を実行するプログラムは、コンピュータに、電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、受け付けられた電子文書が、振分機能によりグループ分けされたグループの何れに対応するかを決定するとともに、グループに属する電子文書が部分的に変更された変更版であることを判別する決定機能と、受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、を実現させるためのプログラムとして捉えることもできる。 Further, in the second embodiment, the program that executes the processing performed by the management server 30 has a distribution function for grouping the electronic documents processed in the past based on the similarity of the electronic documents on the computer, and the received electronic documents. Accepted as a decision function to determine which of the groups the document corresponds to by the sorting function and to determine that the electronic document belonging to the group is a partially modified version. By comparing the electronic document with the electronic document belonging to the determined group, it can be regarded as a program for realizing a specific function of identifying an unfilled part in the received electronic document.

なお、本実施の形態を実現するプログラムは、通信手段により提供することはもちろん、CD−ROM等の記録媒体に格納して提供することも可能である。 The program that realizes the present embodiment can be provided not only by communication means but also by storing it in a recording medium such as a CD-ROM.

以上、本実施の形態について説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、種々の変更または改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。 Although the present embodiment has been described above, the technical scope of the present invention is not limited to the scope described in the above embodiment. It is clear from the description of the claims that the above-described embodiment with various modifications or improvements is also included in the technical scope of the present invention.

1…情報処理システム、10…画像形成装置、20…端末装置、30…管理サーバ、31…送受信部、32…振分部、33…保存部、34…決定部、35…特定部、M1…未記入箇所 1 ... Information processing system, 10 ... Image forming device, 20 ... Terminal device, 30 ... Management server, 31 ... Transmission / reception unit, 32 ... Distribution unit, 33 ... Storage unit, 34 ... Decision unit, 35 ... Specific unit, M1 ... Blank part

Claims (12)

プロセッサを備え、
前記プロセッサは、
電子文書の類似度から、過去に処理した電子文書をグループ分けし、
受け付けられた電子文書が、グループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書が部分的に変更された変更版であることを判別し、
受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する
ことを特徴とする情報処理装置。
Equipped with a processor
The processor
Group electronic documents processed in the past based on the similarity of electronic documents.
Determine which of the grouped groups the received electronic document corresponds to, and determine that the electronic document belonging to the determined group is a partially modified version.
An information processing device characterized in that an unfilled part in an accepted electronic document is identified by comparing an accepted electronic document with an electronic document belonging to a determined group.
前記プロセッサは、決定されたグループに属する電子文書のそれぞれの画像と、受け付けられた電子文書の画像との差分により、受け付けられた電子文書が前記変更版であるとすることを特徴とする請求項1に記載の情報処理装置。 The processor is characterized in that the received electronic document is the modified version based on the difference between each image of the electronic document belonging to the determined group and the image of the received electronic document. The information processing apparatus according to 1. 前記プロセッサは、決定されたグループに属し過去に処理した電子文書で生じた差分と比較して、受け付けられた電子文書で生じた差分が予め定められた変化をしたときに、前記変更版であると推定することを特徴とする請求項2に記載の情報処理装置。 The processor is the modified version when the difference generated in the accepted electronic document makes a predetermined change as compared to the difference produced in the electronic document that belongs to the determined group and has been processed in the past. The information processing apparatus according to claim 2, wherein the information processing apparatus is presumed to be. 前記プロセッサは、予め定められた変化として差分の量および電子文書の中で差分の生じた箇所の少なくとも一方が変化したときに、前記変更版であると推定することを特徴とする請求項3に記載の情報処理装置。 The third aspect of the present invention is that the processor estimates that the modified version is obtained when the amount of the difference and at least one of the parts where the difference occurs in the electronic document are changed as predetermined changes. The information processing device described. 前記プロセッサは、前記差分の特徴点を見いだし、当該特徴点が予め定められた条件を満たしたときに、前記変更版であるとすることを特徴とする請求項2または3に記載の情報処理装置。 The information processing apparatus according to claim 2 or 3, wherein the processor finds a feature point of the difference, and when the feature point satisfies a predetermined condition, the processor is a modified version. .. 前記特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに差分が同程度である場合であることを特徴とする請求項5に記載の情報処理装置。 The information processing apparatus according to claim 5, wherein the feature point is a case where a plurality of received electronic documents are in the same group and the differences are about the same. 前記特徴点は、受け付けられた複数の電子文書が、同じグループであるとともに予め定められた箇所が変更されない場合であることを特徴とする請求項5に記載の情報処理装置。 The information processing apparatus according to claim 5, wherein the feature point is a case where a plurality of received electronic documents are in the same group and a predetermined portion is not changed. 前記プロセッサは、ユーザが記載する箇所である記入箇所とそれ以外の箇所について区別して前記特徴点を見いだすことを特徴とする請求項5に記載の情報処理装置。 The information processing apparatus according to claim 5, wherein the processor distinguishes between an entry place, which is a place to be described by a user, and a place other than the entry place, and finds the feature point. 前記プロセッサは、電子文書を予め定められた区分に区切り、当該区分毎に比較することで前記変更版であるか否かを判別することを特徴とする請求項1に記載の情報処理装置。 The information processing apparatus according to claim 1, wherein the processor divides an electronic document into predetermined categories and compares each of the categories to determine whether or not the electronic document is a modified version. 前記プロセッサは、電子文書の中の予め定められた記号により前記区分を区切ることを特徴とする請求項9に記載の情報処理装置。 The information processing apparatus according to claim 9, wherein the processor divides the division by a predetermined symbol in an electronic document. 画像の処理を行う画像処理装置と、
前記画像処理装置を利用する際に用いる電子文書について、ユーザが記入しなかった未記入箇所を特定する処理を行う情報処理装置と、
を備え、
前記情報処理装置は、プロセッサを備え、
前記プロセッサは、
電子文書の類似度から、過去に処理した電子文書をグループ分けする振分部と、
受け付けられた電子文書が、前記振分部によりグループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定部と、
受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定部と、
を備える情報処理システム。
An image processing device that processes images and
An information processing device that performs processing to identify unfilled parts that the user did not fill in the electronic document used when using the image processing device.
With
The information processing device includes a processor.
The processor
A distribution unit that groups electronic documents processed in the past based on the similarity of electronic documents,
It is determined which of the groups grouped by the distribution unit corresponds to the received electronic document, and it is determined that the electronic document belonging to the determined group is a partially modified version. The decision-making part to do,
By comparing the accepted electronic document with the electronic document belonging to the determined group, the specific part that identifies the unfilled part in the accepted electronic document and the specific part
Information processing system equipped with.
コンピュータに、
電子文書の類似度から、過去に処理した電子文書をグループ分けする振分機能と、
受け付けられた電子文書が、前記振分機能によりグループ分けされたグループの何れに対応するかを決定するとともに、決定されたグループに属する電子文書が部分的に変更された変更版であることを判別する決定機能と、
受け付けられた電子文書と決定されたグループに属する電子文書との比較により、受け付けられた電子文書の中の未記入箇所を特定する特定機能と、
を実現させるためのプログラム。
On the computer
A sorting function that groups electronic documents processed in the past based on the similarity of electronic documents,
It is determined which of the groups grouped by the sorting function corresponds to the received electronic document, and it is determined that the electronic document belonging to the determined group is a partially modified version. The decision function to do and
A specific function to identify unfilled parts in the accepted electronic document by comparing the accepted electronic document with the electronic document belonging to the determined group, and
A program to realize.
JP2020005306A 2020-01-16 2020-01-16 Information processing device, information processing system, and program Active JP7484176B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020005306A JP7484176B2 (en) 2020-01-16 2020-01-16 Information processing device, information processing system, and program
US16/997,187 US11438477B2 (en) 2020-01-16 2020-08-19 Information processing device, information processing system and computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020005306A JP7484176B2 (en) 2020-01-16 2020-01-16 Information processing device, information processing system, and program

Publications (2)

Publication Number Publication Date
JP2021114041A true JP2021114041A (en) 2021-08-05
JP7484176B2 JP7484176B2 (en) 2024-05-16

Family

ID=77077607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020005306A Active JP7484176B2 (en) 2020-01-16 2020-01-16 Information processing device, information processing system, and program

Country Status (1)

Country Link
JP (1) JP7484176B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004086851A (en) 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd Apparatus, method, and program for detecting significant updating of electronic document, and record medium storing the program
JP2007164452A (en) 2005-12-13 2007-06-28 Canon Inc Information processor, information processing method, storage medium and program
JP2014132736A (en) 2013-01-07 2014-07-17 Canon Inc Information processing system and method therefor
JP2015191382A (en) 2014-03-28 2015-11-02 日本電気株式会社 Image data processing device, method, and program
JP6886100B2 (en) 2015-11-20 2021-06-16 キヤノンマーケティングジャパン株式会社 Information processing equipment, its processing method and program

Also Published As

Publication number Publication date
JP7484176B2 (en) 2024-05-16

Similar Documents

Publication Publication Date Title
US8897563B1 (en) Systems and methods for automatically processing electronic documents
US7587412B2 (en) Mixed media reality brokerage network and methods of use
JP4533273B2 (en) Image processing apparatus, image processing method, and program
US20110249905A1 (en) Systems and methods for automatically extracting data from electronic documents including tables
CN102611815A (en) Image processing apparatus, image processing system and image processing method
US20150304521A1 (en) Dynamically generating table of contents for printable or scanned content
JP2009224958A (en) Job procedure extrapolating system and program
JP6665498B2 (en) Information processing apparatus, image processing system and program
US11908215B2 (en) Information processing apparatus, information processing method, and storage medium
US20170124390A1 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
KR20170101125A (en) Information processing apparatus, information processing method, and storage medium
US11710329B2 (en) Image processing apparatus with automated registration of previously encountered business forms, image processing method and storage medium therefor
US20150187022A1 (en) Information processing system, information processing method, and computer program product
JP2018042067A (en) Image processing system, image processing method, and information processing device
US11657367B2 (en) Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program
US11438477B2 (en) Information processing device, information processing system and computer readable medium
JP7484176B2 (en) Information processing device, information processing system, and program
JP2021114040A (en) Information processing apparatus, information processing system, and program
JP2008257543A (en) Image processing system and program
CN113870387A (en) Data output system and method, image processing system and method
US20200304670A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2009223390A (en) Image processing monitoring system and program
CN112101356A (en) Method and device for positioning specific text in picture and storage medium
US11659106B2 (en) Information processing apparatus, non-transitory computer readable medium, and character recognition system
US20220319218A1 (en) Image processing apparatus, image processing system, control method thereof, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240415

R150 Certificate of patent or registration of utility model

Ref document number: 7484176

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150