JP6079361B2 - Document management apparatus, document management method, and document management program - Google Patents

Document management apparatus, document management method, and document management program Download PDF

Info

Publication number
JP6079361B2
JP6079361B2 JP2013065379A JP2013065379A JP6079361B2 JP 6079361 B2 JP6079361 B2 JP 6079361B2 JP 2013065379 A JP2013065379 A JP 2013065379A JP 2013065379 A JP2013065379 A JP 2013065379A JP 6079361 B2 JP6079361 B2 JP 6079361B2
Authority
JP
Japan
Prior art keywords
document
information
important
character string
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013065379A
Other languages
Japanese (ja)
Other versions
JP2014191522A (en
Inventor
源 佐藤
源 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013065379A priority Critical patent/JP6079361B2/en
Publication of JP2014191522A publication Critical patent/JP2014191522A/en
Application granted granted Critical
Publication of JP6079361B2 publication Critical patent/JP6079361B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本技術は、文書管理装置、文書管理方法および文書管理プログラムに関する。   The present technology relates to a document management apparatus, a document management method, and a document management program.

近年、多様なプラットフォームから出力される文書を電子化・集約して一元化管理を行い、ネットワーク環境の端末から電子文書の利用を可能とした電子文書管理システムが開発されている。   2. Description of the Related Art In recent years, electronic document management systems have been developed in which documents output from various platforms are digitized and aggregated for centralized management, and electronic documents can be used from terminals in a network environment.

このようなシステムを導入することにより、ペーパーレス化によるコストダウンが実現される。また、ユーザは、システムを通じて、端末上で紙文書と同様に文書の参照、書き込み、マーキング等の操作を行うことができ、さらに、仕分けや検索など紙文書では困難だった操作が容易となるため、業務の活性化、効率化が可能になる。   By introducing such a system, it is possible to reduce costs by making paperless. In addition, the user can perform operations such as document reference, writing, and marking on the terminal through the system in the same manner as a paper document. Further, operations that are difficult with a paper document such as sorting and searching can be easily performed. Activating and improving the efficiency of business.

一方、近年では、個人データや企業の機密案件などの情報漏洩に対する対策要求が高まっており、電子文書の管理においても高いセキュリティ機能が求められている。
従来の情報漏洩の対策技術としては、例えば、端末のネットワークアドレスと、プリントジョブの送信先プリンタのネットワークアドレスとが同一でないときには端末側で警告を発する技術が提案されている。
On the other hand, in recent years, there has been an increasing demand for countermeasures against information leakage such as personal data and corporate confidential matters, and a high security function is also required in the management of electronic documents.
As a conventional information leakage countermeasure technique, for example, a technique has been proposed in which a warning is issued on the terminal side when the network address of the terminal and the network address of the destination printer of the print job are not the same.

また、プリンタの識別情報と宛先情報を保持し、該プリンタに識別情報を問い合わせ、取得した識別情報と保持している識別情報とが一致したときは、該プリンタへ印刷データを送信する技術が提案されている。   Also, a technique is proposed in which identification information and destination information of a printer are held, identification information is inquired to the printer, and print data is transmitted to the printer when the acquired identification information matches the held identification information. Has been.

さらに、出現位置毎のキーワードを判定対象とし、所定範囲内に他のキーワードがあるか否かを判定し、判定対象のキーワードと他のキーワードを組み合わせた組み合わせ情報のうち、機密文書の組み合わせ情報と一致する数が所定値以上か否かを判定する技術が提案されている。   Further, a keyword for each appearance position is set as a determination target, it is determined whether or not there is another keyword within a predetermined range, and among combination information obtained by combining the determination target keyword and another keyword, combination information of a confidential document and A technique for determining whether or not the number of matches is a predetermined value or more has been proposed.

特開2009−151618号公報JP 2009-151618 A 特開2008−152691号公報JP 2008-152691 A 特開2010−231766号公報JP 2010-231766 A

重要な電子文書には、アクセス権、または重要な内容である旨を示すマーキングなどを付与したりして、重要文書であることを設定して管理している。
しかし、電子文書が重要であるか否かの判断は、従来、人間の作業で行われているため、重要な文書であるにもかかわらず、人為的ミスによって、重要文書と判定されない場合がある。
An important electronic document is managed by setting it as an important document by giving an access right or marking indicating that it is an important content.
However, since the determination of whether or not an electronic document is important is conventionally performed by human work, it may not be determined as an important document due to human error even though it is an important document. .

例えば、文書に記載されている、重要文書判定の指標となる文字列などを見逃してしまうことで、重要文書であるにもかかわらず、非重要文書と判定してしまう可能性がある。このような場合に、重要文書を非重要文書と混在して出力(例えば、印刷)してしまうと、情報漏洩につながってしまう。   For example, by overlooking a character string or the like described in a document that serves as an index for determining an important document, the document may be determined as an unimportant document even though it is an important document. In such a case, if an important document is mixed with an unimportant document and output (for example, printing), information leakage occurs.

1つの側面では、本発明は、重要文書の判定精度の向上を図った文書管理装置、文書管理方法および文書管理プログラムを提供することを目的とする。   In one aspect, an object of the present invention is to provide a document management apparatus, a document management method, and a document management program that improve the accuracy of determining important documents.

1つの案では、文書管理装置が提供される。文書管理装置は、文書が重要か否かの判定に用いるキーワードの集合に含まれるキーワードを文書から検索し、キーワードに関連づけられた所定文字列を抽出する検索手段と、抽出された所定文字列を集合に追加して蓄積する蓄積手段と、文書が重要であるか否かの重要文書判定処理を行う判定手段とを有する。また、判定手段は、文書に付属するメモ情報の中に、重要文書とみなす重要ワードが含まれるか否かの判定を行うメモ情報検索を行い、メモ情報から重要ワードが検出されない場合は、文書の管理情報の中に、重要ワードが含まれるか否かの判定を行う管理情報検索を行い、管理情報から重要ワードが検出されない場合は、文書のデータ内にキーワードまたは所定文字列の少なくとも一方が含まれるか否かを判定する。 In one scheme, a document management device is provided. A document management apparatus searches a document for a keyword included in a set of keywords used to determine whether or not a document is important, extracts a predetermined character string associated with the keyword, and extracts the predetermined character string . a means for storing in addition to collecting case, and a determination unit that document makes a critical document determining process whether important. Further, the determination means performs a memo information search for determining whether or not an important word regarded as an important document is included in the memo information attached to the document, and if no important word is detected from the memo information, When the management information is searched for determining whether or not the important word is included in the management information and no important word is detected from the management information, at least one of the keyword or the predetermined character string is included in the document data. It is determined whether or not it is included.

1態様によれば、重要文書の判定精度の向上を図ることが可能になる。   According to one aspect, it is possible to improve the determination accuracy of important documents.

文書管理装置の構成例を示す図である。It is a figure which shows the structural example of a document management apparatus. 電子文書管理システムの構成例を示す図である。It is a figure which shows the structural example of an electronic document management system. サーバ装置の構成例を示す図である。It is a figure which shows the structural example of a server apparatus. 帳票管理手段で管理される帳票ファイルのフォーマットを示す図である。It is a figure which shows the format of the form file managed by the form management means. 帳票ファイルのデータ構造を示す図である。It is a figure which shows the data structure of a form file. メモファイル管理手段で管理されるメモファイルのフォーマットを示す図である。It is a figure which shows the format of the memo file managed by the memo file management means. 管理情報DBに格納される管理情報のフォーマットを示す図である。It is a figure which shows the format of the management information stored in management information DB. 重要ワード管理手段で管理される重要ワードファイルのフォーマットを示す図である。It is a figure which shows the format of the important word file managed by the important word management means. 蓄積情報のフォーマットを示す図である。It is a figure which shows the format of accumulation | storage information. 重要文書判定処理の全体動作を示すフローチャートである。It is a flowchart which shows the whole operation | movement of an important document determination process. スタンプが付与された帳票の例を示す図である。It is a figure which shows the example of the form to which the stamp was provided. メモ情報検索の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of memo information search. 管理情報検索の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of management information search. データ検索の動作を示すフローチャートである。It is a flowchart which shows operation | movement of a data search. 重要文書判定済み調査の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the important document determination completed investigation. 差分判定項目を用いて判定処理を行う場合の動作を説明するための図である。It is a figure for demonstrating operation | movement in the case of performing a determination process using a difference determination item. 差分判定項目を用いて判定処理を行う場合の動作を説明するための図である。It is a figure for demonstrating operation | movement in the case of performing a determination process using a difference determination item. 所定文字列抽出処理の動作を説明するための図である。It is a figure for demonstrating the operation | movement of a predetermined character string extraction process. 所定文字列抽出処理の動作を示すフローチャートである。It is a flowchart which shows operation | movement of a predetermined character string extraction process. 帳票の出力処理の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of a form output process. 本実施の形態に用いるコンピュータのハードウェアの一構成例を示す図である。It is a figure which shows one structural example of the hardware of the computer used for this Embodiment.

以下、本発明の実施の形態を図面を参照して説明する。図1は文書管理装置の構成例を示す図である。文書管理装置1は、検索手段1a、蓄積手段1bおよび判定手段1cを備える。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram illustrating a configuration example of a document management apparatus. The document management apparatus 1 includes a search unit 1a, a storage unit 1b, and a determination unit 1c.

検索手段1aは、文書が重要か否かの判定に用いるキーワードの集合に含まれるキーワードを文書から検索し、キーワードに関連づけられた所定文字列を抽出する。蓄積手段1bは、抽出された所定文字列をキーワードの集合に追加して蓄積する。判定手段1cは、文書が重要文書であるか否かの重要文書判定処理を行う。重要文書判定処理の1つとしては、キーワードまたは所定文字列の少なくとも一方を含む文書を重要文書と判定する。   The search means 1a searches the document for keywords included in a set of keywords used for determining whether or not the document is important, and extracts a predetermined character string associated with the keyword. The storage means 1b adds the extracted predetermined character string to the keyword set and stores it. The determination unit 1c performs an important document determination process as to whether or not the document is an important document. As one of the important document determination processes, a document including at least one of a keyword or a predetermined character string is determined as an important document.

図1に示す例において、重要文書とみなすキーワードを「住所」とし、文書A、Bには「住所」が記載されている。また、文書Aには「住所」に関連づけられた文字列「東京都AA区」が記載され、文書Bには「住所」に関連づけられた文字列「東京都BB区」が記載されている。   In the example shown in FIG. 1, a keyword regarded as an important document is “address”, and “address” is described in documents A and B. In addition, the character string “Tokyo AA ward” associated with “address” is described in document A, and the character string “Tokyo BB ward” associated with “address” is described in document B.

文書Aでは、「住所」をキーワードにしているので、このキーワードに関連づけられる文字列「東京都AA区」は所定文字列となる。したがって、検索手段1aは、文書Aから所定文字列「東京都AA区」を抽出し、蓄積手段1bは、抽出された所定文字列「東京都AA区」をキーワード「住所」の集合に追加して蓄積する。   In the document A, since “address” is a keyword, the character string “Tokyo AA Ward” associated with the keyword is a predetermined character string. Accordingly, the search means 1a extracts the predetermined character string “Tokyo AA Ward” from the document A, and the storage means 1b adds the extracted predetermined character string “Tokyo AA Ward” to the set of keywords “address”. Accumulate.

一方、文書Bでは、「住所」をキーワードにしているので、このキーワードに関連づけられる文字列「東京都BB区」は所定文字列となる。したがって、検索手段1aは、文書Bから所定文字列「東京都BB区」を抽出し、蓄積手段1bは、抽出された所定文字列「東京都BB区」をキーワード「住所」の集合に追加して蓄積する。   On the other hand, in the document B, since “address” is a keyword, the character string “Tokyo BB Ward” associated with the keyword is a predetermined character string. Accordingly, the search means 1a extracts the predetermined character string “Tokyo BB ward” from the document B, and the storage means 1b adds the extracted predetermined character string “Tokyo BB ward” to the set of keywords “address”. Accumulate.

このような処理によって、重要文書と判定するための所定文字列が蓄積・更新されていく。また、これらキーワードまたは所定文字列にもとづいて、文書が重要文書であるか否かの判定が行われる。   Through such processing, a predetermined character string for determining an important document is accumulated and updated. Further, it is determined whether or not the document is an important document based on these keywords or a predetermined character string.

ここで、従来では、重要文書であるか否かの判断は、主に人間の作業で行われているため、重要文書判定の指標となる文字列などを見逃してしまうなどの人為的ミスによって、重要文書と判定されない場合がある。   Here, conventionally, since it is mainly performed by human work to determine whether it is an important document, due to human error such as missing a character string that is an index of important document determination, It may not be judged as an important document.

例えば、「住所」を重要文字列とした場合、一方の文書(文書Cとする)には「住所」の文字列が記載されており、他方の文書(文書Dとする)には、「住所」の文字列は記載されていないが、「東京都DD区」の文字列が記載されているとする。   For example, when “address” is an important character string, the character string “address” is described in one document (referred to as document C), and the address “address” is indicated in the other document (referred to as document D). The character string "" is not described, but the character string "Tokyo DD Ward" is described.

このような場合、文書Dは、文字列「住所」の直接の記載はなくても、「東京都DD区」という住所表示がなされているので、文書Cが重要文書であるだけでなく、文書Dも重要文書である。   In such a case, the document D does not have the direct description of the character string “address”, but the address “Tokyo DD ward” is displayed, so that the document C is not only an important document, D is also an important document.

しかし、従来では、重要文字列である「住所」が直接記載されている文書Cを重要文書と判定することは容易であっても、「住所」という文字列の直接の記載がない文書Dに対しては、重要文書と判定されないおそれがある。   However, conventionally, even if it is easy to determine that the document C in which the “address” that is an important character string is directly described is an important document, the document C in which the character string “address” is not directly described On the other hand, there is a possibility that it is not determined as an important document.

一方、文書管理装置1では、キーワードに関連する所定文字列の抽出、蓄積処理を行う。キーワードとなる「住所」と、このキーワードに関連づけられた所定文字列「東京都DD区」をすでに蓄積しているとする。   On the other hand, the document management apparatus 1 performs extraction and accumulation processing of a predetermined character string related to the keyword. Assume that an “address” as a keyword and a predetermined character string “Tokyo DD Ward” associated with the keyword have already been accumulated.

文書管理装置1では、キーワードや所定文字列にもとづいて、文書が重要文書であるか否かの判定を行うので、重要文書判定時に、「住所」が文書内に直接記載されていなくても、所定文字列「東京都DD区」が記載されている文書Dを重要文書と判定することになる。このように、キーワードの直接の記載がなくても、キーワードに関連づけられた所定文字列から重要文書を判定することができる。   Since the document management apparatus 1 determines whether or not the document is an important document based on a keyword or a predetermined character string, even when the “address” is not directly described in the document when the important document is determined, The document D in which the predetermined character string “Tokyo Metropolitan DD Ward” is described is determined as an important document. As described above, an important document can be determined from a predetermined character string associated with a keyword even if the keyword is not directly described.

上記のように、文書管理装置1では、キーワードに関連づけられた所定文字列を文書から抽出し、抽出された所定文字列をキーワード集合に追加していくことで、重要文書か否かを判定する際の所定文字列を自動更新する。これにより、重要文書の判定精度を向上させることが可能になる。   As described above, the document management apparatus 1 determines whether or not the document is an important document by extracting a predetermined character string associated with the keyword from the document and adding the extracted predetermined character string to the keyword set. The predetermined character string at the time is automatically updated. Thereby, it becomes possible to improve the determination accuracy of an important document.

次に文書管理装置1の機能を備える電子文書管理システムの構成について説明する。なお、文書の1つの例として帳票を扱うものとして以降説明する。
図2は電子文書管理システムの構成例を示す図である。電子文書管理システム2は、サーバ装置10、文書作成装置21、クライアント装置22−1、22−2およびプリンタ23−1〜23−3を備える。
Next, the configuration of an electronic document management system having the function of the document management apparatus 1 will be described. In the following description, a document is handled as an example of a document.
FIG. 2 is a diagram illustrating a configuration example of an electronic document management system. The electronic document management system 2 includes a server device 10, a document creation device 21, client devices 22-1 and 22-2, and printers 23-1 to 23-3.

サーバ装置10には、文書作成装置21、クライアント装置22−1、22−2およびプリンタ23−1〜23−3が接続されている(図示はしていないが、各装置はネットワークを介在して接続されてもよい)。   The server device 10 is connected to a document creation device 21, client devices 22-1 and 22-2, and printers 23-1 to 23-3 (not shown, but each device is connected via a network). May be connected).

サーバ装置10は、図1に示した文書管理装置1の機能を有している。サーバ装置10は、従来、紙で出力されていた帳票を電子化・集約して一元化管理を行い、クライアント側の端末に対して、電子化した帳票を表示して活用させる制御を行う。   The server device 10 has the function of the document management device 1 shown in FIG. The server apparatus 10 performs centralized management by digitizing and consolidating forms that have conventionally been output on paper, and controls the client side terminal to display and utilize the digitized forms.

文書作成装置21は、帳票を作成し、作成した帳票をサーバ装置10に登録する。クライアント装置22−1、22−2は、帳票を活用可能な端末である。クライアント装置22−1、22−2が例えば、帳票の印刷依頼をサーバ装置10に送信すると、プリンタ23−1〜23−3は、サーバ装置10からの印刷指示にもとづき帳票の印刷を実行する。   The document creation device 21 creates a form and registers the created form in the server device 10. The client devices 22-1 and 22-2 are terminals that can utilize the forms. For example, when the client apparatuses 22-1 and 22-2 transmit a print request for a form to the server apparatus 10, the printers 23-1 to 23-3 execute printing of the form based on a print instruction from the server apparatus 10.

次にサーバ装置10の構成について説明する。図3はサーバ装置の構成例を示す図である。サーバ装置10は、制御手段11、文書出力処理手段12および情報管理手段13を備える。   Next, the configuration of the server device 10 will be described. FIG. 3 is a diagram illustrating a configuration example of the server apparatus. The server device 10 includes a control unit 11, a document output processing unit 12, and an information management unit 13.

制御手段11は、図1に示した検索手段1a、蓄積手段1bおよび判定手段1cの機能を有し、重要文書判定処理や、装置またはシステムの全体制御を行う。文書出力処理手段12は、帳票の出力処理を行う。出力処理としては例えば、ネットワークへの文書出力処理、またはプリンタへの文書出力処理などを行う。   The control means 11 has the functions of the search means 1a, storage means 1b and determination means 1c shown in FIG. 1, and performs important document determination processing and overall control of the apparatus or system. The document output processing means 12 performs a form output process. As the output process, for example, a document output process to a network or a document output process to a printer is performed.

情報管理手段13は、帳票ファイル管理手段13a、メモファイル管理手段13b、管理情報DB(database)13cおよび重要ワード管理手段13dを備えて、各種情報の管理を行う。   The information management unit 13 includes a form file management unit 13a, a memo file management unit 13b, a management information DB (database) 13c, and an important word management unit 13d, and manages various types of information.

帳票ファイル管理手段13aは、帳票のデータをファイル化して管理する。メモファイル管理手段13bは、帳票に付属するメモ情報をファイル化したメモファイルを管理する。管理情報DB13cは、帳票の管理情報を格納管理する。重要ワード管理手段13dは、重要ワードをファイル化して管理する。   The form file management means 13a manages the form data as a file. The memo file management means 13b manages a memo file in which memo information attached to a form is filed. The management information DB 13c stores and manages form management information. The important word management means 13d manages the important word as a file.

重要ワードとは、後述のメモ検索および管理情報検索において、帳票が重要文書であるか否かを判定する指標となるワードのことである。また、後述のデータ検索では、帳票が重要文書であるか否かを判定する指標に使用するものは、キーワードと所定文字列となる。   The important word is a word that serves as an index for determining whether or not a form is an important document in a memo search and management information search described later. In the data search described later, what is used as an index for determining whether or not a form is an important document is a keyword and a predetermined character string.

次に情報管理手段13内の各構成要素における管理フォーマットについて説明する。図4は帳票管理手段で管理される帳票ファイルのフォーマットを示す図である。帳票ファイルf1は、帳票の出力データ(印刷データ)が格納されるファイルである。帳票ファイルf1では、後述のデータ検索により、帳票ファイルf1の出力データの中から、キーワードまたは所定文字列が存在するか否かの検索が行われる。   Next, the management format in each component in the information management means 13 will be described. FIG. 4 is a diagram showing a format of a form file managed by the form management means. The form file f1 is a file in which form output data (print data) is stored. In the form file f1, a search is performed as to whether or not a keyword or a predetermined character string exists from the output data of the form file f1 by a data search described later.

図5は帳票ファイルのデータ構造を示す図である。帳票ファイルf1は、“枠組み”と“データ”とで構成され、“枠組み”と“データ”とが結合されたものが帳票となる。なお、サーバ装置10では、“枠組み”か“データ”かを判別することが可能である。   FIG. 5 shows the data structure of the form file. The form file f1 is composed of “framework” and “data”, and a form in which “framework” and “data” are combined becomes a form. The server device 10 can determine whether it is “framework” or “data”.

図6はメモファイル管理手段で管理されるメモファイルのフォーマットを示す図である。サーバ装置10は、メモ情報付与機能によって、帳票にメモ情報を付与することができる。   FIG. 6 is a diagram showing the format of the memo file managed by the memo file management means. The server device 10 can add memo information to the form by the memo information adding function.

メモ情報は、各種のマーキング情報であって、スタンプ(電子印鑑など)、付箋、ラインマークなどがある。これらメモ情報は、ファイル化されてメモファイルとして管理される。   The memo information is various kinds of marking information, and includes a stamp (such as an electronic seal stamp), a sticky note, and a line mark. The memo information is filed and managed as a memo file.

メモファイルf2は、例えば、ページ、座標、作成者名、日付、メモ種別、フォント、文字色、背景色、枠オプション、影オプション、その他属性情報およびテキスト情報といった属性を含む。   The memo file f2 includes attributes such as page, coordinates, creator name, date, memo type, font, character color, background color, frame option, shadow option, other attribute information, and text information.

なお、後述のメモ情報検索により、メモファイルf2の属性のテキスト情報の中から、重要ワードが存在するか否かの検索が行われる。メモ情報が付与された帳票については図11で後述する。   It should be noted that a search for whether or not an important word exists is performed from the text information of the attribute of the memo file f2 by a memo information search described later. The form with the memo information will be described later with reference to FIG.

図7は管理情報DBに格納される管理情報のフォーマットを示す図である。サーバ装置10では、管理情報を用いて、帳票を管理している。管理情報には例えば、帳票名、コメントまたは備考などが含まれる。また、管理情報DB13c内では、これらの属性の他に、重要フラグおよび蓄積バージョン情報を付与して管理する。   FIG. 7 is a diagram showing a format of management information stored in the management information DB. The server device 10 manages the form using the management information. The management information includes, for example, a form name, a comment, or a remark. Further, in the management information DB 13c, in addition to these attributes, an important flag and accumulated version information are assigned and managed.

図7に示す管理情報d1では、例えば、帳票名、コメント、重要フラグおよび蓄積バージョン情報の属性を示している。重要フラグは、当該帳票が重要文書である場合はYes、非重要文書の場合はNoと記載される(空白のものは、まだ重要文書判定が実施されていない帳票である)。   In the management information d1 shown in FIG. 7, for example, the form name, comment, important flag, and stored version information attributes are shown. The important flag is described as “Yes” when the document is an important document and “No” when the document is a non-important document (a blank document is a document for which an important document determination has not yet been performed).

また、管理情報DB13cに書き込まれる蓄積バージョン情報は、帳票を蓄積する際に、帳票毎に設定されるバージョン情報である。なお、後述の管理情報検索により、管理情報d1の属性の帳票名、コメントまたは備考などから、重要ワードが存在するか否かの検索が行われる。   The stored version information written in the management information DB 13c is version information set for each form when the form is stored. It should be noted that, by management information search described later, a search is performed as to whether or not an important word exists from the form name, comment, or remarks of the attribute of the management information d1.

図8は重要ワード管理手段で管理される重要ワードファイルのフォーマットを示す図である。重要ワードファイルf3は、重要ワードと、重要文書判定を実施するか否かの設定とが記載される。図8の場合、重要文書判定を実施すること(Yes)、また、重要文書とみなす重要ワードは、「重要」、「秘密」、「ONLY」であることが記載されている。   FIG. 8 is a diagram showing a format of an important word file managed by the important word management means. The important word file f3 describes an important word and a setting as to whether or not to perform important document determination. In the case of FIG. 8, it is described that the important document determination is performed (Yes), and the important words regarded as the important documents are “important”, “secret”, and “ONLY”.

次に蓄積手段1bに格納される蓄積情報について説明する。図9は蓄積情報のフォーマットを示す図である。蓄積情報d2は、キーワード、所定文字列および蓄積バージョン情報の属性を有する。   Next, accumulation information stored in the accumulation means 1b will be described. FIG. 9 is a diagram showing a format of accumulated information. The stored information d2 has attributes of a keyword, a predetermined character string, and stored version information.

図9では、キーワード「郵便番号」に関連づけられた所定文字列が000-0000であり、この情報を蓄積した際の蓄積バージョン情報が20120101135121であることが示されている。
また、キーワード「住所」に関連づけられた所定文字列が東京都XXXであり、この情報を蓄積した際の蓄積バージョン情報が20120101135121であることが示されている。さらに、キーワード「顧客名」に関連づけられた所定文字列が日本であり、この情報を蓄積した際の蓄積バージョン情報が20111213091121であることが示されている。
FIG. 9 shows that the predetermined character string associated with the keyword “zip code” is 000-0000, and the stored version information when this information is stored is 20120101135121.
Further, it is shown that the predetermined character string associated with the keyword “address” is Tokyo XXX, and the stored version information when this information is stored is 20120101135121. Furthermore, it is shown that the predetermined character string associated with the keyword “customer name” is Japan, and the accumulated version information when this information is accumulated is 20111213091121.

上記のように、蓄積バージョン情報は、帳票だけでなく、キーワードまたは所定文字列に対しても設定される。すなわち、蓄積手段1bに書き込まれる蓄積バージョン情報は、キーワードまたは所定文字列に対して設定されるバージョン情報である。   As described above, the stored version information is set not only for a form but also for a keyword or a predetermined character string. That is, the accumulated version information written in the accumulating unit 1b is version information set for a keyword or a predetermined character string.

次に重要ワードおよびキーワードの設定について説明する。システム管理者は、サーバ装置10に対して、ある帳票が重要文書であるか否かを判定する際の指標となる重要ワードおよびキーワードを、環境設定画面等を通じて設定する。   Next, setting of important words and keywords will be described. The system administrator sets important words and keywords, which serve as indices for determining whether or not a certain form is an important document, through the environment setting screen or the like.

重要ワードとしては、例えば、「重要」、「秘」、「ONLY」等がある。キーワードとしては「郵便番号」、「住所」、「顧客名」等がある。どちらの場合も任意に変更が可能である。重要ワードは、後述のメモ情報検索および管理情報検索において、重要文書判定指標に使用され、キーワードは、後述のデータ検索において、重要文書判定指標に使用される。   Examples of important words include “important”, “secret”, “ONLY”, and the like. Keywords include “zip code”, “address”, “customer name”, and the like. In either case, it can be arbitrarily changed. The important word is used as an important document determination index in memo information search and management information search described later, and the keyword is used as an important document determination index in data search described later.

次に帳票が重要文書であるか否かを判定する重要文書判定処理について説明する。サーバ装置10は、保管されている帳票を調査するスレッドを定期的に起動して、該帳票が重要文書であるか否かを判定する。   Next, an important document determination process for determining whether or not a form is an important document will be described. The server device 10 periodically activates a thread for investigating stored forms, and determines whether or not the form is an important document.

この場合、重要文書を判定する際の検索処理には、メモ情報検索、管理情報検索およびデータ検索があり、これらの検索を段階的に実行することで、保管している帳票が重要文書であるか否かを判定する。   In this case, the retrieval processing for determining an important document includes a memo information search, a management information search, and a data search. By executing these searches step by step, the stored form is an important document. It is determined whether or not.

メモ情報検索とは、帳票に付属するメモ情報にもとづいて、重要文書判定を行うものである。また、管理情報検索とは、帳票を管理する際の管理情報にもとづいて、重要文書判定を行うものである。さらに、データ検索とは、帳票に実際に記載されているデータにもとづいて、重要文書判定を行うものである。   The memo information search is an important document determination based on memo information attached to a form. Also, the management information search is an important document determination based on management information when managing a form. Further, the data search is an important document determination based on data actually described in a form.

図10は重要文書判定処理の全体動作を示すフローチャートである。
〔S1〕制御手段11は、保管されている帳票に対して、重要文書判定をすでに実施したか否かを判断する。実施済みならば終了し、未実施ならばステップS2へ行く。
FIG. 10 is a flowchart showing the overall operation of the important document determination process.
[S1] The control means 11 determines whether or not important document determination has already been performed on the stored form. If it has been performed, the process ends.

〔S2〕制御手段11は、帳票に対してメモ情報検索を行う。
〔S3〕制御手段11は、帳票に付属するメモ情報から重要ワードを検出した場合はステップS10へ行き、重要ワードを検出しない場合はステップS4へ行く。
[S2] The control means 11 performs a memo information search for the form.
[S3] The control means 11 goes to step S10 if an important word is detected from the memo information attached to the form, and goes to step S4 if no important word is detected.

〔S4〕制御手段11は、帳票に対して管理情報検索を行う。
〔S5〕制御手段11は、帳票の管理情報から重要ワードを検出した場合はステップS10へ行き、重要ワードを検出しない場合はステップS6へ行く。
[S4] The control means 11 performs management information search on the form.
[S5] The control means 11 goes to step S10 if an important word is detected from the management information of the form, and goes to step S6 if no important word is detected.

〔S6〕制御手段11は、帳票に対してデータ検索を行う。
〔S7〕制御手段11は、帳票に記載されるデータの中に、蓄積手段1bに蓄積されているキーワードまたは所定文字列が有るか否かを判定する。キーワードまたは所定文字列の少なくとも一方が有ると判断した場合はステップS10へ行き、キーワードおよび所定文字列のどちらも無いと判断した場合はステップS8へ行く。
[S6] The control means 11 performs a data search on the form.
[S7] The control means 11 determines whether or not there is a keyword or a predetermined character string stored in the storage means 1b in the data described in the form. If it is determined that at least one of the keyword and the predetermined character string is present, the process proceeds to step S10, and if it is determined that neither the keyword nor the predetermined character string is present, the process proceeds to step S8.

〔S8〕制御手段11は、当該帳票を非重要文書と判定する。
〔S9〕制御手段11は、非重要文書のバージョン情報を管理情報DB13cに書き込む。管理情報DB13cに書き込まれたバージョン情報は、蓄積バージョン情報として管理される。
[S8] The control means 11 determines that the form is a non-important document.
[S9] The control means 11 writes the version information of the non-important document in the management information DB 13c. The version information written in the management information DB 13c is managed as accumulated version information.

〔S10〕制御手段11は、当該帳票を重要文書と判定する。
〔S11〕制御手段11は、重要文書からキーワードおよび所定文字列を抽出し、蓄積バージョン情報を付して蓄積手段1bに蓄積する。
[S10] The control means 11 determines that the form is an important document.
[S11] The control unit 11 extracts a keyword and a predetermined character string from the important document, adds the stored version information, and stores the extracted information in the storage unit 1b.

〔S12〕制御手段11は、重要文書のバージョン情報を管理情報DB13cに書き込む。管理情報DB13cに書き込まれたバージョン情報は、蓄積バージョン情報として管理される。   [S12] The control means 11 writes the version information of the important document in the management information DB 13c. The version information written in the management information DB 13c is managed as accumulated version information.

上記の重要文書判定処理フローは、保管されている帳票に対して定期的に実行される。また、帳票が印刷などによって出力される場合、出力指示が出された帳票に対しても出力時に上記の重要文書判定処理フローが実行される。   The above important document determination processing flow is periodically executed for a stored form. When a form is output by printing or the like, the above-described important document determination processing flow is executed at the time of output even for a form for which an output instruction has been issued.

なお、メモ情報検索、管理情報検索、データ検索の順で検索処理の負荷が重くなるので、上記のように、最も負荷の軽いメモ情報検索を最初に行い、2番目に管理情報検索を行い、最も負荷の重いデータ検索の順に検索処理を行っている。このように、負荷が軽い処理から順番に検索処理を行うことで、早い段階で重要文書であるか否かを判定することができ、高速検索が可能になる。   Since the load of search processing increases in the order of memo information search, management information search, and data search, as described above, the memo information search with the lightest load is performed first, the management information search is performed second, Search processing is performed in the order of data search with the heaviest load. In this way, by performing search processing in order from processing with a light load, it is possible to determine whether or not the document is an important document at an early stage, and high-speed search becomes possible.

次にメモ情報検索について説明する。最初に、メモ情報が付与された帳票について示す。図11はスタンプが付与された帳票の例を示す図である。「重要」のスタンプが付与されている帳票の一部を示している。   Next, the memo information search will be described. First, a form to which memo information is assigned will be described. FIG. 11 shows an example of a form to which a stamp is attached. A part of the form to which the “important” stamp is attached is shown.

図6で上述したように、メモ情報のメモファイルは、メモ種別という属性を有している。メモ種別の項目に「スタンプ」というメモ種別情報が記載されていれば、テキスト情報には、「重要」や「秘」などのスタンプが表すワードが記載されている。   As described above with reference to FIG. 6, the memo file of memo information has an attribute called memo type. If memo type information “stamp” is described in the memo type item, the text information includes words represented by stamps such as “important” and “secret”.

したがって、例えば、メモ種別の項目に「スタンプ」と記載され、テキスト情報の項目に「重要」と記載されていれば、図11に示すように、帳票には「重要」のスタンプが付与されるものとなる。   Therefore, for example, if “stamp” is described in the item of memo type and “important” is described in the item of text information, the “important” stamp is given to the form as shown in FIG. It will be a thing.

図12はメモ情報検索の動作を示すフローチャートである。重要文書判定処理では、最初に、帳票に付与されているメモ情報の中に、重要ワードが存在しているか否かの検索処理を実施する。   FIG. 12 is a flowchart showing the memo information search operation. In the important document determination process, first, a search process is performed to determine whether or not an important word exists in the memo information assigned to the form.

〔S21〕制御手段11は、帳票に付与されているメモ情報のメモファイルからメモ種別に記載されているメモ種別情報を取得する。
〔S22〕制御手段11は、メモ種別情報が「スタンプ」であるか否かを判定する。「スタンプ」であればステップS23へ行き、「スタンプ」でなければステップS26へ行く。
[S21] The control unit 11 acquires the memo type information described in the memo type from the memo file of the memo information given to the form.
[S22] The control means 11 determines whether or not the memo type information is “stamp”. If it is “stamp”, it goes to step S23, and if it is not “stamp”, it goes to step S26.

〔S23〕制御手段11は、メモ種別情報が「スタンプ」であるとき、メモファイルのテキスト情報から文字列を取得する。
〔S24〕制御手段11は、取得した文字列が、重要ワードであるか否かを判定する。取得した文字列が、「重要」または「秘」などの重要ワードの場合は、ステップS25へ行き、重要ワードでない場合は、ステップS26へ行く。
[S23] When the memo type information is “stamp”, the control means 11 acquires a character string from the text information of the memo file.
[S24] The control means 11 determines whether or not the acquired character string is an important word. If the acquired character string is an important word such as “important” or “secret”, the process goes to step S25, and if not, the process goes to step S26.

〔S25〕制御手段11は、当該帳票を重要文書と判定する。
〔S26〕制御手段11は、当該帳票のメモ情報には重要ワードが含まれていないと判断して次の処理の管理情報検索へ移行する。
[S25] The control means 11 determines that the form is an important document.
[S26] The control means 11 determines that the important word is not included in the memo information of the form, and proceeds to the management information search of the next process.

このように、メモ情報検索では、メモ情報の文字列にもとづいて、重要文書判定処理を行う。帳票には、図11に示したようなメモ情報が表示されている場合が多々あり、メモ情報の情報量は、帳票データの情報量と比較して少ない。このため、メモ情報検索から重要文書判定処理を開始することで、簡易にかつ高速に重要文書であるか否かの判定を実行することが可能になる。   Thus, in the memo information search, the important document determination process is performed based on the character string of the memo information. In many cases, memo information as shown in FIG. 11 is displayed on the form, and the information amount of the memo information is smaller than the information amount of the form data. For this reason, by starting the important document determination process from the memo information search, it is possible to easily and quickly determine whether or not the document is an important document.

次に管理情報検索について説明する。図13は管理情報検索の動作を示すフローチャートである。メモ情報検索を行った結果、重要文書判定対象の帳票のメモ情報に、重要ワードが含まれていない場合は、管理情報の中に重要ワードが含まれているか否かの検索処理が実施される。   Next, management information retrieval will be described. FIG. 13 is a flowchart showing the management information search operation. As a result of the memo information search, if the important word is not included in the memo information of the important document determination target form, a search process is performed to determine whether or not the important word is included in the management information. .

〔S31〕制御手段11は、重要文書判定対象の帳票の管理情報の例えば、帳票名、コメント、備考に記載されている文字列を取得する。
〔S32〕制御手段11は、取得した文字列が、重要ワードであるか否かを判定する。取得した文字列が、「重要」、「秘」などの重要ワードの場合は、ステップS33へ行き、重要ワードでない場合は、ステップS34へ行く。
[S31] The control unit 11 obtains, for example, a document name, a comment, and a character string described in the remarks of the management information of the important document determination target form.
[S32] The control means 11 determines whether or not the acquired character string is an important word. If the acquired character string is an important word such as “important” or “secret”, the process goes to step S33, and if not, the process goes to step S34.

〔S33〕制御手段11は、当該帳票を重要文書と判定する。
〔S34〕制御手段11は、当該帳票の管理情報には重要ワードが含まれていないと判断して次の処理のデータ検索へ移行する。
[S33] The control means 11 determines that the form is an important document.
[S34] The control means 11 determines that the management information of the form does not contain an important word, and proceeds to data search for the next process.

このように、管理情報検索では、管理情報の文字列にもとづいて、重要文書判定処理を行う。管理情報としては帳票名、コメント、備考等があり、これら管理情報の情報量は、帳票データの情報量と比較して少ない。このため、メモ情報に重要ワードが存在しなかった場合には、管理情報検索を行うことで、簡易にかつ高速に重要文書であるか否かの判定を実行することが可能になる。   Thus, in the management information search, the important document determination process is performed based on the character string of the management information. The management information includes form names, comments, remarks, and the like. The amount of management information is small compared to the amount of form data. For this reason, when the important word does not exist in the memo information, it is possible to easily and quickly determine whether the document is an important document by performing management information search.

次にデータ検索について説明する。図14はデータ検索の動作を示すフローチャートである。メモ情報検索と管理情報検索を行った結果、判定対象の帳票のメモ情報と管理情報に、重要ワードが含まれていない場合には、帳票のデータの中に、蓄積してあるキーワードまたは所定文字列が含まれている否かのデータ検索が実施される。   Next, data search will be described. FIG. 14 is a flowchart showing the data search operation. As a result of the memo information search and management information search, if the memo information and management information of the judgment target form does not contain an important word, the stored keyword or specified character in the form data A data search is performed to determine whether a column is included.

〔S41〕制御手段11は、重要文書判定対象の帳票のデータを取得する。
〔S42〕制御手段11は、取得した帳票データに、蓄積手段1bに蓄積されているキーワードが存在するか否かを判定する。キーワードが存在する場合はステップS44へ行き、存在しない場合ステップS43へ行く。
[S41] The control unit 11 acquires the data of the document that is the target of the important document determination.
[S42] The control means 11 determines whether or not the keyword stored in the storage means 1b exists in the acquired form data. If there is a keyword, go to step S44, otherwise go to step S43.

〔S43〕制御手段11は、取得した帳票データに、蓄積手段1bに蓄積されている所定文字列が存在するか否かを判定する。所定文字列が存在する場合はステップS44へ行き、存在しない場合ステップS45へ行く。   [S43] The control means 11 determines whether or not a predetermined character string stored in the storage means 1b exists in the acquired form data. If the predetermined character string exists, the process goes to step S44, and if not, the process goes to step S45.

〔S44〕制御手段11は、当該帳票を重要文書と判定する。
〔S45〕制御手段11は、当該帳票を非重要文書と判定する。
このように、データ検索では、帳票に実際に記載されている文字列にもとづいて、重要文書判定処理を行う。この場合、管理者によって設定されたキーワードだけでなく、キーワードに関連づけられた所定文字列を文書から自動的に抽出してあらかじめ蓄積しておき、この所定文字列からも検索を行っている。これにより、従来、見落とされる可能性があった文字列も精度良く検出されるので、重要文書の判定精度を向上させることが可能になる。
[S44] The control means 11 determines that the form is an important document.
[S45] The control means 11 determines that the form is a non-important document.
As described above, in the data search, the important document determination process is performed based on the character string actually described in the form. In this case, not only the keyword set by the administrator but also a predetermined character string associated with the keyword is automatically extracted from the document and stored in advance, and the search is performed from this predetermined character string. As a result, since character strings that could have been overlooked in the past are also detected with high accuracy, it is possible to improve the determination accuracy of important documents.

なお、本技術では、帳票にキーワードや所定文字列が記載されている場合、それらキーワードや所定文字列の帳票内での出現位置については問わない。帳票内のどの場所であっても、キーワードまたは所定文字列の少なくとも一方が記載されていれば、当該帳票を重要文書と判定するものである。   In the present technology, when a keyword or a predetermined character string is described in the form, the appearance position of the keyword or the predetermined character string in the form does not matter. If at least one of a keyword or a predetermined character string is described at any location in the form, the form is determined as an important document.

次に帳票に対して重要文書判定処理(図10のステップS2以降の処理)をすでに実施したか否かを判断するための重要文書判定済み調査について説明する。
図15は重要文書判定済み調査の動作を示すフローチャートである。
Next, the important document determined investigation for determining whether or not the important document determination process (the process after step S2 in FIG. 10) has already been performed on the form will be described.
FIG. 15 is a flowchart showing the operation of the important document determined investigation.

〔S51〕制御手段11は、重要文書判定処理対象の帳票に付されているバージョン情報を取得する。
〔S52〕制御手段11は、管理情報DB13cから蓄積バージョン情報を取得する。なお、管理情報DB13c内において、蓄積バージョン情報はあらかじめソートされている。
[S51] The control unit 11 obtains version information attached to the document to be processed for important document determination processing.
[S52] The control means 11 acquires the accumulated version information from the management information DB 13c. Note that the stored version information is sorted in advance in the management information DB 13c.

〔S53〕制御手段11は、バージョン情報と、蓄積バージョン情報との新旧を比較する。バージョン情報が蓄積バージョン情報よりも新しい場合はステップS54へ行き、バージョン情報が蓄積バージョン情報よりも旧い場合はステップS55へ行く。   [S53] The control unit 11 compares the version information with the new version of the stored version information. If the version information is newer than the stored version information, go to step S54, and if the version information is older than the stored version information, go to step S55.

〔S54〕制御手段11は、バージョン情報が付されている当該帳票は、重要文書判定処理が未実施であるとして、重要文書判定処理を実行する。
〔S55〕制御手段11は、バージョン情報が付されている当該帳票は、過去に重要文書判定処理を実施済みとして重要文書判定処理を実行しない。
[S54] The control unit 11 performs the important document determination process on the form to which the version information is attached, assuming that the important document determination process is not performed.
[S55] The control unit 11 does not execute the important document determination process for the form to which the version information is attached, assuming that the important document determination process has been performed in the past.

このように、重要文書判定済み調査では、重要文書判定処理対象の帳票のバージョン情報と、すでに管理情報DB13cで管理されている蓄積バージョン情報とを比較する。そして、バージョン情報が蓄積バージョン情報よりも新しい場合は、当該帳票は、重要文書判定処理は未実施であると認識して、重要文書判定処理を実施することとした。   As described above, in the important document determination completed survey, the version information of the document that is the target of the important document determination process is compared with the accumulated version information that is already managed in the management information DB 13c. If the version information is newer than the stored version information, the form recognizes that the important document determination process has not been performed, and performs the important document determination process.

これにより、重要文書判定処理を行う際、蓄積バージョン情報を利用して、重要文書判定処理が実施済みなのか否かを認識することができるので、重要文書判定処理がすでに実施済みの帳票に対しては、重要文書判定の前処理段階で、効率よく除外することが可能になる。   As a result, when performing the important document determination process, it is possible to recognize whether the important document determination process has been performed using the accumulated version information. Therefore, it is possible to efficiently exclude the document at the preprocessing stage of the important document determination.

次に帳票内にキーワードまたは所定文字列が存在するか否かの判定処理を行う際に、差分判定項目を見つけ出し、差分判定項目を用いて判定処理を行う場合について説明する。
図16、図17は差分判定項目を用いて判定処理を行う場合の動作を説明するための図である。図16において、蓄積手段1bに格納される蓄積情報d2−1は、キーワード、所定文字列および蓄積バージョン情報を有している。なお、蓄積手段1b内において、蓄積バージョン情報はあらかじめソートされている。
Next, a description will be given of a case where a difference determination item is found and a determination process is performed using the difference determination item when determining whether or not a keyword or a predetermined character string exists in the form.
FIGS. 16 and 17 are diagrams for explaining the operation in the case where the determination process is performed using the difference determination item. In FIG. 16, the storage information d2-1 stored in the storage means 1b has a keyword, a predetermined character string, and storage version information. In the storage unit 1b, the stored version information is sorted in advance.

蓄積情報d2−1は具体的に、(キーワード、所定文字列、蓄積バージョン情報)=(郵便番号、000-0000、20120101135121)、(住所、東京都XXX、20120101135121)、(顧客名、日本、20111213091121)となっている。   The accumulated information d2-1 is specifically (keyword, predetermined character string, accumulated version information) = (zip code, 000-0000, 20120101135121), (address, Tokyo XXX, 20120101135121), (customer name, Japan, 20111213091121 ).

このとき、重要文書判定処理対象の帳票3に付されているバージョン情報が20110101135121であったとすると、蓄積情報d2−1に示される蓄積バージョン情報20120101135121、20111213091121は、帳票3に付されているバージョン情報20110101135121よりも新しい。   At this time, if the version information attached to the document 3 subject to the important document determination process is 20110101135121, the accumulated version information 20120101135121 and 20111213091121 indicated in the accumulated information d2-1 are the version information attached to the form 3. Newer than 20110101135121.

したがって、この場合は、蓄積情報d2−1に記されるキーワードおよび所定文字列のすべてが帳票3に含まれるか否かの判定処理が行われることになる(図16の場合には差分はない)。   Therefore, in this case, a determination process is performed as to whether or not all of the keyword and the predetermined character string described in the accumulated information d2-1 are included in the form 3 (there is no difference in the case of FIG. 16). ).

図17において、重要文書判定処理対象の帳票3aに付されているバージョン情報が20111213091121であったとする。このとき、蓄積情報d2−1に示される蓄積バージョン情報20120101135121は、帳票3aに付されているバージョン情報20110101135121よりも新しい。また、蓄積情報d2−1に示される蓄積バージョン情報20111213091121は、帳票3aに付されているバージョン情報と等しい。   In FIG. 17, it is assumed that the version information attached to the document 3a to be processed for important document determination is 20111213091121. At this time, the stored version information 20120101135121 shown in the stored information d2-1 is newer than the version information 20110101135121 attached to the form 3a. The stored version information 20111213091121 shown in the stored information d2-1 is equal to the version information attached to the form 3a.

したがって、この場合は、蓄積情報d2−1に記されるキーワードおよび所定文字列として、“郵便番号”、“000−0000”、“住所”および“東京都XXX”が差分判定項目となり、この差分判定項目が帳票3aに含まれるか否かの判定処理が行われることになる。   Therefore, in this case, “zip code”, “000-0000”, “address”, and “Tokyo XXX” are the difference determination items as keywords and predetermined character strings described in the accumulated information d2-1. A process for determining whether or not the determination item is included in the form 3a is performed.

このように、帳票に付されているバージョン情報と、キーワードまたは所定文字列に付された蓄積バージョン情報とを比較し、バージョン情報よりも新しい蓄積バージョン情報が付されているキーワードまたは所定文字列を蓄積情報内から差分判定項目として抽出する。そして、差分判定項目が帳票内に存在するか否かの判定を行う。   In this way, the version information attached to the form is compared with the accumulated version information attached to the keyword or the predetermined character string, and the keyword or predetermined character string attached with the accumulated version information newer than the version information is obtained. Extracted from the accumulated information as a difference judgment item. Then, it is determined whether or not the difference determination item exists in the form.

これにより、帳票に付されているバージョン情報と等しい、または旧い蓄積バージョン情報が付されているキーワードまたは所定文字列の判定処理は省くことができ、新しいバージョンのキーワードまたは所定文字列の判定処理が実行できるので、高速処理が可能になる。   As a result, it is possible to omit the determination process of the keyword or the predetermined character string that is the same as the version information attached to the form or the old accumulated version information is added, and the determination process of the new version keyword or the predetermined character string is omitted. Since it can be executed, high-speed processing becomes possible.

次に所定文字列の抽出処理について説明する。図18は所定文字列抽出処理の動作を説明するための図である。制御手段11は、キーワードおよびキーワードに関連づけられた所定文字列を抽出し蓄積する。   Next, a predetermined character string extraction process will be described. FIG. 18 is a diagram for explaining the operation of the predetermined character string extraction process. The control means 11 extracts and accumulates a keyword and a predetermined character string associated with the keyword.

この場合、制御手段11は、帳票の出力データから「〜様・郵便番号(〒)・住所」等のキーワードを抽出し、抽出した情報の座標から顧客の名前や住所情報を採取して、これらの情報を蓄積する。また、蓄積時には蓄積バージョン情報を設定して更新する。   In this case, the control means 11 extracts a keyword such as “~ / postal code (〒) / address” from the output data of the form, collects the name and address information of the customer from the coordinates of the extracted information, and extracts these keywords. Accumulate information. At the time of accumulation, accumulation version information is set and updated.

図18の場合、制御手段11は、まず、キーワード検索により、情報D1(郵便番号(〒)・住所)を抽出する。そして、制御手段11は、情報D1の座標情報(座標情報P1とする)を取得し、座標情報P1と枠組みから、情報D2の座標情報(座標情報P2とする)を取得する。その後、制御手段11は、座標情報P2から郵便番号や住所、顧客名の所定文字列を取得し、取得した所定文字列を蓄積し、重要文書判定処理にて使用する。   In the case of FIG. 18, the control means 11 first extracts information D1 (postal code (〒) / address) by keyword search. And the control means 11 acquires the coordinate information (referred to as coordinate information P1) of the information D1, and acquires the coordinate information (referred to as coordinate information P2) of the information D2 from the coordinate information P1 and the framework. Thereafter, the control unit 11 acquires a predetermined character string of a zip code, an address, and a customer name from the coordinate information P2, accumulates the acquired predetermined character string, and uses it in the important document determination process.

図19は所定文字列抽出処理の動作を示すフローチャートである。
〔S61〕制御手段11は、帳票に記載されるキーワードを抽出する。例えば、「郵便番号の記号(〒)」、「住所」、「〜様」といったキーワードを帳票から抽出する。
FIG. 19 is a flowchart showing the operation of the predetermined character string extraction process.
[S61] The control means 11 extracts keywords described in the form. For example, keywords such as “postal code symbol (〒)”, “address”, and “˜” are extracted from the form.

〔S62〕制御手段11は、抽出したキーワードの座標情報(第1の座標情報)を取得する。
〔S63〕制御手段11は、抽出したキーワードの横隣のデータ構造が、データか枠組みかを判別する。データの場合はステップS64へ行き、枠組みの場合はステップS65へ行く。
[S62] The control means 11 acquires coordinate information (first coordinate information) of the extracted keyword.
[S63] The control means 11 determines whether the data structure next to the extracted keyword is data or a framework. If it is data, go to step S64, and if it is a framework, go to step S65.

〔S64〕制御手段11は、抽出したキーワードの座標情報と、データを含む枠領域の座標情報(第2の座標情報)とにもとづき、当該枠領域に記載されているデータ(所定文字列)の座標情報(第3の座標情報)を取得する。   [S64] Based on the coordinate information of the extracted keyword and the coordinate information (second coordinate information) of the frame area including the data, the control means 11 performs the data (predetermined character string) of the data described in the frame area. The coordinate information (third coordinate information) is acquired.

〔S65〕制御手段11は、抽出したキーワードの縦隣のデータ構造が、データか枠組みかを判別する。データの場合はステップS66へ行き、枠組みの場合は終了する。
〔S66〕制御手段11は、抽出したキーワードの座標情報(第1の座標情報)と、データを含む枠領域の座標情報(第2の座標情報)とにもとづき、当該枠領域に記載されているデータ(所定文字列)の座標情報(第3の座標情報)を取得する。
[S65] The control unit 11 determines whether the vertically adjacent data structure of the extracted keyword is data or a framework. If it is data, the process goes to step S66, and if it is a framework, the process ends.
[S66] Based on the coordinate information (first coordinate information) of the extracted keyword and the coordinate information (second coordinate information) of the frame area including the data, the control means 11 is described in the frame area. The coordinate information (third coordinate information) of the data (predetermined character string) is acquired.

〔S67〕制御手段11は、座標情報(第3の座標情報)から所定文字列を抽出して、蓄積手段1b内のキーワード集合に対して蓄積する。
〔S68〕制御手段11は、当該帳票に対して、重要文書である旨を示すフラグを設定する。このような処理によって所定文字列が抽出されることにより、キーワードに関連づいた所定文字列を精度よく抽出することが可能になる。
[S67] The control means 11 extracts a predetermined character string from the coordinate information (third coordinate information) and stores it in the keyword set in the storage means 1b.
[S68] The control means 11 sets a flag indicating that the document is an important document for the form. By extracting the predetermined character string by such processing, it becomes possible to accurately extract the predetermined character string related to the keyword.

次に帳票の出力処理について説明する。なお、出力処理としては印刷する場合を例にして説明する。図20は帳票の出力処理の動作を示すフローチャートである。
〔S71〕制御手段11は、クライアント端末から印刷依頼を受信する。
Next, a form output process will be described. The output process will be described by taking the case of printing as an example. FIG. 20 is a flowchart showing the operation of the form output process.
[S71] The control means 11 receives a print request from the client terminal.

〔S72〕制御手段11は、重要文書判定処理が実施済みか否かを判断する。実施済みならばステップS74へ行き、未実施ならばステップS73へ行く。
〔S73〕制御手段11は、重要文書判定処理を実施する。
[S72] The control unit 11 determines whether the important document determination process has been performed. If it has been implemented, go to step S74, and if not, go to step S73.
[S73] The control means 11 performs an important document determination process.

〔S74〕制御手段11は、印刷依頼を受けた帳票に重要フラグが設定されているか否かを判断する。重要フラグが設定されている場合はステップS75へ行き、未設定の場合はステップS77へ行く。   [S74] The control means 11 determines whether or not an important flag is set in the form for which the print request has been received. If the important flag is set, go to step S75, and if not set, go to step S77.

〔S75〕制御手段11は、警告アラームを発出する。
〔S76〕制御手段11は、警告アラームを発した後、印刷許可を受けた場合はステップS77へ行き、印刷許可を受けない場合はステップS78へ行く。
[S75] The control means 11 issues a warning alarm.
[S76] After issuing a warning alarm, the control means 11 goes to step S77 if printing permission is received, and goes to step S78 if printing permission is not received.

〔S77〕制御手段11は、帳票出力指示を文書出力処理手段12に与える。文書出力処理手段12は、印刷依頼を受けた帳票の印刷指示をプリンタに送信して印刷を実行する。   [S 77] The control means 11 gives a form output instruction to the document output processing means 12. The document output processing means 12 transmits a print instruction for the form for which the print request has been received to the printer and executes printing.

〔S78〕制御手段11は、帳票出力指示を出さず、印刷を実行せずに処理を終了する。
次に従来生じていた問題ケースと、問題ケースに本技術を適用して解決した場合の効果について説明する。
[S78] The control means 11 does not issue a form output instruction and terminates the process without executing printing.
Next, a problem case that has occurred in the past and effects when the present technology is applied to solve the problem case will be described.

(問題ケース1)重要の捺印がある印刷禁止の帳票が多数存在するが、管理者のミスでいくつかの帳票に印刷禁止のアクセス権が設定されないなどの理由により、印刷禁止の帳票と気付かず印刷してしまう。   (Problem Case 1) There are many print-prohibited forms with important seals, but the administrator is not aware of the print-prohibited forms because the print-prohibited access right is not set for some forms due to an administrator's mistake. It will print.

(効果)本技術では、印刷時に重要文書かどうか判別して警告アラームを出力するので、重要文書の軽率な印刷を防止することが可能になる。
(問題ケース2)重要な文字列と判別しにくい機密情報(顧客名等)が含まれた帳票が存在する場合、管理者が設定する重要文字列では、重要文書と判断できないおそれがあり、重要な帳票を軽率に印刷してしまう。
(Effect) In the present technology, since it is determined whether the document is an important document at the time of printing and a warning alarm is output, it is possible to prevent the important document from being printed at a low rate.
(Problem Case 2) If there is a form containing confidential information (customer name, etc.) that is difficult to distinguish from an important character string, the important character string set by the administrator may not be determined as an important document. Prints out a lot of forms.

(効果)本技術では、重要文書と判定する際の所定文字列を更新・蓄積していくことで、重要文字列と判別しにくい機密情報も判別することが可能になるので、軽率な印刷を防止することが可能になる。   (Effect) With this technology, it is possible to discriminate confidential information that is difficult to distinguish from important character strings by updating and accumulating predetermined character strings when determining important documents. It becomes possible to prevent.

(問題ケース3)大量の帳票を一度に印刷を行う場合、迅速な印刷処理が必要であるが、印刷時に帳票内のデータ検索等を行うと、印刷処理に多くの時間がかかる。
(効果)本技術では、帳票が保管されている間(印刷前)に、重要文書の判定処理を実施し、さらに重要文書判定処理を行う場合もメモ情報検索、管理情報検索、データ検索という処理負荷の軽い順に実行する。これにより、印刷開始時の判定処理の時間を軽減することが可能になる。さらに、バージョン情報を利用して差分事項に対して、重要文書の判定処理を実施するので、判別処理の時間を短縮することが可能になる。
(Problem Case 3) When a large amount of forms are printed at once, a quick print process is required. However, if data search or the like in a form is performed at the time of printing, the print process takes a lot of time.
(Effects) With this technology, important document determination processing is performed while a form is stored (before printing), and even when important document determination processing is performed, processing such as memo information search, management information search, and data search Execute in ascending order of load. As a result, it is possible to reduce the time for determination processing at the start of printing. Furthermore, since the important document determination process is performed on the difference items using the version information, the time required for the determination process can be shortened.

次に本技術の制御をコンピュータによって実現する場合について説明する。上記に示した処理機能は、コンピュータによって実現可能である。図21は本実施の形態に用いるコンピュータのハードウェアの一構成例を示す図である。サーバ装置10内のコンピュータ100は、CPU101によって装置全体が制御されている。CPU101には、バス108を介してRAM(Random Access Memory)102と複数の周辺機器が接続されている。   Next, a case where the control of the present technology is realized by a computer will be described. The processing functions shown above can be realized by a computer. FIG. 21 is a diagram illustrating a configuration example of computer hardware used in this embodiment. The computer 100 in the server device 10 is controlled by the CPU 101 as a whole. A RAM (Random Access Memory) 102 and a plurality of peripheral devices are connected to the CPU 101 via a bus 108.

RAM102は、コンピュータ100の主記憶装置として使用される。RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。   The RAM 102 is used as a main storage device of the computer 100. The RAM 102 temporarily stores at least part of an OS (Operating System) program and application programs to be executed by the CPU 101. The RAM 102 stores various data necessary for processing by the CPU 101.

バス108に接続されている周辺機器としては、HDD(Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、光学ドライブ装置106、および通信インタフェース107がある。   Peripheral devices connected to the bus 108 include an HDD (Hard Disk Drive) 103, a graphic processing device 104, an input interface 105, an optical drive device 106, and a communication interface 107.

HDD103は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103は、コンピュータ100の二次記憶装置として使用される。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、二次記憶装置としては、フラッシュメモリなどの半導体記憶装置を使用することもできる。   The HDD 103 magnetically writes and reads data to and from the built-in disk. The HDD 103 is used as a secondary storage device of the computer 100. The HDD 103 stores an OS program, application programs, and various data. Note that a semiconductor storage device such as a flash memory can also be used as the secondary storage device.

グラフィック処理装置104には、モニタ104aが接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ104aの画面に表示させる。モニタ104aとしては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置などがある。   A monitor 104 a is connected to the graphic processing device 104. The graphic processing device 104 displays an image on the screen of the monitor 104a in accordance with a command from the CPU 101. Examples of the monitor 104a include a display device using a CRT (Cathode Ray Tube) and a liquid crystal display device.

入力インタフェース105には、キーボード105aとマウス105bとが接続されている。入力インタフェース105は、キーボード105aやマウス105bから送られてくる信号をCPU101に送信する。なお、マウス105bは、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。   A keyboard 105 a and a mouse 105 b are connected to the input interface 105. The input interface 105 transmits signals sent from the keyboard 105a and the mouse 105b to the CPU 101. Note that the mouse 105b is an example of a pointing device, and other pointing devices can also be used. Examples of other pointing devices include a touch panel, a tablet, a touch pad, and a trackball.

光学ドライブ装置106は、レーザ光などを利用して、光ディスク106aに記録されたデータの読み取りを行う。光ディスク106aは、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク106aには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(Rewritable)などがある。   The optical drive device 106 reads data recorded on the optical disc 106a using laser light or the like. The optical disk 106a is a portable recording medium on which data is recorded so that it can be read by reflection of light. Examples of the optical disc 106a include a DVD (Digital Versatile Disc), a DVD-RAM, a CD-ROM (Compact Disc Read Only Memory), and a CD-R (Recordable) / RW (Rewritable).

通信インタフェース107は、ネットワーク110に接続されている。通信インタフェース107は、ネットワーク110を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。   The communication interface 107 is connected to the network 110. The communication interface 107 transmits and receives data to and from other computers or communication devices via the network 110.

以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。また、コンピュータで本実施の形態の処理機能を実現する場合、サーバ装置10が有する機能の処理内容を記述したプログラムが提供される。   With the hardware configuration as described above, the processing functions of the present embodiment can be realized. Further, when the processing functions of the present embodiment are realized by a computer, a program describing the processing contents of the functions of the server device 10 is provided.

そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD、DVD−RAM、CD−ROM/RWなどがある。光磁気記録媒体には、MO(Magneto Optical disk)などがある。なおプログラムを記録する記録媒体には、一時的な伝搬信号自体は含まれない。   By executing the program on a computer, the above processing functions are realized on the computer. The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of the computer-readable recording medium include a magnetic storage device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Examples of the magnetic storage device include a hard disk device (HDD), a flexible disk (FD), and a magnetic tape. Optical discs include DVD, DVD-RAM, CD-ROM / RW, and the like. Magneto-optical recording media include MO (Magneto Optical disk). The recording medium for recording the program does not include a temporary propagation signal itself.

プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。   When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.

プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。   The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. Further, each time the program is transferred from the server computer, the computer can sequentially execute processing according to the received program.

また、上記の処理機能の少なくとも一部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)などの電子回路で実現することもできる。   In addition, at least a part of the above processing functions can be realized by an electronic circuit such as a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), or a PLD (Programmable Logic Device).

以上説明したように、本技術では、文書からキーワードを検索し、キーワードに関連づけられた所定文字列を抽出し、抽出された所定文字列をキーワードに追加し、キーワードまたは所定文字列の少なくとも一方を含む文書を重要文書と判定する。これにより、重要文書の判定精度の向上を図ることができ、重要文書の流出を防止することが可能になる。また、重要文書判定処理を高速に行うことが可能になる。   As described above, in the present technology, a keyword is searched from a document, a predetermined character string associated with the keyword is extracted, the extracted predetermined character string is added to the keyword, and at least one of the keyword or the predetermined character string is extracted. The included document is determined as an important document. Thereby, it is possible to improve the determination accuracy of the important document, and it is possible to prevent the important document from being leaked. In addition, the important document determination process can be performed at high speed.

以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。   As mentioned above, although embodiment was illustrated, the structure of each part shown by embodiment can be substituted by the other thing which has the same function. Moreover, other arbitrary structures and processes may be added.

1 文書管理装置
1a 検索手段
1b 蓄積手段
1c 判定手段
A、B 文書
DESCRIPTION OF SYMBOLS 1 Document management apparatus 1a Retrieval means 1b Accumulation means 1c Determination means A, B Document

Claims (9)

文書が重要か否かの判定に用いるキーワードの集合に含まれるキーワードを文書から検索し、キーワードに関連づけられた所定文字列を抽出する検索手段と、
抽出された所定文字列を前記集合に追加して蓄積する蓄積手段と、
文書が重要であるか否かの重要文書判定処理を行う判定手段と、
を備え、
前記判定手段は、
文書に付属するメモ情報の中に、前記重要文書とみなす重要ワードが含まれるか否かの判定を行うメモ情報検索を行い、
前記メモ情報から前記重要ワードが検出されない場合は、文書の管理情報の中に、前記重要ワードが含まれるか否かの判定を行う管理情報検索を行い、
前記管理情報から前記重要ワードが検出されない場合は、文書のデータ内にキーワードまたは所定文字列の少なくとも一方が含まれるか否かを判定する、
とを特徴とする文書管理装置。
A search means for searching a keyword for a keyword included in a set of keywords used for determining whether or not the document is important, and extracting a predetermined character string associated with the keyword;
Accumulation means for adding the extracted predetermined character string to the set and accumulating;
A determination means for performing an important document determination process of whether or not a document is important;
With
The determination means includes
A memo information search is performed to determine whether or not an important word regarded as an important document is included in the memo information attached to the document,
When the important word is not detected from the memo information, a management information search is performed to determine whether or not the important word is included in the management information of the document,
When the important word is not detected from the management information, it is determined whether or not at least one of a keyword or a predetermined character string is included in document data.
Document management device comprising a call.
前記判定手段は、重要文書判定処理を実施した文書には蓄積バージョン情報を付し、判定処理対象の文書に付されているバージョン情報と、前記蓄積バージョン情報とを比較し、前記バージョン情報が前記蓄積バージョン情報よりも新しい場合は、前記バージョン情報が付されている文書に対して、重要文書判定処理を実施することを特徴とする請求項記載の文書管理装置。 The determination means attaches accumulated version information to a document that has undergone important document determination processing, compares the version information attached to the document to be determined and the accumulated version information, and the version information newer than the storage version information, said the document version information is attached, the document management apparatus according to claim 1, wherein the performing the important document determining process. 前記蓄積手段は、キーワードまたは所定文字列に蓄積バージョン情報を付して蓄積し、
前記判定手段は、判定処理対象の文書に付されているバージョン情報と、前記蓄積バージョン情報とを比較して、前記バージョン情報よりも新しい前記蓄積バージョン情報が付されているキーワードまたは所定文字列を用いて、重要文書判定処理を実施することを特徴とする請求項記載の文書管理装置。
The storage means stores the keyword or predetermined character string with the stored version information,
The determination unit compares the version information attached to the document to be determined and the stored version information, and determines a keyword or a predetermined character string to which the stored version information is newer than the version information. used, the document management apparatus according to claim 1, wherein the performing the important document determining process.
前記検索手段は、
キーワードの第1の座標情報と、キーワードに隣接する枠領域であって所定文字列を含む前記枠領域の第2の座標情報とから、前記枠領域に含まれる所定文字列の第3の座標情報を取得し、
前記第3の座標情報にもとづき、所定文字列を抽出する、
ことを特徴とする請求項1記載の文書管理装置。
The search means includes
From the first coordinate information of the keyword and the second coordinate information of the frame region adjacent to the keyword and including the predetermined character string, the third coordinate information of the predetermined character string included in the frame region Get
A predetermined character string is extracted based on the third coordinate information;
The document management apparatus according to claim 1.
前記判定手段は、前記メモ情報が有する属性のメモ種別がスタンプである場合に、前記メモ情報が有する属性のテキスト情報から文字列を抽出し、該文字列が前記重要ワードであるか否かを判定することを特徴とする請求項記載の文書管理装置。 The determination unit extracts a character string from text information of an attribute included in the memo information when the memo type of the attribute included in the memo information is a stamp, and determines whether the character string is the important word or not. a file management apparatus according to claim 1, wherein the determining. 前記判定手段は、前記管理情報の帳票名、コメントまたは備考の少なくとも1つに記載される文字列を抽出し、該文字列が前記重要ワードであるか否かを判定することを特徴とする請求項記載の文書管理装置。 The determination unit extracts a character string described in at least one of a form name, a comment, or a remark of the management information, and determines whether or not the character string is the important word. Item 1. The document management apparatus according to Item 1 . 文書が重要か否かの判定に用いるキーワードの集合に含まれるキーワードを文書から検索し、キーワードに関連づけられた所定文字列を抽出し、
抽出された所定文字列を前記集合に追加して蓄積
文書が重要であるか否かの重要文書判定処理を行い、
文書に付属するメモ情報の中に、前記重要文書とみなす重要ワードが含まれるか否かの判定を行うメモ情報検索を行い、
前記メモ情報から前記重要ワードが検出されない場合は、文書の管理情報の中に、前記重要ワードが含まれるか否かの判定を行う管理情報検索を行い、
前記管理情報から前記重要ワードが検出されない場合は、文書のデータ内にキーワードまたは所定文字列の少なくとも一方が含まれるか否かを判定する、
ことを特徴とする文書管理方法。
Search the document for keywords included in the set of keywords used to determine whether the document is important, extract a predetermined character string associated with the keyword,
The extracted predetermined character string stored in addition to the set,
Perform important document judgment processing to determine whether the document is important,
A memo information search is performed to determine whether or not an important word regarded as an important document is included in the memo information attached to the document,
When the important word is not detected from the memo information, a management information search is performed to determine whether or not the important word is included in the management information of the document,
When the important word is not detected from the management information, it is determined whether or not at least one of a keyword or a predetermined character string is included in document data.
A document management method characterized by the above.
コンピュータに、
文書が重要か否かの判定に用いるキーワードの集合に含まれるキーワードを文書から検索し、キーワードに関連づけられた所定文字列を抽出し、
抽出された所定文字列を前記集合に追加して蓄積
文書が重要であるか否かの重要文書判定処理を行い、
文書に付属するメモ情報の中に、前記重要文書とみなす重要ワードが含まれるか否かの判定を行うメモ情報検索を行い、
前記メモ情報から前記重要ワードが検出されない場合は、文書の管理情報の中に、前記重要ワードが含まれるか否かの判定を行う管理情報検索を行い、
前記管理情報から前記重要ワードが検出されない場合は、文書のデータ内にキーワードまたは所定文字列の少なくとも一方が含まれるか否かを判定する、
処理を実行させる文書管理プログラム。
On the computer,
Search the document for keywords included in the set of keywords used to determine whether the document is important, extract a predetermined character string associated with the keyword,
The extracted predetermined character string stored in addition to the set,
Perform important document judgment processing to determine whether the document is important,
A memo information search is performed to determine whether or not an important word regarded as an important document is included in the memo information attached to the document,
When the important word is not detected from the memo information, a management information search is performed to determine whether or not the important word is included in the management information of the document,
When the important word is not detected from the management information, it is determined whether or not at least one of a keyword or a predetermined character string is included in document data.
A document management program that executes processing.
文書が重要か否かの判定に用いるキーワードの集合に含まれるキーワードを文書から検索し、キーワードに関連づけられた所定文字列を抽出する検索手段と、  A search means for searching a keyword for a keyword included in a set of keywords used for determining whether or not the document is important, and extracting a predetermined character string associated with the keyword;
抽出された所定文字列を前記集合に追加して蓄積する蓄積手段と、  Accumulation means for adding the extracted predetermined character string to the set and accumulating;
を備え、  With
前記検索手段は、  The search means includes
キーワードの第1の座標情報と、キーワードに隣接する枠領域であって所定文字列を含む前記枠領域の第2の座標情報とから、前記枠領域に含まれる所定文字列の第3の座標情報を取得し、  From the first coordinate information of the keyword and the second coordinate information of the frame region adjacent to the keyword and including the predetermined character string, the third coordinate information of the predetermined character string included in the frame region Get
前記第3の座標情報にもとづき、所定文字列を抽出する、  A predetermined character string is extracted based on the third coordinate information;
ことを特徴とする文書管理装置。  A document management apparatus characterized by that.
JP2013065379A 2013-03-27 2013-03-27 Document management apparatus, document management method, and document management program Active JP6079361B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013065379A JP6079361B2 (en) 2013-03-27 2013-03-27 Document management apparatus, document management method, and document management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013065379A JP6079361B2 (en) 2013-03-27 2013-03-27 Document management apparatus, document management method, and document management program

Publications (2)

Publication Number Publication Date
JP2014191522A JP2014191522A (en) 2014-10-06
JP6079361B2 true JP6079361B2 (en) 2017-02-15

Family

ID=51837735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013065379A Active JP6079361B2 (en) 2013-03-27 2013-03-27 Document management apparatus, document management method, and document management program

Country Status (1)

Country Link
JP (1) JP6079361B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63158663A (en) * 1986-12-23 1988-07-01 Toshiba Corp Document privacy protecting device
JP4773003B2 (en) * 2001-08-20 2011-09-14 株式会社リコー Document search apparatus, document search method, program, and computer-readable storage medium
JP3553543B2 (en) * 2001-11-30 2004-08-11 三菱スペース・ソフトウエア株式会社 Related word automatic extraction device, multiple important word extraction program, and upper and lower hierarchy relation extraction program for important words
JP4747591B2 (en) * 2005-01-31 2011-08-17 日本電気株式会社 Confidential document retrieval system, confidential document retrieval method, and confidential document retrieval program

Also Published As

Publication number Publication date
JP2014191522A (en) 2014-10-06

Similar Documents

Publication Publication Date Title
CN111753500B (en) Method for merging and displaying formatted electronic form and OFD (office file format) and generating catalog
US7614000B2 (en) File formats, methods, and computer program products for representing presentations
JP4682284B2 (en) Document difference detection device
US11042689B2 (en) Generating a document preview
JP2007133794A (en) Electronic document managing device, electronic document management program, and electronic document management system
US8719690B2 (en) Method and system for automatic data aggregation
WO2014064803A1 (en) Document processing program, document processing device, document processing system, and document processing method
JP2008310514A (en) User operation history acquisition display device, user operation history acquisition display method, user operation history acquisition display program and recording medium recording that program
JP4959501B2 (en) Information processing apparatus, information processing method, and program
JP2010092383A (en) Electronic document file search device, electronic document file search method, and computer program
JP4747828B2 (en) History management device
JP6052801B2 (en) System, method and program for associating description items between documents
JP6079361B2 (en) Document management apparatus, document management method, and document management program
JP5929356B2 (en) Information processing apparatus and information processing program
JP4828318B2 (en) Multiple form integrated printing method, system and program
US20130060778A1 (en) Device, method, and program for displaying document list
JP2016126532A (en) Calculation program, information processing apparatus, and calculation method
JP6028905B2 (en) Form management device, form management method, and form management program
JP2011043930A (en) System, server device, apparatus and method for processing business form, and program
JP2007241473A (en) Information processing apparatus and method, program, and storage medium
JP2007179130A (en) Classification management device and its program
JP2018005306A (en) Information processing apparatus and information processing program
JP6743470B2 (en) Image storage device and image storage program
JP2021100176A (en) Information processing device and information processing program
JP6192603B2 (en) Document processing apparatus and document processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160923

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170102

R150 Certificate of patent or registration of utility model

Ref document number: 6079361

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150