WO2006100739A1 - 文書管理プログラムおよび文書管理方法 - Google Patents

文書管理プログラムおよび文書管理方法 Download PDF

Info

Publication number
WO2006100739A1
WO2006100739A1 PCT/JP2005/005023 JP2005005023W WO2006100739A1 WO 2006100739 A1 WO2006100739 A1 WO 2006100739A1 JP 2005005023 W JP2005005023 W JP 2005005023W WO 2006100739 A1 WO2006100739 A1 WO 2006100739A1
Authority
WO
WIPO (PCT)
Prior art keywords
document
signature
log
file
divided
Prior art date
Application number
PCT/JP2005/005023
Other languages
English (en)
French (fr)
Inventor
Yasuo Abe
Yue Tian
Yuji Miyamoto
Takaoki Sasaki
Hideyuki Hirano
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to JP2007509093A priority Critical patent/JP4615010B2/ja
Priority to PCT/JP2005/005023 priority patent/WO2006100739A1/ja
Publication of WO2006100739A1 publication Critical patent/WO2006100739A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3247Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials involving digital signatures

Definitions

  • the present invention relates to a document management program and a document management method, and more particularly to a document management program and a document management method for managing important documents.
  • important documents In recent years, there is an increasing need to manage electronic documents (hereinafter referred to as “important documents”) in which confidential information such as confidential information and personal information is described.
  • important documents As a method of managing this important document, when an arbitrary document is taken out from the hangar where the important document is stored, a method of detecting which important document the arbitrary document refers to It has been known. Examples of this detection method include the methods described in (1) and (3) below.
  • the file name of the important document is output as a log, and by analyzing the log using the saved file name, it is possible to detect when and who has brought out the important document by any PC.
  • the log includes the date and time of saving, saving user ID, personal computer information, etc.
  • the signature of the important document is output as a log, and by analyzing the signature, it is possible to detect when and who the 1S computer has brought out the important document.
  • the important document itself is saved as a backup, and the contents of the backup document and the important document are compared to analyze whether the important document is the same document or whether the important document is similar. You can, when, who, what personal computer power is an important sentence It is possible to detect whether a letter has been taken out.
  • Patent Document 1 Japanese Patent Laid-Open No. 11 196392
  • the present invention has been made in view of the above points, and even a document in which a file name has been changed, a part of a file has been altered, a part thereof has been cut out, or a part has been added is added.
  • An object of the present invention is to provide a document management program and a document management method capable of detecting an original document without storing the entire document.
  • a document management program as shown in FIG. 1 is provided.
  • the document management program according to the present invention is for causing a computer to manage documents.
  • the computer 1 that executes this document management program is a log output means.
  • the log output means 2 is used to store an arbitrary document such as Doc (1) from the document storage 4 in which a plurality of documents Doc (1), Doc (2), ..., Doc (n) are stored.
  • Document A containing at least a part When it is extracted, the document A is divided, and the divided documents DA (1), DA (2) after the division are signed with DA (m) Sign (1), Sign (2), Calculate Sign (m) and output the log containing the calculated signature Sign (1), Sign (2), ..., Sign (m) to the log storage 5
  • the document body detection means 3 receives a request to detect the original document of the log stored in the log storage unit 5
  • the document body detection means 3 receives a plurality of documents in the document repository 4 Doc (1), Doc (2), ⁇ ⁇ ⁇ ⁇ Doc (n) signature of each document, for example, Doc (l) signature DSign (l), DSign (2), ⁇ ⁇ ⁇ Dsi gn (j) and the calculated signature Sign ( Original document that forms part of document Doc (1) corresponding to document A at the time of log output according to the result of comparing 1), Sign (2), ..., Sign (m) Is detected.
  • the log output means includes at least one arbitrary document body from a document storage means in which a plurality of document bodies are stored.
  • the document is divided, the signatures in the divided documents are calculated, and the log including the calculated signatures is output to the log storage unit.
  • the detection unit receives a request to detect the original document of the log, the signature of the document obtained by dividing each of the plurality of document bodies in the document storage unit is compared with the signature included in the log,
  • a document management method characterized by detecting an original document constituting at least a part of the document main body corresponding to the log output according to a result.
  • each of the plurality of important documents in the document storage means By comparing the signature of the divided document obtained by dividing the signature with the signature included in the log, it is possible to reliably detect the original document in the log without knocking up the entire taken-out document. As a result, the original file power can also know the original document of the part corresponding to the exported document, that is, the contents of the exported document.
  • FIG. 1 is a conceptual diagram of the invention applied to the present embodiment.
  • FIG. 2 is a diagram illustrating a hardware configuration example of a computer according to the present embodiment.
  • FIG. 3 is a block diagram showing functions for realizing the present embodiment.
  • FIG. 4 is a diagram showing a program configuration of a computer according to the present embodiment.
  • FIG. 5 is a diagram showing items described in a management book in the present embodiment.
  • FIG. 6 is a schematic diagram showing a divided file according to the present embodiment.
  • FIG. 7 A diagram showing the relationship between the file type, the number of signature creation divisions, and the number of search keyword knots.
  • FIG. 8 is a flowchart showing a procedure for creating management information.
  • FIG. 9 is a flowchart showing a detection processing procedure of the file detection means.
  • FIG. 10 is a flowchart showing a detection processing procedure of the file detection means.
  • FIG. 11 is a flowchart showing a procedure of a detection processing routine.
  • FIG. 12 is a flowchart showing a procedure of a detection processing routine.
  • FIG. 13 is a diagram showing the relationship among the file type, the number of signature creation divisions, and the number of bytes of a search keyword in Modification 4.
  • FIG. 1 is a conceptual diagram of the invention applied to the embodiment.
  • the document management program according to the present embodiment can cause a computer to execute the following processing. At this time, the computer 1 functions as a document management device.
  • the document registration means 7 registers a document (hereinafter referred to as “important document”) in which confidential information such as confidential information or personal information is stored in the document storage 4.
  • Document repository 4 is provided to store multiple important documents Doc (1), Doc (2), ..., Doc (n). Important documents Doc (1), Doc (2), ..., Doc (n) can be updated and saved only by an administrator with special authority.
  • Document take-out means 6 is a document A that has the same content as an important document, or that has undergone file name change, partial alteration of content, partial extraction of content, addition of content, etc. It is intended to be taken out and stored in a place other than the document storage 4.
  • FIG. 1 shows a case where the document A stored in the document storage 4 is taken out by the document take-out means 6 and stored in the medium M outside the computer 1.
  • the log output means 2 includes important documents Doc (1), Doc (2),
  • the document body detecting means 3 receives a request to detect the original document of the document A, the signature Sign (l), Sign (2), ..., Sign (m) and the important document Doc ( Signature of the document divided into 1) DSign (
  • the log output means 2 outputs a log including the calculated signatures Sign (1), Sign (2),..., Sign (m) to the log storage unit 5.
  • the document body detection means 3 splits the signature Sign (l), Sign (2), ..., Sign (m) and the document body.
  • the signatures DSign (l), DSi gn (2), ..., Dsign (j) are compared with each other and form at least part of the important document corresponding to document A at the time of log output according to the result The original document is detected.
  • FIG. 2 is a diagram illustrating a hardware configuration example of the computer according to the present embodiment.
  • the document management program and the document management method according to the embodiment of the present invention are realized by the computer 100.
  • the computer 100 has the following hardware configuration.
  • the entire computer 100 is controlled by a CPU (Central Processing Unit) 101.
  • a random access memory (RAM) 102, a hard disk drive (HDD) 103, a graphic processing device 104, an input interface 105, and a drive 106 are connected to the CPU 101 via a bus 101a.
  • the RAM 102 temporarily stores at least a part of an OS (Operating System) program application program to be executed by the CPU 101.
  • the RAM 102 stores various data necessary for processing by the CPU 101.
  • the HDD 103 stores an OS, application programs, and the like.
  • a monitor 11 is connected to the graphic processing device 104.
  • the graphic processing device 104 displays an image on the screen of the monitor 11 in accordance with a command from the CPU 101.
  • a keyboard 12 and a mouse 13 are connected to the input counter face 105.
  • the input interface 105 transmits a signal sent from the keyboard 12 or mouse 13 to the CPU 101 via the bus 101a.
  • the drive 106 reads data from the medium M and writes data to the medium M.
  • FIG. 3 is a block diagram showing functions for realizing the present embodiment.
  • the computer 100 includes an original file storage unit 110 that stores a plurality of original files (text files), a file system 120 that manages data stored in the original file storage unit 110, and the file system 120. Inputs the original file to the original file storage unit 110, outputs the original file from the original file storage unit 110, the file input / output unit 130, the original file storage unit 110, and inputs the file to the file input / output unit 130.
  • File input / output section 130 File input / output monitoring section for monitoring file output 140, management information creation means 150 for creating file management information, management list for managing management information 161
  • a storage unit 160 and file detection means 170 are provided.
  • the original file storage unit 110 is a storage unit that stores an original file of electronic data to be managed.
  • the file input / output unit 130 includes a file including part or all of the original file upon request. File (hereinafter referred to as “export file”) and move or copy it to an external medium (storage device) M.
  • outputting an original file from the original file storage unit 110 to the file input / output unit 130 is referred to as “taking out the original file”.
  • the input / output monitoring unit 140 copies the export file to the management information creation means 150 when the original file is taken out.
  • the management information creation unit 150 creates management information (log) for the export file force received from the input / output monitoring unit 140 and stores the management information in the management list storage unit 160.
  • the file detection means 170 detects the original file that is the carry-out source of the export file, using the management book stored in the management book storage unit 160 and the original file stored in the original file storage unit 110. Further, the file detection means 170 outputs the detection result to the monitor 11.
  • FIG. 4 is a diagram showing a program configuration of the computer according to the present embodiment. The same parts as those in FIG.
  • the file input / output monitoring unit 140 operates integrally with the OS 190 provided by the system.
  • the original file stored in the original file storage unit 110 is taken out to the file input / output unit 130, the original file is taken out by the OS 190 and the file is
  • the input / output monitoring unit 140 copies the export file to the management information creation unit 150.
  • management book 161 stored in the management book storage unit 160 will be described.
  • FIG. 5 is a diagram showing items described in the management book 161 in the present embodiment.
  • the management book 161 describes management information created when the original file is taken out. This management information includes history information 162 and signature information 163.
  • the history information 162 indicates "output date” indicating the date when the file was saved, "output hour / minute / second” indicating the hour / minute / second when the file was saved, and the name of the computer that saved the file.
  • the signature information 163 includes an "entire signature J” indicating the signature of the entire saved file, "signature creation division number” indicating the number of file divisions, and a divided file (hereinafter referred to as "divided file”).
  • “Search keyword” indicating the keyword that extracted the first K bytes (K is a positive real number) of words, phrases, or sentences, and “number of bytes to be signed” indicating the number of bytes per divided file It consists of “number” and “split signature” items that indicate the signature of the split file.
  • the search keyword, the number of bytes to be signed, and the divided signature are created for each divided file and stored in the management list 161.
  • Such signature information 163 is created by a signature information creation operation.
  • the signature information creation operation will be described in detail later.
  • FIG. 6 is a schematic diagram showing a divided file according to the present embodiment.
  • FIG. 6 shows an example in which the export file A1 is divided into three divided files DA (1), DA (2), and DA (3) as an example.
  • the overall signature AS (1) is the signature of the entire export file A1. This signature is created by using, for example, the HASH function on the export file A (l). “AS (1)” is written in the data contents of “Overall signature” in the management book.
  • search keyword As a search keyword, a common part of each divided file is extracted. In Fig. 6, K bytes of search keywords are extracted from the beginning of each divided document.
  • the data contents of the “search keyword” in the management list correspond to the divided files DA (1), DA (2), and DA (3), respectively. The corresponding search keyword is described.
  • the data contents of "number of bytes to be signed" in the management list include divided files DA (1), DA
  • the divided signatures DS (1), DS (2), and DS (3) are created by using, for example, a HASH function or the like for each of the divided files DA (1), DA (2), and DA (3).
  • DS (1)”, “DS (2)”, and “DS (3)” are described in the data content of “division signature” in the management book.
  • Figure 7 shows the relationship between the file type, the number of signature creation divisions, and the number of bytes in the search keyword.
  • file type for example, resume, approval document, customer list, etc.
  • number of signature creation divisions for example, resume, approval document, customer list, etc.
  • number of bytes of search keyword are set.
  • the number of signature creation divisions and the search keyword are determined using a comparison table described in advance. This comparison table is stored in the HDD 103 in advance.
  • comparison table may be stored in an external file (not shown) and read when the document management program is started or when a divided file is divided.
  • the number of bytes of the search keyword may be calculated using a calculation formula, or may be calculated using a calibration curve or the like.
  • the determination of which "file type" the export file corresponds to, for example, a method of determining from the extension of the original file, or features such as a resume, a decision document, and a customer list separately.
  • a defined classification table is prepared and a decision is made with reference to the classification table.
  • FIG. 8 is a flowchart showing a procedure for creating signature information. In the following, the process shown in FIG. 8 will be described in order of step number.
  • the management information creating means 150 acquires the export file from the input / output monitoring unit 140 (step Sl l).
  • a signature for the entire export file is created (step S12).
  • the total number of bytes of the export file is divided by the number of signature creation divisions corresponding to the type of export file to calculate the number of signature target bytes of each division file (step S13). ).
  • the total number of bytes of the export file is set as the number of unsigned bytes (step S14).
  • step S15 by creating a split signature, Do, and determines whether there is a split file if (step S15) is 0 divided signatures do not create a divided file (Yes in step S 15), also export file force A file for the number of bytes to be signed is read (step S16).
  • step S16 the file read in step S16 is set as a divided file for the current process, and the number of bytes of this divided file is held in the RAM 102 as the number of bytes to be signed for the current process (step S17). .
  • the leading force K bytes of the divided file of the current process is set as the search keyword of the current process and held in the RAM 102 (step S18).
  • a split signature is created from the split file of the current process and held in the RAM 102 (step S19).
  • step S20 the number of unsigned creation bytes is also subtracted from the number of signature target notes in this split file, and the value is set as the new number of unsigned creation notes (step S20). Thereafter, the process returns to step S15.
  • step S15 a split signature is created! In case of / (when split signatures are created for all split files) (No in step S15), the various types of signature information stored in the RAM 102 and separately created history information are managed. The data is output to the storage unit 160 (step S21), and the signature information creation operation is terminated.
  • FIGS. 9 and 10 are flowcharts showing the procedure of the detection operation of the file detection means. In the following, the process shown in FIGS. 9 and 10 will be described in order of step number.
  • the management list 161 of the export file to be detected is extracted from the management list storage unit 160, and the management information is acquired (step S31).
  • step S32 output date and time of history information export file in management information (hereinafter referred to as “nDate”) Is acquired (step S32).
  • the last update date and time (hereinafter referred to as “oDate”) of one of the original files corresponding to the export file (hereinafter referred to as “the current original file”) Obtain (step S33).
  • step S34 it is determined whether or not the date / time power after nDate is oDate.
  • step S34 When nDate is earlier than oDate (No in step S34), the export file is not judged as a derived file of the current original file, and the process returns to step S31.
  • nDate is a date after oDate (Yes in step S34)
  • the file size of the export file (hereinafter referred to as "nSize") is acquired from the history information (step S35).
  • step S32 to step S35 the narrowing down of the export files to be processed by the detection operation of the file detection means 170 by the update date comparison is performed only when simple processing is desired (simple search processing). It is also preferable to adopt a configuration so that all cases are adopted (all cases search process). In this case, before step S31, based on the input information (not shown) that makes it possible to selectively identify the simple search process and the all-case search process, it is identified whether the V or misalignment process is selected.
  • the process can be configured to be branched.
  • step S36 the file size of the original file (hereinafter referred to as “oSize”) is acquired (step S36).
  • nSize and oSize are equal (step S37).
  • step S38 If nSize and oSize are not equal (No in step S37), the process proceeds to a detection processing routine (step S38).
  • step S43 After the detection processing routine power is also restored, the process proceeds to step S43.
  • nSign a signature of the entire export file
  • oSign a signature of the entire original file (hereinafter referred to as “oSign”) is created (step S40), and it is determined whether nSign and oSign are equal (step S41).
  • step S41 If nSign and oSign are not equal (No in step S41), the detection processing routine (step Shift to step S38).
  • step S41 if nSign and oSign are equal (Yes in step S41), the export file is regarded as a derivative file of the original file at this time, and the history information and management information are output as the original file information (step S42).
  • step S43 it is determined whether or not there is an original file that has not been compared with the export file.
  • step S43 Compare the export file with the signature! / Wow! /, If there is an original file (No in step S43), return to step S31 and continue the bow I detection operation.
  • step S43 if there is no original file by comparing with the export file (Yes in step S43), the detection operation is terminated.
  • the time for the detection operation can be shortened by performing Steps S31-S34, Step S37, and Steps S39-S42.
  • the original file is not compared with the signature of the export file, that is, the signature of the export file and the signatures of all the original files obtained by referring to the comparison table
  • the signature of the export file is regarded as a derivative file of the original file at this time
  • the file is compared with the signature.
  • the detection operation can be terminated.
  • FIG. 11 and FIG. 12 are flowcharts showing the procedure of the detection processing routine. In the following, the process shown in FIGS. 11 and 12 will be described in order of step number.
  • the signature creation division number (hereinafter referred to as “hMax”) is acquired from the management information (step S5).
  • step S52 the value of the signature creation division number counter (hereinafter referred to as “hCnt”) is set to 1 (step S52).
  • step S53 it is determined whether hCnt and hMax are equal.
  • step S53 If hCnt and hMax are equal (No in step S53), a search keyword is acquired from the management information (step S54).
  • step S55 the original file is searched with the acquired search keyword.
  • Step S56 it is determined whether or not the original file has a portion that has hit the search keyword power.
  • step S56 If the search keyword power S is not hit in the original file (No in step S56), the value (M) of the mismatch register stored in the RAM 102 is incremented (step S57), and the process proceeds to step S64.
  • the management information power also acquires the number of bytes to be signed (step S58).
  • the search keyword contained in the original file is positioned for the number of signature target notes acquired in step S58, and a signature for this file is created (step S60).
  • step S59 it is determined whether or not the divided signature acquired in step S59 matches the signature created in step S60 (step S61).
  • step S61 If the split signature does not match the signature created in the original file (No in step S61), the next position of the search keyword that was hit last in the split file is confirmed (step S62), and the process returns to step S56.
  • step S63 if the divided signature matches the signature created by the original file (Yes in step S61), the value (N) of the match register stored in the RAM 102 is incremented (step S63).
  • step S64 hcnt is incremented (step S64), and the process returns to step S53.
  • step S66 the similarity L is compared with a preset similarity threshold LL.
  • step S66 When L ⁇ LL (No in step S66), the next original file is read without considering the export file as a derivative file of the original file (step S67), and the process returns to step S53. The same operation as described above is performed on the file.
  • the export file is a derivative file of the original file.
  • Each item of management information is displayed on the monitor 11 via the graphic processor 104.
  • the management information creation means 150 creates the management information for the export file power received from the input / output monitoring unit 140, and the search keyword of the export file in the original file and the signature of the hit part By comparing the signature of this part with the split signature of the export file, the original file corresponding to the export file power can be detected. As a result, it is possible to know the original document of the part corresponding to the original file power export document, so that the contents of the extracted document can be known.
  • the power of performing the detection operation on the original file corresponding to the file described in the management book is not limited to this. For example, even if the detection operation is performed on all the original files. Good.
  • the signature creation division number of the export file and the number of bytes of the search keyword are determined using the comparison table.
  • the present invention is not limited to this, and the following modification is used. Monkey.
  • the administrator determines the number of signature creation divisions and the number of bytes for the search keywords in advance, such as dividing the signature creation division number into 100 and the search keyword byte count into 8 bytes.
  • the number of signature creation divisions and the number of bytes for the search keyword are determined in proportion. This percentage can be simply a percentage or other percentage calculation. However, the number of bytes of the search keyword may be extremely small or large depending on the file capacity, so each limit value is determined. This is determined by the type and size of the original file and stored in the HDD 103 or in an external file. [0088] When determining the number of search keyword notes based on the ratio, first, the number of signature generation divisions is determined. Then, it is confirmed whether or not the number of signature generation divisions is within the limit value.
  • the result of dividing the number of bytes of the original file by the number of signature creation divisions is 63 bytes or less
  • the division file per division is set to 64 bytes, and the signature creation division number is changed.
  • the number of signature creation divisions is determined by the number of bytes Z 64 of the original file.
  • the maximum number of bytes per division is 4096 bytes (assuming about 1Z2 pages)
  • the result of dividing the number of bytes of the original file by the number of signature creation divisions is 097 bytes or more. Set the file to 4096 bytes and change the number of signature creation divisions. In this case, the number of divisions is determined by the number of bytes in the original file Z4096.
  • the ratio of search keywords is next determined. Then, the percentage power of the search keyword and whether or not it can be applied to the divided file are confirmed.
  • the number of bytes of the search keyword is (number of bytes of the divided file) Z (number of divisions for signature creation)
  • the search keyword when the search keyword is 7 bytes or less, the search keyword is 8 bytes. If the search keyword is 129 bytes or more, the search keyword is 128 bytes.
  • the number of signature creation divisions and the number of bytes for the search keyword are determined based on the information of each original file.
  • FIG. 13 is a diagram illustrating the relationship among the file type, the number of signature creation divisions, and the number of search keyword bytes according to the fourth modification.
  • the method and the first to third modifications using the comparison table described in the embodiment are combined.
  • the comparison table if the original file is a resume, the signature creation division number is 5 and the search keyword is 16, and if the original file is an approval document, it is described in Modification 2.
  • the number of signature generation divisions and the number of bytes of the search keyword are determined in proportion.
  • the processing functions described above can be realized by a computer.
  • a program describing the processing contents of the functions that the computer should have is provided.
  • the program describing the processing contents can be recorded on a computer-readable recording medium.
  • the computer-readable recording medium include a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory.
  • Magnetic recording devices include hard disk drives (HDD), flexible disks (FD), and magnetic tapes.
  • Optical disks include DVD (Digital Versatile Disc), DVD—RAM (Random Access Memory), CD—ROM (Compact Disc Read Only Memory), CD—R (Recordable) / RW (ReWritable), and the like.
  • Magneto-optical recording media include MO (Magneto-Optical disk).
  • the computer that executes the program stores, for example, a program recorded on a portable recording medium or a program transferred by a server computer in its own storage device. Then, the computer reads its own storage device power program and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. The computer can also execute processing according to the received program sequentially each time the program is transferred to the server computer.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Storage Device Security (AREA)

Abstract

 ファイル名の変更や、ファイルの一部分の改ざん、一部分の切り出し、または一部分の追加が行われた文書であっても、文書全体を保存することなく、元文書の検出を行う。  コンピュータ(1)を、重要文書Doc(1)の少なくとも一部を含む文書Aが持ち出されたとき、文書Aを分割し、分割文書DA(1)、DA(2)・・・、DA(m)における署名をそれぞれ計算し、算出された署名Sign(1)、Sign(2)、・・・、Sign(m)を含むログをログ格納部(5)に出力するログ出力手段(2)、ログの元文書の検出要求を受けたとき、Doc(1)の署名DSign(1)、DSign(2)、・・・、Dsign(j)と、署名Sign(1)、Sign(2)、・・・、Sign(m)とをそれぞれ比較し、結果に応じてログ出力時の文書Aに対応する文書Doc(1)の一部を構成する元文書を検出する文書本体検出手段(3)、として機能させる。                                                                               

Description

明 細 書
文書管理プログラムおよび文書管理方法
技術分野
[0001] 本発明は文書管理プログラムおよび文書管理方法に関し、特に重要文書を管理す る文書管理プログラムおよび文書管理方法に関する。
背景技術
[0002] 近年、社外秘の情報や個人情報等の秘密情報が記載された電子文書 (以下「重要 文書」と 、う)を管理する必要性が高まって 、る。この重要文書を管理する方法の一 つとして、重要文書が格納されている格納庫から任意の文書が持ち出されたとき、そ の任意の文書がどの重要文書を参照したものであるかを検出する方法が知られてい る。この検出方法しては、例えば、以下(1)一(3)に挙げる方法が挙げられる。
(1)重要文書を別の保管場所に保存したとき、保存ファイル名称をログとして出力す る方法。
(2)重要文書を別の保管場所に保存したとき、その文書全体の署名 (メッセージ認証 コードまたは、ノ、ッシュコード)をログとして出力する方法 (例えば、特許文献 1参照)。
(3)重要文書を別の保管場所に保存したときに、その重要文書そのものをバックアツ プファイルとして保存する方法。
[0003] 以下、これらの(1)一 (3)に挙げた方法を具体的に説明する。
(1)の方法は、重要文書のファイル名がログとして出力され、保存ファイル名でログを 解析すれば、いつ、誰が、どのパソコン力も重要文書を持ち出したかを検出すること ができる。なお、ログとしては、保存日時、保存ユーザ ID、パソコンの固有情報などが 出力される。
(2)の方法は、重要文書の署名がログとして出力され、署名を解析すれば、いつ、誰 1S どのパソコン力も重要文書を持ち出したかを検出することができる。
(3)の方法は、重要文書そのものがバックアップとして保存され、そのバックアップ文 書と重要文書との内容を比較することによって、重要文書と同じ文書か、または重要 文書の類似文書力否かを解析することができ、いつ、誰が、どのパソコン力も重要文 書を持ち出したかを検出することができる。
特許文献 1:特開平 11 196392号公報
発明の開示
発明が解決しょうとする課題
[0004] し力しながら、従来の技術には以下のような問題があった。
前述した(1)の方法は、重要文書を別の保管場所に保存するときに、ファイル名を 別のファイル名で保存すると、参照元の重要文書が分からない。すなわち、ログを解 祈しても、何の文書が持ち出されたのかを知ることができな 、。
[0005] 前述した(2)の方法は、重要文書の一部分の改ざん、一部分の切り出し、または一 部分の追カ卩による持ち出しの場合、本技術のログでは、保存文書全体の署名しか出 力していないため、元の重要文書の署名とは異なる。このため、参照元の重要文書 が分力ゝらない。すなわち、署名を解析しても、何の文書が持ち出されたのかを知るこ とができない。
[0006] 前述した(3)の方法は、文書を保存するときに、ログとは別に保存時の文書ファイル をバックアップとして残すので、バックアップ文書と重要文書の内容とを比較すれば、 ノ ックアップ文書と参照元の重要文書との同一性または類似性が検出できる。しかし 、文書全体のバックアップを取るため、保存に必要な容量が膨大なものとなる。
[0007] 本発明はこのような点に鑑みてなされたものであり、ファイル名の変更や、ファイル の一部分の改ざん、一部分の切り出し、または一部分の追カ卩が行われた文書であつ ても、文書全体を保存することなぐ元文書の検出を行うことができる文書管理プログ ラムおよび文書管理方法を提供することを目的とする。
課題を解決するための手段
[0008] 本発明では上記問題を解決するために、図 1に示すような文書管理プログラムが提 供される。本発明に係る文書管理プログラムは、コンピュータに、文書を管理させるた めのものである。この文書管理プログラムを実行するコンピュータ 1は、ログ出力手段
2と、文書本体検出手段 3とを有する。
[0009] ログ出力手段 2は、複数の文書 Doc (1)、 Doc (2)、…、 Doc (n)が保管された文 書保管庫 4から、任意の文書、例えば、 Doc (1)の少なくとも一部を含む文書 Aが持 ち出されたとき、文書 Aを分割し、分割後の複数の分割文書 DA (1)、 DA(2) · · ·、 D A (m)における署名 Sign (1)、 Sign (2)、 · · ·、 Sign (m)をそれぞれ計算し、算出さ れた署名 Sign (1)、 Sign (2)、 · · ·、 Sign (m)を含むログをログ格納部 5に出力する
[0010] 文書本体検出手段 3は、ログ格納部 5に格納されたログの元文書の検出要求を受 けたとき、文書保管庫 4内の複数の文書 Doc (1)、 Doc (2)、 · · ·、 Doc (n)それぞれ を分割した文書の署名、例えば、 Doc (l)の署名 DSign (l)、 DSign(2)、 · · ·、 Dsi gn (j)と、算出された署名 Sign (1)、 Sign (2)、 · · ·、 Sign (m)とを、それぞれ比較し 、結果に応じてログ出力時の文書 Aに対応する文書 Doc (1)の一部を構成する元文 書を検出する。
[0011] このような文書管理プログラムを実行するコンピュータによれば、文書保管庫 4から 、 Doc (1)の少なくとも一部を含む文書 Aが持ち出されると、ログ出力手段 2により、持 ち出された文書 Aが分割された複数の分割文書 DA(1)、 DA(2) · · ·、 DA(m)にお ける署名 Sign(l)、 Sign(2)、 · · ·、 Sign(m)が、それぞれ計算され、算出された署 名 Sign (1)、 Sign (2)、 · · ·、 Sign (m)を含むログがログ格納部 5に出力される。その 後、ログの元文書の検出要求を受けると、文書本体検出手段 3により、署名 Sign (l) 、 Sign (2)、 · · ·、 Sign(m)と文書本体を分割した文書の署名 DSign (l)、 DSign(2 )、 · · ·、 Dsign (j)とが、それぞれ比較され、結果に応じて文書 Aに対応する文書 Do c (1)の少なくとも一部を構成する元文書が検出される。
[0012] また、上記課題を解決するために、文書を管理させる文書管理方法にお!、て、ログ 出力手段が、複数の文書本体が保管された文書保管手段から、任意の文書本体の 少なくとも一部の搬出文書が持ち出されたとき、前記文書を分割し、分割後の複数の 分割文書における署名をそれぞれ計算し、算出された前記各署名を含むログをログ 格納部に出力し、文書本体検出手段が、前記ログの元文書の検出要求を受けたとき 、前記文書保管手段内の前記複数の文書本体それぞれを分割した文書の署名と、 前記ログに含まれる署名とを、それぞれ比較し、結果に応じて前記ログ出力時に対 応する前記文書本体の少なくとも一部を構成する元文書を検出する、ことを特徴とす る文書管理方法が提供される。 [0013] このようなデータベース再編成方法によれば、複数の文書本体が保管された文書 保管手段から、任意の文書本体の少なくとも一部の搬出文書が持ち出されると、ログ 出力手段により搬出文書が分割され、分割後の複数の分割文書における署名がそ れぞれ計算され、算出された各署名を含むログがログ格納部に出力される。その後、 前記ログの元文書の検出要求を受けたとき、文書本体検出手段により、文書保管手 段内の複数の文書本体それぞれを分割した文書の署名と、ログに含まれる署名とが 、それぞれ比較され、結果に応じてログ出力時に対応する文書本体の少なくとも一部 を構成する元文書が検出される。
発明の効果
[0014] 本発明は、搬出文書のファイル名が重要文書のファイル名と異なっていたり、搬出 文書の一部分が改ざん、切り出しまたは追加されていたりしても、文書保管手段内の 複数の重要文書それぞれを分割した分割文書の署名と、ログに含まれる署名とを、 それぞれ比較することによって、持ち出し文書全体のノ ックアップをとることなぐ確実 に、ログの元文書の検出を行うことができる。これにより、原本ファイル力も搬出文書 に対応する部分の元文書を知ることができる、すなわち、搬出された文書の内容を知 ることがでさる。
[0015] 本発明の上記および他の目的、特徴および利点は本発明の例として好ま U、実施 の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。
図面の簡単な説明
[0016] [図 1]本実施の形態に適用される発明の概念図である。
[図 2]本実施の形態のコンピュータのハードウェア構成例を示す図である。
[図 3]本実施の形態を実現するための機能を示すブロック図である。
[図 4]本実施の形態のコンピュータのプログラム構成を示した図である。
[図 5]本実施の形態における管理簿に記載される項目を示す図である。
[図 6]本実施の形態の分割ファイルを示す概略図である。
[図 7]ファイルの種類、署名作成分割数および検索キーワードのノイト数の関係を示 す図である。
[図 8]管理情報作成の手順を示すフローチャートである。 [図 9]ファイル検出手段の検出処理の手順を示すフローチャートである。
[図 10]ファイル検出手段の検出処理の手順を示すフローチャートである。
[図 11]検出処理ルーチンの手順を示すフローチャートである。
[図 12]検出処理ルーチンの手順を示すフローチャートである。
[図 13]変形例 4のファイルの種類、署名作成分割数および検索キーワードのバイト数 の関係を示す図である。
発明を実施するための最良の形態
[0017] 以下、本発明の実施の形態を図面を参照して詳細に説明する。
まず、実施の形態に適用される発明の概要について説明し、その後、実施の形態 の具体的な内容を説明する。
[0018] 図 1は、実施の形態に適用される発明の概念図である。本実施の形態の文書管理 プログラムは、コンピュータに以下の処理を実行させることができ、このときコンビユー タ 1は、文書管理装置として機能する。
[0019] 文書登録手段 7は、社外秘の情報や個人情報等の秘密情報が格納された文書 (以 下「重要文書」と言う)を文書保管庫 4に登録する。
文書保管庫 4は、複数の重要文書 Doc (1)、 Doc (2)、 · · ·、 Doc (n)を保管するた めに設けられて 、る。重要文書 Doc (1)、 Doc (2)、 …、 Doc (n)の更新、保存など は、特別の権限を有する管理者のみが行うことができるものとする。
[0020] 文書持ち出し手段 6は、重要文書と内容が同じ、または重要文書に対してファイル 名の変更、内容の一部改ざん、内容の一部切り出しおよび内容の追加等が行われた 文書 Aを持ち出し、文書保管庫 4以外の場所に保管させるためのものである。図 1で は、文書保管庫 4内に格納された文書 Aが、文書持ち出し手段 6に持ち出され、コン ピュータ 1の外部のメディア Mに保管される場合を示している。
[0021] ログ出力手段 2は、文書登録手段 7により登録された重要文書 Doc (1)、 Doc (2)、
· · ·、 Doc (n)が保管された文書保管庫 4から、文書 Aが文書持ち出し手段 6に持ち 出されたとき、持ち出された文書 Aを分割した複数の分割文書 DA (1)、 DA (2) · · ·、 DA(m)における署名 Sign(l)、 Sign(2)、 · · ·、 Sign (m)をそれぞれ計算する。ま た、ログ出力手段 2は、算出された署名 Sign (1)、 Sign (2)、…、 Sign (m)を含む口 グをログ格納部 5に出力する。
[0022] 文書本体検出手段 3は、文書 Aの元の文書を検出する要求を受けたとき、署名 Sig n (l)、 Sign (2)、 · · ·、 Sign (m)と重要文書 Doc (1)を分割した文書の署名 DSign (
1)、 DSign (2)、 · · ·、 DSign (j)とを、それぞれ比較することによって、文書 Aの持ち 出し元である重要文書 Doc (1)を検出する。
[0023] このような文書管理装置によれば、文書保管庫 4から、文書 Aが文書持ち出し手段 6に持ち出されると、ログ出力手段 2により文書 Aを分割した分割文書 DA(1)、 DA(
2) · · ·、 DA (m)における署名 Sign (1)、 Sign (2)、 · · ·、 Sign (m)がそれぞれ計算 される。また、ログ出力手段 2により、算出された署名 Sign (1)、 Sign (2)、 · · ·、 Sign (m)を含むログがログ格納部 5に出力される。
[0024] その後、ログの元文書の検出要求を受けると、文書本体検出手段 3により、署名 Sig n (l)、 Sign (2)、 · · ·、 Sign (m)と文書本体を分割した文書の署名 DSign (l)、 DSi gn (2)、 · · ·、 Dsign (j)とが、それぞれ比較され、結果に応じてログ出力時の文書 A に対応する重要文書の少なくとも一部を構成する元文書が検出される。
[0025] このようにして、署名を用いることで、文書 Aのファイル名が重要文書のファイル名と 異なっていたり、文書 Aの一部分が改ざん、切り出しまたは追加されていたりしても、 文書 A全体のバックアップを取ることなぐ容易かつ確実に文書 Aの持ち出し元であ る重要文書の検出を行うことができる。これにより、取り出された文書の内容を知ること ができる。
[0026] 以下、本発明の実施の形態を具体的に説明する。
図 2は、本実施の形態のコンピュータのハードウェア構成例を示す図である。本発 明の実施の形態の文書管理プログラムおよび文書管理方法は、コンピュータ 100に より実現される。
[0027] コンピュータ 100は、以下の様なハードウェア構成を有している。
コンピュータ 100は、 CPU(Central Processing Unit) 101によって装置全体が制御 されている。 CPU101には、バス 101aを介してRAM(Random Access Memory) 102 、ハードディスクドライブ(HDD:Hard Disk Drive) 103、グラフィック処理装置 104、 入力インタフェース 105およびドライブ 106が接続されている。 [0028] RAM102には、 CPU101に実行させる OS(Operating System)のプログラムゃァプ リケーシヨンプログラムの少なくとも一部が一時的に格納される。また、 RAM102には 、 CPU101による処理に必要な各種データが格納される。また、 HDD103には、 O Sやアプリケーションプログラム等が格納される。
[0029] グラフィック処理装置 104には、モニタ 11が接続されている。グラフィック処理装置 1 04は、 CPU101からの命令に従って、画像をモニタ 11の画面に表示させる。入カイ ンタフェース 105には、キーボード 12とマウス 13とが接続されている。入力インタフエ ース 105は、キーボード 12やマウス 13から送られてくる信号を、バス 101aを介して C PU 101に送信する。
[0030] ドライブ 106は、メディア Mからのデータの読み取りおよびメディア Mに対してのデ ータの書き込みを行う。
以上のようなハードウェア構成によって、本実施の形態の処理機能を実現すること ができる。
[0031] 以下、図 2に示す構成のシステムにおける本実施の形態の処理について詳細に説 明する。
図 3は、本実施の形態を実現するための機能を示すブロック図である。
[0032] コンピュータ 100は、複数の原本ファイル (テキストファイル)を記憶する原本フアイ ル記憶部 110、原本ファイル記憶部 110に記憶されて 、るデータを管理するファイル システム 120、ファイルシステム 120を介して原本ファイル記憶部 110に原本ファイル を入力し、また、原本ファイル記憶部 110から原本ファイルを出力するファイル入出力 部 130、原本ファイル記憶部 110力 ファイル入出力部 130へのファイルの入力およ びファイル入出力部 130からのファイルの出力を監視するファイル入出力監視部 14 0、ファイルの管理情報を作成する管理情報作成手段 150、管理情報を管理するた めの管理簿 161を記憶する管理簿記憶部 160およびファイル検出手段 170を有して いる。
[0033] 原本ファイル記憶部 110は、管理対象の電子データの原本ファイルを記憶する記 憶手段である。
ファイル入出力部 130は、要求に応じて原本ファイルの一部または全部を含むフアイ ル (以下、「搬出ファイル」と言う)を生成し、外部のメディア (記憶装置) Mに移動また は複写する。
[0034] なお、以下では原本ファイル記憶部 110からファイル入出力部 130に原本ファイル を出力することを「原本ファイルを持ち出す」と言う。
入出力監視部 140は、原本ファイルの持ち出し時に、管理情報作成手段 150に搬 出ファイルを複写する。
[0035] 管理情報作成手段 150は、入出力監視部 140から受け取った搬出ファイル力も管 理情報 (ログ)を作成し、その管理情報を管理簿記憶部 160に格納する。
ファイル検出手段 170は、管理簿記憶部 160に格納された管理簿と原本ファイル 記憶部 110に記憶されて 、る原本ファイルとを用いて、搬出ファイルの持ち出し元で ある原本ファイルを検出する。また、ファイル検出手段 170は、検出結果をモニタ 11 に出力する。
[0036] なお、ファイル検出手段 170の検出動作 (作用)については、後に詳述する。
次に、ファイル入出力監視部と OSやアプリケーション等のプログラムとの関係につ いて説明する。
[0037] 図 4は、本実施の形態のコンピュータのプログラム構成を示した図である。図 2と同 じものには同じ番号を付し、説明は省略する。
本発明に係るファイル入出力監視部 140は、システムが提供する OS190と一体ィ匕 して動作する。文書管理プログラムが起動しているとき、原本ファイル記憶部 110に 格納された原本ファイルの、ファイル入出力部 130への持ち出し処理を実行させる際 、 OS190による原本ファイルの持ち出し処理を実行すると同時に、ファイル入出力監 視部 140が、管理情報作成手段 150に搬出ファイルを複写する。
[0038] 次に、管理簿記憶部 160に格納される管理簿 161について説明する。
図 5は、本実施の形態における管理簿 161に記載される項目を示す図である。管 理簿 161には、原本ファイルの持ち出し時に作成される管理情報が記載されている。 この管理情報は、履歴情報 162および署名情報 163で構成される。
[0039] 履歴情報 162は、ファイルを保存した年月日を示す「出力年月日」、ファイルを保存 した時分秒を示す「出力時分秒」、ファイル保存を行ったコンピュータの名称を示す「 マシン名」、ファイル保存を行ったコンピュータの IP (Internet Protocol)アドレスを示 す「IPアドレス」、ファイル保存を行ったコンピュータの MAC (Media Access Control) アドレスを示す「MACアドレス」、ファイル保存を行ったコンピュータ上のログイン IDを 示す「ユーザ名」、保存を行ったファイルの名称を示す「ファイル名」、保存を行ったフ アイルのサイズ (バイト単位)を示す「ファイルサイズ」の項目で構成される。
[0040] 署名情報 163は、保存を行ったファイル全体の署名を示す「全体署名 J、ファイルの 分割数を示す「署名作成分割数」、分割されたファイル (以下「分割ファイル」と言う) の 1分割分の最初の Kバイト (Kは正の実数)分の単語、文節、または文章を抽出した キーワードを示す「検索キーワード」、分割ファイルの 1分割ファイル当たりのバイト数 を示す「署名対象バイト数」、分割ファイルの署名を示す「分割署名」の項目で構成さ れる。
[0041] なお、検索キーワードの Kバイトについては後に詳述する。
また、検索キーワード、署名対象バイト数および分割署名については、個々の分割 ファイルついてそれぞれ作成され、管理簿 161に記憶される。
[0042] このような署名情報 163は、署名情報作成動作によって作成される。なお、署名情 報作成動作については、後に詳述する。
次に、署名情報 163の具体例について説明する。
[0043] 図 6は、本実施の形態の分割ファイルを示す概略図である。図 6には、一例として、 搬出ファイル A1を 3つの分割ファイル DA(1)、 DA (2)、 DA (3)に分割した場合の 例が示されている。
[0044] 全体署名 AS (1)は、搬出ファイル A1全体の署名である。この署名は、搬出フアイ ル A (l)に例えば、 HASH関数等を用いることにより作成される。管理簿の「全体署 名」のデータ内容には、「AS (1)」が記載される。
[0045] また、署名作成分割数は 3であるので、管理簿の「署名作成分割数」のデータ内容 には、「3」が記載される。
検索キーワードは、各分割ファイルの共通の部分が抽出される。図 6では、各分割 文書内の先頭から Kバイト分の検索キーワードが抽出されて 、る。管理簿の「検索キ 一ワード」のデータ内容には、分割ファイル DA(1)、 DA(2)、 DA (3)にそれぞれ対 応する検索キーワードが記載される。
[0046] また、管理簿の「署名対象バイト数」のデータ内容には、分割ファイル DA(1)、 DA
(2)、 DA (3)のそれぞれのバイト数が記載される。
分割署名 DS (1)、 DS (2)、 DS (3)は、分割ファイル DA (1)、 DA (2)、 DA (3)に 、それぞれ例えば、 HASH関数等を用いることにより作成される。図 6に示す例では 、管理簿の「分割署名」のデータ内容には、「DS (1)」、「DS (2)」、「DS (3)」が記載 される。
[0047] 次に、署名作成分割数と検索キーワードのバイト数の算出方法について説明する。
図 7は、ファイルの種類、署名作成分割数および検索キーワードのバイト数の関係 を示す図である。
[0048] 本実施の形態では、図 7に示すように、「ファイルの種類」(一例として履歴書、決裁 書、顧客名簿等)、「署名作成分割数」および「検索キーワードのバイト数」が予め記 述された対照表を用いて署名作成分割数および検索キーワードを求める。この対照 表は、 HDD103内に予め格納されている。
[0049] なお、対照表は外部ファイル(図示せず)に格納して、文書管理プログラムの起動 時や分割ファイルの分割時に読み込んでもよい。
また、検索キーワードのバイト数は、計算式を用いて算出しても良いし、検量線等を 用いて算出してもよい。
[0050] また、搬出ファイルがどの「ファイルの種類」に対応するかの判断は、例えば、原本 ファイルの拡張子から決定する方法や、別個に履歴書や決裁書や顧客名簿等の特 徴が定義された分類表を用意し、その分類表を参照して決定する方法等が挙げられ る。
[0051] 次に、署名情報作成動作について説明する。
図 8は、署名情報作成の手順を示すフローチャートである。以下、図 8に示す処理 をステップ番号に沿って説明する。
[0052] 原本ファイルが持ち出されると、管理情報作成手段 150は、入出力監視部 140から 、搬出ファイルを取得する (ステップ Sl l)。
次に、搬出ファイル全体の署名を作成する (ステップ S12)。 [0053] そして、対照表を参照し、搬出ファイルの全バイト数を、搬出ファイルの種類に対応 する署名作成分割数で割って、各分割ファイルの署名対象バイト数を算出する (ステ ップ S13)。
[0054] 次に、未署名作成バイト数として搬出ファイルの全バイト数を設定する (ステップ S1 4)。
その後、分割署名を作成して 、な 、分割ファイルがあるか否かを判断する (ステップ S15) 0分割署名を作成していない分割ファイルがある場合は (ステップ S 15の Yes) 、搬出ファイル力も署名対象バイト数分のファイルを読み込む (ステップ S16)。
[0055] 次に、ステップ S 16で読み込んだファイルを今回の処理の分割ファイルとし、この分 割ファイルのバイト数を今回の処理の署名対象バイト数として RAM102にて保持す る(ステップ S 17)。
[0056] そして、今回の処理の分割ファイルの先頭力 Kバイト分を今回の処理の検索キー ワードとし、 RAM 102にて保持する(ステップ S 18)。
次に、今回の処理の分割ファイルから分割署名を作成し、 RAM102にて保持する (ステップ S 19)。
[0057] その後、未署名作成バイト数力も今回の分割ファイルの署名対象ノイト数を減算し て、その値を新たな未署名作成ノイト数とする (ステップ S20)。その後、ステップ S15 に戻る。
[0058] 一方、ステップ S 15で、分割署名を作成して!/ヽな 、分割ファイルがな!/、場合 (全て の分割ファイルに対して分割署名が作成された場合)は (ステップ S 15の No)、 RAM 102に保持されている各種署名情報と、別途作成された履歴情報とを管理簿記憶部 160に出力して (ステップ S21)、署名情報作成動作を終了する。
[0059] 次に、ファイル検出手段による検出動作 (作用)について説明する。
図 9および図 10は、ファイル検出手段の検出動作の手順を示すフローチャートであ る。以下、図 9および図 10に示す処理をステップ番号に沿って説明する。
[0060] まず、管理簿記憶部 160から検出対象の搬出ファイルの管理簿 161を取り出し、管 理情報を取得する (ステップ S31)。
次に、管理情報内の履歴情報力 搬出ファイルの出力日時 (以下「nDate」と言う) を取得する(ステップ S32)。
[0061] 次に、対照表を参照して搬出ファイルに対応する原本ファイルのうちの 1つの原本 ファイル (以下「今回の原本ファイル」と言う)の最終更新日時 (以下「oDate」と言う) を取得する(ステップ S33)。
[0062] そして、 nDateが oDate以降の日時力否かを判断する(ステップ S34)。
nDateが oDateよりも前の日時のとき(ステップ S34の No)は、搬出ファイルを、今 回の原本ファイルの派生ファイルと判断せず、ステップ S31〖こ戻る。
[0063] 一方、 nDateが oDate以降の日時のとき(ステップ S34の Yes)は、履歴情報から搬 出ファイルのファイルサイズ(以下「nSize」と言う)を取得する(ステップ S35)。
[0064] このステップ S32からステップ S35の、更新日付比較による、ファイル検出手段 170 の検出動作の処理対象とする搬出ファイルの絞り込みについては、簡易的に処理を 行いたい場合 (簡易検索処理)にのみ採用し、全件を対象としたい場合 (全件検索処 理)には採用しないよう構成することも好ましい。この場合、ステップ S31の前で簡易 検索処理と全件検索処理とを選択的に識別可能とするような図示外の入力情報に基 づき、 V、ずれの処理が選択されて 、るか識別して処理を分岐するよう構成すればよ い。
[0065] 次に、原本ファイルのファイルサイズ(以下「oSize」と言う)を取得する(ステップ S36
) o
次に、 nSizeと oSizeとが等し 、か否かを判断する (ステップ S37)。
[0066] nSizeと oSizeとが等しくなければ (ステップ S37の No)、検出処理ルーチン (ステツ プ S38)に移行する。
検出処理ルーチン力も復帰後に、ステップ S43に移行する。
[0067] 一方、 nSizeと oSizeとが等しければ (ステップ S37の Yes)、管理情報力も搬出ファ ィル全体の署名(以下「nSign」と言う)を取得する (ステップ S39)。
[0068] 次に、原本ファイルの全体の署名(以下「oSign」と言う)を作成する(ステップ S40) そして、 nSignと oSignとが等しいか否かを判断する(ステップ S41)。
[0069] nSignと oSignとが等しくなければ (ステップ S41の No)、検出処理ルーチン (ステツ プ S38)に移行する。
一方、 nSignと oSignとが等しければ (ステップ S41の Yes)、搬出ファイルを、今回 の原本ファイルの派生ファイルとみなし、この履歴情報および管理情報を原本フアイ ルの情報として出力する (ステップ S42)。
[0070] 次に、搬出ファイルと署名の比較を行っていない原本ファイルがあるか否かを判断 する(ステップ S43)。
搬出ファイルと署名の比較を行って!/、な!/、原本ファイルがある場合は (ステップ S43 の No)、ステップ S31に戻って弓 Iき続き検出動作を行う。
一方、搬出ファイルと比較を行って 、な 、原本ファイルがな 、場合は (ステップ S43 の Yes)、検出動作を終了する。
[0071] 本実施の形態では、ステップ S31— S34、ステップ S37、ステップ S39— S42を行う ことによって、検出動作の時間を短縮することができる。
なお、本実施の形態では、搬出ファイルと署名の比較を行っていない原本ファイル 力 Sない場合、すなわち、搬出ファイルの署名と、対照表を参照して得られた全ての原 本ファイルの署名とを比較した後に検出動作を終了したが、これに限らず、搬出ファ ィルを今回の原本ファイルの派生ファイルとみなした場合、搬出ファイルと署名の比 較を行って 、な 、原本ファイルがあっても検出動作を終了してもよ 、。
[0072] 図 11および図 12は、検出処理ルーチンの手順を示すフローチャートである。以下 、図 11および図 12に示す処理をステップ番号に沿って説明する。
まず、管理情報から署名作成分割数 (以下「hMax」と言う)を取得する (ステップ S5
[0073] 次に、署名作成分割数カウンタの値 (以下「hCnt」と言う)を 1に設定する (ステップ S52)。
次に、 hCntと hMaxとが等しいか否かを判断する(ステップ S53)。
[0074] hCntと hMaxとが等しくな 、場合 (ステップ S53の No)は、管理情報から検索キー ワードを取得する(ステップ S54)。
次に、取得した検索キーワードで原本ファイルを検索する (ステップ S55)。
[0075] そして、原本ファイルに検索キーワード力ヒットする部分があるか否かを判断する (ス テツプ S56)。
原本ファイルに検索キーワード力 Sヒットしなければ (ステップ S56の No)、 RAM102 に格納されて 、る不一致レジスタの値(M)をインクリメントし (ステップ S57)、ステップ S 64に移行する。
[0076] 一方、原本ファイルに検索キーワードがヒットすれば (ステップ S56の Yes)、管理情 報力も署名対象バイト数を取得する (ステップ S58)。
次に、管理情報から分割署名を取得する (ステップ S59)。
[0077] 次に、原本ファイルに含まれる検索キーワードの先頭位置力 ステップ S58で取得 した署名対象ノイト数分のファイルを取得し、このファイルの署名を作成する (ステツ プ S60)。
[0078] そして、ステップ S59で取得した分割署名とステップ S60で作成した署名とが一致 する力否かを判断する (ステップ S61)。
分割署名と原本ファイルで作成した署名とが一致しなければ (ステップ S61の No)、 分割ファイルの前回ヒットした検索キーワードの次の位置を確認して (ステップ S62)、 ステップ S56に戻る。
[0079] 一方、分割署名と原本ファイルで作成した署名とが一致すれば (ステップ S61の Ye s)、 RAM102に格納されている一致レジスタの値(N)をインクリメントする(ステップ S 63)。
[0080] 次に、 hcntをインクリメントし (ステップ S64)、ステップ S53に戻る。
そして、これらステップ S53—ステップ S64を署名作成分割数分繰り返し、 hCntと h Maxとが等しい場合 (ステップ S53の Yes)は、一致レジスタの値(N)と不一致レジス タの値(M)とを用いて、類似度 L=NZ (N+M)を求める(ステップ S65)。
次に、この類似度 Lを、予め設定しておいた類似度のしきい値 LLと比較する (ステツ プ S66)。
[0081] L< LLのときは(ステップ S66の No)、搬出ファイルを原本ファイルの派生ファイル とみなさずに、次の原本ファイルを読み込んで (ステップ S67)、ステップ S53に戻り、 この読み込んだ原本ファイルに対して前述した動作と同様の動作を行う。
[0082] 一方、 L≥LLのときは(ステップ S66の Yes)、搬出ファイルを原本ファイルの派生フ アイルとみなし、管理情報の各項目をグラフィック処理装置 104を介してモニタ 11に 表示する。
[0083] このように本実施の形態では、ファイル名の変更、ファイル内容の一部改ざん、ファ ィルの一部切り出しおよびファイル内容の追カ卩のうちのいずれか 1つまたは複数が行 われた搬出ファイルが持ち出されても、管理情報作成手段 150が、入出力監視部 14 0から受け取った搬出ファイル力も管理情報を作成し、原本ファイルにおける搬出ファ ィルの検索キーワードとヒットした部分の署名を作成し、この部分の署名と搬出フアイ ルの分割署名とを比較することによって、搬出ファイル力 該当する原本ファイルを検 出することができる。これにより、原本ファイル力 持出文書に対応する部分の元文書 を知ることができるため、取り出された文書の内容を知ることができる。
[0084] また、搬出ファイル全体のバックアップを取る必要がな 、ため、保存容量の増大を 防止することができる。
なお、本実施の形態では、管理簿に記載されたファイルに対応する原本ファイルに 対して検出動作を行った力 これに限らず、例えば、全ての原本ファイルに対して検 出動作を行ってもよい。
[0085] ところで、本実施の形態では、対照表を用いて搬出ファイルの署名作成分割数およ び検索キーワードのバイト数を決定したが、これに限らず、以下の変形例を用いること ちでさる。
[0086] (変形例 1)
予め管理者が署名作成分割数を 100分割、検索キーワードのバイト数を 8バイト等 、署名作成分割数および検索キーワードのバイト数を決定する。
[0087] (変形例 2)
原本ファイルの種類に関わらず、署名作成分割数および検索キーワードのバイト数 を割合で決定する。この割合は、単純に百分率でも良いし、その他の割合計算によ るものでもよい。但し、ファイルの容量により検索キーワードのバイト数力 極端に小さ い値または、大きい値になる可能性があるので、それぞれの限界値を決定する。これ は、原本ファイルの種類、大きさなどにより決定し、 HDD103内または、外部ファイル に格納する。 [0088] 割合によつて検索キーワードのノイト数を決めるときは、まず、署名作成分割数を決 定する。そして、その署名作成分割数が限界値以内カゝ否かを確認する。
例えば、搬出ファイルを 100分割するときに、 1分割の最小バイト数を 64バイト (約 1 行分を想定)とした場合、原本ファイルのバイト数を署名作成分割数で割った結果が 63バイト以下の場合は、 1分割当たりの分割ファイルを 64バイトとし、署名作成分割 数を変更する処理を行う。この場合の署名作成分割数は、原本ファイルのバイト数 Z 64で求められる。また、 1分割の最大バイト数を 4096バイト (約 1Z2ページ分を想定 )とした場合、原本ファイルのバイト数を署名作成分割数で割った結果力 097バイト 以上の場合は、 1分割当たりの分割ファイルを 4096バイトとし、署名作成分割数を変 更する処理を行う。この場合の分割数は、原本ファイルのバイト数 Z4096で求めら れる。
[0089] 署名作成分割数が決定すると、次に検索キーワードの割合を決定する。そして、そ の検索キーワードの割合力、分割ファイルに適応する力否かを確認する。
例えば、署名対象バイト数に対する検索キーワードのバイト数の百分率を&%とした 場合、検索キーワードのバイト数は、(分割ファイルのバイト数) Z (署名作成分割数)
X (aZlOO)で求められる。
[0090] この結果、例えば、検索キーワードが 7バイト以下の時は、検索キーワードを 8バイト とする。また、検索キーワードが 129バイト以上の時は、検索キーワードを 128バイトと する。
[0091] (変形例 3)
個々の原本ファイルの情報に基づいて署名作成分割数や検索キーワードのバイト 数を決定する。
[0092] (変形例 4)
図 13は、変形例 4のファイルの種類、署名作成分割数および検索キーワードのバイ ト数の関係を示す図である。
[0093] 変形例 4では、実施形態で述べた対照表を用 、る方法および変形例 1一 3を組み 合わせる。例えば、対照表を参照して、原本ファイルが履歴書であれば、署名作成分 割数を 5、検索キーワードを 16とし、原本ファイルが決裁書であれば変形例 2で述べ たように署名作成分割数および検索キーワードのバイト数を割合で決定する。
[0094] なお、上記の処理機能は、コンピュータによって実現することができる。その場合、 コンピュータが有すべき機能の処理内容を記述したプログラムが提供される。そのプ ログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現 される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体 に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気 記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置に は、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある 。光ディスクには、 DVD(Digital Versatile Disc), DVD— RAM(Random Access Memory), CD— ROM(Compact Disc Read Only Memory), CD— R(Recordable)/R W(ReWritable)などがある。光磁気記録媒体には、 MO(Magneto- Optical disk)などが ある。
[0095] プログラムを流通させる場合には、たとえば、そのプログラムが記録された DVD、 C D— ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンビユー タの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコ ンピュータにそのプログラムを転送することもできる。
[0096] プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプロ グラムもしくはサーバコンピュータ力 転送されたプログラムを、 自己の記憶装置に格 納する。そして、コンピュータは、自己の記憶装置力 プログラムを読み取り、プロダラ ムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログ ラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンビュ ータは、サーバコンピュータ力もプログラムが転送される毎に、逐次、受け取ったプロ グラムに従った処理を実行することもできる。
[0097] 上記については単に本発明の原理を示すものである。さらに、多数の変形、変更が 当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用 例に限定されるものではなぐ対応するすべての変形例および均等物は、添付の請 求項およびその均等物による本発明の範囲とみなされる。
符号の説明 1 コンピュータ
2 ログ出力手段
3 文書本体検出手段
4 文書保管庫
5 ログ格納部
100 コンピュータ
110 原本ファイル記憶部
150 管理情報作成手段
160 管理簿記憶部
170 ファイル検出手段
Doc(l)、 Doc(2) ···、 Doc(n) 重要文書
DA(1)、 DA(2)、 DA(3) ···、 DA(m) 分割文書
Sign (1), Sign (2), ···、 Sign(m) 署名
DSign(l)、DSign(2)、•••.Dsign(j) 署名

Claims

請求の範囲
[1] コンピュータに、文書を管理させる文書管理プログラムにおいて、
前記コンピュータを、
複数の文書本体が保管された文書保管手段から、任意の文書本体の少なくとも一 部を含む搬出文書が持ち出されたとき、前記文書を分割し、分割後の複数の分割文 書における署名をそれぞれ計算し、算出された前記各署名を含むログをログ格納部 に出力するログ出力手段、
前記ログの元文書の検出要求を受けたとき、前記文書保管手段内の前記複数の 文書本体それぞれを分割した文書の署名と、前記ログに含まれる署名とを、それぞ れ比較し、結果に応じて前記ログ出力時の前記搬出文書に対応する前記文書本体 の少なくとも一部を構成する元文書を検出する文書本体検出手段、
として機能させることを特徴とする文書管理プログラム。
[2] 前記文書本体を分割した文書の各署名と前記ログに含まれる各署名とが所定箇所 以上一致する前記文書本体を、前記文書本体の前記ログの元文書として検出するこ とを特徴とする請求の範囲第 1項記載の文書管理プログラム。
[3] 前記ログ出力手段は、前記分割文書毎に、前記分割文書の一部を検索キーワード とし、前記検索キーワードを含むログを出力し、
前記文書本体検出手段は、前記検索キーワードを含む前記文書本体を前記文書 保管手段から検索し、前記検索キーワードが前記文書本体に含まれていれば、前記 検索キーワードを含む前記分割文書の署名と、前記検索キーワードを含む前記文書 本体を分割した文書の署名とを比較することを特徴とする請求の範囲第 1項記載の 文書管理プログラム。
[4] 前記ログ出力手段は、前記各分割文書のバイト数と前記分割文書毎に作成された 分割署名とを含むログを出力し、
前記文書本体検出手段は、前記検索キーワードを含む文書本体を前記文書保管 手段から検索し、前記検索キーワードが前記文書本体に含まれていれば、前記分割 文書のバイト数から前記文書本体の前記検索キーワードを含むエリアを特定して前 記エリアの署名を作成し、前記文書本体に含まれて 、る検索キーワードの前記分割 署名と、前記エリアの署名とを比較することを特徴とする請求の範囲第 3項記載の文 書管理プログラム。
[5] 前記検索キーワードのバイト数および前記分割文書のバイト数は、前記文書本体 の種類によって予め決定されている請求の範囲第 4項記載の文書管理プログラム。
[6] 前記ログ出力手段は、前記分割文書にハッシュ関数を適用することにより前記分割 署名を作成することを特徴とする請求の範囲第 4項記載の文書管理プログラム。
[7] 文書を管理させる文書管理方法にお!、て、
ログ出力手段が、複数の文書本体が保管された文書保管手段から、任意の文書本 体の少なくとも一部の搬出文書が持ち出されたとき、前記文書を分割し、分割後の複 数の分割文書における署名をそれぞれ計算し、算出された前記各署名を含むログを ログ格納部に出力し、
文書本体検出手段が、前記ログの元文書の検出要求を受けたとき、前記文書保管 手段内の前記複数の文書本体それぞれを分割した文書の署名と、前記ログに含ま れる署名とを、それぞれ比較し、結果に応じて前記ログ出力時に対応する前記文書 本体の少なくとも一部を構成する元文書を検出する、
ことを特徴とする文書管理方法。
[8] コンピュータに、文書を管理させる文書管理プログラムを記録したコンピュータ読み 取り可能な記録媒体において、
前記コンピュータを、
複数の文書本体が保管された文書保管手段から、任意の文書本体の少なくとも一 部の搬出文書が持ち出されたとき、前記文書を分割し、分割後の複数の分割文書に おける署名をそれぞれ計算し、算出された前記各署名を含むログをログ格納部に出 力するログ出力手段、
前記ログの元文書の検出要求を受けたとき、前記文書保管手段内の前記複数の 文書本体それぞれを分割した文書の署名と、前記ログに含まれる署名とを、それぞ れ比較し、結果に応じて前記ログ出力時に対応する前記文書本体の少なくとも一部 を構成する元文書を検出する文書本体検出手段、
として機能させることを特徴とする文書管理プログラムを記録したコンピュータ読み 取り可能な記録媒体。
PCT/JP2005/005023 2005-03-18 2005-03-18 文書管理プログラムおよび文書管理方法 WO2006100739A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007509093A JP4615010B2 (ja) 2005-03-18 2005-03-18 文書管理プログラムおよび文書管理方法
PCT/JP2005/005023 WO2006100739A1 (ja) 2005-03-18 2005-03-18 文書管理プログラムおよび文書管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/005023 WO2006100739A1 (ja) 2005-03-18 2005-03-18 文書管理プログラムおよび文書管理方法

Publications (1)

Publication Number Publication Date
WO2006100739A1 true WO2006100739A1 (ja) 2006-09-28

Family

ID=37023436

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/005023 WO2006100739A1 (ja) 2005-03-18 2005-03-18 文書管理プログラムおよび文書管理方法

Country Status (2)

Country Link
JP (1) JP4615010B2 (ja)
WO (1) WO2006100739A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008090959A1 (ja) 2007-01-24 2008-07-31 Kyowa Hakko Kirin Co., Ltd. エフェクター活性が増強された遺伝子組換え抗体組成物
JP2009020720A (ja) * 2007-07-12 2009-01-29 Sky Kk ファイル管理システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01163871A (ja) * 1987-12-21 1989-06-28 Hitachi Ltd 伝票圧縮文の作成方法
JP2000172548A (ja) * 1998-12-11 2000-06-23 Nippon Telegr & Teleph Corp <Ntt> 電子データ管理方法,装置およびそのプログラム記録媒体
JP2003303276A (ja) * 2002-04-11 2003-10-24 Ricoh Co Ltd 稟議システムおよび稟議決裁方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3705891B2 (ja) * 1997-04-07 2005-10-12 富士通株式会社 コンピュータシステム
JPH11328422A (ja) * 1998-03-13 1999-11-30 Matsushita Electric Ind Co Ltd 画像識別装置
AU2000238402B2 (en) * 2000-04-20 2005-04-28 Yutaka Yasukura Electronic information inquiring method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01163871A (ja) * 1987-12-21 1989-06-28 Hitachi Ltd 伝票圧縮文の作成方法
JP2000172548A (ja) * 1998-12-11 2000-06-23 Nippon Telegr & Teleph Corp <Ntt> 電子データ管理方法,装置およびそのプログラム記録媒体
JP2003303276A (ja) * 2002-04-11 2003-10-24 Ricoh Co Ltd 稟議システムおよび稟議決裁方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008090959A1 (ja) 2007-01-24 2008-07-31 Kyowa Hakko Kirin Co., Ltd. エフェクター活性が増強された遺伝子組換え抗体組成物
JP2009020720A (ja) * 2007-07-12 2009-01-29 Sky Kk ファイル管理システム

Also Published As

Publication number Publication date
JPWO2006100739A1 (ja) 2008-08-28
JP4615010B2 (ja) 2011-01-19

Similar Documents

Publication Publication Date Title
US20230409713A1 (en) Ransomware infection detection in filesystems
US7912866B2 (en) System and method for detecting and storing file identity change information within a file system
JP5058495B2 (ja) ゴースト化による同期
US7272606B2 (en) System and method for detecting and storing file content access information within a file system
Carrier File system forensic analysis
US7917481B1 (en) File-system-independent malicious content detection
JP5644777B2 (ja) ファイル群整合性検証システム、ファイル群整合性検証方法およびファイル群整合性検証用プログラム
US20100306180A1 (en) File revision management
US20090198744A1 (en) Electronic file managing apparatus and electronic file managing method
US20110208744A1 (en) Methods for detecting and removing duplicates in video search results
US7814070B1 (en) Surrogate hashing
US20080140660A1 (en) System and Method for File Authentication and Versioning Using Unique Content Identifiers
US11113148B2 (en) Methods and systems for metadata tag inheritance for data backup
JP2010198370A (ja) アーカイブ装置、変換装置および変換プログラム
US10503605B2 (en) Method of detecting source change for file level incremental backup
US20200242080A1 (en) Methods and Systems for Natural Language Processing of Metadata
US8725766B2 (en) Searching text and other types of content by using a frequency domain
US20200242077A1 (en) Methods and Systems for Metadata Tag Inheritance Between Multiple Storage Systems
US11100048B2 (en) Methods and systems for metadata tag inheritance between multiple file systems within a storage system
WO2006100739A1 (ja) 文書管理プログラムおよび文書管理方法
US11526506B2 (en) Related file analysis
JP7007565B2 (ja) 情報処理装置および情報処理プログラム
CN103870476A (zh) 检索方法及设备
US20220391356A1 (en) Duplicate file management for content management systems and for migration to such systems
US20110307492A1 (en) Multi-region cluster representation of tables of contents for a volume

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2007509093

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

NENP Non-entry into the national phase

Ref country code: RU

WWW Wipo information: withdrawn in national office

Country of ref document: RU

122 Ep: pct application non-entry in european phase

Ref document number: 05721173

Country of ref document: EP

Kind code of ref document: A1

WWW Wipo information: withdrawn in national office

Ref document number: 5721173

Country of ref document: EP