JP2012174151A - File tracking device, file tracking method and file tracking program - Google Patents

File tracking device, file tracking method and file tracking program Download PDF

Info

Publication number
JP2012174151A
JP2012174151A JP2011037818A JP2011037818A JP2012174151A JP 2012174151 A JP2012174151 A JP 2012174151A JP 2011037818 A JP2011037818 A JP 2011037818A JP 2011037818 A JP2011037818 A JP 2011037818A JP 2012174151 A JP2012174151 A JP 2012174151A
Authority
JP
Japan
Prior art keywords
file
log
tracking
date
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011037818A
Other languages
Japanese (ja)
Other versions
JP5701096B2 (en
Inventor
Hiroyuki Sakakibara
裕之 榊原
Shoji Sakurai
鐘治 桜井
Koji Anzai
宏司 安西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Mitsubishi Electric Information Systems Corp
Mitsubishi Electric Information Technology Corp
Original Assignee
Mitsubishi Electric Corp
Mitsubishi Electric Information Systems Corp
Mitsubishi Electric Information Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, Mitsubishi Electric Information Systems Corp, Mitsubishi Electric Information Technology Corp filed Critical Mitsubishi Electric Corp
Priority to JP2011037818A priority Critical patent/JP5701096B2/en
Publication of JP2012174151A publication Critical patent/JP2012174151A/en
Application granted granted Critical
Publication of JP5701096B2 publication Critical patent/JP5701096B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To solve the problem that whether or not a processing object file is generated by copy and transfer operations from a different file by tracking only a file operation log.SOLUTION: In trace-back, a narrowed period acquisition part 1116 acquires a narrowed period until a final trace object file is opened and preserved from a log entry, a tracking candidate generation part 1126 turns a different file separately opened in the narrowed period to a candidate file of a copy origin, and an additional trace determination part 1107 calculates similarity between the information of the final trace object file and the information of the candidate file, compares the similarity with a threshold, and estimates the candidate file whose similarity is larger than the threshold as the copy origin.

Description

この発明は、所定のファイルである処理対象ファイルを作成した元のファイルを、複数のログエントリを追跡して推定するファイル追跡装置に関する。また、処理対象ファイルから生成された他のファイルを複数のログエントリを追跡して推定するファイル追跡装置に関する。特に、処理対象ファイルが元のファイルに記憶された一部の情報から生成されたか推定する、或いは、処理対象ファイルに記憶された一部の情報から生成された他のファイルを推定することに関する。   The present invention relates to a file tracking device that estimates an original file that created a processing target file, which is a predetermined file, by tracking a plurality of log entries. The present invention also relates to a file tracking device that estimates other files generated from a processing target file by tracking a plurality of log entries. In particular, the present invention relates to estimating whether a processing target file is generated from a part of information stored in the original file or estimating another file generated from a part of information stored in the processing target file.

例えば、従来どのような場合に、処理対象ファイルを作成した元のファイルを推定するか、説明する。組織の従業員が組織内のファイルサーバ装置に機密ファイルとして管理記憶されているファイルをメールに添付し、添付ファイルとして組織外部に送出した場合がある。メール送信後、メールに添付されたファイルが機密ファイルに由来するか否か調査することがある。例えば、機密ファイルが格納されたファイルサーバ装置から取得したファイルを、リネームして、リネームしたファイルをメールに添付して添付ファイルとして送信した場合、添付ファイルはファイルサーバに記憶された機密ファイルが由来である。この様な調査により、組織の機密ファイル管理者は機密ファイルが送出されたことが分かると、当該メールの送信先に添付ファイルの削除を依頼するなどの対応を行なう。
メールに添付されて送信されたファイルを生成する元となった元ファイル(添付されたファイルの由来)を調べる方法として、添付されたファイルが操作された際のファイルの操作履歴(ログエントリ)を追跡(トレース)することで、添付されたファイルの元となった元ファイルを追跡調査する方法がある。
For example, a case where the original file that created the processing target file is estimated will be described below. There are cases where an employee of an organization attaches a file managed and stored as a confidential file in a file server device in the organization to an email and sends the file as an attached file outside the organization. After sending an email, it may be investigated whether the file attached to the email comes from a confidential file. For example, if a file acquired from a file server device that stores a confidential file is renamed, and the renamed file is attached to an email and sent as an attached file, the attached file is derived from the confidential file stored in the file server It is. When the confidential file manager of the organization knows that the confidential file has been sent out by such an investigation, the organization performs a response such as requesting the destination of the mail to delete the attached file.
As a method of examining the original file (origin of the attached file) that generated the file attached to the email and sent, the operation history (log entry) of the file when the attached file was operated There is a method of tracking the original file that is the source of the attached file by tracing.

また、処理対象ファイルが、元ファイルに記憶された情報の一部を用いて生成されたかを、クリップボードに記憶された情報を追跡して判定するものがあった。   In addition, there is a method of determining whether a processing target file is generated by using a part of information stored in an original file by tracking information stored in a clipboard.

特開2009−026294号公報JP 2009-026294 A

特開2009−26294号公報に記載された発明では、クリップボードを監視することでコピー操作・ペースト操作を把握している。しかし、この様な方式ではクリップボードを監視する機能が必要であり、方式によってはクリップボード操作ログを分析する必要があるため、分析対象ログ種類が増え、ログ量も増大する課題がある。   In the invention described in Japanese Patent Laid-Open No. 2009-26294, the copy operation / paste operation is grasped by monitoring the clipboard. However, such a method requires a function for monitoring the clipboard, and depending on the method, it is necessary to analyze the clipboard operation log, so that there is a problem that the number of logs to be analyzed increases and the amount of logs also increases.

また、ファイル操作ログには、ファイルの生成、ファイルの保存、ファイルの削除、ファイルのリネーム、ファイルの移動、表計算ソフトウエアなどのアプリケーションによるファイルのオープン/クローズなどが記憶されている。この様な動作が履歴として記憶されたファイル操作ログから、ファイルのトレースを行なうことができる。しかし、処理対象ファイルを元のファイルに記憶された一部の情報から生成する複写及び貼付操作(元のファイルの一部を複写(コピー)する操作を行い、コピーしたファイルの一部を処理対象ファイルに貼り付ける(ペースト)操作を行うことにより元のファイルの一部から処理対象ファイルを生成する、ファイルのコピーアンドペースト)、或いは、処理対象ファイルに記憶された一部の情報から生成された他のファイルを生成する複写及び貼付操作(処理対象ファイルの一部を複写(コピー)する操作を行い、コピーしたファイルの一部を他のファイルに貼り付ける(ペースト)操作を行うことにより処理対象ファイルの一部から他のファイルを生成する、ファイルのコピーアンドペースト)では、ファイル間のデータのコピーアンドペーストの記録が操作ログに残らない。このため、ファイル操作ログしか採取できない運用環境の場合、ファイルのコピーアンドペーストによって生成されたファイルであるのか、ファイルのコピーアンドペーストによって別のファイルを生成する元のファイルであるのか、操作ログから推定することができない。   The file operation log stores file generation, file saving, file deletion, file renaming, file movement, file open / close by an application such as spreadsheet software, and the like. A file can be traced from a file operation log in which such an operation is stored as a history. However, a copy and paste operation that generates a file to be processed from a part of information stored in the original file (a part of the original file is copied and copied) A file to be processed is generated from a part of the original file by performing a paste operation on the file (copy and paste of the file), or generated from a part of information stored in the file to be processed Copy and paste operations that generate other files (perform processing by copying part of the file to be processed and pasting part of the copied file into other files) Copying and pasting files from one part of a file to another, copying and pasting data between files Record of the paste does not remain in the operation log. For this reason, in an operating environment where only file operation logs can be collected, whether it is a file generated by copying and pasting a file, or an original file that generates another file by copying and pasting a file, Cannot be estimated.

この発明は、ファイル操作ログしか採取できない運用環境において、操作ログのみからでもファイルのコピーアンドペーストを判断することを可能にする。
また、処理対象ファイルを生成した元ファイルを追跡する方法(トレースバック)、或いは、処理対象ファイルから生成した他のファイルを追跡する方法(トレースフォワード)を利用して複数の操作ログから、ファイル間のデータのコピーアンドペーストの操作を推定し、当該操作を行ったファイルを追跡する。
The present invention makes it possible to determine copy and paste of a file only from an operation log in an operating environment in which only a file operation log can be collected.
In addition, using the method of tracing the original file that generated the processing target file (trace back) or the method of tracking the other file generated from the processing target file (trace forward), multiple operation logs can be The data copy and paste operation is estimated, and the file on which the operation is performed is traced.

この発明に係るファイル追跡装置であって、処理対象ファイルを生成した元のファイルを、複数のログエントリを追跡して推定するファイル追跡装置は、
操作コマンドと、操作したファイルのファイル名を含む操作内容と、操作が行われた日時を表すタイムスタンプとを有するログエントリを複数記憶した操作ログ記憶部と、
上記処理対象ファイルの処理対象ファイル名を入力し、上記操作ログ記憶部に記憶された複数のログエントリからログエントリが有する操作コマンドと操作内容とを用いて、上記処理対象ファイルを保存する操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプを保存日時として取得するとともに、取得した保存日時までに、上記処理対象ファイルを開く操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをオープン日時として取得し、取得したオープン日時と上記保存日時とを有するしぼり込み期間を出力するしぼり込み期間取得部と、
上記しぼり込み期間取得部が出力したしぼり込み期間を入力し、上記操作ログ記憶部が記憶した複数のログエントリからログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて、入力したしぼり込み期間に、上記処理対象ファイル名と類似する類似ファイル名のファイルを開く操作と閉じる操作とのいずれかの操作を行ったことを表すログエントリを1つ以上抽出し、抽出した1つ以上の各ログエントリを追跡候補ログとして記憶装置に記憶する追跡候補生成部と、
上記追跡候補生成部が記憶装置に記憶した追跡候補ログを順次入力し、入力した追跡候補ログが有する操作内容に含まれた類似ファイル名が表すファイルに記憶された情報を追跡候補情報として入力し、上記類似ファイル名の類似ファイルを生成した元のファイルを複数のログエントリを追跡して推定するか否かを、入力した追跡候補情報を用いて判定し、推定することを判定した追跡候補ログを出力する追加追跡ログ判定部と、
上記追加追跡ログ判定部が出力した追跡候補ログを、追加追跡ログとして記憶する追加追跡ログ記憶部と、
上記追加追跡ログ記憶部に記憶された追加追跡ログが有する操作内容に含まれた上記類似ファイル名を入力し、入力した類似ファイル名の類似ファイルを生成した元のファイルを、上記処理対象ファイルを生成した元のファイルとして、複数のログエントリを追跡して推定する追跡部と
を備えたことを特徴とする。
The file tracking apparatus according to the present invention, the file tracking apparatus for estimating the original file that generated the processing target file by tracking a plurality of log entries,
An operation log storage unit that stores a plurality of log entries each including an operation command, an operation content including the file name of the operated file, and a time stamp indicating the date and time when the operation was performed;
An operation for inputting the processing target file name of the processing target file and saving the processing target file using an operation command and operation contents of the log entry from a plurality of log entries stored in the operation log storage unit. A log entry indicating that the processing has been performed is extracted, and the time stamp of the extracted log entry is acquired as the storage date and time, and the log entry indicating that the operation to open the processing target file is performed by the acquired storage date and time. Extracting, acquiring a time stamp included in the extracted log entry as an open date, and outputting a squeeze period acquisition unit having the acquired open date and the storage date and time;
The squeezing period output by the squeezing period acquisition unit is input, and the squeezing that is input using the time stamp, operation command, and operation content of the log entry from the plurality of log entries stored by the operation log storage unit. One or more log entries indicating that any one of an operation of opening and closing a file having a similar file name similar to the file name to be processed in the period is extracted, and each of the extracted one or more A tracking candidate generator for storing the log entry in the storage device as a tracking candidate log;
The tracking candidate generation unit sequentially inputs the tracking candidate log stored in the storage device, and inputs the information stored in the file represented by the similar file name included in the operation content of the input tracking candidate log as the tracking candidate information. Whether or not to estimate the original file that generated the similar file with the similar file name by tracking a plurality of log entries is determined using the input tracking candidate information, and the tracking candidate log determined to be estimated An additional tracking log determination unit that outputs
An additional tracking log storage unit that stores the tracking candidate log output by the additional tracking log determination unit as an additional tracking log;
The similar file name included in the operation content of the additional tracking log stored in the additional tracking log storage unit is input, the original file that generated the similar file with the input similar file name is changed to the processing target file. The generated original file includes a tracking unit that tracks and estimates a plurality of log entries.

本願発明のファイル追跡装置によれば、従来、複数のログエントリだけでは追跡(トレース)できなかった複写及び貼り付けの操作により生成したファイルの元ファイルを推定できる効果がある。さらに、元ファイルの候補の特定においては、元ファイルの候補としたファイルに記憶された情報とトレース対象ファイルに記憶された情報との類似度に基づいて元ファイルを推定することができる。   According to the file tracking apparatus of the present invention, there is an effect that it is possible to estimate an original file of a file generated by copying and pasting operations that could not be tracked (traced) by a plurality of log entries. Furthermore, in specifying the original file candidate, the original file can be estimated based on the similarity between the information stored in the file as the original file candidate and the information stored in the trace target file.

ファイルに対する操作を追跡(トレース)する一例を示す図。The figure which shows an example which tracks (traces) the operation with respect to a file. ファイル追跡装置が動作するファイル追跡システムの構成を説明するブロック図。The block diagram explaining the structure of the file tracking system which a file tracking apparatus operate | moves. ファイル追跡システム及びファイル追跡装置の外観の一例を示す図。The figure which shows an example of the external appearance of a file tracking system and a file tracking apparatus. ファイル追跡システム1及びファイル追跡装置のハードウェア資源の一例を示す図。The figure which shows an example of the hardware resource of the file tracking system 1 and a file tracking apparatus. 実施の形態1のファイル追跡システムで使用する各種期間を説明する図。The figure explaining the various periods used with the file tracking system of Embodiment 1. FIG. 実施の形態1のトレース部及びコピーアンドペーストファイル特定部のブロック図。FIG. 3 is a block diagram of a trace unit and a copy and paste file specifying unit according to the first embodiment. 実施の形態1のトレース部の動作を説明するフローチャート。6 is a flowchart for explaining the operation of the trace unit according to the first embodiment. 実施の形態1のコピーアンドペーストファイル特定部1106及び追加トレース判断部1107の動作を示すフローチャート。5 is a flowchart showing operations of a copy and paste file specifying unit 1106 and an additional trace determining unit 1107 according to the first embodiment. 実施の形態1のコピーアンドペーストファイル特定部1106のしぼり込み期間取得部1116の動作を示すフローチャート。10 is a flowchart showing the operation of a squeezing period acquisition unit 1116 of the copy and paste file specifying unit 1106 according to the first embodiment. 実施の形態1のコピーアンドペーストファイル特定部1106の追跡候補生成部1126の動作を示すフローチャート。6 is a flowchart showing an operation of a tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106 according to the first embodiment. 実施の形態1のファイル追跡システム1が使用する各種期間を説明する図。The figure explaining the various periods which the file tracking system 1 of Embodiment 1 uses. 実施の形態2のトレース部の動作を示すフローチャート。9 is a flowchart showing the operation of the trace unit according to the second embodiment. 実施の形態2のコピーアンドペーストファイル特定部1106、追加トレース判断部1107の動作を示すフローチャート。10 is a flowchart showing operations of a copy and paste file specifying unit 1106 and an additional trace determining unit 1107 according to the second embodiment. 実施の形態2のコピーアンドペーストファイル特定部1106のしぼり込み期間取得部の動作を示すフローチャート。10 is a flowchart showing an operation of a squeezing period acquisition unit of the copy and paste file specifying unit 1106 according to the second embodiment. 実施の形態2のコピーアンドペーストファイル特定部1106の追跡候補生成部1126の動作を示すフローチャート。10 is a flowchart showing the operation of the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106 according to the second embodiment. 実施の形態4のペースト先とコピー元の拡張子の組み合わせとスコアを示した表を示す図。The figure which shows the table | surface which showed the combination and score of the paste destination and copy origin extension of Embodiment 4. FIG. トレース部及びコピーアンドペーストファイル特定部、追加トレース判断部の処理の概要を表すフローチャート。The flowchart showing the outline | summary of a process of a trace part, a copy and paste file specific | specification part, and an additional trace judgment part. ログエントリの一例を示す図。The figure which shows an example of a log entry.

以下に説明する実施の形態では、操作ログをログエントリとする。ファイルに対して複写及び貼り付け操作を行うことをコピーアンドペーストと呼ぶ。複数のログエントリを追跡することをトレースと呼ぶ。あるファイルを元にして作成されたファイルを複数のログエントリをトレースして推定する処理をトレースバックと呼ぶ。トレースバックにおいて、上記あるファイルを処理対象ファイル、或いは、トレース対象ファイル、最終トレース対象ファイルと呼び、特に、以下に説明するトレース部においては処理対象ファイル、或いは、トレース対象ファイルと呼び、コピーアンドペーストファイル特定部と追加トレース判断部においては最終トレース対象ファイルと呼ぶ。あるファイルを元にして生成されたファイルを複数のログエントリをトレースして推定する処理をトレースフォワードと呼ぶ。トレースフォワードにおいて、元にしたあるファイルを処理対象ファイル、或いは、トレース対象ファイル、最終トレース対象ファイルと呼び、特に、以下に説明するトレース部においては処理対象ファイル、或いは、トレース対象ファイルと呼び、コピーアンドペーストファイル特定部と追加トレース判断部においては、最終トレース対象ファイルと呼ぶ。電子メールを、単にメールと呼ぶ。
最初の実施の形態で、トレースバックにおいて、トレース対象ファイルをオープンし保存するまでの期間に別途開いていたファイルを推定し、推定したファイルをコピー元の候補とし、トレース対象ファイルに記憶された情報と、候補とした該ファイルに記憶された情報との類似度を調べることで、該ファイルをコピー元であることを特定するファイル追跡装置の一例を説明する。
別の実施の形態で、トレースフォワードにおいて、トレース対象ファイルをオープンしクローズするまでの期間に別途保存したファイルを推定し、推定したファイルをコピー先の候補とし、トレース対象ファイルに記憶された情報と候補とした該ファイルに記憶された情報との類似度を調べることで、該ファイルをコピー先であることを特定するファイル追跡装置の一例を説明する。
まず、トレースバック或いはトレースフォワードを行う運用環境を説明する。
In the embodiment described below, an operation log is a log entry. Performing copy and paste operations on a file is called copy and paste. Tracking multiple log entries is called tracing. The process of estimating a file created based on a certain file by tracing a plurality of log entries is called traceback. In traceback, the above-mentioned file is called a process target file, a trace target file, or a final trace target file. In particular, in the trace section described below, it is called a process target file or a trace target file, and is copied and pasted. In the file specifying part and the additional trace determining part, it is called a final trace target file. A process of estimating a file generated based on a certain file by tracing a plurality of log entries is called trace forward. In trace forward, a file based on a process is called a process target file, a trace target file, or a final trace target file. In particular, in the trace section described below, a process target file or a trace target file is called and copied. In the and paste file specifying part and the additional trace determining part, it is called a final trace target file. E-mail is simply called mail.
In the first embodiment, in the trace back, information that is separately opened during the period until the trace target file is opened and saved is estimated, the estimated file is set as a copy source candidate, and the information stored in the trace target file An example of a file tracking device that identifies the file as a copy source by examining the similarity between the file and information stored in the candidate file will be described.
In another embodiment, in the trace forward, a file that is separately stored in a period until the trace target file is opened and closed is estimated, the estimated file is set as a copy destination candidate, and the information stored in the trace target file is An example of a file tracking device that identifies the file as a copy destination by examining the similarity with the information stored in the file as a candidate will be described.
First, an operational environment for performing trace back or trace forward will be described.

図1は、ファイルに対する操作を追跡(トレース)する一例を示す図である。
図1において、機密ファイル91がファイルサーバ90に記憶されている。機密ファイル91のファイル名はaaa.csvである。社員Aが端末Aからファイル名bbb.csvであるファイルを電子メールに添付して、社員Aが所属する組織以外の別の組織にメールサーバ94を介してインターネット940経由で送信する(1)。
(1)の操作を行うと、メールログ(メールを生成、送信する等のメール編集操作の履歴情報)に「社員Aのメールアドレスからファイル bbb.csv をメール添付・送信」という記録がされる。
ファイルサーバの管理者は、(1)の操作で記録されたメールログを確認して、ファイル名bbb.csvであるファイルが電子メールに添付されて他の組織に送信されたことを把握する(2)。
ファイルサーバの管理者は、(2)で把握した電子メールが送信された日時を含む一定の期間内にファイルサーバから端末Aにダウンロードされたファイルを、ファイルサーバの操作ログを確認して把握する(3)。
ファイルサーバから端末Aにファイルがダウンロードされた際、ファイルサーバログに「ファイルサーバから端末Aへaaa.csvをダウンロード」という操作ログの記録がされる。(3)ではファイルサーバの管理者は、記録された操作ログを確認する。
ファイルサーバの管理者は、ダウンロードされたファイルのファイル名と、添付されたファイルのファイル名とが異なるため、社員Aの使用端末である端末Aのファイル操作ログを確認して、ダウンロードされたファイルに対してファイル名を変更するリネーム操作が行われていないか確認する(4)。
社員Aの使用端末である端末Aにおいて、ダウンロードされたファイルに対してファイル名を変更するリネーム操作が行われた際、端末Aの操作ログに「ファイルaaa.csvをファイルbbb.csvにリネーム」という操作ログの記録がされる。
これらの記録を(1)のメール送信の記録から遡って追跡すると、社員Aがメールに添付して送信した添付ファイルbbb.csvはaaa.csvが由来であることが分かる。この様に時間的に遡って、送信したファイルの取り扱いを調査する方法をトレースバックという。図1では、メールに添付されたbbb.csvをトレース対象ファイルとする。各操作ログ97はログ分析サーバ96に集められトレースバックされる。
FIG. 1 is a diagram illustrating an example of tracing (tracing) an operation on a file.
In FIG. 1, a confidential file 91 is stored in the file server 90. The file name of the confidential file 91 is aaa. csv. Employee A sends file name bbb. The csv file is attached to the e-mail and transmitted to another organization other than the organization to which the employee A belongs via the Internet 940 via the mail server 94 (1).
When the operation (1) is performed, the mail log (history information on mail editing operations such as generating and sending mail) is recorded as “attaching / sending file bbb.csv from the mail address of employee A”. .
The administrator of the file server confirms the mail log recorded by the operation (1), and checks the file name bbb. It is grasped that the file as csv is attached to the e-mail and transmitted to another organization (2).
The file server administrator confirms the file downloaded from the file server to the terminal A within a certain period including the date and time when the e-mail grasped in (2) is confirmed by checking the operation log of the file server. (3).
When a file is downloaded from the file server to the terminal A, an operation log of “download aaa.csv from the file server to the terminal A” is recorded in the file server log. In (3), the administrator of the file server confirms the recorded operation log.
Since the file name of the downloaded file is different from the file name of the attached file, the file server administrator checks the file operation log of terminal A, which is the terminal used by employee A, and downloads the downloaded file. It is confirmed whether or not a rename operation for changing the file name is performed (4).
When the rename operation for changing the file name is performed on the downloaded file in the terminal A which is the terminal used by the employee A, the “rename file aaa.csv to the file bbb.csv” is recorded in the operation log of the terminal A. The operation log is recorded.
When these records are traced back from the mail transmission record of (1), the attached file bbb. csv is aaa. It can be seen that csv is derived. A method of investigating the handling of the transmitted file going back in time is called traceback. In FIG. 1, bbb. Let csv be the trace target file. Each operation log 97 is collected in the log analysis server 96 and traced back.

また、ファイルサーバからダウンロードされたファイルが、ダウンロード後どのように取り扱われ、最終的に組織外部へ送出されたか、複数の操作ログを分析して調査するトレースフォワードがある。トレースフォワードは、トレースバックとは逆の手順で複数のログを分析して調査する。具体的には、トレースフォワードは、ファイルサーバからダウンロードされたファイルをトレース対象ファイルとし、トレース対象ファイルから生成されたファイルを操作ログを追跡して推定する。   In addition, there is a trace forward in which a plurality of operation logs are analyzed and investigated as to how a file downloaded from a file server is handled after downloading and finally sent out of the organization. Trace forward analyzes and investigates multiple logs in the reverse procedure of traceback. Specifically, in the trace forward, a file downloaded from a file server is set as a trace target file, and a file generated from the trace target file is estimated by tracing an operation log.

実施の形態1.
この実施の形態1では、トレースバックを行うファイル追跡装置であって、コピーアンドペーストの操作を行ったファイルを複数のログエントリから推定するファイル追跡装置の一例を説明する。
Embodiment 1 FIG.
In the first embodiment, an example of a file tracking apparatus that performs traceback and estimates a file that has been subjected to copy and paste operations from a plurality of log entries will be described.

本実施の形態では、組織の従業員が使用する計算機を「端末」と呼ぶ。「端末」は、その端末を使用して端末外部からファイルを入力するファイル操作を表すファイル操作情報や、端末の記憶装置に記憶されたファイルに対して行ったファイル操作を表すファイル操作情報を履歴によって記録した操作ログファイルを記憶した記憶装置を有する。
ファイル追跡装置は、端末とは別の計算機であるファイル追跡サーバであるファイル追跡システムにより動作する。ファイル追跡システムは、端末から操作ログファイルを定期的に取り込む。その方法の例として、端末にあらかじめインストールした自動ファイル転送プログラムが、操作ログファイルを定期的にファイル追跡システムへ転送して実現する方法がある。操作ログファイルのファイル追跡システムへの転送方法は当例に限定せず他の方法であってもよい。
In this embodiment, a computer used by employees of an organization is called a “terminal”. “Terminal” has a history of file operation information representing file operations for inputting files from the outside of the terminal using the terminal, and file operation information representing file operations performed on files stored in the storage device of the terminal. A storage device storing the operation log file recorded by
The file tracking device operates by a file tracking system that is a file tracking server that is a computer different from the terminal. The file tracking system periodically fetches operation log files from the terminal. As an example of the method, there is a method in which an automatic file transfer program installed in a terminal in advance is realized by periodically transferring an operation log file to a file tracking system. The method of transferring the operation log file to the file tracking system is not limited to this example, and other methods may be used.

ファイル追跡装置の構成を説明する。
図2は、ファイル追跡装置が動作するファイル追跡システムの構成を説明するブロック図である。
なお、ファイル追跡システム1はトレースバック、とその逆のトレースである、トレースフォワードの両方を処理するが、本実施の形態では、トレースバックの処理について説明する。
図2を用いて本発明のファイル追跡システムの構成説明を行う。
ファイル追跡システム1は、トレース部1104、トレース結果判断部1105、コピーアンドペーストファイル特定部1106、追加トレース判断部1107、期間入力部1108、操作ログファイル取り込み部1103、外部入力ログファイル取り込み部1101a、外部入力ファイル特定部1102a、外部出力ログファイル取り込み部1101b、外部出力ファイル特定部1102bを備える。
The configuration of the file tracking device will be described.
FIG. 2 is a block diagram illustrating the configuration of a file tracking system in which the file tracking device operates.
The file tracking system 1 processes both trace back and trace forward, which is the reverse of the trace. In the present embodiment, the trace back processing will be described.
The configuration of the file tracking system of the present invention will be described with reference to FIG.
The file tracking system 1 includes a trace unit 1104, a trace result determining unit 1105, a copy and paste file specifying unit 1106, an additional trace determining unit 1107, a period input unit 1108, an operation log file capturing unit 1103, an external input log file capturing unit 1101a, An external input file specifying unit 1102a, an external output log file capturing unit 1101b, and an external output file specifying unit 1102b are provided.

以下に、ファイル追跡システムが備える各要素について概要を説明する。
・外部入力ログファイル取り込み部1101a
外部入力ログファイル取り込み部1101aは、ファイル追跡システム1の外部から外部入力ログファイル2101aを入力する。外部入力ログファイル取り込み部1101aは、入力した該ファイルに記憶された操作ログを表す外部入力ログ2201aを当該ログのフォーマットに従い取り出し出力する。例えば、ファイル追跡システム1は、あらかじめ外部入力ログファイル2101aのファイル名と該ファイルが記憶する操作ログのフォーマットを定義したフォーマット定義情報を記憶装置に記憶する。外部入力ログファイル取り込み部1101aは、入力した外部入力ログファイル2101aのファイル名と一致するファイル名を記憶装置から検索し、検索したファイル名に対応するフォーマット定義情報に基づいて外部入力ログファイル2101aから外部入力ログ2201aを取得する。
外部入力ログファイル2101aは、端末外部から端末へファイルの入力操作が行なわれたことが記録されている操作ログを記憶したログファイルである。本実施の形態では、外部入力ログファイル2101aを、ファイルサーバからファイルを端末にダウンロードしたことを記録している操作ログを記憶したファイルサーバログファイルとする。外部入力ログ2201aは、ファイルサーバログファイルに記憶されたファイルサーバログである。ファイルサーバログには、ファイルサーバから端末にファイルをダウンロードしたダウンロード日時、ダウンロードした端末の識別子、ダウンロードの操作を表す操作コマンド、ダウンロードファイル名などを有するログエントリが複数記録されている。
The outline of each element provided in the file tracking system will be described below.
External input log file import unit 1101a
The external input log file capturing unit 1101a inputs the external input log file 2101a from the outside of the file tracking system 1. The external input log file capturing unit 1101a extracts and outputs an external input log 2201a representing an operation log stored in the input file according to the format of the log. For example, the file tracking system 1 stores in the storage device the format definition information that defines the file name of the external input log file 2101a and the format of the operation log stored in the file in advance. The external input log file import unit 1101a searches the storage device for a file name that matches the file name of the input external input log file 2101a, and from the external input log file 2101a based on the format definition information corresponding to the searched file name. The external input log 2201a is acquired.
The external input log file 2101a is a log file that stores an operation log in which a file input operation is performed from the outside of the terminal to the terminal. In the present embodiment, the external input log file 2101a is a file server log file that stores an operation log recording that a file has been downloaded from the file server to the terminal. The external input log 2201a is a file server log stored in a file server log file. In the file server log, a plurality of log entries having a download date and time when a file is downloaded from the file server to the terminal, an identifier of the downloaded terminal, an operation command indicating a download operation, a download file name, and the like are recorded.

・外部出力ログファイル取り込み部1101b
外部出力ログファイル2101bを入力し、該ファイルからログの内容である外部出力ログ2201bをログのフォーマットに従い取り出し出力する。
外部出力ログファイル2101bは、端末から端末外部へファイルを出力したことが記録されている操作ログを記憶したログファイルである。本実施の形態では、外部出力ログファイル2101bをメールログファイルとする。その場合、外部出力ログ2201bはメールログファイルに記憶されたログエントリ(メールログ)である。メールログには、送信日時、送信元メールアドレス、あて先メールアドレス、メールに添付されて送信した操作を表す操作コマンド、添付ファイル名などを有するログエントリが複数記録されている。
External output log file import unit 1101b
The external output log file 2101b is input, and the external output log 2201b which is the contents of the log is extracted from the file according to the log format and output.
The external output log file 2101b is a log file that stores an operation log in which a file output from the terminal to the outside of the terminal is recorded. In the present embodiment, the external output log file 2101b is a mail log file. In this case, the external output log 2201b is a log entry (mail log) stored in the mail log file. In the mail log, a plurality of log entries having a transmission date and time, a transmission source mail address, a destination mail address, an operation command indicating an operation transmitted by being attached to the mail, an attached file name, and the like are recorded.

・外部入力ファイル特定部1102a
外部入力ログ2201aを入力し、外部入力ファイル特定条件2102aに従い、端末外部から端末へ入力されたファイルである外部入力ファイルを特定し、外部入力ファイル名2202aとファイル入力日時2203aを出力する。
外部入力ログ2201aがファイルサーバログの場合は、外部入力ファイル名2202aはファイルサーバからダウンロードされたファイル名(ダウンロードファイル名)であり、ファイル入力日時2203aはダウンロードされた日時(ダウンロード日時)である。
外部入力ファイル特定条件2102aは、外部入力ファイルを特定する条件を指定する。該条件として、機密ファイルを特定する条件を指定する。本実施の形態では、「ファイルサーバからダウンロードされたファイル」という条件とする。
External input file specifying unit 1102a
The external input log 2201a is input, an external input file that is a file input from the outside of the terminal to the terminal is specified according to the external input file specifying condition 2102a, and an external input file name 2202a and a file input date 2203a are output.
When the external input log 2201a is a file server log, the external input file name 2202a is the name of the file downloaded from the file server (download file name), and the file input date 2203a is the date of download (download date).
The external input file specifying condition 2102a specifies a condition for specifying an external input file. As the condition, a condition for specifying the confidential file is designated. In the present embodiment, the condition is “file downloaded from file server”.

・外部出力ファイル特定部1102b
外部出力ログ2201bを入力し、外部出力ファイル特定条件2102bに従い、端末から端末外部へ出力されたファイルである外部出力ファイルを特定し、外部出力ファイル名2202bとファイル出力日時2203bを出力する。
例えば、外部出力ログ2201bがメールログの場合は、外部出力ファイル名2202bはメールに添付された添付ファイル名(添付ファイル名)であり、ファイル出力日時2203bは添付ファイルがメールに添付されて送信された日時(送信日時)である。
外部出力ファイル特定条件2102bは、外部出力ファイルを特定するための条件を指定する。該条件として、情報漏洩を疑う条件を指定する。本実施の形態では、「送信されたメールの添付ファイルサイズが閾値を越えた場合」という条件とする。この条件の指定の理由は、情報漏洩が行なわれる場合、まとまったデータを漏洩させることがあるため、ある大きさ以上の添付ファイルが送信された場合を条件とするためである。該条件に指定した閾値は、数値、或いは、数値を記憶したファイルのファイル名を指定する。
External output file specifying unit 1102b
An external output log 2201b is input, an external output file that is a file output from the terminal to the outside of the terminal is specified according to the external output file specifying condition 2102b, and an external output file name 2202b and a file output date 2203b are output.
For example, when the external output log 2201b is a mail log, the external output file name 2202b is an attached file name (attached file name) attached to the mail, and the file output date 2203b is transmitted with the attached file attached to the mail. Date and time (send date).
The external output file specifying condition 2102b specifies a condition for specifying an external output file. As this condition, a condition suspected of information leakage is designated. In this embodiment, the condition is “when the attached file size of the transmitted mail exceeds the threshold”. The reason for specifying this condition is that when information leakage is performed, a group of data may be leaked, so that a condition that an attached file of a certain size or larger is transmitted. The threshold value specified for the condition specifies a numerical value or a file name of a file storing the numerical value.

・期間入力部1108(期間入力部の一例)
期間入力部1108は、ファイル追跡システム1で使用する各種期間を入力して記憶装置に記憶する。例えば、開始日時及び終了日時を有する処理対象期間2108を、入力装置から入力し記憶装置に記憶する。或いは、外部入力ファイル特定部1102aが出力したファイル入力日時2203aを開始日時として入力し、外部出力ファイル特定部1102bが出力したファイル出力日時2203bを終了日時として入力し、記憶装置に記憶する。
-Period input unit 1108 (an example of a period input unit)
The period input unit 1108 inputs various periods used in the file tracking system 1 and stores them in the storage device. For example, the processing target period 2108 having the start date and time and the end date and time is input from the input device and stored in the storage device. Alternatively, the file input date / time 2203a output by the external input file specifying unit 1102a is input as the start date / time, and the file output date / time 2203b output by the external output file specifying unit 1102b is input as the end date / time and stored in the storage device.

・操作ログファイル取り込み部1103(操作ログ抽出部の一例)
操作ログファイル2103を入力し、期間入力部1108が記憶装置に記憶した処理対象期間に操作が行われたログエントリを表す操作ログ2204(ログエントリの一例)をログのフォーマットに従い取り出し、処理対象ログ記憶部1109(操作ログ記憶部の一例)に記憶する。例えば、ファイル追跡システム1は、あらかじめ操作ログファイル2103のファイル名と該ファイルが記憶するログのフォーマットを定義したフォーマット定義情報を記憶装置に記憶する。操作ログファイル取り込み部1103は、入力した操作ログファイル2103のファイル名と一致するファイル名を記憶装置から検索し、検索したファイル名に対応するフォーマット定義情報に基づいて操作ログファイル2103から操作ログ2204を取得する。本実施の形態では、“タイムスタンプ、ユーザ識別子、端末識別子、ファイル名、ファイル操作内容、アプリケーション名”というフォーマットで出力する。
Operation log file import unit 1103 (an example of an operation log extraction unit)
An operation log file 2103 is input, an operation log 2204 (an example of a log entry) representing a log entry that is operated during the processing target period stored in the storage device by the period input unit 1108 is extracted according to the log format, and the processing target log It memorize | stores in the memory | storage part 1109 (an example of an operation log memory | storage part). For example, the file tracking system 1 stores, in a storage device, format definition information that defines the file name of the operation log file 2103 and the format of the log stored in the file in advance. The operation log file capturing unit 1103 searches the storage device for a file name that matches the file name of the input operation log file 2103, and based on the format definition information corresponding to the searched file name, the operation log file 2103 to the operation log 2204. To get. In this embodiment, data is output in a format of “time stamp, user identifier, terminal identifier, file name, file operation content, application name”.

・処理対象ログ記憶部1109
処理対象ログ記憶部1109は、操作ログファイル取り込み部1103が取得した操作ログ2204を記憶するファイルであって、当該ファイルは記憶装置に記憶されている。
Processing target log storage unit 1109
The processing target log storage unit 1109 is a file for storing the operation log 2204 acquired by the operation log file capturing unit 1103, and the file is stored in the storage device.

・トレース部1104(追跡部の一例)
外部入力ファイル名2202a、ファイル入力日時2203a、外部出力ファイル名2202b、ファイル出力日時2203b、操作ログ2204、トレース開始条件2104、トレース条件2105、トレース終了条件2106を入力し、最終変遷日時2205a、トレース開始日時2205b、トレース終了日時2205c、最終トレース対象ファイル名2206、また、トレースした結果を判定結果2207として出力する。
Trace unit 1104 (an example of a tracking unit)
External input file name 2202a, file input date / time 2203a, external output file name 2202b, file output date / time 2203b, operation log 2204, trace start condition 2104, trace condition 2105, trace end condition 2106 are input, last transition date / time 2205a, trace start The date and time 2205b, the trace end date and time 2205c, the final trace target file name 2206, and the traced result are output as the determination result 2207.

トレース開始条件2104はトレースモードの指定であり、トレースバックを行うか、トレースフォワードを行うかを指定する。本実施の形態では、トレースバックを指定する。
トレース条件2105はトレースを行う際の条件であり、本実施の形態では、コピーアンドペーストファイル特定部1106によってログエントリを検索する条件として、外部出力ファイル名2202bで特定されるファイルの拡張子と同じ拡張子のファイルが記録されたログエントリを検索する、という条件が定義された情報である。トレース終了条件2106はトレースを終了するための条件であり、本実施の形態はトレースバックであるので「外部出力ファイルをトレースした結果、ファイルサーバ由来である場合に終了する」という条件を定義した情報である。
The trace start condition 2104 is a designation of the trace mode, and designates whether to perform trace back or trace forward. In the present embodiment, traceback is designated.
The trace condition 2105 is a condition for tracing, and in this embodiment, as the condition for searching the log entry by the copy and paste file specifying unit 1106, the same as the file extension specified by the external output file name 2202b. This is information in which a condition that a log entry in which a file with an extension is recorded is searched is defined. The trace end condition 2106 is a condition for ending the trace. Since the present embodiment is a trace back, information defining a condition that “the result is traced from the file server as a result of tracing the external output file” is defined. It is.

最終変遷日時2205aとは、本実施の形態はトレースバックであるので、トレースの過程で判明した一番古くファイルを変遷させた日時である。ファイルの変遷とは、ファイルのリネーム、コピー、移動の操作である。すなわち、ファイルの変遷とは、元のファイルに記憶された情報をそのまま新たなファイルの情報として、新たなファイルを生成するファイル操作を表す。最終トレース対象ファイル名2206は、本実施の形態はトレースバックであるので、トレースの過程で、最も古くに変遷したファイルのファイル名である。
トレース開始日時2205b(開始日時の一例)は、トレースを開始する日時である。トレース終了日時2205c(終了日時の一例)は、トレースを終了する日時である。トレース開始日時2205b及びトレース終了日時2205cは、期間入力部1108が記憶装置に記憶した処理対象期間2108のことである。
The last transition date and time 2205a is the date and time when the oldest file that was found in the trace process was changed because the present embodiment is trace back. A file transition is a file rename, copy, or move operation. That is, the file transition represents a file operation for generating a new file using the information stored in the original file as it is as new file information. The final trace target file name 2206 is the file name of the file that has changed the oldest during the trace process because the present embodiment is trace back.
The trace start date and time 2205b (an example of the start date and time) is the date and time when the trace is started. The trace end date and time 2205c (an example of the end date and time) is the date and time when the trace ends. The trace start date and time 2205b and the trace end date and time 2205c are the processing target period 2108 stored in the storage device by the period input unit 1108.

・トレース結果判断部1105
トレース部1104が出力した判定結果2207を入力し、判定結果2207に基づき、トレースの結果であるトレース結果2107を出力する。具体的には、ファイル追跡システム1が備える表示装置にトレース結果2107を表示する、或いは、ファイル追跡システム1が備えるプリンタ装置にトレース結果2107を印刷する、或いは、ブザーや表示灯などの警告装置にトレース結果2107を出力する。
本実施の形態はトレースバックであるので、外部出力ファイルをトレースした結果ファイルサーバ由来であると判断できなかった場合、ファイルサーバ由来のファイルのデータをコピーしトレース対象のファイルへペーストしていないか判断するために、コピーアンドペースト調査指示2208を出力する。
Trace result determination unit 1105
The determination result 2207 output from the trace unit 1104 is input, and based on the determination result 2207, a trace result 2107, which is a trace result, is output. Specifically, the trace result 2107 is displayed on a display device included in the file tracking system 1, or the trace result 2107 is printed on a printer device included in the file tracking system 1, or a warning device such as a buzzer or an indicator lamp is used. The trace result 2107 is output.
Since this embodiment is a traceback, if it cannot be determined that the file is derived from the file server as a result of tracing the external output file, is the data of the file derived from the file server copied and pasted into the file to be traced? In order to make a determination, a copy and paste investigation instruction 2208 is output.

・コピーアンドペーストファイル特定部1106(しぼり込み期間取得部、追跡候補生成部の一例)
コピーアンドペースト調査指示2208を入力し、操作ログ2204、最終変遷日時2205a、トレース開始日時2205b、最終トレース対象ファイル名2206、トレース開始条件2104、トレース条件2105、トレース終了条件2106を入力する。本実施の形態はトレースバックであるので、ファイルサーバ由来のファイルからコピーアンドペーストがトレース対象ファイルに対して発生していないか調査する。その結果は特定結果2209、及び、追加でトレースを行う候補ファイルのリストであるトレース対象候補ファイルリスト2211(追跡候補ログの一例)として出力する。
Copy and paste file specifying unit 1106 (an example of a squeezing period acquisition unit and a tracking candidate generation unit)
A copy and paste investigation instruction 2208 is input, and an operation log 2204, a last transition date 2205a, a trace start date 2205b, a last trace target file name 2206, a trace start condition 2104, a trace condition 2105, and a trace end condition 2106 are input. Since this embodiment is a traceback, it is investigated whether copy and paste has occurred for a trace target file from a file derived from a file server. The result is output as a specific result 2209 and a trace target candidate file list 2211 (an example of a tracking candidate log) which is a list of candidate files to be additionally traced.

・追加トレース判断部1107(追加追跡ログ判定部の一例)
コピーアンドペーストファイル特定部1106から出力された特定結果2209と、トレース対象候補ファイルリスト2211から、追加でトレースを実施するか判定し、追加でトレースを実施する場合は、トレース対象候補ファイルリスト2211に含まれるトレース対象候補ファイル名を追加トレース対象ファイル名2210bとして、追加トレース対象ファイルリスト2210aに記憶する。トレース部1104は、追加トレース対象ファイルリスト2210aに記憶された追加トレース対象ファイル名2210bを、新たな処理対象ファイルのファイルとして入力し、新たな処理対象ファイル名について追跡を行う。
Additional trace determination unit 1107 (an example of an additional tracking log determination unit)
From the identification result 2209 output from the copy and paste file identification unit 1106 and the trace target candidate file list 2211, it is determined whether or not to perform additional trace. The included trace target candidate file name is stored in the additional trace target file list 2210a as the additional trace target file name 2210b. The trace unit 1104 inputs the additional trace target file name 2210b stored in the additional trace target file list 2210a as a new process target file, and traces the new process target file name.

図3は、ファイル追跡システム及びファイル追跡装置の外観の一例を示す図である。
図3において、ファイル追跡システム1及びファイル追跡装置は、システムユニット910、CRT(Cathode・Ray・Tube)やLCD(液晶)の表示画面を有する表示装置901、キーボード902(Key・Board:K/B)、マウス903、FDD904(Flexible・Disk・ Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。
システムユニット910は、コンピュータであり、ファクシミリ機932、電話器931とケーブルで接続され、また、ローカルエリアネットワーク942(LAN)、ゲートウェイ941を介してインターネット940に接続されている。
FIG. 3 is a diagram illustrating an example of the appearance of the file tracking system and the file tracking apparatus.
In FIG. 3, a file tracking system 1 and a file tracking device are a system unit 910, a display device 901 having a CRT (Cathode / Ray / Tube) or LCD (liquid crystal) display screen, a keyboard 902 (Key / Board: K / B). ), A mouse 903, an FDD 904 (Flexible / Disk / Drive), a compact disk device 905 (CDD), a printer device 906, a scanner device 907, and the like, which are connected by cables and signal lines.
The system unit 910 is a computer, and is connected to the facsimile machine 932 and the telephone 931 via a cable, and is connected to the Internet 940 via a local area network 942 (LAN) and a gateway 941.

図4は、ファイル追跡システム1及びファイル追跡装置のハードウェア資源の一例を示す図である。
図4において、ファイル追跡システム1及びファイル追跡装置は、プログラムを実行するCPU911(Central・Processing・Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU911は、バス912を介してROM913、RAM914、通信ボード915、表示装置901、キーボード902、マウス903、FDD904、CDD905、プリンタ装置906、スキャナ装置907、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置920の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部の一例である。
通信ボード915、キーボード902、スキャナ装置907、FDD904などは、入力部、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力部、出力装置の一例である。
FIG. 4 is a diagram illustrating an example of hardware resources of the file tracking system 1 and the file tracking apparatus.
In FIG. 4, the file tracking system 1 and the file tracking device include a CPU 911 (also referred to as a central processing unit, a central processing unit, a processing unit, a processing unit, a microprocessor, a microcomputer, and a processor) that executes a program. . The CPU 911 is connected to the ROM 913, the RAM 914, the communication board 915, the display device 901, the keyboard 902, the mouse 903, the FDD 904, the CDD 905, the printer device 906, the scanner device 907, and the magnetic disk device 920 via the bus 912, and the hardware. Control the device. Instead of the magnetic disk device 920, a storage device such as an optical disk device or a memory card read / write device may be used.
The RAM 914 is an example of a volatile memory. The storage media of the ROM 913, the FDD 904, the CDD 905, and the magnetic disk device 920 are an example of a nonvolatile memory. These are examples of a storage device or a storage unit.
The communication board 915, the keyboard 902, the scanner device 907, the FDD 904, and the like are examples of an input unit and an input device.
Further, the communication board 915, the display device 901, the printer device 906, and the like are examples of an output unit and an output device.

通信ボード915は、ファクシミリ機932、電話器931、LAN942等に接続されている。通信ボード915は、LAN942に限らず、インターネット940、ISDN等のWAN(ワイドエリアネットワーク)などに接続されていても構わない。インターネット940或いはISDN等のWANに接続されている場合、ゲートウェイ941は不用となる。
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。
The communication board 915 is connected to the facsimile machine 932, the telephone 931, the LAN 942, and the like. The communication board 915 is not limited to the LAN 942 and may be connected to the Internet 940, a WAN (wide area network) such as ISDN, or the like. When connected to a WAN such as the Internet 940 or ISDN, the gateway 941 is unnecessary.
The magnetic disk device 920 stores an operating system 921 (OS), a window system 922, a program group 923, and a file group 924. The programs in the program group 923 are executed by the CPU 911, the operating system 921, and the window system 922.

上記プログラム群923には、ファイル追跡システム1及びファイル追跡装置において動作する「〜部」として説明する動作を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、以下に述べる実施の形態の説明において、「〜の判定結果」、「〜の計算結果」、「〜の処理結果」、「〜追跡結果」、「〜特定結果」、「〜指示」として説明する情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリになどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・入力・出力・印刷・表示・判定・取り込み・取り出しなどのCPUの動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・入力・印刷・表示・抽出・判定のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
また、以下に述べる実施の形態の説明において説明するフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD(Digital・Versatile・Disk)等の記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
The program group 923 stores programs for executing operations described as “˜units” that operate in the file tracking system 1 and the file tracking device. The program is read and executed by the CPU 911.
In the file group 924, in the description of the embodiment described below, “to determination result”, “to calculation result”, “to processing result”, “to tracking result”, “to specific result”, “ Information, data, signal values, variable values, and parameters described as “instructions” are stored as items of “˜file” and “˜database”. The “˜file” and “˜database” are stored in a recording medium such as a disk or a memory. Information, data, signal values, variable values, and parameters stored in a storage medium such as a disk or memory are read out to the main memory or cache memory by the CPU 911 via a read / write circuit, and extracted, searched, referenced, compared, It is used for CPU operations such as calculation, calculation, processing, input, output, printing, display, determination, capture, and retrieval. Information, data, signal values, variable values, and parameters are stored in the main memory and cache memory during the CPU operation of extraction, search, reference, comparison, operation, calculation, processing, output, input, printing, display, extraction, and judgment. Or temporarily stored in the buffer memory.
In addition, the arrows in the flowcharts described in the following description of the embodiments mainly indicate input / output of data and signals. The data and signal values are the RAM 914 memory, the FDD 904 flexible disk, the CDD 905 compact disk, and the magnetic field. The data is recorded on a recording medium such as a magnetic disk of the disk device 920, another optical disk, a mini disk, and a DVD (Digital Versatile Disk). Data and signals are transmitted online via a bus 912, signal lines, cables, or other transmission media.

また、以下に述べる実施の形態の説明において「〜部」」として説明するものは、「〜回路」、「〜装置」、「〜機器」、「手段」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。すなわち、プログラムは、以下に述べる「〜部」としてコンピュータを機能させるものである。あるいは、以下に述べる「〜部」の手順や方法をコンピュータに実行させるものである。   In addition, what is described as “to part” in the description of the embodiment described below may be “to circuit”, “to device”, “to device”, and “means”. It may be “step”, “˜procedure”, “˜processing”. That is, what is described as “˜unit” may be realized by firmware stored in the ROM 913. Alternatively, it may be implemented only by software, or only by hardware such as elements, devices, substrates, and wirings, by a combination of software and hardware, or by a combination of firmware. Firmware and software are stored as programs in a recording medium such as a magnetic disk, a flexible disk, an optical disk, a compact disk, a mini disk, and a DVD. The program is read by the CPU 911 and executed by the CPU 911. That is, the program causes the computer to function as “to part” described below. Alternatively, the procedure or method of “to part” described below is executed by a computer.

図2のファイル追跡システム1のトレースバックの動作について説明する。
本実施の形態では、ある端末“A”(以降、端末A)において、ファイルサーバ由来のファイルを添付ファイルとしてメールで送信(外部出力)したかトレースバックする例を示す。
The trace back operation of the file tracking system 1 in FIG. 2 will be described.
In this embodiment, an example of tracing back whether a file derived from a file server is transmitted as an attached file by e-mail (external output) in a certain terminal “A” (hereinafter, terminal A) is shown.

外部入力ログファイル取り込み部1101aは、外部入力ログファイル2101aとしてファイルサーバログファイルに記憶されたファイルサーバログを読み込む。ファイルサーバログファイルは、例えば、ファイル追跡システム1を搭載しているファイル追跡サーバにおいて、FTPコマンドでファイルサーバから取得すればよい。
ファイル追跡システム1及びファイル追跡装置が使用するログエントリを図18に示す。図18は、ファイル追跡システム1及びファイル追跡装置が使用するログエントリの一例を示す図である。図18において、ログエントリ210は、タイムスタンプ211、端末名212、プロセス名213、操作コマンド214、操作内容215、アプリケーション名216を有する。タイムスタンプ211は、当該ログエントリが生成された日時、すなわち、ファイルに対して操作が行われた日時を記憶し、例えば、2010/12/01 09:00:00との日時情報を有する。端末名212は、ファイルを操作した端末を識別する端末名を記憶する。例えば、端末Aとの端末名を記憶する。プロセス名213は、ファイルに対する操作が行われた時に端末Aにおいて実行されていたプロセスを識別するプロセス名を記憶する。例えば、プロセスAとのプロセス名を記憶する。操作コマンド214は、ファイルに対して行われた操作を表すコマンドが記憶される。例えば、ファイルを開く操作を行った場合は、オープンとの操作コマンドが記憶される。操作内容215は、ファイルに対して行った操作の内容を表す情報を記憶する。例えば、ファイルAをダウンロードした場合、ファイルAをダウンロードしたとの操作内容が記憶される。アプリケーション名216は、ファイルに対する操作が行われた時に端末Aにおいて実行されていたアプリケーションを識別するアプリケーション名を記憶する。例えば、ファイルに対して行われた操作が表計算プログラムを実行することにより行われた操作である場合、表計算プログラムとのアプリケーション名が記憶される。
外部入力ログファイル取り込み部1101aは、FTPコマンドでファイルサーバログファイルを取得し、さらに、取得したファイルサーバログファイルから、ファイルサーバログを読み込んで、操作コマンドがダウンロードを表す操作コマンドを記憶し、かつ、端末名が端末Aを記憶する(条件1)ファイルサーバログを抽出する。
ファイル追跡システム1は、外部入力ログファイル2101aに記憶されたファイルサーバログがどのようなフォーマットで、どのような項目の情報を記憶しているかを表すフォーマット定義情報を、ファイルサーバログファイルのファイル名に対応させて、ファイル追跡システム1が備える記憶装置に記憶しておく。外部入力ログファイル取り込み部1101aは、記憶装置に記憶されたフォーマット定義情報を入力し、入力したフォーマット定義情報に基づいて操作コマンドと端末名との各項目に対応する情報を取得する。外部入力ログファイル取り込み部1101aは、上記した条件1を満たすファイルサーバログを抽出し、外部入力ログ2201aとして外部入力ファイル特定部1102aへ出力する。本実施の形態では、外部入力ログファイル取り込み部1101aは、ファイルサーバログから“ダウンロード日時、ダウンロードした端末の識別子、ダウンロードファイル名”という項目を有する外部入力ログ2201aを出力する。外部入力ログ2201aは、図18のログエントリ210の一例であり、外部入力ログ2201aは、ログエントリ210が有する項目と同じ項目を有してもよいし、ログエントリ210が有する項目のうち一部の項目を有してもよい。具体的には、“ダウンロード日時”は、タイムスタンプ211の一例であり、“ダウンロードした端末の識別子”は端末名212の一例であり、“ダウンロードファイル名”は、操作内容215の一例である。
The external input log file capturing unit 1101a reads the file server log stored in the file server log file as the external input log file 2101a. The file server log file may be acquired from the file server by an FTP command in a file tracking server equipped with the file tracking system 1, for example.
FIG. 18 shows log entries used by the file tracking system 1 and the file tracking apparatus. FIG. 18 is a diagram illustrating an example of a log entry used by the file tracking system 1 and the file tracking apparatus. In FIG. 18, the log entry 210 includes a time stamp 211, a terminal name 212, a process name 213, an operation command 214, an operation content 215, and an application name 216. The time stamp 211 stores the date and time when the log entry was generated, that is, the date and time when the operation was performed on the file, and has date and time information such as 2010/12/01 09:00:00. The terminal name 212 stores a terminal name that identifies the terminal that has operated the file. For example, the terminal name with the terminal A is stored. The process name 213 stores a process name that identifies a process being executed in the terminal A when an operation is performed on a file. For example, the process name with process A is stored. The operation command 214 stores a command representing an operation performed on the file. For example, when an operation for opening a file is performed, an operation command for opening is stored. The operation content 215 stores information indicating the content of the operation performed on the file. For example, when the file A is downloaded, the operation content that the file A is downloaded is stored. The application name 216 stores an application name that identifies the application that was being executed in the terminal A when an operation was performed on the file. For example, when the operation performed on the file is an operation performed by executing a spreadsheet program, the application name with the spreadsheet program is stored.
The external input log file capturing unit 1101a acquires a file server log file using an FTP command, further reads the file server log from the acquired file server log file, stores an operation command indicating that the operation command represents download, and Then, the file server log in which the terminal name stores the terminal A (condition 1) is extracted.
The file tracking system 1 uses the format definition information indicating what format and what item information is stored in the file server log stored in the external input log file 2101a as the file name of the file server log file. The file tracking system 1 stores the information in the storage device. The external input log file capturing unit 1101a inputs the format definition information stored in the storage device, and acquires information corresponding to each item of the operation command and the terminal name based on the input format definition information. The external input log file capturing unit 1101a extracts a file server log that satisfies the above condition 1, and outputs the file server log as the external input log 2201a to the external input file specifying unit 1102a. In the present embodiment, the external input log file capturing unit 1101a outputs an external input log 2201a having items “download date and time, identifier of downloaded terminal, download file name” from the file server log. The external input log 2201a is an example of the log entry 210 in FIG. 18. The external input log 2201a may have the same items as the log entry 210, or some of the items included in the log entry 210. You may have the item of. Specifically, “download date / time” is an example of the time stamp 211, “identifier of the downloaded terminal” is an example of the terminal name 212, and “download file name” is an example of the operation content 215.

外部入力ファイル特定部1102aは、外部入力ログ2201aに対して、外部入力ファイル特定条件2102aに基づき外部入力ファイル名2202aとファイル入力日時2203aを特定する。本実施の形態では、外部入力ファイル特定条件2102aとして「外部入力ログ検索期間において、端末Aが、ファイルサーバから、ファイルをダウンロードした場合」を指定する。外部入力ファイル特定部1102aは、この外部入力ファイル特定条件2102aを入力した場合、端末Aがファイルサーバからファイルをダウンロードした記録に該当するログエントリを抽出し、ダウンロード日時とダウンロードファイル名を外部入力ログ2201aから取り出す。外部入力ファイル名2202aに、取り出したダウンロードファイル名を設定する。ファイル入力日時2203aに、取り出したダウンロード日時を設定する。外部入力ログ2201aが有する端末名212(“ダウンロードした端末の識別子”)は端末Aを示している。外部入力ファイル特定条件2102aに指定した“外部入力ログ検索期間”とは、後に示す「外部出力ファイル特定条件2102bにおける「疑義期間の最後」から過去に遡って、外部入力ログ2201aを検索する期間を指定するものである。本実施の形態では、過去に遡る日数を「31日」とする。外部入力ファイル特定部1102aは、ファイル追跡システム1の記憶装置に記憶された“過去に遡る日数”を入力する。例えば、外部出力ファイル特定条件2102bにおける疑義期間の最後の日時を2010/12/01 17:00:00とすると、2010/12/01 17:00:00から31日遡った日時は、2010/10/31 17:00:00である。これにより“外部入力ログ検索期間”は、2010/10/31 17:00:00を開始日時とし、2010/12/01 17:00:00を終了日時として有する期間になる。
外部入力ファイル特定部1102aは、外部入力ログ2201aから、外部入力ログ検索期間のタイムスタンプ211を有し、端末Aがファイルサーバからファイルをダウンロードしたとの操作内容を表す操作内容215を有する外部入力ログ2201aを抽出する。なお、外部入力ログ検索期間は、後述するトレース対象期間(「トレース対象期間」は処理対象期間の一例である)以上、すなわち、トレース対象期間を含む期間を設定する。
The external input file specifying unit 1102a specifies the external input file name 2202a and the file input date / time 2203a based on the external input file specifying condition 2102a with respect to the external input log 2201a. In the present embodiment, “when terminal A downloads a file from the file server during the external input log search period” is designated as the external input file specifying condition 2102a. When the external input file specifying unit 1102a inputs the external input file specifying condition 2102a, the external input file specifying unit 1102a extracts a log entry corresponding to the record in which the terminal A downloaded the file from the file server, and sets the download date and the download file name to the external input log. Take out from 2201a. The extracted download file name is set in the external input file name 2202a. The extracted download date and time is set in the file input date and time 2203a. A terminal name 212 (“identifier of downloaded terminal”) included in the external input log 2201a indicates the terminal A. The “external input log search period” specified in the external input file specifying condition 2102a refers to a period in which the external input log 2201a is searched retroactively from the “end of doubt period” in the “external output file specifying condition 2102b” described later. It is what you specify. In the present embodiment, the number of days going back to the past is “31 days”. The external input file specifying unit 1102 a inputs “the number of days going back in the past” stored in the storage device of the file tracking system 1. For example, when the last date and time of the doubt period in the external output file specifying condition 2102b is 2010/12/01 17:00: The date and time 31 days after 2010/12/01 17:00: / 31 17:00:00. Thus, the “external input log search period” is a period having 2010/10/31 17:00: 00 as the start date and 2010/12/01 17:00: 00 as the end date.
The external input file specifying unit 1102a has an external input log 2201a having an external input log search period time stamp 211 and an external input 215 indicating an operation content indicating that the terminal A has downloaded a file from the file server. The log 2201a is extracted. It should be noted that the external input log search period is set to a trace target period (“trace target period” is an example of a process target period) described later, that is, a period including the trace target period.

外部出力ログファイル取り込み部1101bは、外部出力ログファイル2101bとしてメールログファイルに記憶されたメールログを取り込む。
ファイル追跡システム1は、外部出力ログファイル2101bに記憶されたメールログがどのようなフォーマットで、どのような項目の情報を記憶しているかを表すフォーマット定義情報を、メールログファイルのファイル名に対応させて、ファイル追跡システム1が備える記憶装置に記憶しておく。外部出力ログファイル取り込み部1101bは、記憶装置に記憶されたフォーマット定義情報を入力し、入力したフォーマット定義情報に基づいて、外部出力ログファイル2101bから、操作コマンドと端末名との各項目に対応する情報を取得する。取得したメールログを外部出力ログ2201bとして外部出力ファイル特定部1102bへ出力する。本実施の形態では、メールログ及び外部出力ログ2201bは、“送信日時、送信元メールアドレス、あて先メールアドレス、添付ファイル名、添付ファイルサイズ”という項目を有する。外部出力ログ2201bは、図18のログエントリ210の一例であり、外部入力ログ2201aは、ログエントリ210が有する項目と同じ項目を有してもよいし、ログエントリ210が有する項目のうち一部の項目を有してもよい。具体的には、“送信日時”は、タイムスタンプ211の一例であり、“送信元メールアドレス、あて先メールアドレス、添付ファイル名、添付ファイルサイズ”は操作内容215に含まれた情報の一部である。
The external output log file capturing unit 1101b captures a mail log stored in the mail log file as the external output log file 2101b.
The file tracking system 1 corresponds to the format definition information indicating what format and what item information is stored in the mail log stored in the external output log file 2101b with the file name of the mail log file. And stored in a storage device included in the file tracking system 1. The external output log file capturing unit 1101b inputs the format definition information stored in the storage device, and corresponds to each item of the operation command and the terminal name from the external output log file 2101b based on the input format definition information. Get information. The acquired mail log is output to the external output file specifying unit 1102b as the external output log 2201b. In this embodiment, the mail log and the external output log 2201b have items of “transmission date and time, transmission source mail address, destination mail address, attached file name, attached file size”. The external output log 2201b is an example of the log entry 210 in FIG. 18, and the external input log 2201a may have the same items as the items included in the log entry 210, or some of the items included in the log entry 210. You may have the item of. Specifically, “transmission date and time” is an example of the time stamp 211, and “source email address, destination email address, attached file name, attached file size” are part of information included in the operation content 215. is there.

外部出力ファイル特定部1102bは、外部出力ログ2201bから、外部出力ファイル特定条件2102bに基づき外部出力ファイル名2202bとファイル出力日時2203bを特定する。本実施の形態では、外部出力ファイル特定条件2102bに「疑義期間において、端末Aのユーザが送信したメールの添付ファイルサイズが閾値を越えた場合」を指定する。“閾値”は数値であっても、数値を記憶したファイルのファイル名を指定してもよい。外部出力ファイル特定部1102bは、上記した指定がされた外部出力ファイル特定条件2102bを入力した場合、“送信日時が疑義期間であり、かつ、送信元メールアドレス=端末Aのユーザのメールアドレス、かつ、添付ファイルサイズが閾値を超えた”との条件を満たすメールログを抽出し、抽出したメールログから、添付ファイル名と送信日時(タイムスタンプ)を取り出す。外部出力ファイル特定部1102bは、外部出力ファイル名2202bに、取り出した添付ファイル名を設定する。外部出力ファイル特定部1102bは、ファイル出力日時2203bに、取り出した添付ファイルのメールによる送信日時(タイムスタンプ)を設定する。
“疑義期間”とは、端末Aからの機密ファイルの外部送出が疑われる期間であり、本実施の形態では、2010/12/1 09:00:00から2010/12/1 17:00:00の8時間を疑義期間とする。疑義期間は、ファイル追跡システム1が備える記憶装置にあらかじめ記憶されている。例えば、疑義期間は、端末Aからメールによるファイル漏洩が疑われ、漏洩した期間が推測された場合にメールサーバの管理者やファイル追跡システム1の運用者によりファイル追跡システム1が備える記憶装置に記憶される。また、例えば、メールサーバの管理者は、機密ファイルがファイルサーバにより機密ファイルとして管理されているが、機密ファイルを本来アクセスすることができない外部組織へメールに添付されて送信されることが発生したか否か確認するために、定期的に、送信されたメールを確認する期間を疑義期間としてファイル追跡システム1が備える記憶装置に記憶する。外部出力ファイル特定条件2102bに指定される“疑義期間”は、ファイル追跡システム1の記憶装置に記憶された疑義期間を記憶したファイルのファイル名を指定する。
外部出力ファイル特定部1102bは、2010/12/1 09:00:00から2010/12/1 17:00:00の疑義期間のタイムスタンプを有するメールログから、“送信元メールアドレス=端末Aのユーザのメールアドレス、かつ、添付ファイルサイズが閾値を超えた”との条件を満たすログエントリを抽出し、外部出力ファイル名2202bに添付ファイル名を設定し、ファイル出力日時2203bに送信日時を設定し、出力する。本実施の形態では、2010/12/1 09:30:00を記憶したタイムスタンプを有するメールログが発見されたとする。ファイル出力日時2203bは2010/12/1 09:30:00に設定される。
The external output file specifying unit 1102b specifies the external output file name 2202b and the file output date 2203b based on the external output file specifying condition 2102b from the external output log 2201b. In the present embodiment, “when the attached file size of the mail transmitted by the user of the terminal A exceeds the threshold during the doubt period” is specified in the external output file specifying condition 2102b. The “threshold” may be a numerical value or a file name of a file storing the numerical value may be designated. When the external output file specifying condition 2102b specified as described above is input, the external output file specifying unit 1102b reads that “the transmission date and time is a suspicion period, and the transmission source email address = the email address of the user of the terminal A, and The mail log satisfying the condition that the attached file size exceeds the threshold is extracted, and the attached file name and the transmission date and time (time stamp) are extracted from the extracted mail log. The external output file specifying unit 1102b sets the extracted attached file name in the external output file name 2202b. The external output file specifying unit 1102b sets a transmission date / time (time stamp) of the extracted attached file by mail in the file output date / time 2203b.
The “question period” is a period in which external transmission of the confidential file from the terminal A is suspected. In the present embodiment, 2010/12/1 09:00:00 to 2010/12/1 17:00 8 hours is assumed as the period of doubt. The doubt period is stored in advance in a storage device included in the file tracking system 1. For example, the doubt period is stored in a storage device included in the file tracking system 1 by the administrator of the mail server or the operator of the file tracking system 1 when the leakage of the file is suspected from the terminal A and the leakage period is estimated. Is done. In addition, for example, an administrator of a mail server may have a confidential file managed as a confidential file by the file server, but the confidential file may be sent as an attachment to an external organization that cannot originally access the confidential file. In order to check whether or not the file tracking system 1 has a period during which the transmitted mail is to be checked periodically as a doubt period, the file tracking system 1 stores the period. The “question period” designated in the external output file specifying condition 2102b designates the file name of the file storing the doubt period stored in the storage device of the file tracking system 1.
The external output file specifying unit 1102b reads from the mail log having the time stamp of the doubt period from 2010/12/1 09:00:00 to 2010/12/1 17:00: The log entry that satisfies the condition of the user's email address and the attached file size exceeds the threshold is extracted, the attached file name is set in the external output file name 2202b, and the transmission date and time is set in the file output date 2203b. ,Output. In this embodiment, it is assumed that a mail log having a time stamp storing 2010/12/1 09:30:30 is found. The file output date 2203b is set to 2010/12/1 09:30:30.

操作ログファイル取り込み部1103は、端末Aの操作ログファイル2103から、あらかじめ運用者により定義され、ファイル追跡システム1の記憶装置に記憶されたログエントリのファイルフォーマットに従いログエントリを取り出し、操作ログ2204として出力する。本実施の形態では、“タイムスタンプ、ユーザ識別子、端末識別子、ファイル名、ファイル操作内容、アプリケーション名”というフォーマットで出力する。操作ログファイル2103に記憶されたログエントリは、図18の項目を有するものとする。“タイムスタンプ”はタイムスタンプ211、“端末識別子”は端末名212、“ファイル名”は操作内容215に記憶された情報の一部、“ファイル操作内容”は操作内容215、“アプリケーション名”はアプリケーション名216であり、“ユーザ識別名”は、図18には図示していないが、操作内容215に含まれて記憶されているものとする。操作ログファイル取り込み部1103は、操作ログファイル2103からログエントリを取り出す際に、処理対象期間2108の期間に操作されたことを表すログエントリを操作ログ2204として抽出し、抽出した操作ログ2204を処理対象ログ記憶部1109に記憶する。処理対象期間は、期間入力部1108により入力されて、ファイル追跡システム1が備える記憶装置に記憶されている。処理対象期間及び期間入力部1108については、トレース部1104の説明において詳細を説明する。   The operation log file capturing unit 1103 extracts a log entry from the operation log file 2103 of the terminal A according to the file format of the log entry that is defined in advance by the operator and stored in the storage device of the file tracking system 1, and serves as an operation log 2204. Output. In this embodiment, data is output in a format of “time stamp, user identifier, terminal identifier, file name, file operation content, application name”. It is assumed that the log entry stored in the operation log file 2103 has the items shown in FIG. “Time stamp” is the time stamp 211, “Terminal identifier” is the terminal name 212, “File name” is a part of the information stored in the operation content 215, “File operation content” is the operation content 215, and “Application name” is It is assumed that the application name 216 and the “user identification name” are not included in FIG. When retrieving the log entry from the operation log file 2103, the operation log file capturing unit 1103 extracts a log entry indicating that the operation is performed during the processing target period 2108 as the operation log 2204, and processes the extracted operation log 2204. Store in the target log storage unit 1109. The processing target period is input by the period input unit 1108 and stored in the storage device included in the file tracking system 1. Details of the processing target period and period input unit 1108 will be described in the description of the trace unit 1104.

トレース部1104は、トレース開始条件2104、トレース条件2105、トレース終了条件2106、処理対象期間2108を入力する(図2では、処理対象期間2108とトレース部1104とを結ぶ線の記載を省略している)。
トレース開始条件2104は、本実施の形態ではトレースバックのモードで動くことを指示する情報を指定する。
トレース条件2105は、コピーアンドペーストファイル特定部1106により、「外部出力ファイル名2202bと同じ拡張子のファイルを追跡候補とする」という動作を行うことを指示する情報を指定する。例えば、外部出力ファイル名2202bがabc.csvであれば、上記した情報がトレース条件2105として指示された場合、コピーアンドペーストファイル特定部1106は、拡張子が.csvであるファイルを追跡候補とするよう動作する。
トレース終了条件2106は、本実施の形態では「外部出力ファイルをトレースした結果、ファイルサーバ由来である場合に終了する」という条件を、より具体的に、「外部出力ファイルをトレースした結果、ファイルサーバからダウンロードされたファイルに辿りついたら終了」という条件として指定する。
The trace unit 1104 inputs a trace start condition 2104, a trace condition 2105, a trace end condition 2106, and a processing target period 2108 (in FIG. 2, the description of the line connecting the processing target period 2108 and the trace unit 1104 is omitted). ).
In this embodiment, the trace start condition 2104 designates information instructing to move in the trace back mode.
The trace condition 2105 designates information for instructing the copy and paste file specifying unit 1106 to perform an operation of “making a file having the same extension as the external output file name 2202b a tracking candidate”. For example, the external output file name 2202b is abc. In the case of csv, when the above-described information is designated as the trace condition 2105, the copy and paste file specifying unit 1106 has an extension of .csv. It operates so that a file which is csv is a tracking candidate.
In the present embodiment, the trace end condition 2106 is more specifically defined as “the result of tracing the external output file, and the process ends when the file is derived from the file server”. Specify as a condition of “Finish when the file downloaded from is reached”.

処理対象期間2108は、期間入力部1108が入力装置により入力した開始期間及び終了期間を有する期間である。期間入力部1108は、ファイル追跡システム1の運用者がマウスやキーボード等の入力装置から入力した期間を処理対象期間として、ファイル追跡システム1が備える記憶装置に記憶する。トレース部1104は、ファイル追跡システム1が備える記憶装置に記憶された処理対処期間を、トレース終了条件の1つとして入力する。   The processing target period 2108 is a period having a start period and an end period input by the period input unit 1108 using the input device. The period input unit 1108 stores a period input by an operator of the file tracking system 1 from an input device such as a mouse or a keyboard as a processing target period in a storage device included in the file tracking system 1. The trace unit 1104 inputs the processing coping period stored in the storage device included in the file tracking system 1 as one of the trace end conditions.

ここで、トレースを行う処理対象期間、疑義期間、外部入力ログ検索期間の関係を説明する。図5は、ファイル追跡システムで使用する各種期間を説明する図である。
図5において、疑義期間は、既に説明したように、例えば、端末Aからメールによるファイル漏洩が疑われ、漏洩した期間が推測された場合にメールサーバの管理者やファイル追跡システム1の運用者によりファイル追跡システム1が備える入力装置により入力され、記憶装置に記憶される。疑義期間は、外部出力ファイル特定部1102bが抽出の対象とするメールログをしぼり込むための期間である。上記した例では、2010/12/01 9:00:00から2010/12/01 17:00:00を疑義期間とする。
外部入力ログ検索期間は、外部入力ファイル特定部1102aが抽出の対象とするファイルサーバログをしぼり込むための期間である。外部入力ログ検索期間は、“疑義期間の最終日時”からファイル追跡システム1が備える記憶装置に予め記憶された“過去に遡る日数”を遡った日時を開始日時とし、“疑義期間の最終日時”を終了日時とする期間である。例えば、メールに添付されて送信された添付ファイルの生成元ファイルがどのファイルであるか追跡する場合、追跡するログエントリの範囲を指定するのが、処理対象期間であり、ダウンロードは処理対象期間の開始日時よりも前に行われていると考える。このため、処理対象期間の開始日時以前の日時を、外部入力ログ検索期間の開始日時とする。また、添付ファイルを送信する直前にダウンロードされるとも考える。このため、メール送信がされたと疑う疑義期間の終了日時を、外部入力ログ検索期間の終了日時とする。
外部入力ファイル特定部1102aは、ファイル追跡システム1が備える記憶装置に予め記憶された疑義期間の最終日時からファイル追跡システム1が備える記憶装置に予め記憶された過去に遡る日数を遡った日時を算出し、外部入力ログ検索期間の開始日時とする。外部入力ファイル特定部1102aは、ファイル追跡システム1が備える記憶装置に予め記憶された疑義期間の最終日時を入力し、外部入力ログ検索期間の終了日時とする。
処理対象期間は、トレース部1104がトレース対象(処理対象)とするログエントリをしぼり込むための期間である。ファイル追跡システム1の運用者は、処理対象期間2108を入力する際、外部入力ログ検索期間に含まれる期間を入力する。この実施の形態では、メールに添付された添付ファイル、すなわち、外部出力ファイル名2202bのファイルを生成した元ファイルを追跡するので、処理対象期間の終了日時は、添付ファイルが送信された日時であるファイル出力日時2203bとすればよい。期間入力部1108は、ファイル出力日時2203bを外部出力ファイル特定部1102bから入力し、入力したファイル出力日時2203bを処理対象期間2108の終了日時とする。運用者から入力された終了日時よりも優先して、ファイル出力日時2203bを処理対象期間2108の終了日時とする場合、運用者は終了日時として「0000/00/00」等の、日時としてあり得ない文字列を入力する。外部出力ファイル名2202bのファイルがファイルサーバからダウンロードされたファイルを元に生成されたファイルであれば、外部出力ファイル名2202bのファイルは、ファイル入力日時2203a以後に生成されたことが推測できる。期間入力部1108は、ファイル入力日時2203aを外部入力ファイル特定部1102aから入力し、入力したファイル入力日時2203aを処理対象期間2108の開始日時とする。運用者から入力された開始日時よりも優先して、ファイル入力日時2203aを処理対象期間2108の開始日時とする場合、運用者は開始日時として「0000/00/00」等の、日時としてあり得ない文字列を入力する。期間入力部1108は、日時としてあり得ない日時が入力装置から入力されたら、ファイル入力日時2203aやファイル出力日時2203bを入力する。また、ファイル入力日時2203aが複数入力された場合、最も日時が古いファイル入力日時2203aを開始日時とする。
なお、疑似期間内に端末Aから添付ファイルを送信したメールが複数あると、外部出力ファイル特定部1102bは、外部出力ファイル名2202b、ファイル出力日時2203bを複数出力する。このように複数出力された場合は、例えば、ファイル外部出力ファイル名2202b、ファイル出力日時2203bとの組のうちファイル出力日時2203bが最も古いものから順にトレース部1104に出力して、トレースを行わせる。1つの組についてトレースが終了したら、次にファイル出力日時2203bが古い組をトレース部1104に出力してトレースを行わせる。
Here, the relationship between the processing target period, the doubt period, and the external input log search period for tracing will be described. FIG. 5 is a diagram for explaining various periods used in the file tracking system.
In FIG. 5, as described above, the doubt period is determined by the mail server administrator or the file tracking system 1 operator when, for example, a file leakage due to mail is suspected from the terminal A and the leakage period is estimated. The file is input by an input device included in the file tracking system 1 and stored in a storage device. The doubt period is a period for the external output file specifying unit 1102b to narrow down the mail log to be extracted. In the above-described example, the doubt period is from 2010/12/01 9:00: 00 to 2010/12/01 17:00: 00.
The external input log search period is a period for the external input file specifying unit 1102a to narrow down the file server log to be extracted. The external input log search period starts from the “date and time of the suspicion period” as the start date and time, and the “date and time of the suspicion period” Is a period with end date and time. For example, when tracking which file is the source file of the attached file sent as an email attachment, the range of log entries to be tracked is the processing target period, and download is the processing target period. We think that it is performed before start date and time. Therefore, the date and time before the start date and time of the processing target period is set as the start date and time of the external input log search period. It is also considered that it is downloaded immediately before sending the attached file. For this reason, the end date / time of the suspicion period in which the e-mail transmission is suspected is set as the end date / time of the external input log search period.
The external input file specifying unit 1102a calculates a date and time that goes back from the last date and time of the doubt period previously stored in the storage device included in the file tracking system 1 to the number of days going back to the past stored in the storage device included in the file tracking system 1 And the start date and time of the external input log search period. The external input file specifying unit 1102a inputs the final date and time of the doubt period stored in advance in the storage device included in the file tracking system 1, and sets it as the end date and time of the external input log search period.
The processing target period is a period for the log unit 1104 to narrow down log entries to be traced (processing target). When inputting the processing target period 2108, the operator of the file tracking system 1 inputs a period included in the external input log search period. In this embodiment, since the attached file attached to the mail, that is, the original file that generated the file with the external output file name 2202b is traced, the end date / time of the processing target period is the date / time when the attached file was transmitted. The file output date 2203b may be used. The period input unit 1108 inputs the file output date / time 2203b from the external output file specifying unit 1102b, and sets the input file output date / time 2203b as the end date / time of the processing target period 2108. When the file output date / time 2203b is set as the end date / time of the processing target period 2108 in preference to the end date / time input from the operator, the operator may have a date / time such as “0000/00/00” as the end date / time. Enter no string. If the file with the external output file name 2202b is a file generated based on the file downloaded from the file server, it can be estimated that the file with the external output file name 2202b was generated after the file input date 2203a. The period input unit 1108 inputs the file input date / time 2203a from the external input file specifying unit 1102a, and sets the input file input date / time 2203a as the start date / time of the processing target period 2108. When the file input date / time 2203a is set as the start date / time of the processing target period 2108 in preference to the start date / time input from the operator, the operator may have a date / time such as “0000/00/00” as the start date / time. Enter no string. The period input unit 1108 inputs a file input date / time 2203a and a file output date / time 2203b when a date / time that is not possible as a date / time is input from the input device. If a plurality of file input dates 2203a are input, the file input date 2203a with the oldest date is set as the start date.
Note that if there are a plurality of mails that have sent attachment files from the terminal A within the pseudo period, the external output file specifying unit 1102b outputs a plurality of external output file names 2202b and file output date / time 2203b. When a plurality of files are output in this way, for example, the file output date / time 2203b in the set of the file external output file name 2202b and the file output date / time 2203b is output to the trace unit 1104 in order from the oldest file output date / time 2203b. . When tracing is completed for one set, the next set with the oldest file output date 2203b is output to the trace unit 1104 for tracing.

トレース部1104は、トレース対象期間のタイムスタンプを有するログエントリ210を記憶した処理対象ログ記憶部1109から、タイムスタンプの新しい順にログエントリ210を入力してトレースする。   The trace unit 1104 inputs and traces the log entries 210 from the processing target log storage unit 1109 that stores the log entries 210 having the time stamp of the trace target period in the order of the newest time stamps.

トレース部1104では、まず、外部出力ファイル特定部1102bの出力である外部出力ファイル名2202bを入力するが、これをトレース対象ファイル名として設定する(トレース対象ファイル名は処理対象ファイル名の一例である。すなわち、メールに添付された添付ファイルが処理対象ファイルの一例である)。トレース対象ファイル名は、トレース対象ファイル名で識別されるファイルのデータが機密ファイル由来か(機密ファイルを元に生成されたファイルであるか)調査する対象であり、本実施の形態では、ファイルサーバからダウンロードされたファイル(ファイルサーバで記憶及び管理されているファイルは機密ファイルであるとする)に由来するか、すなわち、ダウンロードされたファイルを元に生成されたか調査する対象である。次に、処理対象期間2108をトレース対象期間として入力し、処理対象期間2108が有する開始日時をトレース開始日時に設定し、処理対象期間2108が有する終了日時をトレース終了日時に設定する。本実施の形態では、ファイル入力日時2203a=2010/11/1 09:30:00=トレース開始日時となり、ファイル出力日時2203b=2010/12/1 09:30:00=トレース終了日時となる。   In the trace unit 1104, first, an external output file name 2202b that is an output of the external output file specifying unit 1102b is input, and this is set as a trace target file name (the trace target file name is an example of a process target file name). That is, the attached file attached to the mail is an example of the processing target file). The trace target file name is a target for investigating whether the data of the file identified by the trace target file name originates from a confidential file (whether it is a file generated based on the confidential file). In this embodiment, the file server It is an object to investigate whether it is derived from a file downloaded from the file (a file stored and managed in the file server is a confidential file), that is, whether it is generated based on the downloaded file. Next, the process target period 2108 is input as a trace target period, the start date / time of the process target period 2108 is set as the trace start date / time, and the end date / time of the process target period 2108 is set as the trace end date / time. In this embodiment, file input date / time 2203a = 2010/11/1 09: 30: 30 = trace start date / time, and file output date / time 2203b = 2010/12/1 09: 30: 0 = trace end date / time.

トレース部1104の動作の詳細を説明する。なお、以下の説明では、判定結果をアルファベット小文字のyes、noと記載するが、フローチャート図では、アルファベット大文字のYES,NOとして記載する。他の実施の形態でも同様とする。以下の説明では、フローチャート図の説明において、各工程の番号を小文字のsとして記載したものを、フローチャート図では、大文字のSと記載した。
図6は、トレース部及びコピーアンドペーストファイル特定部のブロック図である。
図7はトレース部の動作を説明するフローチャートである。
図6に示すように、トレース部1104は、転送判定部1114と変遷判定部1124を備える。転送判定部1114は、外部出力ファイル名2202bのファイルが、外部入力ファイル名2202aのファイルであるか否か判定する。すなわち、添付ファイルのファイル名がダウンロードファイルのファイル名と一致するか否か判定する。変遷判定部1124は、外部出力ファイル名2202bのファイルが、外部入力ファイル名2202aのファイルが記憶する情報をそのまま変更せずに外部出力ファイル名2202bのファイルに引き継いで、外部出力ファイル名2202bのファイルを生成する変遷操作により生成されたか否か判定する。転送判定部1114と変遷判定部1124との各部動作の詳細は、図7のフローチャートの説明の中で述べる。
Details of the operation of the trace unit 1104 will be described. In the following description, the determination result is written as lowercase letters yes and no, but in the flowchart, it is written as uppercase letters YES and NO. The same applies to other embodiments. In the following description, in the description of the flowchart diagram, the number of each step is described as a lowercase s, and in the flowchart diagram, the capital letter S is described.
FIG. 6 is a block diagram of the trace unit and the copy and paste file specifying unit.
FIG. 7 is a flowchart for explaining the operation of the trace unit.
As shown in FIG. 6, the trace unit 1104 includes a transfer determination unit 1114 and a transition determination unit 1124. The transfer determination unit 1114 determines whether or not the file with the external output file name 2202b is the file with the external input file name 2202a. That is, it is determined whether or not the file name of the attached file matches the file name of the download file. The transition determination unit 1124 takes over the information stored in the file of the external input file name 2202a to the file of the external output file name 2202b without changing the information stored in the file of the external input file name 2202a. It is determined whether or not it has been generated by a transition operation that generates. Details of the operations of the transfer determination unit 1114 and the transition determination unit 1124 will be described in the description of the flowchart of FIG.

初めに、トレース対象期間について説明する。トレース対象期間は、トレース開始日時からトレース終了日時の間の期間である。トレース終了日時=2010/12/1 09:30:00、トレース開始日時=2010/11/1 09:30:00である。つまり、トレース対象期間は、トレース開始日時=2010/11/1 09:30:00からトレース終了日時=2010/12/1 09:30:00の期間である。
以降、当フローチャートにおけるログとは、トレース対象期間のログエントリを示す。
First, the trace target period will be described. The trace target period is a period between the trace start date and time and the trace end date and time. Trace end date and time = 2010/12/1 09:30, and trace start date and time = 2010/11/1 09:30. In other words, the trace target period is the period from the trace start date / time = 2010/11/1 09:30 to the trace end date / time = 2010/12/1 09:30.
Hereinafter, the log in this flowchart indicates a log entry in the trace target period.

s101を行う前に、トレース部1104は、後述するs106で設定する最終トレース対象ファイル名2206に初期値を設定する。トレース部1104は、最終トレース対象ファイル名2206に初期値として外部出力ファイル名2202bを設定する。すなわち、トレース部1104は、最終トレース対象ファイル名2206に初期値としてトレース対象ファイル名を設定する。また、トレース部1104は、後述するs107で設定する最終変遷日時2205aに初期値を設定する。トレース部1104は、最終変遷日時2205aに初期値としてファイル出力日時2203bを設定する。すなわち、トレース部1104は、最終変遷日時2205aに初期値としてトレース対象ファイル名のファイルがメールに添付されて送信された日時を設定する。
s101において、トレース部1104は、トレース対象ファイル名で識別されるファイルが、トレース終了条件2106に指定された「外部出力ファイルをトレースした結果、ファイルサーバからダウンロードされたファイルに辿りついたら終了」という条件に合うか調べる。この条件は、トレース対象ファイル名がファイルサーバからダウンロードされたファイルのファイル名であるか、という条件である。
既に、外部入力ファイル特定部1102aにより、端末Aが外部入力ログ検索期間にファイルサーバからダウンロードしたダウンロードファイルのダウンロードファイル名が外部入力ファイル名2202aとして判明している。判明しているダウンロードファイル名とトレース対象ファイル名とが一致するか比較する。
一致した場合は、トレース部1104は、この時点で処理を終了する。トレース部1104は、終了する際、判定結果2207として、外部出力ファイルはファイルサーバ由来であることを示す結果を出力する。例えば、外部出力ファイルがファイルサーバ由来であることを示す数値コードやメッセージを出力する。
s101の処理は、トレース部1104、特にトレース部1104の転送判定部1114が行う転送判定処理である。
Before performing s101, the tracing unit 1104 sets an initial value for the final trace target file name 2206 set in s106 described later. The trace unit 1104 sets the external output file name 2202b as an initial value in the final trace target file name 2206. That is, the trace unit 1104 sets the trace target file name as an initial value in the final trace target file name 2206. In addition, the trace unit 1104 sets an initial value in the last transition date 2205a set in s107 described later. The trace unit 1104 sets the file output date 2203b as an initial value in the last transition date 2205a. That is, the trace unit 1104 sets the date and time when the file with the trace target file name is attached to the mail as the initial value in the last transition date and time 2205a.
In step s101, the trace unit 1104 indicates that the file identified by the trace target file name is “terminated when it reaches the file downloaded from the file server as a result of tracing the external output file” specified in the trace end condition 2106. Find out if it meets your requirements. This condition is a condition that the trace target file name is the file name of the file downloaded from the file server.
The download file name of the download file that the terminal A downloaded from the file server during the external input log search period has already been identified as the external input file name 2202a by the external input file specifying unit 1102a. Compare the download file name that is known and the file name to be traced.
If they match, the trace unit 1104 ends the process at this point. When the trace unit 1104 terminates, the result indicating that the external output file is derived from the file server is output as the determination result 2207. For example, a numerical code or message indicating that the external output file is derived from a file server is output.
The process of s101 is a transfer determination process performed by the trace unit 1104, particularly the transfer determination unit 1114 of the trace unit 1104.

s101において、トレース部1104は、トレース対象ファイル名が外部入力ファイル名2202aと一致しない場合、s103に進む。
s103では、トレース部1104は、処理対象ログ記憶部1109から読み込むログエントリが残ってないか判定する。残ってない場合、トレース部1104は、判定結果2207として、外部出力ファイルはファイルサーバ由来であるか判定できなかったことを示す結果を出力し、s109へ進む。残ってたらトレース部1104は、s104へ進む。
s104では、処理対象ログ記憶部1109に記憶されたログエントリを逆方向、すなわち、タイムスタンプの新しいものから古いものに向かって順に読む。通常、エントリログは、時系列に古いログエントリから新しいログエントリの順に記録されるが、本実施の形態はトレースバックであるため、ログを逆方向に辿ることになる。
ログエントリには、ファイル操作に関する記録があり、“タイムスタンプ、ユーザ識別子、端末識別子、ファイル名、ファイル操作内容、アプリケーション名”との項目を有する。図18に示すログエントリ210が処理対象ログ記憶部1109に記憶されたログエントリのフォーマットである。なお、図18にはユーザ識別子に対応するユーザ名の項目がないが、端末名212の後ろにあるものとする。また、図18ファイル名に対応する項目はないが、ファイル名は操作内容215に含まれるものとする。
In s101, when the trace target file name does not match the external input file name 2202a, the trace unit 1104 proceeds to s103.
In s103, the trace unit 1104 determines whether there are any log entries to be read from the processing target log storage unit 1109. If not, the trace unit 1104 outputs, as the determination result 2207, a result indicating that the external output file cannot be determined from the file server, and proceeds to s109. If it remains, the trace unit 1104 proceeds to s104.
In s104, the log entries stored in the processing target log storage unit 1109 are read in the reverse direction, that is, in order from the newest time stamp to the oldest. Normally, the entry log is recorded in chronological order from the oldest log entry to the newest log entry. Since this embodiment is a traceback, the log is traced in the reverse direction.
The log entry includes a record relating to a file operation, and includes items such as “time stamp, user identifier, terminal identifier, file name, file operation content, application name”. The log entry 210 shown in FIG. 18 is the format of the log entry stored in the processing target log storage unit 1109. In FIG. 18, there is no user name item corresponding to the user identifier, but it is assumed to be behind the terminal name 212. 18 does not have an item corresponding to the file name, but the file name is included in the operation content 215.

s105において、トレース部1104は、ログエントリが変遷操作を表すか否か判定する。変遷操作とは、ファイルのリネーム、ファイルのコピー、ファイルの移動、のいずれかのファイル操作により、元のファイルに記憶された情報をそのまま変更せずに全て別の新たなファイルに引き継いで、新たなファイルを生成する操作である。トレース部1104は、変遷操作が、読み込んだログエントリに記録されているか確認する。
変遷操作の判定は、ログエントリの操作内容に記録された変遷後のファイル名が、トレース対象ファイル名か判定する。リネーム、コピー、移動の変遷操作においては、変遷操作前のファイル名(パスを含む)と変遷操作後のファイル名(パスを含む)が操作内容215に記録される。トレース部1104は、トレース対象ファイル名がファイル名のみでパスを含まない場合は、変遷後のファイル名(パスを含む)に、トレース対象ファイル名が含まれるか判定する。具体的には、トレース対象ファイル名が、aaa.docであり、変遷後のファイル名がc:¥work¥aaa.docであると、変遷後のファイル名にトレース対象ファイル名が含まれる。すなわち、変遷後のファイル名のパス名を除く部分のファイル名がトレース対象ファイル名と一致する。この場合、トレース部1104は、変遷後のファイル名とトレース対象ファイル名とが一致すると判定する。別の例として、トレース対象ファイル名が、aab.docであり、変遷後のファイル名がc:¥work¥aaa.docであると、変遷後のファイル名にトレース対象ファイル名が含まれない。すなわち、変遷後のファイル名のパス名を除く部分のファイル名がトレース対象ファイル名と一致しない。この場合、トレース部1104は、変遷後のファイル名とトレース対象ファイル名とが一致しないと判定する。
トレース部11104は、トレース対象ファイル名がファイルのパスを含む場合は、そのパスも含めて、ログエントリ上の変遷後のファイル名(パスを含む)との一致を判定する。具体的には、トレース対象ファイル名が、c:¥work¥aaa.docであり、変遷後のファイル名がc:¥work¥aaa.docであると、変遷後のファイル名がレース対象ファイル名と一致する。この場合、トレース部1104は、変遷後のファイル名とトレース対象ファイル名とが一致すると判定する。別の例として、トレース対象ファイル名が、c:¥test¥aaa.docであり、変遷後のファイル名がc:¥work¥aaa.docであると、パス名を含む変遷後のファイル名がパス名を含むレース対象ファイル名と一致しない。この場合、トレース部1104は、変遷後のファイル名とトレース対象ファイル名とが一致しないと判定する。
トレース部1104は、一致することを判定した場合、s106へ進む。一致しないことを判定した場合、s103へ戻る。
In s105, the trace unit 1104 determines whether or not the log entry represents a transition operation. A transition operation is a file operation that can be renamed, copied, moved, or transferred to a new file without changing the information stored in the original file. To create a simple file. The trace unit 1104 confirms whether the transition operation is recorded in the read log entry.
The transition operation is determined by determining whether the file name after the transition recorded in the operation content of the log entry is a trace target file name. In the rename, copy, and move transition operations, the file name before the transition operation (including the path) and the file name after the transition operation (including the path) are recorded in the operation content 215. When the trace target file name includes only the file name and does not include the path, the trace unit 1104 determines whether the trace target file name is included in the transitioned file name (including the path). Specifically, the trace target file name is aaa. doc, and the file name after the transition is c: \ work \ aaa. If it is doc, the traced file name is included in the file name after the transition. That is, the file name in the portion excluding the path name of the file name after the transition matches the trace target file name. In this case, the trace unit 1104 determines that the file name after the transition matches the trace target file name. As another example, the file name to be traced is aab. doc, and the file name after the transition is c: \ work \ aaa. If it is doc, the file name after the transition does not include the trace target file name. That is, the file name in the part other than the path name of the file name after the transition does not match the trace target file name. In this case, the trace unit 1104 determines that the file name after the transition does not match the trace target file name.
When the trace target file name includes the path of the file, the trace unit 11104 determines a match with the file name (including the path) after the transition on the log entry including the path. Specifically, the trace target file name is c: \ work \ aaa. doc, and the file name after the transition is c: \ work \ aaa. If it is doc, the file name after the transition matches the file name to be raced. In this case, the trace unit 1104 determines that the file name after the transition matches the trace target file name. As another example, the trace target file name is c: \ test \ aaa. doc, and the file name after the transition is c: \ work \ aaa. If it is doc, the post-transition file name including the path name does not match the race target file name including the path name. In this case, the trace unit 1104 determines that the file name after the transition does not match the trace target file name.
If the tracing unit 1104 determines that they match, the processing proceeds to s106. If it is determined that they do not match, the process returns to s103.

変遷操作を表すログエントリの操作コマンドと操作内容215との一例は以下である。
・リネーム
操作コマンド : リネーム
ファイル操作内容 : リネーム リネーム前=”c:¥work¥test1.doc” リネーム後=”c:¥work¥test2.doc”
リネーム前が変遷前、リネーム後が変遷後である。
・コピー
操作コマンド : コピー
ファイル操作内容 : コピー コピー元=”c:¥work¥test1.doc” コピー先=”c:¥work¥test2.doc”
コピー元が変遷前、コピー後が変遷後である。
・移動
操作コマンド : 移動
ファイル操作内容 : 移動 移動前=”c:¥work¥test1.doc” 移動後=”c:¥work2¥test1.doc”
移動前が変遷前、移動後が変遷後である。
上記した変遷操作を表す操作コマンドが操作コマンド214に記憶され、かつ、ログエントリの操作内容に変遷後のファイル名が、トレース対象ファイル名で記憶され、かつ、上記したファイル名の判定において一致するとの判定がされていれば、トレース部1104は、s105の判定において、yesと判定する。
トレース部1104は、yesの場合はs106に移行する。noの場合はs103に戻る。
An example of the operation command of the log entry representing the transition operation and the operation content 215 is as follows.
Rename operation command: Rename File operation content: Rename Before rename = “c: ¥ work ¥ test1.doc” After rename = “c: ¥ work ¥ test2.doc”
Before renaming is before the transition and after renaming is after the transition.
Copy operation command: Copy File operation content: Copy Copy source = “c: \ work \ test1.doc” Copy destination = “c: \ work \ test2.doc”
The copy source is before the transition, and after the copy is after the transition.
・ Move operation command: Move File operation content: Move Before move = “c: ¥ work ¥ test1.doc” After move = “c: ¥ work2 ¥ test1.doc”
Before the movement is before the transition, and after the movement is after the transition.
The operation command representing the above transition operation is stored in the operation command 214, and the file name after the transition is stored in the operation contents of the log entry as the trace target file name, and the above file name determination matches. If the determination is made, the trace unit 1104 determines yes in the determination of s105.
In the case of yes, the trace unit 1104 proceeds to s106. If no, return to s103.

s106では、変遷操作に応じてトレース対象ファイルを再設定し、さらに、最終トレース対象ファイル名2206を設定する。
・操作コマンドがリネームの場合
現在のトレース対象ファイル名はリネーム後のファイル名であるから、リネーム前のパスを含んだファイル名をトレース対象ファイル名に再設定し、リネーム前のパスを含んだファイル名を最終トレース対象ファイル名2206に設定する。
・操作コマンドがコピーの場合
現在のトレース対象ファイル名はコピー先のファイル名であるから、コピー元のパスを含んだファイル名をトレース対象ファイル名に再設定し、コピー元のパスを含んだファイル名を最終トレース対象ファイル名2206に設定する。
・操作コマンドが移動の場合
現在のトレース対象ファイル名は移動後のファイル名であるから、移動前のパスを含んだファイル名をトレース対象ファイル名に再設定し、移動前のパスを含んだファイル名を最終トレース対象ファイル名2206に設定する。
In s106, the trace target file is reset according to the transition operation, and the final trace target file name 2206 is set.
-When the operation command is renamed The current trace target file name is the file name after renaming, so the file name including the path before renaming is reset to the trace target file name, and the file including the path before renaming. The name is set to the final trace target file name 2206.
-When the operation command is copy The current trace target file name is the copy destination file name, so reset the file name including the copy source path to the trace target file name, and include the copy source path. The name is set to the final trace target file name 2206.
-When the operation command is move Since the current trace target file name is the file name after the move, reset the file name including the path before the move to the trace target file name, and include the path before the move The name is set to the final trace target file name 2206.

最初にs106を処理する場合、トレース対象ファイル名は、ファイル名のみで、ファイルパスは無い場合がある。これは、メールログであれば、添付ファイル名はわかっても、端末A上のどのパスのファイルかは記録されていないからである。変遷操作に関するログエントリには、ファイルのパスも含まれるため、変遷前のファイルについてはファイルのパスも取得することができる。従って、2回目以降のs106の処理では、トレース対象ファイル名はパスを含んだファイル名となる。   When processing s106 for the first time, the trace target file name may be only the file name and there may be no file path. This is because, in the case of a mail log, the path of the file on the terminal A is not recorded even if the attached file name is known. Since the log entry related to the transition operation includes the file path, the file path can be acquired for the file before the transition. Therefore, in the second and subsequent processing of s106, the trace target file name is a file name including a path.

次に、s107において、トレース部1104は、変遷操作が発生した日時(ログエントリのタイムスタンプ)を最終変遷日時2205aに設定する。具体的には、トレース部1104は、s105でyesと判定したログエントリのタイムスタンプ211を、最終変遷日時2205aに設定する。   Next, in s107, the trace unit 1104 sets the date and time when the transition operation occurred (log entry time stamp) as the final transition date and time 2205a. Specifically, the trace unit 1104 sets the time stamp 211 of the log entry determined as yes in s105 as the last transition date 2205a.

s108において、トレース部1104は、現在のトレース対象ファイル名で識別されるファイルが、トレース終了条件2106に指定された「外部出力ファイルをトレースした結果、ファイルサーバからダウンロードされたファイルに辿りついたら終了」という条件に合うか調べる。その方法は、s101と同じである。
s108において、トレース部1104は、現在のトレース対象ファイル名で識別されるファイルがファイルサーバからダウンロードされたファイルであると判定した場合(yes)、処理を終了する。この場合、トレース部1104は、判定結果2207として、外部出力ファイルはファイルサーバ由来であることを示す結果を出力する。s108において、トレース部1104は、トレース対象ファイル名で識別されるファイルがファイルサーバからダウンロードされたファイルであると判定できなかった場合(no)、s103に戻る。
トレース部1104の処理はここまでである。上記s103からs108は、トレース部1104、特にトレース部1104の変遷判定部1124が行う変遷判定処理である。
In s108, the trace unit 1104 terminates when the file identified by the current trace target file name reaches the file downloaded from the file server as a result of tracing the external output file specified in the trace end condition 2106. To see if it meets the conditions. The method is the same as s101.
If the trace unit 1104 determines in s108 that the file identified by the current trace target file name is a file downloaded from the file server (yes), the process ends. In this case, the trace unit 1104 outputs, as the determination result 2207, a result indicating that the external output file is derived from the file server. In s108, when the trace unit 1104 cannot determine that the file identified by the trace target file name is a file downloaded from the file server (no), the process returns to s103.
The processing of the trace unit 1104 is up to here. Steps s103 to s108 are transition determination processing performed by the trace unit 1104, in particular, the transition determination unit 1124 of the trace unit 1104.

トレース部1104が、判定結果2207として、外部出力ファイルはファイルサーバ由来であるか判定できなかったことを示す結果を出力した場合、トレース結果判断部1105はこの判定結果2207を入力し、コピーアンドペーストファイル特定部1106に対して、コピーアンドペースト調査指示2208を出力する。外部出力ファイルはファイルサーバ由来であるか判定できなかったことを示す結果とは、すなわち、メールで送信された添付ファイルが、ファイルサーバからダウンロードされたファイルであるか判定できなかったが、いずれのファイルをコピー元ファイルとして生成されていることが推定できる候補ファイルがあることを表している。
また、トレース部1104が、判定結果2207として外部出力ファイルはファイルサーバ由来であることを示す結果を出力した場合、トレース結果判断部1105はこの判定結果2207を入力し、トレース結果2107として、「外部出力ファイルはファイルサーバ由来であった」という結果を表すメッセージを出力する。この結果は、表示装置のディスプレイにメッセージとして表示するなど、人間が見て分かる情報で表現する。
When the trace unit 1104 outputs, as the determination result 2207, a result indicating that the external output file cannot be determined from the file server, the trace result determination unit 1105 inputs the determination result 2207, and performs copy and paste. A copy and paste investigation instruction 2208 is output to the file specifying unit 1106. The result indicating that it was not possible to determine whether the external output file originated from the file server, that is, it was not possible to determine whether the attached file sent by e-mail was a file downloaded from the file server. This indicates that there is a candidate file that can be estimated that the file is generated as a copy source file.
When the trace unit 1104 outputs a result indicating that the external output file is derived from the file server as the determination result 2207, the trace result determination unit 1105 inputs the determination result 2207, and the trace result 2107 is “external A message indicating that the output file was derived from the file server is output. This result is expressed by information that can be seen by humans, such as displaying it as a message on the display of the display device.

s109は、図7の変遷判定処理だけでは、外部出力ファイルがファイルサーバ由来であることを発見できなかった場合、さらにログエントリを追跡する処理である。s109の処理は、コピーアンドペーストファイル特定部1106で処理される。s109ではファイル操作ログには現れないコピーアンドペースト操作について判定し、メールで送信された添付ファイルが、ファイルサーバからダウンロードされたファイルであることを判定できなかったが、いずれのファイルをコピー元ファイルとして生成されていることが推定され、元ファイルとして推定されるファイルが複写及び貼り付け(コピーアンドペースト)操作によって生成されたか否か、さらに、ログエントリを追跡する処理である。
コピーアンドペーストファイル特定部1106は、コピーアンドペースト調査指示2208を受け、フローチャート図8,図9の処理を行う。コピーアンドペーストファイル特定部1106は、図6に示すようにしぼり込み期間取得部1116,追跡候補生成部1126を備える。しぼり込み期間取得部1116は、推定した元ファイルを追跡するために、ログエントリをしぼり込むための期間を求める。追跡候補生成部1126は、しぼり込み期間取得部1116が求めたしぼり込み期間に、最終トレース対象ファイル名2206bのファイルを生成した元ファイルを判定する。
図8は、コピーアンドペーストファイル特定部1106及び追加トレース判断部1107の動作を示すフローチャートである。図9は、コピーアンドペーストファイル特定部1106のしぼり込み期間取得部1116の動作を示すフローチャートである。
s109 is a process for further tracking the log entry when the external output file cannot be found from the file server only by the transition determination process of FIG. The process of s109 is processed by the copy and paste file specifying unit 1106. In s109, a copy and paste operation that does not appear in the file operation log is determined, and it cannot be determined that the attached file transmitted by mail is a file downloaded from the file server. This is a process of tracking whether or not a file estimated as an original file has been generated by a copy and paste (copy and paste) operation, and a log entry.
Upon receiving the copy and paste investigation instruction 2208, the copy and paste file specifying unit 1106 performs the processes shown in the flowcharts of FIGS. The copy and paste file specifying unit 1106 includes a squeezing period acquisition unit 1116 and a tracking candidate generation unit 1126 as shown in FIG. The squeezing period acquisition unit 1116 obtains a period for squeezing the log entry in order to track the estimated original file. The tracking candidate generation unit 1126 determines the original file that generated the file of the final trace target file name 2206b during the subtraction period obtained by the subtraction period acquisition unit 1116.
FIG. 8 is a flowchart showing the operations of the copy and paste file specifying unit 1106 and the additional trace determining unit 1107. FIG. 9 is a flowchart showing the operation of the squeezing period acquisition unit 1116 of the copy and paste file specifying unit 1106.

コピーアンドペーストファイル特定部1106は、トレース結果判断部1105からコピーアンドペースト調査指示2208を入力すると、処理対象ログ記憶部1109から操作ログ2204を入力し、最終変遷日時2205a、トレース開始日時2205b、トレース終了日時2205c、最終トレース対象ファイル名2206を、トレース部1104から入力する。トレース開始日時2205b、トレース終了日時2205cは、処理対象期間であるため、記憶装置に記憶された処理対象期間2108を入力しても良い。
最終トレース対象ファイル名2206は、しぼり込み期間取得部1116が入力する処理対象ファイル名の一例である。最終変遷日時2205aは、しぼり込み期間取得部1116が入力する処理対象日時の一例である。
When the copy and paste file specifying unit 1106 inputs the copy and paste investigation instruction 2208 from the trace result determining unit 1105, the copy and paste file specifying unit 1106 inputs the operation log 2204 from the processing target log storage unit 1109, the last transition date 2205a, the trace start date 2205b, the trace The end date and time 2205 c and the final trace target file name 2206 are input from the trace unit 1104. Since the trace start date and time 2205b and the trace end date and time 2205c are processing target periods, the processing target period 2108 stored in the storage device may be input.
The final trace target file name 2206 is an example of a process target file name input by the squeezing period acquisition unit 1116. The last transition date and time 2205a is an example of the processing date and time input by the squeezing-in period acquisition unit 1116.

図8において、まず、コピーアンドペーストファイル特定部1106は、最終トレース対象ファイル名2206で識別されるファイル(最終トレース対象ファイル)に対するオープン・保存日時の特定を行う(s201)。具体的には、図9のフローチャートに従う。
図9において、コピーアンドペーストファイル特定部1106は、トレース対象ファイルオープン日時という変数をNULLに設定する。また、トレース対象ファイル保存日時という変数をNULLに設定する。(s301)。
In FIG. 8, first, the copy and paste file specifying unit 1106 specifies the open / save date and time for the file (final trace target file) identified by the final trace target file name 2206 (s201). Specifically, it follows the flowchart of FIG.
In FIG. 9, the copy and paste file specifying unit 1106 sets a variable called the trace target file open date to NULL. Also, a variable called the trace target file save date is set to NULL. (S301).

次に、s304において、コピーアンドペーストファイル特定部1106は、処理対象ログ記憶部1109から読み込むログエントリが残ってないか判定し、残ってる場合(no)、s303へ戻る。残ってない場合(yes)、処理を終了する。
s303において、コピーアンドペーストファイル特定部1106は、処理対象ログ記憶部1109からログエントリを逆方向(タイムスタンプの新しいものから古いものの順)に一つ入力する。このとき、ログエントリ210のタイムスタンプがトレース開始日時2205bから最終変遷日時2205aであるログエントリ210を入力する。
Next, in s304, the copy and paste file specifying unit 1106 determines whether or not there is a log entry to be read from the processing target log storage unit 1109. If the log entry remains (no), the process returns to s303. If it does not remain (yes), the process is terminated.
In s303, the copy and paste file specifying unit 1106 inputs one log entry from the processing target log storage unit 1109 in the reverse direction (from the newest time stamp to the oldest one). At this time, the log entry 210 whose time stamp of the log entry 210 is from the trace start date 2205b to the last transition date 2205a is input.

次に、s305において、コピーアンドペーストファイル特定部1106は、入力したログエントリの操作コマンド214が、ファイルを記憶する操作を記録し、操作内容215に、最終トレース対象ファイル名2206で識別されるファイルが保存された記録があるか判定する。あることを判定した場合(yes)、s306に移行する。noであれば、s304に戻る。   Next, in s305, the copy and paste file specifying unit 1106 records the operation for storing the file in the operation command 214 of the input log entry, and the file identified by the final trace target file name 2206 in the operation content 215. Determine if there is a saved record. When it is determined that there is (yes), the process proceeds to s306. If no, return to s304.

s306では、コピーアンドペーストファイル特定部1106は、s305でyesと判定されたログエントリ210のタイムスタンプ211を、トレース対象ファイル保存日時(保存日時の一例)に設定する。
s308において、コピーアンドペーストファイル特定部1106は、処理対象ログ記憶部1109から読みこむログエントリが残ってないか判定し、残ってる場合(no)、s307へ進む。残ってない場合(yes)、処理を終了する。
次に、s307において、コピーアンドペーストファイル特定部1106は、ログを逆方向に一つ入力する。
In s306, the copy and paste file specifying unit 1106 sets the time stamp 211 of the log entry 210 determined to be yes in s305 as the trace target file save date (an example of the save date).
In s308, the copy and paste file specifying unit 1106 determines whether or not there are any log entries to be read from the processing target log storage unit 1109. If the log entries remain (no), the process proceeds to s307. If it does not remain (yes), the process is terminated.
Next, in s307, the copy and paste file specifying unit 1106 inputs one log in the reverse direction.

次に、s309において、コピーアンドペーストファイル特定部1106は、入力したログエントリの操作コマンドにファイルを開く操作の操作コマンドが記録され、操作内容215に最終トレース対象ファイル名2206で識別されるファイルがオープンされたことが記録されているか判定する。記録されていれば(yes)、s310に移行する。記録されていなければ(no)、s308に戻る。   Next, in s309, the copy and paste file specifying unit 1106 records the operation command for opening the file in the operation command of the input log entry, and the file identified by the final trace target file name 2206 is stored in the operation content 215. Judge whether it is recorded that it was opened. If it is recorded (yes), the process proceeds to s310. If not recorded (no), the process returns to s308.

s310では、コピーアンドペーストファイル特定部1106は、s309でyesと判定されたログエントリ210のタイムスタンプ211を、トレース対象ファイルオープン日時(オープン日時の一例)に設定する。
上記したs201(s301からs310)の処理は、コピーアンドペーストファイル特定部1106が行う。特に、コピーアンドペーストファイル特定部1106のしぼり込み期間取得部1116が行うしぼり込み期間取得処理である。
In s310, the copy and paste file specifying unit 1106 sets the time stamp 211 of the log entry 210 determined as yes in s309 as the trace target file open date (an example of the open date).
The process of s201 (s301 to s310) described above is performed by the copy and paste file specifying unit 1106. In particular, this is a squeezing period acquisition process performed by the squeezing period acquisition unit 1116 of the copy and paste file specifying unit 1106.

このように図9のフローチャートに従うことで、トレース開始日時から最終変遷日時までの期間に、最終トレース対象ファイル名で識別されるファイルのオープン或いは保存の日時がわかる。両方とも発生していない場合は、トレース対象ファイルオープン日時もトレース対象ファイル保存日時も設定されず、初期値すなわちNULLである。   Thus, by following the flowchart of FIG. 9, the date of opening or saving of the file identified by the final trace target file name can be known in the period from the trace start date to the last transition date. If neither has occurred, neither the trace target file open date nor the trace target file save date is set, but the initial value, that is, NULL.

図8に戻る。次に、s202において、コピーアンドペーストファイル特定部1106は、トレース対象候補ファイル名(追跡候補ログの一例)の特定を行う。トレース対象候補ファイル名とは、ファイルに記憶された情報をコピーし、コピーした情報を最終トレース対象ファイル名2206で識別されるファイルへペーストした、そのコピー元となったと推定されるファイルのファイル名である。
s202の処理を、図10を用いて説明する。図10は、コピーアンドペーストファイル特定部1106の追跡候補生成部1126の動作を示すフローチャートである。
Returning to FIG. Next, in s202, the copy and paste file specifying unit 1106 specifies a trace target candidate file name (an example of a tracking candidate log). The trace target candidate file name is the file name of the file that is estimated to be the copy source after copying the information stored in the file and pasting the copied information to the file identified by the final trace target file name 2206 It is.
The process of s202 will be described with reference to FIG. FIG. 10 is a flowchart showing the operation of the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106.

まず、s401において、コピーアンドペーストファイル特定部1106は、トレース対象ファイルオープン日時=NULL又はトレース対象ファイル保存日時=NULLを判断する。これは、トレース開始日時から最終変遷日時までの期間に、最終トレース対象ファイル名で識別されるファイルのオープンと保存が発生したかの確認である。yesの場合、コピーアンドペーストファイル特定部1106は、処理を終了する。noの場合、コピーアンドペーストファイル特定部1106はs402に移行する。   First, in s401, the copy and paste file specifying unit 1106 determines whether the trace target file open date = NULL or the trace target file save date = NULL. This is a confirmation whether the file identified by the final trace target file name has been opened and saved during the period from the trace start date to the last transition date. In the case of yes, the copy and paste file specifying unit 1106 ends the process. In the case of no, the copy and paste file specifying unit 1106 proceeds to s402.

s402では、コピーアンドペーストファイル特定部1106は、トレース対象ファイルオープン日時からトレース対象ファイル保存日時までのしぼり込み期間のログエントリ210を処理対象ログ記憶部1109から順次入力する。具体的には、コピーアンドペーストファイル特定部1106は、ログエントリ210のタイムスタンプ211が、しぼり込み期間であるログエントリを順次入力する。   In s402, the copy and paste file specifying unit 1106 sequentially inputs from the processing target log storage unit 1109 the log entries 210 of the squeezing period from the trace target file open date to the trace target file save date. Specifically, the copy and paste file specifying unit 1106 sequentially inputs log entries in which the time stamp 211 of the log entry 210 is a narrowing period.

次に、s403では、コピーアンドペーストファイル特定部1106は、s402で入力したログエントリ210が、以下の条件に合致することが判定し、合致することを判定したログエントリ210を追跡候補ログとしてトレース対象候補ファイルリスト2211(ファイル追跡システム1が備える記憶装置が記憶するファイルの一例)に記憶する。
・操作内容215に最終トレース対象ファイル名2206と拡張子が同じであるファイル名が記録されている(トレース条件2105を参照することによる)
・操作コマンド214に、ファイルを開く(オープンする)か、ファイルを閉じる(クローズ)のいずれかを行っている操作が記録されている
上記条件に合致するか判定することにより、コピーアンドペーストファイル特定部1106は、最終トレース対象ファイル名2206で識別されるファイルをオープンしてから保存する間に、別途オープンしていた別の同種類のファイルの有無を判定し、ファイルが有る場合は、判定できたログエントリを追跡候補ログとしてトレース対象候補ファイルリスト2211に追加する。追跡候補ログが有する操作内容215に含まれたファイル名であって、合致することが判定されたファイルのファイル名をトレース対象候補ファイル名(類似ファイル名の一例)とする。
最終トレース対象ファイル名2206で識別されるファイルをオープンしてから保存する間に、別途同種類のファイルをオープンしていた場合、その別ファイルから最終トレース対象ファイル名2206にコピーアンドペーストが発生した可能性があるため、それらをトレース対象の候補ファイルとして扱う。また、複数存在する可能性があるため、リスト化(ファイル化)する。
図8のs202は、コピーアンドペーストファイル特定部1106が行う。特に、コピーアンドペーストファイル特定部1106の追跡候補生成部1126が行う追跡候補生成処理である。
Next, in s403, the copy and paste file specifying unit 1106 determines that the log entry 210 input in s402 satisfies the following conditions, and traces the log entry 210 determined to match as a tracking candidate log. The target candidate file list 2211 (an example of a file stored in a storage device included in the file tracking system 1) is stored.
A file name having the same extension as the last trace target file name 2206 is recorded in the operation content 215 (by referring to the trace condition 2105).
-The operation command 214 records the operation that opens (opens) or closes the file (closes). Copy / paste file identification by determining whether the above conditions are met While the file identified by the final trace target file name 2206 is opened and saved, the unit 1106 determines whether there is another file of the same type that has been opened separately, and can determine if there is a file. The log entry is added to the trace target candidate file list 2211 as a tracking candidate log. A file name included in the operation content 215 included in the tracking candidate log and the file name of the file determined to match is set as a trace target candidate file name (an example of a similar file name).
If the same type of file was opened while the file identified by the final trace target file name 2206 was opened and saved, copy and paste occurred from that other file to the final trace target file name 2206 Because there is a possibility, they are treated as candidate files to be traced. In addition, since there is a possibility that a plurality of files exist, a list is created (filed).
8 is performed by the copy and paste file specifying unit 1106. In particular, this is a tracking candidate generation process performed by the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106.

図8に戻る。
s203では、コピーアンドペーストファイル特定部1106は、トレース対象候補ファイルリスト2211が空か調べる。空の場合(yes)、コピーアンドペーストファイル特定部1106は、処理を終了する。この場合、コピーアンドペーストファイル特定部1106は、「コピー元ファイルの特定無しを示す結果」を特定結果2209として出力する。
追加トレース判断部1107(追加追跡ログ判定部の一例)は、特定結果2209を入力し、特定結果2209が「コピー元ファイルの特定無しを示す結果」を表す場合、処理を終了し、表さない場合、s204に移行する。
Returning to FIG.
In s203, the copy and paste file specifying unit 1106 checks whether the trace target candidate file list 2211 is empty. If it is empty (yes), the copy and paste file specifying unit 1106 ends the process. In this case, the copy and paste file specifying unit 1106 outputs “a result indicating that the copy source file is not specified” as the specifying result 2209.
The additional trace determination unit 1107 (an example of an additional tracking log determination unit) inputs the identification result 2209, and if the identification result 2209 indicates “result indicating that the copy source file is not specified”, the process ends and does not represent. In the case, the process proceeds to s204.

s204では、追加トレース判断部1107(追加追跡ログ判定部の一例)が、トレース対象候補ファイルリスト2211の先頭から順に、追跡候補ログを入力する。   In s204, the additional trace determination unit 1107 (an example of the additional tracking log determination unit) inputs the tracking candidate log in order from the top of the trace target candidate file list 2211.

次に、s205において、追加トレース判断部1107は、トレース対象候補ファイル名で識別されるファイルがトレース対象として妥当か判定する。
判定する方法として、以下がある。
・「トレース対象候補ファイル名で識別されるファイル」と「最終トレース対象ファイル名2206で識別されるファイル」の類似性を調べる。類似していれば妥当と判断する。類似性の判定方法は公知のファイル類似性比較技術を用いればよい。
例えば、
・トレース対象候補ファイル名で識別されるファイルに、予め設定した機密ファイルを示す用語が含まれているか検索する。含まれていれば、妥当と判断する。機密ファイルを示す用語は、ファイルサーバのファイルに含まれる用語とする。
・「トレース対象候補ファイル名で識別されるファイル」の内容である追跡候補情報をトレース対象候補ファイル名で識別されるファイルから入力し、「最終トレース対象ファイル名2206で識別されるファイル」の内容である生成元情報を最終トレース対象ファイル名2206で識別されるファイルから入力する。生成元情報と追跡候補情報とがどのぐらい一致するか表す類似度を算出し、算出した類似度とあらかじめファイル追跡システム1の記憶装置に記憶された閾値(類似閾値)とを比較し、類似度が閾値より大きいことを判定した場合、妥当と判断する。具体的には、生成元情報が「ABCDEFG」という7つの文字列であり、追跡候補情報が「XYZABCDEFG12345」という15個の文字列であるとすると、追跡候補情報には生成元情報がすべて含まれ、追跡候補情報の15個の文字列のうち7文字が生成元情報と一致するので、類似度は、7/15×100より約47%と求められる。閾値が40%であると、追加トレース判断部1107は妥当と判断する。閾値が60%であると、追加トレース判断部1107は妥当でないと判断する。
In step s205, the additional trace determination unit 1107 determines whether the file identified by the trace target candidate file name is valid as a trace target.
There are the following determination methods.
The similarity between the “file identified by the trace target candidate file name” and the “file identified by the final trace target file name 2206” is examined. If they are similar, it is judged appropriate. As a method for determining similarity, a known file similarity comparison technique may be used.
For example,
Search whether the file identified by the trace target candidate file name contains a term indicating a preset confidential file. If it is included, it is judged appropriate. The term indicating the confidential file is a term included in the file of the file server.
-Input the tracking candidate information, which is the content of the "file identified by the trace target candidate file name", from the file identified by the trace target candidate file name, and the content of the "file identified by the final trace target file name 2206" Is input from the file identified by the final trace target file name 2206. A similarity indicating how much the generation source information matches the tracking candidate information is calculated, and the calculated similarity is compared with a threshold (similarity threshold) stored in the storage device of the file tracking system 1 in advance. Is determined to be appropriate when it is determined that is greater than the threshold. Specifically, if the source information is seven character strings “ABCDEFG” and the tracking candidate information is 15 character strings “XYZABCDEFFG12345”, the tracking candidate information includes all the source information. Since 7 characters out of the 15 character strings of the tracking candidate information match the generation source information, the similarity is calculated to be about 47% from 7/15 × 100. If the threshold value is 40%, the additional trace determination unit 1107 determines that it is appropriate. If the threshold value is 60%, the additional trace determination unit 1107 determines that it is not valid.

s206において、追加トレース判断部1107は、トレース対象候補ファイル名で識別されるファイルがトレース対象として妥当と判断した場合は、s207に移行する。妥当ではないと判断した場合は、s208へ移行する。   If the additional trace determining unit 1107 determines in s206 that the file identified by the trace target candidate file name is appropriate as the trace target, the process proceeds to s207. If it is determined to be invalid, the process proceeds to s208.

s207では、追加トレース判断部1107は、妥当と判断したトレース対象候補ファイル名を含むログエントリ210を追加追跡ログとして追加トレース対象ファイルリスト2210a(追加追跡ログ記憶部の一例)に追加する。追加追跡ログが有する操作内容に含まれたファイル名であって、妥当と判断されたトレース対象候補ファイル名を追加トレース対象ファイル名2210bとする。   In s207, the additional trace determination unit 1107 adds the log entry 210 including the trace target candidate file name determined to be valid to the additional trace target file list 2210a (an example of the additional tracking log storage unit) as an additional tracking log. The file name included in the operation content of the additional tracking log and the trace target candidate file name determined to be valid is set as the additional trace target file name 2210b.

s208では、追加トレース判断部1107は、トレース対象候補ファイルリスト2211に記憶されたすべての追跡候補ログについて処理を行ったか判定する。すべての追跡候補ログについて処理を行ったと判定した場合、追加トレース判断部1107は、処理を終了する。
終了する際、追加トレース対象ファイルリストが空であれば、トレース結果2107としてコピー元ファイルの特定無しを示す結果を出力する。空でなければ、トレース結果2107としてコピー元ファイルの特定有りを示す結果を出力する。
追加トレース判断部1107は、すべての追跡候補ログについて処理を行っていないと判定した場合、s204に戻る。
In s208, the additional trace determination unit 1107 determines whether processing has been performed for all the tracking candidate logs stored in the trace target candidate file list 2211. If it is determined that all the tracking candidate logs have been processed, the additional trace determination unit 1107 ends the process.
When the process ends, if the additional trace target file list is empty, a result indicating that the copy source file is not specified is output as the trace result 2107. If not empty, a result indicating that the copy source file is specified is output as the trace result 2107.
If the additional trace determination unit 1107 determines that all the tracking candidate logs have not been processed, the process returns to s204.

このようにして、トレース対象候補ファイルリスト2211から、最終トレース対象ファイル名2206で識別されるファイルに対してコピーアンドペーストのコピー元となっている可能性のあるファイルを特定し、追加トレース対象ファイルリスト2210aに加える。追加トレース対象ファイルリスト2210aは、さらに追加でトレースを行う対象のファイル名のリストであり、ファイルサーバのファイルが由来であるか調べる対象である。
図8のs203は、コピーアンドペーストファイル特定部1106の処理であり、s203の一部、s204〜s208は、追加トレース判断部1107の追加追跡ログ判定処理である。
追加トレース判断部1107は、トレース結果2107(コピー元ファイルの特定の有無)、追加トレース対象ファイルリスト2210aを出力する。
In this way, a file that may be a copy-and-paste copy source for the file identified by the final trace target file name 2206 is identified from the trace target candidate file list 2211, and the additional trace target file is identified. Add to list 2210a. The additional trace target file list 2210a is a list of file names to be additionally traced, and is a target for examining whether the file of the file server is derived.
8 is a process of the copy and paste file specifying unit 1106, and a part of s 203, s 204 to s 208 is an additional tracking log determination process of the additional trace determination unit 1107.
The additional trace determination unit 1107 outputs a trace result 2107 (whether or not the copy source file is specified) and an additional trace target file list 2210a.

トレース部1104は、コピー元ファイルの特定が有る場合、すなわち、追加トレース対象ファイルリスト2210aに1つ以上の追加追跡ログが記憶されている場合、追加トレース対象ファイルリスト2210aから追加追跡ログを順次入力し、追加追跡ログが有する操作内容に含まれた追加トレース対象ファイル名2210bを取得し、追加トレース対象ファイル名2210bを新たなトレース対象ファイル名として、図8の追跡処理のトレースバックを行う。
コピー元ファイルの特定が無い場合、すなわち、追加トレース対象ファイルリスト2210aに追加追跡ログが記憶されていない場合、トレース部1104は、処理を行わない。
When the copy source file is specified, that is, when one or more additional trace logs are stored in the additional trace target file list 2210a, the trace unit 1104 sequentially inputs the additional trace logs from the additional trace target file list 2210a. Then, the additional trace target file name 2210b included in the operation content of the additional trace log is acquired, and the trace processing of the tracking process of FIG. 8 is performed using the additional trace target file name 2210b as the new trace target file name.
When the copy source file is not specified, that is, when the additional trace log is not stored in the additional trace target file list 2210a, the trace unit 1104 does not perform processing.

図7から図10で説明したファイル追跡システム1の各処理の順序を説明する。
図17は、トレース部及びコピーアンドペーストファイル特定部、追加トレース判断部の処理の概要を表すフローチャートである。
図17において、ファイル追跡システム1は、S1において、転送判定部1114により転送判定処理を行う。転送判定処理は、図7のs101である。
S2において、変遷判定部1124により変遷判定処理を行う。変遷判定処理は、図7のs103からs108である。
S3において、トレース結果判断部1105により、トレース結果判定処理を行う。
S4において、トレース結果判断部1105により、結果出力処理を行う。結果出力処理は、ファイルサーバのファイル由来であることが確認できた場合、または、ファイルサーバのファイル由来でないことが確認できた場合、確認できた結果を出力する。
S5において、しぼり込み期間取得部1116により、しぼり込み期間取得処理を行う。しぼり込み期間取得処理は、図8のs201である。
S6において、追跡候補生成部1126により、追跡候補生成処理を行う。追跡候補生成処理は、図8のs202である。
S7において、追加トレース判断部1107により、追加追跡ログ判定処理を行う。追加追跡ログ判定処理は、図8のs203の一部、s204からs208の処理である。追加追跡ログ判定処理では、追加追跡ログがある場合は、S1から処理を繰り返す。追加追跡ログがない場合は、処理を終了する。
The order of each process of the file tracking system 1 described with reference to FIGS. 7 to 10 will be described.
FIG. 17 is a flowchart showing an outline of processing of the trace unit, the copy and paste file specifying unit, and the additional trace determination unit.
In FIG. 17, the file tracking system 1 performs a transfer determination process by the transfer determination unit 1114 in S1. The transfer determination process is s101 in FIG.
In S <b> 2, the transition determination unit 1124 performs transition determination processing. The transition determination process is from s103 to s108 in FIG.
In S3, the trace result determination unit 1105 performs a trace result determination process.
In S4, the trace result determination unit 1105 performs a result output process. In the result output process, when it is confirmed that the file is derived from the file of the file server, or when it is confirmed that the file is not derived from the file of the file server, the confirmed result is output.
In S <b> 5, the narrowing period acquisition unit 1116 performs a narrowing period acquisition process. The squeezing period acquisition process is s201 in FIG.
In S6, the tracking candidate generation unit 1126 performs tracking candidate generation processing. The tracking candidate generation process is s202 in FIG.
In step S7, the additional trace determination unit 1107 performs an additional tracking log determination process. The additional tracking log determination process is a part of s203 in FIG. 8 and processes from s204 to s208. In the additional tracking log determination process, if there is an additional tracking log, the process is repeated from S1. If there is no additional tracking log, the process ends.

ファイル追跡システム1は、最終的に1つ以上のトレース対象ファイル名で識別されるファイルが、ファイルサーバのファイル由来であることが確認できた場合に、外部出力ファイルは、ファイルサーバのファイル由来であると判断する。   When the file tracking system 1 confirms that the file finally identified by one or more trace target file names originates from the file server file, the external output file originates from the file server file. Judge that there is.

追加トレース対象ファイル名2210bのトレースバックは、そのままトレース部1104に返すと、トレース対象期間を最初から調査することになる。トレース開始日時からトレース対象ファイル保存日時までの間の調査で十分であるため、以下の様に処理してもよい。
s207においてトレース対象候補ファイル名を追加トレース対象ファイルリストに加える際に、トレース対象ファイル保存日時もトレース対象候補ファイル名の参考情報としてリストに加える。
追加トレース対象ファイル名2210bで識別されるファイルのトレースバック時には、トレース部1104において、該トレース対象ファイル保存日時をトレース終了日時として扱い、トレース開始日時〜トレース対象ファイル保存日時の期間をトレース対象期間としてトレースバックさせてもよい。
When the traceback of the additional trace target file name 2210b is returned to the trace unit 1104 as it is, the trace target period is investigated from the beginning. Since the investigation between the trace start date and time and the trace target file save date and time is sufficient, the following processing may be performed.
When adding the trace target candidate file name to the additional trace target file list in s207, the trace target file save date and time is also added to the list as reference information of the trace target candidate file name.
When the file identified by the additional trace target file name 2210b is traced back, the trace unit 1104 treats the trace target file storage date / time as the trace end date / time, and sets the period from the trace start date / time to the trace target file storage date / time as the trace target period. It may be traced back.

本実施の形態では、外部入力ログファイルとしてファイルサーバログファイルを例としたが、他のログファイルでも良い。また、外部出力ログファイルとしてメールログファイルを例としたが、他のログファイルでも良い。   In this embodiment, the file server log file is taken as an example of the external input log file, but another log file may be used. Further, although the mail log file is taken as an example of the external output log file, other log files may be used.

本実施の形態によれば、操作ログ(ログエントリ)のみの分析において、ファイルの変遷操作に基づくトレースバックを行い、ファイルサーバ由来のファイルか確認できなかった場合においても、最後のトレース対象ファイル(最終トレース対象ファイル)をオープン・保存した期間に、別途オープンしていた同種の他のファイルを、コピー元として特定し、新たなトレース対象ファイルに設定し、さらにトレースバックを行う。この結果、従来、操作ログだけでは、トレースできなかったファイルの内容のコピーアンドペーストにも対応したトレースバックを実現できる効果がある。さらに、コピー元候補のファイルの特定においては、コピー元候補のファイルとトレース対象ファイルとの類似性や、機密を表すキーワードを検索することにより、コピー元候補を確定することができる。   According to the present embodiment, in the analysis of only the operation log (log entry), the traceback based on the file transition operation is performed, and even if the file originated from the file server cannot be confirmed, the last trace target file ( During the period when the last trace target file) is opened and saved, another file of the same type that has been opened separately is specified as the copy source, set as a new trace target file, and further trace backed. As a result, there is an effect that trace back corresponding to copy and paste of the contents of a file that could not be traced with the operation log alone can be realized. Furthermore, in specifying the copy source candidate file, the copy source candidate can be determined by searching for similarities between the copy source candidate file and the trace target file and keywords representing confidentiality.

本実施の形態では、機密情報として漏洩されたか調査したいファイルに対して、ファイル操作ログ等の複数のログから、ファイル間のデータのコピーアンドペーストを含んだ該ファイルに対する操作を追跡するファイル追跡装置の一例を説明した。ファイル追跡装置が行うトレースバックにおいて、トレース対象ファイルをオープンし保存するまでの期間に別途開いていたファイルをコピー元の候補とし、トレース対象ファイルと該ファイル間の類似を調べることで該ファイルをコピー元であることを特定する。
また、本実施の形態では、ファイル操作ログなどの複数ログを用いて、ファイルのトレースバックを行い、あるファイルが機密情報由来であるかトレースを行なうファイル追跡装置であって、
・ファイル操作ログから、トレース対象ファイルをオープンし、保存するまでの期間に、別途オープンしていたファイルをコピー元の候補ファイルとして選択する
・選択されたコピー元の候補ファイルに、機密ファイルに含まれるキーワードが含まれるか検査し、含まれていればコピー元の候補ファイルを新たなトレース対象ファイルとする
・選択されたコピー元の候補ファイルとトレース対象ファイルの類似性を検査し、類似していればコピー元の候補ファイルを新たなトレース対象ファイルとする
との処理を行うファイル追跡装置の一例を説明した。
In the present embodiment, a file tracking device that tracks an operation on a file including copy and paste of data between files from a plurality of logs such as a file operation log with respect to a file that is to be investigated whether it has been leaked as confidential information An example was described. In the traceback performed by the file tracking device, the file that was opened separately until the trace target file is opened and saved is used as the copy source candidate, and the file is copied by examining the similarity between the trace target file and the file. Identify original.
Further, in the present embodiment, a file tracking device that performs trace back of a file using a plurality of logs such as a file operation log and traces whether a certain file is derived from confidential information,
・ From the file operation log, select the file that was opened separately as the copy source candidate file during the period from when the trace target file is opened and saved ・ Included in the confidential file in the selected copy source candidate file If it is included, the copy source candidate file is used as a new trace target file. • The similarity between the selected copy source candidate file and the trace target file is checked and they are similar. Thus, an example of a file tracking device that performs processing for setting a copy source candidate file as a new trace target file has been described.

実施の形態2.
本実施の形態では、本発明のファイル追跡装置の一例としてファイル追跡システム1よる、コピーアンドペーストへ対応したファイル操作ログのトレースフォワードの実行について説明する。
実施の形態1と同じく、外部入力ログファイルはファイルサーバログファイルとし、外部出力ログファイルはメールログファイルとする。
Embodiment 2. FIG.
In the present embodiment, execution of trace forward of a file operation log corresponding to copy and paste by the file tracking system 1 as an example of the file tracking apparatus of the present invention will be described.
As in the first embodiment, the external input log file is a file server log file, and the external output log file is a mail log file.

ファイル追跡システム1の構成の説明を行う。
システムの構成は図2及び図6と同じであるが、一部構成要素に対する入出力内容が異なるため差分について説明する。
・トレース部1104
判定結果2207は、外部入力ファイルが端末外部へ出力されたか判定した結果を出力する。
トレース開始条件2104は、本実施の形態ではトレースフォワードのモードで動くように指定する。
トレース終了条件2106はトレースを終了するための条件であり、「外部入力ファイルをトレースした結果、添付ファイルでメール送信された場合に終了する」、という条件を指定する。
The configuration of the file tracking system 1 will be described.
Although the system configuration is the same as in FIGS. 2 and 6, the input / output contents for some components are different, so the difference will be described.
Trace part 1104
The determination result 2207 outputs the result of determining whether the external input file has been output to the outside of the terminal.
The trace start condition 2104 is designated to move in the trace forward mode in this embodiment.
The trace end condition 2106 is a condition for ending the trace, and designates a condition “end when mail is transmitted as an attached file as a result of tracing the external input file”.

・トレース結果判断部1105
外部入力ファイルをトレースした結果、添付ファイルでメール送信されていないと判断した場合、外部入力ファイル、或いは外部入力ファイルが変遷したファイルのデータをコピーし、コピーしたデータを他のファイルへペーストしていないか判断するために、コピーアンドペースト調査指示2208を出力する。
Trace result determination unit 1105
If the external input file is traced and it is determined that the e-mail is not sent as an attached file, the data of the external input file or the file in which the external input file has changed is copied, and the copied data is pasted to another file. In order to determine whether there is any, a copy and paste investigation instruction 2208 is output.

動作の説明を行う。
図2、図6のファイル追跡システム1のトレースフォワードの動作について説明する。本実施の形態では、ファイルサーバからのファイルのダウンロードを行った後、このファイルが、添付ファイルでメール送信されていないかトレースを行う場合の動作について説明する。
The operation will be described.
The trace forward operation of the file tracking system 1 of FIGS. 2 and 6 will be described. In this embodiment, after downloading a file from the file server, an operation will be described in which tracing is performed to check whether this file has been mailed as an attached file.

外部入力ログファイル取り込み部1101aは、外部入力ログファイル2101aとしてファイルサーバログファイルを取り込む。外部入力ログファイル2101aから、当ログファイルの指定のフォーマットに従い、ログを取り出し、外部入力ログ2201aとして外部入力ファイル特定部1102aへ出力する。本実施の形態では、“ダウンロード日時(タイムスタンプの一例)、ダウンロードした端末の識別子(端末名の一例)、ダウンロードファイル名(操作内容の一例)”という項目を有するフォーマットでログを出力する。   The external input log file capturing unit 1101a captures a file server log file as the external input log file 2101a. A log is extracted from the external input log file 2101a according to the specified format of the log file, and is output to the external input file specifying unit 1102a as the external input log 2201a. In the present embodiment, a log is output in a format having items of “download date / time (an example of a time stamp), identifier of a downloaded terminal (an example of a terminal name), and download file name (an example of operation content)”.

外部入力ファイル特定部1102aは、外部入力ログ2201aに対して、外部入力ファイル特定条件2102aに基づき外部入力ファイル名2202aとファイル入力日時2203aを特定する。本実施の形態では、外部入力ファイル特定条件2102aに「指定期間に、端末Aがファイルサーバからファイルをダウンロードした場合」を設定する。本実施の形態では、指定期間を“2010/11/01 09:00:00から2010/11/01 17:00:00”の8時間とする。外部入力ファイル特定部1102aは該指定期間に、端末Aがファイルサーバからファイルをダウンロードした記録に該当するログエントリを抽出し、ダウンロード日時とダウンロードファイル名を取り出す。具体的には、外部入力ログ2201aが有するダウンロード日時が指定期間に含まれ、かつ、ダウンロードした端末の識別子が端末Aを表す外部入力ログ2201aを抽出する。抽出した外部入力ログ2201aからダウンロード日時、ダウンロードファイル名を取得する。本実施の形態では、2010/11/01 09:30:00に端末Aがファイルサーバからファイルをダウンロードしたとする。外部入力ファイル特定部1102aは、外部入力ファイル名2202aにダウンロードしたファイル名、ファイル入力日時2203aにダウンロード日時2010/11/01 09:30:00を設定する。
指定期間は、トレースフォワードを開始する時期としてあらかじめファイル追跡システム1の運用者により記憶装置に記憶され、外部入力ファイル特定部1102aは、記憶装置から指定期間を入力する。なお、指定期間内に端末Aがファイルサーバから複数回ファイルをダウンロードすると、外部入力ファイル特定部1102aは、外部入力ファイル名2202aとファイル入力日時2203aを複数出力する。このように複数出力された場合は、例えば、外部入力ファイル名2202aとファイル入力日時2203aとの組のうちファイル入力日時2203aが最も古いものから順にトレース部1104に出力して、トレースを行わせる。1つの組についてトレースが終了したら、次にファイル入力日時2203aが古い組をトレース部1104に出力してトレースを行わせる。
The external input file specifying unit 1102a specifies the external input file name 2202a and the file input date / time 2203a based on the external input file specifying condition 2102a with respect to the external input log 2201a. In the present embodiment, “when terminal A downloads a file from the file server during a specified period” is set in external input file specifying condition 2102a. In the present embodiment, the designated period is 8 hours from “2010/11/01 09:00:00 to 2010/11/01 17:00:00”. The external input file specifying unit 1102a extracts a log entry corresponding to the record in which the terminal A downloaded the file from the file server during the specified period, and extracts the download date and the download file name. Specifically, the external input log 2201a in which the download date and time included in the external input log 2201a is included in the specified period and the identifier of the downloaded terminal indicates the terminal A is extracted. Download date / time and download file name are acquired from the extracted external input log 2201a. In the present embodiment, it is assumed that terminal A downloads a file from the file server at 2010/11/01 09:30. The external input file specifying unit 1102a sets the downloaded file name in the external input file name 2202a, and the download date and time 2010/11/01 09:30 at the file input date and time 2203a.
The specified period is stored in advance in the storage device by the operator of the file tracking system 1 as the time to start the trace forward, and the external input file specifying unit 1102a inputs the specified period from the storage device. When the terminal A downloads the file from the file server a plurality of times within the designated period, the external input file specifying unit 1102a outputs a plurality of external input file names 2202a and file input date / time 2203a. When a plurality of outputs are output in this way, for example, the oldest file input date / time 2203a in the set of the external input file name 2202a and the file input date / time 2203a is output to the trace unit 1104 in order from the oldest, and the tracing is performed. When tracing is completed for one group, the group having the oldest file input date and time 2203a is output to the trace unit 1104 for tracing.

外部出力ログファイル取り込み部1101bは、外部出力ログファイル2101bとしてメールログファイルを取り込む。外部出力ログファイル2101bから、当ログファイルの指定のフォーマットに従い、ログを取り出し、外部出力ログ2201bとして外部出力ファイル特定部1102bへ出力する。本実施の形態では、“送信日時(タイムスタンプの一例)、送信元メールアドレス(操作内容の一例)、あて先メールアドレス(操作内容の一例)、添付ファイル名(操作内容の一例)、添付ファイルサイズ(操作内容の一例)”という項目を有するフォーマットでログを出力する。   The external output log file capturing unit 1101b captures a mail log file as the external output log file 2101b. The log is extracted from the external output log file 2101b according to the specified format of the log file, and is output to the external output file specifying unit 1102b as the external output log 2201b. In the present embodiment, “transmission date and time (an example of a time stamp), transmission source email address (an example of operation content), destination email address (an example of operation content), attached file name (an example of operation content), and attached file size (Example of operation content) A log is output in a format having an item “.

外部出力ファイル特定部1102bは、外部出力ログ2201bに対して、外部出力ファイル特定条件2102bに基づき外部出力ファイル名2202bとファイル出力日時2203bを特定する。外部出力ファイル特定条件2102bに「外部出力ログ検索期間において、端末Aのユーザが添付ファイルをメールで送信した場合」を指定し、端末Aのユーザのメールアドレスからの添付ファイルの送信に該当するログエントリを抽出し、その添付ファイル名と送信日時(タイムスタンプ)を取り出す。具体的には、外部出力ログ2201bが有する送信日時が外部出力ログ検索期間に含まれ、かつ、送信元メールアドレスが端末Aを表す外部出力ログ2201bを取り出す。外部出力ファイル特定部1102bは、取り出した外部出力ログ2201bが有する添付ファイル名を取得し、外部出力ファイル名2202bに取得した添付ファイル名を設定する。外部出力ファイル特定部1102bは、取り出した外部出力ログ2201bが有する送信日時を取得し、ファイル出力日時2203bに取得した送信日時(タイムスタンプ)を設定する。なお、外部出力ログ2201bが複数ある場合は、最も新しい送信日時をファイル出力日時2203bに設定する。外部出力ログ検索期間とは、「外部入力ファイル特定条件2102aにおける指定期間の最初の日時」から未来に向かって、外部出力ログ2201bを検索する期間を指定する。本実施の形態では、未来に向かう期間を「31日」として、あらかじめファイル追跡システム1の運用者により記憶装置に記憶されているものとする。外部入力ファイル特定条件2102aにおける指定期間の最初の日時を、端末Aがファイルサーバから機密ファイルをダウンロードしたダウンロード日時2010/11/01 09:30:00よりも前にする。ここでは、2010/11/01 09:00:00とすると、2010/11/01 09:00:00から31日後は2010/12/02 09:00:00と求められる。外部出力ログ検索期間は、2010/11/01 09:00:00から2010/12/02 09:00:00までの期間になる。外部出力ファイル特定部1102bは、2010/11/01 09:00:00から2010/12/02 09:00:00までの外部出力ログ2201bの記録から、端末Aのユーザのメールアドレスから添付ファイルを送信したログエントリを抽出する。具体的には、外部出力ログ2201bから、外部出力ログ2201bが有する送信日時が2010/11/01 09:00:00から2010/12/02 09:00:00までの期間に含まれ、かつ、送信元メールアドレスが端末Aのユーザを表す外部出力ログ2201bを取り出す。ここでは、送信日時が2010/12/01 09:30:00である外部出力ログ2201bが抽出されるものとする。
外部出力ログ検索期間は、後述するトレーストレース対象期間(「トレース対象期間」は処理対象期間の一例)以上、すなわち、トレース対象期間を含む期間を設定する。
The external output file specifying unit 1102b specifies the external output file name 2202b and the file output date 2203b based on the external output file specifying condition 2102b for the external output log 2201b. A log corresponding to the transmission of an attached file from the user A's mail address is specified in the external output file specifying condition 2102b by specifying "when the user of the terminal A sends an attached file by mail during the external output log search period" The entry is extracted, and the attached file name and transmission date / time (time stamp) are extracted. Specifically, an external output log 2201b in which the transmission date and time of the external output log 2201b is included in the external output log search period and the transmission source mail address indicates the terminal A is extracted. The external output file specifying unit 1102b acquires the attached file name included in the extracted external output log 2201b, and sets the acquired attached file name in the external output file name 2202b. The external output file specifying unit 1102b acquires the transmission date and time of the extracted external output log 2201b, and sets the acquired transmission date and time (time stamp) in the file output date and time 2203b. If there are a plurality of external output logs 2201b, the most recent transmission date / time is set as the file output date / time 2203b. The external output log search period specifies a period for searching the external output log 2201b from the “first date and time of the specified period in the external input file specifying condition 2102a” to the future. In the present embodiment, it is assumed that the period toward the future is “31 days” and is stored in the storage device by the operator of the file tracking system 1 in advance. The first date and time of the specified period in the external input file specifying condition 2102a is set to be earlier than the download date and time 2010/11/01 09:30 at which the terminal A downloaded the confidential file from the file server. Here, assuming 2010/01/01 09:00:00, it will be calculated as 2010/12/02 09:00:00 after 31 days from 2010/11/01 09:00:00. The external output log search period is a period from 2010/11/01 09:00:00 to 2010/12/02 09:00:00. The external output file specifying unit 1102b reads the attached file from the mail address of the user of the terminal A from the recording of the external output log 2201b from 2010/11/01 09:00:00 to 2010/12/02 09:00:00. Extract sent log entries. Specifically, the transmission date and time of the external output log 2201b from the external output log 2201b is included in the period from 2010/01/01 09:00:00 to 2010/12/02 09:00:00, and The external output log 2201b whose sender mail address represents the user of the terminal A is taken out. Here, it is assumed that the external output log 2201b whose transmission date and time is 2010/12/01 09:30 is extracted.
As the external output log search period, a trace trace target period described later (“trace target period” is an example of a process target period) or more, that is, a period including the trace target period is set.

操作ログファイル取り込み部1103(操作ログ入力部の一例)は、操作ログファイル2103に記憶された情報のフォーマットに従い、端末Aの操作ログファイル2103が記憶した操作ログをログエントリ210として取り出し、ログエントリ210が有するタイムスタンプが、期間入力部1108が記憶装置に記憶した処理対象期間2108に含まれることを判定したら、判定したログエントリ210を処理対象ログ記憶部1109(処理対象記憶部の一例)に記憶する。本実施の形態では、“タイムスタンプ(タイムスタンプ211の一例)、ユーザ識別子、端末識別子(端末名212の一例)、ファイル名、ファイル操作内容(操作内容215の一例)、アプリケーション名(アプリケーション名216の一例)”というフォーマットで出力する。図18のログエントリ210は、処理対象ログ記憶部1109に記憶されたログエントリの一例である。図18のログエントリ210には、ファイル名、ユーザ識別子がないが、ファイル名及びユーザ識別名は操作内容215に含まれるものとする。   The operation log file capturing unit 1103 (an example of the operation log input unit) extracts the operation log stored in the operation log file 2103 of the terminal A as the log entry 210 according to the format of the information stored in the operation log file 2103, and logs the log entry. When it is determined that the time stamp 210 includes in the processing target period 2108 stored in the storage device by the period input unit 1108, the determined log entry 210 is stored in the processing target log storage unit 1109 (an example of the processing target storage unit). Remember. In this embodiment, “time stamp (an example of time stamp 211), user identifier, terminal identifier (an example of terminal name 212), file name, file operation content (an example of operation content 215), and application name (application name 216). Example)) is output in the format "". A log entry 210 in FIG. 18 is an example of a log entry stored in the processing target log storage unit 1109. The log entry 210 in FIG. 18 does not have a file name or user identifier, but the file name and user identification name are included in the operation content 215.

トレース部1104は、トレース開始条件2104、トレース条件2105、トレース終了条件2106を入力する。
トレース開始条件2104は、本実施の形態ではトレースフォワードのモードで動くことを指示する情報を指定する。
トレース条件2105は、コピーアンドペーストファイル特定部1106が動作する際に使用する「外部入力ファイル名2202aと同じ拡張子のファイルをトレースする」という動作を行うことを指示する情報を指定する。例えば、コピーアンドペーストファイル特定部1106は、外部入力ファイル名2202aがabc.csvであれば、拡張子が.csvのファイルを追跡候補とする。
トレース終了条件2106は、本実施の形態では、「トレース対象ファイルが添付ファイルでメール送信された場合に終了」を指定する。
トレース部1104は、期間入力部1108が記憶装置に記憶した処理対象期間2108を入力する。期間入力部1108は、実施の形態1と同じ動作を行う。ファイル入力日時2203aには、2010/11/01 09:30:00が設定されている。ファイル出力日時2203bには、2010/12/01 09:30:00が設定されている。このため、期間入力部1108は、開始日時が2010/11/01 09:30:00であり、終了日時が2010/12/01 09:30:00である処理対象期間を記憶装置に記憶する。
図11にファイル追跡システム1が使用する各種期間を説明する。指定期間は、ファイルサーバの管理者またはファイル追跡システム1の運用者が、あらかじめ入力装置を用いてファイル追跡システム1の記憶装置に記憶する。指定期間は、ファイルサーバから機密ファイルがダウンロードされたと推定される期間である。或いは、ダウンロードされた機密ファイルがメールに添付され、機密ファイルの使用が許可されていない端末に送信されたか否かを定期的に調査する環境では、管理者や運用者が任意の期間を指定期間として指定する。
外部出力ログ検索期間は、指定期間の開始日時以前の日時から、あらかじめ記憶装置に記憶された未来に向かう日数を加えた日数である。外部出力ログ検索期間は、メールに添付されて送信されたファイルを追跡する期間である。指定期間の開始日時以前の日時を期間の開始とするのは、機密ファイルが添付ファイルの元ファイルとなるのが、機密ファイルがダウンロードされた日時以後と考え、ダウンロード日時を含む期間とするためである。
処理対象期間(トレース対象期間)は、、開始日時をファイルサーバから機密ファイルがダウンロードされた日時とし、終了日時を添付ファイルを添付したメールが送信された日時とする。実施の形態1で説明したように、開始日時、終了日時は、運用者が任意の日時を指定することもできる。任意の日時を指定する場合は、処理対象期間が外部出力ログ検索期間に含まれる期間を指定する。
The trace unit 1104 inputs a trace start condition 2104, a trace condition 2105, and a trace end condition 2106.
In this embodiment, the trace start condition 2104 designates information instructing to move in the trace forward mode.
The trace condition 2105 specifies information instructing to perform an operation of “trace a file having the same extension as the external input file name 2202a” used when the copy and paste file specifying unit 1106 operates. For example, the copy and paste file specifying unit 1106 determines that the external input file name 2202a is abc. If it is csv, the extension is. A csv file is set as a tracking candidate.
In the present embodiment, the trace end condition 2106 designates “end when the trace target file is sent as an attached mail by mail”.
The trace unit 1104 inputs the processing target period 2108 stored in the storage device by the period input unit 1108. The period input unit 1108 performs the same operation as in the first embodiment. The file input date 2203a is set to 2010/11/01 09:30. 2010/12/01 09:30:30 is set in the file output date 2203b. Therefore, the period input unit 1108 stores in the storage device the processing target period whose start date and time is 2010/11/01 09:30, and whose end date and time is 2010/12/01 09:30.
FIG. 11 illustrates various periods used by the file tracking system 1. During the designated period, the administrator of the file server or the operator of the file tracking system 1 stores in advance in the storage device of the file tracking system 1 using an input device. The designated period is a period during which it is estimated that the confidential file has been downloaded from the file server. Alternatively, in an environment where the downloaded confidential file is attached to an e-mail and periodically checked to see if it has been sent to a terminal that is not permitted to use the confidential file, the administrator or operator can specify an arbitrary period. Specify as.
The external output log search period is the number of days obtained by adding the number of days toward the future stored in advance in the storage device from the date and time before the start date and time of the specified period. The external output log search period is a period for tracking a file attached to an email and transmitted. The reason for starting the period is the date and time before the start date and time of the specified period because the confidential file becomes the original file of the attached file after the date and time when the confidential file was downloaded, and the period including the download date and time. is there.
In the processing target period (trace target period), the start date and time is the date and time when the confidential file is downloaded from the file server, and the end date and time is the date and time when the mail with the attached file is transmitted. As described in the first embodiment, the operator can specify any date and time for the start date and time and the end date and time. When specifying an arbitrary date and time, a period in which the processing target period is included in the external output log search period is specified.

トレース部1104では、まず、外部入力ファイル特定部1102aが出力した外部入力ファイル名2202aを入力するが、これをトレース対象ファイル名(処理対象ファイル名の一例)として設定する。該トレース対象ファイル名は、ファイルサーバからダウンロードしたファイルを識別するファイル名であり、ダウンロード後にメールに添付されて送信されたか追跡する対象である。本実施の形態では、添付ファイルでメール送信されたか追跡する対象である。
次に、期間入力部1108が記憶装置に記憶した処理対象期間2108をトレース対象期間として入力する。本実施の形態では。トレース対象期間は、開始日時=2010/11/01 09:30:00、終了日時=2010/12/01 09:30:00である。
The trace unit 1104 first inputs the external input file name 2202a output from the external input file specifying unit 1102a, and sets this as a trace target file name (an example of a process target file name). The trace target file name is a file name for identifying a file downloaded from the file server, and is a target for tracking whether the file is attached to a mail after being downloaded. In the present embodiment, it is an object to be tracked as to whether an email has been sent as an attached file.
Next, the process target period 2108 stored in the storage device by the period input unit 1108 is input as the trace target period. In this embodiment. The trace target period is start date / time = 2010/11/01 09:30, end date / time = 2010/12/01 09:30.

トレース部1104の動作の詳細を説明する。
図12は、トレース部の動作を示すフローチャートである。
図12のフローチャートに従いトレース部1104の動作を説明する。
Details of the operation of the trace unit 1104 will be described.
FIG. 12 is a flowchart showing the operation of the trace unit.
The operation of the trace unit 1104 will be described with reference to the flowchart of FIG.

s101’を行う前に、トレース部1104は、後述するs106’で設定する最終トレース対象ファイル名2206に初期値を設定する。トレース部1104は、最終トレース対象ファイル名2206に初期値として外部入力ファイル名2202aを設定する。すなわち、トレース部1104は、最終トレース対象ファイル名2206に初期値としてトレース対象ファイル名を設定する。また、トレース部1104は、後述するs107’で設定する最終変遷日時2205aに初期値を設定する。トレース部1104は、最終変遷日時2205aに初期値としてファイル入力日時2203aを設定する。すなわち、トレース部1104は、最終変遷日時2205aに初期値としてトレース対象ファイル名のファイルがダウンロードされた日時を設定する。
まず、s101’において、トレース対象ファイル名で識別されるファイルが、トレース終了条件2106に指定された「トレース対象ファイルが添付ファイルでメール送信された場合に終了」という条件に合うか調べる。トレース対象ファイルが添付ファイルでメール送信されたか否かは次の様に調べる。
外部出力ファイル特定部1102bにおいて、既に、端末Aのユーザのメールアドレスからの添付ファイルの送信に該当するログエントリが抽出され、添付ファイル名が外部出力ファイル名2202bとして、添付ファイルのメールによる送信日時(タイムスタンプ)がファイル出力日時2203bに設定され、トレース部1104へ出力されている。
Before performing s101 ′, the tracing unit 1104 sets an initial value for the final trace target file name 2206 set in s106 ′ described later. The trace unit 1104 sets the external input file name 2202a as an initial value in the final trace target file name 2206. That is, the trace unit 1104 sets the trace target file name as an initial value in the final trace target file name 2206. In addition, the trace unit 1104 sets an initial value in the last transition date 2205a set in s107 ′ described later. The trace unit 1104 sets the file input date 2203a as an initial value in the last transition date 2205a. That is, the trace unit 1104 sets the date and time when the file with the trace target file name was downloaded as the initial value in the last transition date and time 2205a.
First, in s101 ′, it is checked whether or not the file identified by the trace target file name meets the condition “end when the trace target file is sent as an attached mail by mail” specified in the trace end condition 2106. Whether or not the trace target file has been sent as an attached mail is checked as follows.
The external output file specifying unit 1102b has already extracted the log entry corresponding to the transmission of the attached file from the mail address of the user of the terminal A, and the attached file name is the external output file name 2202b. (Time stamp) is set in the file output date 2203 b and is output to the trace unit 1104.

従って、トレース対象ファイル名が、外部出力ファイル名2202bと一致するか確認すればよい。一致していれば、トレース対象ファイルがメール送信されていると判断する。このとき、外部出力ファイル名2202bに対応する送信日時であるファイル出力日時2203bは、トレース開始日時よりも後であることを条件とする。
また、外部出力ファイル名2202bがファイルのパスを含まずファイル名のみである場合は、トレース対象ファイル名(パスを含む)におけるファイル名部分との一致を確認する。ファイル名の一致の判定は、実施の形態1と同じである。
Therefore, it is only necessary to confirm whether the trace target file name matches the external output file name 2202b. If they match, it is determined that the trace target file has been mailed. At this time, the condition is that the file output date 2203b, which is the transmission date / time corresponding to the external output file name 2202b, is later than the trace start date / time.
If the external output file name 2202b includes only the file name without including the file path, the file name portion in the trace target file name (including the path) is checked for coincidence. The file name match determination is the same as in the first embodiment.

一致した場合(s101’でyes)は、この時点でトレース部1104は、処理を終了する。この際、トレース部1104は、判定結果2207として、外部入力ファイルはメール送信されたという結果を出力する。   If they match (yes in s101 '), the trace unit 1104 ends the process at this point. At this time, the trace unit 1104 outputs, as the determination result 2207, a result that the external input file has been mailed.

次に、トレース対象ファイル名が、外部出力ファイル名2202bと一致しない場合(s101’でno)の処理を説明する。
s103’において、トレース部1104は、処理対象ログ記憶部1109から読み込むログエントリが残ってないか判定する。残ってないと判定した場合(yes)、s109’に進む。残ってると判定した場合(no)、s104’へ進む。
s104’において、トレース部1104は、処理対象ログ記憶部1109に記憶されたトレース対象期間に含まれるタイムスタンプを有するログエントリ210を入力する。
ログエントリは順方向、すなわち、タイムスタンプが古い方から新しい方へ順次入力する。
ログエントリには、ファイル操作に関する記録があり、以下のフォーマットである。
“タイムスタンプ(タイムスタンプ211の一例)、ユーザ識別子、端末識別子(端末名212の一例)、ファイル名(操作内容215の一例)、ファイル操作内容(操作内容215の一例)、アプリケーション名(アプリケーション名216の一例)”
Next, processing when the trace target file name does not match the external output file name 2202b (no in s101 ′) will be described.
In s103 ′, the trace unit 1104 determines whether there are any log entries to be read from the processing target log storage unit 1109 remaining. When it is determined that there is no remaining (yes), the process proceeds to s109 ′. If it is determined that it remains (no), the process proceeds to s104 ′.
In s104 ′, the trace unit 1104 inputs a log entry 210 having a time stamp included in the trace target period stored in the process target log storage unit 1109.
The log entries are input in the forward direction, that is, sequentially from the oldest time stamp to the newest time stamp.
The log entry has a record relating to file operation and has the following format.
“Time stamp (an example of time stamp 211), user identifier, terminal identifier (an example of terminal name 212), file name (an example of operation content 215), file operation content (an example of operation content 215), application name (application name) 216 example) ”

s105’において、トレース部1104は、変遷操作があるか判定を行う。変遷操作は実施の形態1と同じ定義である。
トレース部1104は、入力したログエントリ210の変遷前のファイル名が、トレース対象ファイル名か確認する。リネーム、コピー、移動においては、操作内容215に変遷操作前のファイル名(パスを含む)と変遷操作後のファイル名(パスを含む)が記録される。トレース部1104は、トレース対象ファイル名がファイル名のみでパスを含まない場合は、変遷前のファイル名(パスを含む)のうちパスを除く部分の名前が、トレース対象ファイル名と一致するか判定する。トレース部1104は、トレース対象ファイル名がファイルのパスを含む場合は、変遷前のファイル名(パスを含む)がトレース対象ファイル名(パスを含む)と一致するか判定する。
変遷操作があり、ログエントリ上の変遷前のファイル名が、トレース対象ファイル名であれば、トレース部1104は、yesと判定する。
yesの場合、トレース部1104は、s106’に移行する。noの場合、トレース部1104は、s103’に戻る。
In s105 ′, the trace unit 1104 determines whether there is a transition operation. The transition operation has the same definition as in the first embodiment.
The trace unit 1104 checks whether the file name before transition of the input log entry 210 is the name of the trace target file. In renaming, copying, and moving, the operation name 215 records the file name before the transition operation (including the path) and the file name after the transition operation (including the path). When the trace target file name is only the file name and does not include the path, the trace unit 1104 determines whether the name of the portion excluding the path in the file name before the transition (including the path) matches the trace target file name. To do. When the trace target file name includes the file path, the trace unit 1104 determines whether the file name (including the path) before the transition matches the trace target file name (including the path).
If there is a transition operation and the file name before transition on the log entry is the name of the file to be traced, the trace unit 1104 determines yes.
In the case of yes, the trace unit 1104 proceeds to s106 ′. If no, the trace unit 1104 returns to s103 ′.

s106’では、トレース部1104は、変遷操作に応じてトレース対象ファイルを再設定し、さらに、最終トレース対象ファイル名2206を設定する。
・操作コマンドがリネームの場合
現在のトレース対象ファイル名はリネーム前のファイル名であるから、リネーム後のパスを含んだファイル名をトレース対象ファイル名に再設定し、リネーム後のパスを含んだファイル名を最終トレース対象ファイル名2206に設定する。
・操作コマンドがコピーの場合
現在のトレース対象ファイル名はコピー元のファイル名であるから、コピー先のパスを含んだファイル名をトレース対象ファイル名に再設定し、コピー先のパスを含んだファイル名を最終トレース対象ファイル名2206に設定する。
・操作コマンドが移動の場合
現在のトレース対象ファイル名は移動前のファイル名であるから、移動後のパスを含んだファイル名をトレース対象ファイル名に再設定し、移動後のパスを含んだファイル名を最終トレース対象ファイル名2206に設定する。
最初にs106’を処理する場合、トレース対象ファイル名は、ファイル名のみで、ファイルパスは無い場合がある。これは、ファイルサーバログであれば、ダウンロードファイル名はわかっても、端末A上のどのパスのファイルかは記録されていないからである。変遷操作に関するログエントリには、ファイルのパスも含まれるため、変遷前後のファイルについてはファイルのパスも取得することができる。従って、2回目以降のs106’の処理では、トレース対象ファイル名はパスを含んだファイル名となる。
In s106 ′, the trace unit 1104 resets the trace target file in accordance with the transition operation, and further sets the final trace target file name 2206.
When the operation command is renamed The current trace target file name is the file name before renaming, so the file name including the path after renaming is reset to the trace target file name, and the file including the path after renaming The name is set to the final trace target file name 2206.
-If the operation command is copy: Since the current trace target file name is the copy source file name, reset the file name including the copy destination path to the trace target file name, and include the copy destination path. The name is set to the final trace target file name 2206.
-When the operation command is move The current trace target file name is the file name before the move, so reset the file name including the path after the move to the trace target file name, and include the path after the move The name is set to the final trace target file name 2206.
When processing s106 ′ for the first time, the file name to be traced may be only the file name and there may be no file path. This is because, in the case of a file server log, although the download file name is known, the path of the file on the terminal A is not recorded. Since the log entry related to the transition operation includes the file path, the file path can be acquired for the files before and after the transition. Therefore, in the second and subsequent processing of s106 ′, the file name to be traced is a file name including a path.

次に、s107’において、トレース部1104は、変遷操作が発生した日時(ログエントリ210のタイムスタンプ211)を最終変遷日時2205aに設定する。   Next, in s107 ', the trace unit 1104 sets the date and time when the transition operation occurred (time stamp 211 of the log entry 210) as the final transition date and time 2205a.

次に、s108’において、トレース部1104は、現在のトレース対象ファイル名で識別されるファイルが、「トレース対象ファイルが添付ファイルでメール送信された場合に終了」という条件に合うか判定する。その方法は、s101’に示したものと同じである。
現在のトレース対象ファイル名で識別されるファイルがメール送信されていた場合(yes)トレース部1104は、処理を終了する。この際、判定結果2207において、外部入力ファイルはメール送信されたことを示す結果を出力する。送信されたことを判定できなかった場合(no)、トレース部1104は、s103’に戻る。
トレース部1104の処理はここまでである。
s101’は、トレース部1104の処理であり、特に、トレース部1104が備える転送判定部1114の転送判定処理である。
s103’からs108’は、トレース部1104の処理であり、特に、トレース部1104が備える変遷判定部1124の変遷判定処理である。
Next, in s108 ′, the trace unit 1104 determines whether or not the file identified by the current trace target file name satisfies the condition “end when the trace target file is mailed as an attached file”. The method is the same as that shown in s101 ′.
If the file identified by the current trace target file name has been mailed (yes), the trace unit 1104 ends the process. At this time, in the determination result 2207, the external input file outputs a result indicating that the mail has been transmitted. When it is not possible to determine that it has been transmitted (no), the trace unit 1104 returns to s103 ′.
The processing of the trace unit 1104 is up to here.
s101 ′ is a process of the trace unit 1104, and in particular, a transfer determination process of the transfer determination unit 1114 included in the trace unit 1104.
s103 ′ to s108 ′ are processes of the trace unit 1104, and in particular, a transition determination process of the transition determination unit 1124 included in the trace unit 1104.

s103’でyesに進む際、トレース部1104は、判定結果2207として、外部入力ファイルはメール送信されたか分からなかったことを示す結果を出力する。
トレース部1104が、判定結果2207として外部入力ファイルはメール送信されたか分からなかったことを示す結果を出力した場合、トレース結果判断部1105はこの判定結果2207を入力し、コピーアンドペーストファイル特定部1106に対して、コピーアンドペースト調査指示2208を出力する。
また、トレース部1104が、判定結果2207として外部入力ファイルはメール送信されたことを示す結果を出力した場合、トレース結果判断部1105はこの判定結果2207を入力し、トレース結果2107として、「外部入力ファイルはメール送信された」という結果を出力する。この結果は、表示装置等のディスプレイにメッセージとして表示するなど、人間が見て分かる情報で表現する。
When proceeding to yes in s103 ′, the trace unit 1104 outputs, as the determination result 2207, a result indicating that the external input file has not been transmitted by mail.
When the trace unit 1104 outputs a result indicating that the external input file has not been sent by mail as the determination result 2207, the trace result determination unit 1105 inputs the determination result 2207, and the copy and paste file specifying unit 1106 In response to this, a copy and paste investigation instruction 2208 is output.
In addition, when the trace unit 1104 outputs a result indicating that the external input file has been sent by mail as the determination result 2207, the trace result determination unit 1105 inputs this determination result 2207, and the “external input” The result is that the file has been mailed. This result is expressed by information that can be seen by humans, for example, as a message on a display such as a display device.

s109’は、図12のファイルの変遷操作の確認だけでは、トレース対象期間内に外部入力ファイルがメール送信されたことを発見できなかった場合の処理である。s109’の処理は、コピーアンドペーストファイル特定部1106で処理される。s109’では操作ログには現れない、コピーアンドペーストについて調査し、コピー先ファイルを特定する。
コピーアンドペーストファイル特定部1106は、コピーアンドペースト調査指示2208を受け、フローチャート図13の処理を行う。
図13は、コピーアンドペーストファイル特定部1106、追加トレース判断部1107の動作を示すフローチャートである。
図13において、コピーアンドペーストファイル特定部1106は、トレース部1104から最終変遷日時2205a、トレース開始日時2205b、トレース終了日時2205c、最終トレース対象ファイル名2206を受ける。トレース開始日時2205b、トレース終了日時2205cは、処理対象期間2108であるため、コピーアンドペーストファイル特定部1106は、記憶装置に記憶された処理対象期間2108を入力してもよい。
最終トレース対象ファイル名2206は、しぼり込み期間取得部1116が入力する処理対象ファイル名の一例である。最終変遷日時2205aは、しぼり込み期間取得部1116が入力する処理対象期間の一例である。
s109 ′ is a process in the case where it is not possible to find out that the external input file has been mailed within the trace target period only by checking the file transition operation in FIG. The process of s109 ′ is processed by the copy and paste file specifying unit 1106. In s109 ′, copy and paste that does not appear in the operation log is investigated, and a copy destination file is specified.
Upon receiving the copy and paste investigation instruction 2208, the copy and paste file specifying unit 1106 performs the processing in the flowchart of FIG.
FIG. 13 is a flowchart showing the operations of the copy and paste file specifying unit 1106 and the additional trace determining unit 1107.
In FIG. 13, the copy and paste file specifying unit 1106 receives the final transition date 2205a, the trace start date 2205b, the trace end date 2205c, and the final trace target file name 2206 from the trace unit 1104. Since the trace start date 2205b and the trace end date 2205c are the processing target period 2108, the copy and paste file specifying unit 1106 may input the processing target period 2108 stored in the storage device.
The final trace target file name 2206 is an example of a process target file name input by the squeezing period acquisition unit 1116. The last transition date and time 2205a is an example of a processing target period input by the squeezing period acquisition unit 1116.

まず、s201’において、コピーアンドペーストファイル特定部1106は、最終トレース対象ファイル名で識別されるファイル(最終トレース対象ファイル)に対するオープン・クローズ日時の特定を行う。具体的には、例えば、図14のフローチャートに従う。図14は、コピーアンドペーストファイル特定部1106のしぼり込み期間取得部1116の動作を示すフローチャートである。
図14のs301’において、コピーアンドペーストファイル特定部1106は、トレース対象ファイルオープン日時という変数をNULLに設定する。また、トレース対象ファイルクローズ日時という変数をNULLに設定する。
First, in s201 ′, the copy and paste file specifying unit 1106 specifies the open / close date and time for the file (final trace target file) identified by the final trace target file name. Specifically, for example, the flowchart of FIG. 14 is followed. FIG. 14 is a flowchart showing the operation of the squeezing period acquisition unit 1116 of the copy and paste file specifying unit 1106.
In s301 ′ of FIG. 14, the copy and paste file specifying unit 1106 sets a variable called the trace target file open date to NULL. Also, a variable called trace target file close date / time is set to NULL.

次に、s303’において、コピーアンドペーストファイル特定部1106は、処理対象ログ記憶部1109から読み込むログエントリが残ってないか判定し、残ってる場合(no)、s304’へ進む。残ってない場合(yes)、処理を終了する。   Next, in s303 ', the copy and paste file specifying unit 1106 determines whether there is a log entry to be read from the processing target log storage unit 1109, and if it remains (no), the process proceeds to s304'. If it does not remain (yes), the process is terminated.

次に、s304’において、コピーアンドペーストファイル特定部1106は、処理対象ログ記憶部1109に記憶されたログエントリ210から、ログエントリのタイムスタンプが最終変遷日時2205aからトレース終了日時2205cまでの期間に含まれるログエントリ210を、順方向(古いログエントリから新しいログエントリに向かって読む)で読む。   Next, in s304 ′, the copy and paste file specifying unit 1106 starts from the log entry 210 stored in the processing target log storage unit 1109 in the period from the last transition date and time 2205a to the trace end date and time 2205c. The included log entry 210 is read in the forward direction (reading from the old log entry to the new log entry).

次に、s305’において、コピーアンドペーストファイル特定部1106は、ログエントリ210の操作コマンド214が、ファイルをオープンする操作を記録し、操作内容215に、最終トレース対象ファイル名2206で識別されるファイルがオープンされた記録があるか判定する。コピーアンドペーストファイル特定部1106は、あることを判定した場合(yes)、s306’に移行する。noであれば、s303’に戻る。   Next, in s305 ′, the copy and paste file specifying unit 1106 records the operation for opening the file by the operation command 214 of the log entry 210, and the file identified by the final trace target file name 2206 in the operation content 215. Determine if there is a record opened. If the copy and paste file specifying unit 1106 determines that it exists (yes), the process proceeds to s306 '. If no, return to s303 '.

s306’では、コピーアンドペーストファイル特定部1106は、最終トレース対象ファイル名で識別されるファイルがオープンされたことを表すログエントリのタイムスタンプを、トレース対象ファイルオープン日時(オープン日時の一例)に設定する。
s307’において、コピーアンドペーストファイル特定部1106は、処理対象ログ記憶部1109から読み込むログエントリが残ってないか判定し、残ってる場合(no)、s308’へ進む。残ってない場合(yes)、処理を終了する。
次に、s307’において、コピーアンドペーストファイル特定部1106は、ログを一つ読む。ここでは、順方向(古いエントリから新しいエントリに向かって読む)で読む。
In s306 ′, the copy and paste file specifying unit 1106 sets the time stamp of the log entry indicating that the file identified by the final trace target file name is opened as the trace target file open date (an example of the open date). To do.
In s307 ′, the copy and paste file specifying unit 1106 determines whether there is any log entry to be read from the processing target log storage unit 1109, and if it remains (no), the process proceeds to s308 ′. If it does not remain (yes), the process is terminated.
Next, in s307 ′, the copy and paste file specifying unit 1106 reads one log. Here, read in the forward direction (read from the old entry to the new entry).

次に、s309’において、コピーアンドペーストファイル特定部1106は、ログエントリ210の操作コマンドに、ファイルを閉じる操作の操作コマンドが記録され、操作内容215に最終トレース対象ファイル名2206で識別されるファイルがクローズされたことが記録されているか判定する。記録されていれば(yes)、s310’に移行する。noであれば、s307’に戻る。   Next, in s309 ′, the copy and paste file specifying unit 1106 records the operation command for closing the file in the operation command of the log entry 210, and the file identified by the final trace target file name 2206 in the operation content 215 It is determined whether or not it is recorded that has been closed. If recorded (yes), the process proceeds to s310 '. If no, return to s307 '.

s310’では、コピーアンドペーストファイル特定部1106は、ログエントリのタイムスタンプを、トレース対象ファイルクローズ日時(クローズ日時の一例)に設定する。
図14は、コピーアンドペーストファイル特定部1106の処理であり、特に、コピーアンドペーストファイル特定部1106のしぼり込み期間取得部1116のしぼり込み期間取得処理である。
In s310 ′, the copy and paste file specifying unit 1106 sets the time stamp of the log entry to the trace target file close date (an example of the close date).
FIG. 14 shows the processing of the copy and paste file specifying unit 1106, and in particular, the narrowing period acquisition processing of the narrowing period acquisition unit 1116 of the copy and paste file specifying unit 1106.

このように図14のフローチャートに従うことで、最終変遷日時2205aからトレース終了日時2205cまでの期間に、最終トレース対象ファイル名2206で識別されるファイルのオープン或いはクローズの日時がわかる。両方とも発生していない場合は、トレース対象ファイルオープン日時もトレース対象ファイルクローズ日時も設定されず、NULLである。   By following the flowchart of FIG. 14 in this way, the date of opening or closing of the file identified by the final trace target file name 2206 can be known in the period from the last transition date 2205a to the trace end date 2205c. When neither of them occurs, neither the trace target file open date nor the trace target file close date is set and NULL is set.

図13に戻る。次に、コピーアンドペーストファイル特定部1106は、トレース対象候補ファイル名の特定を行う(s202’)。トレース対象候補ファイル名とは、最終トレース対象ファイル名2206で識別されるファイルの内容をコピーしコピーした内容をペーストした、そのペースト先となったと考えられるファイルのファイル名である。
s202’の処理を、図15を用いて説明する。図15は、コピーアンドペーストファイル特定部1106の追跡候補生成部1126の動作を示すフローチャートである。
Returning to FIG. Next, the copy and paste file specifying unit 1106 specifies the trace target candidate file name (s202 ′). The trace target candidate file name is the file name of the file that is considered to be the paste destination after copying the content of the file identified by the final trace target file name 2206 and pasting the copied content.
The process of s202 ′ will be described with reference to FIG. FIG. 15 is a flowchart showing the operation of the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106.

まず、s401’において、コピーアンドペーストファイル特定部1106は、トレース対象ファイルオープン日時=NULLかつトレース対象ファイルクローズ日時=NULLか判断する。これは、最終変遷日時2205aからトレース終了日時2205cまでの期間に、最終トレース対象ファイル名2206で識別されるファイルのオープンかクローズが発生したかの確認である。yesの場合、コピーアンドペーストファイル特定部1106処理は、処理を終了する。noの場合、コピーアンドペーストファイル特定部1106は、s402’に移行する。   First, in s401 ', the copy and paste file specifying unit 1106 determines whether the trace target file open date = NULL and the trace target file close date = NULL. This is confirmation of whether the file identified by the final trace target file name 2206 has been opened or closed during the period from the last transition date 2205a to the trace end date 2205c. In the case of yes, the copy and paste file specifying unit 1106 processing ends the processing. In the case of no, the copy and paste file specifying unit 1106 proceeds to s402 '.

s402’では、コピーアンドペーストファイル特定部1106は、トレース対象ファイルオープン日時からトレース対象ファイルクローズ日時までのしぼり込み期間のログエントリ210を処理対象ログ記憶部1109から順次入力する。具体的には、コピーアンドペーストファイル特定部1106は、ログエントリ210のタイムスタンプ211が、しぼり込み期間であるログエントリを順次入力する。   In s <b> 402 ′, the copy and paste file specifying unit 1106 sequentially inputs the log entries 210 of the squeezing period from the trace target file open date to the trace target file close date from the processing target log storage unit 1109. Specifically, the copy and paste file specifying unit 1106 sequentially inputs log entries in which the time stamp 211 of the log entry 210 is a narrowing period.

次にs403’では、コピーアンドペーストファイル特定部1106は、入力したログエントリ210が、以下の条件に合致するか判定し、合致することを判定したログエントリ210を追跡候補ログとしてトレース対象候補ファイルリスト2211(ファイル追跡システム1が備える記憶装置が記憶するファイルの一例)に記憶する。
・最終トレース対象ファイル名2206と拡張子が同じである(トレース条件2105を参照することによる)
・操作コマンドにファイルを保存するとの操作が記憶されている
上記条件に合致する事を判定することにより、コピーアンドペーストファイル特定部1106は、最終トレース対象ファイル名2206で識別されるファイルをオープンしてからクローズする間に、別途保存した別の同種類のファイルの有無を確認し、ファイルが有る場合は、該当するファイル名をトレース対象候補ファイル名(類似ファイル名)をリスト化したトレース対象候補ファイルリスト2211に追加する。最終トレース対象ファイル名2206で識別されるファイルをオープンしてからクローズする間に、別途同種類のファイルを保存した場合、最終トレース対象ファイル名2206で識別されるファイルからその別ファイルへコピーアンドペーストが発生した可能性があるため、それらをトレース対象の候補ファイルとして扱う。また、複数存在する可能性があるため、リスト化(ファイル化)する。
図13のs202’は、コピーアンドペーストファイル特定部1106が行う。特に、コピーアンドペーストファイル特定部1106の追跡候補生成部1126が行う追跡候補生成処理である。
Next, in s403 ′, the copy and paste file specifying unit 1106 determines whether the input log entry 210 matches the following conditions, and uses the log entry 210 determined to match as a tracking candidate log as a trace target candidate file. The data is stored in a list 2211 (an example of a file stored in a storage device included in the file tracking system 1).
The extension is the same as the final trace target file name 2206 (by referring to the trace condition 2105).
The operation to save the file in the operation command is stored. By determining that the above condition is met, the copy and paste file specifying unit 1106 opens the file identified by the final trace target file name 2206. Check whether there is another file of the same type that has been saved separately, and if there is a file, trace target candidates that list the corresponding file names as trace target candidate file names (similar file names) It is added to the file list 2211. If the same type of file is saved while the file identified by the final trace target file name 2206 is opened and closed, copy and paste from the file identified by the final trace target file name 2206 to the other file Since these may have occurred, treat them as candidate files to be traced. In addition, since there is a possibility that a plurality of files exist, a list is created (filed).
The copy and paste file specifying unit 1106 performs s202 ′ in FIG. In particular, this is a tracking candidate generation process performed by the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106.

図13に戻る。
s203’では、コピーアンドペーストファイル特定部1106は、トレース対象候補ファイルリスト2211が空か調べる。空の場合(yes)、コピーアンドペーストファイル特定部1106は、処理を終了する。この場合、コピーアンドペーストファイル特定部1106は、特定結果2209として「コピー先ファイルの特定無しを示す結果」を出力する。
追加トレース判断部1107は、特定結果2209を入力し、特定結果2209が「コピー先ファイルの特定無しを示す結果」を表す場合(yes)、処理を終了する。noである場合、追加トレース判断部1107は、s204’に移行する。
Returning to FIG.
In s203 ′, the copy and paste file specifying unit 1106 checks whether the trace target candidate file list 2211 is empty. If it is empty (yes), the copy and paste file specifying unit 1106 ends the process. In this case, the copy and paste file specifying unit 1106 outputs “a result indicating that the copy destination file is not specified” as the specifying result 2209.
The additional trace determination unit 1107 inputs the identification result 2209, and when the identification result 2209 represents "result indicating that the copy destination file is not specified" (yes), the process is terminated. If no, the additional trace determination unit 1107 proceeds to s204 ′.

s204’では、追加トレース判断部1107(追加追跡ログ判定部の一例)がトレース対象候補ファイルリスト2211の先頭から順に、追跡候補ログを入力し、入力した追跡候補ログの操作内容215に含まれたトレース対象候補ファイル名を取得する。   In s204 ′, the additional trace determination unit 1107 (an example of an additional tracking log determination unit) inputs the tracking candidate log in order from the top of the trace target candidate file list 2211 and is included in the operation content 215 of the input tracking candidate log. Get the trace target candidate file name.

次に、s205’において、追加トレース判断部1107は、トレース対象候補ファイル名で識別されるファイルがトレース対象として妥当か判定する。
判定する方法として、以下がある。
・「最終トレース対象ファイル名2206で識別されるファイル」の内容である生成元情報を最終トレース対象ファイル名2206で識別されるファイルから入力し、「トレース対象候補ファイル名で識別されるファイル」の内容である追跡情報をトレース対象候補ファイル名で識別されるファイルから入力し、追跡候補情報と生成元情報とがどのぐらい一致するか表す類似度を算出し、算出した類似度とあらかじめファイル追跡システム1の記憶装置に記憶された閾値(類似閾値)とを比較し、類似度が閾値より大きいことを判定した場合、妥当と判断する。具体例は、実施の形態1と同じである。また、類似性の判定方法は公知のファイル類似性比較技術を用いればよい。
・トレース対象候補ファイル名で識別されるファイルに、予め設定した機密ファイルを示す用語が含まれているか検索する。含まれていれば、妥当と判断する。機密ファイルを示す用語は、ファイルサーバのファイルに含まれる用語とする。
・「トレース対象候補ファイル名で識別されるファイル」の内容である追跡候補情報をトレース対象候補ファイル名で識別されるファイルから入力し、「外部入力ファイル名2202aで識別されるファイル」の内容である生成元情報を外部入力ファイル名2202aで識別されるファイルから入力し、追跡候補情報と生成元情報とがどのぐらい一致するか表す類似度を算出し、算出した類似度とあらかじめファイル追跡システム1の記憶装置に記憶された閾値とを比較し、類似度が閾値より大きいことを判定した場合、妥当と判断する。具体例は、実施の形態1と同じである。また、類似性の判定方法は公知のファイル類似性比較技術を用いればよい。
Next, in s205 ′, the additional trace determination unit 1107 determines whether the file identified by the trace target candidate file name is appropriate as the trace target.
There are the following determination methods.
The generation source information that is the content of the “file identified by the final trace target file name 2206” is input from the file identified by the final trace target file name 2206, and the “file identified by the trace target candidate file name” Input the tracking information, which is the contents, from the file identified by the trace target candidate file name, calculate the similarity indicating how much the tracking candidate information and the source information match, and calculate the similarity and the file tracking system in advance When the threshold value (similarity threshold value) stored in one storage device is compared and it is determined that the similarity is greater than the threshold value, it is determined to be appropriate. A specific example is the same as in the first embodiment. The similarity determination method may use a known file similarity comparison technique.
Search whether the file identified by the trace target candidate file name contains a term indicating a preset confidential file. If it is included, it is judged appropriate. The term indicating the confidential file is a term included in the file of the file server.
The tracking candidate information that is the content of the “file identified by the trace target candidate file name” is input from the file that is identified by the trace target candidate file name, and the content of the “file that is identified by the external input file name 2202a” A certain generation source information is input from a file identified by the external input file name 2202a, a similarity indicating how much the tracking candidate information matches the generation source information is calculated, and the calculated similarity and the file tracking system 1 in advance are calculated. Are compared with the threshold values stored in the storage device, and if it is determined that the similarity is greater than the threshold value, it is determined to be valid. A specific example is the same as in the first embodiment. The similarity determination method may use a known file similarity comparison technique.

s206’において、トレース対象候補ファイル名で識別されるファイルがトレース対象として妥当と判断された場合は、追加トレース判断部1107は、s207’に移行する。妥当ではないと判断された場合は、s204’へ移行する。   If it is determined in s206 'that the file identified by the trace target candidate file name is valid as a trace target, the additional trace determination unit 1107 proceeds to s207'. If it is determined to be invalid, the process proceeds to s204 '.

s207’では、追加トレース判断部1107は、妥当と判断したトレース対象候補ファイル名を含むログエントリ210を追加追跡ログとして追加トレース対象ファイルリスト2210a(追加追跡ログ記憶部の一例)に追加する。追加追跡ログが有する操作内容に含まれたファイル名であって、妥当と判断されたトレース対象候補ファイル名を追加トレース対象ファイル名2210bとする。   In s207 ', the additional trace determination unit 1107 adds the log entry 210 including the trace target candidate file name determined to be valid to the additional trace target file list 2210a (an example of an additional tracking log storage unit) as an additional tracking log. The file name included in the operation content of the additional tracking log and the trace target candidate file name determined to be valid is set as the additional trace target file name 2210b.

s208’では、追加トレース判断部1107は、トレース対象候補ファイルリスト2211に記憶されたすべての追跡候補ログについて処理を行ったか判定する。すべての追跡候補ログについて処理を行ったと判定した場合、追加トレース判断部1107は、処理を終了する。
終了する際、追加トレース対象ファイルリストが空であれば、トレース結果2107としてコピー先ファイルの特定無しを示す結果を出力する。空でなければ、トレース結果2107としてコピー先ファイルの特定有りを示す結果を出力する。
追加トレース判断部1107は、すべての追跡候補ログについて処理を行っていないと判定した場合、s204’に戻る。
In s208 ′, the additional trace determining unit 1107 determines whether or not processing has been performed for all the tracking candidate logs stored in the trace target candidate file list 2211. If it is determined that all the tracking candidate logs have been processed, the additional trace determination unit 1107 ends the process.
When the process ends, if the additional trace target file list is empty, a result indicating that the copy destination file is not specified is output as the trace result 2107. If not empty, a result indicating that the copy destination file is specified is output as the trace result 2107.
If the additional trace determination unit 1107 determines that all the tracking candidate logs have not been processed, the process returns to s204 ′.

このようにして、トレース対象候補ファイルリスト2211から、最終トレース対象ファイル名2206で識別されるファイルに対してコピーアンドペーストのコピー先となっている可能性のあるファイルを特定し、追加トレース対象ファイルリスト2210aに加える。追加トレース対象ファイルリスト2210aはさらに追加でトレースを行うトレース対象ファイル名のリストであり、メール送信されたか調べる対象である。
図13のs203’は、コピーアンドペーストファイル特定部1106と追加トレース判断部1107との処理であり、s204’〜s208’は、追加トレース判断部1107の追加追跡ログ判定処理である。
追加トレース判断部1107は、トレース結果2107(コピー元ファイルの特定の有無)、追加トレース対象ファイルリスト2210aを出力する。
In this way, from the trace target candidate file list 2211, the file that may be the copy and paste destination for the file identified by the final trace target file name 2206 is identified, and the additional trace target file is identified. Add to list 2210a. The additional trace target file list 2210a is a list of trace target file names to be additionally traced, and is a target for checking whether an e-mail has been transmitted.
In FIG. 13, s203 ′ is a process of the copy and paste file specifying unit 1106 and the additional trace determination unit 1107, and s204 ′ to s208 ′ are an additional tracking log determination process of the additional trace determination unit 1107.
The additional trace determination unit 1107 outputs a trace result 2107 (whether or not the copy source file is specified) and an additional trace target file list 2210a.

図2のトレース部1104は、コピー元ファイルの特定が有る場合、すなわち、追加トレース対象ファイルリスト2210aに1つ以上の追加追跡ログが記憶されている場合、追加トレース対象ファイルリスト2210aから追加追跡ログを順次入力し、追加追跡ログが有する操作内容に含まれた追加トレース対象ファイル名2210bを取得し、追加トレース対象ファイル名2210bを新たなトレース対象ファイル名として、図13の追跡処理のトレースフォワードを行う。
コピー先ファイルの特定が無い場合は、すなわち、追加トレース対象ファイルリスト2210aに追加追跡ログが記憶されていない場合、トレース部1104は、処理を行わない。
When the copy source file is specified, that is, when one or more additional trace logs are stored in the additional trace target file list 2210a, the trace unit 1104 in FIG. 2 adds the additional trace log from the additional trace target file list 2210a. Are sequentially input, the additional trace target file name 2210b included in the operation content of the additional tracking log is acquired, and the trace processing of the tracking process in FIG. Do.
When the copy destination file is not specified, that is, when the additional trace log is not stored in the additional trace target file list 2210a, the trace unit 1104 does not perform processing.

ファイル追跡システム1は、最終的に1つ以上のトレース対象ファイル名で識別されるファイルが、メール送信されたことが確認できた場合に、ファイルサーバからダウンロードしたファイルは、メール送信されたと判断する。   The file tracking system 1 determines that the file downloaded from the file server has been mailed when it can be confirmed that the file finally identified by one or more trace target file names has been mailed. .

追加トレース対象ファイル名2210bのトレースフォワードは、そのままトレース部1104に返すと、トレース対象期間を最初から調査することになる。トレース対象ファイルオープン日時或いはトレース対象ファイルクローズ日時からトレース終了日時までの間の調査で十分であるため、以下の様に処理してもよい。
s207’においてトレース対象候補ファイル名を追加トレース対象ファイルリスト2210aに加える際に、トレース対象ファイルオープン日時或いはトレース対象ファイルクローズ日時もトレース対象候補ファイル名の参考情報としてリストに加える。
追加トレース対象ファイル名2210bで識別されるファイルのトレースフォワード時には、トレース部1104において、トレース対象ファイルオープン日時或いはトレース対象ファイルクローズ日時をトレース開始日時として扱い、トレース対象ファイルオープン日時或いはトレース対象ファイルクローズ日時からトレース終了日時の期間をトレース対象期間としてトレースフォワードさせてもよい。
When the trace forward of the additional trace target file name 2210b is returned to the trace unit 1104 as it is, the trace target period is investigated from the beginning. Since the investigation between the trace target file open date and time or the trace target file close date and time and the trace end date and time is sufficient, the following processing may be performed.
When adding the trace target candidate file name to the additional trace target file list 2210a in s207 ′, the trace target file open date / time or the trace target file close date / time is also added to the list as reference information of the trace target candidate file name.
When tracing the file identified by the additional trace target file name 2210b, the trace unit 1104 treats the trace target file open date / time or the trace target file close date / time as the trace start date / time, and trace target file open date / time or trace target file close date / time. The trace end date and time may be trace forwarded as the trace target period.

本実施の形態では、外部入力ログファイルとしてファイルサーバログファイルを例としたが、他のログファイルでも良い。また、外部出力ログファイルとしてメールログファイルを例としたが、他のログファイルでも良い。   In this embodiment, the file server log file is taken as an example of the external input log file, but another log file may be used. Further, although the mail log file is taken as an example of the external output log file, other log files may be used.

本実施の形態では、機密情報として漏洩されたか調査したいファイルに対して、ファイル操作ログ等の複数のログから、ファイル間のデータのコピーアンドペーストを含んだ該ファイルに対する操作を追跡する。トレースフォワードにおいて、トレース対象ファイルをオープンしクローズするまでの期間に別途保存したファイルをコピー先の候補とし、トレース対象ファイルと該ファイル間の類似を調べることで該ファイルをコピー先であることを特定する。
また、本実施の形態では、端末操作ログなどの複数ログを用いて、ファイルのトレースフォワードを行い、機密情報由来のファイルがどのように扱われたかトレースを行なうファイル追跡装置であって、以下の動作を行うファイル追跡装置を説明した。
・ファイル操作ログから、トレース対象ファイルをオープンし、クローズするまでの期間に、別途保存していたファイルをペースト先の候補ファイルとして選択する。
・選択されたペースト先の候補ファイルが、機密情報由来のファイルと類似しているか検査し、類似していればペースト先の候補ファイルを新たなトレース対象ファイルとする。
・選択されたペースト先の候補ファイルとトレース対象ファイルの類似性を検査し、類似していればペースト先の候補ファイルを新たなトレース対象ファイルとする。
・選択されたペースト先の候補ファイルに、機密ファイルに含まれるキーワードが含まれるか検査し、含まれていればペースト先の候補ファイルを新たなトレース対象ファイルとする。
In the present embodiment, for a file to be investigated as to whether it has been leaked as confidential information, an operation for the file including copy and paste of data between files is traced from a plurality of logs such as a file operation log. In trace forward, specify a file that was saved separately during the period between opening and closing the trace target file as the copy destination candidate, and identifying the file as the copy destination by examining the similarity between the trace target file and the file To do.
Further, in the present embodiment, a file tracking device that traces how a file derived from confidential information is traced using a plurality of logs such as a terminal operation log, and includes the following: A file tracking device that operates is described.
-From the file operation log, select the file that was saved separately as the paste destination candidate file until the trace target file is opened and closed.
-Check whether the selected paste destination candidate file is similar to the file derived from confidential information, and if it is similar, the paste destination candidate file is set as a new trace target file.
The similarity between the selected paste destination candidate file and the trace target file is checked, and if they are similar, the paste destination candidate file is set as a new trace target file.
The selected paste destination candidate file is checked to see if the keyword included in the confidential file is included. If it is included, the paste destination candidate file is set as a new trace target file.

本実施の形態によれば、ファイル操作ログのみの分析において、ファイルの変遷操作に基づくトレースフォワードを行い、ファイルの外部送出が確認できなかった場合においても、最後のトレース対象ファイルをオープン・クローズした期間に、別途オープンしていた同種の他のファイルを、コピー先として特定し、新たなトレース対象ファイルに設定しさらにトレースフォワードを行う。この結果、従来、ファイル操作ログだけでは、トレースできなかったファイルの内容のコピーアンドペーストにも対応したトレースフォワードを実現できる効果がある。さらに、コピー先候補のファイルの特定においては、コピー先候補のファイルとトレース対象ファイルとの類似性や、機密を表すキーワードを検索することにより、コピー先候補を確定することができる。   According to the present embodiment, in the analysis of only the file operation log, the trace forward based on the file transition operation is performed, and the last trace target file is opened / closed even when the external transmission of the file cannot be confirmed. During the period, another file of the same type that has been opened separately is specified as the copy destination, set as a new trace target file, and further trace forward is performed. As a result, there is an effect that trace forward corresponding to copy and paste of the contents of a file that could not be traced using only the file operation log can be realized. Furthermore, in specifying the copy destination candidate file, the copy destination candidate can be determined by searching for similarities between the copy destination candidate file and the trace target file and keywords representing confidentiality.

実施の形態3.
本実施の形態では、実施の形態1における、最終トレース対象ファイル名で識別されるファイルへのペーストが発生したことを判断する方法として、トレース対象ファイル名で識別されるファイルをオープンした時のファイルサイズに対して、保存した時のファイルサイズが、オープンから保存までの時間に対して増加が大きい場合に、ペーストが発生していると判断する。
Embodiment 3 FIG.
In this embodiment, as a method for determining that the paste to the file identified by the final trace target file name in Embodiment 1 has occurred, the file when the file identified by the trace target file name is opened It is determined that the paste has occurred when the file size at the time of saving greatly increases with respect to the size from the opening to the saving.

コピーアンドペーストファイル特定部1106の動作として、トレースバックにおいては、図8のs201でトレース開始日時から最終変遷日時までの期間に最終トレース対象ファイル名で識別されるファイルをオープンした日時と、保存した日時を抽出している。本実施の形態では、しぼり込み期間取得部1116は、該ファイルをオープンした日時を取得する際に、ログエントリ210にファイルサイズが記録されている場合に、ファイルサイズを取得する。これを、オープン時ファイルサイズ(オープンサイズの一例)とする。さらに、しぼり込み期間取得部1116は、該ファイルを保存した日時を取得する際に、ログエントリにファイルサイズが記録されている場合に、ファイルサイズを取得する。これを、保存時ファイルサイズ(保存サイズの一例)とする。   As the operation of the copy and paste file specifying unit 1106, in trace back, the date and time when the file identified by the last trace target file name was opened and saved in the period from the trace start date to the last transition date and time in s201 of FIG. The date and time are extracted. In the present embodiment, the squeezing period acquisition unit 1116 acquires the file size when the file size is recorded in the log entry 210 when acquiring the date and time when the file was opened. This is the file size at opening (an example of an open size). Further, the squeezing period acquisition unit 1116 acquires the file size when the file date is stored and the file size is recorded in the log entry. This is the file size at the time of saving (an example of the saving size).

トレース対象ファイル保存日時とトレース対象ファイルオープン日時の日時差を△tとする。保存時ファイルサイズとオープン時ファイルサイズのサイズ差を△sとする。
この△tと△sを用いて、コピーアンドペーストファイル特定部1106は、△tに対する△sの比が一定以上の場合に、ペーストが発生したと判断する。例えば、最終トレース対象ファイル名で識別されるファイルがcsvファイルで、△tが30秒、△sが1MBの場合は、csvファイルを30秒で1MB増加させるために、そのデータをキーボードで打ち込んだとは考えにくく、別のファイルからデータをコピーし、該ファイルにペーストしたと判断できる。ペーストが発生したと判断する△sと△tの比の基準値(比閾値)を予め決めておき、記憶装置に記憶し、追跡候補生成部1126は、記憶装置から基準値を入力し、基準値を△s/△tが超えたか判定する。追跡候補生成部1126は、基準値を△s/△tが超えたと判定した場合に、ペーストが発生したと判断すれば良い。例えば、基準値を10Kバイト/秒と予め記憶した場合は、追跡候補生成部1126は、△s/△tが10Kバイト/秒を超えた場合にペーストが発生したと判断する。この処理は、実施の形態1のs403の条件に加える。この結果、△s/△tが基準値を超えずペーストが発生していないと判断された場合は、常に、トレース対象候補ファイルリスト2211は空となる。或いは、べつの例として、図10のs402の前に、基準値を△s/△tが超えたか判定する処理を行い、基準値を△s/△tが超えたと判定した場合、s402へ進み、基準値を△s/△tが超えたと判定しなかった場合、処理を終了するようにしてもよい。
Let Δt be the time difference between the trace target file save date and time and the trace target file open date and time. Let Δs be the size difference between the saved file size and the opened file size.
Using the Δt and Δs, the copy and paste file specifying unit 1106 determines that the paste has occurred when the ratio of Δs to Δt is greater than or equal to a certain value. For example, if the file identified by the final trace target file name is a csv file, Δt is 30 seconds, and Δs is 1 MB, the data is typed with the keyboard to increase the csv file by 1 MB in 30 seconds. It can be determined that data has been copied from another file and pasted into the file. A reference value (ratio threshold) of the ratio between Δs and Δt for determining that the paste has occurred is determined in advance and stored in the storage device. The tracking candidate generation unit 1126 inputs the reference value from the storage device, and the reference It is determined whether Δs / Δt exceeds the value. The tracking candidate generation unit 1126 may determine that paste has occurred when it is determined that Δs / Δt exceeds the reference value. For example, when the reference value is stored in advance as 10 Kbytes / second, the tracking candidate generation unit 1126 determines that paste has occurred when Δs / Δt exceeds 10 Kbytes / second. This process is added to the condition of s403 in the first embodiment. As a result, when it is determined that Δs / Δt does not exceed the reference value and no paste is generated, the trace target candidate file list 2211 is always empty. Alternatively, as another example, before s402 in FIG. 10, processing is performed to determine whether Δs / Δt exceeds the reference value, and when it is determined that Δs / Δt has exceeded the reference value, the process proceeds to s402. If it is not determined that Δs / Δt exceeds the reference value, the process may be terminated.

実施の形態2においても、同様に時間当たりのファイルの増加をペーストの判断に利用する。トレースフォワードにおけるコピーアンドペーストファイル特定部1106の追跡候補生成部1126は、処理であるs403’に以下の処理を加える。s403’において、追跡候補生成部1126は、最終トレース対象ファイル名で識別されるファイルをオープンしてからクローズするまでの期間に、保存が発生した別ファイルを特定する。別ファイルの判定は、操作コマンド214に保存操作を表す操作コマンドが記録されているか判定することにより行う。ログエントリにおいて、特定した該ファイルの保存日時におけるファイルサイズ(保存時ファイルサイズ’)(保存サイズの一例)を取得し、さらに、該保存日時に対して時間を遡り、直近に該ファイルをオープンした日時を調べ、その時の該ファイルのファイルサイズ(オープン時ファイルサイズ’)(オープンサイズの一例)を取得する。追跡候補生成部1126は、保存時ファイルサイズ’とオープン時ファイルサイズ’のサイズ’差を△s’、該保存時と該オープン時の日時差を△t’とし、トレースバック時と同じ様に、△s’/△t’の基準値(比閾値)を記憶装置に記憶しておき、記憶装置から基準値を入力し、基準値を△s/△tが超えたか判定する処理を行い、短期間でのファイルサイズの増加の有無を調べる。基準値を△s/△tが超えたと判定したら、短期間に増加しているとし、ペーストが発生していると判断し、該ファイルのファイル名をトレース対象候補ファイルリスト2211に加える。そうでない場合は、トレース対象候補ファイルリスト2211にファイル名を加えない。   In the second embodiment as well, the increase in files per hour is similarly used for paste determination. The tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106 in the trace forward adds the following processing to s403 'that is processing. In s403 ', the tracking candidate generation unit 1126 specifies another file that has been saved during the period from when the file identified by the final trace target file name is opened to when it is closed. The determination of another file is performed by determining whether or not an operation command representing a save operation is recorded in the operation command 214. In the log entry, the file size at the save date and time of the specified file (file size at save time) (an example of the save size) is acquired, and the file is opened most recently by going back to the save date and time. The date and time are checked, and the file size of the file at that time (open file size ') (an example of the open size) is acquired. The tracking candidate generation unit 1126 sets the difference between the file size when saved and the file size when opened as Δs, and the time difference between the saved and opened as Δt ', in the same way as when tracing back. , Δs ′ / Δt ′ reference value (ratio threshold) is stored in the storage device, the reference value is input from the storage device, and a process of determining whether Δs / Δt exceeds the reference value is performed. Check for an increase in file size in a short period of time. If it is determined that Δs / Δt has exceeded the reference value, it is determined that it has increased in a short period of time, it is determined that pasting has occurred, and the file name of the file is added to the trace target candidate file list 2211. Otherwise, the file name is not added to the trace target candidate file list 2211.

トレースバック時の△s/△tの基準値、トレースフォワード時の△s’/△t’の基準値はトレース条件2105で指定しても良い。   The reference value of Δs / Δt at the time of trace back and the reference value of Δs ′ / Δt ′ at the time of trace forward may be designated by the trace condition 2105.

本実施の形態によれば、トレースバック時にトレース対象ファイルのオープン〜保存の期間において、その期間に対するファイルサイズの増加率を調べ、短時間に増加していることが分かった場合に、ペーストによるファイルサイズの増加と判断し、短時間の増加が無かった場合にペーストが発生していないと判断することで、ペーストが発生していないと考えられるトレース対象ファイルをトレース対象から除外できるので、余分なトレースを行わなくてよい効果がある。
さらに、同様の方法で、トレースフォワード時に、トレース対象のファイルのオープン〜クローズの期間において保存が発生した別ファイルの短期間のファイルサイズの増加を確認し、ペーストの発生を判断することで、ペーストが発生していないと考えられるトレース対象ファイルをトレース対象から除外できるので、余分なトレースを行わなくてよい効果がある。
According to the present embodiment, during the traceback file open-save period at the time of traceback, the increase rate of the file size with respect to that period is examined, and if it is found that the file has increased in a short time, the file by paste Since it is determined that the size has increased, and it is determined that no paste has occurred when there is no increase in a short period of time, it is possible to exclude the trace target file that is considered to have no paste from the trace target. This has the effect of not requiring tracing.
Furthermore, in the same way, when tracing forward, the increase in the file size in the short term of another file that has been saved during the period from the opening to the closing of the trace target file is confirmed, and the occurrence of the paste is judged. Since it is possible to exclude a trace target file that is considered not to have occurred from the trace target, there is an effect that it is not necessary to perform extra tracing.

この実施の形態では、ペースト先の候補ファイルが短時間に増加していた場合にペースト先のファイルとして確定するファイル追跡装置の一例を説明した。   In this embodiment, an example of a file tracking apparatus has been described in which a paste destination file is determined as a paste destination file when the paste destination candidate files have increased in a short time.

実施の形態4.
実施の形態1、2ではトレース条件2105として、コピーアンドペーストファイル特定部1106は、最終トレース対象ファイルと同じ拡張子のファイルについてトレースを行うこととしている。しかし、コピーアンドペーストは同種のファイル間のみで発生するとは限らない。本実施の形態では、コピーアンドペーストが発生しうる拡張子の組み合わせを予め定義し、さらに、スコアを付与することで不要なトレースを行わないファイル追跡システム1の一例を説明する。
Embodiment 4 FIG.
In the first and second embodiments, as the trace condition 2105, the copy and paste file specifying unit 1106 traces a file having the same extension as the final trace target file. However, copy and paste does not always occur only between files of the same type. In the present embodiment, an example of a file tracking system 1 in which combinations of extensions that can cause copy and paste are defined in advance and unnecessary tracing is not performed by giving a score will be described.

実施の形態1、2では、コピーアンドペーストファイル特定部1106の追跡候補生成部1126がトレースバック時のs403もしくは、トレースフォワード時のs403’において、トレース対象候補ファイルリスト2211に加えるファイル名の条件として最終トレース対象ファイル名と拡張子が同じであることを条件としているが、本実施の形態ではこの条件を次の様に変更する。   In the first and second embodiments, the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106 uses the file name condition to be added to the trace target candidate file list 2211 in s403 at the time of trace back or s403 ′ at the time of trace forward. The condition is that the final trace target file name and the extension are the same, but in the present embodiment, this condition is changed as follows.

図16は、ペースト先とコピー元の拡張子の組み合わせとスコアを示した表を示す図である。例えば、ペースト先が.docの場合、コピー元が.txtではスコア(拡張子点数の一例)を2と定義する。ペースト先が.docの場合、コピー元が.docではスコアを3と定義する。ペースト先が.docの場合、コピー元が.csvではスコアを1と定義する。このスコアは次の様に処理される。該表は、コピーアンドペーストファイル特定部1106に埋め込まれていてもよく、トレース条件2105で与えても良い。
トレースバックの場合、トレース条件2105において拡張子の組み合わせのスコアが2以上のもの(点数閾値)を処理するという条件を指定する。コピーアンドペーストファイル特定部1106の追跡候補生成部1126の処理であるs403において、追跡候補生成部1126は、最終トレース対象ファイル名の拡張子が.docの場合、トレース対象候補ファイルリスト2211に加える条件として、スコアが2以上となる拡張子のファイルというトレース条件2105を参照する。最終トレース対象ファイル名で識別されるファイルはペースト先であるので、図16においてペースト先の拡張子が.docの行を参照すると、スコアが2以上のコピー元の拡張子は、.docと.txtである。追跡候補生成部1126は、最終トレース対象ファイル名で識別されるファイルをオープンしてから保存するまでの間に、オープンか、クローズ、或いは両方を行なっているファイルの拡張子が、.doc及び.txtのファイルのファイル名をトレース対象候補ファイルリスト2211に加える。トレース条件2105において拡張子の組み合わせのスコアの閾値は2以外でも良い。
FIG. 16 is a table showing combinations of paste destinations and copy source extensions and scores. For example, if the paste destination is. In the case of doc, the copy source is. In txt, a score (an example of extension score) is defined as 2. The paste destination is. In the case of doc, the copy source is. In doc, the score is defined as 3. The paste destination is. In the case of doc, the copy source is. In csv, the score is defined as 1. This score is processed as follows. The table may be embedded in the copy and paste file specifying unit 1106 or may be given by the trace condition 2105.
In the case of trace back, a condition is specified in which the score of the combination of extensions is 2 or more (point threshold) in the trace condition 2105. In s403, which is the process of the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106, the tracking candidate generation unit 1126 has the extension of the file name of the final trace target file as. In the case of doc, as a condition to be added to the trace target candidate file list 2211, a trace condition 2105 called a file having an extension with a score of 2 or more is referred to. Since the file identified by the final trace target file name is the paste destination, the extension of the paste destination in FIG. Referring to the line of doc, the extension of the copy source having a score of 2 or more is. doc and. txt. The tracking candidate generation unit 1126 has an extension of a file that has been opened, closed, or both, between the time the file identified by the final trace target file name is opened and saved. doc and. The file name of the txt file is added to the trace target candidate file list 2211. In the trace condition 2105, the threshold value of the combination of extensions may be other than 2.

トレースフォワードの場合、例えば、トレース条件2105において拡張子の組み合わせのスコアが3以上のもの(点数閾値)を処理するという条件を指定する。コピーアンドペーストファイル特定部1106の追跡候補生成部1126の処理である、s403’において、追跡候補生成部1126は、最終トレース対象ファイル名の拡張子が.docの場合、トレース対象候補ファイルリスト2211に加える条件として、スコアが3以上というトレース条件2105を参照する。最終トレース対象ファイル名で識別されるファイルはコピー元であるので、図16においてコピー元の拡張子が.docの列を参照すると、スコアが3以上のペースト先の拡張子は、.docである。追跡候補生成部1126は、最終トレース対象ファイル名で識別されるファイルをオープンしてからクローズするまでの間に、保存を行なっているファイルの拡張子が、.docのファイルのファイル名をトレース対象候補ファイルリスト2211に加える。トレース条件2105において拡張子の組み合わせのスコアの閾値は3以外でも良い。   In the case of trace forward, for example, a condition is specified in which a combination of extensions of 3 or more (point threshold) is processed in the trace condition 2105. In s 403 ′, which is the process of the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106, the tracking candidate generation unit 1126 has an extension of the file name of the final trace target. In the case of doc, as a condition to be added to the trace target candidate file list 2211, a trace condition 2105 having a score of 3 or more is referred to. Since the file identified by the final trace target file name is the copy source, the extension of the copy source in FIG. Referring to the column of doc, the extension of the paste destination having a score of 3 or more is. doc. The tracking candidate generation unit 1126 has the extension of the file being saved between the time when the file identified by the final trace target file name is opened and the time when the file is saved being. The file name of the doc file is added to the trace target candidate file list 2211. In the trace condition 2105, the extension threshold score may be other than 3.

本実施の形態によれば、コピーアンドペーストが発生する可能性のあるファイルの拡張子間のスコアを予め定めておくことで、指定したスコアの閾値以上の拡張子の組み合わせについてトレースが可能となるため、全ての拡張子の組み合わせについてトレースする必要が無くなり、トレース処理が効率化される効果がある。   According to the present embodiment, it is possible to trace a combination of extensions that are equal to or greater than a specified score threshold by setting in advance a score between extensions of files that may cause copy and paste. Therefore, it is not necessary to trace all combinations of extensions, and there is an effect that the tracing process is made efficient.

この実施の形態では、トレースするファイルの拡張子の組み合わせに予めスコアをつけ一定のスコア以上の拡張子のファイルのみトレースするファイル追跡装置の一例を説明した。   In this embodiment, an example of a file tracking device that gives a score in advance to a combination of extensions of files to be traced and traces only a file having an extension exceeding a certain score has been described.

実施の形態5.
実施の形態1のトレースバックにおいて、s402、s403において、追跡候補生成部1126は、最終トレース対象ファイル名で識別されるファイルがオープン〜保存された期間に、別途オープン或いはクローズ或いは両方を行なっているファイルのファイル名をトレース対象候補ファイルリスト2211に加えたが、本実施の形態では、該期間に、別途オープン或いはクローズ或いは両方を行なっているファイルで、かつ、保存を行なったファイルについては、トレース対象候補ファイルリスト2211に加えない。コピー元としてファイルをオープンするのであれば、編集し保存することは少ないという予想に基づく。該保存の有無は、最終トレース対象ファイル名で識別されるファイルがオープン〜保存されたしぼり込み期間のログエントリを検索し、該ファイルの保存の有無を確認する。
Embodiment 5 FIG.
In the traceback according to the first embodiment, in s402 and s403, the tracking candidate generation unit 1126 performs separate opening or closing or both during the period in which the file identified by the final trace target file name is opened to saved. Although the file name of the file has been added to the trace target candidate file list 2211, in this embodiment, the file that has been separately opened or closed during the period and the file that has been saved is traced. It is not added to the target candidate file list 2211. If the file is opened as a copy source, it is based on the expectation that editing and saving are rare. Whether or not the file is saved is searched for a log entry in the squeezing period in which the file identified by the final trace target file name is opened to saved, and whether or not the file is saved is confirmed.

実施の形態2のトレースフォワードにおいては、s402’において、追跡候補生成部1126は、トレース対象ファイルオープン日時からトレース対象ファイルクローズ日時までの間のログを切り出す、としているが、本実施の形態では、該オープン〜クローズを行った間に、最終トレース対象ファイル名で識別されるファイルが保存されていれば、切り出したログを破棄し、s403’において、トレース対象候補ファイルリスト2211を空として終了する。これは、コピー元として最終トレース対象ファイル名で識別されるファイルをオープンするのであれば、編集し保存することは少ないという予想に基づく。該保存の有無は、該オープン〜クローズを行ったしぼり込み期間のログエントリ210の操作コマンド214を用いて検索する。操作コマンド214に保存操作を表す操作コマンドが記憶され、かつ、操作内容215に最終トレース対象ファイル名で識別されるファイルの保存を行ったことが記憶されているか判定する。   In the trace forward of the second embodiment, in s402 ′, the tracking candidate generation unit 1126 cuts out a log between the trace target file open date and time and the trace target file close date and time. However, in the present embodiment, If the file identified by the final trace target file name is saved during the opening to closing, the cut log is discarded, and in s403 ′, the trace target candidate file list 2211 is emptied and the process ends. This is based on the expectation that if a file identified by the final trace target file name is opened as a copy source, it is rarely edited and saved. The presence / absence of the storage is searched using the operation command 214 of the log entry 210 during the squeezing period in which the opening to closing is performed. It is determined whether an operation command indicating a save operation is stored in the operation command 214 and that the file identified by the final trace target file name is stored in the operation content 215.

本実施の形態によれば、コピーアンドペーストのコピー元としてファイルを参照する場合は、編集し保存することは少ないという予想に基づき、トレースバック、トレースフォワードの両方において、コピー元と考えられるファイルについて保存を行なっている場合は、コピー元の候補から除外することにより、コピー元ではない可能性のあるファイルをトレースする無駄を省く効果がある。   According to the present embodiment, when a file is referred to as a copy source of copy and paste, the file considered to be the copy source in both traceback and trace forward based on the expectation that editing and saving are rare. In the case of saving, by excluding it from the copy source candidates, there is an effect of eliminating waste of tracing a file that may not be the copy source.

この実施の形態では、コピー元の候補ファイルが保存されていた場合はコピー元の候補から除外する。ペースト先の候補ファイルの特定において、トレース対象のファイルが保存されていた場合は、該ペースト先の候補ファイルを候補ファイルから除外するとの動作を行うファイル追跡装置の一例を説明した。   In this embodiment, if a copy source candidate file is stored, it is excluded from the copy source candidates. An example of a file tracking device that performs an operation of excluding a paste-destination candidate file from the candidate file when the file to be traced is stored in the specification of the paste-destination candidate file has been described.

実施の形態6.
実施の形態1のトレースバックにおいて、s403において、最終トレース対象ファイル名で識別されるファイルがオープン〜保存されたしぼり込み期間に、別途オープン或いはクローズ或いは両方を行なっているファイルをトレース対象候補ファイルリスト2211に加えるが、本実施の形態では、s403において、追跡候補生成部1126は、該しぼり込み期間に別途オープン或いはクローズ或いは両方を行なっているファイルでかつ、該期間の直後に削除しているログエントリをトレース対象候補ファイルリスト2211に加える。これは、悪意をもってファイルの内容をコピーアンドペーストした場合、コピー元のファイルを削除して証拠を隠蔽することが考えられるためである。
該しぼり込み期間のログエントリのうち、別途オープン或いはクローズ或いは両方を行なっているログエントリについて、該しぼり込み期間の直後のログエントリを検索し、該ファイルの削除が記録されているか確認する。直後とは、例えば、10分以内である。直後とする期間については、トレース条件2105で与えればよい。追跡候補生成部1126は、トレース条件2105を参照する。
Embodiment 6 FIG.
In the traceback according to the first embodiment, in s403, a file that is separately opened or closed or both during the squeezing period in which the file identified by the final trace target file name is opened to saved is the trace target candidate file list. In addition to 2211, in this embodiment, in s403, the tracking candidate generation unit 1126 is a file that is separately opened, closed, or both during the narrowing period, and is deleted immediately after the period. The entry is added to the trace target candidate file list 2211. This is because, when the contents of a file are copied and pasted maliciously, it is conceivable to hide the evidence by deleting the copy source file.
Among the log entries in the squeezing period, for log entries that are separately opened, closed, or both, the log entry immediately after the squeezing period is searched to check whether the deletion of the file is recorded. Immediately after is, for example, within 10 minutes. What is necessary is just to give with the trace condition 2105 about the period immediately after. The tracking candidate generation unit 1126 refers to the trace condition 2105.

削除されたファイルのファイル名が追跡候補生成部1126で生成したトレース対象候補ファイルリスト2211に含まれていると、追加トレース判断部1107は、削除されたファイルをアクセスできないため、当該ファイルの情報を入力することができない。このため、追加トレース判断部1107は、s205で、トレース対象候補ファイル名で識別されるファイルが削除されていてアクセスできない時は、実施の形態1で説明した類似度を比較する処理を行わずに、s207に移行し、トレース対象候補ファイル名を含む操作内容215を有するログエントリ210を追加トレース対象ファイルリスト2210aに追加する。   If the file name of the deleted file is included in the trace target candidate file list 2211 generated by the tracking candidate generation unit 1126, the additional trace determination unit 1107 cannot access the deleted file. I can't enter it. Therefore, when the file identified by the trace target candidate file name is deleted and cannot be accessed in s205, the additional trace determination unit 1107 does not perform the process of comparing the similarity described in the first embodiment. , S207, and the log entry 210 having the operation content 215 including the trace target candidate file name is added to the additional trace target file list 2210a.

実施の形態2のトレースフォワードにおいて、s403’において、最終トレース対象ファイル名で識別されるファイルがオープン〜クローズされたしぼり込み期間に、別途保存されたファイルのファイル名をトレース対象候補ファイルリスト2211に加える。本実施の形態では、s403’において、追跡候補生成部1126は、追加条件として、該しぼり込み期間の直後に最終トレース対象ファイル名で識別されるファイルを削除している場合は、該別途保存されたファイルをトレース対象候補ファイルリスト2211に加える。削除操作は、操作コマンド214に、削除操作を表す操作コマンドが記憶されている場合に削除が行われたと判定する。これは、悪意をもってファイルの内容をコピーアンドペーストした場合、コピー元のファイルを削除して証拠を隠蔽することが考えられるためである。
該しぼり込み期間のログエントリにおいて、該しぼり込み期間の直後のログを検索し、最終トレース対象ファイル名で識別されるファイルの削除が記録されているか確認する。直後とは、例えば、10分以内である。直後とする期間については、トレース条件2105で与えればよい。追跡候補生成部1126は、トレース条件2105を参照する。
In the trace forward of the second embodiment, in s403 ′, the file name of the separately stored file is stored in the trace target candidate file list 2211 during the squeezing period in which the file identified by the final trace target file name is opened to closed. Add. In this embodiment, in s403 ′, the tracking candidate generation unit 1126 saves the file identified by the final trace target file name immediately after the narrowing period as an additional condition. The added file is added to the trace target candidate file list 2211. The delete operation is determined to have been performed when an operation command representing the delete operation is stored in the operation command 214. This is because, when the contents of a file are copied and pasted maliciously, it is conceivable to hide the evidence by deleting the copy source file.
In the log entry of the squeezing period, the log immediately after the squeezing period is searched to confirm whether deletion of the file identified by the final trace target file name is recorded. Immediately after is, for example, within 10 minutes. What is necessary is just to give with the trace condition 2105 about the period immediately after. The tracking candidate generation unit 1126 refers to the trace condition 2105.

削除されたファイルのファイル名が追跡候補生成部1126で生成したトレース対象候補ファイルリスト2211に含まれていると、追加トレース判断部1107は、削除されたファイルをアクセスできないため、当該ファイルの情報を入力することができない。このため、追加トレース判断部1107は、s205’で、トレース対象候補ファイル名で識別されるファイルが削除されていてアクセスできない時は、実施の形態1で説明した類似度を比較する処理を行わずに、s207’に移行し、トレース対象候補ファイル名を含む操作内容215を有するログエントリ210を追加トレース対象ファイルリスト2210aに追加する。   If the file name of the deleted file is included in the trace target candidate file list 2211 generated by the tracking candidate generation unit 1126, the additional trace determination unit 1107 cannot access the deleted file. I can't enter it. Therefore, when the file identified by the trace target candidate file name is deleted and cannot be accessed in s205 ′, the additional trace determination unit 1107 does not perform the process of comparing the similarity described in the first embodiment. Then, the process proceeds to s207 ′, and the log entry 210 having the operation content 215 including the trace target candidate file name is added to the additional trace target file list 2210a.

本実施の形態によれば、悪意を持ってファイルをコピーアンドペーストする場合、コピーアンドペースト後にコピー元ファイルを削除し証拠を隠蔽する可能性を鑑み、トレース対象候補ファイルリスト2211に加える条件として、トレースバックの場合は、最終トレース対象ファイル名で識別されるファイルがオープン〜保存された期間に別途オープン或いはクローズ或いは両方を行なっているファイルでかつ該期間の直後に削除しているものをトレース対象候補ファイルリスト2211に加えることにした。また、トレースフォワードの場合は、最終トレース対象ファイル名で識別されるファイルがオープン〜クローズされた期間の直後に該ファイルが削除されている場合は、該期間に保存した別ファイルのファイル名をトレース対象候補ファイルリスト2211に加えることにした。
この結果、トレース対象候補ファイルリスト2211に加えるファイル名を絞り込むことができるため、余分なトレースを行わなくてよい効果がある。
According to the present embodiment, when a file is copied and pasted maliciously, in consideration of the possibility of deleting the copy source file and concealing evidence after copy and paste, as a condition to be added to the trace target candidate file list 2211, In the case of traceback, the file identified by the last trace target file name is a file that has been opened or closed separately during the period when it was opened and saved, or both that have been deleted immediately after that period. It was decided to add to the candidate file list 2211. In the case of trace forward, when the file identified by the last trace target file name has been deleted immediately after the period from opening to closing, the file name of another file saved during that period is traced. The target candidate file list 2211 is added.
As a result, the file names to be added to the trace target candidate file list 2211 can be narrowed down, and there is an effect that unnecessary tracing is not required.

この実施の形態では、コピー元の候補ファイルがクローズ直後に削除されている場合にコピー元のファイルとして確定する。ペースト先の候補ファイルに対するトレース対象ファイルが、クローズ直後に削除されていた場合は、ペースト先のファイルとして確定する動作を行うファイル追跡装置の一例を説明した。   In this embodiment, when a copy source candidate file is deleted immediately after closing, it is determined as a copy source file. An example of a file tracking device that performs an operation of confirming a file as a paste-destination file when the trace target file for the paste-destination candidate file has been deleted immediately after closing has been described.

実施の形態7.
情報漏洩を鑑みた場合、組織の外部へ送出(漏洩)したファイルに多くのデータを含むほど漏洩時の被害が大きくなると考えられる。ファイル間でデータをコピーアンドペーストする場合において、コピー元ファイルが大きければ多くのデータをコピーできる可能性がある。また、ペースト先のファイルが大きければ多くのデータをペーストされた可能性がある。本実施の形態ではコピー元、ペースト先の候補とするファイルのファイルサイズに着目し、トレース対象の候補を絞り込むものである。
Embodiment 7 FIG.
When information leakage is taken into consideration, it is considered that the damage at the time of leakage increases as more data is included in the file sent (leaked) outside the organization. When copying and pasting data between files, if the copy source file is large, a large amount of data may be copied. Also, if the paste destination file is large, a large amount of data may have been pasted. In this embodiment, attention is focused on the file size of a file that is a copy source and paste destination candidate, and the trace target candidates are narrowed down.

実施の形態1のトレースバックにおいて、コピーアンドペーストファイル特定部1106の追跡候補生成部1126の動作を示すs403において、追跡候補生成部1126は、最終トレース対象ファイル名で識別されるファイルがオープン〜保存されたしぼり込み期間に、別途オープン或いはクローズ或いは両方を行なっているファイルをトレース対象候補ファイルリスト2211に加える。本実施の形態では、該しぼり込み期間に、別途オープン或いはクローズ或いは両方を行なっており、かつ、一定以上のファイルサイズのものをトレース対象候補ファイルリスト2211に加える。これは、コピー元とするファイルが一定以上のサイズ(サイズ閾値)であれば、データをコピーできる可能性があることに基づく。一定以上のファイルサイズとして、例えば、500Kバイト以上などを指定する。このファイルサイズの条件は、トレース条件2105で指定すればよい。追跡候補生成部1126は、ファイルサイズを操作内容215から取得する。また、追跡候補生成部1126は、操作コマンド214にファイルを開く操作を表す操作コマンドが記憶されているか判定する。また、追跡候補生成部1126は、トレース条件2105を参照する。   In the traceback according to the first embodiment, in s403 indicating the operation of the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106, the tracking candidate generation unit 1126 opens and saves the file identified by the final trace target file name. During the squeezing-in period, a file that is separately opened, closed, or both is added to the trace target candidate file list 2211. In the present embodiment, open, close, or both are separately performed during the squeeze-in period, and files having a certain file size or more are added to the trace target candidate file list 2211. This is based on the possibility that data can be copied if the file to be copied is a certain size (size threshold) or more. For example, 500 Kbytes or more is designated as the file size above a certain level. This file size condition may be specified by the trace condition 2105. The tracking candidate generation unit 1126 acquires the file size from the operation content 215. Further, the tracking candidate generation unit 1126 determines whether an operation command representing an operation for opening a file is stored in the operation command 214. The tracking candidate generation unit 1126 refers to the trace condition 2105.

実施の形態2のトレースフォワードにおいて、コピーアンドペーストファイル特定部1106の追跡候補生成部1126動作を示すs403’において、追跡候補生成部1126は、最終トレース対象ファイル名で識別されるファイルがオープン〜クローズされたしぼり込み期間に、別途保存されたファイルをトレース対象候補ファイルリスト2211に加えている。本実施の形態では、該しぼり込み期間に、別途保存しており、かつ、一定以上のファイルサイズ(サイズ閾値)のものをトレース対象候補ファイルリスト2211に加える。これは、ペースト先とするファイルが一定以上のサイズであれば、データをペーストされている可能性があることに基づく。一定以上のファイルサイズとして、例えば、500Kバイト以上などを指定する。このファイルサイズの条件は、トレース条件2105で指定すればよい。追跡候補生成部1126は、ファイルサイズを操作内容215から取得する。また、追跡候補生成部1126は、操作コマンド214にファイルを開く操作を表す操作コマンドが記憶されているか判定する。また、追跡候補生成部1126は、トレース条件2105を参照する。   In the trace forward of the second embodiment, in s403 ′ indicating the operation of the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106, the tracking candidate generation unit 1126 opens or closes the file identified by the final trace target file name. A separately stored file is added to the trace target candidate file list 2211 during the squeezing period. In the present embodiment, a file that is separately stored and has a file size (size threshold) of a certain size or more is added to the trace target candidate file list 2211 during the narrowing period. This is based on the fact that data may be pasted if the file to be pasted is a certain size or larger. For example, 500 Kbytes or more is designated as the file size above a certain level. This file size condition may be specified by the trace condition 2105. The tracking candidate generation unit 1126 acquires the file size from the operation content 215. Further, the tracking candidate generation unit 1126 determines whether an operation command representing an operation for opening a file is stored in the operation command 214. The tracking candidate generation unit 1126 refers to the trace condition 2105.

本実施の形態によれば、ファイル間でデータをコピーアンドペーストする場合は一定以上のデータ量をコピーアンドペーストすることを想定し、トレースバックではコピー元の候補のファイルサイズを一定以上のものに限定し、また、トレースフォワードではペースト先の候補のファイルをサイズを一定以上のものに限定することで、トレース対象候補ファイル名を絞り込むことができるため、余分なトレースを行わなくてよい効果がある。   According to this embodiment, when copying and pasting data between files, it is assumed that a certain amount of data is copied and pasted, and in traceback, the file size of the copy source candidate is set to a certain size or more. In addition, in trace forward, by limiting the paste destination candidate file size to a certain size or more, the target file names to be traced can be narrowed down, so there is no need to perform extra tracing. .

この実施の形態では、コピー元の候補ファイルが一定以上のサイズの場合にコピー元のファイルとして確定する。ペースト先の候補ファイルが一定以上のサイズの場合にペースト先のファイルとして確定する動作を行うファイル追跡装置の一例を説明した。   In this embodiment, when the copy source candidate file has a predetermined size or larger, it is determined as the copy source file. An example of a file tracking device that performs an operation of determining a paste-destination candidate file as a paste-destination file when the paste-destination candidate file has a certain size or more has been described.

実施の形態8.
コピーアンドペーストを行なう場合、コピー元ファイルをオープンし、内容をコピーし、直ぐにクローズしても、クリップボードと呼ばれるコピーデータの保存領域にコピーした内容が保存される。クローズした後、ペースト先ファイルへペーストすることが可能である。
Embodiment 8 FIG.
When performing copy and paste, even if the copy source file is opened, the contents are copied, and immediately closed, the copied contents are stored in a copy data storage area called a clipboard. After closing, it can be pasted into the destination file.

実施の形態1の様に、最終トレース対象ファイル名で識別されるファイルをオープン〜保存したしぼり込み期間に別途オープン或いはクローズ或いは両方を行なっているファイルのファイル名をトレース対象候補ファイル名とした場合、「コピー元ファイルでデータをコピー→直ぐクローズ→その後ペースト先ファイルをオープン→ペースト→保存」という操作を行なった場合にトレース対象候補ファイル名が見つからない。本実施の形態では、実施の形態1のトレースバックにおいて、コピーアンドペーストファイル特定部1106の追跡候補生成部1126の動作を示すs402を次の様に変更する。
s402:トレース対象ファイル保存日時からn分遡りログを切り出す。
When the file name of the file that is opened or closed separately during the squeezing period in which the file identified by the final trace target file name is opened to saved as in the first embodiment is used as the trace target candidate file name The candidate file name to be traced is not found when the operation of “copy data in copy source file → close immediately → open paste destination file afterwards → paste → save” is performed. In the present embodiment, in the traceback of the first embodiment, s402 indicating the operation of the tracking candidate generation unit 1126 of the copy and paste file specifying unit 1106 is changed as follows.
s402: A log is cut back by n minutes from the trace target file save date and time.

この様に、切り出す対象のログの開始をトレース対象ファイルオープン日時とせず、トレース対象ファイル保存日時からn分遡った日時とすることで、追跡候補生成部1126は、トレース対象ファイルオープン日時よりも前の時間のログも含めて切り出す。従って、トレース対象ファイルオープン日時よりも前にオープン・コピー・クローズしたファイルについてもs403でトレース対象候補ファイルリスト2211に追加される。但し、トレース対象ファイル保存日時からn分遡った日時は、トレース対象ファイルオープン日時よりも前となるようにn分を設定する。   In this way, the start of the log to be extracted is not set as the trace target file open date and time, but is set as the date and time that is traced back by n minutes from the trace target file save date and time, so that the tracking candidate generation unit 1126 Cut out including the time log. Therefore, a file opened / copied / closed before the trace target file open date / time is also added to the trace target candidate file list 2211 in s403. However, n minutes is set so that the date and time traced back by n minutes from the trace target file save date and time is before the trace target file open date and time.

トレース対象ファイル保存日時から遡る時間であるn分の指定によっては、トレース対象ファイルオープン日時よりも前にオープン・コピー・クローズしたファイルについてs403で抽出されない場合がある。例えば、「ファイルAをオープン→データをコピー→クローズ」し、その2分後に「最終トレース対象ファイル名で識別されるファイルをオープン→ペースト→10分後に保存」した場合を考える。n=10分とした場合、トレース対象ファイル保存日時から10分遡っても、ファイルAのオープン〜クローズの期間はs402で切り出されるログには含まれない。
しかし、コピーしてからペーストせず長時間放置することは少ないと予想されるため、例えば、遡る時間は、
n分=「トレース対象ファイル保存日時−トレース対象ファイルオープン日時」+△
において、△=30分などとすればよい。この様にすれば、トレース対象ファイルオープン日時よりも30分前のログも切り出される。
Depending on the designation of n minutes that is the time that goes back from the trace target file save date and time, a file that was opened, copied, or closed before the trace target file open date and time may not be extracted in s403. For example, consider a case where “open file A → copy data → close” and “open the file identified by the final trace target file name → paste → save after 10 minutes” two minutes later. When n = 10 minutes, the period from the opening to the closing of file A is not included in the log extracted in s402 even if it goes back 10 minutes from the trace target file save date and time.
However, since it is expected that it will rarely be left for a long time without copying and pasting, for example,
n minutes = "Trace target file save date-Trace target file open date" + △
In this case, Δ = 30 minutes may be set. In this way, a log 30 minutes before the trace target file open date is also cut out.

本実施の形態によれば、トレース対象ファイル保存日時から一定時間を遡ったログにおいて、別途オープン或いはクローズ或いはその両方を行なったファイルのファイル名をトレース対象候補ファイル名とするので、該ファイルの「オープン→データコピー→クローズ」後、「最終トレース対象ファイル名で識別されるファイルをオープン→ペースト→保存」するような場合においても、該ファイル名をトレース対象候補ファイル名として特定することが可能となる効果がある。   According to the present embodiment, the file name of the file that has been separately opened and / or closed in the log that goes back a certain time from the trace target file save date and time is set as the trace target candidate file name. After “Open → Data Copy → Close”, it is possible to specify the file name as the trace target candidate file name even in the case of “Open → Paste → Save” as the file identified by the final trace target file name. There is an effect.

1 ファイル追跡システム、90 ファイルサーバ、91 機密ファイル、94 メールサーバ、96 ログ分析サーバ、97 操作ログ、210 ログエントリ、211 タイムスタンプ、212 端末名、213 プロセス名、214 操作コマンド、215 操作内容、216 アプリケーション名、901 表示装置、902 キーボード、903 マウス、904 FDD、905 CDD、906 プリンタ装置、907 スキャナ装置、910 システムユニット、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 磁気ディスク装置、921 OS、922 ウィンドウシステム、923 プログラム群、924 ファイル群、931 電話器、932 ファクシミリ機、940 インターネット、941 ゲートウェイ、942 LAN、1101a 外部入力ログファイル取り込み部、1101b 外部出力ログファイル取り込み部、1102a 外部入力ファイル特定部、1102b 外部出力ファイル特定部、1103 操作ログファイル取り込み部、1104 トレース部、1105 トレース結果判断部、1106 コピーアンドペーストファイル特定部、1107 追加トレース判断部、1108 期間入力部、1109 処理対象ログ記憶部、1114 転送判定部、1116 しぼり込み期間取得部、1124 変遷判定部、1126 追跡候補生成部、2101a 外部入力ログファイル、2101b 外部出力ログファイル、2103 操作ログファイル、2201a 外部入力ログ、2201b 外部出力ログ、2102a 外部入力ファイル特定条件、2102b 外部出力ファイル特定条件、2104 トレース開始条件、2105 トレース条件、2106 トレース終了条件、2107 トレース結果、2108 処理対象期間、2202a 外部入力ファイル名、2202b 外部出力ファイル名、2203a ファイル入力日時、2203b ファイル出力日時、2204 操作ログ、2205a 最終変遷日時、2205b トレース開始日時、2205c トレース終了日時、2206 最終トレース対象ファイル名、2207 判定結果、2208 コピーアンドペースト調査指示、2209 特定結果、2210a トレース対象ファイルリスト、2210b 追加トレース対象ファイル名、2211 トレース対象候補ファイルリスト。   1 file tracking system, 90 file server, 91 confidential file, 94 mail server, 96 log analysis server, 97 operation log, 210 log entry, 211 time stamp, 212 terminal name, 213 process name, 214 operation command, 215 operation content, 216 Application name, 901 display device, 902 keyboard, 903 mouse, 904 FDD, 905 CDD, 906 printer device, 907 scanner device, 910 system unit, 911 CPU, 912 bus, 913 ROM, 914 RAM, 915 communication board, 920 magnetic Disk device, 921 OS, 922 window system, 923 program group, 924 file group, 931 telephone, 932 facsimile machine, 940 Internet, 41 Gateway, 942 LAN, 1101a External input log file capturing unit, 1101b External output log file capturing unit, 1102a External input file specifying unit, 1102b External output file specifying unit, 1103 Operation log file capturing unit, 1104 Trace unit, 1105 Trace result Determination unit, 1106 copy and paste file specifying unit, 1107 additional trace determination unit, 1108 period input unit, 1109 processing target log storage unit, 1114 transfer determination unit, 1116 constriction period acquisition unit, 1124 transition determination unit, 1126 tracking candidate generation 2101a external input log file, 2101b external output log file, 2103 operation log file, 2201a external input log, 2201b external output log, 2102a external Input file specification condition, 2102b external output file specification condition, 2104 trace start condition, 2105 trace condition, 2106 trace end condition, 2107 trace result, 2108 processing target period, 2202a external input file name, 2202b external output file name, 2203a file input Date / time, 2203b File output date / time, 2204 Operation log, 2205a Last transition date / time, 2205b Trace start date / time, 2205c Trace end date / time, 2206 Final trace target file name, 2207 Judgment result, 2208 Copy and paste investigation instruction, 2209 Specific result, 2210a Trace Target file list, 2210b Additional trace target file name, 2211 Trace target candidate file list.

Claims (19)

処理対象ファイルを生成した元のファイルを、複数のログエントリを追跡して推定するファイル追跡装置において、
操作コマンドと、操作したファイルのファイル名を含む操作内容と、操作が行われた日時を表すタイムスタンプとを有するログエントリを複数記憶した操作ログ記憶部と、
上記処理対象ファイルの処理対象ファイル名を入力し、上記操作ログ記憶部に記憶された複数のログエントリからログエントリが有する操作コマンドと操作内容とを用いて、上記処理対象ファイルを保存する操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプを保存日時として取得するとともに、取得した保存日時までに、上記処理対象ファイルを開く操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをオープン日時として取得し、取得したオープン日時と上記保存日時とを有するしぼり込み期間を出力するしぼり込み期間取得部と、
上記しぼり込み期間取得部が出力したしぼり込み期間を入力し、上記操作ログ記憶部が記憶した複数のログエントリからログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて、入力したしぼり込み期間に、上記処理対象ファイル名と類似する類似ファイル名のファイルを開く操作と閉じる操作とのいずれかの操作を行ったことを表すログエントリを1つ以上抽出し、抽出した1つ以上の各ログエントリを追跡候補ログとして記憶装置に記憶する追跡候補生成部と、
上記追跡候補生成部が記憶装置に記憶した追跡候補ログを順次入力し、入力した追跡候補ログが有する操作内容に含まれた類似ファイル名が表すファイルに記憶された情報を追跡候補情報として入力し、上記類似ファイル名の類似ファイルを生成した元のファイルを複数のログエントリを追跡して推定するか否かを、入力した追跡候補情報を用いて判定し、推定することを判定した追跡候補ログを出力する追加追跡ログ判定部と、
上記追加追跡ログ判定部が出力した追跡候補ログを、追加追跡ログとして記憶する追加追跡ログ記憶部と、
上記追加追跡ログ記憶部に記憶された追加追跡ログが有する操作内容に含まれた上記類似ファイル名を入力し、入力した類似ファイル名の類似ファイルを生成した元のファイルを、上記処理対象ファイルを生成した元のファイルとして、複数のログエントリを追跡して推定する追跡部と
を備えたことを特徴とするファイル追跡装置。
In a file tracking device that estimates the original file that generated the file to be processed by tracking multiple log entries,
An operation log storage unit that stores a plurality of log entries each including an operation command, an operation content including the file name of the operated file, and a time stamp indicating the date and time when the operation was performed;
An operation for inputting the processing target file name of the processing target file and saving the processing target file using an operation command and operation contents of the log entry from a plurality of log entries stored in the operation log storage unit. A log entry indicating that the processing has been performed is extracted, and the time stamp of the extracted log entry is acquired as the storage date and time, and the log entry indicating that the operation to open the processing target file is performed by the acquired storage date and time. Extracting, acquiring a time stamp included in the extracted log entry as an open date, and outputting a squeeze period acquisition unit having the acquired open date and the storage date and time;
The squeezing period output by the squeezing period acquisition unit is input, and the squeezing that is input using the time stamp, operation command, and operation content of the log entry from the plurality of log entries stored by the operation log storage unit. One or more log entries indicating that any one of an operation of opening and closing a file having a similar file name similar to the file name to be processed in the period is extracted, and each of the extracted one or more A tracking candidate generator for storing the log entry in the storage device as a tracking candidate log;
The tracking candidate generation unit sequentially inputs the tracking candidate log stored in the storage device, and inputs the information stored in the file represented by the similar file name included in the operation content of the input tracking candidate log as the tracking candidate information. Whether or not to estimate the original file that generated the similar file with the similar file name by tracking a plurality of log entries is determined using the input tracking candidate information, and the tracking candidate log determined to be estimated An additional tracking log determination unit that outputs
An additional tracking log storage unit that stores the tracking candidate log output by the additional tracking log determination unit as an additional tracking log;
The similar file name included in the operation content of the additional tracking log stored in the additional tracking log storage unit is input, the original file that generated the similar file with the input similar file name is changed to the processing target file. A file tracking apparatus comprising: a tracking unit that tracks and estimates a plurality of log entries as a generated original file.
処理対象ファイルを元のファイルとして生成した別の新たなファイルを、複数のログエントリを追跡して推定するファイル追跡装置において、
操作コマンドと、操作したファイルのファイル名を含む操作内容と、操作が行われた日時を表すタイムスタンプとを有するログエントリを複数記憶した操作ログ記憶部と、
上記処理対象ファイルの処理対象ファイル名を入力し、上記操作ログ記憶部に記憶された複数のログエントリからログエントリが有する操作コマンドと操作内容とを用いて、上記処理対象ファイルを開く操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをオープン日時として取得するとともに、取得したオープン日時以降に、上記処理対象ファイルを閉じる操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをクローズ日時として取得し、取得したオープン日時と上記クローズ日時とを有するしぼり込み期間を出力するしぼり込み期間取得部と、
上記しぼり込み期間取得部が出力したしぼり込み期間を入力し、上記操作ログ記憶部が記憶した複数のログエントリからログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて、入力したしぼり込み期間に、上記処理対象ファイル名と類似する類似ファイル名のファイルを記憶するとの操作を行ったことを表すログエントリを1つ以上抽出し、抽出した1つ以上の各ログエントリを追跡候補ログとして記憶装置に記憶する追跡候補生成部と、
上記追跡候補生成部が記憶装置に記憶した追跡候補ログを順次入力し、入力した追跡候補ログが有する操作内容に含まれた類似ファイル名が表すファイルに記憶された情報を追跡候補情報として入力し、上記類似ファイル名の類似ファイルから生成した別の新たなファイルを複数のログエントリを追跡して推定するか否かを、入力した追跡候補情報を用いて判定し、推定することを判定した追跡候補ログを出力する追加追跡ログ判定部と、
上記追加追跡ログ判定部が出力した追跡候補ログを、追加追跡ログとして記憶する追加追跡ログ記憶部と、
上記追跡ログ記憶部に記憶された追加候補ログが有する操作内容に含まれた上記類似ファイル名を入力し、入力した類似ファイル名の類似ファイルから生成した別の新たなファイルを、上記処理対象ファイルを元のファイルとして生成した別の新たなファイルとして、複数のログエントリを追跡して推定する追跡部
を備えたことを特徴とするファイル追跡装置。
In a file tracking device that estimates another new file generated as an original file to be processed by tracking a plurality of log entries,
An operation log storage unit that stores a plurality of log entries each including an operation command, an operation content including the file name of the operated file, and a time stamp indicating the date and time when the operation was performed;
The processing target file name of the processing target file is input, and the operation target file is opened from the plurality of log entries stored in the operation log storage unit using the operation command and operation content of the log entry. The log entry indicating that the file to be processed is extracted and the time stamp of the extracted log entry is acquired as the open date and time. Acquiring a time stamp included in the extracted log entry as a closing date and time, and a squeezing period acquisition unit that outputs a squeezing period including the acquired opening date and time and the closing date and time,
The squeezing period output by the squeezing period acquisition unit is input, and the squeezing that is input using the time stamp, operation command, and operation content of the log entry from the plurality of log entries stored by the operation log storage unit. One or more log entries indicating that an operation for storing a file with a similar file name similar to the processing target file name during the period is extracted, and each of the extracted one or more log entries is used as a tracking candidate log A tracking candidate generator for storing in a storage device;
The tracking candidate generation unit sequentially inputs the tracking candidate log stored in the storage device, and inputs the information stored in the file represented by the similar file name included in the operation content of the input tracking candidate log as the tracking candidate information. Whether or not another new file generated from a similar file with the similar file name is estimated by tracking a plurality of log entries, is determined using the input tracking candidate information, and tracking is determined to be estimated An additional tracking log determination unit that outputs candidate logs;
An additional tracking log storage unit that stores the tracking candidate log output by the additional tracking log determination unit as an additional tracking log;
The similar file name included in the operation content of the additional candidate log stored in the tracking log storage unit is input, and another new file generated from the similar file with the input similar file name is input to the processing target file. A file tracking apparatus comprising a tracking unit that tracks and estimates a plurality of log entries as another new file generated as an original file.
上記ファイル追跡装置は、さらに、
処理対象とする期間を指定する開始日時と終了日時とを有する処理対象期間を入力する期間入力部を備え、
上記操作ログ記憶部は、上記複数のログエントリとして、ログエントリが有するタイムスタンプが上記処理対象期間内である複数のログエントリを記憶し、
上記しぼり込み期間取得部は、上記処理対象ファイルを生成した日時を表す処理対象日時を入力し、上記操作ログ記憶部に記憶された複数のログエントリから、上記期間入力部が入力した開始日時から上記処理対象日時までの期間に含まれるタイムスタンプを有し、かつ、ファイルを保存する操作を表す操作コマンドを有し、かつ、上記処理対象ファイル名を含む操作内容を有するログエントリを1つ以上抽出し、抽出した1つ以上のログエントリから、上記終了日時に最も近いタイムスタンプを有するログエントリを選択し、選択したログエントリが有するタイムスタンプを上記保存日時として取得し、上記操作ログ記憶部が記憶した複数のログエントリから、上記開始日時から上記保存日時までの期間に含まれるタイムスタンプを有し、かつ、ファイルを開く操作を表す操作コマンドを有し、かつ、上記処理対象ファイル名を含む操作内容を有するログエントリを1つ以上抽出し、抽出した1つ以上のログエントリから、上記終了日時に最も近いタイムスタンプを有するログエントリを選択し、選択したログエントリが有するタイムスタンプを上記オープン日時として取得し、
上記追跡候補生成部は、上記操作ログ記憶部に記憶された複数のログエントリから、上記しぼり込み期間に含まれるタイムスタンプを有し、かつ、ファイルを開く操作とファイルを閉じる操作とのいずれかの操作を表す操作コマンドを有し、かつ、上記処理対象ファイル名と類似する類似ファイル名を含む操作内容を有するログエントリを1つ以上抽出し、抽出した1つ以上の各ログエントリを上記追跡候補ログとして記憶装置に記憶する
ことを特徴とする請求項1記載のファイル追跡装置。
The file tracking device further includes:
A period input unit for inputting a processing target period having a start date and time and an end date and time for specifying a period to be processed;
The operation log storage unit stores, as the plurality of log entries, a plurality of log entries whose time stamps are included in the processing target period,
The squeezing period acquisition unit inputs a processing target date and time representing the date and time when the processing target file is generated, and from a plurality of log entries stored in the operation log storage unit, from the start date and time input by the period input unit One or more log entries having a time stamp included in the period up to the processing target date and time, having an operation command indicating an operation for saving a file, and having an operation content including the processing target file name Extracting and selecting a log entry having a time stamp closest to the end date and time from the extracted one or more log entries, obtaining the time stamp of the selected log entry as the save date and time, and the operation log storage unit Has a time stamp included in a period from the start date and time to the save date and time from a plurality of log entries stored, One or more log entries having an operation command representing an operation for opening a file and having an operation content including the file name to be processed are extracted, and the end date and time are extracted from the extracted one or more log entries. Select the log entry with the closest time stamp, get the time stamp that the selected log entry has as the open date and time,
The tracking candidate generation unit has a time stamp included in the squeezing period from a plurality of log entries stored in the operation log storage unit, and one of an operation for opening a file and an operation for closing a file One or more log entries having an operation command representing the operation and having an operation content including a similar file name similar to the processing target file name are extracted, and each of the extracted one or more log entries is tracked The file tracking apparatus according to claim 1, wherein the file tracking apparatus is stored in a storage device as a candidate log.
上記ファイル追跡装置は、さらに、
処理対象とする期間を指定する開始日時と終了日時とを有する処理対象期間を入力する期間入力部を備え、
上記操作ログ記憶部は、上記複数のログエントリとして、ログエントリが有するタイムスタンプが上記処理対象期間内である複数のログエントリを記憶し、
上記しぼり込み期間取得部は、上記処理対象ファイルを生成した日時を表す処理対象日時を入力し、上記操作ログ記憶部に記憶された複数のログエントリから、上記処理対象日時から上記期間入力部が入力した終了日時までの期間に含まれるタイムスタンプを有し、かつ、ファイルを開く操作を表す操作コマンドを有し、かつ、上記処理対象ファイル名を含む操作内容を有するログエントリを1つ以上抽出し、抽出した1つ以上のログエントリから、上記開始日時に最も近いタイムスタンプを有するログエントリを選択し、選択したログエントリが有するタイムスタンプを上記オープン日時として取得し、上記操作ログ記憶部が記憶した複数のログエントリから、上記オープン日時から上記終了日時までの期間に含まれるタイムスタンプを有し、かつ、ファイルを閉じる操作を表す操作コマンドを有し、かつ、上記処理対象ファイル名を含む操作内容を有するログエントリを1つ以上抽出し、抽出した1つ以上のログエントリから、上記開始日時に最も近いタイムスタンプを有するログエントリを選択し、選択したログエントリが有するタイムスタンプを上記クローズ日時として取得し、
上記追跡候補生成部は、上記操作ログ記憶部に記憶された複数のログエントリから、上記しぼり込み期間に含まれるタイムスタンプを有し、かつ、ファイルを記憶する操作を表す操作コマンドを有し、かつ、上記処理対象ファイル名と類似する類似ファイル名を含む操作内容を有するログエントリを1つ以上抽出し、抽出した1つ以上の各ログエントリを上記追跡候補ログとして記憶装置に記憶する
ことを特徴とする請求項2記載のファイル追跡装置。
The file tracking device further includes:
A period input unit for inputting a processing target period having a start date and time and an end date and time for specifying a period to be processed;
The operation log storage unit stores, as the plurality of log entries, a plurality of log entries whose time stamps are included in the processing target period,
The squeezing period acquisition unit inputs a processing target date and time representing the date and time when the processing target file was generated, and the period input unit starts from the processing target date and time from a plurality of log entries stored in the operation log storage unit. Extract one or more log entries that have a time stamp included in the period up to the input end date and time, have an operation command indicating an operation to open a file, and have an operation content including the file name to be processed The log entry having the time stamp closest to the start date and time is selected from the extracted one or more log entries, the time stamp of the selected log entry is acquired as the open date and time, and the operation log storage unit There is a time stamp included in the period from the open date and time to the end date and time from the stored log entries. One or more log entries having an operation command representing an operation for closing a file and having an operation content including the file name to be processed are extracted, and the start date and time are extracted from the extracted one or more log entries. Select the log entry having the time stamp closest to, and obtain the time stamp that the selected log entry has as the closing date and time,
The tracking candidate generation unit has an operation command representing an operation of storing a file, having a time stamp included in the squeezing period, from a plurality of log entries stored in the operation log storage unit, And extracting at least one log entry having an operation content including a similar file name similar to the processing target file name, and storing the extracted one or more log entries in the storage device as the tracking candidate log. 3. The file tracking apparatus according to claim 2, wherein
上記追加追跡ログ判定部は、上記しぼり込み期間取得部が入力した処理対象ファイル名が表す処理対象ファイルに記憶された情報を生成元情報として入力し、上記追跡候補情報と生成元情報とを比較して追跡候補情報の生成元情報に対する類似度を求め、求めた類似度が予め設定した類似度閾値より大きいか否か判定し、大きいことを判定した追跡候補ログを出力する
ことを特徴とする請求項1から4のいずれかに記載のファイル追跡装置。
The additional tracking log determination unit inputs, as generation source information, information stored in the processing target file indicated by the processing target file name input by the squeezing period acquisition unit, and compares the tracking candidate information with the generation source information. Then, the similarity to the generation source information of the tracking candidate information is obtained, it is determined whether or not the obtained similarity is larger than a preset similarity threshold, and a tracking candidate log determined to be larger is output. The file tracking device according to claim 1.
上記追加追跡ログ判定部は、予め設定された用語が上記追跡候補情報に含まれているか否か判定し、含まれていることを判定した追跡候補ログを出力する
ことを特徴とする請求項1から4のいずれかに記載のファイル追跡装置。
The said additional tracking log determination part determines whether the preset term is contained in the said tracking candidate information, and outputs the tracking candidate log which determined that it was contained. 5. The file tracking device according to any one of 1 to 4.
上記操作ログ記憶部は、各ログエントリが有する上記操作内容が含むファイル名として、ファイルの種類を表すログ拡張子を含むファイル名を記憶し、
上記追跡候補生成部は、上記処理対象ファイル名として、ファイルの種類を表す処理対象拡張子を含むファイル名を入力し、上記ログ拡張子と上記処理対象拡張子とが一致するか否か判定し、一致することを判定したログ拡張子を含むファイル名を上記類似ファイル名とする
ことを特徴とする請求項1から4のいずれかに記載のファイル追跡装置。
The operation log storage unit stores a file name including a log extension representing a file type as a file name included in the operation content of each log entry,
The tracking candidate generation unit inputs a file name including a processing target extension representing a file type as the processing target file name, and determines whether or not the log extension matches the processing target extension. 5. The file tracking apparatus according to claim 1, wherein a file name including a log extension determined to match is used as the similar file name.
上記ファイル追跡装置は、さらに、ファイルの種類を表す複数の拡張子の各拡張子を組み合わせた複数の組み合わせ拡張子の各組み合わせ拡張子と点数とを対応させた拡張子点数を予め記憶した拡張子点数記憶部を備え、
上記操作ログ記憶部は、各ログエントリが有する上記操作内容が含むファイル名として、ファイルの種類を表すログ拡張子を含むファイル名を記憶し、
上記追跡候補生成部は、上記処理対象ファイル名として、ファイルの種類を表す処理対象拡張子を含むファイル名を入力し、上記拡張子点数記憶部が記憶した複数の拡張子点数から、上記ログ拡張子と上記処理対象拡張子との組み合わせに対応する点数を取得し、取得した点数と予め設定した点数閾値とを比較し、取得した点数が点数閾値より大きいことを判定した場合、上記ログ拡張子を含むファイル名を上記類似ファイル名とする
ことを特徴とする請求項1から4のいずれかに記載のファイル追跡装置。
The file tracking device further stores in advance an extension score in which each combination extension of a plurality of combination extensions obtained by combining each extension of a plurality of extensions representing file types is associated with a score. With a score storage unit,
The operation log storage unit stores a file name including a log extension representing a file type as a file name included in the operation content of each log entry,
The tracking candidate generation unit inputs a file name including a processing target extension representing a file type as the processing target file name, and expands the log from a plurality of extension scores stored in the extension score storage unit. When the score corresponding to the combination of the child and the extension to be processed is acquired, the acquired score is compared with a preset score threshold, and it is determined that the acquired score is larger than the score threshold, the log extension 5. The file tracking apparatus according to claim 1, wherein a file name including the file name is the similar file name.
上記操作ログ記憶部は、上記複数のログエントリの各ログエントリとして、上記操作したファイルのサイズを表すファイルサイズを有するログエントリを記憶し、
上記しぼり込み期間取得部は、上記保存日時としたタイムスタンプを有するログエントリからファイルサイズを保存サイズとして取得し、上記オープン日時としたタイムスタンプを有するログエントリからファイルサイズをオープンサイズとして取得し、
上記追跡候補生成部は、上記追跡候補ログの抽出を行う前に、上記しぼり込み期間取得部が取得した保存サイズとオープンサイズとのサイズ差を求め、上記保存日時と上記オープン日時との日時差を求め、求めた日時差に対する上記サイズ差の比が予め設定した比閾値以上か否か判定し、比閾値以上であることを判定した場合、上記追跡候補ログの抽出を行う
ことを特徴とする請求項1または3記載のファイル追跡装置。
The operation log storage unit stores a log entry having a file size representing the size of the operated file as each log entry of the plurality of log entries,
The squeezing period acquisition unit acquires a file size as a storage size from a log entry having a time stamp as the storage date and time, acquires a file size as an open size from a log entry having the time stamp as the open date and time,
The tracking candidate generation unit obtains a size difference between the storage size and the open size acquired by the squeezing period acquisition unit before extracting the tracking candidate log, and calculates a date difference between the storage date and time and the open date and time. It is determined whether the ratio of the size difference to the calculated date difference is equal to or greater than a preset ratio threshold, and if it is determined that the ratio is equal to or greater than the ratio threshold, the tracking candidate log is extracted. The file tracking device according to claim 1 or 3.
上記操作ログ記憶部は、上記複数のログエントリの各ログエントリとして、上記操作したファイルのサイズを表すファイルサイズを有するログエントリを記憶し、
上記追跡候補生成部は、上記類似ファイル名を有するログエントリを類似ログエントリとし、当該類似ログエントリが有するファイルサイズを保存サイズとして取得するとともに、タイムスタンプを保存日時として取得し、取得した保存日時よりも古いタイムスタンプを有し、かつ、上記類似ファイル名のファイルを開くとの操作を行ったことを表すログエントリを、上記操作ログ記憶部が記憶した複数のログエントリからログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて抽出し、抽出したログエントリが有するファイルサイズを類似オープンサイズとして取得するとともに、タイムスタンプを類似オープン日時として取得し、上記保存サイズと上記類似オープンサイズとのサイズ差を求め、上記保存日時と上記類似オープン日時との日時差を求め、求めた日時差に対する上記サイズ差の比が予め設定した比閾値以上か否か判定し、比閾値以上であることを判定した場合、上記類似ログエントリを上記追跡候補ログとして記憶装置に記憶する
ことを特徴とする請求項2または4記載のファイル追跡装置。
The operation log storage unit stores a log entry having a file size representing the size of the operated file as each log entry of the plurality of log entries,
The tracking candidate generation unit sets a log entry having the similar file name as a similar log entry, acquires a file size of the similar log entry as a storage size, acquires a time stamp as a storage date and time, and acquires the acquired storage date and time. A log entry having a log entry indicating that an operation for opening a file with a similar file name having an older time stamp is performed from a plurality of log entries stored in the operation log storage unit. Extract using the stamp, operation command, and operation content, acquire the file size of the extracted log entry as a similar open size, acquire the time stamp as a similar open date, and store the saved size and the similar open size The size difference between Determine the date / time difference from the open date / time, determine whether the ratio of the size difference to the calculated date / time difference is greater than or equal to a preset ratio threshold, and if it is determined that the ratio is greater than or equal to the ratio threshold, track the similar log entry 5. The file tracking apparatus according to claim 2, wherein the file tracking apparatus stores the candidate log in a storage device.
上記追跡候補生成部は、上記類似ファイル名を有するログエントリを類似ログエントリとし、上記操作ログ記憶部が記憶した複数のログエントリの中に、上記しぼり込み期間に、上記類似ファイル名のファイルを記憶するとの操作を行ったことを表すログエントリがあるか否か、ログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて判定し、ないことを判定した場合、上記類似ログエントリを上記追跡候補ログとして記憶装置に記憶する
ことを特徴とする請求項1または3記載のファイル追跡装置。
The tracking candidate generation unit sets a log entry having the similar file name as a similar log entry, and the file having the similar file name is stored in the log-in period in the plurality of log entries stored in the operation log storage unit. Whether or not there is a log entry indicating that an operation to store is performed is determined by using a time stamp, an operation command, and an operation content of the log entry. 4. The file tracking device according to claim 1, wherein the file tracking device is stored in a storage device as a tracking candidate log.
上記追跡候補生成部は、上記追跡候補ログの抽出を行う前に、上記操作ログ記憶部が記憶した複数のログエントリの中に、上記しぼり込み期間に、上記処理対象ファイル名のファイルを記憶するとの操作を行ったことを表すログエントリがあるか否か、ログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて判定し、ないことを判定した場合、上記追跡候補ログの抽出を行う
ことを特徴とする請求項2または4記載のファイル追跡装置。
The tracking candidate generation unit stores the file with the processing target file name in the squeezing period in the plurality of log entries stored in the operation log storage unit before extracting the tracking candidate log. Whether or not there is a log entry indicating that the above operation has been performed is determined using the time stamp, the operation command, and the operation content of the log entry. If it is determined that there is no log entry, the tracking candidate log is extracted. 5. The file tracking device according to claim 2, wherein the file tracking device is a file tracking device.
上記追跡候補生成部は、上記類似ファイル名を有するログエントリを類似ログエントリとし、上記操作ログ記憶部が記憶した複数のログエントリの中に、上記保存日時の後に、上記類似ファイル名のファイルを削除するとの操作を行ったことを表すログエントリがあるか否か、ログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて判定し、あることを判定した場合、上記類似ログエントリを上記追跡候補ログとして記憶装置に記憶し、
上記追加追跡ログ判定部は、上記類似ファイルが削除されてアクセスできない場合、上記追跡候補ログを上記追加追跡ログとして上記追加追跡ログ記憶部に記憶する
ことを特徴とする請求項1または3記載のファイル追跡装置。
The tracking candidate generation unit sets a log entry having the similar file name as a similar log entry, and stores the file with the similar file name after the storage date and time in the plurality of log entries stored by the operation log storage unit. It is determined whether or not there is a log entry indicating that an operation to be deleted is performed using a time stamp, an operation command, and an operation content of the log entry. Store it in the storage device as a tracking candidate log,
The said additional tracking log determination part stores the said tracking candidate log in the said additional tracking log memory | storage part as said additional tracking log when the said similar file is deleted and cannot be accessed. File tracking device.
上記追跡候補生成部は、上記類似ファイル名を有するログエントリを類似ログエントリとし、上記操作ログ記憶部が記憶した複数のログエントリの中に、上記クローズ日時の後に、上記類似ファイル名のファイルを削除するとの操作を行ったことを表すログエントリがあるか否か、ログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて判定し、あることを判定した場合、上記類似ログエントリを上記追跡候補ログとして記憶装置に記憶し、
上記追加追跡ログ判定部は、上記類似ファイルが削除されてアクセスできない場合、上記追跡候補ログを上記追加追跡ログとして上記追加追跡ログ記憶部に記憶する
ことを特徴とする請求項2または4記載のファイル追跡装置。
The tracking candidate generation unit sets a log entry having the similar file name as a similar log entry, and adds a file having the similar file name after the closing date and time among the plurality of log entries stored by the operation log storage unit. It is determined whether or not there is a log entry indicating that an operation to be deleted is performed using a time stamp, an operation command, and an operation content of the log entry. Store it in the storage device as a tracking candidate log,
5. The additional tracking log determination unit, when the similar file is deleted and cannot be accessed, stores the tracking candidate log as the additional tracking log in the additional tracking log storage unit. File tracking device.
上記操作ログ記憶部は、上記複数のログエントリの各ログエントリとして、上記操作したファイルのサイズを表すファイルサイズを有するログエントリを記憶し、
上記追跡候補生成部は、上記類似ファイル名を有するログエントリを類似ログエントリとし、当該類似ログエントリが有するファイルサイズを保存サイズとして取得し、取得した保存サイズが予め設定したサイズ閾値以上であるか否か判定し、サイズ閾値以上であることを判定した場合、上記類似ログエントリを上記追跡候補ログとして記憶装置に記憶する
ことを特徴とする請求項1から4いずれかに記載のファイル追跡装置。
The operation log storage unit stores a log entry having a file size representing the size of the operated file as each log entry of the plurality of log entries,
The tracking candidate generation unit acquires a log entry having the similar file name as a similar log entry, acquires the file size of the similar log entry as a storage size, and whether the acquired storage size is equal to or larger than a preset size threshold value. The file tracking apparatus according to claim 1, wherein if it is determined whether or not the size is equal to or larger than a size threshold value, the similar log entry is stored in the storage apparatus as the tracking candidate log.
処理装置と、操作コマンドと、操作したファイルのファイル名を含む操作内容と、操作が行われた日時を表すタイムスタンプとを有するログエントリを複数記憶した操作ログ記憶部とを備え、処理対象ファイルを生成した元のファイルを、複数のログエントリを追跡して推定するファイル追跡装置におけるファイル追跡方法であって、
処理装置がしぼり込み期間取得部により、上記処理対象ファイルの処理対象ファイル名を入力し、上記操作ログ記憶部に記憶された複数のログエントリからログエントリが有する操作コマンドと操作内容とを用いて、上記処理対象ファイルを保存する操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプを保存日時として取得するとともに、取得した保存日時までに、上記処理対象ファイルを開く操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをオープン日時として取得し、取得したオープン日時と上記保存日時とを有するしぼり込み期間を出力するしぼり込み期間取得工程と、
処理装置が追跡候生成部により、上記しぼり込み期間取得工程により出力したしぼり込み期間を入力し、上記操作ログ記憶部が記憶した複数のログエントリからログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて、入力したしぼり込み期間に、上記処理対象ファイル名と類似する類似ファイル名のファイルを開く操作と閉じる操作とのいずれかの操作を行ったことを表すログエントリを1つ以上抽出し、抽出した1つ以上の各ログエントリを追跡候補ログとして記憶装置に記憶する追跡候補生成工程と、
処理装置が追加追跡ログ判定部により、上記追跡候補生成工程により記憶装置に記憶した追跡候補ログを順次入力し、入力した追跡候補ログが有する操作内容に含まれた類似ファイル名が表すファイルに記憶された情報を追跡候補情報として入力し、上記類似ファイル名の類似ファイルを生成した元のファイルを複数のログエントリを追跡して推定するか否かを、入力した追跡候補情報を用いて判定し、推定することを判定した追跡候補ログを追加追跡ログとして出力する追加追跡ログ判定工程と、
処理装置が追跡部により、上記追加追跡ログ判定工程により出力された追加追跡ログが有する操作内容に含まれた上記類似ファイル名を入力し、入力した類似ファイル名の類似ファイルを生成した元のファイルを、上記処理対象ファイルを生成した元のファイルとして、複数のログエントリを追跡して推定する追跡工程と
を備えることを特徴とするファイル追跡方法。
A processing target file comprising a processing device, an operation command, an operation log storage unit that stores a plurality of log entries each including an operation content including a file name of the operated file, and a time stamp indicating the date and time when the operation was performed A file tracking method in a file tracking device that estimates an original file generated by tracking a plurality of log entries,
The processing device inputs the processing target file name of the processing target file by the squeezing period acquisition unit, and uses the operation command and the operation content of the log entry from the plurality of log entries stored in the operation log storage unit. The log entry indicating that the operation for saving the processing target file is performed is extracted, the time stamp of the extracted log entry is acquired as the storage date and time, and the processing target file is opened by the acquired storage date and time. A squeezing period acquisition step of extracting a log entry indicating that an operation has been performed, acquiring a time stamp of the extracted log entry as an open date and time, and outputting a squeezing period having the acquired open date and time and the storage date and time When,
The processing device inputs the squeezing period output by the tracking squeeze period acquisition step by the tracking candidate generation unit, and the time stamp, operation command, and operation content of the log entry from the plurality of log entries stored in the operation log storage unit Are used to extract one or more log entries indicating that either an operation of opening or closing a file with a similar file name similar to the processing target file name was performed during the input squeezing period. A tracking candidate generation step of storing the extracted one or more log entries in the storage device as a tracking candidate log;
The processing device sequentially inputs the tracking candidate log stored in the storage device by the additional tracking log determination unit by the additional tracking log determination unit, and stores it in the file represented by the similar file name included in the operation content of the input tracking candidate log. The input information is input as tracking candidate information, and it is determined by using the input tracking candidate information whether the original file that generated the similar file with the similar file name is estimated by tracking a plurality of log entries. An additional tracking log determination step for outputting the tracking candidate log determined to be estimated as an additional tracking log;
The original file in which the processing device inputs the similar file name included in the operation content of the additional tracking log output by the additional tracking log determination step by the tracking unit, and generates a similar file with the input similar file name And a tracking step of tracking and estimating a plurality of log entries as the original file that generated the processing target file.
処理装置と、操作コマンドと、操作したファイルのファイル名を含む操作内容と、操作が行われた日時を表すタイムスタンプとを有するログエントリを複数記憶した操作ログ記憶部とを備え、処理対象ファイルを元のファイルとして生成した別の新たなファイルを、複数のログエントリを追跡して推定するファイル追跡装置におけるファイル追跡方法であって、
処理装置がしぼり込み期間取得部により、上記処理対象ファイルの処理対象ファイル名を入力し、上記操作ログ記憶部に記憶された複数のログエントリからログエントリが有する操作コマンドと操作内容とを用いて、上記処理対象ファイルを開く操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをオープン日時として取得するとともに、取得したオープン日時以降に、上記処理対象ファイルを閉じる操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをクローズ日時として取得し、取得したオープン日時と上記クローズ日時とを有するしぼり込み期間を出力するしぼり込み期間取得工程と、
処理装置が追跡候補生成部により、上記しぼり込み期間取得工程により出力したしぼり込み期間を入力し、上記操作ログ記憶部が記憶した複数のログエントリからログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて、入力したしぼり込み期間に、上記処理対象ファイル名と類似する類似ファイル名のファイルを記憶するとの操作を行ったことを表すログエントリを1つ以上抽出し、抽出した1つ以上の各ログエントリを追跡候補ログとして記憶装置に記憶する追跡候補生成工程と、
処理装置が使追跡ログ判定部により、上記追跡候補生成工程により記憶装置に記憶した追跡候補ログを順次入力し、入力した追跡候補ログが有する操作内容に含まれた類似ファイル名が表すファイルに記憶された情報を追跡候補情報として入力し、上記類似ファイル名の類似ファイルから生成した別の新たなファイルを複数のログエントリを追跡して推定するか否かを、入力した追跡候補情報を用いて判定し、推定することを判定した追跡候補ログを追加候補ログとして出力する追加追跡ログ判定工程と、
処理装置が追跡部により、上記追加追跡ログ判定工程により出力された追加候補ログが有する操作内容に含まれた上記類似ファイル名を入力し、入力した類似ファイル名の類似ファイルから生成した別の新たなファイルを、上記処理対象ファイルを元のファイルとして生成した別の新たなファイルとして、複数のログエントリを追跡して推定する追跡工程と
を備えることを特徴とするファイル追跡方法。
A processing target file comprising a processing device, an operation command, an operation log storage unit that stores a plurality of log entries each including an operation content including a file name of the operated file, and a time stamp indicating the date and time when the operation was performed A file tracking method in a file tracking device that estimates another new file generated as an original file by tracking a plurality of log entries,
The processing device inputs the processing target file name of the processing target file by the squeezing period acquisition unit, and uses the operation command and the operation content of the log entry from the plurality of log entries stored in the operation log storage unit. , Extracting a log entry indicating that an operation for opening the processing target file has been performed, obtaining a time stamp of the extracted log entry as an open date, and closing the processing target file after the acquired open date A log entry indicating that the log entry is performed, obtaining a time stamp of the extracted log entry as a closed date and time, and outputting a squeezed period having the obtained open date and time and the closed date and time; ,
The processing device inputs the squeezing period output in the squeezing period acquisition step by the tracking candidate generation unit, and the time stamp, operation command, and operation content of the log entry from the plurality of log entries stored in the operation log storage unit Are used to extract one or more log entries indicating that an operation for storing a file with a similar file name similar to the processing target file name is performed during the input squeezing period, and one or more extracted log entries A tracking candidate generation step of storing each log entry in the storage device as a tracking candidate log;
The processing device sequentially inputs the tracking candidate log stored in the storage device by the use tracking log determination unit by the use tracking log determination unit, and stores it in the file represented by the similar file name included in the operation content of the input tracking candidate log. Whether or not to estimate another new file generated from the similar file with the similar file name by tracking a plurality of log entries using the input tracking candidate information. An additional tracking log determination step of outputting the tracking candidate log determined to be determined and estimated as an additional candidate log;
The processing unit inputs the similar file name included in the operation content of the additional candidate log output by the additional tracking log determination step by the tracking unit, and generates another new file generated from the similar file with the input similar file name. A file tracking method comprising: a tracking step of tracking and estimating a plurality of log entries as another new file generated from the processing target file as an original file.
処理装置と、操作コマンドと、操作したファイルのファイル名を含む操作内容と、操作が行われた日時を表すタイムスタンプとを有するログエントリを複数記憶した操作ログ記憶部とを備え、処理対象ファイルを生成した元のファイルを、複数のログエントリを追跡して推定する処理をコンピュータに実行させるファイル追跡プログラムであって、
処理装置が、上記処理対象ファイルの処理対象ファイル名を入力し、上記操作ログ記憶部に記憶された複数のログエントリからログエントリが有する操作コマンドと操作内容とを用いて、上記処理対象ファイルを保存する操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプを保存日時として取得するとともに、取得した保存日時までに、上記処理対象ファイルを開く操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをオープン日時として取得し、取得したオープン日時と上記保存日時とを有するしぼり込み期間を出力するしぼり込み期間取得処理と、
処理装置が、上記しぼり込み期間取得処理により出力したしぼり込み期間を入力し、上記操作ログ記憶部が記憶した複数のログエントリからログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて、入力したしぼり込み期間に、上記処理対象ファイル名と類似する類似ファイル名のファイルを開く操作と閉じる操作とのいずれかの操作を行ったことを表すログエントリを1つ以上抽出し、抽出した1つ以上の各ログエントリを追跡候補ログとして記憶装置に記憶する追跡候補生成処理と、
処理装置が、上記追跡候補生成処理により記憶装置に記憶した追跡候補ログを順次入力し、入力した追跡候補ログが有する操作内容に含まれた類似ファイル名が表すファイルに記憶された情報を追跡候補情報として入力し、上記類似ファイル名の類似ファイルを生成した元のファイルを複数のログエントリを追跡して推定するか否かを、入力した追跡候補情報を用いて判定し、推定することを判定した追跡候補ログを追加追跡ログとして出力する追加追跡ログ判定処理と、
処理装置が、上記追加追跡ログ判定処理により出力された追加追跡ログが有する操作内容に含まれた上記類似ファイル名を、上記処理対象ファイル名として入力し、入力した類似ファイル名の類似ファイルを作成した元のファイルを、上記処理対象ファイルを生成した元のファイルとして、複数のログエントリを追跡して推定する追跡処理と
をコンピュータに実行させることを特徴とするファイル追跡プログラム。
A processing target file comprising a processing device, an operation command, an operation log storage unit that stores a plurality of log entries each including an operation content including a file name of the operated file, and a time stamp indicating the date and time when the operation was performed Is a file tracking program that causes a computer to execute a process of tracking and estimating a plurality of log entries.
The processing device inputs the processing target file name of the processing target file, and uses the operation command and the operation content of the log entry from the plurality of log entries stored in the operation log storage unit to store the processing target file. A log entry indicating that a save operation has been performed is extracted, the time stamp of the extracted log entry is acquired as the save date and time, and the operation to open the processing target file is performed by the acquired save date and time. A log entry representing, extracting a time stamp of the extracted log entry as an open date and time, and outputting a squeeze period having the acquired open date and the save date and time;
The processing device inputs the squeezing period output by the squeezing period acquisition process, and uses the time stamp, operation command, and operation content of the log entry from the plurality of log entries stored in the operation log storage unit, One or more log entries indicating that either an operation of opening or closing a file having a similar file name similar to the processing target file name is performed during the input squeezing period are extracted, and the extracted 1 A tracking candidate generation process for storing two or more log entries in the storage device as a tracking candidate log;
The processing device sequentially inputs the tracking candidate log stored in the storage device by the tracking candidate generation process, and the information stored in the file represented by the similar file name included in the operation content of the input tracking candidate log is the tracking candidate. Whether to estimate the original file that generated the similar file with the similar file name by tracking multiple log entries using the input tracking candidate information, and determining to estimate Additional tracking log judgment processing for outputting the tracking candidate log as an additional tracking log,
The processing device inputs the similar file name included in the operation content of the additional tracking log output by the additional tracking log determination process as the processing target file name, and creates a similar file with the input similar file name A file tracking program that causes a computer to perform tracking processing for tracking and estimating a plurality of log entries, using the original file as the original file that generated the processing target file.
処理装置と、操作コマンドと、操作したファイルのファイル名を含む操作内容と、操作が行われた日時を表すタイムスタンプとを有するログエントリを複数記憶した操作ログ記憶部とを備え、処理対象ファイルを元のファイルとして生成した別の新たなファイルを、複数のログエントリを追跡して推定する処理をコンピュータに実行させるファイル追跡プログラムであって、
処理装置が、上記処理対象ファイルの処理対象ファイル名を入力し、上記操作ログ記憶部に記憶された複数のログエントリからログエントリが有する操作コマンドと操作内容とを用いて、上記処理対象ファイルを開く操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをオープン日時として取得するとともに、取得したオープン日時以降に、上記処理対象ファイルを閉じる操作を行ったことを表すログエントリを抽出し、抽出したログエントリが有するタイムスタンプをクローズ日時として取得し、取得したオープン日時と上記クローズ日時とを有するしぼり込み期間を出力するしぼり込み期間取得処理と、
処理装置が、上記しぼり込み期間取得処理により出力したしぼり込み期間を入力し、上記操作ログ記憶部が記憶した複数のログエントリからログエントリが有するタイムスタンプと操作コマンドと操作内容とを用いて、入力したしぼり込み期間に、上記処理対象ファイル名と類似する類似ファイル名のファイルを記憶するとの操作を行ったことを表すログエントリを1つ以上抽出し、抽出した1つ以上の各ログエントリを追跡候補ログとして記憶装置に記憶する追跡候補生成処理と、
処理装置が、上記追跡候補生成処理により記憶装置に記憶した追跡候補ログを順次入力し、入力した追跡候補ログが有する操作内容に含まれた類似ファイル名が表すファイルに記憶された情報を追跡候補情報として入力し、上記類似ファイル名の類似ファイルから生成した別の新たなファイルを複数のログエントリを追跡して推定するか否かを、入力した追跡候補情報を用いて判定し、推定することを判定した追跡候補ログを追加候補ログとして出力する追加追跡ログ判定処理と、
処理装置が、上記追加追跡ログ判定処理により出力された追加候補ログが有する操作内容に含まれた上記類似ファイル名を入力し、入力した類似ファイル名の類似ファイルから生成した別の新たなファイルを、上記処理対象ファイルから生成した別の新たなファイルとして、複数のログエントリを追跡して推定する追跡処理と
をコンピュータに実行させることを特徴とするファイル追跡プログラム。
A processing target file comprising a processing device, an operation command, an operation log storage unit that stores a plurality of log entries each including an operation content including a file name of the operated file, and a time stamp indicating the date and time when the operation was performed Is a file tracking program that causes a computer to execute processing to estimate another new file generated as an original file by tracking a plurality of log entries,
The processing device inputs the processing target file name of the processing target file, and uses the operation command and the operation content of the log entry from the plurality of log entries stored in the operation log storage unit to store the processing target file. Indicates that a log entry indicating that an open operation has been performed is extracted, the time stamp of the extracted log entry is acquired as an open date, and that the operation target file is closed after the acquired open date A log period acquisition process that extracts a log entry, acquires a time stamp of the extracted log entry as a close date, and outputs a squeeze period having the acquired open date and the above close date;
The processing device inputs the squeezing period output by the squeezing period acquisition process, and uses the time stamp, operation command, and operation content of the log entry from the plurality of log entries stored in the operation log storage unit, One or more log entries representing that an operation for storing a file having a similar file name similar to the processing target file name is extracted during the input squeezing period, and the one or more extracted log entries are A tracking candidate generation process to be stored in a storage device as a tracking candidate log;
The processing device sequentially inputs the tracking candidate log stored in the storage device by the tracking candidate generation process, and the information stored in the file represented by the similar file name included in the operation content of the input tracking candidate log is the tracking candidate. Whether or not to estimate another new file generated from a similar file with the same file name as information by tracking a plurality of log entries and using the input tracking candidate information An additional tracking log determination process that outputs the tracking candidate log that has been determined as an additional candidate log;
The processing device inputs the similar file name included in the operation content of the additional candidate log output by the additional tracking log determination process, and creates another new file generated from the similar file with the input similar file name. A file tracking program for causing a computer to execute tracking processing for tracking and estimating a plurality of log entries as another new file generated from the processing target file.
JP2011037818A 2011-02-24 2011-02-24 File tracking apparatus, file tracking method, and file tracking program Expired - Fee Related JP5701096B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011037818A JP5701096B2 (en) 2011-02-24 2011-02-24 File tracking apparatus, file tracking method, and file tracking program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011037818A JP5701096B2 (en) 2011-02-24 2011-02-24 File tracking apparatus, file tracking method, and file tracking program

Publications (2)

Publication Number Publication Date
JP2012174151A true JP2012174151A (en) 2012-09-10
JP5701096B2 JP5701096B2 (en) 2015-04-15

Family

ID=46976975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011037818A Expired - Fee Related JP5701096B2 (en) 2011-02-24 2011-02-24 File tracking apparatus, file tracking method, and file tracking program

Country Status (1)

Country Link
JP (1) JP5701096B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014056285A (en) * 2012-09-11 2014-03-27 Nippon Telegr & Teleph Corp <Ntt> Copy tracking system
JP2015162085A (en) * 2014-02-27 2015-09-07 西日本電信電話株式会社 Tracking system, tracking method, mail terminal, mail server, log output method, and computer program
JP2017168030A (en) * 2016-03-18 2017-09-21 日本電気株式会社 History analyzer, history analysis method, history analysis system, and program
KR101977008B1 (en) * 2019-01-07 2019-05-09 동양대학교 산학협력단 Data hiding method using timestamp information capable of correcting time distortion
KR20210017839A (en) * 2019-08-09 2021-02-17 한국디지털포렌식센터 주식회사 Automated system for forming analyzed data by extracting original data
KR20210104525A (en) * 2020-02-17 2021-08-25 한국디지털포렌식센터 주식회사 System for reporting of digital evidence by sorting data collection from object disk
CN115004159A (en) * 2020-02-06 2022-09-02 三菱电机株式会社 Setting change device, setting change method, and setting change program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003308236A (en) * 2002-04-18 2003-10-31 Casio Comput Co Ltd File processor and program
JP2006516775A (en) * 2003-01-23 2006-07-06 ヴァーダシス・インコーポレーテッド Identifying similarity and revision history in large unstructured data sets
JP2008146192A (en) * 2006-12-07 2008-06-26 Hitachi Software Eng Co Ltd File circulation path tracing system
JP2010160698A (en) * 2009-01-08 2010-07-22 Hitachi Ltd History management system, and history management server and method for managing history

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003308236A (en) * 2002-04-18 2003-10-31 Casio Comput Co Ltd File processor and program
JP2006516775A (en) * 2003-01-23 2006-07-06 ヴァーダシス・インコーポレーテッド Identifying similarity and revision history in large unstructured data sets
JP2008146192A (en) * 2006-12-07 2008-06-26 Hitachi Software Eng Co Ltd File circulation path tracing system
JP2010160698A (en) * 2009-01-08 2010-07-22 Hitachi Ltd History management system, and history management server and method for managing history

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014056285A (en) * 2012-09-11 2014-03-27 Nippon Telegr & Teleph Corp <Ntt> Copy tracking system
JP2015162085A (en) * 2014-02-27 2015-09-07 西日本電信電話株式会社 Tracking system, tracking method, mail terminal, mail server, log output method, and computer program
JP2017168030A (en) * 2016-03-18 2017-09-21 日本電気株式会社 History analyzer, history analysis method, history analysis system, and program
KR101977008B1 (en) * 2019-01-07 2019-05-09 동양대학교 산학협력단 Data hiding method using timestamp information capable of correcting time distortion
KR20210017839A (en) * 2019-08-09 2021-02-17 한국디지털포렌식센터 주식회사 Automated system for forming analyzed data by extracting original data
KR102294926B1 (en) 2019-08-09 2021-08-27 한국디지털포렌식센터 주식회사 Automated system for forming analyzed data by extracting original data
CN115004159A (en) * 2020-02-06 2022-09-02 三菱电机株式会社 Setting change device, setting change method, and setting change program
KR20210104525A (en) * 2020-02-17 2021-08-25 한국디지털포렌식센터 주식회사 System for reporting of digital evidence by sorting data collection from object disk
KR102432530B1 (en) 2020-02-17 2022-08-16 한국디지털포렌식센터 주식회사 System for reporting of digital evidence by sorting data collection from object disk

Also Published As

Publication number Publication date
JP5701096B2 (en) 2015-04-15

Similar Documents

Publication Publication Date Title
JP5701096B2 (en) File tracking apparatus, file tracking method, and file tracking program
US10326792B2 (en) Virus intrusion route identification device, virus intrusion route identification method, and program
US20150033331A1 (en) System and method for webpage analysis
US20130275433A1 (en) Classification rule generation device, classification rule generation method, classification rule generation program, and recording medium
WO2012112944A2 (en) Managing unwanted communications using template generation and fingerprint comparison features
US20140075364A1 (en) Capturing Activity History Stream
US8752204B2 (en) Identifying and redacting privileged information
CN106445476B (en) Code change information determination method and device and electronic equipment
CN113486350B (en) Method, device, equipment and storage medium for identifying malicious software
CN115766184A (en) Webpage data processing method and device, electronic equipment and storage medium
US7505903B2 (en) Speech recognition dictionary creation method and speech recognition dictionary creating device
JP2010049473A (en) Link information extraction device, link information extraction method, and program
EP3009942A1 (en) Social contact message monitoring method and device
Michalas et al. MemTri: A memory forensics triage tool using bayesian network and volatility
CN109977423B (en) Method and device for processing word, electronic equipment and readable storage medium
CN116071133A (en) Cross-border electronic commerce environment analysis method and system based on big data and computing equipment
JP5055202B2 (en) Keyword comparison system, keyword comparison method, and keyword comparison program
WO2011048672A1 (en) Data processing device, data processing method, and program
JP2022518659A (en) Exploit kit detection
US8775528B2 (en) Computer readable recording medium storing linking keyword automatically extracting program, linking keyword automatically extracting method and apparatus
CN115310082A (en) Information processing method, information processing device, electronic equipment and storage medium
Joo et al. A reference database of Windows artifacts for file‐wiping tool execution analysis
US11698889B2 (en) Method, electronic device, and computer program product for processing data
Vasilaras et al. Android Device Incident Response: Viber Analysis
WO2010067566A1 (en) Device for analyzing time series data, method of analyzing time series data, and computer-readable storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140925

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150217

R150 Certificate of patent or registration of utility model

Ref document number: 5701096

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees