JP2011238165A - 計算機システム及びメタデータ管理サーバ - Google Patents

計算機システム及びメタデータ管理サーバ Download PDF

Info

Publication number
JP2011238165A
JP2011238165A JP2010111063A JP2010111063A JP2011238165A JP 2011238165 A JP2011238165 A JP 2011238165A JP 2010111063 A JP2010111063 A JP 2010111063A JP 2010111063 A JP2010111063 A JP 2010111063A JP 2011238165 A JP2011238165 A JP 2011238165A
Authority
JP
Japan
Prior art keywords
metadata
file
history
event
management server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010111063A
Other languages
English (en)
Inventor
Susumu Serita
進 芹田
Yasuhiro Fujii
康広 藤井
Hiromi Hashimoto
宏美 橋本
Yoshinori Honda
義則 本多
Tatsunoshin Kawaguchi
龍之進 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2010111063A priority Critical patent/JP2011238165A/ja
Publication of JP2011238165A publication Critical patent/JP2011238165A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】派生したファイルのメタデータを効率的に管理する。
【解決手段】本発明は、メタデータ管理サーバ及び来歴を管理する来歴管理サーバを備える計算機システムにおいて、前記各サーバは、前記ファイルを保持するクライアント計算機と接続されており、前記メタデータ管理サーバは、前記クライアント計算機に保持されるファイルのメタデータが変更されたイベントを検出し、前記検出されたイベントに関係する来歴の検索を前記来歴管理サーバに要求し、前記来歴管理サーバから送信された来歴の検索結果に基づいて、前記メタデータが変更された第1ファイルから派生した派生先の第2ファイル、及び当該第1ファイルを派生した派生元の第3ファイルを抽出し、前記抽出された第2ファイル及び第3ファイルのうち、前記メタデータを更新すべきファイルを特定し、前記特定されたファイルのメタデータを更新するためのメタデータ更新要求を生成する。
【選択図】図1

Description

本発明は,電子ファイルのメタデータを管理する技術に関する。
官民共に機密情報の適切な取扱いが強く求められているにもかかわらず、依然として機密情報の漏えい事件・事故が問題となっている。
情報漏洩対策では、情報を取り扱うユーザが、管理されている個人情報及び他者情報などの機密情報を的確に識別できる必要がある。電子ファイル(以下、「ファイル」という)形式の機密情報を識別する手段として、文書管理システム、ファイルシステムなどを利用し、機密レベルなどの機密情報を表す情報をファイルのメタデータとしてファイルと関連付けて管理するという方法が知られている。しかし、一般にメタデータを付与する作業は、情報を取り扱うユーザによる機密レベルの判定などを含むため、手間がかかることが多い。
このような課題に対して、特許文献1、2では、セキュリティ情報を表すメタデータが設定されていないファイルに、当該ファイルと類似するファイルのメタデータを付与することによって、メタデータの付与を効率化している。
特開2006−185153号公報 特開2009−230427号公報
前述した特許文献1、2で開示されている技術では、メタデータの付与を効率化できるが、複製や編集を経て派生したファイルが組織内に散在している場合、それら派生したファイルのメタデータも変更する方法は開示されていない。
本発明は、派生したファイルのメタデータを効率的に管理することを目的とする。
本発明の代表的な一例を示せば以下の通りである。すなわち、ファイルのメタデータを管理する計算機システムにおいて、前記計算機システムは、前記ファイルのメタデータを管理するメタデータ管理サーバ、及び、前記ファイルの操作のログの来歴を管理する来歴管理サーバを備え、前記メタデータ管理サーバ及び前記来歴管理サーバは、前記ファイルを保持するクライアント計算機と接続されており、前記来歴管理サーバは、前記クライアント計算機による前記ファイルの内容又は格納場所に変化が生じるイベントを収集し、前記収集されたイベントの情報を来歴として蓄積し、前記メタデータ管理サーバは、前記クライアント計算機に保持されるファイルのメタデータが変更されたイベントを検出し、前記検出されたイベントに関係する来歴の検索を前記来歴管理サーバに要求し、前記来歴管理サーバは、前記メタデータ管理サーバからの要求に基づいて、管理されている来歴を検索し、前記来歴の検索結果を前記メタデータ管理サーバに送信し、前記メタデータ管理サーバは、前記来歴管理サーバから送信された来歴の検索結果を受信し、前記受信した来歴の検索結果に基づいて、前記メタデータが変更された第1ファイルから派生した派生先の第2ファイル、及び当該第1ファイルを派生した派生元の第3ファイルを抽出し、前記抽出された派生先の第2ファイル及び派生元の第3ファイルのうち、前記メタデータを更新すべきファイルを特定し、前記特定されたファイルのメタデータを更新するためのメタデータ更新要求を生成し、前記生成されたメタデータ更新要求を前記クライアントに送信することを特徴とする。
本発明の実施の形態によると、組織内に散在している機密文書の管理を効率化できる。
本発明の実施形態の計算機システムの構成例を示す図である。 本発明の実施形態のメタデータ管理サーバの構成のブロック図である。 本発明の実施形態でファイルをコピーした操作のログの一例を示す説明図である。 本発明の実施形態でファイルを圧縮した操作のログの一例を示す説明図である。 本発明の実施形態で可搬記録媒体が関係する操作のログの一例を示す説明図である。 本発明の実施形態で外部ホストが関係する操作のログの一例を示す説明図である。 本発明の実施形態でメールの添付ファイルを保存する操作のログの一例を示す説明図である。 本発明の実施形態でネットワーク経由でファイルをコピーする操作のログの一例を示す説明図である。 本発明の実施形態で編集されたファイルを上書保存した操作のログの一例を示す説明図である。 本発明の実施形態で編集されたファイルを別名で保存した操作のログの一例を示す説明図である。 本発明の実施形態でファイルを削除した操作のログの一例を示す説明図である。 本発明の実施形態でファイルを印刷した操作のログの一例を示す説明図である。 本発明の実施形態でファイルが添付されたメールを送受信したログを示す説明図である。 本発明の実施形態の来歴検索クエリの一例を示す説明図である。 本発明の実施形態の来歴検索結果の一例を示す説明図である。 本発明の実施形態のメタデータ変更イベントの一例を示す説明図である。 本発明の実施形態のメタデータ変更イベント選択ルールの一例を示す説明図である。 本発明の実施形態の派生先に適用されるルールの一例を示す説明図である。 本発明の実施形態の派生元に適用されるルールの一例を示す説明図である。 本発明の実施形態のメタデータ更新クエリの一例を示す説明図である。 本発明の実施形態のメタデータ管理処理のフローチャートである。 本発明の実施形態の派生先の来歴に対するメタデータ更新クエリ生成処理のフローチャートである。 本発明の実施形態の派生元の来歴に対するメタデータ更新クエリ生成処理のフローチャートである。 本発明の実施形態のメタデータ更新処理のフローチャートである。
以下、本発明のメタデータ管理システムを実施するための形態について、適宜図面を参照して、説明する。
<システム構成>
まず、本発明の実施形態の概要を説明する。
図1は、本発明の実施形態に係る計算機システムの構成例を示す図である。
図1に示すように、本実施形態の計算機システムは、メタデータ管理サーバ130及び来歴管理サーバ140を備える。本計算機システムは、メールサーバ120を備えてもよい。これらの装置はネットワーク101を介して相互に接続されている。また、ネットワーク101には、クライアント110が接続されている。図1には、1台のクライアント110を図示したが、複数のクライアント110がネットワーク101に接続されてもよい。
ネットワーク101に接続される各装置は、少なくともプロセッサ(Central Processing Unit)及びメモリを備えたコンピュータであり、プロセッサがメモリに格納されたプログラムを実行することによって、その機能を発揮する。
本計算機システムで取り扱われるメタデータは、クライアント110に格納さるファイルに関する付加的なデータを表す。例えば、ファイルの作成者、ファイルの作成日時、ファイルの機密レベル等がメタデータに含まれる。これらのメタデータは、ファイルそのものに格納されても、ファイルと関連付けられて管理される別のデータであってもよい。ファイルを取り扱うユーザは、メタデータを編集及び参照することができる。
次に、これら各装置の構成及び動作について説明する。
クライアント110は、メタデータ変更監視プログラム111、メタデータ更新プログラム112及びファイル操作監視プログラム113を備える。これらのプログラムは、補助記憶装置(例えば、磁気ディスクドライブ)に格納されており、補助記憶装置から読み出され、クライアント110の主記憶装置(メモリ)にロードされ、プロセッサによって実行される。
メタデータ変更監視プログラム111は、クライアント110のOS(Operating System)、ファイルシステム、メタデータを編集するプログラムを監視し、メタデータが変更された場合、メタデータ管理サーバ130へ変更の内容を通知するプログラムである。例えば、クライアント110に格納されるファイルの機密レベルを表すメタデータが、「公開情報」から「社外秘情報」へ変更された場合、メタデータ変更監視プログラム111は、メタデータ管理サーバ130へメタデータの変更を通知する。ただし、メタデータ更新プログラム112がメタデータを変更した場合、メタデータ更新ログがメタデータ管理サーバ130に送信されるので、このメタデータの変更はメタデータ変更監視プログラム111からメタデータ管理サーバ130へ通知されない。
メタデータ更新プログラム112は、メタデータ管理プログラム131から、クライアント110上のファイルのメタデータを更新する通知を受信した場合、受信した通知に基づいて、メタデータを更新し、メタデータ更新処理の結果をメタデータ管理サーバ130へ通知するなどの処理を行うプログラムである。例えば、クライアント110に格納されたファイルの機密レベルを表すメタデータを「社外秘情報」にするための通知をメタデータ管理プログラム131から受信した場合、メタデータ更新プログラム112は、受信した通知に指定されたファイルのメタデータを「社外秘情報」に更新し、更新の完了をメタデータ管理サーバ130へ通知する。
ファイル操作監視プログラム113は、クライアント110のOSやファイルシステムを監視し、ファイルの新規作成、編集、印刷などのファイル操作に関するログを取得し、取得したログを来歴管理サーバ140へ送信するプログラムである。
メールサーバ120は、クライアント110からの要求に従ってメールを送信するメール送信プログラム、受信したメールをクライアント110からの要求に従って配信するメール受信プログラム及びメール送受信監視プログラム121を備える。これらのプログラムは、補助記憶装置(例えば、磁気ディスクドライブ)に格納されており、補助記憶装置から読み出され、メールサーバ120の主記憶装置(メモリ)にロードされ、プロセッサによって実行される。
メール送受信監視プログラム121は、メールサーバ120によるメールの送受信に関するログを取得し、取得したログを来歴管理サーバ140へ送信するプログラムである。
メタデータ管理サーバ130は、メタデータ管理プログラム131、管理ルール設定プログラム132及び来歴走査プログラム133を備える。これらのプログラムは、補助記憶装置(例えば、磁気ディスクドライブ)に格納されており、補助記憶装置から読み出され、メタデータ管理サーバ130の主記憶装置(メモリ)にロードされ、プロセッサによって実行される。
また、メタデータ管理サーバ130は、メタデータ変更ログデータベース136、メタデータ変更イベント選択ルール134及びメタデータ更新ファイル選択ルール135を、補助記憶装置に格納する。
メタデータ変更イベント選択ルール134は、ファイルのメタデータを更新すべきメタデータ変更イベントを判定するためのルールである。メタデータ変更イベント選択ルール134の詳細は図12を用いて説明する。
メタデータ更新ファイル選択ルール135は、メタデータを更新すべきファイルを判定するためのルールである。メタデータ更新ファイル選択ルール135の詳細は、図13を用いて説明する。
メタデータ管理プログラム131は、クライアント110でファイルのメタデータが変更されたことの通知をメタデータ管理プログラム131から受信した場合、受信した通知に基づいて、メタデータの変更が生じたファイルに関するログを来歴管理サーバ140から取得し、メタデータ更新ファイル選択ルール135に基づいて、メタデータを更新する通知をクライアント110に送信するプログラムである。メタデータ管理プログラム131の詳細は、図17を用いて説明する。
管理ルール設定プログラム132は、ユーザがメタデータ変更イベント選択ルール134及びメタデータ更新ファイル選択ルール135を設定するためのインターフェースを備えたプログラムである。すなわち、管理ルール設定プログラム132は、各ルールのフィールドの値を、ユーザがCUIやGUIで設定できる機能を備える。
メタデータ更新ログデータベース136は、メタデータの更新処理を行ったクライアント110から通知される処理結果が格納される。具体的には、メタデータを更新した日時、クライアント110の識別情報(例えば、ホスト名)、メタデータが更新されるファイルの識別情報(例えば、ファイルパス)、更新前のメタデータ、更新後のメタデータなどが含まれる。メタデータ管理サーバ130を管理するユーザは、メタデータ更新ログデータベース136によって、メタデータの更新状況を把握することができる。
来歴走査プログラム133は、メタデータ管理プログラム131がメタデータが更新されるファイルを特定する際に、補助的に実行されるプログラムである。来歴管理サーバ140から受信したログは、図11に示すようにツリー構造のデータになっている。メタデータ管理プログラム131は、ツリー構造のデータを順に解析する。来歴走査プログラム133は、メタデータ管理プログラムが解析した結果に従って、次の解析対象の来歴を決定し、メタデータ管理プログラム131に通知する。
来歴管理サーバ140は、来歴検索プログラム141及び来歴送信プログラム142を備える。これらのプログラムは、補助記憶装置(例えば、磁気ディスクドライブ)に格納されており、補助記憶装置から読み出され、来歴管理サーバ140の主記憶装置(メモリ)にロードされ、プロセッサによって実行される。
また、来歴管理サーバ140は、来歴データベース143を、補助記憶装置に格納する。
来歴データベース143は、クライアント110におけるファイル操作のログ、メールサーバ120におけるメール送受信のログ等を含む。これらのログは、ファイル操作監視プログラム113及びメール送受信監視プログラム121により来歴管理サーバ140に送信され、来歴データベース143に格納される。来歴データベース143に格納されたログを「来歴」という。
来歴検索プログラム141は、来歴管理サーバ140に格納される来歴を検索するプログラムである。
来歴送信プログラム142は、来歴検索プログラム141によって検索された来歴を、メタデータ管理サーバ130へ送信するプログラムである。
なお、メタデータ管理サーバ130と来歴管理サーバ140とを1台のコンピュータに実装してもよい。また、来歴管理サーバ140の機能をメタデータ管理サーバ130に集約して、メタデータ管理サーバ130が来歴の検索・管理をするように構成してもよい。
次に、本実施形態の各コンピュータの構成について説明する。図2は、本実施形態のメタデータ管理サーバ130の構成のブロック図である。
図2に示すように、メタデータ管理サーバ130は、プロセッサ(CPU)202、主記憶装置203、補助記憶装置204、ネットワークインターフェース205、I/Oインターフェース206及び可搬媒体接続部207を備える。これらの各ハードウェア資源は内部バス208によって接続されている。
プロセッサ202は、主記憶装置203にロードされたプログラムを実行する。主記憶装置203は、プロセッサ202で実行されるプログラム、プログラムの実行時に必要なデータを格納するメモリである。補助記憶装置204は、例えば、磁気ディスクドライブ、フラッシュメモリ等の不揮発性記憶装置である。
ネットワークインターフェース205は、ネットワーク101と接続され、ネットワーク101と接続された各装置と通信する。I/Oインターフェース206は、出力装置(例えば、ディスプレイ等)及び入力装置(例えば、キーボード、マウス)を接続する。可搬媒体接続部207は、光ディスク、USBメモリ等の可搬記録媒体と接続するためのインターフェースであり、本計算機システムで管理されるファイルを記録媒体から読み込むために使用される。また、可搬記録媒体は、本計算機システムの計算機で実行されるプログラムを記録媒体から読み込むために使用される。
なお、本明細書では、主記憶装置203と補助記憶装置204とを、「記憶装置」と総称する。また、各装置には、本実施形態の記録閲覧及び監査の処理に必要なプログラムが格納されるROM(Read Only Memory)が備わる。
以上、メタデータ管理サーバ130の構成を図2を用いて説明したが、来歴管理サーバ140、メールサーバ120及びクライアント110も、メタデータ管理サーバ130と同じ構成を有するコンピュータである。
<ログの構成>
次に、図3Aから図8を参照して、ファイル操作監視プログラム113が取得するファイル操作ログについて説明する。
図3Aは、ファイルをコピーした操作のログの一例を示す説明図である。
ファイル操作ログは、ユーザ操作を表すイベント300Aと、イベント300Aが発生した時刻302Aと、イベント300Aが発生する前のファイルの情報を表す304Aと、イベント300Aが発生した後のファイルの情報を表す306Aなどを含む。
イベント発生前ファイルの情報304Aは、イベントが発生したクライアント110の識別情報340A、イベントによって操作されたファイルのパス名342A、イベントによって操作されたファイル名344A、イベントによって操作されたファイルが格納された補助記憶装置の種別を表すドライブ種別346Aなどを含む。イベント発生後ファイルの情報306Aも同様に、クライアント110の識別情報369A、イベントによって操作されたファイルのパス名362A、イベントによって操作されたファイル名364A、イベントによって操作されたファイルが格納された補助記憶装置の種別を表すドライブ種別366Aなどを含む。
また、ファイルを特徴づける情報(ファイルのテキスト情報等)を取得できる場合、取得した情報を、イベント発生前ファイルの情報304A及びイベント発生後ファイルの情報306Aに含めてもよい。
ここで、本明細書で用いる用語を定義する。
クライアント110等の計算機を「ホスト」と総称する。あるホストから見てネットワーク101に接続された別のホストを「外部ホスト」という。
また、ホストのIPアドレス、MACアドレス及び名称等、ホストをネットワーク10上で一意に識別するための識別情報を「ホスト識別情報」と総称する。
さらに、ホスト識別情報、パス名、ファイル名、ドライブ種別など、ホスト内にあるファイルを識別するための情報を「ファイル情報」と総称する。例えば、ドライブ種別には、クライアント110内に存在して外部からアクセスできない「ローカルドライブ」、外部からアクセス可能な「ネットワークドライブ」、可搬記録媒体上のドライブであることを示す「リムーバブルドライブ」などがある。このファイル情報から計算機システム内に格納されるファイルを一意に特定できる場合、このファイル情報は「完全」である。例えば、ホスト識別情報、パス名、ファイル名が明示されたファイル情報は完全となる。逆に、例えば、ファイル名しか含まないファイル情報は「不完全」となる。
図3Aには、イベント300Aがファイルのコピーであるイベントを示す。具体的には、図3Aに示すログで表されるイベントは、2008年4月28日10時21分14秒に、「PC−123」という名称のクライアント110で、ローカルドライブ上のフォルダ「C:¥MyDocuments」の下のファイル「readme.txt」がコピーされて、ファイル「C:¥DeskTop¥readme.txt」が生成されたイベントを表す。
図3Aに示す例では、イベント発生前のファイルの情報304A、イベント発生後ファイルの情報306Aの各々には一つのファイルが記載されるが、記載されるファイルが存在しない場合、記載されるファイルが複数となる場合もある。例えば、イベントがファイルの新規作成であれば、イベント発生前ファイルの情報304Aは存在せず、カラム340A〜346Aは空となる。また、イベントがファイルの削除であれば、イベント発生後ファイルの情報306Aは存在せず、カラム360A〜366Aは空となる。
図3Bは、ファイルを圧縮した操作のログの一例を示す説明図である。図3Bに示すイベントは、イベント300Bがファイルの圧縮であるイベントであり、このイベントにおいては、複数のファイルが圧縮されて一つのファイルが生成される。この場合、イベント発生前ファイルの情報304Bに複数のファイルの情報が記載されてもよい。
図4Aは、可搬記録媒体が関係する操作のログの一例を示す説明図である。図4Aに示すログで表されるイベントでは、可搬媒体に記録されたファイルがクライアント110の補助記憶装置204にコピーされている。ドライブ種別446Aに、リムーバブルドライブの識別情報「USB−001」が記載されている。
図4Bは、外部ホストが関係する操作のログの一例を示す説明図である。図4Bに示すログで表されるイベントでは、ネットワーク経由で他のクライアント110のフォルダにファイルがコピーされている。イベント発生後のホスト識別情報460Bがイベント発生前と同じ「PC−123」となっており、パス名462Bが「Z:¥Public」となっている。他のホストのフォルダをネットワークドライブとして割り当てることができるOSがある。このようなOSでは、パス名462Bからホスト識別情報460Bを特定できない場合がある。このため、ネットワーク101を介してファイルをコピーした場合、ファイル操作のログからは、どのクライアント110へファイルがコピーされたかを追跡できない。すなわち、このファイル情報は不完全である。
図5A及び図5Bは、不正確なログの一例を示す説明図である。
図5Aは、メールの添付ファイルを保存する操作のログの一例を示す説明図である。前述したように、ファイル操作監視プログラム113は、クライアント110のOSやファイルシステムを監視してログを収集する。このため、クライアント110のユーザがメールの添付ファイルを保存した場合、メール送受信プログラムによってファイルが生成されたところまではログを取得できるが、それがどのメールの添付ファイルであるかを特定することは、困難である。その結果、添付ファイルの保存というユーザ操作は、図5Aに示すイベント500Aのようにファイルが「新規作成」されたものとして、不正確なログが取られる可能性がある。
また、図5Bに示すように、OSがその外部ホストを識別できない場合、ネットワーク101経由で外部ホストからコピーされたファイルが、どの外部ホストに格納されていたファイルかを知ることはできない。このとき、外部ホストからファイルをコピーする操作は、図5Bに示すイベントのパス名562Bのフォルダにファイルが「新規作成」されたものとして、不正確なログが収集される可能性がある。
本実施の形態では、このように不正確なログが収集された場合でも、来歴を追跡可能である。
図6Aは、編集されたファイルを上書保存した操作のログの一例を示す説明図である。図6Aに示すログで表されるイベントでは、編集されたファイルを上書保存したため、イベント発生前の情報604Aのホスト名640A、パス名642A、ファイル名644A及びドライブ種別646Aは、イベント発生後の情報606Aのホスト名660A、パス名662A、ファイル名664A及びドライブ種別666Aと、それぞれ同じ値になっている。しかし、前述したテキスト情報などのファイルを特徴づける情報がログに含まれる場合、編集元ファイルをそのまま存置し、上書保存は別場所に保存されることがある。この場合、それらの値は、イベント発生前とイベント発生後で異なることがある。
図6Bは、編集されたファイルを別名で保存した操作のログの一例を示す説明図である。図6Bに示すログで表されるイベントでは、編集されたファイルを、別名で保存したため、イベント発生前の情報604Bのホスト名640B、パス名642B及びファイル名644Bの少なくとも一つの値は、イベント発生後情報606Bのホスト名660B、パス名662B及びファイル名664Bと異なる。この例では、編集されたファイルは、ファイル名を「readme.txt」から「sample.txt」に変更して保存されている。
図7Aは、ファイルを削除した操作のログの一例を示す説明図である。図7Aに示すログで表されるイベントでは、イベント発生前の情報704Aで特定されるファイルを削除したため、イベント発生後の情報706Aは空になっている。
図7Bは、ファイルを印刷した操作のログの一例を示す説明図である。図7Bに示すログで表されるイベントは、イベント700Bがファイルの印刷であるイベントである。このログには、イベントが発生した時刻702B、イベント発生前の情報704B及びイベント発生後の情報706Bが含まれる。イベント発生前の情報704Bは、印刷されたファイルの情報であり、ホスト識別情報740B、パス名742B、ファイル名744B及びドライブ種別746Bなどを含む。イベント発生後の情報706Bは、印刷して生成された紙文書を識別するための情報であり、ホスト(プリンタ又は複合機)の識別情報760B及び紙文書ID762Bなどを含む。紙文書ID762Bは、印刷された紙文書を識別するための識別情報で、紙文書の背景部に直接書き込まれたり、バーコードとして印字されたり、又は電子透かしとして目立たないように紙文書全体に埋め込まれたりする。電子透かしについては、例えば、特開2004−289783号公報に開示される技術を用いることができる。
具体的には、図7Bに示す例では、2008年4月28日10時21分14秒に、「PC−123」という名称のクライアント110で、ローカルドライブ上のファイル「C:¥MyDocuments¥readme.txt」が、「Printer−456」という名称のプリンタで印刷されて、128ビットのID「29E548C7−E81F−4464−A7DC−B3CA0DCA381E」が付与された紙文書が生成されたことを表している。
図8は、メール送受信ログを示す説明図である。図8に示すメール送信のログは、メールの送信か受信かを表すイベント800A、イベントが発生した時刻802A、メールのメッセージID804A、メールの送信宛先のメールアドレス806A、カーボンコピー先のアドレス808A、ブラインドカーボンコピー先のアドレス810A、メールの送信元のアドレス812A及び添付ファイル名814Aなどを含む。
メールアドレス806A、808A、810Aには複数のアドレスが記録されることがあり、添付ファイル814Aには複数のファイル名が記録されることがある。なお、イベント800Aがメール受信であった場合、ブラインドカーボンコピー先のメールアドレス810Aは、受信側メールサーバ120にメールを送信した送信側メールサーバ120によって消去されているため取得できない。
具体的には、図8に示す例では、2008年4月28日10時21分14秒に、「attachment1.txt」「attachment2.txt」などのファイルが添付されたメッセージIDが「48F697B8.5000406@in.com」のメールが、メールアドレス「ddd@in.com」のユーザから、アドレス「aaa1@out1.com」「aaa2@out2.com」などへ送信、「bbb1@out3.com」「bbb2@out4.com」などへカーボンコピー送信、「ccc1@out5.com」「ccc2@out6.com」などへブラインドカーボンコピー送信されたというメール送信イベントを表している。
図8には、メールの送信ログを示したが、メール送受信監視プログラム121は、メールの受信ログも取得してもよい。ずなわち、メールサーバ120は、ファイルが添付されているメールをクライアント110に転送した際、メールの受信ログを生成する。また、前述したように、受信したメールに添付されたファイルがローカルディスク(補助記憶装置)に格納された場合、ファイルを新規作成したログが生成される。
図3A〜図8で説明した様々なログ(来歴)は、来歴管理サーバ140に格納される。
<各種データの構成>
図9は、来歴検索クエリの一例を示す説明図である。来歴検索クエリ900は、ファイル情報(すなわち、ホスト識別情報901、パス名902、ファイル名903及びドライブ種別904)などを含む。なお、来歴検索クエリ900に含まれるパラメータは、システム内でファイルを一意に特定できるものであればよく、例えば、来歴検索クエリ900にドライブ種別904を含まなくてもよい。また、来歴検索クエリ900に時刻(又は、時間範囲)を含んでもよい。来歴検索クエリ900に時刻を含む場合、その時刻以前又は以後のイベントのみを検索することができ、来歴検索クエリ900に時間範囲を含む場合、その時間範囲内のイベントのみを検索することができる。
来歴検索プログラム141は、来歴検索クエリ900を受信すると、受信した来歴検索クエリに含まれるファイル情報と一致する来歴及びその来歴からトレースされる来歴を検索し、検索結果を来歴送信プログラム142へ出力する。
図10は、来歴検索結果の一例を示す説明図である。来歴検索結果に含まれる各テーブル1010等は、来歴のイベント種別1011、イベント発生前の情報1012及びイベント発生後1013の情報を簡略化して表しているが、実際には、図3Aから図8で説明したログのデータである。
来歴検索プログラム142は、来歴データベース143に格納されている来歴から、図10に示すツリー状のデータを作成する。すなわち、検索された来歴はポインタによって、下位の来歴を指定することによって、ツリー状のデータが構成される。
ここで、連結された二つの来歴は、上位の来歴から下位の来歴が派生したことを表す。例えば、連結された来歴1010及び1020は、来歴1010で作成されたファイル「readme.txt」が、来歴1020で、編集され、上書き保存されたことを表す。ファイル操作に関するログの場合は、ある来歴のイベント発生後の情報と、他の来歴のイベント発生前の情報とを比較することによって、この来歴同士を連結するかを判定できる。
ファイル操作に関するログ1030とメール送受信に関するログ1060との連結の可否は、メール送受信ログの添付ファイルの情報とファイル操作のイベント発生前あるいは発生後の情報を比較することによって判定できる。来歴検索プログラム142は、来歴データベース143に含まれるすべての来歴の連結可否を検索することによって、図10のようなツリー構造をしたデータを複数作成することができる。
来歴検索プログラム141は、来歴検索クエリ900を受信すると、来歴検索クエリ900に含まれるファイルの情報と一致するファイルの情報を持つ来歴を検索し、その来歴が含まれるツリー構造のデータを来歴検索結果として来歴送信142プログラムへ出力する。なお、このデータは、来歴検索クエリ900によって検索が行われる都度、検索条件に一致する来歴によってツリー状のデータを作成してもよいし、クライアント110又はメールサーバ120からログが送信され、来歴データベース143が更新されるタイミングで作成してもよい。
図11は、メタデータ変更イベントの一例を示す説明図である。メタデータ変更イベント1100は、変更イベントが発生した時刻1101、イベントが発生したクライアント110の識別情報1102、ファイルのパス名1103、ファイル名1104、ファイルが格納された補助記憶装置の種別を表すドライブ種別1105、変更前のメタデータ1106及び変更後のメタデータ1107などを含む。変更前のメタデータ1106及び変更後のメタデータ1107は、それぞれ複数のメタデータを格納できる。図11に示す例では、「機密レベル=公開」というメタデータ1108が、「機密レベル=社外秘」というメタデータ1109に変更されたことを表す。メタデータには、図示した機密レベルの他、ファイルの属性、ファイルの保存期間、検索用キーワードなどを含んでもよい。
なお、メタデータが設定されていないファイルに、新たにメタデータが設定された場合のイベントは、変更前メタデータが空で、変更後メタデータに値が含まれるイベントによって表される。
図12は、メタデータ変更イベント選択ルールの一例を示す説明図である。メタデータ変更イベント選択ルール134は、メタデータ管理サーバ130によって管理され、条件1210及び条件式1220などを含む。
条件1210は、メタデータ変更イベント1100のフィールドと同じフィールド(時刻1211、ホストの識別情報1212、ファイルのパス名1213、ファイル名1214、ドライブ種別1215)及び変更前メタデータ1216及び変更後メタデータ1217を含む。ユーザは、管理ルール設定プログラム132のインターフェースを用いて、条件1210の中の各フィールドの値を設定する。
メタデータ管理プログラム131は、メタデータ変更監視プログラム111から受信したメタデータ変更イベント1100の各フィールドの値と、メタデータ変更イベント選択ルール134の条件の中の各フィールドの値を比較し、それぞれの値が一致するかを判定する。図12に示す例で、記号「*」は任意の値を表し、比較する際に「*」の項目は、常に一致すると判定される。
条件式1220は、条件の各フィールドの比較結果から、メタデータ変更イベント1100がメタデータ変更イベント選択ルール134を満たすかを判定するための規則を表す。図12に示す例の「AND」は、メタデータ変更監視プログラム111から受信したメタデータ変更イベント1100の対応する各フィールドの値と、条件の各フィールドとが全て一致する場合に、受信したメタデータ変更イベント1100が選択ルールを満たすと判定することを表す。
図12に示す例では、メタデータ変更イベントの時刻1211が「2009年」、ドライブ種別1215が「ローカルドライブ」、変更前メタデータ1218が「機密レベル=公開」、変更後メタデータ1219が「機密レベル=社外秘」である場合、メタデータ管理プログラム131は、受信したメタデータ変更イベントが選択ルールに含まれると判定する。
一般に、メタデータ変更イベント選択ルール134には、条件及び条件式のセットを含む複数の選択ルールが含まれる。メタデータ管理プログラム131は、メタデータ変更監視プログラム111から受信したメタデータ変更イベント1100とメタデータ変更イベント選択ルール134に含まれる全ての選択ルールとを比較し、メタデータ変更イベント1100が1以上の選択ルールと一致する場合、メタデータ管理プログラム131は、そのメタデータ変更イベント1100がメタデータ変更イベント選択ルール134を満たすと判定する。
次に、メタデータ更新ファイル選択ルール135について説明する。メタデータ更新ファイル選択ルール135は、図13Aに示す派生先(図10に示すツリーの下位)に適用されるルール1300A、及び、図13Bに示す派生元(図10に示すツリーの上位)に適用されるルール1300Bを含む。
図13Aは、派生先に適用されるルールの一例を示す説明図である。派生先に適用されるルール1300Aは、メタデータ管理プログラム131が、メタデータ変更イベントが発生したファイルに関する来歴(以下、イベント発生来歴という)の派生先の来歴を解析する際に適用される。派生先に適用されるルールは、メタデータ変更イベントが発生したファイルと、そのファイルの派生先の関係にあるファイルとの類似度のしきい値1310A、及び、来歴のイベントの種別に応じてメタデータを更新するための処理の種別を表すクエリ種別フィールド1320Aなどを含む。
しきい値1310Aは、あるファイルと他のファイルとが類似しているかを表す指標を用いて設定され、様々な方法が採用可能である。図13Aに示す例では、二つのファイルの類似度を表す指標に、一方のファイルから何回編集されて他方のファイルが生成されたかを表す編集回数を用いており、しきい値1310Aとして「2回」が設定されている。このしきい値1310Aは、メタデータ管理プログラム131がメタデータを更新するファイルを決定するため、図10で示されるようなツリー構造の来歴をイベント発生来歴から派生先来歴へと順次解析していく際に用いられる。イベント発生来歴と解析対象の来歴との間(解析対象の来歴も含める)にイベント種別が編集である来歴が3回以上存在する場合は、解析対象の来歴に対応するファイルのメタデータは更新されないことになる。
メタデータを更新するための処理の種別1320Aは、メタデータ管理プログラム131が来歴に対応するファイルのメタデータを更新する処理をクライアント110のメタデータ更新プログラム112へ依頼する際に、メタデータ更新プログラム112によって行われる処理を、来歴のイベントの種別ごとに指定する。処理の種別として、ここでは、「強制」、「確認」、「通知」の3種類が登録されている。なお、前述以外にも、様々な処理を設定できる。
「強制」は、メタデータ更新プログラム112が、更新対象のファイルのメタデータを、ユーザへの確認も通知もすることなく、強制的に更新することを意味する。「確認」は、メタデータ更新プログラム112が、更新対象のファイルのメタデータを更新するかの入力を促すメッセージをクライアント110に表示し、ユーザによる入力に従って、ファイルのメタデータを更新する(又は、更新しない)ことを意味する。「通知」は、メタデータ更新プログラム112が、ユーザに対してメタデータ更新イベントが発生したことを通知するメッセージを表示するだけで、メタデータは更新しないことを意味する。
例えば、「通知」は、メタデータ管理プログラム131が、イベント種別が「印刷」又は「メール送信」の来歴に対応するファイルのメタデータを更新する際に、イベントが発生したクライアント110上のメタデータ更新プログラム112を通じて、このファイルを印刷又はメールに添付して送信したユーザにメッセージを送ることが考えられる。ユーザは、通知を受け取ることによって、印刷した紙文書の取り扱いを変更したり、メールの送信先に注意を促すことが可能になる。
図13Bは、派生元に適用されるルールの一例を示す説明図である。派生元に適用されるルール1300Bは、メタデータ管理プログラム131が、イベントが発生したファイルに関する来歴の派生元の来歴を解析する際に適用される。各フィールドで設定される項目は、派生先に適用されるルール1300Aと同じであるが、設定される値を変更することによって、派生先と派生元に対して異なる取り扱いをすることができる。
図14は、メタデータ更新クエリの一例を示す説明図である。メタデータ更新クエリ14100は、メタデータが更新されるファイルが格納されているクライアント110の識別情報14101、更新対象のファイルのパス1402、更新対象のファイル名1403、メタデータが更新されるファイルが格納された補助記憶装置の種別を表すドライブ種別1404、メタデータ管理プログラム131が作成した更新クエリに対応する来歴のイベント種別14105、このイベント発生時刻14106、メタデータ更新プログラム112によって行われる処理を表すクエリ種別1407、メタデータ更新イベント14108、及び補足情報14109などを含む。
メタデータ更新イベント14108のフィールドには、メタデータ変更イベント1100(図11)に含まれるデータが格納される。補足情報14109には、例えば、メタデータが更新されるファイルをメールに添付して送信した場合の送信宛先メールアドレスなどが格納される。
<システムによる処理>
次に、図15を参照して、メタデータ管理プログラム131によって実行される処理について説明する。
まず、メタデータ管理プログラム131は、メタデータ変更監視プログラム111によって送信されるメタデータ変更通知を受信する。メタデータ変更通知には、メタデータ変更イベント1100が含まれている(S1501)。なお、クライアント110(メタデータ変更監視プログラム111)が、メタデータ変更通知を送信しなくても、メタデータ管理サーバ130(メタデータ管理プログラム131)が、繰り返し、クライアント110に問い合わせるなどによってメタデータの変更を検出してもよい。
その後、メタデータ管理プログラム131は、ステップS1501において受信したメタデータ変更イベント1100がメタデータ変更イベント選択ルール134と一致するかを判定する(S1502)。その結果、メタデータ変更イベント1100がメタデータ変更イベント選択ルール134と一致すると判定された場合、ステップS1503に進む。一方、メタデータ変更イベント1100がメタデータ変更イベント選択ルール134と一致しないと判定された場合、ステップS1501に戻る。
ステップS1503において、メタデータ管理プログラム131は、来歴管理サーバ140へ送信する来歴検索クエリ900を生成する。具体的には、メタデータ管理プログラム131が受信したメタデータ変更イベント1100からファイルの情報を抽出し、抽出されたファイルの情報を来歴検索クエリ900に設定する。
その後、メタデータ管理プログラム131は、ステップS1503において生成された来歴検索クエリを来歴管理サーバ140へ送信する(S1504)。
メタデータ管理プログラム131は、来歴管理サーバ140における来歴送信プログラム142によって送信される来歴検索結果を受信する(S1505)。
メタデータ管理プログラム131は、ステップS1505において受信した来歴検索結果及びメタデータ更新ファイル選択ルール135を参照して、メタデータ更新クエリ14100を生成する(S1506)。この処理の結果、0又は1以上のメタデータ更新クエリ14100が生成される。メタデータ更新クエリ14100を生成する処理は、ステップS1505において受信した来歴検索結果のうち、イベントが発生したファイルの来歴と派生先の来歴に対する処理(図16)と、派生元の来歴に対する処理(図17)とに分かれている。メタデータ管理プログラム131は、ステップS1506において、これら両方の処理を実行する。
なお、本実施の形態では、派生先の来歴に対する処理(図16)及び派生元の来歴に対する処理(図17)との両方を実行するが、計算機システムで管理されるファイルによっては、派生先の来歴に対する処理又は派生元の来歴に対する処理の一方を実行すればよい。
メタデータ管理プログラム131は、ステップS1506において生成されたメタデータ更新クエリ14100の有無を判定する(S1507)。その結果、メタデータ更新クエリ14100が存在すると判定された場合、ステップS1508に進む。一方、メタデータ更新クエリ14100が存在しないと判定された場合、ステップS1501に戻る。
ステップS1508において、メタデータ管理プログラム131は、メタデータを更新する。具体的には、ステップ1506において生成されたメタデータ更新クエリ14100に含まれるファイルの情報を参照し、このファイルの情報によって識別されるクライアント110にメタデータ更新クエリ14100を送信する。
クライアント110がメタデータ更新クエリ14100を受信すると、メタデータ更新プログラム112が、受信したメタデータ更新クエリ14100に従ってメタデータを更新する。メタデータ更新プログラム112の処理の詳細は図18を用いて説明する。
メタデータ更新プログラム112は、メタデータ更新処理の最後に、メタデータ更新ログをメタデータ管理サーバ130へ送信する。メタデータ更新ログには、更新処理の内容、及び更新処理が実行された時刻などが含まれる。
メタデータ管理サーバ130がメタデータ更新プログラム112からメタデータ更新ログを受信すると、メタデータ管理プログラム131は、受信したメタデータ更新ログをメタデータ更新ログデータベース136に格納する。
次に、図16を参照して、派生先の来歴に対してメタデータ更新クエリを生成する処理について説明する。
前述したように、来歴検索結果は、ツリー構造である。来歴走査プログラム133は、このツリーから一つの枝(経路)を選択し、その経路上の来歴を走査する。以下で説明する処理は、この一つの経路に対して適用されるものである。来歴走査プログラム133は、処理されたフローを記憶し、来歴検索結果のツリーの全ての経路を走査するまで、この処理が繰り返される。
まず、メタデータ管理プログラム131は、ステップS1505において受信した来歴検索結果を参照し、イベントが発生したファイルの来歴を識別する(S1601)。具体的には、ステップS1501において受信したメタデータ変更イベントに含まれるファイルの情報をキーとして、ステップS1505において受信した来歴検索結果を検索し、メタデータ変更イベントに含まれるファイルの情報と一致する来歴をイベントが発生した来歴として識別する。但し、該当する来歴が複数検索された場合、時刻が一番新しい来歴をイベントが発生した来歴として識別する。
その後、来歴走査プログラム133は、ステップS1601においてメタデータ管理プログラム131によって識別されたイベント発生来歴を解析対象に設定する(S1602)。
さらに、来歴走査プログラム133は、解析対象に設定されている来歴から派生した派生先イベントがあるかを判定する(S1603)。その結果、派生先イベントが存在しないと判定された場合、この来歴はツリーの末端なので、処理を終了する。一方、派生先イベントが存在すると判定された場合、来歴走査プログラム133は、ステップS1602において設定されたイベントから派生した派生先イベントの来歴を解析対象に設定する(S1604)。
その後、メタデータ管理プログラム131は、ステップS1604で解析対象に設定された派生先イベントの来歴のイベント種別を識別し、識別した結果によって処理を振り分ける(S1605)。すなわち、識別した結果、イベント種別が「新規作成」、「ファイルコピー」、「圧縮」のいずれかの場合、ステップS1606に進む。イベント種別が、「メール送信」、「印刷」のいずれかの場合、ステップS1609に進む。イベント種別が「編集」の場合、ステップS1608に進む。イベント種別が「削除」の場合、処理を終了する。
イベント種別が「新規作成」、「ファイルコピー」又は「圧縮」の場合、ステップS1606において、メタデータ管理プログラム131は、解析対象の来歴から派生した来歴の中に、イベント種別が「削除」、「編集」のいずれかの来歴があるかを判定する。そして、イベント種別が「編集」の来歴が存在する場合、イベント種別が「編集」の来歴のイベント発生前のファイルの情報とイベント発生後のファイルの情報とが一致するかを判定する。ファイルの情報が一致する編集イベントが存在する場合、ファイルは上書き保存されたと判定できる。
その結果、削除イベントが存在するか、又は、ファイルの情報が一致する編集イベントが存在すると判定された場合、ステップS1603に進む。一方、これらのイベントが存在しないと判定された場合、ステップS1609に進む。派生先の来歴に削除イベントが含まれる場合、メタデータ変更イベントが発生したファイルから派生したファイルが、ある時刻において存在したが、現在は存在しないので、メタデータを更新する必要がないと判定できる。また、派生先の来歴に上書保存イベントが含まれる場合、この来歴ではメタデータを更新せず、その上書保存イベントでメタデータを更新すればよいので、メタデータの更新が重複することを避けることができる。
イベント種別が「編集」の場合、ステップS1608において、メタデータ管理プログラム131は、メタデータを変更するイベントが発生した際のファイルと、解析対象のイベント発生後のファイルの情報で識別されるファイルとの類似度を計算し、計算された類似度と、メタデータ更新ファイル選択ルール135に設定された類似度のしきい値とを比較することによって、両ファイルが類似するかを判定する。類似度は、前述した編集回数を用いて計算してもよいし、テキストマッチング、文書解析などの公知の方法によって計算してもよい。その結果、両ファイルが類似すると判定された場合、類似するファイルのメタデータも更新するために、ステップS1609に進む。一方、両ファイルが類似しないと判定された場合、両ファイルは異なるものであり、派生先のファイルのメタデータを更新する必要がないので、処理を終了する。
イベント種別が、「メール送信」又は「印刷」の場合、ステップS1609において、メタデータ管理プログラム131は、解析対象の来歴からメタデータ更新クエリ14100を生成する。解析対象の来歴のイベント種別が、「新規作成」、「ファイルコピー」、「圧縮」又は「編集」の場合、メタデータ管理プログラムは、解析対象の来歴からイベント発生後のファイルの情報を取得し、メタデータ更新クエリ14100のファイルの情報のフィールド14101〜14104に設定する。一方、解析対象の来歴のイベント種別がメール送信の場合、解析対象の来歴の派生元来歴のイベント発生後のファイルの情報をメタデータ更新クエリ14100のファイルの情報のフィールド14101〜14104に設定する。
メタデータ更新クエリ14100のイベント種別のフィールド14105には、解析対象の来歴のイベント種別を設定する。イベント発生時刻のフィールド14106には、解析対象の来歴のイベント発生時刻を設定する。クエリ種別のフィールド14107には、派生先に適用されるメタデータ更新ファイル選択ルール1300Aのクエリ種別1320Aの中で、イベント種別14105に対応する処理の種別(強制、確認又は通知)を設定する。メタデータ変更イベントフィールド14108には、ステップS1501において受信したメタデータ変更イベントを設定する。また、必要に応じて、補足情報フィールド14109にデータ(例えば、メールを送信した宛先メールアドレス)を設定する。メタデータ更新クエリを生成した後、ステップS1603に進む。
次に、図17を参照して、派生元の来歴に対してメタデータ更新クエリを生成する処理について説明する。
まず、メタデータ管理プログラム131は、ステップS1505において受信した来歴検索結果を参照し、イベントが発生したファイルの来歴を識別する(S1701)。具体的には、ステップ1501において受信したメタデータ変更イベントに含まれるファイルの情報をキーとして、ステップS1505において受信した来歴検索結果を検索し、メタデータ変更イベントに含まれるファイルの情報と一致する来歴をイベントが発生した来歴として識別する。但し、該当する来歴が複数検索された場合、時刻が一番新しい来歴をイベントが発生した来歴として識別する。
その後、来歴走査プログラム133は、ステップS1701においてメタデータ管理プログラム131によって識別されたイベント発生来歴を解析対象に設定する(S1702)。
さらに、来歴走査プログラム133は、解析対象に設定されている来歴から派生した派生先イベントがあるかを判定する(S1703)。その結果、派生先イベントが存在しないと判定された場合、この来歴はツリーの末端なので、処理を終了する。一方、派生先イベントが存在すると判定された場合、来歴走査プログラム133は、ステップS1702において設定されたイベントの派生先イベントの来歴を解析対象に設定する(S1704)。
その後、メタデータ管理プログラム131は、ステップS1704で解析対象に設定された派生先イベントの来歴のイベント種別を識別し、識別した結果によって処理を振り分ける(S1705)。すなわち、識別した結果、イベント種別が「新規作成」、「ファイルコピー」、「圧縮」のいずれかの場合、ステップS1706に進む。イベント種別が、「メール送信」、「印刷」のいずれかの場合、ステップS1710に進む。イベント種別が「編集」の場合、ステップS1708に進む。イベント種別が「削除」の場合、処理を終了する。
イベント種別が「新規作成」、「ファイルコピー」又は「圧縮」の場合、ステップS1706において、メタデータ管理プログラム131は、解析対象の来歴から派生した来歴の中に、イベント種別が「削除」、「編集」のいずれかの来歴があるかを判定する。そして、イベント種別が「編集」の来歴が存在する場合、イベント種別が「編集」の来歴のイベント発生前のファイルの情報とイベント発生後のファイルの情報とが一致するかを判定する。ファイルの情報が一致する編集イベントが存在する場合、ファイルは上書き保存されたと判定できる。
その結果、削除イベントが存在するか、又は、ファイルの情報が一致する編集イベントが存在すると判定された場合、ステップS1709に進む。一方、これらのイベントが存在しないと判定された場合、ステップS1710に進む。派生先の来歴に削除イベントが含まれる場合、メタデータ変更イベントが発生したファイルから派生したファイルが、ある時刻において存在したが、現在は存在しないので、メタデータを更新する必要がないと判定できる。また、派生先の来歴に上書保存イベントが含まれる場合、この来歴ではメタデータを更新せず、その上書保存イベントでメタデータを更新すればよいので、メタデータの更新が重複することを避けることができる。
イベント種別が「編集」の場合、ステップS1708において、メタデータ管理プログラム131は、メタデータを変更するイベントが発生した際のファイルと、解析対象のイベント発生後のファイルの情報で識別されるファイルとの類似度を計算し、計算された類似度と、メタデータ更新ファイル選択ルール135に設定された類似度のしきい値とを比較することによって、両ファイルが類似するかを判定する。類似度は、前述した編集回数を用いて計算してもよいし、テキストマッチング、文書解析などの公知の方法によって計算してもよい。その結果、両ファイルが類似すると判定された場合、類似するファイルのメタデータも更新するために、ステップS1609に進む。一方、両ファイルが類似しないと判定された場合、両ファイルは異なるものであり、派生先のファイルのメタデータを更新する必要がないので、処理を終了する。
イベント種別が、「メール送信」又は「印刷」の場合、ステップS1710において、メタデータ管理プログラム131は、解析対象の来歴からメタデータ更新クエリ14100を生成する。解析対象の来歴のイベント種別が、「新規作成」、「ファイルコピー」、「圧縮」又は「編集」の場合、メタデータ管理プログラムは、解析対象の来歴からイベント発生後のファイルの情報を取得し、メタデータ更新クエリ14100のファイルの情報のフィールド14101〜14104に設定する。一方、解析対象の来歴のイベント種別がメール送信の場合、解析対象の来歴の派生先来歴のイベント発生後のファイルの情報をメタデータ更新クエリ14100のファイルの情報のフィールド14101〜14104に設定する。
メタデータ更新クエリ14100のイベント種別のフィールド14105には、解析対象の来歴のイベント種別を設定する。イベント発生時刻のフィールド14106には、解析対象の来歴のイベント発生時刻を設定する。クエリ種別のフィールド14107には、派生元に適用されるメタデータ更新ファイル選択ルール1300Bのクエリ種別1320Bの中で、イベント種別14105に対応する処理の種別(強制、確認又は通知)を設定する。メタデータ変更イベントフィールド14108には、ステップS1501において受信したメタデータ変更イベントを設定する。また、必要に応じて、補足情報フィールド14109にデータ(例えば、メールを送信した宛先メールアドレス)を設定する。メタデータ更新クエリを生成した後、ステップS1703に進む。
ステップS1709において、来歴走査プログラム133は、解析対象の来歴に派生先イベントがあるかを判定する。その結果、派生先来歴が存在する場合、この来歴から分岐する枝(経路)が存在するので、ステップS1711に進み、さらにメタデータ更新クエリ14100を生成する。一方、派生先来歴が存在しない場合、この来歴から分岐する枝は存在しないので、ステップS1711に進み、さらにメタデーステップS1703に進む。
ステップS1711において、メタデータ管理プログラム131は、派生先来歴を対象としたメタデータ更新クエリの生成処理を行う。具体的には、S1711において解析対象に設定されている来歴を解析対象に設定した後、図16に示すメタデータ更新クエリ生成処理のステップS1603からの処理と同じ処理を実行する。来歴走査プログラム133は、ステップS1602において解析対象に設定された来歴を基点とした派生先来歴について、全ての経路を走査するまで、この処理を繰り返す。すべての経路について、この処理を行った後、ステップS1703に戻る。
次に、図18を参照して、メタデータ更新プログラム112の処理について説明する。
まず、メタデータ更新プログラム112は、メタデータ管理プログラム131によって送信されたメタデータ更新クエリ14100を受信する(S1801)。
メタデータ更新プログラム112は、ステップS1801において受信したメタデータ更新クエリ14100のクエリ種別を判定する(S1802)。その結果、クエリ種別が「強制」又は「確認」であると判定された場合、ステップS1805に進む。一方、クエリ種別が「通知」である場合、メタデータ更新プログラム112は、メタデータの変更を知らせるメッセージを表示する(S1803)。
その後、ユーザは、ステップS1803において表示されたメッセージを確認し、確認した旨を入力する(S1804)。例えば、ユーザが表示されたメッセージの中の「確認」ボタンを操作することによって、メタデータ更新プログラム112がユーザによる確認結果を取得する。その後、ステップS1811に進む。
ステップS1805において、メタデータ更新プログラム112は、ステップS1801において受信したメタデータ更新クエリ14100に含まれるファイルの情報で識別されるファイルが、クライアント110上に保存されているかを判定する。その結果、このファイルがクライアント110上に保存されていないと判定された場合、ステップS1811に進む。一方、このファイルがクライアント110上に保存されていると判定された場合、メタデータ更新プログラム112は、ステップS1801において受信したメタデータ更新クエリ14100のクエリ種別を判定する。判定した結果、クエリ種別が「強制」である場合、ステップS1810に進む。一方、クエリ種別が「確認」である場合、メタデータ更新プログラム112は、ユーザによるメタデータを更新するか否かの判定を促すメッセージを表示する(S1807)。
その後、ユーザは、ステップS1807において表示されたメッセージを確認し、メタデータを更新するかを決定する(S1808)。例えば、ユーザが表示されたメッセージの中の「更新」ボタン又は「非更新」ボタンを操作することによって、メタデータ更新プログラム112がユーザによる更新/非更新の選択結果を取得する。
そして、メタデータ更新プログラム112は、ユーザが非更新を選択した場合、ステップS1811に進む。一方、ユーザが更新を選択した場合、メタデータ更新プログラム112は、メタデータを更新する(S1810)。
ステップS1811において、メタデータ更新プログラム112は、処理結果(メタデータ更新ログ)をメタデータ管理サーバ130へ送信し(S1811)、その後、処理を終了する。
以上説明したように、本発明の実施の形態では、予めルール(メタデータイベント選択ルール134、メタデータ更新ファイル選択ルール135)を設定しておくことによって、クライアント110上のファイルのメタデータが変更された場合に、メタデータを更新すべきファイルを漏れなく効率的に更新することができる。
なお、前述した実施形態は、本発明を実施するための一例であり、本発明の範囲は明細書に開示された実施形態に限定されない。したがって、本発明の要旨を変更しない範囲内においてその実施形式を種々変形することが可能である。例えば、ハードウェア、ソフトウェア、各フローチャートなどの具体的な構成について、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
110 クライアント
111 メタデータ変更監視プログラム
112 メタデータ更新プログラム
113 ファイル操作監視プログラム
120 メールサーバ
121 メール送受信監視プログラム
130 メタデータ管理サーバ
131 メタデータ管理プログラム
132 管理ルール設定プログラム
133 来歴走査プログラム
134 メタデータ変更イベント選択ルール
135 メタデータ更新ファイル選択ルール
136 メタデータ変更ログデータベース
140 来歴管理サーバ
141 来歴検索プログラム
142 来歴送信プログラム
143 来歴データベース

Claims (18)

  1. ファイルのメタデータを管理する計算機システムにおいて、
    前記計算機システムは、前記ファイルのメタデータを管理するメタデータ管理サーバ、及び、前記ファイルの操作のログの来歴を管理する来歴管理サーバを備え、
    前記メタデータ管理サーバ及び前記来歴管理サーバは、前記ファイルを保持するクライアント計算機と接続されており、
    前記来歴管理サーバは、前記クライアント計算機による前記ファイルの内容又は格納場所に変化が生じるイベントを収集し、前記収集されたイベントの情報を来歴として蓄積し、
    前記メタデータ管理サーバは、
    前記クライアント計算機に保持されるファイルのメタデータが変更されたイベントを検出し、
    前記検出されたイベントに関係する来歴の検索を前記来歴管理サーバに要求し、
    前記来歴管理サーバは、
    前記メタデータ管理サーバからの要求に基づいて、管理されている来歴を検索し、
    前記来歴の検索結果を前記メタデータ管理サーバに送信し、
    前記メタデータ管理サーバは、
    前記来歴管理サーバから送信された来歴の検索結果を受信し、
    前記受信した来歴の検索結果に基づいて、前記メタデータが変更された第1ファイルから派生した派生先の第2ファイル、及び当該第1ファイルを派生した派生元の第3ファイルを抽出し、
    前記抽出された派生先の第2ファイル及び派生元の第3ファイルのうち、前記メタデータを更新すべきファイルを特定し、
    前記特定されたファイルのメタデータを更新するためのメタデータ更新要求を生成し、
    前記生成されたメタデータ更新要求を前記クライアントに送信することを特徴とする計算機システム。
  2. 前記来歴検索結果は、ファイルが操作された順に派生元来歴と派生先来歴とがリンクしたツリー構造であって、
    前記メタデータ管理サーバは、前記抽出された派生先の第2ファイル又は派生元の第3ファイルが所定条件を満たす場合、前記第1ファイルがメタデータを更新すべきファイルであると特定することを特徴とする請求項1に記載の計算機システム。
  3. 前記メタデータ管理サーバは、
    前記抽出された派生先の第2ファイルから派生した第4ファイルに対応する来歴に削除イベントも、上書保存イベントも存在しない場合、当該抽出された派生先の第2ファイルが、メタデータを更新すべきファイルであると特定し、
    前記抽出された派生元の第3ファイルを派生した第5ファイルに対応する来歴に削除イベントも、上書保存イベントも存在しない場合、当該抽出された派生元の第3ファイルが、メタデータを更新すべきファイルであると特定することを特徴とする請求項2に記載の計算機システム。
  4. 前記メタデータ管理サーバは、
    前記抽出された派生先の第2ファイルに対応する来歴が編集イベントであり、かつ、前記第2ファイルが派生元の第1ファイルと類似する場合、前記第2ファイルが、メタデータを更新すべきファイルであると特定し、
    前記抽出された派生元の第3ファイルに対応する来歴が編集イベントであり、かつ、前記第3ファイルが派生先の第1ファイルと類似する場合、前記第3ファイルが、メタデータを更新すべきファイルであると特定することを特徴とする請求項2に記載の計算機システム。
  5. 前記来歴検索要求は、前記計算機システム内でファイルを一意に特定可能なパラメータを含むことを特徴とする請求項1に記載の計算機システム。
  6. 前記メタデータ管理サーバは、
    前記イベントが、派生先及び派生元のファイルのメタデータを更新すべきものか否かの情報を含むメタデータ変更イベント選択ルールを管理し、
    前記検出されたイベントが、前記メタデータ変更イベント選択ルールに一致する場合、前記検出されたイベントに関係する来歴の検索を前記来歴管理サーバに要求することを特徴とする請求項1に記載の計算機システム。
  7. 前記メタデータ更新要求には、利用者が確認した場合にメタデータを更新する第1の種別と、メタデータを更新せず、関連するファイルのメタデータの更新を利用者に通知する第2の種別と、利用者へ確認も通知もすることなくメタデータを更新する第3の種別とを含む要求の種別が設定され、
    前記クライアント計算機は、前記メタデータ更新要求に設定された要求の種別に対応する処理を選択的に実行することを特徴とする請求項1に記載の計算機システム。
  8. 前記メタデータ管理サーバは、
    前記イベントがファイルの新規作成である場合、前記メタデータ更新要求には前記第3の種別を設定し、
    前記イベントがファイルのコピーである場合、前記メタデータ更新要求には前記第1の種別を設定し、
    前記イベントがファイルの転送である場合、前記メタデータ更新要求には前記第2の種別を設定することを特徴とする請求項1に記載の計算機システム。
  9. 前記クライアントは、
    前記メタデータ更新要求を受信した場合、受信したメタデータ更新要求に従って、メタデータを更新し、
    メタデータ更新ログを生成し、
    前記生成されたメタデータ更新ログを前記メタデータ管理サーバに送信し、
    前記メタデータ管理サーバは、受信した前記メタデータ更新ログを記憶装置に格納することを特徴とする請求項1に記載の計算機システム。
  10. ファイルのメタデータを管理するメタデータ管理サーバであって、
    前記メタデータ管理サーバは、プログラムを実行するプロセッサ、前記プロセッサで実行されるプログラムを格納するメモリ、及び他の計算機と接続するインターフェースを備え、前記ファイルを保持するクライアント計算機と接続されており、
    前記メタデータ管理サーバが備わる計算機システムでは、前記クライアント計算機による前記ファイルの内容又は格納場所に変化が生じるイベントを収集し、前記収集されたイベントの情報を来歴として蓄積されており、
    前記メタデータ管理サーバは、
    前記クライアント計算機に保持されるファイルのメタデータが変更されたイベントを検出し、
    前記検出されたイベントに関係する来歴を検索した結果に基づいて、前記メタデータが変更された第1ファイルから派生した派生先の第2ファイル、及び当該第1ファイルを派生した派生元の第3ファイルを抽出し、
    前記抽出された派生先の第2ファイル及び派生元の第3ファイルのうち、前記メタデータを更新すべきファイルを特定し、
    前記特定されたファイルのメタデータを更新するためのメタデータ更新要求を生成し、
    前記生成されたメタデータ更新要求を前記クライアントに送信することを特徴とするメタデータ管理サーバ。
  11. 前記来歴の検索結果は、ファイルが操作された順に派生元来歴と派生先来歴とがリンクしたツリー構造であって、
    前記メタデータ管理サーバは、前記抽出された派生先の第2ファイル又は派生元の第3ファイルが所定条件を満たす場合、前記第1ファイルがメタデータを更新すべきファイルであると特定することを特徴とする請求項10に記載のメタデータ管理サーバ。
  12. 前記抽出された派生先の第2ファイルから派生した第4ファイルに対応する来歴に削除イベントも、上書保存イベントも存在しない場合、当該抽出された派生先の第2ファイルが、メタデータを更新すべきファイルであると特定し、
    前記抽出された派生元の第3ファイルを派生した第5ファイルに対応する来歴に削除イベントも、上書保存イベントも存在しない場合、当該抽出された派生元の第3ファイルが、メタデータを更新すべきファイルであると特定することを特徴とする請求項11に記載の前記メタデータ管理サーバ。
  13. 前記抽出された派生先の第2ファイルに対応する来歴が編集イベントであり、かつ、前記第2ファイルが派生元の第1ファイルと類似する場合、前記第2ファイルが、メタデータを更新すべきファイルであると特定し、
    前記抽出された派生元の第3ファイルに対応する来歴が編集イベントであり、かつ、前記第3ファイルが派生先の第1ファイルと類似する場合、前記第3ファイルが、メタデータを更新すべきファイルであると特定することを特徴とする請求項11に記載の前記メタデータ管理サーバ。
  14. 前記来歴検索要求は、前記計算機システム内でファイルを一意に特定可能なパラメータを含むことを特徴とする請求項10に記載の前記メタデータ管理サーバ。
  15. 前記メタデータ管理サーバは、
    前記イベントが、派生ファイルのメタデータを更新すべきものか否かの情報を含むメタデータ変更イベント選択ルールを管理し、
    前記検出されたイベントが、前記メタデータ変更イベント選択ルールに一致する場合、前記検出されたイベントに関係する来歴を検索することを特徴とする請求項10に記載の前記メタデータ管理サーバ。
  16. 前記メタデータ更新要求には、利用者が確認した場合にメタデータを更新する第1の種別と、メタデータを更新せず、関連するファイルのメタデータの更新を利用者に通知する第2の種別と、利用者へ確認も通知もすることなくメタデータを更新する第3の種別とを含む要求の種別が設定され、
    前記クライアント計算機は、前記メタデータ更新要求に設定された要求の種別に対応する処理を選択的に実行することを特徴とする請求項10に記載の前記メタデータ管理サーバ。
  17. 前記メタデータ管理サーバは、
    前記イベントがファイルの新規作成である場合、前記メタデータ更新要求には前記第3の種別を設定し、
    前記イベントがファイルのコピーである場合、前記メタデータ更新要求には前記第1の種別を設定し、
    前記イベントがファイルの転送である場合、前記メタデータ更新要求には前記第2の種別を設定することを特徴とする請求項10に記載の前記メタデータ管理サーバ。
  18. 前記クライアントは、
    前記メタデータ更新要求を受信した場合、受信したメタデータ更新要求に従って、メタデータを更新し、
    メタデータ更新ログを生成し、
    前記生成されたメタデータ更新ログを前記メタデータ管理サーバに送信し、
    前記メタデータ管理サーバは、受信した前記メタデータ更新ログを記憶装置に格納することを特徴とする請求項10に記載の前記メタデータ管理サーバ。
JP2010111063A 2010-05-13 2010-05-13 計算機システム及びメタデータ管理サーバ Pending JP2011238165A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010111063A JP2011238165A (ja) 2010-05-13 2010-05-13 計算機システム及びメタデータ管理サーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010111063A JP2011238165A (ja) 2010-05-13 2010-05-13 計算機システム及びメタデータ管理サーバ

Publications (1)

Publication Number Publication Date
JP2011238165A true JP2011238165A (ja) 2011-11-24

Family

ID=45326048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010111063A Pending JP2011238165A (ja) 2010-05-13 2010-05-13 計算機システム及びメタデータ管理サーバ

Country Status (1)

Country Link
JP (1) JP2011238165A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016192031A (ja) * 2015-03-31 2016-11-10 ブラザー工業株式会社 情報保護装置
JP2016218955A (ja) * 2015-05-26 2016-12-22 日本電信電話株式会社 セキュリティレベル管理システム、セキュリティレベル管理装置、セキュリティレベル管理方法およびプログラム
US11669628B2 (en) 2021-03-09 2023-06-06 Hitachi, Ltd. Data management device, data management system, and data management method
US11775497B2 (en) 2021-03-15 2023-10-03 Fujitsu Limited Computer-readable recording medium storing information processing program for generating partial data lineage, method of generating partial data lineage, and information processing device for generating partial data lineage

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016192031A (ja) * 2015-03-31 2016-11-10 ブラザー工業株式会社 情報保護装置
US10027668B2 (en) 2015-03-31 2018-07-17 Brother Kogyo Kabushiki Kaisha Information protecting apparatus
JP2016218955A (ja) * 2015-05-26 2016-12-22 日本電信電話株式会社 セキュリティレベル管理システム、セキュリティレベル管理装置、セキュリティレベル管理方法およびプログラム
US11669628B2 (en) 2021-03-09 2023-06-06 Hitachi, Ltd. Data management device, data management system, and data management method
US11775497B2 (en) 2021-03-15 2023-10-03 Fujitsu Limited Computer-readable recording medium storing information processing program for generating partial data lineage, method of generating partial data lineage, and information processing device for generating partial data lineage

Similar Documents

Publication Publication Date Title
US8156092B2 (en) Document de-duplication and modification detection
US8805832B2 (en) Search term management in an electronic discovery system
US9330374B2 (en) Source-to-processing file conversion in an electronic discovery enterprise system
JP5343608B2 (ja) 業務管理支援装置、業務管理支援プログラム、業務管理支援システム、情報処理装置、及び文書管理装置
US20090044283A1 (en) Document management apparatus, document management system and method, and computer-readable medium
US20080046260A1 (en) Automated litigation discovery method and system
US8745155B2 (en) Network storage device collector
US8166038B2 (en) Intelligent retrieval of digital assets
US8200635B2 (en) Labeling electronic data in an electronic discovery enterprise system
JP5542859B2 (ja) ログ管理装置、ログ蓄積方法、ログ検索方法、およびプログラム
JP2009075655A (ja) ファイル管理システム、ファイル管理方法、およびファイル管理プログラム
US20120254134A1 (en) Using An Update Feed To Capture and Store Documents for Litigation Hold and Legal Discovery
US6721745B2 (en) Method and system for facilitating retrieval of report information in a data management system
US9934487B2 (en) Custodian management system
AU2007202450B2 (en) Information processing apparatus, information processing system, and program
US20200210377A1 (en) Content management system and method
JP2011238165A (ja) 計算機システム及びメタデータ管理サーバ
US20130006997A1 (en) Information processing apparatus, client management method and client management system
US7418323B2 (en) Method and system for aircraft data and portfolio management
US20080235215A1 (en) Data search method, recording medium recording program, and apparatus
JP4857199B2 (ja) 情報資産管理システム、ログ分析装置、及びログ分析用プログラム
JP2009122995A (ja) 関連処理記録の管理システム及び管理方法
CN112395476A (zh) 一种工程资料管理的方法
WO2022249259A1 (ja) 検索方法、検索プログラム、および情報処理装置
JP2002312218A (ja) レプリケーションデータベースシステム及びその制御プログラムが記録されたコンピュータ読取り可能な記録媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120316