JP2009199356A - ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム - Google Patents

ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム Download PDF

Info

Publication number
JP2009199356A
JP2009199356A JP2008040558A JP2008040558A JP2009199356A JP 2009199356 A JP2009199356 A JP 2009199356A JP 2008040558 A JP2008040558 A JP 2008040558A JP 2008040558 A JP2008040558 A JP 2008040558A JP 2009199356 A JP2009199356 A JP 2009199356A
Authority
JP
Japan
Prior art keywords
file
event
correlation
file event
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008040558A
Other languages
English (en)
Inventor
Satoshi Kurihara
聡 栗原
Hidenori Fukui
秀徳 福井
Shinichi Okano
真一 岡野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka University NUC
Sumitomo Electric Industries Ltd
Original Assignee
Osaka University NUC
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC, Sumitomo Electric Industries Ltd filed Critical Osaka University NUC
Priority to JP2008040558A priority Critical patent/JP2009199356A/ja
Publication of JP2009199356A publication Critical patent/JP2009199356A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ファイルイベント間の相関を生成する。
【解決手段】ファイルイベント間の相関を生成する装置3a,3b,3cであって、ファイルイベントの発生を検出する検出手段と、前記検出手段が検出したファイルイベントの情報を記憶するファイルイベントテーブルT1と、ファイルイベント間の相関に関する相関情報を記憶する相関テーブルT2と、他のファイルイベントを前記ファイルイベントテーブルT1から抽出する抽出手段と、ファイル間の内容の相関を示すファイル相関値を決定する決定手段と、を備えている。前記相関テーブルT2は、前記ファイル相関値をイベント相関値として記憶する。
【選択図】図3

Description

本発明は、ファイルイベント間の相関を生成する装置等に関するものである。
近年の情報技術の著しい発達により、パーソナルコンピュータ(PC)に代表される情報端末が一台で保有するファイルの数は万単位、多い場合では十万単位となり、組織のような集合体で考えると保有するファイル数は更に膨大なものとなる。
こうした大量のファイルの中から誰でも所望のファイルを探せるようにするための方法の1つに、所定の管理者が予めファイル分類を論理的に決めておく方法がある。しかし、その場合には、次のような問題がある。
まずファイルの分類基準を一義的に決定する必要がある。ところが、多数の人が所属する組織において基準を一義的に決定することは容易ではなく、また、仮に決定したとしても、それが周知されなければ、第三者による検索は困難になる。
個人(一端末)レベルで考えた場合にも、ファイル数の増加と共に分類も複雑多岐になり、それらをすべて個人が記憶しておくことも、もはや困難になっている。
上記のような問題に関し、特許文献1には、ファイルと関連してユーザから指示された処理を検出し、検出された処理に関する属性を前記ファイルと対応付けて記録し、その記録に基づくファイルの検索が可能な形で複数のファイルを監視するファイル管理方法が開示されている。
ここで、ユーザから指示された「処理」とは、例えば、ファイルを開くといった処理をいう。
特開2003−167767号公報
本発明者らは、ファイルに対するアクセスなどのファイルイベントに着目し、複数のファイルイベント間の相関を求め、関連するファイルイベントを手がかりに所望のファイルを検索するという着想を得た。
一方、特許文献1に記載の技術では、ファイルに関する処理を検出することが行われるものの、当該処理の属性が、ファイルと対応付けて記録されるだけである。つまり、特許文献1には、様々な処理間の相関を求めておくという着想は開示されていない。
そこで、本発明は、ファイルイベント間の相関を利用して、ファイル検索を行うための新たな技術を提供することを目的とする。
第1の本発明は、ファイルイベント間の相関を生成する装置であって、ファイルイベントの発生を検出する検出手段と、前記検出手段が検出したファイルイベントを示すファイルイベント情報を記憶するファイルイベントテーブルと、ファイルイベントテーブルに記憶されているファイルイベント間の相関に関する相関情報を記憶する相関テーブルと、前記検出手段が検出したファイルイベントに関連する他のファイルイベントを、所定の抽出条件に従って、前記ファイルイベントテーブルから抽出する抽出手段と、を備え、前記相関テーブルには、前記検出手段が決定したファイルイベントと、前記抽出手段が抽出した他のファイルイベントと、が関連付けて記憶されることを特徴とするファイルイベント相関生成装置である。
上記第1の本発明によれば、ファイルイベント間の相関を規定したファイルイベントネットワークが形成されるため、当該ネットワークを利用したファイル検索が可能となる。
前記検出手段が検出したファイルイベントが対象とするファイルと、前記抽出手段が抽出した他のファイルイベントが対象とするファイルと、の間のファイル内容の相関を示すファイル相関値を決定する決定手段と、を更に備え、前記相関テーブルは、前記決定手段が決定したファイル相関値を、前記検出手段が検出したファイルイベントと前記抽出手段が抽出した他のファイルイベントとの間のイベント相関値として記憶するのが好ましい。この場合、相関するファイルイベントが特定だきるだけなく、相関するファイルイベント間の相関値も得られる。
前記決定手段は、各ファイルに共通して含まれる重要語の数に基づいて、前記ファイル相関値を算出するのが好ましい。この場合、重要語に基づいてファイルイベント相関値が決定される。
前記相関テーブルは、ファイルイベントの発生時点におけるファイルの内容に基づく前記ファイル相関値を、前記イベント相関値として記憶するのが好ましい。この場合、各イベント発生時におけるファイルの内容に基づいて、イベント相関値が決定されるため、ファイルの内容が変動しても、イベント発生時の内容で相関を持つことができる。
前記抽出条件は、前記検出手段が検出したファイルイベントの発生時を起点とする過去の所定時間内において発生した他のファイルイベントを抽出対象とするものであるのが好ましい。
関連するファイルイベント同士の条件を規定した関連情報を有し、前記抽出条件は、前記検出手段が検出したファイルイベントについて、前記関連情報に規定する条件を満たす他のファイルイベントを抽出対象とするものであるのが好ましい。
前記相関テーブルは、ファイルイベント間の相関値を記憶可能に構成され、前記関連情報に規定する条件を満たすファイルイベント間については、前記相関テーブルに記憶される前記相関値は、当該相関値としての最大値であるのが好ましい。
ファイルイベントを選択する選択手段と、前記相関テーブルを参照して、前記選択手段によって選択されたファイルイベントに関連する他のファイルイベントを取得する取得手段と、前記選択手段によって選択されたファイルイベント、及び前記取得手段によって取得されたファイルイベントを表示する表示手段と、を更に備えるのが好ましい。この場合、関連するファイルイベントが表示されるため、利用者にとって分かり易い表示となる。
前記取得手段は、前記相関テーブルを参照して、前記選択手段によって選択されたファイルイベントとの相関値が、閾値よりも高い他のファイルイベントを取得するのが好ましい。
前記選択手段は、ファイルを選択するファイル選択手段を含み、選択されたファイルに対する最新のファイルイベントを選択するのが好ましい。
コンピュータプログラムに係る本発明は、コンピュータを、ファイルイベント相関生成装置として機能させるためのものである。
第2の本発明は、ネットワークを介して接続された情報端末を管理する管理装置であって、情報端末において発生したファイルイベントを示すファイルイベント情報及びファイルイベント間の相関に関する相関情報を、複数の情報端末からネットワークを介して受信することができる受信手段と、前記受信手段によって受信したファイルイベント情報を記憶する管理用ファイルイベントテーブルと、前記受信手段によって受信した相関情報を記憶する管理用相関テーブルと、を備える管理装置である。
前記受信手段によって受信したファイルイベント情報が示すファイルイベントが、当該ファイルイベントが発生した情報端末とは別の外部コンピュータが関与する外部ファイルイベントである場合には、前記外部ファイルイベントに関連する他のファイルイベントを、外部ファイルイベント用の抽出条件に従って、前記管理用ファイルイベントテーブルから抽出する抽出手段を、更に備え、前記管理要相関テーブルには、前記外部ファイルイベントと、前記抽出手段が抽出した他のファイルイベントと、が関連付けて記憶されるのが好ましい。この場合、端末間のファイルイベントネットワークを形成することができる。
前記外部ファイルイベントと、前記抽出手段が抽出した他のファイルイベントと、の間のファイル内容の相関を示すファイル相関値を決定する決定手段を、更に備え、前記管理用相関テーブルは、前記決定手段が決定したファイル相関値を、前記外部ファイルイベントと前記抽出手段が抽出した他のファイルイベントとの間のイベント相関値として記憶するのが好ましい。
前記外部ファイルイベント用の前記抽出条件は、前記外部コンピュータにおけるファイルイベントであって、前記外部ファイルイベントとほぼ同時に発生し、かつ、前記外部ファイルイベントが対象とするファイルと共通するファイルを対象とするファイルイベントが抽出対象とされるものであるのが好ましい。
前記外部ファイルイベント用の前記抽出条件は、前記外部ファイルイベントが対象とするファイルを対象として、前記外部ファイルイベントの発生よりも過去に発生したファイルイベントが抽出対象とされるものであるのが好ましい。
前記外部ファイルイベント用の前記抽出条件は、当該外部ファイルイベントが発生した情報端末において受信又は送信された電子メールと同一の電子メールについて、前記外部コンピュータにおいて発生した送信ファイルイベント又は受信ファイルイベントが抽出対象とされるものであるのが好ましい。
ファイルイベントを選択する選択手段と、前記管理用相関テーブルを参照して、前記選択手段によって選択されたファイルイベントと関連する他のファイルイベントを取得する取得手段と、前記選択手段によって選択されたファイルイベント、及び前記取得手段によって取得されたファイルイベントを表示する表示手段と、を更に備えるのが好ましい。
前記取得手段は、フ前記管理用相関テーブルを参照して、前記選択手段によって選択されたファイルイベントとの相関値が閾値よりも高い、他のファイルイベントを取得するのが好ましい。
コンピュータプログラムに係る本発明は、コンピュータを、前記管理装置として機能させるためのコンピュータプログラムである。
本発明によれば、複数のファイルイベントを関連付けたファイルイベントネットワークを得ることができる。
以下、本発明の実施形態を図面に基づいて説明する。
[1.ファイル管理システムの全体構成]
図1は、ファイル管理システム1の全体を示している。このシステム1は、LAN等のネットワーク(TCP/IPネットワーク)2を介して接続された1又は複数の情報端末(クライアント端末)3a,3b,3cを有している。また、システム1は、情報端末3a,3b,3cの管理を行う管理サーバ4を含んでいる。
情報端末3a,3b,3c及び管理サーバ4は、コンピュータプログラムを実行可能なコンピュータによって構成されており、それぞれ、コンピュータプログラムが記憶されるハードディスクやメモリ等の記憶部(図示省略)と、コンピュータプログラムを実行するためのCPU等の演算部(図示省略)と、画面表示を行うための表示部(図示省略)と、入力を行うための入力部(キーボード、マウス等;図示省略)と、を有している。
情報端末3a,3b,3c及び管理サーバ4は、記憶部に記憶されているファイルに対してアクセス(読み書き)するためのファイルシステムを有している。ファイルシステムは、情報端末3a,3b,3c及び管理サーバ4に搭載されたオペレーティングシステムの機能の一つである。
本システム1内の情報端末3a,3b,3c及び管理サーバ4は、許可された範囲内で、システム1内の他の情報端末へのアクセスが可能となっており、この機能もオペレーティングシステムによってサポートされている。
また、情報端末3a,3b,3c及び管理サーバ4は、インターネット(外部ネットワーク)5上のWebサーバ6にアクセスして、Webページの参照が可能となっている。さらに、情報端末3a,3b,3c及び管理サーバ4は、インターネットを利用して、電子メールの利用も可能となっている。
図1に示すように、情報端末3a,3b,3cには、エージェントコンピュータプログラム(以下、「エージェント」という)P1がインストールされている。管理サーバ4には、管理コンピュータプログラム(以下、「管理プログラム」という)P2がインストールされている。
なお、これらのコンピュータプログラムP1,P2を総称して、「コンピュータプログラムセット」という。
[2.情報端末(ファイルイベント相関生成装置)について]
前記情報端末3a,3b,3cでは、それぞれ、前記エージェントP1が常駐しており、このエージェントP1によって、各情報端末3a,3b,3cは、ファイルイベント相関生成装置として機能する。
エージェントP1は、常駐する情報端末3a,3b,3cにおいて発生するファイルイベントを監視して検出し、ファイルイベントネットワークを形成する機能を有している。また、エージェントP1は、ファイルイベントネットワークを用いて、情報端末3a,3b,3cに保存されているファイルを検索する機能も有している。
[2.1 ファイル]
本実施形態では、エージェントP1によって監視されるファイルイベントが対象とする「ファイル」は、テキスト情報を持つ電子ファイルを指すものとする。テキスト情報はファイルが持つメタ情報も含むものとする。いわゆる画像ファイルも、メタ情報としてテキスト情報を有するため、「ファイル」に含まれる。
つまり、ファイルとしては、文書ファイル、電子メール、Webページファイル、画像等のバイナリファイルが挙げられる。
[2.2 ファイルイベント]
ファイルイベントとは、ファイルに対する情報端末からの何らかの処理をいう。具体的には、文書ファイルについては、ファイルイベントとは、例えば、文書の作成、参照、更新、又はファイル削除などをいう。電子メールについては、ファイルイベントとは、送信又は受信などをいう。Webページファイルについては、ファイルイベントとは、Webページの参照などをいう。画像ファイルについては、画像の参照などをいう。
なお、以下では、ファイルイベントを、単に「イベント」ということもある。
ファイルイベントの対象となるファイルは、エージェントP1が常駐する情報端末3a,3b,3cの外部(システム1内の他の情報端末、管理サーバ、又はインターネット上のWebサーバなど)にあってもよい。換言すると、ファイルは、エージェントP1が常駐する情報端末3a,3b,3cにネットワークを介して接続された他のコンピュータ(外部コンピュータ)にあってもよい。
このように、エージェントP1が監視対象とするファイルイベントには、当該エージェントP1が常駐する情報端末が自己ファイルを操作するものに限られず、ネットワーク越しに、外部のファイルを操作するものも含まれる。
[2.3 情報端末のデータベース]
図1に示すように、エージェントP1は、常駐する情報端末3a,3b,3cの記憶部にデータベースDB1となる領域を確保する。図2に示すように、このデータベースDB1には、ファイルイベントテーブルT1、相関テーブルT2、重要語テーブルT3が含まれる。
[2.3.1 ファイルイベントテーブル]
ファイルイベントテーブルT1は、エージェントP1が検出したファイルイベントを示すファイルイベント情報(アクセス情報)を記憶するためのものである。エージェントP1は、検出したファイルイベント毎に、ファイルイベント情報としてイベントレコードを生成し、ファイルイベントテーブルT1に蓄積する。
図3は、ファイルイベントテーブルT1に蓄積されるイベントレコードの項目一覧を示している。
イベントレコードは、ID、イベント発生日時、イベント種別、事象、ホスト名、アクセス端末、被アクセス端末、被アクセスファイルパス、被アクセスファイル名、対応イベントID、転送先ファイルパス、転送先ファイル名、書き込みサイズ、Message−ID、タイトル、差出人メールアドレス、宛先メールアドレス、添付ファイル、及び、Refereceの各項目を有する。
エージェントP1は、イベントを検出すると、当該イベントについて、可能な範囲で上記各項目を抽出して、1件のイベントレコードを生成し、ファイルイベントテーブルに追加保存する。
前記IDは、当該イベントに付与され、情報端末3a,3b,3c上においてユニークな識別子である。前記イベント発生日時は、当該イベントが発生した日時である。
前記イベント種別は、当該イベントの種別を示すものである。イベントの種別には、文書アクセス、電子メール送信、電子メール受信、Webアクセス、及びバイナリファイルアクセスなどがある。
前記事象は、イベント種別の詳細事項を示すものである。イベント種別が、文書アクセスである場合、事象には、例えば、作成イベント、更新イベント、削除イベント、参照イベントなどがある。
前記イベント種別及び前記事象によって、イベントの種類が特定される。
なお、利用者からみたファイルへの操作には、ファイルの複製、ファイルの移動、ファイルの名前変更があるが、これらの操作は、本実施形態では、上記事象の組み合わせとして取り扱われる。
つまり、ファイルの複製は、複製元ファイルへの参照イベントと、複製ファイルの作成イベントという、2つのイベントの発生として取り扱われる。
また、ファイルの移動は、移動対象のファイルを移動元ファイルパスにおいて削除する削除イベントと、移動対象のファイルを移動先(転送先)ファイルパスにおいて作成する作成イベントという、2つのイベントの発生として取り扱われる。
さらに、ファイルの名前変更は、名前変更前のファイルの削除イベントと、名前変更後のファイルの作成イベントという、2つのイベントの発生として取り扱われる。
前記ホスト名は、エージェントP1が常駐する情報端末3a,3b,3cのホスト名である。
前記アクセス端末は、ファイルへのアクセスを行っている情報端末3a,3b,3cのアドレスを指す。ある情報端末3a,3b,3cが、自端末上のファイルへのアクセスを行う場合には、自端末のアドレスが、記録される。一方、自端末上のファイルへのアクセスが、他端末から行われた場合には、当該他端末のアドレスが記録される。
前記被アクセス端末は、被アクセスファイルが存在する情報端末3a,3b,3cのアドレスを指す。ある情報端末3a,3b,3cが、自端末上のファイルへのアクセスを行う場合には、自端末のアドレスが、記録される。一方、自端末から、他の端末上に存在するファイルに直接アクセスする場合には、当該他の端末のアドレスが記録される。
前記被アクセスファイルパスは、当該イベントの対象となるファイルの情報端末3a,3b,3c上のパスを指す。Webアクセスの場合は、当該WebのURLが記録される。
前記被アクセスファイル名は、当該イベントの対象となるファイルの名前をいう。Webアクセスの場合には、使用されない。
前記対応イベントIDは、ファイルへの操作が、ファイル複製、ファイル移動、又はファイル名前変更であった場合に発生する削除イベント又は参照イベントにおいて、同時に発生する他方のイベントである作成イベントのIDを示すものである。例えば、ファイル複製操作に伴って参照イベントと作成イベントの2つのイベントが検出されると、イベントレコードの生成の際に、前記参照イベントのイベントレコードの対応イベントIDには、前記作成イベントのIDが記録される。
前記転送先ファイルパスは、ファイルへの操作が、ファイル複製、ファイル移動、又はファイル名前変更であった場合に発生する削除イベント又は参照イベントにおいて、同時に発生する他方のイベントである作成イベントの対象となる被アクセスファイルパスを示す。
前記転送先ファイル名は、ファイルへの操作が、ファイル複製、ファイル移動、又はファイル名前変更であった場合に発生する削除イベント又は参照イベントにおいて、同時に発生する他方のイベントである作成イベントの対象となる被アクセスファイル名を示す。
前記書き込みサイズは、当該イベント発生時のファイルへの書き込みサイズを指す。
前記Message−IDは、電子メールのヘッダの「Message−ID」フィールドの値を指す。Message−IDは、電子メールをユニークに特定することができる。
前記タイトルは、電子メールヘッダの「Subject」フィールドの値を指す。
前記差出人メールアドレスは、電子メールヘッダの「From」フィールドの値を指す。
前記宛先メールアドレスは、電子メールヘッダの「To」フィールド及び「Cc」フィールドの値を指す。
前記添付ファイルは、電子メールに添付されているファイルのファイル名を指す。
前記Refereceは、電子メールのヘッダの「Referece」フィールドの値を指す。
上記のように、ファイルイベントテーブルには、イベントを個々に特定する情報(ID)、イベントの種類を特定する情報(イベント種別、事象)、ファイルアクセスに関与したコンピュータを特定する情報(アクセス端末、被アクセス端末)、イベントの対象となるファイルを特定する情報(被アクセスファイルパス、被アクセスファイル、転送先ファイルパス、転送先ファイル名)、イベントが電子メールに関する場合には、メールの種類を特定する情報などが含まれる。
[2.3.2 相関テーブル]
エージェントP1は、イベント間の相関を示すリンク情報(相関情報)を生成する機能を有しており、当該リンク情報(相関情報)は、相関テーブル(リンク情報テーブル)に記録される。
エージェントP1は、一つのリンク毎に、リンク情報(相関情報)としてリンクレコードを生成し、相関テーブルT2に蓄積する。
リンクは、2つのイベント間に、2つ生成される。例えば、イベントAとイベントnとがあった場合、イベントAからみたイベントnへのリンク(L(A−>n))と、イベントnからみたイベントAへのリンク(L(n−>A))が生成され、イベント間が双方向リンクによって結ばれる。
図4は、相関テーブルに記録されるリンクレコードの項目一覧を示している。
リンクレコードは、リンク元ID、リンク先ID、リンク強度(相関値)、及びリンク種別の各項目を有する。
エージェントP1は、イベントを検出すると関連する他のイベントを、ファイルイベントテーブルT1から抽出して、抽出されたイベント1件あたり、2個のリンクレコードを生成し、相関テーブル(リンクテーブル)に追加保存する。
つまり、検出されたイベントからみた抽出イベントへのリンクと、抽出されたイベントからみた検出イベントへのリンクとが生成、保存される。
リンクレコードの各項目のうち、前記リンク元IDは、リンク元(source)であるファイルイベントのIDを指す。
前記リンク先IDは、リンク先(Destination)であるファイルイベントのIDを指す。
前記リンク元IDと前記リンク先IDには、ファイルイベントテーブルT1における項目「ID」が示すIDが記録される。つまり、各リンクレコードが示すリンクが対象とするイベントは、前記リンク元IDと前記リンク先IDによって特定される。
前記リンク強度は、リンク元イベントからみたリンク先イベントに対するリンク強度の度合い(イベント相関値)を示す。ここでは、イベント相関値は、0〜1の値をとり、相関値=1が、最も高い相関を示す値である。
前記リンク種別は、リンクの種別を示すものである。リンク種別に記録された情報は、リンクを画面表示する際に、リンクに付随して表示され、利用者がイベント間の関係を理解するのに役立つ。
リンク種別には、ファイルの複製操作、ファイルの移動操作、ファイルの名前変更操作、電子メールへのファイル添付操作、メール送信操作、メール転送操作、メール返信操作、同一Subjectであるメール、ほぼ複製、部分引用、取り込み、部分共有などがある。
エージェントP1は、上記ファイルイベントテーブルT1と相関テーブル(リンクテーブル)T2とを生成することで、ノードとなるイベントをリンクで繋いだファイルイベントネットワークを生成する。つまり、ファイルイベントネットワークのノードとなるイベントは、ファイルイベントテーブルT1によって特定され、ファイルイベントネットワークのリンクは、相関テーブルT2によって特定される。
[2.3.3 重要語テーブル]
本実施形態において、相関テーブルT2に登録されるイベント相関値には、各イベントが対象とするファイルの相関値が用いられる。
ファイルの内容の相関をとるため、本実施形態のエージェントP1は、ファイルから1又は複数の重要語(キーワード)を抽出し、重要語テーブルに記録する。
エージェントP1は、一つの重要語毎に、重要語情報として重要語レコードを生成し、重要語テーブルT3に蓄積する。
また、重要語レコードは、イベントが発生する度に、当該イベントが対象とするファイルに含まれる重要語それぞれについて生成される。
同一ファイル名XについてイベントAとイベントnという2つのイベントがあった場合、イベントA発生時におけるファイルXの内容と、イベントn発生時におけるファイルXの内容は一部異なることがありえるが、イベント発生の度に、重要語が抽出されて、重要語テーブルに記録されるため、イベント発生時におけるファイル相関値を決定することが可能である。
図5は、重要語テーブルT3に記録される重要語レコードの項目一覧を示している。
重要語レコードは、ID、イベント発生日時、ホスト名、被アクセスファイルパス、被アクセスファイル名、及び重要語の各項目を有する。
前記IDは、重要語の抽出元のファイルを対象とするイベントのIDであり、ファイルイベントレコードのIDに対応する。
前記イベント発生日時は、前記IDで特定されるファイルイベントが発生した日時を示し、ファイルイベントレコードのイベント発生日時に対応する。
前記ホスト名は、エージェントが常駐する情報端末のホスト名を指し、ファイルイベントレコードのホスト名に対応する。
前記被アクセスファイルパスは、前記IDで特定されるイベントの対象となるファイルの情報端末3a,3b,3c上のパスを指し、ファイルイベントレコードの被アクセスファイルパスに対応する。
前記被アクセスファイル名は、前記IDで特定されるイベントの対象となるファイルの名前をいい、ファイルイベントレコードの被アクセスファイル名に対応する。
前記重要語には、ファイルから抽出した重要語(1語)が記録される。
このように、重要語レコードは、重要語と、その抽出元ファイル、当該抽出元ファイルを対象とするイベントとを、関連付けたものとなっている。
[3.管理サーバ(管理装置)について]
管理サーバ4では、前記管理プログラムP2が常駐しており、システム1内の情報端末3a,3b,3cから、ファイルイベントネットワークを示すファイルイベント情報及びリンク情報(相関情報)を取得して、保管する。
管理プログラムP2は、各情報端末3a,3b,3cが有する端末単位のファイルイベントネットワーク情報を、各情報端末3a,3b,3cから受信し、さらに、端末間のファイルイベントネットワークを生成する。
管理プログラムP2ha,端末間のファイルイベントネットワークを用いて、システム内の情報端末3a,3b,3cに保存されているファイルを、端末横断的に検索する機能をも有している。
[3.1 管理サーバのデータベース]
図1に示すように、管理プログラムP2は、常駐する管理サーバ4の記憶部にデータベースDB2となる領域を確保する。図6に示すように、このデータベースDB2には、管理用ファイルイベントテーブルT4、及び管理用相関テーブルT5が含まれる。
[3.1.1 管理用ファイルイベントテーブル]
管理用ファイルイベントテーブルT4は、各情報端末3a,3b,3cのエージェントP1から送信されたファイルイベント情報(イベントレコード)を記憶するためのものである。
管理用ファイルイベントテーブルT4に保存されるイベントレコードの項目は、図7に示すとおりであり、「エージェントID」が追加されている他は、情報端末3a,3b,3cのファイルイベントテーブルT1におけるイベントレコードの項目と同様である。
前記エージェントIDは、本システム1内において、エージェントP1(情報端末)を識別する識別子である。
このエージェントIDは、情報端末3a,3b,3cが、管理サーバに、イベントレコードを送信する際に、情報端末によって付加されるが、受信側の管理サーバで付加してもよい。
このエージェントIDが追加されることで、管理用ファイルイベントテーブルT4上では、各イベントが、どのエージェントによって検出されたものであるかを識別することができる。
[3.1.2 管理用相関テーブル]
管理用相関テーブルT5は、各情報端末3a,3b,3cのエージェントP1から送信された相関情報(リンクレコード)を記憶するためのものである。
管理用相関テーブルT5に保存されるリンクレコードの項目は、図8に示すとおりであり、「リンク元エージェントID」及び「リンク先エージェントID」が追加されている他は、情報端末3a,3b,3cの相関テーブルT2におけるリンクレコードの項目と同様である。
前記リンク元エージェントIDは、リンク元となるファイルイベントを検出したエージェントP1(情報端末)を示すエージェントIDであり、管理用ファイルイベントテーブルT4のエージェントIDに対応する。
前記リンク先エージェントIDは、リンク先となるファイルイベントを検出したエージェントP1(情報端末)を示すエージェントIDであり、管理用ファイルイベントテーブルT4のエージェントIDに対応する。
[4.エージェントの処理内容]
以下、エージェントP1が常駐する情報端末(ファイルイベント相関生成装置)3a,3b,3cの処理内容について説明する。
[4.1 ファイルイベントネットワーク生成]
図9は、エージェントP1が情報端末3a,3b,3cにおいてファイルイベントを検出した場合の処理の流れを示している。なお、エージェントP1は、常時、情報端末3a,3b,3cにおいて発生するファイルイベントを監視している。
エージェントP1が、ファイルF−AへのファイルイベントAを検出すると(ステップS1−1)、当該イベントAが、解析対象のイベントであるか否かを判定する。
イベントAが解析対象のファイルイベントである場合は、ステップS1−3に進み、解析対象でない場合は、図9のフローを終了する(ステップS1−2)。例えば以下の(1)〜(3)の場合は、イベントは、解析対象とならない。
(1)システムの利用者により対象外に指定されたアプリケーションプロセスによるファイルへのアクセス(例:アンチウィルスソフトによるファイルへのアクセス)。
(2)システムの利用者により対象外に指定されたフォルダにあるファイルに対するアクセス。
(3)同一のファイルに対するファイルイベントが、設定された時間の間に連続的に発生した場合。
上記(1)は、アプリケーションによる自動的なファイルアクセスを排除し、専ら、利用者の操作に起因するファイルアクセスを解析対象とするためのものである。上記(2)は、利用者が、解析対象を自由に決めるためのものである。上記(3)は、利用者側からすると一つのファイル操作とみえるものであっても、アプリケーションによっては、自動的に数回のファイルアクセスを実行することがあるため、設定された時間(例えば、1[s])内の同一ファイルへのイベントは、1回のファイルイベントとみなすためのものである。
ステップS1−3において、エージェントP1は、解析対象とされた検出イベントAについてのイベントレコード(図3参照)を生成し、当該情報端末3a,3b,3cのファイルイベントテーブルT1に登録する。イベントレコードは、そのイベントの種類などの解析結果とイベントが対象とするファイルに関する情報とを用いて生成することができる。なお、イベントの種類の解析は、ファイルへのアクセスログを解析することで行える。
続いて、エージェントP1は、検出イベントAの対象であるファイルF−Aのテキスト情報から重要語(キーワード)を抽出し(ステップS1−4)、重要語ごとに重要語レコード(図5参照)を生成して、重要語テーブルT3に登録する(ステップS1−5)。
重要語の抽出処理では、様々な形式のファイルから、プレーンテキスト情報を抽出するフィルタを適用し、プレーンテキストから形態素解析処理によって、単語を切り取る。そして、切り取られた単語情報を元に、名詞の連結に基づいた重要語抽出が行われる。名詞の連結に基づいた重要語抽出が行われる。なお、名詞の連結に基づく重要語抽出は、例えば、TermExtract(http://gensen.dl.itc.u−tokyo.ac.jp/termextract.html)によって行える。
ここで、重要語とは、そのファイルの内容を特徴付ける上で重要と考えられる語句をいう。単名詞が連結してなる複合語を考えた場合、他の単名詞と連結して複合語を構成する頻度が高い単名詞は、重要語といえる。また、テキスト情報において出現頻度が高い用語は、重要語といえる。
なお、文章から重要語(キーワード)を抽出する手法は、様々なものが提案されており、本発明において、重要語を抽出する手法自体は、上記の例に限定されるものではなく、様々なものが利用可能である。
本実施形態では、イベントA発生時に、当該イベントA発生時点におけるファイルF−Aの内容に基づいて、重要語が抽出される。
抽出された重要語は、事後的に、ファイル相関値の算出に用いられるが、当該イベントA発生時点におけるファイルF−Aの内容に基づく重要語が、イベントAと対応付けられて、重要語テーブルに保存されるため、イベントA発生時のファイルF−Aの内容でファイル相関値を算出することができる。
続いて、イベントAに関連する他のイベントとの間のリンク強度(イベント相関値)を決定する処理が行われる(ステップS1−6〜S1−11)。
この処理は、イベントAに関連する他のイベントを抽出する処理(ステップS1−6,S1−8)、及び、ファイルイベントAと抽出された他のファイルイベントnとの間のイベント相関値を決定する処理(ステップS1−7,S1−9〜11)を有している。
イベントAに関連する他のイベントは、ファイルイベントファイルT1に保存されている、過去又は同時に発生したイベントの中から、所定の抽出条件に従って抽出される。
本実施形態において、抽出条件は、2種類設定されており、いずれかの抽出条件に該当すると、「関連する他のイベント」として抽出される。
第1の抽出条件は、検出イベントAが発生した時点を基点とする過去T秒に発生した他のイベントを抽出対象とするものである(ステップS1−8)。この第1の抽出条件は、主に、イベントAと実質的に同一時間帯に発生した他のイベントを抽出するためのものである。
前記Tは、可変パラメータであり、利用者が適宜設定できる。また、イベントの種別(事象)毎にTの値を異ならせても良い。
前記Tは、同一時間帯を示すものであるため、通常、数秒程度に設定されるが、イベントによっては、比較的長い時間を同一時間帯とみなすべき場合もあるため、3600秒(=1時間)のように大きな値に設定されてもよい。
第2の抽出条件は、イベントAの発生日時によらず、イベントAに「明らかに関連のあるイベント」を抽出対象とするものである(ステップS1−8)。「明らかに関連のあるイベント」を抽出対象とするため、エージェントP1は、明らかに関連するファイルイベント同士の条件を規定した「関連情報」を有している。
前記関連情報が規定する「明らかに関連のあるイベント」の条件は、例えば、下記(1)〜(6)のとおりである。
(1)同一ファイルに対する過去のイベント
イベントAが対象とするファイルF−1について過去に発生したイベントのうち、最新のものは、イベントAと明らかに関連があるとみなす。
なお、ここでは、「同一ファイル」を「パスおよび名前が同一であるファイル」と定義する。
したがって、同一ファイルに対する過去のイベントであるか否かは、ファイルイベントテーブルの「被アクセスファイルパス」と「被アクセスファイル名」の参照によって判定できる。
また、最新のイベントは、ファイルイベントテーブルの「イベント発生日時」の参照によって判定できる。
(2)ファイルの複製操作に伴って発生する2つのイベント
イベントAが、ファイルF−Aの複製操作に伴って発生したファイルF−Aへの参照イベントであった場合、当該参照イベントAは、複製先ファイルF−A’の作成イベントと明らかに関連があるとみなす。
(3)ファイルの移動操作、名前変更操作に伴って発生する2つのイベント
イベントAが、ファイルF−Aの移動又は名前変更操作に伴って発生したファイルF−Aの削除イベントであった場合、当該削除イベントAは、移動先ファイル又は名前変更後ファイルF−A’の作成イベントと、明らかに関連があるとみなす。
ファイル複製操作、移動操作、名前変更操作の場合、イベントレコードの「対応イベントID」に、対応する作成イベントのIDが記録されているため、「対応イベントID」が記録されていれば、対応イベントIDで特定されるイベントを、明らかに関連があるイベントとして特定することができる。
(4)同一電子メールの送信イベントと受信イベント
電子メールの宛先(Ccを含む)に、自己端末を含めた場合、送信した電子メールを自己端末でも受信することになる。このような場合、当該電子メールの送信イベントと、当該電子メールの受信イベントとは明らかに関連があるとみなす。
同一メールの場合、電子メールのヘッダに含まれる「Message−ID」(電子メールをユニークに特定するID)が一致するため、イベントレコードの「Message−ID」を参照することで、同一電子メールを特定することができる。
(5)同一スレッドにある電子メールについてのイベント
ある電子メールの送信イベント又は受信イベントと、その電子メールと同一スレッドとして扱うことの出来る他の電子メールの送信イベント又は受信イベントとは明らかに関連があるとみなす。
具体的には、ある送信メールの送信イベントと、その送信メールに応答して返信されてきた受信メールの受信イベントとは、明らかに関連があるとみなす。また、逆に、ある受信メールの受信イベントと、その受信メールに応答して返信する送信メールの送信イベントも、明らかに関連があるとみなす。
ある電子メールへの返信メールのヘッダには、当該電子メールのMessage−IDが、「Referece」として設定されている。したがって、イベントレコードの「Referece」を参照すれば、同一スレッドとして扱うことのできる他の電子メールのMessage−IDが特定できる。Message−IDが特定できれば、イベントレコードの「Message−ID」を参照することで、他の電子メールを特定できる。
(6)電子メールの送受信イベントと添付ファイルの作成イベント又は参照イベント
受信した電子メールの添付ファイルを、それ単独のファイルとして端末上に別に作成(保存)したとき、その別ファイルの作成イベントと、添付元の電子メールの受信イベントとは明らかに関連があるとみなす。
電子メールの添付ファイルを、端末上に別に作成する場合、当該作成イベントのイベントレコードの「Message−ID」項目には、添付元の電子メールのMessage−IDが登録される。したがって、イベントレコードのMessage−IDを参照すれば、関連のあるイベントを特定できる。
また、端末上に存在する単独のファイルを電子メールに添付ファイルする操作を行った場合、当該ファイルへの参照イベントが発生する。その参照イベントと、添付先の電子メールの送信イベントとは、明らかに関連があるとみなす。
ファイルを電子メールに添付することで発生した参照イベントのイベントレコードの「Message−ID」項目には、添付先の電子メールのMessage−IDが登録される。したがって、イベントレコードのMessage−IDを参照すれば、関連のあるイベントを特定できる。
図9に示すように、本実施形態では、第2の抽出条件(明らかに関連性があるイベント)による抽出(ステップS1−6)を先に行い、その後、第1の抽出条件(過去T秒以内のイベント)による抽出を行う(ステップS1−8)。
第2の抽出条件(明らかに関連性があるイベント)によって1又は複数のイベントn(nは1以上の自然数)がファイルイベントテーブルT1から抽出されると(ステップS1−6)、検出イベントAとイベントnとの間でリンク情報(相関情報;リンクレコード)が生成される。第2の抽出条件では、2つのイベント間に明らかに関連性があるとみなしているため、リンク強度は最大値である1に設定される。
具体的には、検出イベントAと抽出イベントnとの間のリンクとして、第1リンクL(A−>n)と、第2リンクL(n−>A)の2つのリンクが生成される。
第1リンクL(A−>n)の場合、リンクレコードのリンク元IDには検出イベントAのIDが登録され、リンク先IDには抽出イベントnのIDが登録され、リンク強度として「1」が設定される。
第2リンクL(n−>A)の場合、リンクレコードのリンク元IDには抽出イベントnのIDが登録され、リンク先IDには検出イベントAのIDが登録され、リンク強度として「1」が設定される。
また、リンク先イベントとリンク元イベントとの関連性に基づき、リンクの種別(複製、移動、名前変更、ファイル添付等)が特定され、当該リンク種別が、リンクレコードのリンク種別に登録される。
上記のように生成されたリンクレコードは、相関テーブルT2に登録される(ステップS1−7)。
第1の抽出条件(過去T秒以内のイベント)によって1又は複数のイベントn(nは1以上の自然数)がファイルイベントテーブルT1から抽出されると(ステップS1−8)、上記と同様に、検出イベントAとイベントnとの間でリンク情報(リンクレコード)が生成される。
第1の抽出条件によって抽出されたイベントnとの間のリンク強度は、重要語を用いて算出される。ここでのリンク強度(イベント相関値)は、検出イベントAが対象とするファイルと、抽出イベントnが対象とするファイルとのファイル相関値が用いられる。ここでは、ファイル相関値として、各ファイルに含まれる重要語の数に対する、2つのファイル間に共通する重要語の数の割合を用いる。
リンク強度となるファイル相関値の算出方法は下記のとおりである。
まず、イベントAについての重要語(ステップS1−4にて抽出)の数を算出し、この重要語数をkeyword−Aとする。
また、イベントnが対象とするファイルの重要語を、重要語テーブルT3から取得し、イベントnについての重要語数を算出し、この重要語数をkeyword−nとする(ステップS1−9)。
さらに、イベントAとイベントnに共通する重要語の数を、keyword−(A∩n)とする。
イベントAからみた、イベントnに対する第1リンクL(A−>n)の強度は、次の式によって算出される(ステップS1−10)。
L(A−>n)の強度=(keyword−(A∩n))÷(keyword−A)
イベントnからみた、イベントAに対する第2リンクL(n−>A)の強度は、次の式によって算出される(ステップS1−10)。
L(n−>A)の強度=(keyword−(A∩n))÷(keyword−n)
また、イベントA及びイベントnのうち、一方のイベントが参照で他方のイベントが更新であるようなリンクについては、リンク強度に従い、下記表1に示す「関係」を、リンクレコードのリンク種別に登録する。
Figure 2009199356
上記のような「関係」は、あるファイルを開いて参照し、他のファイルを作成した場合のものであり、「ほぼ複製」は、作成イベントAの対象ファイルと、参照イベントnの対象ファイルとの相関(リンク強度)が、どちらのイベントからみても高い場合をいう。
「部分引用」は、作成イベントAの対象ファイルからみた参照イベントnの対象ファイルとの相関(リンク強度)は高いが、参照イベントnの対象ファイルからみた作成イベントAの対象ファイルとの相関(リンク強度)は低い場合をいう。
「取り込み」は、作成イベントAの対象ファイルからみた参照イベントnの対象ファイルとの相関(リンク強度)は低いが、参照イベントnの対象ファイルからみた作成イベントAの対象ファイルとの相関(リンク強度)は高い場合をいう。
「部分共有」は、作成イベントAの対象ファイルと、参照イベントnの対象ファイルとの相関(リンク強度)が、どちらのイベントからみても低い場合をいう。
上記のように生成されたリンクレコードは、相関テーブルT2に登録される(ステップS1−11)。
なお、第1リンク及び第2リンクのリンクレコードを生成する処理は、抽出イベントnの数nに応じた分だけ行われる。
以上のように、イベントAが発生すると、ファイルイベントネットワークへのイベントAの追加が行われるとともに、イベントAと他のイベントとの間のリンクが生成されるため、ファイルイベントネットワークが更新される。
[4.2 エージェントのインターフェース]
エージェントP1は、ファイルイベントネットワーク(相関ネットワーク)を、利用者が参照するためのインターフェース(表示画面)を提供する。
エージェントP1が提供するインターフェースの処理フローは、図10に示すとおりである。なお、利用者は、図10のフローを任意のタイミングで終了できる。
図10に示すように、エージェントP1は、情報端末3a,3b,3cの入力部を介して、利用者が指定するファイルを特定する情報(ファイルパス及びファイル名)の入力を受け付ける(ステップS2−1;ファイルの選択)。
利用者が選択したファイルが、ファイルイベントテーブルT1において登録されているいずれかのイベントが対象とするファイルである場合には、ステップS2−4に進む。一方、利用者が選択したファイルが、ファイルイベントテーブルT1において登録されているどのイベントも対象としないものである場合には、ステップS2−3に進む。
ステップS2−3においては、利用者が選択したファイルに対する参照イベントの発生が検出されたものとして、図9に示す相関抽出フロー(ステップS1−3〜S1−11)を実行し、本フローを終了する。
ステップS2−4においては、利用者が選択したファイルに対する最新のファイルイベントが、主たる表示対象のファイルイベントとして特定(選択)される。
さらに、エージェントP1は、主たる表示対象のファイルイベントを起点に、ファイルネットワークにおいて、X階層分のリンクによって繋がるイベント及びイベント間のリンク情報をファイルイベントテーブルT1及び相関テーブルT2から取得する(ステップS2−5)。
ただし、リンク強度が、閾値以上のリンクのみを取得対象とする。閾値はシステムの利用者が決定することができる。なおここで上記「階層」1つはリンク1つ分に相当する。また、xは可変パラメータであり、システムの利用者が調整可能である。
そして、エージェントP1は、主たる表示対象のファイルイベントと、ステップS2−5において取得されたファイルイベントを画面表示する(ステップS2−6;ファイルイベントネットワークの部分的表示)。
図11は、上記の処理によって情報端末3a,3b,3cの表示部に表示される画面10を示している。この画面は、利用者が選択したファイルを対象とするファイルイベントの一覧を表示するファイルイベント一覧表示部11、解析開始ボタン12、ステップS2−6におけるファイルイベントネットワークの表示のためのネットワーク表示部13、選択されたファイルイベントの情報(イベントレコード)を表示するイベント表示部14、ステップS2−5において取得されるイベントを決めるための前記閾値の設定部15、前記階層の値Xを設定するための階層設定部16を備えている。
ネットワーク表示部13では、イベントe1〜e5をノードとし、各ノードをリンクL1〜L4で繋いだネットワークとして表示される。
また、各イベントe1〜e5には、対象とするファイルの名前(機密ファイルA,機密ファイルB、Subject「[重要]機密事項について」など)が付随して表示される。さらに、各イベントe1〜e5には、イベント種別又は事象(参照、作成、更新、メール送信など)も、付随して表示される。
また、各リンクL1〜L4には、当該リンクのリンクレコードにおいてリンク種別記録されている場合、当該リンク種別(コピー(複製)、引用、ファイル添付など)も付随して表示される。
上記のように、本実施形態では、選択されたファイルイベントに関連するファイルイベントネットワーク(の一部)を表示するため、利用者が、選択されたファイルイベントが対象とするファイルに関連する他のファイルを発見するのが容易である。
利用者は、表示されたイベントの中から、いずれかのイベントを選択することができる(ステップS2−7)。イベントが選択されると、当該イベントを主たる表示対象のイベントとして、ステップS2−5及びステップS2−6の処理が再度行われる。
[4.3 エージェントから管理サーバへの送信]
システム1内の各エージェントP1は、定期的に又は随時に、ファイルイベントテーブルT1の内容、及び相関テーブルT2の内容を、管理サーバ4へ送信する。管理サーバ4では、システム1内の全情報端末3a,3b,3cのエージェントP1から情報を集約する。
図12は、エージェントP1が管理サーバ4に情報を送り処理手順を示している。エージェントP1は、設定された時間、利用者の指示又は端末起動時などにおいて、管理サーバ4への送信処理を行う(ステップS3−1)。送信対象は、ファイルイベントテーブルT1の内容(イベント情報;アクセス情報)、及び相関テーブルT2の内容(相関情報;リンク情報)である。テーブルT1,T2の各レコードには、エージェントIDが付加された上で、管理サーバ4へ送信される。
送信された情報は、管理サーバ4によって受信され(ステップS3−2)、管理サーバ4は、受信した情報を管理用ファイルイベントテーブルT4と管理用相関テーブルT5に保存する(ステップS3−3)。
[5.管理プログラムの処理内容]
管理サーバ4は、各情報端末3a,3b,3cから、情報端末毎のファイルイベントネットワーク情報(イベント情報及相関情報)を取得すると、複数の情報端末をまたがるリンクを追加して、端末間ファイルイベントネットワークを生成する。
管理サーバ4(管理プログラムP2)は、情報端末毎のファイルイベントネットワーク情報(イベント情報及相関情報)を受信すると、次の(1)〜(3)ように関連のあるイベントを抽出し、当該イベント同士を「明らかに関連があるイベント」とみなし、リンク強度の値が「1」であるリンクを生成する。このリンクは、端末間をまたがるものとなる。
(1)図13に示すように、2端末間にまたがる文書の移動又は複製操作に対して、当該端末上でそれぞれ記録されたファイルイベント(削除イベント、作成イベント、参照イベントなど)。
(2)同一Message−IDを持つ電子メールの送信イベントと受信イベント(それぞれが別の端末上で記録される)。
(3)本システム1の配下ではない外部コンピュータ(インターネット上のWebサーバ6など)への、本システム1配下の端末からのアクセスに対して、各端末上で記録されたファイルイベント。
[5.1 ファイルイベント相関生成]
図14は、管理サーバ4(管理プログラム)が、情報端末3a,3b,3cから、ファイルイベントネットワーク情報(イベント情報及相関情報)を取得した場合の処理を示している。
管理サーバ4は、情報端末3a,3b,3cから受信し、管理用ファイルイベントテーブルT4に登録されたファイルイベントのうち、図13の処理が未だされていないものであって、当該ファイルイベントが発生した情報端末とは別のコンピュータ(システム内の他の情報端末又はシステム外のコンピュータ)が関与する外部ファイルイベントを、検索する(ステップS4−1)。
当該ファイルイベントが発生した情報端末とは別のコンピュータが関与する外部ファイルイベントとは、管理用ファイルイベントテーブルT4の「被アクセス端末」項目が外部コンピュータを示すイベント(外部コンピュータ上にあるファイルに対するアクセスを示すイベント)、管理用ファイルイベントテーブルT4の「アクセス端末」項目が外部コンピュータを示すイベント(外部コンピュータから自端末上のファイルに対してアクセスされたことを示すイベント)、又は、「被アクセス端末」項目及び「アクセス端末」項目の両方が外部コンピュータを示すイベント(例えば、他の情報端末上のファイルをさらに他の情報端末にコピーする操作を、自情報端末上から行うような場合)である。
ステップS4−1の検索の後、次に処理すべきイベント(以下、「イベントA」という)がある場合は、ステップS4−3に進む。なければ、図13のフローを終了する。
前記外部コンピュータが、本システム1の管理下にある情報端末3a,3b,3cである場合は、ステップS4−4に進む。管理下でない場合は、ステップS4−7に進む。
外部コンピュータが本システム1の管理下にある他の情報端末である場合、管理用ファイルイベントテーブルT4に記録されているファイルイベントのうち、当該他の情報端末のエージェントP1が記録したファイルイベントを対象として、以下の抽出条件(外部ファイルイベント用抽出条件)をすべて満たすイベントn(nは1以上の自然数)を検索する(ステップS4−4)。
外部ファイルイベント用の第1の抽出条件は、以下のとおりである。
(1)当該他の情報端末からみたアクセス先(又は被アクセス元)の端末が、イベントAを記録した端末であるイベントn。
(2)イベントnの発生日時が、イベントAの発生日時と同時刻帯である。
(3)イベントAにおける被アクセスファイルパス又は転送先ファイルパスと、イベントnにおける被アクセスファイルパス又は転送先ファイルパスとが同一である。
ただし、ある情報端末からみた外部コンピュータ上のファイルのパスは、その外部コンピュータの公開アドレスを基準にしたパスである場合がある。その場合、その公開アドレスを外部コンピュータのファイルシステム上のパスに読み替える。
上記第1の抽出条件により、他の情報端末(外部コンピュータ)におけるファイルイベントnであって、イベントAとほぼ同時に発生し、かつ、イベントAが対象とするファイルと共通するファイルを対象とするものが、抽出される。これらは、典型的には、2つの情報端末にまたがるファイルの移動操作又は複製操作である。
他の情報端末(外部コンピュータ)において対応するイベントnが存在する場合は、ステップS4−6に進む。存在しない場合は、ステップS4−2に戻る。
他の情報端末(外部コンピュータ)において対応するイベントnが存在する場合、管理サーバ4は、イベントAとイベントnの間に、リンク強度を「1」とする第1リンクL(A−>n)及び第2リンクL(n−>A)のリンクレコードを作成する。
また、リンクレコードのリンク種別には、リンク種別(複製、移動など)が記録される。
生成されたリンクレコードは、管理用相関テーブルT5に登録される。
前記外部コンピュータが、本システム1の管理下にないもの(Webサーバなど)である場合、ステップS4−7においては、管理サーバ4は、イベントAの対象である外部ファイルに対して過去に発生したイベントを、管理用ファイルイベントテーブルT4の中から検索して抽出する(第2の抽出条件)。
イベントAの対象である外部ファイルに対して過去に発生したイベントが存在する場合、ステップS4−9へ進む(ステップS4−8)。存在しなければ、ステップS4−2に戻る。
ステップS4−9では、イベントAの対象である外部ファイルに対して過去に発生したイベントのうち、最新のもの(以下、「イベントn’」という)と、イベントAとの間にリンク強度を1とする第1リンクL(A−>n’)及び第2リンクL(n’−>A)のリンクレコードを作成する。
作成されたリンクレコードは、管理用相関テーブルに登録される。
図15は、管理サーバ4において、図14の処理と並行して行われる他の処理を示している。図15の処理は、端末間での電子メールの送受信イベント間にリンクを形成するためのものである。
図15において、ステップS5−1及びステップS5−2は、図14のステップS4−1及びステップS4−2と同様である。
ステップS5−3において、管理サーバ4は、外部コンピュータ(他の情報端末)において発生したイベントであって、イベントAの対象である電子メールのMessage−IDと同じ値を持つ他の電子メールの送信イベント又は受信イベントを、管理用ファイルイベントテーブルT4から抽出する(第3の抽出条件)。
同一Message−IDのイベントn”(n”は1以上の自然数)が存在する場合は、ステップS5−5に進む(ステップS5−4)。存在しなければ、ステップS5−2に戻る。
ステップS5−5においては、イベントAとイベントn”との間にリンク強度を1とする第1リンクL(A−>n”)及び第2リンクL(n”−>A)のリンクレコードを形成する。また、リンクレコードのリンク種別には、リンクがメール送信である旨が記録される。
生成されたリンクレコードは、管理用相関テーブルT5に登録される。
以上の管理サーバ4側の処理によって、複数の端末3a,3b,3cをまたがって関連のあるファイルイベント間にリンクを形成することができる。したがって、管理サーバ4側では、システム1内でのファイル検索も容易に行える。
[5.2 インターフェース]
管理サーバ4(管理プログラムP2)は、端末間ファイルイベントネットワーク(相関ネットワーク)を、利用者が参照するためのインターフェース(表示画面)を提供する。
管理サーバ4が提供するインターフェースの処理フローは、図16に示すとおりである。なお、利用者は、図16のフローを任意のタイミングで終了できる。
図16に示すように、管理サーバ4は、その入力部を介して、利用者が指定するファイルイベントを特定する情報の入力を受け付ける(ステップS6−1;ファイルの選択)。管理サーバ4は、指定されたファイルイベントを、主たる表示対象のファイルイベントとする。
そして、管理サーバ4は、主たる表示対象のファイルイベントを起点に、端末ファイルネットワークにおいて、X階層分のリンクによって繋がるイベント及びイベント間のリンク情報を管理用ファイルイベントテーブルT4及び管理用相関テーブルT5から取得する(ステップS6−2)。
ただし、リンク強度が、閾値以上のリンクのみを取得対象とする。閾値はシステムの利用者が決定することができる。なおここで上記「階層」1つはリンク1つ分に相当する。また、xは可変パラメータであり、システムの利用者が調整可能である。
そして、管理サーバ4は、主たる表示対象のファイルイベントと、ステップS6−2において取得されたファイルイベントを画面表示する(ステップS6−3;ファイルイベントネットワークの部分的表示)。
図17は、上記の処理によって管理サーバ4の表示部に表示される画面10を示している。図11に示す画面10と同様に、ファイルイベント一覧表示部11、解析開始ボタン12、ネットワーク表示部13、選択されたファイルイベントの情報(イベントレコード)を表示するイベント表示部14、前記閾値の設定部15、階層設定部16を備えている。
図17の画面10が、図11の画面10と異なる点は、ネットワーク表示部13において、複数の情報端末分のファイルイベントネットワークが表示可能となっている点である。つまり、ネットワーク表示部13では、複数端末にまたがる端末間ファイルイベントネットワーク(管理用ファイルイベントテーブルT4及び管理用相関テーブルT5の内容)が表示可能となっている。
図17に示すように、管理サーバでは、指定されたイベントに関連する端末間ファイルイベントネットワークが表示されるため、端末をまたがってファイルを検索することが可能である。
そして、利用者は、表示されたイベントの中から、いずれかのイベントを選択することができる(ステップS6−4)。イベントが選択されると、当該イベントを主たる表示対象のイベントとして、ステップS6−2及びステップS6−3の処理が再度行われる。
なお、本発明は上記実施形態に限定されるものではなく、様々な変形が可能である。例えば、リンク形成のためにファイルイベントテーブルT1又は管理用ファイルイベントテーブルT4からイベントを抽出する際の抽出条件は、全イベントを対象とするものであってもよい。この場合、多くのイベント間で相関値が算出されるとともに多数のリンクが形成されることになるが、相関値が低いものについては、リンクレコードを生成しないことで対処することができる。また、リンクレコードを生成する場合には、相関値が低いリンクを表示対象外とすればよい。
また、リンク相関値となるファイル相関値は、重要語数に基づくものに限られず、例えば、テキスト情報全体からみた一致度(類似度)などであってもよい。
ファイル管理システムの全体図である。 情報端末のデータベースの構成図である。 ファイルイベントテーブルの項目一覧である。 相関テーブルの項目一覧である。 重要語テーブルの項目一覧である。 管理サーバのデータベースの構成図である。 管理用ファイルイベントテーブルの項目一覧である。 管理用相関テーブルの項目一覧である。 相関抽出の処理フローである。 表示処理フローである。 情報端末における表示画面である。 情報端末から管理サーバへの情報送信フローである。 端末をまたぐファイルアクセスを示す説明図である。 管理サーバの相関抽出の処理フローである。 管理サーバの相関抽出の処理フローである。 管理サーバの表示処理フローである。 管理サーバにおける表示画面である。
符号の説明
1 ファイル管理システム
2 ネットワーク
3a 情報端末(ファイルイベント相関生成装置)
3b 情報端末(ファイルイベント相関生成装置)
3c 情報端末(ファイルイベント相関生成装置)
4 管理サーバ(管理装置)
P1 エージェントコンピュータプログラム
P2 管理コンピュータプログラム
DB1 データベース
DB2 データベース
T1 ファイルイベントテーブル
T2 相関テーブル
T3 重要語テーブル
T4 管理用ファイルイベントテーブル
T5 管理用相関テーブル

Claims (19)

  1. ファイルイベント間の相関を生成する装置であって、
    ファイルイベントの発生を検出する検出手段と、
    前記検出手段が検出したファイルイベントを示すファイルイベント情報を記憶するファイルイベントテーブルと、
    ファイルイベントテーブルに記憶されているファイルイベント間の相関に関する相関情報を記憶する相関テーブルと、
    前記検出手段が検出したファイルイベントに関連する他のファイルイベントを、所定の抽出条件に従って、前記ファイルイベントテーブルから抽出する抽出手段と、
    を備え、
    前記相関テーブルには、前記検出手段が決定したファイルイベントと、前記抽出手段が抽出した他のファイルイベントと、が関連付けて記憶される
    ことを特徴とするファイルイベント相関生成装置。
  2. 前記検出手段が検出したファイルイベントが対象とするファイルと、前記抽出手段が抽出した他のファイルイベントが対象とするファイルと、の間のファイル内容の相関を示すファイル相関値を決定する決定手段と、
    を更に備え、
    前記相関テーブルは、前記決定手段が決定したファイル相関値を、前記検出手段が検出したファイルイベントと前記抽出手段が抽出した他のファイルイベントとの間のイベント相関値として記憶する
    請求項1記載のファイルイベント相関生成装置。
  3. 前記決定手段は、各ファイルに共通して含まれる重要語の数に基づいて、前記ファイル相関値を算出する
    請求項2記載のファイルイベント相関生成装置。
  4. 前記相関テーブルは、ファイルイベントの発生時点におけるファイルの内容に基づく前記ファイル相関値を、前記イベント相関値として記憶する
    請求項2又は3記載のファイルイベント相関生成装置。
  5. 前記抽出条件は、前記検出手段が検出したファイルイベントの発生時を起点とする過去の所定時間内において発生した他のファイルイベントを抽出対象とするものである
    請求項1〜4のいずれか1項に記載のファイルイベント相関生成装置。
  6. 関連するファイルイベント同士の条件を規定した関連情報を有し、
    前記抽出条件は、前記検出手段が検出したファイルイベントについて、前記関連情報に規定する条件を満たす他のファイルイベントを抽出対象とするものである。
    請求項1〜5のいずれか1項に記載のファイルイベント相関生成装置。
  7. 前記相関テーブルは、ファイルイベント間の相関値を記憶可能に構成され、
    前記関連情報に規定する条件を満たすファイルイベント間については、前記相関テーブルに記憶される前記相関値は、当該相関値としての最大値である
    請求項6記載のファイルイベント相関生成装置。
  8. ファイルイベントを選択する選択手段と、
    前記相関テーブルを参照して、前記選択手段によって選択されたファイルイベントと関連する他のファイルイベントを取得する取得手段と、
    前記選択手段によって選択されたファイルイベント、及び前記取得手段によって取得されたファイルイベントを表示する表示手段と、
    を更に備える請求項1〜7のいずれか1項に記載のファイルイベント相関生成装置。
  9. 前記取得手段は、前記相関テーブルを参照して、前記選択手段によって選択されたファイルイベントとの相関値が、閾値よりも高い他のファイルイベントを取得する
    請求項8記載のファイルイベント相関生成装置。
  10. 前記選択手段は、ファイルを選択するファイル選択手段を含み、選択されたファイルに対する最新のファイルイベントを選択する
    請求項9記載のファイルイベント相関生成装置。
  11. コンピュータを、請求項1〜10のいずれか1項に記載のファイルイベント相関生成装置として機能させるためのコンピュータプログラム。
  12. ネットワークを介して接続された情報端末を管理する管理装置であって、
    情報端末において発生したファイルイベントを示すファイルイベント情報及びファイルイベント間の相関に関する相関情報を、複数の情報端末からネットワークを介して受信することができる受信手段と、
    前記受信手段によって受信したファイルイベント情報を記憶する管理用ファイルイベントテーブルと、
    前記受信手段によって受信した相関情報を記憶する管理用相関テーブルと、
    を備えることを特徴とする管理装置。
  13. 前記受信手段によって受信したファイルイベント情報が示すファイルイベントが、当該ファイルイベントが発生した情報端末とは別の外部コンピュータが関与する外部ファイルイベントである場合には、前記外部ファイルイベントに関連する他のファイルイベントを、外部ファイルイベント用の抽出条件に従って、前記管理用ファイルイベントテーブルから抽出する抽出手段を、更に備え、
    前記管理要相関テーブルには、前記外部ファイルイベントと、前記抽出手段が抽出した他のファイルイベントと、が関連付けて記憶される
    請求項12記載の管理装置。
  14. 前記外部ファイルイベントと、前記抽出手段が抽出した他のファイルイベントと、の間のファイル内容の相関を示すファイル相関値を決定する決定手段を、更に備え、
    前記管理用相関テーブルは、前記決定手段が決定したファイル相関値を、前記外部ファイルイベントと前記抽出手段が抽出した他のファイルイベントとの間のイベント相関値として記憶する
    請求項13記載の管理装置。
  15. 前記外部ファイルイベント用の前記抽出条件は、前記外部コンピュータにおけるファイルイベントであって、前記外部ファイルイベントとほぼ同時に発生し、かつ、前記外部ファイルイベントが対象とするファイルと共通するファイルを対象とするファイルイベントが抽出対象とされるものである
    請求項12〜14のいずれか1項に記載の管理装置。
  16. 前記外部ファイルイベント用の前記抽出条件は、前記外部ファイルイベントが対象とするファイルを対象として、前記外部ファイルイベントの発生よりも過去に発生したファイルイベントが抽出対象とされるものである
    請求項12〜15のいずれか1項に記載の管理装置。
  17. 前記外部ファイルイベント用の前記抽出条件は、当該外部ファイルイベントが発生した情報端末において受信又は送信された電子メールと同一の電子メールについて、前記外部コンピュータにおいて発生した送信ファイルイベント又は受信ファイルイベントが抽出対象とされるものである
    請求項12〜16のいずれか1項に記載の管理装置。
  18. ファイルイベントを選択する選択手段と、
    前記管理用相関テーブルを参照して、前記選択手段によって選択されたファイルイベントと関連する他のファイルイベントを取得する取得手段と、
    前記選択手段によって選択されたファイルイベント、及び前記取得手段によって取得されたファイルイベントを表示する表示手段と、
    を更に備える請求項12〜17のいずれか1項に記載の管理装置。
  19. コンピュータを、請求項12〜18のいずれか1項に記載の管理装置として機能させるためのコンピュータプログラム。
JP2008040558A 2008-02-21 2008-02-21 ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム Pending JP2009199356A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008040558A JP2009199356A (ja) 2008-02-21 2008-02-21 ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008040558A JP2009199356A (ja) 2008-02-21 2008-02-21 ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2009199356A true JP2009199356A (ja) 2009-09-03

Family

ID=41142780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008040558A Pending JP2009199356A (ja) 2008-02-21 2008-02-21 ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2009199356A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013045326A (ja) * 2011-08-25 2013-03-04 Kyoto Univ 関係性グラフデータベースシステム
WO2015004854A1 (ja) * 2013-07-10 2015-01-15 日本電気株式会社 イベント処理装置、イベント処理方法、およびイベント処理プログラム
WO2017069548A1 (ko) * 2015-10-23 2017-04-27 아주대학교산학협력단 복잡계 네트워크에서의 집합 관계 분석 시각화 장치 및 그 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1153387A (ja) * 1997-08-06 1999-02-26 Ibm Japan Ltd 文書の関連付け方法及びそのシステム
JPH11259459A (ja) * 1998-03-06 1999-09-24 Fuji Xerox Co Ltd 文書管理装置
JP2000339206A (ja) * 1999-05-27 2000-12-08 Cadix Inc 電子ファイル管理方法及び電子ファイルを管理するプログラムを格納したコンピュータ読み取り可能な記録媒体
JP2001216311A (ja) * 2000-02-01 2001-08-10 Just Syst Corp イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置
JP2003502720A (ja) * 1998-09-11 2003-01-21 ジェネシス・テレコミュニケーションズ・ラボラトリーズ・インコーポレーテッド 通信センタ内でのマルチメディア対話の規則ベース格納および検索のための方法および装置
JP2007304853A (ja) * 2006-05-11 2007-11-22 Hitachi Electronics Service Co Ltd 情報追跡管理システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1153387A (ja) * 1997-08-06 1999-02-26 Ibm Japan Ltd 文書の関連付け方法及びそのシステム
JPH11259459A (ja) * 1998-03-06 1999-09-24 Fuji Xerox Co Ltd 文書管理装置
JP2003502720A (ja) * 1998-09-11 2003-01-21 ジェネシス・テレコミュニケーションズ・ラボラトリーズ・インコーポレーテッド 通信センタ内でのマルチメディア対話の規則ベース格納および検索のための方法および装置
JP2000339206A (ja) * 1999-05-27 2000-12-08 Cadix Inc 電子ファイル管理方法及び電子ファイルを管理するプログラムを格納したコンピュータ読み取り可能な記録媒体
JP2001216311A (ja) * 2000-02-01 2001-08-10 Just Syst Corp イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置
JP2007304853A (ja) * 2006-05-11 2007-11-22 Hitachi Electronics Service Co Ltd 情報追跡管理システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200700374019; 井ノ口 伸人 外1名: '"アクセス履歴を考慮したファイル間の関連度を用いたデスクトップ検索"' 情報処理学会研究報告 第2006巻,第77号, 20060712, p.141-146, 社団法人情報処理学会 *
JPN6012049967; 井ノ口 伸人 外1名: '"アクセス履歴を考慮したファイル間の関連度を用いたデスクトップ検索"' 情報処理学会研究報告 第2006巻,第77号, 20060712, p.141-146, 社団法人情報処理学会 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013045326A (ja) * 2011-08-25 2013-03-04 Kyoto Univ 関係性グラフデータベースシステム
WO2015004854A1 (ja) * 2013-07-10 2015-01-15 日本電気株式会社 イベント処理装置、イベント処理方法、およびイベント処理プログラム
US9786147B2 (en) 2013-07-10 2017-10-10 Nec Corporation Event processing device, event processing method, and event processing program
WO2017069548A1 (ko) * 2015-10-23 2017-04-27 아주대학교산학협력단 복잡계 네트워크에서의 집합 관계 분석 시각화 장치 및 그 방법

Similar Documents

Publication Publication Date Title
AU2004201344B2 (en) Computer searching with associations
US7865815B2 (en) Integration and presentation of current and historic versions of document and annotations thereon
US9300755B2 (en) System and method for determining information reliability
JP5136228B2 (ja) 作業環境自動保存復元システム、作業環境自動保存復元方法および作業環境自動保存復元プログラム
US8341175B2 (en) Automatically finding contextually related items of a task
JP5265523B2 (ja) 有意な変更検索アラート
US7860971B2 (en) Anti-spam tool for browser
JP4796538B2 (ja) コメントデータを関連付ける方法
JP4636473B2 (ja) リンク情報抽出装置、リンク情報抽出方法およびプログラム
US8234584B2 (en) Computer system, information collection support device, and method for supporting information collection
JP2010218432A (ja) 情報処理装置、システム、方法、プログラムおよび記憶媒体
JP2006099341A (ja) 更新履歴生成装置及びプログラム
JP2010128928A (ja) 検索システム及び検索方法
JP2000285134A (ja) 文書管理方法および文書管理装置および記憶媒体
JP2009199356A (ja) ファイルイベント相関生成装置、管理装置、及びコンピュータプログラム
JP2009015589A (ja) 関連文書提示システム及びプログラム
JP2007233695A (ja) 注釈管理装置、ウェブ表示端末、注釈管理方法およびウェブ表示方法
KR20080028031A (ko) 키워드 및 키워드에 관련된 각종 콘텐츠를 자동으로추출하고 디스플레이하는 시스템 및 방법
JP4879612B2 (ja) 注釈管理装置、ウェブ表示端末、注釈管理方法およびウェブ表示方法
JP5334639B2 (ja) 情報処理装置、データ記憶方法及びプログラム、並びに情報処理システム
JP2009289094A (ja) キーワード比較システム、キーワード比較方法およびキーワード比較プログラム
JP2008541296A (ja) パーソナル化可能情報ネットワーク
JP6065718B2 (ja) 提供プログラム、提供装置及び提供方法
JP2010224941A (ja) 関連情報検索装置、関連情報検索方法、および関連情報検索プログラム
JP2006185185A (ja) 経験スコア管理システムおよび方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101129

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20101129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130205