しかしながら、例えば、特許文献1および特許文献2のようなフォレンジックシステムでは、複数のコンピュータおよびサーバを利用した利用者の膨大なデジタル文書情報を収集することになる。
オペレータが、どの利用者により利用(作成・編集・閲覧)されたデジタル文書情報であるか正確に把握できていない状況下で、当該収集された全てのデジタル文書情報を、訴訟の証拠資料として妥当であるか否かの判別をする作業は、多大な労力と費用がかかるという問題があった。
そこで、本発明は、上記事情に鑑み、デジタル文書情報を収集した後に、デジタル文書情報に対して、どの利用者に関連するものであるかを設定することを可能とするフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムを提供することを目的とするものである。
本発明のフォレンジックシステムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックシステムにおいて、複数の文書ファイルにより構成されるデジタル文書情報と、複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得するデジタル情報取得部と、デジタル情報取得部により取得されたデジタル情報を記録する記録部と、記録されたデジタル情報を表示する表示部と、表示部を介して、複数の文書ファイル毎に、利用者情報に含まれる利用者のうちいずれの利用者に関連するものであるかを示す利用者特定情報を設定し、該設定された利用者特定情報を記憶部に記録するように設定する利用者特定情報設定部と、表示部を介して、少なくとも一人以上の利用者を指定する利用者指定部と、指定された利用者に対応する利用者特定情報が設定された文書ファイルを検索する検索部と、表示部を介して、検索され、抽出された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定する付帯情報設定部と、付帯情報に基づき、訴訟に関連する文書ファイルを出力する出力部とを備えたことを特徴とするものである。
「利用者特定情報設定部」は、表示部を介して、複数の文書ファイル毎に、利用者情報に含まれる利用者のうちいずれの利用者に関連するものであるかを示す利用者特定情報を設定し、該設定された利用者特定情報を記憶部に記録するものである。文書ファイル毎にどの利用者が利用されたものであるかを設定するものである。
なお、「利用者特定情報設定部」は、複数のコンピュータおよびサーバに記録された利用者情報では必ずしも訴訟に関連する利用者を網羅することができない場合があるため、オペレータの指示により、新たな利用者を手動により追加設定してもよい。例えば、「利用者特定情報設定部」は、文書ファイルに対して、複数の利用者が関連するものであることを示す利用者特定情報を設定するものであってもよい。一つの文書ファイルが一人の利用者に関連するものとして設定してもよいし、一つの文書ファイルに対して、複数の利用者が利用するものであるように設定してもよい。また、「利用者特定情報設定部」は、文書ファイルに対して、複数の利用者が関連するものであることと、複数の利用者それぞれの相対的な訴訟に関連する度合いの順位を示す順位付け情報とを利用者情報に設定することができるものであってもよい。一つの文書ファイルに複数の利用者を設定しつつ、その設定された利用者間でどの利用者が、訴訟において関連性が高いかを示す順位を設定することができる。また、「利用者特定情報設定部」が、更に、順位付け情報の順位を指定するものであって、検索部が、指定された順位を有する利用者に対応する利用者特定情報が設定された文書ファイルを検索するものであってもよい。
「デジタル情報取得部」は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得するものであって、取得する方法としては、例えば、上記コンピュータまたはサーバに記録されたデジタル情報をある電子媒体にコピーし、当該電子媒体を介してフォレンジックシステムにコピーさせるか、もしくは上記コンピュータまたはサーバと、フォレンジックシステムをネットワーク回線を介して接続し、コンピュータまたはサーバに記録されたデジタル情報をフォレンジックシステムにデジタル情報をコピーする等により、デジタル情報の保全収集を行う。また、この「デジタル情報取得部」は、サーバとは異なる第二のサーバに記録された、第二のデジタル文書情報および第二の利用者情報を含む第二のデジタル情報を取得するものであって、フォレンジックシステムは、デジタル文書情報のみならず、第二のデジタル文書情報を構成する複数の文書ファイルを検索するものであってもよい。
本発明のフォレンジックシステムは、更に、記録されたデジタル文書情報から、複数の文書ファイル毎にテキスト情報を抽出するテキスト情報抽出部と、キーワードを指定するキーワード指定部とを備え、検索部が、抽出されたテキスト情報に基づいて、指定されたキーワードを含む文書ファイルを検索し、付帯情報設定部が、検索された文書ファイルに対して、付帯情報を設定するものであってもよい。
本発明のフォレンジックシステムは、更に、記録部により記録されたデジタル文書情報の文書ファイルを所定のデータ形式に変換するデータ変換部を備え、データ変換部により変換された文書ファイルが、出力部により出力される前までの間、変換されたデータ形式と同一のまま処理されることを特徴とするものであってもよい。
本発明のフォレンジックシステムは、更に、取得されたデジタル文書情報のデータ形式毎のデータ容量から表わされる統計データ、または検索されたデジタル文書情報のデータ形式毎のデータ容量から表わされる統計データを作成する統計データ作成部を備えたことを特徴とするものであってもよい。
本発明のフォレンジックシステムは、更に改めてデジタル情報を取得する際に、その取得する日時を計時する計時部を備え、デジタル情報は、更にデジタル文書情報を保管するフォルダ情報を備えるものであって、デジタル情報取得部は、以前に計時部により計時された日時より以後に作成された、デジタル文書情報およびフォルダ情報を取得し、取得されたデジタル文書情報に関連する利用者情報を取得するものであってもよい。
「サーバ」は、単数以上のサーバであって、例えば、複数のサーバにより構成されるものであってもよく、少なくともメールサーバ、ファイルサーバ、文書管理サーバのいずれか2つ以上であることを特徴とするものである。
本発明のフォレンジックシステムは、付帯情報設定部を複数備えたものであり、異なるオペレータにより付帯情報を設定することができることを特徴とするものである。
「表示部」は、デジタル情報を表示できるディスプレイ等をいう。また、「記録されたデジタル情報を表示する」というのは、利用者情報およびデジタル文書情報を全て表示してもよいし、それらの情報のうち少なくとも一つを表示してもよいし、それらの情報の属性情報(例えば、利用者の氏名、文書ファイルのファイル名、文書ファイル等)のうち少なくとも一つを表示してもよい。
「出力部」は、デジタル文書情報を何らかのプロダクションとして出力するものであって、例えば、プリンタ、デジタル文書ファイル作成装置のいずれかであればよい。
「利用者情報」は、コンピュータおよび/またはサーバに記録された利用者を示すものであって、コンピュータおよび/またはサーバを利用した者はだれであるかを示す利用者IDであったり、文書ファイルを実際に編集、作成、閲覧いずれかの利用を行った者を示す情報であったり、どの時期にその利用者がどのデジタル文書情報にアクセスしたかを示すアクセス情報とを含むものであってもよい。
本発明のフォレンジック方法は、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジック方法において、複数の文書ファイルにより構成されるデジタル文書情報と、複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得するステップと、デジタル情報取得部により取得されたデジタル情報を記録するステップと、記録されたデジタル情報を表示するステップと、複数の文書ファイル毎に、利用者情報に含まれる利用者のうちいずれの利用者に関連するものであるかを示す利用者特定情報を設定し、設定された利用者特定情報を記憶部に記録するように設定するステップと、少なくとも一人以上の利用者を指定するステップと、指定された利用者に対応する利用者特定情報が設定された文書ファイルを検索するステップと、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定するステップと、付帯情報に基づき、訴訟に関連する文書ファイルを出力することを特徴とする。
本発明のフォレンジックプログラムは、複数のコンピュータまたはサーバに記録されたデジタル情報を取得し、該取得されたデジタル情報を分析するフォレンジックプログラムにおいて、コンピュータが、複数の文書ファイルにより構成されるデジタル文書情報と、複数のコンピュータまたはサーバを利用する利用者に関する利用者情報とを含むデジタル情報を取得する機能と、デジタル情報取得部により取得されたデジタル情報を記録する機能と、記録されたデジタル情報を表示する機能と、複数の文書ファイル毎に、利用者情報に含まれる利用者のうち、いずれの利用者に関連するものであるかを示す利用者特定情報を設定し、該設定された利用者特定情報を記憶部に記録するように設定する機能と、少なくとも一人以上の利用者を指定する機能と、指定された利用者に対応する利用者特定情報が設定された文書ファイルを検索する機能と、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定する機能と、付帯情報に基づき、訴訟に関連する文書ファイルを出力する機能とを実現させるものである。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、複数の文書ファイル毎に、利用者情報に含まれる利用者のうちいずれの利用者に関連するものであるかを示す利用者特定情報を設定し、該設定された利用者特定情報を記憶部に記録するように設定し、少なくとも一人以上の利用者を指定し、指定された利用者に対応する利用者特定情報が設定された文書ファイルを検索し、表示部を介して、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力することにより、取得された全てのデジタル文書情報を確認することなく、訴訟に関連する利用者毎に分類分けされたデジタル文書情報のみを抽出し、分析および確認することを可能にする。
これにより、氾濫するデジタル文書情報の中でも、特定の者に関係するデジタル文書情報のみを抽出し、訴訟の証拠資料作成のための作業負荷の軽減を図ることができる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、文書ファイルに対して、複数の利用者それぞれに関連するものであることを示す利用者特定情報を設定することにより、一つの文書ファイルに対して、複数の利用者が関連したものであることを設定することができる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、文書ファイルに対して、複数の利用者それぞれに関連するものであることと、複数の利用者それぞれの相対的な訴訟に関連する度合いの順位を示す順位付け情報とを利用者特定情報に設定するに際し、一つの文書ファイルに対して、複数の利用者が関連したものであることと、その複数の利用者間でどの利用者が、訴訟において関連性が高いかを示す順位を予め設定することができる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、検索部が、指定された順位を有する利用者に対応する利用者情報が設定された文書ファイルを検索するに際し、訴訟に関連する利用者であって、関連性の度合いの順位を踏まえて、利用者が関連するデジタル文書情報を検索することができる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、サーバとは異なる第二のサーバに記録された、第二のデジタル文書情報および第二の利用者情報を含む第二のデジタル情報を取得するものであって、デジタル文書情報のみならず、第二のデジタル文書情報を構成する複数の文書ファイルを検索するに際し、複数のサーバに記録されたデジタル文書情報を漏れなく、分析および確認することを可能にする。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、更に、テキスト情報抽出部と、キーワード指定部と、検索部とを備え、付帯情報設定部が、検索された文書ファイルに対して、付帯情報を設定するに際し、サーバに記録されたデジタル文書情報のうち、特定の者がアクセスしたもののみであって、所定の検索により、訴訟に関連する可能性のあるデジタル文書情報の母集団を絞り込むことが可能になる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、データ変換部により変換された文書ファイルが、出力部により出力される前までの間、変換されたデータ形式と同一のまま処理されるに際し、処理フローの中途でのデータフォーマット変換の無駄な工程を削減でき、デジタル文書情報の品質劣化のリスクを排除することができる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、更に、統計データ作成部を備えた際に、統計データをオペレータに可視化して提供できるため、訴訟準備に要する労力を早期に把握することができる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、更に、デジタル情報取得部は、以前に計時部により計時された日時より以後に作成された、デジタル文書情報およびフォルダ情報を取得するに際し、デジタル情報の差分収集を可能とし、毎回サーバ等から同一のデジタル情報を重複して取得する負荷を軽減することができる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、付帯情報設定部を複数備えたものである際には、付帯情報設定部は、異なるオペレータにより付帯情報を設定することができることにより、法廷への証拠資料であるか否かの判定を複数人で判定することで早期に準備作業を行うことを可能にする。
以下、本発明の実施の形態について、図面を参照しながら説明する。
図1は、本発明の実施形態におけるフォレンジックシステム1の構成を表す機能ブロック図である。
図1に示すフォレンジックシステム1は、複数のコンピュータ(PC2〜5)およびサーバ10に記録されたデジタル情報を取得し、取得されたデジタル情報を分析するフォレンジックシステム1において、複数の文書ファイルにより構成されるデジタル文書情報と、複数のコンピュータ(PC2〜5)またはサーバ10を利用する利用者に関する利用者情報とを含むデジタル情報を取得するデジタル情報取得部20と、デジタル情報取得部20により取得されたデジタル情報を記録する記録部30と、記録されたデジタル情報を表示する表示部40と、表示部40を確認して(介して)、複数の文書ファイル毎に、利用者情報に含まれる利用者のうちいずれの利用者に関連するものであるかを示す利用者特定情報を設定し、該設定された利用者特定情報を記憶部30に記録するように設定する利用者特定情報設定部95と、表示部40を介して、少なくとも一人以上の利用者を指定する利用者指定部50と、指定された利用者に対応する利用者特定情報が設定された文書ファイルを検索する検索部100と、表示部40を介して、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定する付帯情報設定部70と、付帯情報に基づき、訴訟に関連する文書ファイルを出力する出力部120を備えたものである。
制御部160は、表示制御部45、デジタル文書情報抽出部60、テキスト情報取得部80、管理部85、検索部100、データ変換部110、統計データ作成部130、計時部140、CPU150を備えるものである。
また、フォレンジックシステム1は、キーボード、マウスおよび表示部4がタッチパネル機能を備えるときにはタッチパネルなどのデータ入力装置を備え、このデータ入力装置として、利用者指定部50、付帯情報設定部70、キーワード指定部90、利用者特定情報設定部95がある。
利用者情報は、コンピュータおよび/またはサーバに記録された利用者を示すものであって、コンピュータまたはサーバの利用をした者はだれであるかを示す利用者IDであったり、文書ファイルを実際に編集、作成、閲覧いずれかの利用を行った者を示す情報であったり、どの時期にその利用者がどのデジタル文書情報にアクセスしたかを示すアクセス情報とを含むものであってもよい。
利用者指定部50、付帯情報設定部70、キーワード指定部90および利用者特定情報設定部95が、それぞれ別のデータ入力装置であってもよいし、同一のデータ入力装置であってもよい。
また、出力部120は、電子媒体にデータを記録する記録装置またはプリンタ等である。
なお、図1に示すようなフォレンジックシステム1の構成は、補助記憶装置(不図示)に読み込まれたフォレンジックプログラムをコンピュータ上でCPU150により計算・実行することにより実現される。このとき、このフォレンジックプログラムは、CD−ROM等の記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされるものである。
以下、本発明の第1の実施形態では、フォレンジックシステム1はパーソナルコンピュータとして説明するが、フォレンジックシステム1は、サーバ、携帯端末型のコンピュータ機等であってもよいし、後述する第2の実施形態のようなネットワーク型のシステム構成であってもよい。
利用者特定情報設定部95は、表示部を介して、複数の文書ファイル毎に、利用者情報に含まれる利用者のうちいずれの利用者に関連するものであるかを示す利用者特定情報を設定し、該設定された利用者特定情報を記憶部30に記録するものである。なお、複数のコンピュータおよびサーバに記録された利用者情報では必ずしも訴訟に関連する利用者を網羅することができない場合があるため、オペレータの指示により、新たな利用者を手動により追加設定することも可能である。
利用者特定情報設定部95は、文書ファイル毎にどの利用者が利用されたものであるかを設定するものである。例えば、利用者特定情報設定部95は、文書ファイルに対して、複数の利用者が関連するものであることを示す利用者情報を設定するものであってもよい。一つの文書ファイルが一人の利用者に関連するものとして設定してもよいし、一つの文書ファイルに対して、複数の利用者が利用するものであるように設定してもよい。また、利用者特定情報設定部95は、文書ファイルに対して、複数の利用者それぞれに関連するものであることと、複数の利用者それぞれの相対的な訴訟に関連する度合いの順位を示す順位付け情報とを利用者特定情報に設定することができるものであってもよい。これにより、一つの文書ファイルに複数の利用者を設定しつつ、その設定された利用者間でどの利用者が、訴訟において関連性が高いかを示す順位を設定することができる。また、利用者特定情報設定部95が、更に、順位付け情報の順位を指定するものであって、検索部100が、指定された順位を有する利用者に対応する利用者特定情報が設定された文書ファイルを検索するものであってもよい。
デジタル情報取得部20は、利用者が利用していたPC2〜5またはサーバ10に記録されたデジタル情報を取得するものである。
例えば、デジタル情報取得部20は、PC2〜5またはサーバ10に記録されたデジタル情報をある電子媒体(例えば、USB、CD、DVD等)にコピーし、当該電子媒体を介してフォレンジックシステムに、デジタル情報をコピーさせる。
また、PC2〜5またはサーバ10と、フォレンジックシステム1とをネットワーク回線を介して接続した場合、デジタル情報取得部20は、PC2〜5またはサーバ10に記録されたデジタル情報を、ネットワークを介してデータ送信を受け付けることにより、デジタル情報の保全収集を行う。
デジタル情報取得部20は、サーバ10とは異なるサーバ(第二のサーバという)に記録された、第二のデジタル文書情報および第二の利用者情報を含む第二のデジタル情報を取得するものであって、フォレンジックシステム1は、デジタル文書情報のみならず、第二のデジタル文書情報を構成する複数の文書ファイルを検索するものであってもよい。
また、デジタル情報収集部10は、サーバ10とは異なるサーバ(第二のサーバという)に記録された、第二のデジタル文書情報、第二の利用者情報および第二のアクセス履歴情報を含む第二のデジタル情報を取得するものであってもよい。
フォレンジックシステム1は、更に、記録されたデジタル文書情報から、複数の文書ファイル毎にテキスト情報を抽出するテキスト情報抽出部80と、キーワードを指定するキーワード指定部90と、抽出されたテキスト情報に基づいて、指定されたキーワードを含む文書ファイルを検索する検索部100とを備えたものである。
この付帯情報設定部70が、検索部100が検索された文書ファイルに対して、付帯情報を設定するものである。
フォレンジックシステム1は、更に、記録部30により記録されたデジタル文書情報の文書ファイルを所定のデータ形式に変換するデータ変換部110を備え、データ変換部110により変換された文書ファイルが、出力部120により出力される前までの間、変換されたデータ形式と同一のまま処理されることを特徴とするものである。
フォレンジックシステム1は、更に、取得されたデジタル文書情報のデータ形式毎のデータ容量から表わされる統計データ、また検索部100により検索されたデジタル文書情報のデータ形式毎のデータ容量から表わされる統計データを作成する統計データ作成130部を備えたものである。
フォレンジックシステム1は、更に改めてデジタル情報を取得する際に、その取得する日時を計時する計時部140を備え、デジタル情報は、更にデジタル文書情報を保管するフォルダ情報を備えるものであって、デジタル情報取得部20は、以前に計時部140により計時された日時より以後に作成された、デジタル文書情報およびフォルダ情報を取得し、該取得されたデジタル文書情報およびフォルダ情報に関連する、利用者情報を取得する。
このデジタル情報は、デジタル文書情報と、利用者情報と、更にこのデジタル文書情報を保管するフォルダ情報を備えるものであってもよい。
計時部140は、デジタル情報取得部20によりデジタル情報を取得した際の日時を計算する。
表示部40は、制御部160に構成される表示制御部45の指示により表示内容を表示する。
デジタル情報取得部20は、n回目(n=2,3,・・・)にデジタル情報を取得する際、n−1回目にデジタル情報を取得した時点の計時部140により計時された日時を表わす情報から、その日時情報より以後にPC2〜5またはサーバ10に作成された、デジタル文書情報およびフォルダ情報を取得するものである。その際に、該取得されたデジタル文書情報およびフォルダ情報を取得し、取得されたデジタル文書情報に関連する利用者情報を更に取得するものであってもよい。サーバ10は、単数以上のサーバであって、例えば、複数のサーバにより構成されるものであってもよく、少なくともメールサーバ、ファイルサーバ、文書管理サーバのいずれか2つ以上であってもよい。
フォレンジックシステム1は、更に複数のオペレータが同時に利用できるものであってもよい。
付帯情報設定部70は、複数のデータ入力装置により構成されるものであってもよく、その複数の付帯情報設定部70に対応する複数の表示部40をそれぞれ用意してもよい。
そして、複数のオペレータがデジタル文書情報を同時に確認しながら、複数の付帯情報設定部70を介して、付帯情報を設定することができる。
出力部120は、デジタル文書情報を何らかのプロダクションとして出力するものであって、例えば、プリンタまたは、電子媒体にデジタル情報を記録する記録装置であればよい。
以下、図2のサービスフローを参照しながら、フォレンジックシステム1の法廷への証拠資料提出のための準備作業を行う手順を簡単に説明する。
まず、フォレンジックという不正アクセスや機密情報漏洩などコンピュータに関する犯罪や法的紛争が生じた際に、原因究明や捜査に必要な機器やデータ、電子的記録を収集・分析し、その法的な証拠性を明らかにする必要がある。
特に、米国民事訴訟では、eDiscovery(電子証拠開示)等が求められており、当該訴訟の原告および被告のいずれもが、関連するデジタル情報をすべて証拠として提出する責任を負うため、コンピュータやサーバに記録されたデジタル情報を証拠として、提出しなければならない。
そこで、フォレンジックシステム1は、訴訟に関連するデジタル情報を選別し、法廷への証拠資料提出のための準備作業を行うべく、PC2〜5やサーバ10に記録されたデジタル情報を保全収集(Preservation)する。
その後、フォレンジックシステム1は、保全収集したデジタル情報を記録部30のようなデータベースに登録し、デジタル情報を分析(Analysis)し、キーワード検索やフィルタ処理により、細分化する。
この記録部30は、フォレンジックシステム1のコンピュータに含める構成であってもよいし、コンピュータとは別体としてサーバに保存してもよい。
そして、フォレンジックシステム1は、細分化したデジタル情報を表示部40上でレビュー(Review)し、オペレータが付帯情報設定部70を介して、デジタル文書情報に対して付帯情報を設定する。
制御部160は、保全収集分析機能、処理分析検索機能、Review機能、Production機能を有する。
例えば、制御部160の保全収集分析機能は、案件毎のデータ管理が可能となるようにCase管理機能(管理部85の機能)、対象者・証拠物毎にファイルの種類や所持量の分析ができ、検索対象ファイルの分析も可能とするファイル分析機能(検索部100の機能)、検索・閲覧対象となるファイルタイプの選択可能とするファイル種類選択抽出機能(デジタル文書情報抽出部60の機能)、選択したファイルを別ファイルとして保全収集が可能となる保全収集機能(データ変換部110)を有する。また、制御部160の処理分析検索機能は、全文検索機能と、頻出語句トップ抽出機能を有する(検索部100の機能)。この全文検索機能は、多言語に対応し、Boolean演算により、AND OR NOT検索を可能とし、Grouping演算によりカッコを用いた検索を可能とし、検索した語句のハイライト表示機能、Meta Dataにする機能等を有する。また、全文検索機能は、高度検索機能を有し、近傍検索や正規表現検索等を可能とする。頻出語句トップ抽出機能は、あるデジタル文書情報内部における頻出語句を抽出するものである。
また、制御部160のReview機能は、例えば、E−mail Familyをまとめて閲覧できるE−mail Family閲覧処理機能(検索部100の機能)や、1つの評価または複数の評価を付帯情報として設定されたものを当該評価に基づいて検索できる自由設計Tag機能(検索部100の機能)、階層構造BookMark設定されたもののBookMark検索を可能とする自由設計BookMark機能(検索部100の機能)、任意の文字数入力可能なコメント欄を設けた自由入力コメント欄(管理部85の機能)、上述した複数のオペレータがデジタル文書情報を確認するための同時閲覧機能、ReViewする際、閲覧者のアカウント毎に、Case毎のアクセス権、管理者権限、閲覧のみ権限等の設定可能にしたアクセス権制御機能(管理部85の機能)、デジタル文書情報の本文に変更を加えずに文書内に書き込みを可能とする文書内書き込みMemo機能(管理部85の機能)、Review完了文書数(%)表示を可能とするCase Management機能(管理部85の機能)、E−mailスレッド(返信、転送等)を一括表示するE−mail Threading機能(管理部85の機能)、メールのやり取りをグラフィカルに表示するメール分析表示機能(統計データ作成部130の機能)、Draft、古いVersion等の類似文書を自動分類して表示する類似文書表示機能(管理部85の機能)、類似文書の差の部分のみをハイライト表示する類似文書差分ハイライト機能(管理部85の機能)、検索Hitした語句の周辺部分のみを表示する検索Hit部分前後文章表示機能(検索部100の機能)を有する。
また、制御部160のProduction機能は、実ファイル、メタ情報、Tag情報等のXML出力、CSV出力、画像出力、各種ロードファイル出力の各種出力機能(管理部85からの指示により、出力部120により出力できる機能)、選択された複数のデジタル文書情報の印刷するBatch Printing機能(管理部85からの指示により、出力部120により出力できる機能)を有する。
最後に、フォレンジックシステム1は、出力部120により電子媒体にデータを生成するようにプロダクション(Production)する。例えば、電子媒体にデータを記録する記録装置により、所定のフォーマットのデータ形式により、電子媒体に記録する。
次に、図3のフローチャートを参照しながら、フォレンジックシステム1の法廷への証拠資料提出のための準備作業を行う手順を詳細に説明する。
まず、デジタル情報取得部20は、例えば、Word形式、PDF形式、PPT形式、Excel形式のような汎用フォーマットによる文書ファイルからなるデジタル文書情報と、PC2〜5またはサーバ10を利用する利用者に関する利用者情報とを含むデジタル情報を取得する(ST1)。
なお、利用者が利用するPC2〜5は、例として4台で説明しているが、4台にかぎられたものではなく、複数のPCであればよい。
次に、デジタル情報取得部20は、取得したデジタル情報を記録部30に記録する(ST2)。表示部40は、制御部160を介して、デジタル情報(デジタル文書情報、利用者情報、デジタル情報のタイトルだけを示す情報等の少なくともいずれかを指す)を表示することができる(ST3)。
例えば、表示部40は、表示制御部45からの指示に応じて、利用者情報およびデジタル文書情報を全て表示してもよいし、それらの情報のうち少なくとも一つを表示してもよいし、それらの情報の属性情報(例えば、利用者の氏名、文書ファイルのファイル名、等)のうち少なくとも一つを表示してもよい。
例えば、オペレータは、表示部40の画面を確認しながら、フォレンジックシステム1にログインし、更にCase(フォレンジックシステム1のデータベースの最上位のデータグループの単位)を作成する。また、オペレータは、表示部40の画面を確認しながら、デジタル情報が記録された記録部30に相当するサーバ等の接続先の設定と管理を行う(この場合、記録部30は複数存在する)。また、オペレータは、表示部40の画面を確認しながら、Custodian(データ保持対象者または利用者)の設定をし、管理をする。オペレータは、表示部40の画面を確認しながら、情報収集および保全収集されたTarget(フォレンジックシステム1のデータベースの中位のデータグループ単位)の作成と状態管理をする。後述するが、オペレータは、表示部40の画面を確認しながら、情報収集および保全収集したTargetにCustodianを関係付ける。例えば、オペレータは、表示部40を確認しながら、PC2〜5またはサーバから取得したデジタル文書情報から構成される複数のTargetに対して、どの利用者が訴訟に関連したかを予め設定する。 制御部160は、記録部30に記録されたデジタル情報を取得し、各種機能部により、デジタル情報を分析することができる。
フォレンジックシステム1は、記録部30に記録されたデジタル文書情報のデータ形式毎のデータ容量から表わされる統計データ、または検索部100により検索されたデジタル文書情報のデータ形式毎のデータ容量から表わされる統計データを作成する統計データ作成部110を備えている。
例えば、オペレータは、表示部40の画面を確認しながら、分析対象のCustodianとそのCustodianと対応づいたTarget内から所定のPath(ディレクトリ)を選択し、Custodian毎のファイル数および容量の分析結果のリストを表示できる。また、オペレータは、表示部40の画面を確認しながら、Path毎のファイル数および容量の分析結果のリストをチャートとして表示できる。更に、オペレータは、表示部40の画面を確認しながら、Path(ディレクトリ)毎のファイル数および容量の分析結果をリスト表示できる。また、オペレータは、表示部40の画面を確認しながら、File Type毎のファイル数および容量の分析結果のリストをチャートとして表示できる。また、オペレータは、表示部40の画面を確認しながら、File Type毎のファイル数および容量の分析結果のリストを表示できる。
また、オペレータは、表示部40の画面を確認しながら、File Type毎のファイル数および容量の分析結果のリストをチャートとして表示できる。更に、オペレータは、表示部40の画面を確認しながら、テキスト検索可能なファイルのみをFile Type毎のファイル数および容量の分析結果のリストをチャートとして表示できる。このテキスト検索可能なファイルは、予めテキスト情報取得部80により、記録部30に記録されたデジタル文書情報からテキスト情報が抽出可能なものに対して行われる。
次に、オペレータが、利用者特定情報設定部95により、表示部40を介して、複数の文書ファイル毎に、利用者情報に含まれる利用者のうちいずれの利用者(Custodian)に関連するものであるかを示す利用者特定情報を設定し、設定された利用者特定情報を記憶部30に記録するように設定する(ST4)。具体的には、オペレータは、表示部40の画面を確認しながら、情報収集および保全収集したTargetを構成する文書ファイルそれぞれに対して、利用者情報に含まれる利用者(利用者のコンピュータIDであってもよい、前述した情報であればいずれでもよい)から、いずれの利用者が訴訟に関連するかを関係付ける具体的には、オペレータが表示部40を確認しながら、利用者情報から選定された利用者ID(もしくは利用者名)から文書ファイル毎に妥当な利用者IDを付与するように設定する。なお、複数のコンピュータおよびサーバに記録された利用者情報では必ずしも訴訟に関連する利用者を網羅することができない場合があるため、オペレータの指示により、新たな利用者を手動により追加設定することも可能である。
また、オペレータは、利用者特定情報設定部95により、文書ファイルに対して、複数の利用者が関連するものであることを示す利用者特定情報を設定することもできる。一つの文書ファイルが一人の利用者に関連するものとして設定してもよいし、一つの文書ファイルに対して、複数の利用者が利用するものであるように設定してもよい。また、オペレータは、利用者特定情報設定部95により、文書ファイルに対して、複数の利用者それぞれに関連するものであることと、複数の利用者それぞれの相対的な訴訟に関連する度合いの順位を示す順位付け情報とを利用者情報に設定することができるものであってもよい。これにより、一つの文書ファイルに複数の利用者を設定しつつ、その設定された利用者間でどの利用者が、訴訟において関連性が高いかを示す順位を設定することができる。また、オペレータは、利用者特定情報設定部95により、更に、順位付け情報の順位を指定するものであって、検索部100が、指定された順位を有する利用者に対応する利用者特定情報が設定された文書ファイルを検索するものであってもよい。
オペレータは、表示部40を確認しながら、利用者指定部50により、少なくとも一人以上の利用者(Custodian)を指定する(ST5)。例えば、予め、甲氏のコンピュータやサーバ利用時のID情報または氏名情報を利用者特定情報として、記憶部30に記録されていることにより、表示部40に甲氏のIDまたは甲氏、その他の者を選択できるようにする。
そして、オペレータはこの表示部40の選択画面上で、特定の利用者を指定することで、文書ファイルを検索できる。
検索部100は、指定された利用者に対応する利用者特定情報が設定された文書ファイルを検索する(ST6)。
例えば、オペレータが、利用者指定部50により、Custodianである甲氏を指定した場合、文書ファイルと利用者(Custodian)との関係が、利用者特定情報設定部95により設定されているため、Target内の文書ファイルから、指定された利用者に関連する文書ファイルのみを抽出することも可能となっている。
なお、甲氏を例に説明したが、甲氏に加え、乙氏など複数のCustodianを指定することもでき、甲氏および乙氏に関連する文書ファイルのみを抽出することができる。また、上述したように、甲氏・乙氏のAND OR NOT検索もできる。また、オペレータは、利用者指定部50により、少なくとも一人以上の利用者に加え、順位付け情報の順位を指定することができる。これにより、検索部100は、指定された順位を有する利用者に対応する利用者特定情報が設定された文書ファイルを検索する。
また、複数の利用者それぞれの相対的な訴訟に関連する度合いの順位を示す順位付け情報とを、利用者特定情報に設定された場合、例えば、オペレータは、利用者特定情報設定部95により、特定の文書ファイルは、甲氏がもっとも関連するため、「1」番を設定し、乙氏は次に関連するため、「2」番を設定する。
そして、オペレータは、検索する際に、例えば、Custodianが乙氏であって、乙氏の順位が「2」番であるものを検索することができる。
更に、オペレータは、検索部100の機能により、表示部40の画面を確認しながら、利用者による絞り込以外の検索を行うことができる。また、オペレータは、表示制御部45の機能により、表示部40の画面を確認しながら、簡易閲覧を行うことができる。オペレータは、この簡易閲覧により、デジタル文書情報の内容を把握できる。
オペレータは、抽出されたデジタル文書情報の文書ファイルそれぞれが、訴訟に関連するものであるか否かを示す付帯情報を設定する(ST7)。
具体的には、訴訟に関連する情報であれば、「Hot」、関連する可能性があるものは「Responsive」とし、関連する可能性がないものは「Not Responsive」として、ファイル毎にタグ(付帯情報)が付与される。具体的には、Batchリストのファイル行をクリックするとタグの入力が可能となる。
そして、オペレータは、出力部120から、付帯情報に基づき、訴訟に関連する文書ファイルを出力するように指示する。オペレータの指示を受け付けたCPU150は、出力部120に対して、出力するように制御する。例えば、Hotと付与された文書ファイルのみを出力しもよいし、HotおよびResponsiveと付与された文書ファイルを出力してもよい。
出力部120は、CPU150からの指示に基づき、付帯情報に基づき、訴訟に関連する文書ファイルを出力する(ST8)。
また、フォレンジックシステム1は、複数のフォレンジックシステム用サーバにより構成されるものであって、デジタル情報抽出部と、検索部とがそれぞれ、フォレンジックシステム用サーバに分離されたものであり、更に、分離されたフォレンジックシステムがネットワークを介して、接続されたものであってもよい。
また、第2の実施形態について、図4を参照しながら、説明する。
フォレンジックシステム1は、図4に示すような、ネットワーク型のシステム構成であってもよい。第2の実施形態のフォレンジックシステム1は、第1の実施形態で説明したフォレンジックシステム1の各処理部と同様であるが、それぞれの処理部は複数のサーバに分散して配置されている。サーバ間は、ネットワークを介して接続されている。このため、国内にサーバを分散して配置してもよいし、国内外を問わずサーバを分散して配置してもよい。
また、フォレンジックシステム1によれば、利用者指定部50、付帯情報設定部70、キーワード指定部90および利用者特定情報設定部95は、それぞれのクライアントPC170〜172に備わるデータ入力装置が該当する。
なお、表示部40は、それぞれのクライアントPC170〜172に該当する。そして、複数のクライアントPCとUIサーバとの間に、仮想クライアントサーバに一括してデータ送受信をまとめることにより、表示レスポンスの向上を可能とする。
このようにして、第1の実施形態のようにコンピュータによりフォレンジックシステム1を構成してもよいし、第2の実施形態のようにネットワーク型のシステムによりフォレンジックシステム1を構成してもよい。
フォレンジックシステム1によれば、複数の文書ファイル毎に、利用者情報に含まれる利用者のうちいずれの利用者に関連するものであるかを示す利用者特定情報を設定し、該設定された利用者特定情報を記憶部30に記録するように設定し、少なくとも一人以上の利用者を指定し、指定された利用者に対応する利用者特定情報が設定された文書ファイルを検索し、表示部40を介して、検索された文書ファイルが、訴訟に関連するものであるか否かを示す付帯情報を設定し、付帯情報に基づき、訴訟に関連する文書ファイルを出力することにより、取得された全てのデジタル文書情報を確認することなく、訴訟に関連する利用者毎に分類分けされたデジタル文書情報のみを抽出し、分析および確認することを可能にする。
これにより、氾濫するデジタル文書情報の中でも、特定の者に関係するデジタル文書情報のみを抽出し、訴訟の証拠資料作成のための作業負荷の軽減を図ることができる。
本発明のフォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラムによれば、文書ファイルに対して、複数の利用者それぞれに関連するものであることを示す利用者特定情報を設定することにより、一つの文書ファイルに対して、複数の利用者が関連したものであることを設定することができる。
フォレンジックシステム1によれば、文書ファイルに対して、複数の利用者それぞれに関連するものであることと、複数の利用者それぞれの相対的な訴訟に関連する度合いの程度を示す順位付け情報とを利用者特定情報に設定するに際し、一つの文書ファイルに対して、複数の利用者が関連したものであることと、その複数の利用者間でどの利用者が、訴訟において関連性が高いかを示す順位を予め設定することができる。
フォレンジックシステム1によれば、検索部100が、指定された順位を有する利用者に対応する利用者特定情報が設定された文書ファイルを検索するに際し、訴訟に関連する利用者であって、関連性の度合いの程度を示す順位である者が関連するデジタル文書情報を検索することができる。
フォレンジックシステム1によれば、サーバ10とは異なる第二のサーバに記録された、第二のデジタル文書情報および第二の利用者情報を含む第二のデジタル情報を取得するものであって、デジタル文書情報のみならず、第二のデジタル文書情報を構成する複数の文書ファイルを検索するに際し、複数のサーバに記録されたデジタル文書情報を漏れなく、分析および確認することを可能にする。
フォレンジックシステム1によれば、更に、テキスト情報抽出部80と、キーワード指定部90と、検索部100とを備え、付帯情報設定部70が、検索された文書ファイルに対して、付帯情報を設定するに際し、サーバに記録されたデジタル文書情報のうち、特定の者がアクセスしたもののみであって、所定の検索により、訴訟に関連する可能性のあるデジタル文書情報の母集団を絞り込むことが可能になる。
フォレンジックシステム1によれば、データ変換部110により変換された文書ファイルが、出力部120により出力される前までの間、変換されたデータ形式と同一のまま処理されるに際し、処理フローの中途でのデータフォーマット変換の無駄な工程を削減でき、デジタル文書情報の品質劣化のリスクを排除することができる。
フォレンジックシステム1によれば、更に、統計データ作成部130を備えた際に、統計データをオペレータに可視化して提供できるため、訴訟準備に要する労力を早期に把握することができる。
フォレンジックシステム1によれば、更に、デジタル情報取得部20は、以前に計時部140により計時された日時より以後に作成された、デジタル文書情報およびフォルダ情報を取得するに際し、デジタル情報の差分収集を可能とし、毎回サーバ等から同一のデジタル情報を重複して取得する負荷を軽減することができる。フォレンジックシステム1によれば、付帯情報設定部を複数備えたものである際には、付帯情報設定部70は、異なるオペレータにより付帯情報を設定することができることにより、法廷への証拠資料であるか否かの判定を複数人で判定することで早期に準備作業を行うことを可能にする。
以上、本発明において実施形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることは明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
また第1の実施形態と第2の実施形態のフォレンジックシステム1は、それぞれのシステム全体または、それぞれの各処理部を組み合わせて構成することができる。