JP2005503616A - データの内容と属性に基づいてデータをリストアする技法 - Google Patents
データの内容と属性に基づいてデータをリストアする技法 Download PDFInfo
- Publication number
- JP2005503616A JP2005503616A JP2003529351A JP2003529351A JP2005503616A JP 2005503616 A JP2005503616 A JP 2005503616A JP 2003529351 A JP2003529351 A JP 2003529351A JP 2003529351 A JP2003529351 A JP 2003529351A JP 2005503616 A JP2005503616 A JP 2005503616A
- Authority
- JP
- Japan
- Prior art keywords
- file
- files
- storage device
- information
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1469—Backup restoration techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
異種ストレージ環境においてデータをリストアするための技法(図3)。リストアするデータを、ユーザが指定するデータ内容および/またはデータ属性に基づいて識別することができる(302)。リストアするデータを、バックアップ・データ、アーカイブ・データ、およびその他のタイプのデータから識別することができる(304)。データのストレージ位置に関わらずデータをリストアできるように、単一のサーチ指向ユニフォーム・ユーザ・インターフェースが提供される。データの位置やタイプ(例えば、アーカイブ、バックアップ、またはその他)に関わらず、データへのアクセスが可能になる。
Description
【関連出願】
【0001】
(関連出願の相互参照)
本出願は、2001年8月31日に出願された「検索のためのファイルの内容と属性のインデックス化(FILE CONTENT AND ATTRIBUTES INDEXING FOR RETRIEVAL)」と題する米国特許仮出願第60/316783号からの優先権を主張し、同仮出願の非仮出願である。同仮出願のすべての内容を実際上参照により本明細書に組み込む。
【技術分野】
【0002】
本発明は、データのストアおよび管理に関し、より詳細には、データの内容と属性に基づいてデータの検索を容易に行えるようにする技法に関する。
【背景技術】
【0003】
データをディスク・サブシステムからテープ(または他のオフライン媒体)などのバックアップ媒体にバックアップ・セットとしてバックアップする、いくつかのデータストア/バックアップ・アプリケーションが従来から利用可能である。データは、ファイルやディレクトリなどのストレージ・ユニットの形でストアすることができる。バックアップ手順の一環として、バックアップ・アプリケーションは、各バックアップ・セットに含まれる内容を識別する(「バックアップ・カタログ」と呼ばれる)カタログを作成する。例えば、バックアップ・カタログは、各バックアップ・セット毎に、そのバックアップ・セットに含まれるファイルとディレクトリを含む。バックアップ・カタログ中のファイルとディレクトリは一般に、コンピュータ処理に適したファイル名とディレクトリ名を用いて識別される。バックアップ・カタログによって、バックアップに使用されるバックアップ媒体を識別する媒体識別子(ID)(例えば、オフライン媒体ID)を識別することもできる。ストアされるデータに対して、1つまたは複数のバックアップ・カタログを生成することができる。
【0004】
バックアップ・アプリケーションによって生成されたバックアップ・カタログは一般に、バックアップ媒体自体やローカル・ハード・ドライブにストアされる。ある特定のファイルをバックアップ媒体からリストアする必要が生じた場合、ユーザは最初に複数のバックアップ・カタログをサーチして、その特定のファイルが含まれるバックアップ・セットを識別しなければならない。バックアップ・セットは、その特定のファイルをストアしているバックアップ媒体を直接的には識別しない。現在のところ、バックアップ・カタログ中の特定のファイルのサーチは、その特定のファイルの完全なファイル指定に基づいて行われている。したがって、ユーザは、リストアしたいファイルの正確な名前を知らなければならない。ある特定のファイルの正確なファイル名を忘れてしまった場合、ユーザは、その特定のファイルに関するファイル名を識別するのに、複数のバックアップ・カタログのブラウズを強いられる。さらに、バックアップ・カタログからその特定のファイルのファイル名を確定することができない場合、ユーザは、自分が望む正しいファイルが取得できるまで、バックアップ媒体から複数のファイルをリストアしなければならない。ユーザが複数のファイルをリストアしようとしている場合、問題はさらに悪化する。
【0005】
したがって、上で説明したように、従来のデータ管理及びデータ・ストレージ・アプリケーションは、ある特定のファイルをバックアップまたはアーカイブ・データからリストアする場合、その特定のファイルの完全なファイル指定(例えば、その特定のファイルのファイル名)を事前に知っていることをユーザに要求する。ストアされるファイルとディレクトリが多く、ストアされたファイルに関連づけられる暗号化された名前が多い場合には、これは非常に面倒で不便なことになる。したがって、データのリストア、特にバックアップ・データやアーカイブ・データのリストアは、ユーザやデータ・ストレージ・システムを管理するシステム管理者にとって時間を浪費する面倒なオペレーションである。このことは、組織または企業の情報技術(IT)関連費用を押し上げ、組織または企業の収益に悪影響を及ぼす。
【発明の開示】
【発明が解決しようとする課題】
【0006】
上記の事柄に鑑みて、データのストレージとリストア・オペレーションを簡略化する技法が必要である。さらに、データをリストアするためのより簡単でより使いやすいインターフェースを提供する技法も必要である。
【課題を解決するための手段】
【0007】
本発明の実施態様は、異種ストレージ環境においてデータをリストアする技法を提供する。ユーザが指定するデータ内容および/またはデータ属性に基づいてリストアするデータを識別することができる。リストアするデータを、バックアップ・データ、アーカイブ・データ、その他のタイプのデータから識別することができる。したがって、本発明の実施態様は、データのストレージ位置に関わらずデータをリストアできるように、単一のサーチ指向ユニフォーム・ユーザ・インターフェースを提供する。したがって、本発明は、データの位置やタイプ(例えば、アーカイブ、バックアップ、その他)に関わらず、データに容易にアクセスできる。
【0008】
本発明の一実施態様によれば、ストレージ環境内の複数のストレージ・デバイスにストアされており、バックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含む複数のファイルから1つまたはいくつかのファイルをリストアする技法が提供される。この実施態様では、複数のファイル内のファイルの内容に関する情報と、複数のファイル内のファイルのストレージ位置を識別する位置情報がストアされる。第1の内容を識別する情報を含む要求が受信される。それに応答して、本発明の実施態様は、複数のファイルの内容に関する情報に基づいて、複数のファイルの中から、第1の内容を含む第1の1つまたは複数のファイル・セットを確定する。第1のファイル・セットのうちの少なくとも1つのファイルに関するストレージ位置情報が位置情報に基づいて確定される。ストレージ位置情報は、少なくとも1つのファイルがストアされている第1のストレージ・デバイスを複数のストレージ・デバイスから識別する情報を含む。少なくとも1つのファイルが、第1のストレージ・デバイスからリストアされる。
【0009】
本発明の別の実施態様によれば、ストレージ環境内の複数のストレージ・デバイスにストアされており、バックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含む複数のファイルから1つまたはいくつかのファイルをリストアする技法が提供される。この実施態様では、複数のファイル内の各ファイルの1つまたは複数の属性を識別する属性情報と、複数のファイル内のファイルのストレージ位置を識別する位置情報がストアされる。第1の属性を識別する情報を含む要求が受信される。それに応答して、本発明の実施態様は、その属性情報に基づいて、複数のファイルの中から、第1の属性を満足する第1の1つまたは複数のファイル・セットを確定する。第1のファイル・セットのうちの少なくとも1つのファイルに関するストレージ位置情報が位置情報に基づいて確定される。ストレージ位置情報は、少なくとも1つのファイルがストアされている第1のストレージ・デバイスを複数のストレージ・デバイスから識別する情報を含む。少なくとも1つのファイルが第1のストレージ・デバイスからリストアされる。
【0010】
本発明のさらに別の実施態様によれば、ストレージ環境内の複数のストレージ・デバイスにストアされており、バックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含む複数のファイルから1つまたはいくつかのファイルをリストアする技法が提供される。この実施態様では、複数のファイル内のファイルの内容に関する情報と、複数のファイル内のファイルの1つまたは複数の属性を識別する属性情報がストアされる。この実施態様では、複数のファイル内のファイルのストレージ位置を識別する位置情報にもアクセスすることができる。第1の基準を識別する情報を含む要求が受信される。この実施態様は、属性情報と複数のファイル内のファイルの内容に関する情報に基づいて、複数のファイルの中から、第1の基準を満足する第1の1つまたは複数のファイル・セットを確定する。この実施態様では、第1のファイル・セットのうちの少なくとも1つのファイルのストレージ位置情報が位置情報に基づいて確定される。ストレージ位置情報は、少なくとも1つのファイルがストアされている第1のストレージ・デバイスを複数のストレージ・デバイスから識別する情報を含む。少なくとも1つのファイルが第1のストレージ・デバイスからリストアされる。
【発明を実施するための最良の形態】
【0011】
本発明の上記の実施形態、その他の特徴、および利点は、以下の明細書、特許請求の範囲、および添付の図面を参照することでより明らかになるであろう。
【0012】
図1は本発明の実施形態を組み込むことができる分散システムの簡略ブロック図である。
【0013】
図2は本発明の一実施形態によるコンピュータ・システムの簡略ブロック図である。
【0014】
図3は本発明の一実施形態によるファイルの内容および/または属性に基づいて1つまたはいくつかのファイルをリストアする方法の簡略ハイレベル・フローチャートである。
【0015】
図4は本発明の一実施形態によるファイルを容易にリストアできるようにするのに使用されるファイルに関する情報を収集する方法の簡略ハイレベル・フローチャートである。
【0016】
図5Aは本発明の一実施形態に従ってストアすることができるファイルの内容に関する情報を含むファイル関連情報の一部を示す図である。
【0017】
図5Bは本発明の一実施形態に従ってストアすることができるファイルの属性に関する情報を含むファイル関連情報の一部を示す図である。
【0018】
図6は本発明の一実施形態に従って位置データベースにストアすることができるファイルの位置情報の一部を示す図である。
【0019】
図7は本発明の一実施形態によるファイルの内容および/または属性情報をインデックス化する方法の簡略ハイレベル・フローチャートである。
【0020】
図8は本発明の一実施形態によるファイルをリストアする方法を示す簡略ハイレベル・フローチャートである。
【0021】
本発明の実施形態は、異種ストレージ環境においてデータをリストアする技法を提供する。リストアするデータを、ユーザが指定するデータ内容および/またはデータ属性に基づいて識別することができる。リストアするデータを、バックアップ・データ、アーカイブ・データ、その他のタイプのデータから識別することができる。したがって、本発明の実施形態は、データのストレージ位置に関わらずデータをリストアできるように、単一のサーチ指向ユニフォーム・ユーザ・インターフェースを提供する。したがって、本発明は、データの位置やタイプ(例えば、アーカイブ、バックアップ、その他)に関わらず、データに容易にアクセスできるようにする。
【0022】
本発明の一実施形態によれば、異種ストレージ環境内にストア、バックアップ、またはアーカイブされたデータをリストアするためのより簡単でより使いやすいインターフェースを提供する技法が提供される。データのストレージ位置およびデータのタイプ(例えば、バックアップ・データ、アーカイブ・データなど)に関わらず、データのリストアはユーザからは透過的である。
【0023】
この適用例では、用語「バックアップ・データ」(またはデータがファイル形式でストアされる場合は「バックアップ・ファイル」)は、データ原本が消失またはアクセス不可となった場合の復旧用に不揮発性ストア媒体にストアされたデータを指すものとする。バックアップ・コピーのバックアップ・データは通常、テープなどの着脱可能ストア媒体にストアされる。従来技術では、リストアするバックアップ・データの内容を識別し、そのバックアップ・データをバックアップ媒体からリストアするには、明示的なアクションが必要とされる。その結果、従来技術では、リストアされるバックアップ・データの識別とその識別されたバックアップ・データのリストアはユーザから透過的ではない。例えば、特定の内容を含む1つまたは複数のバックアップ・ファイル、または関連する特定の属性を有するファイルを識別するのに、バックアップ・ファイルの内容をうまく使ってサーチすることはできない。「背景技術」セクションで説明したように、従来技術では、ある特定のバックアップ・ファイルをリストアするために、ユーザは、完全なファイル指定を用いて複数のバックアップ・カタログをサーチして、その特定のファイルを含むバックアップ・セットを識別し、そのバックアップ・セット内のすべてのファイルをリストアし、そのリストアされたファイルをサーチして、所望の内容を含む特定のファイルを探さなければならない。
【0024】
この適用例では、用語「アーカイブ・データ」(またはデータがファイル形式でストアされる場合は「アーカイブ・ファイル」)は、データの集合を長期間にわたって耐久的に記録しておくためにとられたデータの集合のコピーを指すものとする。データがアーカイブされた場合、元のデータの集合は削除されることもある。アーカイブ・データは一般に、テープなどの着脱可能媒体上にストアされ、1つまたは複数のデータ・ファイルを含むことができる。従来技術では、リストアするアーカイブ・データの内容を識別し、そのアーカイブ・データをアーカイブ媒体からリストアするには、明示的なアクションが必要とされる。その結果、従来技術では、リストアされるアーカイブ・データの識別とその識別されたアーカイブ・データのリストアはユーザから透過的ではない。例えば、特定の内容を含む1つまたは複数のアーカイブ・ファイル、または関連する特定の属性を有するファイルを識別するのに、アーカイブ・ファイルの内容をうまく使ってサーチすることはできない。したがって、従来技術では、ある特定のアーカイブ・ファイルをリストアするために、ユーザは、完全なファイル指定を用いて複数のアーカイブ・カタログをサーチして、その特定のファイルを含むアーカイブ・セットを識別し、そのアーカイブ・セット内のすべてのファイルをリストアし、そのリストアされたファイルをサーチして、所望の内容を含む特定のファイルを探さなければならない。
【0025】
この適用例では、用語「データのリストア」は、データをそのストレージ位置から検索しまたはアクセスし、そのデータをデータ要求者またはユーザが利用できるようにすることを指すものとする。例えば、ユーザがあるデータ・ファイルにストアされているデータにアクセスできる場合、そのデータ・ファイルはリストアされていると見なされる。本発明の一実施形態によれば、データのストレージ位置またはタイプ(例えば、原データ、バックアップ・データ、アーカイブ・データなど)に関わらず、データのリストアはユーザから透過的である。本発明の実施形態は、原データ、バックアップ・データ、アーカイブ・データ、その他のタイプのデータからリストアされるデータを識別することができる。ユーザは、リストアするデータを識別するために明示的なアクションをとる必要がない。
【0026】
本発明の実施形態は、ユーザが指定する基準を満足する、リストアされる1つまたは複数のデータ・ファイルを識別することができる。ユーザが指定する基準として、ユーザが指定する内容および/または1つまたは複数のファイル属性を挙げることができる。リストアされる1つまたは複数のファイルは、バックアップ・ファイルとアーカイブ・ファイルを含む複数のファイルから識別することができる。例えば、ユーザ指定の内容および/またはユーザ指定の属性を含む1つまたは複数のファイルをリストアのために識別する。次に、1つまたは複数の識別されたファイルをリストアする。その結果、複数のバックアップ・カタログまたはアーカイブ・カタログをサーチする必要がなくなる。
【0027】
本発明の教示によれば、ユーザは、リストアするファイルの内容または属性についての情報を知ることによって、ファイルを検索することができる。ファイルをリストアするのに使用できる内容または属性として、ファイル内の1つまたは複数の単語、ファイル内容が関連するトピックまたは主題、ファイルの作成者情報、ファイルに関連する時間情報(例えば、ファイルの作成時間、ファイルの最終変更時間など)、他の類似のファイル関連情報を挙げることができる。
【0028】
以下に記載の本発明の実施形態は、バックアップ・ファイルとアーカイブ・ファイルを含む複数のデータ・ファイルからデータ・ファイルをリストアする技法を説明する。しかし、本発明の教示はまた、当業者に周知の他のタイプのストレージ・ユニットからデータをリストアする際にも利用できることを理解されたい。例えば、本発明の教示は、ブロック・データをリストアするのに利用することもできる。したがって、以下に記載の本発明の実施形態は、本発明の範囲を限定するものではない。
【0029】
図1は、本発明の一実施形態を組み込むことができる分散システム100の簡略ブロック図である。分散システム100は、複数の通信リンクを介して1つまたは複数の通信ネットワークに結合された複数のコンピュータ・システムとストレージ・デバイスを含む。図1に示すように、複数のコンピュータ・システムには、通信ネットワーク112に結合された1つまたは複数のユーザ(クライアント)システム102、通信ネットワーク112とストレージ・エリア・ネットワーク(SAN)114に結合されたデータ管理サーバ(DMS)104を含む複数のサーバ・システム、通信ネットワーク112に結合されたアプリケーション・サービス・プロバイダ(ASP)サーバ106、さらにはインターネットなどの通信ネットワーク110への接続性を提供するサーバ108が含まれる。図1に示す分散コンピュータ・ネットワーク100は、本発明を組み込んだ実施形態を説明するためのものにすぎず、特許請求の範囲で定義する本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0030】
通信ネットワーク112、110などの図1に示す通信ネットワークは、図1に示す様々なコンピュータ・システムとストレージ・デバイスの間の通信と情報交換を可能にする機構を提供する。通信ネットワーク自体は、数多くの相互接続されたコンピュータ・システムや通信リンクから構成することができる。例えば、通信ネットワーク112は、(図1に示すような)LAN、ワイド・エリア・ネットワーク(WAN)、無線ネットワーク、イントラネット、私設ネットワーク、公衆ネットワーク、交換ネットワーク、または他の適当な通信ネットワークとすることができる。同様に、通信ネットワーク110も、(図1に示すような)インターネットなどの他の通信ネットワーク、または他のコンピュータ・ネットワークとすることができる。
【0031】
図1に示す様々なシステムを接続するのに使用される通信リンクは、配線リンク、光リンク、衛星またはその他の無線通信リンク、波動伝搬リンク、情報伝達用のその他の機構を含む様々なタイプのリンクとすることができる。様々な通信プロトコルを使用して、通信リンクを介した情報通信を行うことができる。これらの通信プロトコルとして、TCP/IP、HTTPプロトコル、拡張マークアップ言語(XML)、無線アプリケーション・プロトコル(WAP)、ファイバ・チャネル・プロトコル、業界標準機構が開発中のプロトコル、ベンダの独自プロトコル、カスタマイズ・プロトコル、その他を挙げることができる。
【0032】
図1に示すネットワーク100などの分散コンピュータ・ネットワークに接続されるコンピュータ・システムは一般に、情報またはサービスを要求するか、それとも情報またはサービスをストア/提供するかという、そのコンピュータ・システムが担う役割に応じて、「クライアント」または「サーバ」に分類することができる。ユーザが情報要求またはサービス要求を構成するのに使用するコンピュータ・システムは一般に、「クライアント」コンピュータと呼ばれる。クライアント・システムから情報要求および/またはサービス要求を受信し、その要求を満たすのに必要な処理を実行し、要求に対応する結果/情報を要求元クライアント・システムに転送するコンピュータ・システムは通常、「サーバ」システムと呼ばれる。クライアント要求を満たすのに必要な処理は、単一のサーバ・システムで実行することができ、あるいは代りに他のサーバに代行させることもできる。したがって、図1に示すサーバ・システムは、1つまたは複数のクライアント・コンピュータから受信した要求が要求する情報および/またはサービスを提供するように構成される。しかし、あるコンピュータ・システムは、サーバとしてもクライアントとしても機能することができることを理解されたい。
【0033】
本発明のユーザは、クライアント・システム102を使用して、図1に示すストレージ・デバイスにストアされた1つまたは複数のファイルにストアされたデータにアクセスすることができる。本発明の一実施形態によれば、ユーザは、クライアント・システム102を使用して、分散システム100にストアされた1つまたは複数のファイルを識別しリストアするための要求を構成することができる。リストアするファイルを識別するため、ユーザは、要求の一部として、リストアするファイルの内容および/または属性に関する情報を指定することができる。ユーザはまた、クライアント・システム102を使用して、図1に示す他のシステムと対話することもできる。例えば、ユーザは、クライアント・システム102を使用して、データ管理サーバ(DMS)104と対話することができる。クライアント・システム102は、パーソナル・コンピュータ、ポータブル・コンピュータ、ワークステーション、コンピュータ端末、ネットワーク・コンピュータ、メインフレーム、キオスク、携帯情報端末(PDA)、セルラ電話などの通信デバイス、またはその他の情報処理システムを始めとする様々なタイプのシステムとすることができる。
【0034】
DMS104は、ファイル・リストア要求を受信し、ファイル・リストア要求内で指定された内容および/または属性情報に基づいて、1つまたは複数のファイルを容易に識別しリストアできるようにする処理を実行するように構成される。ファイル・リストア要求に含まれる情報に基づいてリストアする1つまたは複数のファイルを容易に識別できるようにするのにDMS104が使用する情報、また識別されたファイルをリストアするのにDMS104が使用する情報は、DMS104がアクセスできるメモリ位置にストアすることができる。例えば、そうした情報は、DMS104がアクセスできる1つまたは複数のデータベースにストアすることができる。図1に示す実施形態では、そうした情報は、DMS104がアクセスできるインデックス・データベース120および位置データベース122にストアされる。DMS104が実行する処理について以下でさらに詳しく説明する。
【0035】
本発明の教示によれば、1つまたは複数のファイルを識別しリストアするためにDMS104が実行する処理は、DMS104が実行するソフトウェア・モジュールによって、DMS104に結合されたハードウェア・モジュールによって、またはそれらの組合せによって実施することができる。本発明の代替実施形態では、DMS104に結合された他のコンピュータ・システムやデバイスによって、処理を実行することもできる。
【0036】
本発明の一実施形態によれば、分散システム100は、バックアップ・データ・ファイルとアーカイブ・データ・ファイルを含むデータ・ファイルをストアするのに使用される1つまたは複数のストレージ・デバイスを含む。様々な異なるタイプのデバイスを使用して、ファイルをストアすることができる。ファイルは、専用ストレージ・デバイス(例えば、デバイス115、116、118)に、様々なコンピュータ・システム(例えば、クライアント及びサーバ・システム)、着脱可能ストレージ・デバイス、その他にストアすることができる。ストレージ・デバイスの例として、テープ、ディスク・ドライブ、光ディスク、ソリッドステート・ストレージ、およびその他のタイプのコンピュータ可読ストレージ媒体を挙げることができる。一般に、用語「ストレージ・デバイス」を使用したときは、デジタルまたは電子形式でデータをストアできるシステム、サブシステム、デバイス、コンピュータ媒体、ネットワーク、またはその他類似のシステムまたは機構を指すものとする。ストレージ・デバイスは、直接DMSに、通信リンク112などの通信ネットワークを介してDMS104に、ストレージ・ネットワーク(例えば、ストレージ・エリア・ネットワーク(SAN)114、ネットワーク接続ストレージ(NAS)など)、および他の技法を介してDMS104に結合することができる。ストレージ・デバイスにストアされるある種のデータ・ファイル、例えば、アーカイブされたデータファイルやバックアップされたデータ・ファイルは、直接ブラウズしたりサーチしたりすることはできない。
【0037】
当業者に周知であるように、ストレージ・デバイスは一般に、ストレージ・デバイスにストアされたデータへのアクセスに要する時間量(「データ・アクセス時間」と呼ばれる)によって特徴づけられる。したがって、データ・ファイルをストアするのに使用されるストレージ・デバイスは、オンライン・ストレージ・デバイス115、ニアライン・ストレージ・デバイス116、オフライン・ストレージ・デバイス118、その他として特徴づけることができる。オンライン・ストレージ・デバイスのデータ・アクセス時間は一般に、ニアライン・ストレージ・デバイスのアクセス時間よりも短い。オフライン・ストレージ・デバイスのアクセス時間は一般に、ニアライン・ストレージ・デバイスのアクセス時間よりも長い。オフライン・ストレージ・デバイスは一般に、DMS104が直ちにアクセスできないデバイスである。オフライン・ストレージ・デバイスは一般に、アーカイブ・データやバックアップ・データをストアするのに使用される。オフライン・ストレージ・デバイスの例として、ディスク・ドライブ、テープ、光デバイス、その他などのコンピュータ可読ストレージが挙げられる。オフライン・ストレージ・デバイスにストアされたデータをリストアするのに先立って、オフライン・ストレージ・デバイスをアクセス可能にしなければならない。例えば、オフライン・デバイスとして着脱可能テープが使用されている場合、テープ上にストアされているデータをDMS104によってリストアするのに先立って、ユーザはテープをDMS104がアクセスできるようにしなければならない。
【0038】
様々な他の基準を使用して、ストレージ・デバイスを分類しまたは特徴づけることもできることを理解されたい。ストレージ・デバイスの分類は、本発明では必要とされず、特許請求の範囲で具陳される本発明の範囲を限定するものと解釈すべきではない。
【0039】
図2は、本発明の一実施形態による図1に示すコンピュータ・システム200の簡略ブロック図である。上で示したように、コンピュータ・システム200は、図1に示すクライアント・システムまたはサーバ・システム(例えば、DMS104)として実施することができる。図2に示すように、コンピュータ・システム200は、バス・サブシステム204を介して複数の周辺デバイスと通信を行う、少なくとも1つのプロセッサ202を含む。これらの周辺デバイスとして、メモリ・サブシステム208とファイル・ストレージ・サブシステム210を含むストレージ・サブシステム206、ユーザ・インターフェース入力デバイス212、ユーザ・インターフェース出力デバイス214、ネットワーク・インターフェース・サブシステム216を挙げることができる。入出力デバイスは、ユーザがコンピュータ・システム200と対話できるようにする。ユーザは、人間、デバイス、プロセス、別のコンピュータ、その他とすることができる。ネットワーク・インターフェース・サブシステム216は、他のコンピュータ・システム、ストレージ・デバイス、通信ネットワークへのインターフェースである。
【0040】
バス・サブシステム204は、コンピュータ・システム200の様々なコンポーネントとサブシステムに互いに目的通りの通信を行わせるための機構を提供する。コンピュータ・システム200の様々なサブシステムやコンポーネントは、同じ物理位置に存在する必要はなく、ネットワーク100内の様々な位置に分散することができる。バス・サブシステム204は概略的に単一バスとして示されているが、バス・サブシステムの代替実施形態として、複数バスを利用することもできる。
【0041】
ユーザ・インターフェース入力デバイス212として、キーボード、ポインティング・デバイス、マウス、トラックボール、タッチパッド、グラフィックス・タブレット、スキャナ、バーコード・スキャナ、ディスプレイに組み込まれたタッチスクリーン、音声識別システムなどの音声入力デバイス、マイクロフォン、その他のタイプの入力デバイスを挙げることができる。一般に、用語「入力デバイス」を使用するときは、コンピュータ・システム200を使用して情報を入力する、すべての可能なタイプのデバイスと方法を指すものとする。
【0042】
ユーザ・インターフェース出力デバイス214として、ディスプレイ・サブシステム、プリンタ、ファックス機、さらには音声出力デバイスなどの視覚非依存ディスプレイを挙げることができる。ディスプレイ・サブシステムは、ブラウン管(CRT)、液晶ディスプレイ(LCD)などのフラットパネル・デバイス、または投射デバイスとすることができる。一般に、用語「出力デバイス」を使用するときは、コンピュータ・システム200から情報を出力する、すべての可能なタイプのデバイスと方法を指すものとする。
【0043】
ストレージ・サブシステム206は、コンピュータ・システムや本発明の機能を提供する基本プログラミングとデータ構造をストアするように構成することができる。例えば、本発明の一実施形態によれば、本発明の機能を実施するソフトウェア・モジュールを、DMS104のストレージ・サブシステム206にストアすることができる。これらのソフトウェア・モジュールは、DMS104のプロセッサ202で実行することができる。ストレージ・サブシステム206はまた、本発明が使用することのできる情報をストアするリポジトリも提供する。ストレージ・サブシステム206は、メモリ・サブシステム208およびファイル・ストレージ・サブシステム210を含むことができる。
【0044】
メモリ・サブシステム208は、プログラム実行中に命令とデータをストレージするためのメインRAM(ランダム・アクセス・メモリ)や、固定命令をストアするROM(読取り専用メモリ)を始めとする、複数のメモリを含むことができる。ファイル・ストレージ・サブシステム210は、プログラムとデータ・ファイル用の永続(不揮発性)ストレージを提供し、ファイル・ストレージ・サブシステム210として、ハードディスク・ドライブ、着脱可能媒体を伴ったフロッピディスク・ドライブ、CD−ROM(コンパクト・デジタル読取り専用メモリ)ドライブ、光ドライブ、着脱可能媒体カートリッジ、その他のストレージ媒体を挙げることができる。1つまたは複数のドライブを、別の接続コンピュータ上の遠隔位置に配置することができる。
【0045】
コンピュータ・システム200自体は、パーソナル・コンピュータ、ポータブル・コンピュータ、ワークステーション、ネットワーク・コンピュータ、メインフレーム、キオスク、携帯情報端末(PDA)、セルラ電話などの通信デバイス、またはその他の情報処理システムを始めとする様々なタイプのシステムとすることができる。コンピュータとネットワークはその性質上、変化し続けていくので、図2に示すコンピュータ・システム200の説明は、コンピュータ・システムの好ましい実施形態を説明するための具体的なある例として意図されているにすぎない。コンピュータ・システムの多くの他の構成が可能であり、図2に示すコンピュータ・システムより多いまたは少ないコンポーネントを有することができる。
【0046】
図3は、本発明の一実施形態による、ファイルの内容および/または属性に基づいて、1つまたは複数のデータ・ファイルを識別しリストアする方法の簡略ハイレベル・フローチャート300である。図3に示す処理は、DMS104によって実行されるソフトウェア・モジュールによって、DMS104に結合されたハードウェア・モジュールによって、またはそれらの組合せによって実行することができる。図3に示すフローチャート300は、本発明を組み込んだ一実施形態を説明するものにすぎず、特許請求の範囲で定義する本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0047】
図3に説明するように、データ・ファイルのリストアを容易にするために、DMS104は、分散システム100内の1つまたは複数のストレージ・デバイスにストアされた、アーカイブ・ファイルとバックアップ・ファイルを含む様々なデータ・ファイルの内容および/または属性に関する情報を収集しストアする(ステップ302)。DMS104によってストアされたデータ・ファイルについての情報(「ファイル関連情報」とも呼ぶ)として、データ・ファイルの内容に関する情報および/またはデータ・ファイルの1つまたは複数の属性を識別する情報を挙げることができる。DMS104は、継続的または周期的に、あるいは特定のイベントが発生した時に、データ・ファイルについてのファイル関連情報を確定しストアすることができる。例えば、本発明の一実施形態によれば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされる毎に、DMS104はファイル関連情報を追跡し記録することができる。本発明の一実施形態によれば、ステップ302の一部分として、DMS104は、ストアされたデータ・ファイルと各ストアされたデータ・ファイルのファイル関連情報とのインデックス(またはマッピング)を作成しストアする。図1に示す実施形態では、インデックス情報は、インデックス・データベース120にストアされる。
【0048】
ステップ302の一部分として、DMS104はまた、データ・ファイルをストアするのに使用されるストレージ・デバイスとストレージ・デバイス上のファイルをストアする位置を識別する情報を追跡し記録する。したがって、DMS104は、ファイルをストアするストレージ・デバイスを識別する情報とストレージ・デバイス上のファイルをストアする位置を識別する情報を含む、各データ・ファイルについての「ファイル位置情報」をストアする。図1に示す実施形態では、ファイル位置情報は、位置データベース122にストアされる。様々な異なる形式を使用して物理位置情報をストアできることを理解されたい。本発明の一実施形態によれば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされる毎に、DMS104は、ファイルのファイル位置情報を追跡し記録する。
【0049】
様々な異なる形式を使用してインデックス情報とファイル位置情報をストアできることを理解されたい。例えば、本発明の一実施形態によれば、インデックス情報とファイル位置情報は、結合されて単一データベースにストアされる。他の実施形態では、それらの情報は複数のデータベースにストアされる。
【0050】
ステップ302で識別されストアされる情報は、次に、ファイル・リストア要求で指定される内容および/または属性基準に合致する1つまたは複数のデータ・ファイルを特定しリストアするのに使用される(ステップ304)。ステップ304で実行される処理について、以下でより詳細に説明する。
【0051】
本発明の代替形式では、図3のステップ302で実行される処理は、DMS104以外のコンピュータ・システムで実行できることを理解されたい。この実施形態では、ステップ302で確定される情報は、DMS104がアクセスできるメモリ位置にストアされる。その後、DMS104はストア情報を使用して、図3のステップ304に示される処理を実行することができる。
【0052】
図4は、本発明の一実施形態による、ファイルのリストアを容易にするのに使用される、ファイルに関する情報を収集する方法の簡略ハイレベル・フローチャート400である。本発明の一実施形態によれば、図4に示す処理は、DMS104上で実行されるソフトウェア・モジュールによって、DMS104に結合されたハードウェアによって、またはそれらの組合せによって実行される。図4に示すフローチャート400は、本発明を組み込んだ一実施形態を説明するものにすぎず、特許請求の範囲で具陳する本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、代替形態が理解できよう。
【0053】
図4に示すように、DMS104がある特定のファイルについての情報を確定し記録するための信号を受信したとき、この方法は起動される(ステップ402)。本発明の一実施形態によれば、確定され記録されるファイルについての情報として、ファイル関連情報とファイル位置情報を挙げることができる。ファイル関連情報はその特定のファイルの内容とそのファイルの属性に関する情報を含み、ファイル位置情報はそのファイルをストアするストレージ・デバイスを識別する情報とストレージ・デバイス上のそのファイルをストアする位置を識別する情報とを含む。
【0054】
本発明の一実施形態によれば、DMS104は、あるイベントが発生したときに信号を受信する。例えば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされるときに、DMS104は信号を受信する。あるいは、周期的な時間間隔で信号を受信することもできる。DMS104上で動作するプロセスまたはアプリケーション(例えば、タイマ・アプリケーション)を始めとする複数の異なる発信元から、あるいは他のアプリケーションまたはデバイスから、信号を受信することができる。
【0055】
ステップ402で受信した信号に応答して、DMS104は、特定のファイルの内容および/または属性に関する情報を確定する(ステップ404)。ファイルの内容に関する情報は、その特定のファイルに含まれる1つまたは複数の単語、句、イメージなどを含むことができる。ファイルの属性に関する情報は、その特定のファイルの1つまたは複数の属性を識別する情報を含むことができる。例えば、属性情報としては、その特定のファイルの作成者に関する情報、ファイルが作成された時間、ファイルが最後に変更された時間、ファイルが最後にアクセスされた時間、ファイルが属する部署名またはドメイン、ファイルに関連づけることのできる顧客属性、ファイルに関連づけられたその他の情報を挙げることができる。本発明の一実施形態によれば、DMS104は、特定のファイルの様々なバージョンについて、内容と属性情報を確定することができる。
【0056】
ステップ404で確定されたファイルの内容と属性に関する情報は次に、DMS104がアクセスできるメモリ位置にストアされる(ステップ406)。本発明の一実施形態によれば、DMS104は、特定のファイルについて確定された内容と属性情報に基づいて、インデックス(またはマッピング)を生成する。インデックス情報は、DMS104がアクセスできるインデックス・データベース120にストアすることができる。
【0057】
ステップ402で受信した信号に応答して、DMSは、特定のファイルの物理位置を指示するファイル位置情報も確定する(ステップ408)。先に示したように、ファイル位置情報は、ファイルをストアするストレージ・デバイスとそのストレージ・デバイス上のファイルをストアする位置(例えば、ディレクトリ・パス、パス名など)を識別する情報を含む。例えば、ファイルがオフライン・ストレージ・デバイスにストアされている場合、そのファイルについてのファイル位置情報は、コンピュータ可読オフライン・ストレージ・デバイスまたは媒体を識別する媒体識別子と、オフライン・ストレージ・デバイス上のそのファイルをストアする位置とを識別することができる。ファイルがオンラインまたはニアライン・ストレージ・デバイスにストアされている場合、そのファイルについてのファイル位置情報は、そのファイルをストアするストレージ・サブシステムまたはシステムを識別することができる。本発明の一実施形態によれば、ファイル位置情報は、ファイルがクライアント・コンピュータのローカル・ストレージ・システムから別のストレージ・デバイスに移送されたかどうかを指示する情報も含む。
【0058】
ステップ408で確定されたファイル位置情報は次に、DMS104がアクセスできるメモリ位置にストアされる(ステップ410)。本発明の一実施形態によれば、ファイル位置情報は、DMS104がアクセスできる位置データベース122にストアすることができる。
【0059】
本発明の一実施形態によれば、DMS104は次に、ファイル関連情報(ファイルの内容および/または属性に関する情報を含む)とファイル位置情報を使用して、ファイル・リストア要求に応答してファイルを識別しリストアできるようにする(ステップ412)。例えば、本発明の一実施形態によれば、DMS104は、インデックス・データベース120と位置データベース122にストアされた情報を使用して、1つまたは複数のファイルをリストアできるようにする。
【0060】
図5Aには、本発明の一実施形態による、インデックス・データベース120にストアすることのできるファイルの内容に関する情報を含むファイル関連情報の一部分が示されている。図5Aに示す実施形態では、情報は表500の形でストアされる。しかし、本発明の代替実施形態では、他の様々な形式を使用して情報をストアすることもできる。
【0061】
図5Aに示す表500は複数の行を含み、各行はある特定のファイルについてのある特定の内容に関する情報をストアする。図5Aに示すように、表500の列502は、列504によって識別される内容情報を含むファイルを識別する情報をストアする。列502でファイルを識別するのに、様々な異なる技法を使用することができる。図5Aに示す実施形態では、各ファイルはファイルに割り当てられたファイル識別子(例えば、識別子「123」)によって識別される。
【0062】
列504に格納される内容情報は、列502によって識別されるファイルに含まれる単語、句、イメージなどを識別することができる。図5Aに示す実施形態では、列504は、列502で識別されるファイルにストアされた単語を識別する(例えば、表500の第1行は、ファイル識別子「123」によって識別されるファイルに単語「patent」が含まれることを示す)。本発明の代替実施形態では、他のタイプの内容情報やテキスト属性も列504に格納される。
【0063】
列506は、列504によって識別される単語についてのタイトル・カウントを識別する。ある単語のタイトル・カウントは、列502によって識別されるファイルに関連するタイトル情報中における列504によって識別される単語の出現回数(度数)を示す。タイトル情報には、列502で識別されるファイルに関連するファイル名、または列502で識別されるファイルに関連するタイトル属性を当てることができる。
【0064】
列508は、列504によって識別される単語についてのキーワード・カウントを識別する。キーワード・カウントは、列502で識別されるファイルに関連するキーワード属性中における列504によって識別される単語の出現度数を示す。列510は、列504で識別される単語についての内容・カウントを識別する。内容・カウントは、列502で識別されるファイルの内容中に列504で識別される単語が出現する回数を示す。例えば、図5Aに示す表500の第1行は、単語「patent」が、ファイル「123」に関連するタイトル情報中に1回出現し、ファイル「123」に関連するキーワード属性中に1回出現し、ファイル「123」の内容中に2回出現することを示している。
【0065】
図5Aに示す表500は、インデックス・データベース120にストアされるファイル関連情報の一実施形態を説明するものにすぎず、本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0066】
上で説明したように、本発明の一実施形態によれば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされる毎に、インデックス・データベース120にストアされたファイル関連情報は、DMS104によって自動的に更新される。新しいファイルが作成されたとき、その新たに作成されたファイルに対応する1つまたは複数のレコードが、インデックス・データベース120に追加される。既存ファイルが変更されたとき、その既存ファイルに対応するインデックス・データベース120内の情報が更新される。本発明の一実施形態によれば、あるファイルに関する情報は、そのファイルが削除されたときに、インデックス・データベース120から削除する(または無効化標識を付ける)ことができる。
【0067】
図5Bには、本発明の一実施形態による、インデックス・データベース120にストアすることのできるファイルの属性に関する情報を含む、ファイル関連情報の一部分が示されている。図5Bに示す実施形態では、情報は表550の形でストアされる。しかし、本発明の代替実施形態では、他の様々な形式を使用して、情報をストアすることもできる。
【0068】
図5Bに示す表550は複数の行を含み、各行はある特定のファイルについての属性に関する情報をストアする。図5Bに示すように、表550の列552は、ファイルを識別する情報をストアする。列552でファイルを識別するのに、様々な異なる技法を使用することができる。図5Bに示す実施形態では、各ファイルはファイルに割り当てられたファイル識別子(例えば、識別子「123」)によって識別される。
【0069】
列554、556、558は、列552で識別されるファイルの様々な属性に関する情報をストアする。例えば、図5Bに示す表550では、列554は列552で識別されるファイルの最終アクセス時間を示す情報をストアし、列556は列552で識別されるファイルの作成時間を示す情報をストアし、列558は列552で識別されるファイルの最終変更時間を示す情報をストアする。
【0070】
図5Bに示す表550は、インデックス・データベース120にストアされるファイル関連情報の一実施形態を説明するものにすぎず、本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、代替形態が理解できよう。例えば、表550は、より多いまたは少ないファイル属性を格納できるように、図5Bに示す列数よりも多いまたは少ない列を含むことができる。
【0071】
上で説明したように、本発明の一実施形態によれば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされる毎に、インデックス・データベース120にストアされた属性情報は、DMS104によって自動的に更新される。新しいファイルが作成されたとき、その新たに作成されたファイルに対応する1つまたは複数のレコードが、インデックス・データベース120に追加される。既存ファイルが変更されたとき、その既存ファイルに対応するインデックス・データベース120内の情報が更新される。本発明の一実施形態によれば、あるファイルに関する情報は、そのファイルが削除されたときに、インデックス・データベース120から削除する(または無効化標識を付ける)ことができる。
【0072】
図6には、本発明の一実施形態による、ファイルのファイル位置情報の一部分が示されている。この情報は位置データベース122にストアすることができる。図6に示す実施形態では、情報は表600の形でストアされる。しかし、本発明の代替実施形態では、他の様々な形式を使用して、情報をストアすることもできる。
【0073】
図6に示す表600は複数の行を含み、各行はあるファイルについてのファイル位置情報をストアする。列602は、その位置情報が格納される1つまたは複数のファイルを識別する情報をストアする。様々な異なる技法を使用して、ファイルを識別することができる。図6に示す実施形態では、各ファイルは、ファイルに関連づけられたファイル識別子(例えば、識別子「123」、「124」、「125」など)を用いて識別される。
【0074】
列602によって識別される特定のファイルについて、列604は、ディレクトリ・パス名を識別する情報を格納し、ファイルは列606によって識別されるストレージ・デバイス上のそのパス名の下にストアされる。列606は、列602で識別されるファイルがストアされるストレージ・デバイスを識別する情報をストアする。図6に示すように、ストレージ・デバイス識別子(または媒体ID)を使用して、ファイルがストアされるストレージ・デバイスを識別することができる。ストレージ・デバイスは、オンライン・ストレージ・デバイス、ニアライン・ストレージ・デバイス、またはオフライン・ストレージ・デバイスとすることができる。
【0075】
列608は、列602によって識別されるファイルが(ファイルが作成された)ローカル・システムからバックアップ・ストレージに移送されたかどうかを示す情報をストアする。「Y」は、ファイルがファイルを作成するのに使用されたクライアント・システムからバックアップ・ストレージ・デバイスに移送されたことを示す。「N」は、ファイルがローカル・システムから移送されていないことを示す。列610は、列602によって識別されるファイルが、そのファイルが最初に作成されたローカル・システム上に存在するかどうかを示す情報をストアする。「Y」は、ファイルがローカル・システム上にストアされていることを示し、「N」は、ファイルがもはやローカル・システム上にストアされていないことを示す。
【0076】
図6に示す表600は、ファイル位置情報の一実施形態を説明するものにすぎず、本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、代替形態が理解できよう。
【0077】
上で説明したように、ファイルに関する情報が変更される毎に(例えば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされるときに)、位置データベース122にストアされた情報は、DMS104によって継続的に更新される。本発明の一実施形態によれば、位置データベース122にストアされた情報は、ファイルがアクセスされる毎に、またはその位置があるストレージ・デバイスから別のストレージ・デバイスに変更される毎に、またはそのファイルをストアするディレクトリが変ったときに更新される。例えば、ある特定のファイルについて、位置データベース122にストアされるそのファイルについての情報は、その特定のファイルが第1のストレージ・デバイスから、第1のストレージ・デバイスと同じタイプでもなくてもよい第2のストレージ・デバイスに移送される毎に更新される。例えば、そのファイルがローカル・システムからオンライン・ストレージに、オンライン・ストレージからニアライン・ストレージに、ニアライン・ストレージからオフライン・ストレージに、オフライン・ストレージからニアライン・ストレージに、ニアライン・ストレージからオンライン・ストレージに移送されるなどしたとき。
【0078】
図7は、本発明の一実施形態による、ファイルの内容および/または属性情報をインデックス化する方法の簡略ハイレベル・フローチャート700である。図7に示すフローチャート700は、本発明を組み込んだ一実施形態を説明するものにすぎず、特許請求の範囲で具陳する本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0079】
図7に示すように、ファイルがセーブまたはクローズされたことを示す信号を受信したとき、この方法が起動される(ステップ702)。本発明の一実施形態によれば、ファイルに対して実行されるオペレーションをモニタするように構成されたプロセスが、信号を受信する。例えば、ある特定のクライアント・システム102上で動作するプロセスは、その特定のクライアント・システム上でファイルがセーブまたはクローズされたときに、信号を検出または受信する。
【0080】
ステップ702で受信した信号に応答して、ファイルのコピーが準備エリアにストアされる(ステップ704)。本発明の一実施形態によれば、準備エリアは、ファイルを作成、セーブ、またはクローズするのに使用されるコンピュータ・システム上にローカルに存在する。ステップ702で信号を検出したプロセスは、準備エリアへのファイルのコピーを行えるようにすることができる。本発明の一実施形態によれば、準備エリアは、ローカル・コンピュータ・システム上に存在することのできる「書込み専用」ストレージ位置である。準備エリアからファイルをリストアすることもできる。例えば、誤ってファイルを削除してしまった場合、ユーザは準備エリアからファイルを回復することができる。
【0081】
準備エリアにストアされたファイルのコピーは次に、DMS104に送られる(ステップ706)。DMS104は次に、そのファイルについてのファイル関連情報やそのファイルについてのファイル位置情報を確定する(ステップ708)。ファイル関連情報はインデックス・データベース120にストアされ、ファイル位置情報は位置データベース122にストアされる(ステップ710)。本発明の代替実施形態では、ステップ706、708で実行される処理は、DMS104に代ってユーザまたはクライアント・システム自体で実行することもできる。
【0082】
図8は、本発明の一実施形態による、ファイルを識別しリストアする方法の簡略ハイレベル・フローチャート800である。図8に示すフローチャート800は、本発明を組み込んだ一実施形態を説明するものにすぎず、特許請求の範囲で定義する本発明の範囲を限定するものではない。図8に示す処理は、DMS104上で動作するソフトウェア・モジュールによって、DMS104に結合されたハードウェア・モジュールによって、またはそれらの組合せによって実行される。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0083】
図8に示すように、DMS104が1つまたは複数のファイルのリストアを要求する要求を受信したときにこの方法が起動される(ステップ802)。本発明の教示によれば、要求は、リストアする1つまたは複数のファイルを識別するのに使用される基準を指定する情報を含むことができる。基準は、リストアする1つまたは複数のファイルの内容および/または属性を指定することができる。例えば、リストア要求基準は、リストアされるファイルが含まなければならない1つまたは複数の単語または句を指定することができる。要求基準で指定される属性情報は、ファイル作成者、ファイル作成時間、ファイル変更時間、さらにリストアされるファイルのその他のファイル関連情報を指定することができる。従来のシステムと異なり、ファイルをリストアするために、ユーザが完全なファイル指定(例えば、完全な正確なファイル名)を明らかにする必要はない。
【0084】
複数の発信元から要求を受信することができる。例えば、1つまたは複数のクライアント・システム102から、DMS104上または他のコンピュータ・システム上で動作するプロセスまたはアプリケーションから、DMS104に結合されたデバイスとシステムから、さらにはその他の発信元から要求を受信することができる。
【0085】
DMS104は次に、インデックス・データベース120をサーチして、ステップ802で受信した要求で指定される基準を満足する1つまたは複数のファイルを識別する(ステップ804)。ステップ804で識別された1つまたは複数のファイルは、アーカイブ・ファイルおよび/またはバックアップ・ファイルを含むことができる。アーカイブまたはバックアップ・データに含まれるファイルを識別するために、ユーザはどのような明示的なアクションもとる必要はない。
【0086】
例えば、要求が1つまたは複数の単語を識別する情報を指定する場合、DMSはインデックス・データベースをサーチして、1つまたは複数の指定された単語を含む1つまたは複数のファイルを識別する。同様に、ステップ802で受信した要求が1つまたは複数のファイル属性を識別する情報を指定する場合、DMSはインデックス・データベースをサーチして、ユーザが指定したのと同じ属性をもつ1つまたは複数のファイルを識別する。
【0087】
本発明の一実施形態によれば、DMS104はまた、リストア要求で指定された基準との適合性に基づいて、ステップ804で確定された1つまたは複数のファイルを分類することができる。例えば、ファイルの内容中に指定された単語が現れる度数に基づいて、ファイルを分類することができる。要求との適合性の程度に基づいてファイルを分類するのに、当業者に周知の様々な技法を使用することができる。
【0088】
ステップ804で識別された1つまたは複数のファイルのリストが次に、ユーザに出力される(ステップ806)。要求との適合性の程度に基づいてファイルを分類する実施形態では、ステップ804で識別された1つまたは複数のファイルを分類したリストが、ステップ806でユーザに出力される。
【0089】
次にユーザは、ユーザに出力されたファイルのリストから、リストアする1つまたは複数のファイルを選択することができる。DMS104は、ステップ806でユーザに出力されたファイルのリストから、ユーザが選択したリストアする1つまたは複数のファイルを識別する信号を受信する(ステップ808)。ユーザが選択したリストアする各ファイルについて、DMS104は次に位置データベース122をサーチして、リストアするファイルの物理位置を確定する(ステップ810)。
【0090】
リストアする各ファイルについて、ステップ810で確定されたファイルの情報に基づいて、DMSは、DMS104がアクセスできないデバイス(例えば、オフライン・デバイス)にファイルがストアされているかどうかを判断する(ステップ812)。DMS104がアクセスできるデバイスにファイルがストアされている場合、そのファイルはユーザのため自動的にそのデバイスからリストアされる(ステップ814)。DMS104がアクセスできないストレージ・デバイスにファイルがストアされている場合、アクセス不可ストレージ・デバイスを識別するメッセージがユーザに出力される(ステップ816)。例えば、DMS104は、リストアするファイルをストアするオフライン・ストレージ・デバイスの媒体識別子を示すメッセージを出力することができる。
【0091】
次にユーザは、ステップ816で出力された情報を使用して、アクセス不可デバイスからファイルをリストアすることができる。例えば、ユーザは、ステップ816で識別されたストレージ・デバイスを、DMS104がアクセスできるようにすることができる。DMS104はその後、そのストレージ・デバイスからファイルをリストアすることができる。
【0092】
本発明の一実施形態では、ステップ806、808を任意選択とし省略することができる。この実施形態では、リストア要求で指定される情報基準を満足する1つまたは複数のファイルを識別した後(ステップ804)、DMS104は直ちにステップ810に進み、リストアする1つまたは複数のファイルの物理位置を確定することができる。この実施形態では、どのようなユーザ対話も必要とせず、ステップ802で受信するリストア要求に含まれる情報に基づいて、1つまたは複数のファイルを自動的にリストアする。
【0093】
先に説明したように、本発明は、ファイルの内容および/または属性に基づいて、ファイルを識別しリストアする技法を提供する。リストアのために識別されるファイルには、アーカイブ・ファイルおよび/またはバックアップ・ファイルを含むことができる。本発明の教示によれば、ユーザは、アーカイブまたはバックアップ・データからファイルをリストアするために、アーカイブまたはバックアップ・カタログを調べる必要はなく、完全なファイル名を提供する必要もない。したがって、本発明は、リストアするファイルを識別するのに使用する基準を指定し、アーカイブとバックアップ・ファイルを含む複数のファイルをサーチして基準を満足するファイルを識別し、識別されたファイルをリストアするための簡単で使いやすいインターフェースを提供する。本発明によって、異種ストレージ環境についての広い専門技術知識を必要とせず、直感的なサーチ、分類、検索が可能になる。
【0094】
本発明の一実施形態によれば、アーカイブ・ファイルとバックアップ・ファイルを含むファイルの物理位置に関する情報は、単一の位置データベース122に集約される。したがって、位置データベース122は、多数のかつ異種のストレージ・デバイス間にわたるファイル位置情報をストアする単一のデータベースとなる。同様に、アーカイブ・ファイルとバックアップ・ファイルを含むファイルの内容と属性についての情報は、単一のインデックス・データベース120に集約される。位置データベース122とインデックス・データベース120にストアされた情報を利用することで、本発明は、ファイルの実際のストレージ位置が異なるデバイスとシステムにあっても、アーカイブ・ファイルとバックアップ・ファイルを含むファイルを検索するための単一の論理データ・ストアを提供する。これによって、オンライン、ニアライン、またはオフラインのストレージ・デバイスからファイルをリストアするために、バックアップ・カタログをサーチまたはブラウズする必要がなくなる。したがって、本発明は、データのストレージ位置に関わりなくデータをリストアするための、単一のサーチ指向ユニフォーム・ユーザ・インターフェースを提供する。したがって、本発明は、データの位置やタイプ(例えば、アーカイブ、バックアップ、その他)に関わりなく、データへのアクセスを容易にする。本発明の一実施形態によれば、リストアするデータの識別およびデータのストレージ位置は、ユーザからは透過的である。また本発明によって、システム管理者およびシステム・ソフトウェア・アプリケーションは、ユーザの関与なしにストレージの位置を動的に確定することができる。
【0095】
本発明の具体的な実施形態について説明してきたが、様々な修正形態、変更形態、代替構造、および均等物も本発明の範囲内に包含される。本明細書に記載の発明は、ある具体的なデータ処理環境内のオペレーションに制限されるものではなく、複数のデータ処理環境内でも制約なく動作する。さらに、本発明を具体的な一連の処理および工程を用いて説明してきたが、本発明が説明した一連の処理および工程に限定されるものではないことは当業者には明らかであろう。
【0096】
さらに、ハードウェアとソフトウェアの特定の組合せを用いて本発明を説明してきたが、ハードウェアとソフトウェアの他の組合せも本発明の範囲内に含まれることを理解されたい。本発明は、ハードウェアのみによって、またはソフトウェアのみによって、またはそれらの組合せを用いて実施することができる。
【0097】
したがって、明細書および図面は、制限的なものではなく説明的なものと見なすべきである。しかし、特許請求の範囲に記載の本発明のより広範な主旨および範囲から逸脱することなく、本発明に追加、控除、削除、および他の修正および変更を施し得ることは明らかであろう。
【図面の簡単な説明】
【0098】
【図1】本発明の実施形態を組み込むことができる分散システムの簡略ブロック図である。
【図2】本発明の一実施形態によるコンピュータ・システムの簡略ブロック図である。
【図3】本発明の一実施形態によるファイルの内容および/または属性に基づいて1つまたはいくつかのファイルをリストアする方法の簡略ハイレベル・フローチャートである。
【図4】本発明の一実施形態によるファイルを容易にリストアできるようにするのに使用されるファイルに関する情報を収集する方法の簡略ハイレベル・フローチャートである。
【図5】本発明の一実施形態に従ってストアすることができるファイルの内容に関する情報を含むファイル関連情報の一部を示す図である。
【図6】本発明の一実施形態に従って位置データベースにストアすることができるファイルの位置情報の一部を示す図である。
【図7】本発明の一実施形態によるファイルの内容および/または属性情報をインデックス化する方法の簡略ハイレベル・フローチャートである。
【図8】本発明の一実施形態によるファイルをリストアする方法を示す簡略ハイレベル・フローチャートである。
【0001】
(関連出願の相互参照)
本出願は、2001年8月31日に出願された「検索のためのファイルの内容と属性のインデックス化(FILE CONTENT AND ATTRIBUTES INDEXING FOR RETRIEVAL)」と題する米国特許仮出願第60/316783号からの優先権を主張し、同仮出願の非仮出願である。同仮出願のすべての内容を実際上参照により本明細書に組み込む。
【技術分野】
【0002】
本発明は、データのストアおよび管理に関し、より詳細には、データの内容と属性に基づいてデータの検索を容易に行えるようにする技法に関する。
【背景技術】
【0003】
データをディスク・サブシステムからテープ(または他のオフライン媒体)などのバックアップ媒体にバックアップ・セットとしてバックアップする、いくつかのデータストア/バックアップ・アプリケーションが従来から利用可能である。データは、ファイルやディレクトリなどのストレージ・ユニットの形でストアすることができる。バックアップ手順の一環として、バックアップ・アプリケーションは、各バックアップ・セットに含まれる内容を識別する(「バックアップ・カタログ」と呼ばれる)カタログを作成する。例えば、バックアップ・カタログは、各バックアップ・セット毎に、そのバックアップ・セットに含まれるファイルとディレクトリを含む。バックアップ・カタログ中のファイルとディレクトリは一般に、コンピュータ処理に適したファイル名とディレクトリ名を用いて識別される。バックアップ・カタログによって、バックアップに使用されるバックアップ媒体を識別する媒体識別子(ID)(例えば、オフライン媒体ID)を識別することもできる。ストアされるデータに対して、1つまたは複数のバックアップ・カタログを生成することができる。
【0004】
バックアップ・アプリケーションによって生成されたバックアップ・カタログは一般に、バックアップ媒体自体やローカル・ハード・ドライブにストアされる。ある特定のファイルをバックアップ媒体からリストアする必要が生じた場合、ユーザは最初に複数のバックアップ・カタログをサーチして、その特定のファイルが含まれるバックアップ・セットを識別しなければならない。バックアップ・セットは、その特定のファイルをストアしているバックアップ媒体を直接的には識別しない。現在のところ、バックアップ・カタログ中の特定のファイルのサーチは、その特定のファイルの完全なファイル指定に基づいて行われている。したがって、ユーザは、リストアしたいファイルの正確な名前を知らなければならない。ある特定のファイルの正確なファイル名を忘れてしまった場合、ユーザは、その特定のファイルに関するファイル名を識別するのに、複数のバックアップ・カタログのブラウズを強いられる。さらに、バックアップ・カタログからその特定のファイルのファイル名を確定することができない場合、ユーザは、自分が望む正しいファイルが取得できるまで、バックアップ媒体から複数のファイルをリストアしなければならない。ユーザが複数のファイルをリストアしようとしている場合、問題はさらに悪化する。
【0005】
したがって、上で説明したように、従来のデータ管理及びデータ・ストレージ・アプリケーションは、ある特定のファイルをバックアップまたはアーカイブ・データからリストアする場合、その特定のファイルの完全なファイル指定(例えば、その特定のファイルのファイル名)を事前に知っていることをユーザに要求する。ストアされるファイルとディレクトリが多く、ストアされたファイルに関連づけられる暗号化された名前が多い場合には、これは非常に面倒で不便なことになる。したがって、データのリストア、特にバックアップ・データやアーカイブ・データのリストアは、ユーザやデータ・ストレージ・システムを管理するシステム管理者にとって時間を浪費する面倒なオペレーションである。このことは、組織または企業の情報技術(IT)関連費用を押し上げ、組織または企業の収益に悪影響を及ぼす。
【発明の開示】
【発明が解決しようとする課題】
【0006】
上記の事柄に鑑みて、データのストレージとリストア・オペレーションを簡略化する技法が必要である。さらに、データをリストアするためのより簡単でより使いやすいインターフェースを提供する技法も必要である。
【課題を解決するための手段】
【0007】
本発明の実施態様は、異種ストレージ環境においてデータをリストアする技法を提供する。ユーザが指定するデータ内容および/またはデータ属性に基づいてリストアするデータを識別することができる。リストアするデータを、バックアップ・データ、アーカイブ・データ、その他のタイプのデータから識別することができる。したがって、本発明の実施態様は、データのストレージ位置に関わらずデータをリストアできるように、単一のサーチ指向ユニフォーム・ユーザ・インターフェースを提供する。したがって、本発明は、データの位置やタイプ(例えば、アーカイブ、バックアップ、その他)に関わらず、データに容易にアクセスできる。
【0008】
本発明の一実施態様によれば、ストレージ環境内の複数のストレージ・デバイスにストアされており、バックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含む複数のファイルから1つまたはいくつかのファイルをリストアする技法が提供される。この実施態様では、複数のファイル内のファイルの内容に関する情報と、複数のファイル内のファイルのストレージ位置を識別する位置情報がストアされる。第1の内容を識別する情報を含む要求が受信される。それに応答して、本発明の実施態様は、複数のファイルの内容に関する情報に基づいて、複数のファイルの中から、第1の内容を含む第1の1つまたは複数のファイル・セットを確定する。第1のファイル・セットのうちの少なくとも1つのファイルに関するストレージ位置情報が位置情報に基づいて確定される。ストレージ位置情報は、少なくとも1つのファイルがストアされている第1のストレージ・デバイスを複数のストレージ・デバイスから識別する情報を含む。少なくとも1つのファイルが、第1のストレージ・デバイスからリストアされる。
【0009】
本発明の別の実施態様によれば、ストレージ環境内の複数のストレージ・デバイスにストアされており、バックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含む複数のファイルから1つまたはいくつかのファイルをリストアする技法が提供される。この実施態様では、複数のファイル内の各ファイルの1つまたは複数の属性を識別する属性情報と、複数のファイル内のファイルのストレージ位置を識別する位置情報がストアされる。第1の属性を識別する情報を含む要求が受信される。それに応答して、本発明の実施態様は、その属性情報に基づいて、複数のファイルの中から、第1の属性を満足する第1の1つまたは複数のファイル・セットを確定する。第1のファイル・セットのうちの少なくとも1つのファイルに関するストレージ位置情報が位置情報に基づいて確定される。ストレージ位置情報は、少なくとも1つのファイルがストアされている第1のストレージ・デバイスを複数のストレージ・デバイスから識別する情報を含む。少なくとも1つのファイルが第1のストレージ・デバイスからリストアされる。
【0010】
本発明のさらに別の実施態様によれば、ストレージ環境内の複数のストレージ・デバイスにストアされており、バックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含む複数のファイルから1つまたはいくつかのファイルをリストアする技法が提供される。この実施態様では、複数のファイル内のファイルの内容に関する情報と、複数のファイル内のファイルの1つまたは複数の属性を識別する属性情報がストアされる。この実施態様では、複数のファイル内のファイルのストレージ位置を識別する位置情報にもアクセスすることができる。第1の基準を識別する情報を含む要求が受信される。この実施態様は、属性情報と複数のファイル内のファイルの内容に関する情報に基づいて、複数のファイルの中から、第1の基準を満足する第1の1つまたは複数のファイル・セットを確定する。この実施態様では、第1のファイル・セットのうちの少なくとも1つのファイルのストレージ位置情報が位置情報に基づいて確定される。ストレージ位置情報は、少なくとも1つのファイルがストアされている第1のストレージ・デバイスを複数のストレージ・デバイスから識別する情報を含む。少なくとも1つのファイルが第1のストレージ・デバイスからリストアされる。
【発明を実施するための最良の形態】
【0011】
本発明の上記の実施形態、その他の特徴、および利点は、以下の明細書、特許請求の範囲、および添付の図面を参照することでより明らかになるであろう。
【0012】
図1は本発明の実施形態を組み込むことができる分散システムの簡略ブロック図である。
【0013】
図2は本発明の一実施形態によるコンピュータ・システムの簡略ブロック図である。
【0014】
図3は本発明の一実施形態によるファイルの内容および/または属性に基づいて1つまたはいくつかのファイルをリストアする方法の簡略ハイレベル・フローチャートである。
【0015】
図4は本発明の一実施形態によるファイルを容易にリストアできるようにするのに使用されるファイルに関する情報を収集する方法の簡略ハイレベル・フローチャートである。
【0016】
図5Aは本発明の一実施形態に従ってストアすることができるファイルの内容に関する情報を含むファイル関連情報の一部を示す図である。
【0017】
図5Bは本発明の一実施形態に従ってストアすることができるファイルの属性に関する情報を含むファイル関連情報の一部を示す図である。
【0018】
図6は本発明の一実施形態に従って位置データベースにストアすることができるファイルの位置情報の一部を示す図である。
【0019】
図7は本発明の一実施形態によるファイルの内容および/または属性情報をインデックス化する方法の簡略ハイレベル・フローチャートである。
【0020】
図8は本発明の一実施形態によるファイルをリストアする方法を示す簡略ハイレベル・フローチャートである。
【0021】
本発明の実施形態は、異種ストレージ環境においてデータをリストアする技法を提供する。リストアするデータを、ユーザが指定するデータ内容および/またはデータ属性に基づいて識別することができる。リストアするデータを、バックアップ・データ、アーカイブ・データ、その他のタイプのデータから識別することができる。したがって、本発明の実施形態は、データのストレージ位置に関わらずデータをリストアできるように、単一のサーチ指向ユニフォーム・ユーザ・インターフェースを提供する。したがって、本発明は、データの位置やタイプ(例えば、アーカイブ、バックアップ、その他)に関わらず、データに容易にアクセスできるようにする。
【0022】
本発明の一実施形態によれば、異種ストレージ環境内にストア、バックアップ、またはアーカイブされたデータをリストアするためのより簡単でより使いやすいインターフェースを提供する技法が提供される。データのストレージ位置およびデータのタイプ(例えば、バックアップ・データ、アーカイブ・データなど)に関わらず、データのリストアはユーザからは透過的である。
【0023】
この適用例では、用語「バックアップ・データ」(またはデータがファイル形式でストアされる場合は「バックアップ・ファイル」)は、データ原本が消失またはアクセス不可となった場合の復旧用に不揮発性ストア媒体にストアされたデータを指すものとする。バックアップ・コピーのバックアップ・データは通常、テープなどの着脱可能ストア媒体にストアされる。従来技術では、リストアするバックアップ・データの内容を識別し、そのバックアップ・データをバックアップ媒体からリストアするには、明示的なアクションが必要とされる。その結果、従来技術では、リストアされるバックアップ・データの識別とその識別されたバックアップ・データのリストアはユーザから透過的ではない。例えば、特定の内容を含む1つまたは複数のバックアップ・ファイル、または関連する特定の属性を有するファイルを識別するのに、バックアップ・ファイルの内容をうまく使ってサーチすることはできない。「背景技術」セクションで説明したように、従来技術では、ある特定のバックアップ・ファイルをリストアするために、ユーザは、完全なファイル指定を用いて複数のバックアップ・カタログをサーチして、その特定のファイルを含むバックアップ・セットを識別し、そのバックアップ・セット内のすべてのファイルをリストアし、そのリストアされたファイルをサーチして、所望の内容を含む特定のファイルを探さなければならない。
【0024】
この適用例では、用語「アーカイブ・データ」(またはデータがファイル形式でストアされる場合は「アーカイブ・ファイル」)は、データの集合を長期間にわたって耐久的に記録しておくためにとられたデータの集合のコピーを指すものとする。データがアーカイブされた場合、元のデータの集合は削除されることもある。アーカイブ・データは一般に、テープなどの着脱可能媒体上にストアされ、1つまたは複数のデータ・ファイルを含むことができる。従来技術では、リストアするアーカイブ・データの内容を識別し、そのアーカイブ・データをアーカイブ媒体からリストアするには、明示的なアクションが必要とされる。その結果、従来技術では、リストアされるアーカイブ・データの識別とその識別されたアーカイブ・データのリストアはユーザから透過的ではない。例えば、特定の内容を含む1つまたは複数のアーカイブ・ファイル、または関連する特定の属性を有するファイルを識別するのに、アーカイブ・ファイルの内容をうまく使ってサーチすることはできない。したがって、従来技術では、ある特定のアーカイブ・ファイルをリストアするために、ユーザは、完全なファイル指定を用いて複数のアーカイブ・カタログをサーチして、その特定のファイルを含むアーカイブ・セットを識別し、そのアーカイブ・セット内のすべてのファイルをリストアし、そのリストアされたファイルをサーチして、所望の内容を含む特定のファイルを探さなければならない。
【0025】
この適用例では、用語「データのリストア」は、データをそのストレージ位置から検索しまたはアクセスし、そのデータをデータ要求者またはユーザが利用できるようにすることを指すものとする。例えば、ユーザがあるデータ・ファイルにストアされているデータにアクセスできる場合、そのデータ・ファイルはリストアされていると見なされる。本発明の一実施形態によれば、データのストレージ位置またはタイプ(例えば、原データ、バックアップ・データ、アーカイブ・データなど)に関わらず、データのリストアはユーザから透過的である。本発明の実施形態は、原データ、バックアップ・データ、アーカイブ・データ、その他のタイプのデータからリストアされるデータを識別することができる。ユーザは、リストアするデータを識別するために明示的なアクションをとる必要がない。
【0026】
本発明の実施形態は、ユーザが指定する基準を満足する、リストアされる1つまたは複数のデータ・ファイルを識別することができる。ユーザが指定する基準として、ユーザが指定する内容および/または1つまたは複数のファイル属性を挙げることができる。リストアされる1つまたは複数のファイルは、バックアップ・ファイルとアーカイブ・ファイルを含む複数のファイルから識別することができる。例えば、ユーザ指定の内容および/またはユーザ指定の属性を含む1つまたは複数のファイルをリストアのために識別する。次に、1つまたは複数の識別されたファイルをリストアする。その結果、複数のバックアップ・カタログまたはアーカイブ・カタログをサーチする必要がなくなる。
【0027】
本発明の教示によれば、ユーザは、リストアするファイルの内容または属性についての情報を知ることによって、ファイルを検索することができる。ファイルをリストアするのに使用できる内容または属性として、ファイル内の1つまたは複数の単語、ファイル内容が関連するトピックまたは主題、ファイルの作成者情報、ファイルに関連する時間情報(例えば、ファイルの作成時間、ファイルの最終変更時間など)、他の類似のファイル関連情報を挙げることができる。
【0028】
以下に記載の本発明の実施形態は、バックアップ・ファイルとアーカイブ・ファイルを含む複数のデータ・ファイルからデータ・ファイルをリストアする技法を説明する。しかし、本発明の教示はまた、当業者に周知の他のタイプのストレージ・ユニットからデータをリストアする際にも利用できることを理解されたい。例えば、本発明の教示は、ブロック・データをリストアするのに利用することもできる。したがって、以下に記載の本発明の実施形態は、本発明の範囲を限定するものではない。
【0029】
図1は、本発明の一実施形態を組み込むことができる分散システム100の簡略ブロック図である。分散システム100は、複数の通信リンクを介して1つまたは複数の通信ネットワークに結合された複数のコンピュータ・システムとストレージ・デバイスを含む。図1に示すように、複数のコンピュータ・システムには、通信ネットワーク112に結合された1つまたは複数のユーザ(クライアント)システム102、通信ネットワーク112とストレージ・エリア・ネットワーク(SAN)114に結合されたデータ管理サーバ(DMS)104を含む複数のサーバ・システム、通信ネットワーク112に結合されたアプリケーション・サービス・プロバイダ(ASP)サーバ106、さらにはインターネットなどの通信ネットワーク110への接続性を提供するサーバ108が含まれる。図1に示す分散コンピュータ・ネットワーク100は、本発明を組み込んだ実施形態を説明するためのものにすぎず、特許請求の範囲で定義する本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0030】
通信ネットワーク112、110などの図1に示す通信ネットワークは、図1に示す様々なコンピュータ・システムとストレージ・デバイスの間の通信と情報交換を可能にする機構を提供する。通信ネットワーク自体は、数多くの相互接続されたコンピュータ・システムや通信リンクから構成することができる。例えば、通信ネットワーク112は、(図1に示すような)LAN、ワイド・エリア・ネットワーク(WAN)、無線ネットワーク、イントラネット、私設ネットワーク、公衆ネットワーク、交換ネットワーク、または他の適当な通信ネットワークとすることができる。同様に、通信ネットワーク110も、(図1に示すような)インターネットなどの他の通信ネットワーク、または他のコンピュータ・ネットワークとすることができる。
【0031】
図1に示す様々なシステムを接続するのに使用される通信リンクは、配線リンク、光リンク、衛星またはその他の無線通信リンク、波動伝搬リンク、情報伝達用のその他の機構を含む様々なタイプのリンクとすることができる。様々な通信プロトコルを使用して、通信リンクを介した情報通信を行うことができる。これらの通信プロトコルとして、TCP/IP、HTTPプロトコル、拡張マークアップ言語(XML)、無線アプリケーション・プロトコル(WAP)、ファイバ・チャネル・プロトコル、業界標準機構が開発中のプロトコル、ベンダの独自プロトコル、カスタマイズ・プロトコル、その他を挙げることができる。
【0032】
図1に示すネットワーク100などの分散コンピュータ・ネットワークに接続されるコンピュータ・システムは一般に、情報またはサービスを要求するか、それとも情報またはサービスをストア/提供するかという、そのコンピュータ・システムが担う役割に応じて、「クライアント」または「サーバ」に分類することができる。ユーザが情報要求またはサービス要求を構成するのに使用するコンピュータ・システムは一般に、「クライアント」コンピュータと呼ばれる。クライアント・システムから情報要求および/またはサービス要求を受信し、その要求を満たすのに必要な処理を実行し、要求に対応する結果/情報を要求元クライアント・システムに転送するコンピュータ・システムは通常、「サーバ」システムと呼ばれる。クライアント要求を満たすのに必要な処理は、単一のサーバ・システムで実行することができ、あるいは代りに他のサーバに代行させることもできる。したがって、図1に示すサーバ・システムは、1つまたは複数のクライアント・コンピュータから受信した要求が要求する情報および/またはサービスを提供するように構成される。しかし、あるコンピュータ・システムは、サーバとしてもクライアントとしても機能することができることを理解されたい。
【0033】
本発明のユーザは、クライアント・システム102を使用して、図1に示すストレージ・デバイスにストアされた1つまたは複数のファイルにストアされたデータにアクセスすることができる。本発明の一実施形態によれば、ユーザは、クライアント・システム102を使用して、分散システム100にストアされた1つまたは複数のファイルを識別しリストアするための要求を構成することができる。リストアするファイルを識別するため、ユーザは、要求の一部として、リストアするファイルの内容および/または属性に関する情報を指定することができる。ユーザはまた、クライアント・システム102を使用して、図1に示す他のシステムと対話することもできる。例えば、ユーザは、クライアント・システム102を使用して、データ管理サーバ(DMS)104と対話することができる。クライアント・システム102は、パーソナル・コンピュータ、ポータブル・コンピュータ、ワークステーション、コンピュータ端末、ネットワーク・コンピュータ、メインフレーム、キオスク、携帯情報端末(PDA)、セルラ電話などの通信デバイス、またはその他の情報処理システムを始めとする様々なタイプのシステムとすることができる。
【0034】
DMS104は、ファイル・リストア要求を受信し、ファイル・リストア要求内で指定された内容および/または属性情報に基づいて、1つまたは複数のファイルを容易に識別しリストアできるようにする処理を実行するように構成される。ファイル・リストア要求に含まれる情報に基づいてリストアする1つまたは複数のファイルを容易に識別できるようにするのにDMS104が使用する情報、また識別されたファイルをリストアするのにDMS104が使用する情報は、DMS104がアクセスできるメモリ位置にストアすることができる。例えば、そうした情報は、DMS104がアクセスできる1つまたは複数のデータベースにストアすることができる。図1に示す実施形態では、そうした情報は、DMS104がアクセスできるインデックス・データベース120および位置データベース122にストアされる。DMS104が実行する処理について以下でさらに詳しく説明する。
【0035】
本発明の教示によれば、1つまたは複数のファイルを識別しリストアするためにDMS104が実行する処理は、DMS104が実行するソフトウェア・モジュールによって、DMS104に結合されたハードウェア・モジュールによって、またはそれらの組合せによって実施することができる。本発明の代替実施形態では、DMS104に結合された他のコンピュータ・システムやデバイスによって、処理を実行することもできる。
【0036】
本発明の一実施形態によれば、分散システム100は、バックアップ・データ・ファイルとアーカイブ・データ・ファイルを含むデータ・ファイルをストアするのに使用される1つまたは複数のストレージ・デバイスを含む。様々な異なるタイプのデバイスを使用して、ファイルをストアすることができる。ファイルは、専用ストレージ・デバイス(例えば、デバイス115、116、118)に、様々なコンピュータ・システム(例えば、クライアント及びサーバ・システム)、着脱可能ストレージ・デバイス、その他にストアすることができる。ストレージ・デバイスの例として、テープ、ディスク・ドライブ、光ディスク、ソリッドステート・ストレージ、およびその他のタイプのコンピュータ可読ストレージ媒体を挙げることができる。一般に、用語「ストレージ・デバイス」を使用したときは、デジタルまたは電子形式でデータをストアできるシステム、サブシステム、デバイス、コンピュータ媒体、ネットワーク、またはその他類似のシステムまたは機構を指すものとする。ストレージ・デバイスは、直接DMSに、通信リンク112などの通信ネットワークを介してDMS104に、ストレージ・ネットワーク(例えば、ストレージ・エリア・ネットワーク(SAN)114、ネットワーク接続ストレージ(NAS)など)、および他の技法を介してDMS104に結合することができる。ストレージ・デバイスにストアされるある種のデータ・ファイル、例えば、アーカイブされたデータファイルやバックアップされたデータ・ファイルは、直接ブラウズしたりサーチしたりすることはできない。
【0037】
当業者に周知であるように、ストレージ・デバイスは一般に、ストレージ・デバイスにストアされたデータへのアクセスに要する時間量(「データ・アクセス時間」と呼ばれる)によって特徴づけられる。したがって、データ・ファイルをストアするのに使用されるストレージ・デバイスは、オンライン・ストレージ・デバイス115、ニアライン・ストレージ・デバイス116、オフライン・ストレージ・デバイス118、その他として特徴づけることができる。オンライン・ストレージ・デバイスのデータ・アクセス時間は一般に、ニアライン・ストレージ・デバイスのアクセス時間よりも短い。オフライン・ストレージ・デバイスのアクセス時間は一般に、ニアライン・ストレージ・デバイスのアクセス時間よりも長い。オフライン・ストレージ・デバイスは一般に、DMS104が直ちにアクセスできないデバイスである。オフライン・ストレージ・デバイスは一般に、アーカイブ・データやバックアップ・データをストアするのに使用される。オフライン・ストレージ・デバイスの例として、ディスク・ドライブ、テープ、光デバイス、その他などのコンピュータ可読ストレージが挙げられる。オフライン・ストレージ・デバイスにストアされたデータをリストアするのに先立って、オフライン・ストレージ・デバイスをアクセス可能にしなければならない。例えば、オフライン・デバイスとして着脱可能テープが使用されている場合、テープ上にストアされているデータをDMS104によってリストアするのに先立って、ユーザはテープをDMS104がアクセスできるようにしなければならない。
【0038】
様々な他の基準を使用して、ストレージ・デバイスを分類しまたは特徴づけることもできることを理解されたい。ストレージ・デバイスの分類は、本発明では必要とされず、特許請求の範囲で具陳される本発明の範囲を限定するものと解釈すべきではない。
【0039】
図2は、本発明の一実施形態による図1に示すコンピュータ・システム200の簡略ブロック図である。上で示したように、コンピュータ・システム200は、図1に示すクライアント・システムまたはサーバ・システム(例えば、DMS104)として実施することができる。図2に示すように、コンピュータ・システム200は、バス・サブシステム204を介して複数の周辺デバイスと通信を行う、少なくとも1つのプロセッサ202を含む。これらの周辺デバイスとして、メモリ・サブシステム208とファイル・ストレージ・サブシステム210を含むストレージ・サブシステム206、ユーザ・インターフェース入力デバイス212、ユーザ・インターフェース出力デバイス214、ネットワーク・インターフェース・サブシステム216を挙げることができる。入出力デバイスは、ユーザがコンピュータ・システム200と対話できるようにする。ユーザは、人間、デバイス、プロセス、別のコンピュータ、その他とすることができる。ネットワーク・インターフェース・サブシステム216は、他のコンピュータ・システム、ストレージ・デバイス、通信ネットワークへのインターフェースである。
【0040】
バス・サブシステム204は、コンピュータ・システム200の様々なコンポーネントとサブシステムに互いに目的通りの通信を行わせるための機構を提供する。コンピュータ・システム200の様々なサブシステムやコンポーネントは、同じ物理位置に存在する必要はなく、ネットワーク100内の様々な位置に分散することができる。バス・サブシステム204は概略的に単一バスとして示されているが、バス・サブシステムの代替実施形態として、複数バスを利用することもできる。
【0041】
ユーザ・インターフェース入力デバイス212として、キーボード、ポインティング・デバイス、マウス、トラックボール、タッチパッド、グラフィックス・タブレット、スキャナ、バーコード・スキャナ、ディスプレイに組み込まれたタッチスクリーン、音声識別システムなどの音声入力デバイス、マイクロフォン、その他のタイプの入力デバイスを挙げることができる。一般に、用語「入力デバイス」を使用するときは、コンピュータ・システム200を使用して情報を入力する、すべての可能なタイプのデバイスと方法を指すものとする。
【0042】
ユーザ・インターフェース出力デバイス214として、ディスプレイ・サブシステム、プリンタ、ファックス機、さらには音声出力デバイスなどの視覚非依存ディスプレイを挙げることができる。ディスプレイ・サブシステムは、ブラウン管(CRT)、液晶ディスプレイ(LCD)などのフラットパネル・デバイス、または投射デバイスとすることができる。一般に、用語「出力デバイス」を使用するときは、コンピュータ・システム200から情報を出力する、すべての可能なタイプのデバイスと方法を指すものとする。
【0043】
ストレージ・サブシステム206は、コンピュータ・システムや本発明の機能を提供する基本プログラミングとデータ構造をストアするように構成することができる。例えば、本発明の一実施形態によれば、本発明の機能を実施するソフトウェア・モジュールを、DMS104のストレージ・サブシステム206にストアすることができる。これらのソフトウェア・モジュールは、DMS104のプロセッサ202で実行することができる。ストレージ・サブシステム206はまた、本発明が使用することのできる情報をストアするリポジトリも提供する。ストレージ・サブシステム206は、メモリ・サブシステム208およびファイル・ストレージ・サブシステム210を含むことができる。
【0044】
メモリ・サブシステム208は、プログラム実行中に命令とデータをストレージするためのメインRAM(ランダム・アクセス・メモリ)や、固定命令をストアするROM(読取り専用メモリ)を始めとする、複数のメモリを含むことができる。ファイル・ストレージ・サブシステム210は、プログラムとデータ・ファイル用の永続(不揮発性)ストレージを提供し、ファイル・ストレージ・サブシステム210として、ハードディスク・ドライブ、着脱可能媒体を伴ったフロッピディスク・ドライブ、CD−ROM(コンパクト・デジタル読取り専用メモリ)ドライブ、光ドライブ、着脱可能媒体カートリッジ、その他のストレージ媒体を挙げることができる。1つまたは複数のドライブを、別の接続コンピュータ上の遠隔位置に配置することができる。
【0045】
コンピュータ・システム200自体は、パーソナル・コンピュータ、ポータブル・コンピュータ、ワークステーション、ネットワーク・コンピュータ、メインフレーム、キオスク、携帯情報端末(PDA)、セルラ電話などの通信デバイス、またはその他の情報処理システムを始めとする様々なタイプのシステムとすることができる。コンピュータとネットワークはその性質上、変化し続けていくので、図2に示すコンピュータ・システム200の説明は、コンピュータ・システムの好ましい実施形態を説明するための具体的なある例として意図されているにすぎない。コンピュータ・システムの多くの他の構成が可能であり、図2に示すコンピュータ・システムより多いまたは少ないコンポーネントを有することができる。
【0046】
図3は、本発明の一実施形態による、ファイルの内容および/または属性に基づいて、1つまたは複数のデータ・ファイルを識別しリストアする方法の簡略ハイレベル・フローチャート300である。図3に示す処理は、DMS104によって実行されるソフトウェア・モジュールによって、DMS104に結合されたハードウェア・モジュールによって、またはそれらの組合せによって実行することができる。図3に示すフローチャート300は、本発明を組み込んだ一実施形態を説明するものにすぎず、特許請求の範囲で定義する本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0047】
図3に説明するように、データ・ファイルのリストアを容易にするために、DMS104は、分散システム100内の1つまたは複数のストレージ・デバイスにストアされた、アーカイブ・ファイルとバックアップ・ファイルを含む様々なデータ・ファイルの内容および/または属性に関する情報を収集しストアする(ステップ302)。DMS104によってストアされたデータ・ファイルについての情報(「ファイル関連情報」とも呼ぶ)として、データ・ファイルの内容に関する情報および/またはデータ・ファイルの1つまたは複数の属性を識別する情報を挙げることができる。DMS104は、継続的または周期的に、あるいは特定のイベントが発生した時に、データ・ファイルについてのファイル関連情報を確定しストアすることができる。例えば、本発明の一実施形態によれば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされる毎に、DMS104はファイル関連情報を追跡し記録することができる。本発明の一実施形態によれば、ステップ302の一部分として、DMS104は、ストアされたデータ・ファイルと各ストアされたデータ・ファイルのファイル関連情報とのインデックス(またはマッピング)を作成しストアする。図1に示す実施形態では、インデックス情報は、インデックス・データベース120にストアされる。
【0048】
ステップ302の一部分として、DMS104はまた、データ・ファイルをストアするのに使用されるストレージ・デバイスとストレージ・デバイス上のファイルをストアする位置を識別する情報を追跡し記録する。したがって、DMS104は、ファイルをストアするストレージ・デバイスを識別する情報とストレージ・デバイス上のファイルをストアする位置を識別する情報を含む、各データ・ファイルについての「ファイル位置情報」をストアする。図1に示す実施形態では、ファイル位置情報は、位置データベース122にストアされる。様々な異なる形式を使用して物理位置情報をストアできることを理解されたい。本発明の一実施形態によれば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされる毎に、DMS104は、ファイルのファイル位置情報を追跡し記録する。
【0049】
様々な異なる形式を使用してインデックス情報とファイル位置情報をストアできることを理解されたい。例えば、本発明の一実施形態によれば、インデックス情報とファイル位置情報は、結合されて単一データベースにストアされる。他の実施形態では、それらの情報は複数のデータベースにストアされる。
【0050】
ステップ302で識別されストアされる情報は、次に、ファイル・リストア要求で指定される内容および/または属性基準に合致する1つまたは複数のデータ・ファイルを特定しリストアするのに使用される(ステップ304)。ステップ304で実行される処理について、以下でより詳細に説明する。
【0051】
本発明の代替形式では、図3のステップ302で実行される処理は、DMS104以外のコンピュータ・システムで実行できることを理解されたい。この実施形態では、ステップ302で確定される情報は、DMS104がアクセスできるメモリ位置にストアされる。その後、DMS104はストア情報を使用して、図3のステップ304に示される処理を実行することができる。
【0052】
図4は、本発明の一実施形態による、ファイルのリストアを容易にするのに使用される、ファイルに関する情報を収集する方法の簡略ハイレベル・フローチャート400である。本発明の一実施形態によれば、図4に示す処理は、DMS104上で実行されるソフトウェア・モジュールによって、DMS104に結合されたハードウェアによって、またはそれらの組合せによって実行される。図4に示すフローチャート400は、本発明を組み込んだ一実施形態を説明するものにすぎず、特許請求の範囲で具陳する本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、代替形態が理解できよう。
【0053】
図4に示すように、DMS104がある特定のファイルについての情報を確定し記録するための信号を受信したとき、この方法は起動される(ステップ402)。本発明の一実施形態によれば、確定され記録されるファイルについての情報として、ファイル関連情報とファイル位置情報を挙げることができる。ファイル関連情報はその特定のファイルの内容とそのファイルの属性に関する情報を含み、ファイル位置情報はそのファイルをストアするストレージ・デバイスを識別する情報とストレージ・デバイス上のそのファイルをストアする位置を識別する情報とを含む。
【0054】
本発明の一実施形態によれば、DMS104は、あるイベントが発生したときに信号を受信する。例えば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされるときに、DMS104は信号を受信する。あるいは、周期的な時間間隔で信号を受信することもできる。DMS104上で動作するプロセスまたはアプリケーション(例えば、タイマ・アプリケーション)を始めとする複数の異なる発信元から、あるいは他のアプリケーションまたはデバイスから、信号を受信することができる。
【0055】
ステップ402で受信した信号に応答して、DMS104は、特定のファイルの内容および/または属性に関する情報を確定する(ステップ404)。ファイルの内容に関する情報は、その特定のファイルに含まれる1つまたは複数の単語、句、イメージなどを含むことができる。ファイルの属性に関する情報は、その特定のファイルの1つまたは複数の属性を識別する情報を含むことができる。例えば、属性情報としては、その特定のファイルの作成者に関する情報、ファイルが作成された時間、ファイルが最後に変更された時間、ファイルが最後にアクセスされた時間、ファイルが属する部署名またはドメイン、ファイルに関連づけることのできる顧客属性、ファイルに関連づけられたその他の情報を挙げることができる。本発明の一実施形態によれば、DMS104は、特定のファイルの様々なバージョンについて、内容と属性情報を確定することができる。
【0056】
ステップ404で確定されたファイルの内容と属性に関する情報は次に、DMS104がアクセスできるメモリ位置にストアされる(ステップ406)。本発明の一実施形態によれば、DMS104は、特定のファイルについて確定された内容と属性情報に基づいて、インデックス(またはマッピング)を生成する。インデックス情報は、DMS104がアクセスできるインデックス・データベース120にストアすることができる。
【0057】
ステップ402で受信した信号に応答して、DMSは、特定のファイルの物理位置を指示するファイル位置情報も確定する(ステップ408)。先に示したように、ファイル位置情報は、ファイルをストアするストレージ・デバイスとそのストレージ・デバイス上のファイルをストアする位置(例えば、ディレクトリ・パス、パス名など)を識別する情報を含む。例えば、ファイルがオフライン・ストレージ・デバイスにストアされている場合、そのファイルについてのファイル位置情報は、コンピュータ可読オフライン・ストレージ・デバイスまたは媒体を識別する媒体識別子と、オフライン・ストレージ・デバイス上のそのファイルをストアする位置とを識別することができる。ファイルがオンラインまたはニアライン・ストレージ・デバイスにストアされている場合、そのファイルについてのファイル位置情報は、そのファイルをストアするストレージ・サブシステムまたはシステムを識別することができる。本発明の一実施形態によれば、ファイル位置情報は、ファイルがクライアント・コンピュータのローカル・ストレージ・システムから別のストレージ・デバイスに移送されたかどうかを指示する情報も含む。
【0058】
ステップ408で確定されたファイル位置情報は次に、DMS104がアクセスできるメモリ位置にストアされる(ステップ410)。本発明の一実施形態によれば、ファイル位置情報は、DMS104がアクセスできる位置データベース122にストアすることができる。
【0059】
本発明の一実施形態によれば、DMS104は次に、ファイル関連情報(ファイルの内容および/または属性に関する情報を含む)とファイル位置情報を使用して、ファイル・リストア要求に応答してファイルを識別しリストアできるようにする(ステップ412)。例えば、本発明の一実施形態によれば、DMS104は、インデックス・データベース120と位置データベース122にストアされた情報を使用して、1つまたは複数のファイルをリストアできるようにする。
【0060】
図5Aには、本発明の一実施形態による、インデックス・データベース120にストアすることのできるファイルの内容に関する情報を含むファイル関連情報の一部分が示されている。図5Aに示す実施形態では、情報は表500の形でストアされる。しかし、本発明の代替実施形態では、他の様々な形式を使用して情報をストアすることもできる。
【0061】
図5Aに示す表500は複数の行を含み、各行はある特定のファイルについてのある特定の内容に関する情報をストアする。図5Aに示すように、表500の列502は、列504によって識別される内容情報を含むファイルを識別する情報をストアする。列502でファイルを識別するのに、様々な異なる技法を使用することができる。図5Aに示す実施形態では、各ファイルはファイルに割り当てられたファイル識別子(例えば、識別子「123」)によって識別される。
【0062】
列504に格納される内容情報は、列502によって識別されるファイルに含まれる単語、句、イメージなどを識別することができる。図5Aに示す実施形態では、列504は、列502で識別されるファイルにストアされた単語を識別する(例えば、表500の第1行は、ファイル識別子「123」によって識別されるファイルに単語「patent」が含まれることを示す)。本発明の代替実施形態では、他のタイプの内容情報やテキスト属性も列504に格納される。
【0063】
列506は、列504によって識別される単語についてのタイトル・カウントを識別する。ある単語のタイトル・カウントは、列502によって識別されるファイルに関連するタイトル情報中における列504によって識別される単語の出現回数(度数)を示す。タイトル情報には、列502で識別されるファイルに関連するファイル名、または列502で識別されるファイルに関連するタイトル属性を当てることができる。
【0064】
列508は、列504によって識別される単語についてのキーワード・カウントを識別する。キーワード・カウントは、列502で識別されるファイルに関連するキーワード属性中における列504によって識別される単語の出現度数を示す。列510は、列504で識別される単語についての内容・カウントを識別する。内容・カウントは、列502で識別されるファイルの内容中に列504で識別される単語が出現する回数を示す。例えば、図5Aに示す表500の第1行は、単語「patent」が、ファイル「123」に関連するタイトル情報中に1回出現し、ファイル「123」に関連するキーワード属性中に1回出現し、ファイル「123」の内容中に2回出現することを示している。
【0065】
図5Aに示す表500は、インデックス・データベース120にストアされるファイル関連情報の一実施形態を説明するものにすぎず、本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0066】
上で説明したように、本発明の一実施形態によれば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされる毎に、インデックス・データベース120にストアされたファイル関連情報は、DMS104によって自動的に更新される。新しいファイルが作成されたとき、その新たに作成されたファイルに対応する1つまたは複数のレコードが、インデックス・データベース120に追加される。既存ファイルが変更されたとき、その既存ファイルに対応するインデックス・データベース120内の情報が更新される。本発明の一実施形態によれば、あるファイルに関する情報は、そのファイルが削除されたときに、インデックス・データベース120から削除する(または無効化標識を付ける)ことができる。
【0067】
図5Bには、本発明の一実施形態による、インデックス・データベース120にストアすることのできるファイルの属性に関する情報を含む、ファイル関連情報の一部分が示されている。図5Bに示す実施形態では、情報は表550の形でストアされる。しかし、本発明の代替実施形態では、他の様々な形式を使用して、情報をストアすることもできる。
【0068】
図5Bに示す表550は複数の行を含み、各行はある特定のファイルについての属性に関する情報をストアする。図5Bに示すように、表550の列552は、ファイルを識別する情報をストアする。列552でファイルを識別するのに、様々な異なる技法を使用することができる。図5Bに示す実施形態では、各ファイルはファイルに割り当てられたファイル識別子(例えば、識別子「123」)によって識別される。
【0069】
列554、556、558は、列552で識別されるファイルの様々な属性に関する情報をストアする。例えば、図5Bに示す表550では、列554は列552で識別されるファイルの最終アクセス時間を示す情報をストアし、列556は列552で識別されるファイルの作成時間を示す情報をストアし、列558は列552で識別されるファイルの最終変更時間を示す情報をストアする。
【0070】
図5Bに示す表550は、インデックス・データベース120にストアされるファイル関連情報の一実施形態を説明するものにすぎず、本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、代替形態が理解できよう。例えば、表550は、より多いまたは少ないファイル属性を格納できるように、図5Bに示す列数よりも多いまたは少ない列を含むことができる。
【0071】
上で説明したように、本発明の一実施形態によれば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされる毎に、インデックス・データベース120にストアされた属性情報は、DMS104によって自動的に更新される。新しいファイルが作成されたとき、その新たに作成されたファイルに対応する1つまたは複数のレコードが、インデックス・データベース120に追加される。既存ファイルが変更されたとき、その既存ファイルに対応するインデックス・データベース120内の情報が更新される。本発明の一実施形態によれば、あるファイルに関する情報は、そのファイルが削除されたときに、インデックス・データベース120から削除する(または無効化標識を付ける)ことができる。
【0072】
図6には、本発明の一実施形態による、ファイルのファイル位置情報の一部分が示されている。この情報は位置データベース122にストアすることができる。図6に示す実施形態では、情報は表600の形でストアされる。しかし、本発明の代替実施形態では、他の様々な形式を使用して、情報をストアすることもできる。
【0073】
図6に示す表600は複数の行を含み、各行はあるファイルについてのファイル位置情報をストアする。列602は、その位置情報が格納される1つまたは複数のファイルを識別する情報をストアする。様々な異なる技法を使用して、ファイルを識別することができる。図6に示す実施形態では、各ファイルは、ファイルに関連づけられたファイル識別子(例えば、識別子「123」、「124」、「125」など)を用いて識別される。
【0074】
列602によって識別される特定のファイルについて、列604は、ディレクトリ・パス名を識別する情報を格納し、ファイルは列606によって識別されるストレージ・デバイス上のそのパス名の下にストアされる。列606は、列602で識別されるファイルがストアされるストレージ・デバイスを識別する情報をストアする。図6に示すように、ストレージ・デバイス識別子(または媒体ID)を使用して、ファイルがストアされるストレージ・デバイスを識別することができる。ストレージ・デバイスは、オンライン・ストレージ・デバイス、ニアライン・ストレージ・デバイス、またはオフライン・ストレージ・デバイスとすることができる。
【0075】
列608は、列602によって識別されるファイルが(ファイルが作成された)ローカル・システムからバックアップ・ストレージに移送されたかどうかを示す情報をストアする。「Y」は、ファイルがファイルを作成するのに使用されたクライアント・システムからバックアップ・ストレージ・デバイスに移送されたことを示す。「N」は、ファイルがローカル・システムから移送されていないことを示す。列610は、列602によって識別されるファイルが、そのファイルが最初に作成されたローカル・システム上に存在するかどうかを示す情報をストアする。「Y」は、ファイルがローカル・システム上にストアされていることを示し、「N」は、ファイルがもはやローカル・システム上にストアされていないことを示す。
【0076】
図6に示す表600は、ファイル位置情報の一実施形態を説明するものにすぎず、本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、代替形態が理解できよう。
【0077】
上で説明したように、ファイルに関する情報が変更される毎に(例えば、ファイルが作成、変更、クローズ、セーブ、削除、アーカイブ、バックアップなどされるときに)、位置データベース122にストアされた情報は、DMS104によって継続的に更新される。本発明の一実施形態によれば、位置データベース122にストアされた情報は、ファイルがアクセスされる毎に、またはその位置があるストレージ・デバイスから別のストレージ・デバイスに変更される毎に、またはそのファイルをストアするディレクトリが変ったときに更新される。例えば、ある特定のファイルについて、位置データベース122にストアされるそのファイルについての情報は、その特定のファイルが第1のストレージ・デバイスから、第1のストレージ・デバイスと同じタイプでもなくてもよい第2のストレージ・デバイスに移送される毎に更新される。例えば、そのファイルがローカル・システムからオンライン・ストレージに、オンライン・ストレージからニアライン・ストレージに、ニアライン・ストレージからオフライン・ストレージに、オフライン・ストレージからニアライン・ストレージに、ニアライン・ストレージからオンライン・ストレージに移送されるなどしたとき。
【0078】
図7は、本発明の一実施形態による、ファイルの内容および/または属性情報をインデックス化する方法の簡略ハイレベル・フローチャート700である。図7に示すフローチャート700は、本発明を組み込んだ一実施形態を説明するものにすぎず、特許請求の範囲で具陳する本発明の範囲を限定するものではない。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0079】
図7に示すように、ファイルがセーブまたはクローズされたことを示す信号を受信したとき、この方法が起動される(ステップ702)。本発明の一実施形態によれば、ファイルに対して実行されるオペレーションをモニタするように構成されたプロセスが、信号を受信する。例えば、ある特定のクライアント・システム102上で動作するプロセスは、その特定のクライアント・システム上でファイルがセーブまたはクローズされたときに、信号を検出または受信する。
【0080】
ステップ702で受信した信号に応答して、ファイルのコピーが準備エリアにストアされる(ステップ704)。本発明の一実施形態によれば、準備エリアは、ファイルを作成、セーブ、またはクローズするのに使用されるコンピュータ・システム上にローカルに存在する。ステップ702で信号を検出したプロセスは、準備エリアへのファイルのコピーを行えるようにすることができる。本発明の一実施形態によれば、準備エリアは、ローカル・コンピュータ・システム上に存在することのできる「書込み専用」ストレージ位置である。準備エリアからファイルをリストアすることもできる。例えば、誤ってファイルを削除してしまった場合、ユーザは準備エリアからファイルを回復することができる。
【0081】
準備エリアにストアされたファイルのコピーは次に、DMS104に送られる(ステップ706)。DMS104は次に、そのファイルについてのファイル関連情報やそのファイルについてのファイル位置情報を確定する(ステップ708)。ファイル関連情報はインデックス・データベース120にストアされ、ファイル位置情報は位置データベース122にストアされる(ステップ710)。本発明の代替実施形態では、ステップ706、708で実行される処理は、DMS104に代ってユーザまたはクライアント・システム自体で実行することもできる。
【0082】
図8は、本発明の一実施形態による、ファイルを識別しリストアする方法の簡略ハイレベル・フローチャート800である。図8に示すフローチャート800は、本発明を組み込んだ一実施形態を説明するものにすぎず、特許請求の範囲で定義する本発明の範囲を限定するものではない。図8に示す処理は、DMS104上で動作するソフトウェア・モジュールによって、DMS104に結合されたハードウェア・モジュールによって、またはそれらの組合せによって実行される。当業者であれば、他の変形形態、修正形態、および代替形態が理解できよう。
【0083】
図8に示すように、DMS104が1つまたは複数のファイルのリストアを要求する要求を受信したときにこの方法が起動される(ステップ802)。本発明の教示によれば、要求は、リストアする1つまたは複数のファイルを識別するのに使用される基準を指定する情報を含むことができる。基準は、リストアする1つまたは複数のファイルの内容および/または属性を指定することができる。例えば、リストア要求基準は、リストアされるファイルが含まなければならない1つまたは複数の単語または句を指定することができる。要求基準で指定される属性情報は、ファイル作成者、ファイル作成時間、ファイル変更時間、さらにリストアされるファイルのその他のファイル関連情報を指定することができる。従来のシステムと異なり、ファイルをリストアするために、ユーザが完全なファイル指定(例えば、完全な正確なファイル名)を明らかにする必要はない。
【0084】
複数の発信元から要求を受信することができる。例えば、1つまたは複数のクライアント・システム102から、DMS104上または他のコンピュータ・システム上で動作するプロセスまたはアプリケーションから、DMS104に結合されたデバイスとシステムから、さらにはその他の発信元から要求を受信することができる。
【0085】
DMS104は次に、インデックス・データベース120をサーチして、ステップ802で受信した要求で指定される基準を満足する1つまたは複数のファイルを識別する(ステップ804)。ステップ804で識別された1つまたは複数のファイルは、アーカイブ・ファイルおよび/またはバックアップ・ファイルを含むことができる。アーカイブまたはバックアップ・データに含まれるファイルを識別するために、ユーザはどのような明示的なアクションもとる必要はない。
【0086】
例えば、要求が1つまたは複数の単語を識別する情報を指定する場合、DMSはインデックス・データベースをサーチして、1つまたは複数の指定された単語を含む1つまたは複数のファイルを識別する。同様に、ステップ802で受信した要求が1つまたは複数のファイル属性を識別する情報を指定する場合、DMSはインデックス・データベースをサーチして、ユーザが指定したのと同じ属性をもつ1つまたは複数のファイルを識別する。
【0087】
本発明の一実施形態によれば、DMS104はまた、リストア要求で指定された基準との適合性に基づいて、ステップ804で確定された1つまたは複数のファイルを分類することができる。例えば、ファイルの内容中に指定された単語が現れる度数に基づいて、ファイルを分類することができる。要求との適合性の程度に基づいてファイルを分類するのに、当業者に周知の様々な技法を使用することができる。
【0088】
ステップ804で識別された1つまたは複数のファイルのリストが次に、ユーザに出力される(ステップ806)。要求との適合性の程度に基づいてファイルを分類する実施形態では、ステップ804で識別された1つまたは複数のファイルを分類したリストが、ステップ806でユーザに出力される。
【0089】
次にユーザは、ユーザに出力されたファイルのリストから、リストアする1つまたは複数のファイルを選択することができる。DMS104は、ステップ806でユーザに出力されたファイルのリストから、ユーザが選択したリストアする1つまたは複数のファイルを識別する信号を受信する(ステップ808)。ユーザが選択したリストアする各ファイルについて、DMS104は次に位置データベース122をサーチして、リストアするファイルの物理位置を確定する(ステップ810)。
【0090】
リストアする各ファイルについて、ステップ810で確定されたファイルの情報に基づいて、DMSは、DMS104がアクセスできないデバイス(例えば、オフライン・デバイス)にファイルがストアされているかどうかを判断する(ステップ812)。DMS104がアクセスできるデバイスにファイルがストアされている場合、そのファイルはユーザのため自動的にそのデバイスからリストアされる(ステップ814)。DMS104がアクセスできないストレージ・デバイスにファイルがストアされている場合、アクセス不可ストレージ・デバイスを識別するメッセージがユーザに出力される(ステップ816)。例えば、DMS104は、リストアするファイルをストアするオフライン・ストレージ・デバイスの媒体識別子を示すメッセージを出力することができる。
【0091】
次にユーザは、ステップ816で出力された情報を使用して、アクセス不可デバイスからファイルをリストアすることができる。例えば、ユーザは、ステップ816で識別されたストレージ・デバイスを、DMS104がアクセスできるようにすることができる。DMS104はその後、そのストレージ・デバイスからファイルをリストアすることができる。
【0092】
本発明の一実施形態では、ステップ806、808を任意選択とし省略することができる。この実施形態では、リストア要求で指定される情報基準を満足する1つまたは複数のファイルを識別した後(ステップ804)、DMS104は直ちにステップ810に進み、リストアする1つまたは複数のファイルの物理位置を確定することができる。この実施形態では、どのようなユーザ対話も必要とせず、ステップ802で受信するリストア要求に含まれる情報に基づいて、1つまたは複数のファイルを自動的にリストアする。
【0093】
先に説明したように、本発明は、ファイルの内容および/または属性に基づいて、ファイルを識別しリストアする技法を提供する。リストアのために識別されるファイルには、アーカイブ・ファイルおよび/またはバックアップ・ファイルを含むことができる。本発明の教示によれば、ユーザは、アーカイブまたはバックアップ・データからファイルをリストアするために、アーカイブまたはバックアップ・カタログを調べる必要はなく、完全なファイル名を提供する必要もない。したがって、本発明は、リストアするファイルを識別するのに使用する基準を指定し、アーカイブとバックアップ・ファイルを含む複数のファイルをサーチして基準を満足するファイルを識別し、識別されたファイルをリストアするための簡単で使いやすいインターフェースを提供する。本発明によって、異種ストレージ環境についての広い専門技術知識を必要とせず、直感的なサーチ、分類、検索が可能になる。
【0094】
本発明の一実施形態によれば、アーカイブ・ファイルとバックアップ・ファイルを含むファイルの物理位置に関する情報は、単一の位置データベース122に集約される。したがって、位置データベース122は、多数のかつ異種のストレージ・デバイス間にわたるファイル位置情報をストアする単一のデータベースとなる。同様に、アーカイブ・ファイルとバックアップ・ファイルを含むファイルの内容と属性についての情報は、単一のインデックス・データベース120に集約される。位置データベース122とインデックス・データベース120にストアされた情報を利用することで、本発明は、ファイルの実際のストレージ位置が異なるデバイスとシステムにあっても、アーカイブ・ファイルとバックアップ・ファイルを含むファイルを検索するための単一の論理データ・ストアを提供する。これによって、オンライン、ニアライン、またはオフラインのストレージ・デバイスからファイルをリストアするために、バックアップ・カタログをサーチまたはブラウズする必要がなくなる。したがって、本発明は、データのストレージ位置に関わりなくデータをリストアするための、単一のサーチ指向ユニフォーム・ユーザ・インターフェースを提供する。したがって、本発明は、データの位置やタイプ(例えば、アーカイブ、バックアップ、その他)に関わりなく、データへのアクセスを容易にする。本発明の一実施形態によれば、リストアするデータの識別およびデータのストレージ位置は、ユーザからは透過的である。また本発明によって、システム管理者およびシステム・ソフトウェア・アプリケーションは、ユーザの関与なしにストレージの位置を動的に確定することができる。
【0095】
本発明の具体的な実施形態について説明してきたが、様々な修正形態、変更形態、代替構造、および均等物も本発明の範囲内に包含される。本明細書に記載の発明は、ある具体的なデータ処理環境内のオペレーションに制限されるものではなく、複数のデータ処理環境内でも制約なく動作する。さらに、本発明を具体的な一連の処理および工程を用いて説明してきたが、本発明が説明した一連の処理および工程に限定されるものではないことは当業者には明らかであろう。
【0096】
さらに、ハードウェアとソフトウェアの特定の組合せを用いて本発明を説明してきたが、ハードウェアとソフトウェアの他の組合せも本発明の範囲内に含まれることを理解されたい。本発明は、ハードウェアのみによって、またはソフトウェアのみによって、またはそれらの組合せを用いて実施することができる。
【0097】
したがって、明細書および図面は、制限的なものではなく説明的なものと見なすべきである。しかし、特許請求の範囲に記載の本発明のより広範な主旨および範囲から逸脱することなく、本発明に追加、控除、削除、および他の修正および変更を施し得ることは明らかであろう。
【図面の簡単な説明】
【0098】
【図1】本発明の実施形態を組み込むことができる分散システムの簡略ブロック図である。
【図2】本発明の一実施形態によるコンピュータ・システムの簡略ブロック図である。
【図3】本発明の一実施形態によるファイルの内容および/または属性に基づいて1つまたはいくつかのファイルをリストアする方法の簡略ハイレベル・フローチャートである。
【図4】本発明の一実施形態によるファイルを容易にリストアできるようにするのに使用されるファイルに関する情報を収集する方法の簡略ハイレベル・フローチャートである。
【図5】本発明の一実施形態に従ってストアすることができるファイルの内容に関する情報を含むファイル関連情報の一部を示す図である。
【図6】本発明の一実施形態に従って位置データベースにストアすることができるファイルの位置情報の一部を示す図である。
【図7】本発明の一実施形態によるファイルの内容および/または属性情報をインデックス化する方法の簡略ハイレベル・フローチャートである。
【図8】本発明の一実施形態によるファイルをリストアする方法を示す簡略ハイレベル・フローチャートである。
Claims (66)
- 複数のファイルをストアする複数のストレージ・デバイスを含み、その複数のファイルがバックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含むストレージ環境において、前記複数のファイルから1つまたはいくつかのファイルをリストアする方法であって、
前記複数のファイル内のファイルの内容に関する情報をストアするステップと、
前記複数のファイル内のファイルのストレージ位置を識別する位置情報をストアするステップと、
第1の内容を識別する情報を含む要求を受信するステップと、
前記複数のファイルの前記内容に関する前記情報に基づいて、前記第1の内容を含む第1の1つまたは複数のファイル・セットを前記複数のファイルから確定するステップと、
前記位置情報に基づいて、前記第1のファイル・セットの少なくとも1つのファイルのストレージ位置情報を確定するステップであって、そのストレージ位置情報に、前記複数のストレージ・デバイスから前記少なくとも1つのファイルをストアする第1のストレージ・デバイスを識別する情報を含むステップと、
前記第1のストレージ・デバイスから前記少なくとも1つのファイルをリストアするステップと
を含む方法。 - 前記第1のファイル・セットの中のファイルを識別する情報を出力するステップと、
前記少なくとも1つのファイルを含み、前記第1のファイル・セットからリストアされる第2のファイル・セットの選択を指示する信号を受信するステップをさらに含む請求項1に記載の方法。 - 前記複数のファイル内の前記ファイルの前記内容に関する前記情報が、
前記複数のファイル内の各ファイルについて、
前記ファイル内の1つまたは複数の単語を識別する情報と、
各単語について、前記ファイル内での前記単語の出現回数を示す第1の値とを含む請求項1に記載の方法。 - 前記複数のファイル内の前記ファイルの前記内容に関する前記情報が、
前記複数のファイル内の各ファイルについて、
前記ファイル内の1つまたは複数の単語を識別する情報と、
各単語について、
前記ファイル内での前記単語の出現回数を示す第1の値と
前記ファイルに関連するタイトル情報内での前記単語の出現回数を示す第2の値とを含む請求項1に記載の方法。 - 前記複数のファイルの前記位置情報が、
前記複数のファイル内の各ファイルについて、
前記複数のストレージ・デバイスから前記ファイルをストアするストレージ・デバイスを識別する情報と、
前記ファイルをストアする前記ストレージ・デバイス上の前記ファイルにアクセスするパス名を識別する情報とを含む請求項1に記載の方法。 - 前記第1の内容が1つまたは複数の単語を含み、
前記第1の1つまたは複数のファイル・セットが前記1つまたは複数の単語を含むファイルを含む請求項1に記載の方法。 - 前記少なくとも1つのファイルがバックアップ・ファイルである請求項1に記載の方法。
- 前記少なくとも1つのファイルがアーカイブ・ファイルである請求項1に記載の方法。
- 前記第1のストレージ・デバイスが、オフライン・ストレージ・デバイスとニアライン・ストレージ・デバイスの少なくとも一方であり、
前記第1のストレージ・デバイスから少なくとも1つのファイルをリストアするステップが、前記少なくとも1つのファイルが前記第1のストレージ・デバイスにストアされていることを示す情報を出力するステップを含む請求項1に記載の方法。 - 複数のファイルをストアする複数のストレージ・デバイスを含み、その複数のファイルがバックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含むストレージ環境において、前記複数のファイルから1つまたはいくつかのファイルをリストアする方法であって、
前記複数のファイル内のファイルの1つまたは複数の属性を識別する属性情報をストアするステップと、
前記複数のファイル内のファイルのストレージ位置を識別する位置情報をストアするステップと、
第1の属性を識別する情報を含む要求を受信するステップと、
前記属性情報に基づいて、前記複数のファイルから、前記第1の属性を満足する第1の1つまたは複数のファイル・セットを確定するステップと、
前記位置情報に基づいて、前記第1のファイル・セットの少なくとも1つのファイルのストレージ位置情報を確定するステップであって、そのストレージ位置情報に、前記複数のストレージ・デバイスから前記少なくとも1つのファイルをストアする第1のストレージ・デバイスを識別する情報を含むステップと、
前記第1のストレージ・デバイスから前記少なくとも1つのファイルをリストアするステップとを含む方法。 - 前記第1のファイル・セットの中のファイルを識別する情報を出力するステップと、
前記少なくとも1つのファイルを含み、前記第1のファイル・セットからリストアされる第2のファイル・セットの選択を指示する信号を受信するステップをさらに含む請求項10に記載の方法。 - 前記属性情報が、
前記複数のファイル内の各ファイルについて、
前記ファイルが作成された時間を識別する情報と、
前記ファイルが最後に変更された時間を識別する情報とを含む請求項10に記載の方法。 - 前記複数のファイルの前記位置情報が、
前記複数のファイル内の各ファイルについて、
前記複数のストレージ・デバイスから前記ファイルをストアするストレージ・デバイスを識別する情報と、
前記ファイルをストアする前記ストレージ・デバイス上の前記ファイルにアクセスするパス名を識別する情報とを含む請求項10に記載の方法。 - 前記第1の属性が、ファイルが作成された時間、ファイルが最後に変更された時間、ファイルが最後にアクセスされた時間、ファイルの作成者情報、ファイルの所有者情報から成る属性のグループから選択可能である請求項10に記載の方法。
- 前記少なくとも1つのファイルがバックアップ・ファイルである請求項10に記載の方法。
- 前記少なくとも1つのファイルがアーカイブ・ファイルである請求項10に記載の方法。
- 前記第1のストレージ・デバイスが、オフライン・ストレージ・デバイスとニアライン・ストレージ・デバイスの少なくとも一方であり、
前記第1のストレージ・デバイスから少なくとも1つのファイルをリストアするステップが、前記少なくとも1つのファイルが前記第1のストレージ・デバイスにストアされていることを示す情報を出力するステップを含む請求項10に記載の方法。 - 複数のファイルをストアする複数のストレージ・デバイスを含み、その複数のファイルがバックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含むストレージ環境において、前記複数のファイルから1つまたはいくつかのファイルをリストアする方法であって、
前記複数のファイル内のファイルの内容に関する情報をストアするステップと、
前記複数のファイル内のファイルの1つまたは複数の属性を識別する属性情報をストアするステップと、
前記複数のファイル内のファイルのストレージ位置を識別する位置情報をストアするステップと、
第1の基準を識別する情報を含む要求を受信するステップと、
前記属性情報と前記複数のファイル内の前記ファイルの前記内容に関する前記情報に基づいて、前記複数のファイルから、前記第1の基準を満足する第1の1つまたは複数のファイル・セットを確定するステップと、
前記位置情報に基づいて、前記第1のファイル・セットの少なくとも1つのファイルのストレージ位置情報を確定するステップであって、そのストレージ位置情報に、前記複数のストレージ・デバイスから前記少なくとも1つのファイルをストアする第1のストレージ・デバイスを識別する情報を含むステップと、
前記第1のストレージ・デバイスから前記少なくとも1つのファイルをリストアするステップとを含む方法。 - 前記第1の基準が第1の内容を識別する情報を含む請求項18に記載の方法。
- 前記第1の基準が第1の属性を識別する情報を含む請求項18に記載の方法。
- 前記少なくとも1つのファイルがバックアップ・ファイルである請求項18に記載の方法。
- 前記少なくとも1つのファイルがアーカイブ・ファイルである請求項18に記載の方法。
- 前記第1のストレージ・デバイスが、オフライン・ストレージ・デバイスとニアライン・ストレージ・デバイスの少なくとも一方である請求項18に記載の方法。
- 複数のファイルをストアする複数のストレージ・デバイスを含み、その複数のファイルがバックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含むストレージ環境において、前記複数のファイルから1つまたはいくつかのファイルをリストアするためのデータ処理システムであって、
プロセッサと、
前記プロセッサに結合されたメモリとを含み、
前記メモリが、前記プロセッサによって実行される複数のコード・モジュールをストアするように構成され、前記複数のコード・モジュールが、
第1の内容を識別する情報を含む要求を受信するためのコード・モジュールと、
前記複数のファイル内のファイルの内容に関する情報にアクセスするためのコード・モジュールと、
前記複数のファイルの前記内容に関する前記情報に基づいて、前記複数のファイルから、前記第1の内容を含む第1の1つまたは複数のファイル・セットを確定するためのコード・モジュールと、
前記複数のファイル内のファイルのストレージ位置を識別する位置情報にアクセスするためのコード・モジュールと、
前記位置情報に基づいて、前記第1のファイル・セットの少なくとも1つのファイルのストレージ位置情報を確定するためのコード・モジュールであって、そのストレージ位置情報に、前記複数のストレージ・デバイスから前記少なくとも1つのファイルをストアする第1のストレージ・デバイスを識別する情報を含むコード・モジュールと、
前記第1のストレージ・デバイスから前記少なくとも1つのファイルをリストアするためのコード・モジュールとを含むシステム。 - 前記複数のコード・モジュールが、
前記第1のファイル・セットの中のファイルを識別する情報を出力するためのコード・モジュールと、
前記少なくとも1つのファイルを含み、前記第1のファイル・セットからリストアされる第2のファイル・セットの選択を指示する信号を受信するためのコード・モジュールをさらに含む請求項24に記載のシステム。 - 前記複数のファイル内の前記ファイルの前記内容に関する前記情報が、
前記複数のファイル内の各ファイルについて、
前記ファイル内の1つまたは複数の単語を識別する情報と、
各単語について、前記ファイル内での前記単語の出現回数を示す第1の値とを含む請求項24に記載のシステム。 - 前記複数のファイル内の前記ファイルの前記内容に関する前記情報が、
前記複数のファイル内の各ファイルについて、
前記ファイル内の1つまたは複数の単語を識別する情報と、
各単語について、
前記ファイル内での前記単語の出現回数を示す第1の値と
前記ファイルに関連するタイトル情報内での前記単語の出現回数を示す第2の値とを含む請求項24に記載のシステム。 - 前記複数のファイルの前記位置情報が、
前記複数のファイル内の各ファイルについて、
前記複数のストレージ・デバイスから前記ファイルをストアするストレージ・デバイスを識別する情報と、
前記ファイルをストアする前記ストレージ・デバイス上の前記ファイルにアクセスするパス名を識別する情報とを含む請求項24に記載のシステム。 - 前記第1の内容が、1つまたは複数の単語を含み、
前記第1の1つまたは複数のファイル・セットが、前記1つまたは複数の単語を含むファイルを含む請求項24に記載のシステム。 - 前記少なくとも1つのファイルが、バックアップ・ファイルである請求項24に記載のシステム。
- 前記少なくとも1つのファイルが、アーカイブ・ファイルである請求項24に記載のシステム。
- 前記第1のストレージ・デバイスが、オフライン・ストレージ・デバイスとニアライン・ストレージ・デバイスの少なくとも一方であり、
前記第1のストレージ・デバイスから少なくとも1つのファイルをリストアするためのコード・モジュールが、
前記少なくとも1つのファイルが前記第1のストレージ・デバイスにストアされていることを示す情報を出力するためのコード・モジュールを含む請求項24に記載のシステム。 - 複数のファイルをストアする複数のストレージ・デバイスを含み、前記複数のファイルがバックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含むストレージ環境において、前記複数のファイルから1つまたはいくつかのファイルをリストアするためのデータ処理システムであって、
プロセッサと、
前記プロセッサに結合されたメモリとを含み、
前記メモリが、前記プロセッサによって実行される複数のコード・モジュールをストアするように構成され、前記複数のコード・モジュールが、
前記複数のファイル内のファイルの1つまたは複数の属性を識別する属性情報にアクセスするためのコード・モジュールと、
第1の属性を識別する情報を含む要求を受信するためのコード・モジュールと、
前記属性情報に基づいて、前記複数のファイルから、前記第1の属性を満足する第1の1つまたは複数のファイル・セットを確定するためのコード・モジュールと、
前記複数のファイル内のファイルのストレージ位置を識別する位置情報にアクセスするためのコード・モジュールと、
前記位置情報に基づいて、前記第1のファイル・セットの少なくとも1つのファイルのストレージ位置情報を確定するためのコード・モジュールであって、そのストレージ位置情報に、前記複数のストレージ・デバイスから前記少なくとも1つのファイルをストアする第1のストレージ・デバイスを識別する情報を含むコード・モジュールと、
前記第1のストレージ・デバイスから前記少なくとも1つのファイルをリストアするためのコード・モジュールとを含むシステム。 - 前記複数のコード・モジュールが、
前記第1のファイル・セットの中のファイルを識別する情報を出力するためのコード・モジュールと、
前記少なくとも1つのファイルを含み、前記第1のファイル・セットからリストアされる第2のファイル・セットの選択を指示する信号を受信するためのコード・モジュールをさらに含む請求項33に記載のシステム。 - 前記属性情報が、
前記複数のファイル内の各ファイルについて、
前記ファイルが作成された時間を識別する情報と、
前記ファイルが最後に変更された時間を識別する情報とを含む請求項33に記載のシステム。 - 前記複数のファイルの前記位置情報が、
前記複数のファイル内の各ファイルについて、
前記複数のストレージ・デバイスから前記ファイルをストアするストレージ・デバイスを識別する情報と、
前記ファイルをストアする前記ストレージ・デバイス上の前記ファイルにアクセスするパス名を識別する情報とを含む請求項33に記載のシステム。 - 前記第1の属性が、ファイルが作成された時間、ファイルが最後に変更された時間、ファイルが最後にアクセスされた時間、ファイルの作成者情報、ファイルの所有者情報から成る属性のグループから選択可能である請求項33に記載のシステム。
- 前記少なくとも1つのファイルがバックアップ・ファイルである請求項33に記載のシステム。
- 前記少なくとも1つのファイルがアーカイブ・ファイルである請求項33に記載のシステム。
- 前記第1のストレージ・デバイスが、オフライン・ストレージ・デバイスとニアライン・ストレージ・デバイスの少なくとも一方であり、
前記第1のストレージ・デバイスから少なくとも1つのファイルをリストアするためのコード・モジュールが、
前記少なくとも1つのファイルが前記第1のストレージ・デバイスにストアされていることを示す情報を出力するためのコード・モジュールを含む請求項33に記載のシステム。 - 複数のファイルをストアする複数のストレージ・デバイスを含み、前記複数のファイルがバックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含むストレージ環境において、前記複数のファイルから1つまたはいくつかのファイルをリストアするためのデータ処理システムであって、
プロセッサと、
前記プロセッサに結合されたメモリとを含み、
前記メモリが、前記プロセッサによって実行される複数のコード・モジュールをストアするように構成され、前記複数のコード・モジュールが、
第1の基準を識別する情報を含む要求を受信するためのコード・モジュールと、
前記複数のファイル内ファイルの内容に関する情報と前記複数のファイル内のファイルの1つまたは複数の属性を識別する属性情報とにアクセスするためのコード・モジュールと、
前記属性情報と前記複数のファイル内の前記ファイルの前記内容に関する前記情報に基づいて、前記複数のファイルから、前記第1の基準を満足する第1の1つまたは複数のファイル・セットを確定するためのコード・モジュールと、
前記複数のファイル内のファイルのストレージ位置を識別する位置情報にアクセスするためのコード・モジュールと、
前記位置情報に基づいて、前記第1のファイル・セットの少なくとも1つのファイルのストレージ位置情報を確定するためのコード・モジュールであって、そのストレージ位置情報に、前記複数のストレージ・デバイスから前記少なくとも1つのファイルをストアする第1のストレージ・デバイスを識別する情報を含むコード・モジュールと、
前記第1のストレージ・デバイスから前記少なくとも1つのファイルをリストアするためのコード・モジュールとを含むシステム。 - 前記第1の基準が第1の内容を識別する情報を含む請求項41に記載のシステム。
- 前記第1の基準が第1の属性を識別する情報を含む請求項41に記載のシステム。
- 前記少なくとも1つのファイルがバックアップ・ファイルである請求項41に記載のシステム。
- 前記少なくとも1つのファイルがアーカイブ・ファイルである請求項41に記載のシステム。
- 前記第1のストレージ・デバイスが、オフライン・ストレージ・デバイスとニアライン・ストレージ・デバイスの少なくとも一方である請求項41に記載のシステム。
- 分散ストレージ環境において複数のストレージ・デバイスにストアされた複数のファイルから1つまたはいくつかのファイルをリストアするためのコンピュータ可読ストレージ媒体上にストアされたコンピュータ・プログラム製品であって、前記複数のファイルがバックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含み、前記コンピュータ・プログラム製品が、
第1の内容を識別する情報を含む要求を受信するためのコードと、
前記複数のファイル内のファイルの内容に関する情報にアクセスするためのコードと、
前記複数のファイルの前記内容に関する前記情報に基づいて、前記複数のファイルから、前記第1の内容を含む第1の1つまたは複数のファイル・セットを確定するためのコードと、
前記複数のファイル内のファイルのストレージ位置を識別する位置情報にアクセスするためのコードと、
前記位置情報に基づいて、前記第1のファイル・セットの少なくとも1つのファイルのストレージ位置情報を確定するためのコードであって、そのストレージ位置情報に、前記複数のストレージ・デバイスから前記少なくとも1つのファイルをストアする第1のストレージ・デバイスを識別する情報を含むコードと、
前記第1のストレージ・デバイスから前記少なくとも1つのファイルをリストアするためのコードとを含むコンピュータ・プログラム製品。 - 前記第1のファイル・セットの中のファイルを識別する情報を出力するためのコードと、
前記少なくとも1つのファイルを含み、前記第1のファイル・セットからリストアされる第2のファイル・セットの選択を指示する信号を受信するためのコードをさらに含む請求項47に記載のコンピュータ・プログラム製品。 - 前記複数のファイル内の前記ファイルの前記内容に関する前記情報が、
前記複数のファイル内の各ファイルについて、
前記ファイル内の1つまたは複数の単語を識別する情報と、
前記ファイル内での前記単語の出現回数を示す第1の値と
前記ファイルに関連するタイトル情報内での前記単語の出現回数を示す第2の値とを含み、
前記複数のファイルの前記位置情報が、
前記複数のファイル内の各ファイルについて、
前記複数のストレージ・デバイスから前記ファイルをストアするストレージ・デバイスを識別する情報と、
前記ファイルをストアする前記ストレージ・デバイス上の前記ファイルにアクセスするパス名を識別する情報とを含む請求項47に記載のコンピュータ・プログラム製品。 - 前記第1の内容が、1つまたは複数の単語を含み、
前記第1の1つまたは複数のファイル・セットが、前記1つまたは複数の単語を含むファイルを含む請求項47に記載のコンピュータ・プログラム製品。 - 前記少なくとも1つのファイルが、バックアップ・ファイルである請求項47に記載のコンピュータ・プログラム製品。
- 前記少なくとも1つのファイルが、アーカイブ・ファイルである請求項47に記載のコンピュータ・プログラム製品。
- 前記第1のストレージ・デバイスが、オフライン・ストレージ・デバイスとニアライン・ストレージ・デバイスの少なくとも一方であり、
前記第1のストレージ・デバイスから少なくとも1つのファイルをリストアするためのコードが、
前記少なくとも1つのファイルが前記第1のストレージ・デバイスにストアされていることを示す情報を出力するためのコードを含む請求項47に記載のコンピュータ・プログラム製品。 - 分散ストレージ環境において複数のストレージ・デバイスにストアされた複数のファイルから1つまたはいくつかのファイルをリストアするためのコンピュータ可読ストレージ媒体上にストアされたコンピュータ・プログラム製品であって、前記複数のファイルがバックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含み、前記コンピュータ・プログラム製品が、
第1の属性を識別する情報を含む要求を受信するためのコードと、
前記複数のファイル内のファイルの1つまたは複数の属性を識別する属性情報にアクセスするためのコードと、
前記属性情報に基づいて、前記複数のファイルから、前記第1の属性を満足する第1の1つまたは複数のファイル・セットを確定するためのコードと、
前記複数のファイル内のファイルのストレージ位置を識別する位置情報にアクセスするためのコードと、
前記位置情報に基づいて、前記第1のファイル・セットの少なくとも1つのファイルのストレージ位置情報を確定するためのコードであって、そのストレージ位置情報に、前記複数のストレージ・デバイスから前記少なくとも1つのファイルをストアする第1のストレージ・デバイスを識別する情報を含むコードと、
前記第1のストレージ・デバイスから前記少なくとも1つのファイルをリストアするためのコードとを含むコンピュータ・プログラム製品。 - 前記第1のファイル・セットの中のファイルを識別する情報を出力するためのコードと、
前記少なくとも1つのファイルを含み、前記第1のファイル・セットからリストアされる第2のファイル・セットの選択を指示する信号を受信するためのコードをさらに含む請求項54に記載のコンピュータ・プログラム製品。 - 前記属性情報が、
前記複数のファイル内の各ファイルについて、
前記ファイルが作成された時間を識別する情報と、
前記ファイルが最後に変更された時間を識別する情報とを含み、
前記複数のファイルの前記位置情報が、
前記複数のファイル内の各ファイルについて、
前記複数のストレージ・デバイスから前記ファイルをストアするストレージ・デバイスを識別する情報と、
前記ファイルをストアする前記ストレージ・デバイス上の前記ファイルにアクセスするパス名を識別する情報とを含む請求項54に記載のコンピュータ・プログラム製品。 - 前記第1の属性が、ファイルが作成された時間、ファイルが最後に変更された時間、ファイルが最後にアクセスされた時間、ファイルの作成者情報、およびファイルの所有者情報から成る属性のグループから選択可能である請求項54に記載のコンピュータ・プログラム製品。
- 前記少なくとも1つのファイルがバックアップ・ファイルである請求項54に記載のコンピュータ・プログラム製品。
- 前記少なくとも1つのファイルがアーカイブ・ファイルである請求項54に記載のコンピュータ・プログラム製品。
- 前記第1のストレージ・デバイスが、オフライン・ストレージ・デバイスとニアライン・ストレージ・デバイスの少なくとも一方であり、
前記第1のストレージ・デバイスから少なくとも1つのファイルをリストアするためのコードが、
前記少なくとも1つのファイルが前記第1のストレージ・デバイスにストアされていることを示す情報を出力するためのコードを含む請求項54に記載のコンピュータ・プログラム製品。 - 分散ストレージ環境において複数のストレージ・デバイスにストアされた複数のファイルから1つまたはいくつかのファイルをリストアするためのコンピュータ可読ストレージ媒体上にストアされたコンピュータ・プログラム製品であって、前記複数のファイルがバックアップ・ファイルとアーカイブ・ファイルの少なくとも一方を含み、前記コンピュータ・プログラム製品が、
第1の基準を識別する情報を含む要求を受信するためのコードと、
前記複数のファイル内ファイルの内容に関する情報とその複数のファイル内のファイルの1つまたは複数の属性を識別する属性情報にアクセスするためのコードと、
前記属性情報と前記複数のファイル内の前記ファイルの前記内容に関する前記情報に基づいて、前記複数のファイルから、前記第1の基準を満足する第1の1つまたは複数のファイル・セットを確定するためのコードと、
前記複数のファイル内のファイルのストレージ位置を識別する位置情報にアクセスするためのコードと、
前記位置情報に基づいて、前記第1のファイル・セットの少なくとも1つのファイルのストレージ位置情報を確定するためのコードであって、そのストレージ位置情報に、前記複数のストレージ・デバイスから前記少なくとも1つのファイルをストアする第1のストレージ・デバイスを識別する情報を含むコードと、
前記第1のストレージ・デバイスから前記少なくとも1つのファイルをリストアするためのコードとを含むコンピュータ・プログラム製品。 - 前記第1の基準が第1の内容を識別する情報を含む請求項61に記載のコンピュータ・プログラム製品。
- 前記第1の基準が第1の属性を識別する情報を含む請求項61に記載のコンピュータ・プログラム製品。
- 前記少なくとも1つのファイルがバックアップ・ファイルである請求項61に記載のコンピュータ・プログラム製品。
- 前記少なくとも1つのファイルがアーカイブ・ファイルである請求項61に記載のコンピュータ・プログラム製品。
- 前記第1のストレージ・デバイスが、オフライン・ストレージ・デバイスとニアライン・ストレージ・デバイスの少なくとも一方である請求項61に記載のコンピュータ・プログラム製品。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31678301P | 2001-08-31 | 2001-08-31 | |
PCT/US2002/027387 WO2003025795A1 (en) | 2001-08-31 | 2002-08-26 | Techniques for restoring data based on contents and attributes of the data |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005503616A true JP2005503616A (ja) | 2005-02-03 |
Family
ID=23230668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003529351A Withdrawn JP2005503616A (ja) | 2001-08-31 | 2002-08-26 | データの内容と属性に基づいてデータをリストアする技法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20030046313A1 (ja) |
EP (1) | EP1421522A1 (ja) |
JP (1) | JP2005503616A (ja) |
CA (1) | CA2458416A1 (ja) |
WO (1) | WO2003025795A1 (ja) |
Families Citing this family (130)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7388092B2 (en) * | 1996-05-03 | 2008-06-17 | Applera Corporation | Oligonucleotides and analogs labeled with energy transfer dyes |
US7062456B1 (en) | 1999-02-09 | 2006-06-13 | The Chase Manhattan Bank | System and method for back office processing of banking transactions using electronic files |
US7035880B1 (en) | 1999-07-14 | 2006-04-25 | Commvault Systems, Inc. | Modular backup and retrieval system used in conjunction with a storage area network |
US7434219B2 (en) | 2000-01-31 | 2008-10-07 | Commvault Systems, Inc. | Storage of application specific profiles correlating to document versions |
US7003641B2 (en) | 2000-01-31 | 2006-02-21 | Commvault Systems, Inc. | Logical view with granular access to exchange data managed by a modular data and storage management system |
US6658436B2 (en) | 2000-01-31 | 2003-12-02 | Commvault Systems, Inc. | Logical view and access to data managed by a modular data and storage management system |
US20040039891A1 (en) * | 2001-08-31 | 2004-02-26 | Arkivio, Inc. | Optimizing storage capacity utilization based upon data storage costs |
US20040054656A1 (en) * | 2001-08-31 | 2004-03-18 | Arkivio, Inc. | Techniques for balancing capacity utilization in a storage environment |
US7092977B2 (en) * | 2001-08-31 | 2006-08-15 | Arkivio, Inc. | Techniques for storing data based upon storage policies |
US7509316B2 (en) | 2001-08-31 | 2009-03-24 | Rocket Software, Inc. | Techniques for performing policy automated operations |
WO2003027891A1 (en) | 2001-09-28 | 2003-04-03 | Commvault Systems, Inc. | System and method for archiving objects in an information store |
US20030115204A1 (en) * | 2001-12-14 | 2003-06-19 | Arkivio, Inc. | Structure of policy information for storage, network and data management applications |
US7987246B2 (en) * | 2002-05-23 | 2011-07-26 | Jpmorgan Chase Bank | Method and system for client browser update |
US20040083202A1 (en) * | 2002-08-30 | 2004-04-29 | Arkivio, Inc. | Techniques to control recalls in storage management applications |
US8402001B1 (en) * | 2002-10-08 | 2013-03-19 | Symantec Operating Corporation | System and method for archiving data |
US7340650B2 (en) * | 2002-10-30 | 2008-03-04 | Jp Morgan Chase & Co. | Method to measure stored procedure execution statistics |
US20040103199A1 (en) * | 2002-11-22 | 2004-05-27 | Anthony Chao | Method and system for client browser update from a lite cache |
CA2506543A1 (en) * | 2002-12-02 | 2004-06-17 | Arkivio Inc. | Data recovery techniques in storage systems |
US20050021524A1 (en) * | 2003-05-14 | 2005-01-27 | Oliver Jack K. | System and method of managing backup media in a computing environment |
US9678967B2 (en) | 2003-05-22 | 2017-06-13 | Callahan Cellular L.L.C. | Information source agent systems and methods for distributed data storage and management using content signatures |
US20050021566A1 (en) * | 2003-05-30 | 2005-01-27 | Arkivio, Inc. | Techniques for facilitating backup and restore of migrated files |
WO2004109556A1 (en) * | 2003-05-30 | 2004-12-16 | Arkivio, Inc. | Operating on migrated files without recalling data |
US7100005B2 (en) * | 2003-06-17 | 2006-08-29 | Agilent Technologies, Inc. | Record storage and retrieval solution |
US7454569B2 (en) | 2003-06-25 | 2008-11-18 | Commvault Systems, Inc. | Hierarchical system and method for performing storage operations in a computer network |
US8938595B2 (en) | 2003-08-05 | 2015-01-20 | Sepaton, Inc. | Emulated storage system |
US8280926B2 (en) | 2003-08-05 | 2012-10-02 | Sepaton, Inc. | Scalable de-duplication mechanism |
US20050193235A1 (en) | 2003-08-05 | 2005-09-01 | Miklos Sandorfi | Emulated storage system |
US7146476B2 (en) * | 2003-08-05 | 2006-12-05 | Sepaton, Inc. | Emulated storage system |
US7069278B2 (en) * | 2003-08-08 | 2006-06-27 | Jpmorgan Chase Bank, N.A. | System for archive integrity management and related methods |
US20050065965A1 (en) * | 2003-09-19 | 2005-03-24 | Ziemann David M. | Navigation of tree data structures |
GB2407175A (en) | 2003-10-08 | 2005-04-20 | Hewlett Packard Development Co | A method of storing data on a secondary storage device |
WO2005050381A2 (en) | 2003-11-13 | 2005-06-02 | Commvault Systems, Inc. | Systems and methods for performing storage operations using network attached storage |
JP4493321B2 (ja) * | 2003-11-19 | 2010-06-30 | 株式会社日立製作所 | ディスクアレイ装置及びデータ退避方法 |
US7287048B2 (en) * | 2004-01-07 | 2007-10-23 | International Business Machines Corporation | Transparent archiving |
KR20070005626A (ko) * | 2004-03-19 | 2007-01-10 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 애플리케이션 제어된 원격지 저장장치 |
JP4551680B2 (ja) * | 2004-03-26 | 2010-09-29 | キヤノン株式会社 | 文書管理システム、文書管理方法及びそのプログラム、並びに記憶媒体 |
US7366974B2 (en) * | 2004-09-03 | 2008-04-29 | Jp Morgan Chase Bank | System and method for managing template attributes |
US8504565B2 (en) * | 2004-09-09 | 2013-08-06 | William M. Pitts | Full text search capabilities integrated into distributed file systems— incrementally indexing files |
US20060059210A1 (en) * | 2004-09-16 | 2006-03-16 | Macdonald Glynne | Generic database structure and related systems and methods for storing data independent of data type |
US20090132466A1 (en) * | 2004-10-13 | 2009-05-21 | Jp Morgan Chase Bank | System and method for archiving data |
US7844691B2 (en) * | 2004-12-30 | 2010-11-30 | Xstor Systems, Inc. | Scalable distributed storage and delivery |
US20080162595A1 (en) * | 2004-12-31 | 2008-07-03 | Emc Corporation | File and block information management |
US8260753B2 (en) * | 2004-12-31 | 2012-09-04 | Emc Corporation | Backup information management |
US9069436B1 (en) * | 2005-04-01 | 2015-06-30 | Intralinks, Inc. | System and method for information delivery based on at least one self-declared user attribute |
US9026512B2 (en) * | 2005-08-18 | 2015-05-05 | Emc Corporation | Data object search and retrieval |
US7716171B2 (en) * | 2005-08-18 | 2010-05-11 | Emc Corporation | Snapshot indexing |
US20070043705A1 (en) * | 2005-08-18 | 2007-02-22 | Emc Corporation | Searchable backups |
US8065606B1 (en) | 2005-09-16 | 2011-11-22 | Jpmorgan Chase Bank, N.A. | System and method for automating document generation |
US7739254B1 (en) * | 2005-09-30 | 2010-06-15 | Google Inc. | Labeling events in historic news |
US7890527B1 (en) * | 2005-09-30 | 2011-02-15 | Symantec Operating Corporation | Backup search agents for use with desktop search tools |
WO2007054806A1 (en) * | 2005-11-11 | 2007-05-18 | Pankaj Anand | A method and a system for retrieving data |
US7937393B2 (en) | 2005-11-28 | 2011-05-03 | Commvault Systems, Inc. | Systems and methods for classifying and transferring information in a storage network |
US20200257596A1 (en) | 2005-12-19 | 2020-08-13 | Commvault Systems, Inc. | Systems and methods of unified reconstruction in storage systems |
US8930496B2 (en) | 2005-12-19 | 2015-01-06 | Commvault Systems, Inc. | Systems and methods of unified reconstruction in storage systems |
WO2007138461A2 (en) * | 2006-05-31 | 2007-12-06 | Pankaj Anand | Method and a system for obtaining differential backup |
WO2007138460A2 (en) * | 2006-05-31 | 2007-12-06 | Pankaj Anand | Local data retrieval and restoration method and system thereof |
JP4939152B2 (ja) * | 2006-09-13 | 2012-05-23 | 株式会社日立製作所 | データ管理システム及びデータ管理方法 |
US7882077B2 (en) | 2006-10-17 | 2011-02-01 | Commvault Systems, Inc. | Method and system for offline indexing of content and classifying stored data |
US8104076B1 (en) | 2006-11-13 | 2012-01-24 | Jpmorgan Chase Bank, N.A. | Application access control system |
US8370442B2 (en) | 2008-08-29 | 2013-02-05 | Commvault Systems, Inc. | Method and system for leveraging identified changes to a mail server |
US7734669B2 (en) | 2006-12-22 | 2010-06-08 | Commvault Systems, Inc. | Managing copies of data |
US20080228771A1 (en) | 2006-12-22 | 2008-09-18 | Commvault Systems, Inc. | Method and system for searching stored data |
US9298417B1 (en) * | 2007-07-25 | 2016-03-29 | Emc Corporation | Systems and methods for facilitating management of data |
US7814066B1 (en) * | 2007-11-30 | 2010-10-12 | Sprint Communications Company L.P. | System for backup and recovery of a plurality of heterogeneous databases |
US8315986B1 (en) * | 2007-12-24 | 2012-11-20 | Emc Corporation | Restore optimization |
US8769048B2 (en) | 2008-06-18 | 2014-07-01 | Commvault Systems, Inc. | Data protection scheduling, such as providing a flexible backup window in a data protection system |
US8352954B2 (en) | 2008-06-19 | 2013-01-08 | Commvault Systems, Inc. | Data storage resource allocation by employing dynamic methods and blacklisting resource request pools |
US9128883B2 (en) | 2008-06-19 | 2015-09-08 | Commvault Systems, Inc | Data storage resource allocation by performing abbreviated resource checks based on relative chances of failure of the data storage resources to determine whether data storage requests would fail |
US8239348B1 (en) * | 2008-08-14 | 2012-08-07 | Symantec Corporation | Method and apparatus for automatically archiving data items from backup storage |
US8725688B2 (en) | 2008-09-05 | 2014-05-13 | Commvault Systems, Inc. | Image level copy or restore, such as image level restore without knowledge of data object metadata |
US20100070474A1 (en) | 2008-09-12 | 2010-03-18 | Lad Kamleshkumar K | Transferring or migrating portions of data objects, such as block-level data migration or chunk-based data migration |
WO2010114855A1 (en) * | 2009-03-31 | 2010-10-07 | Commvault Systems, Inc. | Information management systems and methods for heterogeneous data sources |
CN101662760B (zh) * | 2009-07-31 | 2011-12-28 | 中兴通讯股份有限公司 | 将终端数据进行备份的方法及系统 |
US8762634B2 (en) * | 2009-10-24 | 2014-06-24 | International Business Machines Corporation | Efficiently restoring data from a sequential-access backup archive |
US8442983B2 (en) * | 2009-12-31 | 2013-05-14 | Commvault Systems, Inc. | Asynchronous methods of data classification using change journals and other data structures |
US8202205B2 (en) * | 2010-02-09 | 2012-06-19 | GoBe Healthy, LLC | Omni-directional exercise device |
US9038177B1 (en) | 2010-11-30 | 2015-05-19 | Jpmorgan Chase Bank, N.A. | Method and system for implementing multi-level data fusion |
US9021198B1 (en) | 2011-01-20 | 2015-04-28 | Commvault Systems, Inc. | System and method for sharing SAN storage |
US8527472B2 (en) * | 2011-03-29 | 2013-09-03 | Kaseya International Limited | Method and apparatus of securely processing data for file backup, de-duplication, and restoration |
US9054864B2 (en) | 2011-03-29 | 2015-06-09 | Kaseya Limited | Method and apparatus of securely processing data for file backup, de-duplication, and restoration |
US9064133B2 (en) | 2011-03-29 | 2015-06-23 | Kaseya Limited | Method and apparatus of securely processing data for file backup, de-duplication, and restoration |
US8719264B2 (en) | 2011-03-31 | 2014-05-06 | Commvault Systems, Inc. | Creating secondary copies of data based on searches for content |
US8849762B2 (en) * | 2011-03-31 | 2014-09-30 | Commvault Systems, Inc. | Restoring computing environments, such as autorecovery of file systems at certain points in time |
US8935215B1 (en) * | 2011-04-29 | 2015-01-13 | Symantec Corporation | Optimized index usage for data restore |
US9292588B1 (en) | 2011-07-20 | 2016-03-22 | Jpmorgan Chase Bank, N.A. | Safe storing data for disaster recovery |
CN103123635B (zh) * | 2011-11-21 | 2019-01-15 | 联想(北京)有限公司 | 一种数据搜索方法及应用该方法的电子设备 |
US9251360B2 (en) | 2012-04-27 | 2016-02-02 | Intralinks, Inc. | Computerized method and system for managing secure mobile device content viewing in a networked secure collaborative exchange environment |
US9253176B2 (en) | 2012-04-27 | 2016-02-02 | Intralinks, Inc. | Computerized method and system for managing secure content sharing in a networked secure collaborative exchange environment |
US9489271B1 (en) * | 2012-03-29 | 2016-11-08 | Veritas Technologies Llc | User interface for restoring databases |
US10157184B2 (en) | 2012-03-30 | 2018-12-18 | Commvault Systems, Inc. | Data previewing before recalling large data files |
US9553860B2 (en) | 2012-04-27 | 2017-01-24 | Intralinks, Inc. | Email effectivity facility in a networked secure collaborative exchange environment |
EP2842070B1 (en) | 2012-04-27 | 2020-08-05 | Intralinks, Inc. | Computerized method and system for managing networked secure collaborative exchange |
US8892523B2 (en) | 2012-06-08 | 2014-11-18 | Commvault Systems, Inc. | Auto summarization of content |
US9633216B2 (en) | 2012-12-27 | 2017-04-25 | Commvault Systems, Inc. | Application of information management policies based on operation with a geographic entity |
US10540373B1 (en) | 2013-03-04 | 2020-01-21 | Jpmorgan Chase Bank, N.A. | Clause library manager |
US9459968B2 (en) | 2013-03-11 | 2016-10-04 | Commvault Systems, Inc. | Single index to query multiple backup formats |
US9514327B2 (en) | 2013-11-14 | 2016-12-06 | Intralinks, Inc. | Litigation support in cloud-hosted file sharing and collaboration |
US9798596B2 (en) | 2014-02-27 | 2017-10-24 | Commvault Systems, Inc. | Automatic alert escalation for an information management system |
US9648100B2 (en) | 2014-03-05 | 2017-05-09 | Commvault Systems, Inc. | Cross-system storage management for transferring data across autonomous information management systems |
US9823978B2 (en) | 2014-04-16 | 2017-11-21 | Commvault Systems, Inc. | User-level quota management of data objects stored in information management systems |
US9613190B2 (en) | 2014-04-23 | 2017-04-04 | Intralinks, Inc. | Systems and methods of secure data exchange |
US9740574B2 (en) | 2014-05-09 | 2017-08-22 | Commvault Systems, Inc. | Load balancing across multiple data paths |
US11249858B2 (en) | 2014-08-06 | 2022-02-15 | Commvault Systems, Inc. | Point-in-time backups of a production application made accessible over fibre channel and/or ISCSI as data sources to a remote application by representing the backups as pseudo-disks operating apart from the production application and its host |
US9852026B2 (en) | 2014-08-06 | 2017-12-26 | Commvault Systems, Inc. | Efficient application recovery in an information management system based on a pseudo-storage-device driver |
US9444811B2 (en) | 2014-10-21 | 2016-09-13 | Commvault Systems, Inc. | Using an enhanced data agent to restore backed up data across autonomous storage management systems |
US10747622B2 (en) * | 2015-03-31 | 2020-08-18 | SkyKick, Inc. | Efficient backup, search and restore |
US9766825B2 (en) | 2015-07-22 | 2017-09-19 | Commvault Systems, Inc. | Browse and restore for block-level backups |
US10033702B2 (en) | 2015-08-05 | 2018-07-24 | Intralinks, Inc. | Systems and methods of secure data exchange |
US11263171B2 (en) * | 2015-12-09 | 2022-03-01 | Druva Inc. | Unified time-indexed catalogue for multiple archived snapshots |
WO2017127124A1 (en) * | 2016-01-22 | 2017-07-27 | Hewlett Packard Enterprise Development Lp | Ranking backup files |
US10296368B2 (en) | 2016-03-09 | 2019-05-21 | Commvault Systems, Inc. | Hypervisor-independent block-level live browse for access to backed up virtual machine (VM) data and hypervisor-free file-level recovery (block-level pseudo-mount) |
US10540516B2 (en) | 2016-10-13 | 2020-01-21 | Commvault Systems, Inc. | Data protection within an unsecured storage environment |
US10838821B2 (en) | 2017-02-08 | 2020-11-17 | Commvault Systems, Inc. | Migrating content and metadata from a backup system |
US10740193B2 (en) | 2017-02-27 | 2020-08-11 | Commvault Systems, Inc. | Hypervisor-independent reference copies of virtual machine payload data based on block-level pseudo-mount |
US10891069B2 (en) | 2017-03-27 | 2021-01-12 | Commvault Systems, Inc. | Creating local copies of data stored in online data repositories |
US10776329B2 (en) | 2017-03-28 | 2020-09-15 | Commvault Systems, Inc. | Migration of a database management system to cloud storage |
US11074140B2 (en) | 2017-03-29 | 2021-07-27 | Commvault Systems, Inc. | Live browsing of granular mailbox data |
US10984041B2 (en) | 2017-05-11 | 2021-04-20 | Commvault Systems, Inc. | Natural language processing integrated with database and data storage management |
US10664352B2 (en) | 2017-06-14 | 2020-05-26 | Commvault Systems, Inc. | Live browsing of backed up data residing on cloned disks |
EP4270209A3 (en) | 2017-10-26 | 2023-11-22 | Druva Inc. | Deduplicated merged indexed object storage file system |
US10795927B2 (en) | 2018-02-05 | 2020-10-06 | Commvault Systems, Inc. | On-demand metadata extraction of clinical image data |
US20190251204A1 (en) | 2018-02-14 | 2019-08-15 | Commvault Systems, Inc. | Targeted search of backup data using calendar event data |
US10642886B2 (en) | 2018-02-14 | 2020-05-05 | Commvault Systems, Inc. | Targeted search of backup data using facial recognition |
US10761942B2 (en) | 2018-03-12 | 2020-09-01 | Commvault Systems, Inc. | Recovery point objective (RPO) driven backup scheduling in a data storage management system using an enhanced data agent |
US10789387B2 (en) | 2018-03-13 | 2020-09-29 | Commvault Systems, Inc. | Graphical representation of an information management system |
US11159469B2 (en) | 2018-09-12 | 2021-10-26 | Commvault Systems, Inc. | Using machine learning to modify presentation of mailbox objects |
US10860443B2 (en) | 2018-12-10 | 2020-12-08 | Commvault Systems, Inc. | Evaluation and reporting of recovery readiness in a data storage management system |
US11308034B2 (en) | 2019-06-27 | 2022-04-19 | Commvault Systems, Inc. | Continuously run log backup with minimal configuration and resource usage from the source machine |
US11494417B2 (en) | 2020-08-07 | 2022-11-08 | Commvault Systems, Inc. | Automated email classification in an information management system |
US20220391372A1 (en) * | 2021-06-08 | 2022-12-08 | Amadeus S.A.S. | Database offloading utilizing a locater index |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5053948A (en) * | 1988-01-29 | 1991-10-01 | Wisconsin Alumni Research Foundation | File index system for mass storage device |
US5131087A (en) * | 1988-12-29 | 1992-07-14 | Storage Technology Corporation | Computer system having apparatus for automatically redistributing data records stored therein |
US5485606A (en) * | 1989-07-10 | 1996-01-16 | Conner Peripherals, Inc. | System and method for storing and retrieving files for archival purposes |
US5063523A (en) * | 1989-11-16 | 1991-11-05 | Racal Data Communications Inc. | Network management system with event rule handling |
US5276867A (en) * | 1989-12-19 | 1994-01-04 | Epoch Systems, Inc. | Digital data storage system with improved data migration |
US5202982A (en) * | 1990-03-27 | 1993-04-13 | Sun Microsystems, Inc. | Method and apparatus for the naming of database component files to avoid duplication of files |
US5317728A (en) * | 1990-09-07 | 1994-05-31 | International Business Machines Corporation | Storage management of a first file system using a second file system containing surrogate files and catalog management information |
US5333315A (en) * | 1991-06-27 | 1994-07-26 | Digital Equipment Corporation | System of device independent file directories using a tag between the directories and file descriptors that migrate with the files |
CA2048039A1 (en) * | 1991-07-19 | 1993-01-20 | Steven Derose | Data processing system and method for generating a representation for and random access rendering of electronic documents |
JPH0727442B2 (ja) * | 1991-09-11 | 1995-03-29 | インターナショナル・ビジネス・マシーンズ・コーポレイション | データ記憶装置階層構造におけるヒット率を向上させる方法およびそのための装置 |
US5367698A (en) * | 1991-10-31 | 1994-11-22 | Epoch Systems, Inc. | Network file migration system |
JP3448068B2 (ja) * | 1991-12-24 | 2003-09-16 | 富士通株式会社 | データ処理システムおよびストレージ管理方法 |
US5471677A (en) * | 1992-06-24 | 1995-11-28 | Matsushita Electric Industrial Co., Ltd. | Data retrieval using user evaluation of data presented to construct interference rules and calculate range of inputs needed for desired output and to formulate retrieval queries |
US5506986A (en) * | 1992-07-14 | 1996-04-09 | Electronic Data Systems Corporation | Media management system using historical data to access data sets from a plurality of data storage devices |
US5475834A (en) * | 1992-10-26 | 1995-12-12 | International Business Machines Corporation | Integration of migration level two and backup tape processing using multiple inventory entries |
AU5987294A (en) * | 1993-02-17 | 1994-09-14 | 3Com Corporation | System for reading dynamically changing data |
US5991753A (en) * | 1993-06-16 | 1999-11-23 | Lachman Technology, Inc. | Method and system for computer file management, including file migration, special handling, and associating extended attributes with files |
WO1995013580A1 (en) * | 1993-11-09 | 1995-05-18 | Arcada Software | Data backup and restore system for a computer network |
US5873103A (en) * | 1994-02-25 | 1999-02-16 | Kodak Limited | Data storage management for network interconnected processors using transferrable placeholders |
AU5386796A (en) * | 1995-04-11 | 1996-10-30 | Kinetech, Inc. | Identifying data in a data processing system |
US6453325B1 (en) * | 1995-05-24 | 2002-09-17 | International Business Machines Corporation | Method and means for backup and restoration of a database system linked to a system for filing data |
US5798766A (en) * | 1995-10-20 | 1998-08-25 | Fuji Xerox Co., Ltd. | Drawing system |
US5778395A (en) * | 1995-10-23 | 1998-07-07 | Stac, Inc. | System for backing up files from disk volumes on multiple nodes of a computer network |
US5933603A (en) * | 1995-10-27 | 1999-08-03 | Emc Corporation | Video file server maintaining sliding windows of a video data set in random access memories of stream server computers for immediate video-on-demand service beginning at any specified location |
JP3170455B2 (ja) * | 1996-05-27 | 2001-05-28 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | データ記憶システムにおけるデータの再配置方法、そのシステムに記憶されたデータのアクセス方法及びデータ記憶システム |
US5819296A (en) * | 1996-10-31 | 1998-10-06 | Veritas Software Corporation | Method and apparatus for moving large numbers of data files between computer systems using import and export processes employing a directory of file handles |
US6154817A (en) * | 1996-12-16 | 2000-11-28 | Cheyenne Software International Sales Corp. | Device and method for managing storage media |
US6366988B1 (en) * | 1997-07-18 | 2002-04-02 | Storactive, Inc. | Systems and methods for electronic data storage management |
US6330610B1 (en) * | 1997-12-04 | 2001-12-11 | Eric E. Docter | Multi-stage data filtering system employing multiple filtering criteria |
US6023709A (en) * | 1997-12-15 | 2000-02-08 | International Business Machines Corporation | Automated file error classification and correction in a hierarchical storage management system |
US6631477B1 (en) * | 1998-03-13 | 2003-10-07 | Emc Corporation | Host system for mass storage business continuance volumes |
US6460070B1 (en) * | 1998-06-03 | 2002-10-01 | International Business Machines Corporation | Mobile agents for fault diagnosis and correction in a distributed computer environment |
WO2000004483A2 (en) * | 1998-07-15 | 2000-01-27 | Imation Corp. | Hierarchical data storage management |
US6269382B1 (en) * | 1998-08-31 | 2001-07-31 | Microsoft Corporation | Systems and methods for migration and recall of data from local and remote storage |
US6449731B1 (en) * | 1999-03-03 | 2002-09-10 | Tricord Systems, Inc. | Self-healing computer system storage |
US6404925B1 (en) * | 1999-03-11 | 2002-06-11 | Fuji Xerox Co., Ltd. | Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition |
US6339793B1 (en) * | 1999-04-06 | 2002-01-15 | International Business Machines Corporation | Read/write data sharing of DASD data, including byte file system data, in a cluster of multiple data processing systems |
US6466952B2 (en) * | 1999-04-08 | 2002-10-15 | Hewlett-Packard Company | Method for transferring and indexing data from old media to new media |
US6584497B1 (en) * | 1999-07-28 | 2003-06-24 | International Business Machines Corporation | Method, system, and program for returning a file requested through a network connection |
US6519637B1 (en) * | 1999-09-23 | 2003-02-11 | International Business Machines Corporation | Method and apparatus for managing a memory shortage situation in a data processing system |
US6493756B1 (en) * | 1999-10-28 | 2002-12-10 | Networks Associates, Inc. | System and method for dynamically sensing an asynchronous network event within a modular framework for network event processing |
US6460055B1 (en) * | 1999-12-16 | 2002-10-01 | Livevault Corporation | Systems and methods for backing up data files |
US7509420B2 (en) * | 2000-02-18 | 2009-03-24 | Emc Corporation | System and method for intelligent, globally distributed network storage |
AU2001250952A1 (en) * | 2000-03-22 | 2001-10-03 | Interwoven, Inc. | Method and apparatus for storing changes to file attributes without having to store an additional copy of the file contents |
GB0012701D0 (en) * | 2000-05-24 | 2000-07-19 | Geary Michael D | Automated astrological data retrieval and analysis |
US6990667B2 (en) * | 2001-01-29 | 2006-01-24 | Adaptec, Inc. | Server-independent object positioning for load balancing drives and servers |
US6775792B2 (en) * | 2001-01-29 | 2004-08-10 | Snap Appliance, Inc. | Discrete mapping of parity blocks |
US7444662B2 (en) * | 2001-06-28 | 2008-10-28 | Emc Corporation | Video file server cache management using movie ratings for reservation of memory and bandwidth resources |
US20040054656A1 (en) * | 2001-08-31 | 2004-03-18 | Arkivio, Inc. | Techniques for balancing capacity utilization in a storage environment |
US7092977B2 (en) * | 2001-08-31 | 2006-08-15 | Arkivio, Inc. | Techniques for storing data based upon storage policies |
US20040039891A1 (en) * | 2001-08-31 | 2004-02-26 | Arkivio, Inc. | Optimizing storage capacity utilization based upon data storage costs |
US7509316B2 (en) * | 2001-08-31 | 2009-03-24 | Rocket Software, Inc. | Techniques for performing policy automated operations |
US20030115204A1 (en) * | 2001-12-14 | 2003-06-19 | Arkivio, Inc. | Structure of policy information for storage, network and data management applications |
US20040083202A1 (en) * | 2002-08-30 | 2004-04-29 | Arkivio, Inc. | Techniques to control recalls in storage management applications |
WO2004021225A1 (en) * | 2002-08-30 | 2004-03-11 | Arkivio, Inc. | Techniques for moving stub files without recalling data |
CA2506543A1 (en) * | 2002-12-02 | 2004-06-17 | Arkivio Inc. | Data recovery techniques in storage systems |
US20050021566A1 (en) * | 2003-05-30 | 2005-01-27 | Arkivio, Inc. | Techniques for facilitating backup and restore of migrated files |
WO2004109556A1 (en) * | 2003-05-30 | 2004-12-16 | Arkivio, Inc. | Operating on migrated files without recalling data |
-
2002
- 2002-08-26 US US10/229,299 patent/US20030046313A1/en not_active Abandoned
- 2002-08-26 WO PCT/US2002/027387 patent/WO2003025795A1/en not_active Application Discontinuation
- 2002-08-26 JP JP2003529351A patent/JP2005503616A/ja not_active Withdrawn
- 2002-08-26 EP EP02768738A patent/EP1421522A1/en not_active Withdrawn
- 2002-08-26 CA CA002458416A patent/CA2458416A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
CA2458416A1 (en) | 2003-03-27 |
WO2003025795A1 (en) | 2003-03-27 |
US20030046313A1 (en) | 2003-03-06 |
EP1421522A1 (en) | 2004-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005503616A (ja) | データの内容と属性に基づいてデータをリストアする技法 | |
US7136882B2 (en) | Storage device manager | |
CN1656478B (zh) | 显示来自不同物理位置的不同类型的项目的文件系统 | |
US10706010B2 (en) | Methods and systems for managing data | |
US8577847B2 (en) | System and method for delivering results of a search query in an information management system | |
US6978297B1 (en) | System and method of managing queues by maintaining metadata files having attributes corresponding to capture of electronic document and using the metadata files to selectively lock the electronic document | |
CN100524296C (zh) | 利用虚拟文件夹的系统和方法 | |
JP5623537B2 (ja) | ポータルのためのユーザ定義のプロファイル・タグ、ルール、および推奨 | |
US8452788B2 (en) | Information retrieval system, registration apparatus for indexes for information retrieval, information retrieval method and program | |
EP1091304A2 (en) | Method and apparatus for electronic document management | |
US20120331071A1 (en) | Email attachment management in a computer system | |
US20040236801A1 (en) | Systems and methods for distributed content storage and management | |
JPH09153050A (ja) | 文書情報収集方法および文書情報収集装置 | |
JP2000003321A (ja) | 高性能なメッセ―ジ格納構造 | |
AU2010202186B2 (en) | Marketing asset exchange | |
US6823341B1 (en) | Method, system and program for providing indexed web page contents to a search engine database | |
JP5241298B2 (ja) | 履歴上のファイル名およびロケーションをインデックス付きにすることによりファイル・サーチおよびファイル操作を支援するためのシステムおよび方法 | |
US8386503B2 (en) | Method and apparatus for entity removal from a content management solution implementing time-based flagging for certainty in a relational database environment | |
US7693883B2 (en) | Online data volume deletion | |
US6754697B1 (en) | Method and apparatus for browsing and storing data in a distributed data processing system | |
JP2000132552A (ja) | 索引掲示装置及びプログラム記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050826 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20080502 |