JP2005502956A - 選択的データバックアップ - Google Patents
選択的データバックアップ Download PDFInfo
- Publication number
- JP2005502956A JP2005502956A JP2003527601A JP2003527601A JP2005502956A JP 2005502956 A JP2005502956 A JP 2005502956A JP 2003527601 A JP2003527601 A JP 2003527601A JP 2003527601 A JP2003527601 A JP 2003527601A JP 2005502956 A JP2005502956 A JP 2005502956A
- Authority
- JP
- Japan
- Prior art keywords
- data
- computer
- file
- stored
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000004891 communication Methods 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims description 58
- 230000008859 change Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 15
- 230000007717 exclusion Effects 0.000 claims description 11
- 239000000945 filler Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 description 31
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 208000024780 Urticaria Diseases 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000000739 chaotic effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 208000000044 Amnesia Diseases 0.000 description 1
- 208000026139 Memory disease Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006984 memory degeneration Effects 0.000 description 1
- 208000023060 memory loss Diseases 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1451—Management of the data involved in backup or backup restore by selection of backup contents
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
【0001】
(発明の分野)
本発明は、データをバックアップすること、より詳細には、非決定ファイルをバックアップすることに関する。
【背景技術】
【0002】
(本発明の背景)
データバックアップによる電子データ保護は、一般のイベントであり、ますます多くのメモリー量および処理能力を費やすイベントである。データファイルは、今日、一般的に、従来のソフトウェアプログラムを使用するよりも、より多くのメモリーを占有している。それ故、これらのファイルのバックアップは、より多くの格納スペースならびにファイルを転送および格納するための通信リンクバンド幅より多くの処理能力および通信リンクバンド幅を要求する。膨大な量のデータをバックアップする場合、変更のなかったデータをバックアップせず、可能な限り少ないファイルのコピー(好ましくは1つ)をバックアップして、データバックアップを低減することが望ましい。
【0003】
バックアップシステムに必要なバンド幅および格納を大幅に低減する、ネットワークに基づくコンピュータバックアップシステムのための数多くの手法が開発されてきた。2つの例は、差分ファイルおよび共通ファイルの排除(例えば、Caneら、米国特許第5,765,173号)である。一般的に、差分ファイルのバックアップは、前のファイル内の情報を固定サイズのブロック単位に表す1セットのハッシュコードを使用してファイル内に生じた変更を決定することによって行われる。これらのハッシュコードは、現在変更された同じファイルに対して照合され、変更のあったファイルの領域および変更のなかったファイルの領域を決定する。この結果、変更のあったファイルの部分を送信および格納するための大バンド幅およびスペースが著しく節約される。共通ファイル排除は、バックアップされるべきファイルが他のバックアップされるべきファイルと同じかどうか(例えば、既にバックアップされたファイルか)を決定し、もしそうであれば、そのファイルの1つのコピーのみを格納する。共通ファイル排除手法は、ファイル以外のデータグループに適用され得る。
【発明の開示】
【課題を解決するための手段】
【0004】
(発明の要旨)
本発明は、一般的に、ある局面で、所望のデータをバックアップするためのシステムであって、そのシステムとバックアップデータを格納するためのバックアップストレージとの間で情報を伝送するよう構成された通信リンクを含むシステム、および、通信リンクと結合されたプロセッサを提供する。そのプロセッサは、所望のデータの関連実体データ決定、格納されたデータと所望のデータの関連実体データとの比較、および格納されたデータと関連実体データの比較に基づいて格納のために通信リンクを介して関連実体データの伝送をするように構成されている。
【0005】
本発明のインプリメンテーションは、以下のような特徴の1つ以上を含み得る。プロセッサは、格納するために伝送するための関連データのうちの、格納データ中に存在する少なくとも一部を無視するよう構成される。プロセッサは、関連実体データが格納されたデータにない場合に限り、格納のための関連実体データを伝送するよう構成される。プロセッサは、所望のデータの構造およびその構造の部分と関連するデータを分析することで、関連実体データを決定するよう構成される。プロセッサは、変化耐性フォーマットに関する、関連実体データをマッピングし、変化耐性フォーマットされた実体データを用いて関連実体データと格納されたデータを比較するよう構成される。プロセッサは、関連実体データと格納されたデータを比較するように、関連実体データにおいて差動バックアップを行うよう構成される。
【0006】
本発明のインプリメンテーションは、また、以下のような特徴の1つ以上を含み得る。プロセッサは、実体データが格納されたデータにないというインディカ、および、格納されたデータ内の関連実体データが格納されたデータにないというインディカを、通信ラインを介して、伝送するようさらに構成される。インディカは、追加キーコマンド、追加値コマンド、削除キーコマンド、削除値コマンドおよび変化値コマンドのうち少なくとも1つを含む。プロセッサは、所望のデータ内でデータのグルーピングを決定することによって、関連実体データを決定するように構成されている。プロセッサは、所望のデータに関連するインデックスを分析することによって、データのグルーピングを決定するように構成される。プロセッサは、格納されたデータと関連実体データを比較するように、データのグルーピング上で共通ファイル排除を行うように構成される。さらに、プロセッサは、格納されたデータに存在するデータのグルーピングと関連実体データとの関係のインディカを通信ラインを介して、伝送するよう構成される。
【0007】
概して、他の局面において、発明は、コンピュータ読出し可能な媒体上に存在するコンピュータプログラム製品を提供する。コンピュータ読出し可能な媒体は、コンピュータが実行可能な命令を含有する。コンピュータが実行可能な命令は、複数のレベルでの実体データおよびフィーラデータを含む集合データの分析、集合データのレベルに関するレベルおよび価値の実体データ指示の決定、および、比較をコンピュータにさせる。この比較は、決定された実体データと格納されたデータの間のレベルまたは値の実体コンテンツにおける差分を決定するための、決定された実体データと格納されたデータとの比較である。
【0008】
発明のインプリメンテーションは、以下の特徴をひとつ以上含む。コンピュータに比較させる命令は、コンピュータに差分バックアップ技術を適用させる。命令は、コンピュータに決定された実体データを変更登録形式に格納させる。コンピュータに比較させる命令は、コンピュータに差分バックアップ技術を適用させ、その命令は、コンピュータに、少なくとも実体データをバックアップさせる命令をさらに含む。この実体データは、変更登録形式にあり、および格納されたデータに不在である。命令は、コンピュータに決定された実体データが格納されたデータに不在であるデータを含むことについての追加インディカ(add indicia)を提供させ、および、格納されたデータが決定された実体データに不在のデータを含むことについてのリムーブインディカ(remove indicia)を提供させる。
【0009】
概して、他の局面において、発明は、コンピュータ読出し可能な媒体上に存在するコンピュータプログラム製品を提供する。コンピュータ読出し可能な媒体は、コンピュータが実行可能な命令を含有する。コンピュータが実行可能な命令は、コンピュータに、データサブグループを含むデータの分析、データファイル内のデータサブグループの認証、データサブグループと格納された潜在的共通データセットとの比較、および、比較を基礎としたデータサブグループのバックアップをさせる。
【0010】
発明の実施形態は、以下の特徴をひとつ以上含む。命令は、コンピュータにこれらのデータサブグループのみをバックアップさせる。これらのデータサブグループは、格納された潜在的共通データセットに不在である。命令は、コンピュータにデータサブグループを分離されたファイルとして比較のために格納させる。命令は、コンピュータに、共通のファイル削除技術を用いる格納された潜在的共通データセットとデータサブグループとを比較させる。命令は、コンピュータに潜在的共通データセットの少なくともひとつがデータファイルに関することを示すリムーブインディカを提供させる。命令は、コンピュータに潜在的共通データセットの少なくともひとつがデータファイルの特定の部分に関することを示すリムーブインディカを提供させる。
【0011】
発明のさまざまな局面は、以下のひとつ以上の優位な点を提供する。伝統的バックアップ技術を破る方法で格納されたデータは、伝統的バックアップ技術の優位な点が達成される間に、バックアップされ得る。少ない実質的な変更を伴うファイル、および、十分な実質的でない変更は、少ない記憶装置かつ/または処理において、少ない実質的な変更に対応してバックアップされ得る。大きいデータサブグループ(集合させられたデータグループ、例えばファイル)は、非冗長的な方法においてバックアップされ得る。
【0012】
本発明の上記および他の利点および本発明の内容は、以下の図面、詳細な説明および特許請求の範囲を読むことにより完全に理解される。
【発明を実施するための最良の形態】
【0013】
(好適な実施形態の詳細な説明)
本発明の少なくともいくつかの実施形態は、実体変化を格納するために、および/または、他のデータセットに類似し得るデータのより大きな集合のデータサブセットを決定するために、データの実体差分変化を決定する技術を提供して、類似しているデータセットの二重格納を減らす。ファイルが分析されて、ファイルの実体を決定し得、そして、格納されたファイルの実体と比較され得る。ファイルの実体が異なる場合、実体差分が格納され得るが、実体ではない差分は、無視されて、バックアップされなくてもよい。さらに、意味のあるサブセットを含むファイルが分析されて、サブセット、および、格納されたデータセットと比較されるサブセットを決定し得る。データの二重セットはバックアップを迂回し得て、二重ではないセットはバックアップされ得る。
【0014】
特定のファイルが従来の差分のファイルバックアップ技術に十分に従わないことが発見されている。いくつかのファイルは、それらのファイル内に計算されたインデックスおよびポインタ(管理データ)(すなわち、多くの場合にはごみ(gabage)バイト)を含む。ごみバイトは、実体コンテンツ/情報を何も表さず、空のスペースにすぎない。若干修正され得るが、実質的に完全に修正されてはいないこのようなファイルは、異なって見える。例えば、ハッシュコード比較法が用いられる場合、これらのファイルは、以前のバージョンとはほぼ完全に異なっているかのようである。この「カオス的」挙動は、そのファイルを信頼して再構成するためにはこれらのファイルのほぼ全ての「データ」がバックアップされる必要があることを意味している。
【0015】
いくつかのデータファイル(例えば、Microsoft Outlook.pstファイル等のいくつかのメールシステムファイル)も、共通ファイル排除バックアップ技術の効率を減少させている。これらのデータファイルは、添付物をより大きなデータセット内に組み込むことによって、その添付物を取り扱う(例えば、全メールおよび添付物を含むファイル)。添付物を含むファイル全体が格納されたファイルに一致しない場合、共通ファイル排除技術は、e‐メールファイル(添付物)のサブセットがストレージレジストリに存在するデータセットと一致することを認識できない。
【0016】
本明細書に用いられているように、非決定ファイルまたはデータ群は、あるファイルまたはデータ群である。そのファイルファイルまたはデータ群において、ファイルまたはデータ群の物理的構成は、実体またはコンテンツが非常にささいな変化で、ある瞬間から次の瞬間へ変化してもよいし、データサブグループを含むファイルまたはデータ群のコンテンツは、劇的に変化してもよいが、ファイルまたはデータ群のデータサブグループは、格納された群に一致してもよい。これらの特徴は、従来のバックアップ法を避けて、従来のバックアップ法をより効率悪くする。
【0017】
図1を参照すると、非決定データをバックアップするシステム10は、コンピュータ12、通信ネットワーク14、およびバックアップストレージ16を含む。このコンピュータ12は、プロセッサ18、およびそのプロセッサ12によって実行され得るソフトウェア命令を格納して、バックアップされ得るデータを格納するメモリ20を含む。このソフトウェア命令は、以下に記載される機能を実行するようにプロセッサ18によって実行されるように構成される。コンピュータ12は、ネットワーク14を介して、バックアップするためにストレージ16にデータを送るように構成される。通常インターネットとして公知のパケット交換式ネットワークとしてここで示されるネットワーク14は、ワイドエリアネットワーク(WAN)であってもよいし、ローカルエリアネットワーク(LAN)であってもよい。さらに、ネットワーク14は、単純な通信ラインと置きかえられてもよい。このネットワーク14は、リンクの形態は変化し得るが、コンピュータ12とストレージ16との間の通信リンクを示す。
【0018】
コンピュータ12は、プロセッサ18にデータを評価させるように構成される。そのデータは、メモリ20に格納され、バックアップされるべきであり、バックアップするデータがあるかどうか、および、どのデータをバックアップするかを決定する。プロセッサ18は、格納されたソフトウェアと連動して、ファイル内の実際の、実体情報が評価され得るメカニズムを識別するように構成される。このメカニズムは、好ましくは、実体情報のみを識別して、ファイルのごみデータまたは管理部分は無視される。このプロセッサ18は、そのファイルを実際の情報を表す部分に分割するようにさらに構成される。このプロセッサ18は、好ましくは、差分のバックアップまたは共通(冗長)ファイルを排除する等の従来の技術を用いて、バックアップ用に実際の情報を評価するようにさらに構成される。実際のデータの評価は、1つの群(ファイルまたはメモリブロック)または別々の部分に集められた実際のデータによって実行され得る。コンピュータ12には、また、ファイルとは異なるデータのセットに作用する。
【0019】
(レジストリバックアップバックグラウンド)
Windows(R)NTシステム上へのレジストリバックアップは、一般に、レジストリセーブキーのためのRegSaveKeyと言うWin32 API(Application Programming Interface)を用いるほとんどのバックアップ製品によって実行される。レジストリは、キーとして識別されるアプリケーション用のアプリケーションの記述(例えば、.txtといったタイプのファイル)、ユーザ情報(例えば、デスクトップ設定)、および特有の設定(例えば、ワードプロセシングデフォルト、eメールデフォルトなど)を含む反転ツリー構造のデータベースである。キーは、レジストリにおける設定の名前であり、以下で使用される値は、設定の値を示す。RegSaveKeyは、APIユーザによって特定されるロケーションにおける格納ディスクにレジストリハイブのインメモリ(in−memory)バージョンをコピーする。ハイブは、レジストリの論理的ブランチであり、単一ファイル内に含まれる。例えば、以下のハイブはWindows(R)NT4.0上に存在する。
【0020】
SYSTEM
SAM
SECURITY
SOFTWARE
USER
システム上にアカウントを持つユーザにつき1つのUSERハイブがあるが、ログオンされるユーザのUSERハイブだけがメモリ内にロードされる。全ての他のUSERハイブは、ディスクに残る。
【0021】
レジストリをバックアップすることは、従来は、それぞれのインメモリハイブのためのWindows(R)RegSaveKey()APIをコールすることを含んでいる。このAPIは、ディスク上の対応するハイブファイルがアクセスされ得ないためにコールされる一方で、ハイブが使用中であるのでハイブがロードされる。RegSaveKey()は、従来は、ファイルとしてこれらのレジストリハイブをキャプチャするための唯一のメカニズムであった。ハイブは、差分バックアップソフトウェアエンジンを用いてバックアップされる(例えば、Caneらによる米国特許第5,765,173号に記載される)。これにより、ハイブファイル(単数または複数)が、最初に完全にバックアップされて、その後、ハイブファイル(単数または複数)に対するバイナリ変化は、それぞれ断続的なバックアップに送信された。このメカニズムにより、それぞれのバックアップ上にバックアップされるハイブにつき、平均で100Kほどのデータが得られた。
【0022】
Windows(R)2000の場合、レジストリハイブファイルのサイズは増加した。前述のパラグラフに記載されるレジストリをバックアップするためのメカニズムを用いて、バックアップ毎の生じるデータ量は、SOFTWAREハイブに対して平均してほぼ12MBになり、他のハイブは通常1MBを超えた。遅い通信接続を用いる遠隔ユーザに対して、通常毎日、このような遅い接続を介する遠隔のData Centerに、全てのバックアップ上の数メガバイト(15MB以上)を送信することは、受け入れることができない。さらに、バックアップデータは、格納される必要がある。このことは、10000のWindows(R)2000ユーザをサポートするData Centerを意味し、150GBのデータは、典型的に、ユーザのレジストリハイブをただバックアップするために、毎日格納される必要がある。
【0023】
Windows(R)2000上に作成されるデータRegSaveKey()が決定的でないことが発見された。RegSaveKeyを用いる2つの断続的なバックアップは、レジストリハイブに実際に変化しないので、ほぼ完全に異なるファイルを作成する。ファイル内の実際のデータは、ばらついている「ジャンク」またはフィラーデータによって、分散された。「ジャンク」またはフィラーデータは、その時点で偶然メモリにあった意味のないバイトであり、変化する。さらに、たとえ、実際のデータ間「ジャンク」が無視された場合でも、データの順序には差がある。
【0024】
バックアップサイズ問題は、上記と共に対応する検索問題である。数MBのデータは、典型的に、差分技術を用いてバックアップ毎にバックアップされる。レジストリハイブは、Data Centerによって再構築され、このハイブが検索のために必要とされる場合、ユーザのマシーンに戻るように送信される。Windows(R)2000上の、再構築されるレジストリの総サイズは、20MBを超える。つまり、遅い接続については、かなり長くなる。
【0025】
(システム10を用いたレジストリハイブバックアップ)
図1をさらに参照して、図2を参照した動作において、システム10を用いてレジストリハイブをバックアップするためのプロセス30は、示された工程を含む。しかしながら、プロセス30は、例示のみであり、限定的ではない。プロセス30は、例えば、工程を追加、削除または再構成することによって変更され得る。さらに、プロセス30は、他の非決定ファイルまたは他のデータ群をバックアップするように適合され得る。他の非決定ファイルまたは他のデータ群の物理的構成(例えば、ビット)は、それらの実体コンテンツ(すなわち、物理的構成によって表された実体)が変化するよりもかなり顕著に変化する。プロセス30は、好ましくは、任意のユーザがバックアップしているシステムにログオンされたかどうかに関係なくバックアップを実行し得るバックグラウンドにおいて実行しているプロセスにおいてインプリメントされる。プロセス30は、さらに好ましくは、(レジストリおよび任意の適切なファイルへのアクセスを含む)バックアップを達成するために十分な特権を有するローカルシステムアカウント下で実行するバックグラウンドプロセスによってインプリメントされる。これは、プロセスをバックアップおよび復元するための多くのキー(バックアッププログラムを実行するユーザが(例えば、Window NT セキュリティに起因して)アクセスするための許可を有し得ないキーを含む)へのアクセスを可能にする。プロセス30は、レジストリを通って実体情報を見い出し、その実体情報を格納された実体情報と比較し、どの実体情報が新しいか、どの実体情報が予め格納されているか、どの実体情報が変化したか、予め格納された、どの実体情報が取り除かれたかを判定する。あるいは、プロセスは、従来のブロック差分技術を適用可能な組織化ファイルを構築し得る。
【0026】
工程32において、ユーザはコンピュータ12を操作し(例えば、マウス、キーボードなどを用いて)、Win32 API RegSaveKey()にファイルとしてディスク(例えば、メモリ20)にハイブを格納させる。このバックアップがコンピュータ12に対するこのハイブのこれまでの第1のバックアップである場合、次いで、コンピュータ12は、このファイルをストレージ16に送信し、同様に、ローカルにこのファイルをキャッシュし、そのプロセス30は終了する。メモリにロードされたファイルは、「(base)ベース」レジストリファイルまたは「OldHive(オールドハイブ)」である。このバックアップがハイブの第1のバックアップでない場合、次いで、プロセス32は、工程34に進む。
【0027】
工程34において、コンピュータ12は、Win32 API RegLoadKey()を用いて、レジストリハイブファイルをレジストリに再ロードする。コンピュータは、比較のために、新しい名前「CurrentHive(カレントハイブ)」という名でハイブファイルを再ロードする。
【0028】
工程36において、コンピュータ12は、ローカルディスクキャッシュからOldHiveを回復する。そのレジストリハイブは、第1のバックアップの時間に存在していたようにファイルとして復元される。以下に議論するように、OldHiveが周期的にリセットされ得る場合、複数のOldHiveが存在し得る。バックアップのために、コンピュータ12は、複数のOldHiveのどれが、バックアップされるべきハイブと少なくとも同じくらい古いものである最新のOldHiveであるかを判定する。
【0029】
工程38において、復元されたハイブはレジストリにロードされている。コンピュータ12は、CurrentHiveとの比較のために、キャッシュから復元されたハイブを、「OldHive」という名でレジストリにロードする。
【0030】
工程40において、コンピュータ12は、2つのロードされたレジストリハイブ、CurrentHiveおよびOldHiveの間の比較を行う。それぞれの差分は、「HKEY LOCAL MACHINE$<HiveName>$CL」と名付けられた差分ファイルに書き込まれる。ここで、<HiveName>はバックアップされているハイブの名前である。その差分ファイルは、元々のバックアップレジストリファイル(ベースレジストリファイル)を取り出し、その差分ファイルが生成された時間において存在していたようなレジストリハイブファイルに等価であるように、それから情報を加算、減算(おそらく変化)するためのコマンドのリストを含む。工程40のさらなる詳細な説明は図3に関して以下に提示される。
【0031】
工程42において、コンピュータ12は、標準差分バックアップ技術を用いて、工程40に生成されたファイルをバックアップする。生成された差分は、このレジストリハイブに作成された前の差分ファイルに対して存在し得る。好ましくは、OldHiveにはなく、CurrentHiveのみにある実体データは、コンピュータ12によって、格納のためにバックアップストレージ16に送信される。CurrentHiveおよびOldHiveのある実体データは、格納のために、送信または再送信され得、システム10は、実体データを分析する代わりに、従来の態様でCurrentHiveの全てを格納すること、または、差分を判定することに対して利点がある。したがって、格納のためにある重複データを送信することは、また、本発明の範囲内にあるが、CurrentHiveおよびOldHiveにある少なくともいくつかの実体データ、好ましくは、全ての実体データは、バックアップストレージ16に送信されるためにバイパスされる。
【0032】
さらに図1を参照しながら、図3を参照すると、図2の工程40が、システム10を用いて、ロードされたレジストリハイブを比較するプロセス50として示され、図示されている工程を含む。しかし、このプロセス50は、一例に過ぎず、これに限定されるものではない。プロセス50は、例えば、工程を追加、削除、または並べ替えることによって、変更され得る。
【0033】
工程52において、コンピュータ12は、主キー(第1レベルキー)を、対応するキーアレイ、すなわち、CurrentHiveに対して1つのアレイ、およびOldHiveに対して1つのアレイに読み込む。各キーアレイ要素について、コンピュータ12は以下のものを格納する。
【0034】
szKeyName:Keyの名前
nNumSubKeys:このキーの下のSubkeyの数
nNumValues:このキーの下のValueの数
nACLTag:別のマップに格納されるAccess Control List(ACL)への一意的なタグ
nClassTag:別のマップに格納されるClass Nameへの一意的なタグ
実際のACLおよびクラス名は、キーについての他の情報とともに格納されない。これは、実際のACLおよびクラス名が、他のACLおよびクラスと同一である傾向があるからである。ACLまたはクラスへのタグを格納することによって、比較プロセス50の間のメモリにおいて、ならびに、バックアップされる差異ファイルを作成、送信、および格納する場合において、大幅なスペースの節約となる。例えば、ACLは、長さが2Kであり得るが、45,000の異なるキーに取り付けられる(90MB)。好ましくは、ACLの実際のコピーは1つだけマップに保持され、タグが各キーによって参照される状態で、タグにマッピングされる。
【0035】
主キー情報を入手するために、Win32 API関数RegQueryInfoKey()が、RegOpenKey()APIを用いてキーを開けた後、コンピュータ12によって用いられる。ACLのキーセキュリティ情報を入手するため、コンピュータ12は、RegGetKeySecurity()への呼を用いる。ACLは、別のマップに格納され、一意的なタグを用いて、ルックアップされ得る。このタグは、ACLのコンテンツに基づく、(このレジストリハイブについて)一意的なハッシュコードである。現在のタグと同一のタグが生成されるが、ACLのコンテンツが異なる場合(ハッシュコード衝突)、ハッシュコード値は、一意的なタグが生成されるまで、1ずつ増分される。
【0036】
工程54において、コンピュータ12は、szKeyNameによって、2つのキーアレイのそれぞれをソートする。コンピュータ12は、CurrentHiveキーアレイ内の各主キーを、OldHiveキーアレイ内のキーと比較する。主キーを比較することによって、以下の結果のうちの1つがもたらされる。
【0037】
1.キーはCurrentHiveにはあるが、OldHiveにはない:この場合、コンピュータ12は、「Add Key」コマンドを、バックアップされるファイルに書く。また、コンピュータ12は、この主キーのサブキーおよび値の全てを数え上げ、それぞれについて、「Add Key」および「Add Value」コマンドを追加する。事実上、その主サブキーの下のツリー全体は、現在のハイブにとって新しいものである。
【0038】
2.キーはCurrentHiveにはないがOldHiveにはある:この場合、コンピュータ12は、バックアップされるファイルに、「Remove Key」コマンドを書く。
【0039】
3.キーはCurrentHiveおよびOldHiveの両方にある:この場合、コンピュータ12は、名前が同じであるにも関わらず、クラス名またはACLがこれらの2つの主キーの間で異なるか否かについて判定する。いずれかが異なる場合、コンピュータ12は、CurrentHiveのキーのクラス情報および/またはACL情報を、バックアップされるファイル(「差分ファイル」)に、対応するクラスおよび/またはACLが差分ファイルに既に書き込まれていない場合に書き込む。コンピュータ12は、「Modified Key」コマンドを、クラスおよび/またはACLについて、タグを有するファイル(「タグファイル」)に出力する。コンピュータ12は、サブ工程56、68について記載されたように、2つの値アレイを比較する。
【0040】
工程52と同様に、サブ工程56において、一致する主キーの下に存在する、CurrentHiveおよびOldHiveにおける値の名前およびキーの値が、コンピュータ12によって、読み出され、ソートされる。これらの値は、RegEnumValue()Win32 APIなどの適切なAPIを用いることによって、コンピュータ12によって入手され得る。コンピュータ12は、値をCurrentHive値アレイおよびOldHive値アレイにソートする。
【0041】
サブ工程58において、コンピュータ12は、CurrentHive値アレイにおいて処理されているキーの下の各値を、OldHive値アレイにおいて処理されているキーの下の各値と比較する。それぞれの比較に対して、以下の結果のうちの1つが生じる。
【0042】
1.値はCurrentHiveにはあるが、OldHiveにはない:コンピュータ12は、「Add Value」コマンドを差分ファイルに書く。
【0043】
2.値はCurrentHiveにはないが、OldHiveにはある:コンピュータ12は、「Remove Value」コマンドを差分ファイルに書く。
【0044】
3.値はCurrentHiveとOldHiveとの両方にあり、同じである:出力はなし。
【0045】
4.値はCurrentHiveとOldHiveとの両方にあるが、異なる:コンピュータ12は、「Change Value」コマンド(値変更コマンドなどとも呼ばれる)を差分ファイルに書く。値変更コマンドは、値追加コマンドと組み合わせられた値削除コマンドと論理的に等価であり、そのようにインプリメントされ得る。
【0046】
また、コンピュータ12は、CurrentHiveの主キーおよびOldHiveの主キーのサブキーを、まるでサブキー自体が主キーであるかのように、工程52および54に従って、処理する。
【0047】
工程60において、コンピュータ12は、主キーを閉じる。コンピュータ12は、Win32 API関数RegCloseKey()などの適切なAPIを用いて、主キーを閉じ得る。
【0048】
図3に示すプロセス50によって行われる比較は、実体情報が入手されるような「実行中」に行われる。コンピュータ12は、CurrentHiveの実体情報のファイル全体を生成して、その後、それを、OldHiveの(他のファイル内の)実体情報のファイル全体と比較することを待たない。代わりに、コンピュータ12は、CurrentHiveが入手される場合、CurrentHiveからの実体情報をOldHiveからの実体情報と比較する。あるいは、コンピュータは、実体情報の2つのファイルを生成し、例えば、標準的な差動ファイルバックアップ技術を用いて、実体情報ファイルを比較することによって、プロセス50を行い得る。実体情報ファイルは、ファイルの実体的なコンテンツの小さな変化が変化耐性ファイルの物理的な構成に小さな変化をもたらすという点で、変化耐性ファイルである。「実行中」技術は、時間およびリソースの節約のために、好ましいことがあり得る。
【0049】
図4を参照すると、ADD KEY、ADD VALUE、REMOVE KEY、およびREMOVE VALUEコマンドが例示的に示されている。図示されているように、Key AのSubkey AAは、CurrentHiveにはあるが、OldHiveにはない。従って、対応するADD KEYコマンドが生成され、差分ファイルに入れられる。差分ファイルに入れられた各ADD KEYコマンドについて、キーのACLは、その特定のACLが差分ファイルにまだない場合、差分ファイルに追加される。クラス名についても同様である。新たなSubkey AAと同様に、Key BのSubkey BBの値BB1は、CurrentHiveにはあるが、OldHiveにはない。従って、対応するADD VALUEコマンドが生成され、差分ファイルに入れられる。任意のADDコマンド(キーまたは値)について、十分な情報が差分ファイルに入れられるので、対応するキーまたは値が、後でレジストリハイブに戻されて追加され得る。Key AのSubkey ABの値AB2は、OldHiveにはあるがCurrentHiveにはない。従って、対応するREMOVE VALUEコマンドが生成され、差分ファイルに入れられる。同様に、Key AのSubkey ACは、OldHiveにはあるがCurrentHiveにはない。従って、対応するREMOVE KEYコマンドが生成され、差分ファイルに入れられる。図4には、MODIFY KEYコマンドが示されていないが、示されているキーまたは値の一致のいずれかについて、対応するACLまたはクラス名が異なる場合、MODIFY KEYコマンドが生成され、差分ファイルに入れられ得る。
【0050】
(バックアップレジストリハイブの復元)
図5によると、図1をさらに参照して、システム10を用いるバックアップレジストリハイブを復元するためのプロセス70は、示された工程を含む。しかしながら、プロセス70は、例示に過ぎず、限定的でない。プロセス70は、例えば、工程が追加、除去または再構成されることによって変更され得る。さらに、プロセス70は、他の非決定ファイルまたは他のデータ群を復元するように適合され得る。
【0051】
工程72において、コンピュータ12は、バックアップされた最後のフルレジストリハイブファイル(ベースレジストリファイル)を決定する。所望のサイズよりも大きくなった場合、周期的に、差分ファイルが空にされ得る。例えば、差分ファイルがCurrentHiveよりも大きくなった場合、OldHiveは、CurrentHiveになるようにリセットされ得、差分ファイルを実質的に空にする。しかしながら、複数のOldHiveが存在する。バックアップのために、コンピュータ12は、複数のOldHiveのどれが、バックアップされるべきハイブと少なくとも同じだけ古い最新のOldHiveであるかを決定する。
【0052】
工程74において、コンピュータ12は、オンディスクキャッシュから最後のフルレジストリハイブファイルを復元する。このファイルが(例えば、ディスククラッシュ、機械損等によるメモリ消失により)キャッシュにない場合、コンピュータ12は、バックアプストレージ16からファイルを取り出す。
【0053】
工程76において、コンピュータ12は、工程74から再構築されたファイルをハイブ「RestoreHive」としてロードする。これを行うために、ユーザは、RegLoadKey()Win32 API等のコンピュータ12の適切なAPIを用いる。
【0054】
工程78において、コンピュータ12は、適切な差分ファイルを取り出す。コンピュータ12は、レジストリハイブファイルが復元されるべきレジストリハイブバックアップに対応するHKEY_LOCAL_MACHINE$<HiveName>$CLファイルを取り出す。
【0055】
工程80において、コンピュータ12は、取り出された差分ファイルを開き、かつ処理する。ファイル内の各コマンドについて、コンピュータ12キーおよび値を追加またはロードされた「RestoreHive」から削除する(変更/改変値コマンドが用いられた場合、値を変更する)。コンピュータ12は、さらに、ACLを、適宜、適用し、対応するクラスを見つけ出すためにCLASS IDを用いる。
【0056】
工程82において、コンピュータは、差分ファイルを閉じ、「RestoreHive」ハイブをアンロードする。コンピュータは、RestoreHiveファイルをアンロードするために、Win32 API機能RegUnloadKey()等の適切な機能を用いる。
【0057】
他の実施形態は、本発明の範囲および主旨、ならびに添付の特許請求の範囲に含まれる。例えば、上述の記載は、レジストリのバックアップに焦点を当てたが、上述の技術は、レジストリまたはファイルをバックアップすることに限定されない。この技術は、従来の差分ファイルのバックアップを妨害する任意の数の他のデータセットに適用され得る。データセットがインデックスおよび/またはジャンクデータを含み、ならびに/あるいは、改変が原因で、無秩序な挙動を表示する場合、データセットのコンテンツの実質または意味の知識を用いてこの技術が適用され得る。
【0058】
さらに、現在のファイルと、そのファイルの前のバージョンとの間の差分の決定および/または格納に関する種々の技術が用いられ得る。上述の記載は、ファイルのベースラインバージョンの格納、ならびに、各後続のバックアップにおいて現在のバージョンとベースラインバージョンとの間の差分を表す差分ファイルの決定、および差分ファイルの格納に焦点を当てられ、新しいベースラインファイルは、場合によっては、周期的に格納される。あるいは、バックアップされるべきファイルは、局所的に格納され得、各後続のバックアップにて、最も最近バックアップされたバージョン(ベースラインバージョンと対照的に)と現在のバージョンとの間の論理差分が決定され得、決定された差分は、差分ファイルとして格納される。さらに、ファイルのバイナリバージョンは、差分バックアップに適用できる標準フォームに変換され得、この標準フォームはバックアップされる。各後続のバックアップにて、現在のファイルは標準フォームに変換され得、2つの標準フォームファイル間の差分を決定するために従来の差分バックアッププロセスが適用される。さらに別の技術が可能であり、本発明および特許請求の範囲および主旨に含まれる。これらの代替的技術を用いる復元は、バックアップファイルの実体データに集中することによって実行され得る。
【0059】
(システム10を用いた集合ブロックバックアップ)
図1を参照すると、システム10はさらに、典型的な共通/冗長ファイル排除(CFE/RFE)バックアップ手法の有効性をブレークするファイルまたは他のデータセットを効率的にバックアップするために用いられ得る。コンピュータ12が効率的にバックアップするように構成されているCFEブレークファイルは、大きいファイル内にデータサブグループのインデックスまたは他のインディカ(indicia)を含んでデータベースに似た、電子データ添付物などの、ファイルまたは他のデータグループの集合を含む。このようなCFEブレークファイルがあると、データサブグループはバックアップされるべき他のデータサブグループまたはファイルと同一であり得る。コンピュータ12は、個々のデータサブグループを決定し、同一のデータサブグループの冗長なバックアップを低減させ、好適には排除するように構成されている。このように、CFE手法はファイルへの適用に限定されず、任意のデータグループに適用され得る。
【0060】
図6に、一例としてのCFEブレークファイル110を論理的に示す。ファイル110は、適切なポインタで多くの非連続的メモリ位置に物理的に分割され得る。ファイル110は、データサブグループ120および122の、開始を示すインデックス112および114、ならびに終端を示すインデックス116および118を含む。他のデータサブグループもファイル110に含まれ得るが、例として2つのデータサブグループ120および122のみを示す。データサブグループ120、122の例は、電子メールおよび関連する添付物、または電子メールフォルダおよび関連する添付物であるが、データサブグループはこれらに限られない。データサブグループは、ファイルであってもよいし、ファイルでない他の関連データセットであってもよい。
【0061】
図7さらに図1および図6を参照すると、システム10を用いてCFEブレークファイルをバックアップするプロセス130は図示する工程を含む。しかしプロセス130は一例であって、本発明はこれに限定されない。プロセス130は、例えば他の工程を追加したり、工程を除去したり、工程を再構成したりすることにより変更され得る。プロセス130はファイル以外のデータセットに適用され得る。
【0062】
工程132において、コンピュータ12はファイル110を分析してデータサブグループ120および122を決定する。コンピュータ12は、ファイル110内のインデックス112、114、116および118を見つけ出し、データサブグループ120および122の開始および終端を決定し、それによりデータサブグループ120および122の内容を決定する。
【0063】
工程134において、コンピュータ12はデータサブグループ120および122を格納し、冗長/共通ファイル排除バックアップを適用する。データサブグループ120および122が決定されると、コンピュータ12はデータサブグループ120および122を一時的ストレージ、例えばキャッシュに格納する。コンピュータ12はさらに、バックアップストレージ16内にすでに格納されているファイルに対して各決定され格納されたデータサブグループに、標準共通ファイル排除手法を適用する。あるいはコンピュータ12は、データサブグループ120および122をより永久的なストレージに格納し、格納されたグループおよび/またはファイルに対して集合的に共通ファイル排除を実行することができる。
【0064】
工程136において、クロスレファレンスデータベースが生成されて、冗長データサブグループと関連データサブグループとを関連づける。例えば、データサブグループ120が電子メールメッセージでありデータサブグループ122がバックアップストレージ16にすでに格納されているファイルと冗長である添付物である場合、データサブグループ122はその全体をバックアップすることはない。コンピュータ12は、データサブグループ120を、データサブグループ122と同一であり既に格納されているファイルと関連づけるクロスレファレンスデータベースにレファレンスを挿入する。こうしてコンピュータ12は、クロスレファレンスデータベースを用いて、ファイル110内のいずれのデータサブグループ(例えばデータサブグループ120)が、関連データサブグループ(例えば、冗長であったデータサブグループ122)を有するかを決定し、格納された冗長データサブグループを見つけ出し、格納された冗長データサブグループを用いてファイル110と、全体としてはファイル110と共に格納されていなかったデータサブグループ(ここではデータサブグループ122)とを再アセンブルする。
【0065】
他の実施形態も特許請求の範囲の範囲および思想に含まれる。例えば、ソフトウェアの性質上、上記した機能はソフトウェア、ハードウェア、ファームウェア、ハードワイヤリング、またはこれらのうちのいずれかの組み合わせによってインプリメントされ得る。さらに機能をインプリメントする特徴部も、物理的に様々に配置され得、例えば、機能の異なる部分が異なる物理的位置でインプリメントされるように分散され得る。
【図面の簡単な説明】
【0066】
【図1】図1は、データのバックアップシステムの単純化されたブロック図である。
【図2】図2は、図1に示されたシステムを利用した非決定レジストリデータファイルデータのバックアップ処理のブロックフロー図である。
【図3】図3は、図1に示されたシステムを利用した非決定レジストリデータファイルデータのバックアップ処理のブロックフロー図である。
【図4】図4は、レジストリファイルのバックアップを図解したブロック図である。
【図5】図5は、バックアップレジストリファイルのリストアを示すブロックフロー図である。
【図6】図6は、データサブグループを含む集合ファイルの一部を単純化したブロック図である。
【図7】図7は、図6に示された集合ファイルのバックアップ処理のブロックフロー図である。
Claims (23)
- 所望のデータをバックアップするシステムであって、
該システムとバックアップデータを格納するバックアップストレージとの間で情報を伝送するように構成されている通信リンクと、
該通信リンクに連結されたプロセッサであって、
該所望のデータの関連実体データを決定し、
該所望のデータの該関連実体データと格納されたデータとを比較し、
該関連実体データと該格納されたデータとの比較に基づいて、格納するために、該通信リンクを介して該関連実体データを伝送するように構成されているプロセッサと、
を備えたシステム。 - 前記プロセッサが、前記関連データのうち、前記格納されたデータ内に存在する少なくともいくつかであって、格納のために伝送する少なくともいくつかを迂回するように構成されている、請求項1に記載のシステム。
- 前記プロセッサが、前記関連実体データが前記格納されたデータ内に存在しない場合にのみ、該関連実体データを格納のために伝送する、請求項1に記載のシステム。
- 前記プロセッサが、前記所望のデータの構成と該構成の一部と関連するデータとを分析することにより、前記関連実体データを決定するように構成されている、請求項1に記載のシステム。
- 前記プロセッサが、前記関連実体データを変更耐性フォーマットにマッピングし、該変更耐性フォーマットされた実体データを用いて、該関連実体データと前記格納されたデータとを比較するように構成されている、請求項4に記載のシステム。
- 前記プロセッサが、前記関連実体データに対して差分バックアップを実行し、該関連実体データと前記格納されたデータとを比較するように構成されている、請求項1に記載のシステム。
- 前記プロセッサが、実体データが前記格納されたデータ内に存在しないこと、および該格納されたデータ内の実体データが前記関連実体データ内に存在しないというインディカを、前記通信リンクを介して伝送するようにさらに構成されている、請求項1に記載のシステム。
- 前記インディカが、キー追加コマンド、値追加コマンド、キー除去コマンド、値除去コマンド、および値変更コマンドのうちの少なくとも1つを含む、請求項7に記載のシステム。
- 前記プロセッサが、前記所望のデータ内のデータのグルーピングを決定することにより、前記関連実体データを決定するように構成されている、請求項1に記載のシステム。
- 前記プロセッサが、前記所望のデータに関連するインデックスを分析することにより、前記データのグルーピングを決定するように構成されている、請求項9に記載のシステム。
- 前記プロセッサが、前記データのグルーピングに対して共通ファイル排除を実行し、前記関連実体データと前記格納されたデータとを比較するように構成されている、請求項9に記載のシステム。
- 前記プロセッサが、前記通信リンクを介して、前記格納されたデータ内に存在するデータグルーピングと前記関連実体データとの関係のインディカを伝送するようにさらに構成されている、請求項11に記載のシステム。
- コンピュータ実行可能命令を含むコンピュータ読取り可能媒体上に存在するコンピュータプログラム製品であって、コンピュータに、
実体データとフィラーデータとを複数のレベルで含む集合データを分析させ、
該集合データの該レベルに関連するレベルと値とを示す該実体データを決定させ、
該決定された実体データと格納されたデータとを比較して、該決定された実体データと該格納されたデータとの間の、実体内容レベルおよび値における差分を決定するようにさせる、コンピュータプログラム製品。 - 前記コンピュータに比較させる前記命令が、該コンピュータに、差分バックアップ手法を適用させる、請求項13に記載のコンピュータプログラム製品。
- 前記命令が、前記コンピュータに、変更耐性フォーマットで前記決定された実体データを格納させる、請求項13に記載のコンピュータプログラム製品。
- 前記コンピュータに比較させる前記命令が、該コンピュータに、差分バックアップ手法を適用させ、該命令が、該コンピュータに、少なくとも、前記変更耐性フォーマットであり前記格納されたデータ内に存在しない実体データをバックアップさせる命令をさらに含む、請求項15に記載のコンピュータプログラム製品。
- 前記命令が、前記コンピュータに、前記決定された実体データが前記格納されたデータ内に存在しないデータを含むという追加インディカを提供させ、該格納されたデータが該決定された実体データ内に存在しないデータを含むという除去インディカを提供させる、請求項13に記載のコンピュータプログラム製品。
- コンピュータ実行可能命令を含むコンピュータ読取り可能媒体上に存在するコンピュータプログラム製品であって、コンピュータに、
データサブグループを含むデータを分析させ、
データファイル内の該データサブグループを識別させ、
該データサブグループと格納された潜在的に共通のデータセットとを比較させ、
該比較に基づいて該データサブグループをバックアップさせる、コンピュータプログラム製品。 - 前記命令が前記コンピュータに、前記格納された潜在的に共通のデータセット内に存在しないデータサブグループのみをバックアップさせる、請求項18に記載のコンピュータプログラム製品。
- 前記命令が前記コンピュータに、比較のために前記データサブグループを別々のファイルとして格納させる、請求項18に記載のコンピュータプログラム製品。
- 前記命令が前記コンピュータに、共通ファイル排除手法を用いて、前記データサブグループと前記格納された潜在的に共通のデータセットとを比較させる、請求項18に記載のコンピュータプログラム製品。
- 前記命令が前記コンピュータに、前記潜在的に共通のデータセットの少なくとも1つが前記データファイルと関連することを示す除去インディカを提供させる、請求項18に記載のコンピュータプログラム製品。
- 前記命令が前記コンピュータに、前記潜在的に共通のデータセットの少なくとも1つが前記データファイルの特定の部分と関連することを示す除去インディカを提供させる、請求項22に記載のコンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31768401P | 2001-09-06 | 2001-09-06 | |
US10/235,304 US7509356B2 (en) | 2001-09-06 | 2002-09-05 | Data backup |
PCT/US2002/028406 WO2003023617A2 (en) | 2001-09-06 | 2002-09-06 | Selective data backup |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009115038A Division JP2009181590A (ja) | 2001-09-06 | 2009-05-11 | 選択的データバックアップ |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005502956A true JP2005502956A (ja) | 2005-01-27 |
Family
ID=26928792
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003527601A Withdrawn JP2005502956A (ja) | 2001-09-06 | 2002-09-06 | 選択的データバックアップ |
JP2009115038A Pending JP2009181590A (ja) | 2001-09-06 | 2009-05-11 | 選択的データバックアップ |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009115038A Pending JP2009181590A (ja) | 2001-09-06 | 2009-05-11 | 選択的データバックアップ |
Country Status (6)
Country | Link |
---|---|
US (1) | US7509356B2 (ja) |
EP (1) | EP1428123B1 (ja) |
JP (2) | JP2005502956A (ja) |
AU (1) | AU2002323635A1 (ja) |
HK (1) | HK1067197A1 (ja) |
WO (1) | WO2003023617A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006244485A (ja) * | 2005-02-28 | 2006-09-14 | Microsoft Corp | 階層的に安全なストレージシステム内の発見可能性および列挙の機構 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8443045B2 (en) * | 2002-10-01 | 2013-05-14 | Honda Motor Co., Ltd. | Storage of selected e-mails including attachments in document management system |
US7251680B2 (en) * | 2003-10-31 | 2007-07-31 | Veritas Operating Corporation | Single instance backup of email message attachments |
US7913053B1 (en) | 2005-02-15 | 2011-03-22 | Symantec Operating Corporation | System and method for archival of messages in size-limited containers and separate archival of attachments in content addressable storage |
US7974952B1 (en) * | 2005-04-18 | 2011-07-05 | Emc Corporation | Tracking file system changes for backup |
US7624129B2 (en) * | 2006-06-30 | 2009-11-24 | Microsoft Corporation | Dual logging of changes to a user preference in a computer device |
US8458127B1 (en) * | 2007-12-28 | 2013-06-04 | Blue Coat Systems, Inc. | Application data synchronization |
US8527465B1 (en) * | 2008-12-24 | 2013-09-03 | Emc Corporation | System and method for modeling data change over time |
US8166038B2 (en) * | 2009-06-11 | 2012-04-24 | Kaufman Mark A | Intelligent retrieval of digital assets |
US9390088B2 (en) * | 2013-04-22 | 2016-07-12 | International Business Machines Corporation | Ensuring access to long-term stored electronic documents |
JP7108784B2 (ja) * | 2018-08-21 | 2022-07-28 | 華為技術有限公司 | データ記憶方法、データ取得方法、及び機器 |
CN112328171B (zh) * | 2020-10-23 | 2024-04-30 | 苏州元核云技术有限公司 | 数据分布预测方法、数据均衡方法、设备及存储介质 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5274807A (en) * | 1990-11-01 | 1993-12-28 | At&T Bell Laboratories | Method for reducing magnetic storage volume for computer disk image backup |
US5613113A (en) * | 1993-10-08 | 1997-03-18 | International Business Machines Corporation | Consistent recreation of events from activity logs |
US5819020A (en) * | 1995-10-16 | 1998-10-06 | Network Specialists, Inc. | Real time backup system |
US5765173A (en) * | 1996-01-11 | 1998-06-09 | Connected Corporation | High performance backup via selective file saving which can perform incremental backups and exclude files and uses a changed block signature list |
US5819251A (en) * | 1996-02-06 | 1998-10-06 | Oracle Corporation | System and apparatus for storage retrieval and analysis of relational and non-relational data |
US5813008A (en) * | 1996-07-12 | 1998-09-22 | Microsoft Corporation | Single instance storage of information |
US5758359A (en) * | 1996-10-24 | 1998-05-26 | Digital Equipment Corporation | Method and apparatus for performing retroactive backups in a computer system |
US6038665A (en) * | 1996-12-03 | 2000-03-14 | Fairbanks Systems Group | System and method for backing up computer files over a wide area computer network |
US6088693A (en) * | 1996-12-06 | 2000-07-11 | International Business Machines Corporation | Data management system for file and database management |
US6157931A (en) * | 1997-02-11 | 2000-12-05 | Connected Corporation | Database/template driven file selection for backup programs |
US5907848A (en) * | 1997-03-14 | 1999-05-25 | Lakeview Technology, Inc. | Method and system for defining transactions from a database log |
US6199074B1 (en) * | 1997-10-09 | 2001-03-06 | International Business Machines Corporation | Database backup system ensuring consistency between primary and mirrored backup database copies despite backup interruption |
US5991772A (en) * | 1997-10-31 | 1999-11-23 | Oracle Corporation | Method and apparatus for restoring a portion of a database |
US6088694A (en) * | 1998-03-31 | 2000-07-11 | International Business Machines Corporation | Continuous availability and efficient backup for externally referenced objects |
US6032145A (en) * | 1998-04-10 | 2000-02-29 | Requisite Technology, Inc. | Method and system for database manipulation |
US6189016B1 (en) * | 1998-06-12 | 2001-02-13 | Microsoft Corporation | Journaling ordered changes in a storage volume |
US6279011B1 (en) * | 1998-06-19 | 2001-08-21 | Network Appliance, Inc. | Backup and restore for heterogeneous file server environment |
US6269381B1 (en) * | 1998-06-30 | 2001-07-31 | Emc Corporation | Method and apparatus for backing up data before updating the data and for restoring from the backups |
US6141660A (en) * | 1998-07-16 | 2000-10-31 | International Business Machines Corporation | Command line interface for creating business objects for accessing a hierarchical database |
US6115772A (en) * | 1998-09-18 | 2000-09-05 | International Business Machines, Inc. | System and method for host expansion and connection adaptability for a SCSI storage array |
US6385626B1 (en) * | 1998-11-19 | 2002-05-07 | Emc Corporation | Method and apparatus for identifying changes to a logical object based on changes to the logical object at physical level |
US6212512B1 (en) * | 1999-01-06 | 2001-04-03 | Hewlett-Packard Company | Integration of a database into file management software for protecting, tracking and retrieving data |
JP2000200208A (ja) | 1999-01-06 | 2000-07-18 | Fujitsu Ltd | ファイルバックアップ方法,装置およびそのプログラム記録媒体 |
US6397307B2 (en) * | 1999-02-23 | 2002-05-28 | Legato Systems, Inc. | Method and system for mirroring and archiving mass storage |
US6374265B1 (en) * | 1999-03-29 | 2002-04-16 | Inventec Corp. | Method for backup and recovery of the long filename in computer system |
US6513051B1 (en) * | 1999-07-16 | 2003-01-28 | Microsoft Corporation | Method and system for backing up and restoring files stored in a single instance store |
US6317755B1 (en) * | 1999-07-26 | 2001-11-13 | Motorola, Inc. | Method and apparatus for data backup and restoration in a portable data device |
US6460055B1 (en) * | 1999-12-16 | 2002-10-01 | Livevault Corporation | Systems and methods for backing up data files |
US6526418B1 (en) * | 1999-12-16 | 2003-02-25 | Livevault Corporation | Systems and methods for backing up data files |
AU2001238269B2 (en) * | 2000-02-18 | 2006-06-22 | Emc Corporation | Hash file system and method for use in a commonality factoring system |
US7072916B1 (en) * | 2000-08-18 | 2006-07-04 | Network Appliance, Inc. | Instant snapshot |
US7730213B2 (en) * | 2000-12-18 | 2010-06-01 | Oracle America, Inc. | Object-based storage device with improved reliability and fast crash recovery |
US6868417B2 (en) * | 2000-12-18 | 2005-03-15 | Spinnaker Networks, Inc. | Mechanism for handling file level and block level remote file accesses using the same server |
US6745209B2 (en) * | 2001-08-15 | 2004-06-01 | Iti, Inc. | Synchronization of plural databases in a database replication system |
US6898688B2 (en) * | 2001-12-28 | 2005-05-24 | Storage Technology Corporation | Data management appliance |
US6820098B1 (en) * | 2002-03-15 | 2004-11-16 | Hewlett-Packard Development Company, L.P. | System and method for efficient and trackable asynchronous file replication |
US7302536B2 (en) * | 2003-06-17 | 2007-11-27 | Hitachi, Ltd. | Method and apparatus for managing replication volumes |
-
2002
- 2002-09-05 US US10/235,304 patent/US7509356B2/en not_active Expired - Fee Related
- 2002-09-06 JP JP2003527601A patent/JP2005502956A/ja not_active Withdrawn
- 2002-09-06 WO PCT/US2002/028406 patent/WO2003023617A2/en active Application Filing
- 2002-09-06 AU AU2002323635A patent/AU2002323635A1/en not_active Abandoned
- 2002-09-06 EP EP02757632A patent/EP1428123B1/en not_active Expired - Lifetime
-
2004
- 2004-12-15 HK HK04109950.5A patent/HK1067197A1/xx not_active IP Right Cessation
-
2009
- 2009-05-11 JP JP2009115038A patent/JP2009181590A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006244485A (ja) * | 2005-02-28 | 2006-09-14 | Microsoft Corp | 階層的に安全なストレージシステム内の発見可能性および列挙の機構 |
Also Published As
Publication number | Publication date |
---|---|
HK1067197A1 (en) | 2005-04-01 |
US7509356B2 (en) | 2009-03-24 |
WO2003023617A3 (en) | 2004-03-18 |
EP1428123B1 (en) | 2011-11-02 |
AU2002323635A1 (en) | 2003-03-24 |
EP1428123A2 (en) | 2004-06-16 |
WO2003023617A2 (en) | 2003-03-20 |
JP2009181590A (ja) | 2009-08-13 |
US20030135524A1 (en) | 2003-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009181590A (ja) | 選択的データバックアップ | |
US11561931B2 (en) | Information source agent systems and methods for distributed data storage and management using content signatures | |
US11016859B2 (en) | De-duplication systems and methods for application-specific data | |
US10884990B2 (en) | Application-aware and remote single instance data management | |
US8219524B2 (en) | Application-aware and remote single instance data management | |
US7305577B2 (en) | Data isolation system and method | |
US6477544B1 (en) | Single instance store for file systems | |
US7529778B1 (en) | System and method for providing access to consistent point-in-time file versions | |
US7680998B1 (en) | Journaled data backup during server quiescence or unavailability | |
US20120158760A1 (en) | Methods and computer program products for performing computer forensics | |
US20040236801A1 (en) | Systems and methods for distributed content storage and management | |
US9002800B1 (en) | Archive and backup virtualization | |
WO2007118243A2 (en) | Data compression and storage techniques | |
US10467187B1 (en) | System and method for restoration of MICROSOFT exchange server mail | |
Feng | Overview of Data Deduplication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050902 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081008 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090106 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090209 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20090508 Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090508 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090703 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20091002 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20110421 |