JP2010211713A - バックアップ装置、バックアップシステム、バックアップ方法、及びプログラム - Google Patents

バックアップ装置、バックアップシステム、バックアップ方法、及びプログラム Download PDF

Info

Publication number
JP2010211713A
JP2010211713A JP2009059587A JP2009059587A JP2010211713A JP 2010211713 A JP2010211713 A JP 2010211713A JP 2009059587 A JP2009059587 A JP 2009059587A JP 2009059587 A JP2009059587 A JP 2009059587A JP 2010211713 A JP2010211713 A JP 2010211713A
Authority
JP
Japan
Prior art keywords
compression
information
backup
compression method
update information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009059587A
Other languages
English (en)
Other versions
JP5636635B2 (ja
Inventor
Takeshi Miyata
剛 宮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009059587A priority Critical patent/JP5636635B2/ja
Publication of JP2010211713A publication Critical patent/JP2010211713A/ja
Application granted granted Critical
Publication of JP5636635B2 publication Critical patent/JP5636635B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】データ量が膨大であっても、バックアップ処理と復旧処理とにかかる時間の短縮化を図り得る、バックアップ装置、バックアップシステム、バックアップ方法、及びプログラムを提供する。
【解決手段】コンピュータ(現用サーバ10)に記憶されているデータのバックアップを行うバックアップ装置であって、バックアップ対象となるデータの初期情報とその更新情報とを共に記憶する記憶部26と、圧縮処理部27と、送信部28とを備えている。圧縮処理部27は、初期情報及び更新情報を合わせて圧縮可能な2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出し、各予想サイズに基づいて圧縮方式を選択し、更に、選択された圧縮方式を用いて、初期情報及び更新情報を圧縮する。送信部28は、圧縮された初期情報及び更新情報を、選択された圧縮方式を特定する情報と共に、代替サーバ40に送信する。
【選択図】図1

Description

本発明は、バックアップ装置、特には、短時間に膨大な処理を行うメモリデータベースに対応可能なバックアップ装置、それを用いたバックアップシステム及びバックアップ方法、更には、これらを実現するためのプログラムに関する。
コンピュータシステムにおいて、それを構成するクライアントやサーバに障害が発生しても、直ぐに復旧できるよう、データをバックアップしておくことは重要である。また、バックアップにおいては、頻繁に更新されるデータを常に最新の状態でバックアップすることが特に重要であるため、更新データのバックアップについて種々の技術が開発されている(例えば、特許文献1参照)。
特許文献1は、クライアントにおいて頻繁に更新されるデータをサーバでバックアップする技術を開示している。特許文献1の技術では、クライアントは、元ファイルをサーバに送信し、そして、更新の度に、元ファイルと更新ファイルとの差分圧縮処理を行い、差分圧縮ファイルをサーバに送信する。サーバはこれらのファイルを蓄積する。
復旧時においては、サーバは、蓄積している元ファイルと差分圧縮ファイルとを、復旧対象となるクライアントに送信する。クライアントでは、差分圧縮ファイルが復元され、復旧が行われる。このように、特許文献1に開示の技術によれば、頻繁に更新されるデータを最新の状態でバックアップでき、更に、障害が発生しても、簡単に最新の状態に復旧できる。
また、近年においては、ネットワークの急速な発展に伴い、サーバの利用が増加しており、これに伴い、サーバ自体のバックアップの重要性も高まっている。このため、例えば、サーバがメモリデータベースとして用いられる場合においては、メモリデータベースとして機能する現用サーバとは別に、バックアップ用の退避サーバを設置することが提案されている。
この場合、退避サーバは、特許文献1に開示の技術を利用することにより、バックアップ対象となる現用サーバにおいて頻繁に更新されるデータを、常に最新の状態でバックアップすることができる。また、現用サーバに障害が発生すると、退避サーバから現用サーバへと、バックアップされていた最新の更新データがネットワークを介して転送され、現用サーバの復旧が行われる。
特開2004−94617号公報(第8頁−第9頁)
しかしながら、上記特許文献1に開示の技術を利用してバックアップを行う場合は、差分データ毎に圧縮を行う必要があるため、バックアップ処理の短縮化が難しいという問題がある。よって、特に、メモリデータベースとして用いられるサーバのように、短時間の間に膨大な量のデータを処理する装置に、上記特許文献1に開示の技術を適用した場合は、求められる機能が得られない可能性が極めて高いと考えられる。
また、上記特許文献1に開示の技術では、復旧する際には、差分データ毎に復元化を行う必要があるため、復旧処理の短縮化も難しいという問題がある。よって、上記特許文献1に開示の技術をサーバに適用した場合は、復旧に時間がかかり、結果的に、システム全体の処理が停滞してしまう可能性がある。
本発明の目的は、上記問題を解消し、データ量が膨大であっても、バックアップ処理と復旧処理とにかかる時間の短縮化を図り得る、バックアップ装置、バックアップシステム、バックアップ方法、及びプログラムを提供することにある。
上記目的を達成するため、本発明におけるバックアップ装置は、コンピュータに記憶されているデータのバックアップを行うバックアップ装置であって、
バックアップ対象となるデータの初期情報とその更新情報とを共に記憶する記憶部と、
前記初期情報及び前記更新情報を合わせて圧縮可能な2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出し、算出した各予想サイズに基づいて圧縮方式を選択し、更に、選択された圧縮方式を用いて、前記初期情報及び前記更新情報を圧縮する圧縮処理部と、
圧縮された前記初期情報及び前記更新情報を、前記選択された圧縮方式を特定する情報と共に、外部に送信する送信部と、
を備えていることを特徴とする。
上記目的を達成するため、本発明におけるバックアップシステムは、バックアップ対象となるサーバ装置と、前記サーバ装置に記憶されているデータのバックアップを行うバックアップ装置とを備える、バックアップシステムであって、
前記バックアップ装置は、
バックアップ対象となるデータの初期情報とその更新情報とを共に記憶する記憶部と、
前記初期情報及び前記更新情報を合わせて圧縮可能な2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出し、算出した各予想サイズに基づいて圧縮方式を選択し、更に、選択された圧縮方式を用いて、前記初期情報及び前記更新情報を圧縮する圧縮処理部と、
圧縮された前記初期情報及び前記更新情報を、前記選択された圧縮方式を特定する情報と共に、外部に送信する送信部とを備えている、
ことを特徴とする。
上記目的を達成するため、本発明におけるバックアップ方法は、コンピュータに記憶されているデータのバックアップを行うためのバックアップ方法であって、
(a)バックアップ対象となるデータの初期情報とその更新情報とを共に記憶するステップと、
(b)前記(a)のステップで記憶された前記初期情報及び前記更新情報を合わせて圧縮可能な2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出するステップと、
(c)前記(b)のステップで算出された各予想サイズに基づいて圧縮方式を選択し、選択された圧縮方式を用いて、前記初期情報及び前記更新情報を圧縮するステップと、
(d)前記(c)のステップで圧縮された前記初期情報及び前記更新情報を、前記(c)のステップで選択された圧縮方式を特定する情報と共に送信するステップと、
を有している、ことを特徴とする。
上記目的を達成するため、本発明におけるプログラムは、コンピュータによって、別のコンピュータに記憶されているデータのバックアップを行うためのプログラムであって、
前記コンピュータに、
(a)バックアップ対象となるデータの初期情報とその更新情報とを共に記憶するステップと、
(b)前記(a)のステップで記憶された前記初期情報及び前記更新情報を合わせて圧縮可能な2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出するステップと、
(c)前記(b)のステップで算出された各予想サイズに基づいて圧縮方式を選択し、選択された圧縮方式を用いて、前記初期情報及び前記更新情報を圧縮するステップと、
(d)前記(c)のステップで圧縮された前記初期情報及び前記更新情報を、前記(c)のステップで選択された圧縮方式を特定する情報と共に送信するステップと、
を実行させる、ことを特徴とする。
以上のように、本発明におけるバックアップ装置、バックアップシステム、バックアップ方法、及びプログラムによれば、データ量が膨大であっても、バックアップ処理と復旧処理とにかかる時間の短縮化を図ることが可能となる。
図1は、本発明の実施の形態1におけるバックアップ装置及びバックアップシステムの概略構成を示すブロック図である。 図2は、本発明の実施の形態1におけるバックアップ装置の動作を示すフロー図である。 図3は、本発明の実施の形態1で作成される圧縮データの構造を示す図である。 図4は、本発明の実施の形態1で行われるハフマン符号化圧縮の一例を示す図である。 図5は、本発明の実施の形態2におけるバックアップ装置及びバックアップシステムの概略構成を示すブロック図である。
(実施の形態1)
以下、本発明の実施の形態1における、バックアップ装置、バックアップシステム、バックアップ方法、及びプログラムについて、図1〜図4を参照しながら説明する。最初に、本実施の形態1におけるバックアップ装置及びバックアップシステムの構成について図1を用いて説明する。図1は、本発明の実施の形態1におけるバックアップ装置及びバックアップシステムの概略構成を示すブロック図である。
図1に示すように、バックアップシステム1は、データを更新する現用サーバ10と、バックアップ装置(退避サーバ)20とを備え、この現用サーバ10がバックアップ対象となる。本実施の形態1では、バックアップシステム1は、更に、システム監視サーバ60と、代替サーバ40を備えている。これらは全て、ネットワーク切替装置51を介して接続されている。
また、図1に示すように、バックアップ装置20は、記憶部26と、圧縮処理部27と、送信部28とを備え、これらによって、現用サーバ10に記憶されているデータのバックアップを行っている。記憶部26は、バックアップ対象となるデータの初期情報とその更新情報とを共に記憶する。本実施の形態1では、バックアップ対象となるデータは、後述するように、現用サーバ10に記憶されているデータ、即ち、ドメイン管理情報A13、論理データAa14、及び論理データAb15等である。
圧縮処理部27は、先ず、2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出する。この2以上の圧縮方式は、記憶部26に記憶されている初期情報及び更新情報を合わせて圧縮可能な圧縮方式であり、利用される圧縮方式の候補となる。そして、圧縮処理部27は、算出した各予想サイズに基づいて圧縮方式を選択する。また、圧縮処理部27は、選択された圧縮方式を用いて、初期情報及び更新情報を圧縮する。
送信部28は、圧縮された初期情報及び更新情報を、選択された圧縮方式を特定する情報(以下、「圧縮情報」という。)と共に、外部に送信する。本実施の形態1では、初期情報、更新情報、及び圧縮情報は、後述するように、現用サーバ10に障害が発生した場合は、代替サーバ40に送信される。送信後、代替サーバ40は、障害が発生する前の現用サーバ10と同様に機能する。
このように、本実施の形態1では、バックアップされるデータ、特に、初期情報からの差分である更新情報は、上記特許文献1に開示の例と異なり、バックアップの度に圧縮されず、まとめてバックアップ装置20によって圧縮される。また、このとき、バックアップデータに合わせて、最も効率の良い圧縮方式が用いられる。更に、バックアップデータの復元は、バックアップデータが展開されるコンピュータ上でまとめて行なわれる。よって、本実施の形態1によれば、データ量が膨大であっても、バックアップ処理と復旧処理とにかかる時間の短縮化を図ることが可能となる。
ここで、本実施の形態1におけるバックアップ装置20及びバックアップシステムの構成について更に具体的に説明する。図1に示すように、本実施の形態1では、現用サーバ10は、RDB(Relation Data Base)であって、メモリをメインの記憶装置に用いるメモリデータベースである。
現用サーバ10は、ドメイン管理部Aと、記憶部16とを備えている。記憶部16は、データベースを構築するメモリであり、その記憶領域には、メモリドメインAが構築されている。なお、図1の例では、メモリドメインAのみが図示されているが、実際には、多数のメモリドメインが構築されている。
メモリドメインA12の中には、RDBでいうところの「表」に相当する論理データAa14及び論理データAb15と、各論理データを管理するデータであるドメイン管理情報A13とが存在している。論理データAa14及び論理データAb15とは、現用サーバ10で実行されるアプリケーションプログラム(図示せず)によって随時更新されている。また、論理データAa14及び論理データAb15それぞれの更新情報は、更新が確定する度に、ネットワーク切替装置51を介して、バックアップ装置20に送信される。
また、ドメイン管理情報A13のサイズは、論理データAa14及び論理データAb15等の論理データに比べると、通常、充分に小さくなる。なお、図1においては、簡略化のため、2つの論理データのみが図示されているが、論理データの数はこれに限定されるものではない。
ドメイン管理部A11は、メモリドメインA12といったメモリドメインの内容や、現用サーバ10内で行われる処理を管理している。実際は、ドメイン管理部A11は、現用サーバ10にインストールされたプログラムによって実現されている。
また、図1に示すように、本実施の形態1では、バックアップ装置20は、退避サーバであり、現用サーバ10と同様の構成を備えている。即ち、バックアップ装置20は、ドメインA11と同様の機能を有するドメイン管理部A´21を備えている。ドメイン管理
部A´21は、ドメイン管理部A11と同様に、メモリドメインA´22といったメモリドメインの内容や、バックアップ装置内の処理を管理しており、後述するようにプログラムによって実現されている。
また、バックアップ装置20の記憶部26の記憶領域には、メモリドメインA12の複製であるメモリドメインA´22が構築されている。具体的には、バックアップ装置20の記憶部26における記憶領域には、メモリドメインA´22が存在し、その中には、論理データAa´24及び論理データAb´25と、各論理データを管理するデータであるドメイン管理情報A´23とが存在している。
論理データAa´24及び論理データAb´25は、それぞれ、論理データAa14、論理データAb15の複製である。また、現用サーバ10から、各データの更新情報が送信されるため、論理データAa´24と論理データAa14との間、論理データAb´25と論理データAb15との間では、内容が同期される。また、ドメイン管理情報A´23は、ドメイン管理情報A13の複製であり、そのサイズは、論理データAa´24及び論理データAb´25等の論理データに比べると、通常、充分に小さくなる。
そして、バックアップ装置20は、現用サーバ10と同様の構成を備えているが、次の点で異なっている。即ち、バックアップ装置20では、ドメイン管理部A´21は、上述した圧縮処理部27を備えている。更に、記憶部26には、選択された各圧縮方式の圧縮辞書と、それぞれを用いて圧縮した場合の予想サイズとが記憶される。
図1の例では、記憶部26には、圧縮辞書(a)30と、圧縮辞書(a)30に対応する転送(圧縮)時の予想サイズ(a)31と、圧縮辞書(b)32と、圧縮辞書(b)32に対応する転送(圧縮)時の予想サイズ(b)33とが記憶される。なお、図1では、簡略化のため、圧縮辞書と予想サイズとは2組しか図示されていないが、本実施の形態は、これに限定されるものではない。
また、本実施の形態では、圧縮処理部27は、メモリドメインA´22に格納される初期情報を確認すると、その後、メモリドメインA12からメモリドメインA´22に向かって転送される更新情報を継続的に監視する。なお、上述したように、ドメイン管理情報A´23のサイズは、論理データのそれに比べて小さくなっている。よって、圧縮管理部27は、メモリドメインA´22において、初期情報と更新情報とを確認するだけで、メモリドメインA´22におけるドメイン管理情報A´23以外の内容、即ち大部分の情報を把握することができる。
更に、圧縮処理部27は、監視によって得られた情報を用いて、圧縮方式毎に、圧縮のシミュレーションを実行し、それによって予想サイズを算出し、そして圧縮方式を選択する。上述の圧縮辞書(a)30及び圧縮辞書(b)32は、この圧縮シミュレーションに用いられる。また、予想サイズ(a)31及び予想サイズ(b)33は、圧縮シミュレーションによって算出されるので、これらの記憶は、圧縮シミュレーションの後に行われる。そして、圧縮処理部27によって選択された圧縮方式の圧縮辞書が、圧縮情報として、後述するように代替サーバ40に転送される。なお、圧縮シミュレーションで行われる具体的な処理については、図2〜図4を用いて後述する。
また、システム監視サーバ60は、サーバ監視部61を備えている。サーバ監視部61は、現用サーバ10の動作状況を監視し、障害が発生した場合にこれを検知する。そして、サーバ監視部61は、現用サーバ10に障害が発生したことを検知すると、バックアップ装置20に対して、メモリドメインに記憶されているデータを代替サーバ40に送信するよう指示を行う。
代替サーバ40は、現用サーバ10に障害が発生した場合の代替となるサーバであり、障害が発生していない場合は待機状態にある。代替サーバ40は、ドメイン管理部S41と、記憶部46とを備えている。ドメイン管理部S41は、ドメインA11と同様の機能を有しており、プログラムによって実現されている。
また、記憶部46には、メモリドメインS42が構築されており、その中に、バックアップ装置20のメモリドメインに格納されているデータが書き込まれる。更に、記憶部46には、圧縮辞書Sが記憶される。圧縮辞書Sとしては、バックアップ装置20が選出した圧縮方式の圧縮辞書が格納される。なお、圧縮辞書Sの構築は、代替サーバ40が現用サーバを代替えする際、即ち、バックアップ装置20から、選出された圧縮辞書が転送されたときに行われる。
設定ファイル50は、現用サーバ10、バックアップ装置20、及び代替サーバ30の全てと接続されているデータベース(図示せず)に格納されているファイルである。設定ファイル50は、ドメイン管理部A11、ドメイン管理部A´21、ドメイン管理部S41、サーバ監視部61の動作を規定している。本実施の形態では、設定ファイル50は、例えば、候補となる圧縮方式を規定している。
次に、図1に示したバックアップ装置20及びバックアップシステム1の動作について図2〜図4を用いて説明する。図2は、本発明の実施の形態1におけるバックアップ装置の動作を示すフロー図である。図3は、本発明の実施の形態1で行われるハフマン符号化圧縮の一例を示す図である。図4は、本発明の実施の形態1で作成される圧縮データの構造を示す図である。
なお、本実施の形態1におけるバックアップ方法は、バックアップ装置20を動作させることによって実行することができる。よって、本実施の形態1におけるバックアップ方法の説明は、以下のバックアップ装置20の説明に代える。また、以下の説明においては、適宜図1を参酌する。
図2に示すように、先ず、バックアップ装置20において、ドメイン管理部A´21は、記憶部26に、現用サーバ10から送信された、各論理データの初期情報及び更新情報を記憶させる(ステップS1)。なお、ステップS1において、既に初期情報が記憶されている場合は、記憶部26は、更新情報のみを記憶する。
次に、圧縮処理部27は、初期情報及び更新情報を合わせて圧縮可能な2以上の圧縮方式について、圧縮シミュレーションを実行し(ステップS2及びS3)、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出する(ステップS4)。
ここで、ステップS2以降について具体的に説明する前に、本実施の形態1における圧縮方式について説明する。本実施の形態1では、ハフマン符号化圧縮が採用されている。図3は、データを圧縮(符号化)する際の区切りを4バイトに指定した場合の、ハフマン符号化圧縮の例を示している。図3に示すハフマン符号化圧縮では、4バイトの出現データそれぞれについて出現回数がカウントされ、最も出現頻度が高いデータに最も短い符号(ビット数)が割り当てられ、効率の高い圧縮が可能となる。
但し、出現データを何バイト単位で符号化したときに、最も圧縮効率が高くなるかは、圧縮元のデータ次第であり、最適な単位の予測は困難である。このため、本実施の形態1では、圧縮単位の大きさを変えて、圧縮シミュレーションが行われる。各圧縮方式は、圧縮の単位の大きさが異なるハフマン符号化圧縮である。本実施の形態においては、図1に
示した設定ファイル50に、予め、データを圧縮(符号化)する際の単位となるサイズ(圧縮単位のサイズ)が、複数指定されている。圧縮処理部27は、指定されている各圧縮単位で圧縮シミュレーションを実行する。
また、図4に示すように、一般に、圧縮データ200は、圧縮辞書201と、圧縮後のデータである圧縮内容202とで構成される。本実施の形態における圧縮シミュレーションでは、このうち圧縮辞書201を、指定された圧縮単位毎に作成する。なお、図1の例では、指定された圧縮単位は2種類のみであるが、本実施の形態1では、指定された圧縮単位の数は限定されるものではない。
ステップS2において、圧縮処理部27は、メモリドメインA´22の初期の情報と、メモリドメインA12からメモリドメインA´22に向かって転送される更新情報を監視し、初期情報及び更新情報それぞれから出現データ毎の出現回数を計測する。このとき、圧縮処理部27は、設定ファイル50に指定されたサイズを単位として、サイズ毎に、出現回数をカウントする。
次に、ステップS3において、圧縮処理部27は、ステップS2で得られた出現回数に基づいて、各出現データに符号を割り当てて符号化を行い、圧縮方式毎(圧縮単位毎)に圧縮辞書を作成する。この結果、図1に示したように、圧縮辞書(a)30及び圧縮辞書(b)32が作成される。これらの圧縮辞書は、実際には、図3に示された情報を含んでいる。
次に、ステップS4において、圧縮処理部27は、ステップS3で得られた各圧縮辞書を用いて、圧縮方式毎に、各圧縮単位でメモリドメインA´全体を圧縮した場合の予想サイズを算出する。本実施の形態では、図1に示したように、圧縮辞書(a)30による予想サイズ(a)31と、圧縮辞書(b)32による予想サイズ(b)33とが算出され、これらは記憶部26の記憶領域に記録される。
ステップS4が実行された後は、ドメイン管理部A´21によって、システム監視サーバ60からの指示が行われたかどうかの判定が行われる(ステップS5)。具体的には、現用サーバ10に障害が発生した場合は、代替サーバ40に現用サーバ10を代替させるため、サーバ監視部61は、バックアップ装置20に対して指示が行われるので、ドメイン管理部A´21は指示の有無を判定する。なお、この場合の指示は、メモリドメインA´22の内容のメモリドメインS42への転送命令である。
ステップS5での判定の結果、指示が行われていない場合は、ドメイン管理部A´21は、更に、新たな更新情報が記憶されているかどうかを判定し(ステップS6)、新たな更新情報が記憶されている場合は、再度ステップS2以降を実行する。一方、新たな更新情報が記憶されていない場合は、ドメイン管理部A´は待機状態となる。
また、ステップS5での判定の結果、指示が行われている場合は、ドメイン管理部A´21は、メモリドメインA´22とメモリドメインS42との間のデータ転送量を抑制するため、ステップS4で算出された予想サイズを比較し、圧縮方式を選択する(ステップS7)。具体的には、ドメイン管理部A´21は、予想サイズ(a)31と予想サイズ(b)33とを比較し、値が小さい方の圧縮方式(圧縮辞書)を選択する。仮に「予想サイズ(a)>予想サイズ(b)」であった場合は、ドメイン管理部A´21は、圧縮辞書(b)32を選択する。
次に、ドメイン管理部A´21は、送信部28を介して、ドメイン管理部S41に対し、選択した圧縮辞書(例えば、圧縮辞書(b)32)を転送する(ステップS8)。これ
により、ドメイン管理部S41は、圧縮辞書(b)32の内容を、圧縮辞書S43として記憶部46の記憶領域に格納する。
次に、ドメイン管理部A´21は、メモリドメインA´22の内容を、選択された圧縮辞書に基づいて符号化して、得られた圧縮データを、送信部28によって、ネットワーク経由で、ドメイン管理部S41へと転送する(ステップS9)。ステップS9により、バックアップ装置20における処理は終了する。
また、ステップS9の終了後、代替サーバ46では、ドメイン管理部S41は、受信したデータを圧縮辞書S43に基づいて復号化し、メモリドメインS42上に展開する。そして、サーバ監視部61は、代替サーバ40が現用サーバ10の代替となったことを認識すると、代替サーバ40に、現用サーバ10で実行されていた処理を再開させる。以上により、バックアップシステム1としての復旧処理が完了する。
また、本実施の形態におけるプログラムは、コンピュータに、図2に示すステップS1〜S9を具現化させるプログラムであれば良い。このプログラムをコンピュータにインストールして実行すれば、バックアップ装置20を実現することができる。この場合、コンピュータのCPU(central processing unit)は、ドメイン管理部A´21(又は圧縮処理部27)として機能し、処理を行なう。更に、コンピュータに備えられたメモリは、記憶部26として機能し、メモリドメインA´22、圧縮辞書(a)30、予想サイズ(a)31、圧縮辞書(b)32、及び予想サイズ(b)33を記憶する。
以上、本実施の形態1によれば、データ量が膨大であっても、バックアップ処理と復旧処理とにかかる時間の短縮化を図ることが可能となる。また、本実施の形態1では、圧縮処理の一部である圧縮シミュレーションが、転送指示が行われる前に前もって行われているため、システム全体としての復旧時間の短縮化が図られている。更に、複数の圧縮方式から、最も効率的な圧縮方式を選択できるため、この点からも、復旧時間の短縮化が図られる。
(実施の形態2)
次に本発明の実施の形態2におけるバックアップ装置、バックアップシステム、バックアップ方法、及びプログラムについて、図5を参照しながら説明する。図5は、本発明の実施の形態2におけるバックアップ装置及びバックアップシステムの概略構成を示すブロック図である。
図5に示すように、本実施の形態2におけるバックアップシステム2においては、実施の形態1におけるバックアップシステム1と異なり、設定ファイル50は、候補となる2以上の圧縮方式として、圧縮アルゴリズムが互いに異なる圧縮方式を規定している。このため、バックアップ装置20において、圧縮処理部27は、圧縮シミュレーションとして、規定されている圧縮アルゴリズム毎に、対応する圧縮辞書を生成する。
具体的には、本実施の形態2では、設定ファイル50は、三種類の圧縮方式を規定している。よって、図5に示すように、圧縮処理部27は、圧縮辞書(a)130、圧縮辞書(b)132、及び圧縮辞書(c)134を作成し、これらを用いて、予想サイズ(a)131、予想サイズ(b)133、及び予想サイズ(c)135の三種類の予想サイズを算出する。そして、圧縮処理部27は、これらを全て、記憶部26の記憶領域に記録する。
なお、本実施の形態2において、予想サイズの算出は、メモリドメインA´22の圧縮を行うことなく、実行されている。また、圧縮辞書(a)131、圧縮辞書(b)133
、圧縮辞書(c)135には、圧縮アルゴリズムを特定するための情報が含まれている。
また、本実施の形態2においても、メモリドメインA´22の圧縮は、メモリドメインA´22とメモリドメインS42との間のデータ転送量を抑制するため、予想サイズが最も小さい圧縮辞書を用いて行われる。仮に「予想サイズ(a)131>予想サイズ(c)135>予想サイズ(b)133」であった場合は、予想サイズ(b)133に対応する圧縮辞書(b)132が選択される。
更に、本実施の形態でも、ドメイン管理部A´22は、送信部28を介して、ドメイン管理部Sに、選択された圧縮辞書を転送する。ドメイン管理部S41は、選択された圧縮辞書の内容を圧縮辞書Sとして記憶部46の記憶領域に格納する。
このように、本実施の形態2は、候補となる圧縮方式の種類や数が異なる以外は、実施の形態1と同様である。よって、本実施の形態2においても、実施の形態1と同様の効果を得ることができる。また、本実施の形態2において、利用可能な圧縮アルゴリズムは特に限定されるものではなく、圧縮対象となるデータの内容や種類に応じて、適切な圧縮アルゴリズムを用いることができる。
以上のように、本発明は、サーバ装置に代表されるコンピュータにおけるデータのバックアップ及び復旧に利用可能である。本発明は、産業上の利用可能性を有している。
1 バックアップシステム(実施の形態1)
2 バックアップシステム(実施の形態2)
10 現用サーバ
11 ドメイン管理部A
12 メモリドメインA
13 ドメイン管理情報
14 論理データAa
15 論理データAb
16 記憶部
20 バックアップ装置(退避サーバ)
21 ドメイン管理部A´
22 メモリドメインA´
23 ドメイン管理情報
24 論理データAa´
25 論理データAb´
26 記憶部
27 圧縮処理部
28 送信部
30 圧縮辞書(a)
31 予想サイズ(a)
32 圧縮辞書(b)
33 予想サイズ(b)
40 代替えサーバ
41 ドメイン管理部S
42 メモリドメインS
43 圧縮辞書S
50 設定ファイル
51 ネットワーク切替装置
60 システム監視サーバ
61 サーバ監視部
130 圧縮辞書(a)
131 予想サイズ(a)
132 圧縮辞書(b)
133 予想サイズ(b)
134 圧縮辞書(c)
135 予想サイズ(c)

Claims (21)

  1. コンピュータに記憶されているデータのバックアップを行うバックアップ装置であって、
    バックアップ対象となるデータの初期情報とその更新情報とを共に記憶する記憶部と、
    前記初期情報及び前記更新情報を合わせて圧縮可能な2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出し、算出した各予想サイズに基づいて圧縮方式を選択し、更に、選択された圧縮方式を用いて、前記初期情報及び前記更新情報を圧縮する圧縮処理部と、
    圧縮された前記初期情報及び前記更新情報を、前記選択された圧縮方式を特定する情報と共に、外部に送信する送信部と、
    を備えていることを特徴とするバックアップ装置。
  2. 前記圧縮処理部が、前記記憶部に記憶される前記初期情報と前記更新情報とを監視しながら、前記圧縮方式毎に、圧縮のシミュレーションを実行し、それによって前記予想サイズを算出する、請求項1に記載のバックアップ装置。
  3. 前記2以上の圧縮方式それぞれが、圧縮単位の大きさが互いに異なる圧縮方式であり、
    前記圧縮処理部が、前記圧縮のシミュレーションとして、前記初期情報及び前記更新情報に対して、圧縮単位を変えながら複数回の符号化を行って、前記圧縮方式毎の圧縮辞書を生成し、
    前記送信部が、前記選択された圧縮方式を特定する情報として、前記選択された圧縮方式に対応する圧縮辞書を送信する、
    請求項2に記載のバックアップ装置。
  4. 前記2以上の圧縮方式それぞれが、圧縮アルゴリズムが互いに異なる圧縮方式であり、
    前記圧縮処理部が、前記圧縮のシミュレーションとして、各圧縮アルゴリズムに対応する圧縮辞書を生成し、
    前記送信部が、前記選択された圧縮方式を特定する情報として、前記選択された圧縮方式に対応する圧縮辞書を送信する、
    請求項2に記載のバックアップ装置。
  5. 外部から前記初期情報及び前記更新情報の送信が指示された場合に、前記圧縮処理部が、前記圧縮方式の選択及び前記選択された圧縮方式による圧縮を実行する、請求項1〜4のいずれかに記載のバックアップ装置。
  6. バックアップ対象となるサーバ装置と、前記サーバ装置に記憶されているデータのバックアップを行うバックアップ装置とを備える、バックアップシステムであって、
    前記バックアップ装置は、
    バックアップ対象となるデータの初期情報とその更新情報とを共に記憶する記憶部と、
    前記初期情報及び前記更新情報を合わせて圧縮可能な2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出し、算出した各予想サイズに基づいて圧縮方式を選択し、更に、選択された圧縮方式を用いて、前記初期情報及び前記更新情報を圧縮する圧縮処理部と、
    圧縮された前記初期情報及び前記更新情報を、前記選択された圧縮方式を特定する情報と共に、外部に送信する送信部とを備えている、
    ことを特徴とするバックアップシステム。
  7. 前記サーバ装置の代替となる代替サーバ装置と、前記サーバ装置の状態を監視する監視装置とを更に備え、
    前記監視措置は、前記サーバ装置に障害が発生したと判断すると、前記バックアップ装置の前記送信部に対して、圧縮された前記初期情報、前記更新情報、及び前記選択された圧縮方式を特定する情報を、前記代替サーバ装置へと送信させる、請求項6に記載のバックアップシステム。
  8. 前記圧縮処理部が、前記記憶部に記憶される前記初期情報と前記更新情報とを監視しながら、前記圧縮方式毎に、圧縮のシミュレーションを実行し、それによって前記予想サイズを算出する、請求項7に記載のバックアップシステム。
  9. 前記2以上の圧縮方式それぞれが、圧縮単位の大きさが互いに異なる圧縮方式であり、
    前記圧縮処理部が、前記圧縮のシミュレーションとして、前記初期情報及び前記更新情報に対して、圧縮単位を変えながら複数回の符号化を行って、前記圧縮方式毎の圧縮辞書を生成し、
    前記送信部が、前記選択された圧縮方式を特定する情報として、前記選択された圧縮方式に対応する圧縮辞書を送信する、
    請求項8に記載のバックアップシステム。
  10. 前記2以上の圧縮方式それぞれが、圧縮アルゴリズムが互いに異なる圧縮方式であり、
    前記圧縮処理部が、前記圧縮のシミュレーションとして、各圧縮アルゴリズムに対応する圧縮辞書を生成し、
    前記送信部が、前記選択された圧縮方式を特定する情報として、前記選択された圧縮方式に対応する圧縮辞書を送信する、
    請求項8に記載のバックアップシステム。
  11. 前記監視措置が、前記バックアップ装置の前記送信部に対して、圧縮された前記初期情報、前記更新情報、及び前記選択された圧縮方式を特定する情報の送信を指示した場合に、
    前記圧縮処理部が、前記圧縮方式の選択及び前記選択された圧縮方式による圧縮を実行する、請求項8〜10のいずれかに記載のバックアップシステム。
  12. コンピュータに記憶されているデータのバックアップを行うためのバックアップ方法であって、
    (a)バックアップ対象となるデータの初期情報とその更新情報とを共に記憶するステップと、
    (b)前記(a)のステップで記憶された前記初期情報及び前記更新情報を合わせて圧縮可能な2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出するステップと、
    (c)前記(b)のステップで算出された各予想サイズに基づいて圧縮方式を選択し、選択された圧縮方式を用いて、前記初期情報及び前記更新情報を圧縮するステップと、
    (d)前記(c)のステップで圧縮された前記初期情報及び前記更新情報を、前記(c)のステップで選択された圧縮方式を特定する情報と共に送信するステップと、
    を有している、ことを特徴とするバックアップ方法。
  13. 前記(b)のステップで、前記初期情報と前記更新情報とを監視しながら、前記圧縮方式毎に、圧縮のシミュレーションを実行し、それによって前記予想サイズを算出する、請求項12に記載のバックアップ方法。
  14. 前記2以上の圧縮方式それぞれが、圧縮単位の大きさが互いに異なる圧縮方式であり、
    前記(b)のステップで、前記圧縮のシミュレーションとして、前記初期情報及び前記更新情報に対して、圧縮単位を変えながら複数回の符号化を行って、前記圧縮方式毎の圧
    縮辞書を生成し、
    前記(d)のステップで、前記決定された圧縮方式を特定する情報として、前記選択された圧縮方式に対応する圧縮辞書を送信する、
    請求項13に記載のバックアップ方法。
  15. 前記2以上の圧縮方式それぞれが、圧縮アルゴリズムが互いに異なる圧縮方式であり、
    前記(b)のステップで、前記圧縮のシミュレーションとして、各圧縮アルゴリズムに対応する圧縮辞書を生成し、
    前記(d)のステップで、前記決定された圧縮方式を特定する情報として、前記選択された圧縮方式に対応する圧縮辞書を送信する、
    請求項13に記載のバックアップ方法。
  16. 外部から前記初期情報及び前記更新情報の送信が指示された場合に、前記(c)のステップが実行される、請求項12〜15のいずれかに記載のバックアップ方法。
  17. コンピュータによって、別のコンピュータに記憶されているデータのバックアップを行うためのプログラムであって、
    前記コンピュータに、
    (a)バックアップ対象となるデータの初期情報とその更新情報とを共に記憶するステップと、
    (b)前記(a)のステップで記憶された前記初期情報及び前記更新情報を合わせて圧縮可能な2以上の圧縮方式について、各圧縮方式によって圧縮したときの圧縮データの予想サイズを算出するステップと、
    (c)前記(b)のステップで算出された各予想サイズに基づいて圧縮方式を選択し、選択された圧縮方式を用いて、前記初期情報及び前記更新情報を圧縮するステップと、
    (d)前記(c)のステップで圧縮された前記初期情報及び前記更新情報を、前記(c)のステップで選択された圧縮方式を特定する情報と共に送信するステップと、
    を実行させる、ことを特徴とするプログラム。
  18. 前記(b)のステップで、前記初期情報と前記更新情報とを監視しながら、前記圧縮方式毎に、圧縮のシミュレーションを実行し、それによって前記予想サイズを算出する、請求項17に記載のプログラム。
  19. 前記2以上の圧縮方式それぞれが、圧縮単位の大きさが互いに異なる圧縮方式であり、
    前記(b)のステップで、前記圧縮のシミュレーションとして、前記初期情報及び前記更新情報に対して、圧縮単位を変えながら複数回の符号化を行って、前記圧縮方式毎の圧縮辞書を生成し、
    前記(d)のステップで、前記決定された圧縮方式を特定する情報として、前記選択された圧縮方式に対応する圧縮辞書を送信する、
    請求項18に記載のプログラム。
  20. 前記2以上の圧縮方式それぞれが、圧縮アルゴリズムが互いに異なる圧縮方式であり、
    前記(b)のステップで、前記圧縮のシミュレーションとして、各圧縮アルゴリズムに対応する圧縮辞書を生成し、
    前記(d)のステップで、前記決定された圧縮方式を特定する情報として、前記選択された圧縮方式に対応する圧縮辞書を送信する、
    請求項18に記載のプログラム。
  21. 外部から前記初期情報及び前記更新情報の送信が指示された場合に、前記(c)のステップを前記コンピュータに実行させる、請求項17〜20のいずれかに記載のプログラム
JP2009059587A 2009-03-12 2009-03-12 バックアップ装置、バックアップシステム、バックアップ方法、及びプログラム Expired - Fee Related JP5636635B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009059587A JP5636635B2 (ja) 2009-03-12 2009-03-12 バックアップ装置、バックアップシステム、バックアップ方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009059587A JP5636635B2 (ja) 2009-03-12 2009-03-12 バックアップ装置、バックアップシステム、バックアップ方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2010211713A true JP2010211713A (ja) 2010-09-24
JP5636635B2 JP5636635B2 (ja) 2014-12-10

Family

ID=42971764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009059587A Expired - Fee Related JP5636635B2 (ja) 2009-03-12 2009-03-12 バックアップ装置、バックアップシステム、バックアップ方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5636635B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013544403A (ja) * 2010-11-18 2013-12-12 コーニンクレッカ フィリップス エヌ ヴェ ドメインを維持する方法及びデバイス

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08191427A (ja) * 1995-01-09 1996-07-23 Hitachi Ltd 情報記録再生装置
JP2004171529A (ja) * 2002-11-06 2004-06-17 Tkc Corp データバックアップシステムおよびデータバックアップ方法
JP2007066007A (ja) * 2005-08-31 2007-03-15 Mitsubishi Electric Corp データ生成装置及びデータ生成方法及びデータ生成プログラム
WO2007118243A2 (en) * 2006-04-07 2007-10-18 Data Storage Group Data compression and storage techniques
JP2008035230A (ja) * 2006-07-28 2008-02-14 Fujifilm Corp データ圧縮装置およびデータ圧縮プログラム
JP2008521293A (ja) * 2004-11-15 2008-06-19 スミス マイクロ ソフトウエア,インコーポレイテッド 既圧縮ファイルのロスレス圧縮システムおよび方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08191427A (ja) * 1995-01-09 1996-07-23 Hitachi Ltd 情報記録再生装置
JP2004171529A (ja) * 2002-11-06 2004-06-17 Tkc Corp データバックアップシステムおよびデータバックアップ方法
JP2008521293A (ja) * 2004-11-15 2008-06-19 スミス マイクロ ソフトウエア,インコーポレイテッド 既圧縮ファイルのロスレス圧縮システムおよび方法
JP2007066007A (ja) * 2005-08-31 2007-03-15 Mitsubishi Electric Corp データ生成装置及びデータ生成方法及びデータ生成プログラム
WO2007118243A2 (en) * 2006-04-07 2007-10-18 Data Storage Group Data compression and storage techniques
JP2008035230A (ja) * 2006-07-28 2008-02-14 Fujifilm Corp データ圧縮装置およびデータ圧縮プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013544403A (ja) * 2010-11-18 2013-12-12 コーニンクレッカ フィリップス エヌ ヴェ ドメインを維持する方法及びデバイス

Also Published As

Publication number Publication date
JP5636635B2 (ja) 2014-12-10

Similar Documents

Publication Publication Date Title
US9430546B2 (en) Systems and methods for managing delta version chains
CN107003890B (zh) 高效地提供虚拟机参考点
JP4263477B2 (ja) 共通デジタルシーケンスを識別するシステム
JP5819416B2 (ja) データ記憶とデータ送信の最適化
US20130144840A1 (en) Optimizing restores of deduplicated data
US8438130B2 (en) Method and system for replicating data
US8806062B1 (en) Adaptive compression using a sampling based heuristic
CN105075222A (zh) 采用动态压缩的数据复制
CN105635252B (zh) 一种Hadoop分布式文件系统HDFS纠删码冗余备份方法
US9824131B2 (en) Regulating a replication operation
US11455100B2 (en) Handling data slice revisions in a dispersed storage network
TWI663515B (zh) 用於物聯網設備於資料中心備份的分散式重複資料刪除儲存系統及其達成分散式重複資料刪除方法
CN107340971A (zh) 一种数据存储与恢复架构与方法
JP2011175421A (ja) ストレージシステム
CN106055430A (zh) 云台摄像头的系统备份更新方法及装置
CN111414277B (zh) 数据恢复方法、装置、电子设备和介质
JP5636635B2 (ja) バックアップ装置、バックアップシステム、バックアップ方法、及びプログラム
CN112416878A (zh) 一种基于云平台的文件同步管理方法
US20180246666A1 (en) Methods for performing data deduplication on data blocks at granularity level and devices thereof
EP3659042A1 (en) Apparatus and method for deduplicating data
KR101909500B1 (ko) 로그 데이터 관리 디바이스 및 로그 관리 시스템
CN112988461B (zh) 数据备份方法、边缘节点、数据中心及计算机存储介质
US9940378B1 (en) Optimizing replication of similar backup datasets
US20140317411A1 (en) Deduplication of data
JP2009064149A (ja) 電力系統分散監視制御システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140625

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140822

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141007

LAPS Cancellation because of no payment of annual fees