JP2009080788A - データ重複除外を用いた電力効率的なデータ記憶 - Google Patents

データ重複除外を用いた電力効率的なデータ記憶 Download PDF

Info

Publication number
JP2009080788A
JP2009080788A JP2008144338A JP2008144338A JP2009080788A JP 2009080788 A JP2009080788 A JP 2009080788A JP 2008144338 A JP2008144338 A JP 2008144338A JP 2008144338 A JP2008144338 A JP 2008144338A JP 2009080788 A JP2009080788 A JP 2009080788A
Authority
JP
Japan
Prior art keywords
data
volume
content
stored
storage media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008144338A
Other languages
English (en)
Other versions
JP5121581B2 (ja
Inventor
Atsushi Murase
敦史 村瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2009080788A publication Critical patent/JP2009080788A/ja
Application granted granted Critical
Publication of JP5121581B2 publication Critical patent/JP5121581B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/325Power saving in peripheral device
    • G06F1/3268Power saving in hard disk drive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1453Management of the data involved in backup or backup restore using de-duplication of the data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0625Power saving in storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0634Configuration or reconfiguration of storage systems by changing the state or mode of one or more devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • G06F3/0641De-duplication techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

【課題】電力を節約しながらデータの重複除外が可能になる記憶システムを提供する。
【解決手段】記憶システムは、第1のボリュームと、第1のボリューム上に記憶されたデータの第1の領域に対応するハッシュ値の第1の表と、データの領域が第1のボリューム上に記憶された場所の論理ブロックアドレス表とを含む第一の重複除外範囲と、第2のボリュームに関して類似した情報を含む第2の重複除外範囲とを含む。第1のボリュームを作り上げる第1の記憶媒体は電源がオフの状態であっても、第2のボリューム上に第2のデータの重複除外および記憶が発生し、第2のボリュームを作り上げる第2の記憶媒体は電源がオフの状態であっても、第1のデータの重複除外および記憶が発生し、それによって、電力を節約しながらデータの重複除外が可能になる。
【選択図】図2

Description

[0002] 本発明は、一般に、情報システムおよび記憶システムに関する。
[0004] いくつかの要因は、データセンターならびにその他の情報処理・記憶装置(information processing and storage facilities)の操作コストを著しく増加している。これらの要因は、記憶されているデータ量の途方もなく大きな増加と、エネルギー価格の上昇と、より多くの電気を消費して、より大きな冷却容量を要求するコンピュータおよび記憶システムとを含む。現在の傾向が続く場合、多くのデータセンターは、機器の増大する密度と、データセンターの規模の急成長とにより、それらのニーズを満たすのに不十分な電力容量を間もなく有する可能性がある。したがって、電力効率を達成することは、今日のデータセンターおよびその他の情報処理・記憶装置において非常に重要な課題である。関連技術は、参照によりその開示全体が本明細書に組み込まれている、2003年6月26に出願した、Guha他に対する「Method and Apparatus for Power−Efficient High−Capacity Scalable Storage System」と題された、米国特許第7035972号を含む。
[0005] また、記憶されているデータ量の途方もなく大きな増加に対処するためのソリューションは、この非常に大きなデータ量を削減するための技術を含む。1つのかかる技術は、特定の記憶環境内に記憶された大量のデータは、やはり同じ記憶環境内に記憶された冗長的な部分をすでに有することを前提とする、データ重複除外(de−duplication)である。データ書込みプロセスの間、一般的な重複除外機能は、データストリームをデータのより小さな領域に分解して、データの各領域のコンテンツを記憶環境内に予め記憶された領域と比較する。データの同じ領域が記憶システム内にすでに記憶されている場合、記憶システムは、同じコンテンツを有する新しいデータ領域を記憶するのではなく、すでに記憶されたデータ領域に単に新しいリンクを作成する。関連技術は、参照によりその開示全体が本明細書に組み込まれており、重複除外機能を用いたデータ記憶のための一般的な方法を教示する、2005年5月24日に出願した、Zhu他に対する、「Efficient Data Storage System」と題された、米国特許公開第2005/0216669号を含む。
[0006] その結果、記憶環境内でのデータ重複除外の使用は、記憶環境内に記憶されたデータの全体的なサイズを削減し、この技術は、VTL(仮想テープライブラリ(Virtual Tape Library))システムおよびデータバックアップを実行するためのその他のシステムを含めて、多くの記憶システム内に取り入れられている。VTLシステムに関する先行技術は、参照によりその開示全体が本明細書に組み込まれており、VTLシステム、すなわち、テープバックアップをエミュレートするためにディスクドライブを使用する仮想テープバックアップシステムに関する、「Tape Drive Emulation System for a Disk Drive」と題された、Plotkin他に対する、米国特許第5297124号を含む。VTLまたはその他のデータバックアップシステムを使用することで、様々なアプリケーション、部、ソースなどからバックアップのためのすべてのデータを、単一点管理(single−point management)も同様に可能にする単一のデータバックアップ記憶ソリューション内に統合することが可能である。しかし、重複除外技術は、新しい着信データ領域を記憶システムのボリュームで予め記憶されたデータ領域と引き続き比較するため、これらのボリュームは常に電源がオンにされる必要がある。これは、予め記憶された領域のいずれかが新しい着信領域と比較される必要があり、記憶されたデータの特定部分が任意の一定期間にわたって比較するために必要にならないという保証は存在しないからである。この状況は、記憶されたデータの全体的な量を削減するものの、他には、記憶システムによって消費される電力量の削減にはほとんど役立たない。したがって、やはりバックアップされているデータの重複除外も実行しながら、データバックアップを実行するためのより電力効率的な方法の必要性が存在する。
[0007] 本発明の実施形態は、要求される記憶容量の全体的な量を削減するためにシステム上で重複除外機能も利用しながら、ディスク電源装置を制御することによってデータバックアップシステムの電源消費を削減する。これにより、本発明は、重複除外機能を実行することによって記憶システムにより効率的にデータを記憶させると同時に、電力を節約するため、本発明は先行技術では利用可能でなかった利点を提供する。本発明のこれらのおよびその他の特徴と利点とは、以下の好ましい実施形態の詳細な説明を鑑みて当業者に明らかになるであろう。
[0008] 上で提示された一般的な説明、および下で提示される好ましい実施形態の詳細な説明と共に、添付の図面は、現在企画される本発明の最良の形態の好ましい実施形態の原理を例示および説明する働きをする。
[0021] 以下の本発明の詳細な説明で、開示の一部を形成し、その中で、限定ではなく例として、それによって本発明が実施され得る特定の実施形態が示される添付の図面が参照される。図面では、同様の番号はいくつかの図を通して実質的に同様の構成要素を説明する。さらに、図面、前述の議論、および以下の説明は、単に例示的および説明的であり、本発明の範囲または本出願をいかなるようにも限定することが意図されない。
[0022] 本発明の実施形態は、ある種の産業において記憶されているデータ量の急増に対処するために重複除外ソリューションを提供するための方法と装置とを含み、本発明の実施形態は、記憶装置によって消費される電力量を削減するディスク電源制御技術も導入する。発明者は、一定の記憶環境で、記憶されている大量のデータは、頻繁にアクセスされる必要のないバックアップデータであり、実際に、大量のデータは記憶されて、決して再度アクセスされないと判断した。本発明は、常に活動状態でなくてよい記憶装置用のディスク駆動軸(spindles)をオフにする最適な状況を決定し、それにより、記憶装置の電力消費量を削減し、冷却用の電力消費量も削減することによって、この現象を利用する。
[0023] 本発明の実施形態は、システム内の内部に「重複除外範囲」を維持するVTLシステムなどのデータバックアップシステムを含む。重複除外範囲は、重複除外領域のハッシュ表と、重複除外領域が記憶されることになる記憶ボリュームとを含む。各重複除外範囲は、電子メールサーバデータ、ファイルサーバデータなど、それぞれのバックアップソースデータに割り当てられる。例えば、電子メールサーバのデータなど、特定のタイプのデータに関してバックアップタスクを開始する時が来ると、バックアップ管理モジュールは、対応する重複除外範囲を記憶システム内に設定する。記憶システムは、特定の重複除外範囲に関係するディスクドライブだけをオンにして、ディスクドライブの残りの部分の電力をオフにする。バックアップ管理モジュールは、バックアップデータストリームを記憶システムに書き込み、記憶システム上の重複除外モジュールは、特定のデータタイプのために適用可能な重複除外範囲に関して予め設定されたハッシュ表と領域ボリュームとを利用して重複除外プロセスを実行する。これにより、異なる範囲のデータをバックアップするために使用されるその他のディスクは依然として電源がオフの状態であるものの、冗長的なデータ部分を統合することによって重複除外を使用して、ソースデータは記憶システムにバックアップされる。
[0024] 重複除外範囲に従って比較目標領域を区分化することによって、プロセスは重複除外のごくわずかな効果を失うことになる。例えば、データ重複除外がデータバックアップ動作にうまく機能する理由は、特定のソースデータが繰返しバックアップされるからである。他方で、異なるデータソース間でデータ重複除外を実行することは、記憶されているデータのサイズを削減することに関して効率性の期待がはるかに小さい。したがって、この状況で電力消費量を大量に削減することは、わずかなデータが実際に重複除外されている状態で大量のデータの重複除外を試みるよりもより効果的である。これにより、本発明によって記載された方法は、所有者の観点および環境上の観点の総コストの両方からより貴重である。VTL記憶システムなど、単一の記憶システム内に複数のかかる重複除外範囲を有して、電源装置制御を統合することは、データ記憶装置に共通の多数の長いバックアップウィンドウの間、大きな割合のディスクドライブが電源をオフにされることを可能にして、記憶システムの区分全体をオンにすることが回避され得る。さらに、本発明の実施形態は、VTLシステムの例という状況に関して説明されるが、本発明はその他のデータバックアップ記憶システム、アーカイブ記憶システムなどに応用されることが可能であることは当業者に明らかになるであろう。
[0025] 第1の実施形態−ハードウェアアーキテクチャ
[0026] 図1は、第1の実施形態の情報システムの物理的ハードウェアアーキテクチャの例を示す。これらの実施形態の情報システムは、記憶システム100と、1つまたは複数のアプリケーションコンピュータ110と、管理コンピュータ120とからなる。アプリケーションコンピュータ110と、管理コンピュータ120と、記憶システム100とは、SAN(記憶域ネットワーク)、LAN(ローカルエリアネットワーク)、WAN(広域ネットワーク)、またはその他のタイプのネットワークであってよいネットワーク130を介して通信のために接続される。さらに、例えば、SANがネットワーク130として使用される場合、管理専用ネットワークとして、管理コンピュータ120と記憶システム100の間の追加の通信のためにLAN(図示せず)が含まれてもよい。
[0027] 記憶システム100は、記憶媒体106など、複数の記憶装置へのアクセスを制御するためのコントローラ101を含む。コントローラ101は、CPU102と、メモリ103と、ネットワーク130と接続するための1つまたは複数のポート104とを含む。記憶媒体106は、コントローラ101との通信のために接続され、好ましい実施形態では、ハードディスクドライブであってよいが、その他の実施形態では、固体メモリ、光ディスク、テープドライブなど、様々なその他のタイプの記憶装置のいずれかであってよい。VTLまたはその他のバックアップ機能性は、この例で説明されるように記憶システム100に統合されてよいが、その他の実施形態では、この機能性は、独立した装置として一般的な記憶システムから切り離して提供されてよい。
[0028] アプリケーションコンピュータ110は、CPU111と、メモリ112と、ポート113と、記憶媒体114とを含むコンピュータであってよい。アプリケーションコンピュータ110は、その上でアプリケーションが実行され、アプリケーションに関連するデータを維持するサーバであってよい。示された例では、アプリケーションデータは、内部の記憶媒体114内に記憶されると想定され得るが、ネットワーク130を介してなど、アプリケーションコンピュータに接続された外部の記憶システムに記憶されてもよい。
[0029] 管理コンピュータ120は、CPU121と、メモリ122と、ポート123とを含むコンピュータサーバであってよい。管理コンピュータ120は、記憶システム100上でバックアップタスクを管理するためにバックアップ管理者(backup administrator)によって使用されることが可能であり、アプリケーションコンピュータ110から記憶システム100にデータをバックアップする端末コンピュータである。
[0030] 論理素子構造
[0031] 図2および3は、この実施形態の例示的なソフトウェアおよび論理素子構造を示す。図2で例示されたように、アプリケーションコンピュータ110上の素子は、例えば、電子メールなど、特定のタイプの企業データ(enterprise data)を作成するアプリケーションコンピュータ110上のモジュールであるアプリケーション280を含む。アプリケーション280によって作成されたデータは、アプリケーションコンピュータ110上の記憶媒体114上など、ソースボリューム270内に記憶される。
[0032] 管理コンピュータ120は、バックアッププロセス全体を制御するバックアップ管理モジュール290を含む。管理コンピュータ120は、まず、どのアプリケーションデータ(例えば、ソースボリューム270)が記憶システム100内にバックアップされることになるかを特定する。記憶システム100の準備ができた後、コントローラ101は、アプリケーションコンピュータ110からバックアップソースデータを受信する。バックアップスケジュール表500は、各データソースがバックアップされることになる時間に関する情報、およびデータ転送を開始する前に記憶システムに対して特定される各バックアップデータの識別(すなわち、下でさらに説明される「重複除外範囲」)も維持する。
[0033] 記憶ボリューム構成
[0034] 各アレイグループ210は、複数の記憶媒体106からの物理的容量から構成される論理記憶容量であり、RAID(独立ディスク冗長アレイ(Redundant Array of Independent Disks))構成で構成されてよい。例えば、アレイグループは、データを記憶する3つのディスクと、各データストライプに関してパリティデータを記憶するもう1つのディスクとを有するなど、RAID5構成として構成されてよい。目標ボリューム220は、アレイグループ210のうちの1つから利用可能な記憶空間を切り取ることによって利用可能な記憶容量として作成される論理記憶エクステント(extent)(すなわち、論理ボリューム)である。図2では、目標ボリューム220−1はアレイグループ210−1から生成され、目標ボリューム220−2はアレイグループ210−2から生成され、目標ボリューム220−3はアレイグループ210−3から生成される。各目標ボリューム220は、(通常、1対1の関係にある)アプリケーションコンピュータ110のうちの1つの特定のソースボリューム270に関してバックアップデータを保持する論理ボリュームである。各目標ボリューム220は、複数のデータ領域230を保持する。領域230は、ボリューム220内に記憶されたバックアップデータの一部である。しかし、重複除外プロセスは、バックアッププロセスの間に同じバイトパターンを有する領域を統合するため、それぞれの目標ボリューム220内のその他の領域230と比較し、ボリューム220内に含まれた各領域230は独自のコンテンツを有する。領域230は、複数のブロック240から構成される。領域230内の最大ブロック数は、特定された量に限定されるが、これらのブロックのすべてが任意の特定の領域内に充当されなくてもよい。特定のソースボリューム270に対するバックアッププロセスの間に、対応する目標ボリューム220だけの電源がオンにされることになり、これは、そこから目標ボリューム220が割り当てられる特定のアレイグループ210を作り上げる記憶媒体106だけがオンにされる必要があり、記憶媒体106の残りの部分と、それらの対応する目標ボリューム220とは、依然として電源がオフの状態であることを意味する。したがって、例示された実施形態によれば、すべての目標ボリューム220は、異なるアレイグループから割り当てられることが好ましい。すなわち、言い換えれば、複数のアレイグループを通して目標ボリュームを割り当てることが回避される。
[0035] コントローラ上のソフトウェア
[0036] 図2に例示されたように、重複除外モジュール200は、バックアップ管理モジュール290からの指示に応答して記憶システム100に重複除外サービスを提供するためのプログラムである。重複除外モジュール200は、対応するアレイグループ210を作り上げる記憶媒体106への電源装置を制御することによって目標ボリューム220をオンおよびオフにするために電源装置を制御するようにも構成される。バックアップ管理モジュール290から任意の特定の重複除外範囲が特定される場合、重複除外モジュール200は、対応するアレイグループ内の記憶媒体への電源装置をオンにすることによって関連した目標ボリュームをオンにする。重複除外モジュール200は、次いで、バックアップ管理モジュール290によって特定された重複除外範囲に対応する目標ボリューム220にバックアップデータのデータストリームを書き込むための書込み要求を受け入れる。目標ボリュームへのデータ書込みの間、重複除外モジュール200は、データストリームを領域のサイズに分解して、新しいデータを目標ボリューム内にすでに記憶された領域と比較する。新しいデータパターンが識別された場合、重複除外モジュール200は、バックアップデータストリームのその部分を用いて新しい領域を作成して、目標ボリューム内に新しい領域を記憶する。他方で、バックアップデータストリームの部分が既存の領域と同じである場合、重複除外モジュール200は、既存の領域に対して追加のリンクを単に作成する。バックアップデータの全体量の処理が完了した後で、目標ボリュームは、重複除外モジュール200によって再びオフにされることが可能であり、これはバックアップ管理モジュール290からの命令によってトリガされ得る。
[0037] コントローラ101は、重複除外モジュール200によって使用されるデータ構造も含む。範囲表600は、特定の範囲に関してハッシュ表800、領域表900、バックアップ画像カタログ表1000、および目標ボリューム220のセットを見つけるために重複除外範囲情報の記録を保持する。アレイグループ表700は、重複除外モジュール200が、記憶媒体のどのセットが特定のアレイグループを作り上げるかを決定することを可能にするためにアレイグループ情報の記録を保持する。各ハッシュ表800は、対応する目標記憶ボリューム220内の各領域に関して生成されたハッシュ値を保持する。ハッシュ値は、新しい着信データとボリューム内の既存の領域との初期の比較を実行するために使用される。領域表900は、それぞれの目標ボリューム220内で各領域が実際に記憶される場所(論理ブロックアドレス−LBA)の情報を保持する。バックアップ画像カタログ表1000は、特定の目標ボリューム220に関してバックアップされた画像の情報を保持し、特定の目標ボリューム内に記憶された領域に対する各画像のマッピング情報を有する。ハッシュ表800と、領域表900と、バックアップ画像カタログ表1000とは、各目標ボリュームすなわち対応する範囲に対して1つが存在するように生成される。
[0038] 重複除外範囲の構成要素
[0039] 図3で例示されたように、重複除外範囲300は、特定のソースボリューム270に関して重複除外機能を利用すると同時に、データバックアップを実行するために必要な素子のセットを保持する論理グループである。したがって、重複除外範囲300は、目標ボリューム220と、ハッシュ表800と、領域表900と、バックアップ画像カタログ表1000とからなる。本発明の記憶システムは、かかる範囲の複数のセットを有し、バックアップ管理モジュール290から受信されたコマンドに基づいて1つの範囲から次の範囲に交換することが可能である(すなわち、特定のソースボリュームに関する特定のバックアッププロセスの間、1つの範囲セットだけが使用される)。
[0040] バックアップスケジュール表
[0041] 図4は、バックアップソースデータ用の名称を識別するバックアップソース名510を含むバックアップスケジュール表500のデータ構造の例を示す。トリガタイミング520は、特定のバックアップソースからのデータに関してバックアッププロセスを開始するための時間を示す。範囲ID530は、バックアップソースのために使用されることになる重複除外範囲を識別する。例えば、行591は、毎「水曜日の午前2時」からバックアップされることが予定され、記憶システムで「S1」の範囲IDを有する重複除外範囲を有するバックアップソースデータ「電子メール」についての記録を示す。バックアップスケジュール表500は、管理コンピュータ120内で維持され、各バックアッププロセスをいつ開始するか、どの範囲記憶システム100が使用すべきかを決定するためにバックアップ管理モジュール290によって参照される。
[0042] 範囲表
[0043] 図5は、重複除外範囲を識別する範囲ID610を含む範囲表600のデータ構造の例を示す。ハッシュID620は、特定の範囲に属すハッシュ表800を識別する。領域表ID630は、特定の範囲に属する領域表900を識別する。カタログID640は、特定の範囲に属するバックアップ画像カタログ表1000を識別する。目標ボリュームID650は、特定の範囲に属する目標ボリューム220を識別する。アレイグループID660は、そこから目標ボリュームが当初切り取られたアレイグループを識別する。例えば、行691は、その中で、重複除外範囲「S1」がハッシュ表「H1」と、領域表「CT1」と、バックアップ画像カタログ表「CLG1」とからなる記録を例示し、バックアップデータはアレイグループ「A1」から切り取られた目標ボリューム「V1」上に記憶されることになる。各範囲の構成要素は、それらのそれぞれの範囲に関して1つずつ生成され、それにより、記憶システムはこれらの構成要素の複数のセット、すなわち、各範囲に1セットを有することになる。範囲表600は、バックアップ管理モジュール290によって特定されたデータをバックアップするために使用される、特定された重複除範囲300に対応する表800、900、1000および目標ボリューム220のセットを突き止めるために重複除外モジュール200によって参照される。
[0044] アレイグループ表
[0045] 図6は、各記述項(entry)のためのアレイグループを識別するアレイグループID710を含むアレイグループ表700のデータ構造の例を示す。媒体ID720は、アレイグループに対応する記憶媒体を識別する。例えば、記述項791、792、および793は、その中に記憶媒体「M1」、「M2」、および「M3」を含むアレイグループ「A1」の記録を表す。アレイグループ表700は、特定の記憶媒体のための電力がオフおよびオンにされることが可能であるように、記憶媒体106のどのセットがあるアレイグループ210を作り上げるかを決定するために重複除外モジュール200によって参照される。
[0046] ハッシュ表
[0047] 図7は、ハッシュ表800のデータ構造の例を示す。ハッシュ値の記述項810は、バックアッププロセスの間に重複除外モジュール200によってそれぞれの領域から生成されたハッシュ値を含む。領域ID820は、それに関してハッシュ表が生成されている特定の目標ボリューム内の領域を識別する。例えば、行891は、ハッシュ値として「S1HV1」を有し、領域IDは「S1Ch1」を有する領域の記録を表す。同じハッシュ値は、両方とも同じハッシュ値「S1HV2」を有する、領域ID「S1Ch2」に関して行892で、かつ領域ID「S1Ch3」に関して行893で例示されるように、異なるデータコンテンツを実際に有する領域に関して時々生成される場合がある点に留意されたい。これにより、ハッシュ表800は、新しく分割されたソースバックアップデータと目標ボリューム上の既存の領域との間の当初の比較を行うために重複除外モジュール200によって使用される。次いで、一致するハッシュ値が識別された場合、データが既存の領域と真に同じであるかどうかを決定するために、直接ビット対ビットまたはバイト対バイトの比較が実行される。各重複除外範囲300に関して、1つのハッシュ表800が生成される。
[0048] 領域表
[0049] 図8は、特定の領域を識別する領域ID910を含む領域表900のデータ構造の例を示す。開始LBA920は、それぞれの領域の開始アドレスである目標ボリューム上のLBAを示す。ブロック930の数は、それぞれの領域内の有効なブロック数を示す。例えば、行991は、領域IDとして「S1Ch1」を有する領域の記録を表し、ボリューム上のLBA「0」で開始する領域が記録され、次いで、有効ブロックの数は開始LBAから「32」ブロックである。重複除外プロセスの間、バックアップソースデータのバイトストリームは、領域の最大ブロック数(例えば、この例では32ブロック)に等しいサイズの部分に分割される。しかし、データの終了部分はこの境界に正確に分割されない可能性が発生する場合があり、したがって、いくつかの領域は、多くの場合、領域内で許可される最大ブロック数よりも長さが短いことになる。これが発生すると、領域表900内のブロック数930は、比較が実行されている場合、有効なデータの終了部分を示す。例えば、行992は、LBA32で開始し、25ブロックの有効データを含む領域ID「S1Ch2」を示す。この領域の残りの部分は、データ比較目的で、重複除外モジュール200によって無視される無効データにより充当されことが可能である。領域表900は更新されて、新しく分割されたソースバックアップデータと目標ボリューム上の既存の領域の間の比較の間、各領域のコンテンツへのアクセスに使用するために重複除外モジュール200によって参照される。各重複除外範囲300に関して、1つの領域表900が作成および維持される。
[0050] バックアップ画像カタログ表
[0051] 図9は、バックアップ画像を識別するバックアップ画像ID1010を含むバックアップ画像カタログ表1000の例示的なデータ構造を示す。タイムスタンプ1020は、特定のバックアップ画像に関するバックアッププロセスの開始時間用のタイムスタンプを示す。通し番号1030は、バックアップデータストリームの各分割された部分に関する通し番号を示す。領域ID1040は、データのその分割された部分に対応する領域を示す。例えば、行1091は、「T1」(ある時間値)でバックアップされ、バックアップデータストリームの第1の分割された部分(通し番号「0」)であったバックアップ画像「S1BU0000」に属す領域「S1Ch1」の記録を表す。バックアップ画像カタログ表は更新されて、重複除外機能を利用してバックアップが実行される場合、重複除外モジューリ200によって参照される。
[0052] データバックアップのプロセス
[0053] 図10は、バックアップ管理モジュール290と重複除外モジュール200とによって実行されたアプリケーションデータのデータバックアップのためのプロセスの例を示す。プロセスは、一般に、バックアップスケジュール表500によって示されるように、アプリケーションをバックアップする時間が到着したときに始まる。あるいは、プロセスは、管理者によって手動でトリガされることも可能である。バックアップ管理モジュール290は、特定のアプリケーションに対応する範囲を決定して、範囲の設定を命じることによってバックアップを実行するよう記憶システム100を準備する。記憶システム100は、特定された範囲に関して対応する表を識別して、その範囲に属す目標ボリュームの電源をオンにする。アプリケーションデータが目標ボリュームにバックアップされると同時に、重複除外機能も実行される。目標ボリュームは、バックアッププロセスの完了に続いて電源がオフにされることが可能である。この例では、「電子メール」アプリケーションがバックアップされることになる。
[0054] ステップ1500。バックアップ管理モジュール290は、その中で、記録がそのトリガ時間が来た「電子メール」として設定されたバックアップソース名510を有する範囲ID530をバックアップスケジュール表500から選択する。
[0055] ステップ1510。バックアップ管理モジュール290は、選択された範囲に関して範囲IDを設定するよう記憶システム100に命令を送る。
[0056] ステップ1520。重複除外モジュール200は、特定された範囲に関して表800、900、1000を識別および選択し、対応する目標ボリューム220の電源をオンにするために、図11に記載されたように「範囲設定プロセス」を実行する。
[0057] ステップ1530。バックアップ管理モジュール290は、それぞれのアプリケーションコンピュータ110からバックアップソースデータを受信して、そのデータストリームを記憶システム100に転送する。
[0058] ステップ1540。重複除外モジュール200は、重複除外機能を利用すると同時に、図12A〜12Bに記載されたように、受信されたデータを目標ボリューム220に書き込む「データ書込みプロセス」を実行する。
[0059] ステップ1550。記憶システムへのバックアップデータの転送が完了した場合、バックアップ管理モジュール290は、バックアッププロセスが完了したという通知を記憶システム100に送付する。
[0060] ステップ1560。重複除外モジュールは、ステップ1520で電源がオンにされたすべての記憶媒体106の電源をオフにする。
[0061] 範囲設定プロセス
[0062] 図11は、実際のデータバックアップ(すなわち、目標ボリュームへのデータの書込み)が重複除外モジュール200によって実行され始める前に記憶システム上に範囲を設定するためのプロセスの例を示す。範囲設定プロセスは、特定された範囲に関して表を選択して、その範囲に属する目標ボリュームに関して記憶媒体の電源をオンにする。
[0063] ステップ1600。重複除外モジュール200は、識別された範囲IDに対応するハッシュ表ID、領域表ID、バックアップ画像カタログ表ID、目標ボリュームIDおよびアレイグループIDなど、範囲表600から特定された重複除外範囲300に関して範囲素子のIDを選択する。
[0064] ステップ1610。重複除外モジュール200は、記憶媒体106のアレイグループ表700から、ステップ1600で取得されたアレイグループIDに対応するすべての媒体ID720を識別する。
[0065] ステップ1620。重複除外モジュール200は、ステップ1610で識別された記憶媒体106の電源をオンにする。
[0066] データ書込みプロセス
[0067] 図12A〜12Bは、重複除外モジュール200によって実行された目標ボリューム220のうちの1つにバックアップソースデータを書き込むためのプロセスの例を示す。プロセスは、(a)バックアップデータを領域サイズの断片に分割し、(b)分割された部分に関して計算されたハッシュ値を記憶システム内にすでに記憶された既存のデータに関する既存のハッシュ値と比較し、c)ハッシュ値が一致する場合、分割された部分を実際の領域コンテンツと比較し、d)分割された部分がすでに記憶されたデータのいずれかに一致しない場合、新しい領域を記憶システムに記憶し、e)範囲の関連する表800、900、100を更新する。
[0068] ステップ1700。重複除外モジュール200は、特定のバックアップ画像に関して通し番号を追跡するために変数「v_通し番号」を0(ゼロ)に初期化する。
[0069] ステップ1710。重複除外モジュール200は、データストリームが受信されると、バックアップデータを領域の指定された最大ブロック数と同じブロック数を有する部分に分割することによって、データストリームを領域のサイズに分解する。図8を参照して上で提示された例では、領域用の最大ブロック数は32ブロックであるが、任意のその他の実用的なブロック数が使用されてよい。
[0070] ステップ1720。重複除外モジュール200は、処理のためにステップ1710で作成された分割されたデータ部分のうちの1つを選択する。バックアップデータの分割されたデータ部分のすべての断片がすでに処理されている場合、プロセスは終了する。そうでない場合、プロセスはステップ1730に進む。
[0071] ステップ1730。重複除外モジュール200は、ステップ1720で選択された分割されたバックアップデータ部分に関して新しいハッシュ値を生成する。使用される特定のハッシュ機能は、本発明にとって重要ではない。例えば、MD5、SHA1、SHA256などが使用されてよい。
[0072] ステップ1740。重複除外モジュール200は、ステップ1730で計算された新しく生成されたハッシュ値に一致する既存のハッシュ値を有する、ハッシュ表800内のいずれの記録も識別する。一致するハッシュ値を有する記録が存在しない場合または一致するハッシュ値を有するすべての記録がすでに処理されている場合、プロセスは図12Bのステップ1800に進む(すなわち、調査されている特定の分割されたデータ部分のデータコンテンツは独自であり、分割されたデータ部分を記憶するために目標ボリューム220上に新しい領域を作成することが必要になる)。そうでない場合、1つまたは複数の一致するハッシュ値がステップ1740内で突き止められる場合、プロセスは直接データ比較のためにステップ1750に進む。上で議論されたように、比較のためにここで使用されるハッシュ表800は、図11を参照して上で説明された範囲設定プロセスのステップ1600で取得されたハッシュ表IDによって選択される。
[0073] ステップ1750。重複除外モジュール200は、ハッシュ表800から、一致するハッシュ値を有する領域の領域IDを識別し、次いで、開始LBA920と、識別された領域のブロック数930とを領域表900から取得するためにこの領域IDを使用する。この情報は、調査されている分割されたバックアップデータ部分と同じハッシュ値を有する実際の領域コンテンツの記憶位置と長さとを示す。比較のためにここで使用される領域表は、図11を参照して上で説明された範囲設定プロセスのステップ1600内で取得されたそのIDによって選択される。
[0074] ステップ1760。重複除外モジュール200は、分割されたバックアップデータ部分のバイトストリームを、ステップ1750で取得された既存の領域のコンテンツと直接的に比較する。バイトパターンが一致する場合、データは記憶システム内にすでに記憶されたコンテンツに一致するコンテンツを有し、目標ボリューム上に予め記憶された領域は共有されることが可能であり、新しい領域が作成される必要がないため、データを再度記憶する必要はなく、したがって、プロセスはステップ1770に進む。そうでない場合、バイトパターンが互いに一致しない場合、プロセスはステップ1740に戻り、任意のその他の一致するハッシュ値を処理する。
[0075] ステップ1770。同じデータコンテンツは目標ボリューム上にすでに記憶されているため、新しい領域を作成および記憶する必要がなく、したがって、重複除外モジュール200は、ステップ1740で選択された既存の領域の領域IDとして変数「v_領域ID」を設定し、次いで、図12Bのステップ1850に進む。
[0076] ステップ1800。図12Bを参照すると、ステップ1740に続いて、調査されている分割されたデータ部分に関して一致するハッシュ値または同じコンテンツが見つからない場合、新しい領域は特定の分割されたデータ部分に関して記憶される必要がある。重複除外モジュール200は、目標ボリューム200に関して空の領域のIDを取得して(または重複除外モジュールは、ボリュームの部分に関して任意の独自の領域IDを作成することができる)、新しい流域としてバックアップデータ部分を記憶するための目標ボリューム220の開始LBAも取得する。新しい領域にボリューム容量を割り当てることは、様々な方法で実行されてよい。例えば、目標ボリューム220の容量全体は、ボリューム220が当初割り当てられる場合、領域に関して最大ブロック数を有する領域に区分化されてよい。これは等しいサイズの記憶領域の利用可能なプールを作成することができ、これらの区分化された領域の各々の境界ブロックアドレスは、この場合、新しい空の領域が要求されると、新しい領域を記憶するための開始LBAとして1つずつ提供されることができる。
[0077] ステップ1810。重複除外モジュール200は、ステップ1800で取得された開始LBAによって特定されたLBAでバックアップデータ部分のコンテンツを新しい領域として目標ボリューム200に記憶する。
[0078] ステップ1820。重複除外モジュール200は、ステップ1730で生成されたハッシュ表と、ステップ1800で取得された領域IDとを使用してハッシュ表800内に新しい記録を作成する。
[0079] ステップ1830。重複除外モジュール200は、ステップ1800で取得された領域IDおよび開始LBAと、新しく記憶されたバックアップデータコンテンツのブロック数で表した長さとを使用して、領域表900内に新しい記録を作成する。
[0080] ステップ1840。重複除外モジュール200は、ステップ1800で取得された領域ID(すなわち、新しい領域のID)になるように変数「v_領域ID」を設定する。
[0081] ステップ1850。重複除外モジュール200は、新しい記録をバックアップ画像カタログ表1000に挿入して、下の値を充当する。バックアップ画像ID1010は、重複除外モジュール200またはバックアップ管理モジュール290によって割り当てられた、処理されているバックアップ画像用の独自のIDである。タイムスタンプ1020は、現在のバックアッププロセスの開始時間を示す。通し番号1030は、処理された、分割されたデータ部分の通し番号である変数v_通し番号の値である。領域IDは、その値が、新しい領域が作成されたかかどうか(ステップ1800〜1840)または同じコンテンツを有する既存の領域が発見されたかどうか(ステップ1770)によって決まる変数v_領域IDの値である。
[0082] ステップ1860。重複除外モジュール200は、変数v_通し番号の値を増分して、バックアップデータの次の分割されたデータ部分に関してプロセスを繰り返すためにステップ1720に戻る。バックアップデータのすべての部分が調査されて、バックアップ画像カタログ表1000内に記憶された記述項が場合、プロセスは終了する。
[0083] これにより、ディスク電源制御技術が記憶システムの全体的な電力消費量を削減すると同時に、本発明の重複除外ソリューションは記憶される必要があるデータ量を削減する手段を提供する。本発明のデータバックアップ構成に基づき、記憶媒体の一部だけがオンにされる必要があり、記憶媒体の残りの部分は依然としてオフの状態である。記憶システムは、システムの内部に複数の重複除外範囲を保持し、各重複除外範囲は、電子メールサーバデータ、ファイルサーバデータなど、それぞれのバックアップソースデータに割り当てられる。特定のデータソースに関してバックアップタスクを開始する時間が来ると、バックアップ管理モジュールは対応する重複除外範囲を設定し、次いで、特定された重複除外範囲に関連する記憶媒体だけに電源を入れ、記憶媒体の残りの部分は電力をオフの状態に維持する。重複除外プロセスは、設定された重複除外範囲内に含まれた特定のボリュームに関して実行され、それにより、冗長的なデータ部分を削除すると同時に、その他のバックアップ目標ボリュームはオフの状態に維持する。加えて、バックアップデータが取り出される必要がある場合、そのデータを含む特定のボリュームに対応する記憶媒体だけがオンにされる必要があり、所望されるバックアップ画像は、対応するバックアップ画像カタログ表と領域表とを使用して読み取られることが可能である。さらに、本発明はVTLバックアップ記憶システムの環境で説明されているものの、本発明はその他のタイプのバックアップ記憶システム、アーカイブ記憶システム、およびその中で本発明の重複除外範囲が適用され得るその他のタイプの記憶システムにも適用可能である。
[0084] 前述の説明から、本発明は、使用される記憶容量の量を削減するために記憶システム上に重複除外機能を同時に利用しながら、記憶装置の電源装置を制御することによって記憶システム用の電力消費量を削減するための方法および装置を提供することが明らかになるであろう。加えて、本明細書では特定の実施形態が例示および説明されているが、当業者は、開示された特定の実施形態は、同じ目的を達成するために計算される任意の構成に置き換えられることが可能である点を理解されよう。この開示は、本発明のすべてのおよび任意の適合形態または改変形態を網羅することが意図され、上の説明は、限定的ではなく、例示的な形で行われている点を理解されたい。したがって、本発明の範囲は添付の特許請求の範囲の資格が与えられる均等物の完全範囲と共に、かかる特許請求の範囲を参照して適切に決定されるべきである。
[0009]本発明の方法および装置が適用され得るハードウェア構成の例を例示する図である。 [0010]図1のアーキテクチャに適用される本発明の論理構成の例を例示する図である。 [0011]重複除外範囲の論理構造の例を例示する図である。 [0012]バックアップスケジュール表の例示的なデータ構造を示す図である。 [0013]範囲表の例示的なデータ構造を示す図である。 [0014]アレイグループ表の例示的なデータ構造を示す図である。 [0015]ハッシュ表の例示的なデータ構造を示す図である。 [0016]領域表の例示的なデータ構造を示す図である。 [0017]バックアップ画像カタログ表の例示的なデータ構造を示す図である。 [0018]データバックアップのための例示的なプロセスを示す図である。 [0019]例示的な範囲設定プロセスを示す図である。 [0020]例示的なデータ書込みプロセスを示す図である。 [0020]例示的なデータ書込みプロセスを示す図である。
符号の説明
100……記憶システム、101……コントローラ、110……アプリケーションコンピュータ、103、112、122……メモリ、104、113、123……ポート、106、114……記憶媒体、120……管理コンピュータ、130……ネットワーク

Claims (20)

  1. 記憶システムであって、
    1つまたは複数の第1の記憶媒体および1つまたは複数の第2の記憶媒体と通信するコントローラと、
    前記1つまたは複数の第1の記憶媒体から割り当てられた記憶容量を有する第1のボリュームと
    を含み、
    当初、前記1つまたは複数の第1の記憶媒体と前記1つまたは複数の第2の記憶媒体とが、電源がオフの状態に構成され、
    前記コントローラが、前記第1のボリュームに記憶されることになる第1のデータに関して命令を受信し、前記1つまたは複数の第2の記憶媒体は依然として電源がオフの状態であるものの、前記1つまたは複数の第1の記憶媒体は電源がオンにされた状態にするように構成され、
    前記コントローラによって受信された前記第1のデータのコンテンツが、前記第1のボリューム内に記憶された任意の既存のデータのコンテンツと比較され、
    前記比較の結果が、前記データの前記コンテンツは前記第1のボリューム内の前記既存のデータの前記コンテンツと一致しないことを示す場合、前記第1のデータが前記第1のボリューム内に記憶される
    記憶システム。
  2. 前記比較の前記結果が、前記第1のデータの前記コンテンツが前記第1のボリューム内に記憶された前記既存のデータの前記コンテンツと一致することを示す場合、前記第1のデータの識別子を前記既存のデータの識別子と結びつける第1の記録が記憶されて、前記第1のデータが破棄される
    請求項1に記載の記憶システム。
  3. 前記第1のデータの前記コンテンツが一致しない場合、前記第1のボリュームに前記第1のデータを記憶することの完了に続いて、または前記第1のデータの前記コンテンツが一致する場合、前記記録を記憶することの完了に続いて、前記1つまたは複数の第1の記憶媒体は電源がオフにされる
    請求項2に記載の記憶システム。
  4. 前記1つまたは複数の第2の記憶媒体から割り当てられた記憶容量を有する第2のボリュームをさらに含み、
    前記コントローラが、前記第2のボリュームに記憶されることになる第2のデータに関して命令を受信し、
    前記コントローラが、前記1つまたは複数の第1の記憶媒体は依然として電源がオフであるものの、前記1つまたは複数の第2の記憶媒体の電源をオンの状態に構成し、
    前記コントローラによって受信された前記第2のデータのコンテンツが、前記第2のボリューム内に記憶された任意の既存のデータのコンテンツと比較され、
    前記比較の結果が、前記第2のデータの前記コンテンツが、前記第2のボリューム内の前記既存のデータの前記コンテンツと一致しないことを示す場合、前記第2のデータが前記第2のボリュームに記憶され、
    前記比較の前記結果が、前記第2のデータの前記コンテンツが前記第2のボリューム内に記憶された前記既存のデータの前記コンテンツと一致することを示す場合、第2のデータの識別子を前記第2のボリューム内に記憶された前記既存のデータの識別子と結びつける第2の記録が記憶され、前記第2のデータが破棄され、
    前記第2のデータの前記コンテンツが一致しない場合、前記第2のボリュームに前記第2のデータを記憶することの完了に続いて、または前記第2のデータの前記コンテンツが一致する場合、前記記録を記憶することの完了に続いて、前記1つまたは複数の第2の記憶媒体は電源がオフにされる
    請求項3に記載の記憶システム。
  5. 第1のハッシュ値が前記第1のデータの前記コンテンツに関して計算され、前記比較の間、前記第1のデータの前記コンテンツの前記第1のボリューム上の前記既存のデータの前記コンテンツとの直接比較が実行されるべきかどうかを決定するために、前記ハッシュ値が、前記第1のボリューム上に記憶された前記既存のデータの前記コンテンツに関して計算された第2のハッシュ値と比較される
    請求項1に記載の記憶システム。
  6. 複数の前記第1の記憶媒体が存在し、前記第1の記憶媒体は第1のアレイグループ内に構成されており、前記第1のボリュームは前記第1のアレイグループから割り当てられた記憶容量を有し、
    複数の前記第2の記憶媒体が存在し、前記第2の記憶媒体は第2のアレイグループ内に構成されており、第2のボリュームは前記第2のアレイグループから割り当てられた記憶容量を有し、
    前記第1および第2のアレイグループが、互いと関係なく前記コントローラによって電源がオンおよびオフにされるように構成された
    請求項1に記載の記憶システム。
  7. 前記第1のボリュームと、前記第1のボリューム上に記憶された第1のデータ領域に対応する第1のハッシュ値表と、データの前記領域が前記第1のボリューム上に記憶された場所の第1の論理ブロックアドレス表とを含む第1の重複除外範囲と、
    前記第2のボリュームと、前記第2のボリューム上に記憶された第2のデータ領域に対応する第2のハッシュ値表と、前記第2のデータ領域が前記第2のボリューム上に記憶された場所の第2の論理ブロックアドレス表とを含む第2の重複除外範囲とを含み、
    前記第1の範囲が、第1のデータソースからのデータを重複除外および記憶する際に使用され、前記第2の範囲が、第2のデータソースからのデータを重複除外および記憶する際に使用されるように構成された
    請求項1に記載の記憶システム。
  8. 第1のアプリケーションコンピュータが、前記第1のデータソースとして第1のソースボリューム内に記憶された第1のアプリケーションデータを作成し、第2のアプリケーションコンピュータが、前記第2のデータソースとして第2のソースボリューム内に記憶された第2のアプリケーションデータを作成し、
    前記記憶システムと通信する管理コンピュータが、前記第1の範囲を使用して、前記第1のソースボリュームを前記第1のボリュームにバックアップし、前記第2の範囲を使用して、前記第2のソースボリュームを前記第2のボリュームにバックアップするよう前記記憶システムに周期的に命令する
    請求項7に記載の記憶装置。
  9. 情報システムであって、
    1つまたは複数の第1の記憶媒体および1つまたは複数の第2の記憶媒体と通信するコントローラを含む記憶システムと、
    前記1つまたは複数の第1の記憶媒体から割り当てられた記憶容量を有する第1のボリュームと、
    前記1つまたは複数の第2の記憶媒体から割り当てられた記憶容量を有する第2のボリュームと、
    第1のボリュームと、前記第1のボリューム上に記憶された第1のデータ領域に対応する第1のハッシュ値表と、前記データ領域が前記第1のボリューム上に記憶された場所の第1の論理ブロックアドレス表とを含む第1の重複除外範囲と、
    第2のボリュームと、前記第2のボリューム上に記憶された第2のデータ領域に対応する第2のハッシュ値表と、前記第2のデータ領域が前記第2のボリューム上に記憶された場所の第2の論理ブロックアドレス表とを含む第2の重複除外範囲と
    を含み、
    前記第1の範囲が、第1のデータソースからの第1のデータを重複除外および記憶する際に使用され、前記第2の範囲が、第2のデータソースからの第2のデータを重複除外および記憶する際に使用されるように構成された
    情報システム。
  10. 前記1つまたは複数の第1の記憶媒体と前記1つまたは複数の第2の記憶媒体とが、当初、電源がオフの状態に構成され、
    前記コントローラが、前記第1のデータソースから前記第1のデータを記憶するための命令を受信して、前記第1の範囲に対応する前記第1のボリュームと、前記第1のハッシュ値表と、前記第1の論理ブロックアドレス表とを識別し、1つまたは複数の第2の記憶媒体の電源は依然としてオフであるものの、前記1つまたは複数の第1の記憶媒体の電源をオンの状態にするように構成され、
    前記コントローラが、前記コントローラによって受信された前記第1のデータのコンテンツを前記第1のボリューム内に記憶された任意の既存のデータのコンテンツと比較することによって前記第1のデータを前記重複除外および記憶することを実行するように構成され、
    前記比較の結果が、前記データの前記コンテンツが、前記第1のボリューム内の前記既存のデータの前記コンテンツと一致しないことを示す場合、前記第1のデータが前記第1のボリュームに記憶される
    請求項9に記載の情報システム。
  11. 前記比較の前記結果が、前記第1のデータの前記コンテンツが前記第1のボリューム内に記憶された前記既存のデータの前記コンテンツと一致することを示す場合、前記第1のデータの識別子を前記既存のデータの識別子と結びつける第1の記録が記憶され、前記第1のデータが破棄される
    請求項10に記載の情報システム。
  12. 前記第1のデータの前記コンテンツが一致しない場合、前記第1のデータを前記第1のボリュームに記憶することの完了に続いて、または前記第1のデータの前記コンテンツが一致する場合、前記記録を記憶することの完了に続いて、前記1つまたは複数の第1の記憶媒体の電源がオフにされる
    請求項11に記載の情報システム。
  13. 第1のハッシュ値が前記第1のデータの前記コンテンツに関して計算され、前記比較の間、前記第1のデータの前記コンテンツの前記第1のボリューム上の前記既存のデータの前記コンテンツとの直接比較が実行されるべきかどうかを決定するために、前記第1のハッシュ値が前記第1のボリューム上に記憶された前記既存のデータの前記コンテンツに関して計算された第2のハッシュ値と比較される
    請求項10に記載の情報システム。
  14. 複数の前記第1の記憶媒体が存在し、前記第1の記憶媒体は第1のアレイグループ内に構成されており、前記第1のボリュームは前記第1のアレイグループから割り当てられた記憶容量を有し、
    複数の前記第2の記憶媒体が存在し、前記第2の記憶媒体は第2のアレイグループ内に構成されており、前記第2のボリュームは前記第2のアレイグループから割り当てられた記憶容量を有し、
    前記第1および第2のアレイグループが、互いと関係なく前記コントローラによって電源がオンおよびオフにされるように構成された
    請求項9に記載の情報システム。
  15. 第1のアプリケーションコンピュータが前記第1のデータソースとして第1のソースボリューム内に記憶された第1のアプリケーションデータを作成し、第2のアプリケーションコンピュータが前記第2のデータソースとして第2のソースボリューム内に記憶された第2のアプリケーションデータを作成し、
    前記記憶システムと通信する管理コンピュータが、前記第1の範囲を使用して、前記第1のソースボリュームを前記第1のボリュームにバックアップし、前記第2の範囲を使用して、前記第2のソースボリュームを前記第2のボリュームにバックアップするように前記記憶システムに周期的に命令する
    請求項9に記載の情報システム。
  16. 1つまたは複数の第1の記憶媒体および1つまたは複数の第2の記憶媒体と通信するコントローラを有する記憶システムを操作する方法であって、前記方法が、
    前記1つまたは複数の第1の記憶媒体から第1のボリュームを割り当てるステップと、
    前記1つまたは複数の第2の記憶媒体から第2のボリュームを割り当てるステップと、
    前記1つまたは複数の第1の記憶媒体と前記1つまたは複数の第2の記憶媒体とを電源がオフの状態に構成するステップと、
    第1のデータを前記第1のボリュームに記憶するための命令を受信するステップと、
    前記1つまたは複数の第2の記憶媒体は電源がオフの状態であるものの、前記1つまたは複数の第1の記憶媒体を電源がオンの状態に構成するステップと、
    前記第1のデータを、所定のサイズの部分に分割して、前記第1のボリューム内に記憶された任意の既存のデータが前記所定のサイズの領域として記憶されるステップと、
    各分割された部分のコンテンツを前記第1のボリューム上にすでに記憶された任意の既存の領域と比較するステップと、
    各分割された部分に関して、前記分割された部分の前記比較の結果が、前記分割された部分の前記コンテンツが前記第1のボリューム上の前記既存の領域の前記コンテンツに一致しないことを示す場合、前記分割された部分を新しい領域として前記第1のボリュームに記憶するステップと、
    前記分割された部分の前記比較の前記結果が、前記分割された部分の前記コンテンツが前記第1のボリューム上の前記既存の領域のうちの1つの前記コンテンツに一致することを示す場合、前記分割された部分の識別子を前記既存のデータの識別子と結びつける記録を記憶して、前記第1のデータの前記分割された部分を破棄するステップと
    を含む方法。
  17. 前記分割された部分のすべての前記コンテンツが前記既存の領域の前記コンテンツと比較されて、前記分割された部分が新しい領域として前記第1のボリュームに記憶された後、または前記分割された部分の前記識別子を前記既存のデータの前記識別子と結びつける前記記録が記憶された後、前記1つまたは複数の第1の記憶媒体への電源をオフにするステップをさらに含む
    請求項16に記載の方法。
  18. 各前記分割された部分の前記コンテンツに関して第1のハッシュ値を計算するステップをさらに含み、
    前記分割された部分の前記コンテンツを比較する前記ステップが、前記第1の分割された部分のいずれかの前記コンテンツと前記既存のデータとの直接比較が実行されるべきかどうかを決定するために、前記第1のハッシュ値を前記第1のボリューム上に記憶された任意の既存のデータの前記コンテンツに関して計算された第2のハッシュ値と比較することを含む
    請求項16に記載の方法。
  19. 前記第1のボリュームと、前記第1のボリューム上に記憶されたデータの第1の領域に対応する第1のハッシュ値表と、前記データ領域が前記第1のボリューム上に記憶された場所の第1の論理ブロックアドレス表とを含むように第1の重複除外範囲を構成するステップと、
    前記第2のボリュームと、前記第2のボリューム上に記憶された第2のデータ領域に対応する第2のハッシュ値表と、前記第2のデータ領域が前記第2のボリューム上に記憶された場所の第2の論理ブロックアドレス表とを含むように第2の重複除外範囲を構成するステップとをさらに含み、
    前記第1の範囲が、第1のデータソースからの前記第1のデータを重複除外および記憶する際に使用され、前記第2の範囲が、第2のデータソースからの第2のデータを重複除外および記憶する際に使用されるように構成された
    請求項16に記載の方法。
  20. 第1のアプリケーションコンピュータ内に第1のアプリケーションデータを作成するステップであって、前記第1のアプリケーションデータが前記第1のデータソースとして第1のソースボリューム内に記憶されているステップと、
    第2のコンピュータ内に第2のアプリケーションデータを作成するステップであって、前記第2のアプリケーションデータが前記第2のデータソースとして第2のソースボリューム内に記憶されているステップと、
    前記第1の範囲を使用して、前記第1のソースボリュームを前記第1のボリュームにバックアップし、前記第2の範囲を使用して、前記第2のソースボリュームを前記第2のボリュームにバックアップするように前記記憶システムに周期的に命令するステップと
    をさらに含む請求項19に記載の方法。
JP2008144338A 2007-09-26 2008-06-02 データ重複除外を用いた電力効率的なデータ記憶 Expired - Fee Related JP5121581B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/902,824 2007-09-26
US11/902,824 US7870409B2 (en) 2007-09-26 2007-09-26 Power efficient data storage with data de-duplication

Publications (2)

Publication Number Publication Date
JP2009080788A true JP2009080788A (ja) 2009-04-16
JP5121581B2 JP5121581B2 (ja) 2013-01-16

Family

ID=40239628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008144338A Expired - Fee Related JP5121581B2 (ja) 2007-09-26 2008-06-02 データ重複除外を用いた電力効率的なデータ記憶

Country Status (3)

Country Link
US (2) US7870409B2 (ja)
EP (1) EP2042979A3 (ja)
JP (1) JP5121581B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009059096A (ja) * 2007-08-30 2009-03-19 Hitachi Ltd ストレージシステム及びストレージシステムの消費電力低減方法
JP2013054416A (ja) * 2011-09-01 2013-03-21 Fujitsu Ltd ストレージシステム、ストレージ制御装置およびストレージ制御方法

Families Citing this family (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2409936T3 (es) 2003-01-31 2013-06-28 Good Technology Corporation Recuperación asíncrona de datos en tiempo real
US20120166725A1 (en) * 2003-08-14 2012-06-28 Soran Philip E Virtual disk drive system and method with deduplication
US9489150B2 (en) 2003-08-14 2016-11-08 Dell International L.L.C. System and method for transferring data between different raid data storage types for current data and replay data
CN101566931B (zh) 2003-08-14 2011-05-18 克姆佩棱特科技公司 虚拟磁盘驱动系统和方法
DE102005023258A1 (de) * 2004-11-16 2006-11-23 Fan Separator Gmbh Drehtrommel zur aeroben Erwärmung rieselfähiger Feststoffe
JP2009538493A (ja) * 2006-05-24 2009-11-05 コンペレント・テクノロジーズ データ・プログレッション・ディスク局所性最適化のシステムおよび方法
US7870409B2 (en) * 2007-09-26 2011-01-11 Hitachi, Ltd. Power efficient data storage with data de-duplication
US9122397B2 (en) * 2007-10-26 2015-09-01 Emc Corporation Exposing storage resources with differing capabilities
US20090204636A1 (en) * 2008-02-11 2009-08-13 Microsoft Corporation Multimodal object de-duplication
US8484162B2 (en) 2008-06-24 2013-07-09 Commvault Systems, Inc. De-duplication systems and methods for application-specific data
US8060476B1 (en) 2008-07-14 2011-11-15 Quest Software, Inc. Backup systems and methods for a virtual computing environment
US8386494B2 (en) * 2008-08-07 2013-02-26 Hewlett-Packard Development Company, L.P. Providing data structures for determining whether keys of an index are present in a storage system
US8086799B2 (en) * 2008-08-12 2011-12-27 Netapp, Inc. Scalable deduplication of stored data
US8429649B1 (en) 2008-09-25 2013-04-23 Quest Software, Inc. Systems and methods for data management in a virtual computing environment
US8495032B2 (en) * 2008-10-01 2013-07-23 International Business Machines Corporation Policy based sharing of redundant data across storage pools in a deduplicating system
US8155766B2 (en) * 2008-11-03 2012-04-10 Hitachi, Ltd. Methods and apparatus to provision power-saving storage system
US8892676B2 (en) * 2008-11-07 2014-11-18 Compellent Technologies Thin import for a data storage system
US8108544B2 (en) * 2008-12-10 2012-01-31 At&T Intellectual Property I, Lp System and method for content validation
US8725690B1 (en) * 2008-12-19 2014-05-13 Emc Corporation Time and bandwidth efficient backups of space reduced data
US8560716B1 (en) 2008-12-19 2013-10-15 Emc Corporation Time and bandwidth efficient recoveries of space reduced data
US8712974B2 (en) 2008-12-22 2014-04-29 Google Inc. Asynchronous distributed de-duplication for replicated content addressable storage clusters
US8621166B1 (en) * 2009-02-09 2013-12-31 American Megatrends, Inc. Efficient backup of multiple versions of a file using data de-duplication
US20100211983A1 (en) * 2009-02-19 2010-08-19 Pixel8 Networks, Inc. Virtual private content delivery network and method thereof
US8688711B1 (en) 2009-03-31 2014-04-01 Emc Corporation Customizable relevancy criteria
US8996468B1 (en) 2009-04-17 2015-03-31 Dell Software Inc. Block status mapping system for reducing virtual machine backup storage
US8095756B1 (en) * 2009-04-28 2012-01-10 Netapp, Inc. System and method for coordinating deduplication operations and backup operations of a storage volume
US8930306B1 (en) * 2009-07-08 2015-01-06 Commvault Systems, Inc. Synchronized data deduplication
US9778946B2 (en) 2009-08-07 2017-10-03 Dell Software Inc. Optimized copy of virtual machine storage files
US8676759B1 (en) * 2009-09-30 2014-03-18 Sonicwall, Inc. Continuous data backup using real time delta storage
US8484412B2 (en) * 2009-11-05 2013-07-09 International Business Machines Corporation Power mode operation of a magnetic tape drive
US9235399B2 (en) 2010-01-15 2016-01-12 Dell Products L.P. System and method for manufacturing and personalizing computing devices
US10387927B2 (en) 2010-01-15 2019-08-20 Dell Products L.P. System and method for entitling digital assets
US9256899B2 (en) 2010-01-15 2016-02-09 Dell Products, L.P. System and method for separation of software purchase from fulfillment
US8548919B2 (en) * 2010-01-29 2013-10-01 Dell Products L.P. System and method for self-provisioning of virtual images
US9100396B2 (en) 2010-01-29 2015-08-04 Dell Products L.P. System and method for identifying systems and replacing components
US8429641B2 (en) * 2010-02-02 2013-04-23 Dell Products L.P. System and method for migration of digital assets
US9305069B2 (en) * 2010-02-09 2016-04-05 Google Inc. Method and system for uploading data into a distributed storage system
US8380659B2 (en) 2010-02-09 2013-02-19 Google Inc. Method and system for efficiently replicating data in non-relational databases
US8874523B2 (en) * 2010-02-09 2014-10-28 Google Inc. Method and system for providing efficient access to a tape storage system
US8744997B2 (en) * 2010-02-09 2014-06-03 Google Inc. Pruning of blob replicas
US8615485B2 (en) * 2010-02-09 2013-12-24 Google, Inc. Method and system for managing weakly mutable data in a distributed storage system
US8423517B2 (en) * 2010-02-09 2013-04-16 Google Inc. System and method for determining the age of objects in the presence of unreliable clocks
US8862617B2 (en) * 2010-02-09 2014-10-14 Google Inc. System and method for replicating objects in a distributed storage system
US20110196900A1 (en) * 2010-02-09 2011-08-11 Alexandre Drobychev Storage of Data In A Distributed Storage System
US8341118B2 (en) * 2010-02-09 2012-12-25 Google Inc. Method and system for dynamically replicating data within a distributed storage system
WO2011116087A2 (en) * 2010-03-16 2011-09-22 Copiun, Inc. Highly scalable and distributed data de-duplication
US8170783B2 (en) 2010-03-16 2012-05-01 Dell Products L.P. System and method for handling software activation in entitlement
US8453031B2 (en) 2010-03-24 2013-05-28 International Business Machines Corporation Data deduplication using CRC-seed differentiation between data and stubs
US9075532B1 (en) * 2010-04-23 2015-07-07 Symantec Corporation Self-referential deduplication
US8707087B2 (en) * 2010-05-18 2014-04-22 Dell Products L.P. Restoration of an image backup using information on other information handling systems
US9569446B1 (en) 2010-06-08 2017-02-14 Dell Software Inc. Cataloging system for image-based backup
CN103229161B (zh) 2010-08-24 2016-01-20 科派恩股份有限公司 连续接入网关和去重数据缓存服务器
US8898114B1 (en) * 2010-08-27 2014-11-25 Dell Software Inc. Multitier deduplication systems and methods
US8782361B2 (en) * 2010-08-31 2014-07-15 Hitachi, Ltd. Management server and data migration method with improved duplicate data removal efficiency and shortened backup time
US8572340B2 (en) 2010-09-30 2013-10-29 Commvault Systems, Inc. Systems and methods for retaining and using data block signatures in data protection operations
US8364652B2 (en) 2010-09-30 2013-01-29 Commvault Systems, Inc. Content aligned block-based deduplication
US10394757B2 (en) 2010-11-18 2019-08-27 Microsoft Technology Licensing, Llc Scalable chunk store for data deduplication
US9122641B1 (en) 2010-11-30 2015-09-01 Symantec Corporation On-premise data deduplication for cloud environments
US8438130B2 (en) * 2010-12-13 2013-05-07 International Business Machines Corporation Method and system for replicating data
US9116850B2 (en) 2010-12-14 2015-08-25 Commvault Systems, Inc. Client-side repository in a networked deduplicated storage system
US9020900B2 (en) 2010-12-14 2015-04-28 Commvault Systems, Inc. Distributed deduplicated storage system
US9280550B1 (en) 2010-12-31 2016-03-08 Emc Corporation Efficient storage tiering
US8886901B1 (en) 2010-12-31 2014-11-11 Emc Corporation Policy based storage tiering
US8886914B2 (en) 2011-02-24 2014-11-11 Ca, Inc. Multiplex restore using next relative addressing
US9575842B2 (en) 2011-02-24 2017-02-21 Ca, Inc. Multiplex backup using next relative addressing
JP5282795B2 (ja) * 2011-02-25 2013-09-04 ブラザー工業株式会社 情報通信システム、情報処理方法、ノード装置及びプログラム
US9823981B2 (en) * 2011-03-11 2017-11-21 Microsoft Technology Licensing, Llc Backup and restore strategies for data deduplication
JP5501280B2 (ja) * 2011-03-31 2014-05-21 株式会社日立ソリューションズ 情報処理システム、バックアップ管理方法、及びプログラム
US8954399B1 (en) * 2011-04-18 2015-02-10 American Megatrends, Inc. Data de-duplication for information storage systems
CN102184198B (zh) * 2011-04-22 2016-04-27 张伟 适用于工作负载保护系统的重复数据删除方法
WO2013008264A1 (en) * 2011-07-08 2013-01-17 Hitachi, Ltd. Storage system and its data processing method
US8990171B2 (en) 2011-09-01 2015-03-24 Microsoft Corporation Optimization of a partially deduplicated file
US10324893B1 (en) * 2011-12-15 2019-06-18 Veritas Technologies Llc Backup application catalog analyzer
WO2013093960A1 (en) * 2011-12-20 2013-06-27 Hitachi, Ltd. Storage system and method for controlling storage system
WO2013119201A1 (en) * 2012-02-06 2013-08-15 Hewlett-Packard Development Company, L.P. De-duplication
US9311375B1 (en) 2012-02-07 2016-04-12 Dell Software Inc. Systems and methods for compacting a virtual machine file
US10402393B2 (en) * 2012-03-02 2019-09-03 Pure Storage, Inc. Slice migration in a dispersed storage network
US11232093B2 (en) 2012-03-02 2022-01-25 Pure Storage, Inc. Slice migration in a dispersed storage network
WO2013159337A1 (zh) * 2012-04-27 2013-10-31 华为技术有限公司 存储控制设备、数据归档存储系统和数据存取方法
US20130339298A1 (en) 2012-06-13 2013-12-19 Commvault Systems, Inc. Collaborative backup in a networked storage system
US8949401B2 (en) 2012-06-14 2015-02-03 Dell Products L.P. Automated digital migration
US9880771B2 (en) * 2012-06-19 2018-01-30 International Business Machines Corporation Packing deduplicated data into finite-sized containers
US8468139B1 (en) 2012-07-16 2013-06-18 Dell Products L.P. Acceleration of cloud-based migration/backup through pre-population
US9779219B2 (en) 2012-08-09 2017-10-03 Dell Products L.P. Method and system for late binding of option features associated with a device using at least in part license and unique ID information
US9465808B1 (en) 2012-12-15 2016-10-11 Veritas Technologies Llc Deduplication featuring variable-size duplicate data detection and fixed-size data segment sharing
US9633033B2 (en) 2013-01-11 2017-04-25 Commvault Systems, Inc. High availability distributed deduplicated storage system
US9244937B2 (en) * 2013-03-15 2016-01-26 International Business Machines Corporation Efficient calculation of similarity search values and digest block boundaries for data deduplication
US9116941B2 (en) 2013-03-15 2015-08-25 International Business Machines Corporation Reducing digest storage consumption by tracking similarity elements in a data deduplication system
US9678975B2 (en) * 2013-03-15 2017-06-13 International Business Machines Corporation Reducing digest storage consumption in a data deduplication system
US9547662B2 (en) 2013-03-15 2017-01-17 International Business Machines Corporation Digest retrieval based on similarity search in data deduplication
JP5444506B1 (ja) * 2013-03-29 2014-03-19 株式会社東芝 データの重複をハッシュテーブルに基づいて排除するためのストレージシステム
US8868954B1 (en) * 2013-05-21 2014-10-21 Microsoft Corporation Low cost storage for rarely read data
US10157107B2 (en) * 2013-07-03 2018-12-18 Catalogic Software, Inc. Data backup and progressive restoration using data chunks in cloud storage and a data cache
JP6197666B2 (ja) * 2014-01-27 2017-09-20 富士通株式会社 記憶装置、複製方法及び複製プログラム
US10380072B2 (en) 2014-03-17 2019-08-13 Commvault Systems, Inc. Managing deletions from a deduplication database
RU2659455C2 (ru) * 2014-03-17 2018-07-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для управления скачиванием файла в облачном сервисе хранения
US9305036B2 (en) 2014-03-27 2016-04-05 International Business Machines Corporation Data set management using transient data structures
US9658774B2 (en) * 2014-07-09 2017-05-23 Hitachi, Ltd. Storage system and storage control method
US9116853B1 (en) * 2014-08-20 2015-08-25 International Business Machines Corporation Tape backup and restore in a disk storage environment
CN106663052A (zh) * 2014-09-11 2017-05-10 株式会社东芝 文件系统、数据重复排除方法以及用于文件系统的程序
CN104298614B (zh) * 2014-09-30 2017-08-11 华为技术有限公司 数据块在存储设备中存储方法和存储设备
US9575673B2 (en) 2014-10-29 2017-02-21 Commvault Systems, Inc. Accessing a file system using tiered deduplication
US10339106B2 (en) 2015-04-09 2019-07-02 Commvault Systems, Inc. Highly reusable deduplication database after disaster recovery
US20160350391A1 (en) 2015-05-26 2016-12-01 Commvault Systems, Inc. Replication using deduplicated secondary copy data
JP6666540B2 (ja) * 2015-06-15 2020-03-18 富士通株式会社 ストレージ制御装置、及びプログラム
US10061663B2 (en) 2015-12-30 2018-08-28 Commvault Systems, Inc. Rebuilding deduplication data in a distributed deduplication data storage system
US10282124B2 (en) * 2016-06-23 2019-05-07 International Business Machines Corporation Opportunistic handling of freed data in data de-duplication
CN106648959B (zh) * 2016-09-07 2020-03-10 华为技术有限公司 数据存储的方法和存储系统
US10838753B2 (en) * 2018-02-21 2020-11-17 Red Hat, Inc. Efficient memory deduplication by hypervisor initialization
CN109445703B (zh) * 2018-10-26 2019-10-25 黄淮学院 一种基于块级数据去重的Delta压缩存储组件
US11010258B2 (en) 2018-11-27 2021-05-18 Commvault Systems, Inc. Generating backup copies through interoperability between components of a data storage management system and appliances for data storage and deduplication
US11698727B2 (en) 2018-12-14 2023-07-11 Commvault Systems, Inc. Performing secondary copy operations based on deduplication performance
US20200327017A1 (en) 2019-04-10 2020-10-15 Commvault Systems, Inc. Restore using deduplicated secondary copy data
US11463264B2 (en) 2019-05-08 2022-10-04 Commvault Systems, Inc. Use of data block signatures for monitoring in an information management system
CN110688073B (zh) * 2019-10-10 2023-07-14 深圳市网心科技有限公司 数据存储方法、电子设备、系统及介质
US20210173811A1 (en) 2019-12-04 2021-06-10 Commvault Systems, Inc. Optimizing the restoration of deduplicated data stored in multi-node replicated file systems
CN111159068B (zh) * 2019-12-30 2022-04-22 联想(北京)有限公司 信息处理方法和电子设备
CN113626251A (zh) * 2020-05-06 2021-11-09 伊姆西Ip控股有限责任公司 用于迁移备份系统的方法、设备和计算机程序产品
US11687424B2 (en) 2020-05-28 2023-06-27 Commvault Systems, Inc. Automated media agent state management

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007156597A (ja) * 2005-12-01 2007-06-21 Hitachi Ltd ストレージ装置
WO2007089502A1 (en) * 2006-01-26 2007-08-09 Network Appliance, Inc. Content addressable storage array element
JP2009059096A (ja) * 2007-08-30 2009-03-19 Hitachi Ltd ストレージシステム及びストレージシステムの消費電力低減方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297124A (en) 1992-04-24 1994-03-22 Miltope Corporation Tape drive emulation system for a disk drive
US7035972B2 (en) 2002-09-03 2006-04-25 Copan Systems, Inc. Method and apparatus for power-efficient high-capacity scalable storage system
US6928526B1 (en) 2002-12-20 2005-08-09 Datadomain, Inc. Efficient data storage system
US20080104081A1 (en) * 2006-10-30 2008-05-01 Yasuyuki Mimatsu Tiered storage system with single instance function
US7840657B2 (en) * 2006-10-31 2010-11-23 Oracle America, Inc. Method and apparatus for power-managing storage devices in a storage pool
US7873809B2 (en) * 2007-03-29 2011-01-18 Hitachi, Ltd. Method and apparatus for de-duplication after mirror operation
US7669023B2 (en) * 2007-07-10 2010-02-23 Hitachi, Ltd. Power efficient storage with data de-duplication
US7870409B2 (en) * 2007-09-26 2011-01-11 Hitachi, Ltd. Power efficient data storage with data de-duplication

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007156597A (ja) * 2005-12-01 2007-06-21 Hitachi Ltd ストレージ装置
WO2007089502A1 (en) * 2006-01-26 2007-08-09 Network Appliance, Inc. Content addressable storage array element
JP2009059096A (ja) * 2007-08-30 2009-03-19 Hitachi Ltd ストレージシステム及びストレージシステムの消費電力低減方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009059096A (ja) * 2007-08-30 2009-03-19 Hitachi Ltd ストレージシステム及びストレージシステムの消費電力低減方法
JP2013054416A (ja) * 2011-09-01 2013-03-21 Fujitsu Ltd ストレージシステム、ストレージ制御装置およびストレージ制御方法

Also Published As

Publication number Publication date
EP2042979A3 (en) 2012-01-25
US20110072291A1 (en) 2011-03-24
US7870409B2 (en) 2011-01-11
JP5121581B2 (ja) 2013-01-16
EP2042979A2 (en) 2009-04-01
US8286019B2 (en) 2012-10-09
US20090083563A1 (en) 2009-03-26

Similar Documents

Publication Publication Date Title
JP5121581B2 (ja) データ重複除外を用いた電力効率的なデータ記憶
US7669023B2 (en) Power efficient storage with data de-duplication
US11461015B2 (en) Available storage space in a system with varying data redundancy schemes
US7975115B2 (en) Method and apparatus for separating snapshot preserved and write data
US8566517B1 (en) System, method and computer program product for optimization of tape performance using distributed file copies
US8001345B2 (en) Automatic triggering of backing store re-initialization
US8271718B2 (en) Storage system and control method for the same, and program
US8204858B2 (en) Snapshot reset method and apparatus
US7783603B2 (en) Backing store re-initialization method and apparatus
US20180267856A1 (en) Distributed storage system, data storage method, and software program
US20120117029A1 (en) Backup policies for using different storage tiers
US20060053250A1 (en) Storage system and data management device for storage system
US20100235597A1 (en) Method and apparatus for conversion between conventional volumes and thin provisioning with automated tier management
US8850142B2 (en) Enhanced virtual storage replication
US20080270699A1 (en) System for controlling spinning of disk
JP2007234026A (ja) ユニークブロックプールマネージャを含むデータ記憶システムおよび階層記憶装置における応用
US20120260038A1 (en) Storage apparatus and volume management method
JP2009059096A (ja) ストレージシステム及びストレージシステムの消費電力低減方法
US9268785B2 (en) Preserving redundancy in data deduplication systems by designation of virtual address
US20190065382A1 (en) Storage device initiated copy back operation
US7849280B2 (en) Storage system and power consumption reduction method, and information processing apparatus
US8171324B2 (en) Information processing device, data writing method, and program for the same
US8938596B2 (en) Storage apparatus, control apparatus, and storage apparatus control method
JP2004013786A (ja) データ記憶方法およびデータ記憶制御装置
WO2015145707A1 (ja) 追記型記憶装置への書き込みデータ決定方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090223

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120925

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121023

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5121581

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees