JP4968218B2 - Disk storage device, data backup system, data relocation method, and program - Google Patents
Disk storage device, data backup system, data relocation method, and program Download PDFInfo
- Publication number
- JP4968218B2 JP4968218B2 JP2008232282A JP2008232282A JP4968218B2 JP 4968218 B2 JP4968218 B2 JP 4968218B2 JP 2008232282 A JP2008232282 A JP 2008232282A JP 2008232282 A JP2008232282 A JP 2008232282A JP 4968218 B2 JP4968218 B2 JP 4968218B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- access
- time zone
- disk
- disk medium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 28
- 230000008707 rearrangement Effects 0.000 claims description 29
- 230000010076 replication Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 19
- 238000010586 diagram Methods 0.000 description 10
- 238000005070 sampling Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000003362 replicative effect Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Description
本発明は、ディスク記憶装置、データバックアップシステム、データ再配置方法及びプログラムに関し、特に、バックアップ対象データを複製(レプリカ)したレプリケーションデータを記憶するディスク記憶装置、データバックアップシステム、データ再配置方法及びプログラムに関する。 The present invention relates to a disk storage device, a data backup system, a data relocation method, and a program, and more particularly to a disk storage device, a data backup system, a data relocation method, and a program for storing replication data obtained by replicating (replicating) backup target data. About.
近年、業務用ストレージのデータバックアップ手法として、バックアップ中の業務停止時間を短縮する為に、業務データとは異なる物理ディスクに作成したレプリカからテープ等のバックアップ用媒体にバックアップすることが行われている。 In recent years, as a data backup method for business storage, in order to reduce the business stop time during backup, backup from a replica created on a physical disk different from business data to a backup medium such as tape has been performed. .
また、物理ディスクの大容量化に伴い、一つの物理ディスクから論理LUN(Logical Unit Number)と呼ばれる仮想的な物理ディスクを作成し、パーティションを設定してサーバに参照させる方式も一般化している。例えば、システム更新の際に、論理LUNのサイズを合せるだけで、実際の物理ディスク容量の差異を意識することなくデータ移行を行うことができる。 As the capacity of a physical disk increases, a method of creating a virtual physical disk called a logical LUN (Logical Unit Number) from one physical disk, setting a partition, and referring to the server is also generalized. For example, when the system is updated, it is possible to perform data migration without being aware of the difference in actual physical disk capacity by simply combining the logical LUN sizes.
一方、コスト削減の観点より、レプリカ用の物理ディスクとしては、より大容量のものを少数だけ実装される傾向にある。また、保護方式もRAID1(ミラー)より安価なRAID5(パリティ)が採用される傾向にあるため、物理ディスクから切り出される論理LUN数は、オリジナル(複製元)の物理ディスクの数の数倍になる。 On the other hand, from the viewpoint of cost reduction, there is a tendency that only a small number of replica physical disks are mounted. Further, since RAID 5 (parity), which is cheaper than RAID 1 (mirror), tends to be adopted as the protection method, the number of logical LUNs cut out from the physical disk is several times the number of original (replication source) physical disks. .
特許文献1に、磁気ディスクや光ディスク等のディスクにおけるデータを書き込む際に、最後にアクセスしたセクタの最も近くの空きセクタにデータを書き込むようにし、シーク時間の短縮を実現する情報処理システムが提案されている。
特許文献2には、複数の回転型記憶装置に同一データを多重に格納する記憶装置において、上位装置からのアクセス形態やデータの使用目的に応じて、予め回転型記憶装置のデータ配置(内周側/外周側等)を決めておき、アクセス要求時に、制御装置が該データ配置にあわせたアクセスを実行する記憶装置が開示されている。
In
図14は、業務サーバA(11)と、業務サーバAとは別の業務に用いる業務サーバB(12)を有する業務システムにおけるディスクストレージ装置100の構成を表した図である。破線21、22、23はそれぞれ物理ディスクを表している。物理ディスク21、22には、業務サーバA(11)用のLUNと、その他LUNが構成され、物理ディスク23には、業務サーバB(12)用のLUNと、その他LUNが構成されている。また、一点鎖線24は、物理ディスク21、22の業務サーバA(11)用のLUNを用いてストライピング(RAID0)による高速化が図られていることを示している。
FIG. 14 is a diagram showing the configuration of the disk storage device 100 in a business system having a business server A (11) and a business server B (12) used for business different from the business server A. Dashed
ここで、物理ディスク31は、レプリカ用物理ディスクであり、3つの物理ディスク21、22、23のデータを記憶できる、必要十分な大きさを持っているものとする。バックアップサーバ40は、予め設定したバックアップスケジュールに従って、物理ディスク31からテープ装置41にバックアップを作成する。
Here, the
図14に示したように、物理ディスク21、22、23に含まれる論理LUN数が多くなると、レプリケーション先の物理ディスク31には複数の論理LUNが存在することになる。特に、一点鎖線24で表したように、複数の論理LUNをボリュームマネージャのストライプ(RAID0)機能で高速化している場合等は、複数の論理LUNへの同時アクセスによりスループットが大幅に低下してしまう。
As illustrated in FIG. 14, when the number of logical LUNs included in the
図15は、レプリケーション先の物理ディスク31におけるブロックの配置状況を表した図であり、図中の数値は各ブロックに対するアクセス時刻を表している。図15のように、物理ディスク単位でレプリケーションが行われている場合、複数の論理LUNにわたってアクセスが発生しないバックアップスケジュールを作成することは困難である。例えば、業務サーバA用の論理LUNのバックアップを取る場合、物理ディスク31へのアクセスが広範囲に分散し、シーク時間が大きくなってしまうのである。
FIG. 15 is a diagram showing the block arrangement status in the replication destination
本発明は、上記した事情に鑑みてなされたものであって、その目的とするところは、上記レプリカ用の物理ディスクからバックアップを作成する際のスループットの低下を抑えることができるディスク記憶装置、データバックアップシステム、データ再配置方法及びプログラムを提供することにある。 The present invention has been made in view of the above-described circumstances, and the object of the present invention is to provide a disk storage device and data that can suppress a decrease in throughput when creating a backup from the replica physical disk. To provide a backup system, a data relocation method, and a program.
本発明の第1の視点によれば、複製元のデータを複製したレプリケーションデータを格納するディスク媒体と、前記ディスク媒体へのアクセスパターンを観測し、該観測されたアクセスパターンにおけるデータアクセス順序に従い、前記ディスク媒体におけるデータ配置順序を決定する手段と、前記データ配置順序に従ってレプリケーションデータを再配置する手段と、を備えるディスク記憶装置が提供される。 According to the first aspect of the present invention, a disk medium that stores replication data obtained by replicating replication source data, and an access pattern to the disk medium are observed, and according to the data access order in the observed access pattern, There is provided a disk storage device comprising: means for determining a data arrangement order in the disk medium; and means for rearranging replication data according to the data arrangement order.
本発明の第2の視点によれば、複製元のデータを複製したレプリケーションデータを格納するディスク媒体へのアクセスパターンを観測し、該観測されたアクセスパターンにおけるデータアクセス順序に従い、前記ディスク媒体におけるデータ配置順序を決定し、前記データ配置順序に従って前記レプリケーションデータを再配置するデータ再配置方法が提供される。 According to the second aspect of the present invention, an access pattern to a disk medium storing replication data obtained by duplicating replication source data is observed, and the data in the disk medium is determined according to the data access order in the observed access pattern. There is provided a data rearrangement method for determining an arrangement order and rearranging the replication data according to the data arrangement order.
本発明の第3の視点によれば、複製元のデータを複製したレプリケーションデータを格納するディスク媒体へのアクセスパターンを観測し、該観測されたアクセスパターンにおけるデータアクセス順序に従い、前記ディスク媒体におけるデータ配置順序を決定する処理と、前記データ配置順序に従って、前記レプリケーションデータを再配置する処理とをコンピュータに実行させるプログラムが提供される。 According to the third aspect of the present invention, an access pattern to a disk medium that stores replication data obtained by duplicating replication source data is observed, and data in the disk medium is determined according to the data access order in the observed access pattern. There is provided a program for causing a computer to execute a process for determining an arrangement order and a process for rearranging the replication data according to the data arrangement order.
本発明によれば、キャッシュヒット率が上昇し、ディスク媒体からデータを読み出す際のスループットが向上する。また、これらの結果として、バックアップの所要時間を少なくすることができる。その理由は、バックアップが所定のバックアップスケジュールに基づいてなされるというバックアップの特性に着目し、観測されたアクセス状況と同様のアクセスが行われた場合に少ないシーク時間で済むように、実アクセス順序に基づくデータの局所化を行うようにしたことにある。 According to the present invention, the cache hit rate increases and the throughput when reading data from the disk medium is improved. As a result, the time required for backup can be reduced. The reason is that focusing on the backup characteristics that backup is performed based on a predetermined backup schedule, the actual access order is set so that less seek time is required when the same access as the observed access status is performed. This is based on the localization of the data based on it.
[発明の概要]
はじめに本発明の概要を説明する。図1は、本発明に係るディスク記憶装置によるデータの再配置処理を模式的に表した図である。図1の左側の図は、再配置処理前の物理ディスク31におけるブロックの配置状況を表した図であり、図中の数値は各ブロックに対するアクセス時刻(30分単位)を表している(図15と同一)。
[Summary of Invention]
First, the outline of the present invention will be described. FIG. 1 is a diagram schematically showing data rearrangement processing by the disk storage device according to the present invention. The diagram on the left side of FIG. 1 is a diagram showing the block arrangement status on the
そこで、本発明に係るディスク記憶装置は、上記物理ディスク31に対するアクセスを観測し、観測されたアクセスパターンが再現された場合にシーク時間が短くなるよう物理ディスクのデータを配置し直す。例えば、図15では「21:00」と表示された21:00〜21:29という時間帯にアクセスされたブロックは、図15の右側の図のように局所化するように再配置される。再配置後は、再配置前のデータアドレスから再配置後のデータアドレスを求めることのできるポインタテーブル等を用いて、アクセスすることができるようにする。以上により、次回以降のアクセスの際のシーク時間を短縮することが可能になる。また、キャッシュヒット率も向上させることが可能になる。
Therefore, the disk storage device according to the present invention observes access to the
[第1の実施形態]
続いて、本発明の第1の実施形態について図面を参照して詳細に説明する。図2は、本発明の一実施形態の構成を表したブロック図である。図2を参照すると、業務サーバ群11/12と、バックアップサーバ40と、接続されたディスクストレージ装置(ディスク記憶装置)100が示されている。
[First Embodiment]
Next, a first embodiment of the present invention will be described in detail with reference to the drawings. FIG. 2 is a block diagram showing the configuration of one embodiment of the present invention. Referring to FIG. 2, a business server group 11/12, a backup server 40, and a connected disk storage device (disk storage device) 100 are shown.
ディスクストレージ装置100は、業務用の磁気ディスク群21/22/23と、レプリカ用の磁気ディスク群31Aと、磁気ディスク制御機構60と、データ再配置部61とを備える。
The disk storage device 100 includes a business
業務用の磁気ディスク群21/22/23は、業務サーバ群11/12用の論理LUNが設定されたディスク群であり、図14の物理ディスク21〜23に相当する。
The business
レプリカ用の磁気ディスク群31Aは、業務用の磁気ディスク群21/22/23のレプリケーション先となるディスク群であり、図14の物理ディスク31に相当する。
The replica magnetic disk group 31A is a disk group serving as a replication destination of the business
磁気ディスク制御機構60は、業務サーバ群11/12及びバックアップサーバ40から、業務用の磁気ディスク群21/22/23及びレプリカ用の磁気ディスク群31Aへのアクセス要求に応じる。なお、レプリカ用の磁気ディスク群31Aへのアクセスに際しては、スナップショット等に利用されているものと同等のポインタテーブルが参照される。
The magnetic disk control mechanism 60 responds to an access request from the business server group 11/12 and the backup server 40 to the business
データ再配置部61は、バックアップサーバ40から磁気ディスク制御機構60へのアクセスを観測し(アクセス情報)、その結果に基づいて、レプリカ用の磁気ディスク群31Aにおけるデータ配置順序を示すポインタテーブルを作成・更新する。また、データ再配置部61は、作成・更新したポインタテーブルに基づいたデータの再配置を磁気ディスク制御機構60に指示する。本実施形態では、ポインタテーブルに基づき、業務用の磁気ディスク群21/22/23からレプリカ用の磁気ディスク群31Aに含まれる物理ディスクに全レプリケーションを行うことによりデータの再配置を行うものとする。
The data rearrangement unit 61 observes access from the backup server 40 to the magnetic disk control mechanism 60 (access information), and creates a pointer table indicating the data arrangement order in the replica magnetic disk group 31A based on the result. ·Update. The data rearrangement unit 61 instructs the magnetic disk control mechanism 60 to rearrange data based on the created / updated pointer table. In this embodiment, based on the pointer table, data is rearranged by performing full replication from the business use
図3は、データ再配置部61の具体的な構成の例を表したブロック図である。 FIG. 3 is a block diagram illustrating an example of a specific configuration of the data rearrangement unit 61.
総ブロック数記憶部61Aは、レプリケーション先となるレプリカ用の磁気ディスク群31Aに含まれる対象物理ディスクのブロック数を記憶する。
The total block
分割数記憶部61Bは、後記する再配置処理単位となる物理ディスクの分割数mを記憶する。物理ディスクの分割数としては、総ブロック数記憶部61Aに記憶されたブロック数よりも小さい値が設定される。ある程度の数のブロックをまとめた再配置処理単位を採用することにより、後記するソートや再配置処理を効率よく行うためである。もちろん、物理ディスクの分割数m=物理ディスクのブロック数とすることも可能である。
The division number storage unit 61B stores a division number m of a physical disk that is a rearrangement processing unit to be described later. As the number of divisions of the physical disk, a value smaller than the number of blocks stored in the total block
1領域あたりのブロック数記憶部61Cは、上記物理ディスクの分割数で分割された各領域に含まれるブロック数を記憶する。1領域あたりのブロック数は、総ブロック数記憶部61Aに記憶された総ブロック数を、分割数記憶部61Bに記憶された分割数で除することにより求めることができる。
The block
上記総ブロック数や分割数の設定を省略して、直接ユーザが1領域あたりのブロック数を設定できるようにしてもよい。 The setting of the total number of blocks and the number of divisions may be omitted, and the user may directly set the number of blocks per area.
第1メモリテーブル61Dは、図10に示すように、時間帯毎に、各領域へのアクセス回数を記録するm行n列のテーブルによって構成される。mは、分割数記憶部61Bに記憶された分割数であり、nは、観測時間やアクセス時刻の記録間隔によって決定される。例えば、24時間を観測期間とし、15分単位でアクセス数を記録する場合、n=24[h]×60[分]÷15[分]=96と算出され、t1〜t96の時間帯に区分される。 As shown in FIG. 10, the first memory table 61D is configured by a table of m rows and n columns that records the number of accesses to each area for each time period. m is the number of divisions stored in the division number storage unit 61B, and n is determined by the observation time and the recording interval of the access time. For example, when the number of accesses is recorded in units of 15 minutes with an observation period of 24 hours, n = 24 [h] × 60 [minutes] ÷ 15 [minutes] = 96, and is divided into time zones t1 to t96. Is done.
第2メモリテーブル61Eは、図11に示すように、第1メモリテーブル61Dを参照して、各領域における最もアクセスの多かった時間帯を記録するm行2列のテーブルである。 As shown in FIG. 11, the second memory table 61E refers to the first memory table 61D, and is an m-row / 2-column table that records the most frequently accessed time zone in each area.
第1ブロック番号オフセット記憶部61G、第2ブロック番号オフセット記憶部61H、同時間帯の領域数記憶部61I、処理中時間帯記憶部61J、ブロック数カウンタ61Kは、ポインタテーブルの作成時に使用する各種変数を格納する。
The first block number offset
アクセス監視手段62は、物理ディスクに対するアクセスを監視し、第1メモリテーブル61Dに記録する手段である。 The access monitoring means 62 is a means for monitoring access to the physical disk and recording it in the first memory table 61D.
アクセス時間帯抽出手段63は、第1メモリテーブル61Dを参照して、各領域の領域番号と、各領域における最もアクセスの多かった時間帯との組みを前記第2メモリテーブルに記録する。
The access time
ポインタテーブル作成手段64は、処理変数が格納される第1ブロック番号オフセット記憶部61G、第2ブロック番号オフセット記憶部61H、同時間帯の領域数記憶部61I、処理中時間帯記憶部61J、ブロック数カウンタ61Kを参照して、第2メモリテーブル61Eから、データ配置順序(ポインタテーブル)を作成する(図13参照)。
The pointer table creation means 64 includes a first block number offset
なお、上記したデータ再配置部61及びその各処理手段は、ハードウェアにより構成することも可能であるが、ディスクストレージ装置100に搭載されたコンピュータに実行させるプログラムにより実現することが可能である。 The data rearrangement unit 61 and each processing unit described above can be configured by hardware, but can also be realized by a program executed by a computer installed in the disk storage device 100.
続いて、本実施形態のデータ再配置処理の流れについて図面を参照して詳細に説明する。 Next, the flow of data rearrangement processing according to this embodiment will be described in detail with reference to the drawings.
[事前準備]
まず、事前準備として以下のとおり初期値の設定や初期化が行われる。図4は、事前準備において行われる処理フローチャートの例である。
[Advance preparation]
First, as an advance preparation, initial values are set and initialized as follows. FIG. 4 is an example of a process flowchart performed in advance preparation.
まず、総ブロック数記憶部61Aに物理ディスクのブロック数を設定する(ステップJ1)。
First, the number of physical disk blocks is set in the total block
次に、分割数記憶部61Bに、物理ディスクの分割数をセットする(ステップJ2)。 Next, the division number of the physical disk is set in the division number storage unit 61B (step J2).
次に、一つの領域に含まれるブロック数を算出し、1領域あたりのブロック数記憶部61Cに設定する(ステップJ3)。
Next, the number of blocks included in one area is calculated and set in the block
次に、初期化処理を行う。具体的には、第1メモリテーブル61D、第1ブロック番号オフセット記憶部61G及び同時間帯の領域数記憶部61Iに0を設定する。処理中時間帯記憶部61Jに−1を設定する(ステップJ4)。
Next, initialization processing is performed. Specifically, 0 is set in the first memory table 61D, the first block number offset
[データ再配置処理−サンプリング]
図5は、データ再配置処理の流れを表したフローチャートである。始めに、データ再配置部61は、物理ディスクへの個々のブロックへのアクセス回数と時間帯を記録するサンプリング処理を実行する(ステップA1)。サンプリング処理は、一定のサンプリング期間(例えば、12時間、24時間等)を設定して行われる。
[Data relocation processing-sampling]
FIG. 5 is a flowchart showing the flow of the data rearrangement process. First, the data rearrangement unit 61 executes a sampling process for recording the number of accesses to each block to the physical disk and the time zone (step A1). The sampling process is performed by setting a certain sampling period (for example, 12 hours, 24 hours, etc.).
図6は、サンプリング処理の流れを表したフローチャートである。まず、データ再配置部61は、対象の物理ディスクにREADアクセスが発生した際、アクセス先のブロック番号と時刻を検出する(ステップB1)。 FIG. 6 is a flowchart showing the flow of the sampling process. First, the data relocation unit 61 detects the block number and time of the access destination when the READ access has occurred to the target physical disk (step B1).
次に、データ再配置部61内のアクセス監視手段62が、前記検出したブロックが属する領域番号と時刻に対応する第1メモリテーブルの欄の値を1加算する(ステップB2)。 Next, the access monitoring means 62 in the data rearrangement unit 61 adds 1 to the area number to which the detected block belongs and the value in the first memory table column corresponding to the time (step B2).
以上の処理が、前述したサンプリング期間を経過するまで継続される(ステップB3のNo)。 The above processing is continued until the above-described sampling period elapses (No in step B3).
図10は、上記サンプリングに時間帯毎のアクセスが記憶された第1メモリテーブルを表している。図10のt1〜tnは、所定のサンプリング時間間隔により設定された時間帯を示している。例えば、領域番号3は、時間帯t3に8回のアクセスを受けていることを読み取ることができる。
FIG. 10 shows a first memory table in which access for each time period is stored in the sampling. In FIG. 10, t1 to tn indicate time zones set by predetermined sampling time intervals. For example, it can be read that the
[データ再配置処理−アクセス時間帯の集計]
次に、データ再配置部61内のアクセス時間帯抽出手段63が起動され、第1のメモリテーブル61Dを参照して、各領域についてアクセス数の最も多い時間帯を探し、その領域のアクセス時間帯に設定する処理が行われる(図5のステップA2)。
[Data relocation processing-Total access time]
Next, the access time zone extraction means 63 in the data rearrangement unit 61 is activated, refers to the first memory table 61D, searches for the time zone having the largest number of accesses for each area, and accesses the access time zone for that area. Is set (step A2 in FIG. 5).
図7は、アクセス時間帯の抽出処理の流れを表したフローチャートである。まず、アクセス時間帯抽出手段63は、第1メモリテーブル61Dから一行読み出し、アクセス回数が最も大きい時間帯を抽出とする(ステップC1)。 FIG. 7 is a flowchart showing the flow of access time zone extraction processing. First, the access time zone extracting means 63 reads one row from the first memory table 61D and extracts the time zone having the largest number of accesses (step C1).
次に、アクセス時間帯抽出手段63は、前記読み出した行の領域番号と、前記抽出したアクセス時間帯と、の組を第2メモリテーブル61Eに記憶する(ステップC2)。図11は、図10の第1メモリテーブル61Dから一行ずつアクセス回数が大きい時間帯を抽出した結果を示している。 Next, the access time zone extracting means 63 stores the set of the read row area number and the extracted access time zone in the second memory table 61E (step C2). FIG. 11 shows a result of extracting a time zone in which the number of accesses is large for each row from the first memory table 61D of FIG.
以上の処理は、第1メモリテーブル61Dのすべての行についてアクセス時間帯の抽出が完了するまで継続される(ステップC3のNo)。 The above process is continued until the extraction of the access time period is completed for all the rows of the first memory table 61D (No in Step C3).
第1メモリテーブル61Dのすべての行についてアクセス時間帯の抽出が完了すると(ステップC3のYes)、次に、ポインタテーブル作成手段64が起動される。 When the extraction of the access time zone is completed for all the rows of the first memory table 61D (Yes in step C3), the pointer table creation means 64 is then activated.
ポインタテーブル作成手段64は、第2メモリテーブル61Eの各行をアクセス時間帯の順にソートする(ステップA3)。図12は、図11の第2メモリテーブル61Eをアクセス時間帯でソート(昇順)した状態を示している。 The pointer table creation means 64 sorts each row of the second memory table 61E in the order of the access time zone (step A3). FIG. 12 shows a state where the second memory table 61E of FIG. 11 is sorted (in ascending order) by the access time zone.
ポインタテーブル作成手段64は、上記ソートした第2メモリテーブル61Eを用いてデータ配置順序(ポインタテーブル)の作成を開始する(ステップA4)。 The pointer table creation means 64 starts creating the data arrangement order (pointer table) using the sorted second memory table 61E (step A4).
図8は、データ配置順序(ポインタテーブル)の作成処理の流れを表したフローチャートである。まず、ポインタテーブル作成手段64は、第2メモリテーブル61Eから1行読み出し(ステップD1)、当該行のアクセス時間帯と、処理中時間帯記憶部61Jに記憶されている時間帯と比較する(ステップD2)。
FIG. 8 is a flowchart showing the flow of processing for creating the data arrangement order (pointer table). First, the pointer
ここで、読み出した行のアクセス時間帯が変化している場合(ステップD2のYes)、ポインタテーブル作成手段64は、処理中時間帯記憶部61Jの値を更新するとともに(ステップD3)、第2メモリテーブル61Eを参照してアクセス時間帯が同一の領域数(行数)を算出し、同時間帯の領域数記憶部61Iに記憶する(ステップD4)。
Here, when the access time zone of the read row has changed (Yes in Step D2), the pointer table creation means 64 updates the value of the processing time
次に、ポインタテーブル作成手段64は、第2ブロック番号オフセット記憶部61Hの値を0とし、第1ブロック番号オフセット記憶部61Gに、同時間帯の領域数記憶部61Iの値をセットする(ステップD5)。第2ブロック番号オフセット記憶部61Hの値は、後記するブロック番号の書き出しに用いられる。
Next, the pointer table creation means 64 sets the value of the second block number offset
なお、読み出した行のアクセス時間帯が変化していない場合(ステップD2のNo)、ポインタテーブル作成手段64は、第2ブロック番号オフセット記憶部61Hの値を1加算する処理を行う(ステップD6)。
If the access time zone of the read row has not changed (No in step D2), the pointer
以上のブロック番号の書き出し準備が完了すると、ポインタテーブル作成手段64は、ブロック数カウンタ61Kを0で初期化し、第2メモリテーブル61Eから読み出した行をデータ配置順序(ポインタテーブル)に書き出す処理を実行する(ステップD7)。
When the above block number writing preparation is completed, the pointer table creating means 64 initializes the
図9は、第2メモリテーブル61Eから読み出した行をデータ配置順序(ポインタテーブル)に書き出す処理の流れを表したフローチャートである。まず、ポインタテーブル作成手段64は、第2メモリテーブル61Eから読み出した行の領域番号を用いて下記のとおり、データ配置順序(ポインタテーブル)61Fの該当行にブロック番号を記録する。
行番号:読み出した行の領域番号×1領域あたりのブロック数+ブロック数カウンタ値
記録内容(ブロック番号):ブロック数カウンタ値×同時間帯の領域数+第1ブロック番号オフセット+第2ブロック番号オフセット
FIG. 9 is a flowchart showing a flow of processing for writing out the row read from the second memory table 61E in the data arrangement order (pointer table). First, the pointer table creating means 64 records the block number in the corresponding row of the data arrangement order (pointer table) 61F using the area number of the row read from the second memory table 61E as follows.
Row number: area number of read row × number of blocks per area + block number counter value Recorded content (block number): block number counter value × number of areas in the same time zone + first block number offset + second block number offset
上記1領域あたりのブロック数は、1領域あたりのブロック数記憶部61Cに記憶されている。ブロック数カウンタ値は、ブロック数カウンタ61Kに記憶されている。また、同時間帯の領域数は、同時間帯の領域数記憶部61Iに記憶されている。第1、第2ブロック番号オフセットは、それぞれ第1ブロック番号オフセット記憶部61G、第2ブロック番号オフセット記憶部61Hに記憶されている。
The number of blocks per area is stored in the block
ポインタテーブル作成手段64は、ブロック数カウンタ61Kの値を1加算する(ステップE2)。以上の処理は、ブロック数カウンタ61Kの値が、1領域あたりのブロック数に達するまで継続される(ステップE3)。
The pointer table creating means 64 adds 1 to the value of the
第2メモリテーブル61Eから読み出した行のブロックの書き出しが完了すると、ポインタテーブル作成手段64は、第2メモリテーブル61Eの全行(全領域)の書き出しが完了したか否かを確認する(ステップD8)。 When the writing of the block of the row read from the second memory table 61E is completed, the pointer table creating means 64 checks whether or not the writing of all the rows (all areas) of the second memory table 61E is completed (Step D8). ).
ここで、第2メモリテーブル61Eの全行(全領域)の書き出しが完了していない場合ポインタテーブル作成手段64は、ステップD1に戻って、第2メモリテーブル61Eの次の行について処理を継続する(ステップD8のNo)。 Here, when writing of all the rows (all areas) of the second memory table 61E is not completed, the pointer table creating means 64 returns to step D1 and continues the processing for the next row of the second memory table 61E. (No in step D8).
以上の結果、ソート後の第2メモリテーブル61Eにおける順序に従って各行に含まれるブロック番号の書き出しが行われる。図13は、図12の第2メモリテーブル61Eから作成されたデータ配置情報(ポインタテーブル)の例である。 As a result, the block numbers included in each row are written according to the order in the second memory table 61E after sorting. FIG. 13 is an example of data arrangement information (pointer table) created from the second memory table 61E of FIG.
最後に、上記のようにしてデータ配置順序(ポインタテーブル)の作成・更新が完了すると、データ再配置部61は、業務データ用の物理ディスクからレプリカ用の物理ディスクに、全ブロックのデータをコピーする(ステップA5)。例えば、図13のとおりに、物理ディスク31のブロックが再配置されることでシーク時間が最小化され、次回以降、同様のアクセスが行われた場合に、高速にアクセスすることが可能になる。
Finally, when the creation / update of the data arrangement order (pointer table) is completed as described above, the data rearrangement unit 61 copies the data of all blocks from the business data physical disk to the replica physical disk. (Step A5). For example, as shown in FIG. 13, the seek time is minimized by rearranging the blocks of the
特に、本実施形態では、所定のサンプリング期間を定めて物理ディスクへのアクセス状況を観測し、その結果から、最もアクセス回数が多かった時間帯をアクセス時間帯として抽出し、データの再配置プランを作成することとしているため、実効性の高いデータ再配置を行うことが可能になる。 In particular, in this embodiment, a predetermined sampling period is set and the access status to the physical disk is observed, and from the result, the time zone with the highest number of accesses is extracted as the access time zone, and the data relocation plan is determined. Therefore, it is possible to perform highly effective data rearrangement.
なお、本実施形態では、業務データ用の物理ディスクからレプリカ用の物理ディスクに、全ブロックのデータをコピーすることによりデータの再配置を行うものとして説明したが、ディスクストレージ装置100が別途作業用メモリエリアを有している場合には、該エリアを利用してデータの再配置を行うこととしてもよい。 In the present embodiment, the data relocation is performed by copying the data of all blocks from the physical disk for business data to the physical disk for replica. However, the disk storage apparatus 100 is separately used for work. When a memory area is provided, data rearrangement may be performed using the area.
以上、本発明の好適な実施形態を説明したが、本発明は、上記した実施形態に限定されるものではなく、本発明の基本的技術的思想を逸脱しない範囲で、更なる変形・置換・調整を加えることができる。例えば、上記したデータ再配置部の構成や処理フローチャートは、あくまでその一例を示したものに過ぎず、実際のアクセスパターンに従い、データを並び替え局所化することができる構成・処理を採用することが可能である。 The preferred embodiments of the present invention have been described above. However, the present invention is not limited to the above-described embodiments, and further modifications, replacements, and replacements may be made without departing from the basic technical idea of the present invention. Adjustments can be made. For example, the configuration and processing flowchart of the data rearrangement unit described above is merely an example, and it is possible to adopt a configuration and processing that can rearrange and localize data according to an actual access pattern. Is possible.
例えば、上記した実施形態では、アクセス監視手段62を備えて、アクセスパターンを入手するものとして説明したが、バックアップサーバ40等から入手したバックアップスケジュールに基づいて、データアクセス順序を導出するものとしても良い。更に、バックアップスケジュールが更新されたタイミングでデータの再配置を行うものとすれば、バックアップスケジュール更新直後のスループットの低下を抑えることが可能になる。
For example, in the above-described embodiment, the
上記した実施形態のデータストレージ装置100を、図2、図14等に示したバックアップサーバ40と連携させれば、より効率的なバックアップを行いうるデータバックアップシステムが提供される。 If the data storage device 100 of the above-described embodiment is linked to the backup server 40 shown in FIGS. 2 and 14, a data backup system capable of performing more efficient backup is provided.
11 業務サーバA
12 業務サーバB
21、22、23 物理ディスク(複製元)
24 RAID0(ストライプ)構成
31 物理ディスク(レプリカ用)
31A 磁気ディスク群(レプリカ用)
40 バックアップサーバ
41 テープ装置
60 磁気ディスク制御機構
61 データ再配置部
61A 総ブロック数記憶部
61B 分割数記憶部
61C 1領域あたりのブロック数記憶部
61D 第1メモリテーブル
61E 第2メモリテーブル
61F データ配置順序(ポインタテーブル)
61G 第1ブロック番号オフセット記憶部
61H 第2ブロック番号オフセット記憶部
61I 同時間帯の領域数記憶部
61J 処理中時間帯記憶部
61K ブロック数カウンタ
62 アクセス監視手段
63 アクセス時間帯抽出手段
64 ポインタテーブル作成手段
100 ディスクストレージ装置(ディスク記憶装置)
11 Business server A
12 Business server B
21, 22, 23 Physical disk (replication source)
24 RAID 0 (stripe)
31A Magnetic disk group (for replica)
40 Backup Server 41 Tape Device 60 Magnetic Disk Control Mechanism 61
61G First block number offset
Claims (5)
前記ディスク媒体へのアクセスパターンを観測し、該観測されたアクセスパターンにおけるデータアクセス順序に従い、前記ディスク媒体におけるデータ配置順序を決定する手段と、
前記データ配置順序に従ってレプリケーションデータを再配置する手段と、を有し、
前記ディスク媒体におけるデータ配置順序を決定する手段は、
前記ディスク媒体の記憶領域を所定のサイズで分割し、各分割された領域に対する、所定の時間区分におけるアクセス回数を記録し、
前記各分割された領域毎に、前記アクセス回数が最も大きい時間区分を当該分割された領域のアクセス時間帯として抽出し、該アクセス時間帯を基準として前記分割された領域を並び替えたテーブルを作成し、
前記テーブルを参照して、前記アクセス時間帯が一致する領域に属するブロックに、順番に新しいブロック番号を付与し、前記並び替え前後のブロック番号の対応関係を表したポインタテーブルを作成するディスク記憶装置。 A disk medium for storing replication data that is a copy of the original data;
Means for observing an access pattern to the disk medium and determining a data arrangement order in the disk medium according to a data access order in the observed access pattern;
Means for rearranging replication data according to the data arrangement order ,
The means for determining the data arrangement order in the disk medium is:
The storage area of the disk medium is divided by a predetermined size, and the number of accesses in a predetermined time segment for each divided area is recorded,
For each divided area, the time segment with the largest number of accesses is extracted as the access time zone of the divided area, and a table in which the divided areas are rearranged based on the access time zone is created. And
A disk storage device that refers to the table and creates a pointer table that sequentially assigns new block numbers to the blocks belonging to the areas having the same access time zone and indicates the correspondence between the block numbers before and after the rearrangement .
前記ディスク記憶装置からデータを読み出して所定のバックアップ媒体へのデータバックアップを行うバックアップサーバと、
を含むデータバックアップシステム。 The disk storage device according to claim 1 or 2 ,
A backup server that reads data from the disk storage device and performs data backup to a predetermined backup medium;
Including data backup system.
前記各分割された領域毎に、前記アクセス回数が最も大きい時間区分を当該分割された領域のアクセス時間帯として抽出し、該アクセス時間帯を基準として前記分割された領域を並び替えたテーブルを作成し、
前記テーブルを参照して、前記アクセス時間帯が一致する領域に属するブロックに、順番に新しいブロック番号を付与し、前記並び替え前後のブロック番号の対応関係を表したポインタテーブルを作成することにより、前記ディスク媒体におけるデータ配置順序を決定し、
前記データ配置順序に従って前記レプリケーションデータを再配置するデータ再配置方法。 By dividing the storage area of the disk medium storing the replication data obtained by copying the replication source data by a predetermined size, and recording the number of accesses in a predetermined time section for each of the divided areas , Observe access patterns,
For each divided area, the time segment with the largest number of accesses is extracted as the access time zone of the divided area, and a table in which the divided areas are rearranged based on the access time zone is created. And
By referring to the table, by assigning a new block number in order to the blocks belonging to the area where the access time zone matches, by creating a pointer table that represents the correspondence between the block numbers before and after the rearrangement, Determining a data arrangement order in the disk medium;
A data rearrangement method for rearranging the replication data according to the data arrangement order.
前記各分割された領域毎に、前記アクセス回数が最も大きい時間区分を当該分割された領域のアクセス時間帯として抽出し、該アクセス時間帯を基準として前記分割された領域を並び替えたテーブルを作成し、前記テーブルを参照して、前記アクセス時間帯が一致する領域に属するブロックに、順番に新しいブロック番号を付与し、前記並び替え前後のブロック番号の対応関係を表したポインタテーブルを作成することにより、前記ディスク媒体におけるデータ配置順序を決定する処理と、
前記データ配置順序に従って、前記レプリケーションデータを再配置する処理とをコンピュータに実行させるプログラム。 By dividing the storage area of the disk medium storing the replication data obtained by copying the replication source data by a predetermined size, and recording the number of accesses in a predetermined time section for each of the divided areas , Processing to observe access patterns ;
For each divided area, the time segment with the largest number of accesses is extracted as the access time zone of the divided area, and a table in which the divided areas are rearranged based on the access time zone is created. Then, referring to the table, a new block number is assigned in order to the blocks belonging to the areas where the access time zones coincide with each other, and a pointer table representing the correspondence relationship between the block numbers before and after the rearrangement is created. Accordingly, the process of determining the data arrangement order in the disk medium,
A program that causes a computer to execute a process of rearranging the replication data in accordance with the data arrangement order.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008232282A JP4968218B2 (en) | 2008-09-10 | 2008-09-10 | Disk storage device, data backup system, data relocation method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008232282A JP4968218B2 (en) | 2008-09-10 | 2008-09-10 | Disk storage device, data backup system, data relocation method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010066979A JP2010066979A (en) | 2010-03-25 |
JP4968218B2 true JP4968218B2 (en) | 2012-07-04 |
Family
ID=42192519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008232282A Expired - Fee Related JP4968218B2 (en) | 2008-09-10 | 2008-09-10 | Disk storage device, data backup system, data relocation method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4968218B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5998806B2 (en) | 2012-09-28 | 2016-09-28 | 富士通株式会社 | Storage control device, storage control program, and copy method |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08286838A (en) * | 1995-04-18 | 1996-11-01 | Fuji Xerox Co Ltd | Storage controller |
-
2008
- 2008-09-10 JP JP2008232282A patent/JP4968218B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010066979A (en) | 2010-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI426380B (en) | System and method for optimizing redundancy restoration in distributed data layout environments | |
JP3249868B2 (en) | Array type storage system | |
US5764880A (en) | Method and system for rebuilding log-structured arrays | |
US9811454B2 (en) | Creating logical disk drives for raid subsystems | |
US20030236944A1 (en) | System and method for reorganizing data in a raid storage system | |
KR20040060732A (en) | A log-structured write cache for data storage devices and systems | |
JPWO2006123416A1 (en) | Disk failure recovery method and disk array device | |
JP2005531071A5 (en) | ||
CN106168920B (en) | Controlling a redundant array of independent disks including a read-only flash data storage device | |
JP2000293317A (en) | Storage controller | |
CN101154174A (en) | Using file system information in raid data reconstruction and migration | |
EP0899731A2 (en) | Improved disk log using distributed write | |
JP3919770B2 (en) | Self-healing storage system | |
JP2691087B2 (en) | Directory system, device and method for data files | |
US7577803B2 (en) | Near instantaneous backup and restore of disc partitions | |
JP4457019B2 (en) | Information processing system and primary storage device | |
JP4713951B2 (en) | Virtual tape library system and virtual tape writing method | |
US9069470B2 (en) | Zone group reassignment using storage device signatures | |
JP2015225603A (en) | Storage control device, storage control method, and storage control program | |
JPH0792896B2 (en) | Device and method for positioning mispositioned heads | |
JP4968218B2 (en) | Disk storage device, data backup system, data relocation method, and program | |
JP2005284816A (en) | Disk array system | |
US20110055505A1 (en) | Data copying | |
CN107545022B (en) | Disk management method and device | |
JP6171616B2 (en) | Storage control device and storage control program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120306 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120319 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4968218 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |