JP2001236253A - 複数の記録媒体を利用してデータをバックアップする装置および方法 - Google Patents
複数の記録媒体を利用してデータをバックアップする装置および方法Info
- Publication number
- JP2001236253A JP2001236253A JP2000046675A JP2000046675A JP2001236253A JP 2001236253 A JP2001236253 A JP 2001236253A JP 2000046675 A JP2000046675 A JP 2000046675A JP 2000046675 A JP2000046675 A JP 2000046675A JP 2001236253 A JP2001236253 A JP 2001236253A
- Authority
- JP
- Japan
- Prior art keywords
- data
- backup
- time
- processing
- data sets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
ップする際の処理時間を短縮する。 【解決手段】 ホストコンピュータ10は、磁気ディス
ク装置20に格納されているデータを読み出して複数の
磁気テープ装置40に書き込む。磁気テープ装置40に
データを書き込む処理は、複数のジョブから構成され
る。これらのジョブは、トータルバックアップ時間が最
短になるように、過去のバックアップ処理の結果に従っ
て複数の処理シーケンスに振り分けられる。これらの処
理シーケンスが並列的に実行される。
Description
アップする装置および方法に係わる。特に、複数のデー
タセットを複数の記録媒体を用いてバックアップする際
の効率を向上させる技術に係わる。
に伴って大量のデータを蓄積するための装置が必要不可
欠になってきている。また、それらのデータの中には、
しばしば重要な情報が含まれているので、大量のデータ
をバックアップするための技術も実用化されている。
に分散して格納される。この場合、記憶装置としては、
たとえば、磁気ディスク装置等のDASD(Direct Acc
essStorage Device)が用いられる。一方、バックアッ
プ用記憶装置としては、しばしば磁気テープ記録媒体が
用いられる。そして、格納すべきデータ量が大きい場合
には、このバックアップ用の磁気テープ記録媒体も複数
必要となる。
ップする場合は、そのバックアップ時間を短縮するため
に、通常、それらの記録媒体へデータを書き込むための
複数の書込み処理が並列的に実行される。すなわち、上
述の例においては、複数の磁気ディスク装置から読み出
されたデータは、複数の磁気テープ記録媒体に並列に書
き込まれる。この並列処理は、例えば、磁気ディスク装
置からデータ読み出して所定の磁気テープ記録媒体に書
き込むジョブを磁気ディスク装置毎に(あるいは、論理
ボリューム毎に)作成し、それらのジョブを並列に実行
することにより実現される。
スク装置に格納されているデータの量は、一般に、均一
ではない。このため、上述の並列処理により実行される
ジョブの組合せが適切でないと、バックアップ時間が必
要以上に長くなってしまう。例えば、第1〜第3の磁気
ディスク装置にそれぞれ格納されているデータを第1の
磁気テープ記録媒体に書き込む処理と、第4〜第6の磁
気ディスク装置にそれぞれ格納されているデータを第2
の磁気テープ記録媒体に書き込む処理とを並列して実行
する場合を考える。この場合、もし第1〜第3の磁気デ
ィスク装置に格納されているデータ量が第4〜第6の磁
気ディスク装置に格納されているデータの量よりも大き
かったとすると、第2の磁気テープ記録媒体にデータを
書き込む処理が終了した後、しばらくの間、第1の磁気
テープ記録媒体にデータを書き込む処理が続くことにな
る。これにより、全体のバックアップ時間が必要以上に
長くなってしまう。
は、上述の並列処理により実行されるジョブの組合せが
適切でなければならない。しかし、従来は、上述のジョ
ブを自動的に適切に組み合わせる手法は考えられておら
ず、ユーザがマニュアルでジョブの組合せを設定(チュ
ーニング処理)していた。したがって、ジョブ数が多く
なると、それらのジョブを適切に組み合わせることが困
難であった。また、任意の磁気ディスク装置にデータが
追加されたり、あるいは任意の磁気ディスク装置からデ
ータが削除された場合には、その都度、ユーザがマニュ
アルでジョブの組合せを変更する必要があった。
納されているデータを磁気テープ記録媒体を用いてバッ
クアップする場合に限らず、任意の記録媒体に格納され
ているデータを他の記録媒体を利用してバックアップす
る際に発生し得る。
てデータをバックアップする際の処理時間を自動的に短
くする装置および方法を提供することである。
置は、第1の記録媒体に格納されている複数のデータセ
ットを複数の第2の記録媒体を利用してバックアップす
る構成を前提とし、第1の記録媒体から上記複数のデー
タセットを読み出す読出し手段と、その読出し手段によ
り読み出された複数のデータセットを複数の第2の記録
媒体に書き込むための複数の書込み処理を並列的に実行
する書込み手段と、複数のデータセットを複数の第2の
記録媒体を利用してバックアップするために要した時間
を各データセットについてそれぞれ検出する検出手段
と、過去に検出手段により検出されたデータセット毎の
バックアップ時間に基づいて、それらのデータセットを
上記並列的に実行される複数の書込み処理に割り当てる
割当て手段とを有する。
間は、基本的に、それぞれその書込み処理に割り当てら
れているデータセットのバックアップ時間の合計値とし
て表される。ここで、各データセットをバックアップす
るための時間は、検出手段により過去に検出された時間
から推測することができる。したがって、過去に検出手
段により検出されたデータセット毎のバックアップ時間
に基づいてそれらのデータセットを複数の書込み処理に
割り当てるようにすれば、各書込み処理の処理時間を調
整することができる。本発明のバックアップ装置は、こ
れを利用し、全体のバックアップ時間が短くなるよう
に、複数のデータセットを上記複数の書込み処理に割り
当てる。
処理の処理時間が均一または略均一になるように、上記
複数のデータセットをそれらの書込み処理に割り当てる
ようにしてもよい。これにより、処理時間が必要以上に
長くなる書込み処理がなくなるので、全体のバックアッ
プ時間が短くなる。
図面を参照しながら説明する。図1は、本発明の実施形
態のシステム構成図である。以下の実施例では、DAS
D(Direct Access Storage Device)に格納されている
データを磁気テープ装置を用いてバックアップする場合
を想定する。なお、DASDは、ここでは、磁気ディス
ク装置とする。
ィスク装置(DASD)20を1つの記憶装置として利
用することができる。即ち、ホストコンピュータ10
は、所望のデータを1または複数の磁気ディスク装置2
0から取り出すことができ、また、データを所望の1ま
たは複数の磁気ディスク装置20に格納することができ
る。なお、磁気ディスク装置20からデータを読み出す
処理および磁気ディスク装置20へデータを書き込む処
理は、ホストコンピュータ10からの指示に従って、コ
ントローラ30により実行される。
磁気テープ装置(CMT)40を1つの記憶装置として
利用することができる。すなわち、ホストコンピュータ
10は、データを所望の1または複数の磁気テープ装置
40に格納できる。この実施例のバックアップ処理で
は、磁気ディスク装置20から読み出した1または複数
のデータセットが1または複数の磁気テープ装置40に
格納される。そして、当然のことではあるが、ホストコ
ンピュータ10は、磁気テープ装置40に格納されてい
るデータを読み出すことができる。なお、磁気テープ装
置40へデータを書き込む処理および磁気テープ装置4
0からデータを読み出す処理は、ホストコンピュータ1
0からの指示に従って、コントローラ50により実行さ
れる。
すべての磁気ディスク装置20にそれぞれ格納されてい
るデータが読み出され、それらのデータが複数の磁気テ
ープ装置40に書き込まれる。ただし、一部の磁気ディ
スク装置20に格納されているデータについてバックア
ップ処理を行うこともできる。
単位で実行される。なお「ボリューム」は、一般には、
磁気ディスクや磁気テープ等の1つの着脱可能な記録装
置を指すことが多いが、ここでは、仮想的なボリューム
を想定する。すなわち、1台の磁気ディスク装置を1つ
のボリュームを考えてもよいし、或いは、1台の磁気デ
ィスク装置の中に複数のボリュームが存在するものとし
てバックアップ処理を実行してもよい。
は、各ボリュームに格納されているデータを読み出して
それを所定の磁気テープ装置40に書き込む処理を「ジ
ョブ」と呼ぶことにする。また、各ジョブを実行するこ
とによりバックアップされる1かたまりのデータを「デ
ータセット」と呼ぶことがある。
を並列的に実行する。この場合、ホストコンピュータ1
0は、バックアップ処理に係わるジョブを複数のグルー
プに振り分け、それら複数のグループに属するジョブを
並列的に実行していく。ここで、ホストコンピュータ1
0は、バックアップ処理に要する総時間(すなわち、す
べてのジョブが実行されるまでの時間)が出来るだけ短
くなるようにジョブの組合せを最適化する。
の時間管理テーブルは、図1に示すホストコンピュータ
10が備えるメモリ上に設けられ、バックアップ処理に
要する総時間が短くなるようにジョブの組合せを決定す
るために利用される。なお、ここでは、9つのボリュー
ム(A01〜A03、B01〜B03、C01〜C0
3)にそれぞれ格納されているデータのバックアップを
実行するものとする。このとき、各ボリューム毎に対応
してジョブが作成されるものとする。
は、各ボリュームに格納されているデータの量を表す。
図2に示す例では、例えば、ボリュームA01に1.5
Gバイトのデータが格納されており、ボリュームA02
に1.1Gバイトのデータが格納されている。この値
は、各ボリュームのデータが更新されたとき(データの
追加、削除、変更を含む)に更新される。なお、各ボリ
ュームに格納されているデータの量を検出する方法は、
既知の技術なので、具体的な方法についての説明は省略
する。
格納されているデータについてバックアップを実行した
回数を表す。なお、この値は、対応するボリュームのデ
ータが更新されたときに「0」に戻る。
が実行されたときに、そのバックアップ処理に要した時
間を表す。この値は、例えば、該当するボリュームから
データを読み出す処理が開始されたときから、そのデー
タが所定の磁気テープ装置に書き込まれるまでの時間を
計測することにより得られる。
たバックアップ処理に要した時間の平均値である。図2
に示す例では、たとえば、ボリュームA01について
「15分」が得られており、ボリュームA02について
「12分」が得られている。なお、この値を算出する方
法は、後述する。
納されているデータをバックアップするために要するで
あろう時間を表す。この値は、「前日までの平均時間」
が算出されている場合には、その値がそのまま使用され
る。一方、「前日までの平均時間」が算出されていない
場合、即ち、あるボリュームのデータが更新された後の
第1回目のバックアップ処理においては、そのボリュー
ムについては、「データ量」に基づいて算出される。な
お、新たに設けられたボリュームについても、「当日の
予測時間」は「データ量」に基づいて算出される。図2
に示す例では、ボリュームA01〜A03、B01〜B
03、C01〜C02については、「当日の予測時間」
として「前日までの平均時間」がそのまま設定されてお
り、ボリュームC03については、「当日の予測時間」
として「データ量」に基づいて算出された値が設定され
ている。
あるいは任意のボリュームのデータが更新された際の動
作を説明するフローチャートである。このフローチャー
トの処理は、新たなボリュームが追加されたとき、ある
いは既存のボリュームの中の任意のボリュームのデータ
が更新されたときに実行される。ここで、データ更新
は、データの追加、データの削除、データを変更を含
む。
ューム、或いはデータが更新されたボリュームに格納さ
れているデータの量を検出する。ステップS2では、ス
テップS1で検出したデータ量を、時間管理テーブル内
の対応するフィールドの「データ量」に設定する。な
お、新たにボリュームが追加された場合には、時間管理
テーブル内にそのボリュームに対応するフィールドを生
成し、そのフィールドの「データ量」に検出した値が設
定される。この後、ステップS3において、対応するフ
ィールドの「バックアップ回数」に「0」を設定する。
上記処理により、時間管理テーブルにおいて、対応する
ボリュームについての「データ量」が更新されると共
に、「バックアップ回数」がリセットされる。
トである。このフローチャートの処理は、バックアップ
処理が起動されたときに、ホストコンピュータ10によ
り実行される。
ら任意のボリュームに対応するフィールドのデータを抽
出する。ステップS12では、ステップS11で抽出し
たデータの中の「バックアップ回数」が「0」であるか
否かを調べる。「バックアップ回数」が「0」であった
場合は、ステップS13へ進み、そうでない場合にはス
テップS14へ進む。
出したデータの中の「データ量」に基づいて「当日の予
測時間」を算出する。この算出においては、「バックア
ップ能力」も参照される。ここで、「バックアップ能
力」は、ホストコンピュータ10、磁気ディスク装置2
0、磁気テープ装置40の性能などにより決まる。この
ため、もし、磁気ディスク装置20の性能が互いに同じ
でなかったとすると、あるボリュームについての「バッ
クアップ能力」と他のボリュームについての「バックア
ップ能力」とが異なることになる。したがって、磁気デ
ィスク装置20の性能が均一でない場合には、時間管理
テーブルに「バックアップ能力」を設定するためのレコ
ードを設け、各ボリューム毎にその値を予め設定してお
く必要がある。
間」は、例えば下記の式により求められる。ここで、
「バックアップ能力」の単位は、例えば、「メガバイト
/秒」である。 「当日の予測時間」=「データ量」/「バックアップ能
力」 ステップS14では、ステップS11で抽出したデータ
の中の「前日までの平均時間」をそのまま「当日の予測
時間」に設定する。
録されているすべてのボリュームについて上記ステップ
S12〜S14の処理を実行するために設けられてい
る。すなわち、未処理のボリュームが残っている場合に
は、ステップS11に戻って次のボリュームに対応する
フィールドのデータを抽出する。
するジョブを並列的に処理する際のジョブの組合せを決
定する。図2に示す例では、時間管理テーブルに9つの
ボリュームが登録されており、9つのジョブが作成され
る。ここで、図1に示すシステムにおいて、コントロー
ラ50a〜50cが互いに並列的にデータ書込み処理を
実行できるものとする。この場合、各ジョブは、コント
ローラ50a〜50cの中のいずれか1つに割り当てら
れることになる。なお、ジョブの組合せを決定する方法
については、後述詳しく説明する。
いて決定された組合せに従って、並列的にバックアップ
処理を実行する。ステップS18では、各ジョブの処理
時間を検出することにより、各ボリュームごとにバック
アップ時間を検出する。このステップS18の処理は、
ステップS17の処理と並列に実行される。
結果に従って、時間管理テーブルを更新する。具体的に
は、まず、ステップS18において検出した各ボリュー
ム毎のバックアップ時間を、それぞれ対応する「当日の
実績時間」に設定する。続いて、各ボリューム毎に、過
去の実績を参照してバックアップ処理に要した時間の平
均値を算出する。この平均時間は、例えば、下記の式に
より求められる。 「平均時間」=(「前日までの平均時間」×「バックア
ップ回数」+「当日の実績時間」)/(「バックアップ
回数」+1) ここで、「前日までの平均時間」「バックアップ回数」
「当日の実績時間」および「バックアップ回数」は、そ
れぞれ時間管理テーブルに設定されている値を用いる。
例えば、図2に示す例において、ボリュームA03のバ
ックアップ処理のために21分を要したとすると、平均
時間は、下記の値となる。 「平均時間」=(20×10+21)/(10+1)2
0.1 上述のようにしてボリューム毎に算出された「平均時
間」は、時間管理テーブル内の対応する「前日までの平
均時間」にそれぞれ設定される。更に、この後、時間管
理テーブルにおいて各ボリュームの「バックアップ回
数」に「1」が加算される。
クアップ処理を開始する前に、各ジョブの処理時間の予
測値を予め求めておき、これらの予測値に従ってジョブ
が適切に並べ替えられて並列的に実行される。このと
き、これらのジョブは、全体のバックアップ時間が短く
なるように、或いは並列に実行される複数の処理シーケ
ンスの実行時間が均一または略均一になるように、並べ
替えられる。以下、複数のジョブを複数の処理シーケン
スに振り分ける方法の実施例を説明する。
ンスに振り分ける方法の実施例であり、図4のステップ
S16に対応する。ここでは、図2に示した時間管理テ
ーブルに基づいてバックアップ処理が実行されるものと
する。また、複数の磁気テープ装置40へデータを書き
込むための3つの処理シーケンス(図5に示す処理1〜
処理3)が並列的に実行されるものとする。
は、対応するボリュームの「当日の予測時間」が長い順
番に並べられる。ここでは、図2に示す時間管理テーブ
ルに従って、ジョブ(A03)、ジョブ(B01)、ジ
ョブ(A01)、ジョブ(C01)、ジョブ(B0
2)、ジョブ(A02)、ジョブ(C03)、ジョブ
(B03)、ジョブ(C02)の順番に並べられる。
ブは、図5に示すように、1つずつ順番に実行順序管理
テーブルに設定されていく。このとき、これらのジョブ
は、まず昇り順(処理1、処理2、処理3の順番)に1
つずつ順番に割り当てられ、次に、下り順(処理3、処
理2、処理1の順番)に1つずつ順番に割り当てられ
る。以降、昇り順/下り順を交互に繰り返しながら、ジ
ョブが1つずつ対応する処理シーケンスに割り当てられ
ていく。これにより、図5に示す実行順序管理テーブル
が得られる。
において、ジョブの実行順序を反転させる。例えば、図
5に示す例では、この処理により、「処理2」におい
て、第1番目にジョブ(B03)、2番目にジョブ(B
02)、3番目にジョブ(B01)が設定されることに
なる。
須ではないが、並列処理の弊害を小さくする上で有効で
ある。たとえば、大規模な磁気テープ装置の中には、多
数の磁気テープを収容する収容棚および複数の書込み/
読出し装置を備え、ロボットが、指定された磁気テープ
をその収容棚から取り出して指定された書込み/読出し
装置定にマウントするものが知られている。このような
構成の磁気テープ装置においては、あるジョブが終了し
て次のジョブが開始される際に、書込み/読出し装置か
ら磁気テープを取り出して他の磁気テープをその装置に
マウントする処理が発生する。このとき、複数のジョブ
が並列的に実行される環境においては、上述のマウント
動作が競合する場合がある。ここで、マウントの競合が
発生すると、各処理シーケンスのマウント動作は、他の
処理シーケンスのマウント動作が終了するまで待たされ
ることになる。よって、上記並列処理環境においては、
あるジョブが終了して次のジョブが開始されるタイミン
グが互いに重なり合わないことが望ましい。
ブを複数の処理シーケンスに振り分けると、バックアッ
プ処理の終了間際に実行時間の短いジョブが集中し、あ
るジョブが終了して次のジョブが開始されるタイミング
が互いに重なり合う可能性が高くなってしまう。このた
め、処理番号が偶数の処理シーケンスにおいてジョブの
実行順序を反転させることにより、上述の問題による弊
害を軽減している。
のようにして作成した実行順序管理テーブルに従ってバ
ックアップ処理を実行する。すなわち、ジョブ(A0
3)、ジョブ(A02)、ジョブ(C03)を順番に実
行する処理シーケンス1、ジョブ(B03)、ジョブ
(B02)、ジョブ(B01)を順番に実行する処理シ
ーケンス2、およびジョブ(A01)、ジョブ(C0
1)、ジョブ(C02)を順番に実行する処理シーケン
ス3を並列的に実行する。
ンスに振り分ける処理のフローチャートであり、図4の
ステップS16に対応する。ここでは、複数の磁気テー
プ装置40へデータを書き込むためのn個の処理シーケ
ンスが並列的に実行されるものとする。
設定されている「当日の予測時間」の長い順番にジョブ
をソートし、ジョブ列を作成する。ステップS22で
は、ステップS21で作成したジョブ列の先頭からn個
のジョブを抽出する。ステップS23では、ステップS
22で抽出したn個のジョブを、n個の処理シーケンス
に対して昇り順に割り当てる。ステップS24では、ス
テップS21で作成したジョブ列に未処理のジョブが残
っているか否かを調べる。そして、未処理のジョブが残
っている場合には、ステップS25へ進み、そうでない
場合にはステップS28へ進む。
から未だ抽出されていないn個のジョブを抽出する。ス
テップS26では、ステップS25で抽出したn個のジ
ョブを、n個の処理シーケンスに対して下り順に割り当
てる。ステップS27では、ステップS21で作成した
ジョブ列に未処理のジョブが残っているか否かを調べ
る。そして、未処理のジョブが残っている場合には、ス
テップS22に戻り、そうでない場合にはステップS2
8へ進む。なお、ステップS22またはS25におい
て、上記ジョブ列に残っているジョブの数がn個未満の
ときは、それらのジョブをすべて抽出する。この後、ス
テップS28において、処理シーケンス番号が偶数の処
理シーケンスにおいて、ジョブの実行順序を反転させ
る。
間」の長い順番にジョブを各処理シーケンスに振り分け
ているが、「当日の予測時間」の短い順番にジョブを各
処理シーケンスに振り分けるようにしてもよい。
図である。ここでは、図2に示す時間管理テーブルに登
録されている9つのボリュームについてバックアップ処
理を行う場合を想定し、並列的に実行される3つの処理
シーケンスについて、それぞれ「当日の予測時間」の合
計値を示す。
に、ボリュームの識別番号の並び順に従って9つのジョ
ブを単純に3つの処理シーケンスに割り当てた場合を示
している。この場合、処理シーケンス2、3について
は、実行時間が比較的短くなることが期待されるが、処
理シーケンス1の実行時間はかなり長くなるものと予想
される。このように、幾つかの処理シーケンスが比較的
早く終了したとしても、実行時間の長い処理シーケンス
が1つでも含まれていると、すべてのバックアップ処理
が終了するまでの時間は結果として長くなってしまう。
合、ユーザが手作業で、ジョブの組合せを変更してい
た。たとえば、実行時間が最も長かった処理シーケンス
の所定のジョブと実行時間が最も短かった処理シーケン
スの所定のジョブとを入れ替えてバックアップ処理を実
行し、その結果に基づいてさらにジョブの入れ替えが必
要か否かを判断しながらジョブの入れ替え作業を繰り返
していた。このため、ジョブ数が多くなった場合、ある
いは並列に実行される処理シーケンスの数が多くなった
場合には、そのような入れ替え作業は困難であった。ま
た、各ボリュームのデータ量が変わった場合、あるいは
新たなボリュームが追加された場合には、ジョブを組み
合わせる作業をやり直す必要があり、ユーザの負担が重
かった。
場合のバックアップ処理の予測時間を示す。このグラフ
は、図5に示した実行順序管理テーブルに従っている。
このように、本実施形態の方法を使用すると、本実施形
態の方法を使用しない場合と比べて、処理シーケンス間
のばらつきが小さくなると共に、実行時間の最大値が小
さくなっている。これにより、すべてのバックアップ処
理が終了するまでの時間が短くなる。
ンスに振り分ける方法の他の実施例であり、図4のステ
ップS16に対応する。ここでも、図2に示した時間管
理テーブルに基づいてバックアップ処理が実行されるも
のとする。また、複数の磁気テープ装置40へデータを
書き込むための3つの処理シーケンス(図5に示す処理
1〜処理3)が並列的に実行されるものとする。
ョブは、図5〜図6に示した実施例の方法と同様に、対
応するボリュームの「当日の予測時間」が長い順番に並
べられる。
アップ時間」を算出する。この「目標バックアップ時
間」は、下記の式により算出される。 「目標バックアップ時間」=Σ「当日の予測時間」/
「並列に実行される処理シーケンスの数」 例えば、図2に示した例では、下記のようになる。 「目標バックアップ時間」=(15+12+20+18+14+8 +15+6 +12)/3 =40(分) そして、上述のようにして並べられたジョブは、図8に
示すように、1つずつ順番に実行順序管理テーブルに設
定されていく。このとき、これらのジョブは、各処理シ
ーケンスの実行時間が「目標バックアップ時間」に対し
て一定の範囲内に収まるように適切に選択されて対応す
る処理シーケンスに振り分けられる。図8に示す例で
は、一定の範囲として「±20%」が設定されている。
ーケンス1に割り当てるべきジョブを決定する。この場
合、まず、時間管理テーブルに登録されているボリュー
ムの中で「当日の予測時間」が最も長いボリュームに対
応するジョブを処理シーケンス1に割り当てる。ここで
は、処理シーケンス1にジョブ(A03)が割り当てら
れる。そして、このジョブの「当日の予測時間」が「目
標範囲」に入っているか否を調べる。なお、「目標範
囲」は、「目標バックアップ時間±20%」、すなわち
32分〜48分であるものとする。ここでは、ジョブ
(A03)の「当日の予測時間」は「20分」であり、
上記目標範囲には入っていない。
予測時間」が2番目に長いボリュームに対応するジョブ
を割り当てる。ここでは、処理シーケンス1にジョブ
(B01)が割り当てられる。そして、このジョブ(B
01)及び先に処理シーケンス1に割り当てられている
ジョブ(A03)の「当日の予測時間」の和が、目標範
囲に入っているか否かを調べる。ここでは、ジョブ(B
01)の「当日の予測時間」は「18分」なので、上記
2つのジョブの「当日の予測時間」の和は「38分」で
ある。すなわち、これら2つのジョブの「当日の予測時
間」の和は、目標範囲に入っている。したがって、処理
シーケンス1にジョブを割り当てる作業を終了する。
同様の手順でジョブが割り当てられる。これにより、図
8に示す実行順序管理テーブルが得られる。なお、目標
範囲を変更すると、ジョブの割当てが変わることがあ
る。例えば、目標範囲として、「目標バックアップ時間
±5%」、すなわち、38分〜42分とした場合の例を
図9に示す。このとき、もし、処理シーケンス2に対し
て、ジョブ(A01)およびジョブ(C01)を割り当
てた後にジョブ(B02)を割り当てると、それらのジ
ョブの「当日の予測時間」の合計値は、「44分」とな
り、目標範囲を越えてしまう。したがって、この場合
は、処理シーケンス2に対して、ジョブ(A01)およ
びジョブ(C01)を割り当てた後に、「当日の予測時
間」がジョブ(B02)よりも短いジョブを選択して、
それを処理シーケンス2に割り当てる。ここでは、処理
シーケンス2にジョブ(A02)が割り当てられてい
る。これにより、処理シーケンス2の予測時間は、「4
2分」になり、目標範囲に収まることになる。
動作を説明するフローチャートであり、図4のステップ
S16に対応する。ステップS31では、図6に示した
図21と同様に、時間管理テーブルに設定されている
「当日の予測時間」の長い順番にジョブをソートし、ジ
ョブ列を作成する。ステップS32では、時間管理テー
ブルを参照し、並列に実行すべき処理シーケンス処理に
ついての「目標バックアップ時間」を算出する。そし
て、ステップS33において、ステップS32で算出し
た「目標バックアップ時間」に基づいて目標範囲を設定
する。
り当てられるべき処理シーケンスを1つ抽出する。ステ
ップS35では、ステップS34で抽出した処理シーケ
ンスに割り当てるべきジョブを1つ抽出する。ステップ
S36では、ステップS34で抽出したジョブの「当日
の予測時間」の合計値を算出する。すなわち、ステップ
S35〜S37、S41〜S43の処理が繰り返し実行
されると、複数のジョブが抽出されることになるので、
その場合に、それら複数のジョブの「当日の予測時間」
の合計値を算出する。もっとも、第1番目のジョブが抽
出された時点では、その抽出されたジョブの「当日の予
測時間」がステップS36により算出された合計値とし
て扱われる。
出した合計値がステップS33で設定した目標範囲内で
あるか否かを調べる。そして、その合計値が目標範囲内
であれば、ステップS38において、抽出された1以上
のジョブを、ステップS34で抽出した処理シーケンス
に割り当てる。
ての処理シーケンスについて上記ステップS35〜S3
8の処理を実行するために設けられている。すなわち、
未処理の処理シーケンスが残っていれば、ステップS3
4に戻って次の処理シーケンスを選択する。
ップS35〜S38を実行すると、ステップS40にお
いて、いずれの処理シーケンスにも割り当てられていな
いジョブが残ってないかを調べる。このとき、もし、ジ
ョブが残っていれば、ステップS51においてエラー処
理を実行する。
プS33で設定した目標範囲外であった場合(ステップ
S37:No)には、ステップS41において、いずれ
の処理シーケンスにも割り当てられていないジョブ或い
は未だ抽出されていないジョブが残っているか否かを調
べる。そして、もし、ジョブが残っていなければ、当該
処理シーケンスの処理時間を目標範囲内にすることがで
きないものとみなし、ステップS51のエラー処理を実
行する。
S41:Yes)には、ステップS36で算出した合計
値が上記目標範囲に達していないのか、或いはそれを越
えてしまっているのかを調べる。そして、その合計値が
目標範囲に達していないのであれば、ステップS35に
戻って次のジョブを抽出する。また、その合計値が目標
範囲を越えてしまっていた場合には、ステップS43に
おいて直前に抽出したジョブをジョブ列に戻し、その後
にステップS35において次のジョブを抽出する。
ステップS33に戻って目標範囲を変更する処理であ
る。このようなエラー処理を導入する場合には、初期段
階において、目標範囲の幅を狭く設定する。このとき、
もし、各処理シーケンスの実行時間がそのような目標範
囲に収まれば、それらの処理シーケンスの実行時間のば
らつきは小さくなり、全体のバックアップ時間は論理的
に可能な最短時間に近くなる。一方、各処理シーケンス
の実行時間がそのような目標範囲に収まらなかった場合
には、目標範囲を少しずつ広げていく。このような構成
とすれば、処理シーケンス間のばらつきが必要以上に大
きくなることはなく、また、全体のバックアップ時間が
必要以上に長くなることもない。
おいて「当日の予測時間」が長い順番にジョブをソート
し、その順番に従ってジョブを対応する処理シーケンス
に割り当てているが、本発明はこれに限定されるもので
はない。すなわち、例えば、「当日の予測時間」が短い
順番にジョブを対応する処理シーケンスに割り当てる手
順でもよい。また、図10のフローチャートにおいて、
ステップS31の処理を省略し、任意の順番でジョブが
抽出されてステップS34以降の処理が実行されるよう
な手順であってもよい。
明した実施例による効果を説明する図である。図11
(a) は、目標範囲として「目標バックアップ時間±20
%」が設定された場合を示し、図11(b) は、目標範囲
として「目標バックアップ時間±5%」が設定された場
合を示している。このように、目標範囲の幅を狭くする
と、各処理シーケンスの処理時間が均一化され、必要以
上に処理時間が長くなる処理シーケンスがなくなるの
で、全体のバックアップ時間を短くすることができる。
バックアップ処理が実行される際、その都度、各ジョブ
毎にバックアップ時間が計測される。そして、並列的に
実行される複数の処理シーケンスにジョブを振り分ける
際、それらのジョブの過去のバックアップ時間に基づい
て次回のバックアップ処理に要するであろう時間を予測
し、それらの予測時間を参照していた。しかし、本発明
はこの方法に限定されるものではない。すなわち、例え
ば、バックアップ処理の実行時に各ジョブのバックアッ
プ時間を計測することなく、各ボリュームに蓄積されて
いるデータの量およびバックアップ能力のみに基づい
て、並列的に実行される複数の処理シーケンスに振り分
けるべきジョブを決定してもよい。
置などのDASDに格納されているデータを磁気テープ
装置を用いてバックアップするケースを示したが、本発
明はこの構成に限定されるものではなく、任意の記録媒
体に格納されているデータを任意の記録媒体を用いてバ
ックアップする場合に適用可能である。
は、コンピュータを用いて上述のフローチャートに示し
た処理を記述したプログラムを実行することにより実現
される。上述の実施例では、このプログラムは、ホスト
コンピュータ10により実行される。
ック図である。CPU101は、上述のフローチャート
に示した処理を記述したプログラムを記憶装置102か
らメモリ103にロードして実行する。記憶装置102
は、たとえばハードディスクであり、上記プログラムを
格納する。一方、メモリ103は、例えば半導体メモリ
であり、CPU101の作業領域として使用される。な
お、時間管理テーブルおよび実行順序管理テーブルは、
このメモリ103に作成される。
の指示に従って可搬性記録媒体105にアクセスする。
可搬性記録媒体105は、例えば、半導体デバイス(P
Cカード等)、磁気的作用により情報が入出力される媒
体(フロッピーディスク、磁気テープなど)、光学的作
用により情報が入出力される媒体(光ディスクなど)を
含む。通信制御装置106は、CPU101の指示に従
って網との間でデータを送受信する。
ログラムなどの提供方法を説明する図である。本発明に
係わるプログラムは、例えば、以下の3つの方法の中の
任意の方法により提供される。
ルされて提供される。この場合、プログラム等は、たと
えば、出荷前にプレインストールされる。 (b) 可搬性記録媒体に格納されて提供される。この場
合、可搬性記録媒体105に格納されているプログラム
等は、基本的に、記録媒体ドライバ104を介して記憶
装置102にインストールされる。
合、基本的には、ホストコンピュータ10がサーバに格
納されているプログラム等をダウンロードすることによ
ってそのプログラム等を取得する。
適化されるので、バックアップ時間が短くなる。また、
このバックアップ手順の最適化処理は、コンピュータに
より実行されるので、ユーザに負担がかかることはな
い。
のボリュームのデータが更新された際の動作を説明する
フローチャートである。
ける方法の実施例である。
ートである。
(b) は、本実施形態を使用した場合のバックアップ処理
の予測時間を示す図である。
ける方法の他の実施例である。
ャートである。
目標範囲の幅が狭い場合の例である。
るコンピュータのブロック図である。
の提供方法を説明する図である。
Claims (6)
- 【請求項1】 第1の記録媒体に格納されている複数の
データセットを複数の第2の記録媒体を利用してバック
アップする装置であって、 上記第1の記録媒体から上記複数のデータセットを読み
出す読出し手段と、 その読出し手段により読み出された複数のデータセット
を上記複数の第2の記録媒体に書き込むための複数の書
込み処理を並列的に実行する書込み手段と、 複数のデータセットを上記複数の第2の記録媒体を利用
してバックアップするために要した時間を各データセッ
トについてそれぞれ検出する検出手段と、 過去に上記検出手段により検出されたデータセット毎の
バックアップ時間に基づいて、それらのデータセットを
上記並列的に実行される複数の書込み処理に割り当てる
割当て手段と、 を有するバックアップ装置。 - 【請求項2】 請求項1に記載の装置であって、 上記割当て手段は、上記並列的に実行される複数の書込
み処理の処理時間が均一または略均一になるように、上
記複数のデータセットをそれらの書込み処理に割り当て
る。 - 【請求項3】 請求項1に記載の装置であって、 上記割当て手段は、 過去にバックアップ処理が実行されたデータセットにつ
いて、過去に上記検出手段により検出されたバックアッ
プ時間に基づいて、次回のバックアップ処理に要するで
あろう予測時間を算出する第1の算出手段と、 過去にバックアップ処理が実行されていないデータセッ
トについて、そのデータセットのデータ量に基づいて、
次回のバックアップ処理に要するであろう予測時間を算
出する第2の算出手段を含み、 上記第1および第2の算出手段により算出される各デー
タセットについての予測時間に基づいて、それらのデー
タセットを上記並列的に実行される複数の書込み処理に
割り当てる。 - 【請求項4】 第1の記録媒体に格納されている複数の
データセットを複数の第2の記録媒体を利用してバック
アップする装置であって、 上記第1の記録媒体から上記複数のデータセットを読み
出す読出し手段と、 その読出し手段により読み出された複数のデータセット
を上記複数の第2の記録媒体に書き込むための複数の書
込み処理を並列的に実行する書込み手段と、 上記複数のデータセットの各データ量を検出する検出手
段と、 その検出手段により検出されたデータセット毎のデータ
量に基づいて、それらのデータセットを上記並列的に実
行される複数の書込み処理に割り当てる割当て手段と、 を有するバックアップ装置。 - 【請求項5】 第1の記録媒体に格納されている複数の
データセットを複数の第2の記録媒体を利用してバック
アップする方法であって、 上記第1の記録媒体から上記複数のデータセットを読み
出し、 読み出された複数のデータセットを上記複数の第2の記
録媒体に書き込むための複数の書込み処理を並列的に実
行し、 複数のデータセットを上記複数の第2の記録媒体を利用
してバックアップするために要した時間を各データセッ
トについてそれぞれ検出し、 過去に検出されたデータセット毎のバックアップ時間に
基づいて、それらのデータセットを上記並列的に実行さ
れる複数の書込み処理に割り当てるバックアップ方法。 - 【請求項6】 コンピュータにより実行されたときに、 上記第1の記録媒体から上記複数のデータセットを読み
出す読出し手段と、 その読出し手段により読み出された複数のデータセット
を上記複数の第2の記録媒体に書き込むための複数の書
込み処理を並列的に実行する書込み手段と、 複数のデータセットを上記複数の第2の記録媒体を利用
してバックアップするために要した時間を各データセッ
トについてそれぞれ検出する検出手段と、 過去に上記検出手段により検出されたデータセット毎の
バックアップ時間に基づいて、それらのデータセットを
上記並列的に実行される複数の書込み処理に割り当てる
割当て手段と、 を提供するプログラムを格納する記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000046675A JP4064033B2 (ja) | 2000-02-24 | 2000-02-24 | 複数の記録媒体を利用したデータバックアップ装置およびプログラム記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000046675A JP4064033B2 (ja) | 2000-02-24 | 2000-02-24 | 複数の記録媒体を利用したデータバックアップ装置およびプログラム記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001236253A true JP2001236253A (ja) | 2001-08-31 |
JP2001236253A5 JP2001236253A5 (ja) | 2004-12-09 |
JP4064033B2 JP4064033B2 (ja) | 2008-03-19 |
Family
ID=18569047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000046675A Expired - Fee Related JP4064033B2 (ja) | 2000-02-24 | 2000-02-24 | 複数の記録媒体を利用したデータバックアップ装置およびプログラム記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4064033B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040047207A (ko) * | 2002-11-29 | 2004-06-05 | (주)소프트위드솔루션 | 과부하 조절 기능을 갖는 데이터 백업 시스템 및 이를이용한 데이터 백업 방법 |
JP2009223508A (ja) * | 2008-03-14 | 2009-10-01 | Hitachi Computer Peripherals Co Ltd | バックアップシステム及び世代データ管理方法 |
JP2012014244A (ja) * | 2010-06-29 | 2012-01-19 | Fujitsu Ltd | 情報端末 |
US8605560B2 (en) | 2012-03-19 | 2013-12-10 | Fujitsu Limited | Storage system and storage control method |
JP2019505040A (ja) * | 2015-12-28 | 2019-02-21 | ベリタス テクノロジーズ エルエルシー | 大規模分散スケールアウトデータシステムをバックアップするためのシステム及び方法 |
-
2000
- 2000-02-24 JP JP2000046675A patent/JP4064033B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040047207A (ko) * | 2002-11-29 | 2004-06-05 | (주)소프트위드솔루션 | 과부하 조절 기능을 갖는 데이터 백업 시스템 및 이를이용한 데이터 백업 방법 |
JP2009223508A (ja) * | 2008-03-14 | 2009-10-01 | Hitachi Computer Peripherals Co Ltd | バックアップシステム及び世代データ管理方法 |
JP2012014244A (ja) * | 2010-06-29 | 2012-01-19 | Fujitsu Ltd | 情報端末 |
US8605560B2 (en) | 2012-03-19 | 2013-12-10 | Fujitsu Limited | Storage system and storage control method |
JP2019505040A (ja) * | 2015-12-28 | 2019-02-21 | ベリタス テクノロジーズ エルエルシー | 大規模分散スケールアウトデータシステムをバックアップするためのシステム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4064033B2 (ja) | 2008-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8688932B2 (en) | Virtual computer system and method of controlling the same | |
RU2642349C1 (ru) | Способ для сохранения данных посредством устройства хранения данных и устройство хранения данных | |
US7330947B2 (en) | Method and apparatus for backing up data in virtual storage medium | |
US7085900B2 (en) | Backup technique for data stored on multiple storage devices | |
US20120210042A1 (en) | Remote memory for virtual machines | |
US8065466B2 (en) | Library apparatus, library system and method for copying logical volume to disk volume in cache disk with smallest access load | |
JP2008015623A (ja) | 複数種類の記憶デバイスを備えたストレージシステムの制御装置 | |
JP6885193B2 (ja) | 並列処理装置、ジョブ管理方法、およびジョブ管理プログラム | |
JP5584422B2 (ja) | 情報処理装置,スケジュール管理装置,スケジュール管理方法およびスケジュール管理プログラム | |
US20090077284A1 (en) | System and Method for Enhancing External Storage | |
US20200285510A1 (en) | High precision load distribution among processors | |
US10203879B2 (en) | Control device and control method | |
US10146783B2 (en) | Using file element accesses to select file elements in a file system to defragment | |
JP4308152B2 (ja) | メモリを予約するための方法、システム、および製品 | |
JP4064033B2 (ja) | 複数の記録媒体を利用したデータバックアップ装置およびプログラム記憶媒体 | |
US6697866B1 (en) | Access control method for data stored in fixed-block length format in computer configurations utilizing variable length data format interfaces | |
EP2703993A2 (en) | Information processing apparatus, computer program, and copy control method | |
JP6859684B2 (ja) | ストレージ制御装置、ストレージ装置、及び制御プログラム | |
US6874072B2 (en) | Method, apparatus and article of manufacture for managing a reusable linear access storage medium | |
WO2019111303A1 (ja) | データ書き込み装置及び方法 | |
JP4220726B2 (ja) | 外部記憶装置システム及び記憶制御装置 | |
JP2004157644A (ja) | ディスクサブシステム、計算機システム、それを管理するためのストレージ管理方法、および、管理プログラム | |
JP4371756B2 (ja) | データバックアップ方法及びバックアップ装置 | |
JP7050540B2 (ja) | 論理記憶領域の配置制御装置、論理記憶領域の配置制御システム、論理記憶領域の配置制御方法、及び、論理記憶領域の配置制御プログラム | |
US10209888B2 (en) | Computer and optimization method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070724 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071030 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071226 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120111 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130111 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130111 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140111 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |