JP3725375B2 - Data reorganization method in storage media library - Google Patents
Data reorganization method in storage media library Download PDFInfo
- Publication number
- JP3725375B2 JP3725375B2 JP27128499A JP27128499A JP3725375B2 JP 3725375 B2 JP3725375 B2 JP 3725375B2 JP 27128499 A JP27128499 A JP 27128499A JP 27128499 A JP27128499 A JP 27128499A JP 3725375 B2 JP3725375 B2 JP 3725375B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- volume
- medium
- reorganization
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、光ディスクライブラリやその他の、追記型制御の記憶媒体ライブラリにおけるデータ再編成方法に関する。
【0002】
【従来の技術】
データを長期に保管する用途は図面、伝票、文章、帳票等多岐に渡っている。データの長期保存の場合は、低ビットコスト性、長期保存性から光ディスクが多く使われている。特にデータ容量が大きくなると、光ディスクライブラリを用いて円板複数枚からなる大容量ボリュームを構成するケースが増えてきている。
【0003】
光ディスクライブラリはパソコンもしくはワークステーションのサーバにSCSIインタフェースなどで接続され、一般にライブラリ内の円板複数枚をまとめて一つの大容量の論理ボリューム(以下、単にボリュームという)を構築している。このため、ユーザは円板1枚1枚を意識することなく、1つのボリュームとしてアクセスすることができる。
【0004】
光ディスクライブラリ内の複数の円板面をまとめて1つのボリュームとする場合、ファイルは通常、追記的に書かれ、更新があっても元のスペースを使うのではなく、データの一番後ろに書き直される。これにより、ファイルの書き込み処理や更新されたファイルの読み出しにおいて、複数の円板を検索しないですますことができる。光ディスクライブラリを用いた複数枚円板からなるボリュームを考えた場合、光ディスクのアクセス性能が低いということの他に、ライブラリ内でのメカ動作によるオーバヘッドが発生するため、このファイルの書き込み処理などで複数の円板の検索を回避できることは、性能面上、重要な要素となっている。有効データがどの円板のどこにあるかという情報は、サーバ上にファイル管理情報として別途保持し、全円板を直接アクセスしなくても、目的の有効データが取得できる仕組みとなっている。
【0005】
【発明が解決しようとする課題】
ところで、追記形式の場合、更新・削除のファイル量が増えると、ボリューム内の無効領域が増えてくる。このため、定期的にボリューム内のデータを再編成する必要がある。
【0006】
従来、光ディスクライブラリ内の円板複数枚からなるボリュームのデータ再編成処理としてとられてきた方法は、先頭の円板面から順に、更新あるいは削除して使われなくなった無効領域を有効データで詰めていく方法であった。
【0007】
しかしながら、この方法は、円板の枚数増加や高密度化によりボリュームサイズが大きくなると、全データを詰めるのに膨大な時間がかかるという問題があった。さらにデータ再編成処理中は、当該ボリュームにアクセスできず、ボリュームサイズによっては1〜2週間ぐらいの運用停止を余儀なくされるという問題があった。
【0008】
また、この先頭の円板面から順に有効データを詰めていく方法では、書き込まれたデータの移動が伴うので、その間にハード障害等で処理が不用意に中断された場合、データ損失を招く恐れがあった。
【0009】
本発明の目的は、光ディスクライブラリやその他、一般に複数の媒体をまとめて一つの論理ボリュームとして使用する記憶媒体ライブラリにおいて、先頭の媒体から有効データを詰め直すことなく、実際の運用に適用しやすく、データ損失の危険性が少ないデータ再編成方法を提供することにある。
【0010】
【課題を解決するための手段】
本発明は、ボリュームへの書き込みは、従来どおりの追記方式を用いる。データ再編成の指示が出されると、先頭の媒体面から順にデータを読み出し、ファイル管理情報を参照して、そのデータが有効か無効かを判断する。そこで有効データだけをボリュームの最後尾に追加していく。この結果、無効領域しか持たなくなった媒体は、ボリューム管理下から外していき、この媒体はフォーマットすることで、再利用できるようにする。これにより、各ボリュームを最少枚数の円板で構成し、ライブラリ全体の有効容量を拡大することができる。この方法は、ボリュームを構成する媒体の枚数が複数の場合に有効であり、最終面より1つ手前の面まで処理を行ったら再編成終了とする。
【0011】
通常運用を止めずに計画的なデータ再編成を行うためには、ボリュームをオンラインにしたまま、データ再編成の開始ができ、通常のアクセス要求がきた場合には、データ再編成を中断し、さらにまたデータ再編成が再開できる仕組みとなっていなければならない。そこで、どの媒体のどこまで処理したか(再編成終了媒体アドレス)を、再編成終了時に保存しておき、次回の再編成開始時にそこから再開するようにする。
【0012】
また、書き込まれたデータはそのまま元の媒体面に残っているので、ハード障害等で再編成処理中、不用意に中断されても、データ損失は発生しない。少なくともサーバ内の制御ソフトが管理している再編成終了媒体アドレスまでの再編成処理は完了しており、そこから再編成処理を再開すればよい。
【0013】
次に、異なる記憶媒体ライブラリを制御ソフトで同じ管理下におき、1つのボリュームをそれぞれのライブラリにある媒体で構成できる場合は、ボリュームの前半と後半で構成する媒体のライブラリを分けることで、前半を構成する媒体から後半を構成する媒体へデータの移行が可能となる。全ボリュームに対してこの処理を行えば、前半媒体を構成していたライブラリの全媒体は無効領域となり、それらをボリューム管理下から外すことで、もう一方のライブラリへデータ移行が行えたことになる。
【0014】
また、無効領域の多い媒体だけ選択して詰めるという方法では、予め、データ再編成を実施する基準として無効容量の値を設定しておき、その値以上無効領域がある媒体だけデータ再編成を実施する。ボリュームを構成する媒体ごとの有効/無効領域容量を制御ソフトが常に管理しており、データ再編成を開始したら、該当する媒体だけを処理し、結果として効率的にデータ再編成が行えることになる。
【0015】
【発明の実施の形態】
以下、本発明の実施の形態について図面により説明する。なお、以下の実施の形態では対象とする記憶媒体ライブラリは光ディスクライブラリとする。
【0016】
図1は、光ディスクライブラリを使用したシステムの構成例を示す。図において、PCもしくはワークステーションであるサーバ1に、アレイディスク2と光ディスクライブラリ3がSCSIなどのインタフェースケーブル41,42で接続される。このアレイディスク2と光ディスクライブラリ3で階層記憶を構成している。サーバ1内には、アレイディスク2と光ディスクライブラリ3のアクセス制御に加えて光ディスクライブラリ3のデータ再編成制御を行う制御ソフト11、及び、ファイルのディレクトリ構造を保持するファイル管理情報データベース(DB)12が存在する。
【0017】
サーバ1にあらかじめインストールされた制御ソフト11の制御により、光ディスクライブラリ3に入っている複数枚の円板を面単位でグループ化し、1つのボリュームが構成される。面単位で扱うことにより、両面使用可能な光ディスクでも対応することができる。図1の例では、光ディスクライブラリ3内の円板面31,32,・・・,33,34,35をグループ化することを示している。
【0018】
さらに、制御ソフト11では、アレイディスク2内のハードディスクをキャッシュとして光ディスクのボリュームに割当て、アクセス頻度の高いデータは高速のハードディスクに置いておき、アクセス頻度の低いデータは低速の光ディスクに保存しておく制御を行うことで、全体的なアクセス性能を向上させる階層記憶管理も実現する。図1の例では、光ディスクライブラリ3内の円板面31,32,・・・,33,34,35をグループ化するとともに、アレイディスク2内のハードディスク21をキャッシュとして割当て、ボリューム5を構成することを示している。
【0019】
ここで、ボリューム5に対してファイル8へのWRITEが発生した場合(6)、制御ソフト11の処理としては、まず、キャッシュ21にデータを書き込む(61)。ファイルの更新日時と現在の時刻がある一定時間を超えると、そのファイルはデータが確定したと判断し、制御ソフト11は、ファイル管理情報データベース12を参照して、該当光ディスクへそのデータをコピーする(62)。これを、光ディスクのファイル更新と称す。ボリューム5に対してファイル8からのREADが発生した場合(7)、制御ソフト11は、そのデータがキャッシュ21に存在すれば該キャッシュから読み出す(71)。もしキャッシュに存在しなければ、制御ソフト11は、ファイル管理情報データベース12を参照して、該当光ディスクからキャッシュ21へデータをコピーし(72)、キャッシュからデータを読み出す(71)。この場合、光ディスク上の該当ファイルは有効のままとし、その後、キャッシュから戻される時(光ディスクのファイル更新時)、光ディスク上の該当ファイル(旧データ)を無効化する。
【0020】
図2は、光ディスクライブラリの構成例を示す。通常、光ディスクライブラリ3は、図2のように、アクセッサ(1111)と複数台のドライブ(11121,11122)、および複数のセル(1113)から構成されており、各セルには光ディスク1114が格納されている。ここで、例えばセル11131の光ディスク、セル11132の光ディスク、セル11133の光ディスクという順でアクセスが発生したとする。すると、制御ソフト11の制御下で、次のようなシーケンスで処理が行われる。
(1)アクセッサ1111がセル11131の光ディスクをドライブ11121に移動し(1115)、I/O処理を行う。
(2)アクセッサ1111がセル11132の光ディスクをドライブ11122に移動し(1116)、I/O処理を行う。
(3)アクセッサ1111がドライブ11121から光ディスクをセル11131に戻した後(11171)、セル11133の光ディスクをドライブ11121に移動し(11172)、I/O処理を行う。
【0021】
次に、光ディスクライブラリ3のデータアクセス制御について説明する。ファイルのディレクトリ構造はファイル管理情報データベース12に保持されており、通常、ファイルのデータは光ディスクに保存されている。光ディスクに対しては追記制御であるため、光ディスクのファイル更新が発生すると(即ち、キャッシュから光ディスクへの更新済ファイルの書込み)、同じファイルのデータが二重に存在することになる。そこで、ファイル管理情報データベース12に、ファイル毎に有効なデータアドレスを保持し、目的のファイルデータにアクセスすることを実現している。図3を例に説明すると、円板面104,105,106の3面からなるボリューム5で、円板面106の領域1061までデータが書かれているとする。ここでボリューム5の円板面104内に存在するファイル1071の更新要求が発生した場合(101)、制御ソフト11では新しいデータ(更新済ファイル)を円板面106の領域1062に書き込み(1011)、ファイル管理情報データベース12のファイル1071の物理アドレスを円板面104の1041から円板面106の1062に変更する(1012)。これにより、ファイル1071の旧データ領域1041は無効領域となる。また、長時間にわたる不使用等により、ボリューム5内に存在するファイル1072の削除要求が発生した場合(102)、制御ソフト11はファイル管理情報データベース12のファイル1072に関する情報を抹消することで(1021)、領域1042は無効領域となり、ボリューム5からファイル1072が削除されたことになる。また、ユーザからの要求等により、ボリューム5に新しくファイル1073を作成する場合(103)、制御ソフト11では、円板面106の領域1063にデータを書き込み(1031)、ファイル管理情報データベース12にファイル1073の情報を追加する(1032)。
【0022】
図4に、ファイル管理情報データベース12内の光ディスクライブラリに係るディレクトリのフォーマット例を示す。なお、キャッシュのディレクトリは本発明に直接関係がないので、ここでは省略する。
【0023】
ファイル管理情報データベース12は、光ディスクライブラリに関し、図4に示すように、ボリュームを構成する円板面ID情報1211、各円板面に存在するファイルの総数1212、ファイルの物理アドレス1213のデーブルから構成される。ボリュームごとにテーブル1211が存在し、構成する円板面の数だけテーブル1212が存在する。テーブル1213は、その円板面に格納されたファイルの数だけ存在する。ファイルの作成が発生すると、ファイル管理情報データベース12としてはテーブル1213が追加され、ファイルの削除が発生すると、該当するテーブル1213の情報が削除される。ファイルの更新が発生した場合は、該当するテーブルの円板面内物理アドレスが更新される。
【0024】
後述のデータ再編成処理を行う場合は、テーブル1211の円板面ID情報を元に、各円板面毎にテーブル1212にあるファイル総数分だけ、テーブル1213の有効な物理アドレスを取得していく。円板面の全領域が無効になった場合、その円板面のテーブル1212のファイル総数が0となり、対応するテーブル1213の情報は存在しない。ここで、さらに円板面をボリューム管理下から外した場合、テーブル1211から該当する円板面デバイスID情報と対応するテーブル1212の情報が削除される。
【0025】
次に、データ再編成について説明する。データ再編成制御もサーバ1の制御ソフト11が受け持つ。従来の方法では、先頭の円板面から順番にデータを詰めて書き直していくが、本発明の方法では、有効なデータを先頭の円板面から同一ボリュームの有効データ最終アドレスに追記していく。
【0026】
まず、図5で従来のデータ再編成処理を説明する。ここで、ボリューム205は円板面201,202,203,204からなり、データ再編成前、図5の左側に示すように、円板面201,202,203に有効データのファイル2051〜2056がとびとびに存在しているとする。この円板面201,202,203,204からなるボリューム205に対しデータ再編成を行う場合、まず、円板面201の領域201aの有効データであるファイル2051、ファイル2052を同じ円板面201の先頭領域である201bに書き直し、円板面202の領域202aの有効データであるファイル2053、ファイル2054を円板面201の残りの領域201cに書き込む。次に、円板面202の領域202bの有効データであるファイル2055と円板面203の領域203aの有効データであるファイル2056は、円板面202の先頭領域202cに書き直す。円板面203は、有効データ領域がなくなったので、フォーマットをかけて全領域を空き領域(書き込み可能)にする。円板面204は、もともと空き領域であるため、そのまま(書き込可能)にしておく。この結果、データ再編成後、ボリューム205は図5の右側に示すようになる。
【0027】
次に、図6で本発明のデータ再編成処理の概要を説明する。前提条件は図5と同様に、円板面301,302,303,304から構成されたボリューム305は、データ再編成前、図6の左側に示す状態にある場合を仮定する。データ再編成を行う場合、まず、円板面303の領域303aのファイル2056はそのまま有効データとし、円板面301の領域301aの有効データであるファイル2051、ファイル2052を、円板面303の有効データ最終アドレスの後、つまり、ファイル2056の領域303aの直後の領域303bに追記する。次に、円板面302の領域302aの有効データであるファイル2053を円板303の残領域303cに書き込み、円板302の領域302b,302cのファイル2054、ファイル2055は次の円板面304の先頭領域304aに書き込む。この過程でファイル管理情報も更新しているので、円板面301と円板面302は全て無効領域となる。この結果、データ再編成後、ボリューム305は図6の右側に示すようになる。円板面301と円板面302は必要な時にボリューム305の管理下から外し、フォーマットして再利用することができる。
【0028】
次に、本発明のデータ再編成処理を実際に適用する場合のやり方について説明する。まず、データ再編成処理は、1度にボリューム内の全データを再編成するのではなく、基本的に毎日少しずつ行っていく方針をとる。従って、データ再編成処理が通常のジョブスケジュールの中で行うことができるようにする。そのためには、明示的にデータ再編成処理を開始するコマンドと終了するコマンドを用意し、データ再編成処理を1つのジョブとして扱えるようにする。そうすれば全体的なシステム運用の中で時間指定やジョブシーケンスの設定によりデータ再編成処理がスケジューリングできるようになる。データ再編成処理を終了するタイミングとしては、データ再編成終了コマンドが入力された場合、再編成処理が終わった場合、通常の書き込み操作が発生した場合がある。また、終了条件が発生しても、1ファイルの書き込み処理が終わってから終了させた方が、関連するデータが連続して配置されるのでアクセス性能向上が期待できる。そこで、終了コマンドには、処理中のファイルデータを書き込んでから終了させるモードと強制的に終わらせるモードを用意する。
【0029】
再編成処理終了時には、再編成処理をどの円板面のどこまで行ったかのポイント(円板アドレス、ファイル名)を保存しておき(例えば、ファイル管理情報データベース12に保持する)、これから行う通常書き込み処理のポイントおよび次回データ再編成開始時の処理開始ポイントとする。
【0030】
再編成処理を実施し、無効になった円板面は基本的にアクセスする必要がないので、ボリュームがオンラインの状態でも管理下から外せるようにする。しかし、円板の両面を使用している場合は、両面とも無効になってから管理下から外すようにする。
【0031】
通常運用の書き込み、およびデータ再編成で書き込み処理で容量が足りなくなった場合、制御ソフト11の制御下で、予めライブラリ内に投入しておいたフォーマット済の円板が、そのボリュームに自動的に追加されるようにする。また、常時、ボリューム容量と追加できるフォーマット済の円板の枚数を監視し、枚数が減少してきたらシステム管理者に通報するような機能も必要となってくる。但し、データ再編成中に容量満杯となり追加できる円板もない場合、ワーニングメッセージは出すが、再編成処理自体は正常終了させる。そのため、データを書き込む前に予め必要な容量を確認し、ファイルの途中で再編成処理が終了しないようにする。
【0032】
図7に、以上を踏まえた上で、本発明によるデータ再編成処理のフローチャートの一例を示す。まず、データ再編成開始コマンドにより、処理が開始される。ここで前回のデータ再編成が終わったアドレスを取得し、処理開始アドレスとする(ステップ401)。新規に始める場合は、ボリュームの先頭円板面の先頭アドレスを開始アドレスとする。次に、ファイル管理情報データベース12のファイル管理情報を参照して当該円板面から有効データを取得する(ステップ402)。基本的には、図4に示したように、ファイル管理情報データベース12に円板面ごとの有効データ情報が管理されており、円板面全領域をアクセスする必要はない。次に、得られた有効データをボリュームの有効データ最終アドレスに追記する(ステップ403)と共に、ファイル管理情報で当該ファイルの物理アドレスを追記したデータの新しいアドレスに変更する(ステップ404)。ここでデータ再編成処理を終了するかどうかをチェックする。データ再編成終了コマンドの入力や、通常の書き込み操作により終了通知を受けた場合、再編成処理が終了した場合、データ再編成処理終了を決定する(ステップ405)。それ以外の場合は、再編成処理続行と判断し、ステップ402に戻り、再び有効データの取得から始める。データ再編成処理終了時には、再編成が終わったところの円板面アドレスを保存しておき、次回の再編成処理の開始アドレスとする。再編成が終了した場合は、次回の再編成処理はボリュームの先頭円板面から始める(ステップ406)。1ファイルのデータ書き込み中に強制的に終了通知を受ける場合は、ステップ404を中断し、ファイル管理情報と円板面に書かれた状態の整合性をとった上で、ステップ406へ進む。
【0033】
実際の運用スケジュールの中で本発明のデータ再編成処理を組み込んだ例を図8に示す。この例では、通常運用が8時から0時で、1時間の余裕を持って、1時からデータ再編成を行い、5時にデータ再編成終了指示を出す(運用ステジュール505)。このような運用に適用した例がボリューム504で、円板面501,502,・・・,503で構成されており、円板面503の領域5031まで書かれているとする。このとき、まず通常運用により、円板面503の領域5032にデータが書き込まれ、その後のデータ再編成処理により、円板面501の有効データであるファイル5041,5042,5043が円板面503の領域5033に書き込まれる。そして次の通常運用で、円板503の領域5034にデータが書き込まれ、その後のデータ再編成処理で円板501の有効データである5044,5045,5046が円板面503の領域5035に書き込まれる。この結果、円板面501が全て無効データ領域となり、円板面502があらたに1面目となる。
【0034】
次に、本発明のデータ再編成処理を適用して、光ディスクライブラリ間でデータ移行する例を図9で説明する。サーバ601に旧型の光ディスクライブラリ602がSCSIインタフェースケーブル604aで、新型の光ディスクライブラリ603が同様にSCSIなどのインタフェースケーブル604bで接続されている。図9では、キャッシュ用のアレイディスクは省略している。ここで、旧型の光ディスクライブラリ602の円板面606a,606b,606c,606dで構成されたボリューム605に新型光ディスクライブラリ603の円板面606e,606fを追加する。そこでデータ再編成処理を実施し、旧型光ディスクライブラリの円板面606a,606b,606c,606dを、それぞれ無効になった時点で順番にボリューム605の管理下からはずしていく。結果として、ボリューム605は新型光ディスクライブラリ603の円板面だけから構成され、旧媒体から新媒体へデータ移行が行われたことになる。
【0035】
次に、無効領域の容量が多い円板面だけをデータ再編成して、ボリュームサイズを縮小する場合を図10で説明する。データ再編成前、ボリューム707は、図10の左側に示すように、無効領域10%の円板面701、無効領域30%の円板面702、無効領域40%の円板面703、無効領域10%の円板面704、有効領域50%、空き領域50%の円板面705、空き領域100%の円板面706から構成されているとする。ここで、無効領域が20%以上の円板面だけをデータ再編成するように設定し、再編成処理を行うと、円板面701,704は対象外となり、円板面702,703の有効データだけが円板面705,706に追記されていく。この結果、データ再編成後、ボリューム707は、図10の右側に示すように、円板面701,704,705,706の構成となり、無効となった円板面702,703はフォーマットして再利用可とする。
【0036】
以上、本発明の実施形態について説明したが、本発明は、これに限定されないことは云うまでもない。例えば、本発明は光ディスクライブラリに限らず、一般に複数の記憶媒体をまとめて1つの論理ボリュームとし、追記形式でデータの書き込みを行う記憶媒体ライブラリに広く適用可能である。また、実施形態では、アレイディスクと光ディスクライブラリで階層記憶を構成するとしたが、本発明は階層記憶に限る必要はない。
【0037】
【発明の効果】
以上の説明から明らかな如く、本発明のデータ再編成方法によれば、次のような効果が得られる。
(1)データ再編成により無効になった媒体をボリュームから外し、フォーマットしなおすことで、媒体の再利用が可能となり、記憶媒体ライブラリ全体としての使用可能領域が増える。
【0038】
(2)運用面から考えた場合、ボリュームの先頭媒体から順に有効データを詰め直す必要がないため、データ再編成処理を行いつつも中断ができるので、例えば、毎日少しずつ再編成処理が実行できるという効果がある。
【0039】
(3)ライブラリ間のデータ移行の面から考えた場合、データ再編成処理の過程で旧媒体から新媒体へのデータ移行が実施できる。このため、新ドライブが旧媒体を読めなくてもデータ移行が可能となる。
【0040】
(4)副媒体を作成する際、従来の方法だと、データ再編成をした後にボリューム全体の複製を作成する必要があったが、本発明を採用すれば、データ再編成により書き込まれた円板だけの複製をとればよい。よって無効領域を詰めなおしても副媒体作成にかかる時間は少なくなる。
【図面の簡単な説明】
【図1】本発明の一実施形態の光ディスクライブラリに適用したシステムの構成例を示す図である。
【図2】光ディスクライブラリの構造の概要を示すである。
【図3】ボリュームの追記型書き込み処理を説明する図である。
【図4】ボリュームのファイル管理情報データベースのフォーマット例を示す図である。
【図5】従来のデータ再編成処理を説明する図である。
【図6】本発明によるデータ再編成処理を説明する図である。
【図7】本発明によるデータ再編成処理のフローチャート例を示した図である。
【図8】本発明によるデータ再編成処理を実運用に乗せた場合の例を示した図である。
【図9】本発明によるデータ再編成処理により、データ移行を行う例を示した図である。
【図10】本発明によるデータ再編成処理で、無効領域の多い円板面だけを選択して処理する例を示した図である。
【符号の説明】
1 サーバ
11 制御ソフト
12 ファイル管理情報データベース
2 アレイディスク
21 アレイディスク内のハードディスク
3 光ディスクライブラリ
31〜35 光ディスクライブラリ内の円板面
5 ボリューム
6 ボリューム5に対するWRITEプロセス
61〜62 WRITEプロセスにおける内部処理
7 ボリューム5に対するREADプロセス
71〜72 READプロセスにおける内部処理
8 ボリューム内のファイル[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a data reorganization method in an optical disk library and other write-once control storage medium libraries.
[0002]
[Prior art]
There are various uses for storing data for a long period of time, such as drawings, slips, sentences, and forms. In the case of long-term storage of data, optical disks are often used because of low bit cost and long-term storage. In particular, when the data capacity is increased, the number of cases in which a large-capacity volume composed of a plurality of discs is configured using an optical disk library is increasing.
[0003]
An optical disk library is connected to a personal computer or workstation server via a SCSI interface or the like, and generally a large-capacity logical volume (hereinafter simply referred to as a volume) is constructed by collecting a plurality of disks in the library. Therefore, the user can access as one volume without being aware of each disk.
[0004]
When multiple disc surfaces in an optical disc library are combined into a single volume, the file is usually written additionally and is rewritten at the end of the data instead of using the original space even if there is an update. It is. As a result, it is possible to skip searching for a plurality of discs in the file writing process or in reading the updated file. When considering a volume consisting of multiple discs using an optical disk library, there is an overhead due to mechanical operation in the library in addition to low access performance of the optical disk. The ability to avoid searching for discs is an important factor in terms of performance. Information about where the valid data is in which disk is stored separately as file management information on the server, and the target valid data can be acquired without directly accessing all the disks.
[0005]
[Problems to be solved by the invention]
By the way, in the case of the write-once format, the invalid area in the volume increases as the amount of update / delete files increases. For this reason, it is necessary to periodically reorganize the data in the volume.
[0006]
Conventionally, the data reorganization process for volumes consisting of multiple discs in an optical disk library is based on the invalid data that is no longer used by updating or deleting in order from the top disc surface. It was a way to go.
[0007]
However, this method has a problem that it takes an enormous amount of time to pack all data when the volume size increases due to an increase in the number of disks or a higher density. Further, during the data reorganization process, there is a problem that the volume cannot be accessed, and depending on the volume size, the operation must be stopped for about 1 to 2 weeks.
[0008]
In addition, the method of packing valid data in order from the first disk surface involves movement of written data. If the process is interrupted carelessly due to a hardware failure or the like, data loss may occur. was there.
[0009]
The object of the present invention is easy to apply to actual operation without repacking valid data from the top medium in an optical disk library or other storage medium library that generally uses a plurality of media as one logical volume. The object is to provide a data reorganization method with a low risk of data loss.
[0010]
[Means for Solving the Problems]
In the present invention, the conventional write-once method is used for writing to the volume. When a data reorganization instruction is issued, data is read in order from the top medium surface, and file management information is referenced to determine whether the data is valid or invalid. Therefore, only valid data is added to the end of the volume. As a result, the medium having only the invalid area is removed from the volume management, and the medium can be reused by formatting. As a result, each volume is constituted by a minimum number of disks, and the effective capacity of the entire library can be expanded. This method is effective when the number of media constituting the volume is plural, and the reorganization is completed when the process is performed up to the surface immediately before the final surface.
[0011]
In order to perform planned data reorganization without stopping normal operation, data reorganization can be started while the volume is online, and when normal access requests are received, data reorganization is interrupted, Furthermore, the system must be able to resume data reorganization. Therefore, to what medium and to what extent (reorganization end medium address) is stored at the end of the reorganization, and is resumed from there when the next reorganization is started.
[0012]
In addition, since the written data remains on the original medium surface as it is, no data loss occurs even if it is interrupted carelessly during the reorganization process due to a hardware failure or the like. The reorganization processing up to at least the reorganization end medium address managed by the control software in the server has been completed, and the reorganization processing may be resumed from there.
[0013]
Next, if different storage media libraries are under the same management by the control software and one volume can be configured with the media in each library, the first half of the volume and the second half of the volume can be separated into the first half. The data can be transferred from the medium constituting the medium to the medium constituting the latter half. If this processing is performed for all volumes, all the media in the library that made up the first half media become invalid areas, and data can be migrated to the other library by removing them from volume management. .
[0014]
In addition, in the method of selecting and packing only media with many invalid areas, a value of invalid capacity is set in advance as a standard for performing data reorganization, and data reorganization is performed only for media with invalid areas exceeding that value. To do. The control software always manages the valid / invalid area capacity of each medium constituting the volume. When data reorganization is started, only the corresponding medium is processed, and as a result, data reorganization can be performed efficiently. .
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings. In the following embodiment, the target storage medium library is an optical disk library.
[0016]
FIG. 1 shows a configuration example of a system using an optical disk library. In the figure, an
[0017]
Under the control of the
[0018]
Further, the
[0019]
When WRITE to the file 8 occurs in the volume 5 (6), the
[0020]
FIG. 2 shows a configuration example of the optical disc library. As shown in FIG. 2, the
(1) The accessor 1111 moves the optical disk of the cell 11131 to the drive 11121 (1115), and performs I / O processing.
(2) The accessor 1111 moves the optical disk of the cell 11132 to the drive 11122 (1116), and performs I / O processing.
(3) After the accessor 1111 returns the optical disk from the drive 11121 to the cell 11131 (11171), the optical disk in the cell 11133 is moved to the drive 11121 (11172), and I / O processing is performed.
[0021]
Next, data access control of the
[0022]
FIG. 4 shows a format example of a directory related to the optical disc library in the file
[0023]
As shown in FIG. 4, the file
[0024]
When data reorganization processing described later is performed, valid physical addresses in the table 1213 are acquired for the total number of files in the table 1212 for each disk surface based on the disk surface ID information in the table 1211. . When the entire area of the disk surface becomes invalid, the total number of files in the table 1212 on the disk surface becomes 0, and there is no information in the corresponding table 1213. Here, when the disk surface is further removed from the volume management, the information on the table 1212 corresponding to the corresponding disk surface device ID information is deleted from the table 1211.
[0025]
Next, data reorganization will be described. Data reorganization control is also handled by the
[0026]
First, a conventional data reorganization process will be described with reference to FIG. Here, the
[0027]
Next, the outline of the data reorganization processing of the present invention will be described with reference to FIG. As for the precondition, as in FIG. 5, it is assumed that the volume 305 constituted by the disk surfaces 301, 302, 303, and 304 is in the state shown on the left side of FIG. 6 before data reorganization. When data reorganization is performed, first, the
[0028]
Next, how to actually apply the data reorganization processing of the present invention will be described. First, the data reorganization process is basically not performed by reorganizing all the data in the volume at once, but is basically performed little by little every day. Therefore, the data reorganization process can be performed in a normal job schedule. For this purpose, a command to explicitly start and end a data reorganization process is prepared so that the data reorganization process can be handled as one job. Then, the data reorganization process can be scheduled by specifying the time and setting the job sequence in the overall system operation. As the timing for ending the data reorganization process, there is a case where a data reorganization end command is input, the reorganization process is completed, or a normal write operation occurs. Further, even if the end condition occurs, the access performance can be expected to improve if the process is terminated after the writing process of one file is completed because the related data is continuously arranged. Therefore, the end command is provided with a mode in which the file data being processed is written and then the process is ended and a mode in which the process is forcibly ended.
[0029]
At the end of the reorganization process, the point (disc address, file name) of which disk surface and how far the reorganization process has been performed is stored (for example, stored in the file management information database 12), and the normal writing process to be performed from now on And the processing start point at the start of the next data reorganization.
[0030]
Reorganization processing is performed, and the invalid disk surface does not need to be accessed basically, so that the volume can be removed from the management even when it is online. However, if both sides of the disc are used, remove them from management after both sides become invalid.
[0031]
When there is not enough space in the writing process due to normal operation writing and data reorganization, a formatted disk that has been put in the library in advance under the control of the
[0032]
FIG. 7 shows an example of a flowchart of data reorganization processing according to the present invention based on the above. First, processing is started by a data reorganization start command. Here, an address at which the previous data reorganization is completed is acquired and set as a processing start address (step 401). When starting a new one, the start address of the top disk surface of the volume is set as the start address. Next, valid data is acquired from the disk surface with reference to the file management information in the file management information database 12 (step 402). Basically, as shown in FIG. 4, the effective data information for each disk surface is managed in the file
[0033]
An example in which the data reorganization processing of the present invention is incorporated in the actual operation schedule is shown in FIG. In this example, normal operation is from 8:00 to 0:00, data reorganization is performed from 1 o'clock with a margin of 1 hour, and a data reorganization end instruction is issued at 5 o'clock (operation schedule 505). An example applied to such an operation is a
[0034]
Next, an example in which data reorganization processing of the present invention is applied to transfer data between optical disk libraries will be described with reference to FIG. The old
[0035]
Next, the case where the volume size is reduced by reorganizing only the disk surface having a large capacity of the invalid area will be described with reference to FIG. Before the data reorganization, as shown on the left side of FIG. 10, the volume 707 includes a
[0036]
As mentioned above, although embodiment of this invention was described, it cannot be overemphasized that this invention is not limited to this. For example, the present invention is not limited to an optical disk library, and is generally applicable to a storage medium library in which a plurality of storage media are combined into one logical volume and data is written in a write-once format. In the embodiment, the hierarchical storage is configured by the array disk and the optical disk library. However, the present invention is not limited to the hierarchical storage.
[0037]
【The invention's effect】
As is apparent from the above description, the data reorganization method of the present invention provides the following effects.
(1) By removing a medium invalidated by data reorganization from the volume and reformatting it, the medium can be reused, and the usable area of the entire storage medium library increases.
[0038]
(2) From the operational point of view, it is not necessary to repack the valid data in order from the beginning medium of the volume, so the data reorganization process can be interrupted, and for example, the reorganization process can be executed little by little every day. There is an effect.
[0039]
(3) When considering from the viewpoint of data migration between libraries, data migration from an old medium to a new medium can be performed in the course of data reorganization processing. Therefore, data migration is possible even if the new drive cannot read the old medium.
[0040]
(4) With the conventional method, when creating a secondary medium, it was necessary to create a replica of the entire volume after data reorganization. However, if the present invention is adopted, a circle written by data reorganization is required. You only need to make a duplicate of the board. Therefore, even if the invalid area is refilled, the time required for creating the sub medium is reduced.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration example of a system applied to an optical disc library according to an embodiment of the present invention.
FIG. 2 shows an outline of the structure of an optical disc library.
FIG. 3 is a diagram for explaining volume write-once processing;
FIG. 4 is a diagram illustrating a format example of a volume file management information database;
FIG. 5 is a diagram for explaining conventional data reorganization processing;
FIG. 6 is a diagram illustrating data reorganization processing according to the present invention.
FIG. 7 is a flowchart showing an example of data reorganization processing according to the present invention.
FIG. 8 is a diagram showing an example when the data reorganization processing according to the present invention is put into actual operation;
FIG. 9 is a diagram showing an example of performing data migration by data reorganization processing according to the present invention.
FIG. 10 is a diagram showing an example in which only a disk surface with many invalid areas is selected and processed in the data reorganization processing according to the present invention.
[Explanation of symbols]
1 server
11 Control software
12 File management information database
2 Array disk
21 Hard disks in the array disk
3 Optical disk library
31-35 Disk surface in optical disk library
5 volumes
6 WRITE process for
61-62 Internal processing in WRITE process
7 READ process for
71-72 Internal processing in READ process
8 Files in the volume
Claims (6)
ボリュームの先頭の媒体面から順に有効データのみを読み出し、該読み出したデータを、ボリューム内の最終有効データが書かれている媒体面の該最終有効データ領域に続けて追記していくことを特徴とするデータ再編成方法。A data reorganization method in a storage medium library in which a plurality of medium surfaces are combined into one logical volume (hereinafter simply referred to as a volume), and data is written to the volume in a write-once format,
It is characterized in that only valid data is read in order from the medium surface at the beginning of the volume, and the read data is added to the final valid data area on the medium surface where the final valid data in the volume is written. To reorganize data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27128499A JP3725375B2 (en) | 1999-09-24 | 1999-09-24 | Data reorganization method in storage media library |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27128499A JP3725375B2 (en) | 1999-09-24 | 1999-09-24 | Data reorganization method in storage media library |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001092703A JP2001092703A (en) | 2001-04-06 |
JP3725375B2 true JP3725375B2 (en) | 2005-12-07 |
Family
ID=17497929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27128499A Expired - Lifetime JP3725375B2 (en) | 1999-09-24 | 1999-09-24 | Data reorganization method in storage media library |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3725375B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4079244B2 (en) | 2001-03-30 | 2008-04-23 | 日立ソフトウエアエンジニアリング株式会社 | Reorganization processing method for write-once type storage media volume |
US7037291B2 (en) | 2001-12-04 | 2006-05-02 | Advanced Cardiovascular Systems, Inc. | Catheter shaft junction having a polymeric reinforcing member with a high glass transition temperature |
JP5181620B2 (en) | 2007-10-26 | 2013-04-10 | ソニー株式会社 | Recording apparatus, disk switching method, and computer program |
JP5206103B2 (en) * | 2008-05-09 | 2013-06-12 | 日本電気株式会社 | Storage device, storage device control system, storage device control method, and program |
-
1999
- 1999-09-24 JP JP27128499A patent/JP3725375B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2001092703A (en) | 2001-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6816941B1 (en) | Method and system for efficiently importing/exporting removable storage volumes between virtual storage systems | |
US6718427B1 (en) | Method and system utilizing data fragments for efficiently importing/exporting removable storage volumes | |
CA2308681C (en) | Method and apparatus for storage of data | |
US8392685B2 (en) | Arrangements for managing metadata of an integrated logical unit including differing types of storage media | |
US7308528B2 (en) | Virtual tape library device | |
EP1805589B1 (en) | Tape emulating disk based storage and method with automatically resized emulated tape capacity | |
US8015157B2 (en) | File sharing system, file server, and method for managing files | |
JP3509285B2 (en) | Compressed data management method | |
US5214781A (en) | Method of managing storage medium | |
JP4402103B2 (en) | Data storage device, data relocation method thereof, and program | |
CZ294346B6 (en) | Method of accessing or archiving data stored in a computer system and the computer system for making the same | |
KR20000022716A (en) | Efficient volume copy using pre-configuration of log structured target storage | |
US6629203B1 (en) | Alternating shadow directories in pairs of storage spaces for data storage | |
US8359439B2 (en) | Backup apparatus, backup method, and file reading apparatus | |
JP6531574B2 (en) | Storage device, storage device control program and storage device control method | |
JP2006079274A (en) | File management device, network system, file management method and program | |
JP3725375B2 (en) | Data reorganization method in storage media library | |
JP2005202942A (en) | Information recording medium, data processor and data processing method | |
JP4394467B2 (en) | Storage system, server apparatus, and preceding copy data generation method | |
JP4079244B2 (en) | Reorganization processing method for write-once type storage media volume | |
US20100131469A1 (en) | Storage management device and file deletion control method | |
EP1686451A1 (en) | Virtual tape library device | |
JP2005165485A (en) | File management device, storage management system, system management method, program, and recording medium | |
JP2006079273A (en) | File management device, network system, file management method, and program | |
JPH0233621A (en) | Recording medium control system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050921 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3725375 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080930 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080930 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080930 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110930 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140930 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |