JP2024043376A - 情報処理装置、情報処理方法、及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法、及び情報処理プログラム Download PDF

Info

Publication number
JP2024043376A
JP2024043376A JP2022148540A JP2022148540A JP2024043376A JP 2024043376 A JP2024043376 A JP 2024043376A JP 2022148540 A JP2022148540 A JP 2022148540A JP 2022148540 A JP2022148540 A JP 2022148540A JP 2024043376 A JP2024043376 A JP 2024043376A
Authority
JP
Japan
Prior art keywords
packed
objects
data
magnetic tape
data migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022148540A
Other languages
English (en)
Inventor
輝江 渡邊
豊 大石
優子 増田
美咲 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2022148540A priority Critical patent/JP2024043376A/ja
Priority to US18/356,170 priority patent/US20240094935A1/en
Priority to CN202311154900.7A priority patent/CN117727342A/zh
Publication of JP2024043376A publication Critical patent/JP2024043376A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B20/1201Formatting, e.g. arrangement of data block or words on the record carriers on tapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0632Configuration or reconfiguration of storage systems by initialisation or re-initialisation of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0682Tape device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0686Libraries, e.g. tape libraries, jukebox
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/002Programmed access in sequence to a plurality of record carriers or indexed parts, e.g. tracks, thereof, e.g. for editing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Library & Information Science (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】データ移行の際のテープドライブに対する磁気テープの入れ替えの発生頻度を低減することができる情報処理装置、情報処理方法、及び情報処理プログラムを得る。
【解決手段】情報処理装置は、1本のデータ移行元の磁気テープに記録された各パックドオブジェクトについて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定し、再生成すると判定した第1のパックドオブジェクトに含まれるオブジェクトを用いて第2のパックドオブジェクトを生成し、複数の第2のパックドオブジェクト及びパリティデータを複数の磁気テープに分散して記録する制御を行い、再生成しないと判定したパックドオブジェクトをデータ移行元の磁気テープとは異なる磁気テープに記録する制御を行う。
【選択図】図10

Description

本開示は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
特許文献1には、複数のデータをまとめて磁気テープに記録する技術が開示されている。
特許文献2には、複数のデータを用いてパリティデータを生成し、その複数のデータ及びパリティデータを複数の磁気テープに分散して記録する技術が開示されている。
WO2021/181739A1 特開2021-117772号公報
データの移行元の磁気テープからデータの移行先の磁気テープへデータを移行する場合、テープドライブに対する磁気テープの入れ替えの発生頻度が高くなると、データの移行時間が長くなってしまう。
本開示は、以上の事情を鑑みてなされたものであり、データ移行の際のテープドライブに対する磁気テープの入れ替えの発生頻度を低減することができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
第1の態様の情報処理装置は、少なくとも一つのプロセッサを備える情報処理装置であって、プロセッサは、データ及びそのデータに関するメタデータを含む1つ以上のオブジェクトがまとめられた複数のパックドオブジェクトと、その複数のパックドオブジェクトを用いて生成されたパリティデータとが分散して記録された複数の磁気テープのうち、データ移行の対象として指定された1本のデータ移行元の磁気テープに記録された各パックドオブジェクトについて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定し、再生成すると判定した第1のパックドオブジェクトに含まれるオブジェクトを用いて第2のパックドオブジェクトを生成し、複数の第2のパックドオブジェクトを用いてパリティデータを生成し、複数の第2のパックドオブジェクト及びパリティデータを複数の磁気テープに分散して記録する制御を行い、再生成しないと判定したパックドオブジェクトについては、そのパックドオブジェクトをデータ移行元の磁気テープとは異なる磁気テープに記録する制御を行う。
第2の態様の情報処理装置は、第1の態様の情報処理装置において、プロセッサは、データ移行の目的がデータ移行元の磁気テープを初期化したうえで再利用することである場合、更に、第2のパックドオブジェクトの生成に用いられた第1のパックドオブジェクトをデータ移行元の磁気テープとは異なる磁気テープに退避する。
第3の態様の情報処理装置は、第2の態様の情報処理装置において、複数のパックドオブジェクトとその複数のパックドオブジェクトから生成されたパリティデータとが1つのグループとされ、プロセッサは、データ移行元の磁気テープのデータ移行の処理中に、データ移行元の磁気テープ以外にデータの移行元として指定され、かつデータ移行の対象として指定された磁気テープが存在する場合、データ移行の処理中のデータ移行元の磁気テープに記録されているパックドオブジェクトと同じグループに属するパックドオブジェクトが記録されている数が多い順をデータ移行元の磁気テープ以外のデータの移行元として指定された磁気テープのデータ移行の順番とする。
第4の態様の情報処理装置は、第1の態様から第3の態様の何れか1態様の情報処理装置において、複数のパックドオブジェクトとその複数のパックドオブジェクトから生成されたパリティデータとが1つのグループとされ、プロセッサは、データ移行の目的が相対的に古い世代の磁気テープから相対的に新しい世代の磁気テープへのデータ移行である場合、データ移行元の磁気テープに記録されているパックドオブジェクトと同じグループのパックドオブジェクトが相対的に新しい世代の磁気テープに記録されている場合、そのデータ移行元の磁気テープに記録されているパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成しないと判定する。
第5の態様の情報処理装置は、第1の態様から第4の態様の何れか1態様の情報処理装置において、プロセッサは、データ移行元の磁気テープに記録されたパックドオブジェクトにおけるオブジェクトの削除率に基づいて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定する。
第6の態様の情報処理方法は、データ及びそのデータに関するメタデータを含む1つ以上のオブジェクトがまとめられた複数のパックドオブジェクトと、その複数のパックドオブジェクトを用いて生成されたパリティデータとが分散して記録された複数の磁気テープのうち、データ移行の対象として指定された1本のデータ移行元の磁気テープに記録された各パックドオブジェクトについて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定し、再生成すると判定した第1のパックドオブジェクトに含まれるオブジェクトを用いて第2のパックドオブジェクトを生成し、複数の第2のパックドオブジェクトを用いてパリティデータを生成し、複数の第2のパックドオブジェクト及びパリティデータを複数の磁気テープに分散して記録する制御を行い、再生成しないと判定したパックドオブジェクトについては、そのパックドオブジェクトをデータ移行元の磁気テープとは異なる磁気テープに記録する制御を行う処理を情報処理装置が備えるプロセッサが実行するものである。
第7の態様の情報処理プログラムは、データ及びそのデータに関するメタデータを含む1つ以上のオブジェクトがまとめられた複数のパックドオブジェクトと、その複数のパックドオブジェクトを用いて生成されたパリティデータとが分散して記録された複数の磁気テープのうち、データ移行の対象として指定された1本のデータ移行元の磁気テープに記録された各パックドオブジェクトについて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定し、再生成すると判定した第1のパックドオブジェクトに含まれるオブジェクトを用いて第2のパックドオブジェクトを生成し、複数の第2のパックドオブジェクトを用いてパリティデータを生成し、複数の第2のパックドオブジェクト及びパリティデータを複数の磁気テープに分散して記録する制御を行い、再生成しないと判定したパックドオブジェクトについては、そのパックドオブジェクトをデータ移行元の磁気テープとは異なる磁気テープに記録する制御を行う処理を情報処理装置が備えるプロセッサに実行させるためのものである。
本開示によれば、データ移行の際のテープドライブに対する磁気テープの入れ替えの発生頻度を低減することができる。
情報処理システムの構成の一例を示すブロック図である。 オブジェクトを説明するための図である。 パックドオブジェクトを説明するための図である。 情報処理装置のハードウェア構成の一例を示すブロック図である。 パックドオブジェクト及びパリティデータの磁気テープにおける記録状態を説明するための図である。 情報処理装置の機能的な構成の一例を示すブロック図である。 パックドオブジェクトの再生成の可否を判定する処理を説明するための図である。 パックドオブジェクトの再生成処理を説明するための図である。 パリティデータの生成処理を説明するための図である。 パックドオブジェクト及びパリティデータの磁気テープへの記録処理を説明するための図である。 再生成しないと判定されたパックドオブジェクトの移行処理を説明するための図である。 データ移行処理の一例を示すフローチャートである。 変形例に係る第1のパックドオブジェクトの退避処理を説明するための図である。 変形例に係るデータ移行の順番を説明するための図である。 変形例に係るパックドオブジェクトの再生成の可否を判定する処理を説明するための図である。
以下、図面を参照して、本開示の技術を実施するための形態例を詳細に説明する。
まず、図1を参照して、本実施形態に係る情報処理システム10の構成を説明する。図1に示すように、情報処理システム10は、情報処理装置12及びテープライブラリ14を含む。情報処理装置12の例としては、サーバコンピュータ等が挙げられる。
テープライブラリ14は、複数のスロット(図示省略)及び複数のテープドライブ18を備え、各スロットには記録媒体の一例としての磁気テープTが格納される。各テープドライブ18は、情報処理装置12に接続される。テープドライブ18は、情報処理装置12による制御によって、磁気テープTに対するデータの書き込み又は読み取りを行う。磁気テープTの例としては、LTO(Linear Tape-Open)テープが挙げられる。
情報処理装置12により磁気テープTに対するデータの書き込み又は読み取りを行う場合、書き込み又は読み取り対象の磁気テープTがスロットから所定のテープドライブ18にロードされる。テープドライブ18にロードされた磁気テープTに対するデータの書き込み又は読み取りが完了すると、磁気テープTは、テープドライブ18から元々格納されていたスロットにアンロードされる。
本実施形態では、一例として図2に示すように、磁気テープTに記録するデータを取り扱う単位として、文書データ及び画像データ等のユーザが保存対象とするデータと、そのデータに関するメタデータとを含むオブジェクトを適用した形態例を説明する。図2の例では、メタデータを「メタ」と表記している。なお、このオブジェクトを取り扱うストレージシステムは、オブジェクトストレージシステムと称される。メタデータには、例えば、オブジェクトキー等のオブジェクトの識別情報、オブジェクト名、データのサイズ、及びタイムスタンプ等の属性情報が含まれる。なお、オブジェクトを磁気テープTに記録する際のデータ及びメタデータの記録順は特に限定されず、メタデータ及びデータの順でもよいし、データ及びメタデータの順でもよい。
また、本実施形態では、一例として図3に示すように、1つ以上のオブジェクトが予め定められたルール(以下、「パッキングルール」という)に従ってまとめられたオブジェクト(以下、「パックドオブジェクト」という)単位でオブジェクトが磁気テープTに記録される。これは、情報処理装置12が磁気テープTへオブジェクトを記録する際のテープドライブ18への記録指示のコマンド発行によるオーバーヘッドの低減等を目的としている。パックドオブジェクトは、開示の技術に係るデータ移行の対象とされる磁気テープTに記録されたデータの一例である。図3の「obj」はオブジェクトを表している。なお、図3では、1つのパックドオブジェクトに4つのオブジェクトが含まれる例を示しているが、これに限定されない。1つのパックドオブジェクトに3つ以下のオブジェクトが含まれてもよいし、5つ以上のオブジェクトが含まれてもよい。また、パックドオブジェクトに含まれるオブジェクトの個数は均一でなくてもよい。
パッキングルールの例としては、同じ拡張子のデータを含む複数のオブジェクトを同じパックドオブジェクトにまとめる、又は同時に読み取られる可能性の高い複数のオブジェクトを同じパックドオブジェクトにまとめる、といったルールが挙げられる。また、パッキングルールの例としては、1つのパックドオブジェクトのサイズが予め定められた下限値以上上限値未満となるように複数のオブジェクトを1つのパックドオブジェクトにまとめる、といったルールが挙げられる。また、パッキングルールの例としては、1つのパックドオブジェクトに含まれるオブジェクトの数が予め定められた下限値以上上限値未満となるように複数のオブジェクトを1つのパックドオブジェクトにまとめる、といったルールが挙げられる。また、複数のパッキングルールを組み合わせてもよい。
次に、図4を参照して、本実施形態に係る情報処理装置12のハードウェア構成を説明する。図4に示すように、情報処理装置12は、CPU(Central Processing Unit)20、一時記憶領域としてのメモリ21、及び不揮発性の記憶部22を含む。また、情報処理装置12は、液晶ディスプレイ等のディスプレイ23、キーボードとマウス等の入力装置24、ネットワークに接続されるネットワークI/F(InterFace)25、及び各テープドライブ18が接続される外部I/F26を含む。CPU20、メモリ21、記憶部22、ディスプレイ23、入力装置24、ネットワークI/F25、及び外部I/F26は、バス27に接続される。CPU20は、プロセッサの一例である。
記憶部22は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリ等によって実現される。記憶媒体としての記憶部22には、情報処理プログラム30が記憶される。CPU20は、記憶部22から情報処理プログラム30を読み出してからメモリ21に展開し、展開した情報処理プログラム30を実行する。
ところで、本実施形態に係る情報処理装置12は、磁気テープTに記録されたパックドオブジェクトを磁気テープTに移行する機能を有する。以下では、このデータ移行におけるデータ移行元の磁気テープTを移行元テープといい、データ移行先の磁気テープTを移行先テープという。図5を参照して、移行元テープに記録済みの移行対象のパックドオブジェクトについて説明する。本実施形態では、パックドオブジェクトの冗長性の確保のために、複数のパックドオブジェクトを用いてパリティデータが生成される。本実施形態では、説明を分かり易くするために、3つのパックドオブジェクトから1つのパリティデータが生成される構成(所謂3D+1Pの構成)を例に説明する。なお、パックドオブジェクトの数及びパリティデータの数の組合せはこの例に限定されない。また、情報処理装置12は、3つのパックドオブジェクト及びその3つのパックドオブジェクトから生成された1つのパリティデータを1つのグループに属するものとして取り扱う。このグループは、パリティグループと称されることもある。
図5に示すように、本実施形態では、1つのグループのパックドオブジェクトの数及びパリティデータの数の合計値と同数のストレージプールが用意され、各ストレージプールは、複数の磁気テープTによって構成される。データが磁気テープTに記録される場合、データの記録先のストレージプールが指定され、指定されたストレージプールに含まれる何れかの磁気テープTにデータが記録される。
本実施形態では、1つのグループに属する3つのパックドオブジェクトと1つのパリティデータとが4つのストレージプール、すなわち、4本の磁気テープTに分散して記録される。図5における「PoolA」、「PoolB」、「PoolC」、及び「PoolP」はストレージプールを表している。「PoolA」、「PoolB」、及び「PoolC」は、パックドオブジェクトの記録用のストレージプールであり、「PoolP」はパリティデータの記録用のストレージプールである。
図5における「PO」はパックドオブジェクトを表しており、「パリティ」はパリティデータを表している。図5における「PO」の後の1文字のアルファベットは、同じグループ内のパックドオブジェクトを識別するためのものである。図5における1文字のアルファベットの後の数字、及び「パリティ」の後の数字は、グループを識別するためのものである。すなわち、例えば、図5における「パリティ1」は、「PO A-1」、「PO B-1」、及び「PO C-1」を用いて生成されたパリティデータである。以上のように構成することで、1本の磁気テープTが使用不可能になった場合でも、残りの3本の磁気テープTに記録された2つのパックドオブジェクト及び1つのパリティデータから、使用不可能になった1本の磁気テープTに記録されたパックドオブジェクトを復元することができる。
また、本実施形態では、ストレージプール機能が使用されるため、ストレージプール間での磁気テープTのデータの記録状態が同じようになるとは限らない。例えば、図5に示すように、「PoolA」では、「PO A-1」及び「PO A-2」が同じ磁気テープTに記録され、「PoolB」では、「PO B-1」及び「PO B-2」が異なる磁気テープTに記録されることも発生し得る。
次に、図6を参照して、本実施形態に係る情報処理装置12の機能的な構成について説明する。図6に示すように、情報処理装置12は、判定部40、第1生成部42、第2生成部44、及び制御部46を含む。CPU20が情報処理プログラム30を実行することにより、判定部40、第1生成部42、第2生成部44、及び制御部46として機能する。
判定部40は、複数の磁気テープTのうち、データ移行の対象として指定された1本の移行元テープに記録された各パックドオブジェクトについて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定する。本実施形態では、判定部40は、移行元テープに記録されたパックドオブジェクトにおけるオブジェクトの削除率に基づいて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定する。
本実施形態に係る情報処理システム10では、情報処理システム10のユーザ又は管理者等により削除要求が入力されたオブジェクトは、削除要求が入力された時点では磁気テープTからは削除されず、オブジェクトが削除されたことを表す削除情報が付与される。この削除情報は、例えば、オブジェクトを管理するためのデータベース又はそのオブジェクトが記録された磁気テープTの管理情報を記録する領域等に、オブジェクトに対応付けられて保存される。これは、磁気テープTに記録されたオブジェクトの中から特定のオブジェクトのみを磁気テープT上から削除することが困難であるためである。パックドオブジェクトにおけるオブジェクトの削除率とは、パックドオブジェクト内のオブジェクトが削除された比率を表す。
本実施形態では、判定部40は、削除率として、パックドオブジェクトに含まれるオブジェクトの総数に対する削除情報が付与されたオブジェクトの数の比率を導出する。なお、判定部40は、削除率として、パックドオブジェクトに含まれるオブジェクトの総サイズに対する削除情報が付与されたオブジェクトの総サイズの比率を導出してもよい。そして、図7に示すように、判定部40は、削除率が閾値以上のパックドオブジェクトについては、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成すると判定する。一方、判定部40は、削除率が閾値未満のパックドオブジェクトについては、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成しないと判定する。
図7における実線のオブジェクトは削除情報が付与されていないオブジェクトを表し、破線のオブジェクトは削除情報が付与されているオブジェクトを表している。また、図7では、閾値を50%とした場合の例を示している。従って、図7の例では、4つのオブジェクトのうち3つのオブジェクトに削除情報が付与されているパックドオブジェクト、すなわち、削除率が75%のパックドオブジェクトについては再生成すると判定される。また、図7の例では、4つのオブジェクトのうち1つのオブジェクトに削除情報が付与されているパックドオブジェクト、すなわち、削除率が25%のパックドオブジェクトについては再生成しないと判定される。
第1生成部42は、判定部40により再生成すると判定されたパックドオブジェクト(以下、「第1のパックドオブジェクト」という)に含まれるオブジェクトを用いてパックドオブジェクト(以下、「第2のパックドオブジェクト」という)を生成する。図8に示すように、本実施形態では、第1生成部42は、第1のパックドオブジェクトに含まれるオブジェクトのうち削除情報が付与されていないオブジェクトのみを用いて、前述したパッキングルールに従って、第2のパックドオブジェクトを生成する。図8における実線のオブジェクトは削除情報が付与されていないオブジェクトを表し、破線のオブジェクトは削除情報が付与されているオブジェクトを表している。図8では、第1生成部42が、3つの第1のパックドオブジェクトに含まれるオブジェクトのうち削除情報が付与されていない4つのオブジェクトを用いて第2のパックドオブジェクトを生成する例を示している。
第2生成部44は、第1生成部42により生成された複数の第2のパックドオブジェクトを用いてパリティデータを生成する。図9に示すように、本実施形態では、第2生成部44は、第1生成部42により生成された3つの第2のパックドオブジェクトを用いて、第2のパックドオブジェクトと同一サイズの1つのパリティデータを生成する。本実施形態に係るパリティデータは、3つのパックドオブジェクトのうちの1つのパックドオブジェクトが失われても、その1つのパックドオブジェクトを残りの2つのパックドオブジェクトと1つのパリティデータとから復元可能な冗長符号である。
なお、第2生成部44は、複数の第2のパックドオブジェクトを用いてパリティデータを生成する場合、最大サイズの第2のパックドオブジェクト以外の第2のパックドオブジェクトに対してダミーデータを付加することにより複数の第2のパックドオブジェクトのサイズを同一サイズにする処理を実行してもよい。この場合のダミーデータの例としては、0でパディングされたデータ、又は1でパディングされたデータ等が挙げられる。
制御部46は、複数の第2のパックドオブジェクト及びその複数の第2のパックドオブジェクトを用いて第2生成部44により生成されたパリティデータを複数の磁気テープTに分散して記録する制御を行う。すなわち、図10に示すように、移行元テープに記録されたパックドオブジェクトのうち、判定部40により再生成すると判定された第1のパックドオブジェクトを用いて第2のパックドオブジェクトが生成される。そして、複数の第2のパックドオブジェクトを用いてパリティデータが生成され、その複数のパックドオブジェクト及びパリティデータが複数の磁気テープTに分散して記録される。図10の例では、データ移行の対象として指定された1本の移行元テープが「PoolA」に属する場合を示している。また、図10における「PO」はパックドオブジェクトを表しており、「パリティ」はパリティデータを表している。
また、制御部46は、判定部40により再生成しないと判定されたパックドオブジェクトについては、そのパックドオブジェクトを移行元テープとは異なる磁気テープTに記録する制御を行う。具体的には、図11に示すように、制御部46は、判定部40により再生成しないと判定されたパックドオブジェクトについては、そのパックドオブジェクトを移行元テープと同じストレージプールに属し、かつ移行元テープとは異なる磁気テープTに記録する制御を行う。図11における「PO」はパックドオブジェクトを表している。すなわち、この場合、このパックドオブジェクトは、同じグループに属することが継続される。
次に、図12を参照して、本実施形態に係る情報処理装置12の作用を説明する。CPU20が情報処理プログラム30を実行することによって、図12に示すデータ移行処理が実行される。図12に示すデータ移行処理は、例えば、実行開始の指示が入力装置24を介して入力された場合等に実行される。また、ここでは、実行開始の指示とともに、データ移行の対象として指定された1本の移行元テープを特定可能な情報も入力されるものとする。
図12のステップS10で、判定部40は、前述したように、データ移行の対象として指定された1本の移行元テープに記録された各パックドオブジェクトについて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定する。ステップS10で再生成すると判定されたパックドオブジェクトに対してはステップS12~S16の処理が実行される。また、ステップS10で再生成しないと判定されたパックドオブジェクトに対してはステップS18の処理が実行される。
ステップS12で、第1生成部42は、前述したように、ステップS10で再生成すると判定された第1のパックドオブジェクトに含まれるオブジェクトを用いて第2のパックドオブジェクトを生成する。ステップS14で、第2生成部44は、前述したように、ステップS12で生成された複数の第2のパックドオブジェクトを用いてパリティデータを生成する。ステップS16で、制御部46は、前述したように、複数の第2のパックドオブジェクト及びその複数の第2のパックドオブジェクトを用いてステップS14で生成されたパリティデータを複数の磁気テープTに分散して記録する制御を行う。ステップS16の処理が終了すると、データ移行処理が終了する。
一方、ステップS18で、制御部46は、前述したように、ステップS10で再生成しないと判定されたパックドオブジェクトについては、そのパックドオブジェクトを移行元テープとは異なる磁気テープTに記録する制御を行う。ステップS18の処理が終了すると、データ移行処理が終了する。
以上説明したように、本実施形態によれば、1本の移行元テープから、その移行元テープに記録されたパックドオブジェクトの冗長性を維持した状態で、データ移行を行うことができる。すなわち、移行元テープが1本であるため、データ移行に使用するテープドライブ18の数を低減できる結果、データ移行の際のテープドライブ18に対する磁気テープTの入れ替えの発生頻度を低減することができる。従って、データの移行時間が長くなることを抑制することができる。
なお、上記実施形態において、データ移行の目的が移行元テープを初期化したうえで再利用することである場合、制御部46は、更に、第2のパックドオブジェクトの生成に用いられた第1のパックドオブジェクトを移行元テープとは異なる磁気テープTに退避してもよい。具体的には、一例として図13に示すように、この場合、制御部46は、更に、第2のパックドオブジェクトの生成に用いられた第1のパックドオブジェクトを移行元テープと同じストレージプールに属し、かつ移行元テープとは異なる磁気テープTに記録する制御を行う。これにより、移行元テープを初期化した場合においても移行元テープに記録された第1のパックドオブジェクトが失われない。このため、移行元テープに記録された第1のパックドオブジェクトが属するグループのパックドオブジェクトが失われたとしても、その失われたパックドオブジェクトを復元することができる。図13における「PO」はパックドオブジェクトを表しており、「パリティ」はパリティデータを表している。
また、この形態例において、制御部46は、移行元テープのデータ移行の処理中に、移行元テープ以外にデータの移行元として指定され、かつデータ移行の対象として指定された磁気テープが存在する場合、以下に示すようにデータ移行の順番を導出してもよい。すなわち、この場合、制御部46は、データ移行の処理中の移行元テープに記録されているパックドオブジェクトと同じグループに属するパックドオブジェクトが記録されている数が多い順を移行元テープ以外のデータの移行元として指定された磁気テープのデータ移行の順番としてもよい。図14を参照して、このデータ移行の順番の具体例を説明する。
図14に示すように、6本の磁気テープTが存在し、6本の磁気テープTを区別する場合には符号の末尾に数字を付すものとする。また、ここでは、磁気テープT1がデータ移行の処理中の移行元テープであり、磁気テープT2~T6がデータの移行元として指定され、かつデータ移行の対象として指定された磁気テープTであり、データ移行を待機している磁気テープTであるものとする。図14における「PO」はパックドオブジェクトを表しており、「パリティ」はパリティデータを表している。図14における「PO」の後の1文字のアルファベットは、同じグループ内のパックドオブジェクトを識別するためのものである。図14における1文字のアルファベットの後の数字、及び「パリティ」の後の数字は、グループを識別するためのものである。この表記ルールは、後述する図15においても同様である。
図14の例では、データ移行の処理中の移行元テープに記録されているパックドオブジェクトは、「PO A-1」、「PO A-2」、「PO A-3」、及び「PO A-4である。また、図14の例では、磁気テープT2~T6それぞれについて、データ移行の処理中の移行元テープに記録されているパックドオブジェクトと同じグループに属するパックドオブジェクトが記録されている数は、磁気テープT2は4つ、磁気テープT3~T6は2つである。従って、この場合、制御部46は、磁気テープT2を磁気テープT1の次にデータ移行の対象とし、磁気テープT3~T6を磁気テープT2の次にデータ移行の対象とする。
また、上記実施形態において、判定部40は、データ移行の目的が相対的に古い世代の磁気テープTから相対的に新しい世代の磁気テープTへのデータ移行である場合に、以下の判定を行ってもよい。すなわち、この場合、判定部40は、移行元テープに記録されているパックドオブジェクトと同じグループのパックドオブジェクトが相対的に新しい世代の磁気テープTに記録されている場合、その移行元テープに記録されているパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成しないと判定してもよい。図15を参照して、この判定処理の具体例を説明する。
図15に示すように、4本の磁気テープTが存在し、4本の磁気テープTを区別する場合には符号の末尾に数字を付すものとする。また、ここでは、磁気テープT1が移行元テープであり、相対的に古い世代の磁気テープTであるものとする。また、ここでは、磁気テープT2~T4が相対的に新しい世代の磁気テープTであるものとする。すなわち、図15の例では、移行元テープに記録されているパックドオブジェクトと同じグループの全てのパックドオブジェクトが相対的に新しい世代の磁気テープTに記録されている。従って、この場合、判定部40は、移行元テープに記録されているパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成しないと判定する。なお、判定部40は、移行元テープに記録されているパックドオブジェクトと同じグループの全てのパックドオブジェクトではなく、一定数以上のパックドオブジェクトが相対的に新しい世代の磁気テープTに記録されている場合、その移行元テープに記録されているパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成しないと判定してもよい。
また、上記実施形態において、例えば、判定部40、第1生成部42、第2生成部44、及び制御部46といった各種の処理を実行する処理部(processing unit)のハードウェア的な構造としては、次に示す各種のプロセッサ(processor)を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPUに加えて、FPGA(Field Programmable Gate Array)等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
1つの処理部は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせや、CPUとFPGAとの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。
複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアント及びサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System on Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの1つ以上を用いて構成される。
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)を用いることができる。
また、上記実施形態では、情報処理プログラム30が記憶部22に予め記憶(インストール)されている態様を説明したが、これに限定されない。情報処理プログラム30は、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、情報処理プログラム30は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
10 情報処理システム
12 情報処理装置
14 テープライブラリ
18 テープドライブ
20 CPU
21 メモリ
22 記憶部
23 ディスプレイ
24 入力装置
25 ネットワークI/F
26 外部I/F
27 バス
30 情報処理プログラム
40 判定部
42 第1生成部
44 第2生成部
46 制御部
T 磁気テープ

Claims (7)

  1. 少なくとも一つのプロセッサを備える情報処理装置であって、
    前記プロセッサは、
    データ及びそのデータに関するメタデータを含む1つ以上のオブジェクトがまとめられた複数のパックドオブジェクトと、その複数のパックドオブジェクトを用いて生成されたパリティデータとが分散して記録された複数の磁気テープのうち、データ移行の対象として指定された1本のデータ移行元の磁気テープに記録された各パックドオブジェクトについて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定し、
    再生成すると判定した第1のパックドオブジェクトに含まれるオブジェクトを用いて第2のパックドオブジェクトを生成し、
    複数の第2のパックドオブジェクトを用いてパリティデータを生成し、
    前記複数の第2のパックドオブジェクト及び前記パリティデータを複数の磁気テープに分散して記録する制御を行い、
    再生成しないと判定したパックドオブジェクトについては、そのパックドオブジェクトを前記データ移行元の磁気テープとは異なる磁気テープに記録する制御を行う
    情報処理装置。
  2. 前記プロセッサは、
    データ移行の目的が前記データ移行元の磁気テープを初期化したうえで再利用することである場合、更に、前記第2のパックドオブジェクトの生成に用いられた前記第1のパックドオブジェクトを前記データ移行元の磁気テープとは異なる磁気テープに退避する
    請求項1に記載の情報処理装置。
  3. 前記複数のパックドオブジェクトとその複数のパックドオブジェクトから生成されたパリティデータとが1つのグループとされ、
    前記プロセッサは、
    前記データ移行元の磁気テープのデータ移行の処理中に、前記データ移行元の磁気テープ以外にデータの移行元として指定され、かつデータ移行の対象として指定された磁気テープが存在する場合、前記データ移行の処理中の前記データ移行元の磁気テープに記録されているパックドオブジェクトと同じグループに属するパックドオブジェクトが記録されている数が多い順を前記データ移行元の磁気テープ以外のデータの移行元として指定された磁気テープのデータ移行の順番とする
    請求項2に記載の情報処理装置。
  4. 前記複数のパックドオブジェクトとその複数のパックドオブジェクトから生成されたパリティデータとが1つのグループとされ、
    前記プロセッサは、
    データ移行の目的が相対的に古い世代の磁気テープから相対的に新しい世代の磁気テープへのデータ移行である場合、前記データ移行元の磁気テープに記録されているパックドオブジェクトと同じグループのパックドオブジェクトが相対的に新しい世代の磁気テープに記録されている場合、そのデータ移行元の磁気テープに記録されているパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成しないと判定する
    請求項1から請求項3の何れか1項に記載の情報処理装置。
  5. 前記プロセッサは、
    前記データ移行元の磁気テープに記録されたパックドオブジェクトにおけるオブジェクトの削除率に基づいて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定する
    請求項1から請求項3の何れか1項に記載の情報処理装置。
  6. データ及びそのデータに関するメタデータを含む1つ以上のオブジェクトがまとめられた複数のパックドオブジェクトと、その複数のパックドオブジェクトを用いて生成されたパリティデータとが分散して記録された複数の磁気テープのうち、データ移行の対象として指定された1本のデータ移行元の磁気テープに記録された各パックドオブジェクトについて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定し、
    再生成すると判定した第1のパックドオブジェクトに含まれるオブジェクトを用いて第2のパックドオブジェクトを生成し、
    複数の第2のパックドオブジェクトを用いてパリティデータを生成し、
    前記複数の第2のパックドオブジェクト及び前記パリティデータを複数の磁気テープに分散して記録する制御を行い、
    再生成しないと判定したパックドオブジェクトについては、そのパックドオブジェクトを前記データ移行元の磁気テープとは異なる磁気テープに記録する制御を行う
    処理を情報処理装置が備えるプロセッサが実行する情報処理方法。
  7. データ及びそのデータに関するメタデータを含む1つ以上のオブジェクトがまとめられた複数のパックドオブジェクトと、その複数のパックドオブジェクトを用いて生成されたパリティデータとが分散して記録された複数の磁気テープのうち、データ移行の対象として指定された1本のデータ移行元の磁気テープに記録された各パックドオブジェクトについて、そのパックドオブジェクトに含まれるオブジェクトを用いてパックドオブジェクトを再生成するか否かを判定し、
    再生成すると判定した第1のパックドオブジェクトに含まれるオブジェクトを用いて第2のパックドオブジェクトを生成し、
    複数の第2のパックドオブジェクトを用いてパリティデータを生成し、
    前記複数の第2のパックドオブジェクト及び前記パリティデータを複数の磁気テープに分散して記録する制御を行い、
    再生成しないと判定したパックドオブジェクトについては、そのパックドオブジェクトを前記データ移行元の磁気テープとは異なる磁気テープに記録する制御を行う
    処理を情報処理装置が備えるプロセッサに実行させるための情報処理プログラム。
JP2022148540A 2022-09-16 2022-09-16 情報処理装置、情報処理方法、及び情報処理プログラム Pending JP2024043376A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022148540A JP2024043376A (ja) 2022-09-16 2022-09-16 情報処理装置、情報処理方法、及び情報処理プログラム
US18/356,170 US20240094935A1 (en) 2022-09-16 2023-07-20 Information processing apparatus, information processing method, and information processing program
CN202311154900.7A CN117727342A (zh) 2022-09-16 2023-09-08 信息处理装置、信息处理方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022148540A JP2024043376A (ja) 2022-09-16 2022-09-16 情報処理装置、情報処理方法、及び情報処理プログラム

Publications (1)

Publication Number Publication Date
JP2024043376A true JP2024043376A (ja) 2024-03-29

Family

ID=87845553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022148540A Pending JP2024043376A (ja) 2022-09-16 2022-09-16 情報処理装置、情報処理方法、及び情報処理プログラム

Country Status (3)

Country Link
US (1) US20240094935A1 (ja)
JP (1) JP2024043376A (ja)
CN (1) CN117727342A (ja)

Also Published As

Publication number Publication date
US20240094935A1 (en) 2024-03-21
CN117727342A (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
US11763840B2 (en) Information processing device, information processing method, and information processing program
WO2021171814A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2024043376A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20230047128A1 (en) Information processing apparatus, information processing method, and information processing program
WO2022185650A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20230048156A1 (en) Information processing apparatus, information processing method, and information processing program
JP2024044867A (ja) 情報処理装置、情報処理方法及びプログラム
WO2021171816A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2023064456A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
WO2022172549A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
WO2022172548A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2024037470A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2024044866A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
WO2021171815A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
EP4141639A1 (en) Information processing apparatus, information processing method, and information processing program
WO2022044434A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
WO2022049832A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2023026118A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20220406329A1 (en) Information processing device, information processing method, and information processing program
JP2024053282A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
WO2021187429A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20230064391A1 (en) Information processing apparatus, information processing method, and information processing program
WO2022163078A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2023063950A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2024056514A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム