CN102667703B - 用于虚拟磁带库系统中的优化回收处理的系统和方法 - Google Patents

用于虚拟磁带库系统中的优化回收处理的系统和方法 Download PDF

Info

Publication number
CN102667703B
CN102667703B CN201080052602.1A CN201080052602A CN102667703B CN 102667703 B CN102667703 B CN 102667703B CN 201080052602 A CN201080052602 A CN 201080052602A CN 102667703 B CN102667703 B CN 102667703B
Authority
CN
China
Prior art keywords
virtual tape
block
host
storage administration
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201080052602.1A
Other languages
English (en)
Other versions
CN102667703A (zh
Inventor
N·豪斯汀
S·内夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN102667703A publication Critical patent/CN102667703A/zh
Application granted granted Critical
Publication of CN102667703B publication Critical patent/CN102667703B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0664Virtualisation aspects at device level, e.g. emulation of a storage device or system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0686Libraries, e.g. tape libraries, jukebox
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

本发明涉及时序媒体的存储管理的领域,更具体地,其涉及诸如虚拟磁带库中的虚拟磁带之类的虚拟化时序媒体的自治回收处理。为了提供一种用于对虚拟磁带库系统中的虚拟磁带进行管理的改进方法和系统,所发明的系统包括对虚拟磁带库系统(VTL系统)中的虚拟磁带进行管理的存储管理应用,其能够识别给定源虚拟磁带的活动数据的所有块地址;所述存储管理应用经由网络连接至所述虚拟磁带库系统,并且能够发送指示所述VTL系统执行自治回收的命令。VTL系统的特征在于所发明的回收逻辑,其将存储管理应用所写入的每个宿主块唯一地映射至所述VTL系统的磁盘系统上的块。结合存储管理系统,其执行一种用于执行自治回收的方法。

Description

用于虚拟磁带库系统中的优化回收处理的系统和方法
技术领域
本发明涉及时序媒体的存储管理领域,更具体地,其涉及诸如虚拟磁带库中的虚拟磁带的虚拟化时序媒体的自治回收处理。
背景技术
诸如IBM Tivoli Storage Manager、Symantec Netbackup或EMCLegato Networker之类的存储管理应用执行诸如备份、归档和分级存储管理之类的不同数据存储操作。存储管理应用使用诸如虚拟磁带之类的时序媒体主要针对比物理磁带上的数据被更频繁访问的数据进行成本有效的存储。
虚拟磁带典型地由虚拟磁带库进行仿真。根据现有技术的虚拟磁带库包括执行磁带虚拟化软件的计算系统。该磁带虚拟化软件仿真虚拟磁带驱动器、虚拟磁带库和虚拟磁带。虚拟磁带库经由接口以及诸如存储区域网(SAN)或局域网(LAN)之类的网络连接到存储管理应用。存储管理应用将虚拟磁带设备和虚拟磁带仅“视为”真实的磁带设备。当存储管理应用对虚拟磁带进行写入时,该虚拟磁带被存储在也包括在虚拟磁带库中的磁盘系统中。虚拟磁带库中的每个虚拟磁带具有唯一的序列号,该序列号也被称作VOLSER。VOLSER允许唯一识别虚拟磁带库中的虚拟磁带。
就像真实的磁带一样,虚拟磁带无法被以随机的方式写入,而是要从开头向结尾进行顺序写入。因此,不可能向磁带上的任意位置写入数据,而是仅在上次写操作已经在超出那里之处结束的位置写入数据。当磁带上的数据需要被重写时,则磁带必须再次从开头开始写入。
随着已经被写入虚拟磁带的数据到期,这导致数据或部分数据变为非活动的。其余数据仍然是活动的。图1示出并例示了虚拟磁带100上的活动数据102和非活动数据104。
活动数据是仍然有效并且可能被用于恢复的数据。非活动数据通常已经到期并且不再有效。因此,非活动数据实质上由整个磁带容量减去活动数据所代表。非活动数据是VTL的磁盘系统中存储空间的浪费,原因在于该数据不再被需要并且潜在地可能被删除。
虚拟磁带上随着时间变为非活动的数据越多,虚拟磁带上被浪费的存储容量就更多,这是因为具有非活动数据104的点(spot)无法有选择地被重写。此外,磁带上的数据通常并不是按顺序到期,如图1所示,这在磁带上的活动数据部分之间留下了具有非活动数据的间隙。
例如,根据现有技术的诸如在虚拟磁带库IBM TS7500中仿真的IBM TS1130的虚拟磁带具有1TB的容量。如果这样的虚拟磁带剩余50%的活动数据,则有500GB的存储容量被浪费-这是因为其仍然由虚拟磁带库进行分配,而不再被应用软件所引用。虚拟磁带仅在所有活动数据都到期或者所有活动数据都已经被移动到另一个虚拟磁带时才能够被重新使用。虚拟磁带需要为空以便从开头被重新用于新的备份。
将活动数据102移动到另一个虚拟磁带也被称作回收(reclamation)。存储管理应用实施回收处理。回收处理监视已经被写满的每个虚拟磁带上的活动数据的量。典型地,具有用户可以设置的阈值-也被称作回收阈值-并且如果活动数据的量低于该阈值,则存储管理软件就自动将剩余的活动数据从该源虚拟磁带复制到在此时处于空或填充状态的目标虚拟磁带。在回收处理结束时,源磁带为空并且能够被从磁带开头处重新使用。
根据现有技术的该回收处理具有以下缺陷:
1.回收处理由存储管理服务器来执行,这消耗了存储管理服务器上附加的计算资源。
2.回收处理要求两个虚拟设备:一个用于读取数据以及一个用于写入数据。
3.在回收期间,要利用存储管理服务器和虚拟磁带设备之间的网络。
4.在一个输出虚拟磁带变满的情况下,可能属于一起的数据集合或文件可能在回收期间被写入两个不同的虚拟磁带。这导致了较长的恢复时间。
5.为了保持以上两种原因的影响小,典型地建议在时序媒体上存在30%或更少的活动数据时开始回收处理。然而,这使得可用存储容量大幅减少-理论上为70%,实际通常为50%。
6.回收之后不包含活动数据的虚拟磁带在回收处理之后仍然消耗整体容量(非活动数据),这是因为空间仅在所回收的虚拟磁带被应用软件从磁带开头(宿主块(host block)0)重新写入时才被释放。
因此,需要一种克服根据现有技术的回收处理的这些缺陷的系统和方法。
发明内容
本发明的目的是提供一种用于管理虚拟磁带库系统中的虚拟磁带的改进方法和系统。
本发明的该目的通过所附有的独立权利要求中所提到的特征而实现。本发明另外的有利配置和实施例在相应的从属权利要求中给出。现在将参考所附权利要求。
根据本发明的第一方面,所发明的系统包括对虚拟磁带库系统(VTL系统)中的虚拟磁带进行管理的存储管理应用,其能够识别给定源虚拟磁带的活动数据的所有块地址;所述存储管理应用经由网络连接至所述虚拟磁带库系统,并且能够发送指示所述VTL系统执行自治回收的命令。
VTL系统的特征在于所发明的回收逻辑,其将存储管理应用所写入的每个宿主块唯一地映射至所述VTL系统的磁盘系统上的块。结合存储管理应用,其执行实施自治回收的方法,上述方法的特征在于步骤:
a)存储管理应用确定源虚拟磁带要求回收,
b)存储管理应用识别源虚拟磁带的活动数据的所有块地址,并且以升序对块地址进行排序,
c)存储管理应用识别具有足够的空闲容量来存储所述源虚拟磁带的活动数据的目标虚拟磁带以及所述目标虚拟磁带上最后写入的块地址,
d)存储管理向VTL系统发送指示其执行回收的命令,该命令包括关于所述源和所述目标虚拟磁带、表示源虚拟磁带上的活动数据的块地址的有序列表以及目标虚拟磁带上的开始块地址的信息,
e)一旦接收到命令,所述回收逻辑仅通过更新宿主块至磁盘块的映射表而将所述源卷的活动数据宿主块在所述开始块地址处开始引用至所述目标虚拟磁带,并且向存储管理应用发送针对回收命令的完成消息;以及
f)一旦接收到针对回收命令的完成消息,存储管理应用通过去除源卷的所述活动数据块并且将所述活动数据块在开始宿主块地址处开始添加到目标卷来更新块映射表。
在任选的下一个步骤中,回收逻辑从宿主块到磁盘块的映射表中去除源虚拟磁带的所有宿主块地址以便释放VTL系统中的空间。由于源虚拟磁带的存储空间已经被回收,所以之前存储在所述源虚拟磁带上的数据就不再被需要。
在本发明的一个实施例中,经由映射表进行宿主块到磁盘块的映射。磁盘块可能由磁盘系统上的块所代表。可替换地,其可以由文件系统中的文件所代表。
所发明的回收逻辑包括另外的方法,其拦截写入命令并且依据写入命令更新宿主块到磁盘块的映射表。
所发明的回收逻辑进一步包括一种方法,其拦截读取命令并且基于所述映射表确定适当的磁盘块。
本发明进一步提供了第二方面,其中与存储管理应用相结合的所述回收逻辑包括另外的方法,其通过以下步骤从VTL磁盘系统删除给定源虚拟卷的非活动数据:
1.存储管理应用通过将非活动数据的相对量与阈值相比较来确定源虚拟磁带具有特定百分比的非活动数据,
2.存储管理应用识别源虚拟磁带的非活动数据的所有块地址,
3.存储管理向VTL系统发送指示其删除以上所识别的源虚拟卷的非活动数据块的命令,
4.一旦接收到命令,所发明的回收逻辑就通过从宿主块至磁盘块的映射表去除非活动数据块来删除非活动数据块。这将释放磁盘块,上述磁盘块现在能够被用于新数据。
所发明的方法和相应系统与现有技术的VTL系统相结合地利用以下特征克服了现有技术的存储管理应用的上述缺陷:
1.回收不是由存储管理服务器而是由VTL系统自身来执行。这节约了存储管理应用的性能。
2.无需借助于虚拟磁带来执行回收。
3.由于回收处理并不移动任何数据,所以不利用存储管理服务器和虚拟磁带驱动器之间的存储网络进行回收处理。
4.代表活动数据的所有数据集合或文件都将保留在相同的目标虚拟磁带上,这优化了恢复性能并且节约了虚拟磁带驱动器的资源。
5.回收处理能够在任意时间执行,原因在于其使得对存储管理服务器和网络的影响最小化。
6.存储容量得到有效管理,这因为来自源虚拟磁带的活动数据块并没有被复制而是被引用至目标虚拟磁带,而且因为删除了非活动数据。
因此,换句话说,本发明通过引用活动数据块而并不移动任何数据并且删除非活动的到期数据块而提供了虚拟磁带库中有效的空间管理。
因此,利用本发明,现有技术的磁带访问(读、写、定位)保持不变并且并不要求对存储管理应用进行调整。所发明的回收的实施可以利用现有技术中诸如SCSI模式选择命令之类的SCSI命令来实现。
附图说明
本发明通过示例进行图示并且并不被附图的图形形状所限制,其中:
图1图示了磁带上的活动数据和非活动数据的示例,
图2图示了用于所发明方法的优选实施例的所发明硬件和软件环境的最为基本的结构组件,
图3、图4、图5和图6图示了在所发明的回收处理期间更新的具有块映射表的表304的示例,
图7图示了所发明方法的优选实施例中最为重要的步骤的控制流程,
图8A图示了根据SCSI T10标准的MODE SELECT命令,
图8B图示了根据所发明方法的优选实施例、依据MODESELECT命令发送并且被用来指示VTL执行回收的模式页面25h,
图8C图示了根据所发明方法的优选实施例、依据MODESELECT命令发送并且被用来指示VTL删除非活动数据的模式页面26h。
具体实施方式
总体上参考附图并且现在特别参考图2,磁带管理系统300的所发明实施例包括在主机计算系统202上运行的存储管理应用204。存储管理系统对虚拟磁带库(VTL)310中所包括的虚拟磁带进行管理。针对其上写有数据的每个虚拟磁带,存储管理系统204维护将诸如文件(列1)的对象映射到VOLSER所表示的所述虚拟磁带(列3)上的宿主块地址(列2)的表208-VOLSER唯一识别VTL中的每个虚拟磁带-这是根据现有技术。
存储管理系统204经由网络220连接到虚拟磁带库系统310,网络220可能是基于光纤信道的存储区域网(SAN)或者基于以太网的局域网(LAN),等等。虚拟磁带库系统310包括运行虚拟化程序的计算系统212以及用来存储虚拟磁带的数据的磁盘系统214。所发明的虚拟磁带库系统进一步包括管理表304的所发明的回收逻辑302。
在表304中,所发明的回收逻辑将VOLSER所表示的每个虚拟磁带(列3)的宿主块(列2)唯一映射到磁盘系统214的磁盘块(列1)。磁盘块可以是VTL系统中所包括的磁盘设备上的块,或者其可以由根据现有技术的在VTL系统310的磁盘系统上存储数据的文件系统所代表。宿主块是存储管理应用204向虚拟磁带进行写入的块。
如图3的表1所示(第二行),磁盘块(列1)包含与具有VOLSER 123456(列3)的虚拟磁带相关的宿主块0(列2)的数据。相应地,磁盘块1(第三行)包含虚拟磁带123456的宿主块1的数据。磁盘块3(第四行)包含虚拟磁带123456的宿主块3的数据。第五行表示针对VOLSER 123456或其它VOLSER的宿主块至磁盘块的映射的继续,直至磁盘块227。磁盘块228(第六行)包含与具有VOLSER 654321的另一个虚拟磁带相关的宿主块0的数据。相应地,磁盘块229(第七行)包含针对虚拟磁带654321的宿主块1的数据,等等。
接下来,另外参考图7,将通过所发明方法的优选实施例更为详细地描述所发明的活动数据的回收处理。图7图示了其最为重要的步骤的控制流程。
在第一步骤710中,存储管理应用204确定VOLSER所表示的源虚拟磁带要求回收过程的必要性。根据现有技术,这可以基于与用户所定义的回收阈值的比较。
在步骤720,存储管理应用204识别所述源虚拟磁带中包含活动数据的所有宿主块并且以升序对该列表进行排序,步骤730。其由此使用表208,该表208将所述源虚拟磁带上所存储的所有对象(文件)映射到实际对象相关的数据在所述源虚拟磁带上存储的宿主块。因此,存储在存储管理应用的知识库206中的表208包括所述源虚拟磁带的所有活动数据块。
在步骤740,存储管理应用204识别VOLSER所表示的目标虚拟磁带以及要写入活动数据的开始块地址。所述目标虚拟磁带的开始块地址从表208得出,并且等同于已经写入最后数据的宿主块地址递增1。
在步骤760,存储管理应用经由网络220向虚拟磁带系统310的回收逻辑302发送回收命令,回收命令包括活动数据宿主块的列表、源和目标虚拟磁带的VOLSER以及目标虚拟磁带上的开始宿主块地址。回收命令可以是随后跟有根据现有技术的SCSI T10标准的定制模式页面的MODE SELECT(模式选择)命令。随后使用图8A和8B对所述SCSI模式选择命令进行解释。
响应于接收到该回收命令,回收逻辑302在步骤770中通过将具有源虚拟磁带的活动数据的宿主块在表304中的开始宿主块地址处开始映射到目标虚拟磁带的宿主块。
在步骤780,根据过程770中的回收处理更新表304,并且根据回收命令更新表208,由此源虚拟磁带的活动数据宿主块被指定给目标虚拟磁带。
回收逻辑302所执行的该回收过程770自身包括步骤:
1.接收模式选择命令500(图8A)并且基于模式页面600将其识别为回收命令(图8B),步骤770。
2.从所述命令确定源和目标虚拟磁带并且验证这些磁带存在于虚拟磁带库中。
3.从所述命令确定与源虚拟磁带相关的活动数据宿主块的列表并且验证这些块存在于表304中(第二列和第三列)。
4.从所述命令确定目标虚拟磁带的开始宿主块地址,并且使用表304的第二列和第三列验证开始块地址没有超出目标虚拟磁带处的数据的末尾。在该上下文中应当注意的是,数据的末尾由已经被最后写入目标虚拟磁带的宿主块地址所识别。
5.通过更新表304将源虚拟磁带的活动数据块在目标虚拟磁带的开始块地址处开始以连续顺序引用至目标虚拟磁带。
6.任选地从表304的列2和列3删除源虚拟磁带的所有宿主块。
7.利用适当的完成消息完成命令。
一旦接收到完成消息,存储管理应用204就通过将步骤760中所发送的回收命令中包括的所有活动数据宿主块地址(表208的列2)在开始宿主块地址处开始指定给目标虚拟磁带(表208的列3),并且从表208去除源虚拟卷的所有活动数据宿主块地址来更新表208。
例如-根据图3,表1-存储管理应用确定具有VOLSER123456的源虚拟磁带要求回收。活动数据宿主块是块0和块2。存储管理应用进一步识别出目标虚拟磁带654321具有两个将块2指示为开始地址的块(0和1)。存储管理应用向所发明的VTL系统发送随后跟有图8B的模式页面600的模式选择命令(图8A中的500),其包括以下模式页面参数:
-源volser:123456(图8B中的606)
-活动数据块:0,2(图8B中的612和614)
-目标volser:654321(图8B中的608)
-目标开始块地址:2(图8B中的610)
以上所解释的所发明方法更新表1,产生图4所描绘的表2。
在表2中(第二和第四行),存在于磁盘块0和2上的源虚拟磁带123456的活动数据宿主块0和2被附加地映射到虚拟磁带654321的宿主块2和3,这是因为虚拟磁带654321的开始地址是2。因此磁盘块0和2被具有VOLSER 123456和654321的虚拟磁带所共享。
在跟随于步骤780之后的任选步骤中,源虚拟磁带123456的所有宿主块地址被回收逻辑从表304删除。该操作的结果在图5的表3中示出。通过去除VOLSER 123456的宿主块更新表3中列2的第二、第三和第四行,这使得磁盘块1变为空闲并且可用于新数据。
接下来,将更为详细地对一般的读和写处理进行描述:
所发明的VTL系统310实施一种方法,其中存储管理应用每次对虚拟磁带进行写入时,就通过将所写入的宿主块映射到存储数据的磁盘块来更新表304。写入命令由此没有被改变并且因此对应于现有技术,例如SCSI写命令。所发明的VTL系统310、特别是所发明的回收逻辑302拦截相应的写命令,更新表304并且随后执行写命令。写命令一直被指向特定的虚拟磁带。写命令在虚拟磁带已经被定位的位置处执行。所发明的方法包括以下步骤:
1.接收写命令,
2.识别当前位置并且将其转换为开始宿主块地址,
3.识别虚拟磁带序列号,
4.识别没有使用的开始磁盘块地址(表304中的列2和列3为空),
5.通过将数据从开始宿主块地址连续写入在所述开始磁盘块地址开始的相对应的磁盘块地址来执行写命令,
6.识别表304中等于或大于所述开始宿主块地址的所有宿主块地址(处于之前所确定的当前位置处的地址),
7.从表304删除所述虚拟磁带的所述所识别宿主块地址。
以上的步骤6和步骤7确保了当宿主块被重写时,它们被从表304中消除。例如,当虚拟磁带被从开头(宿主块0)写入时,所有之前所写入的宿主块都为空并且将通过步骤6和7被删除。
所发明的VTL系统310实施另外的方法,其处理读命令。当接收到读命令时-诸如根据现有技术的SCSI读命令-VTL系统确定遭受读命令的虚拟磁带的当前位置,将该当前位置映射到开始宿主块,使用表304的列1和2识别被映射到所述开始宿主块的磁盘块,并且根据读命令所请求的块数目以连续顺序从所述开始磁盘块读取数据。
非活动数据处理
除了以资源节约的模式执行回收之外,本发明可以被扩展到从虚拟磁带系统的磁盘系统删除与虚拟磁带相关的非活动数据。这通过删除不再需要的数据而有助于减少所使用的磁盘容量。以下对用于非活动数据处理的处理进行描述:
存储管理应用204识别VOLSER所表示的给定虚拟磁带的包含非活动数据的所有宿主块。由此使用将给定虚拟磁带上所存储的所有对象(例如,文件)映射到磁带上存储与对象相关的数据的块的表208。存储在存储管理应用的知识库206中的表208包括所述虚拟磁带的所有活动数据块。确定非活动数据块实质上是通过从与给定虚拟磁带相关的所有数据宿主块减去活动数据宿主块的集合来进行的。
存储管理应用204向所发明的VTL系统310发送诸如图8A中的SCSI模式选择命令500的命令,该命令后跟有包括源虚拟磁带(图8C中的806)的volser和所述所识别的与源虚拟卷相关的非活动数据宿主块(图8C中的808-812)的列表的模式页面800。
响应于接收到该命令,回收逻辑302从表304删除该非活动数据块的列表中所识别的宿主块,这包括以下步骤:
1.接收图8A中的模式选择命令500和模式页面800(图8C),并且将其识别为用来基于模式页面代码删除虚拟磁带的非活动数据块的命令。
2.从所述模式页面800(图8C)确定源虚拟磁带(图8C中的806)并且验证该磁带存在于虚拟磁带库中。
3.从所述模式页面800(图8C)确定与源虚拟磁带相关的非活动数据(图8C中的808-812)的列表并且验证这些块存在于表304中(第二和第三列)。
4.从表304的列2删除所述列表所识别的每个块地址。
5.以适当状态完成命令。
例如,假设虚拟磁带654321在宿主块1和3具有非活动数据。存储管理应用基于表208识别它并且向VTL系统300发送后跟有模式页面800(图8C)的模式选择命令500(图8A),模式页面800包括磁带654321的VOLSER以及非活动数据块1和3的列表。响应于此,所发明的回收逻辑从表304去除这些块,如图6中的表4所图示。
在表4中,通过去除宿主块3(列2)和VOLSER 654321(列3)来更新第四行。通过去除宿主块1(列2)和VOLSER 654321(列3)来更新第七行。因此,磁盘块2和229被释放并且能够被用于新数据。
存储管理应用204能够使用SCSI模式选择命令来指示虚拟磁带库根据图7的步骤760执行回收。这样的SCSI模式的示例在图8A中示出。
SCSI模式选择命令(500)基本从现有技术所知。模式选择命令允许存储管理应用204向虚拟磁带库310发送模式页面。该命令具有15h的命令代码502,其中后缀h表示十六进制或基数16。该命令代码向虚拟磁带库指示这是模式选择命令。参数列表长度504指定了以字节为单位的所要传输的模式页面600或800的大小。在发送该命令之后,存储管理应用将发送实际的模式页面600或800。
模式选择命令500后跟有模式参数报头(现有技术,未示出)、块描述符(现有技术,未示出)以及一个或多个模式页面,诸如图8B的模式页面600或图8C的800。
图8B的模式页面600被存储管理应用用来指示VTL系统执行回收。模式页面600具有25h的页面代码(602),其中后缀h表示十六进制或基数16。
字段参数页面长度(604)指定了以字节为单位的模式页面的长度。在该示例中,模式页面600的长度为(22+2*N)字节,其中N表示图7的步骤720中所识别的活动数据块地址的数目。字段606指定了图7的步骤710中所确定的被回收的VOLSER所表示的源虚拟磁带。字段608指定了图7的步骤740所确定的VOLSER所表示的目标虚拟磁带。字段610包括图7的步骤740所确定的目标虚拟磁带的开始宿主块地址。
字段612、614和618包括已经在图7的步骤720中被识别的源虚拟磁带的活动数据宿主块地址1、2和N。N是步骤720中所确定的最后的宿主块地址的编号。
一旦接收到后跟有模式页面25h(600)的模式选择命令500,回收逻辑302就执行如图7的步骤770中所概述的回收。
图8C的模式页面800被存储管理应用用来指示VTL系统删除非活动数据。模式页面800具有页面代码(802)26h,其中后缀h表示十六进制或基数16。
字段参数页面长度(804)指定了以字节为单位的模式页面的长度。在该示例中,模式页面的长度为(10+2*N)字节,其中N表示图7的步骤720中所识别的非活动数据块地址的数目。字段806指定了要针对其删除非活动数据块的VOLSER所表示的源虚拟磁带。字段808、810和812包括与源虚拟磁带相关的应当被删除的非活动数据宿主块地址。
一旦接收到后跟有模式页面26h(800)的模式选择命令500,回收逻辑302根据源卷(字段806)(表304的列3)从表304(列2)去除所有非活动数据块地址(图8中的模式页面26h的字段808、810和812)。
本发明可以采取完全硬件实施例、完全软件实施例或者包含硬件和软件元素二者的实施例的形式。在优选实施例中,本发明以软件实现,其包括但不限于固件、常驻软件、微代码等。
此外,本发明可以采取从计算机可用或计算机可读介质可访问的计算机程序产品的形式,其提供程序代码以便由计算机或任意指令执行系统使用或接合计算机或任意指令执行系统使用。
出于该描述的目的,计算机可用或计算机可读介质可以是能够包含、存储、传输、传播或传送程序以便被指令执行系统、装置或设备所使用或者与之相结合使用的任意装置。
介质可以是电、磁、光学、电磁、红外或半导体系统(或者装置或设备)或者传播介质。计算机可读介质的示例包括半导体或固态存储器、磁带、可移动计算机卡带、随机存取存储器(RAM)、只读存储器(ROM)、固化磁盘和光盘。光盘的当前示例包括紧致盘-只读存储器(CD-ROM)、紧致盘-读/写(CD-R/W)和DVD。
适于存储和/或执行程序代码的数据处理系统将包括至少一个直接或通过系统总线间接耦合到存储器元件的处理器。存储器元件可以包括在程序代码的实际执行期间所采用的本地存储器、大容量存储,以及提供至少一些程序代码的临时存储以便减少在执行期间必须从大容量存储检索代码的次数的高速缓存存储器。
输入/输出或I/O设备(包括但不限于键盘、显示器、指示设备等)可以直接或者通过中间的I/O控制器耦合到系统。
网络适配器也可以耦合到系统以使得数据处理系统能够变得通过中间的私有或公众网络耦合到其它数据处理系统或远程打印机或存储设备。调制解调器、电缆调制解调器和以太网卡仅是一些当前可用类型的网络适配器。

Claims (5)

1.一种用于管理虚拟磁带库系统(310)中的虚拟磁带的方法,其中存储管理应用(204)能够使用块映射表(208)识别给定源虚拟磁带的活动数据的所有块地址,并且其中所述存储管理应用(204)经由网络(220)连接到所述虚拟磁带库系统(310)并且能够发送指示所述虚拟磁带库系统(310)执行回收过程的命令,其特征在于:
回收逻辑(302)在宿主块至磁盘块的映射表(304)中将所述存储管理应用(204)所写入的每个宿主块唯一地映射到所述虚拟磁带库系统(310)的磁盘系统上的相应磁盘块,在该方法中执行以下步骤:
a)所述存储管理应用确定(710)源虚拟磁带要求回收,
b)所述存储管理应用识别(720)源虚拟磁带的活动数据的所有块地址,并且以升序对所述块地址进行排序(730),
c)所述存储管理应用识别(740)具有足够的空闲容量来存储所述源虚拟磁带的活动数据的目标虚拟磁带以及所述目标虚拟磁带上最后写入的块地址,
d)所述存储管理应用向所述虚拟磁带库系统(310)发送(760)指示其执行回收的回收命令,所述回收命令包括关于所述源虚拟磁带、所述目标虚拟磁带、所述活动数据宿主块以及所述目标虚拟磁带的所述最后写入的块地址的信息,
e)一旦接收到所述回收命令,所述回收逻辑仅通过更新(780)所述宿主块至磁盘块的映射表而将所述源虚拟磁带的所述活动数据块在开始块地址处开始引用至所述目标虚拟磁带(步骤770);
f)一旦所述回收命令完成,所述存储管理应用通过去除所述源虚拟磁带的所述活动数据块并且将所述活动数据块在所述开始宿主块地址处开始添加到所述目标虚拟磁带来更新所述块映射表(208)。
2.根据权利要求1所述的方法,进一步包括另外的步骤:
所述回收逻辑识别所述源虚拟磁带的所有宿主块地址并且从所述宿主块至磁盘块的映射表去除所述宿主块地址以便释放所述虚拟磁带库系统中的空间。
3.分别根据权利要求1或2所述的方法,其中所述回收命令包含利用模式页面的SCSI模式选择命令,所述模式页面包括分别执行回收或非活动数据处理所必需的信息。
4.根据权利要求1或2所述的方法,进一步包括另外的步骤:
a)所述存储管理应用(204)识别VOLSER所表示的给定源虚拟磁带的包含非活动数据的所有宿主块,
b)所述存储管理应用(204)向所述虚拟磁带库系统(310)发送所述源虚拟磁带的所述volser以及所述所识别的非活动数据宿主块的列表,
c)响应于接收到所述列表,所述虚拟磁带库系统(310)的所述回收逻辑(302)从所述映射表(304)删除该非活动数据块的列表中所识别的所述所有宿主块,其中所述删除通过以下步骤执行:
1)接收命令并且将所述命令识别为用来基于命令代码删除虚拟磁带的非活动数据块的命令,
2)从所述命令确定相关联的源虚拟磁带并且验证所述磁带存在于所述虚拟磁带库系统(310)中,
3)从所述命令确定与所述源虚拟磁带相关的所述非活动数据的列表并且验证所述块存在于所述映射表(304)中,
4)删除映射表(304)的所述列表所识别的每个块地址,
5)以适当状态完成所述命令。
5.一种用于管理虚拟磁带库系统(310)中的虚拟磁带的电子数据处理系统,其中存储管理应用(204)能够识别给定源虚拟磁带的活动数据的所有块地址,并且其中所述存储管理应用(204)经由网络(220)连接到所述虚拟磁带库系统(310)并且能够发送指示所述虚拟磁带库系统(310)执行回收过程的命令,所述电子数据处理系统包括功能性回收逻辑组件(302),用于在宿主块至磁盘块的映射表(304)中将所述存储管理应用(204)所写入的每个宿主块唯一地映射到所述虚拟磁带库系统(310)的磁盘系统上的相应磁盘块,所述功能性回收逻辑组件(302)包含:
a)用于使所述存储管理应用确定(710)源虚拟磁带要求回收的模块,
b)用于使所述存储管理应用识别(720)源虚拟磁带的活动数据的所有块地址,并且以升序对所述块地址进行排序(730)的模块,
c)用于所述存储管理应用识别(740)具有足够的空闲容量来存储所述源虚拟磁带的活动数据的目标虚拟磁带以及所述目标虚拟磁带上最后写入的块地址的模块,
d)用于使所述存储管理应用向所述虚拟磁带库系统(310)发送(760)指示其执行回收的回收命令的模块,所述回收命令包括关于所述源、所述目标虚拟磁带、所述活动数据宿主块以及所述目标虚拟磁带的所述最后写入的块地址的信息,
e)用于一旦接收到所述回收命令,仅通过更新(780)所述宿主块至磁盘块的映射表而将所述源虚拟磁带的所述活动数据块在开始块地址处开始引用至所述目标虚拟磁带的模块;
f)用于一旦所述回收命令完成,所述存储管理应用通过去除所述源虚拟磁带的所述活动数据块并且将所述活动数据块在所述开始宿主块地址处开始添加到所述目标虚拟磁带来更新所述块映射表的模块。
CN201080052602.1A 2009-11-27 2010-08-30 用于虚拟磁带库系统中的优化回收处理的系统和方法 Expired - Fee Related CN102667703B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP09177283.0 2009-11-27
EP09177283 2009-11-27
PCT/EP2010/062610 WO2011064003A1 (en) 2009-11-27 2010-08-30 System and method for optimized reclamation processing in a virtual tape library system

Publications (2)

Publication Number Publication Date
CN102667703A CN102667703A (zh) 2012-09-12
CN102667703B true CN102667703B (zh) 2015-09-16

Family

ID=42751512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080052602.1A Expired - Fee Related CN102667703B (zh) 2009-11-27 2010-08-30 用于虚拟磁带库系统中的优化回收处理的系统和方法

Country Status (5)

Country Link
US (1) US9009443B2 (zh)
CN (1) CN102667703B (zh)
DE (1) DE112010004573T5 (zh)
GB (1) GB2485700B (zh)
WO (1) WO2011064003A1 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8924667B2 (en) 2011-10-03 2014-12-30 Hewlett-Packard Development Company, L.P. Backup storage management
US9348707B2 (en) * 2013-12-18 2016-05-24 International Business Machines Corporation Dynamically adjusting the number of replicas of a file according to the probability that the file will be accessed within a distributed file system
JP6456028B2 (ja) * 2014-02-07 2019-01-23 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
CN104049913A (zh) * 2014-05-29 2014-09-17 北京捷成世纪科技股份有限公司 一种磁带文件管理方法及装置
US9990352B2 (en) * 2014-08-06 2018-06-05 Quest Software Inc. Chunk compression in a deduplication aware client environment
US9917894B2 (en) 2014-08-06 2018-03-13 Quest Software Inc. Accelerating transfer protocols
US9984093B2 (en) 2014-08-06 2018-05-29 Quest Software Inc. Technique selection in a deduplication aware client environment
US10459886B2 (en) 2014-08-06 2019-10-29 Quest Software Inc. Client-side deduplication with local chunk caching
CN104794062A (zh) * 2015-04-15 2015-07-22 四川神琥科技有限公司 一种磁盘读取方法
US9996459B2 (en) 2015-09-21 2018-06-12 International Business Machines Corporation Reclaiming of sequential storage medium
US9916115B2 (en) * 2016-03-29 2018-03-13 International Business Machines Corporation Providing access to virtual sequential access volume
US10228873B2 (en) * 2017-06-28 2019-03-12 International Business Machines Corporation Swapping tape cartridges in tape libraries
US10146479B1 (en) 2017-06-30 2018-12-04 EMC IP Holding Company LLC Mechanism for multiple coexisting configurations support in virtual tape applications
US10338814B1 (en) 2017-06-30 2019-07-02 EMC IP Holding Company LLC Mechanism for virtual tape libraries non-disruptive configuration
US10514992B1 (en) 2017-06-30 2019-12-24 EMC IP Holding Company LLC Disaster recovery specific configurations, management, and application
US10318155B1 (en) * 2017-06-30 2019-06-11 EMC IP Holding Company LLC Mechanism for non-disruptive virtual tape drives removal and reconfiguration
US10599446B2 (en) 2017-10-31 2020-03-24 EMC IP Holding Company LLC Mechanism for transparent virtual tape engines restart
CN109960463B (zh) * 2017-12-26 2021-11-02 中兴通讯股份有限公司 一种磁盘管理方法、装置及存储介质
US11636230B2 (en) * 2020-02-14 2023-04-25 International Business Machines Corporation Securing deallocated blocks in a file system
US11899588B2 (en) * 2020-09-14 2024-02-13 Samsung Electronics Co., Ltd. Systems, methods, and devices for discarding inactive intermediate render targets
US11340824B1 (en) * 2021-01-05 2022-05-24 EMC IP Holding Company LLC Efficient object storage management when performing backups to a cloud-based object storage
JP2023026118A (ja) * 2021-08-12 2023-02-24 富士フイルム株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
TWI815735B (zh) * 2022-11-21 2023-09-11 中華電信股份有限公司 一種具備空間回收之序列化儲存系統、方法及其電腦可讀媒介

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1487419A (zh) * 2002-08-29 2004-04-07 �Ҵ���˾ 用于返回物理卷的方法、系统和产品
EP1686451A1 (en) * 2005-01-31 2006-08-02 Hitachi, Ltd. Virtual tape library device
WO2008116751A1 (en) * 2007-03-26 2008-10-02 International Business Machines Corporation Improved sequential media reclamation and replication

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094605A (en) 1998-07-06 2000-07-25 Storage Technology Corporation Virtual automated cartridge system
US7020755B2 (en) 2002-08-29 2006-03-28 International Business Machines Corporation Method and apparatus for read-only recovery in a dual copy storage system
US7103731B2 (en) 2002-08-29 2006-09-05 International Business Machines Corporation Method, system, and program for moving data among storage units
US6952757B2 (en) 2002-08-29 2005-10-04 International Business Machines Corporation Method, system, and program for managing storage units in storage pools

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1487419A (zh) * 2002-08-29 2004-04-07 �Ҵ���˾ 用于返回物理卷的方法、系统和产品
EP1686451A1 (en) * 2005-01-31 2006-08-02 Hitachi, Ltd. Virtual tape library device
WO2008116751A1 (en) * 2007-03-26 2008-10-02 International Business Machines Corporation Improved sequential media reclamation and replication

Also Published As

Publication number Publication date
GB201202421D0 (en) 2012-03-28
WO2011064003A1 (en) 2011-06-03
GB2485700A (en) 2012-05-23
GB2485700B (en) 2017-06-14
CN102667703A (zh) 2012-09-12
US9009443B2 (en) 2015-04-14
US20120265954A1 (en) 2012-10-18
DE112010004573T5 (de) 2012-11-22

Similar Documents

Publication Publication Date Title
CN102667703B (zh) 用于虚拟磁带库系统中的优化回收处理的系统和方法
US11301379B2 (en) Access request processing method and apparatus, and computer device
US8924664B2 (en) Logical object deletion
US8738588B2 (en) Sequential media reclamation and replication
CN102929884B (zh) 一种收缩虚拟磁盘镜像文件的方法及装置
US7587427B2 (en) Hierarchical storage system, and control method and program therefor
CN106055431B (zh) 基于快照在线回滚的数据备份与恢复的方法及装置
KR100317691B1 (ko) 로그 구조화 목표 저장장치를 사전에 구성하여 볼륨을 효율적으로 복사하는 방법 및 장치
US20140258628A1 (en) System, method and computer-readable medium for managing a cache store to achieve improved cache ramp-up across system reboots
US20170046232A1 (en) Replicating a source data set to a target data store
CN107943414A (zh) 嵌入式Linux的文件系统分区及数据读写方法
CN103797470A (zh) 存储系统
CN102096561B (zh) 分层数据存储处理方法、装置以及存储设备
US10133638B1 (en) Recovery of in-memory state in a log-structured filesystem using fuzzy checkpoints
CN115098299B (zh) 一种虚拟机的备份方法、容灾方法、装置及设备
EP3385846A1 (en) Method and device for processing access request, and computer system
US9002794B1 (en) Reclaiming space from a file system
AU2021348394B2 (en) Data storage volume recovery management
CN114924914A (zh) 磁盘分区表信息备份、恢复方法及系统
CN107544834B (zh) 一种镜像文件收缩方法、装置和机器可读存储介质
CN106055372A (zh) 一种卸载应用程序的方法和装置
US20050262033A1 (en) Data recording apparatus, data recording method, program for implementing the method, and program recording medium
CN103699681A (zh) 数据回滚的处理方法和装置
CN114201341B (zh) 基于云平台的自动数据备份系统、方法及装置
KR100775141B1 (ko) 저널링이 적용된 fat 파일 시스템의 구현 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150916

Termination date: 20200830