WO2014101211A1 - 一种虚拟设备重建方法与装置 - Google Patents

一种虚拟设备重建方法与装置 Download PDF

Info

Publication number
WO2014101211A1
WO2014101211A1 PCT/CN2012/088096 CN2012088096W WO2014101211A1 WO 2014101211 A1 WO2014101211 A1 WO 2014101211A1 CN 2012088096 W CN2012088096 W CN 2012088096W WO 2014101211 A1 WO2014101211 A1 WO 2014101211A1
Authority
WO
WIPO (PCT)
Prior art keywords
vtl
address
node
virtual device
virtual
Prior art date
Application number
PCT/CN2012/088096
Other languages
English (en)
French (fr)
Inventor
汪野
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Priority to PCT/CN2012/088096 priority Critical patent/WO2014101211A1/zh
Priority to CN201280005835.5A priority patent/CN103814352B/zh
Publication of WO2014101211A1 publication Critical patent/WO2014101211A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1034Reaction to server failures by a load balancer

Definitions

  • the present invention relates to the field of storage, and more particularly to a virtual magnetic tape library VTL technology. Background technique
  • VTL Virtual Tape Library
  • VTL products usually consist of servers, VTL devices, and storage arrays.
  • VTL devices can run VTL programs.
  • the server sends the data to be backed up to the VTL device, and the VTL device backs up the data to the storage array.
  • a VTL cluster is a cluster product.
  • a VTL cluster contains multiple VTL devices. Each VTL device can be called a node. Multiple nodes can run VTL applications at the same time. Compared with a VTL product, each VTL device can work at the same time. Therefore, the VTL cluster can significantly reduce the backup and recovery time and reduce the impact of the backup service on the production service.
  • VTL clusters bring about the availability of cluster systems while dramatically improving product performance. Failure of any node in the cluster will cause the entire cluster system to fail. The more nodes in the cluster VTL, the more likely the cluster VTL will be interrupted due to the failure.
  • the invention provides a method and a device for reconstructing a virtual device, which can smoothly take over the service that the virtual device is running before the reconstruction.
  • an embodiment of the present invention provides a virtual device reconstruction method, a virtual magnetic tape library VTL.
  • the cluster includes a first VTL node and a second VTL node, and the backup server establishes a communication connection with the first VTL node and the second VTL node, and the storage device establishes communication with the first VTL node and the second VTL node.
  • the first VTL node is created with at least one virtual device, and the device address of the virtual device on the first VTL node is unique in the VTL cluster.
  • the method includes: the second VTL node takes over the entry address of the first VTL node.
  • the second VTL node acquires configuration information, a device address, an entry address, and a backup server exit address of the virtual device; the second VTL node generates the reconstructed virtual device by using the configuration information; and assigns the device address to the reconstruction virtual
  • the device establishes a mapping relationship between the rebuilt virtual device and the VTL device entry address and the backup server egress address.
  • the embodiment of the present invention provides a virtual device rebuilding device, which is located in a second VTL node, where the virtual magnetic tape library VTL cluster includes a first VTL node and the second VTL node, and the backup server and the first VTL
  • the node and the second VTL node establish a communication connection
  • the storage device establishes a communication connection with the first VTL node and the second VTL node, where the first VTL node is created with at least one virtual device, and the first VTL node is virtualized.
  • the device address of the device is unique in the VTL cluster
  • the virtual device reestablishing device includes: an acquiring module, configured to take over an ingress address of the first VTL node, and obtain configuration information, a device address, an entry address, and a backup server export address, a reconstruction module, configured to generate, by the second VTL node, the reconstructed virtual device by using the configuration information, an enabling module, configured to allocate the device address to the reconstructed virtual device, and establish the reconstructed virtual device and the VTL The mapping between the device entry address and the backup server exit address.
  • the embodiment of the present invention provides a second VTL node, where the virtual magnetic tape library VTL cluster includes a first VTL node and a second VTL node, and the backup server is established with the first VTL node and the second VTL node.
  • the second VTL node includes a CPU, a first communication interface that communicates with the CPU, a second communication interface that communicates with the CPU, and a memory that communicates with the CPU: the first communication interface is configured to communicate with the backup server The second communication interface is configured to communicate with the storage device; the memory is configured to store computer instructions; And the memory is coupled to perform the following operations by running the computer instruction: taking over an entry address of the first VTL node, acquiring configuration information, a device address, an entry address, and a backup server exit of the virtual device The mapping is used to generate a re-establishment virtual device; the device address is assigned to the re-established virtual device, and the mapping relationship between the re-established virtual device and the VTL device ingress address and the backup
  • the configuration information, the device address, the ingress address, and the egress address of the backup server are the same as those of the pre-reconstruction virtual device. Therefore, the backup service being processed by the virtual device can be successfully switched to the rebuilt virtual device. , no data loss will occur.
  • FIG. 1 is a topology diagram of an application scenario according to an embodiment of the present invention.
  • FIG. 2 is a flow chart of an embodiment of a method for reconstructing a virtual device
  • FIG. 3 is a schematic diagram of an embodiment of a virtual device reconstruction apparatus
  • FIG. 4 is a schematic diagram of an embodiment of a VTL node. detailed description
  • VTL technology can emulate physical tapes, and VTL allows customers to configure virtual tape drives, virtual tape cartridges, and specified tape cartridge capacities.
  • the devices that implement VTL technology or the main devices that implement VTL technology are called VTL products or VTL devices.
  • the maximum number of virtual tape drives supported by VTL products from different vendors is different.
  • physical magnetic tape libraries require purchase and installation
  • the external tape drive, but for the VTL, the virtual tape drive can be added by changing the software configuration without any additional hardware cost.
  • a VTL device can be simply referred to as a node. In a VTL technology, there is only one VTL device. We can call it a VTL single-node configuration.
  • VTL nodes can provide protection. When a VTL node fails, the unfailed VTL node takes over the services on the faulty node.
  • the three backup servers 11 are connected to the VTL device 131 and the VTL device 132 through the switch 12.
  • the VTL device 131 and the VTL device 132 are all connected to the storage array 14.
  • the VTL device 131 and the VTL device 132 form a VTL cluster.
  • the VTL system 1 includes a VTL cluster 13 and a storage array 14.
  • the communication connection between the devices can be implemented by using a technology such as a Fibre Channel (FC, Fiber Channel) or an Ethernet (Ethernet).
  • FC Fibre Channel
  • Fiber Channel Fiber Channel
  • Ethernet Ethernet
  • the switch 12 is a FC switch, and the backup server 11 and the VTL device 131 and the VTL device 132 implement communication with the FC switch 12 through a World Wide Port Name (WWPN) address.
  • WWPN World Wide Port Name
  • the VTL cluster 13 is characterized in that when one of the VTL devices 131 and the VTL device 132 fails, the service can be switched to one VTL device. It should be noted that in the embodiments of the present invention, only two VTL devices are used as an example. In fact, a VTL cluster may be composed of more VTL devices.
  • the VTL device may be referred to as a node for short. Therefore, the VTL device 131 may be referred to as a node 131.
  • the VTL device 132 may be referred to as a node 132.
  • the two nodes monitor each other's working status through the arbitration information in the heartbeat network and the backend storage array 14. When a node fails to work properly, another node can take over its services.
  • Both the virtual magnetic tape library device or the virtual magnetic tape drive device are configured on the node 131 and the node 132.
  • the virtual magnetic tape library device or the virtual magnetic tape drive device may be referred to as a virtual device. For the user, the virtual devices are like The same is true for real physical tape devices.
  • the backend storage may be the local storage of the VTL node, that is, the storage by the VTL node itself; or the external storage interconnected by the network and the VTL node, and the storage array 14 in FIG. 1 is an example of the external storage.
  • multiple LUNs can be created in the back-end storage. These LUNs can be directly used by the VTL software in the VTL node, or the VTL node can first create files in it. The system is then available to the VTL software for use. After the SCSI command and data sent by the server are received by the virtual device, the virtual device calls the back-end read/write interface, such as a block read/write interface or a file read/write interface, to write data to the backend storage.
  • the back-end read/write interface such as a block read/write interface or a file read/write interface
  • the parameters of the virtual device can be described by configuration information.
  • the virtual tape library device includes configuration information such as a library ID, a library model, a library name, and a library serial number. , you can recreate the virtual device by determining the configuration information of a virtual device.
  • each node in order to protect nodes between nodes in a VTL cluster, each node pre-stores configuration information of all virtual devices on other nodes. When a node fails, the configuration information can be used to reconstruct the faulty nodes. Virtual device.
  • the device address is assigned to the reconstructed virtual node, and the mapping relationship between the virtual device and the VTL device entry address and the backup server egress address is re-established, and the reconstructed virtual device can accept the backed up server.
  • Use that is, accept user backup requests and perform backup services.
  • the process of assigning addresses to the virtual devices by the VTL devices is independent of each other, so the reconstructed virtual devices are reassigned the virtual device addresses.
  • the backup server still uses the previous virtual device address to back up the data, so the services being backed up will fail and cannot be sent to the rebuilt virtual device.
  • the address of the virtual device may be a Small Computer System Interface (SCSI) address, such as a SCSI triplet address, and the triplet address is an address expressed by the channel channel, the device device, and the target target.
  • the triplet address is the address assigned to each virtual device in the backup server.
  • node 131 in Figure 1 is created with: “131 virtual tape 0[0:0:0]” and “131 virtual magnetic tape drive 0[0:0:1]” virtual devices;
  • 131 in the virtual device “131 virtual tape [0:0:0]” refers to the node name to which this virtual device belongs, “virtual tape” is the type of virtual device, and “0" is the number of the virtual device.
  • Letter The information is the configuration information of this virtual tape. It should be noted that the configuration information is not limited to these items. Since it is only used for the example, the rest of the configuration information is not listed here. [0:0:0] is the SCSI address of this virtual tape.
  • One approach is to recreate the virtual magnetic tape library, virtual magnetic tape drive device in the failed node, and assign a SCSI address to the rebuilt virtual device on node 132 when node 132 detects that node 131 is failing to continue working.
  • the reconstruction is shown in Table 2.
  • the two virtual devices on node 131 are rebuilt on node 132, and the VTL node name, virtual device type, and number information remain unchanged.
  • the node 132 allocates a virtual address to the reconstructed virtual device, it detects that the two SCSI addresses [0:0:0] and [0:0:1] have been occupied by the existing virtual device of the device, and can no longer be used.
  • the reconstructed virtual device is used.
  • the node 132 allocates two new device addresses [0:0:3] and [0:0:4] for the reconstructed virtual device.
  • mapping relationship between the virtual magnetic tape library and the original VTL device entry address and the original backup server egress address is re-established, such as an IP address or a World Wide Port Name (WWPN) address.
  • WWPN World Wide Port Name
  • the write operation will fail and the server will retry multiple times until the preset number of retries or retry time is exceeded, but each time it will fail.
  • Data loss caused by failure after the failure takeover/failure is completed, the mapped virtual device is rescanned in the backup server (Backup Server), and then the failed data backup/recovery task is restarted, which increases the system resource consumption and increases. The risk of data loss.
  • the taken over service is transferred back to the node 131.
  • the node 131 assigns the device address to the two devices to be reassigned, and it is difficult to ensure that the device address is consistent with the device address before the fault, so the fault recovery process is performed. In the middle, it often causes backup failures.
  • the same problem can occur if the virtual device on one VTL node needs to be rebuilt on another virtual device.
  • the device address is independent information other than the configuration information, and the allocation, management, and maintenance modes are different from the configuration information. Therefore, the device address of the virtual device before the reconstruction cannot be implemented in the prior art. The device address of the virtual device remains unchanged after the rebuild.
  • a virtual device re-establishment method is applied to a VTL cluster 13 .
  • the VTL cluster 13 includes a first VTL node 131 and a second VTL node 132.
  • the backup server 11 passes through the switching device 12 and the first VTL node 131 and the first
  • the second VTL node 132 establishes a communication connection.
  • the VTL system 1 is composed of a cluster 13 and a storage device 14.
  • the storage device 14 establishes a communication connection with the first VTL node and the second VTL node.
  • the first VTL node is created with at least one virtual device, and the device address of the virtual device on the first VTL node is unique in the VTL cluster.
  • the switching device 12 may be an IP-based switching device or a WWPN-based switching device.
  • the storage device 14 may be a redundant array of inexpensive disks or integrated with a VTL device. A hard drive together.
  • the device address of the virtual device on the first VTL node is unique in the VTL cluster. That is to say, all VTL nodes in the VTL cluster do not use the device address to create a virtual device.
  • the method implements the unique address of the virtual device. For example, when the VTL node allocates an address for a new virtual device, the VTL node first queries the address of the virtual device of the VTL node and other VTL nodes in the cluster, and selects an unused address for allocation.
  • a cluster address allocation table can be established.
  • Each device allocates an unused address in the table when assigning an address to a new virtual device, and after the allocation is completed, records the assigned address in the table as The address to be used; in addition, each VTL node can be assigned a different address segment, for example, the first device can allocate a set of 1000 addresses, and the second device can allocate a set of another 1000 addresses.
  • the virtual device reconstruction method of this embodiment includes the following steps. See FIG. 2 .
  • the first VTL node searches for a device address that is not used by any VTL device in the VTL cluster; the first VTL node creates the virtual device by using the found device address information.
  • the second VTL node 131 detects whether a node of the first VTL node 132 is faulty.
  • a heartbeat network When the second VTL node 132 does not receive the heartbeat information of the first VTL node 131 through the heartbeat network within a certain period of time, it is determined that the first VTL node 131 has failed; Monitoring by the storage device 14 notifies the second VTL node 132 when the storage device 14 detects that the first VTL node 131 has failed.
  • the second VTL node 132 After detecting that the first VTL node 131 is faulty, the second VTL node 132 takes over the ingress address of the first VTL node 131, and the second VTL node 132 acquires configuration information of the virtual device. , device address, entry address, and backup server exit address.
  • the backup data is sent to the VTL node 131 through the egress address of the backup server 11, and then sent to the VTL through the ingress address of the VTL node 131.
  • the virtual device established by the node 131 sends the backup data to the storage device 14 by the virtual device of the VTL node 131, thereby finally implementing data backup.
  • the data is recorded in a unified platform, and the VTL node 132 obtains the information through the platform; or Each virtual device configuration information, device address, entry address, and backup server exit address of the remaining VTL nodes are saved on each VTL node, and the update of these data is maintained.
  • the backup server 11 and the storage device 14 also receive the fault prompt, and replace the virtual device on the first VTL node with the virtual device on the second VTL node after receiving the fault prompt. ready.
  • the second VTL node generates the reconstructed virtual device by using the configuration information.
  • the configuration information is information used to describe the virtual device, such as the model number of a virtual device, the virtual device name, and the serial number of the virtual device, where the model number of the virtual device refers to the model of the physical device virtualized by the virtual device. , for example, the B equipment produced by Company A.
  • the configuration information is obtained, the virtual device on the failed node can be recreated. It should be specially noted that this configuration information does not include the device address, the entry address, and the backup server exit address.
  • the device address is the address used by the virtual device on the first VTL node 131. Since the address on each VTL node is not duplicated, the second VTL node 132 has no virtual device to use this address, and the second VTL node 132 can use this address. The address is assigned to the rebuilt virtual device. The device entry address and backup server exit address are also mapped to the pre-rebuild virtual device. Therefore, after the mapping between the virtual device and the VTL device entry address and the backup server egress address is established, the configuration information, device address, VTL device entry address, and backup server egress address of the rebuilt virtual device are the same as those before the re-establishment. The location of the first VTL node 131 becomes the second VTL node 132.
  • the reestablishing virtual device receives, by using an ingress address of the reestablishing virtual device, backup information that is sent by the backup server by using the egress server egress address; and the reestablishing virtual device sends the backup data to the storage device for backup. .
  • the reconstructed virtual device can be used by the backup server 11 and managed by the second VTL node 132.
  • Step S26 is an example of how the backup server 11 uses the reconstructed virtual device.
  • step S26 if the fault occurs, the virtual device on the first VTL node 131 is performing a backup task, and the backup task needs to specify the device address, the VTL device entry address, Backup server exit address.
  • the reconstructed virtual device can continue to perform the backup service because the device address, the VTL device entry address, and the backup server egress address of the rebuilt virtual device are the same as those before the re-establishment.
  • the virtual device is unusable.
  • the backup server 11 receives a prompt that the backup task is unsuccessful, and the backup server 11 can try to perform the backup task again until step S24 is executed. When you are done, you can successfully perform the backup task and no longer receive the prompt that the backup task is unsuccessful.
  • the backup server 11 still sends backup data along with the parameters of the virtual device before the failure, including configuration information, device address, entry address, and backup server exit address; and rebuilding the configuration information and device of the virtual device.
  • the address, the ingress address, and the backup server egress address are the same as those of the pre-reconstruction virtual device. Therefore, the backup service being processed by the virtual device before the rebuild can be successfully switched to the rebuilt virtual device. After the data loss takeover is completed, the entire cluster is still available. The state of normal work.
  • This embodiment relates to a failure recovery operation. After the first VTL node 131 in FIG. 1 recovers from the fault, the virtual device migrated to the second VTL node 132 can be relocated back to the first VTL node 131.
  • the principle of this embodiment is basically the same as steps S22, S23, S24, and S25 of the first embodiment.
  • step S22 after detecting that the first VTL node 131 is faulty, the second VTL node 132 takes over the entry address of the first VTL node 131, and the second VTL node 132.
  • the first VTL node 132 after detecting the failure recovery of the first VTL node 131, the first VTL node 132 retakes the entry address taken over by the second VTL node 131.
  • the present invention further provides an embodiment of a virtual device reconstruction apparatus.
  • the virtual device reconstruction device is located in the node, for example, the following second VTL node, that is, the virtual device reconstruction device may be software or hardware having corresponding functions integrated in the node, or may be the node itself.
  • the virtual device reconstruction device 3 is located in the second VTL node, and the virtual magnetic tape library VTL cluster includes the first VTL node and the second VTL node, and the backup server and the first VTL.
  • the node and the second VTL node establish a communication connection
  • the storage device establishes a communication connection with the first VTL node and the second VTL node, where the first VTL node is created with at least one virtual device, and the first VTL node is virtualized.
  • the device address of the device is unique in the VTL cluster, and the virtual device reconstruction device includes: an obtaining module 33, a rebuilding module 34, and an enabling module 35.
  • the creating module 31 and the fault detecting module 32 may also be included.
  • the creating module 31 is configured to find a device address that is not used by any VTL device in the VTL cluster, and is used by the second VTL device to create the virtual device.
  • the fault detection module 32 is connected to the creation module 31, and is configured to detect whether the first VTL node is faulty, and after detecting the fault of the first VTL node, start the acquisition module 33.
  • the obtaining module 33 is connected to the fault detecting module 32, and is configured to take over an entry address of the first VTL node, and obtain configuration information, a device address, an entry address, and a backup server exit address of the virtual device.
  • the backup data is sent to the VTL node through the egress address of the backup server 11.
  • the virtual device established by the VTL node 131 is sent to the virtual device established by the VTL node 131, and the backup data is sent to the storage device 14 by the virtual device of the VTL node 131, thereby finally backing up the data.
  • There are many ways to obtain these data For example, after each virtual device is created, the data can be recorded in a unified platform.
  • the VTL node 132 obtains the information through the platform; or saves a copy on each VTL node.
  • the backup server 11 and the storage device 14 also receive the fault prompt, and replace the virtual device on the first VTL node with the virtual device on the second VTL node after receiving the fault prompt. ready.
  • the reconstruction module 34 is connected to the acquisition module 33, and is configured to generate, by the second VTL node, the reconstruction virtual device by using the configuration information.
  • the configuration information is information used to describe the virtual device, such as the model of a virtual device, the name of the virtual device, and the serial number of the virtual device, where the model number of the virtual device refers to the model of the physical device virtualized by the virtual device.
  • the enabling module 35 is connected to the re-establishing module 34, and is configured to allocate the device address to the re-establishing virtual device, and establish a mapping relationship between the re-established virtual device and the VTL device ingress address and the backup server egress address.
  • the device address is the address used by the virtual device on the first VTL node 131. Since the address on each VTL node is not duplicated, the second VTL node 132 has no virtual device to use this address, and the second VTL node 132 can use this address. The address is assigned to the rebuilt virtual device. The device entry address and backup server exit address are also mapped to the pre-rebuild virtual device. Therefore, after the mapping between the virtual device and the VTL device entry address and the backup server egress address is established, the configuration information, device address, VTL device entry address, and backup server egress address of the rebuilt virtual device are the same as those before the re-establishment. The location of the first VTL node 131 becomes the second VTL node 132.
  • the enabling module 35 is further configured to describe, by the virtual device, an entry address of the reconstructed virtual device. Receiving backup information sent by the backup server using the backup server export address; and causing the rebuilt virtual device to send the received backup data to the storage device for backup.
  • the virtual device on the first VTL node 131 is performing a backup task.
  • This backup task needs to specify the device address, the VTL device entry address, and the backup server exit address when executing.
  • the reconstructed virtual device can continue to perform the backup service because the device address of the virtual device, the VTL device entry address, and the backup server's egress address are the same as those before the re-establishment.
  • the virtual device is unusable.
  • the backup server 11 receives a prompt that the backup task is unsuccessful, and the backup server 11 can try to perform the backup task again until step S24 is performed. When you are done, you can successfully perform the backup task and no longer receive the prompt that the backup task is unsuccessful.
  • the backup server 11 still sends backup data along with the parameters of the virtual device before the failure, including configuration information, device address, entry address, and backup server exit address; and rebuilding the configuration information and device of the virtual device.
  • the address, the ingress address, and the backup server egress address are the same as those of the pre-reconstruction virtual device. Therefore, the backup service being processed by the virtual device before the rebuild can be successfully switched to the rebuilt virtual device. After the data loss takeover is completed, the entire cluster is still available. The state of normal work.
  • the third embodiment is a device for executing the first embodiment.
  • the fault recovery device or the fault recovery module may also be implemented to perform the method in the second embodiment. Since the description has been made in the second embodiment, details are not described herein. .
  • this embodiment is a first VTL node 4.
  • Virtual magnetic tape library VTL cluster package Including a first VTL node and a second VTL node, the backup server establishes a communication connection with the first VTL node and the second VTL node, and the storage device establishes a communication connection with the first VTL node and the second VTL node.
  • the first VTL node is created with at least one virtual device, and the device address of the virtual device on the first VTL node is unique in the VTL cluster, and the first VTL node includes a CPU 44, a first communication interface 41 that communicates with the CPU, and the CPU.
  • a second communication interface 42 for communication and a memory 43 for communicating with the CPU, the first communication interface 41 for communicating with the backup server; the second communication interface 42 for communicating with the storage device;
  • the memory 43 is configured to store computer instructions; and the processor 44 is coupled to the memory for performing the operations of the following Embodiment 1 and Embodiment 2 by running the computer instructions.
  • the present invention can be implemented by means of software plus necessary general hardware, and of course, by hardware, but in many cases, the former is a better implementation. .
  • the technical solution of the present invention which is essential or contributes to the prior art, may be embodied in the form of a software product stored in a readable storage medium, such as a floppy disk of a computer.
  • a hard disk or optical disk or the like includes instructions for causing a computer device (which may be a personal computer, a server, or a network device, etc.) to perform the methods described in various embodiments of the present invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种虚拟设备重建技术,在虚拟设备重建方法中,第二VTL节点接管所述第一VTL节点的入口地址,所述第二VTL节点获取所述虚拟设备的配置信息、设备地址、入口地址以及备份服务器出口地址,第二VTL节点使用所述配置信息生成重建虚拟设备,将所述设备地址分配给重建虚拟设备,建立重建虚拟设备与VTL设备入口地址、备份服务器出口地址之间的映射关系。应用本发明重建的虚拟设备,可以平滑接管原虚拟设备正在备份的业务。

Description

一种虚拟设备重建方法与装置 技术领域
本发明涉及存储领域, 特别有关于一种虚拟磁磁带库 VTL技术。 背景技术
随着计算机技术的高速发展, 各机构、 企业等的数据中心的数据量呈爆炸 式的增长, 相应地, 备份各数据中心的数据所需的时间也大幅增加。 于是各机 构、 企业等的数据中心纷纷引入备份性能更高的磁盘备份存储, 比如虚拟磁磁 带库( VTL, Virtual Tape Library )来替代传统的物理磁磁带库备份存储, 以缩 短数据备份时间, 减小备份业务对生产业务的影响。
VTL产品通常由服务器、 VTL设备以及存储阵列组成, VTL设备可以运行 VTL程序。服务器将需要备份的数据发送给 VTL设备, VTL设备将数据备份到 存储阵列中。 VTL集群是一种集群产品, VTL集群中包含多台 VTL设备, 每台 VTL设备又可以称为一个节点, 多个节点可以同时运行 VTL应用软件。 和单节 点形态(只包含一台服务器) VTL产品相比, 每个 VTL设备可以同时工作, 因 此 VTL集群能显著缩短备份恢复时间, 更大程度地减小备份业务对生产业务的 影响。
VTL 集群在大幅提升产品性能的同时, 也带来了集群系统的可用性问题。 集群中任何一个节点出现故障都将导致整个集群系统的故障, 集群 VTL中的节 点越多, 集群 VTL因故障而中断工作的可能性就越大。
现有技术中, 当 VTL集群中有节点发生故障后。 其他节点会接管这个故障 节点的业务, 在接管的过程中, 故障节点上正在运行的那些备份业务会运行失 败。 发明内容
本发明提供一种虚拟设备重建方法及装置, 可以平滑接管重建前虚拟设备 正在运行的业务。
第一方面, 本发明实施例提供一种虚拟设备重建方法, 虚拟磁磁带库 VTL 集群包括第一 VTL节点以及第二 VTL节点, 备份服务器与所述第一 VTL节点 以及所述第二 VTL节点建立通信连接,存储设备与所述第一 VTL节点以及所述 第二 VTL节点建立通信连接, 第一 VTL节点创建有至少一个虚拟设备, 第一 VTL节点上的虚拟设备的设备地址在 VTL集群中唯一, 该方法包括: 所述第二 VTL节点接管所述第一 VTL节点的入口地址, 所述第二 VTL节点获取所述虚 拟设备的配置信息、 设备地址、 入口地址以及备份服务器出口地址; 第二 VTL 节点使用所述配置信息生成重建虚拟设备; 将所述设备地址分配给重建虚拟设 备, 建立所述重建虚拟设备与 VTL设备入口地址、 备份服务器出口地址之间的 映射关系。
第二方面, 本发明实施例提供一种虚拟设备重建装置, 位于第二 VTL节点 中, 虚拟磁磁带库 VTL集群包括第一 VTL节点以及所述第二 VTL节点, 备份 服务器与所述第一 VTL节点以及所述第二 VTL节点建立通信连接,存储设备与 所述第一 VTL节点以及所述第二 VTL节点建立通信连接, 第一 VTL节点创建 有至少一个虚拟设备,第一 VTL节点上的虚拟设备的设备地址在 VTL集群中唯 一, 所述虚拟设备重建装置包括: 获取模块, 用于接管所述第一 VTL节点的入 口地址, 以及获取所述虚拟设备的配置信息、 设备地址、 入口地址以及备份服 务器出口地址; 重建模块, 用于第二 VTL节点使用所述配置信息生成重建虚拟 设备; 使能模块, 用于将所述设备地址分配给重建虚拟设备, 以及建立所述重 建虚拟设备与 VTL设备入口地址、 备份服务器出口地址之间的映射关系。
第三方面,本发明实施例提供一种第二 VTL节点,虚拟磁磁带库 VTL集群 包括第一 VTL节点以及第二 VTL节点, 备份服务器与所述第一 VTL节点以及 所述第二 VTL节点建立通信连接,存储设备与所述第一 VTL节点以及所述第二 VTL节点建立通信连接, 第一 VTL节点创建有至少一个虚拟设备, 第一 VTL 节点上的虚拟设备的设备地址在 VTL 集群中唯一, 所述第二 VTL 节点包括 CPU, 与 CPU通信的第一通信接口, 与 CPU通信的第二通信接口, 以及与 CPU 通信的内存: 所述第一通信接口, 用于和所述备份服务器通信; 所述第二通信 接口, 用于和所述存储设备通信; 所述内存, 用于存储计算机指令; 所述处理 器, 和所述内存耦合, 用于通过运行所述计算机指令来执行以下操作: 接管所 述第一 VTL节点的入口地址, 获取所述虚拟设备的配置信息、 设备地址、 入口 地址以及备份服务器出口地址; 使用所述配置信息生成重建虚拟设备; 将所述 设备地址分配给重建虚拟设备, 建立所述重建虚拟设备与 VTL设备入口地址、 备份服务器出口地址之间的映射关系。
应用本发明实施例后, 重建虚拟设备的配置信息、 设备地址、 入口地址以 及备份服务器出口地址均与重建前虚拟设备相同, 因此重建前虚拟设备正在处 理的备份业务可以顺利切换到重建后虚拟设备, 不会发生数据丟失。 附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述 中的附图仅仅是本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付 出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1是本发明实施例应用场景拓朴图;
图 2是虚拟设备重建方法实施例流程图;
图 3是虚拟设备重建装置实施例示意图;
图 4是 VTL节点实施例示意图。 具体实施方式
下面将结合本发明实施例中的附图, 对本发明的技术方案进行清楚、 完整 地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实 施例。 基于本发明中的实施例, 本领域普通技术人员在没有作出创造性劳动前 提下所获得的所有其他实施例, 都属于本发明保护的范围。
VTL技术可以仿真物理磁带, VTL允许客户配置虚拟磁带驱动器、 虚拟磁 带盒和指定磁带盒容量。实现 VTL技术的设备或者说实现 VTL技术的主体设备, 我们称为 VTL产品或者 VTL设备, 不同厂商的 VTL产品, 支持虚拟磁带驱动 器的最大数目也不同。 与物理磁磁带库不同, 物理磁磁带库需要购买并安装额 外的磁带驱动器, 但对 VTL来说通过改变软件结构 (configuration)即可增加虚拟 磁带驱动器, 而这不需要花费任何额外的硬件成本。 VTL设备可以简称为节点, 在 VTL技术中, 只有一个 VTL设备的情形, 我们可以称为 VTL单节点形态; 多个 VTL共同工作设备的情形, 我们称为 VTL多节点形态, 或者称呼为 VTL 集群。 在 VTL集群中, VTL节点间可以提供保护, 当某个 VTL节点故障时, 由未发生故障的 VTL节点接管故障节点上的业务。
如图 1所示, 3个备份服务器 11通过交换机 12与 VTL设备 131 以及 VTL 设备 132通信连接, VTL设备 131、 VTL设备 132均与存储阵列 14通信连接, VTL设备 131与 VTL设备 132组成 VTL集群 13 , VTL系统 1包括 VTL集群 13以及存储阵列 14。设备之间的通信连接可以通过光纤通道(FC, Fiber Channel ) 或者以太网 (Ethernet )等技术实现, 本发明后续实施例以 FC技术为例进行介 绍。 当使用 FC时, 所述交换机 12是 FC交换机, 所述备份服务器 11以及 VTL 设备 131、 VTL设备 132通过全球端口名称( WWPN , World Wide Port Name ) 地址实现与 FC交换机 12的通信。 VTL集群 13的特点是 VTL设备 131与 VTL 设备 132中的某一个发生故障时, 可以将业务倒换到一个进行 VTL设备上。 需 要指出的是,本发明各实施例中仅以 2个 VTL设备的情形进行举例,实际上 VTL 集群可以由更多的 VTL设备组成。
VTL设备可以简称为节点, 因此 VTL设备 131可以称为节点 131 , VTL设 备 132可以称为节点 132, 2个节点通过心跳网络和后端存储阵列 14中的仲裁 信息相互监控对方的工作状态, 当一个节点发生故障无法正常工作时, 可以由 另外一个节点接管其业务。 节点 131和节点 132上都配置有虚拟磁磁带库设备 或者虚拟磁磁带机设备, 虚拟磁磁带库设备或虚拟磁磁带机设备都可以称为虚 拟设备, 对用户而言, 这些虚拟设备就像是真实的物理磁带设备一样可用。
后端存储可以是 VTL节点的本地存储,也就是说依靠 VTL节点自身进行存 储; 也可以是通过网络和 VTL节点互联的外置存储, 图 1 中的存储阵列 14是 外置存储的示例。 实际使用时, 可以在后端存储中创建多个 LUN, 这些 LUN可 以被 VTL节点中的 VTL软件直接使用, 也可以先由 VTL节点在其中创建文件 系统,然后再提供给 VTL软件使用。 Server发送的 SCSI指令和数据被虚拟设备 接收到之后, 虚拟设备调用后端读写接口, 如块读写接口或者文件读写接口等, 将数据写入后端存储。
本领域人员应该知道, 虚拟设备的各项参数可以通过配置信息进行描述, 以虚拟磁带库设备为例, 其配置信息包括有磁带库 ID、 磁带库型号、 磁带库名 称以及磁带库序列号等信息, 确定了一个虚拟设备的配置信息就可以重新创建 这个虚拟设备。 现有技术中, VTL 集群中的节点为了进行节点间的保护, 每个 节点会预先存储其他节点上所有虚拟设备的配置信息, 当有节点发生故障时, 通过这些配置信息可以重建故障节点上的虚拟设备。 虚拟设备重建后, 为重建 后的虚拟节点分配设备地址 , 并重新建立这个虚拟设备与 VTL设备入口地址、 备份服务器出口地址之间的映射关系后, 这个重建后的虚拟设备就可以接受被 备份服务器使用, 也就说可以接受用户的备份请求并执行备份业务。
然而, 如果虚拟设备正在进行备份业务时节点发生了故障, 由于各个 VTL 设备为虚拟设备分配地址的过程是相互独立, 因此重建后的虚拟设备会被重新 分配虚拟设备地址。 而备份服务器仍在沿用之前的虚拟设备地址发生备份数据, 因此这些正在备份的业务会失败, 无法正常发送给重建虚拟设备。 虚拟设备的 地址可以是小型计算机系统接口 ( Small Computer System Interface , SCSI )地 址, 例如 SCSI三元组地址, 三元组地址是指用通道 channel, 设备 device以及 目标 target三个信息进行表达的地址。 本实施例中, 三元组地址是在备份服务器 中为每个虚拟设备分配的地址。 这些地址就是从备份服务器中看到的各个虚拟 设备的地址, 以使得备份服务器可以通过三元组地址找到并使用 VTL节点中的 虚拟设备。
举例来说假设图 1中节点 131创建有: "131 虚拟磁带 0[0:0:0] " 以及 "131 虚拟磁磁带机 0[0:0:1] " 这两个虚拟设备; 假设节点 132创建有: "132虚拟磁 磁带库 0[0:0:0] "、 "132虚拟磁磁带机 0[0:0:1] " 以及 "132虚拟磁磁带机设备 1[0:0:2] " 共三个虚拟设备, 如表 1所示。
其中, 虚拟设备 "131 虚拟磁带 [0:0:0]" 中 "131" 指这个虚拟设备所属于 的节点名称, "虚拟磁带" 是虚拟设备的类型, "0" 是虚拟设备的编号, 这些信 息都是这个虚拟磁带的配置信息, 需要说明的是, 配置信息不止这几项, 由于 仅是用于示例, 其余配置信息这里没有列出。 [0:0:0]是这个虚拟磁带的 SCSI地 址。
Figure imgf000007_0001
表 1
一种做法是, 当节点 132检测到节点 131发生故障无法继续工作时, 在节 点 132上重新创建故障节点中的虚拟磁磁带库、 虚拟磁磁带机设备, 并为重建 虚拟设备分配 SCSI地址。 重建后的如表 2所示。
Figure imgf000007_0002
表 2
如表 2所示, 节点 131上的两个虚拟设备在节点 132上得到了重建, VTL 节点名、 虚拟设备类型与编号这两项信息保持不变。 节点 132 为重建的虚拟设 备分配虚拟地址时, 检测到设备地址 [0:0:0]与 [0:0:1]这两个 SCSI地址已经被本 设备已有的虚拟设备占用, 无法再被重建的虚拟设备使用, 本实施例中, 节点 132为重建的虚拟设备分配了 [0:0:3]与 [0:0:4]这两个新设备地址。
分配完设备地址后, 重建这些虚拟磁磁带库与原 VTL设备入口地址、 原备 份服务器出口地址之间的映射关系, 这些地址例如是 IP地址或者虚拟全球端口 名称(World wide Port Name, WWPN )地址, 这些原本由节点 131控制, 故障 发生后由节点 132接管。 当映射关系建立完成后, 就实现了故障节点的接管, 重建的虚拟设备可以接受新的备份请求。 但是故障节点上正在运行的备份仍然 是以原设备地址进行, 也就是说服务器仍然在按照 ",, 131虚拟磁带 0 [0:0:0] "、 "" 131虚拟磁磁带机 0 [0:0:1] " 写入数据, 由于重建的虚拟设备设备地址发 生了变化, 因此写入操作会失败, 服务器会多次重试直到超过预设的重试次数 或者重试时间, 但每次均会以失败告终。 为了避免写入失败造成的数据丟失, 必须在故障接管 /故障恢复完成后, 在备份服务器 (Backup Server ) 中重新扫描 映射的虚拟设备, 然后重启失败的数据备份 /恢复任务,加大了系统的资源消耗, 增加了数据丟失的风险。
当节点 131的故障恢复后, 被接管的业务又被转移回来节点 131 , 节点 131 为这两个设备分配设备地址是重新分配的, 难以保证与故障前的设备地址保持 一致, 因此在故障恢复过程中, 往往也会造成备份的失败。
在故障或者故障恢复以外的其他情形, 如果需要把一个 VTL节点上的虚拟 设备重建在另外一个虚拟设备上, 也会出现同样的问题。 现有技术只能实现配 置信息保持不变, 但是设备地址是配置信息之外的独立信息, 分配、 管理、 维 护的方式均与配置信息不同, 因此现有技术无法实现重建前虚拟设备的设备地 址与重建后虚拟设备的设备地址保持不变。
实施例一
参照图 1 , 一种虚拟设备重建方法, 应用在 VTL集群 13中, VTL集群 13 包括有第一 VTL节点 131 以及第二 VTL节点 132, 备份服务器 11通过交换设 备 12与第一 VTL节点 131以及第二 VTL节点 132建立通信连接。 VTL系统 1 由集群 13以及存储设备 14共同组成。 存储设备 14与第一 VTL节点以及第二 VTL节点建立通信连接, 第一 VTL节点创建有至少一个虚拟设备, 第一 VTL 节点上的虚拟设备的设备地址在 VTL集群中唯一。 根据备份服务器 11与 VTL 集群 13之间通信方式的不同, 交换设备 12可以是基于 IP的交换设备或者基于 WWPN的交换设备,存储设备 14可以是廉价磁盘冗余阵列 RAID组或者与 VTL 设备集成在一起的硬盘。
第一 VTL节点上的虚拟设备的设备地址在 VTL集群中唯一, 也就说 VTL 集群中所有 VTL节点都没有使用这个设备地址的创建虚拟设备。 可以有很多种 办法实现虚拟设备地址的唯一, 例如 VTL节点在为一个新的虚拟设备分配地址 时,先查询本 VTL节点以及集群中其他 VTL节点已有虚拟设备的地址,选择未 被使用的地址进行分配; 也可以建立集群地址分配表, 每个设备在为一个新的 虚拟设备分配地址时, 选择表中未被使用的地址进行分配, 并且在分配完成后, 将本次分配的地址在表中记录为已被使用的地址; 此外, 还可以为每个 VTL节 点分配不同的地址段, 比如第一个设备可以分配 1000个地址组成的集合, 第二 个设备可以分配另外 1000个地址组成的集合, 以此类推, 由于集合之间不存在 相同的元素, 集群中的 VTL设备间的设备地址不会冲突。 本实施例的虚拟设备 重建方法包括如下步骤, 可参见图 2。
S21、所述第一 VTL节点查找未被所述 VTL集群中任一 VTL设备使用的设 备地址; 所述第一 VTL节点使用查找到的设备地址信息创建所述虚拟设备。
这是一个可选步骤, 执行本步骤可以保证集群中任意两个虚拟设备的地址 不重复。
522、 所述第二 VTL节点 131检测第一 VTL节点 132节点是否发生故障。 检测方法有艮多种, 例如通过心跳网络, 当第二 VTL节点 132在一定时间 内没有通过心跳网络收到第一 VTL节点 131的心跳信息时,判定第一 VTL节点 131发生了故障; 也可以通过存储设备 14进行监测, 当存储设备 14监测到第一 VTL节点 131发生故障时, 通知第二 VTL节点 132。
523、当检测到所述第一 VTL节点 131发生故障后,所述第二 VTL节点 132 接管所述第一 VTL节点 131的入口地址,所述第二 VTL节点 132获取所述虚拟 设备的配置信息、 设备地址、 入口地址以及备份服务器出口地址。
要实现数据备份, 需要建立备份服务器出口地址、 VTL设备入口地址以及 虚拟设备之间的映射, 备份数据通过备份服务器 11 的出口地址发往 VTL节点 131 , 再通过 VTL节点 131的入口地址发往 VTL节点 131建立的虚拟设备, 并 由 VTL节点 131的虚拟设备将备份数据发往存储设备 14,最终实现数据的备份。 获取这些数据的方法可以有多种, 例如可以在每个虚拟设备创建完成后将这些 数据记录在一个统一平台中, VTL节点 132通过这个平台获取这些信息; 或者 在每个 VTL节点上保存一份其余 VTL节点的各个虚拟设备配置信息、设备地址、 入口地址以及备份服务器出口地址,并保持这些数据的更新。第一 VTL节点 131 故障后, 备份服务器 11 以及存储设备 14也会收到故障提示, 并分别在收到故 障提示后做好由第二 VTL节点上的虚拟设备替代第一 VTL节点上虚拟设备的准 备。
524、 第二 VTL节点使用所述配置信息生成重建虚拟设备。
如前所述, 配置信息是用来描述虚拟设备的信息, 例如一个虚拟设备的型 号、 虚拟设备名称以及虚拟设备的序列号, 其中虚拟设备的型号是指被虚拟设 备所虚拟的物理设备的型号, 比如 A公司生产的 B款设备。 获取了配置信息以 后就可以重新创建出故障节点上的虚拟设备。 需要特别说明的是, 这个配置信 息不包括设备地址、 入口地址以及备份服务器出口地址。
525、将所述设备地址分配给重建虚拟设备, 建立所述重建虚拟设备与 VTL 设备入口地址、 备份服务器出口地址之间的映射关系。
这个设备地址是第一 VTL节点 131上虚拟设备使用的地址, 由于各个 VTL 节点上的地址不重复,因此第二 VTL节点 132已有虚拟设备没用使用这个地址, 第二 VTL节点 132可以将这个地址分配给重建虚拟设备使用。 设备入口地址、 备份服务器出口地址也是与重建前虚拟设备映射的。 因此建立起重建虚拟设备 与 VTL设备入口地址、 备份服务器出口地址之间的映射关系后, 重建虚拟设备 的配置信息、 设备地址、 VTL设备入口地址、 备份服务器出口地址均与重建前 一样, 只是存在的位置有第一 VTL节点 131变成了第二 VTL节点 132。
526、 所述重建虚拟设备通过所述重建虚拟设备的入口地址, 接收所述备份 服务器使用所述备份服务器出口地址发送的备份信息; 所述重建虚拟设备将备 份数据发往所述存储设备进行备份。 完成步骤 S25之后, 重建虚拟设备即可被 备份服务器 11使用以及被第二 VTL节点 132管理, 步骤 S26是对备份服务器 11如何使用重建虚拟设备的一种举例。
在本步骤 S26中, 如果故障发生时, 第一 VTL节点 131上的虚拟设备正在 执行备份任务, 这个备份任务在执行时需要指定设备地址、 VTL设备入口地址、 备份服务器出口地址。 由于重建后的虚拟设备的设备地址、 VTL设备入口地址、 备份服务器出口地址均与重建前一样, 因此重建后的虚拟设备可以继续执行这 个备份业务。 需要说明的是, 在步骤 S24完成之前, 这个虚拟设备是无法使用 的, 这个时候备份服务器 11会收到备份任务不成功的提示, 这时备份服务器 11 可以再次尝试执行备份任务, 直到步骤 S24执行完成, 即可以成功执行备份任 务, 不再收到备份任务不成功的提示。
在实施例一中, 即如果集群中的某节点出现故障, 其上运行的相关业务可 以被集群中的其他节点接管。 对于正在运行的备份业务, 备份服务器 11仍然沿 用故障前虚拟设备的各项参数发送备份数据, 这些参数包括配置信息、 设备地 址、 入口地址以及备份服务器出口地址; 而重建虚拟设备的配置信息、 设备地 址、 入口地址以及备份服务器出口地址均与重建前虚拟设备相同, 因此重建前 虚拟设备正在处理的备份业务可以顺利切换到重建后虚拟设备, 不会发生数据 丟失接管完成后, 整个集群仍然处于可正常工作的状态。 这样就可以确保整个 集群不会因单个节点故障而无法正常工作, 有效保证了集群产品的可用性。 并 且, 故障接管过程中, 故障节点上正在运行的备份 /恢复任务不会失败, 故障接 管的过程更加平滑。 故障接管完成后, 不需要在 Backup Server中重新扫描映射 的虚拟设备, 然后重启失败的数据备份 /恢复任务以再次执行。 可以实现无数据 丟失的业务保护。
实施例二
本实施例是关于故障恢复操作。当图 1中的第一 VTL节点 131故障恢复后, 可以将迁移至第二 VTL节点 132的虚拟设备重新迁回第一 VTL节点 131。
本实施例的原理与实施例一的步骤 S22、 S23、 S24、 S25基本相同。 所不同 之处在于, 步骤 S22中, 是当检测到所述第一 VTL节点 131发生故障后, 所述 第二 VTL节点 132接管所述第一 VTL节点 131的入口地址, 所述第二 VTL节 点 132获取所述虚拟设备的配置信息、 设备地址、 入口地址以及备份服务器出 口地址。而实施例二的相应步骤中,是当检测到第一 VTL节点 131故障恢复后, 所述第一 VTL节点 132重新接管被第二 VTL节点 131接管的入口地址。 本领域人员在研读了实施例一的基础上, 可以轻易完成实施例二, 此处不 再赘述。 此外在了解了实施例一、 实施例二的基础上, 本领域技术人员应该也 可以推导出如何将任意一个 VTL节点上的虚拟设备迁移到 VTL集群中的其他 VTL节点, 这种迁移可以是因为故障或者故障恢复, 也可以是其他情形, 例如 用户指定的迁移。 当不是因为故障或故障恢复而发生的迁移时, 检测是否发生 故障或者检测故障是否恢复的步骤不是必须的。
实施例三
以实施例一以及实施例二为基础, 本分发明还提供一种虚拟设备重建装置 实施例。 虚拟设备重建装置位于节点中, 例如下面的第二 VTL节点中, 也就是 说虚拟设备重建装置可以是集成在节点中的、 具有相应功能的软件或者硬件, 也可以是节点本身。
参见附图 3 , 本实施例中, 虚拟设备重建装置 3 , 位于第二 VTL节点中, 虚拟磁磁带库 VTL集群包括第一 VTL节点以及所述第二 VTL节点, 备份服务 器与所述第一 VTL节点以及所述第二 VTL节点建立通信连接,存储设备与所述 第一 VTL节点以及所述第二 VTL节点建立通信连接, 第一 VTL节点创建有至 少一个虚拟设备, 第一 VTL节点上的虚拟设备的设备地址在 VTL集群中唯一, 虚拟设备重建装置包括: 获取模块 33、 重建模块 34以及使能模块 35。 可选的, 还可以包括创建模块 31以及故障检测模块 32。
创建模块 31 , 用于查找未被所述 VTL集群中任一 VTL设备使用的设备地 址, 以用于所述第二 VTL设备创建所述虚拟设备。
故障检测模块 32, 和创建模块 31连接, 用于检测第一 VTL节点是否发生 故障, 并在检测到第一 VTL节点故障后, 启动获取模块 33。
获取模块 33 , 和故障检测模块 32连接, 用于接管所述第一 VTL节点的入 口地址, 以及获取所述虚拟设备的配置信息、 设备地址、 入口地址以及备份服 务器出口地址。
要实现数据备份, 需要建立备份服务器出口地址、 VTL设备入口地址以及 虚拟设备之间的映射, 备份数据通过备份服务器 11 的出口地址发往 VTL节点 131 , 再通过 VTL节点 131的入口地址发往 VTL节点 131建立的虚拟设备, 并 由 VTL节点 131的虚拟设备将备份数据发往存储设备 14,最终实现数据的备份。 获取这些数据的方法可以有多种, 例如可以在每个虚拟设备创建完成后将这些 数据记录在一个统一平台中, VTL节点 132通过这个平台获取这些信息; 或者 在每个 VTL节点上保存一份其余 VTL节点的各个虚拟设备配置信息、设备地址、 入口地址以及备份服务器出口地址,并保持这些数据的更新。第一 VTL节点 131 故障后, 备份服务器 11 以及存储设备 14也会收到故障提示, 并分别在收到故 障提示后做好由第二 VTL节点上的虚拟设备替代第一 VTL节点上虚拟设备的准 备。
重建模块 34, 和获取模块 33连接, 用于第二 VTL节点使用所述配置信息 生成重建虚拟设备。
如前所述, 配置信息是用来描述虚拟设备的信息, 例如一个虚拟设备的型 号、 虚拟设备名称以及虚拟设备的序列号, 其中虚拟设备的型号是指虚拟设备 所虚拟的物理设备的型号。 获取了配置信息以后就可以重新创建出故障节点上 的虚拟设备。 需要特别说明的是, 这个配置信息不包括设备地址、 入口地址以 及备份服务器出口地址。
使能模块 35 , 和重建模块 34连接, 用于将所述设备地址分配给重建虚拟设 备, 以及建立所述重建虚拟设备与 VTL设备入口地址、 备份服务器出口地址之 间的映射关系。
这个设备地址是第一 VTL节点 131上虚拟设备使用的地址, 由于各个 VTL 节点上的地址不重复,因此第二 VTL节点 132已有虚拟设备没用使用这个地址, 第二 VTL节点 132可以将这个地址分配给重建虚拟设备使用。 设备入口地址、 备份服务器出口地址也是与重建前虚拟设备映射的。 因此建立起重建虚拟设备 与 VTL设备入口地址、 备份服务器出口地址之间的映射关系后, 重建虚拟设备 的配置信息、 设备地址、 VTL设备入口地址、 备份服务器出口地址均与重建前 一样, 只是存在的位置有第一 VTL节点 131变成了第二 VTL节点 132。
使能模块 35, 还可以用于述虚拟设备通过所述重建虚拟设备的入口地址, 接收所述备份服务器使用所述备份服务器出口地址发送的备份信息; 以及使所 述重建虚拟设备将收到的备份数据发往所述存储设备进行备份。
如果故障发生时, 第一 VTL节点 131上的虚拟设备正在执行备份任务, 这 个备份任务在执行时需要指定设备地址、 VTL设备入口地址、 备份服务器出口 地址。 由于重建后的虚拟设备的设备地址、 VTL设备入口地址、 备份服务器出 口地址均与重建前一样, 因此重建后的虚拟设备可以继续执行这个备份业务。 需要说明的是, 在步骤 S24 完成之前, 这个虚拟设备是无法使用的, 这个时候 备份服务器 11会收到备份任务不成功的提示, 这时备份服务器 11 可以再次尝 试执行备份任务, 直到步骤 S24执行完成, 即可以成功执行备份任务, 不再收 到备份任务不成功的提示。
在实施例三中, 即如果集群中的某节点出现故障, 其上运行的相关业务可 以被集群中的其他节点接管。 对于正在运行的备份业务, 备份服务器 11仍然沿 用故障前虚拟设备的各项参数发送备份数据, 这些参数包括配置信息、 设备地 址、 入口地址以及备份服务器出口地址; 而重建虚拟设备的配置信息、 设备地 址、 入口地址以及备份服务器出口地址均与重建前虚拟设备相同, 因此重建前 虚拟设备正在处理的备份业务可以顺利切换到重建后虚拟设备, 不会发生数据 丟失接管完成后, 整个集群仍然处于可正常工作的状态。 这样就可以确保整个 集群不会因单个节点故障而无法正常工作, 有效保证了集群产品的可用性。 并 且, 故障接管过程中, 故障节点上正在运行的备份 /恢复任务不会失败, 故障接 管的过程更加平滑。 故障接管完成后, 不需要在 Backup Server中重新扫描映射 的虚拟设备, 然后重启失败的数据备份 /恢复任务以再次执行。 可以实现无数据 丟失的业务保护。
由于实施例三是用于执行实施例一的装置。 显然, 在实施例一、 二、 三的 基础上, 同样可以存在故障恢复装置或者故障恢复模块, 来执行实施例二中的 方法, 由于实施例二中已经进行了描述, 此处不再详述。
实施例四
参见附图 4, 本实施例是一种第一 VTL节点 4。 虚拟磁磁带库 VTL集群包 括第一 VTL节点以及第二 VTL节点, 备份服务器与所述第一 VTL节点以及所 述第二 VTL节点建立通信连接, 存储设备与所述第一 VTL节点以及所述第二 VTL节点建立通信连接, 第一 VTL节点创建有至少一个虚拟设备, 第一 VTL 节点上的虚拟设备的设备地址在 VTL 集群中唯一, 所述第一 VTL 节点包括 CPU44, 与 CPU通信的第一通信接口 41 , 与 CPU通信的第二通信接口 42, 以 及与 CPU通信的内存 43 , 所述第一通信接口 41 , 用于和所述备份服务器通信; 所述第二通信接口 42, 用于和所述存储设备通信; 所述内存 43 , 用于存储计算 机指令; 以及所述处理器 44, 和所述内存耦合, 用于通过运行所述计算机指令 来执行以下实施例一以及实施例二所述的操作。
通过以上的实施方式的描述, 所属领域的技术人员可以清楚地了解到本发 明可借助软件加必需的通用硬件的方式来实现, 当然也可以通过硬件, 但很多 情况下前者是更佳的实施方式。 基于这样的理解, 本发明的技术方案本质上或 者说对现有技术做出贡献的部分可以以软件产品的形式体现出来, 该计算机软 件产品存储在可读取的存储介质中, 如计算机的软盘, 硬盘或光盘等, 包括若 干指令用以使得一台计算机设备(可以是个人计算机, 服务器, 或者网络设备 等)执行本发明各个实施例所述的方法。
以上所述, 仅为本发明的具体实施方式, 但本发明的保护范围并不局限于此, 任何熟悉本技术领域的技术人员在本发明揭露的技术范围内, 可轻易想到的变 化或替换, 都应涵盖在本发明的保护范围之内。 因此, 本发明的保护范围应以 所述权利要求的保护范围为准。

Claims

权 利 要求 书
1、 一种虚拟设备重建方法, 其特征在于, 虚拟磁磁带库 VTL 集群包括第 一 VTL节点以及第二 VTL节点, 备份服务器与所述第一 VTL节点以及所述第 二 VTL节点建立通信连接, 存储设备与所述第一 VTL节点以及所述第二 VTL 节点建立通信连接,第一 VTL节点创建有至少一个虚拟设备,第一 VTL节点上 的虚拟设备的设备地址在 VTL集群中唯一, 该方法包括:
所述第二 VTL节点接管所述第一 VTL节点的入口地址, 所述第二 VTL节 点获取所述虚拟设备的配置信息、 设备地址、 入口地址以及备份服务器出口地 址;
第二 VTL节点使用所述配置信息生成重建虚拟设备;
将所述设备地址分配给重建虚拟设备, 建立所述重建虚拟设备与 VTL设备 入口地址、 备份服务器出口地址之间的映射关系。
2、如权利要求 1所述的方法, 其特征在于, 建立映射关系之后进一步包括: 所述重建虚拟设备通过所述重建虚拟设备的入口地址, 接收所述备份服务 器使用所述备份服务器出口地址发送的备份信息;
所述重建虚拟设备将备份数据发往所述存储设备进行备份。
3、 如权利要求 1所述的方法, 其特征在于, 所述第二 VTL节点接管所述 第一 VTL节点的入口地址之前, 进一步包括:
所述第一 VTL节点查找未被所述 VTL集群中任一 VTL设备使用的设备地 址;
所述第一 VTL节点使用查找到的设备地址信息创建所述虚拟设备。
4、 如权利要求 1所述的方法, 其特征在于, 所述第二 VTL节点接管所述 第一 VTL节点的入口地址之前, 进一步包括:
所述第二 VTL节点检测到第一 VTL节点发生故障。
5、 一种虚拟设备重建装置, 位于第二 VTL 节点中, 其特征在于, 虚拟磁 磁带库 VTL集群包括第一 VTL节点以及所述第二 VTL节点, 备份服务器与所 述第一 VTL节点以及所述第二 VTL节点建立通信连接, 存储设备与所述第一 VTL节点以及所述第二 VTL节点建立通信连接, 第一 VTL节点创建有至少一 个虚拟设备,第一 VTL节点上的虚拟设备的设备地址在 VTL集群中唯一,所述 虚拟设备重建装置包括:
获取模块, 用于接管所述第一 VTL节点的入口地址, 以及获取所述虚拟设 备的配置信息、 设备地址、 入口地址以及备份服务器出口地址;
重建模块, 用于第二 VTL节点使用所述配置信息生成重建虚拟设备; 使能模块, 用于将所述设备地址分配给重建虚拟设备, 以及建立所述重建 虚拟设备与 VTL设备入口地址、 备份服务器出口地址之间的映射关系。
6、 如权利要求 5所述的装置, 其特征在于, 所述使能模块还用于: 使所述虚拟设备通过所述重建虚拟设备的入口地址, 接收所述备份服务器 使用所述备份服务器出口地址发送的备份信息; 以及
使所述重建虚拟设备将收到的备份数据发往所述存储设备进行备份。
7、 如权利要求 5所述的装置, 其特征在于, 所述装置进一步包括: 创建模块, 用于查找未被所述 VTL集群中任一 VTL设备使用的设备地址, 以用于所述第二 VTL设备创建所述虚拟设备。
8、 如权利要求 5所述的方法, 其特征在于, 所述装置进一步包括: 故障检测模块, 用于检测第一 VTL节点是否发生故障。
9、一种第二 VTL节点,其特征在于,虚拟磁磁带库 VTL集群包括第一 VTL 节点以及第二 VTL节点, 备份服务器与所述第一 VTL节点以及所述第二 VTL 节点建立通信连接,存储设备与所述第一 VTL节点以及所述第二 VTL节点建立 通信连接,第一 VTL节点创建有至少一个虚拟设备,第一 VTL节点上的虚拟设 备的设备地址在 VTL集群中唯一, 所述第二 VTL节点包括 CPU, 与 CPU通信 的第一通信接口, 与 CPU通信的第二通信接口, 以及与 CPU通信的内存: 所述第一通信接口, 用于和所述备份服务器通信;
所述第二通信接口, 用于和所述存储设备通信;
所述内存, 用于存储计算机指令; 以及
所述处理器, 和所述内存耦合, 用于通过运行所述计算机指令来执行以下 操作:
接管所述第一 VTL节点的入口地址, 获取所述虚拟设备的配置信息、 设备 地址、 入口地址以及备份服务器出口地址;
使用所述配置信息生成重建虚拟设备;
将所述设备地址分配给重建虚拟设备, 建立所述重建虚拟设备与 VTL设备 入口地址、 备份服务器出口地址之间的映射关系。
10如权利要求 9述的方法, 其特征在于, 所述处理器进一步用于执行: 使所述重建虚拟设备通过所述重建虚拟设备的入口地址, 接收所述备份服 务器使用所述备份服务器出口地址发送的备份信息;
使所述重建虚拟设备将备份数据发往所述存储设备进行备份。
11、 如权利要求 9述的方法, 其特征在于, 所述处理器进一步用于执行: 在所述接管步骤之前, 检测第一 VTL节点是否发生故障。
12、 如权利要求 9述的方法, 其特征在于, 所述处理器进一步用于执行: 在所述接管步骤之前, 检测第一 VTL节点的故障是否恢复。
PCT/CN2012/088096 2012-12-31 2012-12-31 一种虚拟设备重建方法与装置 WO2014101211A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/CN2012/088096 WO2014101211A1 (zh) 2012-12-31 2012-12-31 一种虚拟设备重建方法与装置
CN201280005835.5A CN103814352B (zh) 2012-12-31 2012-12-31 一种虚拟设备重建方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/088096 WO2014101211A1 (zh) 2012-12-31 2012-12-31 一种虚拟设备重建方法与装置

Publications (1)

Publication Number Publication Date
WO2014101211A1 true WO2014101211A1 (zh) 2014-07-03

Family

ID=50709723

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/088096 WO2014101211A1 (zh) 2012-12-31 2012-12-31 一种虚拟设备重建方法与装置

Country Status (2)

Country Link
CN (1) CN103814352B (zh)
WO (1) WO2014101211A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625391A (zh) * 2020-05-29 2020-09-04 北京思特奇信息技术股份有限公司 一种任务处理方法、系统和电子设备

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106921508B (zh) * 2015-12-25 2021-02-19 中兴通讯股份有限公司 虚拟化网元故障自愈方法及装置
CN106557280B (zh) * 2016-10-31 2019-10-15 北京华为数字技术有限公司 数据存储方法、存储阵列及主机服务器
CN108234410B (zh) * 2016-12-15 2019-02-22 视联动力信息技术股份有限公司 一种虚拟终端分配方法和装置
CN111193600B (zh) * 2018-11-14 2023-04-07 杭州海康威视系统技术有限公司 一种接管服务的方法、装置及系统
CN110266833B (zh) * 2019-07-16 2022-03-29 广州虎牙科技有限公司 Ip地址管理方法及边缘集群

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1671134A (zh) * 2004-03-19 2005-09-21 株式会社日立制作所 存储系统
US20070067555A1 (en) * 2005-09-19 2007-03-22 Spectra Logic Corporation Virtual interchangeable storage device
CN101799780A (zh) * 2010-03-10 2010-08-11 成都市华为赛门铁克科技有限公司 配置信息文件处理方法、系统及服务器、虚拟磁带库设备
CN102521072A (zh) * 2011-11-25 2012-06-27 成都市华为赛门铁克科技有限公司 虚拟磁带库设备及数据恢复方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201789513U (zh) * 2010-09-14 2011-04-06 北京同有飞骥科技股份有限公司 一种可快速恢复的高可用vtl系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1671134A (zh) * 2004-03-19 2005-09-21 株式会社日立制作所 存储系统
US20070067555A1 (en) * 2005-09-19 2007-03-22 Spectra Logic Corporation Virtual interchangeable storage device
CN101799780A (zh) * 2010-03-10 2010-08-11 成都市华为赛门铁克科技有限公司 配置信息文件处理方法、系统及服务器、虚拟磁带库设备
CN102521072A (zh) * 2011-11-25 2012-06-27 成都市华为赛门铁克科技有限公司 虚拟磁带库设备及数据恢复方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625391A (zh) * 2020-05-29 2020-09-04 北京思特奇信息技术股份有限公司 一种任务处理方法、系统和电子设备
CN111625391B (zh) * 2020-05-29 2023-06-13 北京思特奇信息技术股份有限公司 一种任务处理方法、系统和电子设备

Also Published As

Publication number Publication date
CN103814352B (zh) 2016-11-02
CN103814352A (zh) 2014-05-21

Similar Documents

Publication Publication Date Title
US11226777B2 (en) Cluster configuration information replication
US11983083B2 (en) Trust relationship migration for data mirroring
US10963289B2 (en) Storage virtual machine relocation
US11016864B2 (en) Cluster-wide service agents
US9448899B2 (en) Method, apparatus and system for switching over virtual application two-node cluster in cloud environment
US8996477B2 (en) Multiple node/virtual input/output (I/O) server (VIOS) failure recovery in clustered partition mobility
US9753761B1 (en) Distributed dynamic federation between multi-connected virtual platform clusters
US7415506B2 (en) Storage virtualization and storage management to provide higher level storage services
US9098466B2 (en) Switching between mirrored volumes
US20140173330A1 (en) Split Brain Detection and Recovery System
US10241712B1 (en) Method and apparatus for automated orchestration of long distance protection of virtualized storage
WO2014101211A1 (zh) 一种虚拟设备重建方法与装置
US20160085606A1 (en) Cluster-wide outage detection
WO2012109876A1 (zh) 虚拟化数据备份方法、虚拟化数据重组方法、装置及系统
TW201019100A (en) Active-active failover for a direct-attached storage system
JP2019536167A (ja) 分散ストレージ・エリア・ネットワーク環境における論理ユニット番号へのアクセスを動的に管理する方法とその装置
Ren et al. InfoStor: Highly Available Distributed Block Store

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12890693

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12890693

Country of ref document: EP

Kind code of ref document: A1