CN113625944B - 一种基于多路径和远程复制技术的容灾方法、系统 - Google Patents
一种基于多路径和远程复制技术的容灾方法、系统 Download PDFInfo
- Publication number
- CN113625944B CN113625944B CN202110712438.2A CN202110712438A CN113625944B CN 113625944 B CN113625944 B CN 113625944B CN 202110712438 A CN202110712438 A CN 202110712438A CN 113625944 B CN113625944 B CN 113625944B
- Authority
- CN
- China
- Prior art keywords
- storage device
- path group
- volume
- paths
- group storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000011084 recovery Methods 0.000 title claims abstract description 34
- 238000005516 engineering process Methods 0.000 title claims abstract description 27
- 230000010076 replication Effects 0.000 title claims abstract description 25
- 238000012544 monitoring process Methods 0.000 claims abstract description 47
- 230000004931 aggregating effect Effects 0.000 claims abstract description 13
- 238000004891 communication Methods 0.000 claims description 5
- 230000001360 synchronised effect Effects 0.000 description 8
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0617—Improving the reliability of storage systems in relation to availability
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2064—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring while ensuring consistency
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0653—Monitoring storage devices or systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0662—Virtualisation aspects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于多路径和远程复制技术的容灾方法、系统,所述方法包括如下步骤:将各存储设备的卷配置同步远程复制,并将具备远程复制关系的卷的全球标识ID标识为同一个磁盘设备;分别将各存储设备的卷挂载到宿主机;宿主机进行磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;监控主路径组的状态,当主路径组发生故障时,自动进行切换路径至备路径组。能大大提高存储的高可用性,降低故障切换和回切的复杂度,且大幅降低业务的服务不可用时间。
Description
技术领域
本发明涉及存储容灾技术领域,具体涉及一种基于多路径和远程复制技术的容灾方法、系统。
背景技术
当前的存储同步远程复制技术,仅能够保证存储在发生故障时的数据安全性,不能够保证使用存储的宿主机的高可用性,仅能通过对发生故障的卷进行卸载,并再挂载对端存储中对应的存储卷,再根据故障卷的盘符等信息映射新卷到宿主机中,整体操作复杂繁琐,需要大量的人为干预和操作,RTO时间取决于人为发现故障以及故障恢复操作的时长。
存储A跟存储B之间通过远程复制技术实现数据的同步,可以实现存储A发生故障或灾难时,通过故障切换至存储B来保证业务的快速恢复,以降低业务的不可用时间,但是此种方式仍会有较长一段时间,业务因为无法连接到存储设备导致不能提供复制。
发明内容
针对在存储发生故障时和存储故障恢复后切换时的业务中断问题和切换操作过于复杂和较长的停机时间问题,本发明提供一种基于多路径和远程复制技术的容灾方法、系统。
本发明的技术方案是:
一方面,本发明技术方案提供一种基于多路径和远程复制技术的容灾方法,包括如下步骤:
将各存储设备的卷配置同步远程复制,并将具备远程复制关系的卷的全球标识ID标识为同一个磁盘设备;
分别将各存储设备的卷挂载到宿主机;
宿主机进行磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;
将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;
监控主路径组的状态,当主路径组发生故障时,自动进行切换路径至备路径组。
在原有的存储远程复制技术和多路径技术上进行改进,改变原有多路径仅能对单个卷的多条路径的方式,通过对配置了远程复制的两个存储上的卷同时挂载到宿主机并进行聚合成一个虚拟卷的方式,大幅降低了原有同步远程复制故障切换和故障恢复的复杂度。
进一步的,所述的将各存储设备的卷配置同步远程复制,并将具备远程复制关系的卷的全球标识ID标识为同一个磁盘设备的步骤之前包括:
分别在不同存储设备创建相同规格的磁盘。
进一步的,所述的宿主机进行磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径的步骤包括:
设置多路径软件传入的不同的全球标识ID的磁盘为同一个磁盘设备;
多路径软件在宿主机进行磁盘扫描时,获取分别为两个不同全球标识ID的卷的多条路径。
进一步的,所述的监控主路径组的状态,当主路径组发生故障时,自动进行切换路径至备路径组的步骤包括:
监控主路径组存储设备的状态;
当主路径组存储设备发生故障时,备用路径组存储设备启用卷的读写能力,同时备用路径组存储设备将主路径组存储设备的故障上报,将路径切换至备用路径组。
解决了故障切换和故障恢复时的业务中断问题,可使故障切换和故障恢复做到无中断,无感知。降低客户运维复杂度,提高用户体验。
进一步的,所述的当主路径组存储设备发生故障时,备用路径组存储设备启用卷的读写能力,同时备用路径组存储设备将主路径组存储设备的故障上报,将路径切换至备用路径组的步骤之后还包括:
监控主路径组存储设备故障修复后,开启备用路径组存储设备的卷到主路径组存储设备的卷的反向远程复制;
监控数据反向同步是否完成;若否,继续执行步骤:监控数据反向同步是否完成;
若是,将备用路径组存储设备的卷和主路径组存储设备的卷的远程复制方向进行切换;
将路径回切至主路径组。此时故障完成回切,全程无需停机,且上层业务无感知,无中断。
进一步的,监控数据反向同步完成的步骤还包括:
检测备用路径组存储设备的卷的数据和主路径组存储设备的卷的数据是否完全一致;
当数据完全一致时,执行步骤:将备用路径组存储设备的卷和主路径组存储设备的卷的远程复制方向进行切换。
虚拟机在宿主机中的盘符ID等信息均不发生改变,所承载的业务也不需要中断或出现不可用的情况,所有的切换均可在业务应用无感知的情况下自动切换。
进一步的,监控数据反向同步完成的步骤还包括:
当数据不完全一致时,检测备用路径组存储设备是否故障;
若是,执行步骤:将路径回切至主路径组;
若否,将备用路径组存储设备的卷的数据同步到主路径组存储设备的卷,执行步骤:检测备用路径组存储设备的卷的数据和主路径组存储设备的卷的数据是否完全一致。
另一方面,本发明技术方案还提供一种基于多路径和远程复制技术的容灾系统,包括存储设备A、存储设备B、宿主机;存储设备A中存在卷A,存储设备B中存在卷B;存储设备A与存储设备B远程通信;
该系统还包括挂载模块、配置模块、多路径软件模块、监控模块、切换模块;
挂载模块,用于将卷A和卷B同时挂载到宿主机中;
配置模块,用于将各存储设备的卷配置同步远程复制;
多路径软件模块设置在宿主机,用于进行宿主机磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;
监控模块,用于监控主路径组的状态;
切换模块,用于当主路径组发生故障时,自动进行切换路径至备路径组。
进一步的,该系统还包括磁盘创建模块;
磁盘创建模块,用于分别在存储设备A和存储设备B中创建相同规格的磁盘。
进一步的,配置模块,还用于设置多路径软件模块传入的不同的全球标识ID的磁盘为同一个磁盘设备;并将设置结果通知多路径软件模块。
当主路径组存储设备发生故障时,备用路径组存储设备启用卷的读写能力,同时备用路径组存储设备将主路径组存储设备的故障上报,切换模块将路径切换至备用路径组。
监控主路径组存储设备故障修复后,开启备用路径组存储设备的卷到主路径组存储设备的卷的反向远程复制;监控数据反向同步完成后,检测备用路径组存储设备的卷的数据和主路径组存储设备的卷的数据是否完全一致,当数据完全一致时,将备用路径组存储设备的卷和主路径组存储设备的卷的远程复制方向进行切换;然后将路径回切至主路径组。
能大大提高存储的高可用性,降低故障切换和回切的复杂度,且大幅降低业务的服务不可用时间。
从以上技术方案可以看出,本发明具有以下优点:大幅降低了原有同步远程复制故障切换和故障恢复的复杂度。解决了故障切换和故障恢复时的业务中断问题,可使故障切换和故障恢复做到无中断,无感知。降低客户运维复杂度,提高用户体验。可适用于多种云计算、虚拟化、裸金属等场景。不仅能大大提高存储的高可用性,降低故障切换和回切的复杂度,且大幅降低业务的服务不可用时间。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明另一个实施例的方法的示意性流程图。
图3为本发明实施例提供的系统的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
WWID:World Wide ID全球标识ID,磁盘的唯一标识,用于区分不同的磁盘,多路径中根据WWID来聚合同一磁盘的多条路径。
如图1所示,本发明实施例提供一种基于多路径和远程复制技术的容灾方法,包括如下步骤:
S11:将各存储设备的卷配置同步远程复制,并将具备远程复制关系的卷的全球标识ID标识为同一个磁盘设备;
S12:分别将各存储设备的卷挂载到宿主机;
S13:宿主机进行磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;
S14:将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;
S15:监控主路径组的状态,当主路径组发生故障时,自动进行切换路径至备路径组。
在原有的存储远程复制技术和多路径技术上进行改进,改变原有多路径仅能对单个卷的多条路径的方式,通过对配置了远程复制的两个存储上的卷同时挂载到宿主机并进行聚合成一个虚拟卷的方式,大幅降低了原有同步远程复制故障切换和故障恢复的复杂度。
本发明实施例提供一种基于多路径和远程复制技术的容灾方法,包括如下步骤:
S21:分别在不同存储设备创建相同规格的磁盘;
S22:将各存储设备的卷配置同步远程复制,并将具备远程复制关系的卷的全球标识ID标识为同一个磁盘设备;
S23:分别将各存储设备的卷挂载到宿主机;
S24:宿主机进行磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;具体的步骤包括:设置多路径软件传入的不同的全球标识ID的磁盘为同一个磁盘设备;多路径软件在宿主机进行磁盘扫描时,获取分别为两个不同全球标识ID的卷的多条路径;
S25:将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;
S26:监控主路径组的状态,当主路径组发生故障时,自动进行切换路径至备路径组。具体的,监控主路径组存储设备的状态;当主路径组存储设备发生故障时,备用路径组存储设备启用卷的读写能力,同时备用路径组存储设备将主路径组存储设备的故障上报,将路径切换至备用路径组。监控主路径组存储设备故障修复后,开启备用路径组存储设备的卷到主路径组存储设备的卷的反向远程复制;监控数据反向同步是否完成;若否,继续执行步骤:监控数据反向同步是否完成;若是,将备用路径组存储设备的卷和主路径组存储设备的卷的远程复制方向进行切换;将路径回切至主路径组。此时故障完成回切,全程无需停机,且上层业务无感知,无中断。
在原有的存储远程复制技术和多路径技术上进行改进,改变原有多路径仅能对单个卷的多条路径的方式,通过对配置了远程复制的两个存储上的卷同时挂载到宿主机并进行聚合成一个虚拟卷的方式,大幅降低了原有同步远程复制故障切换和故障恢复的复杂度。
如图2所示,本发明实施例提供一种基于多路径和远程复制技术的容灾方法,包括如下步骤:
S31:分别在不同存储设备创建相同规格的磁盘;
S32:将各存储设备的卷配置同步远程复制,并将具备远程复制关系的卷的全球标识ID标识为同一个磁盘设备;
S33:分别将各存储设备的卷挂载到宿主机;
S34:宿主机进行磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;
S35:将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;
S36:监控主路径组存储设备的状态;
S37:判断主路径组存储设备是否故障,若是,执行步骤S38,否则,返回执行步骤S36;
S38:备用路径组存储设备启用卷的读写能力,同时备用路径组存储设备将主路径组存储设备的故障上报,将路径切换至备用路径组;
S39:监控主路径组存储设备故障修复后,开启备用路径组存储设备的卷到主路径组存储设备的卷的反向远程复制;
S40:监控数据反向同步是否完成,若是,执行步骤S41,否则,继续执行步骤S40;
S41:检测备用路径组存储设备的卷的数据和主路径组存储设备的卷的数据是否完全一致;若是,执行步骤S44;否则,执行步骤S42;
S42:监控备用路径组存储设备是否故障,若是,执行步骤S45;否则,执行步骤S43;
S43:将备用路径组存储设备的卷的数据同步到主路径组存储设备的卷;
S44:将备用路径组存储设备的卷和主路径组存储设备的卷的远程复制方向进行切换;
S45:将路径切回至主路径组。
在原有的存储远程复制技术和多路径技术上进行改进,改变原有多路径仅能对单个卷的多条路径的方式,通过对配置了远程复制的两个存储上的卷同时挂载到宿主机并进行聚合成一个虚拟卷的方式,大幅降低了原有同步远程复制故障切换和故障恢复的复杂度。
下面具体将上述方法应用到容灾系统中,所述的容灾系统包括存储设备A、存储设备B、宿主机;存储设备A中存在卷A,存储设备B中存在卷B;存储设备A与存储设备B远程通信,传统的多路径软件,在存储开启多路径的情况下,当宿主机中进行扫描磁盘,会扫描出多个使用相同WWID磁盘设备,对应为不同路径的同一个存储卷,多路径会通过WWID作为唯一标识,将多个磁盘路径最终聚合成一个磁盘设备,当从存储设备读取或写入数据时,多路径会根据IO以及路径情况,将IO分配到不同的路径,以达到提高速度的效果,并且在存储路径发生故障时,做到故障路径自动切换,保证磁盘路径的高可用。本发明通过改变多路径软件仅能聚合单一WWID路径的方式,通过传入WWID的方式,将多个具备远程复制关系的卷的WWID标识为同一个磁盘设备,告知多路径软件传入的几个WWID磁盘设备为同一个磁盘,使多路径在扫描磁盘时,将这所有具备这些WWID的多个设备路径聚合成同一个磁盘设备,并根据WWID为标识,将路径分组,以主备的方式使用多路径,优先使用远程复制中主卷的路径,在这里存储设备A的路径为主路径,存储设备B的路径为备用路径。
当发生存储设备A发生故障时,通过监控方式,存储设备B与宿主机判断存储设备A发生故障,存储设备B启用卷B的读写能力,同时宿主机多路径软件也通过监控判断或存储设备B将故障上报,将路径切换至存储设备B上,虚拟机在宿主机中的盘符ID等信息均不发生改变,所承载的业务也不需要中断或出现不可用的情况,所有的切换均可在业务应用无感知的情况下自动切换。
在存储设备A的故障修复后,在各存储设备上开启卷B到卷A的反向同步,在完成同步后,卷A和卷B的数据完全一致后,仅需要对存储设备下发命令,对卷A和卷B的远程复制方向进行切换,并且由存储设备通知宿主机的多路径软件,对路径进行回切至卷A。此时故障完成回切,全程无需停机,且上层业务无感知,无中断。
如图3所示,本发明实施例还提供一种基于多路径和远程复制技术的容灾系统,包括存储设备A、存储设备B、宿主机;存储设备A中存在卷A,存储设备B中存在卷B;存储设备A与存储设备B远程通信;
该系统还包括挂载模块、配置模块、多路径软件模块、监控模块、切换模块;
挂载模块,用于将卷A和卷B同时挂载到宿主机中;
配置模块,用于将各存储设备的卷配置同步远程复制;还用于设置多路径软件模块传入的不同的全球标识ID的磁盘为同一个磁盘设备;并将设置结果通知多路径软件模块。
多路径软件模块设置在宿主机,用于进行宿主机磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;
监控模块,用于监控主路径组的状态;
切换模块,用于当主路径组发生故障时,自动进行切换路径至备路径组。当主路径组存储设备发生故障时,备用路径组存储设备启用卷的读写能力,同时备用路径组存储设备将主路径组存储设备的故障上报,切换模块将路径切换至备用路径组。
作为本发明的另一个实施例,还提供一种基于多路径和远程复制技术的容灾系统,包括存储设备A、存储设备B、宿主机;存储设备A中存在卷A,存储设备B中存在卷B;存储设备A与存储设备B远程通信;
该系统还包括挂载模块、配置模块、多路径软件模块、监控模块、切换模块、磁盘创建模块;
磁盘创建模块,用于分别在存储设备A和存储设备B中创建相同规格的磁盘;
挂载模块,用于将卷A和卷B同时挂载到宿主机中;
配置模块,用于将各存储设备的卷配置同步远程复制;还用于设置多路径软件模块传入的不同的全球标识ID的磁盘为同一个磁盘设备;并将设置结果通知多路径软件模块。
多路径软件模块设置在宿主机,用于进行宿主机磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;
监控模块,用于监控主路径组的状态;监控主路径组存储设备故障修复后,开启备用路径组存储设备的卷到主路径组存储设备的卷的反向远程复制;监控数据反向同步完成后,检测备用路径组存储设备的卷的数据和主路径组存储设备的卷的数据是否完全一致,当数据完全一致时,将备用路径组存储设备的卷和主路径组存储设备的卷的远程复制方向进行切换;然后将路径回切至主路径组。
切换模块,用于当主路径组发生故障时,自动进行切换路径至备路径组。当主路径组存储设备发生故障时,备用路径组存储设备启用卷的读写能力,同时备用路径组存储设备将主路径组存储设备的故障上报,切换模块将路径切换至备用路径组。
需要说明的是,磁盘创建模块、配置模块、设置在各存储设备中,挂载模块、切换模块可以设置在宿主机中,监控模块分别设置在个存储设备和宿主机中;
具体的,将存储设备A跟存储设备B之间通过远程复制技术实现数据的同步,可以实现存储设备A发生故障或灾难时,通过故障切换至存储设备B来保证业务的快速恢复,以降低业务的不可用时间。在正常情况下,存储设备A提供卷A供宿主机使用,宿主机将卷A挂载到系统中作为裸设备,再根据卷A创建文件系统(举例说明,如数据库也可以直接使用裸磁盘)等提供给业务使用。同时再存储设备B中存在同样规格的卷B,并通过远程复制的技术实现卷A数据到卷B的同步,宿主机对卷A的写入修改删除等操作,均会由存储设备A将IO动作同步至存储设备B中的卷B中,实现数据的多份保存。在发生存储设备A故障时,此时宿主机上所挂载的卷A IO将会中断,使用卷A的文件系统或者应用则同样会发生故障,服务将会受到影响停止服务。自动进行切换路径至备路径组,也就是,从存储设备A切换至存储设备B;在存储设备A的故障修复后,原有的方式是需要进行存储B中卷B到存储A中卷A的反向同步,将故障期间的数据同步至卷A中,保证卷A跟卷B的数据一致性,接着需要将卷B从宿主机中卸载,再将卷A挂载到宿主机上,并手动映射给宿主机的文件系统或者应用中,再开启卷A到卷B的远程复制,这样才算恢复到正常。本申请中,由于远程复制的技术一般不允许两个卷同时进行读写,所有多路径策略采用主备的方式,默认为卷A的路径均可进行读写,卷B的路径则置为备用路径。当宿主机中进行扫描磁盘,会扫描出多个使用相同WWID磁盘设备,对应为不同路径的同一个存储卷,多路径会通过WWID作为唯一标识,将多个磁盘路径最终聚合成一个磁盘设备,当从存储设备读取或写入数据时,多路径会根据IO以及路径情况,将IO分配到不同的路径,以达到提高速度的效果,并且在存储路径发生故障时,做到故障路径自动切换,保证磁盘路径的高可用。本发明通过改变多路径软件仅能聚合单一WWID路径的方式,通过传入WWID的方式,将多个具备远程复制关系的卷的WWID标识为同一个磁盘设备,告知多路径软件传入的几个WWID磁盘设备为同一个磁盘,使多路径在扫描磁盘时,将这所有具备这些WWID的多个设备路径聚合成同一个磁盘设备,并根据WWID为标识,将路径分组,以主备的方式使用多路径,优先使用远程复制中主卷的路径,在这里存储设备A的路径为主路径,存储设备B的路径为备用路径。
存储设备A故障修复后,开启存储设备B的卷到存储设备A的卷的反向远程复制;监控数据反向同步完成后,检测存储设备B的卷的数据和存储设备A的卷的数据是否完全一致,当数据完全一致时,将存储设备B的卷和存储设备A的卷的远程复制方向进行切换;然后将路径回切至主路径组。
改变原有多路径仅能多单个卷的多条路径进行聚合,将多个卷聚合成一个虚拟卷,通过将卷A和卷B同时挂载到宿主机中,并通过多路径软件将两个卷的多条路径聚合,合并为一个虚拟卷,宿主机再根据虚拟卷创建文件系统或直接用于业务。
能大大提高存储的高可用性,降低故障切换和回切的复杂度,且大幅降低业务的服务不可用时间。
需要说明的是,多路径:主要功能就是和存储设备一起配合实现如下功能:故障的切换和恢复、IO流量的负载均衡、磁盘的虚拟化。
远程复制:存储的复制远程复制能力,分为同步远程复制和异步远程复制,用于数据同步至两个存储设备,实现数据的同步。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (4)
1.一种基于多路径和远程复制技术的容灾方法,其特征在于,包括如下步骤:
分别在不同存储设备创建相同规格的磁盘;
将各存储设备的卷配置同步远程复制,并将具备远程复制关系的卷的全球标识ID标识为同一个磁盘设备;
分别将各存储设备的卷挂载到宿主机;
宿主机进行磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;
将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;
监控主路径组的状态,当主路径组发生故障时,自动进行切换路径至备路径组;包括:监控主路径组存储设备的状态;
当主路径组存储设备发生故障时,备用路径组存储设备启用卷的读写能力,同时备用路径组存储设备将主路径组存储设备的故障上报,将路径切换至备用路径组;
监控主路径组存储设备故障修复后,开启备用路径组存储设备的卷到主路径组存储设备的卷的反向远程复制;
监控数据反向同步是否完成;若否,继续执行步骤:监控数据反向同步是否完成;
若是,将备用路径组存储设备的卷和主路径组存储设备的卷的远程复制方向进行切换;
将路径回切至主路径组;
所述的宿主机进行磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径的步骤包括:
设置多路径软件传入的不同的全球标识ID的磁盘为同一个磁盘设备;
多路径软件在宿主机进行磁盘扫描时,获取分别为两个不同全球标识ID的卷的多条路径。
2.根据权利要求1所述的基于多路径和远程复制技术的容灾方法,其特征在于,监控数据反向同步完成的步骤还包括:
检测备用路径组存储设备的卷的数据和主路径组存储设备的卷的数据是否完全一致;
当数据完全一致时,执行步骤:将备用路径组存储设备的卷和主路径组存储设备的卷的远程复制方向进行切换。
3.根据权利要求2所述的基于多路径和远程复制技术的容灾方法,其特征在于,监控数据反向同步完成的步骤还包括:
当数据不完全一致时,检测备用路径组存储设备是否故障;
若是,执行步骤:将路径回切至主路径组;
若否,将备用路径组存储设备的卷的数据同步到主路径组存储设备的卷,执行步骤:检测备用路径组存储设备的卷的数据和主路径组存储设备的卷的数据是否完全一致。
4.一种基于多路径和远程复制技术的容灾系统,其特征在于,包括存储设备A、存储设备B、宿主机;存储设备A中存在卷A,存储设备B中存在卷B;存储设备A与存储设备B远程通信;
该系统还包括磁盘创建模块、挂载模块、配置模块、多路径软件模块、监控模块和切换模块;
磁盘创建模块,用于分别在存储设备A和存储设备B中创建相同规格的磁盘;
挂载模块,用于将卷A和卷B同时挂载到宿主机中;
配置模块,用于将各存储设备的卷配置同步远程复制;还用于设置多路径软件模块传入的不同的全球标识ID的磁盘为同一个磁盘设备;并将设置结果通知多路径软件模块;
多路径软件模块设置在宿主机,用于进行宿主机磁盘扫描,获取分别为两个不同全球标识ID对应卷的多条路径;将获取的两个卷的多条路径聚合为一个虚拟卷,并根据两个全球标识ID将路径分为两组,并设置两组路径为主备模式;
监控模块,用于监控主路径组的状态;
切换模块,用于当主路径组发生故障时,自动进行切换路径至备路径组;具体用于,当主路径组存储设备发生故障时,备用路径组存储设备启用卷的读写能力,同时备用路径组存储设备将主路径组存储设备的故障上报,切换模块将路径切换至备用路径组;监控主路径组存储设备故障修复后,开启备用路径组存储设备的卷到主路径组存储设备的卷的反向远程复制;监控数据反向同步完成后,检测备用路径组存储设备的卷的数据和主路径组存储设备的卷的数据是否完全一致,当数据完全一致时,将备用路径组存储设备的卷和主路径组存储设备的卷的远程复制方向进行切换;然后将路径回切至主路径组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110712438.2A CN113625944B (zh) | 2021-06-25 | 2021-06-25 | 一种基于多路径和远程复制技术的容灾方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110712438.2A CN113625944B (zh) | 2021-06-25 | 2021-06-25 | 一种基于多路径和远程复制技术的容灾方法、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113625944A CN113625944A (zh) | 2021-11-09 |
CN113625944B true CN113625944B (zh) | 2024-02-02 |
Family
ID=78378440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110712438.2A Active CN113625944B (zh) | 2021-06-25 | 2021-06-25 | 一种基于多路径和远程复制技术的容灾方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113625944B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114625324B (zh) * | 2022-03-31 | 2024-07-02 | 苏州浪潮智能科技有限公司 | 一致性组中卷的服务质量控制方法、装置、设备及介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2859891Y (zh) * | 2005-11-28 | 2007-01-17 | 郴州市东塘电气设备有限公司 | 低压无功自动补偿装置 |
US8255538B1 (en) * | 2011-12-23 | 2012-08-28 | Cirrus Data Solutions, Inc. | Systems and methods for intercepting data relating to storage volume access |
CN103793271A (zh) * | 2012-10-29 | 2014-05-14 | 国际商业机器公司 | 用于在镜像卷之间进行切换的方法和系统 |
CN104838367A (zh) * | 2013-03-14 | 2015-08-12 | 株式会社日立制作所 | 灾难恢复虚拟化的方法和装置 |
CN105718209A (zh) * | 2014-12-05 | 2016-06-29 | 中兴通讯股份有限公司 | 一种多路径设备的命名方法、装置、主机及通信系统 |
CN106030552A (zh) * | 2014-04-21 | 2016-10-12 | 株式会社日立制作所 | 计算机系统 |
CN106383756A (zh) * | 2016-10-12 | 2017-02-08 | 郑州云海信息技术有限公司 | 一种实现存储容灾切换Linux系统业务不中断的方法 |
CN106527972A (zh) * | 2016-10-09 | 2017-03-22 | 郑州云海信息技术有限公司 | 一种基于k1的实现存储双活的多路径方法 |
CN107168656A (zh) * | 2017-06-09 | 2017-09-15 | 郑州云海信息技术有限公司 | 一种基于多路径磁盘驱动的卷复本集系统及其实现方法 |
US10606497B1 (en) * | 2018-10-24 | 2020-03-31 | International Business Machines Corporation | Systems and methods for managing replication path direction in storage networks |
CN111352899A (zh) * | 2018-12-24 | 2020-06-30 | 中兴通讯股份有限公司 | 路径聚合方法、访问方法及通信设备、存储介质 |
CN111443876A (zh) * | 2020-06-17 | 2020-07-24 | 南京信易达计算技术有限公司 | 一种融合型存储专用操作系统、方法和存储介质 |
CN112445652A (zh) * | 2019-08-27 | 2021-03-05 | 株式会社日立制作所 | 远程复制系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100394974B1 (ko) * | 2000-05-23 | 2003-08-19 | 엘지전자 주식회사 | 고밀도 광 기록매체에서의 멀티경로 데이터를 수용하는 방법 |
US7058731B2 (en) * | 2004-08-03 | 2006-06-06 | Hitachi, Ltd. | Failover and data migration using data replication |
JP6814764B2 (ja) * | 2018-04-06 | 2021-01-20 | 株式会社日立製作所 | 情報処理システム及びパス管理方法 |
-
2021
- 2021-06-25 CN CN202110712438.2A patent/CN113625944B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2859891Y (zh) * | 2005-11-28 | 2007-01-17 | 郴州市东塘电气设备有限公司 | 低压无功自动补偿装置 |
US8255538B1 (en) * | 2011-12-23 | 2012-08-28 | Cirrus Data Solutions, Inc. | Systems and methods for intercepting data relating to storage volume access |
CN103793271A (zh) * | 2012-10-29 | 2014-05-14 | 国际商业机器公司 | 用于在镜像卷之间进行切换的方法和系统 |
CN104838367A (zh) * | 2013-03-14 | 2015-08-12 | 株式会社日立制作所 | 灾难恢复虚拟化的方法和装置 |
CN106030552A (zh) * | 2014-04-21 | 2016-10-12 | 株式会社日立制作所 | 计算机系统 |
CN105718209A (zh) * | 2014-12-05 | 2016-06-29 | 中兴通讯股份有限公司 | 一种多路径设备的命名方法、装置、主机及通信系统 |
CN106527972A (zh) * | 2016-10-09 | 2017-03-22 | 郑州云海信息技术有限公司 | 一种基于k1的实现存储双活的多路径方法 |
CN106383756A (zh) * | 2016-10-12 | 2017-02-08 | 郑州云海信息技术有限公司 | 一种实现存储容灾切换Linux系统业务不中断的方法 |
CN107168656A (zh) * | 2017-06-09 | 2017-09-15 | 郑州云海信息技术有限公司 | 一种基于多路径磁盘驱动的卷复本集系统及其实现方法 |
US10606497B1 (en) * | 2018-10-24 | 2020-03-31 | International Business Machines Corporation | Systems and methods for managing replication path direction in storage networks |
CN111352899A (zh) * | 2018-12-24 | 2020-06-30 | 中兴通讯股份有限公司 | 路径聚合方法、访问方法及通信设备、存储介质 |
CN112445652A (zh) * | 2019-08-27 | 2021-03-05 | 株式会社日立制作所 | 远程复制系统 |
CN111443876A (zh) * | 2020-06-17 | 2020-07-24 | 南京信易达计算技术有限公司 | 一种融合型存储专用操作系统、方法和存储介质 |
Non-Patent Citations (2)
Title |
---|
北方联合电力ERP系统异地容灾保护方案;安剑;胡勇;李振华;;电力信息化(第07期);全文 * |
海量存储系统可用性静态测试评估方案;潘清;王霄军;庄泽南;张晓清;;网络安全技术与应用(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113625944A (zh) | 2021-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9769259B2 (en) | Network storage systems having clustered RAIDs for improved redundancy and load balancing | |
US8307242B2 (en) | Failure recovery method, failure recovery program and management server | |
US7428657B2 (en) | Method for rolling back from snapshot with log | |
US7260625B2 (en) | Data center system and method for controlling the same | |
CN110377456B (zh) | 一种虚拟化平台容灾的管理方法及装置 | |
US8793456B2 (en) | Automated migration to a new target volume via merged bitmaps to maintain consistency | |
WO2021136422A1 (zh) | 状态管理方法、主备应用服务器的切换方法及电子设备 | |
KR20110044858A (ko) | 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지 | |
CN103077242A (zh) | 一种实现数据库服务器双机热备的方法 | |
CN103336728A (zh) | 一种磁盘数据恢复方法 | |
CN102394914A (zh) | 集群脑裂处理方法和装置 | |
CN112380062A (zh) | 一种基于系统备份点多次快速恢复系统的方法及系统 | |
CN103186348B (zh) | 存储系统及其数据读写方法 | |
CN105740049B (zh) | 一种控制方法及装置 | |
CN113625944B (zh) | 一种基于多路径和远程复制技术的容灾方法、系统 | |
CN111158955A (zh) | 一种基于卷复制的高可用系统以及多服务器数据同步方法 | |
CN103544081B (zh) | 双元数据服务器的管理方法和装置 | |
CN110928728A (zh) | 一种基于快照的虚拟机复制、切换方法及系统 | |
CN101527656B (zh) | Ngn业务平台数据库应急切换系统及其实现方法 | |
CN107256184A (zh) | 一种基于存储池的数据灾难备份方法及装置 | |
CN104636082B (zh) | 磁盘阵列raid的控制方法及装置 | |
CN114356650A (zh) | 数据备份方法、装置、设备、系统及存储介质 | |
CN109376036A (zh) | 一种用于备份虚拟机的方法和装置 | |
CN102520880B (zh) | 一种系统raid管理模块设计方法 | |
CN112367186A (zh) | 一种基于0penStack裸机的故障保护方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |