CN109597710A - 一种分布式数据中心异地双活方法及应用服务器和网络 - Google Patents

一种分布式数据中心异地双活方法及应用服务器和网络 Download PDF

Info

Publication number
CN109597710A
CN109597710A CN201811379276.XA CN201811379276A CN109597710A CN 109597710 A CN109597710 A CN 109597710A CN 201811379276 A CN201811379276 A CN 201811379276A CN 109597710 A CN109597710 A CN 109597710A
Authority
CN
China
Prior art keywords
storage
access
server
path
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811379276.XA
Other languages
English (en)
Inventor
陈烨
陶宇
张纪林
陈军相
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU XINHE DATA TECHNOLOGY CO LTD
Original Assignee
HANGZHOU XINHE DATA TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU XINHE DATA TECHNOLOGY CO LTD filed Critical HANGZHOU XINHE DATA TECHNOLOGY CO LTD
Priority to CN201811379276.XA priority Critical patent/CN109597710A/zh
Publication of CN109597710A publication Critical patent/CN109597710A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实例提出一种分布式数据中心异地双活方法,应用于两台存储服务器,所述存储设备由至少一个存储服务器进行管理;方法包括:接收到对位于存储设备上的数据的访问请求,请求与存储服务器建立第一类访问路径;当建立第一类访问路径失败时,根据所述访问请求的内容,与存储设备建立第二类访问路径。在通过虚拟存储平台无法访问存储设备时下,根据访问请求直接访问存储设备,而不会改变存储设备中数据的内容和格式,实现了对数据进行访问的路径冗余。两台存储服务器其中之一发生故障时,自动将存储服务切换至冗余服务器,当故障修复时,通过自动反向同步实现两台服务器的存储数据同步,从而实现了对数据进行访问的数据冗余。

Description

一种分布式数据中心异地双活方法及应用服务器和网络
技术领域
本发明涉及数据容灾技术,具体是一种基于冗余系统备份的数据保护策略。
背景技术
存储设备以透明迁移方式接入虚拟存储平台,由虚拟存储平台中的存储服务器进行管理,对存储设备的访问请求首先通过虚拟存储平台的存储服务器,再由虚拟存储平台将访问请求转发到存储设备。
现有技术存在如下问题:以透明迁移的方式接管存储设备,访问请求到达虚拟存储平台的存储服务器之后,若出现故障,则无法实现对存储设备的访问。
发明内容
本发明要解决的技术问题是提供一种分布式数据中心异地双活方法,解决现有技术中存储服务器出现故障后,无法访问位于存储设备上的数据的缺陷。
为解决上述技术问题,本发明的实施例提供:
应用于一应用服务器,所述存储设备由至少一个存储服务器进行管理,存储服务器至少为二台,实时保持两份相同的在线数据;
方法包括:
接收到对位于存储设备上的数据的访问请求,请求与存储服务器建立第一类访问路径;
当建立第一类访问路径失败时,根据所述访问请求的内容,与存储设备建立第二类访问路径。
当两台存储服务器中其中一台发生故障时,存储服务会自动切换至另一台存储服务器。
请求与存储服务器建立第一类访问路径包括:
当逃离模式是双机逃离,且请求与普通存储服务器建立第一类访问路径失败时,请求与冗余存储服务器建立第一类访问路径。
与存储设备建立第二类访问路径之后还包括:
在第二类访问路径存在期间,禁止自行与存储服务器建立第一类访问路径。当检测到应用服务器当前时刻没有访问请求,以及检测到不存在存储服务器故障和线路故障时,在普通存储设备与冗余存储设备之间同步数据;将第二类访问路径切换回第一类访问路径。
应用服务器下发的IO指令将在两存储服务器中同时执行,在双执行完成后才可返回写入完成。存储服务器之间将配置心跳链路,当一方无心跳数据产生时,将存储服务切换至另一方。加入第三方仲裁节点“QNode”,当发生极端情况导致存储服务器之间无法通信时,QNode将作为中间节点判定可用存储服务器。
一种访问位于存储设备上的数据的应用服务器,包括:
访问处理单元,用于接收到对位于存储设备上的数据的访问请求,
第一路径单元,用于请求与存储服务器建立第一类访问路径;所述存储设备由至少一个存储服务器进行管理;
第二路径单元,用于当建立第一类访问路径失败时,根据所述访问请求的内容,与存储设备建立第二类访问路径。
第一路径单元包括:
冗余路径模块,用于当逃离模式是双机逃离,且请求与普通存储服务器建立第一类访问路径失败时,则请求与冗余存储服务器建立第一类访问路径。
切换单元,用于在普通存储设备与冗余存储设备之间同步数据完成之后,将第二类访问路径切换回第一类访问路径。
一种存储数据的网络,包括:应用服务器、存储服务器和存储设备;
存储服务器,用于管理存储设备;
存储设备,用于存放数据;
应用服务器包括:访问处理单元、第一路径单元和第二路径单元,其中,
访问处理单元,用于接收对位于存储设备上的数据的访问请求,
第一路径单元,用于请求与存储服务器建立第一类访问路径;
第二路径单元,用于当建立第一类访问路径失败时,根据所述访问请求的内容,与存储设备建立第二类访问路径。
存储服务器包括普通存储服务器和冗余存储服务器,存储设备包括普通存储设备和冗余存储设备;
普通存储服务器,用于管理普通存储设备;
冗余存储服务器,用于管理冗余存储设备;
普通存储服务器和冗余存储服务器中均包括:
同步单元,用于在第二类访问路径存在期间,当检测到应用服务器当前时刻没有访问请求,以及检测到不存在存储服务器故障和线路故障时,在普通存储设备与冗余存储设备之间同步数据。
应用服务器还包括:
切换单元,用于在普通存储设备与冗余存储设备之间同步数据完成之后,将第二类访问路径切换回第一类访问路径。
本发明的上述技术方案的有益效果如下:在通过虚拟存储平台可以访问存储设备时,若存储设备故障,则将存储服务直接切换至备用存储服务器,实现了对数据进行访问的数据冗余。在通过虚拟存储平台无法访问存储设备时,根据访问请求直接访问存储设备,而不会改变存储设备中数据的内容和格式,实现了对数据进行访问的路径冗余。
附图说明
图1表示一种访问位于存储设备上的数据的方法的流程示意图;
图2表示单机逃离的工作原理示意图;
图3表示双机逃离的工作原理示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明实施例提供分布式数据中心异地双活方法,应用于应用服务器,所述存储设备由至少一个存储服务器进行管理,存储服务器至少为二台,实时保持两份相同的在线数据;
如图1所示,方法包括:
步骤101,接收到对位于存储设备上的数据的访问请求,请求与存储服务器建立第一类访问路径;
步骤102,当建立第一类访问路径失败时,根据所述访问请求中的访问条件,与存储设备建立第二类访问路径。
应用所提供的技术,在通过虚拟存储平台无法访问存储设备时下,根据访问请求直接访问存储设备,而不会改变存储设备中数据的内容和格式,实现了对数据进行访问的路径冗余。
应用服务器,支持多路径输入输出(MPIO,Multi-Path Input/Output),MPIO支持实现多路径之间的切换。
MPIO中,存储设备提供的产品数据(VPD,vital product data)硬件信息和存储服务器提供的VPD硬件信息应当一致,
MPIO能够区分一个路径是来自存储服务器还是来自存储设备的,支持优先访问来自存储服务器的路径。
在一个优选实施例中,在第二类访问路径(path2)存在期间,禁止与存储服务器建立第一类访问路径(path1)。
MPIO保证在应用服务器直接访问存储设备的过程中,不会将路径再切换回存储服务器,应用服务器绕过存储服务器通过第二类访问路径直接访问存储设备会导致存储服务器丢失访问请求的部分信息,为保证存储服务器能够识别完整的访问请求,只允许通过人工干预将访问路径切换回存储服务器。
本发明实施例的多路径的切换过程中,将放弃通过应用服务器访问存储设备中的数据,从而直接访问存储设备中的数据称为逃离模式,逃离模式包括单机逃离和双机逃离。
如图2所示,单机逃离是:应用服务器优先使用存储服务器提供的第一类访问路径访问存储设备,在通过第一类访问路径无法访问存储服务器的情况下通过第二类访问路径直接访问存储设备。
在一个单机逃离的应用场景中,识别到出现存储服务器故障、线路故障等,导致通过第一类访问路径无法访问存储服务器中的数据,应当允许根据访问请求建立第二类访问路径,通过第二类访问路径访问存储设备,若通过第二类访问路径也无法访问存储设备,则会出现访问失败。
如图3所示,双机逃离是在单机逃离的基础上进行扩展,设置有两个存储服务器:一个是普通存储服务器,普通存储服务器与普通的存储设备连接,另一个是冗余存储服务器,冗余存储服务器与冗余存储设备连接,以镜像方式同步两个存储设备中存放的数据。
在一个优选实施例中,请求与存储服务器建立第一类访问路径包括:
当逃离模式是双机逃离,且请求与存储服务器建立第一类访问路径失败时,请求与冗余存储服务器建立第一类访问路径。
应用服务器接到访问请求后,尝试与两个存储服务器建立第一类访问路径,当与两个存储服务器都无法建立第一类访问路径时,根据访问请求中的访问条件与普通的存储设备建立第二类访问路径。
在一个优选实施例中,与存储服务器建立第二类访问路径之后还包括:
在第二类访问路径存在期间,当检测到应用服务器当前时刻没有访问请求,以及检测到不存在存储服务器故障和线路故障时,在普通存储设备与冗余存储设备之间同步数据;
将第二类访问路径切换回第一类访问路径。
切换到第二类访问路径后,应当只允许通过人工干预切换回第一类访问路径,人工干预包括同步普通存储设备(S1)和冗余存储设备(S1’)中的数据,使之互相镜像。
在一个双机逃离的应用场景中,包括:
应用服务器优先与普通存储服务器/冗余存储服务器建立第一类访问路径,由于存在与普通存储服务器功能一致的冗余存储服务器,普通存储服务器和冗余存储服务器中出现的任何单一故障都不影响应用服务器通过第一类访问路径获取数据。
由于要在同步普通存储设备和冗余存储设备之间进行数据镜像,是否允许直接访问存储设备需要根据数据的状态进行判断。
普通存储设备S1和冗余存储设备S1’之间的数据也可以出现不一致的情况,如果新的数据存在于S1’而非S1,表明存储设备上的数据不可访问,此时存储服务器会通知MPIO不允许通过第二类访问路径直接访问存储设备,此时如果通过第一类访问路径也无法访问,那么应用服务器无法完成本次的访问请求。
如果两个存储设备S1和S1’之间已经同步了数据,应当通知MPIO可以通过第二类访问路径可以访问。
若已经将访问请求切换到第二类访问路径path3上了,MPIO应当保证在访问期间,不再将该访问请求切换回第一类访问路径的path1和path2上。
本发明实施例提供一种访问位于存储设备上的数据的应用服务器,包括:
访问处理单元,用于接收到对位于存储设备上的数据的访问请求,
第一路径单元,用于请求与存储服务器建立第一类访问路径;所述存储设备由至少一个存储服务器进行管理;
第二路径单元,用于当建立第一类访问路径失败时,根据所述访问请求的内容,与存储设备建立第二类访问路径。
双机逃离模式中,存储服务器包括普通存储服务器和冗余存储服务器,存储设备包括普通存储设备和冗余存储设备。
在一个优选实施例中,第一路径单元包括:
冗余路径模块,用于当逃离模式是双机逃离,且请求与普通存储服务器建立第一类访问路径失败时,请求与冗余存储服务器建立第一类访问路径。
在一个优选实施例中,应用服务器还包括:
切换单元,用于在普通存储设备与冗余存储设备之间同步数据完成之后,将第二类访问路径切换回第一类访问路径。
本发明实施例提供一种存储数据的网络,如图2所示,包括:应用服务器、存储服务器和存储设备;
存储服务器,用于管理存储设备;
存储设备,用于存放数据;
应用服务器包括:访问处理单元、第一路径单元和第二路径单元,其中,
访问处理单元,用于接收对位于存储设备上的数据的访问请求,
第一路径单元,用于请求与存储服务器建立第一类访问路径;
第二路径单元,用于当建立第一类访问路径失败时,根据所述访问请求的内容,与存储设备建立第二类访问路径。
在一个优选实施例中,如图3所示,存储服务器包括普通存储服务器和冗余存储服务器,存储设备包括普通存储设备和冗余存储设备;
普通存储服务器,用于管理普通存储设备;
冗余存储服务器,用于管理冗余存储设备;
普通存储服务器和冗余存储服务器中均包括:
同步单元,用于在第二类访问路径存在期间,当检测到应用服务器当前时刻没有访问请求,以及检测到不存在存储服务器故障和线路故障时,在普通存储设备与冗余存储设备之间同步数据。
在一个优选实施例中,应用服务器还包括:
切换单元,用于在普通存储设备与冗余存储设备之间同步数据完成之后,将第二类访问路径切换回第一类访问路径。
采用本方案之后的优势是:在通过存储服务器(虚拟存储平台)无法访问存储设备时,根据访问请求直接访问存储设备,并且这种直接访问不会改变存储设备中数据的内容和格式,实现了对数据进行访问的路径冗余;在存储服务器宕机时,可自动切换至冗余存储服务器,实现了对数据进行访问的数据冗余。

Claims (10)

1.一种分布式数据中心异地双活方法,其特征在于,应用于一应用服务器,所述存储设备由至少一个存储服务器进行管理,存储服务器至少为二台,实时保持两份相同的在线数据;
该方法包括:
接收到对位于存储设备上的数据的访问请求,请求与存储服务器建立第一类访问路径;
当建立第一类访问路径失败时,根据所述访问请求的内容,与存储设备建立第二类访问路径;
当两台存储服务器中其中一台发生故障时,存储服务会自动切换至另一台存储服务器;
请求与存储服务器建立第一类访问路径包括:
当逃离模式是双机逃离,且请求与普通存储服务器建立第一类访问路径失败时,请求与冗余存储服务器建立第一类访问路径;
与存储设备建立第二类访问路径之后还包括:
在第二类访问路径存在期间,禁止自行与存储服务器建立第一类访问路径。
2.根据权利要求1所述的方法,其特征在于,与存储设备建立第二类访问路径之后还包括:
在第二类访问路径存在期间,当检测到应用服务器当前时刻没有访问请求,以及检测到不存在存储服务器故障和线路故障时,在普通存储设备与冗余存储设备之间同步数据;
将第二类访问路径切换回第一类访问路径。
3.根据权利要求1所述的方法,其特征在于,应用服务器下发的IO指令将在两存储服务器中同时执行,在双执行完成后才可返回写入完成。
4.根据权利要求1所述的方法,其特征在于,存储服务器之间将配置心跳链路,当一方无心跳数据产生时,将存储服务切换至另一方。
5.根据权利要求1所述的方法,其特征在于,加入第三方仲裁节点“QNode”,当发生极端情况导致存储服务器之间无法通信时,QNode将作为中间节点判定可用存储服务器。
6.一种访问位于存储设备上的数据的应用服务器,其特征在于,包括:
访问处理单元,用于接收到对位于存储设备上的数据的访问请求,
第一路径单元,用于请求与存储服务器建立第一类访问路径;所述存储设备由至少一个存储服务器进行管理;
第二路径单元,用于当建立第一类访问路径失败时,根据所述访问请求的内容,与存储设备建立第二类访问路径。
7.根据权利要求6所述的应用服务器,其特征在于,第一路径单元包括:
冗余路径模块,用于当逃离模式是双机逃离,且请求与普通存储服务器建立第一类访问路径失败时,则请求与冗余存储服务器建立第一类访问路径。
8.根据权利要求6所述的应用服务器,其特征在于,还包括:
切换单元,用于在普通存储设备与冗余存储设备之间同步数据完成之后,将第二类访问路径切换回第一类访问路径。
9.一种存储数据的网络,其特征在于,包括:应用服务器、存储服务器和存储设备;
存储服务器,用于管理存储设备;
存储设备,用于存放数据;
应用服务器包括:访问处理单元、第一路径单元和第二路径单元,其中,
访问处理单元,用于接收对位于存储设备上的数据的访问请求,
第一路径单元,用于请求与存储服务器建立第一类访问路径;
第二路径单元,用于当建立第一类访问路径失败时,根据所述访问请求的内容,与存储设备建立第二类访问路径;
存储服务器包括普通存储服务器和冗余存储服务器,存储设备包括普通存储设备和冗余存储设备;
普通存储服务器,用于管理普通存储设备;
冗余存储服务器,用于管理冗余存储设备;
普通存储服务器和冗余存储服务器中均包括:
同步单元,用于在第二类访问路径存在期间,当检测到应用服务器当前时刻没有访问请求,以及检测到不存在存储服务器故障和线路故障时,在普通存储设备与冗余存储设备之间同步数据。
10.根据权利要求9所述的网络,其特征在于,应用服务器还包括:
切换单元,用于在普通存储设备与冗余存储设备之间同步数据完成之后,将第二类访问路径切换回第一类访问路径。
CN201811379276.XA 2018-11-19 2018-11-19 一种分布式数据中心异地双活方法及应用服务器和网络 Pending CN109597710A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811379276.XA CN109597710A (zh) 2018-11-19 2018-11-19 一种分布式数据中心异地双活方法及应用服务器和网络

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811379276.XA CN109597710A (zh) 2018-11-19 2018-11-19 一种分布式数据中心异地双活方法及应用服务器和网络

Publications (1)

Publication Number Publication Date
CN109597710A true CN109597710A (zh) 2019-04-09

Family

ID=65958698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811379276.XA Pending CN109597710A (zh) 2018-11-19 2018-11-19 一种分布式数据中心异地双活方法及应用服务器和网络

Country Status (1)

Country Link
CN (1) CN109597710A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110784354A (zh) * 2019-10-30 2020-02-11 北京大米未来科技有限公司 数据处理方法、装置、系统和可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102684929A (zh) * 2012-06-06 2012-09-19 广东威创视讯科技股份有限公司 一种双机热冗余备份方法和系统
CN104104648A (zh) * 2013-04-02 2014-10-15 杭州信核数据科技有限公司 一种访问存储设备中的数据的方法、应用服务器和网络
CN104239164A (zh) * 2013-06-19 2014-12-24 国家电网公司 基于云存储的灾备切换系统
CN105553701A (zh) * 2015-12-11 2016-05-04 国网青海省电力公司 一种配网调控系统及其控制方法
CN107426021A (zh) * 2017-07-19 2017-12-01 北京锐安科技有限公司 冗余系统的构建方法、装置及冗余系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102684929A (zh) * 2012-06-06 2012-09-19 广东威创视讯科技股份有限公司 一种双机热冗余备份方法和系统
CN104104648A (zh) * 2013-04-02 2014-10-15 杭州信核数据科技有限公司 一种访问存储设备中的数据的方法、应用服务器和网络
CN104239164A (zh) * 2013-06-19 2014-12-24 国家电网公司 基于云存储的灾备切换系统
CN105553701A (zh) * 2015-12-11 2016-05-04 国网青海省电力公司 一种配网调控系统及其控制方法
CN107426021A (zh) * 2017-07-19 2017-12-01 北京锐安科技有限公司 冗余系统的构建方法、装置及冗余系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110784354A (zh) * 2019-10-30 2020-02-11 北京大米未来科技有限公司 数据处理方法、装置、系统和可读存储介质

Similar Documents

Publication Publication Date Title
CN106899518B (zh) 一种基于互联网数据中心的资源处理方法以及装置
CN104158693B (zh) 数据服务的容灾备份方法和系统
US10713135B2 (en) Data disaster recovery method, device and system
CN104798349B (zh) 响应于端口故障的故障转移
KR100575497B1 (ko) 내고장성 컴퓨터 시스템
US8676760B2 (en) Maintaining data integrity in data servers across data centers
CN104503965B (zh) PostgreSQL高弹性的高可用及负载均衡实现方法
US9641449B2 (en) Variable configurations for workload distribution across multiple sites
CN105426275B (zh) 双活集群系统中容灾的方法及装置
CN113641511B (zh) 一种消息通信方法和装置
CN108234191A (zh) 云计算平台的管理方法和装置
CN106357787A (zh) 一种存储容灾控制系统
WO2021004385A1 (zh) 服务单元切换方法、系统及设备
CN110377459A (zh) 一种容灾系统、容灾处理方法、监控节点和备份集群
CN105554074A (zh) 一种基于rpc通信的nas资源监控系统及监控方法
CN105554130A (zh) 基于分布式存储系统的NameNode切换方法和切换装置
CN106603261A (zh) 热备份方法、第一主用设备、备用设备和通信系统
CN113132159B (zh) 存储集群节点故障的处理方法、设备及存储系统
CN107766181A (zh) 一种基于PCIe非透明桥的双控制器存储高可用子系统
WO2024113780A1 (zh) 一种fc链路管理方法、装置、设备及可读存储介质
CN110348826A (zh) 异地多活容灾方法、系统、设备及可读存储介质
CN107357800A (zh) 一种数据库高可用零丢失解决方法
CN105893176B (zh) 一种网络存储系统的管理方法和装置
CN102187627B (zh) 负载分担的方法及装置、宽带接入服务器系统
CN109597710A (zh) 一种分布式数据中心异地双活方法及应用服务器和网络

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190409