CN113961397A - 一种基于备份容灾系统的高可用集群容灾方法 - Google Patents

一种基于备份容灾系统的高可用集群容灾方法 Download PDF

Info

Publication number
CN113961397A
CN113961397A CN202111263431.3A CN202111263431A CN113961397A CN 113961397 A CN113961397 A CN 113961397A CN 202111263431 A CN202111263431 A CN 202111263431A CN 113961397 A CN113961397 A CN 113961397A
Authority
CN
China
Prior art keywords
server
disaster recovery
address
backup
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111263431.3A
Other languages
English (en)
Inventor
钱炜程
张有成
谢亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Unary Information Technology Co ltd
Original Assignee
Aerospace One System Nanjing Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace One System Nanjing Data Technology Co ltd filed Critical Aerospace One System Nanjing Data Technology Co ltd
Priority to CN202111263431.3A priority Critical patent/CN113961397A/zh
Publication of CN113961397A publication Critical patent/CN113961397A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种基于备份容灾系统的高可用集群容灾方法,属于数据保护技术领域,包括以下步骤:步骤1、设置两台分别运行备份容灾系统的第一服务器和第二服务器,设置一台运行数据存储系统的存储服务器,将备份容灾系统生成的保护数据保存到存储服务器上;步骤2、在第一服务器和第二服务器安装服务器状态检测系统,对所述第一服务器和第二服务器与所述存储服务器连接的配置共享IP地址进行检测;本发明通过配置第一服务器和第二服务器的双备份容灾系统,实现第一服务器系统服务故障时,实时切换到第二服务器,实现了数据保护业务的不中断,确保了已经备份的数据安全可访问,以及进行中的数据保护操作不受第一服务器影响。

Description

一种基于备份容灾系统的高可用集群容灾方法
技术领域
本发明属于数据保护技术领域,具体涉及基于备份容灾系统的高可用集群容灾方法。
背景技术
随着数据对事业、企业单位的重要性不断增加,依靠传统的本地单机备份容灾系统已经无法满足用户对数据安全性要求,当本地单机备份容灾系统发生软硬件故障,如系统崩溃,文件系统损坏导致软件故障,或网络传输线路损坏,主板等寿命到期导致的硬件故障,使得单机数据备份系统无法正常运转,传统的本地单机备份容灾系统在面对自身故障发生时,无法起不到对重要数据的保护作用;
传统单机备份容灾系统主要使用单一系统对数据进行保护,一旦该系统发生故障,将影响到数据的保护功能,造成备份容灾服务无法使用,重要数据丢失的情况,因此需要研发一种新的高可用集群容灾方法来解决现有的问题。
发明内容
本发明的目的在于提供一种基于备份容灾系统的高可用集群容灾方法,以解决的问题。
为实现上述目的,本发明提供如下技术方案:一种基于备份容灾系统的高可用集群容灾方法,包括以下步骤:
步骤1、设置两台分别运行备份容灾系统的第一服务器和第二服务器,设置一台运行数据存储系统的存储服务器,将备份容灾系统生成的保护数据保存到存储服务器上;
步骤2、在第一服务器和第二服务器安装服务器状态检测系统,对所述第一服务器和第二服务器与所述存储服务器连接的配置共享IP地址进行检测;
步骤3、使用所述服务器状态检测系统的状态检测服务对所述备份容灾系统中的基础服务监控;
步骤4、构建第一服务器和第二服务器的数据高可用,将备份容灾系统中使用的数据库进行高可用配置。
优选的,所述步骤2中配置共享IP地址方法包括以下步骤:
步骤21、分别设置第一服务器的第一IP地址和第二服务器的第二IP地址作为其连接入口,并将第一IP地址和第二IP地址地址设置为同一网段;
步骤22、使用服务器状态检测系统在所述第一IP和第二IP地址基础上再分配同一个网段的共享IP地址,并将共享IP地址暴露于网络中作为备份容灾系统访问地址;
步骤23、通过共享IP地址使存储服务器与备份容灾系统进行TCP通信。
优选的,所述步骤3中配置状态检测服务的方法包括以下步骤:
步骤31、分别在第一服务器和第二服务器上安装状态检测服务,并通过共享IP地址进行访问,且所述共享IP地址、第一IP地址、第二IP地址属于同一个网段;
步骤32、第一服务器的状态检测服务将基础服务加入监控项;
步骤33、第一服务器的基础服务运行正常时,第一服务器和第二服务器的服务器状态检测系统发送心跳包确认对方工作状态是否正常;
步骤34、当第一服务器基础服务故障时,则将第一服务器上的服务器状态检测系统服务禁止,将第二服务器变为第一服务器,并接替第一服务器运行备份容灾服务。
优选的,所述步骤4中构建第一服务器和第二服务器的数据高可用的方法包括以下步骤:
步骤41、配置备份容灾系统调用的数据库高可用集群;
步骤42、当第一服务器状态正常时,第一服务器将数据存入数据库,第二服务器实时将第一服务器的数据同步到第二服务器下的数据库中;
步骤43、当第一服务器故障时,第一服务器上全部服务停止,第二服务器使用本地数据库内的数据。
优选的,所述第一服务器与第二服务器运行的备份容灾系统版本相同。
优选的,所述服务器状态检测系统为Keepalived。
优选的,所述基础服务包括备份服务、容灾服务以及所述备份服务、容灾服务对应的数据库服务。
优选的,所述步骤42中,所述数据包括策略数据和日志数据。
优选的,所述步骤3中基础服务监控方法包括:
第一服务器和第二服务器通过状态检测机进行心跳通信;
若心跳通信正常时,则第一服务器一直处于备份容灾系统正常运行状态,第二服务器只接收从第一服务器同步的数据;
若心跳通信不正常时,则第一服务器或第二服务器中某一台机器出现了故障;
优选的,所述第一服务器或第二服务器中某一台机器出现了故障的处理方法步骤:
当第二服务器故障时,切换至第一服务器正常运行服务;
当第一服务器出现故障时,则第一服务器主动停止备份容灾服务和数据库服务;
状态检测机将共享IP地址由第一服务器切换至第二服务器,存储服务器访问的共享IP地址不变,此时,共享IP地址实际指向的IP地址从第一IP地址变为第二IP地址;
第二服务器上的备份容灾服务使用第一服务器同步的数据进行运行,产生的备份数据存储到存储服务器。
本发明的技术效果和优点:该基于备份容灾系统的高可用集群容灾方法,通过配置第一服务器和第二服务器的双备份容灾系统,实现第一服务器系统服务故障时,实时切换到第二服务器,实现了数据保护业务的不中断,确保了已经备份的数据安全可访问,以及进行中的数据保护操作不受第一服务器影响。
附图说明
图1为本发明的流程图;
图2为本发明配置共享IP地址方法的流程图;
图3为本发明配置状态检测服务的方法的流程图;
图4为本发明构建第一服务器和第二服务器的数据高可用方法的流程图;
图5为本发明实施例1配置备份容灾系统高可用集群的方法流程图;
图6为本发明实施例1备份容灾系统高可用集群正常运行时数据传输示意图;
图7为本发明实施例1备份容灾系统高可用集群故障时数据传输示意流程图;
图8为本发明实施例1备份容灾系统高可用集群运行以及处理故障的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本发明提供了如图1-图7中所示的一种基于备份容灾系统的高可用集群容灾方法,如图1所示,包括以下步骤:
步骤1、设置两台分别运行备份容灾系统的第一服务器和第二服务器,设置一台运行数据存储系统的存储服务器,将备份容灾系统生成的保护数据保存到存储服务器上;
如图2所示,步骤2、在第一服务器和第二服务器安装服务器状态检测系统,对所述第一服务器和第二服务器与所述存储服务器连接的配置共享IP地址进行检测;所述步骤2中配置共享IP地址方法包括以下步骤:
步骤21、分别设置第一服务器的第一IP地址和第二服务器的第二IP地址作为其连接入口,用于外部存储服务器的连接和用户页面访问,并将第一IP地址和第二IP地址地址设置为同一网段;
步骤22、使用服务器状态检测系统在所述第一IP和第二IP地址基础上再分配同一个网段的共享IP地址,并将共享IP地址暴露于网络中作为备份容灾系统访问地址;
步骤23、通过共享IP地址使存储服务器与备份容灾系统进行TCP通信;
如图3所示,步骤3、使用所述服务器状态检测系统的状态检测服务对所述备份容灾系统中的基础服务监控;所述基础服务包括备份服务、容灾服务以及所述备份服务、容灾服务对应的数据库服务;所述步骤3中配置状态检测服务的方法包括以下步骤:
步骤31、分别在第一服务器和第二服务器上安装状态检测服务,并通过共享IP地址进行访问,且所述共享IP地址、第一IP地址、第二IP地址属于同一个网段;
步骤32、第一服务器的状态检测服务将基础服务加入监控项;
步骤33、第一服务器的基础服务运行正常时,第一服务器和第二服务器的服务器状态检测系统发送心跳包确认对方工作状态是否正常;
步骤34、当第一服务器基础服务故障时,则将第一服务器上的服务器状态检测系统服务禁止,将第二服务器变为第一服务器,并接替第一服务器运行备份容灾服务。
如图4所示,步骤4、构建第一服务器和第二服务器的数据高可用,将备份容灾系统中使用的数据库进行高可用配置;所述步骤4中构建第一服务器和第二服务器的数据高可用的方法包括以下步骤:
步骤41、配置备份容灾系统调用的数据库高可用集群;
步骤42、当第一服务器状态正常时,第一服务器将数据存入数据库,第二服务器实时将第一服务器的数据同步到第二服务器下的数据库中;所述数据包括策略数据和日志数据。
步骤43、当第一服务器故障时,第一服务器上全部服务停止,第二服务器使用本地数据库内的数据。
本实施例中,第一服务器为主服务器,第二服务器为从服务器;所述第一服务器与第二服务器运行的备份容灾系统版本相同。所述服务器状态检测系统为Keepalived;
如图5、6所示,为备份容灾系统高可用集群正常运行原理:当集群运行正常时,主服务器数据库内的信息从主服务器内的数据库同步向从服务器的数据库,共享IP对应的实际服务器为主服务器,存储服务器与备份容灾服务器之间的数据读写均只通过共享IP,实际存储服务器进行业务交流的服务器为从服务器;
如图7所示,为备份容灾系统高可用集群故障时的运行原理:当集群出现故障时,主服务器上备份容灾系统停止运行,灾备业务不再执行,数据库不再向从服务器同步数据;共享IP对应的实际服务器为从服务器;存储服务器与备份容灾服务器之间的数据读写均只通过共享IP,实际存储服务器进行业务交流的服务器变为从服务器。
实施例2:
与实施例1:不同的是,如图8所示,所述步骤3中基础服务监控方法包括:
第一服务器和第二服务器通过状态检测机进行心跳通信;
若心跳通信正常时,则第一服务器一直处于备份容灾系统正常运行状态,第二服务器只接收从第一服务器同步的数据;
若心跳通信不正常时,则第一服务器或第二服务器中某一台机器出现了故障。
10、根据权利要求9所述的一种基于备份容灾系统的高可用集群容灾方法,其特征在于:所述第一服务器或第二服务器中某一台机器出现了故障的处理方法步骤:
当第二服务器故障时,切换至第一服务器正常运行服务;
当第一服务器出现故障时,则第一服务器主动停止备份容灾服务和数据库服务;
状态检测机将共享IP地址由第一服务器切换至第二服务器,存储服务器访问的共享IP地址不变,此时,共享IP地址实际指向的IP地址从第一IP地址变为第二IP地址;
第二服务器上的备份容灾服务使用第一服务器同步的数据进行运行,产生的备份数据存储到存储服务器。
通过配置主服务器和从服务器的双备份容灾系统,实现主服务器系统服务故障时,实时切换到从服务器,实现了数据保护业务的不中断,确保了已经备份的数据安全可访问,以及进行中的数据保护操作不受主服务器影响。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于备份容灾系统的高可用集群容灾方法,其特征在于:包括以下步骤:
步骤1、设置两台分别运行备份容灾系统的第一服务器和第二服务器,设置一台运行数据存储系统的存储服务器,将备份容灾系统生成的保护数据保存到存储服务器上;
步骤2、在第一服务器和第二服务器安装服务器状态检测系统,对所述第一服务器和第二服务器与所述存储服务器连接的配置共享IP地址进行检测;
步骤3、使用所述服务器状态检测系统的状态检测服务对所述备份容灾系统中的基础服务监控;
步骤4、构建第一服务器和第二服务器的数据高可用,将备份容灾系统中使用的数据库进行高可用配置。
2.根据权利要求1所述的一种基于备份容灾系统的高可用集群容灾方法,其特征在于:所述步骤2中配置共享IP地址方法包括以下步骤:
步骤21、分别设置第一服务器的第一IP地址和第二服务器的第二IP地址作为其连接入口,并将第一IP地址和第二IP地址地址设置为同一网段;
步骤22、使用服务器状态检测系统在所述第一IP和第二IP地址基础上再分配同一个网段的共享IP地址,并将共享IP地址暴露于网络中作为备份容灾系统访问地址;
步骤23、通过共享IP地址使存储服务器与备份容灾系统进行TCP通信。
3.根据权利要求1所述的一种基于备份容灾系统的高可用集群容灾方法,其特征在于:所述步骤3中配置状态检测服务的方法包括以下步骤:
步骤31、分别在第一服务器和第二服务器上安装状态检测服务,并通过共享IP地址进行访问,且所述共享IP地址、第一IP地址、第二IP地址属于同一个网段;
步骤32、第一服务器的状态检测服务将基础服务加入监控项;
步骤33、第一服务器的基础服务运行正常时,第一服务器和第二服务器的服务器状态检测系统发送心跳包确认对方工作状态是否正常;
步骤34、当第一服务器基础服务故障时,则将第一服务器上的服务器状态检测系统服务禁止,将第二服务器变为第一服务器,并接替第一服务器运行备份容灾服务。
4.根据权利要求1所述的一种基于备份容灾系统的高可用集群容灾方法,其特征在于:所述步骤4中构建第一服务器和第二服务器的数据高可用的方法包括以下步骤:
步骤41、配置备份容灾系统调用的数据库高可用集群;
步骤42、当第一服务器状态正常时,第一服务器将数据存入数据库,第二服务器实时将第一服务器的数据同步到第二服务器下的数据库中;
步骤43、当第一服务器故障时,第一服务器上全部服务停止,第二服务器使用本地数据库内的数据。
5.根据权利要求1-4中任意一项所述的基于备份容灾系统的高可用集群容灾方法,其特征在于:所述第一服务器与第二服务器运行的备份容灾系统版本相同。
6.根据权利要求1-3中任意所述种基于备份容灾系统的高可用集群容灾方法,其特征在于:所述服务器状态检测系统为Keepalived。
7.根据权利要求1或2中所述的一种基于备份容灾系统的高可用集群容灾方法,其特征在于:所述基础服务包括备份服务、容灾服务以及所述备份服务、容灾服务对应的数据库服务。
8.根据权利要求4所述的一种基于备份容灾系统的高可用集群容灾方法,其特征在于:所述步骤42中,所述数据包括策略数据和日志数据。
9.根据权利要求1所述的一种基于备份容灾系统的高可用集群容灾方法,其特征在于:所述步骤3中基础服务监控方法包括:
第一服务器和第二服务器通过状态检测机进行心跳通信;
若心跳通信正常时,则第一服务器一直处于备份容灾系统正常运行状态,第二服务器只接收从第一服务器同步的数据;
若心跳通信不正常时,则第一服务器或第二服务器中某一台机器出现了故障。
10.根据权利要求9所述的一种基于备份容灾系统的高可用集群容灾方法,其特征在于:所述第一服务器或第二服务器中某一台机器出现了故障的处理方法步骤:
当第二服务器故障时,切换至第一服务器正常运行服务;
当第一服务器出现故障时,则第一服务器主动停止备份容灾服务和数据库服务;
状态检测机将共享IP地址由第一服务器切换至第二服务器,存储服务器访问的共享IP地址不变,此时,共享IP地址实际指向的IP地址从第一IP地址变为第二IP地址;
第二服务器上的备份容灾服务使用第一服务器同步的数据进行运行,产生的备份数据存储到存储服务器。
CN202111263431.3A 2021-10-28 2021-10-28 一种基于备份容灾系统的高可用集群容灾方法 Pending CN113961397A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111263431.3A CN113961397A (zh) 2021-10-28 2021-10-28 一种基于备份容灾系统的高可用集群容灾方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111263431.3A CN113961397A (zh) 2021-10-28 2021-10-28 一种基于备份容灾系统的高可用集群容灾方法

Publications (1)

Publication Number Publication Date
CN113961397A true CN113961397A (zh) 2022-01-21

Family

ID=79467840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111263431.3A Pending CN113961397A (zh) 2021-10-28 2021-10-28 一种基于备份容灾系统的高可用集群容灾方法

Country Status (1)

Country Link
CN (1) CN113961397A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114598594A (zh) * 2022-03-14 2022-06-07 上海道客网络科技有限公司 一种多集群下应用故障的处理方法、系统、介质和设备
CN115242807A (zh) * 2022-06-30 2022-10-25 深圳震有科技股份有限公司 一种5g通信系统中的数据存取方法及相关设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114598594A (zh) * 2022-03-14 2022-06-07 上海道客网络科技有限公司 一种多集群下应用故障的处理方法、系统、介质和设备
CN114598594B (zh) * 2022-03-14 2023-08-11 上海道客网络科技有限公司 一种多集群下应用故障的处理方法、系统、介质和设备
CN115242807A (zh) * 2022-06-30 2022-10-25 深圳震有科技股份有限公司 一种5g通信系统中的数据存取方法及相关设备

Similar Documents

Publication Publication Date Title
KR100711396B1 (ko) 서버의 이중화 방법 및 이중화 서버시스템
CN202798798U (zh) 基于云计算技术的高可用系统
US9916113B2 (en) System and method for mirroring data
EP2281240B1 (en) Maintaining data integrity in data servers across data centers
CN113961397A (zh) 一种基于备份容灾系统的高可用集群容灾方法
CN106919473B (zh) 一种数据灾备系统及业务处理方法
CN104536971A (zh) 一种具备高可用性的数据库
CN110727709A (zh) 一种集群数据库系统
US7730029B2 (en) System and method of fault tolerant reconciliation for control card redundancy
CN108810150B (zh) 协同办公系统应用级灾备系统的数据复制方法
CN105389231A (zh) 一种数据库双机备份方法及系统
CN111240901B (zh) 分布式块存储系统的节点动态扩展系统、方法及设备
CN110719282B (zh) 一种基于统一权限的认证双活系统
CN115878384A (zh) 一种基于备份容灾系统的分布式集群及构建方法
WO2020233001A1 (zh) 双控构架分布式存储系统、数据读取方法、装置和存储介质
CN117076196A (zh) 一种数据库容灾的管控方法和装置
JP2005055995A (ja) ストレージ制御方法、および、冗長化機能を有するサーバシステム
CN105391790A (zh) 类RAC One Node的数据库高可用方法
CN114706714A (zh) 一种同步计算机内存分割快照的方法
CN107590032A (zh) 存储集群故障转移的方法及存储集群系统
KR20140140719A (ko) 가상 머신 동기화 장치 및 시스템과 이를 이용한 장애 처리 방법
CN114089923A (zh) 一种双活存储系统及其数据处理方法
CN112306761A (zh) 一种面向多业务不停机检修的运维保障方法及系统
CN112783697A (zh) 一种基于快数据和大数据技术架构的运维管理方法
CN105162873A (zh) 一种k1服务器的高可用方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230412

Address after: 210001 floor 3, building B, building C, building 5, Baixia high tech Industrial Park, No. 5, Yongzhi Road, Qinhuai District, Nanjing, Jiangsu Province

Applicant after: NANJING UNARY INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 210000 9-10 / F, building 1, Changfeng building, No.14 Xinghuo Road, Jiangbei new district, Nanjing City, Jiangsu Province

Applicant before: Aerospace one system (Nanjing) data Technology Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: Building 1, 6th Floor, Changfeng Building, No.14 Xinghuo Road, Research and Innovation Park, Jiangbei New District, Nanjing City, Jiangsu Province, 210000

Applicant after: Aerospace One System (Jiangsu) Information Technology Co.,Ltd.

Address before: 210001 floor 3, building B, building C, building 5, Baixia high tech Industrial Park, No. 5, Yongzhi Road, Qinhuai District, Nanjing, Jiangsu Province

Applicant before: NANJING UNARY INFORMATION TECHNOLOGY Co.,Ltd.