CN104066107A - 一种业务容灾的方法及系统 - Google Patents

一种业务容灾的方法及系统 Download PDF

Info

Publication number
CN104066107A
CN104066107A CN201310096432.2A CN201310096432A CN104066107A CN 104066107 A CN104066107 A CN 104066107A CN 201310096432 A CN201310096432 A CN 201310096432A CN 104066107 A CN104066107 A CN 104066107A
Authority
CN
China
Prior art keywords
database
business
sub
storage facility
backup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310096432.2A
Other languages
English (en)
Inventor
李志明
杨光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201310096432.2A priority Critical patent/CN104066107A/zh
Priority to PCT/CN2013/082005 priority patent/WO2013189409A2/zh
Publication of CN104066107A publication Critical patent/CN104066107A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种业务容灾的方法以及系统,所述的业务容灾的方法包括:将业务系统的生产数据库的数据实时备份至备份数据库;当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库。上述方案,通过将业务系统的生产数据库实时备份至备份数据库,并在生产数据库发生故障无法访问时,自动重置至备份数据库,由备份数据库替代子生产库继续为用户提供服务,保证了在数据库无法访问的状况下,业务在不中断的情况下,继续正常使用,增强了业务系统的健壮度,提高客户满意度。

Description

一种业务容灾的方法及系统
技术领域
本发明涉及移动通讯领域,尤其涉及一种业务容灾的方法及系统。
背景技术
伴随着客户越来越高的要求,运营商也对通讯业务提出了更高的要求。但是,业务系统是一个复杂系统,任何一个节点出了问题,都有可能导致运营商的业务不可使用。一般而言,现在都采用的双机倒换技术,使得一旦某个节点出了问题,自动切换到备份节点,使得业务继续正常运行。但是,如果出现了极端情况,即存储数据的磁盘阵列,数据文件损坏等,那双机倒换技术就失灵了。一旦业务意外终止提供,必然引起客户的强烈不满。
发明内容
为了解决现有技术中业务由于存储数据的磁盘阵列,数据文件损坏等造成数据库无法访问从而致使业务终止的问题,本发明提供了一种业务容灾的方法及系统,对业务容灾保护,使得在不中断业务的情况下,业务可以正常使用。
本发明所采用的技术方案如下:
一种业务容灾的方法,用于业务系统,所述业务系统中设置有为业务提供访问数据的生产数据库,所述业务容灾的方法包括:
将业务系统的生产数据库的数据实时备份至备份数据库;
当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库。
优选的,将业务系统的生产数据库的数据实时备份至备份数据库,包括:
当所述生产数据库包括多个业务的子生产库时,将每一业务的子生产库的数据单独实时备份至一对应的备份数据库;
将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置。
优选的,当业务系统中的生产数据库发生故障时,将业务从生产数据库重置至备份数据库,包括:
当任一业务的子生产库发生故障时,根据子生产库和备份数据库的逻辑配置关系,查找与发生故障的子生产库所对应的备份数据库;
将业务从发生故障的子生产库自动重置至查找到的备份数据库。
优选的,将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置,包括:
将每一业务的子生产库的数据库名和备份数据库的数据库名一一对应,其中,备份数据库的数据库名包括子生产库的数据库名a、子生产库对应的节点b以及一用于区别子生产库的数据库名与备份数据库的数据库名的模块号c。
优选的,当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库之前,还包括:控制业务系统从生产数据库重置至备份数据库开始的步骤。
一种业务容灾系统,用于业务系统,所述业务系统中设置有为业务提供访问数据的生产数据库,所述业务容灾系统包括:
备份数据库;
备份模块,用于将业务系统的生产数据库实时备份至所述备份数据库;
重置模块,用于当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库。
优选的,所述备份模块包括:
复制模块,用于当所述生产数据库包括多个业务的子生产库时,将每一业务的子生产库的数据单独实时备份至一对应的备份数据库;
配置模块,用于将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置。
优选的,所述重置模块包括:
查找模块,用于当任一业务的子生产库发生故障时,根据子生产库和备份数据库的逻辑配置关系,查找与发生故障的子生产库所对应的备份数据库;
控制模块,用于控制业务从发生故障的子生产库自动重置至查找到的备份数据库。
优选的,命名模块,用于将每一业务的子生产库的数据库名和备份数据库的数据库名一一对应,其中,备份数据库的数据库名包括子生产库的数据库名a、子生产库对应的节点b以及一用于区别子生产库的数据库名与备份数据库的数据库名的模块号c。
优选的,所述业务容灾系统还包括:一控制开关模块,用于控制所述控制模块开始将业务从生产数据库重置至备份数据库。
本发明的有益效果如下:
上述方案,通过将业务系统的生产数据库实时备份至备份数据库,并在生产数据库发生故障无法访问时,自动重置至备份数据库,由备份数据库替代生产数据库继续为用户提供服务,保证了在生产数据库无法访问的状况下,业务在不中断的情况下,继续正常使用,增强了业务系统的健壮度,提高客户满意度。
附图说明
图1表示本发明所提供的一种业务容灾的方法的示意图;
图2表示本发明所提供的一种业务容灾组网示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,本发明提供一种业务容灾的方法,用于业务系统,所述业务系统中设置有为业务提供访问数据的生产数据库,所述业务容灾的方法包括:
将业务系统的生产数据库的数据实时备份至备份数据库;
当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库,使得业务能够通过访问备份数据库为用户提供服务。
优选的,本发明实施例中所提供的业务容灾的方法具体包括以下步骤:
当所述生产数据库包括多个业务的子生产库时,
将每一业务的子生产库的数据单独实时备份至一对应的备份数据库;
将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置;
当任一业务的子生产库发生故障时,根据子生产库和备份数据库的逻辑配置关系,查找与发生故障的子生产库所对应的备份数据库;
将业务从发生故障的子生产库自动重置至查找到的备份数据库,使得业务能够通过访问查找到的备份数据库为用户提供服务。
而当业务系统只有一个生产数据库时,则相应地,只有一个与其对应的备份数据库,那么,当该生产数据库发生故障时,则业务自动重置至该备份数据库。
优选的,将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置,包括:
将每一业务的子生产库的数据库名和备份数据库的数据库名一一对应,其中,备份数据库的数据库名包括子生产库的数据库名a、子生产库对应的节点b以及一用于区别子生产库的数据库名与备份数据库的数据库名的模块号c。
优选的,当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库之前,还包括:控制业务系统从生产数据库重置至备份数据库开始的步骤。
上述方案中,首先,将业务系统的数据库进行实时复制操作,以保证子生产库与备份数据库的数据一致,这个过程中,需要对业务系统中所有的生产数据库进行复制,并且每一子生产库应该实时单独复制至一个对应的备份数据库,以便于在业务系统由于存储数据的磁盘阵列、数据文件损坏等导致数据库无法访问时,能够采用与发生故障而无法访问的子生产库的数据一致的备份数据库进行业务容灾;
其次,在业务正常的情况下,业务查询业务系统的数据库,根据用户的属性去判断应该为用户提供何种服务,而一旦数据库无法访问,业务需要自动查找到备份数据库。对于业务而言,首先需要进行数据库的重置,也就是说,从正常的子生产库重置到备份数据库中,以使得业务能够准确查询出用户相关数据。而数据库进行重置,一方面需要从发生故障而无法访问的子生产库重置到与其数据一致的备份数据库中,以保证业务访问数据准确,另一方面需要自动查询找到并重置至备份数据库,以保证业务不中断,从而保证业务在不中断情况下正常运行。因此,本发明中,对各子生产库与各备份数据库进行了逻辑配置,也就是说,将子生产库和与其对应的备份数据库进行对应,从而,当任一业务的子生产库发生故障时,根据子生产库和备份数据库的逻辑配置关系,即可自动查找到与发生故障的子生产库所对应的备份数据库,并将业务从发生故障的子生产库自动重置至查找到的备份数据库,使得业务能够通过访问查找到的备份数据库为用户提供服务。需要说明的是,如果业务系统只有一个生产库,则相应地,只有一个与其对应的备份数据库,那么,业务自动重置至该备份数据库。
还需要说明的是,上述方案中,将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置时,优选的,将每一业务的子生产库的数据库名和备份数据库的数据库名一一对应,并且,每一业务的子生产库的数据库名与备份数据库的数据库名不同,比如可以在数据库名称后加入对应的模块号以示区别,,备份数据库的数据库名包括子生产库的数据库名a、子生产库对应的节点b以及一用于区别子生产库的数据库名与备份数据库的数据库名的模块号c,例如:子生产库数据库名为db15,且属于140节点,则其复制后所对应的备份数据库名称为db15_140。Sybase,oracle都提供了相应的工具,在此不再一一列举。
此外,还需要说明的是,由于现网的特殊原因,从发生故障的子生产库重置至其所对应的备份数据库的过程中,不应该打断现有的其他正常业务,也就是说,业务从子生产库自动重置到备份数据库,不需重启平台,以避免造成更大的影响。
此外,还需说明的是,由于业务系统进行容灾流程再恢复正常运行状态也需要一段时间,因此,对于有些场景对实时性要求不高的业务系统,可以不进行容灾,因此,本发明所提供的业务容灾的方法中,还可以包括一在业务需要进行容灾时,控制业务系统从生产数据库重置至备份数据库开始的步骤,也就是,控制业务容灾流程(也就是,查找、重置备份数据库)开始的步骤。
下面结合图2来介绍一下本发明的业务容灾的方法在业务系统的具体实现方式。
如图2所示,首先,业务系统正常运行时,SIU(System interface unit系统接口单元)根据号码属性触发业务所在的SCP(Service Control Point,业务控制点),然后正常执行业务。与此同时,SCP上的数据库每一步操作都将被复制到容灾节点刀片上。
当SCP的数据磁盘阵列出现了无法修复的情况或者数据文件损坏而导致业务无法正常进行时,业务在执行存储过程出错达到预定次数,就自动走容灾流程。
一旦进入容灾流程,此时就能根据子生产库与备份数据库的逻辑配置关系查找到对应的备份数据库,然后进行数据库的重置,从而正确执行存储过程,业务得以顺利往下进行。
而当被损坏的数据文件修复好后,再重新切换到子生产库上进行正常业务处理,而备份节点的备份功能需重新备份系统的数据库,使得下一次出现数据损坏的情况得以正常容灾。这样,就能实现业务容灾,方法简单易行。
本发明还提供了一种业务容灾系统,用于业务系统,所述业务系统中设置有为业务提供访问数据的生产数据库,所述业务容灾系统包括:
备份数据库;
备份模块,用于将业务系统的生产数据库实时备份至所述备份数据库;
重置模块,用于当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库。
优选的,所述备份模块包括:
复制模块,用于当所述生产数据库包括多个业务的子生产库时,将每一业务的子生产库的数据单独实时备份至一对应的备份数据库;
配置模块,用于将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置。
优选的,所述重置模块包括:
查找模块,用于当任一业务的子生产库发生故障时,根据子生产库和备份数据库的逻辑配置关系,查找与发生故障的子生产库所对应的备份数据库;
控制模块,用于控制业务从发生故障的子生产库自动重置至查找到的备份数据库。
优选的,命名模块,用于将每一业务的子生产库的数据库名和备份数据库的数据库名一一对应,其中,备份数据库的数据库名包括子生产库的数据库名a、子生产库对应的节点b以及一用于区别子生产库的数据库名与备份数据库的数据库名的模块号c。
优选的,所述业务容灾系统还包括:一控制开关模块,用于控制所述控制模块开始将业务从生产数据库重置至备份数据库。
以上是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种业务容灾的方法,用于业务系统,所述业务系统中设置有为业务提供访问数据的生产数据库,其特征在于,所述业务容灾的方法包括:
将业务系统的生产数据库的数据实时备份至备份数据库;
当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库。
2.根据权利要求1所述的业务容灾的方法,其特征在于,将业务系统的生产数据库的数据实时备份至备份数据库,包括:
当所述生产数据库包括多个业务的子生产库时,将每一业务的子生产库的数据单独实时备份至一对应的备份数据库;
将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置。
3.根据权利要求2所述的业务容灾的方法,其特征在于,当业务系统中的生产数据库发生故障时,将业务从生产数据库重置至备份数据库,包括:
当任一业务的子生产库发生故障时,根据子生产库和备份数据库的逻辑配置关系,查找与发生故障的子生产库所对应的备份数据库;
将业务从发生故障的子生产库自动重置至查找到的备份数据库。
4.根据权利要求2所述的业务容灾的方法,其特征在于,将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置,包括:
将每一业务的子生产库的数据库名和备份数据库的数据库名一一对应,其中,备份数据库的数据库名包括子生产库的数据库名a、子生产库对应的节点b以及一用于区别子生产库的数据库名与备份数据库的数据库名的模块号c。
5.根据权利要求1所述的业务容灾的方法,其特征在于,当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库之前,还包括:控制业务系统从生产数据库重置至备份数据库开始的步骤。
6.一种业务容灾系统,用于业务系统,所述业务系统中设置有为业务提供访问数据的生产数据库,其特征在于,所述业务容灾系统包括:
备份数据库;
备份模块,用于将业务系统的生产数据库实时备份至所述备份数据库;
重置模块,用于当业务系统中的生产数据库发生故障时,业务系统从生产数据库重置至备份数据库。
7.根据权利要求6所述的业务容灾系统,其特征在于,所述备份模块包括:
复制模块,用于当所述生产数据库包括多个业务的子生产库时,将每一业务的子生产库的数据单独实时备份至一对应的备份数据库;
配置模块,用于将每一业务的子生产库和与其所对应的备份数据库进行逻辑配置。
8.根据权利要求7所述的业务容灾系统,其特征在于,所述重置模块包括:
查找模块,用于当任一业务的子生产库发生故障时,根据子生产库和备份数据库的逻辑配置关系,查找与发生故障的子生产库所对应的备份数据库;
控制模块,用于控制业务从发生故障的子生产库自动重置至查找到的备份数据库。
9.根据权利要求7所述的业务容灾系统,其特征在于,
命名模块,用于将每一业务的子生产库的数据库名和备份数据库的数据库名一一对应,其中,备份数据库的数据库名包括子生产库的数据库名a、子生产库对应的节点b以及一用于区别子生产库的数据库名与备份数据库的数据库名的模块号c。
10.根据权利要求6所述的业务容灾系统,其特征在于,所述业务容灾系统还包括:一控制开关模块,用于控制所述控制模块开始将业务从生产数据库重置至备份数据库。
CN201310096432.2A 2013-03-22 2013-03-22 一种业务容灾的方法及系统 Pending CN104066107A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310096432.2A CN104066107A (zh) 2013-03-22 2013-03-22 一种业务容灾的方法及系统
PCT/CN2013/082005 WO2013189409A2 (zh) 2013-03-22 2013-08-21 一种业务容灾的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310096432.2A CN104066107A (zh) 2013-03-22 2013-03-22 一种业务容灾的方法及系统

Publications (1)

Publication Number Publication Date
CN104066107A true CN104066107A (zh) 2014-09-24

Family

ID=49769552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310096432.2A Pending CN104066107A (zh) 2013-03-22 2013-03-22 一种业务容灾的方法及系统

Country Status (2)

Country Link
CN (1) CN104066107A (zh)
WO (1) WO2013189409A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677675A (zh) * 2014-11-20 2016-06-15 阿里巴巴集团控股有限公司 业务处理方法及装置
CN107122263A (zh) * 2017-05-15 2017-09-01 深圳市奇摩计算机有限公司 在线恢复备份数据的方法及其实现系统和备份设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106933697A (zh) * 2015-12-31 2017-07-07 中富通股份有限公司 一种基于硬件的实时数据库备份方案

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1677887A (zh) * 2005-02-01 2005-10-05 北京北方烽火科技有限公司 N+1备份的数据实时同步方法
US7260590B1 (en) * 2000-12-06 2007-08-21 Cisco Technology, Inc. Streamed database archival process with background synchronization
CN101038591A (zh) * 2007-04-11 2007-09-19 华为技术有限公司 数据库同步方法及系统
US7613747B1 (en) * 2005-06-08 2009-11-03 Sprint Communications Company L.P. Tiered database storage and replication

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7260590B1 (en) * 2000-12-06 2007-08-21 Cisco Technology, Inc. Streamed database archival process with background synchronization
CN1677887A (zh) * 2005-02-01 2005-10-05 北京北方烽火科技有限公司 N+1备份的数据实时同步方法
US7613747B1 (en) * 2005-06-08 2009-11-03 Sprint Communications Company L.P. Tiered database storage and replication
CN101038591A (zh) * 2007-04-11 2007-09-19 华为技术有限公司 数据库同步方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677675A (zh) * 2014-11-20 2016-06-15 阿里巴巴集团控股有限公司 业务处理方法及装置
CN105677675B (zh) * 2014-11-20 2019-08-27 阿里巴巴集团控股有限公司 业务处理方法及装置
CN107122263A (zh) * 2017-05-15 2017-09-01 深圳市奇摩计算机有限公司 在线恢复备份数据的方法及其实现系统和备份设备

Also Published As

Publication number Publication date
WO2013189409A2 (zh) 2013-12-27
WO2013189409A3 (zh) 2014-02-20

Similar Documents

Publication Publication Date Title
US10565071B2 (en) Smart data replication recoverer
CN106357787A (zh) 一种存储容灾控制系统
CN101739313B (zh) 一种连续数据保护和恢复方法
US20230041089A1 (en) State management methods, methods for switching between master application server and backup application server, and electronic devices
CN104252500A (zh) 一种数据库管理平台的故障修复方法和装置
CN105302667B (zh) 基于集群架构的高可靠性数据备份与恢复方法
CN105187249A (zh) 一种故障恢复方法及装置
CN103336728A (zh) 一种磁盘数据恢复方法
CN102857371B (zh) 一种面向集群系统的动态配置管理方法
CN103136070B (zh) 一种数据容灾处理的方法和装置
US7730029B2 (en) System and method of fault tolerant reconciliation for control card redundancy
CN104516796B (zh) 一种基于命令集的网元备份与恢复方法及装置
CN102075989A (zh) 移动网络管理系统的分层备份恢复方法及装置
CN104066107A (zh) 一种业务容灾的方法及系统
CN103186348B (zh) 存储系统及其数据读写方法
CN106201772A (zh) 一种基于数据中心的操作系统备份、恢复方法及装置
CN106294795A (zh) 一种数据库切换方法及系统
CN105607973A (zh) 一种虚拟机系统中设备故障处理的方法、装置及系统
CN105354102A (zh) 一种文件系统维护和修复的方法和装置
CN106534262A (zh) 一种网络信息系统故障的切换方法
CN110502496A (zh) 一种分布式文件系统修复方法、系统、终端及存储介质
EP3066848B1 (en) Method and apparatus for failure recovery in a machine-to-machine network
CN102693171B (zh) 一种信息录入系统的恢复方法及系统
JP5914267B2 (ja) データ復旧装置
CN115629906B (zh) 一种恢复云分布式存储数据故障的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140924

RJ01 Rejection of invention patent application after publication