CN101426306B - 一种容灾切换方法、系统及装置 - Google Patents

一种容灾切换方法、系统及装置 Download PDF

Info

Publication number
CN101426306B
CN101426306B CN2008102250010A CN200810225001A CN101426306B CN 101426306 B CN101426306 B CN 101426306B CN 2008102250010 A CN2008102250010 A CN 2008102250010A CN 200810225001 A CN200810225001 A CN 200810225001A CN 101426306 B CN101426306 B CN 101426306B
Authority
CN
China
Prior art keywords
network element
instruction
switching
receiving object
disaster recovery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008102250010A
Other languages
English (en)
Other versions
CN101426306A (zh
Inventor
孔建坤
陈国栋
孙艳丽
姚进华
宋志刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Shandong Co Ltd
Original Assignee
China Mobile Group Shandong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Shandong Co Ltd filed Critical China Mobile Group Shandong Co Ltd
Priority to CN2008102250010A priority Critical patent/CN101426306B/zh
Publication of CN101426306A publication Critical patent/CN101426306A/zh
Application granted granted Critical
Publication of CN101426306B publication Critical patent/CN101426306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种容灾切换方法,该方法包括:监测第一网元是否发生故障,在确定所述第一网元发生故障后生成切换指令,该切换指令用于将所述第一网元的业务切换到所述第一网元对应的备份网元;根据预先配置的指令与指令接收对象的对应关系,确定所述切换指令对应的指令接收对象,并将所述切换指令发送给所述指令接收对象进行执行。本发明实施例还公开了一种容灾切换系统及装置。采用本发明,能够有效的提高容灾切换过程的及时性和准确性。

Description

一种容灾切换方法、系统及装置 
技术领域
本发明涉及移动通信领域,尤其涉及一种容灾切换方法、系统及装置。 
背景技术
随着移动通信网络的普及,用户对移动通信的服务质量要求越来越高;运营商也要求网络节点发生故障后,网络能够继续提供服务。为了提高运营水平,移动运营商必须给用户提供高品质、不间断的服务。而由于人为操作失误、设备故障、自然灾害等原因,通信网元的故障往往不可避免。 
为了向用户提供不间断的服务,在网元发生故障时需要进行容灾切换。容灾切换是指将故障网元的业务切换到其他正常网元上,由该正常网元接管故障网元的业务。目前采用的容灾切换技术有N+1备份、1+N备份等。 
N+1备份是指,多个网元对应一个备份网元,在多个网元中的某个网元发生故障时,将该故障网元的业务切换到其他备份网元上,由备份网元接管故障网元的业务,从而保证业务的正常运行。在故障网元的故障恢复后,再将业务从备份网元切换回故障恢复的网元。 
1+N备份是指,一般是指对基站的备份,即一个基站控制器对应多个备份基站控制器,当一个基站控制器发生故障时,可以将故障基站控制器下的所有基站的业务切换到多个备份基站控制器上,从而保证业务的正常运行。在故障基站控制器的故障恢复后,再将业务从多个备份基站控制器切换回故障恢复的基站控制器。 
现有技术中,容灾切换的整个过程,包括将故障网元的业务切换到备份网元上、以及将业务从备份网元切换回故障恢复的网元等,均是通过人工操作来完成的,实现上具有及时性差和准确性低的缺陷。
发明内容
本发明实施例提供一种容灾切换方法、系统及装置,用于提高容灾切换的及时性和准确性。 
本发明实施例提供一种容灾切换方法,该方法包括: 
检测第一网元是否发生故障,在确定所述第一网元发生故障后,根据预先设置的网元与切换指令模板的对应关系,确定所述第一网元的类型对应的切换指令模板;获取所述切换指令模板中的容灾指令需要的输入参数;将获取到的输入参数与相应的容灾指令结合,生成切换指令,该切换指令用于将所述第一网元的业务切换到所述第一网元对应的备份网元; 
根据预先配置的指令与指令接收对象的对应关系,确定所述切换指令对应的指令接收对象,并将所述切换指令发送给所述指令接收对象进行执行; 
对所述第一网元进行状态检测,并记录状态检测结果参数;根据所述状态检测结果参数判断所述第一网元是否满足预先配置的容灾切换条件,若不是,则确定所述第一网元的故障恢复,并生成倒回指令,该倒回指令用于将切换到所述备份网元的业务切换回所述第一网元; 
根据预先设置的倒回指令与指令接收对象的对应关系,确定所述倒回指令对应的指令接收对象,将所述倒回指令发送给所述指令接收对象。 
本发明实施例提供一种容灾切换系统,该系统包括: 
故障检测装置,用于检测第一网元是否发生故障;在容灾切换装置将切换指令发送给所述指令接收对象之后,对所述第一网元进行状态检测,并记录状态检测结果参数;根据所述状态检测结果参数判断所述第一网元是否满足预先配置的容灾切换条件,若不是,则确定所述第一网元的故障恢复; 
容灾切换装置,用于在所述故障检测装置确定所述第一网元发生故障后,根据预先设置的网元与切换指令模板的对应关系,确定所述第一网元的类型对应的切换指令模板;获取所述切换指令模板中的容灾指令需要的输入参数;将获取到的输入参数与相应的容灾指令结合,生成切换指令,该切换指令用于将所述第一网元的业务切换到所述第一网元对应的备份网元;根据预先配置的指 令与指令接收对象的对应关系,确定所述切换指令对应的指令接收对象,并将所述切换指令发送给所述指令接收对象进行执行;在所述故障检测装置检测到所述第一网元的故障恢复时,生成倒回指令,该倒回指令用于将切换到所述备份网元的业务切换回所述第一网元,并将所述倒回指令发送给所述倒回指令对应的指令接收对象进行执行。 
本发明实施例提供一种容灾切换装置,该装置包括: 
指令生成单元,包括模板确定单元、参数确定单元和结合单元,所述模板确定单元,用于在故障检测装置确定第一网元发生故障后,根据预先设置的网元与切换指令模板的对应关系,确定所述第一网元的类型对应的切换指令模板;所述参数确定单元,用于获取所述切换指令模板中的容灾指令需要的输入参数;所述结合单元,用于将获取到的输入参数与相应的容灾指令结合,生成切换指令,该切换指令用于将所述第一网元的业务切换到所述第一网元对应的备份网元; 
指令发送单元,用于根据预先配置的指令与指令接收对象的对应关系,确定所述切换指令对应的指令接收对象,并将所述切换指令发送给所述指令接收对象进行执行; 
容灾倒回单元,用于在所述故障检测装置检测到所述第一网元的故障恢复时,生成倒回指令,该倒回指令用于将切换到所述备份网元的业务切换回所述第一网元,并将所述倒回指令发送给所述倒回指令对应的指令接收对象。 
本发明中,对第一网元的故障情况进行自动检测,在确定第一网元发生故障时,生成用于将第一网元的业务切换到备份网元上的切换指令,并将该切换指令发送给第一网元对应的指令接收对象进行执行,使得故障网元的业务切换到备份网元,实现了容灾切换的自动流程,有效的提高了容灾切换过程的及时性和准确性。 
附图说明
图1为本发明实施例提供的方法流程示意图; 
图2为本发明实施例提供的系统结构示意图; 
图3为本发明实施例提供的装置结构示意图; 
图4为本发明实施例提供的装置结构示意图; 
图5为本发明实例一中的系统结构示意图; 
图6为本发明实例二中的系统结构示意图。 
具体实施方式
为了提高容灾切换过程的及时性和准确性,本发明实施例提供一种容灾切换方法,本方法中,对网元进行自动监测,在监测到某个网元发生故障时,自动生成容灾切换指令,并将容灾切换指令发送给故障网元和/或该故障网元对应的备份网元进行执行,使故障网元的业务切换到备份网元。 
参见图1,本发明实施例提供的容灾切换方法,具体包括以下步骤: 
步骤10:监测第一网元是否发生故障; 
本步骤中,监测网元是否发生故障的具体方法可以为:对第一网元进行状态检测,并记录状态检测结果参数;根据记录的状态检测结果参数判断第一网元是否满足预先配置的容灾切换条件,若是,则确定第一网元发生故障。 
对第一网元进行状态检测的方法有多种,下面列举三种方法进行说明: 
第一种,心跳检测方法。本方法中,接收网元定时向外广播的表明自身状态的心跳信号,将信号接收时间作为状态检测结果参数进行记录; 
第二种,检查点方法。本方法中,主动向第一网元发送状态参数获取请求,将第一网元返回的状态参数和/或第一网元响应状态参数获取请求的时间作为状态检测结果参数进行记录;状态参数包括处理器负荷、接通率、话路拥塞系数等。第一网元响应状态参数获取请求的时间可以是发送状态参数获取请求的时间与第一网元返回状态参数的时间之差。 
第三种,事件告警方法。本方法中,接收第一网元发出的事件报告和/或告警信号,将事件报告和/或告警信号中的内容状态检测结果参数进行记录。事件报告包括Trap事件、Syslog事件等。可以使用现有的Syslog采集器采集第一网元发出的Syslog事件报告,使用SNMP采集器采集第一网元发出的Trap事件报告及告警信号。 
在记录各种状态检测结果参数时,可以将各种状态检测结果参数进行分类、格式化、过滤等处理,分类和格式化处理后的状态检测结果参数更加便于与容灾条件数据进行对比分析,过滤处理是为了将不需要的干扰信息删除。 
本步骤中,根据记录的状态检测结果参数判断第一网元是否满足预先配置的容灾切换条件,其具体方法可以为:将记录的状态检测结果参数与预先配置的容灾条件数据进行对比分析,若状态检测结果参数与容灾条件数据相匹配,则判断第一网元满足容灾切换条件,若不相匹配,则判断第一网元不满足容灾切换条件。容灾条件数据可以预先设置在容灾规则库中,与记录的状态检测结果参数相对应,容灾条件数据可以包括:持续未接收到网元心跳信号的时间门限值、网元状态参数的平均门限值、在设定时间内接收到事件报告或告警信息的次数中的一个或任意组合。例如,容灾条件数据中包含:持续未接收到网元 心跳信号的时间门限值为半小时,处理器负荷的平均门限值为80%;根据记录的心跳信号接收时间发现持续1个小时未接收到第一网元发出的心跳信号,但根据记录的状态参数发现第一网元在最近1个小时内处理器负荷的平均门限值为50%,由于记录的状态检测结果参数与容灾条件数据并不完全匹配,可以判断第一网元不满足容灾切换条件。 
当然,以上仅是对容灾条件数据内容的举例,管理人员可以根据实际情况进行其他设置。 
较佳的,为了进一步提高对第一网元故障判断的准确性,在根据已经记录的状态检测结果参数判断第一网元满足预先配置的容灾切换条件后,还检测第一网元的当前状态,并记录当前状态检测结果参数,然后将记录的当前状态检测结果参数与预先配置的容灾条件数据进行对比分析,若当前状态检测结果参数与预先配置的容灾条件数据相匹配,才确定第一网元发生故障。 
步骤11:在确定第一网元发生故障后,生成切换指令,该切换指令用于将第一网元的业务切换到第一网元对应的备份网元; 
本步骤中,切换指令包括但不限于:端口预留指令、链路建立指令、参数配置指令等。可以根据预先设置的网元与备份网元的对应关系,确定第一网元所对应的备份网元。生成切换指令的具体方法为: 
首先,根据预先设置的网元类型与切换指令模板的对应关系,确定第一网元的类型对应的切换指令模板。 
然后,获取所述切换指令模板中的容灾命令需要的参数。切换指令模板中的容灾命令包括但不限于:端口预留命令、链路建立命令、参数配置命令、链路删除命令等,其中: 
端口预留命令的功能是指示备份网元将某个或某几个端口预留给第一网元以为第一网元提供服务,端口预留指令需要的参数为待预留的端口号,获取该端口号的方法可以为:轮询备份网元的各个端口,从轮询到的端口中选取一个或多个空闲端口,将选取的一个或多个空闲端口的端口号作为端口预留命令 的参数; 
链路建立命令的功能是指示备份网元与第一网元建立逻辑链路,链路建立指令需要与第一网元建立逻辑链路所需的相关参数,该参数可以通过与第一网元交互来获取,也可以预先设置各个待监测的网元信息,从预先设置的网元信息中查找第一网元的链路建立参数,将查找到的链路建立参数作为链路建立命令的参数; 
参数配置命令的功能是指示备份网元将第一网元的业务参数配置在自身的服务器中,参数配置指令需要的参数为第一网元的业务参数,比如覆盖的小区标识、使用的信令点等,该业务参数可以通过与第一网元交互来获取,也可以从预先设置的网元信息中查找第一网元的业务参数,将查找到的业务参数作为链路建立命令的参数; 
链路删除命令的功能是指示第一网元切断自身与第一网元所管理的子网元之间的信号连接。链路删除命令可以只需发送给第一网元,并且该指令在有些场景下并不是必须的。 
最后,将获取到的容灾命令需要的参数与相应的容灾命令进行结合,生成切换指令。例如,对于端口预留命令来说,将获取到的待预留的端口号作为端口预留命令的输入参数携带在端口预留命令中,生成端口预留指令;对于链路建立命令来说,将获取到的与第一网元建立逻辑链路所需的相关参数作为链路建立命令的输入参数携带在链路建立命令中,生成链路建立指令;对于参数配置命令来说,将获取到的第一网元的业务参数作为参数配置命令的输入参数携带在参数配置命令中,生成参数配置指令。 
步骤12:根据预先设置的切换指令与指令接收对象的对应关系,确定生成的切换指令对应的指令接收对象,并将生成的切换指令发送给该指令接收对象进行执行。 
本步骤中,可以预先设置端口预留指令、链路建立指令、参数配置指令与备份网元的对应关系,以及链路删除指令与故障网元的对应关系,根据设置的 对应关系,确定端口预留指令、链路建立指令和参数配置指令的发送对象为备份网元,链路删除指令的发送对象为故障网元,则将端口预留指令、链路建立指令和参数配置指令发送给第一网元对应的备份网元,备份网元执行收到的指令,进行端口预留、链路建立、参数配置等操作。将链路删除指令发送给发生故障的第一网元,第一网元执行收到的指令,进行链路删除等操作,切断自身与自身所管理的子网元之间的信号连接。当然,切换指令还可以对应除故障网元和备份网元之外的其他指令接收对象。 
较佳的,为了使得备份网元能够与第一网元所管理的子网元进行通信,从而为子网元提供服务,在确定第一网元发生故障之后,并且发送切换指令之前,还提示用户建立第一网元所管理的子网元与第一网元对应的备份网元之间的物理链路;用户根据该提示建立物理链路后,第一网元所管理的子网元通过该物理链路与备份网元通信。 
较佳的,为了能够将故障网元的业务切换到有业务承载能力的网元上, 
在将切换指令发送给确定的指令接收对象之前,还获取备份网元的性能参数,根据备份网元的性能参数判断该备份网元是否具备接管第一网元的业务的条件,在备份网元具备接管第一网元的业务的条件时,才发送切换指令。可以根据预先配置的接管条件参数判断备份网元是否具备接管第一网元的业务的条件,例如,获取的备份网元的处理器负荷参数为100%,预先配置的接管条件参数中处理器负荷参数为80%,由于备份网元的性能参数与接管条件参数不相匹配,可以判断该备份网元并不具备接管第一网元的业务的条件。 
较佳的,为了使得第一网元的故障恢复时将备份网元接管的业务重新切换回第一网元,在指令接收对象执行接收到的切换指令后,若监测到第一网元的故障恢复,则生成用于将切换到备份网元的业务切换回第一网元的倒回指令,并将倒回指令发送给该倒回指令对应的指令接收对象进行执行。 
监测第一网元的故障是否恢复的方法与监测第一网元是否发生故障的方法类似:对第一网元进行状态检测,并记录状态检测结果参数,根据记录的状 态检测结果参数判断第一网元的故障是否恢复,具体的,将记录的状态检测结果参数与预先配置的容灾条件数据进行对比分析,若状态检测结果参数与容灾条件数据不相匹配,则判断第一网元的故障恢复,若相匹配,则判断第一网元的故障未恢复。 
倒回指令的生成方式也可以与切换指令的生成方式类似:首先,根据预先设置的网元类型与倒回指令模板的对应关系,确定第一网元的类型对应的倒回指令模板。然后,获取所述倒回指令模板中的容灾命令需要的参数。最后,将获取到的容灾命令需要的参数与相应的容灾命令进行结合,生成倒回指令。倒回指令包括但不限于:链路建立指令、链路删除指令等。 
同样可以根据预先设置的倒回指令与指令接收对象的对应关系,确定生成的倒回指令对应的指令接收对象,例如,倒回指令中的链路建立指令对应故障恢复的网元,链路删除指令对应备份网元,则将链路建立指令发送给第一网元,第一网元执行该指令,重新建立与其管理的子网元的逻辑链路;将链路删除指令发送给备份网元,备份网元执行该指令,切断自身与第一网元所管理的子网元之间的信号连接。 
为了使得管理人员等能够直观的看到整个容灾切换过程,可以记录容灾切换过程中发送切换指令、执行切换指令、网元故障恢复、发送倒回指令、执行倒回指令等的进展信息,并将记录的信息展现在可视化界面中。还可以将这些信息以报告的形式发送给相关人员。 
参见图2,本发明实施例还提供一种容灾切换系统,该系统包括: 
故障检测装置20,用于监测第一网元21是否发生故障; 
容灾切换装置22,用于在所述故障检测装置确定所述第一网元发生故障后,生成切换指令,该切换指令用于将所述第一网元的业务切换到所述第一网元对应的备份网元23;根据预先配置的指令与指令接收对象的对应关系,确定所述切换指令对应的指令接收对象,并将所述切换指令发送给所述指令接收对象进行执行。
容灾切换装置22进一步用于: 
在将所述切换指令发送给所述指令接收对象之前,获取所述备份网元的性能参数;根据所述备份网元的性能参数判断所述备份网元是否具备接管所述第一网元的业务的条件,若是,则将所述切换指令发送给所述指令接收对象。 
故障监测装置20进一步用于: 
在将所述切换指令发送给所述指令接收对象之后,监测所述第一网元的故障是否恢复; 
相应的,容灾切换装置22进一步用于: 
在所述故障监测装置监测到所述第一网元的故障恢复时,生成倒回指令,该倒回指令用于将切换到所述备份网元的业务切换回所述第一网元,并将所述倒回指令发送给所述倒回指令对应的指令接收对象进行执行。 
参见图3,本发明实施例还提供一种故障检测装置,可以应用于容灾切换系统中,该故障检测装置包括: 
故障检测单元30,用于对所述第一网元进行状态检测,并记录状态检测结果参数; 
条件分析单元31,用于根据所述故障检测单元记录的状态检测结果参数判断所述第一网元是否满足预先配置的容灾切换条件; 
容灾确定单元32,用于在所述条件分析单元判断所述第一网元满足预先配置的容灾切换条件时,确定所述第一网元发生故障。 
故障检测单元30包括: 
心跳检测单元,用于接收所述第一网元发出的心跳信号; 
第一记录单元,用于将接收所述心跳信号的时间作为所述状态检测结果参数进行记录。 
故障检测单元30包括: 
参数获取单元,用于向所述第一网元发送状态参数获取请求; 
第二记录单元,用于将所述第一网元返回的状态参数和/或对所述参数获取 请求的响应时间作为所述状态检测结果参数进行记录。 
故障检测单元30包括: 
告警接收单元,用于接收所述第一网元发出的事件报告和/或告警信号; 
第三记录单元,用于将所述事件报告和/或告警信号中的内容作为所述状态检测结果参数进行记录。 
本装置进一步包括: 
切换触发单元33,用于向容灾切换装置发送容灾切换触发消息,触发容灾切换装置接收到该消息时确定所述第一网元发生故障,从而启动后续切换流程。 
参见图4,本发明实施例还提供一种容灾切换装置,可以应用于容灾切换系统中,该装置包括: 
指令生成单元40,用于在故障检测装置确定所述第一网元发生故障后,生成切换指令,该切换指令用于将所述第一网元的业务切换到所述第一网元对应的备份网元; 
指令发送单元41,用于根据预先配置的指令与指令接收对象的对应关系,确定所述切换指令对应的指令接收对象,并将所述切换指令发送给所述指令接收对象进行执行。 
指令生成单元40包括: 
模板确定单元,用于根据预先设置的网元类型与切换指令模板的对应关系,确定所述第一网元的类型对应的切换指令模板; 
参数确定单元,用于获取所述切换指令模板中的容灾指令需要的输入参数; 
结合单元,用于将获取到的输入参数与相应的容灾指令结合,生成切换指令。 
该装置还包括: 
性能判断单元42,用于获取所述备份网元的性能参数;根据所述备份网元 的性能参数判断所述备份网元是否具备接管所述第一网元的业务的条件,若是,则指示所述指令发送单元将所述切换指令发送给所述指令接收对象。 
该装置还包括: 
容灾倒回单元43,用于在所述故障监测装置检测到所述第一网元的故障恢复时,指示指令生成单元生成倒回指令,该倒回指令用于将切换到所述备份网元的业务切换回所述第一网元,并指示指令发送单元将所述倒回指令发送给所述倒回指令对应的指令接收对象。 
下面结合容灾切换的系统以具体实施例对本发明的方法进行说明: 
实施例一: 
参见图5,本实施例中,基站控制器1(BSC1)管理基站1(BTS1)和基站基站2(BTS2),基站控制器2(BSC2)管理基站3(BTS3),在BSC1与BSC2之间进行容灾切换的具体流程如下: 
步骤S01:故障检测装置对BSC1进行实时状态检测,记录BSC1发出的告警信号及发出时间;每隔1小时,将记录的信息与容灾规则库中的告警信号数量门限值进行对比分析,发现记录的当前最近1小时发出告警信号的次数超过了告警信号数量门限值,则确定BSC1发生故障; 
步骤S02:故障检测装置向容灾切换装置发送切换触发消息,该消息中包含BSC1的类别信息以及BSC1管理的BTS1和BTS2的相关信息; 
步骤S03:容灾切换装置接收切换触发消息,根据该消息中BSC1的类别信息确定该类别对应切换指令模板1,根据预先设置的网元与备份网元的对应关系,确定BSC1所对应的备份网元为BSC2; 
步骤S04:容灾切换装置读取切换指令模板1中包含的端口预留命令、链路建立命令和参数配置命令,获取端口预留命令、链路建立命令和参数配置命令需要的输入参数,将输入参数与相应的命令结合生成端口预留指令、链路建立指令、参数配置指令; 
步骤S05:容灾切换装置将生成的端口预留指令、链路建立指令、参数配置 指令发送给BSC2; 
步骤S06:BSC2执行接收到的指令,将两个端口分别预留给BTS1和BTS2、建立与BTS1和BTS2的链路、配置BTS1和BTS2的业务参数等操作,将BSC1管理的BTS1和BTS2的业务切换到BSC2上; 
步骤S07:故障检测装置发现记录的当前最近1小时BSC1发出告警信号的次数小于告警信号数量门限值,则确定BSC1故障恢复; 
步骤S08:故障检测装置向容灾切换装置发送倒回触发消息,该消息中包含故障恢复网元BSC1、BSC1管理的BTS1和BTS2的相关信息以及备份网元BSC2的相关信息; 
步骤S09:容灾切换装置接收倒回触发消息,根据该消息中BSC1的类别信息确定该类别对应倒回指令模板1; 
步骤S10:容灾切换装置读取倒回指令模板1中包含的链路删除命令,将BTS1和BTS2的标识信息作为输入参数与链路删除命令结合,生成链路删除指令; 
步骤S101:容灾切换装置将生成的链路删除指令发送给BSC2,BSC2删除与BTS1和BTS2之间的链路,容灾倒回成功。 
实施例二: 
参见图6,本实施例中,在归属位置寄存器1(HLR1)和归属位置寄存器2(HLR2)之间进行容灾切换的具体流程如下: 
步骤S11:故障检测装置对HLR1进行定时状态检测,通过与HLR1交互获取HLR1的可用存储空间参数信息并记录该信息;将记录的可用存储空间参数与容灾规则库中的存储空间门限值进行对比分析,发现记录的可用存储空间小于存储空间门限值,则确定HLR1发生故障; 
步骤S12:故障检测装置向容灾切换装置发送切换触发消息,该消息中包含BSC1的类别信息; 
步骤S13:容灾切换装置接收切换触发消息,根据该消息中HLR1的类别 信息确定该类别对应切换指令模板2,根据预先设置的网元与备份网元的对应关系,确定HLR1所对应的备份网元为HLR2; 
步骤S14:容灾切换装置读取切换指令模板2中包含的服务切换命令,将HLR2的标识信息作为输入参数与服务切换命令结合生成服务切换指令; 
步骤S15:容灾切换装置将生成的服务切换指令发送给HLR1的端局; 
步骤S16:HLR1的端局执行接收到的指令,将用户的指向修改到HLR2,后续则从HLR2查询归属于HLR1的用户信息; 
步骤S17:故障检测装置发现记录的HLR1的可用存储空间小于存储空间门限值,则确定HLR1故障恢复; 
步骤S18:故障检测装置向容灾切换装置发送倒回触发消息,该消息中包含故障恢复网元HLR1的相关信息; 
步骤S19:容灾切换装置接收倒回触发消息,根据该消息中BSC1的类别信息确定该类别对应倒回指令模板2; 
步骤S20:容灾切换装置读取倒回指令模板2中包含的服务修改命令,将HLR1的标识信息作为输入参数与服务修改命令结合,生成修改命令指令; 
步骤S21:容灾切换装置将生成的修改命令指令发送给HLR1,HLR1将用户的指向修改到HLR1,后续则从HLR1查询归属于HLR1的用户信息,容灾倒回成功。 
综上,本发明的有益效果在于: 
本发明实施例提供的方案中,对网元的故障情况进行自动监测,在确定网元发生故障时,生成用于将网元的业务切换到备份网元上的切换指令,并将该切换指令发送给该故障网元对应的指令接收对象进行执行,使得该故障网元的业务切换到备份网元,实现了容灾切换的自动流程,有效的提高了容灾切换过程的及时性和准确性。 
同时,由于本发明中采用了统一的数据管理及自动化的切换方式,节省了人工敲击指令并分析数据的时间,提高了工作效率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (11)

1.一种容灾切换方法,其特征在于,该方法包括:
检测第一网元是否发生故障,在确定所述第一网元发生故障后,根据预先设置的网元与切换指令模板的对应关系,确定所述第一网元的类型对应的切换指令模板;获取所述切换指令模板中的容灾指令需要的输入参数;将获取到的输入参数与相应的容灾指令结合,生成切换指令,该切换指令用于将所述第一网元的业务切换到所述第一网元对应的备份网元;
根据预先配置的指令与指令接收对象的对应关系,确定所述切换指令对应的指令接收对象,并将所述切换指令发送给所述指令接收对象进行执行;
对所述第一网元进行状态检测,并记录状态检测结果参数;根据所述状态检测结果参数判断所述第一网元是否满足预先配置的容灾切换条件,若不是,则确定所述第一网元的故障恢复,并生成倒回指令,该倒回指令用于将切换到所述备份网元的业务切换回所述第一网元;
根据预先设置的倒回指令与指令接收对象的对应关系,确定所述倒回指令对应的指令接收对象,将所述倒回指令发送给所述指令接收对象。
2.如权利要求1所述的方法,其特征在于,所述检测第一网元是否发生故障包括:
对所述第一网元进行状态检测,并记录状态检测结果参数;
根据记录的状态检测结果参数判断所述第一网元满足预先配置的容灾切换条件后,确定所述第一网元发生故障。
3.如权利要求2所述的方法,其特征在于,所述对所述第一网元进行状态检测,并记录状态检测结果参数包括:
接收所述第一网元发出的心跳信号,将信号接收时间作为所述状态检测结果参数进行记录;或者,
向所述第一网元发送状态参数获取请求;将所述第一网元返回的状态参数和/或对所述参数获取请求的响应时间作为所述状态检测结果参数进行记录;或者,
接收所述第一网元发出的事件报告和/或告警信号,将所述事件报告和/或告警信号中的内容作为所述状态检测结果参数进行记录。
4.如权利要求2所述的方法,其特征在于,在判断所述第一网元满足容灾切换条件之后,并且确定所述第一网元发生故障之前,该方法进一步包括:
检测所述第一网元的当前状态,并记录当前状态检测结果参数;判断所述当前状态检测结果参数与预先配置的容灾条件数据是否匹配;
所述确定所述第一网元发生故障包括:
在判断所述当前状态检测结果参数与预先配置的容灾条件数据相匹配时,确定所述第一网元发生故障。
5.如权利要求1所述的方法,其特征在于,在确定所述第一网元发生故障之后,并且将所述切换指令发送给指令接收对象之前,该方法进一步包括:
提示用户建立所述第一网元所管理的子网元与所述备份网元之间的物理链路;
在将所述切换指令发送给所述指令接收对象后,所述第一网元所管理的子网元通过所述物理链路与所述备份网元通信。
6.如权利要求1所述的方法,其特征在于,在确定所述第一网元发生故障之后,并且将所述切换指令发送给指令接收对象之前,该方法进一步包括:
获取所述备份网元的性能参数;
根据所述备份网元的性能参数判断所述备份网元是否具备接管所述第一网元的业务的条件;若是,则将所述切换指令发送给所述指令接收对象。
7.如权利要求1所述的方法,其特征在于,该方法进一步包括:
记录发送所述切换指令和/或执行所述切换指令的进展信息,并将记录的信息展现在可视化界面中。
8.一种容灾切换系统,其特征在于,该系统包括:
故障检测装置,用于检测第一网元是否发生故障;在容灾切换装置将切换指令发送给所述指令接收对象之后,对所述第一网元进行状态检测,并记录状态检测结果参数;根据所述状态检测结果参数判断所述第一网元是否满足预先配置的容灾切换条件,若不是,则确定所述第一网元的故障恢复;
容灾切换装置,用于在所述故障检测装置确定所述第一网元发生故障后,根据预先设置的网元与切换指令模板的对应关系,确定所述第一网元的类型对应的切换指令模板;获取所述切换指令模板中的容灾指令需要的输入参数;将获取到的输入参数与相应的容灾指令结合,生成切换指令,该切换指令用于将所述第一网元的业务切换到所述第一网元对应的备份网元;根据预先配置的指令与指令接收对象的对应关系,确定所述切换指令对应的指令接收对象,并将所述切换指令发送给所述指令接收对象进行执行;在所述故障检测装置检测到所述第一网元的故障恢复时,生成倒回指令,该倒回指令用于将切换到所述备份网元的业务切换回所述第一网元,并将所述倒回指令发送给所述倒回指令对应的指令接收对象进行执行。
9.如权利要求8所述的系统,其特征在于,所述容灾切换装置进一步用于:
在将所述切换指令发送给所述指令接收对象之前,获取所述备份网元的性能参数;根据所述备份网元的性能参数判断所述备份网元是否具备接管所述第一网元的业务的条件,若是,则将所述切换指令发送给所述指令接收对象。
10.一种容灾切换装置,其特征在于,该装置包括:
指令生成单元,包括模板确定单元、参数确定单元和结合单元,所述模板确定单元,用于在故障检测装置确定第一网元发生故障后,根据预先设置的网元与切换指令模板的对应关系,确定所述第一网元的类型对应的切换指令模板;所述参数确定单元,用于获取所述切换指令模板中的容灾指令需要的输入参数;所述结合单元,用于将获取到的输入参数与相应的容灾指令结合,生成切换指令,该切换指令用于将所述第一网元的业务切换到所述第一网元对应的备份网元;
指令发送单元,用于根据预先配置的指令与指令接收对象的对应关系,确定所述切换指令对应的指令接收对象,并将所述切换指令发送给所述指令接收对象进行执行;
容灾倒回单元,用于在所述故障检测装置检测到所述第一网元的故障恢复时,生成倒回指令,该倒回指令用于将切换到所述备份网元的业务切换回所述第一网元,并将所述倒回指令发送给所述倒回指令对应的指令接收对象。
11.如权利要求10所述的装置,其特征在于,该装置还包括:
性能判断单元,用于获取所述备份网元的性能参数;根据所述备份网元的性能参数判断所述备份网元是否具备接管所述第一网元的业务的条件,若是,则指示所述指令发送单元将所述切换指令发送给所述指令接收对象。
CN2008102250010A 2008-10-24 2008-10-24 一种容灾切换方法、系统及装置 Active CN101426306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102250010A CN101426306B (zh) 2008-10-24 2008-10-24 一种容灾切换方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102250010A CN101426306B (zh) 2008-10-24 2008-10-24 一种容灾切换方法、系统及装置

Publications (2)

Publication Number Publication Date
CN101426306A CN101426306A (zh) 2009-05-06
CN101426306B true CN101426306B (zh) 2011-06-01

Family

ID=40616580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102250010A Active CN101426306B (zh) 2008-10-24 2008-10-24 一种容灾切换方法、系统及装置

Country Status (1)

Country Link
CN (1) CN101426306B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101997860B (zh) * 2009-08-25 2014-03-12 中兴通讯股份有限公司 一种ngn网络架构中通信链路检测管理的方法和装置
CN102056207B (zh) * 2009-10-29 2015-04-01 中兴通讯股份有限公司 容灾倒换的实现方法和系统
CN102891868B (zh) * 2011-07-19 2016-09-28 上海可鲁系统软件有限公司 一种分布式系统的负载均衡方法及装置
CN102291262B (zh) * 2011-09-01 2018-03-23 中兴通讯股份有限公司 一种容灾的方法、装置及系统
CN103188098B (zh) * 2011-12-30 2015-12-02 中国移动通信集团河南有限公司 一种容灾切换方法、系统以及装置
CN102820993A (zh) * 2012-08-16 2012-12-12 北京国创富盛通信股份有限公司 网络资源监控系统和网络资源监控方法
CN104348641A (zh) * 2013-07-30 2015-02-11 华为技术有限公司 一种故障的检测方法和故障检测装置
CN104869582B (zh) * 2015-04-28 2018-09-07 福建星网锐捷网络有限公司 一种无线网络备份方法和系统
CN106549791A (zh) * 2015-09-22 2017-03-29 北京信威通信技术股份有限公司 业务恢复处理方法及装置
CN107689879A (zh) * 2016-08-04 2018-02-13 中兴通讯股份有限公司 虚拟网元的管理方法及装置
CN106294028A (zh) * 2016-10-12 2017-01-04 北京智网科技股份有限公司 一种基于物理按键的一键应急设备及方法
CN106685817B (zh) * 2016-12-27 2020-05-12 中国移动通信集团江苏有限公司 一种用于盒端设备流量切换的方法和装置
CN106921746A (zh) * 2017-03-22 2017-07-04 重庆允升科技有限公司 一种数据同步系统及数据同步方法
CN109229102A (zh) * 2017-07-04 2019-01-18 百度在线网络技术(北京)有限公司 无人驾驶车辆控制系统、方法和装置
CN107508700B (zh) * 2017-08-15 2021-01-15 北京小米移动软件有限公司 容灾方法、装置、设备及存储介质
CN110019505A (zh) * 2017-09-15 2019-07-16 中兴通讯股份有限公司 一种数据中心容灾演练方法、装置、设备及存储介质
CN110633174A (zh) * 2018-06-22 2019-12-31 中兴通讯股份有限公司 容灾切换方法、设备以及计算机可读存储介质
CN109240816B (zh) * 2018-08-30 2020-11-10 世纪龙信息网络有限责任公司 系统方案切换方法、装置、计算机设备和存储介质
CN110177010B (zh) * 2019-05-07 2022-05-24 京信网络系统股份有限公司 一种链路切换方法及装置
CN110602685B (zh) * 2019-08-27 2022-05-10 中国—东盟信息港股份有限公司 一种号码位置无感知切换的安全隐私号容灾备份方法
CN112804277A (zh) * 2019-11-13 2021-05-14 中兴通讯股份有限公司 负荷控制信息发送方法、装置、设备和存储介质
CN111427704B (zh) * 2020-03-13 2024-05-28 平安科技(深圳)有限公司 配置指令的远程监控方法、装置、设备及存储介质
CN112463440A (zh) * 2020-11-13 2021-03-09 中国建设银行股份有限公司 容灾切换方法、系统、存储介质及计算机设备
CN114650214B (zh) * 2020-12-21 2024-09-27 顺丰科技有限公司 容灾切换方法、装置、计算机设备及存储介质
CN117170983B (zh) * 2023-11-02 2024-03-01 卓望数码技术(深圳)有限公司 容灾切换方法、系统、计算机设备及存储介质

Also Published As

Publication number Publication date
CN101426306A (zh) 2009-05-06

Similar Documents

Publication Publication Date Title
CN101426306B (zh) 一种容灾切换方法、系统及装置
CN103959845B (zh) 降低无线网络中的无线电链路失效数据量的方法和装置
CA3044045A1 (en) Methods and apparatus for capturing and/or using packets to facilitate fault detection
EP2676472B1 (en) Reporting in communications systems
CN100553213C (zh) 一种wlan异常快速恢复的方法及设备
CN101883374B (zh) 一种终端上报信息的方法及终端设备
US9456355B2 (en) Signaling tracing method, apparatus and system
CN110674096B (zh) 节点故障排查方法、装置、设备及计算机可读存储介质
US20030069959A1 (en) Alarm lists synchronization in an alarm management system
EP2568733A1 (en) Method and apparatus for collecting mobile communication data
CN112218321B (zh) 主备链路切换方法、装置、通信设备和存储介质
CN102045749A (zh) 一种实现邻区优化的方法、装置及系统
WO2012171168A1 (zh) 监控室内覆盖网络的方法、设备及系统
US20140155057A1 (en) Method and apparatus for associating reports
JP6544835B2 (ja) メッセージ処理方法及び装置
CN103299584A (zh) 用于在暂时性失去连接之后优化网络性能的方法
CN104038955B (zh) 一种移动通信系统中的故障检测及处理的方法及基站
CN113824595B (zh) 链路切换控制方法、装置和网关设备
CN113438608A (zh) 一种无线智能交互通信方法及通信系统
CN101917699A (zh) 基于用户的随机上报信令跟踪方法和装置
CN100407838C (zh) 基站子系统业务恢复的自动检测方法及装置
CN106488489B (zh) 一种恢复用户业务数据的方法及装置
CN115022877B (zh) 终端鉴权方法、装置、电子设备及计算机可读存储介质
JP6844824B2 (ja) メッセージ処理方法及び装置
KR101146836B1 (ko) 매니저 고장시 관리 네트워크를 운영하기 위한 방법 및설비들

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant