CN103546914A - 一种hss主备管理的方法及装置 - Google Patents

一种hss主备管理的方法及装置 Download PDF

Info

Publication number
CN103546914A
CN103546914A CN201310495260.6A CN201310495260A CN103546914A CN 103546914 A CN103546914 A CN 103546914A CN 201310495260 A CN201310495260 A CN 201310495260A CN 103546914 A CN103546914 A CN 103546914A
Authority
CN
China
Prior art keywords
hss
host node
node
slave
hss host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310495260.6A
Other languages
English (en)
Other versions
CN103546914B (zh
Inventor
李小康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datang Mobile Communications Equipment Co Ltd
Original Assignee
Datang Mobile Communications Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datang Mobile Communications Equipment Co Ltd filed Critical Datang Mobile Communications Equipment Co Ltd
Priority to CN201310495260.6A priority Critical patent/CN103546914B/zh
Publication of CN103546914A publication Critical patent/CN103546914A/zh
Application granted granted Critical
Publication of CN103546914B publication Critical patent/CN103546914B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种HSS主备管理的方法,用以保障HSS设备的可靠性和稳定性。该方法为:系统配置阶段,在HSS主节点和HSS备节点各创建一块相同大小的磁盘进行分布式复制块设备DRBD同步,形成磁盘镜像区;系统运行阶段,将磁盘镜像区的挂载点挂载在HSS主节点上,令HSS主节点产生的数据实时在所述磁盘镜像区中备份,以及实时监测HSS主节点的运行状态,确定HSS主节点的运行状态发生异常时,将服务切换至HSS备节点以及将所述磁盘镜像区的挂载点挂载在HSS备节点上。这样不仅保证HSS主节点在出现故障时可以及时切换至HSS备节点,还可以保证切换后数据可以实时同步。

Description

一种HSS主备管理的方法及装置
技术领域
本发明涉及通信领域,尤其涉及一种HSS主备管理的方法及装置。
背景技术
归属签约用户服务器(Home Subscriber Server,HSS)作为通信网络中重要的组成部分,其主要用于存储用户数据和签约数据,以及向发起请求的网元提供数据服务,因此,任何原因导致的软件或硬件故障,如计划性停机(版本升级或周期性维护)、突发性停机(宕机或断电),都将直接导致部分用户数据或业务数据无法使用,从而影响通信网络的正常使用。
主备管理是一种保证设备可靠性的技术,它可以保证主设备正常运行时,备设备对数据做备份处理。当主设备出现故障时,系统能将业务及时切换到备设备,保证业务不间断的进行。目前现有的HSS主备方案主要是利用数据库系统Mysql自带的复制技术,实现HSS主备节点的用户数据及业务数据的实时同步,并通过第三方软件实现HSS主备节点间的健康检查。参阅图1所示的场景,HSS主节点上的用户数据及业务数据是通过Mysql自带的复制功能从HSS主节点数据库(即图1所示的DB主)复制到备节点数据库(即图1所示的DB备),但这种方式的数据同步过于依赖数据库本身,灵活性较差。版本文件的同步则需要在HSS主节点进行周期性备份,并通过网络传输到备节点的指定路径,再人为的对备节点的版本进行升级,导致了升级速度慢、不及时的问题。
现有的HSS主备方案属于热备,即HSS主备节点同时运行。HSS主备节点的健康检查通过第三方软件来实现,通常采用传输控制协议(TransmissionControl Protocol,TCP)方式进行心跳检测。HSS主备节点通过第三方软件对外呈现一个虚拟IP来提供服务,当第三方软件检测到HSS主节点心跳丢失时,该虚拟IP会绑定到备节点上,由HSS备节点代替HSS主节点继续提供服务。这种使用第三方软件对HSS主备节点健康检查的方式主要依靠网络通信的方式,即通过检测HSS主节点的网络连接是否正常来判定HSS主节点的运行是否正常。通过这种检测网络连接方式进行对HSS主备节点的健康检查不但方式单一,而且当HSS主节点运行异常,但网络连接依然正常,就可能会通过网络连接的状态判定HSS主节点运行正常,导致HSS主备节点无法及时切换,造成业务的中断。
保证HSS设备的可靠性和稳定性即要保证HSS主节点出现故障时,可以立即切换到HSS备节点,切换后保证数据可以实时同步。由此可见,现有技术中的HSS主备方案,无法保证HSS主节点一出现故障,就能立即切换到备节点,而且数据的同步还要依赖数据库自身复制功能,灵活性差,因此现有技术的HSS主备方案无法保证HSS设备的可靠性和稳定性。
发明内容
本发明实施例提供一种HSS主备管理的方法及装置,用以解决现有技术中存在的由于数据同步过于依赖数据库,灵活性差,以及对HSS主备节点健康检查方式单一,而导致的HSS主备节点无法及时切换,以及在切换后无法实时同步,造成业务中断,无法保证HSS设备的可靠性和稳定性的问题。
本发明实施例提供的具体技术方案如下:
第一方面,一种HSS主备管理的方法,包括:
系统配置阶段,在HSS主节点和HSS备节点各创建一块相同大小的磁盘进行分布式复制块设备(Distributed Replicated Block Device,DRBD)同步,形成磁盘镜像区;
系统运行阶段,将磁盘镜像区的挂载点挂载在HSS主节点上,令HSS主节点产生的数据实时在磁盘镜像区中备份,以及实时监测HSS主节点的运行状态,确定HSS主节点的运行状态发生异常时,将服务切换至HSS备节点以及将磁盘镜像区的挂载点挂载在HSS备节点上。
通过这种可能的实现方式,可以保证HSS设备的可靠性和稳定性,当HSS主节点出现故障时,可以及时切换至HSS备节点,切换后HSS主设备的数据也可以及时同步。
结合第一方面,在第一种可能的实现方式中,令HSS主节点产生的数据实时在磁盘镜像区中备份,包括:
将HSS主节点产生的数据实时在HSS主节点创建的磁盘备份,以及将HSS主节点创建的磁盘中存储的数据通过磁盘镜像实时拷贝至HSS备节点创建的磁盘中。
通过这种可能的实现方式,可以保证HSS主节点产生的数据实时同步至HSS备节点,因此,当切换后HSS备节点数据与HSS主节点的数据保持一致,使得HSS设备对外呈现不发生改变,保证了用户使用的稳定性。
结合第一方面,在第二种可能的实现方式中,实时监测HSS主节点的运行状态,包括:
通过在HSS主节点和HSS备节点之间设置至少一条心跳信道用来检测HSS主节点是否正常运行;或者,
通过实时检测HSS主节点的磁盘镜像区的运行状态来检测HSS主节点是否正常运行;或者,
通过在HSS主节点和HSS备节点之间设置的交换机,采用第三方IP来检测HSS主节点是否正常运行;或者,
通过GreatTurbo HA脚本文件监测HSS主节点上HSS应用或数据库的进程运行状态来检测HSS主节点是否正常运行。
通过这种可能的实现方式,由以上四种方式对HSS主节点的运行状况实时监测,可以在HSS主节点出现上述任意一种或多种情况时,将服务及时切换至HSS备节点,不会造成服务的中断。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,通过在HSS主节点和HSS备节点之间设置至少一条心跳信道用来检测HSS主节点是否正常运行,包括:
在HSS主节点和HSS备节点之间设置至少一条直连网线作为心跳信道;
在HSS备节点通过心跳信道向HSS主节点多次发包,在确定HSS主节点未作出响应后,判定HSS主节点运行异常。
结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,在HSS备节点通过心跳信道向HSS主节点多次发包,在确定HSS主节点未作出响应后,判定HSS主节点运行异常,具体包括:
在HSS备节点通过心跳信道向HSS主节点多次发包,在确认HSS主节点未作出响应后,直接判定HSS主节点运行异常;或者,
在HSS备节点通过心跳信道向HSS主节点多次发包,在确认HSS主节点未作出响应后,继续通过在HSS主节点和HSS备节点之间设置的交换机,采用第三方IP来向HSS主节点继续发包,在确认HSS主节点仍未响应后,判定HSS主节点运行异常。
通过这种可能的实现方式,由两种情况判断HSS主节点的运行状态,可以保证在心跳信道出现故障时,还能通过另外一种第三方IP的方式继续检测HSS主节点的运行状态,避免了HSS主节点因为心跳信道出现故障不能及时切换至HSS备节点的问题。
结合第一方面的上述任意一种可能的实现方式,在第五种可能的实现方式中,将服务切换至HSS备节点,包括:
停止HSS主节点的HSS应用和数据库的进程,启动HSS备节点的HSS应用和数据库的进程。
通过这种可能的实现方式,管理装置通过控制HSS主节点和HSS备节点的HSS应用和数据库进程就能轻松完成HSS主备设备之间的自由切换。
结合第一方面的第一种至第四种任意一种可能的实现方式,在第六种可能的实现方式中,进一步包括:
确定存在HSS应用的升级包时,将HSS应用的升级包上传至HSS主节点;
在确认HSS主节点升级成功后,将HSS应用的升级包在磁盘镜像区备份;
将服务切换至HSS备节点后,先对磁盘镜像区进行扫描,若确认磁盘镜像区存在HSS应用的升级包,则根据HSS应用的升级包对HSS备节点进行升级。
通过这种可能的实现方式,可以通过管理装置直接对HSS备节点进行升级,不再需要人为对HSS备节点进行升级。
第二方面,一种HSS主备管理的装置,包括:
配置单元,用于系统配置阶段,在HSS主节点和HSS备节点各创建一块相同大小的磁盘进行分布式复制块设备DRBD同步,形成磁盘镜像区;
管理单元,用于系统运行阶段,将磁盘镜像区的挂载点挂载在HSS主节点上,令HSS主节点产生的数据实时在磁盘镜像区中备份,以及实时监测HSS主节点的运行状态,确定HSS主节点的运行状态发生异常时,将服务切换至HSS备节点以及将磁盘镜像区的挂载点挂载在HSS备节点上。
结合第二方面,在第一种可能的实现方式中,管理单元令HSS主节点产生的数据实时在磁盘镜像区中备份,包括:
将HSS主节点产生的数据实时在HSS主节点创建的磁盘备份,以及将HSS主节点创建的磁盘中存储的数据通过磁盘镜像实时拷贝至HSS备节点创建的磁盘中。
结合第二方面,在第二种可能的实现方式中,管理单元实时监测HSS主节点的运行状态,包括:
通过在HSS主节点和HSS备节点之间设置至少一条心跳信道用来检测HSS主节点是否正常运行;或者,
通过实时检测HSS主节点的磁盘镜像区的运行状态来检测HSS主节点是否正常运行;或者,
通过在HSS主节点和HSS备节点之间设置的交换机,采用第三方IP来检测HSS主节点是否正常运行;或者,
通过GreatTurbo HA脚本文件监测HSS主节点上HSS应用或数据库的进程运行状态来检测HSS主节点是否正常运行。
结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,管理单元通过在HSS主节点和HSS备节点之间设置至少一条心跳信道用来检测HSS主节点是否正常运行,包括:
在HSS主节点和HSS备节点之间设置至少一条直连网线作为心跳信道;
在HSS备节点通过心跳信道向HSS主节点多次发包,在确定HSS主节点未作出响应后,判定HSS主节点运行异常。
结合第二方面的第三种可能的实现方式,在第四种可能的实现方式中,管理单元在HSS备节点通过心跳信道向HSS主节点多次发包,在确定HSS主节点未作出响应后,判定HSS主节点运行异常,具体包括:
在HSS备节点通过心跳信道向HSS主节点多次发包,在确认HSS主节点未作出响应后,直接判定HSS主节点运行异常;或者,
在HSS备节点通过心跳信道向HSS主节点多次发包,在确认HSS主节点未作出响应后,继续通过在HSS主节点和HSS备节点之间设置的交换机,采用第三方IP来向HSS主节点继续发包,在确认HSS主节点仍未响应后,判定HSS主节点运行异常。
结合第二方面的上述任意一种可能的实现方式,在第五种可能的实现方式中,管理单元将服务切换至HSS备节点,包括:
停止HSS主节点的HSS应用和数据库的进程,启动HSS备节点的HSS应用和数据库的进程。
结合第二方面的第一种至第四种任意一种可能的实现方式,在第六种可能的实现方式中,管理单元进一步用于:
确定存在HSS应用的升级包时,将HSS应用的升级包上传至HSS主节点;
在确认HSS主节点升级成功后,将HSS应用的升级包在磁盘镜像区备份;
将服务切换至HSS备节点后,先对磁盘镜像区进行扫描,若确认磁盘镜像区存在HSS应用的升级包,则根据HSS应用的升级包对HSS备节点进行升级。
本发明实施例提供的方法可以保证HSS设备的可靠性和稳定性,解决现有技术中数据同步过于依赖数据库,灵活性较差,HSS主节点出现故障时无法及时切换至HSS备节点以及切换后数据无法实时同步,造成业务中断的问题。
附图说明
图1为现有技术中的HSS主备拓扑图;
图2为本发明的HSS主备管理的流程图;
图3为本发明的HSS主备拓扑图;
图4为本发明的HSS主备管理的装置图。
具体实施方式
为了保证HSS设备的可靠性和稳定性,解决现有技术中数据同步过于依赖数据库,灵活性较差,HSS主节点出现故障时无法及时切换至HSS备节点以及切换后数据无法实时同步,造成业务中断的问题,本发明实施例提供了HSS主备管理的方法及装置。
以下结合说明书附图对本发明的优选实施例进行说明。
参阅图2所示,本发明实施例中,HSS主备管理的具体流程如下:
步骤200:系统配置阶段,管理装置在HSS主节点和HSS备节点各创建一块相同大小的磁盘进行分布式复制块设备DRBD同步,形成磁盘镜像区。
本实施例中,管理装置可以采用分布式方式设置在HSS主节点和HSS备节点上,或者,也可以单独设置在HSS主节点和HSS备节点之间的一个终端上,这个终端可以是个人电脑、笔记本等等,也可以是服务器,在此不再一一赘述。
步骤210:系统运行阶段,管理装置将磁盘镜像区的挂载点挂载在HSS主节点上,令HSS主节点产生的数据实时在磁盘镜像区中备份,以及实时监测HSS主节点的运行状态,确定HSS主节点的运行状态发生异常时,将服务切换至HSS备节点以及将磁盘镜像区的挂载点挂载在HSS备节点上。
具体的,管理装置将磁盘镜像区的挂载点挂载在HSS主节点上,令HSS主节点产生的数据实时在磁盘镜像区中备份,即将HSS主节点产生的数据实时在HSS主节点创建的磁盘备份,以及将HSS主节点创建的磁盘中存储的数据通过磁盘镜像实时拷贝至HSS备节点创建的磁盘中。
另一方面,在对HSS主节点和HSS备节点上的HSS应用进行升级时,可以采用以下方式:将HSS应用的升级包上传至HSS主节点的HSS应用后台;在确认HSS主节点升级成功后,将HSS应用的升级包在磁盘镜像区备份,在将服务切换至HSS备节点后,先对磁盘镜像区进行扫描,若确认磁盘镜像区中存在HSS应用的升级包,则将HSS应用的升级包拷贝至HSS备节点的指定存储位置,再根据HSS应用的升级包对HSS备节点进行升级。
实时监测HSS主节点的运行状态是否正常的具体流程如下:
第一种情况:通过在HSS主节点和HSS备节点之间设置至少一条直连网线作为心跳信道用来检测HSS主节点是否正常运行。
具体的,在HSS备节点通过心跳信道向HSS主节点多次发包,确定HSS主节点未作出响应后,判定HSS主节点运行异常。
第二种情况:通过在HSS主节点和HSS备节点之间设置交换机,采用一个第三方IP来检测HSS主节点是否正常运行。
具体的,通过HSS主节点和HSS备节点之间的交换机,采用第三方IP向HSS主节点发包,检查交换机与HSS主节点的网络连接状态,在确认HSS主节点未响应后,判定HSS主节点运行异常。
进一步的,第一种情况和第二种情况也可以结合使用,具体为:在HSS备节点通过心跳信道向HSS主节点多次发包,确定HSS主节点未作出响应后,进一步可以通过在HSS主节点和HSS备节点之间的交换机,采用第三方IP向HSS主节点发包,检查交换机与HSS主节点的网络连接状态,在确认HSS主节点仍未响应后,判定HSS主节点运行异常。
第三种情况:通过实时检测HSS主节点的磁盘镜像区的运行状态来检测HSS主节点是否正常运行。
具体的,实时检测HSS主节点的磁盘镜像区的运行状态,若确定HSS主节点的磁盘镜像区运行异常,则判定HSS主节点运行异常。
第四种情况:通过GreatTurbo HA脚本文件监测HSS主节点的HSS应用或数据库的进程运行状态来检测HSS主节点是否正常运行。
具体的,周期性监测HSS主节点上HSS应用或数据库的进程运行状态,若确定HSS应用或数据库的任意一个进程运行异常,则判定HSS主节点运行异常。
在判定HSS主节点的运行状态异常后,管理装置将服务切换至HSS备节点,具体步骤包括:停止HSS主节点的HSS应用和数据库的进程,启动HSS备节点的HSS应用和数据库的进程。切换至HSS备节点的同时将磁盘镜像区的挂载点挂载在HSS备节点上。
下面结合附图,用具体实施例对本发明提供的方法进行详细描述。
参阅图3所示的场景,在本实施例中的HSS主备管理的方案是将HSS应用和GreatTurbo HA软件相结合,用户数据和业务数据同步以及版本文件同步、HSS主节点和HSS备节点间的健康检查以及HSS主备切换都是通过GreatTurbo HA软件控制的。GreatTurbo HA软件将HSS应用和其所使用的Mysql数据库看做是一个服务,GreatTurbo HA软件的所有操作都针对服务进行。HSS主节点和HSS备节点之间的数据同步也是通过GreatTurbo HA软件提供的磁盘镜像功能实现,以及HSS主节点和HSS备节点之间的心跳检测都是通过GreatTurbo HA软件来实现。以下对HSS主备管理的方案进行详细介绍。
在系统配置阶段,为两台空的服务器安装操作系统,同时,安装HSS应用和GreatTurbo HA软件,使得这两台空的服务器可以作为HSS服务器对外提供服务。其中,这两台HSS服务器对应HSS主节点和HSS备节点。
配置好HSS服务器以后,为HSS主节点和HSS备节点各创建一块相同大小的磁盘,将该两块相同大小的磁盘进行DRBD同步,保证了该两块磁盘的连续性,使同步后的两块磁盘对于HSS主节点和HSS备节点而言,可以当做一个虚拟的共享磁盘阵列使用。经过上述配置,使得该两块相同大小的磁盘成为磁盘镜像区。该磁盘镜像区在物理上为两块设置于HSS主节点和HSS备节点上的磁盘,逻辑上可以看成设置于HSS主节点和HSS备节点之间的一块磁盘。
当配置好磁盘镜像区后,启动GreatTurbo HA软件,使用GreatTurbo HA脚本文件进行配置,在初始配置服务阶段,需要设置一个优先节点,其中,优先节点是指:在初始阶段,指定HSS主节点为优先级高的节点;在运行阶段,当满足HSS主备切换条件时,在切换后,将HSS备节点设置为优先节点。
因此,当HSS主节点和HSS备节点都启动时,服务就会根据配置信息,先在HSS主节点上运行,即将磁盘镜像区的挂载点挂载在HSS主节点上,以及修改Mysql数据库的存储路径,将其指向磁盘镜像区。
在系统运行阶段,进行数据同步的具体实现步骤如下:
数据同步包括用户数据及业务数据同步和版本文件同步两部分,两者都是通过GreatTurbo HA软件提供的磁盘镜像实现的,但两者的实现方式并不相同。
通过将磁盘镜像区的挂载点挂载在HSS主节点上,令HSS主节点产生的用户数据及业务数据实时在磁盘镜像区中备份,其中,磁盘镜像区的挂载点始终挂载在对外提供服务的HSS设备上,也即挂载在优先节点上;以及用户数据及业务数据同步是通过修改Mysql数据库的存储路径,将其指向磁盘镜像区实现的。具体的,将磁盘镜像区设置为/mysqldata目录,对my.cnf文件的修改如下:
……
[mysqld]
Datadir=/mysqldata
……
将HSS主节点产生的用户数据及业务数据实时存储在磁盘镜像区,即存储到HSS主节点磁盘镜像区对应的物理磁盘上,通过GreatTurbo HA软件提供的磁盘镜像功能将产生的用户数据及业务数据拷贝至HSS备节点磁盘镜像区对应的物理磁盘上。
版本文件同步主要用于对HSS主节点和HSS备节点的升级,是通过HSS应用以及磁盘镜像功能实现的。维护人员通过图3指示的维护设备,将HSS应用的升级包上传至HSS主节点的HSS应用后台,进行HSS主节点的升级,若确定HSS主节点的HSS应用升级成功,则GreatTurbo HA软件将HSS应用的升级包拷贝至磁盘镜像区,与用户数据及业务数据同步相同的,将HSS应用的升级包存储至磁盘镜像区,即存储到HSS主节点磁盘镜像区对应的物理磁盘上,通过磁盘镜像功能拷贝至HSS备节点磁盘镜像区对应的物理磁盘上。本实施例中,采用的是冷备方案,即HSS主节点向外提供服务时,HSS备节点处于待机状态,当切换至HSS备节点,HSS备节点向外提供服务,HSS主节点处于待机状态。因此,在同步过程中,当切换至HSS备节点,将服务交由HSS备节点时,先对磁盘镜像区进行扫描,若发现HSS应用的升级包,将该HSS应用的升级包拷贝至HSS备节点的指定存储位置,再根据HSS应用的升级包对HSS备节点进行升级。
因每次将HSS主节点切换至HSS备节点以后,都会将磁盘镜像区的挂载点挂载在HSS备节点上,而逻辑上可以将磁盘镜像区看作是在HSS主节点和HSS备节点之间的一块磁盘,所以,在切换至HSS备节点以后,当产生用户数据和业务数据时,就能实时备份在磁盘镜像区,不会造成数据丢失的问题。
参阅图3所示,在系统运行阶段,管理装置实时监测HSS主节点的运行状态,判定HSS主节点是否运行异常的具体流程如下:
第一种情况:在HSS主节点和HSS备节点之间设置至少一条直连网线作为心跳信道,使得HSS备节点可以通过心跳信道对HSS主节点进行心跳检测,即对HSS主节点的运行状态进行检测。本实施例中,设置两条直连网线作为心跳信道1和心跳信道2,只设置一条心跳信道时,在该心跳信道出现故障,可能无法及时的完成HSS主节点和HSS备节点之间的切换,因此,设置两条心跳信道目的是保证一条心跳信道出现故障时,可以继续使用另外一条心跳信道。进行心跳检测的过程如下,在GreatTurbo HA软件上配置心跳检测的频率,根据配置心跳检测的频率,在HSS备节点通过心跳信道向HSS主节点发包,确定HSS主节点有响应,则继续由HSS主节点向外提供服务,在确认经过多次向HSS主节点发包pingHSS主节点,而HSS主节点都未响应,则判定HSS主节点运行异常。
第二种情况:进一步的,为了提高系统的可靠性,在HSS主节点和HSS备节点之间的交换机配置了第三方IP,为保证HSS主节点和HSS备节点都能连通,一般情况将第三方IP配置为网关地址。
具体的,通过在HSS主节点和HSS备节点之间的设置交换机,采用第三方IP向HSS主节点发包,检查交换机与HSS主节点的网络连接状态,在确认HSS主节点未响应后,判定HSS主节点运行异常。
进一步的,第一种情况和第二种情况也可以结合使用,具体为:在HSS备节点通过心跳信道向HSS主节点多次发包,确定HSS主节点未作出响应后,进一步可以通过在HSS主节点和HSS备节点之间的设置交换机,采用第三方IP向HSS主节点发包,GreatTurbo HA软件通过上述心跳检测和第三方IP对应的交换机进行的心跳检测后,在确认HSS主节点的心跳丢失或者第三方IP对应的交换机与HSS主节点无法连接时,判定HSS主节点运行异常。
第三种情况:实时检测HSS主节点的磁盘镜像区的运行状态,当检测到HSS主节点的磁盘镜像区出现磁盘坏道等故障时,GreatTurbo HA软件接收到HSS主节点和HSS备节点的DRBD同步报错,由此判定HSS主节点运行异常。
第四种情况:GreatTurbo HA软件在运行过程中会周期性的通过脚本文件对HSS主节点的HSS应用和Mysql数据库的服务状态进行监测,在确认HSS应用和Mysql数据库任意一个进程运行异常或者停止时,由此判定HSS主节点运行异常。
在系统运行过程中,每当出现上述四种情况中任意一种或多种时,GreatTurbo HA软件就会将服务切换到HSS备节点,由HSS备节点提供服务。
由HSS主节点切换至HSS备节点提供服务的过程包括:通过GreatTurboHA软件停止HSS主节点的HSS应用和数据库的进程,启动HSS备节点的HSS应用和数据库的进程,同时将磁盘镜像区的挂载点挂载在HSS备节点上,完成本次HSS主备管理。
另一方面,本发明实施例中,较佳的,HSS主节点和HSS备节点对外以一个浮动IP呈现,即从整个通信网络看,只有一台HSS设备对外服务,该一台HSS设备的IP始终为上述浮动IP,浮动IP作为一个逻辑端口绑定在HSS服务器的网卡上,HSS主节点与HSS备节点之间的切换只需要与浮动IP建联,使得HSS主备切换时间迅速,对外呈现的时间差较小。
基于同一发明构思,根据本发明上述实施例提供的一种HSS主备管理的方法,相应地,本发明另一实施例还提供了一种主备管理的装置,装置结构示意图如图4所示,具体包括:配置单元400和管理单元410,其中,
配置单元400,用于系统配置阶段,在HSS主节点和HSS备节点各创建一块相同大小的磁盘进行分布式复制块设备DRBD同步,形成磁盘镜像区;
管理单元410,用于系统运行阶段,将磁盘镜像区的挂载点挂载在HSS主节点上,令HSS主节点产生的数据实时在磁盘镜像区中备份,以及实时监测HSS主节点的运行状态,确定HSS主节点的运行状态发生异常时,将服务切换至HSS备节点以及将磁盘镜像区的挂载点挂载在HSS备节点上。
管理单元410令HSS主节点产生的数据实时在磁盘镜像区中备份,包括:
将HSS主节点产生的数据实时在HSS主节点创建的磁盘备份,以及将HSS主节点创建的磁盘中存储的数据通过磁盘镜像实时拷贝至HSS备节点创建的磁盘中。
管理单元410实时监测HSS主节点的运行状态,包括:
通过在HSS主节点和HSS备节点之间设置至少一条心跳信道用来检测HSS主节点是否正常运行;或者,
通过实时检测HSS主节点的磁盘镜像区的运行状态来检测HSS主节点是否正常运行;或者,
通过在HSS主节点和HSS备节点之间设置的交换机,采用第三方IP来检测HSS主节点是否正常运行;或者,
通过GreatTurbo HA脚本文件监测HSS主节点上HSS应用或数据库的进程运行状态来检测HSS主节点是否正常运行。
管理单元410通过在HSS主节点和HSS备节点之间设置至少一条心跳信道用来检测HSS主节点是否正常运行,包括:
在HSS主节点和HSS备节点之间设置至少一条直连网线作为心跳信道;
在HSS备节点通过心跳信道向HSS主节点多次发包,在确定HSS主节点未作出响应后,判定HSS主节点运行异常。
管理单元410在HSS备节点通过心跳信道向HSS主节点多次发包,在确定HSS主节点未作出响应后,判定HSS主节点运行异常,具体包括:
在HSS备节点通过心跳信道向HSS主节点多次发包,在确认HSS主节点未作出响应后,直接判定HSS主节点运行异常;或者,
在HSS备节点通过心跳信道向HSS主节点多次发包,在确认HSS主节点未作出响应后,继续通过在HSS主节点和HSS备节点之间设置的交换机,采用第三方IP来向HSS主节点继续发包,在确认HSS主节点仍未响应后,判定HSS主节点运行异常。
管理单元410将服务切换至HSS备节点,包括:
停止HSS主节点的HSS应用和数据库的进程,启动HSS备节点的HSS应用和数据库的进程。
管理单元410进一步用于:确定存在HSS应用的升级包时,将HSS应用的升级包上传至HSS主节点;
在确认HSS主节点升级成功后,将HSS应用的升级包在磁盘镜像区备份;
将服务切换至HSS备节点后,先对磁盘镜像区进行扫描,若确认磁盘镜像区存在HSS应用的升级包,则根据HSS应用的升级包对HSS备节点进行升级。
由此可见,通过本发明实施例中提供的HSS主备管理的方案,可以通过GreatTurbo HA软件提供的磁盘镜像功能实现HSS用户数据和业务数据实时同步以及版本文件的实时同步,并且通过DRBD同步的检测可以实时发现HSS主节点和HSS备节点之间的磁盘镜像区是否正常来判定HSS主节点的运行状态是否正常,使用直连网线实现HSS主节点和HSS备节点之间的心跳检测、采用第三方IP向HSS主节点发包的方式实现HSS主节点和HSS备节点之间的心跳检测以及使用GreatTurbo HA脚本文件检测HSS主节点的HSS应用或数据库的进程运行状态的方法来检测HSS主节点的运行状态是否正常,这些方法都使得HSS主节点和HSS备节点的健康检查更为可靠。
现有技术中的HSS主备方案在数据同步上一般都基于数据库自身的功能实现,版本文件同步只能借助于HSS应用自身来实现,在设计上比较复杂。而且HSS主节点和HSS备节点之间的健康检查通常只根据网络连接来判断HSS主节点的运行是否正常,这样的方式不仅单一,而且也不可靠。本实施例中的HSS主备管理的方案是将HSS应用和GreatTurbo HA软件相结合,用户数据和业务数据的同步以及版本文件的同步和HSS主节点与HSS备节点之间的健康检查都是通过GreatTurbo HA软件来控制的,通过磁盘镜像功能和网卡的相关配置来实现,完全不对HSS应用做任何修改,应用方式较灵活,使得进行HSS主备切换时,在发现四种情况中的任何一种都能及时的切换至HSS备节点,在切换以后通过将磁盘镜像区的挂载点挂载在HSS备节点上,使得切换后的数据也能及时同步至HSS备节点,使得新产生的数据可以实时在HSS备节点备份,使得HSS设备的稳定性和可靠性更高。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种HSS主备管理的方法,其特征在于,所述方法包括:
系统配置阶段,在HSS主节点和HSS备节点各创建一块相同大小的磁盘进行分布式复制块设备DRBD同步,形成磁盘镜像区;
系统运行阶段,将磁盘镜像区的挂载点挂载在HSS主节点上,令HSS主节点产生的数据实时在所述磁盘镜像区中备份,以及实时监测HSS主节点的运行状态,确定HSS主节点的运行状态发生异常时,将服务切换至HSS备节点以及将所述磁盘镜像区的挂载点挂载在HSS备节点上。
2.如权利要求1所述的方法,其特征在于,令HSS主节点产生的数据实时在所述磁盘镜像区中备份,包括:
将所述HSS主节点产生的数据实时在所述HSS主节点创建的磁盘备份,以及将所述HSS主节点创建的磁盘中存储的数据通过磁盘镜像实时拷贝至所述HSS备节点创建的磁盘中。
3.如权利要求1所述的方法,其特征在于,实时监测HSS主节点的运行状态,包括:
通过在所述HSS主节点和所述HSS备节点之间设置至少一条心跳信道用来检测所述HSS主节点是否正常运行;或者,
通过实时检测所述HSS主节点的磁盘镜像区的运行状态来检测所述HSS主节点是否正常运行;或者,
通过在所述HSS主节点和所述HSS备节点之间设置的交换机,采用第三方IP来检测HSS主节点是否正常运行;或者,
通过GreatTurbo HA脚本文件监测HSS主节点上HSS应用或数据库的进程运行状态来检测HSS主节点是否正常运行。
4.如权利要求3所述的方法,其特征在于,通过在所述HSS主节点和所述HSS备节点之间设置至少一条心跳信道用来检测所述HSS主节点是否正常运行,包括:
在所述HSS主节点和所述HSS备节点之间设置至少一条直连网线作为心跳信道;
在所述HSS备节点通过心跳信道向所述HSS主节点多次发包,在确定所述HSS主节点未作出响应后,判定所述HSS主节点运行异常。
5.如权利要求4所述的方法,其特征在于,在所述HSS备节点通过心跳信道向所述HSS主节点多次发包,在确定所述HSS主节点未作出响应后,判定所述HSS主节点运行异常,具体包括:
在所述HSS备节点通过心跳信道向所述HSS主节点多次发包,在确认所述HSS主节点未作出响应后,直接判定所述HSS主节点运行异常;或者,
在所述HSS备节点通过心跳信道向所述HSS主节点多次发包,在确认所述HSS主节点未作出响应后,继续通过在所述HSS主节点和所述HSS备节点之间设置的交换机,采用第三方IP来向所述HSS主节点继续发包,在确认所述HSS主节点仍未响应后,判定所述HSS主节点运行异常。
6.如权利要求1-5任一项所述的方法,其特征在于,将服务切换至HSS备节点,包括:
停止所述HSS主节点的HSS应用和数据库的进程,启动所述HSS备节点的HSS应用和数据库的进程。
7.如权利要求1-5任一项所述的方法,其特征在于,进一步包括:
确定存在HSS应用的升级包时,将所述HSS应用的升级包上传至HSS主节点;
在确认所述HSS主节点升级成功后,将HSS应用的升级包在磁盘镜像区备份;
将服务切换至HSS备节点后,先对磁盘镜像区进行扫描,若确认磁盘镜像区存在HSS应用的升级包,则根据HSS应用的升级包对HSS备节点进行升级。
8.一种HSS主备管理的装置,其特征在于,所述装置包括:
配置单元,用于系统配置阶段,在HSS主节点和HSS备节点各创建一块相同大小的磁盘进行分布式复制块设备DRBD同步,形成磁盘镜像区;
管理单元,用于系统运行阶段,将磁盘镜像区的挂载点挂载在HSS主节点上,令HSS主节点产生的数据实时在所述磁盘镜像区中备份,以及实时监测HSS主节点的运行状态,确定HSS主节点的运行状态发生异常时,将服务切换至HSS备节点以及将所述磁盘镜像区的挂载点挂载在HSS备节点上。
9.如权利要求8所述的装置,其特征在于,所述管理单元令HSS主节点产生的数据实时在所述磁盘镜像区中备份,包括:
将所述HSS主节点产生的数据实时在所述HSS主节点创建的磁盘备份,以及将所述HSS主节点创建的磁盘中存储的数据通过磁盘镜像实时拷贝至所述HSS备节点创建的磁盘中。
10.如权利要求8所述的装置,其特征在于,所述管理单元实时监测HSS主节点的运行状态,包括:
通过在所述HSS主节点和所述HSS备节点之间设置至少一条心跳信道用来检测所述HSS主节点是否正常运行;或者,
通过实时检测所述HSS主节点的磁盘镜像区的运行状态来检测所述HSS主节点是否正常运行;或者,
通过在所述HSS主节点和所述HSS备节点之间设置的交换机,采用第三方IP来检测HSS主节点是否正常运行;或者,
通过GreatTurbo HA脚本文件监测HSS主节点上HSS应用或数据库的进程运行状态来检测HSS主节点是否正常运行。
11.如权利要求10所述的装置,其特征在于,所述管理单元通过在所述HSS主节点和所述HSS备节点之间设置至少一条心跳信道用来检测所述HSS主节点是否正常运行,包括:
在所述HSS主节点和所述HSS备节点之间设置至少一条直连网线作为心跳信道;
在所述HSS备节点通过心跳信道向所述HSS主节点多次发包,在确定所述HSS主节点未作出响应后,判定所述HSS主节点运行异常。
12.如权利要求11所述的装置,其特征在于,所述管理单元在所述HSS备节点通过心跳信道向所述HSS主节点多次发包,在确定所述HSS主节点未作出响应后,判定所述HSS主节点运行异常,具体包括:
在所述HSS备节点通过心跳信道向所述HSS主节点多次发包,在确认所述HSS主节点未作出响应后,直接判定所述HSS主节点运行异常;或者,
在所述HSS备节点通过心跳信道向所述HSS主节点多次发包,在确认所述HSS主节点未作出响应后,继续通过在所述HSS主节点和所述HSS备节点之间设置的交换机,采用第三方IP来向所述HSS主节点继续发包,在确认所述HSS主节点仍未响应后,判定所述HSS主节点运行异常。
13.如权利要求8-12任一项所述的装置,其特征在于,所述管理单元将服务切换至HSS备节点,包括:
停止所述HSS主节点的HSS应用和数据库的进程,启动所述HSS备节点的HSS应用和数据库的进程。
14.如权利要求8-12任一项所述的装置,其特征在于,所述管理单元进一步用于:
确定存在HSS应用的升级包时,将所述HSS应用的升级包上传至HSS主节点;
在确认所述HSS主节点升级成功后,将HSS应用的升级包在磁盘镜像区备份;
将服务切换至HSS备节点后,先对磁盘镜像区进行扫描,若确认磁盘镜像区存在HSS应用的升级包,则根据HSS应用的升级包对HSS备节点进行升级。
CN201310495260.6A 2013-10-21 2013-10-21 一种hss主备管理的方法及装置 Active CN103546914B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310495260.6A CN103546914B (zh) 2013-10-21 2013-10-21 一种hss主备管理的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310495260.6A CN103546914B (zh) 2013-10-21 2013-10-21 一种hss主备管理的方法及装置

Publications (2)

Publication Number Publication Date
CN103546914A true CN103546914A (zh) 2014-01-29
CN103546914B CN103546914B (zh) 2017-07-21

Family

ID=49969885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310495260.6A Active CN103546914B (zh) 2013-10-21 2013-10-21 一种hss主备管理的方法及装置

Country Status (1)

Country Link
CN (1) CN103546914B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105141400A (zh) * 2015-07-30 2015-12-09 杭州华为数字技术有限公司 一种高可用性集群管理方法及相关设备
CN105357658A (zh) * 2015-11-04 2016-02-24 北京佰才邦技术有限公司 用户信息存储方法和装置及用户设备认证方法和装置
CN105389231A (zh) * 2015-10-28 2016-03-09 浪潮(北京)电子信息产业有限公司 一种数据库双机备份方法及系统
CN105516365A (zh) * 2016-01-22 2016-04-20 浪潮电子信息产业股份有限公司 一种基于网络的分布式镜像存储块设备的管理方法
CN105554130A (zh) * 2015-12-18 2016-05-04 深圳中兴网信科技有限公司 基于分布式存储系统的NameNode切换方法和切换装置
CN106209451A (zh) * 2016-07-08 2016-12-07 深圳前海微众银行股份有限公司 Dcn切换方法及系统
CN106815298A (zh) * 2016-12-09 2017-06-09 中电科华云信息技术有限公司 基于块存储的分布式共享文件系统
CN107329708A (zh) * 2017-07-04 2017-11-07 郑州云海信息技术有限公司 一种分布式存储系统实现缓存数据的方法及系统
CN107465709A (zh) * 2016-06-03 2017-12-12 阿里巴巴集团控股有限公司 分布式镜像构建任务方法及装置、系统
CN107480014A (zh) * 2017-07-24 2017-12-15 北京奇安信科技有限公司 一种高可用设备切换方法及装置
CN109245908A (zh) * 2017-07-10 2019-01-18 北京京东尚科信息技术有限公司 一种主从集群切换的方法和装置
CN110019105A (zh) * 2019-01-24 2019-07-16 江苏中云科技有限公司 一种可靠高效的分布式文件系统
CN110609764A (zh) * 2018-06-15 2019-12-24 伊姆西Ip控股有限责任公司 用于数据备份的方法、设备和计算机程序产品
CN111478947A (zh) * 2020-03-20 2020-07-31 珠海高凌信息科技股份有限公司 主备控制板实时同步方法及系统
CN111935244A (zh) * 2020-07-20 2020-11-13 江苏安超云软件有限公司 一种业务请求处理系统及超融合一体机

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043310A (zh) * 2007-04-27 2007-09-26 北京佳讯飞鸿电气有限责任公司 核心控制系统的双核心控制的镜像备份方法
CN101079742A (zh) * 2007-07-03 2007-11-28 中兴通讯股份有限公司 容灾归属用户服务器间的数据同步方法及系统
CN101471955A (zh) * 2007-12-28 2009-07-01 英业达股份有限公司 一种双控制器网络储存环境下的设备数据写入方法
CN101582787A (zh) * 2008-05-16 2009-11-18 中兴通讯股份有限公司 一种双机备份系统及备份方法
CN102629906A (zh) * 2012-03-30 2012-08-08 浪潮电子信息产业股份有限公司 一种将集群管理节点做双机实现提高集群业务可用性的设计办法
CN102855163A (zh) * 2011-06-27 2013-01-02 华为软件技术有限公司 一种内存数据库双机热备方法及主机
US20130198561A1 (en) * 2011-04-26 2013-08-01 International Business Machines Corporation Migrating virtual machines across sites

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043310A (zh) * 2007-04-27 2007-09-26 北京佳讯飞鸿电气有限责任公司 核心控制系统的双核心控制的镜像备份方法
CN101079742A (zh) * 2007-07-03 2007-11-28 中兴通讯股份有限公司 容灾归属用户服务器间的数据同步方法及系统
CN101471955A (zh) * 2007-12-28 2009-07-01 英业达股份有限公司 一种双控制器网络储存环境下的设备数据写入方法
CN101582787A (zh) * 2008-05-16 2009-11-18 中兴通讯股份有限公司 一种双机备份系统及备份方法
US20130198561A1 (en) * 2011-04-26 2013-08-01 International Business Machines Corporation Migrating virtual machines across sites
CN102855163A (zh) * 2011-06-27 2013-01-02 华为软件技术有限公司 一种内存数据库双机热备方法及主机
CN102629906A (zh) * 2012-03-30 2012-08-08 浪潮电子信息产业股份有限公司 一种将集群管理节点做双机实现提高集群业务可用性的设计办法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105141400A (zh) * 2015-07-30 2015-12-09 杭州华为数字技术有限公司 一种高可用性集群管理方法及相关设备
CN105141400B (zh) * 2015-07-30 2018-08-21 杭州华为数字技术有限公司 一种高可用性集群管理方法及相关设备
CN105389231A (zh) * 2015-10-28 2016-03-09 浪潮(北京)电子信息产业有限公司 一种数据库双机备份方法及系统
CN105357658A (zh) * 2015-11-04 2016-02-24 北京佰才邦技术有限公司 用户信息存储方法和装置及用户设备认证方法和装置
CN105554130A (zh) * 2015-12-18 2016-05-04 深圳中兴网信科技有限公司 基于分布式存储系统的NameNode切换方法和切换装置
CN105516365A (zh) * 2016-01-22 2016-04-20 浪潮电子信息产业股份有限公司 一种基于网络的分布式镜像存储块设备的管理方法
CN107465709A (zh) * 2016-06-03 2017-12-12 阿里巴巴集团控股有限公司 分布式镜像构建任务方法及装置、系统
CN106209451A (zh) * 2016-07-08 2016-12-07 深圳前海微众银行股份有限公司 Dcn切换方法及系统
CN106209451B (zh) * 2016-07-08 2019-08-20 深圳前海微众银行股份有限公司 Dcn切换方法及系统
CN106815298B (zh) * 2016-12-09 2020-11-17 中电科华云信息技术有限公司 基于块存储的分布式共享文件系统
CN106815298A (zh) * 2016-12-09 2017-06-09 中电科华云信息技术有限公司 基于块存储的分布式共享文件系统
CN107329708A (zh) * 2017-07-04 2017-11-07 郑州云海信息技术有限公司 一种分布式存储系统实现缓存数据的方法及系统
CN109245908A (zh) * 2017-07-10 2019-01-18 北京京东尚科信息技术有限公司 一种主从集群切换的方法和装置
CN109245908B (zh) * 2017-07-10 2022-04-26 北京京东尚科信息技术有限公司 一种主从集群切换的方法和装置
CN107480014A (zh) * 2017-07-24 2017-12-15 北京奇安信科技有限公司 一种高可用设备切换方法及装置
CN107480014B (zh) * 2017-07-24 2021-01-01 奇安信科技集团股份有限公司 一种高可用设备切换方法及装置
CN110609764A (zh) * 2018-06-15 2019-12-24 伊姆西Ip控股有限责任公司 用于数据备份的方法、设备和计算机程序产品
CN110019105A (zh) * 2019-01-24 2019-07-16 江苏中云科技有限公司 一种可靠高效的分布式文件系统
CN111478947A (zh) * 2020-03-20 2020-07-31 珠海高凌信息科技股份有限公司 主备控制板实时同步方法及系统
CN111478947B (zh) * 2020-03-20 2023-02-17 珠海高凌信息科技股份有限公司 主备控制板实时同步方法及系统
CN111935244A (zh) * 2020-07-20 2020-11-13 江苏安超云软件有限公司 一种业务请求处理系统及超融合一体机

Also Published As

Publication number Publication date
CN103546914B (zh) 2017-07-21

Similar Documents

Publication Publication Date Title
CN103546914A (zh) 一种hss主备管理的方法及装置
JP6827501B2 (ja) ホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器
CA2733788C (en) Method and systems for redundant server automatic failover
CA2339783C (en) Fault tolerant computer system
US7961594B2 (en) Methods and systems for history analysis for access paths in networks
JP5243384B2 (ja) アプリケーションステーションで利用される冗長マネージャ
CN101908980B (zh) 一种网管升级的方法及系统
CN102394914A (zh) 集群脑裂处理方法和装置
CN104503965A (zh) PostgreSQL高弹性的高可用及负载均衡实现方法
CN107589955B (zh) 一种双cmc固件版本的升级方法及系统
TWI677797B (zh) 主備資料庫的管理方法、系統及其設備
CN103036719A (zh) 一种基于主备集群服务器的跨地区服务容灾方法及装置
CN103024065A (zh) 用于云存储系统的系统配置管理方法
CN105426213A (zh) 软件更新方法和系统
WO2012155630A1 (zh) 一种容灾的方法、装置及系统
CN114116912A (zh) 一种基于Keepalived实现数据库高可用的方法
CN102487332B (zh) 故障处理方法、装置和系统
CN114326366A (zh) 软冗余控制系统及其配置方法
CN104052799A (zh) 一种利用资源环实现高可用存储的方法
CN115658390A (zh) 容器容灾方法、系统、装置、设备及计算机可读存储介质
JP2001346181A (ja) データ記憶部共有装置およびプログラム記録媒体
CN114422335A (zh) 通信方法、装置、服务器及存储介质
JP2013161266A (ja) 呼処理情報の冗長化制御システムおよびこれに利用する予備保守サーバ
CN103023697B (zh) 一种阵列多路径的管理方法、装置及系统
CN112035250A (zh) 高可用局域网服务管理方法、设备及部署架构

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant