CN105515838A - 一种服务配置方法及ha集群系统 - Google Patents

一种服务配置方法及ha集群系统 Download PDF

Info

Publication number
CN105515838A
CN105515838A CN201510851419.2A CN201510851419A CN105515838A CN 105515838 A CN105515838 A CN 105515838A CN 201510851419 A CN201510851419 A CN 201510851419A CN 105515838 A CN105515838 A CN 105515838A
Authority
CN
China
Prior art keywords
physical host
address
service
virtual
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510851419.2A
Other languages
English (en)
Inventor
马宇坚
于芝涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juhaokan Technology Co Ltd
Original Assignee
Qingdao Hisense Media Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Hisense Media Network Technology Co Ltd filed Critical Qingdao Hisense Media Network Technology Co Ltd
Priority to CN201510851419.2A priority Critical patent/CN105515838A/zh
Publication of CN105515838A publication Critical patent/CN105515838A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例提供一种服务配置方法及HA集群系统,能够避免“脑裂”现象的出现,提高系统的可靠性。所述方法应用于HA集群系统,包括至少两个物理主机,每个物理主机预先存储有超时时间标记,至少两个物理主机的超时时间标记均不相同,方法包括:S1:确定虚拟IP地址是否能够PING通;S2:若能够PING通,判断虚拟IP地址是否指向本机IP地址;若是,监控本机上正在运行的所有网元;若否,返回S1;S3:若不能PING通,判断服务的超时时间是否达到本机的超时时间标记;若是,执行S4;若否,释放占用的网络资源并返回S1;S4:配置虚拟IP地址;若配置成功,启动本机上服务对应的网元;若配置失败,释放占用的网络资源并返回S1。本发明适用于通信技术领域。

Description

一种服务配置方法及HA集群系统
技术领域
本发明涉及通信技术领域,尤其涉及一种服务配置方法及高可用(英文:HighAvailable,简称:HA)集群系统。
背景技术
HA集群系统是共同为客户端提供服务的一组物理主机,其通过各个物理主机的协同工作保证服务的不间断,可有效提高系统和应用的可用性。
如图1所示,在现有的HA集群系统中,物理主机间需要通过心跳线连接,并基于心跳线实时监测对方的运行状态。一旦正在工作的物理主机A因为故障,如电源失效、主要部件失效或者启动盘失效等,导致其无法正常向客户端提供服务时,物理主机A的备份主机—物理主机B,即可通过心跳线监测到,从而接替物理主机A继续向客户端提供服务。其中,物理主机A通常称为主用设备,物理主机B称为备用设备。
在上述工作模式下,当连接主用设备及备用设备的心跳线失效时,由于主用设备和备用设备相互失去了联系,都以为对方出了故障,并认为自己是唯一一个可提供服务的物理主机,自己应该获得整个集群系统的“控制权”,因而会出现主用设备及备用设备分别接管服务,并且同时读写共享存储的情况,这一现象通常被称为“脑裂”。“脑裂”会导致共享存储中的数据发生不可预估的损坏,引发数据灾难,进而使得整个系统瘫痪。
发明内容
为此,本发明实施例提供一种服务配置方法及HA集群系统,以避免“脑裂”现象的出现,能够提高系统的可靠性,同时降低系统的成本。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种服务配置方法,应用于高可用HA集群系统,所述HA集群系统包括至少两个物理主机,所述至少两个物理主机中的每个物理主机上运行有至少一个网元,所述至少一个网元中的每个网元在所述HA集群系统存在至少一个备份网元,所述HA集群系统通过虚拟网际协议IP地址向客户端提供服务,所述至少两个物理主机中的每个物理主机预先存储有各自的超时时间标记,所述至少两个物理主机的超时时间标记均不相同;
所述方法包括:
S1:第一物理主机确定所述虚拟IP地址是否能够PING通,其中,所述第一物理主机为所述HA集群系统中任一物理主机;
S2:若确定所述虚拟IP地址能够PING通,判断所述虚拟IP地址是否指向所述第一物理主机的IP地址;若是,监控本机上正在运行的所有网元;若否,则返回至所述S1;
S3:若确定所述虚拟IP地址不能PING通,判断服务的超时时间是否达到所述第一物理主机的超时时间标记;若是,执行S4;若否,则释放占用的网络资源,并返回至所述S1;
S4:配置所述虚拟IP地址以使所述虚拟IP地址指向所述第一物理主机的IP地址;若配置成功,启动所述第一物理主机上所述服务对应的网元;若配置失败,则释放占用的网络资源,并返回至所述S1。
第二方面,提供一种HA集群系统,包括至少两个物理主机,所述至少两个物理主机中的每个物理主机预先存储有各自的超时时间标记,所述至少两个物理主机的超时时间标记均不相同,所述至少两个物理主机中的每个物理主机用于执行如第一方面所述的方法。
本发明实施例提供的服务配置方法及HA集群系统中,各物理主机通过判断虚拟IP地址是否能够PING通来确定系统的运行状态,具体而言,若虚拟IP地址能够PING通,表示系统中某个物理主机正在工作,系统正在为客户端提供服务,此时通过判断虚拟IP地址是否指向本机IP地址即可确定正在工作的物理主机是否为本机,若正在工作的物理主机是本机,则监控本机上正在运行的网元,以在网元出现故障导致服务中断后,及时重新拉起,进而继续为客户端提供服务;若虚拟IP地址不能PING通,则表示系统中原本处于工作状态的物理主机或其上运行的相关网元出现了故障,系统向客户端提供的服务已中断,此时,各物理主机即会判断服务的超时时间是否达到自身的超时时间标记,一旦达到,即配置虚拟IP地址以使虚拟IP地址指向本机的IP地址,并在配置成功后,启动本机上相应的网元,从而完成服务的配置,继续向客户端提供服务。由于一旦原本处于工作状态的物理主机或其上运行的相关网元出现故障导致服务中断,系统中各物理主机即会在同一时刻检测到虚拟IP地址不能PING通,同时,由于各物理主机的超时时间标记均不相同,因而其中超时时间标记最小的物理主机会先检测到服务的超时时间达到自身的超时时间标记,进而配置虚拟IP地址以接管服务,此后,系统中其他物理主机即会检测到虚拟IP地址能够PING通,这样一来,其配置服务的条件即不再成立,进而也就不会再配置服务,因此不会出现多个物理主机争抢资源同时接管服务,并且同时读写共享存储的情况,即不会出现“脑裂”现象。
综上,本发明实施例提供的服务配置方法及HA集群系统能够避免“脑裂”现象的出现,从而提高系统的可靠性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中HA集群系统的工作原理示意图;
图2为本发明实施例提供的服务配置方法的应用场景示意图;
图3为本发明实施例提供的一种服务配置方法的流程示意图一;
图4(a)为本发明实施例一中关于超时时间标记设置的说明示意图;
图4(b)为本发明实施例一中关于超时时间标记设置的说明示意图;
图5为本发明实施例提供的一种服务配置方法的流程示意图二;
图6为本发明实施例提供的一种服务配置方法的流程示意图三;
图7为本发明实施例提供的一种服务配置方法的流程示意图四;
图8为本发明实施例提供的一种HA集群系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
需要说明的是,为了便于清楚描述本发明实施例的技术方案,在本发明下述各实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。另外,为叙述简便,在本发明下述各实施例中,将“HA集群系统”简称为“系统”,如无特殊说明本发明实施例中所述的系统指HA集群系统。
另外,还需说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合。本领域普通技术人员可以理解,本申请实施例中示出的示例为本发明为便于读者理解所作的示意性的说明,并不构成对本发明的限定。
实施例一、
本发明实施例提供一种服务配置方法,应用于HA集群系统,如图2所示,所述HA集群系统包括至少两个物理主机。其中,至少两个物理主机中的每个物理主机上运行有至少一个网元,至少一个网元中的每个网元在HA集群系统存在至少一个备份网元,HA集群系统通过虚拟网际协议IP地址向客户端提供服务,至少两个物理主机中的每个物理主机预先存储有各自的超时时间标记,且至少两个物理主机的超时时间标记均不相同。
如图3所示,所述服务配置方法包括:
S301、第一物理主机确定虚拟IP地址是否能够PING通。
其中,第一物理主机为HA集群系统中任一物理主机。
本领域普通技术人员可以理解,若虚拟IP地址能够PING通,则说明当前系统中有物理主机配置了该虚拟IP地址,配置了该虚拟IP地址的物理主机正在工作,系统通过虚拟IP地址提供的服务处于正常状态;反之,若虚拟IP地址不能PING通,则说明当前系统中的物理主机均未配置虚拟IP地址,原本处于工作状态的物理主机出现了故障,导致系统通过虚拟IP地址提供的服务中断。
一种可能的实现方式中,第一物理主机可通过运行“PING虚拟IP地址”的命令来确定虚拟IP地址是否能够PING通。例如,假设虚拟IP地址为172.168.6.1,则可通过运行命令“PING172.168.6.1”来确定虚拟IP地址是否能够PING通。具体而言,第一物理主机在执行此命令后,如果显示类似以下信息:
Replyfrom172.168.6.1bytes=32time=9msTTL=255
Pingstatisticsfor172.168.6.1
PacketsSent=4Received=4Lost=0
Approximateroundtriptimesinmilli-seconds
Minimum=1msMaximum=9msAverage=5ms
则表示虚拟IP地址能够PING通;反之,如果显示内容为:Requesttimedout,则说虚拟IP地址不能PING通。
S302、若第一物理主机确定虚拟IP地址能够PING通,判断虚拟IP地址是否指向第一物理主机的IP地址。
若是,则执行步骤S303;若否,返回至步骤S301。
S303、第一物理主机监控第一物理主机上正在运行的所有网元。
容易理解,若虚拟IP地址指向本机IP地址,说明当前配置了虚拟IP地址的物理主机为本机,也即系统中正在工作的物理主机即是本机,此时需监控本机上正在运行的网元,以便在网元出现故障后,及时发现并处理,避免服务的中断。
S304、若第一物理主机确定虚拟IP地址不能PING通,判断服务的超时时间是否达到第一物理主机的超时时间标记。
若否,则执行步骤S305;若是,则执行步骤S306。
需要说明的是,此处所述的服务的超时时间指系统提供的该服务中断的持续时间。
S305、第一物理主机释放占用的网络资源,并返回至步骤S301。
S306、第一物理主机配置虚拟IP地址以使虚拟IP地址指向第一物理主机的IP地址。
若配置失败,则执行步骤S305;若配置成功,则执行步骤S307。
本领域技术人员容易理解,若在第一物理主机配置虚拟IP地址的过程中,第一物理主机上的服务对应的网元出现故障,会使得配置失败,此时应释放占用的网络资源,以减少对网络资源的不必要占用,从而减轻系统负荷。
S307、第一物理主机启动第一物理主机上服务对应的网元。
优选的,本发明实施例中,可针对不同的服务,为物理主机设置不同的超时时间标记,例如,可将第一物理主机可提供的服务A对应的超时时间标记设置为5ms,将第一物理主机可提供的服务B对应的超时时间标记设置为7ms;将第一物理主机可提供的服务C对应的超时时间标记设置为13ms;当然,简便起见,也可不区分服务,而是为物理主机设置一个统一的超时时间标记,例如,将第一物理主机可提供的所有服务对应的超时时间标记设置为5ms。具体选择哪种方式,应根据实际应用进行选择,本发明实施例对此不作具体限定。
示例性的,结合图2,给出一具体示例以说明使用本发明实施例提供的方法进行服务配置的具体过程:
假设物理主机1正在向客户端提供服务,且其正在提供的服务所对应的网元仅在物理主机2及物理主机3上存在备份网元,物理主机2及物理主机3的超时时间标记分别为1ms、5ms。则,一旦物理主机1宕机,物理主机2及物理主机3即会同时检测到虚拟IP地址不能PING通,此时物理主机2及物理主机3即确定系统提供的服务中断,并持续PING虚拟IP地址,当服务断开达1ms时,物理主机2检测到虚拟IP地址仍无法PING通,且服务的超时时间达到自身的超时时间标记—1ms,此时物理主机2即会配置虚拟IP地址使虚拟IP地址指向本机IP地址,并启动本机上服务对应的网元,从而完成该服务的配置,接替物理主机1继续为客户端提供服务。此后,而物理主机3即会检测到虚拟IP地址能够PING通,这样一来,物理主机3配置服务的条件即不再成立,物理主机3不会再配置服务,因此不会出现“脑裂”现象。
通常,物理主机配置虚拟IP地址需要耗费一定的时间,若该时间较长,则可能出现在该物理主机配置虚拟IP地址的期间,系统中另一物理主机也检测到服务的超时时间达到自身的超时时间标记,致使另一物理主机也会配置虚拟IP地址,进而出现两个物理主机同时接管服务、争抢资源的情况。如图4(a)所示,当物理主机A检测到服务的超时时间达到自身的超时时间标记ta后,即开始配置虚拟IP地址,若配置虚拟IP地址所需时间△t较大,则在此期间,会出现物理主机B检测到服务的超时时间达到自身超时时间标记tb的情况,此时物理主机B会重复配置虚拟IP地址,物理主机A和物理主机B会同时接管服务、争抢资源。
本发明实施例提供的服务配置方法中,为避免上述情况出现,可在预先设置各物理主机的超时时间标记时,令至少两个物理主机中任意两个物理主机的超时时间标记之差均大于预设值。
其中,所述预设值具体可以是物理主机配置虚拟IP地址所需的时间,还可以是大于该时间的一个时间,本发明实施例对此不作具体限定。
如此一来,即可避免在系统中某一物理主机配置虚拟IP地址的期间,出现其他物理主机检测到服务的超时时间达到自身的超时时间标记的情况,具体如图4(b)所示,由于物理主机A的超时时间标记ta和物理主机B的超时时间标记tb的差值大于配置虚拟IP所需的时间△t,因此在物理主机A配置虚拟IP地址的期间,不会出现物理主机B检测到服务的超时时间达到自身超时时间标记的情况。
本领域普通技术人员可以理解,在HA集群系统中,存在系统所在的局域网中的网关路由器出现故障、未正常运行,但系统中物理主机仍处于激活状态的特殊情况,此种情况下,系统的虚拟IP地址仍然能够PING通,但系统却不能正常向客户端提供服务。
为确保根据虚拟IP地址判断系统提供的服务是否中断的准确性,可在检测虚拟IP地址是否能够PING通之前,先检测网关是否能够PING通,在确保网关能够PING通后,再检测虚拟IP地址是否能够PING通。
即,如图5所示,本发明实施例提供的服务配置方法,在第一物理主机确定虚拟IP地址是否能够PING通之前,还可以包括:
S308、第一物理主机确定网关是否能够PING通。
若是,执行步骤S301;若否,则执行步骤S309。
S309、第一物理主机停止第一物理主机上正在运行的网元,并释放占用的网络资源。
如此,在确定局域网中的网关路由器正在正常运行的情况下,再通过检测虚拟IP地址是否能够PING通来判断服务是否可用,可确保判断的准确性。
优选的,如图6所示,本发明实施例提供的服务配置方法中,若第一物理主机成功启动了第一物理主机上服务对应的网元,则执行步骤S310:
S310、第一物理主机监控服务对应的网元。
即,在成功启动服务对应的网元后,通过监控服务对应的网元获知自身提供服务的情况,以便在网元出现故障后,及时发现并处理,避免服务的中断。
反之,若第一物理主机未能成功启动第一物理主机上服务对应的网元,则说明网元可能出现了问题,本机已无法正常向客户端提供对应的服务,此时需立即释放相应的网元占用的网络资源,以便其他物理主机上的备份网元能够使用该网络资源继续向客户端提供服务。
即,若第一物理主机未能成功启动第一物理主机上服务对应的网元,则执行步骤S305:
S305、第一物理主机释放占用的网络资源,并返回至步骤S301。
进一步的,如图7所示,本发明实施例提供的服务配置方法,在第一物理主机监控服务对应的网元之后,还可以包括:
S311、若第一物理主机监测到服务对应的网元发生故障,确定第一物理主机上是否存在发生故障网元的备份网元。
S312、若第一物理主机确定第一物理主机上存在发生故障网元的备份网元,启动发生故障网元的备份网元。
反之,若第一物理主机确定第一物理主机上不存在发生故障网元的备份网元,则执行步骤S305:
S305、第一物理主机释放占用的网络资源,并返回至步骤S301。
即,当监测到服务对应的网元出现问题后,当本机上存在该网元的备份网元时,优先从本机重新拉起网元。因为如果从其他物理主机拉起网元,则其他物理主机需要配置虚拟IP地址使虚拟IP地址指向该拉起网元的物理主机,这势必会占用一定的时间,导致服务中断的时间变长,增加了客户端的等待时间。而优先从本机拉起网元,则无需重新配置虚拟IP地址,因此能够减少服务中断的时间,减少客户端的等待时间,进而提升用户体验。
当然,容易理解,若第一物理主机上不存在服务对应的网元的备份网元,则无法从第一物理主机拉起网元,服务会持续中断。随着服务的持续中断,某一时刻系统中其他物理主机中超时时间标记最小的物理主机会检测到服务的超时时间达到自身的超时时间标记,此时物理主机即会根据其IP地址配置虚拟IP地址,并在配置成功后启动服务对应的网元,从而接替第一物理主机继续为客户端提供服务。
进一步的,若第一物理主机在预设时间内未能成功启动发生故障网元的备份网元,则执行步骤S305:
S305、第一物理主机释放占用的网络资源,并返回至步骤S301。
即,当尝试从本机拉起备份网元失败后,放弃从本机拉起,选择从其他物理主机拉起网元,由其他物理主机接替第一物理主机继续为客户端提供服务。
优选的,本发明实施例提供的方法还可进一步包括:
第一物理主机检测到HA集群系统的负载值高于预设阈值后,自行重启。
其中,预设阈值具体可根据经验设置,本发明实施例对此不作具体限定。
本领域普通技术人员可以理解,随着系统运行时间的增长,系统的负载值会越来越高,系统运行状态会越来越不稳定,当系统负载值超过系统极限值后,系统的运行状态会极度恶化,此时系统基本处于不可运行的瘫痪状态,甚至连普通命令都无法正常执行,一旦系统处于这样一种状态,即难以恢复至正常状态。而本发明实施例提供的服务配置方法,通过系统的负载值判断系统运行状态,在检测到系统的负载值高于预设阈值后,及时将系统进行重启,使系统恢复至正常状态,这样就可避免由于系统负载超出负荷所引起的系统瘫痪。
本发明实施例提供的服务配置方法中,各物理主机通过判断虚拟IP地址是否能够PING通来确定系统的运行状态,具体而言,若虚拟IP地址能够PING通,表示系统中某个物理主机正在工作,系统正在为客户端提供服务,此时通过判断虚拟IP地址是否指向本机IP地址即可确定正在工作的物理主机是否为本机,若正在工作的物理主机是本机,则监控本机上正在运行的网元,以在网元出现故障导致服务中断后,及时重新拉起,进而继续为客户端提供服务;若虚拟IP地址不能PING通,则表示系统中原本处于工作状态的物理主机或其上运行的相关网元出现了故障,系统向客户端提供的服务已中断,此时,各物理主机即会判断服务的超时时间是否达到自身的超时时间标记,一旦达到,即配置虚拟IP地址以使虚拟IP地址指向本机的IP地址,并在配置成功后,启动本机上相应的网元,从而完成服务的配置,继续向客户端提供服务。由于一旦原本处于工作状态的物理主机或其上运行的相关网元出现故障导致服务中断,系统中各物理主机即会在同一时刻检测到虚拟IP地址不能PING通,同时,由于各物理主机的超时时间标记均不相同,因而其中超时时间标记最小的物理主机会先检测到服务的超时时间达到自身的超时时间标记,进而配置虚拟IP地址以接管服务,此后,系统中其他物理主机即会检测到虚拟IP地址能够PING通,这样一来,其配置服务的条件即不再成立,进而也就不会再配置服务,因此不会出现多个物理主机争抢资源同时接管服务,并且同时读写共享存储的情况,即不会出现“脑裂”现象。
此外,基于本发明实施例提供的服务配置方法,物理主机间无需通过心跳实时监测对方的运行状态,因此各物理主机间不再需要通过心跳线来连接,因此相比于现有技术,本发明实施例提供的服务配置方法能够降低系统成本。
综上,本发明实施例提供的服务配置方法能够避免“脑裂”现象的出现,从而提高系统的可靠性,同时能够降低系统的成本。
实施例二、
本发明实施例提供一种HA集群系统,如图8所示,所述HA集群系统80包括至少两个物理主机801。其中,至少两个物理主机801中的每个物理主机801预先存储有各自的超时时间标记,至少两个物理主机801的超时时间标记均不相同,至少两个物理主机中每个物理主机801均用于执行本发明实施例一所述的服务配置方法。
具体的,基于本发明实施例提供的HA集群系统配置服务的方法具体可参考实施例一的描述,此处不再赘述。
基于本发明实施例提供HA集群系统,各物理主机通过判断虚拟IP地址是否能够PING通来确定系统的运行状态,具体而言,若虚拟IP地址能够PING通,表示系统中某个物理主机正在工作,系统正在为客户端提供服务,此时通过判断虚拟IP地址是否指向本机IP地址即可确定正在工作的物理主机是否为本机,若正在工作的物理主机是本机,则监控本机上正在运行的网元,以在网元出现故障导致服务中断后,及时重新拉起,进而继续为客户端提供服务;若虚拟IP地址不能PING通,则表示系统中原本处于工作状态的物理主机或其上运行的相关网元出现了故障,系统向客户端提供的服务已中断,此时,各物理主机即会判断服务的超时时间是否达到自身的超时时间标记,一旦达到,即配置虚拟IP地址以使虚拟IP地址指向本机的IP地址,并在配置成功后,启动本机上相应的网元,从而完成服务的配置,继续向客户端提供服务。由于一旦原本处于工作状态的物理主机或其上运行的相关网元出现故障导致服务中断,系统中各物理主机即会在同一时刻检测到虚拟IP地址不能PING通,同时,由于各物理主机的超时时间标记均不相同,因而其中超时时间标记最小的物理主机会先检测到服务的超时时间达到自身的超时时间标记,进而配置虚拟IP地址以接管服务,此后,系统中其他物理主机即会检测到虚拟IP地址能够PING通,这样一来,其配置服务的条件即不再成立,进而也就不会再配置服务,因此不会出现多个物理主机争抢资源同时接管服务,并且同时读写共享存储的情况,即不会出现“脑裂”现象。
综上,本发明实施例提供的HA集群系统能够避免“脑裂”现象的出现,从而提高系统的可靠性。
应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-OnlyMemory,简称:ROM)、随机存储器(英文:RandomAccessMemory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种服务配置方法,其特征在于,应用于高可用HA集群系统,所述HA集群系统包括至少两个物理主机,所述至少两个物理主机中的每个物理主机上运行有至少一个网元,所述至少一个网元中的每个网元在所述HA集群系统存在至少一个备份网元,所述HA集群系统通过虚拟网际协议IP地址向客户端提供服务,所述至少两个物理主机中的每个物理主机预先存储有各自的超时时间标记,所述至少两个物理主机的超时时间标记均不相同;
所述方法包括:
S1:第一物理主机确定所述虚拟IP地址是否能够PING通,其中,所述第一物理主机为所述HA集群系统中任一物理主机;
S2:若确定所述虚拟IP地址能够PING通,判断所述虚拟IP地址是否指向所述第一物理主机的IP地址;若是,监控所述第一物理主机上正在运行的所有网元;若否,则返回至所述S1;
S3:若确定所述虚拟IP地址不能PING通,判断服务的超时时间是否达到所述第一物理主机的超时时间标记;若是,执行S4;若否,则释放占用的网络资源,并返回至所述S1;
S4:配置所述虚拟IP地址以使所述虚拟IP地址指向所述第一物理主机的IP地址;若配置成功,启动所述第一物理主机上所述服务对应的网元;若配置失败,则释放占用的网络资源,并返回至所述S1。
2.根据权利要求1所述的方法,其特征在于,在所述第一物理主机确定所述虚拟IP地址是否能够PING通之前,所述方法还包括:
所述第一物理主机确定网关是否能够PING通;若是,执行所述S1;若否,则停止所述第一物理主机上正在运行的网元,并释放占用的网络资源。
3.根据权利要求1或2所述的方法,其特征在于,若所述第一物理主机未能成功启动所述第一物理主机上所述服务对应的网元,所述方法还包括:
所述第一物理主机释放占用的网络资源,并返回至所述S1。
4.根据权利要求1或2所述的方法,其特征在于,若所述第一物理主机成功启动了所述第一物理主机上所述服务对应的网元,所述方法还包括:
所述第一物理主机监控所述服务对应的网元。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若所述第一物理主机监测到所述服务对应的网元发生故障,确定所述第一物理主机上是否存在所述发生故障网元的备份网元;
若所述第一物理主机确定所述第一物理主机上存在所述发生故障网元的备份网元,启动所述发生故障网元的备份网元。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述第一物理主机确定所述第一物理主机上不存在所述发生故障网元的备份网元,释放占用的网络资源,并返回至所述S1。
7.根据权利要求5或6所述的方法,其特征在于,所述方法还包括:
若所述第一物理主机在预设时间内未能成功启动所述发生故障网元的备份网元,所述第一物理主机释放占用的网络资源,并返回至所述S1。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述方法还包括:
所述第一物理主机检测到所述HA集群系统的负载值高于预设阈值后,自行重启。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述至少两个物理主机中任意两个物理主机的超时时间标记之差均大于预设值。
10.一种HA集群系统,其特征在于,包括至少两个物理主机,所述至少两个物理主机中的每个物理主机预先存储有各自的超时时间标记,所述至少两个物理主机的超时时间标记均不相同,所述至少两个物理主机中的每个物理主机用于执行如权利要求1-9任一项所述的方法。
CN201510851419.2A 2015-11-26 2015-11-26 一种服务配置方法及ha集群系统 Pending CN105515838A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510851419.2A CN105515838A (zh) 2015-11-26 2015-11-26 一种服务配置方法及ha集群系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510851419.2A CN105515838A (zh) 2015-11-26 2015-11-26 一种服务配置方法及ha集群系统

Publications (1)

Publication Number Publication Date
CN105515838A true CN105515838A (zh) 2016-04-20

Family

ID=55723497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510851419.2A Pending CN105515838A (zh) 2015-11-26 2015-11-26 一种服务配置方法及ha集群系统

Country Status (1)

Country Link
CN (1) CN105515838A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105959397A (zh) * 2016-06-16 2016-09-21 阿里巴巴集团控股有限公司 信息处理方法、装置及服务器
CN107181834A (zh) * 2017-06-13 2017-09-19 聚好看科技股份有限公司 一种redis管理虚拟IP地址的方法、装置及redis系统
CN109144415A (zh) * 2018-08-01 2019-01-04 新华三云计算技术有限公司 节点检测方法及共享存储装置
CN112351118A (zh) * 2021-01-07 2021-02-09 广东睿江云计算股份有限公司 一种物理机的组播方法及其系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101291243A (zh) * 2007-04-16 2008-10-22 广东省新支点技术服务有限公司 高可用集群系统的裂脑预防方法
CN101873223A (zh) * 2010-05-27 2010-10-27 天讯瑞达通信技术有限公司 基于ip切换的n+m服务备份机制
CN102394914A (zh) * 2011-09-22 2012-03-28 浪潮(北京)电子信息产业有限公司 集群脑裂处理方法和装置
CN102497292A (zh) * 2011-11-30 2012-06-13 中国科学院微电子研究所 计算机集群监控的方法及系统
CN102742214A (zh) * 2011-07-13 2012-10-17 青岛海信传媒网络技术有限公司 改善高可用性系统可靠性的方法和装置
CN103532748A (zh) * 2013-10-08 2014-01-22 北京华胜天成科技股份有限公司 一种drbd脑裂的处理方法及装置
US20140056121A1 (en) * 2012-08-22 2014-02-27 Oracle International Corporation System and method for supporting high available (ha) network communication in a middleware machine environment
CN103973424A (zh) * 2014-05-22 2014-08-06 乐得科技有限公司 缓存系统中的故障解决方法和设备
CN104038376A (zh) * 2014-06-30 2014-09-10 浪潮(北京)电子信息产业有限公司 一种管理真实服务器的方法、装置及lvs集群系统
CN104993953A (zh) * 2015-06-19 2015-10-21 北京奇虎科技有限公司 检测网络服务状态的方法和装置
CN105024855A (zh) * 2015-07-13 2015-11-04 浪潮(北京)电子信息产业有限公司 分布式集群管理系统和方法
CN105099747A (zh) * 2014-05-23 2015-11-25 王能武 计算机备份综合控制管理系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101291243A (zh) * 2007-04-16 2008-10-22 广东省新支点技术服务有限公司 高可用集群系统的裂脑预防方法
CN101873223A (zh) * 2010-05-27 2010-10-27 天讯瑞达通信技术有限公司 基于ip切换的n+m服务备份机制
CN102742214A (zh) * 2011-07-13 2012-10-17 青岛海信传媒网络技术有限公司 改善高可用性系统可靠性的方法和装置
CN102394914A (zh) * 2011-09-22 2012-03-28 浪潮(北京)电子信息产业有限公司 集群脑裂处理方法和装置
CN102497292A (zh) * 2011-11-30 2012-06-13 中国科学院微电子研究所 计算机集群监控的方法及系统
US20140056121A1 (en) * 2012-08-22 2014-02-27 Oracle International Corporation System and method for supporting high available (ha) network communication in a middleware machine environment
CN103532748A (zh) * 2013-10-08 2014-01-22 北京华胜天成科技股份有限公司 一种drbd脑裂的处理方法及装置
CN103973424A (zh) * 2014-05-22 2014-08-06 乐得科技有限公司 缓存系统中的故障解决方法和设备
CN105099747A (zh) * 2014-05-23 2015-11-25 王能武 计算机备份综合控制管理系统
CN104038376A (zh) * 2014-06-30 2014-09-10 浪潮(北京)电子信息产业有限公司 一种管理真实服务器的方法、装置及lvs集群系统
CN104993953A (zh) * 2015-06-19 2015-10-21 北京奇虎科技有限公司 检测网络服务状态的方法和装置
CN105024855A (zh) * 2015-07-13 2015-11-04 浪潮(北京)电子信息产业有限公司 分布式集群管理系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴鑫: "基于开源系统的高可用性集群应用研究", 《信息系统工程》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105959397A (zh) * 2016-06-16 2016-09-21 阿里巴巴集团控股有限公司 信息处理方法、装置及服务器
CN105959397B (zh) * 2016-06-16 2019-01-18 阿里巴巴集团控股有限公司 信息处理方法、装置及服务器
CN107181834A (zh) * 2017-06-13 2017-09-19 聚好看科技股份有限公司 一种redis管理虚拟IP地址的方法、装置及redis系统
CN107181834B (zh) * 2017-06-13 2021-02-12 聚好看科技股份有限公司 一种redis管理虚拟IP地址的方法、装置及redis系统
CN109144415A (zh) * 2018-08-01 2019-01-04 新华三云计算技术有限公司 节点检测方法及共享存储装置
CN109144415B (zh) * 2018-08-01 2022-05-06 新华三云计算技术有限公司 节点检测方法及共享存储装置
CN112351118A (zh) * 2021-01-07 2021-02-09 广东睿江云计算股份有限公司 一种物理机的组播方法及其系统
CN112351118B (zh) * 2021-01-07 2021-05-18 广东睿江云计算股份有限公司 一种物理机的组播方法及其系统

Similar Documents

Publication Publication Date Title
EP3142011B9 (en) Anomaly recovery method for virtual machine in distributed environment
US11194679B2 (en) Method and apparatus for redundancy in active-active cluster system
CN108847982B (zh) 一种分布式存储集群及其节点故障切换方法和装置
EP3253028B1 (en) Method for managing instance node and management device
US10038593B2 (en) Method and system for recovering virtual network
CN105515838A (zh) 一种服务配置方法及ha集群系统
EP3214865B1 (en) Cluster arbitration method and multi-cluster coordination system
EP2637102B1 (en) Cluster system with network node failover
CN109254876A (zh) 云计算系统中数据库的管理方法和装置
CN101262479B (zh) 一种网络文件共享的方法、服务器和网络文件共享的系统
CN111338858A (zh) 一种双机房的容灾方法及装置
CN103902401A (zh) 基于监控的虚拟机容错方法及装置
CN101557307B (zh) 调度自动化系统应用状态管理方法
CN112737844A (zh) 冗余系统中主备切换的方法和装置
CN109286583B (zh) 一种控制器网络端口管理方法、装置、设备及存储介质
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
JP2003345620A (ja) 多ノードクラスタシステムのプロセス監視方法
CN106326042B (zh) 一种运行状态确定方法及装置
CN111934909B (zh) 主备机ip资源切换方法、装置、计算机设备和存储介质
JP2009110218A (ja) 仮想化スイッチおよびそれを用いたコンピュータシステム
CN105306256B (zh) 一种基于VxWorks设备的双机热备实现方法
CN115086219B (zh) 一种虚拟路由器确定方法、设备及计算机可读存储介质
US20150301911A1 (en) Information processing apparatus, control method for information processing apparatus, and computer-readable recording medium
CN109344015B (zh) 一种数据库服务使用ha预防双主节点的方法及系统
CN109412888B (zh) 虚拟交换机监控方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20170106

Address after: 266000 Shandong Province, Qingdao city Laoshan District Songling Road No. 399

Applicant after: Poly Polytron Technologies Inc

Address before: 266071 Laoshan, Qingdao province Hongkong District No. East Road, room 248, room 131

Applicant before: Hisense Media Networks Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160420