CN110768848A - 一种主备服务器切换方法及装置 - Google Patents

一种主备服务器切换方法及装置 Download PDF

Info

Publication number
CN110768848A
CN110768848A CN201911056428.7A CN201911056428A CN110768848A CN 110768848 A CN110768848 A CN 110768848A CN 201911056428 A CN201911056428 A CN 201911056428A CN 110768848 A CN110768848 A CN 110768848A
Authority
CN
China
Prior art keywords
server
interface
main server
time
time length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911056428.7A
Other languages
English (en)
Other versions
CN110768848B (zh
Inventor
湛剑
孙艳杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou DPTech Technologies Co Ltd
Original Assignee
Hangzhou DPTech Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou DPTech Technologies Co Ltd filed Critical Hangzhou DPTech Technologies Co Ltd
Priority to CN201911056428.7A priority Critical patent/CN110768848B/zh
Publication of CN110768848A publication Critical patent/CN110768848A/zh
Application granted granted Critical
Publication of CN110768848B publication Critical patent/CN110768848B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提出一种主备服务器切换方法及装置,该方法包括检测主服务器接口,当接口处于正常状态,且检测到该接口当前时刻无流量流入时,统计无流量流入时长;若无流量流入时长达到第一时长阈值,则将业务切换至备服务器。该装置包括统计模块和第一切换模块。本申请在确定主服务器接口没有故障的情况下,检测接口是否有流量流入,当检测到接口没有流量流入时,统计无流量流入的时间,如果统计的无流量流入时间达到了将要能够对业务造成损失的第一时长阈值时,立刻进行主备切换,以使备服务器能够继续处理业务,避免由于业务长时间处于中断状态而造成损失。

Description

一种主备服务器切换方法及装置
技术领域
本申请涉及网络通信领域,具体涉及一种主备服务器切换方法及装置。
背景技术
随着信息技术的发展,业务的信息化越来越普及,各企业对业务信息化的重视程度也越来越高,服务器对于业务的处理也越来越重要。但服务器出现故障的几率并不小,服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天,而对于一些重要系统而言,企业是很难忍受这样长时间的服务中断的。现有技术中常采用双机热备的方式来解决上述问题。
双机热备是指使用两台服务器,一台主服务器处于工作状态,一台备服务器处于监控准备状态,服务器数据包括数据库数据同时发往两台服务器,保证数据的即时同步。当主服务器出现故障时,备服务器会通过心跳得知主服务器发生故障,此时主服务器停止工作,并将业务资源转移到备服务器上,由备服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。双机热备由备用的服务器解决了在主服务器故障时服务中断的问题。现有技术中,在检测到主服务器自身原因导致的故障时,可以触发主备切换,但在有些情况下,业务处理出现中断时却无法及时进行主备切换,进而会对企业造成严重的损失。
发明内容
有鉴于此,本申请提供一种主备服务器切换方法及装置,在主服务器正常,但业务处理却出现中断的情况下,可以及时进行主备服务器切换,进而避免业务处理处于长时间中断状态,进而避免对企业造成损失。
为实现上述目的,本申请提供技术方案如下:
本申请提出一种主备服务器切换方法,该方法包括:
检测主服务器接口,当接口处于正常状态,且检测到该接口当前时刻无流量流入时,统计无流量流入时长;
若无流量流入时长达到第一时长阈值,则将业务切换至备服务器。
本申请提出一种主备服务器切换装置,该装置包括:
统计模块,用于检测主服务器接口,当接口处于正常状态,且检测到该接口当前时刻无流量流入时,统计无流量流入时长;
第一切换模块,用于若无流量流入时长达到第一时长阈值,则将业务切换至备服务器。
本申请在确定主服务器接口没有故障的情况下,还要检测接口是否有流量流入,当检测到接口没有流量流入时,从当前时刻开始统计无流量流入的时长,如果统计的无流量流入时长达到了将要能够对业务造成损失的第一时长阈值时,立刻将业务流量切换至备服务器,以使备服务器能够继续处理业务,避免由于业务长时间处于中断状态而造成损失。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本申请示出的一种双机热备的网络架构示意图;
图2是本申请示出的一种主备服务器切换方法的流程示意图;
图3是本申请示出的另一种主备服务器切换方法的流程示意图;
图4是本申请示出的一种主备服务器切换方法的一种具体实施方式的流程示意图;
图5是本申请示出的一种主备服务器切换装置的结构示意图;
图6是本申请示出的另一种主备服务器切换装置的结构示意图;
图7是本申请示出的一种主备服务器切换装置中控制模块的结构示意图。
具体实施方式
这里将详细地对示例性实施方式进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
随着信息技术的发展,业务的信息化越来越普及,各企业对业务信息化的重视程度也越来越高,服务器对于业务的处理也越来越重要。但服务器出现故障的几率并不小,服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天,而对于一些重要系统而言,企业是很难忍受这样长时间的服务中断的。现有技术中常采用双机热备的方式来解决上述问题。双机热备是指使用两台服务器,一台主服务器处于工作状态,一台备服务器处于监控准备状态,服务器数据包括数据库数据同时发往两台服务器,保证数据的即时同步。当主服务器出现故障时,备服务器会通过心跳得知主服务器发生故障,此时主服务器停止工作,并将业务资源转移到备服务器上,由备服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。双机热备由备用的服务器解决了在主服务器故障时服务中断的问题。
现有技术中,在检测到主服务器掉电或主服务器接口出现问题等主服务器自身原因导致的故障时,可以触发主备切换。如图1所示,图1为本申请示出的一种双机热备的网络架构示意图,在主服务器正常时,主服务器处理业务流量,备服务器处于监控准备状态,主服务器按照一定的时间间隔通过心跳发送通信信号,表明自身的运行状态,一旦自身发生故障,则通过心跳告知备服务器,或者备服务器无法收到主系统的心跳,则认为主服务器发生故障,会进行主备切换,主服务器停止工作,备服务器开始处理业务流量。
但在有些情况下,却无法及时进行主备切换,以至于业务处理会发生长时间中断。例如当主服务器并未发生故障,却因为人为错误操作、或者网络故障等原因导致流量不能调度至主服务器时,那么主服务器还是可以一直和备服务器保持心跳连接,且也不会告知备服务器自身发生了故障,从而无法及时进行主备切换,但此时业务处理已经处于中断状态,当业务的中断时长超过了该业务能够承受的最长中断时长时,可能会对业务造成不可逆的影响对企业造成严重的损失。
本申请提出一种主备服务器切换方法,用以解决当主服务器本身并未故障,但主服务器无法接收到业务流量时,无法触发主备切换的问题。
图2是本申请示出的一种主备服务器切换方法的流程示意图;
S201:检测主服务器接口,当接口处于正常状态,且检测到接口当前时刻无流量流入时,统计无流量流入时长;
结合图1,主服务器通过接口接收上行设备发送的业务流量,当主服务器接口正常的情况下,检测主服务器接口是否有流量流入,检测接口是否有流量流入可以通过统计接口1秒内流入的流量数据包数量,当该接口1秒内流入的流量数据包数量发生了变化,则确定该接口当前时刻有流量流入,如果没有变化,则确定该接口当前时刻没有流量流入,还可以通过其他方法进行确实接口是否有流量流入,本申请并不对此做限定。
S202:若无流量流入时长达到第一时长阈值,则将业务切换至备服务器。
第一时长阈值为业务能够接受的最长中断的时长阈值,不同的业务能够接受的最长中断的时长阈值也不同。例如,当服务器处理的业务为游戏业务时,游戏业务能够接受最长中断的时长可能有10分钟,当超过10分钟以后可能会对该游戏业务造成不可逆的影响;当服务器处理的业务为银行业务时,该银行业务能够接受最长中断的时长可能更短,只有5分钟,当超过5分钟以后可能会对该银行业务造成不可逆的影响。此时就要根据服务器处理的流量业务类型预先设置第一时长阈值,例如,如果服务器处理的业务为银行业务时,将第一时长阈值设置为5分钟;如果服务器处理的业务为游戏业务时,将第一时长阈值设置为10分钟。当然,如果服务器同时负责处理多项业务,就要确定多项业务中哪项业务能够接受的最长中断的时长最小,并将该业务能接受的最长中断的时长选取为第一时长阈值。例如服务器既处理游戏业务又处理银行业务,那么在确定了银行业务能够接受的最长中断的时长为5分钟,游戏业务能够接受的最长中断的时长为10分钟之后,选取银行业务能够接受的最长中断的时长5分钟作为第一时阈值。
当服务器无流量流入的时长达到了第一时长阈值时,则将业务切换至备服务器。
例如,主服务器处理的业务为银行业务时,确定第一时长阈值为5分钟,当检测到服务器接口无流量流入的时长达到了5分钟,则直接将银行业务流量切换到备服务器,以使备服务器能够继续处理银行业务,避免该银行业务中断的时长超过其能够接受的最长中断时间而带来的损失。
又例如,当主服务器处理的业务为银行业务和游戏业务时,确定第一时长阈值为5分钟,当检测到服务器无流量流入的时长达到了5分钟,则直接将业务流量切换到备服务器,以使备服务器能够继续处理业务,因为游戏业务能够接受的最长中断时间为10分钟,因此此时将业务切换至备服务器进行处理,既可以避免银行业务中断的时长超过其能够接受的最长中断时间,也可以避免游戏业务中断的时长超过其能够接受的最长中断时间,从而避免了损失。由于本申请采用的系统为双机热备系统,备服务器随时处于开机待命状态,故一旦需要进行主备服务器切换,可以认定备服务器能够立刻代替主服务器进行工作。本申请提出的一种主备服务器切换方法,可以应用于主服务器,也可以应用于第三方监控设备,本申请并不对此进行限定。
本申请提出一种主备服务器切换方法,在确定主服务器接口没有故障的情况下,还要检测接口是否有流量流入,当检测到接口没有流量流入时,从当前时刻开始统计无流量流入的时间,如果统计的无流量流入时间达到了将要能够对业务造成损失的第一时长阈值时,立刻将业务流量切换至备服务器,以使备服务器能够继续处理业务,避免对业务造成严重的损失。
图3是本申请示出的另一种主备服务器切换方法的流程示意图;
S301:若无流量流入时长未达到第一时长阈值,则判断无流量流入时长是否大于第二时长阈值,该第二时长阈值小于第一时长阈值;
当主服务器接口无流量流入时长没有达到会对业务造成损失的第一时长阈值时,主服务器接口又重新接收到了流量,说明中断的时间并不会对业务造成损失,此时并不必立即将业务切换至备服务器进行处理。但由于发生了主服务器接口无流量流入的情况,还需要进一步确定是由于什么原因引起的,例如可能是主服务器无法与所有上行设备进行通信造成的。但如果一旦出现无流量流入的情况就立马进行测试主服务器是否可以与所有上行设备进行通信,会产生较多的测试流量,会占用大量的系统处理资源。例如,由于网络延迟,主服务器接口流量流入只中断了1秒时,就要测试主服务器是否可以与所有上行设备进行通信,这显然会使系统产生过多不必要的测试流量,大大增加了系统的负担。
故本申请提出了第二时长阈值,第二时长阈值小于第一时长阈值,只有当主服务器接口无流量流入时长大于第二时长阈值时,才对主服务器所处系统的网络状况进行测试。当主服务器接口无流量流入时长小于第二时长阈值时,说明是正常情况下会发生的主服务器接口无流量流入现象,例如由于网络延迟造成的出现短暂的主服务器接口无流量流入现象,此时并不对主服务器所在系统的网络状况进行测试,节约了网络流量资源和系统处理资源。
优选的,可以基于不同时段的网络延迟设置第二时长阈值,可以根据网络实际情况得到网络高峰时段以及低峰时段,并根据高峰时段以及低峰时段的不同网络延迟情况确定第二时长阈值,在当前时间到达预设时间段时,则可以自动针对此预设时间段的网络延迟确定第二时长阈值。
例如,经过流量数据统计发现用户网络低峰时段为每天的00:00-05:00,高峰时段为每天的19:00-21:00。
低峰时段的网络延迟时间为2秒,高峰时段的网络延迟时间为3秒。
当在低峰时间段时,第二时长阈值可以设置为2秒,当在高峰时间段时,第二时长阈值可以设置为3秒。
这种基于时间的第二时长阈值配置方式可以更适应用户网络流量环境,在后续根据第二时长阈值判断是否需要进行检测主服务器与上行设备连通性时,可以根据不同时间段的不同第二时长阈值进行判断,更加符合实际网络情况,更加合理也更具有针对性。
S302:若无流量流入时长大于第二时长阈值,则控制主服务器基于该接口保存的ARP表项中记录的全部IP地址生成ARP请求报文并通过该接口发送至上行设备;
如果判断得到无流量流入时长大于第二时长阈值,则说明不是由于网络延迟引起的接口无流量流入,此时就需要测试主服务器与所有上行设备的连通性。故本申请通过控制可主服务器向所有上行设备发送ARP请求报文。
S303:检测主服务器是否接收到ARP表项中全部IP地址对应的上行设备返回的ARP响应报文;
S304:若否,则将业务切换至备服务器。
如果检测到主服务器能接收到全部上行设备发送的ARP回应报文,则说明主服务器能够与所有上行设备进行正常通信,进而确定主服务器所在系统的网络状况正常,无流量流入的情况可能仅是由于没有业务请求或由于某种其他正常原因造成的,故并不进行主备服务器的切换;但如果检测到主服务器不能接收到全部上行设备发送的ARP回应报文,则说明主服务器不能与全部上行设备进行正常通信,此时直接进行主备服务器切换,避免任何一个上行设备发送的业务请求出现长时间中断。
优选的,若无流量流入时长大于第二时长阈值时,可以控制主服务器发送组播PING报文,组播组的成员为主服务器的所有上行设备,并检测主服务器是否接收到全部组播组成员发送的PING响应报文,如果能够收到全部组播组成员发送的PING响应报文,则说明主设备可以与所有上行设备进行通信,并不必再控制主服务器生成并发送APR请求报文,也不并不进行主备服务器切换。主服务器发送组播PING报文与查表基于每个IP地址发送APR请求报文相比,速率更快,故在确定无流量流入时长大于第二时长阈值时,可以优先发送组播PING报文。
但由于存在上游设备误认为该组播PING报文为攻击报文而直接丢弃的情况,故当检测到主服务器不能收到全部上行设备发送的PING响应报文时,也不能直接认定该上行设备与主服务器不能进行通信,还要基于稳定性更高的ARP请求报文进一步确定主服务器是否能够与所有上行设备进行通信。
本申请提出一种主备服务器切换方法,在确定主服务器接口无流量流入时长未达到第一时长阈值时,进一步判断主服务器接口无流量流入时长是否大于第二时长阈值时,当小于第二时长阈值时,则说明是由于正常的网络延迟引起的无流量流入,不用对主服务器的网络连通性进行测试,且不用进行主备服务器切换;当大于第二时长阈值时,则可能是主服务器无法接收到全部上行设备发送的业务请求流量造成的,故需要进一步对主服务器的网络连通性进行测试,当通过测试发现主服务器不能连通所有上行设备时,直接进行主备切换,避免任一上行设备发送的业务请求无法得到处理,从而造成业务中断,进而提高了双机热备系统的业务处理能力,避免了由于任一上行设备无法与主服务器进行通信而造成的损失。
图4是本申请示出的一种主备服务器切换方法的一种具体实施方式的流程示意图;
结合图1所示的网络结构,假设本申请主服务器处理的业务为银行业务,该银行业务能够接受的最大中断时长为5分钟,则确定第一时长阈值为5分钟。
S401,主服务器通过接口接收上行设备发送的银行业务流量,当判断该接口无流量流入时,则统计该接口无流量流入的时长。S402,判断无流量流入时长是否达到第一时长阈值,如果检测到该接口无流量流入的时间超过了第一时长阈值即超过了银行业务能够接受的最大中断时长5分钟,则立即执行S408进行主备服务器切换,避免银行业务长时间得不到处理,而造成损失。
当该接口无流量流入时长未超过银行业务能够接受的最大中断时长5分钟时,即未超过第一时长阈值时,则不必立即切换主备服务器,执行S403进一步判断该接口无流量流入时长是否大于第二时长阈值,第二时长阈值根据时间信息确定的,例如该检测时间为20:15,处于高峰时段,则第二时长阈值确定为3秒。如果小于第二时长阈值,却确定该接口无流量流入时长是因为正常的网络延迟造成的,主服务器所处的网络环境没有发生故障,执行S409不进行主备服务器切换。但如果该接口无流量流入时长大于第二时长阈值,则说明可能不是因为简单的网络延迟造成的接口流量流入,还有可能是因为主服务器的多个上行设备之间的一个或多个上行设备无法与主服务器通信造成的,故需要对主服务器是否能与所有上行设备通信进行测试。故当该接口无流量流入时长大于第二时长阈值时,则执行S404控制主服器发送组播PING报文至所有上行设备,并执行S405检测主服务器是否能够接收到全部组播组成员发送的PING响应报文。如图1中,如果当检测到主服务器接口无流量流入时长大于第二时长阈值3秒时,则控制主服务器向用户1、2和3发送组播PING报文,并检测主服务器否接收到所有上行设备返回的PING响应报文。如果能够接收到,则说明主服器可以与所有上行设备进行通信,执行S409不切换主备服务器;如果不能接受到所有上行设备发送的PING响应报文,则执行S406继续控制主服务器向所有上行设备发送ARP请求报文,并执行S407检测主服务器是否能够收到所有上行设备发送的ARP响应报文,如果能收到则说明主服务器能够与所有上行设备都进行通信,则执行S409不必切换主备服务器;但如果主服务器不能收到所有上行设备发送的ARP响应报文,例如不能接收到用户1发送的ARP响应报文,则说明主服务器不能与用户1进行通信,修复主服务器与上行设备的通信,可能需要较长的修复时间,会影响到用户1请求的业务处理,故在判断到主服务器无法与所有上行设备进行通信时,直接执行S408进行主备服务器切换,以使备服务器能够继续处理业务。
与前述一种主备服务器切换方法的实施方式相对应,本申请还提供了一种主备服务器切换装置的实施方式。
图5是是本申请示出的一种主备服务器切换装置的结构示意图
本申请提出一种主备切换装置,该装置包括:
统计模块510,用于检测主服务器接口,当接口处于正常状态,且检测到该接口当前时刻无流量流入时,统计无流量流入时长;
第一切换模块520,用于若无流量流入时长达到第一时长阈值,则将业务切换至备服务器。
本申请提出一种主备服务器切换装置,在确定主服务器接口没有故障的情况下,检测接口是否有流量流入,当检测到接口没有流量流入时,从当前时刻开始统计无流量流入的时间,如果统计的无流量流入时间达到了将要能够对业务造成损失的第一时长阈值时,立刻将业务流量切换至备服务器,以使备服务器能够继续处理业务,避免对业务造成严重的损失。
图6是本申请示出的另一种主备服务器切换装置的结构示意图;
该主备切换装置,在图5示出的主备服务器切换装置的基础上还包括:
判断模块530,用于若无流量流入时长未达到第一时长阈值,则判断该无流量流入时长是否大于第二时长阈值;第二时长阈值小于第一时长阈值;
控制模块540,用于若无流量流入时长大于第二时长阈值,则控制主服务器基于该接口保存的ARP表项中记录的全部IP地址生成ARP请求报文并通过该接口发送至上行设备;
第二切换模块550,用于若检测到该主服务器未接收到ARP表项中全部IP地址对应的上行设备返回的ARP响应报文时,则将业务切换至备服务器。
以上三个模块,可以在无流量流入时长小于第一时长阈值时,进一步判断是否是由于网络延迟或者由于主服器无法与所有上行设备通信造成的,当判断是由于主服器无法与所有上行设备通信造成的时,直接进行主备服务器切换,避免由于无法对该上行设备发送的业务进行处理而发生重大损失,当判断是由于网络延迟造成的短暂的主服务器接口无流量流入时,则不必进行主备服务器切换,也不必对主服务器和上行设备的连通性进行测试,节约了系统的处理资源和网络资源。
图7是本申请示出的一种主备服务器切换装置中控制模块的结构示意图。
该控制模块包括:
第一控制子模块710,用于若无流量流入时长大于第二时长阈值,则控制主服务器发送组播PING报文;该组播组的成员为主服务器的所有上行设备;
第二控制子模块720,用于当检测到主服务器未接收到全部组播组成员发送的PING响应报文时,则控制主服务器基于该接口保存的ARP表项中记录的IP地址生成ARP请求报文并通过该接口发送至上行设备。
控制模块,用于在判断主服务器是否与能够与所有上行设备进行通信时,优选的,可以先采用控制主服务器发送速率较快但稳定性不强的PING请求,当能够就收到所有上行设备发送的PING响应报文时,则并不切换主备服务器。当不能够接收到所有上行设备发送的PING响应报文时,再采用稳定性强但速率相对较慢的ARP请求,进一步判断主服务器是否能够与所有上行设备进行通信,与直接采用ARP请求相比,在主服务器能够与所有上行设备通信时,显然检测速度更快。
上述设备中各个部件的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于设备实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的设备实施例仅仅是示意性的。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种主备服务器切换方法,其特征在于,所述方法包括:
检测主服务器接口,当接口处于正常状态,且检测到所述接口当前时刻无流量流入时,统计无流量流入时长;
若所述无流量流入时长达到第一时长阈值,则将业务切换至备服务器。
2.根据权利要求1所述的方法,其特征在于,
所述第一时长阈值根据流量业务类型确定。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述无流量流入时长未达到第一时长阈值,则判断所述无流量流入时长是否大于第二时长阈值,所述第二时长阈值小于第一时长阈值;
若所述无流量流入时长大于第二时长阈值,则控制所述主服务器基于所述接口保存的ARP表项中记录的全部IP地址生成ARP请求报文并通过所述接口发送至上行设备;
检测所述主服务器是否接收到ARP表项中全部IP地址对应的上行设备返回的ARP响应报文;
若否,则将业务切换至备服务器。
4.根据权利要求3所述的方法,其特征在于,
所述第二时长阈值根据时间信息确定。
5.根据权利要求3所述方法,其特征在于,所述若无流量流入时长大于第二时长阈值,则控制所述主服务器基于所述接口保存的ARP表项中记录的全部IP地址生成ARP请求报文并通过所述接口发送至上行设备,包括:
若所述无流量流入时长大于第二时长阈值,则控制所述主服务器发送组播PING报文,所述组播组的成员为主服务器的所有上行设备;
检测所述主服务器是否接收到全部组播组成员发送的PING响应报文;
若否,则控制所述主服务器基于所述接口保存的ARP表项中记录的全部IP地址生成ARP请求报文并通过所述接口发送至上行设备。
6.一种主备服务器切换装置,其特征在于,所述装置包括:
统计模块,用于检测主服务器接口,当接口处于正常状态,且检测到所述接口当前时刻无流量流入时,统计无流量流入时长;
第一切换模块,用于若无流量流入时长达到第一时长阈值,则将业务切换至备服务器。
7.根据权利要求6所述的装置,其特征在于,
所述第一时长阈值根据流量业务类型确定。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
判断模块,用于若所述无流量流入时长未达到第一时长阈值,则判断所述无流量流入时长是否大于第二时长阈值;所述第二时长阈值小于第一时长阈值;
控制模块,用于若所述无流量流入时长大于第二时长阈值,则控制主服务器基于所述接口保存的ARP表项中记录的全部IP地址生成ARP请求报文并通过所述接口发送至上行设备;
第二切换模块,用于若检测到所述主服务器未接收到ARP表项中全部IP地址对应的上行设备返回的ARP响应报文时,则将业务切换至备服务器。
9.根据本权利要求8所述的装置,其特征在于,
所述第二时长阈值根据时间信息确定。
10.根据权利要求8所述的装置,其特征在于,所述控制模块包括:
第一控制子模块,用于若无流量流入时长大于第二时长阈值,则控制主服务器发送组播PING报文;所述组播组的成员为主服务器的所有上行设备;
第二控制子模块,用于当检测到主服务器未接收到全部组播组成员发送的PING响应报文时,则控制主服务器基于所述接口保存的ARP表项中记录的IP地址生成ARP请求报文并通过所述接口发送至上行设备。
CN201911056428.7A 2019-10-31 2019-10-31 一种主备服务器切换方法及装置 Active CN110768848B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911056428.7A CN110768848B (zh) 2019-10-31 2019-10-31 一种主备服务器切换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911056428.7A CN110768848B (zh) 2019-10-31 2019-10-31 一种主备服务器切换方法及装置

Publications (2)

Publication Number Publication Date
CN110768848A true CN110768848A (zh) 2020-02-07
CN110768848B CN110768848B (zh) 2022-07-01

Family

ID=69335933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911056428.7A Active CN110768848B (zh) 2019-10-31 2019-10-31 一种主备服务器切换方法及装置

Country Status (1)

Country Link
CN (1) CN110768848B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738783A (zh) * 2020-08-18 2020-10-02 国信电子票据平台信息服务有限公司 一种高可用的电子发票开具方法及系统
CN113973117A (zh) * 2020-07-22 2022-01-25 马上消费金融股份有限公司 数据访问方法、网关设备、服务器和数据访问系统
CN114301763A (zh) * 2021-12-15 2022-04-08 山石网科通信技术股份有限公司 分布式集群故障的处理方法及系统、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1418023A (zh) * 2001-11-06 2003-05-14 华为技术有限公司 无线接入网中基站控制器的备份实现方法及装置
CN102291403A (zh) * 2011-08-10 2011-12-21 华为技术有限公司 实现pos端口的链路层协议自适应的方法和设备
CN102739453A (zh) * 2012-07-03 2012-10-17 华为软件技术有限公司 主备切换方法、设备及系统
CN103634131A (zh) * 2012-08-24 2014-03-12 杭州华三通信技术有限公司 一种虚拟化网络设备互联链路检测方法及设备
CN104796329A (zh) * 2014-01-16 2015-07-22 中国移动通信集团北京有限公司 一种链路自动切换方法及装置
CN106656617A (zh) * 2016-12-29 2017-05-10 杭州迪普科技股份有限公司 一种主备切换方法及装置
EP3282642A1 (en) * 2015-09-23 2018-02-14 Huawei Technologies Co., Ltd. Flow control method and equipment

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1418023A (zh) * 2001-11-06 2003-05-14 华为技术有限公司 无线接入网中基站控制器的备份实现方法及装置
CN102291403A (zh) * 2011-08-10 2011-12-21 华为技术有限公司 实现pos端口的链路层协议自适应的方法和设备
CN102739453A (zh) * 2012-07-03 2012-10-17 华为软件技术有限公司 主备切换方法、设备及系统
CN103634131A (zh) * 2012-08-24 2014-03-12 杭州华三通信技术有限公司 一种虚拟化网络设备互联链路检测方法及设备
CN104796329A (zh) * 2014-01-16 2015-07-22 中国移动通信集团北京有限公司 一种链路自动切换方法及装置
EP3282642A1 (en) * 2015-09-23 2018-02-14 Huawei Technologies Co., Ltd. Flow control method and equipment
CN106656617A (zh) * 2016-12-29 2017-05-10 杭州迪普科技股份有限公司 一种主备切换方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113973117A (zh) * 2020-07-22 2022-01-25 马上消费金融股份有限公司 数据访问方法、网关设备、服务器和数据访问系统
CN111738783A (zh) * 2020-08-18 2020-10-02 国信电子票据平台信息服务有限公司 一种高可用的电子发票开具方法及系统
CN114301763A (zh) * 2021-12-15 2022-04-08 山石网科通信技术股份有限公司 分布式集群故障的处理方法及系统、电子设备及存储介质

Also Published As

Publication number Publication date
CN110768848B (zh) 2022-07-01

Similar Documents

Publication Publication Date Title
CN110768848B (zh) 一种主备服务器切换方法及装置
US8570896B2 (en) System and method for controlling threshold testing within a network
US10601643B2 (en) Troubleshooting method and apparatus using key performance indicator information
US8036134B2 (en) Disabled state and state signaling for link aggregation
US7929448B2 (en) Monitoring link aggregation links
US9270560B2 (en) Session layer for monitoring utility application traffic
KR101513863B1 (ko) 네트워크 요소 서비스 복구를 위한 방법 및 시스템
CN106789445B (zh) 一种广电网络中网络设备的状态轮询方法和系统
US11102273B2 (en) Uplink performance management
JP2006501717A (ja) 電気通信ネットワーク・エレメントの監視
EP2892274B1 (en) Fault recovery method of operation and maintenance channel and network management terminal
CN103957538A (zh) 一种网络质量探测方法和设备
CN105071968A (zh) 一种通信设备的业务面和控制面的隐性故障修复方法和装置
JP2023523472A (ja) ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体
CN115378844B (zh) 一种网络链路的故障检测方法及装置
WO2015154512A1 (zh) 一种组播链路的检测方法、网络设备及服务器
EP2815549B1 (en) Method and apparatus for improved handling of ims node blacklisting
CN112714060B (zh) 一种链路检测方法及设备
CN108234156B (zh) 传输报文的方法和设备
CN110830284A (zh) 一种基于sdn网络的业务故障监测的方法和装置
CN104158735A (zh) 网络数据包的分配方法和装置
CN112636999A (zh) 一种端口的探测方法和网络监控系统
CN111200520A (zh) 网络监控方法、服务器和计算机可读存储介质
TW201110617A (en) Network detecting device and method of network quality detecting thereof
CN112751740B (zh) 一种erps子环资源释放方法、系统、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant