CN107483260A - 故障处理方法及装置、电子设备 - Google Patents

故障处理方法及装置、电子设备 Download PDF

Info

Publication number
CN107483260A
CN107483260A CN201710748702.1A CN201710748702A CN107483260A CN 107483260 A CN107483260 A CN 107483260A CN 201710748702 A CN201710748702 A CN 201710748702A CN 107483260 A CN107483260 A CN 107483260A
Authority
CN
China
Prior art keywords
long connection
connection server
server cluster
gateway
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710748702.1A
Other languages
English (en)
Other versions
CN107483260B (zh
Inventor
高岩
李小伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201710748702.1A priority Critical patent/CN107483260B/zh
Publication of CN107483260A publication Critical patent/CN107483260A/zh
Application granted granted Critical
Publication of CN107483260B publication Critical patent/CN107483260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本申请提供一种故障处理方法及装置、电子设备,所述方法的一具体实施方式包括:当所述第一网关或者所述第一长连接服务器集群发生故障时,断开与所述第一网关的连接;所述第一网关对应于第一长连接服务器集群,所述第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群;确定所述多个长连接服务器集群中满足预设条件的第二长连接服务器集群;与所述第二长连接服务器集群对应的第二网关建立连接。该实施方式能够在已建立连接的第一网关或者第一长连接服务器发生故障时,能快速恢复用户设备与业务服务器之间的正常通信,提高了用户设备与业务服务器之间的通信效率,增强了整个网络系统的稳定性。

Description

故障处理方法及装置、电子设备
技术领域
本申请涉及通信技术领域,特别涉及一种故障处理方法及装置、电子设备。
背景技术
随着网络技术的不断发展,网络系统被应用于各个领域,为人们提供了更多便捷的服务。网络系统可以由多个设备构成,在网络系统中,当与用户设备连接的中间网络设备发生故障时,只能等待发生故障的中间网络设备故障消除后,才能恢复用户设备与业务服务器之间的正常通信。因此,网络系统的稳定性较差。
发明内容
为了解决上述技术问题之一,本申请提供一种故障处理方法及装置、电子设备。
根据本申请实施例的第一方面,提供一种故障处理方法,包括:
当第一网关或者第一长连接服务器集群发生故障时,断开与所述第一网关的连接;所述第一网关对应于第一长连接服务器集群,所述第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群;
确定所述多个长连接服务器集群中满足预设条件的第二长连接服务器集群;
与所述第二长连接服务器集群对应的第二网关建立连接。
可选的,所述确定所述多个长连接服务器集群中满足预设条件的第二长连接服务器集群,包括:
获取所述多个长连接服务器集群的列表;
基于所述列表选取满足预设条件的第二长连接服务器集群。
可选的,所述获取所述多个长连接服务器集群的列表,包括:
从HTTP服务器获取所述列表;或者
从缓存的数据中获取所述列表;或者
从本地配置文件中获取所述列表。
可选的,所述基于所述列表选取满足预设条件的第二长连接服务器集群,包括:
同时向所述列表中的每个长连接服务器集群发送连接请求报文;
将接收到的首个响应报文对应的长连接服务器集群作为满足预设条件的第二长连接服务器集群。
可选的,所述方法还包括:
当已连接的域名服务器发生故障时,获取目标域名对应的IP地址;
通过所述IP地址直接访问所述目标域名对应的服务器。
可选的,获取目标域名对应的IP地址,包括:
生成第一标识;
响应于所述第一标识,获取域名与IP地址的映射关系;所述映射关系为预先从已连接的所述域名服务器中获取并存储的;
基于所述映射关系获取所述目标域名对应的IP地址。
可选的,所述方法还包括:
当所述域名服务器的故障消除时,恢复通过所述域名服务器访问目标域名对应的服务器。
根据本申请实施例的第二方面,提供一种故障处理装置,包括:
切断模块,用于在第一网关或者第一长连接服务器集群发生故障时,断开与所述第一网关的连接;所述第一网关对应于第一长连接服务器集群,所述第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群;
确定模块,用于确定所述多个长连接服务器集群中满足预设条件的第二长连接服务器集群;
第二连接模块,用于与所述第二长连接服务器集群对应的第二网关建立连接。
根据本申请实施例的第三方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的故障处理方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请的实施例提供的故障处理方法和装置,在第一网关或者第一长连接服务器集群发生故障时,断开与第一网关的连接,该第一网关对应于第一长连接服务器集群,该第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群。确定上述多个长连接服务器集群中满足预设条件的第二长连接服务器集群,与第二长连接服务器集群对应的第二网关建立连接。从而在已建立连接的第一网关或者第一长连接服务器集群发生故障时,无需等待第一网关或者第一长连接服务器集群的故障消除,就能快速恢复用户设备与业务服务器之间的正常通信,提高了用户设备与业务服务器之间的通信效率,增强了整个网络系统的稳定性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请根据一示例性实施例示出的一种故障处理的场景示意图;
图2是本申请根据一示例性实施例示出的一种故障处理方法的流程图;
图3是本申请根据一示例性实施例示出的另一种故障处理方法的流程图;
图4是本申请根据一示例性实施例示出的另一种故障处理方法的流程图;
图5是本申请根据一示例性实施例示出的一种故障处理装置的框图;
图6是本申请根据一示例性实施例示出的另一种故障处理装置的框图;
图7是本申请根据一示例性实施例示出的另一种故障处理装置的框图;
图8是本申请根据一示例性实施例示出的另一种故障处理装置的框图;
图9是本申请根据一示例性实施例示出的一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1所示,是根据一示例性实施例示出的一种故障处理的场景示意图:在图1示出的场景中,长连接服务器集群102可以通过集群网关103与多个终端104(例如,可以是收银终端等)进行通信,长连接服务器集群102可以将从业务服务器101中获取的业务信息推送给相应的终端104。多个终端104之间可以建立TCP(Transmission Control Protocol,传输控制协议)长连接。每个终端104均可以与域名服务器105进行通信,以通过域名服务器105访问相应的HTTP(Hyper Text Transfer Protocol,超文本传输协议)服务器107,也可以通过网站网关106直接与HTTP服务器107进行通信。HTTP服务器107可以将从终端104中获取的信息传输给业务服务器101。
当某个集群网关103或者某个长连接服务器集群102发生故障后,与其相连的终端104会首先断开与该发生故障的集群网关103或者长连接服务器集群102之间的连接。然后,获取所有长连接服务器集群102的列表,基于该列表向每个长连接服务器集群102发送连接请求报文。并与接收到的首个响应报文对应的长连接服务器集群的集群网关103建立连接。
当域名服务器105正常工作时,终端104可以从域名服务器105中获取域名与IP地址的映射关系,并将该映射关系进行存储。当域名服务器105发生故障后,终端104会从已存储的数据中获取该映射关系,并基于该映射关系获取目标域名对应的IP地址。通过该IP地址直接访问目标域名对应的服务器。
应该理解,图1中的业务服务器、长连接服务器集群、集群网关、终端、域名服务器、网站网关和HTTP服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的业务服务器、长连接服务器集群、集群网关、终端、域名服务器、网站网关和HTTP服务器。
下面将结合具体的实施例对本申请进行详细描述。
如图2所示,图2是根据一示例性实施例示出的一种故障处理方法的流程图,该方法可以应用于用户设备中。该用户设备可以包括但不限于收银终端设备等,该方法包括以下步骤:
在步骤201中,当第一网关或者第一长连接服务器集群发生故障时,断开与第一网关的连接。
在本实施例中,长连接服务器集群为通过TCP长连接的方式与客户端设备进行通信的服务器集群。第一网关对应于第一长连接服务器集群,该第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群。具体来说,可以预先部署多个长连接服务器集群,每个长连接服务器集群均与业务服务器建立通信连接。针对上述用户设备,可以从上述多个长连接服务器集群中选取匹配的第一长连接服务器集群。然后,将该用户设备与该第一长连接服务器集群对应的第一网关建立连接,使该用户设备能够通过第一网关与该第一长连接服务器集群进行通信。
在本实施例的一种实现方式中,从上述多个长连接服务器集群中选取该用户设备匹配的第一长连接服务器集群,可以是选取预先指定的长连接服务器集群作为第一长连接服务器集群。在本实施例的另一种实现方式中,还可以由该用户设备向上述多个长连接服务器集群中的每个长连接服务器集群发送连接请求,选取响应速度最快的长连接服务器集群作为第一长连接服务器集群。可以理解,还可以通过其它方式选取该用户设备匹配的第一长连接服务器集群,本申请对此方面不限定。
一般来说,用户设备与第一网关建立连接以后,第一长连接服务器集群每隔预设时长(例如,1秒,或者5秒,或者10秒等)就会通过第一网关向用户设备发送一个心跳信号,以确定该第一网关与该用户设备之间的连接正常。如果该用户设备在接收到一个心跳信号后,超过预设时长还没有接到下一个心跳信号,则说明检测到第一网关或者第一长连接服务器集群发生故障。在本实施例中,当检测到第一网关或者第一长连接服务器集群发生故障时,可以断开该用户设备与第一网关之间的连接。
在步骤202中,确定上述多个长连接服务器集群中满足预设条件的第二长连接服务器集群。
在本实施例中,首先,可以获取上述多个长连接服务器集群的列表。具体来说,用户设备可以向HTTP服务器发送列表获取请求,以从HTTP服务器获取该列表,也可以直接从用户设备的缓存数据中获取该列表,还可以直接从用户设备的本地配置文件中获取该列表。还可以首先向HTTP服务器发送列表获取请求,当未成功接收到HTTP服务器返回的该列表时,进一步从缓存的数据中查找该列表,当未成功查找到该列表时,还可以进一步从本地配置文件中获取该列表。可以理解,本申请对获取上述多个长连接服务器集群的列表的具体方式方面不限定。
接着,基于该列表选取满足预设条件的第二长连接服务器集群。具体来说,可以同时向上述列表中的每个长连接服务器集群发送连接请求报文,将接收到的首个响应报文对应的长连接服务器集群(即响应最快的长连接服务器集群)作为满足预设条件的第二长连接服务器集群。其中,该响应报文为针对连接请求报文的响应报文。可以理解,还可以通过其它的方式选取满足预设条件的第二长连接服务器集群,例如,选取该列表中满足其它条件,并且处于可用状态的长连接服务器集群作为第二长连接服务器集群,本申请对此方面不限定。
在步骤203中,与第二长连接服务器集群对应的第二网关建立连接。
在本实施例中,将该用户设备与该第二长连接服务器集群对应的第二网关建立连接,使该用户设备能够通过第二网关与该第二长连接服务器集群进行通信。
本申请的上述实施例提供的故障处理方法,在第一网关或者第一长连接服务器集群发生故障时,断开与第一网关的连接,该第一网关对应于第一长连接服务器集群,该第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群。确定上述多个长连接服务器集群中满足预设条件的第二长连接服务器集群,与第二长连接服务器集群对应的第二网关建立连接。从而在已建立连接的第一网关或者第一长连接服务器集群发生故障时,无需等待第一网关或者第一长连接服务器集群的故障消除,就能快速恢复用户设备与业务服务器之间的正常通信,提高了用户设备与业务服务器之间的通信效率,增强了整个网络系统的稳定性。
如图3所示,图3根据一示例性实施例示出的另一种故障处理分配方法的流程图,该实施例描述了域名服务器发生故障时的过程,该方法可以应用于用户设备中,该用户设备可以包括但不限于收银终端设备等,包括以下步骤:
在步骤301中,当第一网关或者第一长连接服务器集群发生故障时,断开与第一网关的连接。
在步骤302中,确定上述多个长连接服务器集群中满足预设条件的第二长连接服务器集群。
在步骤303中,与第二长连接服务器集群对应的第二网关建立连接。
在步骤304中,当已连接的域名服务器发生故障时,获取目标域名对应的IP地址。
在本实施例中,当与用户设备已建立连接的域名服务器处于正常工作状态时,用户设备可以从该域名服务器中获取域名与IP地址的映射关系,并将该映射关系进行存储。一般来说,用户设备可以通过ping服务周期性的检测已连接的域名服务器是否发生故障。当检测到已连接的域名服务器发生故障时,可以生成第一标识,该第一标识用于指示通过IP地址直接访问目标域名对应的服务器。响应于该第一标识,从已存储的数据中获取域名与IP地址的映射关系,并基于该映射关系获取目标域名对应的IP地址。
在步骤305中,通过该IP地址直接访问目标域名对应的服务器。
需要说明的是,对于与图2实施例中相同的步骤,在上述图3实施例中不再进行赘述,相关内容可参见图2实施例。
本申请的上述实施例提供的故障处理方法,在第一网关或者第一长连接服务器集群发生故障时,断开与第一网关的连接,该第一网关对应于第一长连接服务器集群,该第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群。确定上述多个长连接服务器集群中满足预设条件的第二长连接服务器集群,与第二长连接服务器集群对应的第二网关建立连接。在已连接的域名服务器发生故障时,获取目标域名对应的IP地址,通过该IP地址直接访问目标域名对应的服务器。从而不仅可以在已建立连接的第一网关或者第一长连接服务器集群发生故障时,能够快速恢复用户设备与业务服务器之间的正常通信,还能在已连接的域名服务器发生故障时,直接通过目标域名对应的IP地址访问对应的服务器。有助于进一步提高用户设备与业务服务器之间的通信效率,进一步增强了整个网络系统的稳定性。
在一些可选实施方式中,该方法还可以进一步包括:当域名服务器的故障消除时,恢复通过域名服务器访问目标域名对应的服务器。
在本实施例中,具体来说,当检测到域名服务器的故障消除时,可以生成第二标识,该第二标识用于指示通过域名服务器访问目标域名对应的服务器。响应于该第二标识,重新与域名服务器建立连接,并恢复通过域名服务器访问目标域名对应的服务器。
如图4所示,图4根据一示例性实施例示出的另一种故障处理的流程图,该实施例详细描述了获取目标域名对应的IP地址的过程,该方法可以应用于用户设备中,该用户设备可以包括但不限于收银终端设备等,包括以下步骤:
在步骤401中,当第一网关或者第一长连接服务器集群发生故障时,断开与第一网关的连接。
在步骤402中,确定上述多个长连接服务器集群中满足预设条件的第二长连接服务器集群。
在步骤403中,与第二长连接服务器集群对应的第二网关建立连接。
在步骤404中,从已连接的域名服务器中获取域名与IP地址的映射关系。
在步骤405中,将该映射关系进行存储。
在步骤406中,当域名服务器发生故障时,生成第一标识。
在步骤407中,响应于第一标识,从已存储的数据中获取上述映射关系。
在步骤408中,基于该映射关系获取目标域名对应的IP地址。
在步骤409中,通过该IP地址直接访问目标域名对应的服务器。
在步骤410中,当域名服务器的故障消除时,生成第二标识。
在步骤411中,响应于第二标识,恢复通过域名服务器访问目标域名对应的服务器。
需要说明的是,对于与图2和图3实施例中相同的步骤,在上述图4实施例中不再进行赘述,相关内容可参见图2和图3实施例。
本申请的上述实施例提供的故障处理方法,在第一网关或者第一长连接服务器集群发生故障时,断开与第一网关的连接,该第一网关对应于第一长连接服务器集群,该第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群。确定上述多个长连接服务器集群中满足预设条件的第二长连接服务器集群,与第二长连接服务器集群对应的第二网关建立连接。并且,从已连接的域名服务器中获取域名与IP地址的映射关系,将该映射关系进行存储。在该域名服务器发生故障时,获取目标域名对应的IP地址,通过该IP地址直接访问目标域名对应的服务器。并在域名服务器的故障消除时,恢复通过域名服务器访问目标域名对应的服务器。由于预先从域名服务器获取了域名与IP地址的映射关系,并将该映射关系进行存储。因此,在已连接的域名服务器发生故障时,可以基于预先存储的上述映射关系,直接访问目标域名对应服务器。有效地解决了由于域名服务器发生故障而导致的用户设备与业务服务器之间的通信效率低的问题,有助于增强整个网络系统的稳定性。
应当注意,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
与前述故障处理方法实施例相对应,本申请还提供了故障处理装置的实施例。
如图5所示,图5是本申请根据一示例性实施例示出的一种故障处理装置框图,该装置可以包括:第一连接模块501,切断模块502,确定模块503以及第二连接模块504。
其中,切断模块501,用于在第一网关或者第一长连接服务器集群发生故障时,断开与第一网关的连接。该第一网关对应于第一长连接服务器集群,第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群。
确定模块502,用于确定多个长连接服务器集群中满足预设条件的第二长连接服务器集群。
第二连接模块503,用于与第二长连接服务器集群对应的第二网关建立连接。
如图6所示,图6是本申请根据一示例性实施例示出的另一种故障处理装置框图,该实施例在前述图5所示实施例的基础上,确定模块502可以包括:获取子模块601和选取子模块602。
其中,获取子模块601,用于获取上述多个长连接服务器集群的列表。
选取子模块602,用于基于该列表选取满足预设条件的第二长连接服务器集群。
在一些可选实施方式中,获取子模块601被配置用于:从HTTP服务器获取上述列表;或者从缓存的数据中获取上述列表;或者从本地配置文件中获取上述列表。
在另一些可选实施方式中,选取子模块602被配置用于:同时向上述列表中的每个长连接服务器集群发送连接请求报文,将接收到的首个响应报文对应的长连接服务器集群作为满足预设条件的第二长连接服务器集群。
如图7所示,图7是本申请根据一示例性实施例示出的另一种故障处理装置框图,该实施例在前述图5所示实施例的基础上,该装置还可以进一步包括:第一获取模块504和访问模块505。
其中,第一获取模块504,用于在已连接的域名服务器发生故障时,获取目标域名对应的IP地址。
访问模块505,用于通过IP地址直接访问目标域名对应的服务器。
在另一些可选实施方式中,第一获取模块504被配置用于:在域名服务器发生故障时,生成第一标识,响应于第一标识,获取域名与IP地址的映射关系,基于该映射关系获取目标域名对应的IP地址。
如图8所示,图8是本申请根据一示例性实施例示出的另一种故障处理装置框图,该实施例在前述图7所示实施例的基础上,该装置还可以进一步包括:恢复模块506。
其中,恢复模块506,用于在域名服务器的故障消除时,恢复通过域名服务器访问目标域名对应的服务器。
应当理解,上述装置可以预先设置在用户设备中,也可以通过下载等方式而加载到用户设备中。上述装置中的相应模块可以与用户设备中的模块相互配合以实现故障处理方案。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图2至图4任一实施例提供的故障处理方法。
对应于上述的故障处理方法,本申请实施例还提出了图9所示的根据本申请的一示例性实施例的电子设备的示意结构图。请参考图9,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成故障处理装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (9)

1.一种故障处理方法,其特征在于,所述方法包括:
当第一网关或者第一长连接服务器集群发生故障时,断开与所述第一网关的连接;所述第一网关对应于第一长连接服务器集群,所述第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群;
确定所述多个长连接服务器集群中满足预设条件的第二长连接服务器集群;
与所述第二长连接服务器集群对应的第二网关建立连接。
2.根据权利要求1所述的方法,其特征在于,所述确定所述多个长连接服务器集群中满足预设条件的第二长连接服务器集群,包括:
获取所述多个长连接服务器集群的列表;
基于所述列表选取满足预设条件的第二长连接服务器集群。
3.根据权利要求2所述的方法,其特征在于,所述获取所述多个长连接服务器集群的列表,包括:
从HTTP服务器获取所述列表;或者
从缓存的数据中获取所述列表;或者
从本地配置文件中获取所述列表。
4.根据权利要求2所述的方法,其特征在于,所述基于所述列表选取满足预设条件的第二长连接服务器集群,包括:
同时向所述列表中的每个长连接服务器集群发送连接请求报文;
将接收到的首个响应报文对应的长连接服务器集群作为满足预设条件的第二长连接服务器集群。
5.根据权利要求1-4中任一所述的方法,其特征在于,所述方法还包括:
当已连接的域名服务器发生故障时,获取目标域名对应的IP地址;
通过所述IP地址直接访问所述目标域名对应的服务器。
6.根据权利要求5所述的方法,其特征在于,获取目标域名对应的IP地址,包括:
生成第一标识;
响应于所述第一标识,获取域名与IP地址的映射关系;所述映射关系为预先从已连接的所述域名服务器中获取并存储的;
基于所述映射关系获取所述目标域名对应的IP地址。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
当所述域名服务器的故障消除时,恢复通过所述域名服务器访问目标域名对应的服务器。
8.一种故障处理装置,其特征在于,所述装置包括:
切断模块,用于在第一网关或者第一长连接服务器集群发生故障时,断开与所述第一网关的连接;所述第一网关对应于第一长连接服务器集群,所述第一长连接服务器集群选自预先部署的与业务服务器建立通信连接的多个长连接服务器集群;
确定模块,用于确定所述多个长连接服务器集群中满足预设条件的第二长连接服务器集群;
第二连接模块,用于与所述第二长连接服务器集群对应的第二网关建立连接。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-7任一项所述的故障处理方法。
CN201710748702.1A 2017-08-28 2017-08-28 故障处理方法及装置、电子设备 Active CN107483260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710748702.1A CN107483260B (zh) 2017-08-28 2017-08-28 故障处理方法及装置、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710748702.1A CN107483260B (zh) 2017-08-28 2017-08-28 故障处理方法及装置、电子设备

Publications (2)

Publication Number Publication Date
CN107483260A true CN107483260A (zh) 2017-12-15
CN107483260B CN107483260B (zh) 2021-03-02

Family

ID=60602761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710748702.1A Active CN107483260B (zh) 2017-08-28 2017-08-28 故障处理方法及装置、电子设备

Country Status (1)

Country Link
CN (1) CN107483260B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108234304A (zh) * 2017-12-29 2018-06-29 生迪智慧科技有限公司 数据传输方法、装置及系统
CN109245915A (zh) * 2018-08-10 2019-01-18 阿里巴巴集团控股有限公司 一种实现服务器集合均衡调配的方法及系统
CN109921961A (zh) * 2019-03-29 2019-06-21 深圳市思迪信息技术股份有限公司 基于移动平台的多站点网络测速方法及装置
CN110417915A (zh) * 2019-08-22 2019-11-05 北京大米科技有限公司 一种推送消息传输方法、装置、存储介质及电子设备
CN110809064A (zh) * 2019-09-05 2020-02-18 连连银通电子支付有限公司 一种ip地址切换方法、装置及系统
CN111314126A (zh) * 2020-02-11 2020-06-19 网宿科技股份有限公司 服务ip的部署方法及系统、监控设备
CN111800466A (zh) * 2020-06-03 2020-10-20 香港乐蜜有限公司 一种长连接服务的建立方法、装置、电子设备及存储介质
CN111930548A (zh) * 2020-08-12 2020-11-13 湖南快乐阳光互动娱乐传媒有限公司 一种多集群分布式服务的故障模拟系统
CN114422428A (zh) * 2022-01-13 2022-04-29 挂号网(杭州)科技有限公司 服务节点的重启方法、装置、电子设备及存储介质
CN114938373A (zh) * 2022-05-23 2022-08-23 睿云联(厦门)网络通讯技术有限公司 一种云平台tcp长连接服务的高可用连接方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0605339A2 (en) * 1992-10-14 1994-07-06 International Business Machines Corporation Method and apparatus for making a cluster of computers appear as a single host on a network
CN101431520A (zh) * 2008-12-24 2009-05-13 金蝶软件(中国)有限公司 一种建立连接的方法、重定向连接的方法及相关设备
CN102037709A (zh) * 2008-05-21 2011-04-27 艾利森电话股份有限公司 刀片集群交换中心服务器中的资源池化
CN103248504A (zh) * 2012-02-06 2013-08-14 上海软智信息科技有限公司 一种集群节点匹配方法、集群通信模块、设备及系统
CN104581794A (zh) * 2013-10-22 2015-04-29 中国移动通信集团四川有限公司 一种中间件业务故障处理方法及系统
CN105024860A (zh) * 2015-07-23 2015-11-04 上海斐讯数据通信技术有限公司 一种远程通信控制方法及系统
CN105227374A (zh) * 2015-10-23 2016-01-06 浪潮(北京)电子信息产业有限公司 一种集群应用的故障迁移方法和系统
CN105991305A (zh) * 2015-01-28 2016-10-05 中国移动通信集团四川有限公司 一种识别链路异常的方法及装置
US20170078137A1 (en) * 2015-09-14 2017-03-16 Dynatrace Llc Method And System For Clustered Real-time Correlation Of Trace Data Fragments Describing Distributed Transaction Executions
CN106570074A (zh) * 2016-10-14 2017-04-19 深圳前海微众银行股份有限公司 分布式数据库系统及其实现方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0605339A2 (en) * 1992-10-14 1994-07-06 International Business Machines Corporation Method and apparatus for making a cluster of computers appear as a single host on a network
CN102037709A (zh) * 2008-05-21 2011-04-27 艾利森电话股份有限公司 刀片集群交换中心服务器中的资源池化
CN101431520A (zh) * 2008-12-24 2009-05-13 金蝶软件(中国)有限公司 一种建立连接的方法、重定向连接的方法及相关设备
CN103248504A (zh) * 2012-02-06 2013-08-14 上海软智信息科技有限公司 一种集群节点匹配方法、集群通信模块、设备及系统
CN104581794A (zh) * 2013-10-22 2015-04-29 中国移动通信集团四川有限公司 一种中间件业务故障处理方法及系统
CN105991305A (zh) * 2015-01-28 2016-10-05 中国移动通信集团四川有限公司 一种识别链路异常的方法及装置
CN105024860A (zh) * 2015-07-23 2015-11-04 上海斐讯数据通信技术有限公司 一种远程通信控制方法及系统
US20170078137A1 (en) * 2015-09-14 2017-03-16 Dynatrace Llc Method And System For Clustered Real-time Correlation Of Trace Data Fragments Describing Distributed Transaction Executions
CN105227374A (zh) * 2015-10-23 2016-01-06 浪潮(北京)电子信息产业有限公司 一种集群应用的故障迁移方法和系统
CN106570074A (zh) * 2016-10-14 2017-04-19 深圳前海微众银行股份有限公司 分布式数据库系统及其实现方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108234304A (zh) * 2017-12-29 2018-06-29 生迪智慧科技有限公司 数据传输方法、装置及系统
CN109245915B (zh) * 2018-08-10 2021-06-15 创新先进技术有限公司 一种实现服务器集合均衡调配的方法及系统
CN109245915A (zh) * 2018-08-10 2019-01-18 阿里巴巴集团控股有限公司 一种实现服务器集合均衡调配的方法及系统
CN109921961A (zh) * 2019-03-29 2019-06-21 深圳市思迪信息技术股份有限公司 基于移动平台的多站点网络测速方法及装置
CN110417915A (zh) * 2019-08-22 2019-11-05 北京大米科技有限公司 一种推送消息传输方法、装置、存储介质及电子设备
CN110809064A (zh) * 2019-09-05 2020-02-18 连连银通电子支付有限公司 一种ip地址切换方法、装置及系统
CN110809064B (zh) * 2019-09-05 2022-12-16 连连银通电子支付有限公司 一种ip地址切换方法、装置及系统
CN111314126A (zh) * 2020-02-11 2020-06-19 网宿科技股份有限公司 服务ip的部署方法及系统、监控设备
CN111800466A (zh) * 2020-06-03 2020-10-20 香港乐蜜有限公司 一种长连接服务的建立方法、装置、电子设备及存储介质
CN111930548A (zh) * 2020-08-12 2020-11-13 湖南快乐阳光互动娱乐传媒有限公司 一种多集群分布式服务的故障模拟系统
CN111930548B (zh) * 2020-08-12 2024-03-01 湖南快乐阳光互动娱乐传媒有限公司 一种多集群分布式服务的故障模拟系统
CN114422428A (zh) * 2022-01-13 2022-04-29 挂号网(杭州)科技有限公司 服务节点的重启方法、装置、电子设备及存储介质
CN114938373A (zh) * 2022-05-23 2022-08-23 睿云联(厦门)网络通讯技术有限公司 一种云平台tcp长连接服务的高可用连接方法及系统
CN114938373B (zh) * 2022-05-23 2023-11-03 睿云联(厦门)网络通讯技术有限公司 一种云平台tcp长连接服务的高可用连接方法及系统

Also Published As

Publication number Publication date
CN107483260B (zh) 2021-03-02

Similar Documents

Publication Publication Date Title
CN107483260A (zh) 故障处理方法及装置、电子设备
CN102404396B (zh) P2p流量识别方法、装置、设备和系统
US10795744B2 (en) Identifying failed customer experience in distributed computer systems
TWI603206B (zh) Server cluster based data processing method and cluster based data processing system
RU2010146258A (ru) Способ, устройство и система для распределения сообщений
CN109714190A (zh) 一种基于应用级别的负载均衡与故障转移系统及其方法
CN109831351A (zh) 链路跟踪方法、装置、终端及存储介质
CN108769242A (zh) 一种报文调度方法及装置
CN102223266B (zh) 一种协议代理检测方法和装置
CN104426881A (zh) 一种检测恶意行为的方法及装置
CN104660597A (zh) 三层认证方法、装置及三层认证交换机
CN106027284A (zh) 网络的故障诊断方法及装置
CN110619022B (zh) 基于区块链网络的节点检测方法、装置、设备及存储介质
CN103618778A (zh) 利用Linux虚拟主机实现数据高并发的系统及方法
CN107404456A (zh) 错误定位方法及装置
JP2022525205A (ja) 異常ホストのモニタニング
CN109863723A (zh) 存在多个网络接口情况下的自动网络连接恢复
CN105763391A (zh) 一种会话数据流处理系统、方法和相关设备
JP4910542B2 (ja) Sipメッセージ引渡プログラム
CN109474579A (zh) 一种网络重连的方法和装置
CN109120557A (zh) 一种智能路由器wan口的动态切换方法及系统
CN106301898B (zh) 一种配置信息的同步方法及装置
CN111385324A (zh) 一种数据通信方法、装置、设备和存储介质
CN106161051B (zh) 客户端智能选线
CN108900430A (zh) 一种网络流量阻断的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant