WO2020259551A1

WO2020259551A1 - 一种网络连接故障处理方法及装置

Info

Publication number: WO2020259551A1
Application number: PCT/CN2020/097989
Authority: WO
Inventors: 赵帅
Original assignee: 北京金山云网络技术有限公司; 北京金山云科技有限公司
Priority date: 2019-06-28
Filing date: 2020-06-24
Publication date: 2020-12-30
Also published as: CN110300026A

Abstract

本申请实施例提供了一种网络连接故障处理方法及装置，在客户端与部署于容器中的服务端之间的网络连接建立失败的情况下，确定服务端的半连接队列是否溢出，若确定服务端的半连接队列溢出，则按照预设调整规则，增大半连接队列的队列长度，直至服务端的半连接队列不再溢出，若确定服务端的半连接队列未溢出，则确定客户端与服务端之间的网络连接路径，对网络连接路径中的节点进行故障检测，确定待修复节点，以对待修复节点进行修复。这样，通过判断服务端的半连接队列是否溢出，可以对网络故障进行诊断，从而减少人工消耗，提高网络故障处理效率。

Description

一种网络连接故障处理方法及装置

本申请要求于2019年6月28日提交中国专利局、申请号为201910578595.1发明名称为“一种网络连接故障处理方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及互联网技术领域，特别是涉及一种网络连接故障处理方法及装置。

背景技术

在一个容器中，包括一个或多个应用程序以及这些应用程序的运行所必需的环境文件。将应用程序部署在容器中，可以减少由于宿主机操作系统发行版本和其他基础环境的变化造成的应用程序运行差异。一些场景中，可以将服务端部署在容器中，这样，即使服务端所处的宿主机发生变化，服务端也可以为客户端提供稳定的服务。

通常，客户端与部署在容器中的服务端之间需要通过TCP(Transmission Control Protocol，传输控制协议)建立连接，才能进行数据传输。但是，在通过TCP建立连接的过程中，存在建立连接失败的可能，可以理解，连接建立失败将导致客户端与服务端之间的通信失败，进而对服务端所提供的服务的可用性产生较大的影响。而目前通常只能通过运维人员人工排查的方式，处理网络连接故障，需要耗费大量的人工，且效率较低。

因此，目前亟需一种基于容器平台的业务的自动化的网络连接故障处理方法。

发明内容

本申请实施例的目的在于提供一种网络连接故障处理方法及装置，以实现基于容器的自动化的网络连接故障处理。具体技术方案如下：

本申请实施例提供了一种网络连接故障处理方法，所述方法包括：

在客户端与部署于容器中的服务端之间的网络连接建立失败的情况下，确定所述服务端的半连接队列是否溢出；

如果确定所述服务端的半连接队列溢出，则按照预设调整规则，增大所述半连接队列的队列长度，直至所述服务端的半连接队列不再溢出；

如果确定所述服务端的半连接队列未溢出，则确定所述客户端与所述服务端之间的网络连接路径，对所述网络连接路径中的节点进行故障检测，确定待修复节点，以对所述待修复节点进行修复。

可选的，在所述按照预设调整规则，增大所述半连接队列的队列长度，直至所述服务端的半连接队列不再溢出之后，所述方法还包括：

若在所述服务端的半连接队列不再溢出的情况下，所述客户端与所述服务端之间的网络连接建立失败，则确定所述客户端与所述服务端之间的网络连接路径，对所述网络连接路径中的节点进行故障检测，确定待修复节点，以对所述待修复节点进行修复。

可选的，所述确定所述服务端的半连接队列是否溢出，包括：

获取所述服务端的半连接队列的溢出信息；

若获取到所述溢出信息，则确定所述服务端的确定所述服务端的半连接队列溢出；

若未获取到所述溢出信息，则确定所述服务端的半连接队列未溢出。

可选的，所述溢出信息中包含有溢出数量；所述按照预设调整规则，增大所述半连接队列的队列长度，直至所述服务端的半连接队列不再溢出，包括：

每次增大所述半连接队列的队列长度后，获取该次增大队列长度后的半连接队列的溢出数量；

比对该次增大队列长度后的半连接队列的溢出数量和前一次获取的溢出数量，若两者相同，则确定所述服务端的半连接队列不再溢出

可选的，所述获取所述服务端的半连接队列的溢出信息，包括：

登录所述容器，在所述容器内输入网络信息查询指令，以获取所述容器的网络信息，在所述网络信息中查询与所述溢出信息对应的预定格式的字符信息，作为所述溢出信息。

可选的，所述按照预设调整规则，增大所述半连接队列的队列长度，包括：

将所述服务端的队列参数的数值增大N倍，其中，所述N为自然数，且N的取值大于1；或者，

将所述服务端的队列参数的数值增加预设值；

其中，所述队列参数用于定义所述服务端的半连接队列的队列长度。

可选的，所述对所述网络连接路径中的节点进行故障检测，确定待修复节点，包括：

向所述客户端发送故障检测指令，以使所述客户端利用因特网包探索器，向所述服务端发送预设数量的检测报文；

获取所述网络连接路径中的每个节点接收到的检测报文的数量；

判断每个所述节点接收到的检测报文的数量是否与所述预设数量相同，若不相同，则将该节点确定为待修复节点。

可选的，所述检测报文中包括标识信息；所述获取所述网络连接路径中的每个节点接收到的检测报文的数量，包括：

根据所述标识信息，获取所述网络连接路径中的每个节点接收到的检测报文的数量。

本申请实施例还提供了一种网络连接故障处理装置，所述装置包括：

确定模块，设置为在客户端与部署于容器中的服务端之间的网络连接建立失败的情况下，确定所述服务端的半连接队列是否溢出；

调整模块，设置为如果确定所述服务端的半连接队列溢出，则按照预设调整规则，增大所述半连接队列的队列长度，直至所述服务端的半连接队列不再溢出；

第一检测模块，设置为如果确定所述服务端的半连接队列未溢出，则确定所述客户端与所述服务端之间的网络连接路径，对所述网络连接路径中的节点进行故障检测，确定待修复节点，以所述待修复节点进行修复。

可选的，所述装置还包括：

第二检测模块，设置为若在所述服务端的半连接队列不再溢出的情况下，所述客户端与所述服务端之间的网络连接建立失败，则确定所述客户端与所述服务端之间的网络连接路径，对所述网络连接路径中的节点进行故障检测，确定待修复节点，以所述待修复节点进行修复。

可选的，所述确定模块，具体设置为：

获取所述服务端的半连接队列的溢出信息；

可选的，所述溢出信息中包含有溢出数量；所述调整模块，具体设置为：

可选的，所述确定模块，具体设置为：

可选的，所述调整模块，具体设置为：

将所述服务端的队列参数的数值增加预设值；

可选的，所述第一检测模块，具体设置为：

可选的，所述检测报文中包括标识信息；所述第一检测模块，具体设置为：

本申请实施例还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，设置为存放计算机程序；

处理器，设置为执行存储器上所存放的程序时，实现上述任一所述的网络连接故障处理方法。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的网络连接故障处理方法。

本申请实施例还提供了一种可执行程序代码，所述可执行程序代码设置为被运行以执行上述任一所述的网络连接故障处理方法。

本申请实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的网络连接故障处理方法。

本申请实施例有益效果：

本申请实施例提供的网络连接故障处理方法及装置，在客户端与部署于容器中的服务端之间的网络连接建立失败的情况下，确定服务端的半连接队列是否溢出，若确定服务端的半连接队列溢出，则按照预设调整规则，增大半连接队列的队列长度，直至服务端的半连接队列不再溢出，若确定服务端的半连接队列未溢出，则确定客户端与服务端之间的网络连接路径，对网络连接路径中的节点进行故障检测，确定待修复节点，以对待修复节点进行修复。这样，通过判断服务端的半连接队列是否溢出，可以对网络故障进行诊断，若服务端的半连接队列溢出，则判定由于半连接队列已满导致网络连接故障，并通过增大半连接队列的队列长度进行修复，若服务端的半连接队列未溢出，则判定由于网络连接路径中的节点故障导致网络连接故障，并自动定位发生故障的待修复节点，以对待修复节点进行修复，从而减少人工消耗，提高网络故障处理效率。

当然，实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本申请实施例和相关技术的技术方案，下面对实施例和相关技术中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为TCP建立连接的方法的流程示意图；

图2为本申请实施例提供的一种网络连接故障处理方法的流程示意图；

图3为本申请实施例提供的一种网络连接故障处理装置的结构示意图；

图4为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案、及优点更加清楚明白，以下参照附图并举实施例，对本申请进一步详细说明。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

一些场景中，可以将服务端部署在容器中，这样，即使服务端所处的宿主机发生变化，服务端也可以为客户端提供稳定的服务。通常，客户端与部署在容器中的服务端之间需要先通过TCP(Transmission Control Protocol，传输控制协议)建立连接，才能进行数据传输。

如图1所示，通过TCP建立连接的方式为：首先，由客户端向服务端发送SYN(Synchronize Sequence Numbers，同步序列编号)报文，服务端在接收到的SYN报文之后，返回SYN+ACK(Acknowledgement，确认字符)报文，进而，客户端向服务端发送ACK报文，从而建立客户端与服务端之间的连接。

其中，服务端在接收到的SYN报文之后，会生成该SYN报文对应的条目，并将该条目存储至半连接队列中，而在接收到该SYN报文对应的ACK报文之后，则会将该条目从半连接队列存储至全连接队列中。

但是，在通过TCP建立连接的过程中，存在建立连接失败的可能。举例而言，可能由于服务端的半连接队列已满，导致服务端不能及时回复SYN+ACK报文，从而导致建立连接失败，或者，也可能由于网络连接路径中的某一节点丢包，导致建立连接失败，等等。而目前通常只能通过运维人员人工排查的方式，处理网络连接故障，需要耗费大量的人工，且效率较低，缺少一种基于容器的自动化的网络连接故障处理方法。

为了解决上述技术问题，本申请提供了一种网络连接故障处理方法，该方法可以应用于任一电子设备，如服务端所处容器的宿主机、网络中的其他计算机、移动终端等等，本申请实施例对此不做限定。

下面从总体上对本申请实施例提供的网络连接故障处理方法进行说明，上述网络连接故障处理方法包括：

在客户端与部署于容器中的服务端之间的网络连接建立失败的情况下，确定服务端的半连接队列是否溢出；

如果确定服务端的半连接队列溢出，则按照预设调整规则，增大半连接队列的队列长度，直至服务端的半连接队列不再溢出；

如果确定服务端的半连接队列未溢出，则确定客户端与服务端之间的网络连接路径，对网络连接路径中的节点进行故障检测，确定待修复节点，以对待修复节点进行修复。

由以上可见，本申请实施例提供的网络连接故障处理方法，通过判断服务端的半连接队列是否溢出，可以对网络故障进行诊断，若服务端的半连接队列溢出，则判定由于半连接队列已满导致网络连接故障，并通过增大半连接队列的队列长度进行修复，若服务端的半连接队列未溢出，则判定由于网络连接路径中的节点故障导致网络连接故障，并自动定位发生故障的待修复节点，以对待修复节点进行修复，从而减少人工消耗，提高网络故障处理效率。

下面通过具体实施例，对本申请实施例提供的网络连接故障处理方法进行详细说明。

如图2所示，为本申请实施例提供的一种网络连接故障处理方法的流程示意图，包括如下步骤：

S201：在客户端与部署于容器中的服务端之间的网络连接建立失败的情况下，确定服务端的半连接队列是否溢出。若溢出，则执行S202，若未溢出，则执行S203。

在本步骤中，服务端部署在容器中，其中，容器是指一个完整的运行环境，在一个容器数据包中，可以包括服务端、以及类库、其他二进制文件、配置文件等等为该服务端提供运行环境的文件。通过将服务端及其运行环境容器化，可以减少操作系统发行版本和其他基础环境造成的服务端运行差异。

一种实现方式中，可以通过获取服务端的半连接队列的溢出信息，确定服务端的半连接队列是否溢出。若获取到溢出信息，则确定服务端的确定服务端的半连接队列溢出，若未获取到溢出信息，则确定服务端的半连接队列未溢出。

其中，溢出信息可以为一个标识信息，也就是说，当服务端的半连接队列溢出时，可以生成一个标识信息，以表示服务端的半连接队列溢出。溢出信息也可以包含溢出数量，也就是说，当服务端的半连接队列溢出时，输出溢出半连接队列的条目的数量。溢出数量可以为累计值，若半连接队列溢出，那么，溢出数量会增大，若半连接队列未溢出，那么，将不会输出溢出数量，或者，溢出数量与前一次的输出相比，不会发生变化。

在获取服务端的半连接队列的溢出信息时，可以先登录到服务端所处的容器。然后，在容器内输入网络信息查询指令，获取容器的网络信息。进而，在网络信息中查询与溢出信息对应的预定格式的字符信息，若在网络信息中查询到符合预设格式的字符信息，则对符合预设格式的字符信息进行分析，得到服务端的半连接队列的溢出信息，若网络信息中未查询到符合预设格式的字符信息，则判定未获取到溢出信息。

举例而言，可以通过docker exec命令(容器执行命令)，登录到服务端所处的容器中。然后，通过在容器内输入“netstat-s|grep overflow”指令，获取到容器的网络信息。若输出的网络信息中有类似“XXX times listen queue of socket overflow”的输出，则表明网络信息中存在符合预设格式的字符，其中，“XXX”表示任意一个具体的数字，也就是服务端的半连接队列的溢出数量。

S202：按照预设调整规则，增大半连接队列的队列长度，直至服务端的半连接队列不再溢出。

在本步骤中，若确定服务端的半连接队列溢出，表明服务端当前半连接队列已满，也就是说，可以初步判定是由于半连接队列已满，导致网络连接故障。在这种情况下，可以增大半连接队列的队列长度，直至服务端的半连接队列不再溢出，从而使得服务端的半连接队列能够存储新的条目。

其中，按照预设调整规则，增大半连接队列的队列长度的方式，可以为：首先，获取服务端的队列参数，其中，队列参数用于定义服务端的半连接队列的队列长度，然后，按照参数调整规则，增大队列参数的数值。

其中，按照参数调整规则，增大队列参数的数值，可以为将队列参数的数值增大N倍，其中，N的取值为大于1的自然数。比如，将队列参数的数值增大至当前值的2倍。

或者，按照参数调整规则，增大队列参数的数值，也可以为将队列参数的数值增大预设值。比如，将队列参数的数值在当前值的基础上增大1000，等等。

举例而言，一种实现方式中，队列参数包括net.core.somaxconn参数和backlog参数，其中，net.core.somaxconn参数定义了服务端允许的监听队列的最大长度，而backlog参数定义了服务端允许的全连接队列的最大长度。在这种情况下，半连接队列的最大队列长度为net.core.somaxconn参数和backlog参数中的最小值。

在另一种实现方式中，队列参数还可以包括tcp_max_syn_backlog参数，在这种情况下，半连接队列的最大队列长度为net.core.somaxconn参数、backlog参数以及tcp_max_syn_backlog参数中的最小值。

在按照预设调整规则，增大半连接队列的队列长度之后，可以由客户端尝试与服务端建立网络连接。具体的，可以向客户端发送建立连接的指令，客户端在接收到该指令之后，再次与部署于容器中的服务端建立网络连接。或者，客户端也可以按照预设时间间隔，不断尝试与部署于容器中的服务端建立连接。

一种实现方式中，若溢出信息中包含有溢出数量，那么，可以在每次增大半连接队列的队列长度后，获取该次增大队列长度后的半连接队列的溢出数量，然后，比对该次增大队列长度后的半连接队列的溢出数量和前一次获取的溢出数量。

若两者相同，可以确定服务端的半连接队列不再溢出，若该次增大队列长度后的半连接队列的溢出数量大于前一次获取的溢出数量，可以确定服务端的半连接队列仍然是溢出的，进而，可以继续按照预设调整规则，继续增大半连接队列的队列长度，直到半连接队列不再溢出。

若在服务端的半连接队列不再溢出的情况下，客户端与所述服务端之间的网络连接建立成功，那么，表明在此之前的网络连接故障是由于服务端的半连接队列已满导致的，通过增大半连接队列的队列长度，网络连接故障已经得到了处理。

而若在服务端的半连接队列不再溢出的情况下，客户端与服务端之间的网络连接依然建立失败，那么，表明网络连接故障是由于网络连接路径中的某一节点丢包导致的。在这种情况下，可以进一步确定客户端与服务端之间的网络连接路径，对网络连接路径中的节点进行故障检测，确定待修复节点，对待修复节点进行修复。

S203：确定客户端与服务端之间的网络连接路径，对网络连接路径中的节点进行故障检测，确定待修复节点，以对待修复节点进行修复。

在本步骤中，若确定服务端的半连接队列未溢出，可以推断，是由于网络连接路径中的节点故障，发生了丢包，从而导致网络故障。那么，可以确定客户端与服务端之间的网络连接路径，对网络连接路径中的各个节点进行故障检测，确定待修复节点。

具体的，可以通过查询路由表的方式，确定客户端与服务端之间的网络连接路径，或者，也可以通过向运营商方式查询信息的方式，确定客户端与服务端之间的网络连接路径，具体不做限定。

其中，对网络连接路径中的节点进行故障检测，确定待修复节点的方式，可以为：首先，向客户端发送故障检测指令，以使客户端利用ping(Packet Internet Groper，因特网包探索器)，向服务端发送预设数量的检测报文，然后，获取网络连接路径中的每个节点接收到的检测报文的数量，判断每个节点接收到的检测报文的数量是否与预设数量相同，若不相同，则将该节点确定为待修复节点。

其中，故障检测指令可以为ping-c 1000-Q 0x2<server_ip>命令，所发送的检测报文的预设数量，可以由故障检测指令中携带，或者，也可以由客户端随机生成。

对于接收到的检测报文的数量与预设数量不相同的待修复节点，可以对每个待修复节点进行修复，以尽快处理网络连接故障。或者，也可以按照网络连接路径中，从客户端至服务端的节点通过顺序，依次对每个待修复节点进行修复，每修复一个待修复节点，就尝试建立客户端与服务端之间的网络连接，可以理解，第一个丢包的待修复节点发生故障的可能大于后几个丢包的待修复节点，因此，可以减少处理网络连接故障中的资源消耗。

检测报文中还可以包括标识信息，该标识信息用于标识报文的类型为检测报文。这样，可以根据标识信息，获取网络连接路径中的每个节点接收到的检测报文的数量。从而提高故障检测的准确性。举例而言，标识信息可以位于检测报文中的DSCP(Differentiated Services Code Point，差分服务代码点)字段，比如，可以将DSCP字段设定为一个特定值，该特定值表示报文类型为检测报文。

上述内容中，比对该次增大队列长度后的半连接队列的溢出数量和前一次获取的溢出数量，如果该次增大队列长度后的半连接队列的溢出数量大于前一次获取的溢出数量，则可以返回按照预设调整规则，增大半连接队列的队列长度的步骤，直至某一次获取的溢出数量不大于上一次所获取的溢出数量。

与上述方法相对应的，本申请实施例还提供了一种网络连接故障处理装置，如图3所示，为上述网络连接故障处理装置的结构示意图，该装置包括：

确定模块310，设置为在客户端与部署于容器中的服务端之间的网络连接建立失败的情况下，确定服务端的半连接队列是否溢出；

调整模块320，设置为如果确定服务端的半连接队列溢出，则按照预设调整规则，增大半连接队列的队列长度，直至服务端的半连接队列不再溢出；

第一检测模块330，设置为如果确定服务端的半连接队列未溢出，则确定客户端与服务端之间的网络连接路径，对网络连接路径中的节点进行故障检测，确定待修复节点，以待修复节点进行修复。

一种实现方式中，装置还包括：

第二检测模块(图中未示出)，设置为若在服务端的半连接队列不再溢出的情况下，客户端与服务端之间的网络连接建立失败，则确定客户端与服务端之间的网络连接路径，对网络连接路径中的节点进行故障检测，确定待修复节点，以待修复节点进行修复。

一种实现方式中，确定模块310，具体设置为：

获取服务端的半连接队列的溢出信息；

若获取到溢出信息，则确定服务端的确定服务端的半连接队列溢出；

若未获取到溢出信息，则确定服务端的半连接队列未溢出。

一种实现方式中，溢出信息中包含有溢出数量；调整模块320，具体设置为：

每次增大半连接队列的队列长度后，获取该次增大队列长度后的半连接队列的溢出数量；

比对该次增大队列长度后的半连接队列的溢出数量和前一次获取的溢出数量，若两者相同，则确定服务端的半连接队列不再溢出。

一种实现方式中，确定模块310，具体设置为：

登录容器，在容器内输入网络信息查询指令，以获取容器的网络信息，在网络信息中查询与溢出信息对应的预定格式的字符信息，作为溢出信息。

一种实现方式中，调整模块320，具体设置为：

将服务端的队列参数的数值增大N倍，其中，N为自然数，且N的取值大于1；或者，

将服务端的队列参数的数值增加预设值；

其中，队列参数用于定义服务端的半连接队列的队列长度。

一种实现方式中，第一检测模块330，具体设置为：

向客户端发送故障检测指令，以使客户端利用因特网包探索器，向服务端发送预设数量的检测报文；

获取网络连接路径中的每个节点接收到的检测报文的数量；

判断每个节点接收到的检测报文的数量是否与预设数量相同，若不相同，则将该节点确定为待修复节点。

一种实现方式中，检测报文中包括标识信息；第一检测模块330，具体设置为：

根据标识信息，获取网络连接路径中的每个节点接收到的检测报文的数量。

由以上可见，本申请实施例提供的网络连接故障处理装置，通过判断服务端的半连接队列是否溢出，可以对网络故障进行诊断，若服务端的半连接队列溢出，则判定由于半连接队列已满导致网络连接故障，并通过增大半连接队列的队列长度进行修复，若服务端的半连接队列未溢出，则判定由于网络连接路径中的节点故障导致网络连接故障，并自动定位发生故障的待修复节点，以对待修复节点进行修复，从而减少人工消耗，提高网络故障处理效率。

本申请实施例还提供了一种电子设备，如图4所示，包括处理器401、通信接口402、存储器403和通信总线404，其中，处理器401，通信接口402，存储器403通过通信总线404完成相互间的通信，

存储器403，设置为存放计算机程序；

处理器401，设置为执行存储器403上所存放的程序时，实现如下步骤：

由以上可见，本申请实施例提供的电子设备，通过判断服务端的半连接队列是否溢出，可以对网络故障进行诊断，若服务端的半连接队列溢出，则判定由于半连接队列已满导致网络连接故障，并通过增大半连接队列的队列长度进行修复，若服务端的半连接队列未溢出，则判定由于网络连接路径中的节点故障导致网络连接故障，并自动定位发生故障的待修复节点，以对待修复节点进行修复，从而减少人工消耗，提高网络故障处理效率。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一网络连接故障处理方法的步骤。

在本申请提供的又一实施例中，还提供了一种可执行程序代码，所述可执行程序代码设置为被运行以执行上述任一所述的网络连接故障处理方法。

在本申请提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一网络连接故障处理方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务端或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务端或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务端、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例、电子设备实施例、存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

一种网络连接故障处理方法，其中，所述方法包括：

在客户端与部署于容器中的服务端之间的网络连接建立失败的情况下，确定所述服务端的半连接队列是否溢出；

如果确定所述服务端的半连接队列溢出，则按照预设调整规则，增大所述半连接队列的队列长度，直至所述服务端的半连接队列不再溢出；

如果确定所述服务端的半连接队列未溢出，则确定所述客户端与所述服务端之间的网络连接路径，对所述网络连接路径中的节点进行故障检测，确定待修复节点，以对所述待修复节点进行修复。
根据权利要求1所述的方法，其中，所述方法还包括：

若在所述服务端的半连接队列不再溢出的情况下，所述客户端与所述服务端之间的网络连接建立失败，则确定所述客户端与所述服务端之间的网络连接路径，对所述网络连接路径中的节点进行故障检测，确定待修复节点，以对所述待修复节点进行修复。
根据权利要求1或2所述的方法，其中，所述确定所述服务端的半连接队列是否溢出，包括：

获取所述服务端的半连接队列的溢出信息；

若获取到所述溢出信息，则确定所述服务端的确定所述服务端的半连接队列溢出；

若未获取到所述溢出信息，则确定所述服务端的半连接队列未溢出。
根据权利要求3所述的方法，其中，所述溢出信息中包含有溢出数量；所述按照预设调整规则，增大所述半连接队列的队列长度，直至所述服务端的半连接队列不再溢出，包括：

每次增大所述半连接队列的队列长度后，获取该次增大队列长度后的半连接队列的溢出数量；

比对该次增大队列长度后的半连接队列的溢出数量和前一次获取的溢出数量，若两者相同，则确定所述服务端的半连接队列不再溢出。
根据权利要求3所述的方法，其中，所述获取所述服务端的半连接队列的溢出信息，包括：

登录所述容器，在所述容器内输入网络信息查询指令，以获取所述容器的网络信息，在所述网络信息中查询与所述溢出信息对应的预定格式的字符信息，作为所述溢出信息。
根据权利要求1至5任一项所述的方法，其中，所述按照预设调整规则，增大所述半连接队列的队列长度，包括：

将所述服务端的队列参数的数值增大N倍，其中，所述N为自然数，且N的取值大于1；或者，

将所述服务端的队列参数的数值增加预设值；

其中，所述队列参数用于定义所述服务端的半连接队列的队列长度。
根据权利要求1至6任一项所述的方法，其中，所述对所述网络连接路径中的节点进行故障检测，确定待修复节点，包括：

向所述客户端发送故障检测指令，以使所述客户端利用因特网包探索器，向所述服务端发送预设数量的检测报文；

获取所述网络连接路径中的每个节点接收到的检测报文的数量；

判断每个所述节点接收到的检测报文的数量是否与所述预设数量相同，若不相同，则将该节点确定为待修复节点。
根据权利要求7所述的方法，其中，所述检测报文中包括标识信息；

所述获取所述网络连接路径中的每个节点接收到的检测报文的数量，包括：

根据所述标识信息，获取所述网络连接路径中的每个节点接收到的检测报文的数量。
一种网络连接故障处理装置，其中，所述装置包括：

确定模块，设置为在客户端与部署于容器中的服务端之间的网络连接建立失败的情况下，确定所述服务端的半连接队列是否溢出；

调整模块，设置为如果确定所述服务端的半连接队列溢出，则按照预设调整规则，增大所述半连接队列的队列长度，直至所述服务端的半连接队列不再溢出；

第一检测模块，设置为如果确定所述服务端的半连接队列未溢出，则确定所述客户端与所述服务端之间的网络连接路径，对所述网络连接路径中的节点进行故障检测，确定待修复节点，以所述待修复节点进行修复。
根据权利要求9所述的装置，其中，所述装置还包括：

第二检测模块，设置为若在所述服务端的半连接队列不再溢出的情况下，所述客户端与所述服务端之间的网络连接建立失败，则确定所述客户端与所述服务端之间的网络连接路径，对所述网络连接路径中的节点进行故障检测，确定待修复节点，以所述待修复节点进行修复。
根据权利要求9或10所述的装置，其中，所述确定模块设置为：

获取所述服务端的半连接队列的溢出信息；

若获取到所述溢出信息，则确定所述服务端的确定所述服务端的半连接队列溢出；

若未获取到所述溢出信息，则确定所述服务端的半连接队列未溢出。
根据权利要求11所述的装置，其中，所述溢出信息中包含有溢出数量；所述调整模块设置为：

每次增大所述半连接队列的队列长度后，获取该次增大队列长度后的半连接队列的溢出数量；

比对该次增大队列长度后的半连接队列的溢出数量和前一次获取的溢出数量，若两者相同，则确定所述服务端的半连接队列不再溢出。
根据权利要求11所述的装置，其中，所述确定模块设置为：

登录所述容器，在所述容器内输入网络信息查询指令，以获取所述容器的网络信息，在所述网络信息中查询与所述溢出信息对应的预定格式的字符信息，作为所述溢出信息。
根据权利要求9至13任一项所述的装置，其中，所述调整模块设置为：

将所述服务端的队列参数的数值增大N倍，其中，所述N为自然数，且N的取值大于1；或者，

将所述服务端的队列参数的数值增加预设值；

其中，所述队列参数用于定义所述服务端的半连接队列的队列长度。
根据权利要求9至14任一项所述的装置，其中，所述第一检测模块，设置为：

向所述客户端发送故障检测指令，以使所述客户端利用因特网包探索器，向所述服务端发送预设数量的检测报文；

获取所述网络连接路径中的每个节点接收到的检测报文的数量；

判断每个所述节点接收到的检测报文的数量是否与所述预设数量相同，若不相同，则将该节点确定为待修复节点。
根据权利要求15所述的装置，其中，所述检测报文中包括标识信息；所述第一检测模块设置为：

根据所述标识信息，获取所述网络连接路径中的每个节点接收到的检测报文的数量。
一种电子设备，其中，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，设置为存放计算机程序；

处理器，设置为执行存储器上所存放的程序时，实现权利要求1-8任一所述的方法步骤。
一种计算机可读存储介质，其中，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-8任一所述的方法步骤。
一种可执行程序代码，其中，所述可执行程序代码设置为被运行以执行权利要求1-8任一所述的方法步骤。