CN115701051A

CN115701051A - 分布式设备的检测方法、客户端、服务端、设备和介质

Info

Publication number: CN115701051A
Application number: CN202110831414.9A
Authority: CN
Inventors: 明义波; 欧阳卫明
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2021-07-22
Filing date: 2021-07-22
Publication date: 2023-02-07

Abstract

本申请涉及通信技术领域，公开了一种分布式设备的检测方法、客户端、服务端、设备和介质。分布式设备的检测方法，应用于客户端，所述客户端驻留在分布式设备中的一个子设备上，所述方法包括：接收服务端发送的拓扑信息，所述拓扑信息包含所述分布式设备中各个所述子设备的位置信息；根据所述拓扑信息向其他客户端所驻留的所述子设备发送检测报文，供所述子设备中驻留的所述其他客户端接收检测报文；接收所述其他客户端发送的所述检测报文；根据接收到的所述检测报文生成检测结果；向所述服务端上报所述检测结果，供所述服务端汇总所述检测结果。实现在分布式设备的检测过程中，降低部署难度，简化检测流程，从而能够快速简便地完成检测。

Description

分布式设备的检测方法、客户端、服务端、设备和介质

技术领域

本申请实施例涉及通信技术领域，特别涉及一种分布式设备的检测方法、客户端、服务端、设备和介质。

背景技术

随着云计算技术的发展，传统的电信设备商在进行信息与通信技术(Informationand Communications Technology，ICT)的融合时，会在云平台部署越来越多的虚拟化的设备，如虚拟机或容器，这些虚拟机或容器作为子设备整体组合成一个设备对外提供服务，即分布式设备。但是为了更好地为用户提供服务，各个子设备之间的网络质量需要实时监控检测，以满足当网络出现震荡或网络不通时，能够第一时间通知用服务运维人员，从而尽早进行干预，恢复分布式设备中各个子设备之间的正常通信。目前常用的一种分布式设备检测方法是：通过由辅助中央处理器(Central Processing Unit，CPU)通过主控板以太网交换机局域网交换机(LanSWitch，LSW)、接口板LSW将环回探测报文发送给每一个转发芯片，从而通过辅助CPU接收环回报文的情况得到检测结果。

然而，为了实现通过辅助CPU向主控板LSW、接口板LSW向每一个转发芯片发送环回探测报文，需要为环回报文传输路径中经过的各个接口进行相应的配置，部署复杂，实现起来也很复杂，亟需更加简便易于实现的分布式设备检测方法。

发明内容

本申请实施例的主要目的在于提出一种分布式设备的检测方法、客户端、服务端、设备和介质，旨在实现在分布式设备的检测过程中，降低部署难度，简化检测流程，从而能够快速简便地完成检测。

为实现上述目的，本申请实施例提供了一种分布式设备的检测方法，应用于客户端，所述客户端驻留在分布式设备中的一个子设备上，所述方法包括：接收服务端发送的拓扑信息，所述拓扑信息包含所述分布式设备中各个所述子设备的位置信息；根据所述拓扑信息向其他客户端所驻留的所述子设备发送检测报文，供所述子设备中驻留的所述其他客户端接收检测报文；接收所述其他客户端发送的所述检测报文；根据接收到的所述检测报文生成检测结果；向所述服务端上报所述检测结果，供所述服务端汇总所述检测结果。

为实现上述目的，本申请实施例还提出了一种分布式设备的检测方法，应用于服务端，所述服务端驻留在所述分布式设备中的一个子设备中，所述方法包括：向所述分布式设备中各个所述子设备中驻留的客户端发送拓扑信息；接收所述客户端发送的检测结果并汇总所述检测结果。

为实现上述目的，本申请实施例还提出了一种客户端，所述客户端驻留在分布式设备中的一个子设备，所述客户端包括：第一接收模块，用于接收服务端发送的拓扑信息，所述拓扑信息包含所述分布式设备中各个所述子设备的位置信息；第一发送模块，用于根据所述拓扑信息与其他客户端所驻留的所述子设备发送检测报文，供所述子设备中驻留的所述其他客户端接收检测报文；第二接收模块，用于接收所述其他客户端发送的所述检测报文；生成模块，用于根据接收到的所述检测报文生成检测结果；第二发送模块，用于向所述服务端上报所述检测结果，供所述服务端汇总所述检测结果。

为实现上述目的，本申请实施例还提出了一种服务端，所述服务端驻留在分布式设备的一个子设备中，包括：第三发送模块，用于向所述分布式设备中各个所述子设备中驻留的客户端发送拓扑信息；第三接收模块，用于接收所述客户端发送的检测结果并汇总所述检测结果。

为实现上述目的，本申请实施例还提出了一种电子设备，所述设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上所述的分布式设备的检测方法。

为实现上述目的，本申请实施例还提出了计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的分布式设备的检测方法。

本申请实施例提出的分布式设备的检测方法，为每个子设备部署客户端，通过客户端与其他子设备互发检测报文，然后通过子设备中部署的客户端进行报文接收，并根据接收到的检测报文生成检测结果，接着将检测结果上报给服务端进行汇总，只需要为客户端和服务端进行检测配置，需要进行检测配置的部分少，能够降低部署难度，并且检测主要是通过互发检测报文完成，检测流程简便，能够快速地完成检测，且更加容易实现，实用性更强。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定。

图1是本发明实施例中涉及的分布式设备的示意图；

图2是本发明另一实施例中的分布式设备的检测方法的流程图

图3是本发明另一实施例中的包括获取唯一标识和网卡地址步骤的分布式设备的检测方法的流程图；

图4是本发明另一实施例中的分布式设备的检测方法中检测报文格式的示意图；

图5是本发明另一实施例中的包括通过单向链路收发检测报文步骤的分布式设备的检测方法的流程图；

图6是本发明另一实施例中的包括生成告警判断结果和链路状态信息步骤的分布式设备的检测方法的流程图；

图7是本发明另一实施例中的包括周期性发送检测报文步骤的分布式设备的检测方法的流程图；

图8是本发明另一实施例中的包括接收配置更新信息步骤的分布式设备的检测方法的流程图；

图9是本发明另一实施例中子设备状态跃迁示意图；

图10是本发明另一实施例中的包括接向客户端发送拓扑信息步骤的分布式设备的检测方法的流程图；

图11是本发明另一实施例中的包括接收唯一标识和网卡地址步骤的分布式设备的检测方法的流程图；

图12是本发明另一实施例中的客户端的结构示意图；

图13是本发明另一实施例中的服务端的结构示意图；

图14是本发明另一实施例中的分布式设备的检测网络的结构示意图

图15是本发明另一实施例中的电子设备的结构示意图。

具体实施方式

由背景技术可知，通过辅助CPU向主控板LSW、接口板LSW向每一个转发芯片发送环回探测报文，需要为环回报文传输路径中经过的各个接口进行相应的配置，部署复杂，实现也复杂，亟需更加简便易于实现的分布式设备检测方法。

为解决上述问题，本申请实施例提供了一种分布式设备的检测方法，应用于客户端，客户端驻留在分布式设备中的一个子设备上，所述方法包括：接收服务端发送的拓扑信息，拓扑信息包含分布式设备中各个子设备的位置信息；根据拓扑信息向其他客户端所驻留的子设备发送检测报文，供子设备中驻留的其他客户端接收检测报文；接收其他客户端发送的检测报文；根据接收到的检测报文生成检测结果；向服务端上报检测结果，供服务端汇总检测结果。

本申请实施例提出的分布式设备的检测方法，为每个子设备部署客户端，通过客户端与其他子设备互发检测报文，然后通过子设备中部署的客户端进行报文接收，并根据接收到的检测报文生成检测结果，接着将检测结果上报给服务端进行汇总，需要进行检测配置的部分少，降低部署难度，检测主要是通过互发检测报文完成，检测流程简便，能够快速地完成检测，且更加容易实现，实用性更强。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请的各实施例进行详细的阐述。然而，本领域的普通技术人员可以理解，在本申请各实施例中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施例的种种变化和修改，也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便，不应对本申请的具体实现方式构成任何限定，各个实施例在不矛盾的前提下可以相互结合相互引用。

下面将对本实施例的分布式设备的检测方法的实现细节进行具体的说明，以下内容仅为方便理解提供的实现细节，并非实施本方案的必须。

在一些实施例中，分布式设备的检测方法应用于客户端，客户端驻留在分布式设备中的一个子设备中，分布式设备中的子设备可以是虚拟机和/或容器，多个虚拟机和/或容器可以部署在同一个宿主机，也可以部署在不同宿主机。为了帮助本领域技术人员更好地理解子设备及其通信状态，以下参考图1对分布式设备及其中的子设备进行说明：VM表示部署在服务器里边的虚拟机或容器，虚拟机或容器彼此之间通过交换机连接，这些虚拟机或容器可以共同构成设置的虚拟局域网(Virtual Local Area Network，VLAN)，从而与其他设备隔离，形成一个内部网络；同时，虚拟机或容器可以通过网卡或者网桥等与宿主机连接。其中，客户端和服务端是虚拟机或容器中的应用程序。参考图2，分布式设备的检测方法包括：

步骤101，接收服务端发送的拓扑信息，拓扑信息包含分布式设备中各个子设备的位置信息。

具体地说，当服务端确定当前分布式设备对应的拓扑信息时，服务端就会向客户端下发拓扑信息，以便客户端接收和使用拓扑信息进行检测。

更具体地说，在每个子设备中均驻留有一个客户端的情况下，步骤101实际是服务端将拓扑信息同步给所有的客户端。

需要说明的是，对分布式设备的检测主要是通过收发检测报文完成的，因此，在发送检测报文之前需要获取检测报文的接收方地址；并且由于需要彼此之间都互发报文，因此，需要检测报文所有的接收方位置信息。此外，若是服务端只向某个客户端发送该客户端需要的接收方位置信息，那么每个客户端需要接收的位置信息都不相同，这样服务端需要根据不同的客户端生成不同的位置信息，服务端处理压力较大，而向各个客户端发送各个子设备的位置信息即拓扑信息，所有客户端接收到的信息都相同，大大减轻了服务端的处理压力。

进一步地，在一些实施例中，子设备的位置信息包括子设备的唯一标识和网卡地址，且服务端的拓扑信息是通过客户端上报信息获取的，则参考图3，步骤101之前，分布式设备的检测方法还包括：

步骤106，获取自身所驻留的子设备的唯一标识和网卡地址。

具体地说，子设备的唯一标识为子设备在分布式设备中的设备编号，通常为子设备对应的单板编号，子设备的网卡地址是子设备所在的宿主机的网卡地址。

值得一提的是，分布式设备存在多个子设备被部署在同一个宿主机的情况，此时，部分子设备的网卡地址相同，因此，仅仅获取子设备的网卡地址并不能从分布式设备的若干子设备中唯一确定出一个子设备。而获取子设备的唯一标识和网卡地址则避免了上述情况，保证能够唯一确定出一个子设备，从而能够更加精准地确定出检测报文收发过程中发送方和接收方，得到更加精准的检测结果。

需要说明的是，由于客户端驻留在某个子设备中，因此，客户端和子设备共享唯一标识和网卡地址，进而可以认为步骤106实际是客户端获取自身的位置信息。

还需要说明的是，各个子设备的唯一标识和网卡地址通常被用户写在一个配置文件中，这样在子设备启动时，子设备中驻留的客户端能够从配置文件中读取自身的唯一标识和网卡地址。本实施例不对配置文件进行限定，配置文件可以是人工预先输入各个子设备的配置书数据得到的，还可以是每当有不同的子设备加入分布式设备时自动读取等，此处就不再一一赘述了。

步骤107，向服务端发送获取的唯一标识和网卡地址，供服务端汇总各个子设备的唯一标识和网卡地址并生成拓扑信息。

具体地说，子设备中驻留的客户端在加入分布式设备并启动后，会向服务端上报唯一标识和网卡地址，以便服务端将客户端的位置信息汇总到拓扑信息中，从而其他客户端能够根据拓扑信息与该客户端进行通信，如收发检测报文。

值得一提的是，相对于目前常用的各个子设备两两之间互发位置信息来完成位置信息的通知，本实施例引入客户端服务端模型，通过服务端来对客户端进行管理，实现所有客户端向服务端发送位置信息并接收服务器汇总的位置信息，信息发送次数大大减少，且容易部署、实现简单，便于扩容和缩容，能够有效降低成本，提高用户体验。

还值得一提的是，利用包括唯一标识和网卡地址的位置信息，也就是说基于网卡进行分布式设备进行检测，与当前常用的通过辅助CPU向主控板LSW、接口板LSW向每一个转发芯片发送环回探测报文，实际是基于各个LSW的接口进行检测并不相同。特别地，基于接口的检测需要未每个接口进行配置，配置次数远远大于子设备的数量，但是基于网卡的检测进行服务端和客户端进行配置，配置次数和子设备数量相当，不仅减少了配置的次数，降低了部署难度，并且实现相对简单，实用性更强。

步骤102，根据拓扑信息向其他客户端所驻留的子设备发送检测报文，供子设备中驻留的其他客户端接收检测报文。

具体地说，客户端通过拓扑信息确定分布式设备中除自身驻留的子设备的其他子设备的位置信息，然后根据这些位置信息向其他子设备发送检测报文。

更具体地说，客户端之间彼此互发检测报文，每个客户端在作为检测报文的发送方，向其他客户端发送检测报文的同时，还作为检测报文的接收方，接收其他客户端发送过来的检测报文。

需要说明的是，通常情况下，分布式设备中的各个子设备组成的网络实际是一个全连接网络，因此，每两个子设备之间均具有通信链路，进而需要每两个子设备之间报文互发实现对每一条链路进行检测。

进一步地，为了保证与现有协议的兼容性，在一些实施例中，检测报文可以是类型-长度-值(Tag-Length–Value，TLV)报文，参见图4，TLV报文包括类型字段、长度字段和数据字段。

在一些例子中，TLV报文的组成如下：类型字段长度为1字节，长度字段为1字节且数据字段为2字节，其中，类型字段中包括自定义协议类型、目的地址、源地址和源的唯一标识。

在另一些例子中，TLV报文的组成如下：类型字段长度为N(N为大于1的整数)字节，进而类型字段内部包括6字节长的目的物理(Media Access Control，MAC)地址和6字节长的源MAC地址；2字节长的长度字段；若干字节长的数据字段，其中，数据字段包含若干组TLV格式的数据、2字节长的数据起始标志位和4字节长的帧校验序列(Frame Check Sequence，FCS)。

值得一提的是，将检测报文确定为TLV报文，既能基于现有协议实现二层网络中的质量检测，不会与其他协议冲突，也不会出现网络无法识别传输的情况，并且协议定义简单，可拓展性很强，非常适合对分布式设备这种设备内部网络的检测场景。

进一步地，还对TLV报文进行扩展，即在TLV报文的基础上增加扩展字段，扩展字段内可以包括携带指示待检测的网络质量指标的信息，如丢包率、延时时间等。

在一个例子中，TLV报文的扩展字段指示网络质量指标，当子设备解析到的扩展字段类型为00时，按照默认状态进行测量；为01时需要对时延时间进行检测；为10时需要对丢包率进行检测；为11时，需要对丢包率和延时时间进行检测。

值得一提的是，通过对TLV报文进行扩展，能够实现复杂或者精细化的分布式设备检测，比如对时延，丢包率等网络质量指标进行检测。

步骤103，接收其他客户端发送的检测报文。

进一步地，在一些实施例中，需要对各个子设备之间的链路进行单向检测，具体参考图5，步骤102为：根据拓扑信息通过子设备间的单向链路向其他客户端所驻留的子设备发送检测报文，供子设备中驻留的其他客户端接收检测报文。

步骤103为：接收其他客户端通过子设备间的单向链路发送的检测报文。

具体地说，每两个子设备间具有两个单向链路，从而客户端A通过其中一条单向链路将检测报文发送至客户端B，客户端B通过另一条单向链路将检测报文发送至客户端A。

步骤104，根据接收到的检测报文生成检测结果。

具体地说，是否能够接收到检测报文反映了检测报文传输通道是否正常，因此，通过对接收到的检测报文进行统计和/或分析可以得到检测结果。

更具体地说，在一些实施例中，检测结果包括链路状态信息和告警判断结果，参考图6，步骤104包括：

步骤1041，根据接收到的检测报文的数量和预设的丢包阈值判断是否需要进行告警，得到告警判断结果。

具体地说，各个子设备中的客户端均配置有一个预设的丢包阈值，每个客户端各自对接收到的检测报文进行数量统计，然后根据接收到的检测报文数量和子设备的数量确定其他客户端发送但是本客户端未接收到的检测报文的数量，即丢包的检测报文数量，接着比较丢包的检测报文数量和丢包阈值的大小，若大于丢包阈值则认定丢包过多，需要提醒服务运维人员等相关人员，此时，告警判断结果为需要进行告警，若小于丢包阈值则认定丢包在可承受范围内，不需要提醒服务运维人员等相关人员，此时，告警判断结果为不需要进行告警。

在一些例子中，各个客户端配置同一丢包阈值，这样客户端进行检测并生成检测结果的标准相同。

步骤1042，根据接收到的检测报文和拓扑信息确定链路状态信息。

具体地说，检测报文中携带了发送方的信息，根据接收到的检测报文和拓扑信息进行结合，可以分析得到能够接收到检测报文的链路和不能接收到检测报文的链路，从而生成链路状态信息。

更具体地说，对接收到的检测报文进行解析，得到接收到的检测报文的源地址，再与拓扑信息中各个子设备的位置信息进行比较，从而得到本客户端与接收到的报文的源地址指示的客户端之间的链路标记为正常链路，本客户端与未接收到的报文的源地址指示的客户端之间的链路标记为异常链路，所有的标记构成当前检测得到的链路状态信息。

需要说明的是，当告警判断结果为需要进行告警，就需要服务运维人员等对设备进行修复等处理，若此时服务运维人员还能够得到链路状态信息时，则可以直接对异常链路进行处理，不需要人工确定异常链路，提升了异常处理效率，减少人工资源的浪费。

进一步地，在一些实施例中，可以周期性进行检测，参考图7，步骤102为：按照预设的检测周期，周期性根据拓扑信息向其他客户端所驻留的子设备发送检测报文，供子设备中驻留的其他客户端接收检测报文。

具体地说，根据预设的检测周期，周期性启动或触发报文发送流程。

更具体地说，设置一个定时器，定时向其他子设备发送检测报文。

步骤104为：根据在检测周期内接收到的检测报文生成检测结果。

具体地说，根据接收到的接收时间处于同一检测周期内的检测报文生成该检测周期内的检测结果或根据接收到的发送时间处于同一检测周期内的检测报文生成该检测周期内的检测结果。

值得一提的是，通过配置检测周期，实现周期性检测并生成检测结果，不需要人为触发，减少人力资源浪费，还能保持对分布式设备状态的灵敏感知。

在一个例子中，配置的检测周期为1秒，每隔1秒发送一次检测报文，并在发送检测报文同时等待1秒内准备接收检测报文，将这1秒内接收到的检测报文作为当前检测周期内接收到的检测报文。

步骤105，向服务端上报检测结果，供服务端汇总检测结果。

需要说明的是，一个客户端得到的检测结果实际是该客户端和其他客户端之间的链路的检测结果，而不是分布式设备的检测结果，因此，需要每个客户端都向服务端发送检测结果并汇总，才能得到实际的分布式设备的检测结果。

本实施例中并未对检测结果的用途进行限定，检测结果可以存储在服务端等处以供用户后续在服务端进行查询，还可以供用户对分布式设备的状态进行分析预测，此处就不再一一赘述了。

进一步地，为了能够根据当前的实际需求进行不同要求的检测，参考图8，在步骤102之后、步骤103之前，分布式设备的检测方法还包括：

步骤108，接收到服务端发送的配置更新信息。

具体地说，当用户希望对检测的策略进行调整时，会通过服务端下发配置更新信息，配置更新信息中携带了指示检测条件的信息，如丢包阈值、检测周期、增加时延检测等信息。

步骤109，根据配置更新信息重新发送检测报文。

具体地说，配置更新信息中携带了新的检测配置，根据新的检测配置重新发送报文，如按照新的检测周期进行检测、新增对检测报文的时延检测、按照新的丢包阈值判断是否进行告警等。

在一个例子中，某条携带配置更新信息的命令为“ZXR10(conf ig-ovf)#media-link tx-interval 1000rx-timeout 3”。

需要说明的是，本实施例以步骤108和步骤109在步骤102之后、步骤103之前执行为例进行说明，实际步骤108和步骤109可以在分布式设备的检测方法执行过程中的任何一个时刻进行，此时，步骤108和步骤109实际含义是：一旦接收到服务端发送的配置更新信息，就根据接收到的配置更新信息重新发送检测报文。此处不再一一赘述了。

为了更好地帮助本领域技术人员理解上述分布式设备的检测方法中执行不同步骤后客户端的状态，对执行过程中的分布式设备的状态变迁进行说明，参考图9，在未启动分布式设备时，分布式设备处于等待状态，启动后即处于就绪状态，启动检测流程即进入开始状态，检测流程中很可能存在一定数量的检测报文超期(未接收到或周期外接收到)，则可以重新启动检测流程，进入开始状态，也可以认为出现异常情况，出现异常情况时需要对异常情况进行处理，而在处理前还需要关闭检测流程，进入停止状态，从而在停止状态中对异常进行处理以恢复正常，恢复正常后就进入就绪状态，以继续进行检测。此外，当接收到服务端发送的配置更新信息时，进入更新状态，后续根据更新后的配置重新进行启动检测流程，在重新启动检测流程前还需要经历暂停当前的检测，即进入停止状态和准备启动检测流程，即进入就绪状态。

本发明实施例还提供了一种分布式设备的检测方法，应用于服务端，服务端驻留在分布式设备中的一个子设备中，参考图10，分布式设备的检测方法包括：

步骤1001，向分布式设备中各个子设备中驻留的客户端发送拓扑信息。

步骤1002，接收客户端发送的检测结果并汇总检测结果。

具体地说，每个客户端返回的是检测结果是分布式设备的检测结果的一部分，所有客户端都上报检测结果，就能够汇总成分布式设备整体的检测结果。

需要说明的是，当检测结果中包含需要进行告警的告警判断结果时，需要对服务运维等人员进行告警，从而进行修复等处理，以恢复分布式设备的正常工作。或者服务端将汇总后的检测结果上上报给显示终端。

在一个例子中，客户端上报的检测结果中包括需要进行告警的告警判断结果，接着服务端向用户进行告警提醒并展示在显示终端，如某次在显示终端上弹出的告警信息为“％OVF％Media interface status.The interface(slot＝6,mac＝80：2a：3d：03：01：31)turned into DOWN”。

在一个例子中，服务端对来自客户端的检测结果进行存储，用户在需要时会对检测结果的历史信息进行检索，如某次对具有3个单板的分布式设备的链路状态查询结果如下：

上述链路状态查询结果中第1、2列用于表示链路的始发地的唯一标识和网卡地址，第3、4列表示链路的目的地的唯一标识和网卡地址，最后一列表示链路状态，up表示链路正常。

进一步，在一些实施例中，拓扑信息包括各个子设备的唯一标识和网卡地址，是服务端根据客户端上报的位置信息生成的，参考图11，步骤1001之前还包括：

步骤1003，接收客户端发送的唯一标识和网卡地址。

具体地说，每当有新的子设备加入或退出时，或者刚启动分布式设备时，服务端就会接收到客户端上报的唯一标识和网卡地址。

步骤1004，根据唯一标识和网卡地址生成拓扑信息。

具体地说，服务端中存有分布式设备中各个子设备的位置信息，每当有新的子设备加入分布式设备或每当有子设备退出分布式设备时，服务端存储的拓扑信息都将发生变化，此时，服务端需要将最新的拓扑信息下发给所有的客户端，客户端就会根据最新的拓扑信息对分布式设备进行检测。

值得一提的是，通过步骤1003和步骤1004实现对客户端的增加或者退出的支持，进而实现扩容或缩容，灵活性更强。

此外，应当理解的是，上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包括相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。

本发明实施例还提供了一种客户端，客户端驻留在分布式设备中的一个子设备，参考图12，客户端包括：

第一接收模块1201，用于接收服务端发送的拓扑信息，拓扑信息包含分布式设备中各个子设备的位置信息。

第一发送模块1202，用于根据拓扑信息与其他客户端所驻留的子设备发送检测报文，供子设备中驻留的其他客户端接收检测报文。

第二接收模块1203，用于接收其他客户端发送的检测报文。

生成模块1204，用于根据接收到的检测报文生成检测结果。

第二发送模块1205，用于向服务端上报检测结果，供服务端汇总检测结果。

不难发现，本实施例为与应用于客户端的分布式设备检测方法实施例相对应的实施例，本实施例可与应用于客户端的分布式设备检测方法实施例互相配合实施。应用于客户端的分布式设备检测方法实施例中提到的相关技术细节在本实施例中依然有效，为了减少重复，这里不再赘述。相应地，本实施例中提到的相关技术细节也可应用在应用于客户端的分布式设备检测方法实施例中。

值得一提的是，本实施例中所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本发明的创新部分，本实施例中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入，但这并不表明本实施例中不存在其它的单元。

本发明实施例还提供了一种服务端，服务端驻留在分布式设备中的一个子设备，参考图13，服务端包括：

第三发送模块1301，用于向分布式设备中各个子设备中驻留的客户端发送拓扑信息。

第三接收模块1302，用于接收客户端发送的检测结果并汇总检测结果。

不难发现，本实施例为与应用于服务端的分布式设备检测方法实施例相对应的实施例，本实施例可与应用于服务端的分布式设备检测方法实施例互相配合实施。应用于服务端的分布式设备检测方法实施例中提到的相关技术细节在本实施例中依然有效，为了减少重复，这里不再赘述。相应地，本实施例中提到的相关技术细节也可应用在应用于服务端的分布式设备检测方法实施例中。

本发明实施例还提供了一种分布式设备的检测网络，包括以上所述的服务端以及若干以上所述的客户端，其中，检测网络的网络节点为分布式设备中的子设备，每个子设备上均驻留有客户端，至少一个子设备中驻留有服务端。

进一步地，每两个子设备之间具有两条单向链路，单向链路用于将检测报文从一个子设备传输至另一个子设备。

需要说明的是，由于每个子设备上均部署了客户端，因此，部署有服务端的子设备上实际同时部署了客户端和服务端，这样服务端能够得到每个子设备的唯一标识和网卡地址，而不会遗漏部署有服务端的子设备，得到的拓扑信息更加完整、全面。

为了方便本领域技术人员的理解，以下将以4个子设备组成的分布式设备为例对分布式设备的检测网络进行说明，参考图14，子设备1中驻留有客户端和1和服务端，子设备2、3、4中分别驻留有客户端2、3、4，各个子设备之间均通过两条单向链路进行通信，如传输检测报文。

还需要说明的是，在其他实施例中，客户端和服务端进行拓扑信息收发通过和上述检测网络不同的另一个独立的网络进行，即检测网络和实际收发拓扑信息的网络不是同一个网络。

本申请实施例还提供了一种电子设备，参考图15，包括：包括至少一个处理器1501；以及，与至少一个处理器1501通信连接的存储器1502；其中，存储器1502存储有可被至少一个处理器1501执行的指令，指令被至少一个处理器1501执行，以使至少一个处理器1501能够执行上述任一方法实施例所描述的分布式设备的检测方法。

其中，存储器1502和处理器1501采用总线方式连接，总线可以包括任意数量的互联的总线和桥，总线将一个或多个处理器1501和存储器1502的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件，也可以是多个元件，比如多个接收器和发送器，提供用于在传输介质上与各种其他装置通信的单元。经处理器1501处理的数据通过天线在无线介质上进行传输，进一步，天线还接收数据并将数据传输给处理器1501。

处理器1501负责管理总线和通常的处理，还可以提供各种功能，包括定时，外围接口，电压调节、电源管理以及其他控制功能。而存储器1502可以被用于存储处理器1501在执行操作时所使用的数据。

本发明实施例还提供了一种计算机可读存储介质，存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解，上述各实施例是实现本申请的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本申请的精神和范围。

Claims

1.一种分布式设备的检测方法，其特征在于，应用于客户端，所述客户端驻留在分布式设备中的一个子设备上，所述方法包括：

接收服务端发送的拓扑信息，所述拓扑信息包含所述分布式设备中各个所述子设备的位置信息；

根据所述拓扑信息向其他客户端所驻留的所述子设备发送检测报文，供所述子设备中驻留的所述其他客户端接收检测报文；

接收所述其他客户端发送的所述检测报文；

根据接收到的所述检测报文生成检测结果；

向所述服务端上报所述检测结果，供所述服务端汇总所述检测结果。

2.根据权利要求1所述的分布式设备的检测方法，其特征在于，所述位置信息包括所述子设备的唯一标识和网卡地址，

所述接收服务端发送的拓扑信息之前，所述方法还包括：

获取自身所驻留的所述子设备的所述唯一标识和所述网卡地址；

向所述服务端发送获取的所述唯一标识和所述网卡地址，供所述服务端汇总各个所述子设备的所述唯一标识和所述网卡地址并生成所述拓扑信息。

3.根据权利要求1所述的分布式设备的检测方法，其特征在于，所述检测报文为类型-长度-值TLV报文。

4.根据权利要求3所述的分布式设备的检测方法，其特征在于，所述TLV报文包括扩展字段，所述扩展字段内携带指示待检测的网络质量指标的信息。

5.根据权利要求1-4中任一项所述的分布式设备的检测方法，其特征在于，所述根据所述拓扑息向其他客户端所驻留的所述子设备发送检测报文，包括：

按照预设的检测周期，周期性根据所述拓扑信息向所述其他客户端所驻留的所述子设备发送检测报文；

所述根据接收到的所述检测报文生成检测结果，包括：

根据在所述检测周期内接收到的所述检测报文生成所述检测结果。

6.根据权利要求1-4中任一项所述的分布式设备的检测方法，其特征在于，所述方法还包括：

若接收到所述服务端发送的配置更新信息，根据所述配置更新信息重新发送所述检测报文。

7.根据权利要求1-4中任一项所述的分布式设备的检测方法，其特征在于，所述检测结果包括告警判断结果和链路状态信息，所述根据接收到的所述检测报文生成检测结果，包括：

根据接收到的所述检测报文的数量和预设的丢包阈值判断是否需要进行告警，得到告警判断结果；

根据接收到的所述检测报文和所述拓扑信息确定所述链路状态信息。

8.根据权利要求1-4中任一项所述的分布式设备的检测方法，其特征在于，所述根据所述拓扑信息向其他客户端所驻留的所述子设备发送检测报文，包括：

根据所述拓扑信息通过所述子设备间的单向链路向所述其他客户端所驻留的所述子设备发送所述检测报文；

所述接收所述其他客户端发送的所述检测报文，包括：

接收所述其他客户端通过所述子设备间的单向链路发送的所述检测报文。

9.一种分布式设备的检测方法，其特征在于，应用于服务端，所述服务端驻留在所述分布式设备中的一个子设备中，所述方法包括：

向所述分布式设备中各个所述子设备中驻留的客户端发送拓扑信息；

接收所述客户端发送的检测结果并汇总所述检测结果。

10.根据权利要求9所述的分布式设备的检测方法，其特征在于，所述向所述分布式设备中各个所述子设备中驻留的客户端发送拓扑信息之前，所述方法还包括：

接收所述客户端发送的所述唯一标识和所述网卡地址；

根据所述唯一标识和所述网卡地址生成所述拓扑信息。

11.一种客户端，其特征在于，所述客户端驻留在分布式设备中的一个子设备，所述客户端包括：

第一接收模块，用于接收服务端发送的拓扑信息，所述拓扑信息包含所述分布式设备中各个所述子设备的位置信息；

第一发送模块，用于根据所述拓扑信息与其他客户端所驻留的所述子设备发送检测报文，供所述子设备中驻留的所述其他客户端接收检测报文；

第二接收模块，用于接收所述其他客户端发送的所述检测报文；

生成模块，用于根据接收到的所述检测报文生成检测结果；

第二发送模块，用于向所述服务端上报所述检测结果，供所述服务端汇总所述检测结果。

12.一种服务端，其特征在于，所述服务端驻留在分布式设备的一个子设备中，包括：

第三发送模块，用于向所述分布式设备中各个所述子设备中驻留的客户端发送拓扑信息；

第三接收模块，用于接收所述客户端发送的检测结果并汇总所述检测结果。

13.一种分布式设备的检测网络，其特征在于，包括如权利要求12所述的服务端以及若干如权利要求11所述的客户端，其中，所述检测网络的网络节点为所述分布式设备中的子设备，每个所述子设备上均驻留有所述客户端，至少一个所述子设备中驻留有所述服务端。

14.根据权利要求13所述的分布式设备的检测网络，其特征在于，每两个所述子设备之间具有两条单向链路，所述单向链路用于将检测报文从一个所述子设备传输至另一个所述子设备。

15.一种电子设备，其特征在于，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至8中任意一项所述分布式设备的检测方法，或执行如权利要求9或10所述分布式设备的检测方法。

16.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的分布式设备的检测方法，或实现如权利要求9或10所述分布式设备的检测方法。