WO2020238719A1

WO2020238719A1 - 通信链路的建立方法及装置，节点标识确定方法及装置

Info

Publication number: WO2020238719A1
Application number: PCT/CN2020/091221
Authority: WO
Inventors: 董建波; 曹政
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2019-05-29
Filing date: 2020-05-20
Publication date: 2020-12-03
Also published as: CN110581880A; CN110581880B

Abstract

本申请公开一种数据通信链路的建立方法及装置，集群机构中节点标识的确定方法及装置，以及基于人工智能集群架构中数据通信链路的建立方法及装置，计算机存储介质和电子设备，其中数据通信链路的建立方法包括：将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组；根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路；从而使得集群架构中的节点之间没有重复的数据通信路径，避免在大规模数据处理状态下出现的性能下降和网络拥塞等情况。

Description

通信链路的建立方法及装置，节点标识确定方法及装置

本申请要求2019年05月29日递交的申请号为201910457828.2、发明名称为“通信链路的建立方法及装置，节点标识确定方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，具体涉及一种数据通信链路的建立方法和装置，以及集群架构中节点标识的确定方法和装置，以及人工智能集群架构中数据通信链路的建立方法和装置，以及计算机存储设备和电子设备。

背景技术

随着互联技术的广泛应用，对大数据的处理以及机器学习等方面的应用需求越来越多。为提高数据处理的速度，现有集群架构中通过加入大量的计算设备，提升数据处理能力，而对集群架构需要考虑交换设备之间的网络互连结构以提高节点之间的数据通信能力。

目前集群架构常用的是Fat-tree拓扑结构，Fat-tree是一种应用于高性能计算机集群的最常用的拓扑之一。Fat-tree拓扑结构分为三个层次：自上而下分别为边缘层(edge)、汇聚层(aggregate)和核心层(core)，其可以通过类似reduce算法实现源节点和目标节点之间的数据通信。由于源节点和目标节点之间具有多条并行路径，因此网络通用性和扩展性良好。但是，在大规模数据处理的需求下，会带来较大的性能损失。

为此，现有技术提供一种基于二部图的集群架构网络拓扑图，如图1所示，图1是集群架构的网络拓扑图，其中，大量的计算设备通过与其连接交换设备，与对面交换设备上的大量计算设备进行数据通信，如图1中所示，拓扑结构上侧的每个计算设备之间进行通信时，可以通过二部图下侧的任何一个交换设备抵达上侧的与计算设备连接的交换设备，实现上侧计算设备之间的数据通信，同样的，二部图下侧的每个计算设备之间进行通信时，可以使得二部图上侧的任何一个交换设备抵达下侧的交换设备，实现下侧计算设备之间的数据通信。可见，不论上侧计算节点之间的数据通信还是下侧计算节点之间的数据通信，均存在大量的可达路径。

如果计算设备之间在进行数据通信时存在大量的可达路径，则会造成网络通信数据拥塞，导致数据通信延迟。

发明内容

本申请提供一种数据通信链路的建立方法，以解决现有技术中节点设备之间通信路径不唯一导致的数据拥塞的问题。

本申请提供一种数据通信链路的建立方法，包括：

将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组；

根据所述逻辑组中设定的指定节点的标识，确定所述逻辑组中节点的节点标识；

根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。

在一些实施例中，所述将集群架构中用于进行数据通信的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组，包括：

将所述集群架构中分布在二部图两侧的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。

在一些实施例中，所述将所述集群架构中分布在二部图两边的所述节点进行分组，获得在所述集群机构中描述节点连接关系的逻辑组和描述节点物理位置的物理组，包括：

将所述二部图中分别连接不同交换设备的节点的集合，确定为所述逻辑组；

将所述二部图中连接同一交换设备的节点的集合，确定为所述物理组，其中，所述物理组中包括来自不同逻辑组的节点。

在一些实施例中，还包括：

选取第一逻辑组中的节点信息；

将所述第一逻辑组中的节点按照所述二部图划分为至少包括两个节点的节点组；

赋予所述第一逻辑组中第一节点组的两个节点的节点标识；

将所述两个节点的节点标识确定为所述设定的指定节点的节点标识。

在一些实施例中，所述根据所述逻辑组中设定的指定节点的标识，确定所述逻辑组中节点的节点标识，包括：

根据所述第一逻辑组中第一节点组中节点的节点标识，生成所述第一逻辑组中与所述第一节点组相邻的第二节点组中节点的节点标识；

根据所述第二节点组中节点的节点标识生成所述第一逻辑组中与所述第二节点组相邻的下一节点组中节点的节点标识；

当第一逻辑组中节点标识生成完毕，则根据所述第一逻辑组中第一节点组中节点的节点标识，生成第二逻辑组中第一节点组中节点的节点标识；

根据所述第一逻辑组中第二节点组中节点的节点标识，生成所述第二逻辑组中第二节点组中节点的节点标识，依次类推直到生成所有逻辑组中节点的节点标识。

将逻辑组中的节点组按照顺序进行排序，获得排序后的节点组集合；

根据所述节点组集合中第一节点组中节点的节点标识，确定第一节点标识基准；

根据第一节点标识基准生成所述节点组集合中第二节点组中节点的节点标识；

根据所述第二节点组中节点的节点标识，确定第二节点标识基准；

根据所述第二节点标识基准生成所述节点组集合中第三节点组中节点的节点标识；依次类推直到生成节点组集合中所有节点组中节点的节点标识。

在一些实施例中，所述根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路，包括：

根据所述节点标识，对所述逻辑组中的节点进行规约操作，获得节点的规约信息；

根据节点的规约信息，建立所述逻辑组中节点之间的唯一数据通信链路。

在一些实施例中，所述根据所述节点标识，对所述逻辑组中的节点进行规约操作，获得节点的规约信息，包括：

根据设定的第一配对距离，对所述逻辑组中的节点进行两两配对；

根据配对的节点之间传输的数据，获得以所述第一配对距离进行配对的节点的规约信息。

在一些实施例中，还包括：

根据设定的第二配对距离，对所述逻辑组中的节点重新两两配对；

根据配对的两个节点之间传输的数据，并基于已经获得的以所述第一配对距离进行配对的节点的规约信息，获得以所述第二配对距离进行配对的节点的规约信息。

在一些实施例中，还包括：

根据设定的第三配对距离，对所述逻辑组中的节点重新两两配对；

根据配对的两个节点之间传输的数据，并基于已经获得的以所述第二配对距离进行配对的节点的规约信息，获得以所述第三配对距离进行配对的节点的规约信息；

将以所述第三配对距离进行配对的节点的规约信息发送至以所述第二配对距离进行配对的节点；

将获得以所述第二配对距离进行配对的节点的规约信息和接收的以所述第三配对距离进行配对的节点的规约信息，发送至以所述第一配对距离进行配对的节点。

在一些实施例中，还包括：

对所述确定的所述逻辑组中节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识。

在一些实施例中，所述对所述确定的所述逻辑组中节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识，包括：

对所述逻辑组中位于所述集群架构的二部图上侧的节点或下侧的节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识。

在一些实施例中，还包括：

将所述逻辑组中节点的节点标识信息记录至与所述交换设备连接的物理组内的节点上。

在一些实施例中，还包括：

根据所述节点标识，建立节点查询表；

将所述节点标识的信息记录在所述节点查询表中。

在一些实施例中，所述根据所述逻辑组中节点的节点标识，建立节点查询表，包括：

按照所述逻辑组中节点之间的距离建立索引；

将索引值相同的节点标识信息记录到同一节点查询列表中。

本申请还提供一种数据通信链路的建立装置，包括：

分组单元，用于将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组；

确定单元，用于根据所述逻辑组中设定的指定节点的标识，确定所述逻辑组中节点的节点标识；

建立单元，用于根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。

本申请还提供一种集群架构中节点标识的确定方法，包括：

根据所述逻辑组中设定的指定节点的标识，确定所述逻辑组中节点的节点标识。

在一些实施例中，所述将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组，包括：

在一些实施例中，所述将所述集群架构中分布在二部图两边的所述节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组，包括：

在一些实施例中，还包括：

选取第一逻辑组中的节点信息；

将所述第一逻辑组中节点按照所述二部图划分为至少包括两个节点的节点组；

赋予所述第一逻辑组中第一节点组的两个节点的标识；

将所述两个节点的标识确定为所述设定的指定节点标识。

本申请还提供一种集群架构中节点标识的确定装置，包括：

确定单元，用于根据所述逻辑组中设定的指定节点的标识，确定所述逻辑组中节点的节点标识。

本申请还提供一种基于人工智能集群架构中数据通信链路的建立方法，包括：

将人工智能集群架构中用于数据通信的节点进行分组，获得在所述人工智能集群架构中描述节点连接关系的逻辑组和描述节点物理位置的物理组；

根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；

本申请还提供一种基于人工智能集群架构中数据通信链路的建立装置，包括：

分组单元，用于将人工智能集群架构中用于数据通信的节点分组，获得在所述人工智能集群架构中描述节点连接关系的逻辑组和描述节点物理位置的物理组；

确定单元，用于根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；

本申请还提供一种计算机存储介质，用于存储网络平台产生数据，以及对应所述网络平台产生数据进行处理的程序；

所述程序在被所述处理器读取执行时，执行如上所述的数据通信链路的建立方法的步骤，或者执行如上所述的集群架构中节点标识的确定方法的步骤，或者执行如上所述的人工智能集群架构中数据通信链路的建立方法的步骤。

本申请还提供一种电子设备，包括：

处理器；

存储器，用于存储对网络平台产生数据进行处理的程序，所述程序在被所述处理器读取执行时，执行如上所述的数据通信链路的建立方法的步骤，或者执行如上所述的集群架构中节点标识的确定方法的步骤，或者执行如上所述的人工智能集群架构中数据通信链路的建立方法的步骤。

与现有技术相比，本申请具有以下优点：

本申请提供一种数据通信链路的建立方法，包括：将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组；根据所述逻辑组中设定的指定节点的标识，确定所述逻辑组中节点的节点标识；根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路；从而能够使得集群架构中的节点之间没有重复的数据通信路径，并且避免在大规模数据处理状态下出现的性能下降和网络拥塞等情况。

另外，本申请提供的数据通信链路的建立方法中，所述节点标识可以通过将节点标识信息记录到集群架构中的物理组中，以获知节点之间的连接关系；也可以通过建立节点查询表，将节点标识信息记录在节点查询表中，从而能够根据节点查询表获知节点之间的连接关系。

本申请还提供一种集群架构中节点标识的确定方法，包括：将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组；根据所述逻辑组中设定的指定节点的标识，确定所述逻辑组中节点的节点标识；从而使得在集群架构中每个节点均拥有自己的识别信息，以便确定集群架构中节点之间的数据通信链路，避免重复数据通信链路的出现。

本申请该提供一种基于人工智能集群架构中数据通信链路的建立方法，包括：将人工智能集群架构中用于数据通信的节点进行分组，获得在所述人工智能集群架构中描述节点连接关系的逻辑组和描述节点物理位置的物理组；根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路；从而保证人工智能集群架构中，节点之间能够通过唯一数据通信链路进行通信，避免由于节点之间存在重复的数据通信链路而导致的网络拥塞，使得人工智能集群架构性能下降的问题。

附图说明

图1是集群架构的网络拓扑图；

图2是本申请提供的一种数据通信链路的建立方法实施例的流程图；

图3是本申请提供的一种数据通信链路的建立方法实施例中的节点分组的结构示意图；

图4是本申请提供的一种数据通信链路的建立方法实施例中确定节点标识方式一的示意图；

图5是本申请提供的一种数据通信链路的建立方法实施例中确定节点标识方式二的示意图；

图6是本申请提供的一种数据通信链路的建立方法实施例中规约操作的示意图；

图7是本申请提供的一种数据通信链路的建立方法实施例中对应第一匹配距离的配对节点之间数据通信链路的示意图；

图8是本申请提供的一种数据通信链路的建立方法实施例中对应第二匹配距离的配对节点之间数据通信链路的示意图；

图9是本申请提供的一种数据通信链路的建立方法实施例中对应第三匹配距离的配对节点之间数据通信链路的示意图；

图10是本申请提供的一种数据通信链路的建立方法实施例中以颜色区别不同逻辑组或相同逻辑组中节点之间的第一种连接关系示意图；

图11是本申请提供的一种数据通信链路的建立方法实施例中以颜色区别不同逻辑组或相同逻辑组节点之间的第二种连接关系示意图；

图12是本申请提供的一种数据通信链路的建立装置实施例的结构示意图；

图13是本申请提供的一种集群架构中节点标识的确定方法实施例的流程图；

图14是本申请提供的一种集群架构中节点标识的确定装置实施例的结构示意图；

图15是本申请提供的一种基于人工智能集群架构中数据通信链路的建立方法实施例的流程图；

图16是本申请提供的一种基于人工智能集群架构中数据通信链路的建立装置实施例的流程图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

本申请中使用的术语是仅仅出于对特定实施例描述的目的，而非旨在限制本申请。在本申请中和所附权利要求书中所使用的描述方式例如：“一种”、“第一”、和“第二”等，并非对数量上的限定或先后顺序上的限定，而是用来将同一类型的信息彼此区分。

本申请提供的一种数据通信链路的建立方法可以是基于集群架构中的不同节点设备之间进行数据通信而建立的数据通信链路，避免节点设备之间由于存在多条可达路径而导致网络拥塞的问题。

请参考图2所示，图2是本申请提供的一种数据通信链路的建立方法实施例的流程图。该建立方法包括：

步骤S201：将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。

在描述所述步骤S201的具体实现过程前，先将该步骤中涉及的一些技术名词进行解释，具体如下：

本实施例中的集群架构结构是采用二部图的拓扑结构形式，如图1所示，集群架构中的交换设备分布于二部图的两侧，包括：上侧与交换设备连接的节点以及相对的下侧与交换设备连接的节点，上侧节点和下侧节点之间，上侧节点之间以及下侧节点之间能够通过交换设备进行数据通信的网络集群架构。

二部图上侧和下侧的交换设备上分别连接的节点可以包括：计算节点设备、存储节点设备、网络节点设备(网卡)、协处理节点设备以及系统节点设备等。所述协处理节点设备可以包括：如GPU、ASIC、FPGA、DSP等。

所述步骤S201的具体实现过程是：

步骤S201-1：将所述集群架构中分布在二部图两侧的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。其中，所述逻辑组可以表示节点之间的逻辑连接关系，所述物理组可以表示节点物理位置关系。

在本实施例中，所述步骤S201-1的具体实现过程可以包括：

步骤S201-1a：将所述二部图中分别连接不同交换设备的节点的集合确定为逻辑组；

步骤S201-1b：将所述二部图中连接同一交换设备的节点的集合，确定为所述物理组，其中，所述物理组中包括来自不同逻辑组的节点。

为便于理解，下面将以4×8网络集群架构为例进行说明，请参考图3所示。

图3是本申请提供的一种数据通信链路的建立方法实施例中的节点分组的结构示意图。在本实施例中，所谓4×8可以是指包括8个物理组和4个逻辑组，节点共有32个。每个交换设备上分别连接不同逻辑组成员构成物理组，即每个交换机上分别连接4个节点，该4个节点为一个物理组，共有8个物理组；4个节点分别来自不同的逻辑组，选取不同交换设备上的节点，组成一个逻辑组，一个逻辑组共8个节点，共有4个逻辑组。

在本实施例中，可以按照物理组上连接节点的顺序进行逻辑组的划分，例如：如图3所示，上侧中每个物理组中的第一个节点和下侧中每个物理组中的第一节点被划分在第一逻辑组中；上侧中每个物理组中的第二个节点和下侧中每个物理组中的第二节点被划分在第二逻辑组中；上侧中每个物理组中的第三个节点和下侧中每个物理组中的第三节点被划分在第三逻辑组中；上侧中每个物理组中的第四个节点和下侧中每个物理组中的第四节点被划分在第四逻辑组中。物理组的组成可以任意划分，当然，逻辑组的划分方式也可以根据实际需要进行，保证每个物理组有4个节点，每个逻辑组有8个节点即可。通常情况下，节点不重复。上述仅是以4×8的网络集群架构形式对逻辑组和物理组进行说明，并非用于限制。

在基于集群架构完成物理组和逻辑组的分组后，需要对逻辑组中的每个节点进行标识，从而便于确定不同物理组之间各个节点之间通信连接关系。下面将对本申请节点标识的确定进行说明。

步骤S202：根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识。

所述其他节点可以是刨除指定节点之外的节点。

所述步骤S202的目的在于需要预先确定一个标识基准，进而便于根据该标识基准获得其他节点的标识。通过对逻辑组中设置指定节点的标识，从而获得逻辑组中指定节点以外的其他节点的节点标识。因此，需要设置一个节点标识基准，即还可以包括：

步骤S20a：选取第一逻辑组中的节点信息。

所述第一逻辑组可以是上述4×8集群架构中的任何一个逻辑组，沿用上例，请参考图3所示，每个物理组中按照节点从左到右的排列方式，所述第一逻辑组可以包括：上侧每个物理组中第一节点和下侧每个物理组中的第一节点。

步骤S20b：将所述第一逻辑组中的节点按照所述二部图划分为至少包括两个节点的节点组。

沿用上例，将所述第一逻辑组中位于所述上侧物理组中的节点和下侧物理组中的节点为一个节点组，对于4×8的集群架构，一个逻辑组中可以包括4个节点组，也就是说，按照二部图划分为两个向量，即：x，y，x表示二部图上侧的节点，y表示二部图下侧的节点。将位于上侧物理组中的节点与位于下侧物理组中的节点取出作为一个节点组。

步骤S20c：赋予所述第一逻辑组中第一节点组的两个节点的标识。

所述步骤S20c可以将所述第一节点组中的两个节点的向量值赋值为[1，2]，即x＝1，y＝2；1和2为第一节点组中节点的标识，1为二部图上侧物理组中的节点标识，2为二部图下侧物理组中的节点标识。

步骤S20d：将所述两个节点的节点标识确定为所述设定的指定节点的节点标识。

所述步骤S20d的目的在于，将所述步骤S20c中赋值的两个节点的节点标识确定为指定节点的节点标识。

在确定指定节点的节点标识之后，需要根据指定节点的节点标识获得其他节点的节点标识，从而为建立节点之间的连接关系做基础。

在本实施例中，所述节点标识可以采用编码的方式，当然，也可以采用其他能够将节点进行区别的标识方式，例如：形状标识、颜色标识等。

以上为对如何设置指定节点的节点标识进行说明，在获得指定节点的节点标识后，需要根据指定节点的节点标识，确定其他逻辑组中节点成员的节点标识，从而也能够获知每个物理组中节点成员的节点标识。

所述步骤S202如何根据指定节点的节点标识，确定其他节点的节点标识可以包括两种方式，但并与限于这两种方式，首先，将两种方式做一个概括性的说明，后续将会详细阐述。

方式一包括：

步骤S202-1a：根据所述第一逻辑组中第一节点组中节点的节点标识，生成所述第一逻辑组中与所述第一节点组相邻的第二节点组中节点的节点标识；

步骤S202-1b：根据所述第一逻辑组中第一节点组中节点的节点标识生成与所述第二节点组相邻的下一节点组中节点的节点标识；

步骤S202-1c：当第一逻辑组中节点标识生成完毕，则根据所述第一逻辑组中第一节点组中节点的节点标识，生成第二逻辑组中第一节点组中节点的节点标识；

步骤S202-1d：根据所述第一逻辑组中第二节点组中节点的节点标识，生成所述第二逻辑组中第二节点组中节点的节点标识，依次类推直到生成所有逻辑组中节点的节点标识。

方式二包括：

步骤S202-2a：将逻辑组中的节点组按照顺序进行排序，获得排序后的节点组集合；

步骤S202-2b：根据所述节点组集合中预设的第一节点组中节点的节点标识，确定所述第一节点组中节点的节点标识；

步骤S202-2c：根据所述第一节点组中节点的节点标识生成所述节点组集合中第二节点组中节点的节点标识，获得所述第二节点组中节点的节点标识；

步骤S202-2d：根据所述第二节点组中节点的节点标识生成所述节点组集合中第三节点组中节点的节点标识，获得所述第三节点组中节点的节点标识；依次类推直到生成节点组集合中所有节点组中节点的节点标识。

方式一和方式二相同之处在于，二者均需要根据指定节点的节点标识，分别确定第一逻辑组中所有节点成员的节点标识，在本实施例中所述指定节点可以为第一逻辑组中的第一节点组的节点成员。

方式一和方式二不同之处在于，当确定第一逻辑组中第一节点组中节点的节点标识后，方式一，可以根据第一逻辑组中节点组的节点的节点标识，确定第二逻辑组与第一逻辑组相对节点组的节点的节点标识；根据第一逻辑组中节点组的节点的节点标识，确定第三逻辑组与第一逻辑组相对节点组的节点的节点标识；根据根据第一逻辑组中节点组的节点的节点标识，确定第四逻辑组与第一逻辑组相对节点组的节点的节点标识，从而获得所有逻辑组中所有节点的节点标识，需要说明的是，上述是以4×8的集群架构为基础确定逻辑组中节点的节点标识，如果是4×16，则到第四逻辑组后继续进一步确定下一个逻辑组中节点的节点标识，依次类推，直至所有逻辑组中执行完毕。在本实施例中是以4×8的集群架构为基础进行的说明，所以后续均以该集群架构进行说明。方式二，第一逻辑组中的第二节点组的节点标识根据指定节点(第一节点组)确定，第三节点组的节点标识根据第二节点组的节点标识确定，第四节点组的节点标识根据第三节点组的节点标识确定；第二逻辑组中的第一节点组的节点标识根据所述第一逻辑组中第四节点组的节点标识确定，第二逻辑组中的第二节点组的节点标识根据第二逻辑组中的第一节点组的节点标识确定，依次类推。具体如何确定，下面详细说明。

方式一：

请参考图4所示，图4是本申请提供的一种数据通信链路的建立方法实施例中确定节点标识的方式一的示意图。

首先，将逻辑组用0-N进行编号，在本实施例中逻辑组的编号可以包括：第一逻辑组，即0，二进制表示为0000；第二逻辑组，即1，二进制表示为0001；第三逻辑组，即2，二进制表示为0010；第四逻辑组，即3，二进制表示为0011。以第一逻辑组为举例，对逻辑组的结构进行说明。第一逻辑组包括8个节点，上下相对的两个节点被划分为一个节点组，根据图4所示，第一逻辑组中从左至右包括：第一节点组0，二进制表示为0000；第二节点组1，二进制表示为0001；第三节点组2，二进制表示为0010；第四节点组3，二进制表示为0011。第一逻辑组中的结合同样适用于其他逻辑组的结构。

结合上述第一逻辑组的结构，描述第一逻辑组中节点的节点编号的确定，所述第一逻辑组中第一节点组的节点为指定节点，第二节点组根据第一节点组生成节点编号，第三节点组根据第一节点组生成节点编号，第四节点组根据第一节点组成节点编号，具体如下：

基于上述所述步骤S20a至所述步骤S20d可以获得第一逻辑组中第一节点组中的两个节点为指定节点(x，y)，指定节点的节点编号分别是x＝1，y＝2。根据第一逻辑组中的第一节点组的节点编号，通过公式[x+i×B，y+i×B]计算第一逻辑组中其他节点组的节点编号，其中i是当前节点组的编号值或者是当前逻辑组的编号值，计算第一逻辑组中节点编号值时，i为当前节点组的编号值。

关于第一逻辑组：

当第一逻辑组中节点组的二进制表示中数字1为奇数时，节点编号的计算公式为：[y+i×B，x+i×B]，当二进制表示中数字1为偶数时，节点编号的计算公式为：[x+i×B，y+i×B]。其中，i是当前节点组的编号，B是指定节点的个数2。

第一节点组(二进制表示为0000，即节点组编号为0)中节点的节点编号指定为x＝1，y＝2，因此采用[1+0×2，2+0×2]公式也可以获得，该第一节点组的节点编号是x＝1，y＝2。

第二节点组(二进制表示为0001，即节点组编号为1)中节点的节点编号根据第一节点组中节点的节点编号[1，2]，采用[y+i×B，x+i×B]公式生成，即[2+1×2，1+1×2]，生成的第二节点组中节点的节点编号为[4，3]；

第三节点组(二进制表示为0010，即节点组编号为2)中节点的节点编号根据所述第二节点组中节点的节点编号[4，3]，采用[y+i×B，x+i×B]公式生成，即[2+2×2，1+2×2]，生成的第三节点组中节点的节点编号为[6，5]；

第四节点组(二进制表示为0011，即节点组编号为3)中节点的节点编号根据所述第三节点组中节点的节点编号[6，5]，采用[x+i×B，y+i×B]公式生成，即[1+3×2，2+3×2]，生成的第二节点组中节点的节点编号为[7，8]。

至此，获得第一逻辑组中所有节点组中的节点编号，即：

需要说明的是，上述公式中B表示计算基准值，该值根据不同逻辑组进行设定，在第一逻辑组中是根据两个指定节点生成后续节点编号，因为计算基准为2，在第一逻辑组中节点编号确定之后，计算基准被设定为8。

关于第二逻辑组：

依据所述第一逻辑组中节点的节点编号，可以确定第二逻辑组中的节点编号，具体过程可以是：

第二逻辑组(二进制表示为0001)，因此，对于第二逻辑组中节点的节点编号的生成采用[y+i×B，x+i×B]，其中，i表示当前逻辑组的编号值，即为1；B为8。由于已经获知第一逻辑组中的节点编号，因此，在确定第二逻辑组中节点编号时无需在对第二逻辑组中的节点组进行二进制判断，仅需根据第一逻辑组中对应的节点编号生成即可。例如：

第一节点组中节点的节点编号，根据第一逻辑组的第一节点组节点编号[1，2]生成，即为[2+1×8，1+1×8]，生成的第一节点组中节点的节点编号为[10，9]；

第二节点组中节点的节点编号根据第一逻辑组中第二节点组节点编号[4，3]生成，即为[3+1×8，4+1×8]，生成的第二节点组中节点的节点编号为[11，12]；

第三节点组中节点的节点编号根据第一逻辑组中第三节点组节点编号[6，5]生成，即为[5+1×8，6+1×8]，生成的第二节点组中节点的节点编号为[13，14]；

第四节点组中节点的节点编号根据第一逻辑组中第三节点组节点编号[7，8]生成，即为[8+1×8，7+1×8]，生成的第二节点组中节点的节点编号为[16，15]。

至此，获得第二逻辑组中所有节点组中的节点编号，即：

关于第三逻辑组：

依据所述第一逻辑组中节点的节点编号，可以确定第三逻辑组中的节点编号，具体过程可以是：

第三逻辑组(二进制表示为0010)，因此，对于第三逻辑组中节点的节点编号的生成采用[y+i×B，x+i×B]，其中，i表示当前逻辑组编号值，即为2；B为8。由于已经获知第一逻辑组中的节点编号，因此，在确定第三逻辑组中节点编号时无需在对第三逻辑组中的节点组进行二进制判断，仅需根据第一逻辑组中对应的节点编号生成即可。例如：

第一节点组中节点的节点编号，根据第一逻辑组的第一节点组节点编号[1，2]生成，即为[2+2×8，1+2×8]，生成的第一节点组中节点的节点编号为[18，17]；

第二节点组中节点的节点编号根据第一逻辑组中第二节点组节点编号[4，3]生成，即为[3+2×8，4+2×8]，生成的第二节点组中节点的节点编号为[19，20]；

第三节点组中节点的节点编号根据第一逻辑组中第三节点组节点编号[6，5]生成，即为[5+2×8，6+2×8]，生成的第二节点组中节点的节点编号为[21，22]；

第四节点组中节点的节点编号根据第一逻辑组中第三节点组节点编号[7，8]生成，即为[8+2×8，7+2×8]，生成的第二节点组中节点的节点编号为[24，23]。

至此，获得第三逻辑组中所有节点组中的节点编号，即：

关于第四逻辑组：

依据所述第一逻辑组中节点的节点编号，可以确定第四逻辑组中的节点编号，具体过程可以是：

第四逻辑组(二进制表示为0011)，因此，对于第四逻辑组中节点的节点编号的生成采用[x+i×B，y+i×B]，其中，i表示当前逻辑组编号值，即为3；B为8。由于已经获知第一逻辑组中的节点编号，因此，在确定第四逻辑组中节点编号时无需在对第四逻辑组中的节点组进行二进制判断，仅需根据第一逻辑组中对应的节点编号生成即可。例如：

第一节点组中节点的节点编号，根据第一逻辑组的第一节点组节点编号[1，2]生成，即为[1+3×8，2+3×8]，生成的第一节点组中节点的节点编号为[25，26]；

第二节点组中节点的节点编号根据第一逻辑组中第二节点组节点编号[4，3]生成，即为[4+3×8，3+3×8]，生成的第二节点组中节点的节点编号为[28，27]；

第三节点组中节点的节点编号根据第一逻辑组中第三节点组节点编号[6，5]生成，即为[6+3×8，5+3×8]，生成的第二节点组中节点的节点编号为[30，29]；

第四节点组中节点的节点编号根据第一逻辑组中第三节点组节点编号[7，8]生成，即为[7+3×8，8+3×8]，生成的第二节点组中节点的节点编号为[31，32]。

至此，获得第三逻辑组中所有节点组中的节点编号，即：

上述为节点编号确定方式的第一种介绍，下面对第二种方式进行说明。

方式二：

请参考图5所示，图5是本申请提供的一种数据通信链路的建立方法实施例中确定节点标识的方式二的示意图。

首先，根据逻辑组的排列顺序对每个节点组采用0-N进行编号，在本实施例中，逻辑组包括4组，每组有4个节点组，一共16个节点组，那么根据逻辑组的排列顺序则可以获得每个节点组的二进制表示，第一节点组0000；第二节点组0001；第三节点组0010；第四节点组0011；第五节点组0100；第六节点组0101；第七节点组0110；第八节点组0111；第九节点组1000；第十节点组1001；第十一节点组1010；第十二节点组1011；第十三节点组1100；第十四节点组1101；第十五节点组1110；第十六节点组1111。

其中，第一节点组中的节点为指定节点，节点编号为[1，2]。将所述指定节点的节点编号作为基准生成其他节点的节点编号，根据第一节点组的节点编号生成第二节点组的节点编号；根据第一节点组的节点编号生成第三节点组的节点编号，根据第一节点组的节点编号生成第四节点组的节点编号，以此类推。当节点组中二进制表示的数字1为奇数时，节点编号的计算公式为：[y+B，x+B]，当二进制表示中数字1为偶数时，节点编号的计算公式为：[x+B，y+B]。B为以完成节点编号中最大的节点编号。

第一节点组0000，节点编号为预先设定为[1，2]；

第二节点组0001，节点编号根据[y+B，x+B]生成，即为[4，3]；

第三节点组0010，节点编号根据[y+B，x+B]生成，即为[6，5]；

第四节点组0011，节点编号根据[x+B，y+B]生成，即为[7，8]；

第五节点组0100，节点编号根据[y+B，x+B]生成，即为[10，9]；

第六节点组0101，节点编号根据[x+B，y+B]生成，即为[11，12]；

第七节点组0110，节点编号根据[x+B，y+B]生成，即为[13，14]；

第八节点组0111，节点编号根据[y+B，x+B]生成，即为[16，15]；

第九节点组1000，节点编号根据[y+B，x+B]生成，即为[18，17]；

第十节点组1001，节点编号根据[x+B，y+B]生成，即为[19，20]；

第十一节点组1010，节点编号根据[x+B，y+B]生成，即为[21，22]；

第十二节点组1011，节点编号根据[y+B，x+B]生成，即为[24，23]；

第十三节点组1100，节点编号根据[x+B，y+B]生成，即为[25，26]；

第十四节点组1101，节点编号根据[y+B，x+B]生成，即为[28，27]；

第十五节点组1110，节点编号根据[y+B，x+B]生成，即为[30，29]；

第十六节点组1111，节点编号根据[x+B，y+B]生成，即为[31，32]。

上述生成每个节点组中节点的节点编号后，按照逻辑组的组成结构将对应节点组的节点编号记录到相对应的逻辑组中，即可获得每个逻辑组中节点的节点编号。

在获得逻辑组中节点的节点标识后，可以将所述节点标识采用不同的呈现方式进行记录，例如：将所述逻辑组中节点的节点标识信息记录至与所述交换设备连接的物理组内的节点上。如图3所示，每个物理组中均能够呈现不同逻辑组中节点的节点编号。或者，将节点标识信息以查询表的形式进行记录，具体可以是，根据所述节点标识，建立节点查询表；将节点标识信息记录在所述节点查询表中，通过查询表查找节点标识，确定查找的节点标识与节点的映射关系(例如：节点标识与节点IP的映射关系)，从而获知查找的节点标识所对应的节点，也就是说，查询表中记录有节点标识的信息，节点的信息，以及具有连接关系的其他节点标识的信息。其中，所述根据所述逻辑组中节点的节点标识，建立节点查询表，包括：

按照所述逻辑组中节点之间的距离建立索引；

将索引值相同的节点标识信息记录到同一节点查询列表中。

基于上述在确定节点标识后，需要根据节点标识建立二部图中上侧节点与下侧节点之间的数据通信链路，请参考下述内容。

步骤S203：根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。

根据现有技术可以获知，以二部图为网络集群架构的节点之间存在多个可达路劲，会造成网络拥塞。当确定节点标识后，可以根据节点标识建立节点之间唯一数据通信链路，即在不同逻辑组中建立节点之间的唯一数据通信链路，或者在相同逻辑组中建立节点之间的唯一数据通信链路。请参考图5所示，图5是本申请提供的一种数据通信链路的建立方法实施例中规约操作的示意图，具体实现过程可以包括：

步骤S203-1：根据所述节点标识，对所述逻辑组中的节点进行规约操作，获得节点的规约信息。

所述步骤S203-1中采用的规约操作可以是分多步规约方式，即：havling-doubling allreduce。Reduce规约是来自函数式编程的一个经典概念。数据规约包含通过一个函数将一批数据分成较小的一批数据。比如将一个数组的元素通过加法函数规约为一个数字。allreduce是集合通信模式的一种，可以通俗的理解为，将当前节点所持有的数据发送给其他所有参与节点，进行相应的规约操作，使得所有节点能够规约后的结果。规约操作可以包括：如平均、加法、取最大值等，在本实施例中主要采用的是加法规约。

如图6所示，所述步骤S203-1的实现过程可以包括：

步骤S203-1-11：根据设定的第一配对距离，对所述逻辑组中的节点进行两两配对。

如图6所示的Step1，以配对距离的步长为1，对所述第一逻辑组中的节点进行两两配对，即节点1和节点2配对，节点3和节点4配对，节点5和节点6配对，节点7和节点8配对；所述第二逻辑组中的节点进行两两配对，即节点9和节点10配对，节点11和节点12配对，节点13和节点14配对，节点15和节点16配对；所述第三逻辑组中的节点进行两两配对，即节点17和节点18配对，节点18和节点20配对，节点21和节点22配对，节点23和节点24配对；所述第四逻辑组中的节点进行两两配对，即节点25和节点26配对，节点27和节点28配对，节点29和节点30配对，节点31和节点32配对。

步骤S203-1-12：根据配对的节点之间传输的数据，获得以所述第一配对距离进行配对的节点的规约信息。如图6中的step1。

所述步骤S203-1-12的目的在于，两两配对的节点彼此获得对方的部分数据，从而得到规约信息。

基于上述内容还可以包括：

步骤S203-1-21：根据设定的第二配对距离，对所述逻辑组中的节点重新两两配对；如图6中的step2。

步骤S203-1-22：根据配对的两个节点之间传输的数据，并基于已经获得的以所述第一配对距离进行配对的节点的规约信息，获得以所述第二配对距离进行配对的节点的规约信息。

基于上述内容还可以包括：

步骤S203-1-31：根据设定的第三配对距离，对所述逻辑组中的节点重新两两配对；如图6中的step3。

步骤S203-1-32：根据配对的两个节点之间传输的数据，并基于已经获得的以所述第二配对距离进行配对的节点的规约信息，获得以所述第三配对距离进行配对的节点的规约信息；

步骤S203-1-33：将以所述第三配对距离进行配对的节点的规约信息发送至以所述第二配对距离进行配对的节点；即从step3开始反向传输。

步骤S203-1-33：将获得以所述第二配对距离进行配对的节点的规约信息和接收的以所述第三配对距离进行配对的节点的规约信息，发送至以所述第一配对距离进行配对的节点。

需要说明的是，图6仅以8个节点作为举例说明，对于32个节点的规约过程则需要五个步骤，即：step1至step5。在正向规约后，每个节点获得1/32之一的规约结果；之后再进行反向规约，规约结果中传输的数据量可以是每次相同的。

步骤S203-2：根据节点的规约信息，建立所述逻辑组中节点之间的唯一数据通信链路。

所述步骤S203-2的目的是：根据节点的规约信息进而在节点之间建立唯一数据通信链路。需要说明的是，所述步骤S203-2的具体实现过程可以是所述步骤S203-1-11和步骤S203-1-12中根据第一配对距离确定的节点的规约信息实现节点之间唯一数据通信链路建立，如图7所示；也可以是所述步骤S203-1-21和步骤S203-1-22中根据第二配对距离确定的节点的规约信息实现节点之间唯一数据通信链路建立，如图8所示；也可以是所述步骤S203-1-31至步骤S203-33中根据第三配对距离确定的节点的规约信息实现节点之间唯一数据通信链路建立，如图9所示；或者，将以所述第三配对距离进行配对的节点的规约信息发送至以所述第二配对距离进行配对的节点；以及将获得以所述第二配对距离进行配对的节点的规约信息和接收的以所述第三配对距离进行配对的节点的规约信息，发送至以所述第一配对距离进行配对的节点，使得每个节点获得规约结果，从而完成节点之间唯一数据通信链路建立，如图10和图11所示。

图10是本申请提供的一种数据通信链路的建立方法实施例在逻辑组中节点之间的第一种连接关系示意图；图11是本申请提供的一种数据通信链路的建立方法实施例在逻辑组中节点之间的第二种连接关系示意图。这两幅图中均描述逻辑组中节点之间的连接关系，相同颜色的节点之间存在连接关系，因为连接关系跨越两个逻辑组，为在一个虚线框中展示，所以一个虚线框内8根线代表8个连接，连接了16个节点，例如图10上部连接关系表示中，节点1与节点9具有连接关系，在图10下部连线表示中，由于节点9的位置与节点2相同，因此以节点2代替节点9连接表示，当并不是节点1与节点2连接，节点1与节点2之间的连线代表节点1与节点9连接，同理节点4与节点3连线代表节点4与节点12连接。图10和图11仅以部分逻辑组中的节点组作为举例进行绘示。

需要说明的是，为避免逻辑组中节点之间的链路相同，本实施例中，还可以包括：

对所述确定的所述逻辑组中节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识。具体可以是，对所述逻辑组中位于所述集群架构的二部图上侧的节点或下侧的节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识。

如图7中的第二逻辑组，移位前第二逻辑组中上侧(x)节点的节点编号为[10，11，13，16]，移位后第二逻辑组中上侧节点的节点编号为[16，10，11，13]；第三逻辑组在移位前上侧(x)节点的节点编号为[18，19，21，24]，移位后第三逻辑中上侧节点的节点编号为[21，24，18，19]；第四逻辑组在移位前上侧(x)节点的节点编号为[25，28，30，31]，移位后第四逻辑组中上侧节点的节点编号为[31，25，28，30]；移位可以在节点标识确定过程中实现，例如：第一逻辑组节点的节点标识的公式为不移位[y+B<<0，x+B]；第二逻辑组节点的节点标识的公式加入移位[y+i×B<<1，x+i×B]；第三逻辑组节点的节点标识的公式加入移位[y+i×B<<2，x+i×B]；第四逻辑组节点的节点标识的公式加入移位[x+i×B<<3，y+i×B]。其中，<<0表示移位0位即不移位，<<1 表示移位1位，<<2表示移位2位，<<3表示移位3位。

需要说明的是，移位可以针对上侧进行移位，也可以针对下侧(y)进行移位，例如：第一逻辑组节点的节点标识的公式为不移位[y+B，x+B<<0]；第二逻辑组节点的节点标识的公式加入移位[y+i×B，x+i×B<<1]；第三逻辑组节点的节点标识的公式加入移位[y+i×B，x+i×B<<2]；第四逻辑组节点的节点标识的公式加入移位[x+i×B，y+i×B<<3]。

以上是对本申请提供的一种数据通信链路的建立方法实施例的具体描述，与前述提供的一种数据通信链路的建立方法实施例相对应，本申请还公开一种数据通信链路的建立装置实施例，请参看图12，由于装置实施例基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

如图12所示，图12是本申请提供的一种数据通信链路的建立装置实施例的结构示意图，该建立装置包括：

分组单元1201，用于将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。

所述分组单元1201具体用于将所述集群架构中分布在二部图两侧的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。

所述分组单元1201包括：

逻辑组确定子单元，用于将所述二部图中分别连接不同交换设备的节点的集合，确定为所述逻辑组；

物理组确定子单元，用于将所述二部图中连接同一交换设备的节点的集合，确定为所述物理组，其中，所述物理组中包括来自不同逻辑组的节点。

还包括：

选取单元，用于选取第一逻辑组中的节点信息；

节点组划分单元，用于将所述第一逻辑组中的节点按照所述二部图划分为至少包括两个节点的节点组；

赋值单元，用于赋予所述第一逻辑组中第一节点组的两个节点的节点标识；

指定节点标识确定单元，用于将所述两个节点的节点标识确定为所述设定的指定节点的节点标识。

确定单元1202，用于根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识。

所述确定单元1202包括两种实现方式，方式一包括：

第一生成子单元，用于根据所述第一逻辑组中第一节点组中节点的节点标识，生成所述第一逻辑组中与所述第一节点组相邻的第二节点组中节点的节点标识；

第二生成子单元，用于根据所述第二节点组中节点的节点标识生成所述第一逻辑组中与所述第二节点组相邻的下一节点组中节点的节点标识；

第三生成子单元，用于当第一逻辑组中节点标识生成完毕，则根据所述第一逻辑组中第一节点组中节点的节点标识，生成第二逻辑组中第一节点组中节点的节点标识；

第四生成子单元，用于根据所述第一逻辑组中第二节点组中节点的节点标识，生成所述第二逻辑组中第二节点组中节点的节点标识，依次类推直到生成所有逻辑组中节点的节点标识。

所述确定单元1202方式二包括：

获得子单元，用于将逻辑组中的节点组按照顺序进行排序，获得排序后的节点组集合；

第一确定子单元，用于根据所述节点组集合中第一节点组中节点的节点标识，确定第一节点标识基准；

第一生成子单元，用于根据第一节点标识基准生成所述节点组集合中第二节点组中节点的节点标识；

第二确定子单元，用于根据所述第二节点组中节点的节点标识，确定第二节点标识基准；

第三生成子单元，用于根据所述第二节点标识基准生成所述节点组集合中第三节点组中节点的节点标识；依次类推直到生成节点组集合中所有节点组中节点的节点标识。

建立单元1203，用于根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。

所述建立单元1203包括：

规约信息获得子单元，用于根据所述节点标识，对所述逻辑组中的节点进行规约操作，获得节点的规约信息；

建立子单元，用于根据节点的规约信息，建立不同物理组中属于同一逻辑组内的节点之间的唯一数据通信链路。

所述规约信息获得子单元包括：

第一配对子单元，用于根据设定的第一配对距离，对所述逻辑组中的节点进行两两配对；

第一规约获得子单元，用于根据配对的节点之间传输的数据，获得以所述第一配对距离进行配对的节点的规约信息。

第二配对子单元，用于根据设定的第二配对距离，对所述逻辑组中的节点重新两两配对；

第二规约获得子单元，用于根据配对的两个节点之间传输的数据，并基于已经获得的以所述第一配对距离进行配对的节点的规约信息，获得以所述第二配对距离进行配对的节点的规约信息。

第三配对子单元，用于根据设定的第三配对距离，对所述逻辑组中的节点重新两两配对；

第三规约获得子单元，用于根据配对的两个节点之间传输的数据，并基于已经获得的以所述第二配对距离进行配对的节点的规约信息，获得以所述第三配对距离进行配对的节点的规约信息；

第一发送子单元，用于将以所述第三配对距离进行配对的节点的规约信息发送至以所述第二配对距离进行配对的节点；

第二发送子单元，用于将获得以所述第二配对距离进行配对的节点的规约信息和接收的以所述第三配对距离进行配对的节点的规约信息，发送至以所述第一配对距离进行配对的节点。

基于上述内容，为避免逻辑组中节点之间的链路相同，本申请提供的数据通信链路的建立装置还包括：

移位单元，用于对所述确定的所述逻辑组中节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识。

所述移位单元具体用于对所述逻辑组中位于所述集群架构的二部图上侧的节点或下侧的节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识。

基于上述内容，本申请提供的数据通信链路的建立装置中节点标识可以采用不同的方式呈现，因此，还包括：

记录单元，用于将所述逻辑组中节点的节点标识信息记录至与所述交换设备连接的物理组内的节点上。

或者，还包括：

查询表建立单元，用于根据所述节点标识，建立节点查询表；

记录单元，用于将所述节点标识信息记录在所述节点查询表中。

所述查询表建立单元包括：

索引子单元，用于按照所述逻辑组中节点之间的距离建立索引；

记录子单元，用于将索引值相同的节点标识信息记录到同一节点查询列表中。

以上为本申请提供的一种数据通信链路的建立装置实施例的说明，基于上述提供的数据通信链路的建立方法和数据通信链路的建立装置，本申请还提供一种集群架构中节点标识的确定方法，由于该确定方法与数据通信链路的建立方法实施例中的部分内容相同，此处描述的较为概要，具体细节内容，参考数据通信链路的建立方法实施例中的步骤S201和S202的描述。

请参考图13，图13是本申请提供的一种集群架构中节点标识的确定方法实施例的流程图，该确定方法包括：

步骤S1301：将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。

首先，本实施例中的集群架构结构是采用二部图的拓扑结构形式，如图1所示，集群架构中的交换设备分布于二部图的两侧，包括：上侧与交换设备连接的节点以及相对的下侧与交换设备连接的节点，上侧节点和下侧节点之间，上侧节点之间以及下侧节点之间能够通过交换设备进行数据通信的网络集群架构。

所述步骤S1301具体实现过程是：

将所述集群架构中分布在二部图两侧的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。其中，所述逻辑组可以表示节点之间的逻辑连接关系，所述物理组可以表示节点物理位置关系。

在本实施例中，可以将所述二部图中分别连接不同交换设备的节点的集合确定为逻辑组；可以将所述二部图中连接同一交换设备的节点的集合，确定为所述物理组，其中，所述物理组中包括来自不同逻辑组的节点。为便于理解，以4×8网络集群架构为例进行说明，请参考图3所示，具体内容，请参考数据通信链路方法中的步骤S201的描述，此处不再赘述。

步骤S1302：根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识。

所述步骤S1302的目的在于需要预先确定一个节点的标识基准，进而便于根据该标识基准获得其他节点的节点标识。通过对逻辑组中设置指定节点的标识，从而获得逻辑组中指定节点以外的其他节点的节点标识。因此，需要设置一个节点的标识基准，即还可以包括：

选取第一逻辑组中的节点信息；

赋予所述第一逻辑组中第一节点组的两个节点的标识；

将所述两个节点的标识确定为所述设定的指定节点标识。

所述步骤S1302中关于如何确定指定节点标识的过程可以参考上述数据通信链路的建立方法实施例中的所述步骤S20a至所述步骤S20d的描述，此处不再赘述。

在确定指定节点的节点标识之后，需要根据指定节点的节点标识获得其他节点的节点标识，从而为建立节点之间的通信链路关系做基础。

所述步骤S1302如何根据指定节点的节点标识，确定其他节点的节点标识可以包括两种方式，但并与限于这两种方式，首先，将两种方式做一个概括性的说明，后续将会详细阐述。方式一包括：

步骤S1302-1a：根据所述第一逻辑组中第一节点组中节点的节点标识，生成所述第一逻辑组中与所述第一节点组相邻的第二节点组中节点的节点标识；

步骤S1302-1b：根据所述第二节点组中节点的节点标识生成所述第一逻辑组中与所述第二节点组相邻的下一节点组中节点的节点标识；

步骤S1302-1c：当第一逻辑组中节点标识生成完毕，则根据所述第一逻辑组中第一节点组中节点的节点标识，生成第二逻辑组中第一节点组中节点的节点标识；

步骤S1302-1d：根据所述第一逻辑组中第二节点组中节点的节点标识，生成所述第二逻辑组中第二节点组中节点的节点标识，依次类推直到生成所有逻辑组中节点的节点标识。

方式二包括：

步骤S1302-2a：将逻辑组中的节点组按照顺序进行排序，获得排序后的节点组集合；

步骤S1302-2b：根据所述节点组集合中第一节点组中节点的节点标识，确定第一节点标识基准；

步骤S1302-2c：根据第一节点标识基准生成所述节点组集合中第二节点组中节点的节点标识；

步骤S1302-2d：根据所述第二节点组中节点的节点标识，确定第二节点标识基准；

步骤S1302-2e：根据所述第二节点标识基准生成所述节点组集合中第三节点组中节点的节点标识；依次类推直到生成节点组集合中所有节点组中节点的节点标识。

以上仅为步骤S1302中如何根据指定节点的节点标识，确定逻辑组中其他节点的节点标识的概括说明，具体内容请参考上述数据通信链路的建立方法实施例中的步骤S202的详细说明。

以上是对本申请提供的一种集群架构中节点标识的确定方法实施例的具体描述，与前述提供的一种集群架构中节点标识的确定方法实施例相对应，本申请还公开一种集群架构中节点标识的确定装置实施例，请参看图14，由于装置实施例基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

请参考图14，图14是本申请提供的一种集群架构中节点标识的确定装置实施例的结构示意图；所述确定装置包括：

分组单元1401，用于将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。

所述分组单元1401具体用于将所述集群架构中分布在二部图两侧的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。

所述分组单元1401可以包括：

还包括：

选取单元，用于选取第一逻辑组中的节点信息；

确定单元1402，用于根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识。

所述确定单元1402包括两种实现方式，方式一包括：

所述确定单元1402方式二包括：

以上是对本申请提供的一种集群架构中节点标识的确定装置实施例的描述，描述较为概要具体内容可以参考上述数据通信链路的建立方法实施例和建立装置实施例的描述。

由于人工智能深度学习技术不断的发展，因此对集群架构的性能要求更高，为避免数据在通信过程由于产生拥塞等问题而导致数据处理速度下降。本申请还提供一种基于人工智能集群架构中数据通信链路的建立方法，请参考图15所示，图15是本申请提供的一种基于人工智能集群架构中数据通信链路的建立方法实施例的流程图，该方法包括：

步骤S1501：将人工智能集群架构中用于数据通信的节点进行分组，获得在所述人工智能集群架构中描述节点连接关系的逻辑组和描述节点物理位置的物理组；

步骤S1502：根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；

步骤S1503：根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。

上述提供的基于人工智能集群架构中数据通信链路的建立方法，目的在于，将数据通信链路的唯一性应用到人工智能的集群架构中，从而保证人工智能集群架构性能的稳定性。具体实现过程可以参考上述数据通信链路的建立方法实施例的说明。

基于本申请提供的基于人工智能集群架构中数据通信链路的建立方法实施例，本申请还提供一种基于人工智能集群架构中数据通信链路的建立装置实施例，请参考图16所示，该装置包括：

分组单元1601，用于将人工智能集群架构中用户数据通信的节点进行分组，获得在所述人工智能集群架构中描述节点连接关系的逻辑组和描述节点物理位置的物理组；

确定单元1602，用于根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；

建立单元1603，用于根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。

同样地，该装置的具体实现过程可以参考上述数据通信链路的建立方法实施例和数据通信链路的建立装置实施例的说明，此处不再赘述。

基于上述内容，本申请还提供一种计算机存储设备，用于存储网络平台产生数据，以及对应所述网络平台产生数据进行处理的程序；

所述程序在被所述处理器读取执行时，执行如上所述的数据通信链路的建立方法的步骤，或者执行如上所述的集群架构中节点标识的确定方法的步骤，或者执行如上所述的基于人工智能集群架构中数据通信链路的建立方法的步骤。

基于上述内容，本申请还提供一种电子设备，包括：

处理器；

存储器，用于存储对网络平台产生数据进行处理的程序，所述程序在被所述处理器读取执行时，执行如上所述的数据通信链路的建立方法的步骤，或者执行如上所述的集群架构中节点标识的确定方法的步骤，或者执行如上所述的基于人工智能集群架构中数据通信链路的建立方法的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

2、本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请虽然以较佳实施例公开如上，但其并不是用来限定本申请，任何本领域技术人员在不脱离本申请的精神和范围内，都可以做出可能的变动和修改，因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

Claims

一种数据通信链路的建立方法，其特征在于，包括：

将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组；

根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；

根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。
根据权利要求1所述的数据通信链路的建立方法，其特征在于，所述将集群架构中用于进行数据通信的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组，包括：

将所述集群架构中分布在二部图两侧的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。
根据权利要求2所述的数据通信链路的建立方法，其特征在于，所述将所述集群架构中分布在二部图两边的所述节点进行分组，获得在所述集群机构中描述节点连接关系的逻辑组和描述节点物理位置的物理组，包括：

将所述二部图中分别连接不同交换设备的节点的集合，确定为所述逻辑组；

将所述二部图中连接同一交换设备的节点的集合，确定为所述物理组，其中，所述物理组中包括来自不同逻辑组的节点。
根据权利要求2所述的数据通信链路的建立方法，其特征在于，还包括：

选取第一逻辑组中的节点信息；

将所述第一逻辑组中的节点按照所述二部图划分为至少包括两个节点的节点组；

赋予所述第一逻辑组中第一节点组的两个节点的节点标识；

将所述两个节点的节点标识确定为所述设定的指定节点的节点标识。
根据权利要求4所述的数据通信链路的建立方法，其特征在于，所述根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识，包括：

根据所述第一逻辑组中第一节点组中节点的节点标识，生成所述第一逻辑组中与所述第一节点组相邻的第二节点组中节点的节点标识；

根据所述第二节点组中节点的节点标识生成所述第一逻辑组中与所述第二节点组相邻的下一节点组中节点的节点标识；

当第一逻辑组中节点标识生成完毕，则根据所述第一逻辑组中第一节点组中节点的节点标识，生成第二逻辑组中第一节点组中节点的节点标识；

根据所述第一逻辑组中第二节点组中节点的节点标识，生成所述第二逻辑组中第二节点组中节点的节点标识，依次类推直到生成所有逻辑组中节点的节点标识。
根据权利要求4所述的数据通信链路的建立方法，其特征在于，所述根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识，包括：

将逻辑组中的节点组按照顺序进行排序，获得排序后的节点组集合；

根据所述节点组集合中第一节点组中节点的节点标识，确定第一节点标识基准；

根据第一节点标识基准生成所述节点组集合中第二节点组中节点的节点标识；

根据所述第二节点组中节点的节点标识，确定第二节点标识基准；

根据所述第二节点标识基准生成所述节点组集合中第三节点组中节点的节点标识；依次类推直到生成节点组集合中所有节点组中节点的节点标识。
根据权利要求1所述的数据通信链路的建立方法，其特征在于，所述根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路，包括：

根据所述节点标识，对所述逻辑组中的节点进行规约操作，获得节点的规约信息；

根据节点的规约信息，建立所述逻辑组中节点之间的唯一数据通信链路。
根据权利要求7所述的数据通信链路的建立方法，其特征在于，所述根据所述节点标识，对所述逻辑组中的节点进行规约操作，获得节点的规约信息，包括：

根据设定的第一配对距离，对所述逻辑组中的节点进行两两配对；

根据配对的节点之间传输的数据，获得以所述第一配对距离进行配对的节点的规约信息。
根据权利要求8所述的数据通信链路的建立方法，其特征在于，还包括：

根据设定的第二配对距离，对所述逻辑组中的节点重新两两配对；

根据配对的两个节点之间传输的数据，并基于已经获得的以所述第一配对距离进行配对的节点的规约信息，获得以所述第二配对距离进行配对的节点的规约信息。
根据权利要求9所述的数据通信链路的建立方法，其特征在于，还包括：

根据设定的第三配对距离，对所述逻辑组中的节点重新两两配对；

根据配对的两个节点之间传输的数据，并基于已经获得的以所述第二配对距离进行配对的节点的规约信息，获得以所述第三配对距离进行配对的节点的规约信息；

将以所述第三配对距离进行配对的节点的规约信息发送至以所述第二配对距离进行配对的节点；

将获得以所述第二配对距离进行配对的节点的规约信息和接收的以所述第三配对距离进行配对的节点的规约信息，发送至以所述第一配对距离进行配对的节点。
根据权利要求1所述的数据通信链路的建立方法，其特征在于，还包括：

对所述确定的所述逻辑组中节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识。
根据权利要求11所述的数据通信链路的建立方法，其特征在于，所述对所述确定的所述逻辑组中节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识，包括：

对所述逻辑组中位于所述集群架构的二部图上侧的节点或下侧的节点的节点标识进行移位，获得移位后的逻辑组中节点的节点标识。
根据权利要求1所述的数据通信链路的建立方法，其特征在于，还包括：

将所述逻辑组中节点的节点标识信息记录至与交换设备连接的物理组内的节点上。
根据权利要求1所述的数据通信链路的建立方法，其特征在于，还包括：

根据所述节点标识，建立节点查询表；

将所述节点标识的信息记录在所述节点查询表中。
根据权利要求14所述的数据通信链路的建立方法，其特征在于，所述根据所述逻辑组中节点的节点标识，建立节点查询表，包括：

按照所述逻辑组中节点之间的距离建立索引；

将索引值相同的节点标识信息记录到同一节点查询列表中。
一种数据通信链路的建立装置，其特征在于，包括：

分组单元，用于将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组；

确定单元，用于根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；

建立单元，用于根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。
一种集群架构中节点标识的确定方法，其特征在于，包括：

将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组；

根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识。
根据权利要求17所述的集群架构中节点标识的确定方法，其特征在于，所述将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组，包括：

将所述集群架构中分布在二部图两侧的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组。
根据权利要求18所述的集群架构中节点标识的确定方法，其特征在于，所述将所述集群架构中分布在二部图两边的所述节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组，包括：

将所述二部图中分别连接不同交换设备的节点的集合，确定为所述逻辑组；

将所述二部图中连接同一交换设备的节点的集合，确定为所述物理组，其中，所述物理组中包括来自不同逻辑组的节点。
根据权利要求18所述的方法，其特征在于，还包括：

选取第一逻辑组中的节点信息；

将所述第一逻辑组中节点按照所述二部图划分为至少包括两个节点的节点组；

赋予所述第一逻辑组中第一节点组的两个节点的标识；

将所述两个节点的标识确定为所述设定的指定节点标识。
根据权利要求20所述的集群架构中节点标识的确定方法，其特征在于，所述根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识，包括：

根据所述第一逻辑组中第一节点组中节点的节点标识，生成所述第一逻辑组中与所述第一节点组相邻的第二节点组中节点的节点标识；

根据所述第二节点组中节点的节点标识生成所述第一逻辑组中与所述第二节点组相邻的下一节点组中节点的节点标识；

当第一逻辑组中节点标识生成完毕，则根据所述第一逻辑组中第一节点组中节点的节点标识，生成第二逻辑组中第一节点组中节点的节点标识；

根据所述第一逻辑组中第二节点组中节点的节点标识，生成所述第二逻辑组中第二节点组中节点的节点标识，依次类推直到生成所有逻辑组中节点的节点标识。
根据权利要求20所述的集群架构中节点标识的确定方法，其特征在于，所述根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识，包括：

将逻辑组中的节点组按照顺序进行排序，获得排序后的节点组集合；

根据所述节点组集合中第一节点组中节点的节点标识，确定第一节点标识基准；

根据第一节点标识基准生成所述节点组集合中第二节点组中节点的节点标识；

根据所述第二节点组中节点的节点标识，确定第二节点标识基准；

根据所述第二节点标识基准生成所述节点组集合中第三节点组中节点的节点标识；依次类推直到生成节点组集合中所有节点组中节点的节点标识。
一种集群架构中节点标识的确定装置，其特征在于，包括：

分组单元，用于将集群架构中的节点进行分组，获得描述节点连接关系的逻辑组和描述节点物理位置的物理组；

确定单元，用于根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识。
一种基于人工智能集群架构中数据通信链路的建立方法，其特征在于，包括：

将人工智能集群架构中用于数据通信的节点进行分组，获得在所述人工智能集群架构中描述节点连接关系的逻辑组和描述节点物理位置的物理组；

根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；

根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。
一种基于人工智能集群架构中数据通信链路的建立装置，其特征在于，包括：

分组单元，用于将人工智能集群架构中用于数据通信的节点进行分组，获得在所述人工智能集群架构中描述节点连接关系的逻辑组和描述节点物理位置的物理组；

确定单元，用于根据所述逻辑组中设定的指定节点的节点标识，确定所述逻辑组中其他节点的节点标识；

建立单元，用于根据所述节点标识，建立所述逻辑组中节点之间的唯一数据通信链路。
一种计算机存储介质，用于存储网络平台产生数据，以及对应所述网络平台产生数据进行处理的程序；

所述程序在被所述处理器读取执行时，执行如权利要求1至15任意一项所述的数据通信链路的建立方法的步骤，或者执行如权利要求17至22任意一项所述的集群架构中节点标识的确定方法的步骤，或者执行建立如权利要求25所述的人工智能集群架构中数据通信链路的建立装置的步骤。
一种电子设备，包括：

处理器；

存储器，用于存储对网络平台产生数据进行处理的程序，所述程序在被所述处理器读取执行时，执行如权利要求1至15任意一项所述的数据通信链路的建立方法的步骤，或者执行如权利要求17至22任意一项所述的集群架构中节点标识的确定方法的步骤，或者执行建立如权利要求25所述的建立装置的步骤。