WO2023088288A1

WO2023088288A1 - 二部图构建方法、显示方法和装置

Info

Publication number: WO2023088288A1
Application number: PCT/CN2022/132189
Authority: WO
Inventors: 王中伟; 朱融晨; 高寒
Original assignee: 华为技术有限公司
Priority date: 2021-11-19
Filing date: 2022-11-16
Publication date: 2023-05-25
Also published as: CN116152269A

Abstract

本申请公开了一种二部图构建方法、显示方法和装置，构建方法包括：从计算图中搜索出第一通信节点对应的至少一条跨通信边，其中，第一通信节点为计算图包含的M个通信节点中的一个，第一通信节点对应P个前驱节点和Q个后继节点，至少一条跨通信边中的每条跨通信边指示P个前驱节点中一个前驱节点和Q个后继节点中一个后继节点之间的通信路径，且每条跨通信边不经过M个通信节点；切割M个通信节点分别对应的跨通信边，并进行聚合操作，以得到二部图，M个通信节点中的任意两个通信节点在二部图中无边相连。采用本申请，可以基于构建得到的二部图清晰展示模型结构，从而快速直观地定位通信节点的位置和功能，进而为后续并行策略的设计提供依据。

Description

二部图构建方法、显示方法和装置

本申请要求于2021年11月19日提交中国专利局、申请号为202111381794.7、申请名称为“二部图构建方法、显示方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种二部图构建方法、显示方法和装置。

背景技术

随着深度学习的不断发展，硬件算力的不断提升，深度神经网络的规模越来越大。大模型通常会采用集群并行训练，将数据或者模型进行切分并分配到不同的设备中。在表征并行训练过程的计算图中，通信节点用于指示数据交互任务，该数据交互任务是指两个或两个以上的设备(如图形处理器等(Graphics Processing Unit，GPU))之间的数据交互。通常，研究人员会通过设计合理的并行策略，来实现尽可能大的计算通信比，即最大程度地降低单纯通信的时间。如果并行策略设计不合理，可能会引入冗余的通信节点，从而导致通信节点处出现性能瓶颈。

在设计并行策略的过程中，研究人员通常会以通信节点为入口，分析和调整模型的并行策略。

然而，目前利用Tensorboard等工具展示并行训练计算图时，无法清晰展示大模型的结构，需要逐级展开才能看到通信节点，定位通信节点的过程复杂且繁琐。

发明内容

本申请实施例提供了一种二部图构建方法、显示方法和装置，可以将计算图中的通信节点抽提至二部图的顶层，以清晰展示模型结构，从而快速直观地定位通信节点的位置和功能，进而为后续并行策略的设计提供依据。

第一方面，本申请提供了一种二部图构建方法，包括：从计算图中搜索出第一通信节点对应的至少一条跨通信边，其中，所述第一通信节点为所述计算图包含的M个通信节点中的一个，所述第一通信节点对应P个前驱节点和Q个后继节点，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱节点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点，M、P和Q为正整数；切割所述M个通信节点中每个通信节点对应的跨通信边，并进行聚合操作，以得到所述二部图，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。

其中，每个通信节点对应的前驱节点为数据流在流入通信节点之前所经过的非通信节点。每个通信节点对应的后继节点为数据流在流出通信节点之后所经过的非通信节点。每个通信节点对应的跨通信边包括该通信节点对应的前驱节点中任意一个前驱节点到该通信节点对应的后继节点中任意一个后继节点之间的通信路径，且每条跨通信边不经过任何通信节点。

从技术效果上看，本申请通过对计算图中每个通信节点对应的跨通信边进行切割，从而在计算图中只保留经过通信节点的路径。通过此种方式将计算图中的通信节点抽提至二部图的顶层，从而清晰地展示模型结构，并快速定位通信节点的位置和功能，进而为后续模型训练过程中通信节点的融合/切分策略提供依据，以设计最佳的并行策略，来增加计算时间与通信时间的重叠程度，也即降低并行训练过程的训练时长。

在一种可行的实施方式中，所述每条跨通信边包括至少一条子边，所述至少一条子边中的每条子边直接连接两个计算节点；所述至少一条子边中的每条子边对应一个权重系数，所述每条子边对应的一个权重系数由所述每条子边直接连接的两个计算节点的类型决定。

其中，计算节点也称为计算算子，为计算图中不可展开的节点。计算算子的类型由计算算子的具体功能决定，例如，对于求对数算子Log Operator而言，其功能为进行对数运算。可选地，其类型可以为Log，即每个计算算子的类型由其标识符进行表示。

从技术效果上看，本申请为每条跨通信边中的子边定义相应的权重系数，通过权重系数来定义每条子边的重要程度，进而为后续跨通信边的切割提供相应的依据。

在一种可行的实施方式中，所述依次切割所述M个通信节点中每个通信节点对应的跨通信边，包括：在第i条跨通信边中存在一条子边已被切割的情况下，不对所述第i条跨通信边进行切割，所述第i条跨通信边为所述M个通信节点中任一通信节点对应的一条跨通信边；或者，在第i条跨通信边所包含的子边均未被切割的情况下，切割所述第i条跨通信边所包含的子边中权重系数最小或者权重系数最大的子边，所述第i条跨通信边为所述M个通信节点中任一通信节点对应的一条跨通信边。

从技术效果上看，在对跨通信边进行切割时，基于子边的权重系数切割其中的一条子边，一方面可以切割重要程度最小的子边，另一方面，只切割一条子边的方式可以最大程度地保留计算图中的语义信息。

在一种可行的实施方式中，切割后的所述计算图包括K个连通块，K为正整数；所述进行聚合操作，得到所述二部图，包括：对所述切割后的所述计算图中的每个连通块分别进行聚合，得到所述二部图；其中，所述K个连通块是基于所述M个通信节点在所述计算图中的位置对所述计算图中的计算节点进行划分得到的，所述二部图包括K个一级聚合节点和所述M通信节点，所述K个一级聚合节点中任意两个一级聚合节点无边直接相连，且所述K个一级聚合节点分别属于K个命名空间。

其中，连通块(也可称为连通分量)为：在跨通信边被切割后，计算图会被通信节点形成的屏障阻隔开，此时计算图中的计算节点相互连接所构成的子图称为连通块或连通分量。每个连通块包括至少一个计算节点。

从技术效果上看，通过对每个连通块分别进行聚合，即将K个连通块分别聚合得到K个一级聚合节点，得到由一级聚合节点和通信节点构成的二部图，从而可以基于此二部图快速定位通信节点的位置和功能，为后续通信节点的融合/切分提供相应的依据。

在一种可行的实施方式中，所述K个一级聚合节点中的每个一级聚合节点为层级结构，其中，所述层级结构中的第j层中的节点是由所述层级结构中第j-1层的节点展开得到的，所述层级结构中的第一层为所述一级聚合节点，所述第j层中的节点分别属于不同的命名空间；所述第j层中的节点包括聚合节点和/或计算节点，所述计算节点为不可展开的节点。

其中，上述展开为聚合的逆过程。聚合指将至少一个节点和该至少一个节点之间的边所表示的图结构用一个节点进行表示。展开指通过至少一个节点和该至少一个节点之间的边所构成的图结构来表示一个节点。

在一种可行的实施方式中，当第一命名空间中第一计算节点和第二计算节点之间的子边被切割时，更新所述第一命名空间，所述第一命名空间为所述计算图中的命名空间；构建包含第一计算节点的命名空间，所述第一计算节点不属于更新后的所述第一命名空间。

从技术效果上看，在对两个计算节点之间的子边进行切割操作后，存在一个计算节点不属于原来的命名空间，此时通过为该计算节点建立新的命名空间，以满足二部图的构建要求。

在一种可行的实施方式中，所述方法还包括：计算所述二部图中聚合节点的哈希值，以及计算节点的哈希值；其中，当所述节点为所述聚合节点时，所述节点的哈希值等于所述聚合节点展开得到的各节点的哈希值之和，当所述节点为所述计算节点时，所述节点的哈希值由所述计算节点的类型、入度、出度、附属节点的类型、附属节点的数量中的至少一个确定。

其中，计算节点的附属节点流出的数据只流入该计算节点，且计算节点的附属节点没有数据流入，附属节点通常为常量或者变量。

从技术效果上看，通过计算聚合节点的层级结构中每层中节点的哈希值，从而为后续节点的堆叠展示提供相应依据。

在一种可行的实施方式中，所述方法还包括：对所述二部图中的多个节点进行堆叠展示；其中，所述多个节点是由同一所述聚合节点展开一次后得到的，所述多个节点的哈希值相同，且所述多个节点串行连接或并行连接。

可选地，堆叠展示指在二部图中，用连接关系标识以及数字标识构成的堆叠结构来显示满足上述条件的多个节点；其中，连接关系标识用于表征该多个节点之间的连接关系，例如为并行连接或串行连接；数字标识表示满足上述条件的多个节点的数量。上述条件指由同一所述聚合节点展开一次后得到、哈希值相同，且连接关系为串行连接或并行连接的多个节点。

从技术效果上看，在层级结构中，可以认为哈希值相同的节点其内部结构也相同，因而当其进行串行连接或者并行连接时，可以在对应的层级中进行堆叠展示，从而清晰简洁地展示聚合节点的内部结构。

第二方面，本申请提供了一种二部图的显示方法，所述方法包括：输入计算图，基于所述计算图输出所述二部图；其中，所述计算图包括M个通信节点，所述M个通信节点中的第一通信节点对应P个前驱节点和Q个后继节点，所述第一通信节点对应至少一条跨通信边，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱结点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点，P、Q和M为正整数，所述M个通信节点分别对应的跨通信边在所述二部图中不连通，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。

从技术效果上看，本申请通过去除计算图中每个通信节点对应的跨通信边，从而在计算图中只保留数据流经过通信节点的路径。通过此种方式将计算图中的通信节点抽提至二部图的顶层，从而清晰地展示模型结构，并快速定位通信节点的位置和功能，进而为后续模型训练过程中通信节点的融合/切分策略提供依据，以设计最佳的并行策略，来增加计算时间与通信时间的重叠程度，也即降低并行训练过程的训练时长。

在一种可行的实施方式中，所述计算图包括C个计算节点，所述二部图包括K个一级聚合节点；其中，所述K个一级聚合节点是由所述C个计算节点进行聚合得到的，所述K个一级聚合节点中的每个一级聚合节点为层级结构，其中，所述层级结构中第j层中的节点是由所述层级结构中第j-1层中的聚合节点展开得到的，所述层级结构中的第一层为所述一级聚合节点，所述第j层中的节点分别属于不同的命名空间，C、K和j为正整数，所述第j层中的节点包括所述聚合节点和/或所述计算节点，所述计算节点为不可展开的节点。

在一种可行的实施方式中，所述二部图包括堆叠结构；其中，所述堆叠结构包括连接关系标识和数量标识，所述连接关系标识表征多个节点之间的连接关系，所述数量标识表征所述多个节点的数量，所述多个节点是由同一所述聚合节点展开一次后得到的，所述多个节点的哈希值相同，且所述多个节点之间的连接关系为串行连接或并行连接。

在一种可行的实施方式中，当所述节点为所述聚合节点时，所述节点的哈希值等于所述聚合节点展开得到的各节点的哈希值之和，当所述节点为所述计算节点时，所述节点的哈希值由所述计算节点的属性决定，所述计算节点的属性包括所述计算节点的类型、入度、出度、附属节点的类型和附属节点的数量。

具体地，上述第二方面中基于计算图得到二部图的具体过程与上述第一方面中的对应过程相同，此处不再赘述。

第三方面，本申请提供了一种二部图构建装置，包括搜索单元，用于从计算图中搜索出第一通信节点对应的至少一条跨通信边，其中，所述第一通信节点为所述计算图包含的M个通信节点中的一个，所述第一通信节点对应P个前驱节点和Q个后继节点，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱节点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点；M、P和Q为正整数；切割单元，用于切割所述M个通信节点分别对应的跨通信边，并进行聚合操作，得到所述二部图，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。

在一种可行的实施方式中，所述M个通信节点共对应N条跨通信边，N为正整数；在所述切割所述M个通信节点分别对应的跨通信边的方面，所述切割单元具体用于：切割所述N条跨通信边中的每条跨通信边中的一条子边；其中，当所述N条跨通信边中的E条跨通信边包含共同的子边时，所述E条跨通信边中被切割的所有子边分别对应的权重系数之和最大或者最小，E为小于或等于N的正整数；当所述N条跨通信边中的第i条跨通信边与其它跨通信边不包含共同的子边时，切割所述第i条跨通信边所包含的子边中权重系数最小或者权重系数最大的子边，i为正整数。

在一种可行的实施方式中，切割后的所述计算图包括K个连通块，K为正整数；在所述进行聚合操作，得到所述二部图的方面，所述切割单元具体用于：对所述切割后的所述计算图中的K个连通块分别进行聚合，得到所述二部图；其中，所述K个连通块是基于所述M个通信节点在所述计算图中的位置对所述计算图中的计算节点进行划分得到的，所述二部图包括K个一级聚合节点和所述M个通信节点，所述K个一级聚合节点中任意两个一级聚合节点无边直接相连，且所述K个一级聚合节点分别属于K个命名空间。

在一种可行的实施方式中，所述K个一级聚合节点中的每个一级聚合节点为层级结构，其中，所述层级结构中的第j层中的节点是由所述层级结构中第j-1层中的聚合节点展开得到的，所述层级结构中的第一层为所述一级聚合节点，所述第j层中的节点分别属于不同的所述命名空间，j为正整数；所述第j层中的节点包括聚合节点和/或计算节点，所述计算节点为不可展开的节点。

在一种可行的实施方式中，所述装置还包括：更新单元，用于当第一命名空间中第一计算节点和第二计算节点之间的子边被切割时，更新所述第一命名空间，所述第一命名空间为所述计算图中的命名空间；重建单元，用于构建包含所述第一计算节点的命名空间，所述第一计算节点不属于更新后的所述第一命名空间。

在一种可行的实施方式中，所述装置还包括：计算单元，用于计算所述二部图中聚合节点的哈希值，以及计算节点的哈希值；其中，当所述节点为所述聚合节点时，所述节点的哈希值等于所述聚合节点展开得到的各节点的哈希值之和，当所述节点为所述计算节点时，所述节点的哈希值由所述计算节点的属性决定，所述计算节点的属性包括所述计算节点的类型、入度、出度、附属节点的类型和附属节点的数量。

在一种可行的实施方式中，所述装置还包括：堆叠单元，用于对所述二部图中的多个节点进行堆叠展示；其中，所述多个节点是由同一所述聚合节点展开一次后得到的，所述多个节点的哈希值相同，且所述多个节点串行连接或并行连接。

第四方面，本申请提供了一种二部图显示装置，所述装置包括：输入单元，用于输入计算图；显示单元，用于基于所述计算图显示所述二部图；其中，所述计算图包括M个通信节点，所述M个通信节点中的第一通信节点对应P个前驱节点和Q个后继节点，所述第一通信节点对应至少一条跨通信边，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱结点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点，P、Q和M为正整数，所述M个通信节点分别对应的跨通信边在所述二部图中不连通，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。

具体地，上述第四方面中二部图显示装置中基于计算图得到二部图的具体过程与第二方面中二部图的显示方法中二部图的构建过程对应相同，此处不再赘述。

第五方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，该计算机程序被执行时，上述第一方面中任意一项所述的方法得以实现。

第六方面，本申请提供了一种计算机程序，该计算机程序包括指令，当该计算机程序被执行时，上述第一方面中任意一项所述的方法得以实现。

附图说明

以下对本申请实施例用到的附图进行介绍。

图1是本申请实施例中一种提供的一种系统架构示意图；

图2是本申请实施例中一种应用场景示意图；

图3是本申请实施例中一种二部图构建方法流程示意图；

图4是本申请实施例中一种计算图的结构示意图；

图5(a)-图5(b)为本申请实施例中一种跨通信边切割方式示意图；

图6(a)-图6(c)为本申请实施例中另一种跨通信边切割方式示意图；

图7是本申请实施例中一种二部图结构示意图；

图8是本申请实施例中一种命名空间的层级结构示意图；

图9是本申请实施例中一种依据命名空间层级结构进行计算节点的聚合过程示意图；

图10(a)-图10(d)是本申请实施例中一种连通块聚合过程实例图；

图11是本申请实施例中一种节点串行连接和并行连接的结构示意图；

图12(a)-图12(b)是本申请实施例中一种堆叠的聚合节点展开过程示意图；

图13(a)-图13(b)是本申请实施例中一种模型训练过程的时间线示例；

图14是本申请实施例中一种二部图显示方法流程示意图；

图15是本申请实施例中一种二部图构建装置的结构示意图；

图16是本申请实施例中一种二部图显示装置的结构示意图；

图17是本申请实施例中一种二部图构建装置的硬件结构示意图；

图18是本申请实施例中一种二部图显示装置的硬件结构示意图。

具体实施方式

下面结合本申请实施例中的附图对本申请实施例进行描述。本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

首先对本申请实施例中的相关术语进行解释：

(1)并行训练：多个图形处理器(Graphics Processing Unit，GPU)参与神经网络模型训练的过程，并行训练的方式包括数据并行、模型并行和流水线并行等。

(2)计算图可视化：将深度学习模型的计算过程及数据流通过计算图以可视化的方式进行展示的过程。

(3)二部图：如果图中所有节点可分为两个互不相交的子集，并且图中每条边连接的两个节点都分属于这两个互不相交的子集，且两个子集中每个子集内的任意两个节点无边直接相连，则此图为二部图。

(4)节点Node：计算图中的节点包括可展开的节点和不可展开的节点。可展开的节点称为聚合节点，其中，可展开的节点指该节点可以由至少一个节点和该至少一个节点之间的边所构成的图结构进行表示。计算图中不可展开的节点可以划分为计算节点和通信节点两类，也可称为计算算子和通信算子。在表征并行训练过程的计算图中，通信算子用于指示数据交互任务，该数据交互任务是指两个或两个以上的设备(如GPU等设备)之间的数据交互。计算算子为计算图中除通信节点外的其它算子，例如收集算子AllGather Operator、广播算子Broadcast Operator、卷积算子Conv2D Operator、最大池化算子MaxPool Operator、相加算子 Add Operator、求对数算子Log Operator、排序算子Sort Operator、转置算子Transpose Operator等。

(5)聚合节点：二部图中能进行展开的节点。聚合节点基于命名空间得到，存储了该聚合节点内的节点信息，包括其子节点列表，以及该节点是否展开等为后续交互探索模块提供支持的属性。

(6)前驱节点：每个通信节点对应的前驱节点为数据流在流入通信节点之前所经过的非通信节点。

(7)后继节点：每个通信节点对应的后继节点为数据流在流出该通信节点之后所经过的非通信节点。

(8)数据流：计算图中的每条边上的箭头指示与该条边直接连接的两个节点之间的数据流向，即从一个节点流出，流入另一个节点。

(9)跨通信边：每个通信节点对应的跨通信边包括该通信节点对应的前驱节点中任意一个前驱节点到该通信节点对应的后继节点中任意一个后继节点之间的通信路径，且每条跨通信边不经过途中的任何通信节点。

(10)连通块/连通分量：在跨通信边被切割后，计算图会被通信节点形成的屏障阻隔开，此时计算图中计算节点相互连接所构成的子图称为连通块或连通分量。每个连通块包括至少一个计算节点。

(11)命名空间(Name Scope)：深度学习框架在生成神经网络计算图时，会根据计算逻辑将节点分组，为每个节点生成一个命名空间，将计算图数据中的命名空间解析后，可以得到带层次信息的数据流图。

(12)深度学习(Deep Learning)框架：指通过机器学习的算法，在不同的抽象层级上进行多个层次学习的结构，深度学些框架包括PaddlePaddle、Tensorflow、Caffe、Theano、MXNet、Torch和PyTorch等。

下面介绍本申请实施例的系统架构和应用场景

请参见图1，图1为本申请实施例提供的一种系统架构示意图。用于描述计算机设备100的系统架构。如图1所示，计算机设备100的系统架构可以前端110、后端120和设备层130。

可选地，该计算机设备100可以是手机、电脑、平板或服务器等，本申请对此不限定。

可选地，前端110可以包括网页Web页面或应用程序App页面111，二部图构建单元112。二部图构建单元112可以向后端120发出请求，例如，从服务器或主机目录中读取特定格式(例如，json格式等)的计算图数据，然后解析读取的计算图数据，并构建相应的二部图(此过程也是本申请中的主要过程，将在下文的具体实施例中进行展开)；在构建出二部图之后，用户可以在Web页面或者App页面持续进行交互和渲染，来调整和展示二部图的形态，分析对应的模型结构和功能。

可选地，后端120存储有深度学习框架/模型121，用于执行各种深度学习任务，例如图像处理、自然语言处理或其它领域(如科学计算或物理建模等)中的需要进行模型并行训练的任务，本申请对此不限定。此外，后端120可以将存储的深度学习模型转化成特定格式的计算图数据，以供前端110进行读取。在实际处理过程中，对于输入的深度学习模型的计算图，只需要配置统一的计算图数据存储和解析格式，即可采用本申请中的方案进行计算图可视化，即得到深度学习模型对应的二部图。

可选地，设备层130包括处理器131。处理器131可以是多个图形处理器GPU和/或中央处理器(Central Processing Unit，CPU)，用于对深度学习框架/模型121进行并行训练，以及训练结束后的执行。

请参见图2，图2为本申请实施例提供的一种应用场景示意图。应当理解，本申请实施例中的二部图构建方法可应用于包括人工智能(例如图像处理或自然语言处理等)、科学计算等领域中需要利用深度学习模型进行数据处理，且需要对深度学习模型并行训练的场景。

首先，用户基于具体的深度学习任务210构建对应的深度学习模型220，其中，该深度学习任务210可以是图像识别、目标检测、图像分割等图像处理任务或者语音语义识别等自然语言处理任务等，本申请对此不限定；深度学习模型220可以是卷积神经网络模型(Convolutional Neural Network，CNN)、深度信任网络模型(Deep Belief Network，DBN)或堆栈自编码网络模型(Stacked Auto-encoder Network)等。然后并对深度学习模型进行并行训练230，即可以将模型的训练过程拆分到不同的GPU或CPU中并行执行。

进一步地，基于深度学习模型220的训练过程中所形成的计算图数据，利用本申请实施例中的方法进行模型结构可视化240，即构建与计算图数据对应的二部图，并在图形用户界面(Graphic Users Interface，GUI)进行展示。用户基于可视化的二部图快速地定位出通信节点的位置及相应的功能，从而基于此进行并行策略调整250，例如，可以快速确定通信节点的融合/切分策略，从而使得在并行训练过程中通信比最小，即足底啊程度降低训练过程中的通信时长。

在得到训练好的深度学习模型后，进行模型部署260，即将模型部署到各种可行的计算机设备上，例如手机、电脑、服务器等，本申请对此不限定。

请参见图3，图3为本申请实施例中一种二部图构建方法流程示意图。如图3所示，方法300包括步骤S310和步骤S320。

步骤S310：从计算图中搜索出第一通信节点对应的至少一条跨通信边，其中，所述第一通信节点为所述计算图包含的M个通信节点中的一个，所述第一通信节点对应P个前驱节点和Q个后继节点，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱节点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点；M、P和Q为正整数。

其中，上述计算图可以是展开后的计算图，即计算图中的节点为计算节点或者通信节点，且不可再进行展开。上述计算图可以为有向图，即计算图中任意两个直接相连的节点之间的边(或称为数据流)是有方向的，指示该两个节点之间的数据流向。

可选地，每个通信节点对应的前驱节点可以为数据流在流入通信节点之前所经过的所有非通信节点。

可选地，每个通信节点对应的后继节点可以为数据流在流出通信节点之后所经过的所有非通信节点。

具体地，上述第一通信节点对应的前驱节点为在计算图中第一通信节点逻辑顺序之前(即数据流在流入第一通信节点之前经过)的所有计算节点，且不包括第一通信节点本身，共P个。第一通信节点对应的后继节点为在计算图中第一通信节点逻辑顺序之后(即数据流在流出第一通信节点之后经过)的所有计算节点，且不包括第一通信节点本身，共Q个。

可选地，上述从计算图中搜索出第一通信节点对应的至少一条跨通信边，具体为：搜索出P个前驱节点中每个前驱节点到第1、2、3…、Q个后继节点之间，且不经过任何通信节点的通信路径，搜索出的每条通信路径即为一条跨通信边，共搜索出N条跨通信边，N为正整数。应当注意，P个前驱节点中任一前驱节点到Q个后继节点中的任一后继节点之间的跨通信边的数量为大于或等于零的整数。

应当理解，计算图中任意一个通信节点对应的跨通信边的搜索过程与上述第一通信节点对应的跨通信边的搜索过程相同，此处不再赘述。

下面将以图4所示的计算图为例描述搜索通信节点对应的跨通信边的过程。

请参见图4，图4为本申请实施例提供的一种计算图的结构示意图。如图4中所示，计算图400中包含通信节点和计算节点，通信节点用T表示，包括T1、T2和T3；计算节点用J表示，包括J1，J2，…，J10。

对于通信节点T1而言，其对应1个前驱节点：J1；对应4个后继节点：J5、J6、J9和J10。因而，通信节点T1对应的跨通信边共6条，分别为：J1-J2-J5、J1-J2-J5-J6、J1-J2-J5-J6-J9、J1-J2-J5-J6-J9-J10、J1-J2-J4-J8-J10、J1-J2-J3-J7-J10。

对于通信节点T2而言，其对应3个前驱节点：J1、J2和J3；对应2个后继节点：J7和J10。因而，通信节点T2对应的跨通信边共10条，分别为：J3-J7、J3-J7-J10、J2-J3-J7、J2-J3-J7-J10、J2-J4-J8-J10、J2-J5-J6-J9-J10、J1-J2-J3-J7、J1-J2-J5-J6-J9-J10、J1-J2-J4-J8-J10、J1-J2-J3-J7-J10。

对于通信节点T3而言，其对应3个前驱节点：J1、J2和J4；对应2个后继节点：J8和J10。因而，通信节点T3对应的跨通信边共10条，分别为：J4-J8、J4-J8-J10、J2-J4-J8、J2-J4-J8-J10、J2-J5-J6-J9-J10、J2-J3-J7-J10、J1-J2-J4-J8、J1-J2-J5-J6-J9-J10、J1-J2-J4-J8-J10、J1-J2-J3-J7-J10。

可以看出，上述不同通信节点可以对应相同的跨通信边。

综上，在去除不同节点对应的相同跨通信边后，计算图400中的三个通信节点共对应17条跨通信边。

在一种可行实施方式中，所述每条跨通信边包括至少一条子边，所述至少一条子边中的每条子边直接连接两个计算节点；所述至少一条子边中的每条子边对应一个权重系数，所述每条子边对应的一个权重系数由所述每条子边直接连接的两个计算节点的类型决定。

其中，在上述计算图中，子边为直接相连的两个计算节点之间的边，每条跨通信边包括至少一条子边。

其中，计算算子的类型由计算算子的具体功能决定。例如，对于求对数算子Log Operator而言，其功能为进行对数运算。可选地，其类型可以为Log，即每个计算算子的类型由其标识符进行表示。

可选地，用户可以根据每个子边直接连接的两个计算节点的类型来确定连接该两个计算节点的子边的权重系数，本申请对此不进行限定。

例如，对于利用Mindspore框架构建的计算图而言，当计算图中包含依次直接相连的Reshape节点、Tile节点和Mul节点时，由于Reshape节点和Tile节点为进行张量运算的节点，其逻辑相近，而Mul节点为进行数学运算的节点，因此，在进行子边切割时，用户更希望能保留Reshape节点和Tile节点之间相连的子边。此时，可以将Reshape节点和Tile节点之间的子边赋予一个较大的权重系数，将Tile节点和Mul节点之间的子边赋予一个较小的权重系数。

可选地，权重系数可以用于表征对应子边的重要程度。例如，权重系数越大，子边的重要程度越高；或者权重系数越大，子边的重要程度越低。

可选地，所有子边对应的权重系数的值可以位于0和1之间。应当理解，也可以为子边对应权重系数的取值区间也可以是其它取值范围，本申请对此不进行限定。

应当理解，上述计算图中每个通信节点对应的跨通信边所包含的子边的权重系数的确定方式和第一通信节点对应跨通信边所包含的子边的权重系数的确定方式相同，此处不再赘述。

步骤S320：切割所述M个通信节点分别对应的跨通信边，并进行聚合操作，以得到所述二部图，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。

具体地，对计算图中M个通信节点对应的跨通信边进行切割，得到切割后的计算图。其中，切割后的计算图包括K个连通块和M个通信节点，K为正整数。对切割后的计算图进行聚合操作，得到二部图。其中，二部图中所有节点可以划分为两个集合，该两个集合中任一集合中的任意两个节点无边直接相连，该两个集合中的一个集合是由上述M个通信节点构成的集合。

在一种可行实施方式中，所述M个通信节点共对应N条跨通信边，N为正整数；所述切割所述M个通信节点分别对应的跨通信边，包括：切割所述N条跨通信边中的每条跨通信边中的一条子边；其中，当所述N条跨通信边中的E条跨通信边包含共同的子边时，所述E条跨通信边中被切割的所有子边分别对应的权重系数之和最大或者最小，E为小于或等于N的正整数；当所述N条跨通信边中的第i条跨通信边与其它跨通信边不包含共同的子边时，切割所述第i条跨通信边所包含的子边中权重系数最小或者权重系数最大的子边，i为正整数。

应当理解，不同的通信节点可以对应相同的跨通信边，上述M个通信节点共对应的N条跨通信边中不包含相同的跨通信边。

具体地，在对上述M个通信节点对应的跨通信边进行切割时，只切割每条跨通信边中的一条子边，从而确保而后续构建得到的二部图能最大程度地保留计算图中的语义信息。

其中，在对M个通信节点分别对应的跨通信边进行切割时，可以采用下述两种方式中的任意一种进行切割。在全局最优切割方式和局部最优切割方式中，在进行分组后，当每组跨通信边中包含共同子边的跨通信边，其切割方式与上述E条跨通信边的切割方式相同；当分组后的一组中只包含一条跨通信边时，该一条跨通信边的切割方式与上述第i条跨通信边的切割方式相同。

(一)全局最优切割

采用L种分组方式分别对上述N条跨通信边进行分组，每种分组方式对应一个权重系数和一种跨通信边的切割方式。在采用L种分组方式中的任意一种分组方式进行分组后，得到至少一组跨通信边。该至少一组跨通信边中的每组都包含至少一条共同的子边，且每组中包含至少一条跨通信边。其中，L种分组方式的区别在于，在采用不同分组方式分组时依据的共同的子边不同。

下面以L种分组方式中的第a种分组方式为例进行描述其对应的权重系数的确定过程：第a种分组方式将N条跨通信边分为A组。在对每组跨通信边进行切割时，对该组中的每条跨通信边切割一条子边，使得该组中被切割的所有子边分别对应的权重系数之和最大或者最小，将得到的权重系数之和作为该组跨通信边的权重系数。依照上述步骤，可以计算得到A组跨通信边分别对应的A个权重系数，然后将A个权重系数相加，得到第a种划分方式对应的权重系数。

依照上述步骤，可以得到L种分组方式分别对应的L个权重系数，将L个权重系数中最大或者最小的权重系数对应的跨通信边切割方式作为计算图的切割方式，即全局最优切割方式。

(二)局部最优切割

依次切割M个通信节点每个通信节点对应的跨通信边，在切割时，对通信节点的先后顺序不做限定。

搜索出第b个通信节点对应的B条跨通信边，该B条跨通信边中不包括已进行过切割的跨通信边。按照上述全局最优的切割方式，选出B条跨通信边最优的切割方式，该种切割方式使得B条跨通信边中被切割的所有子边分别对应的权重系数之和最大或者最小。

在切割完第b个通信节点对应的B条跨通信边后，开始切割第b+1个通信节点对应的跨通信边，直到切割完上述M个通信节点。

应当理解，采用此种方式可以使得对每个通信节点对应的跨通信边进行切割时，达到最优。用户可以根据具体地场景，选择采用全局最优切割或者局部最优切割的方式来对计算图中的跨通信边进行切割。

下面将以图5(a)-图5(b)为例，来举例描述采用上述全局最优切割方式切割跨通信边的过程；在示例中，以权重系数越高，对应子边的重要程度越高进行描述。图5(a)-图5(b)中的计算图与图4中的计算图相同。

图5(a)-图5(b)为本申请实施例提供的一种跨通信边切割方式示意图。图5(a)和5(b)分别列举了在进行全局最优切割时，两种不同的分组方式分别对应的两种跨通信边的切割方式。应当理解，在搜索示例计算图中的全局最优切割方式时，还会搜索其它的分组方式对应的切割方式，在此不进行一一列举。

在图5(a)中，将计算图中的17条跨通信边分为3组。第一组包含共同的子边J3-J7，包括的跨通信边为：J3-J7、J2-J3-J7、J2-J3-J7-J10、J3-J7-J10、J1-J2-J3-J7-J10。第二组包含共同的子边J4-J8，包括的跨通信边为：J4-J8、J2-J4-J8、J1-J2-J4-J8、J4-J8-J10、J2-J4-J8-J10、J1-J2-J4-J8-J10。第三组包含共同的子边J2-J5，包括的跨通信边为：J1-J2-J5、J1-J2-J5-J6、J1-J2-J5-J6-J9、J1-J2-J5-J6-J9-J10、J2-J5-J6-J9-J10、J1-J2-J5-J6-J9-J10。对上述三组跨通信边分别进行切割，使得每组跨通信边中被切割的所有子边分别对应的权重系数之和最小。

此时，当第一组跨通信边被切割的子边为J3-J7时，可以使得第一组跨通信边被切割的所有子边的权重系数之和最小，第一组跨通信边切割后对应的权重系数为0.3；当第二组跨通信边被切割的子边为J4-J8时，可以使得第二组跨通信边被切割的所有子边的权重系数之和最小，第二组跨通信边切割后对应的权重系数为0.2；当第三组跨通信边被切割的子边为J2-J5时，可以使得第三组跨通信边被切割的所有子边的权重系数之和最小，第三组跨通信边切割后对应的权重系数为0.2。综上，图5(a)所示的分组方式所对应的跨通信边切割方式中，所有被切割子边的权重系数之和为0.7。

在图5(b)中，将计算图中的17条跨通信边分为5组。第一组包含共同的子边J3-J7，包括的跨通信边为：J3-J7、J3-J7-J10。第二组包含共同的子边J4-J8，包括的跨通信边为：J4-J8、J2-J4-J8、J1-J2-J4-J8、J4-J8-J10、J2-J4-J8-J10、J1-J2-J4-J8-J10。第三组包含共同的子边J1-J2，包括的跨通信边为：J1-J2-J5、J1-J2-J5-J6、J1-J2-J5-J6-J9、J1-J2-J5-J6-J9-J10。第四组包含共同的子边J5-J6，包括的跨通信边为：J2-J5-J6-J9-J10、J1-J2-J5-J6-J9-J10。第五组包含共同的子边J2-J3，包括的跨通信边为：J2-J3-J7、J2-J3-J7-J10、J1-J2-J3-J7-J10。

此时，当第一组跨通信边被切割的子边为J3-J7时，可以使得第一组跨通信边被切割的所有子边的权重系数之和最小，第一组跨通信边切割后对应的权重系数为0.3；当第二组跨通信边被切割的子边为J4-J8时，可以使得第二组跨通信边被切割的所有子边的权重系数之和最小，第二组跨通信边切割后对应的权重系数为0.2；当第三组跨通信边被切割的子边为J1-J2时，可以使得第三组跨通信边被切割的所有子边的权重系数之和最小，第三组跨通信边切割后对应的权重系数为0.8；当第四组跨通信边被切割的子边为J5-J6时，可以使得第四组跨通信边被切割的所有子边的权重系数之和最小，第四组跨通信边切割后对应的权重系数为0.4；当第五组跨通信边被切割的子边为J2-J3时，可以使得第五组跨通信边被切割的所有子边的权重系数之和最小，第五组跨通信边切割后对应的权重系数为0.5。

综上，图5(b)所示分组方式所对应的跨通信边切割方式中，所有被切割子边的权重系数之和为2.2。由于图5(a)中所有被切割子边的权重系数之和小于图5(b)中所有被切割子边的权重系数之和，因而图5(a)中跨通信边的切割方式更好。

应当理解，虽然图5(a)和图5(b)只分别列举了在追求全局最优时的两种跨通信边的切割方式，但可以看出，图5(a)中切割子边数量最少，且切割子边对应的权重系数之和也是最小，此时可以将图5(a)中跨通信边切割方式作为计算图的全局最优切割方式。

下面将以图6(a)-图6(c)为例，来举例描述采用上述局部最优切割方式切割跨通信边的过程；在示例中，以权重系数越高，对应子边的重要程度越高进行描述。图6(a)-图6(c)中的计算图与图4中的计算图相同。

图6(a)-图6(c)为本申请实施例提供的另一种跨通信边切割方式示意图。图6(a)和图6(c)分别列举了按照从通信节点T1—通信节点T2—通信节点T3的顺序，依次切割每个通信节点对应的跨通信边的过程。应当理解，图6(a)-图6(c)中的切割顺序只是一个具体示例，本领域技术人员也可采用其它顺序，依次对每个通信节点对应的跨通信边进行切割，本申请对此不进行限定。

图6(a)展示了对通信节点T1对应的跨通信边进行切割的过程。通信节点T1对应的跨通信边共6条，包括：J1-J2-J5、J1-J2-J5-J6、J1-J2-J5-J6-J9、J1-J2-J5-J6-J9-J10、J1-J2-J4-J8-J10、J1-J2-J3-J7-J10。对此6条跨通信边进行切割，使得所有被切割的子边分别对应的权重系数之和最小。可以看出，此6条跨通信边包含一条共同的子边J1-J2，因而当切割子边J1-J2时，权重系数之和最小，为0.8。

图6(b)展示了通信节点T1对应的跨通信边切割后，对通信节点T2对应的跨通信边进行切割的过程。通信节点T2此时对应的跨通信边共6条，包括：J3-J7、J3-J7-J10、J2-J3-J7、J2-J3-J7-J10、J2-J4-J8-J10、J2-J5-J6-J9-J10。按照前述实施例中全局最优切割方式搜索出对此6条跨通信边的最优切割方式，使得6条跨通信边中所有被切割子边的权重系数之和最小。容易理解，可以将此6条跨通信边分为三组，第一组包含四条跨通信边：J3-J7、J3-J7-J10、J2-J3-J7、J2-J3-J7-J10，其包含共同的子边J3-J7。第二组为跨通信边J2-J4-J8-J10。第三组为跨通信边J2-J5-J6-J9-J10。此时，当第一组跨通信边被切割的子边为J3-J7时，可以使得第一组跨通信边被切割的所有子边的权重系数之和最小，第一组跨通信边切割后对应的权重系数为0.3。当第二组跨通信边被切割的子边为J4-J8时，可以使得第二组跨通信边被切割的所有子边的权重系数之和最小，第二组跨通信边切割后对应的权重系数为0.2。当第三组跨通信边被切割的子边为J2-J5时，可以使得第三组跨通信边被切割的所有子边的权重系数之和最小，第三组跨通信边切割后对应的权重系数为0.2。此种全局最优的切割方式下，所有被切割子边分别对应的权重系数之和为0.7。

图6(c)展示了对通信节点T2对应的跨通信边进行切割后得到的计算图。可以看出，通信节点T3对应的跨通信边在前述过程中已全部被切割，因此，图6(c)即为采用局部最优切割方式进行切割后得到的计算图。采用局部最优切割方式进行切割时，所有被切割子边对应的权重之和为1.5。

综上，从图5(a)-图5(b)和图6(a)-图6(c)分别展示的全局最优切割和局部最优切割方式可以看出，采用全局最优切割时，所有被切割子边对应的权重系数之和小于局部最优切割时所有被切割子边对应的权重系数之和，全局最优切割可以最大程度保留计算图中的语义信息。

在一种可行实施方式中，在对跨通信边进行切割后，对所有切割的子边进行标记，使得后续用户对构建好的二部图进行展示过程中，当用户将用户界面的光标等操作按钮移动到子边被切割的计算节点上时，显示该计算节点被切割的子边。

在一种可行实施方式中，切割后的所述计算图包括K个连通块，K为正整数；所述进行聚合操作，得到所述二部图，包括：对所述切割后的所述计算图中的K个连通块分别进行聚合，得到所述二部图；其中，所述K个连通块是基于所述M个通信节点在所述计算图中的位置对所述计算图中的计算节点进行划分得到的，所述二部图包括K个一级聚合节点和所述M个通信节点，所述K个一级聚合节点中任意两个一级聚合节点无边直接相连，且所述K个一级聚合节点分别属于K个命名空间。

其中，切割后的计算图中的计算节点被M个通信节点形成的屏障阻隔开，形成K个连通块，该K个连通块中每个连通块包括至少一个计算节点，具体可参见后文图10(a)-图10(d)所示实施例的详细描述。

请参见图7，图7为本申请实施例提供的一种二部图结构示意图。如图7所示，基于计算图构建得到的二部图中包含K个一级聚合节点和M个通信节点。二部图中所有节点可以分为两个集合，其中一个集合包括所有的通信节点，另一个集合包括所有的一级聚合节点，且该另个集合中任一集合中的任意两个节点之间无边直接相连。如图7所示，K个一级聚合节点中任意两个一级聚合节点之间无边直接相连，且M个通信节点中的任意两个通信节点之间无边直接相连。O个一级聚合节点通过通信节点与K-O个一级聚合节点进行通信。上述对所述切割后的所述计算图中的K个连通块分别进行聚合，得到所述二部图，具体包括：基于每个连通块中计算节点所属命名空间的层级结构，对每个连通块进行聚合，得到与每个连通块对应的一个一级聚合节点，共得到K个一级聚合节点。同时，为该K个一级聚合节点分别构建对应的K个命名空间，即该K个一级聚合节点分别属于K个命名空间。

下面以K个连通块中第一连通块为例来描述，基于第一连通块中计算节点所属命名空间的层级结构对第一连通块进行聚合的过程。其中，第一连通块中的节点属于Z组具有层级结构的命名空间，Z为正整数。

下面以第e组命名空间为例，描述依据其层级结构进行计算节点聚合的过程。具体参见图8，图8为本申请实施例中一种命名空间的层级结构示意图。如图8所示，第e组命名空间具有n个命名空间，分别为：X1、X2、…、Xn。该n个命名空间为可以逐级展开的层级结构：命名空间X1包含命名空间X2，…，命名空间Xn-1包含命名空间Xn。其中，计算节点J11属于命名空间X1；计算节点J12和J13属于命名空间X2；计算节点J14，…，Jd属于命名空间Xn。

然后依据命名空间的层级结构对第e组命名空间中包含的计算节点进行逐层聚合。具体参见图9，图9为本申请实施例提供的一种依据命名空间层级结构进行计算节点的聚合过程示意图。如图9所示，首选从第n层命名空间开始，将属于第n层命名空间的计算节点(J14，…，Jd)进行聚合；然后将得到的聚合节点与属于第n-1层命名空间的计算节点进行聚合；依照此规则逐层聚合，在将第3层命名空间中的节点进行聚合后，得到聚合节点G25；将聚合节点G25与属于第2层命名空间的计算节点进行聚合，得到聚合节点G26，即在对第e组命名空间中包含的计算节点进行聚合后，得到聚合节点G26和计算节点J11。应当注意，在进行节点聚合过程中，还胡同时为聚合节点创建对应的命名空间，如图9所示，为聚合节点G26创建的命名空间为Xg26，为聚合节点G25创建的命名空间为Xg25。命名空间Xg26与命名空间X1同为第一层命名空间，命名空间Xg25与命名空间X2同为第二层命名空间。

按照上述第e组命名空间中包含计算节点的聚合过程，对每组命名空间中包含计算节点进行聚合，得到Z组聚合结果，该Z组聚合结果中包含的节点属于同一层；最后将该Z组聚合结果进行聚合，得到第一连通块对应的一个一级聚合节点，并同时为该一级聚合节点创建对应的命名空间。

同理，可以参照第一连通块的聚合方式对K个连通块中每个连通块进行聚合，得到K个一级聚合节点。

在一种可行实施方式中，所述K个一级聚合节点中的每个一级聚合节点为层级结构，其中，所述层级结构中的第j层中的节点是由所述层级结构中第j-1层中的聚合节点展开得到的，所述层级结构中的第一层为所述一级聚合节点，所述第j层中的节点分别属于不同的命名空间；所述第j层中的节点包括聚合节点和/或计算节点，所述计算节点为不可展开的节点。

由上述对第一连通块进行聚合的过程可知，每个一级聚合节点都为层级结构，且层级结构中的每层中的节点是由上一层中的聚合节点展开得到的，一级聚合节点为其层级结构中的第一层，即层级结构中的最上层。其中，展开为聚合的逆过程。聚合指将至少一个节点和该至少一个节点之间的边所表示的图结构用一个节点进行表示。展开指通过至少一个节点和该至少一个节点之间的边所构成的图结构来表示一个节点。

其中，层级结构每层中节点分别属于不同的命名空间，该不同的命名空间在命名空间的层级结构中属于同一层。每层中节点可以只包括聚合节点，或者只包括计算算，或者包括聚合节点和计算节点。

其中，聚合节点为可以进行展开的节点，计算节点为计算图中不可展开的最小单元。

在一种可行实施方式中，所述方法还包括：当第一命名空间中第一计算节点和第二计算节点之间的子边被切割时，更新所述第一命名空间，所述第一命名空间为所述计算图中的命名空间；构建包含第一计算节点的命名空间，所述第一计算节点不属于更新后的所述第一命名空间。

其中，第一命名空间为计算图中的任意一个命名空间。第一计算节点和第二计算节点为第一命名空间中任意两个计算节点。

具体地，在对计算图中的跨通信边进行切割后，第一计算节点和第二计算节点之间的子边被切割，此时，第一计算节点和第二计算节点在计算图切割后属于不同的连通块。在切割后，第一计算节点不属于第一命名空间，第二计算节点仍属于第一命名空间。此时由于第一命名空间中计算节点的数量发生了变化，可以更新第一命名空间对应的属性，包括第一命名空间的标识符和包含的计算节点的数量等。同时，可以为第一计算节点构建对应的命名空间，为第一计算节点构建的命名空间的层级结构与第二计算节点属于命名空间的层级结构相同。例如，若第二计算节点属于三层命名空间中第三命名空间中，则此时可以为第一计算节点构建一个三层命名空间，且第一计算节点属于该三层命名空间中的第三层命名空间，此时，第一计算节点和第二计算节点所属的命名空间的标识符不同。

可选地，命名空间的标识符可以由字母、数字或字母和数字的组合，或其它字符进行表征，本申请对此不限定。

下面将以图10(a)-图10(d)为例，详细描述对切割跨通信边后的计算图中的连通块进行聚合，得到相应二部图的过程。

请参见图10(a)-图10(d)，图10(a)-图10(d)为本申请实施例提供的一种连通块聚合过程实例图。

其中，图10(a)为进行跨通信边切割后，得到的切割后的计算图。图10(a)是基于图5(a)中的全局最优切割方式进行切割后得到的结果。如图10(a)所示，计算图在进行切割后，所有的计算节点被通信节点阻隔开，形成了两个连通块V1和连通块V2，即切割后的计算图中包括两个连通块(V1和V2)和三个计算节点(T1、T2和T3)。

图10(b)展示了计算图中命名空间的层级结构，以及每个节点所属于的命名空间。如图10(b)所示，计算图对应的命名空间的层级结构为两层。其中，第一层命名空间包括：命名空间D1、命名空间H1和命名空间R1。命名空间D1没有子命名空间，命名空间H1包含命名空间H2，命名空间R1包含命名空间R2，即命名空间H2和命名空间R2分别为命名空间S1和命名空间R1的子命名空间。其中，计算节点J1和通信节点T1属于命名空间D1；通信节点T2、通信节点T3和计算节点J2属于命名空间H1；计算节点J3、计算节点J4和计算节点J5属于命名空间H2；计算节点J6和计算节点J7属于命名空间R1；计算节点J8、计算节点J9和计算节点J10属于命名空间R2。

图10(c)展示了图10(a)中连通块V1和V2的聚合过程。其中，虚线框树状图表示命名空间的层级结构，实现框树状图表示一级聚合节点的层级结构。

在对连通块V1进行聚合的过程中，由于计算节点J5被切割出命名空间H2，此时可以将命名空间H2标识符更新为H2_1，计算节点J3和计算节点J4属于命名空间H2_1。此时，连通块V1对应两组层级结构的命名空间，分别为：D1、H1-H2。依照命名空间的层级结构进行聚合：首先将计算节点J3和计算节点J4聚合为聚合节点G2，聚合节点G2属于命名空间H1，由于H1中节点数量发生变化，可以将命名空间H1标识符更新为H1_1；最后将同属于第一层命名空间的三个节点(计算节点J1、计算节点J2和聚合节点G2)进行聚合，得到连通块V1对应的一级聚合节点G1，并为其构建对应的命名空间U。

在对连通块V2进行聚合的过程中，由于在进行跨通信边切割后，计算节点J5不属于命名空间H2，此时可以依据计算节点J5在切割前对应的命名空间构建新的层级命名空间，即两层命名空间H1_2-H2_2，计算节点J5属于命名空间H2_2。此时，连通块V2对应两组层级结构的命名空间，分别为：H1_2-H2_2、R1-R2。依照命名空间的层级结构进行聚合：首先将计算节点J8、计算节点J9和计算节点J10聚合为聚合节点G4，聚合节点G4和计算节点J6、计算节点J7同属于命名空间R1，此时可以将命名空间R1标识符更新为R1_1；同时，对计算节点J5进行聚合，得到聚合节点G5，聚合节点G5属于命名空间H1_2；最后将属于同一层命名空间的四个节点(聚合节点G5、聚合节点G4和计算节点J6、计算节点J7)进行聚合，得到连通块V2对应的一级聚合节点G6，并未其构建对应的命名空间S。

图10(d)展示进行连通块聚合后，得到的二部图。如图10(d)所示，连通块V1聚合后得到一级聚合节点G1，连通块V2聚合后得到一级聚合节点G6，G1和G6通过三个通信节点(T1、T2和T3)进行通信。三个通信节点中的任意两个无边直接相连，且两个一级聚合节点之间也无边直接相连。

在一种可行实施方式中，所述方法还包括：计算所述二部图中聚合节点的哈希值，以及计算节点的哈希值；其中，当所述节点为所述聚合节点时，所述节点的哈希值等于所述聚合节点展开得到的各节点的哈希值之和，当所述节点为所述计算节点时，所述节点的哈希值由所述计算节点的属性决定，所述计算节点的属性包括所述计算节点的类型、入度、出度、附属节点的类型、附属节点的数量。

其中，上述计算上述一级聚合节点层级结构中聚合节点的哈希值，以及计算节点的哈希值，包括：从层级结构的底层开始，逐层往上，依次计算每层中所有节点对应的哈希值，直到最后计算得到一级聚合节点的哈希值。对于聚合节点而言，其哈希值等于其在进行一次展开后，得到的所有节点的哈希值之和；对于计算节点而言，其哈希值由该计算节点的属性决定。

可选地，计算节点的属性包括计算节点的类型、入度、出度、附属节点的类型、附属节点的数量等，本申请对此不进行限定。进一步，可选地，计算节点的类型用该节点的标识符进行表征，例如Add节点用add表征，Reduce节点用reduce进行表征；计算节点的入度为直接流入该计算节点的数量；出度为从该计算节点流出后，直接流入的节点的数量；计算节点的附属节点为数据只输入到该计算节点的节点，且附属节点无数据输入，附属节点的类型为可以为常量或者变量，可以分别用字符串Const和Para表示，本申请对此不限定。

可选地，在确定计算节点对应的哈希值过程中，可以将表征每个计算节点属性的字符串进行拼接，得到一个字符串；然后采用DJB哈希算法(或称为Times33算法)等将该一个字符串映射为对应的哈希值。

在一种可行实施方式中，所述方法还包括：对所述二部图中的多个节点进行堆叠展示，其中，所述多个节点是由同一所述聚合节点展开一次后得到的，所述多个节点的哈希值相同，且所述多个节点串行连接或并行连接。可选地，堆叠展示指在二部图中，用连接关系标识以及数字标识构成的堆叠结构来显示满足上述条件的多个节点；其中，连接关系标识用于表征该多个节点之间的连接关系，例如为并行连接或串行连接；数字标识表示满足上述条件的多个节点的数量。上述条件指由同一所述聚合节点展开一次后得到、哈希值相同，且连接关系为串行连接或并行连接的多个节点。

具体地，对每个一级聚合节点按照从上层到下层(即从层级结构的第一层开始)的顺序，逐层进行检测，当第一聚合节点进行一次展开后，得到的节点数量大于或等于预设数量时，对展开后得到的节点进行同构检测，具体地：检测展开后得到的节点中是否存在哈希值相同的节点。其中，第一聚合节点为一级聚合节点层级结构中的任意一层中的一个聚合节点。

在检测到展开后的节点中存在哈希值相同的多个节点，且该多个节点之间的连接关系为并行连接或者串行连接时，对该多个节点进行堆叠展示。其中，将哈希值相同的多个节点作为内部结构相同的节点。其中，串行连接指该多个节点依次连接，数据流起始的节点与数据流终止的节点之间只有一条通信路径。并行连接指多个节点中所有节点的输入数据流是由同一节点流出，中间不经过任何节点；且该多个节点中所有节点的输出数据流流入同一节点，中间也不经过任何节点。可选地，用户可以采用双击或单击等操作对该同一聚合节点进行操作，以对该同一聚合节点进行展开，该同一聚合节点展开后，即得到堆叠展示的多个节点。通过进行堆叠展示，可以使得在用户进行二部图可视化时，简化聚合节点的层级结构，节省用户界面空间，有利于用户更加快速了解聚合节点的内部结构。

请参见图11，图11为本申请实施例提供的一种节点串行连接和并行连接的结构示意图。如图11所示，节点1-5为哈希值相同的五个节点，即同构节点。在进行串行结构检测时，遍历该5个节点所连的边，检测到节点1和节点3之间只有一条通信路径，即节点1、节点2和节点3为串行的3个节点，可以对其进行堆叠展示。在进行并行结构检测时，以节点4和节点5作为起点，分别进行前向搜索和后向搜索。在进行前向搜索时，发现节点4和节点5到聚合节点Fhub处汇聚，在进行后项搜索时，发现节点4和节点5到聚合节点Bhub处汇聚，则节点4和节点5为并行连接，同样可以对节点4和节点5进行堆叠展示。

请参见图12(a)-图12(b)，图12(a)-图12(b)为本申请实施例提供的一种堆叠的聚合节点展开过程示意图。

图12(a)为串行结构堆叠的聚合节点可视化展开过程示意图。如图12(a)所示，节点J20、堆叠结构W1和节点J21可以为第二聚合节点进行一次展开后的展开结果，第二聚合节点可以是任一一级聚合节点的任一层中的节点。由于第二聚合节点展开后得到的节点中存在可以堆叠的子结构(即哈希值相同的节点)，可以采用堆叠结构W1进行展示。堆叠结构W1中的标识1为连接关系标识，表示堆叠结构W1中堆叠的节点为串行结构，堆叠结构W1中的数字n1表示进行堆叠的同构节点的数量。用户可以采用单击或双击等操作来进一步展开该堆叠结构W1，得到堆叠结构W2。堆叠结构W2可以展示单个同构节点的内部结构。用户还可以进一步对堆叠结构W2进行展开，得到堆叠结构W2的全展开示意图，即展示n1个串行连接的同构节点的实际连接关系。在可视化过程中，该串行连接的同构节点可以用相同的颜色进行展示。

图12(b)为并行结构堆叠的聚合节点可视化展开过程示意图。如图12(b)所示，节点J22、堆叠结构W3和节点J23可以为第三聚合节点进行一次展开后的展开结果，第三聚合节点可以是任一一级聚合节点的任一层中的节点。由于第三聚合节点展开后得到的节点中存在可以堆叠的子结构(即哈希值相同的节点)，可以采用堆叠结构W3进行展示。堆叠结构W3中的标识2为连接关系标识，表示堆叠结构W3中堆叠的节点为并行结构，堆叠结构W3中的数字n2表示进行堆叠的同构节点的数量。用户可以采用单击或双击等操作来进一步展开该堆叠结构W3，得到堆叠结构W4。堆叠结构W4可以展示单个同构节点的内部结构。用户还可以进一步对堆叠结构W4进行展开，得到堆叠结构W4的全展开示意图，即展示n2个并行连接的同构节点的实际连接关系。在可视化过程中，该并行连接的同构节点可以用相同的颜色进行展示。

应当理解，在实际应用过程中，也可采用其它连接关系标识来表征串行连接和并行连接的堆叠，本申请对此不限定。

请参见图13(a)-图13(b)，图13(a)-图13(b)为本申请实施例提供的一种模型训练过程的时间线示例。在实际应用过程中，用户可以基于本方案构建出各种深度学习任务的二部图，二部图可以清晰地呈现模型的结构，从而使得用户基于二部图快速定位通信节点的位置和功能，进而制定通信节点的融合/切分策略，尽可能地降低训练过程中的通信时长。

在一种可能的场景下，用户可以查看模型训练过对应的时间线Timeline，观察通信时间和计算时间之间的重叠，找到计算和通信之间不重叠的通信节点，然后在基于本方案构建出的二部图中快速定位通信节点，并根据具体地图结构分析通信节点的作用，从而制定合理的通信节点融合/切分策略，使得不同深度学习任务对应的模型训练过程的时长。

举例来说，在采用Mindspore训练残差网络ResNet-50，发现训练过程对应的timeline中，通信节点AllReduce的通信时长与计算节点对应计算时长之间不存在重叠Overlap，迭代拖尾时间较长，timeline如图13(a)所示，第一层为计算节点对应的计算时长，第二层为通信节点对应的通信时长。在将残差网络对应的训练过程构建成相应的二部图后，可以快速且清晰地发现框架自动将所有用于反向梯度聚合的162个通信节点AllReduce融合成了一个节点，因而导致了timeline中的通信时长和计算时长之间不存在重叠。此时，对融合后的通信节点进行切分，将前55个通信节点融合成1个，将第55-108个通信节点融合成1个，将第109-162通信节点融合成一个，重新进行训练，得到的训练过程timeline，如图13(b)所示。可以看出，在对通信节点进行切分后，计算时长与通信时长之间产生重叠。且相对于通信节点切分前梯度计算及融合的过程耗时t1，在进行通信节点切分后，梯度计算及融合的过程耗时t2明显缩短。

请参见图14，图14为本申请实施例中一种二部图显示方法流程示意图。如图14所示，方法1400包括步骤S1410。

步骤S1410：输入计算图，基于所述计算图输出所述二部图。

其中，所述计算图包括M个通信节点，所述M个通信节点中的第一通信节点对应P个前驱节点和Q个后继节点，所述第一通信节点对应至少一条跨通信边，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱结点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点，P、Q和M为正整数，所述M个通信节点分别对应的跨通信边在所述二部图中不连通，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。

具体地，上述方法实施例1400中基于计算图得到二部图的具体过程与上述方法实施例300中的对应过程相同，此处不再赘述。

请参见图15，图15为本申请实施例提供的一种二部图构建装置结构示意图。如图15所示，二部图构建装置1500包括搜索单元1501和切割单元1502。

搜索单元1501，用于从计算图中搜索出第一通信节点对应的至少一条跨通信边，其中，所述第一通信节点为所述计算图包含的M个通信节点中的一个，所述第一通信节点对应P个前驱节点和Q个后继节点，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱节点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点；M、P和Q为正整数。切割单元1502，用于切割所述M个通信节点分别对应的跨通信边，并进行聚合操作，得到所述二部图，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。

在一种可行的实施方式中，所述M个通信节点共对应N条跨通信边，N为正整数；在所述切割所述M个通信节点分别对应的跨通信边的方面，所述切割单元1502具体用于：切割所述N条跨通信边中的每条跨通信边中的一条子边；其中，当所述N条跨通信边中的E条跨通信边包含共同的子边时，所述E条跨通信边中被切割的所有子边分别对应的权重系数之和最大或者最小，E为小于或等于N的正整数；当所述N条跨通信边中的第i条跨通信边与其它跨通信边不包含共同的子边时，切割所述第i条跨通信边所包含的子边中权重系数最小或者权重系数最大的子边，i为正整数。

在一种可行的实施方式中，切割后的所述计算图包括K个连通块，K为正整数；在所述进行聚合操作，得到所述二部图的方面，所述切割单元1502具体用于：对所述切割后的所述计算图中的K个连通块分别进行聚合，得到所述二部图；其中，所述K个连通块是基于所述M个通信节点在所述计算图中的位置对所述计算图中的计算节点进行划分得到的，所述二部图包括K个一级聚合节点和所述M个通信节点，所述K个一级聚合节点中任意两个一级聚合节点无边直接相连，且所述K个一级聚合节点分别属于K个命名空间。

请参见图16，图16为本申请实施例中一种二部图显示装置的结构示意图。如图16所示，装置1600包括输入单元1601和显示单元1602。

输入单元1601，用于输入计算图；显示单元1602，用于基于所述计算图显示所述二部图；其中，所述计算图包括M个通信节点，所述M个通信节点中的第一通信节点对应P个前驱节点和Q个后继节点，所述第一通信节点对应至少一条跨通信边，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱结点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点，P、Q和M为正整数，所述M个通信节点分别对应的跨通信边在所述二部图中不连通，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。

其中，上述C个计算节点为图3方法实施例计算图中包含的计算节点。

具体地，上述二部图显示装置1600中基于计算图得到二部图的具体过程与方法实施例1400中二部图的构建过程对应相同，此处不再赘述。

这里的装置1500和装置1600以功能单元的形式体现。这里的术语“单元”可以指应用特有集成电路(application specific integrated circuit，ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。在一个可选例子中，本领域技术人员可以理解，装置1500和装置1600可以用于分别执行与上述方法实施例300、方法实施例1400中对应的各个流程和/或步骤，为避免重复，在此不再赘述。

请参见图17，图17为本申请实施例中一种二部图构建装置的硬件结构示意图。如图17所示，装置1700可以包括：存储器1701、一个或多个(图中仅示出一个)处理器1702、接口电路1703以及总线1704。其中，存储器1701、处理器1702、接口电路1703通过总线1704实现彼此之间的通信连接。

存储器1701，用于存储指令，该处理器1702用于调用该存储器1701中存储的指令。

处理器1702具体用于获取计算机程序，以执行实施例300中对应的二部图构建方法。

本申请实施例的二部图构建装置，可以将计算图中的通信节点抽提至二部图的顶层，可以清晰展示模型结构，从而快速直观地定位通信节点的位置和功能，进而为后续并行策略的设计提供依据。

应理解，装置1700可以具体为计算机，并且其可以用于执行上述方法实施例300中的各个步骤和/或流程。

存储器1701可以是只读存储器(read only memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(random access memory，RAM)。存储器1701可以存储程序，当存储器1701中存储的程序被处理器1702执行时，处理器1702和接口电路1703用于执行本申请实施例的二部图构建方法的各个步骤。

处理器1702可以采用通用的中央处理器(central processing unit，CPU)，微处理器，应用专用集成电路(application specific integrated circuit，ASIC)，图形处理器(graphics processing unit，GPU)或者一个或多个集成电路，用于执行相关程序，以实现本申请实施例的二部图构建装置中的单元所需执行的功能，或者执行本申请方法实施例的二部图构建方法。

处理器1702还可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，本申请的二部图构建方法的各个步骤可以通过处理器1702中软件形式的指令完成。上述的处理器1702还可以是通用处理器、数字信号处理器(digital signal processing，DSP)、专用集成电路(ASIC)、现成可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1701，处理器1702读取存储器1701中的信息，结合其硬件完成本申请实施例的二部图构建装置中包括的单元所需执行的功能，或者执行本申请方法实施例的二部图构建方法。

接口电路1703使用例如但不限于收发器一类的收发装置，来实现装置1700与其他设备或通信网络之间的通信。例如，可以通过接口电路1703获取程序。

总线1704可包括在装置1700各个部件(例如，存储器1701、处理器1702、接口电路1703)之间传送信息的通路。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述二部图构建方法实施例300中的对应过程，在此不再赘述。

请参见图18，图18为本申请实施例中一种二部图显示装置的硬件结构示意图。如图18所示，装置1800可以包括：存储器1801、一个或多个(图中仅示出一个)处理器1802、接口电路1803以及总线1804。其中，存储器1801、处理器1802、接口电路1803通过总线1804实现彼此之间的通信连接。

存储器1801，用于存储指令，该处理器1802用于调用该存储器1801中存储的指令。

处理器1802具体用于获取计算机程序，以执行实施例1400中对应的二部图显示方法。

本申请实施例的二部图显示装置，可以基于方法实施例1400中的二部图显示方法，对计算图进行处理，输出对应的二部图。输出的二部图可以清晰展示对应深度学习模型的模型结构，从而快速直观地定位通信节点的位置和功能，进而为后续并行策略的设计提供依据。

应理解，装置1800可以具体为计算机，并且其可以用于执行上述方法实施例1400中的各个步骤和/或流程。

存储器1801可以是只读存储器(read only memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(random access memory，RAM)。存储器1801可以存储程序，当存储器1801中存储的程序被处理器1802执行时，处理器1802和接口电路1803用于执行本申请实施例的二部图显示方法的各个步骤。

处理器1802可以采用通用的中央处理器(central processing unit，CPU)，微处理器，应用专用集成电路(application specific integrated circuit，ASIC)，图形处理器(graphics processing unit，GPU)或者一个或多个集成电路，用于执行相关程序，以实现本申请实施例的二部图显示装置中的单元所需执行的功能，或者执行本申请方法实施例的二部图显示方法。

处理器1802还可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，本申请的二部图显示方法中的各个步骤可以通过处理器1802中软件形式的指令完成。上述的处理器1802还可以是通用处理器、数字信号处理器(digital signal processing，DSP)、专用集成电路(ASIC)、现成可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1801，处理器1802读取存储器1801中的信息，结合其硬件完成本申请实施例的二部图显示装置中包括的单元所需执行的功能，或者执行本申请方法实施例的二部图显示方法。

接口电路1803使用例如但不限于收发器一类的收发装置，来实现装置1800与其他设备或通信网络之间的通信。例如，可以通过接口电路1803获取程序。

总线1804可包括在装置1800各个部件(例如，存储器1801、处理器1802、接口电路1803)之间传送信息的通路。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述二部图显示方法实施例1400中的对应过程，在此不再赘述。

本申请实施例提供了一种计算机可读存储介质，所述计算机存储可读介质存储有计算机程序，该计算机程序被执行时，使得上述二部图构建方法实施例和/或二部图显示方法实施例中记载的任意一种的部分或全部步骤得以实现。

本申请实施例提供了一种计算机程序，该计算机程序包括指令，当该计算机程序被处理器执行时，使得上述二部图构建方法实施例和/或二部图显示方法实施例中记载的任意一种的部分或全部步骤得以实现。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可能可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种二部图的构建方法，其特征在于，所述方法包括：

从计算图中搜索出第一通信节点对应的至少一条跨通信边，其中，所述第一通信节点为所述计算图包含的M个通信节点中的一个，所述第一通信节点对应P个前驱节点和Q个后继节点，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱节点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点，M、P和Q为正整数；

切割所述M个通信节点分别对应的跨通信边，并进行聚合操作，以得到所述二部图，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。
根据权利要求1所述的方法，其特征在于，

所述每条跨通信边包括至少一条子边，所述至少一条子边中的每条子边直接连接两个计算节点；

所述至少一条子边中的每条子边对应一个权重系数，所述每条子边对应的一个权重系数由所述每条子边直接连接的两个计算节点的类型决定。
根据权利要求2所述的方法，其特征在于，所述M个通信节点共对应N条跨通信边，N为正整数；所述切割所述M个通信节点分别对应的跨通信边，包括：

切割所述N条跨通信边中的每条跨通信边中的一条子边；

其中，当所述N条跨通信边中的E条跨通信边包含共同的子边时，所述E条跨通信边中被切割的所有子边分别对应的权重系数之和最大或者最小，E为小于或等于N的正整数；当所述N条跨通信边中的第i条跨通信边与其它跨通信边不包含共同的子边时，切割所述第i条跨通信边所包含的子边中权重系数最小或者权重系数最大的子边，i为正整数。
根据权利要求1-3中任一项所述的方法，其特征在于，切割后的所述计算图包括K个连通块，K为正整数；所述进行聚合操作，得到所述二部图，包括：

对所述切割后的所述计算图中的K个连通块分别进行聚合，得到所述二部图；

其中，所述K个连通块是基于所述M个通信节点在所述计算图中的位置对所述计算图中的计算节点进行划分得到的，所述二部图包括K个一级聚合节点和所述M个通信节点，所述K个一级聚合节点中任意两个一级聚合节点无边直接相连，且所述K个一级聚合节点分别属于K个命名空间。
根据权利要求4所述的方法，其特征在于，

所述K个一级聚合节点中的每个一级聚合节点为层级结构，其中，所述层级结构中第j层中的节点是由所述层级结构中第j-1层中的聚合节点展开得到的，所述层级结构中的第一层为所述一级聚合节点，所述第j层中的节点分别属于不同的所述命名空间，j为正整数；

所述第j层中的节点包括聚合节点和/或计算节点，所述计算节点为不可展开的节点。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

当第一命名空间中第一计算节点和第二计算节点之间的子边被切割时，更新所述第一命名空间，所述第一命名空间为所述计算图中的命名空间；

构建包含所述第一计算节点的命名空间，所述第一计算节点不属于更新后的所述第一命名空间。
根据权利要求5或6所述的方法，其特征在于，所述方法还包括：

计算所述二部图中聚合节点的哈希值，以及计算节点的哈希值；

其中，当所述节点为所述聚合节点时，所述节点的哈希值等于所述聚合节点展开得到的各节点的哈希值之和，当所述节点为所述计算节点时，所述节点的哈希值由所述计算节点的属性决定，所述计算节点的属性包括所述计算节点的类型、入度、出度、附属节点的类型和附属节点的数量。
根据权利要求7所述的方法，其特征在于，所述方法还包括：

对所述二部图中的多个节点进行堆叠展示；

其中，所述多个节点是由同一所述聚合节点展开一次后得到的，所述多个节点的哈希值相同，且所述多个节点串行连接或并行连接。
一种二部图的显示方法，其特征在于，所述方法包括：

输入计算图，基于所述计算图输出所述二部图；

其中，所述计算图包括M个通信节点，所述M个通信节点中的第一通信节点对应P个前驱节点和Q个后继节点，所述第一通信节点对应至少一条跨通信边，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱结点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点，P、Q和M为正整数，所述M个通信节点分别对应的跨通信边在所述二部图中不连通，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。
根据权利要求9所述的方法，其特征在于，

所述计算图包括C个计算节点，所述二部图包括K个一级聚合节点；

其中，所述K个一级聚合节点是由所述C个计算节点进行聚合得到的，所述K个一级聚合节点中的每个一级聚合节点为层级结构，其中，所述层级结构中第j层中的节点是由所述层级结构中第j-1层中的聚合节点展开得到的，所述层级结构中的第一层为所述一级聚合节点，所述第j层中的节点分别属于不同的命名空间，C、K和j为正整数，所述第j层中的节点包括所述聚合节点和/或所述计算节点，所述计算节点为不可展开的节点。
根据权利要求10所述的方法，其特征在于，

所述二部图包括堆叠结构；

其中，所述堆叠结构包括连接关系标识和数量标识，所述连接关系标识表征多个节点之间的连接关系，所述数量标识表征所述多个节点的数量，所述多个节点是由同一所述聚合节点展开一次后得到的，所述多个节点的哈希值相同，且所述多个节点之间的连接关系为串行连接或并行连接。
根据权利要求11所述的方法，其特征在于，

当所述节点为所述聚合节点时，所述节点的哈希值等于所述聚合节点展开得到的各节点的哈希值之和，当所述节点为所述计算节点时，所述节点的哈希值由所述计算节点的属性决定，所述计算节点的属性包括所述计算节点的类型、入度、出度、附属节点的类型和附属节点的数量。
一种二部图的构建装置，其特征在于，所述装置包括：

搜索单元，用于从计算图中搜索出第一通信节点对应的至少一条跨通信边，其中，所述第一通信节点为所述计算图包含的M个通信节点中的一个，所述第一通信节点对应P个前驱节点和Q个后继节点，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱节点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点，M、P和Q为正整数；

切割单元，用于切割所述M个通信节点分别对应的跨通信边，并进行聚合操作，以得到所述二部图，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。
根据权利要求13所述的装置，其特征在于，

所述每条跨通信边包括至少一条子边，所述至少一条子边中的每条子边直接连接两个计算节点；

所述至少一条子边中的每条子边对应一个权重系数，所述每条子边对应的一个权重系数由所述每条子边直接连接的两个计算节点的类型决定。
根据权利要求13或14所述的装置，其特征在于，所述M个通信节点共对应N条跨通信边，N为正整数；在所述切割所述M个通信节点分别对应的跨通信边的方面，所述切割单元具体用于：

切割所述N条跨通信边中的每条跨通信边中的一条子边；

其中，当所述N条跨通信边中的E条跨通信边包含共同的子边时，所述E条跨通信边中被切割的所有子边分别对应的权重系数之和最大或者最小，E为小于或等于N的正整数；当所述N条跨通信边中的第i条跨通信边与其它跨通信边不包含共同的子边时，切割所述第i条跨通信边所包含的子边中权重系数最小或者权重系数最大的子边，i为正整数。
根据权利要求13-15中任一项所述的装置，其特征在于，切割后的所述计算图包括K个连通块，K为正整数；在所述进行聚合操作，得到所述二部图的方面，所述切割单元具体用于：

对所述切割后的所述计算图中的K个连通块分别进行聚合，得到所述二部图；

其中，所述K个连通块是基于所述M个通信节点在所述计算图中的位置对所述计算图中的计算节点进行划分得到的，所述二部图包括K个一级聚合节点和所述M个通信节点，所述K个一级聚合节点中任意两个一级聚合节点无边直接相连，且所述K个一级聚合节点分别属于K个命名空间。
根据权利要求16所述的装置，其特征在于，

所述K个一级聚合节点中的每个一级聚合节点为层级结构，其中，所述层级结构中的第j层中的节点是由所述层级结构中第j-1层中的聚合节点展开得到的，所述层级结构中的第一层为所述一级聚合节点，所述第j层中的节点分别属于不同的所述命名空间，j为正整数；

所述第j层中的节点包括所述聚合节点和/或所述计算节点，所述计算节点为不可展开的节点。
根据权利要求17所述的装置，其特征在于，所述装置还包括：

更新单元，用于当第一命名空间中第一计算节点和第二计算节点之间的子边被切割时，更新所述第一命名空间，所述第一命名空间为所述计算图中的命名空间；

重建单元，用于构建包含所述第一计算节点的命名空间，所述第一计算节点不属于更新后的所述第一命名空间。
根据权利要求17或18所述的装置，其特征在于，所述装置还包括：

计算单元，用于计算所述二部图中聚合节点的哈希值，以及计算节点的哈希值；

其中，当所述节点为所述聚合节点时，所述节点的哈希值等于所述聚合节点展开得到的各节点的哈希值之和，当所述节点为所述计算节点时，所述节点的哈希值由所述计算节点的属性决定，所述计算节点的属性包括所述计算节点的类型、入度、出度、附属节点的类型和附属节点的数量。
根据权利要求19所述的装置，其特征在于，所述装置还包括：

堆叠单元，用于对所述二部图中的多个节点进行堆叠展示；

其中，所述多个节点是由同一所述聚合节点展开一次后得到的，所述多个节点的哈希值相同，且所述多个节点串行连接或并行连接。
一种二部图显示装置，其特征在于，所述装置包括：

输入单元，用于输入计算图；

显示单元，用于基于所述计算图显示所述二部图；

其中，所述计算图包括M个通信节点，所述M个通信节点中的第一通信节点对应P个前驱节点和Q个后继节点，所述第一通信节点对应至少一条跨通信边，所述至少一条跨通信边中的每条跨通信边指示所述P个前驱节点中一个前驱结点和所述Q个后继节点中一个后继节点之间的通信路径，且所述每条跨通信边不经过所述M个通信节点，P、Q和M为正整数，所述M个通信节点分别对应的跨通信边在所述二部图中不连通，所述M个通信节点中的任意两个通信节点在所述二部图中无边直接相连。
根据权利要求21所述的装置，其特征在于，

所述计算图包括C个计算节点，所述二部图包括K个一级聚合节点；

其中，所述K个一级聚合节点是由所述C个计算节点进行聚合得到的，所述K个一级聚合节点中的每个一级聚合节点为层级结构，其中，所述层级结构中第j层中的节点是由所述层级结构中第j-1层中的聚合节点展开得到的，所述层级结构中的第一层为所述一级聚合节点，所述第j层中的节点分别属于不同的命名空间，C、K和j为正整数，所述第j层中的节点包括所述聚合节点和/或所述计算节点，所述计算节点为不可展开的节点。
根据权利要求22所述的装置，其特征在于，

所述二部图包括堆叠结构；

其中，所述堆叠结构包括连接关系标识和数量标识，所述连接关系标识表征多个节点之间的连接关系，所述数量标识表征所述多个节点的数量，所述多个节点是由同一所述聚合节点展开一次后得到的，所述多个节点的哈希值相同，且所述多个节点之间的连接关系为串行连接或并行连接。
根据权利要求23所述的装置，其特征在于，

当所述节点为所述聚合节点时，所述节点的哈希值等于所述聚合节点展开得到的各节点的哈希值之和，当所述节点为所述计算节点时，所述节点的哈希值由所述计算节点的属性决定，所述计算节点的属性包括所述计算节点的类型、入度、出度、附属节点的类型和附属节点的数量。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，该计算机程序被执行时，权利要求1-12中任意一项所述的方法得以实现。
一种计算机程序，其特征在于，该计算机程序包括指令，当该计算机程序被执行时，权利要求1-12中任意一项所述的方法得以实现。