CN111694617A

CN111694617A - 网络离线模型的处理方法、人工智能处理装置及相关产品

Info

Publication number: CN111694617A
Application number: CN202010422462.8A
Authority: CN
Inventors: 不公告发明人
Original assignee: Cambricon Technologies Corp Ltd
Current assignee: Cambricon Technologies Corp Ltd
Priority date: 2018-12-29
Filing date: 2018-12-29
Publication date: 2020-09-22
Anticipated expiration: 2038-12-29
Also published as: CN109754072B; CN111694617B; US11699073B2; CN109754072A; US20200210829A1

Abstract

本申请公开了一种网络离线模型的处理方法、人工智能处理装置及相关产品，其中，相关产品包括组合处理装置，所述组合处理装置包括该人工智能处理装置，通用互联接口和其它处理装置；所述人工智能处理装置与所述其它处理装置进行交互，共同完成用户指定的计算操作。本申请实施例有利于提高网络离线模型的运算速度。

Description

网络离线模型的处理方法、人工智能处理装置及相关产品

技术领域

本申请涉及信息处理技术领域，具体涉及一种网络离线模型的处理方法、人工智能处理装置及相关产品。

背景技术

随着信息技术的不断发展和人们日益增长的需求，人们对信息及时性的要求越来越高了。目前，终端对信息的获取以及处理均是基于处理器获得的。在实践中发现，这种基于处理器运行软件程序来处理信息的方式，受限于网络模型的类型，也就是说，对于一些新生的网络模型，处理器对网络类型的版本不兼容。目前，在处理器上运行的网络离线模型，来源于在机器框架下构建的，在构建网络模型时，未对各层网络加以区分，导致单一处理器无法兼容各种网络离线模型。

发明内容

本申请实施例提供了一种离线模型的处理方法，在保存离线网络时，保存该离线网络的类型标识，以期依据类型标识兼容执行所有类型的离线网络。

第一方面，本申请实施例提供了一种网络离线模型的处理方法，该方法包括：

获取网络离线模型中各子网络的运行单元信息，所述运行单元信息包括子网络与运行单元类型之间的对应关系，所述运行单元类型包括通用处理单元类型或人工智能处理单元类型；

根据所述运行单元信息，在构建的所述网络离线模型中定义子网络运行参数，得到构建后的网络离线模型，所述子网络运行参数用于表示各子网络的运行单元类型。

第二方面，本申请实施例提供一种离线模型的人工智能装置，所述装置包括：

获取模块，用于获取网络离线模型中各子网络的运行单元信息，所述运行单元信息包括子网络与运行单元类型之间的对应关系，所述运行单元类型包括通用处理单元类型或人工智能处理单元类型；

构建模块，用于根据所述运行单元信息，在构建的所述网络离线模型中定义子网络运行参数，得到构建后的网络离线模型，所述子网络运行参数用于表示各子网络的运行单元类型。

第三方面，本申请实施例提供一种计算机设备，包括存储器、处理器，所述存储器上存储有可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的方法。

第四方面，本申请实施例提供一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的方法。

第五方面，本申请实施例提供一种组合处理装置，其特征在于，所述组合处理装置包括如第二方面所述的人工智能处理装置，通用互联接口和其它处理装置；

所述人工智能处理装置与所述其它处理装置进行交互，共同完成用户指定的计算操作。

可以看出，在本申请实施例中，获取网络离线模型的运行单元信息，在构建该网络离线模型时，定义各个子网络的运行参数，在运行参数中标记各个子网络的运行单元类型，从而对网络离线模型的子网络进行分类，以便在运行该网络离线模型时，将各个子网络分配各自对应的处理器执行，实现兼容执行该网络离线模型，提高人工智能处理装置可运行的网络离线模型的类型。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种网络离线模型的处理方法；

图2为本申请实施例提供的另一种网络离线模型的处理方法；

图3为本申请实施例提供的一种网络离线模型的人工智能装置的结构示意图；

图4为本申请实施例提供的一种网络离线模型的人工智能装置的功能单元组成框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本申请中的人工智能处理装置可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(MobileInternet Devices，简称：MID)或穿戴式设备等，上述电子设备仅是举例，而非穷举，包含但不限于上述人工智能处理装置。

首先，参阅图1，图1为本申请实施例提供的一种网络离线模型的处理方法的流程示意图，该方法应用于网络离线模型，该网络离线模型包括通用处理器和人工智能处理器，该方法包括如步骤S101～S102中所示的内容：

步骤S101、获取网络离线模型中各子网络的运行单元信息，所述运行单元信息包括子网络与运行单元类型之间的对应关系，所述运行单元类型包括通用处理单元类型或人工智能处理单元类型。

可选的，在子网络的运行单元类型为人工智能处理单元类型时，所述运行单元信息还包括该子网络的入口函数信息，该入口函数信息用于在人工智能处理单元运行该子网络时，通过该入口函数调取与该子网络对应的离线指令，通过预先编译好部分子网络的离线指令，加快了网络离线模型的运行速度。

其中，通用处理器中可以包括中央处理单元CPU(Central Processing Unit，简称：CPU)、图形处理单元GPU(Graphics Processing Unit，简称：GPU)和/或图像处理单元IPU(Image Processing Unit，简称：IPU)中的一种或几种的组合，该人工智能处理器包括机器学习处理器单元MLU(Machine Learning Processing Unit，简称：MLU)，其中，人工智能处理器可由多个MLU集成，组成为一个具有多核的人工智能处理器。

可选的，在获取网络离线模型中各子网络的运行单元信息之前，首先确定该网络离线模型的多个网络层是否可以融合，如是，将可以融合的多个网络层融合为一个子网络，将不能融合的网络层作为一个单独的子网络，在对该网络离线模型执行融合操作后，得到与该网络离线模型的若干个子网络。故每个子网络可以是由一个单独的网络层，也可是有几个网络层融合得到一个子网络，举例来说，如该网络离线模型中包含卷积层Convolution、归一化层BatchNorm以及缩放层Scale时，可以将该网络离线模型中的卷积层Convolution，归一化层BatchNorm以及缩放层Scale融合，得到一个子网络。

可选的，在将该网络离线模型融合后，获取该网络离线模型中各子网络的运行单元信息，以确定每个子网络的运行单元类型，以在构建该网络离线模型时，在与网络的运行单元类型对应的字段中定义各个子网络的运行单元类型。

步骤S102、根据所述运行单元信息，在构建的所述网络离线模型中定义子网络运行参数，得到构建后的网络离线模型，所述子网络运行参数用于表示各子网络的运行单元类型。

可选的，该人工智能装置利用预先安装的机器学习框架构建网络离线模型，下面以卷积神经网络框架caffe(Convolutional Architecture for Fast FeatureEmbedding，简称：caffe)为例对构建网络离线模型做具体说明。

对于caffe框架来说，在生成离线文件需要两个输入，一个是包含网络信息的prototxt文件，另一个是包含已经训练好的权重和偏置的caffemodel文件。在生成离线文件时，首先caffe先调用底层库接口创建一个离线文件，然后caffe会将输入的prototxt整个网络根据每一层是否可以在人工智能处理器上运行划分为若干个子网络，然后若该子网络可以在人工智能处理器上执行。caffe框架则会调用底层库接口将该子网络编译成能在人工智能处理器上运行的离线指令。接着caffe框架通过调用底层库提供的接口将生成的离线指令保存到预先生成好的离线文件中，同时对于像卷积和全连接等需要权重的层，caffe会先从已经训练好的caffemodel中将权重和偏置数据读出并存放在相应的blob中，其中blob为caffe里面定义的一种数据结构，用于层与层之间传递数据。这些权重和偏置数据会在caffe调用底层库生成离线指令的时候一同传递给底层库，然后caffe调用底层库的相关接口将离线指令，权重以及偏置数据一起存放到离线文件中。另外，在caffe调用底层库编译子网络生成离线指令的时候，caffe可以指定当运行该子网络时可以在几个核上运行，也就是所谓的指定模型并行度，该子网络可当成一个模型。

离线文件中除了存放离线指令和权重、偏置等数据外，还会存放自定义的单元信息，每个子网络对应一个单元信息。单元信息可以通过protobuf机制生成，并且caffe可以通过调用protobuf提供的相关接口将该单元信息追加到离线文件的后面，这些信息用于后面运行离线文件时使用。

可选的，在本申请的一个实施例中，可以预先定义格式为.SegmentInfoUnit单元信息，其用于保存每个子网络的子网络运行参数。其中，该子网络运行参数包括子网络名称、运行单元类型和子网络参数信息，该子网络参数信息可以用于指示在执行该子网络时对处理器的资源调度。举例来说，子网络参数信息可以包括卷积核信息等，可以用于表示运行该子网络需要调配的人工智能处理单元的资源信息。

可选的，该单元信息还可以保存与各子网络对应的的离线指令的索引标识以及计算参数的索引标识，该索引标识便于从离线文件中读取与各子网络对应的离线指令以及计算参数，然后，将该单元信息追加在该离线文件caffemodel中，以便基于该索引标识，通过caffe的底层接口从该离线文件中读取每个子网络的子网络运行参数以及与该子网络对应的离线指令以及计算参数。

其中，该计算参数为与每个子网络运算相关的参数数据，例如，当该子网络为卷积层时，该计算参数为权值和偏置，如该卷积层无偏置时，偏置为零，再如，如该子网络为激活层时，该计算参数为激活函数。

在一可能的示例中，将每个子网络的子网络运行参数保存在与每个子网络对应的数据结构中可以为：基于Protocol Buffers机制，获取预先设置的BP Message，通过Protocol Buffers机制中的编译器将每个子网络的layer(子网络中的层)中的符合该BPMessage中的字段编译成二进制文件，将该二进制文件保存在格式为.SegmentInfoUnit的数据结构中。当然，Protocol Buffers机制仅为示例性说明，本申请不对保存子网络的网络信息做唯一限定。

可以看出，在本申请实施例中，通过获取子网路的运行单元信息，在构建网络离线模型时，定义每个子网路的运行参数，使构建好的离线模型的离线文件中保存有各个子网络的运行单元类型，提供了一种新型保存网络离线模型的方法；而且，基于保存的各个子网络的运行单元类型，可以由不同的运行单元来运行不同的网络层，当模型中有新的层时，通过灵活指定新增层的运行单元，可以使网络离线模型的运行更加灵活，更兼容的应用到各种人工智能装置中。

参阅图2，图2为本申请实施例提供的另一种网络离线模型的处理方法的流程示意图，该方法应用于人工智能装置，该人工智能装置可以包括通用处理器和人工智能处理器，该方法包括如步骤S201～S205中所示的内容：

步骤S201、获取网络离线模型中各子网络的运行单元信息，所述运行单元信息包括子网络与运行单元类型之间的对应关系，所述运行单元类型包括通用处理单元类型或人工智能处理单元类型。

步骤S202、根据所述运行单元信息，在构建的所述网络离线模型中定义子网络运行参数，得到构建后的网络离线模型，所述子网络运行参数用于表示各子网络的运行单元类型。

步骤S203、根据所述子网络运行参数，确定目标子网络对应的运行单元，所述目标子网络为所述网络离线模型的任一子网络。

步骤S204、将所述目标子网络在对应的运行单元上执行，以执行所述网络离线模型。

可选的，将所述目标子网络在对应的运行单元上执行的实现过程可以为：通过机器学习框架的接口依次遍历该数据结构读取网络离线模型的网络运行参数，依据该网络运行参数确定执行该目标子网络的运行单元，以及与该目标子网络连接的上一个子网络以及下一个子网络的运行单元，即完成前向推理过程，指示该目标子网络的运行单元从上一个子网络的运行单元出获取输入数据，并将目标子网络的输出结果作为输入数据发送给下一个子网络的运行单元，举例来说，如该目标子网络的网络运行参数中的运行单元类型为人工智能处理单元类型，上一个子网络的运行单元类型为通用处理单元类型，下一个子网络的运行单元类型为通用处理单元类型，则指示人工智能处理单元从通用处理单元获取数据，将获取到的数据作为输入数据，并将得到的输出结果发送给通用处理单元，完成对该网络离线模型的前向推理过程，按照该网络离线模型的运行顺序运行。

可以看出，在本申请实施例中，在人工智能处理装置中设置有通用处理单元和人工智能处理单元，基于每个子网络的运行参数判断出每个子网络的运行单元，然后，由相应的运行单元运行该子网络，从而实现在人工智能处理单元不支持该子网络的运算时，由通用处理单元来运行该子网络的运算，即利用通用处理单元和人工智能处理单元协同工作，能够兼容运行所有类型的网络离线模型，从而提高网络离线模型的应用范围，而且通用处理单元和人工智能处理单元协同工作，将能在人工智能处理单元运行的网络层放到人工智能处理单元上运行，相对于将整个网络离线模型全部放在通用处理单元执行来说，加速了整个离线网络的推理过程，而且，对可以在人工智能处理单元上运行的网络层预先生成离线指令，节省了边执行边生成离线指令所消耗的时间；另外可以由通用处理单元执行网络离线模型的部分或全部运算，降低人工智能处理单元的工作压力。

在一可能的示例中，在根据所述子网络运行参数，确定目标子网络对应的运行单元的实现过程可以为：获取所述网络离线模型的模型并行度；根据人工智能处理单元调度机制、所述模型并行度和所述子网络运行参数，确定所述目标子网络对应的人工智能处理单元。

在上述可能的示例中，在确定所述目标子网络对应的人工智能处理单元时，从该网络离线模型的离线文件中读取与该目标子网络对应的离线指令，解析该离线指令，得到该离线指令中蕴含的模型并行度，依据该模型并行度，得到运行该目标子网络时所需的人工智能处理单元的数量，获取人工智能处理单元的调度机制，依据该调度机制从人工智能处理器中调配与该数量对应的多个人工智能处理单元，将与该数量对应的多个人工智能处理单元指定为运行该目标子网络的人工智能处理单元，将与该子网络对应的离线指令以及计算参数分发给该多个人工智能处理单元，以完成该目标子网络的运算。在本示例中，可预先设定每个子网络的模型并行度，即指定运行该子网络所需的人工智能处理单元的数量，实现在人工智能处理器上实现多核人工智能处理单元共同执行与该子网络对应的运算，提高该子网络的运行速度。

在一可能的示例中，当每个人工智能处理单元中由多个处理线程时，即每个人工智能处理单元中包含多个数据传输通道时，所述将所述目标子网络在对应的运行单元上执行，以执行所述网络离线模型的实现过程可以为：获取调用底层库时的接口指令；解析该接口指令，得到该接口指令中包含的通道标识；根据所述通道标识确定所述人工智能处理单元传输数据的通道；通过所述通道将所述目标子网络在所述人工智能处理单元上运行，以执行所述网络离线模型。在本示例中，每个目标人工智能处理单元包含多个数据传输通道，在调用底层库时，通过接口指令指定相应的通道向目标人工智能处理单元传输离线指令以及计算参数，从而加快该人工智能处理单元的读写速度，加速网络离线模型的推理过程。

参阅图3，图3为本申请实施例提供的一种网络离线模型的人工智能装置的结构示意图，如图3所示，该人工智能装置300包括通用处理器和人工智能处理器、存储器、通信接口以及一个或多个程序，其中，上述一个或多个程序不同于上述一个或多个应用程序，且上述一个或多个程序被存储在上述存储器中，并且被配置由上述处理器执行，上述程序包括用于执行以下步骤的指令：

其中，各子网络包括融合后的多个网络层；

其中，子网络运行参数包括子网络名称、运行单元类型信息和子网络参数信息。

在一可能的示例中，上述程序还用于执行以下步骤的指令：

执行所述构建后的网络离线模型，具体用于执行以下步骤的指令：

根据所述子网络运行参数，确定目标子网络对应的运行单元，所述目标子网络为所述网络离线模型的任一子网络；

将所述目标子网络在对应的运行单元上执行，以执行所述网络离线模型。

在一可能的示例中，若所述目标子网络对应的运行单元为人工智能处理单元，在根据所述子网络运行参数，确定目标子网络对应的运行单元时，上述程序具体用于执行以下步骤的指令：

获取所述网络离线模型的模型并行度；

根据人工智能处理单元调度机制、所述模型并行度和所述子网络运行参数，确定所述目标子网络对应的人工智能处理单元。

在一可能的示例中，若所述目标子网络对应的运行单元为人工智能处理单元，在将所述目标子网络在对应的运行单元上执行，以执行所述网络离线模型时，上述程序具体用于执行以下步骤的指令：

在调用底层库接口时，获取从所述底层接口传入的通道标识；

根据所述通道标识确定所述人工智能处理单元传输数据的通道；

通过所述通道将所述目标子网络在所述人工智能处理单元上执行，以执行所述网络离线模型。

参阅图4，图4示出了上述实施例中所涉及的网络离线模型的人工智能装置400的一种可能的功能单元组成框图，人工智能装置400包括：获取模块410、构建模块420；

获取模块410，用于获取网络离线模型中各子网络的运行单元信息，所述运行单元信息包括子网络与运行单元类型之间的对应关系，所述运行单元类型包括通用处理单元类型或人工智能处理单元类型；

构建模块420，用于根据所述运行单元信息，在构建的所述网络离线模型中定义子网络运行参数，得到构建后的网络离线模型，所述子网络运行参数用于表示各子网络的运行单元类型。

其中，各个子网络包括融合后的多个网络层。

其中，所述子网络运行参数包括子网络名称、运行单元类型信息和子网络参数信息。

在一可能的示例中，人工智能装置400还包括：执行模块430；

执行模块430，用于执行所述构建后的网络离线模型，具体用于：

在一可能的示例中，若所述目标子网络对应的运行单元为人工智能处理单元，在根据所述子网络运行参数，确定目标子网络对应的运行单元，执行模块430，具体用于：

获取所述网络离线模型的模型并行度；

在一可能的示例中，若所述目标子网络对应的运行单元为人工智能处理单元，在将所述目标子网络在对应的运行单元上执行，以执行所述网络离线模型，执行模块430，具体用于：

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质存储用于存储计算机程序，其中，该计算机程序被处理器执行，以实现如上述方法实施例中记载的任何一种离线模型的处理方法的部分或全部步骤。

本申请实施例还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种离线模型的处理方法的部分或全部步骤。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：Random Access Memory，简称：RAM)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种网络离线模型的处理方法，其特征在于，所述方法包括：

根据所述运行单元信息，在构建的所述网络离线模型中定义子网络运行参数，得到构建后的网络离线模型，所述子网络运行参数用于表示各子网络的运行单元类型；

所述方法还包括：

执行所述构建后的网络离线模型，具体包括：

将所述目标子网络在对应的运行单元上执行，以执行所述网络离线模型；

若所述目标子网络对应的运行单元为人工智能处理单元，所述将所述目标子网络在对应的运行单元上执行，以执行所述网络离线模型，包括：

在调用底层库接口时，获取从所述底层库接口传入的通道标识；

2.根据权利要求1所述的方法，其特征在于，各子网络包括融合后的多个网络层。

3.根据权利要求1所述的方法，其特征在于，所述子网络运行参数包括子网络名称、运行单元类型信息和子网络参数信息。

4.根据权利要求1所述的方法，其特征在于，若所述目标子网络对应的运行单元为人工智能处理单元，所述根据所述子网络运行参数，确定目标子网络对应的运行单元，包括：

获取所述网络离线模型的模型并行度；

5.一种人工智能处理装置，其特征在于，所述装置包括：

构建模块，用于根据所述运行单元信息，在构建的所述网络离线模型中定义子网络运行参数，得到构建后的网络离线模型，所述子网络运行参数用于表示各子网络的运行单元类型；

所述装置还包括：执行模块；

所述执行模块，用于执行所述构建后的网络离线模型，具体用于：

若所述目标子网络对应的运行单元为人工智能处理单元，在将所述目标子网络在对应的运行单元上执行，以执行所述网络离线模型，所述执行模块，具体用于：

6.根据权利要求5所述的装置，其特征在于，各个子网络包括融合后的多个网络层。

7.根据权利要求5所述的装置，其特征在于，所述子网络运行参数包括子网络名称、运行单元类型信息和子网络参数信息。

8.根据权利要求5所述的装置，其特征在于，若所述目标子网络对应的运行单元为人工智能处理单元，在根据所述子网络运行参数，确定目标子网络对应的运行单元，所述执行模块，具体用于：

获取所述网络离线模型的模型并行度；

9.一种计算机设备，包括存储器、处理器，所述存储器上存储有可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。

10.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至4中任一项所述方法的步骤。