WO2020211037A1

WO2020211037A1 - 加速器的检测方法和验证平台

Info

Publication number: WO2020211037A1
Application number: PCT/CN2019/083225
Authority: WO
Inventors: 王耀杰; 林蔓虹; 陈琳
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2019-04-18
Filing date: 2019-04-18
Publication date: 2020-10-22
Also published as: CN111656370A

Abstract

一种加速器的检测方法和验证平台，该检测方法包括：生成至少一个目标神经网络（110）；将所述至少一个目标神经网络翻译成神经网络指令（120）；将所述神经网络指令分别输入到加速器以及与所述加速器匹配的软件模型中执行，并确定所述神经网络指令的输出结果的差异（130）；根据所述神经网络指令的输出结果的差异确定加速器运行过程中出现异常的指令（140）。通过生成的至少一个目标神经网络，能够有效地对加速器进行性能检测。

Description

加速器的检测方法和验证平台

版权申明

技术领域

本申请涉及神经网络技术领域，并且更为具体地，涉及一种加速器的检测方法和验证平台。

背景技术

神经网络在生成之后，为了利用该神经网络进行数据处理，一般需要将神经网络加载到加速器上运行。而加速器性能的好坏可能会直接影响到后续利用神经网络进行数据处理的效果，因此，如何更好地对加速器进行性能检测是一个需要解决的问题。

发明内容

本申请提供一种加速器的检测方法、神经网络的生成方法、数据处理方法以及相关装置，以更好地进行加速器的检测。

第一方面，提供了一种加速器的检测方法，该方法包括：生成至少一个目标神经网络；将至少一个目标神经网络翻译成神经网络指令；将神经网络指令分别输入到加速器以及与加速器匹配的软件模型中执行，并确定神经网络指令的输出结果的差异；根据神经网络指令的输出结果的差异确定加速器运行过程中出现异常的指令。

本申请中，通过生成的至少一个目标神经网络，能够有效地对加速器进行性能检测。

可选地，生成至少一个目标神经网络，包括：生成多个目标神经网络。

当生成了多个目标神经网络时，能够采用不同的神经网络对加速器的性能进行检测，进而能够更好地实现对加速器的性能检测。

可选地，上述目标神经网络为卷积神经网络。

应理解，本申请中生成的目标神经网络除了可以是卷积神经网络之外，也可以是卷积神经网络之外的其他类型的神经网络，例如，前馈神经网络，递归神经网络等等。

在第一方面的某些实现方式中，生成至少一个目标神经网络，包括：确定目标神经网络的代数，以及目标神经网络所有代的节点的节点类型和节点个数，其中，该目标神经网络为上述至少一个目标神经网络中的任意一个目标神经网络；根据预设的节点连接要求确定连接该目标神经网络中所有节点的目标连接方式；根据目标连接方式生成目标神经网络。

本申请中，通过先确定待生成的目标神经网络的代数，节点个数和节点类型，再结合预设的节点连接要求生成目标连接方式，能够最终生成目标神经网络，可以更加灵活方便地生成多种类型的神经网络。进一步的，当生成了多种类型的神经网络之后，能够更好地对加速器进行性能检测。

在第一方面的某些实现方式中，根据预设的节点连接要求确定连接目标神经网络中所有节点的目标连接方式，包括：根据节点连接要求确定当前节点的候选父节点，其中，当前节点和候选父节点满足节点连接要求；从候选父节点中选择出当前节点的实际父节点；确定当前节点与当前节点的实际父节点之间的连接关系，以最终生成目标连接方式。

上述候选父节点也可以称为父节点的候选节点。

在第一方面的某些实现方式中，根据节点连接要求确定当前节点的候选父节点，包括：根据以下连接关系中的至少一种，确定当前节点的候选父节点；在当前节点的节点类型为Concat或Eltwise时，当前节点的父节点个数为多个，且当前节点的父节点个数小于或者等于当前节点的候选父节点个数；在当前节点的父节点的节点类型为Active时，当前节点的节点类型为Active之外的类型；在当前节点的父节点的节点类型为Global Pooling时，当前节点的节点类型为Global Pooling；在当前节点的父节点的节点类型为FC时，当前节点的节点类型为FC或者Concat；在当前节点的父节点的节点类型为Conv、Eltwise、Pooling以及Concat时，当前节点的节点类型可以为Conv、Eltwise、Pooling、Active、Global Pooling、Concat以及FC中的任意一种。

在第一方面的某些实现方式中，从候选父节点中选择出当前节点的实际父节点，包括：根据概率密度函数确定候选父节点中的每个节点作为当前节点的实际父节点的概率；根据候选父节点中的每个节点作为当前节点的实际父节点的概率从候选父节点中确定出当前节点的实际父节点。

在第一方面的某些实现方式中，根据候选父节点中的每个节点作为当前节点的实际父节点的概率从候选父节点中确定出当前节点的实际父节点，包括：将候选父节点中作为当前节点的实际父节点的概率大于预设概率值的节点确定为当前节点的实际父节点。

在第一方面的某些实现方式中，上述方法还包括：根据概率密度函数的期望和方差，调整候选父节点中的每个节点作为当前节点的实际父节点的概率。

通过调整概率密度函数的期望和方差，能够调整目标神经网络的宽度和深度，从而能够生成深度和宽度满足要求的目标神经网络。

具体地，可以根据待生成的目标神经网络的深度和宽度的要求来调整概率密度函数的期望和方差。

一般来说，概率密度函数的方差越大，邻近代中的节点被选中的概率越大，网络的宽度会变得越窄，深度会变得越深。

在第一方面的某些实现方式中，上述概率密度函数为高斯函数。

在第一方面的某些实现方式中，上述根据目标连接方式生成目标神经网络，包括：根据预设的节点有效连接关系，从目标连接关系中确定出有效目标连接关系；根据有效目标连接关系生成目标神经网络。

在第一方面的某些实现方式中，上述节点有效连接关系包括下列关系中的至少一种：在当前节点的节点类型为Eltwise时，当前节点的多个输入的通道数保持一致；当前节点的节点类型为FC或者GlobalPooling时，当前节点的之后只能连接FC、GlobalPooling和act类型之外的节点。

在第一方面的某些实现方式中，确定待生成的目标神经网络的代数，以及目标神经网络所有代的节点的节点类型和节点个数，包括：根据对目标神经网络的运算要求确定目标神经网络的代数，以及目标神经网络所有代的节点的节点类型和节点个数。

上述对目标神经网络的运算需求可以为运算量(大小)的需求，当运算量需求较小时，可以为目标神经网络设置较少的代数、每代也可以设置较少的节点个数；而当运算量需求较大时可以为目标神经网络设置较多的代数，每代也可以设置较多的节点个数。

上述对目标神经网络的运算需求可以为运算的复杂度，当运算复杂度较低时，可以为目标神经网络设置较少的代数、每代也可以设置较少的节点个数；当运算复杂度较高时，可以为目标神经网络设置较多的代数，每代也可以设置较多的节点个数。

第二方面，提供一种神经网络的生成方法，该方法包括：确定待生成的目标神经网络的代数，以及目标神经网络所有代的节点的节点类型和节点个数；根据预设的节点连接要求确定连接目标神经网络中所有节点的目标连接方式；根据目标连接方式生成目标神经网络。

本申请中，通过先确定待生成的目标神经网络的代数，节点个数和节点类型，再结合预设的节点连接要求生成目标连接方式，能够最终生成目标神经网络，可以更加灵活方便地生成多种类型的神经网络。

第三方面，提供一种数据处理方法，该方法包括：确定待生成的目标神经网络的代数，以及目标神经网络所有代的节点的节点类型和节点个数；根据预设的节点连接要求确定连接目标神经网络中所有节点的目标连接方式；根据目标连接方式生成目标神经网络；采用目标神经网络进行数据处理。

本申请中，通过先确定待生成的目标神经网络的代数，节点个数和节点类型，再结合预设的节点连接要求生成目标连接方式，能够最终生成目标神经网络，可以更加灵活方便地生成多种类型的神经网络，进而能够更有针对性的采用特定的神经网络对相应的数据进行数据处理。

应理解，本申请第二方面和第三方面中生成的目标神经网络的具体方式以及对相关信息的限定和解释可以参见上述第一方面中的相关内容。

第四方面，提供一种加速器的验证平台，该验证平台包括：存储器，用于存储代码；至少一个处理器，用于执行存储器中存储的代码，以执行如下操作：生成至少一个目标神经网络；将至少一个目标神经网络翻译成神经网络指令；将神经网络指令分别输入到加速器以及与加速器匹配的软件模型中执行，并确定神经网络指令的输出结果的差异；根据神经网络指令的输出结果的差异确定加速器运行过程中出现异常的指令。

第五方面，提供一种神经网络的生成装置，包括：存储器，用于存储代码；至少一个处理器，用于执行所述存储器中存储的代码，以执行如下操作：确定待生成的目标神经网络的代数，以及各代节点的节点类型和节点个数；根据预设的节点连接要求确定连接所述目标神经网络中各个节点的目标连接方式；根据所述目标连接方式生成所述目标神经网络。

第六方面，提供一种数据处理装置，其特征在于，包括：存储器，用于存储代码；至少一个处理器，用于执行所述存储器中存储的代码，以执行如下操作：确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数；根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式；根据所述目标连接方式生成所述目标神经网络；采用所述目标神经网络进行数据处理。

第七方面，提供一种计算机可读存储介质，其上存储有用于执行第一方面、第二方面和第三方面中的任意一种方法的指令。

第八方面，提供一种计算机程序产品，包含用于执行第一方面、第二方面和第三方面中的任意一种方法的指令。

附图说明

图1是神经网络结构的示意图；

图2是本申请实施例的加速器的检测方法的示意性流程图；

图3是本申请实施例的神经网络的生成过程的示意图；

图4是确定的目标神经网络的代数、各代的节点个数和节点类型的示意图；

图5是神经网络的一种可能的节点连接关系的示意图；

图6是神经网络的一种可能的节点连接关系的示意图；

图7是神经网络的一种可能的节点连接关系的示意图；

图8是神经网络的一种可能的节点连接关系的示意图；

图9是本申请实施例的神经网络的生成过程的示意图；

图10是本申请实施例的加速器的验证平台的示意性框图；

图11是本申请实施例的生成神经网络的装置的示意性框图；

图12是本申请实施例的数据处理装置的示意性框图。

具体实施方式

下面结合附图对本申请实施例进行详细的描述。

为了更好地理解本申请实施例，下面先结合图1对本申请实施例中的神经网络的结构以及神经网络的相关信息进行描述。

图1是神经网络结构的示意图。

应理解，图1中的神经网络既可以是卷积神经网络，也可以是其它类型的神经网络，本申请对此不做限制。

在图1中，神经网络的结构主要包括三部分：节点(node)、代(generation)和树(tree)。

在图1中，神经网络包括节点1至节点9，这些节点共同组成了第0代至第4代的节点，每代包含的节点如下：

第0代：节点1；

第1代：节点2、节点3、节点4；

第2代：节点5、节点6；

第3代：节点7、节点8；

第4代：节点1。

如图1所示，前面代的节点可以作为后面代的节点的父节点，后面代的节点可以作为前面代的节点的子节点。例如，第1代至第4代的节点可以作为第0代节点的子节点，第1代节点可以作为第2代至第4代节点的父节点。

如图1所示，上述第0代至第4代中的节点共同构成了神经网络的树。

下面对节点、代和树的相关信息进行详细介绍。

每个节点用于描述一个计算层(例如，卷积层)，每个节点包含的信息以及相应信息的含义具体如下：

node_header:节点的头信息；

上述节点的头信息包括sequence、gen_id和node_id，其中，sequence为节点总序列号，gen_id表示代索引号(该节点所处的代的索引号)，node_id表示代中的节点索引号；

parent_num:(该节点的)父节点个数，对于Concat/Eltwise类型的节点来说，parent_num≥2，对于其它类型的节点来说，parent_num＝1；

parents[]:(该节点的)父节点，(该节点的)父节点个数等于parent_num；

node_t:节点类型，例如，这里的节点类型可以包括Input/Eltwise/Concat/Conv/Pool/Relu/Prelu/innerproduct/GlobalPooling等；

node_name：(该节点的)节点名称；

top:(该节点的)top节点的节点名称，其中，top节点为该节点的子节点；

bottom[]:(该节点的)bottom节点的节点名称，其中，bottom节点为该节点的父节点，bottom节点的个数为parent_num；

if_n/c/h/w[]：(该节点的)各输入节点的batch数、通道数、宽和高，其中，该节点的输入节点个数等于parent_num；

of_n/c/h/w：该节点的输出节点batch数、通道数、宽和高。

代(generation)用于组织至少一个节点，如果一个代中包含多个节点，同代中的各个节点不能相互连接，当前代中的节点只能连接gen_id小于当前代的gen_id的代中的节点(即支持跨代连接)。代中包含的信息以及相应信息的含义如下：

gen_id：代索引号；

node_num:代中包含的节点个数，node_num小于或者等于神经网络的最大宽度；

nodes：代中包含的节点的实例；

node_tq[]:代中包含的各节点的类型。

树(tree)用于组织多个代，并描述网络中所有节点的连接关系。树中包含的信息以及相应信息的含义如下：

gen_num:树中包含的代数，gen_num小于或者等于网络的最大深度；

gens[]：树中包含的代的实例，gens[]的个数等于gen_num。

应理解，上文结合图1介绍的神经网络结构只是本申请实施例中的神经网络的一种可能的结构，本申请实施例的神经网络还可以是其它结构，本申请对本申请涉及到的神经网络的具体结构和形式不做限定。

上文结合图1对本申请实施例中的神经网络的一种可能的结构进行了简单的介绍，下面结合图2对本申请实施例的加速器的检测方法进行详细介绍。

图2是本申请实施例的加速器的检测方法的示意性流程图。图2所示的方法可以由电子设备或者服务器执行，这里的电子设备可以是移动终端(例如，智能手机)，电脑，个人数字助理，可穿戴设备，车载设备，物联网设备等包含处理器的设备。图2所示的方法包括步骤110至140，下面分别对这些步骤进行详细的描述。

110、生成至少一个目标神经网络。

可选地，上述至少一个目标神经网络为多个目标神经网络。

上述目标神经网络可以是卷积神经网络，也可以是卷积神经网络之外，也可以是卷积神经网络之外的其他类型的神经网络，例如，前馈神经网络，递归神经网络等等。

120、将至少一个目标神经网络翻译成神经网络指令。

应理解，步骤120是为了将上述至少一个目标神经网络加载到加速器或者软件模型中执行，在加载到加速器或者软件模型之前，一般需要将上述至少一个目标神经网络翻译成加速器或者软件模型能够执行的指令。

130、将神经网络指令分别输入到加速器以及与加速器匹配的软件模型中执行，并确定神经网络指令的输出结果的差异。

应理解，上述与加速器匹配的软件模型可以是用于对比加速器性能的软件模型，该软件模型可以模拟加速器的运算行为。

假设上述神经网络指令输入到加速器得到的是第一输出结果，上述神经网络指令输入到软件模型得到的是第二输出结果，通过比较第一输出结果和第二输出结果就能获取到上述神经网络指令的输出结果的差异。

140、根据神经网络指令的输出结果的差异确定加速器运行过程中出现异常的指令。

在步骤140中，当输出结果出现差异时，与该输出结果相对应的加速器的指令就可以认定为加速器运行过程中出现异常的指令，通过确定加速器运行过程中出现异常的指令，能够用于定位加速器的问题，进一步的改进或者修正加速器的设计，从而提高加速器的性能。

进一步的，当生成了多个目标神经网络时，能够采用不同的神经网络对加速器的性能进行检测，进而能够更好地实现对加速器的性能检测。

上述步骤110中生成至少一个目标神经网络的实现方式有多种，下面结合图3对步骤110中生成至少一个目标神经网络的过程进行详细的介绍。

图3是本申请实施例的神经网络的生成过程的示意图。

图3所示的过程包括步骤210至230，下面分别对这些步骤进行详细的描述。

210、确定目标神经网络的代数，以及目标神经网络所有代的节点的节点类型和节点个数。

其中，上述步骤210中确定的目标神经网络可以是上述步骤110中的至少一个目标神经网络中的任意一个目标神经网络。

具体地，在步骤210中，可以先随机确定目标神经网络的代数，然后再随机确定每一代的节点的节点类型和节点个数。

例如，如图1所示，可以随机确定目标神经网络的代数为5(图1中的神经网络的代数为5)。

另外，在步骤210中，可以在一定的数值范围(例如，神经网络的深度范围)内来确定目标神经网络的代数。例如，可以在数值[10,20]范围内随机确定目标神经网络的代数为12。

在确定了目标神经网络的代数之后，可以从所有可用的节点类型中确定出各代节点的节点类型，在确定各代的节点个数时，可以在一定的数值范围(例如，神经网络的宽度范围)内来确定各代的节点个数。

应理解，在步骤210中，也可以根据具体的(运算)需求来设置目标神经网络的代数、以及各代的节点类型和节点个数。

例如，如果采用神经网络做一些简单的运算，那么，可以为目标神经网络设置较少的代数、每代也可以设置较少的节点个数，而如果要采用神经网络做一些非常复杂的运算，那么，可以为目标神经网络设置较多的代数，每代也可以设置较多的节点个数。

可选地，可根据Input/Eltwise/Concat/Conv/Pool/Relu/Prelu/Innerproduct/GlobalPooling这些可用的节点类型来确定各代的节点类型。

例如，以图1中所示的神经网络为例，在随机确定了目标神经网络的代数为5之后，可以随机确定第0代至第4代的节点个数分别为1、3、2、2和1。

在确定各代的节点类型和节点个数的时候，既可以先确定各代的节点类型，也可以先确定各代的节点个数，还可以同时确定各代的节点类型和节点个数(本申请不限定确定各代节点的节点类型和各代节点的节点个数的先后顺序)。

应理解，在确定各代的节点类型和节点个数时，每一代的节点个数可以大于或者等于该代的节点类型的个数(每一代的节点类型的个数小于该代的节点个数)。

下面结合附图对步骤210说明确定的目标神经网络的代数，以及各代的节点类型和节点个数进行说明。

例如，如图4所示，步骤210确定的目标神经网络的代数为4(包括第 0代至第4代)，第0代至第3代包含的节点个数具体如下：

第0代节点的节点个数为1；

第1代节点的节点个数为3；

第2代节点的节点个数为2；

第3代节点的节点个数为1。

第0代至第3代包含的节点类型具体如下：

第0代节点的节点类型为Input；

第1代节点的节点类型包括FC、Eltwise和GlobalPoolling；

第2代节点的节点类型为Concat和FC；

第3代节点的节点类型为Eltwise。

220、根据预设的节点连接要求确定目标神经网络中各个节点的连接关系。

上述节点连接要求可以是能够满足神经网络正常使用要求的规则，该节点连接要求可以是预先设置好的，具体地，可以通过经验和要生成的神经网络的需求来设定节点连接要求。

应理解，在步骤220中根据节点连接要求确定的目标神经网络中各个节点之间的连接关系可以有多种，在获取了多种连接关系之后可以从该多种连接关系中(任意)选择一种连接关系作为最终的连接关系。

可选地，上述节点连接要求可以包括下列条件中的至少一种：

(1)第一代节点的节点类型为输入(Input)类型；

(2)当前节点的节点类型为Concat或者Eltwise时，当前节点的父节点个数小于或者等于该父节点的候选节点个数；

(3)当前节点的节点类型与当前节点的父节点之间的连接满足表1所示的关系。

表1

表1示出了当前节点为不同的节点类型时能够连接的父节点的节点类型，其中，Y表示可以连接，N表示不能连接。

应理解，在上述步骤220中可以得到多种节点连接关系，在执行步骤230之前，可以对该多种节点连接关系的有效性进行判断，从中选择出有效的节点连接关系之后再执行步骤230。

具体地，在检查多种节点连接关系的有效性时，可以判断这些节点连接关系是否满足下面的条件(4)和条件(5)，并将这些节点连接关系中满足条件(4)和条件(5)的节点连接关系确定为有效的节点连接关系，并根据这些有效的节点连接关系执行步骤230。

(4)Eltwise类型的节点多个输入的通道数要保持一致；

(5)FC类型和GlobalPooling类型的节点之后(包括紧跟着当前节点之后的节点，以及后面代中位于当前节点之后的节点)不能连接FC、GlobalPooling和act类型之外的其它类型节点。

具体地，FC类型和GlobalPooling类型的节点之后紧跟着的后面的节点，以及后面代中位于FC类型和GlobalPooling类型的节点之后的节点的节点类型只能是FC、GlobalPooling或act类型。

例如，在图4所示的神经网络结构中，节点6的节点类型为Eltwise，节点6两个输入的通道数均为1，节点6两端的输入通道数满足上述条件(4)，但是，对于同为Eltwise类型的节点11来说，节点11左侧的输入通道数为2，右侧的输入通道数为1，节点11左侧的输入通道数和右侧的输入通道数不一致，不满足上述条件(4)。

因此，图5所示的连接关系不符合上述条件(4)，当步骤220中确定出的多种节点连接关系包含图5所示的无效连接关系时，需要将该连接关系排除掉。

再如，在图6所示的神经网络中，节点1的节点类型为FC，节点2的节点类型为Relu，由于节点1的节点类型为FC，节点1后面只能连接节点类型为FC、GlobalPooling和act的节点，节点1与节点2的连接关系不满足上述条件(5)；另外，节点3的节点类型为GlobalPooling，节点4的节点类型为Prelu，节点3只能连接节点类型为FC、GlobalPooling和act的节点，节点3与节点4的连接关系不满足上述条件(5)。

因此，图6所示的连接关系不符合上述条件(5)，当步骤220中确定出的多种节点连接关系包含图6所示的无效连接关系时，要将该连接关系排除掉。

另外，在步骤220中，在确定一个节点的父节点时，可能会存在多个候选节点，这个时候，只要满足上述条件(1)至条件(5)均可以作为当前节点的候选父节点(也可以称为父节点的候选节点)，但是具体从候选父节点中选择哪些节点作为当前节点的实际父节点可以根据概率密度函数来确定。

可选地，上述概率密度函数可以是高斯函数(gaussian function)，由于高斯函数整体符合越接近的代被选中的概率越高的基本要求，具体地，高斯函数的期望值可以与代索引值-1保持一致，高斯函数的期望值不影响网络形态的控制。通过调整高斯函数中的方差，可以实现对高斯函数形态的控制，从而控制各代中的节点被选中的概率。一般来说，高斯函数的方差越大，邻近代中的节点被选中的概率越大，深度会变得越深，网络的宽度会变得越窄。

230、根据目标连接关系生成目标神经网络。

在步骤230中，在确定了各个节点的连接关系之后，就可以根据各个节点的连接关系来构造目标神经网络，或者输出prototxt文件(该文件中包含目标神经网络中各个节点的连接关系)，以便后续根据该prototxt文件输入给配置工具翻译成神经网络指令供加速器执行。

应理解，在根据连接关系生成目标神经网络时，还需要确定各个节点的节点内参数，其中，各个节点的节点内参数类型、节点内参数的个数以及节点内参数与节点类型相关。

例如，对于Conv类型的节点来说，of_h需满足公式(1)。

of_h＝(if_h[0]+2×pad_h–(dilation_h×(kernel_h-1)+1))/stride_h+1 (1)

而对于Pool类型的节点来说，of_h需满足公式(2)。

of_h＝(if_h[0]+2×pad_h–Pool_size)/stride_h+1 (2)

其中，在上述公式(1)和公式(2)中，of_h表示节点输出特征图的高，if_h表示节点输入特征图的高，pad_h是为了便于计算而在节点的输入特征图上填充的元素的行数，通常都是填充0，dilation_h表示在节点的输入特征图中间插值的元素的个数(dilation_h大于0)，通常插值为0，kernel_h表示进行卷积操作时卷积核的大小，stride_h表示卷积核或池化窗口在高度方向滑动的步长，Pool_size表示进行池化处理时的窗口的大小。

对于Concat类型的节点来说，of_c等于各个if_c的总和，对于Eltwise类型的节点来说，of_c应与每个if_c的大小保持一致。

另外，在确定各个节点的节点内参数时，还需要满足下面的条件A。

条件A：父节点输出的特征图的大小与子节点的输入的特征图的大小相等。

由于父节点的输出的特征图的就是子节点的输入的特征图，因此，父节点内输出的特征图的大小要与子节点输入的特征图的大小一致。

下面结合图7和图8对步骤230中根据确定的连接关系生成目标神经网络进行说明。

例如，当步骤210中确定出来的目标神经网络的代数，以及各代的节点类型和节点个数如图4所示的情况时，在此基础上，继续执行步骤220得到的节点连接关系如图7和图8所示。

接下来，根据上述条件(4)和(5)对图7和图8所示的节点连接关系进行分析。通过分析得知，图7和图8所示节点连接关系均满足条件(4)，但是，在图7中，节点3与节点6连接不符合上述条件(5)。而图8除了满足上述条件(4)之外，还满足条件(5)，因此，可以确定图8所示的节点连接关系是有效的节点连接关系，接下来，在步骤230中就可以根据图8所示的节点连接关系来构造神经网络了。

为了更好地理解本申请实施例的神经网络的生成方法的流程，下面结合图9对申请实施例的神经网络的生成过程的具体执行流程进行详细的介绍。

图9是本申请实施例的神经网络的生成过程的示意图。图9所示的过程可以由电子设备(该电子设备的限定和解释可参见图2所示的方法中的相关内容)执行，图9所示的过程包括步骤1001至1011，下面分别对这些步骤进行详细的描述。

1001、开始。

步骤1001表示开始生成神经网络。

1002、随机生成神经网络的代数。

应理解，在步骤1002，可以在一定的数值范围内随机选择一个数值作为神经网络的代数。

1003、随机生成各代节点的个数和各代节点的节点类型。

在步骤1003中，可以在一定的网络宽度的范围内随机生成各代节点的个数。例如，神经网络的宽度不能超过10，那么，可以分别在1到10之间任意选择一个数值作为各个代的节点的个数。

而在随机生成各个节点的节点类型时，可以从所有可用的节点类型中随机生成各个节点的节点类型。

这里的步骤1002和步骤1003相当于上文中的步骤210，上文中对步骤210的相关限定和解释同样适用于步骤1002和步骤1003，为了避免重复，这里不再详细描述步骤1002和步骤1003。

1004、根据节点类型例化各个节点。

具体地，在步骤1004中，可以根据各代的节点类型和各代的节点个数，例化各代中的各个节点，也就是说，要根据各代节点的节点类型和各代的节点个数确定各代中的节点实例，其中，一个节点可以对应一个实例，也可以对多个实例。

应理解，这里的节点更偏向于逻辑上的一个概念，而节点实例则是节点实际依托的一个实体，在该实体上能够执行该节点的各种数据处理任务。

1005、配置各个节点的头信息和父节点个数。

配置各个节点的头信息(node_header)也就是要生成各个节点的节点总序列号(sequence)，代索引号(gen_id)和代中的节点索引号(node_id)。

例如，可以按照从上到下的顺序生成各代的代索引号(gen_id)，按照第0代到第N(N为神经网络的最后一代的编号)代的顺序生成各个节点的总序列号(sequence)，在每代中再按照一定的顺序生成各个节点在代中的节点索引号(node_id)。

其中，sequence表示整个神经网络中的节点的序列号。

1006、计算各个节点的父节点的候选节点。

具体地，在步骤1006中，要计算当前节点的父亲节点的候选节点，以便于后续从该候选节点中选择出父节点。

在步骤1006中，可以最底层开始，逐层为每一层中的每个节点从前面的代中选择出候选父节点。

应理解，在为当前节点选择候选父节点时，当前节点的候选父节点不仅可以来自于当前节点的上一代，也可以来源于当前节点之前的所有代。

在为每一个节点确定候选父节点时，可以按照一定的节点连接要求(该节点连接要求可以是上文中的条件(1)至条件(3)中的一种或者多种)来选择候选父节点，将上一代中满足节点连接要求的节点作为当前节点的候选父节点。

例如，如图4所示，可以选择第2代中的节点5和节点6作为第3代中的节点7的候选父节点。

另外，在步骤1006中，当确定了节点的候选父节点之后，可以采用概率密度函数来计算候选父节点中的每个节点作为当前节的父节点的概率，并将概率大于一定数值的节点作为当前节点的候选父节点。

应理解，上述候选父节点的个数可以是多个，从候选父节点中选出的父节点的个数可以是一个也可以是多个。另外，从候选父节点中选择出来的父节点是当前节点的实际父节点。

例如，某个节点有6个候选父节点，通过概率密度函数计算，这6个候选父节点作为当前节点的候选父节点的概率分别为70％、60％、65％、45％、40％和30％。那么，可以将概率分别为70％、60％、65％对应的候选父节点确定为当前节点的实际父节点(可以选择一个或者多个候选父节点作为当前节点的实际父节点)。

在上述例子中，也可以只将对应概率最大的候选父节点作为当前节点的实际父节点(也就是将概率为70％对应的候选父节点作为当前节点的实际父节点)。

上述概率密度函数具体可以是高斯函数。

1007、随机挑选当前节点的实际父节点进行连接。

在上述步骤1006中，当从候选父节点中选择出当前节点的实际父节点之后，如果实际父节点的数量为多个，那么，就可以从实际父节点中任意或者随机选择父节点进行连接了。

1008、确定当前连接是否有效。

在步骤1008中，要确定当前已经存在的连接是否有效，在具体执行时，可以根据上述条件(4)和条件(5)对每一个连接关系进行判断，满足条件(4)和(5)的连接关系为有效连接关系，不满足条件(4)和条件(5)中的任意一个条件的连接关系为无效连接关系。

当确定连接有效时，执行步骤1009，当确定连接无效时，继续执行步骤1006。

1009、连接各个节点。

在步骤1009中，可以根据步骤1008中确定出来的有效连接关系对各个节点进行连接。

应理解，在步骤1009之后，还可以执行步骤1009a。

1009a、确定各个节点的节点内参数。

确定各个节点的节点内参数时，可以根据上述公式(1)，公式(2)以及条件A的约束来确定各个节点的节点内参数。

1010、打印prototxt文件。

prototxt文件中包含要生成的神经网络中各个节点的连接关系，生成该prototxt文件之后，便于后续根据该prototxt文件构建或者生成神经网络。

1011、结束。

步骤1011表示神经网络的生成过程结束。

上文结合图1至图9对本申请实施例的加速器的检测方法进行了详细的描述。

事实上，本申请还可以保护一种神经网络的生成方法，该神经网络的生成方法具体包括：确定待生成的目标神经网络的代数，以及目标神经网络所有代的节点的节点类型和节点个数；根据预设的节点连接要求确定连接目标神经网络中所有节点的目标连接方式；根据目标连接方式生成目标神经网络。

上述生成的目标神经网络可以用于对数据进行处理，因此，本申请还可以保护一种数据处理方法，该方法包括：确定待生成的目标神经网络的代数，以及目标神经网络所有代的节点的节点类型和节点个数；根据预设的节点连接要求确定连接目标神经网络中所有节点的目标连接方式；根据目标连接方式生成目标神经网络；采用目标神经网络进行数据处理。

可选地，上述采用目标神经网络进行数据处理，包括：获取输入数据；采用目标神经网络对输入数据进行数据处理，得到输出数据。

上述输入数据可以是需要采用神经网络进行处理的数据，进一步的，该输入数据可以是人工智能领域内需要采用神经网络进行处理的数据。

例如，上述输入数据可以是待处理的图像数据，上述输出数据可以是图像的分类结果或者识别结果。再如，上述输入数据也可以是待识别的语音数据，上述输出结果可以是语音识别结果。

应理解，上述神经网络的生成方法和数据处理方法中的神经网络的生成的具体方式以及对相关信息的限定和解释可以参见上文中神经网络的生成过程的相关内容(例如，图2所示的相关内容)。

下面结合图10对本申请实施例的加速器的验证平台进行描述，应理解，图10所示的加速器的验证平台能够执行本申请实施例的加速器的检测方法的各个步骤，下面在介绍图10时适当省略重复的描述。

图10是本申请实施例的加速器的验证平台的示意性框图。图10所示的加速器的验证平台2000包括：

存储器2001，用于存储代码；

至少一个处理器2002，用于执行所述存储器中存储的代码，以执行如下操作：

生成至少一个目标神经网络；

将所述至少一个目标神经网络翻译成神经网络指令；

将所述神经网络指令分别输入到加速器以及与所述加速器匹配的软件模型中执行，并确定所述神经网络指令的输出结果的差异；

根据所述神经网络指令的输出结果的差异确定加速器运行过程中出现异常的指令。

应理解，图10中为了方便表示，仅示出了一个处理器2002，事实上，图10所示的验证平台2000可以包含一个或者多个处理器2002。

图11是本申请实施例的生成神经网络的装置的示意性框图。应理解，图11所示的装置3000能够执行本申请实施例的生成神经网络的方法各个步骤，图11所示的装置3000包括：

存储器3001，用于存储代码；

至少一个处理器3002，用于执行所述存储器中存储的代码，以执行如下操作：

生成至少一个目标神经网络；

将所述至少一个目标神经网络翻译成神经网络指令；

应理解，图11中为了方便表示，仅示出了一个处理器3002，事实上，图11所示的装置3000可以包含一个或者多个处理器3002。

图12是本申请实施例的数据处理装置的示意性框图。应理解，图12所示的装置4000能够执行本申请实施例的数据处理方法的各个步骤，图12所示的装置4000包括：

存储器4001，用于存储代码；

至少一个处理器4002，用于执行所述存储器中存储的代码，以执行如下操作：

确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数；

根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式；

根据所述目标连接方式生成所述目标神经网络；

采用所述目标神经网络进行数据处理。

应理解，图12中为了方便表示，仅示出了一个处理器4002，事实上，图12所示的装置4000可以包含一个或者多个处理器4002。

上述加速器的验证平台2000、装置3000以及装置4000具体可以是电子设备或者服务器，这里的电子设备可以是移动终端(例如，智能手机)，电脑，个人数字助理，可穿戴设备，车载设备，物联网设备等包含处理器的设备。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其他任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc，DVD))、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种加速器的检测方法，其特征在于，包括：

生成至少一个目标神经网络；

将所述至少一个目标神经网络翻译成神经网络指令；

将所述神经网络指令分别输入到加速器以及与所述加速器匹配的软件模型中执行，并确定所述神经网络指令的输出结果的差异；

根据所述神经网络指令的输出结果的差异确定加速器运行过程中出现异常的指令。
如权利要求1所述的方法，其特征在于，所述生成至少一个目标神经网络，包括：

确定所述目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数，其中，所述目标神经网络为所述至少一个目标神经网络中的任意一个目标神经网络；

根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式；

根据所述目标连接方式生成所述目标神经网络。
如权利要求2所述的方法，其特征在于，所述根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式，包括：

根据所述节点连接要求确定所述当前节点的候选父节点，其中，所述当前节点和所述候选父节点满足所述节点连接要求；

从所述候选父节点中选择出所述当前节点的实际父节点；

确定所述当前节点与所述当前节点的实际父节点之间的连接关系，以最终生成所述目标连接方式。
如权利要求3所述的方法，其特征在于，所述根据所述节点连接要求确定所述当前节点的候选父节点，包括：

根据以下连接关系中的至少一种，确定所述当前节点的候选父节点；

在当前节点的节点类型为Concat或Eltwise时，所述当前节点的父节点个数为多个，且所述当前节点的父节点个数小于或者等于所述当前节点的候选父节点个数；

在所述当前节点的父节点的节点类型为Active时，所述当前节点的节点类型为Active之外的类型；

在所述当前节点的父节点的节点类型为Global Pooling时，所述当前节点的节点类型为Global Pooling；

在所述当前节点的父节点的节点类型为FC时，所述当前节点的节点类型为FC或者Concat；

在所述当前节点的父节点的节点类型为Conv、Eltwise、Pooling以及Concat时，所述当前节点的节点类型可以为Conv、Eltwise、Pooling、Active、Global Pooling、Concat以及FC中的任意一种。
如权利要求3或4所述的方法，其特征在于，所述从所述候选父节点中选择出所述当前节点的实际父节点，包括：

根据概率密度函数确定候选父节点中的每个节点作为所述当前节点的实际父节点的概率；

根据所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率从所述候选父节点中确定出所述当前节点的实际父节点。
如权利要求5所述的方法，其特征在于，根据所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率从所述候选父节点中确定出所述当前节点的实际父节点，包括：

将所述候选父节点中作为所述当前节点的实际父节点的概率大于预设概率值的节点确定为所述当前节点的实际父节点。
如权利要求5或6所述的方法，其特征在于，所述方法还包括：

根据所述概率密度函数的期望和方差，调整所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率。
如权利要求5-7中任一项所述的方法，其特征在于，所述概率密度函数为高斯函数。
如权利要求1-8中任一项所述的方法，其特征在于，根据所述目标连接方式生成所述目标神经网络，包括：

根据预设的节点有效连接关系，从所述目标连接关系中确定出有效目标连接关系；

根据所述有效目标连接关系生成所述目标神经网络。
如权利要求9所述的方法，其特征在于，所述节点有效连接关系包括下列关系中的至少一种：

在所述当前节点的节点类型为Eltwise时，所述当前节点的多个输入的通道数保持一致；

所述当前节点的节点类型为FC或者GlobalPooling时，所述当前节点的之后不能连接FC、GlobalPooling和act类型之外的其它类型节点。
如权利要求1-10中任一项所述的方法，其特征在于，所述确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数，包括：

根据对所述目标神经网络的运算要求确定所述目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数。
一种神经网络的生成方法，其特征在于，包括：

确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数；

根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式；

根据所述目标连接方式生成所述目标神经网络。
如权利要求12所述的方法，其特征在于，所述根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式，包括：

根据所述节点连接要求确定所述当前节点的候选父节点，其中，所述当前节点和所述候选父节点满足所述节点连接要求；

从所述候选父节点中选择出所述当前节点的实际父节点；

确定所述当前节点与所述当前节点的实际父节点之间的连接关系，以最终生成所述目标连接方式。
如权利要求13所述的方法，其特征在于，所述根据所述节点连接要求确定所述当前节点的候选父节点，包括：

根据以下连接关系中的至少一种，确定所述当前节点的候选父节点；

在当前节点的节点类型为Concat或Eltwise时，所述当前节点的父节点个数为多个，且所述当前节点的父节点个数小于或者等于所述当前节点的候选父节点个数；

在所述当前节点的父节点的节点类型为Active时，所述当前节点的节点类型为Active之外的类型；

在所述当前节点的父节点的节点类型为Global Pooling时，所述当前节点的节点类型为Global Pooling；

在所述当前节点的父节点的节点类型为FC时，所述当前节点的节点类型为FC或者Concat；

在所述当前节点的父节点的节点类型为Conv、Eltwise、Pooling以及Concat时，所述当前节点的节点类型可以为Conv、Eltwise、Pooling、Active、Global Pooling、Concat以及FC中的任意一种。
如权利要求13或14所述的方法，其特征在于，所述从所述候选父节点中选择出所述当前节点的实际父节点，包括：

根据概率密度函数确定候选父节点中的每个节点作为所述当前节点的实际父节点的概率；

根据所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率从所述候选父节点中确定出所述当前节点的实际父节点。
如权利要求15所述的方法，其特征在于，根据所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率从所述候选父节点中确定出所述当前节点的实际父节点，包括：

将所述候选父节点中作为所述当前节点的实际父节点的概率大于预设概率值的节点确定为所述当前节点的实际父节点。
如权利要求15或16所述的方法，其特征在于，所述方法还包括：

根据所述概率密度函数的期望和方差，调整所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率。
如权利要求15-17中任一项所述的方法，其特征在于，所述概率密度函数为高斯函数。
如权利要求12-18中任一项所述的方法，其特征在于，根据所述目标连接方式生成所述目标神经网络，包括：

根据预设的节点有效连接关系，从所述目标连接关系中确定出有效目标连接关系；

根据所述有效目标连接关系生成所述目标神经网络。
如权利要求19所述的方法，其特征在于，所述节点有效连接关系包括下列关系中的至少一种：

在所述当前节点的节点类型为Eltwise时，所述当前节点的多个输入的通道数保持一致；

所述当前节点的节点类型为FC或者GlobalPooling时，所述当前节点的之后不能连接FC、GlobalPooling和act类型之外的其它类型节点。
如权利要求12-20中任一项所述的方法，其特征在于，所述确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数，包括：

根据对所述目标神经网络的运算要求确定所述目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数。
一种数据处理方法，其特征在于，包括：

确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数；

根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式；

根据所述目标连接方式生成所述目标神经网络；

采用所述目标神经网络进行数据处理。
一种加速器的验证平台，其特征在于，包括：

存储器，用于存储代码；

至少一个处理器，用于执行所述存储器中存储的代码，以执行如下操作：

生成至少一个目标神经网络；

将所述至少一个目标神经网络翻译成神经网络指令；

将所述神经网络指令分别输入到加速器以及与所述加速器匹配的软件模型中执行，并确定所述神经网络指令的输出结果的差异；

根据所述神经网络指令的输出结果的差异确定加速器运行过程中出现异常的指令。
如权利要求23所述的验证平台，其特征在于，所述生成至少一个目标神经网络，包括：

确定所述目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数，其中，所述目标神经网络为所述至少一个目标神经网络中的任意一个目标神经网络；

根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式；

根据所述目标连接方式生成所述目标神经网络。
如权利要求24所述的验证平台，其特征在于，所述根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式，包括：

根据所述节点连接要求确定所述当前节点的候选父节点，其中，所述当前节点和所述候选父节点满足所述节点连接要求；

从所述候选父节点中选择出所述当前节点的实际父节点；

确定所述当前节点与所述当前节点的实际父节点之间的连接关系，以最终生成所述目标连接方式。
如权利要求25所述的验证平台，其特征在于，所述根据所述节点连接要求确定所述当前节点的候选父节点，包括：

根据以下连接关系中的至少一种，确定所述当前节点的候选父节点；

在当前节点的节点类型为Concat或Eltwise时，所述当前节点的父节点个数为多个，且所述当前节点的父节点个数小于或者等于所述当前节点的候选父节点个数；

在所述当前节点的父节点的节点类型为Active时，所述当前节点的节点类型为Active之外的类型；

在所述当前节点的父节点的节点类型为Global Pooling时，所述当前节点的节点类型为Global Pooling；

在所述当前节点的父节点的节点类型为FC时，所述当前节点的节点类型为FC或者Concat；

在所述当前节点的父节点的节点类型为Conv、Eltwise、Pooling以及Concat时，所述当前节点的节点类型可以为Conv、Eltwise、Pooling、Active、Global Pooling、Concat以及FC中的任意一种。
如权利要求25或26所述的验证平台，其特征在于，所述从所述候选父节点中选择出所述当前节点的实际父节点，包括：

根据概率密度函数确定候选父节点中的每个节点作为所述当前节点的实际父节点的概率；

根据所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率从所述候选父节点中确定出所述当前节点的实际父节点。
如权利要求27所述的验证平台，其特征在于，根据所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率从所述候选父节点中确定出所述当前节点的实际父节点，包括：

将所述候选父节点中作为所述当前节点的实际父节点的概率大于预设概率值的节点确定为所述当前节点的实际父节点。
如权利要求27或28所述的验证平台，其特征在于，所述验证平台还包括：

根据所述概率密度函数的期望和方差，调整所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率。
如权利要求27-29中任一项所述的验证平台，其特征在于，所述概率密度函数为高斯函数。
如权利要求23-30中任一项所述的验证平台，其特征在于，根据所述目标连接方式生成所述目标神经网络，包括：

根据预设的节点有效连接关系，从所述目标连接关系中确定出有效目标连接关系；

根据所述有效目标连接关系生成所述目标神经网络。
如权利要求31所述的验证平台，其特征在于，所述节点有效连接关系包括下列关系中的至少一种：

在所述当前节点的节点类型为Eltwise时，所述当前节点的多个输入的通道数保持一致；

所述当前节点的节点类型为FC或者GlobalPooling时，所述当前节点的之后不能连接FC、GlobalPooling和act类型之外的其它类型节点。
如权利要求23-32中任一项所述的验证平台，其特征在于，所述确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数，包括：

根据对所述目标神经网络的运算要求确定所述目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数。
一种神经网络的生成装置，其特征在于，包括：

存储器，用于存储代码；

至少一个处理器，用于执行所述存储器中存储的代码，以执行如下操作：

确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数；

根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式；

根据所述目标连接方式生成所述目标神经网络。
如权利要求34所述的装置，其特征在于，所述根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式，包括：

根据所述节点连接要求确定所述当前节点的候选父节点，其中，所述当前节点和所述候选父节点满足所述节点连接要求；

从所述候选父节点中选择出所述当前节点的实际父节点；

确定所述当前节点与所述当前节点的实际父节点之间的连接关系，以最终生成所述目标连接方式。
如权利要求35所述的装置，其特征在于，所述根据所述节点连接要求确定所述当前节点的候选父节点，包括：

根据以下连接关系中的至少一种，确定所述当前节点的候选父节点；

在当前节点的节点类型为Concat或Eltwise时，所述当前节点的父节点个数为多个，且所述当前节点的父节点个数小于或者等于所述当前节点的候选父节点个数；

在所述当前节点的父节点的节点类型为Active时，所述当前节点的节点类型为Active之外的类型；

在所述当前节点的父节点的节点类型为Global Pooling时，所述当前节点的节点类型为Global Pooling；

在所述当前节点的父节点的节点类型为FC时，所述当前节点的节点类型为FC或者Concat；

在所述当前节点的父节点的节点类型为Conv、Eltwise、Pooling以及Concat时，所述当前节点的节点类型可以为Conv、Eltwise、Pooling、Active、Global Pooling、Concat以及FC中的任意一种。
如权利要求35或36所述的装置，其特征在于，所述从所述候选父节点中选择出所述当前节点的实际父节点，包括：

根据概率密度函数确定候选父节点中的每个节点作为所述当前节点的实际父节点的概率；

根据所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率从所述候选父节点中确定出所述当前节点的实际父节点。
如权利要求37所述的装置，其特征在于，根据所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率从所述候选父节点中确定出所述当前节点的实际父节点，包括：

将所述候选父节点中作为所述当前节点的实际父节点的概率大于预设概率值的节点确定为所述当前节点的实际父节点。
如权利要求37或38所述的装置，其特征在于，所述装置还包括：

根据所述概率密度函数的期望和方差，调整所述候选父节点中的每个节点作为所述当前节点的实际父节点的概率。
如权利要求37-39中任一项所述的装置，其特征在于，所述概率密度函数为高斯函数。
如权利要求34-40中任一项所述的装置，其特征在于，根据所述目标连接方式生成所述目标神经网络，包括：

根据预设的节点有效连接关系，从所述目标连接关系中确定出有效目标连接关系；

根据所述有效目标连接关系生成所述目标神经网络。
如权利要求41所述的装置，其特征在于，所述节点有效连接关系包括下列关系中的至少一种：

在所述当前节点的节点类型为Eltwise时，所述当前节点的多个输入的通道数保持一致；

所述当前节点的节点类型为FC或者GlobalPooling时，所述当前节点的之后只能连接FC、GlobalPooling和act类型之外的节点。
如权利要求34-42中任一项所述的装置，其特征在于，所述确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数，包括：

根据对所述目标神经网络的运算要求确定所述目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数。
一种数据处理装置，其特征在于，包括：

存储器，用于存储代码；

至少一个处理器，用于执行所述存储器中存储的代码，以执行如下操作：

确定待生成的目标神经网络的代数，以及所述目标神经网络所有代的节点的节点类型和节点个数；

根据预设的节点连接要求确定连接所述目标神经网络中所有节点的目标连接方式；

根据所述目标连接方式生成所述目标神经网络；

采用所述目标神经网络进行数据处理。