CN114358251A

CN114358251A - 基于图价值网络的神经网络架构搜索方法

Info

Publication number: CN114358251A
Application number: CN202111677508.1A
Authority: CN
Inventors: 朱文武; 王鑫; 秦一鉴
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2022-04-15

Abstract

本申请提供了一种基于图价值网络的神经网络架构搜索方法，涉及神经网络架构搜索技术领域，旨在提供一种学习已搜索过的架构，以推理得到其他网络架构的神经网络架构搜索方法。所述方法包括：获取神经细胞的当前架构；以图价值网络为价值函数，以所述神经细胞的当前架构为状态，以改变所述神经细胞的当前架构的多种规定行为为动作，进行强化学习训练，得到目标神经细胞的架构；将多个相同的所述目标神经细胞的架构进行堆叠，得到神经网络的架构。

Description

基于图价值网络的神经网络架构搜索方法

技术领域

本申请涉及神经网络架构搜索技术领域，特别是涉及一种基于图价值网络的神经网络架构搜索方法。

背景技术

设计神经网络的架构一直以来是一个难题。神经网络架构搜索旨在让计算机通过搜索算法自动得出搜索空间中的最优架构。

相关技术中的搜索方法着重于搜索策略，对于如何从已搜索过的网络架构的表现中学习到知识，从而推理得到其它网络架构的表现的考虑不足，而将其简单化，往往假设网络中不同操作相互独立，不能学习到已搜索过的网络架构。

发明内容

鉴于上述问题，本发明实施例提供了一种基于图价值网络的神经网络架构搜索方法，以便克服上述问题或者至少部分地解决上述问题。

本发明实施例提供的一种基于图价值网络的神经网络架构搜索方法，所述方法包括：

获取神经细胞的当前架构；

以图价值网络为价值函数，以所述神经细胞的当前架构为状态，以改变所述神经细胞的当前架构的多种规定行为为动作，进行强化学习训练，得到目标神经细胞的架构；

将多个相同的所述目标神经细胞的架构进行堆叠，得到神经网络的架构。

可选地，以图价值网络为价值函数，以所述神经细胞的当前架构为状态，以改变所述神经细胞的当前架构的多种规定行为为动作，进行强化学习训练，得到目标神经细胞的架构，包括：

步骤1：对所述神经细胞的当前架构执行多种规定行为，得到所述神经细胞的多个搜索架构

步骤2：获取所述图价值网络对所述神经细胞的多个搜索架构的评分；

步骤3：以所述神经细胞的多个搜索架构中评分最高的架构，更新所述神经细胞的当前架构；

重复步骤1-3，满足预设条件时，停止更新所述神经细胞的当前架构，将最后一次更新的当前架构作为所述目标神经细胞的架构。

可选地，所述预设条件包括：所述神经细胞上一次更新后的架构为被执行终止动作后的架构；和/或

所述图价值网络对所述神经细胞的多个搜索架构的评分，低于所述图价值网络对所述神经细胞的上一次更新后的架构的评分。

可选地，所述方法还包括：

获取神经细胞的多个样本架构；

将所述多个样本架构作为预设图价值网络的输入，对所述预设图价值网络进行训练，所述预设图价值网络输出所述多个样本架构的预测评分，其中，所述损失函数是根据每个样本架构的预测评分和超网络的评分确定的；

当所述损失函数收敛到最小值时，结束对所述预设图价值网络的训练，得到所述图价值网络；

获取所述图价值网络对所述神经细胞的多个搜索架构的评分，包括：

将所述神经细胞的多个搜索架构输入所述图价值网络，得到所述图价值网络输出的所述神经细胞的多个搜索架构的评分。

可选地，将所述神经细胞的多个搜索架构输入所述图价值网络，得到所述图价值网络输出的所述神经细胞的多个搜索架构的评分，包括：

将所述神经细胞的多个搜索架构建模为对应的多个有向图；

将所述多个有向图输入所述图价值网络的卷积层，得到所述多个有向图的特征；

将所述多个有向图的特征依次输入所述图价值网络的全连接层和激活层，得到所述多个有向图的价值；

将所述多个有向图的价值，作为所述图价值网络输出的所述神经细胞的多个搜索架构对应的评分。

可选地，所述神经细胞包括具有连接关系的多个块；将所述神经细胞的多个搜索架构建模为对应的多个有向图，包括：

将所述神经细胞中的块建模为有向图中的点，且以独热编码表征所述块的操作类型；

将所述块之间的连接关系建模为有向图中的边；

将所述神经细胞的输入建模为有向图中的源；

将所述神经细胞的输出建模为有向图中的汇。

可选地，所述神经细胞包括具有连接关系的多个块，所述块接收任意数量个输入，所述输入包括同一个神经细胞中排序在前的块的输出，和/或排序在前的多个神经细胞的输出；

连接所述多个块的输出，得到所述神经细胞的输出。

可选地，在连接所述多个块的输出之前，包括：

获取所述多个块中每个块的输入；

针对所述每个块，将块的输入相加，执行预设操作，得到所述块的输出，其中，所述预设操作为卷积、池化和直接连接中的任一者。

可选地，所述改变所述神经细胞的当前架构的多种规定行为包括：更改块的操作类型、增加连接关系、删除连接关系、终止动作。

本发明实施例包括以下优点：

本实施例中，可以获取神经细胞的当前架构；以图价值网络为价值函数，以所述神经细胞的当前架构为状态，以改变所述神经细胞的当前架构的多种规定行为为动作，进行强化学习训练，得到目标神经细胞的架构；将多个相同的所述目标神经细胞的架构进行堆叠，得到神经网络的架构。如此，以神经细胞的当前架构为状态进行强化学习训练，可以学习到已搜索过的架构；以图价值网络为价值函数，可以准确评判各架构的价值；利用目标神经细胞的架构堆叠得到神经网络的架构，只需搜索一个神经细胞的架构就可以搭建整个神经网络，以便节约计算量。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例中一种基于图价值网络的神经网络架构搜索方法的步骤流程图；

图2是本发明实施例中一种根据神经细胞的架构建模成的有向图的示意图；

图3是本发明实施例中神经细胞的一个搜索架构示意图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

相关技术中的搜索方法主要分为基于强化学习的方法、基于进化算法的方法和基于梯度的方法。其中，相关技术中的基于强化学习的搜索方法，通常是将神经细胞内部架构看作是链式架构，从前往后依次构建，因而状态被定义为已构建好的神经细胞架构的前缀部分，而动作被定义为神经网络中的一个块，可以被添加到前缀部分的末尾。该方法在学习已搜索过的网络架构以推理得到其他网络架构方面的考虑不足，忽略了实际的神经网络中，不同的操作和不同的操作之间的连接关系与网络的表项之间的复杂关系。

相关技术中的搜索方法，当搜索空间允许神经网络层有任意数量的输入来源时，神经网络模型中的边的数量会变得不确定。为了避免边的数量不确定的技术问题，为了简化搜索难度，相关技术中的搜索方法限制了每个神经网络层的输入来源个数，并且采用直接对搜索空间整体分布建模或使用链式模型建模的方式探索搜索空间。但是在搜索空间上的限制会使得模型无法搜索出更复杂的神经网络架构。

为解决相关技术中的搜索方法限制输入来源个数、不能学习到已搜索过的网络架构等问题，申请人提出：设计一种利用图价值网络搜索最优的神经网络架构，且自动学习已搜索过的网络架构搜索方法，以搜索一种允许任意数量的输入来源、非链式的神经网络架构。

参照图1所示，示出了本发明实施例中一种基于图价值网络的神经网络架构搜索方法的步骤流程图，如图1所示，该方法具体可以包括以下步骤：

步骤S11：获取神经细胞的当前架构。

本申请实施例扩展了相关方法的神经网络定义方式，本方法的搜索空间定义采取微观架构的框架，即整个神经网络架构是由多个相同的神经细胞架构堆叠而成。在获取到神经细胞的架构之后，只需以相同的架构，将神经细胞作为节点进行堆叠即可得到到神经网络。因此只需要搜索一个神经细胞中的微观架构就可以搭建出整个神经网络的架构。

可选地，作为一个实施例，所述神经细胞包括具有连接关系的多个块，所述块接收任意数量个输入，所述输入包括同一个神经细胞中排序在前的块的输出，和/或排序在前的多个神经细胞的输出；连接所述多个块的输出，得到所述神经细胞的输出。

一个神经细胞内部由多个块组成，每一个块可以接收任意数量个输入。这些输入既可以来源于同一个神经细胞中排序在前的块，也可以来源于排序在前的多个神经细胞的输出。排序在前的神经细胞指可以直接向当前的神经细胞进行输入的细胞。

神经细胞的输出是将其内部的每个块的输出进行矢量相连，因此，为了得到神经细胞的输出，需要先获取该神经细胞中每个块的输出。

可选地，作为一个实施例，在连接所述多个块的输出之前，包括：获取所述多个块中每个块的输入；针对所述每个块，将块的输入相加，执行预设操作，得到所述块的输出，其中，所述预设操作为卷积、池化和直接连接中的任一者。

为了获取一个块的输出，需要先将该块的所有输入相加，然后执行一个预设操作。预设操作的候选集是预先确定的，包括卷积、池化和直接连接。对相加后的块的输入执行预设操作后，得到的特征即是这个块的输出。

每一个细胞会将其内部所有的块的输出进行矢量相加，作为整个细胞的输出。

步骤S12：以图价值网络为价值函数，以所述神经细胞的当前架构为状态，以改变所述神经细胞的当前架构的多种规定行为为动作，进行强化学习训练，得到目标神经细胞的架构。

图价值网络用于评估神经细胞的各种架构的价值，以图价值网络为深度强化学习中的价值函数，以神经细胞的当前架构为状态，以改变神经细胞的当前架构的多种规定行为为动作，进行强化学习，得到目标神经细胞的架构。目标神经细胞的架构为在当前架构的基础上，经过多种规定行为改变之后具有最高价值的架构。如此，强化学习可以不断学习到图价值网络评估的价值最高的架构。

相关技术中通常是将神经细胞内部架构看作是链式架构，从前往后依次构建。因而相关技术中基于强化学习的搜索方法中的状态被定义为已构建好的细胞架构的前缀部分，而动作被定义为神经网络中的一个块，可以被添加到前缀部分的末尾。

本申请实施例中，需要处理任意数量的输入边，因此将状态定义为整个神经细胞的当前架构，而动作则是改变神经细胞的当前架构的若干种规定行为，包括更改某一个块的操作类型，增加或删除块之间的连接关系，以及终止动作。

可选地，作为一个实施例，所述改变所述神经细胞的当前架构的规定行为包括：更改块的操作类型、增加连接关系、删除连接关系、终止动作。

一个神经细胞内部由确定数量的多个块组成，这些块之间具有连接关系。改变神经细胞的当前架构的规定行为包括更改某一个块的操作类型，增加或删除块之间的连接关系、终止动作。其中当神经细胞被执行终止动作，则被执行终止动作的神经细胞为目标神经细胞。

步骤S13：将多个相同的所述目标神经细胞的架构进行堆叠，得到神经网络的架构。

在得到目标神经细胞的架构之后，将多个相同的目标神经细胞的架构进行堆叠，即可得到神经网络的架构。因为目标神经细胞的架构为具有最高价值的架构，因此通过目标神经细胞的架构得到的神经网络的架构也是最优的网络架构。

可选地，作为一个实施例，以图价值网络为价值函数，以所述神经细胞的当前架构为状态，以改变所述神经细胞的当前架构的多种规定行为为动作，进行强化学习训练，得到目标神经细胞的架构，包括：

神经细胞中块的数量是确定的，初始化神经细胞的当前架构。对初始化后的神经细胞的当前架构执行改变架构的行为，以得到多个神经细胞的初始化后的当前架构在执行了各不相同的一种行为后，分别得到的多个各不相同神经细胞的搜索架构。例如，对神经细胞的当前架构执行了删除一个连接关系的行为后得到一个搜索架构，对神经细胞的当前架构执行了增加一个连接关系的行为后得到另一个搜索架构，对神经细胞的当前架构执行了更改一个块的操作类型的行为后得到再一个搜索架构。在执行完所有改变神经细胞的当前架构的多种规定行为之后，得到该神经细胞的多个搜索架构。

利用图价值网络对神经细胞的多个搜索架构的评分，其中，图价值网络是预先训练好的，训练图价值网络的方法将在后文详述。

获取了图价值网络对神经细胞的多个搜索架构的评分后，以该多个搜索架构中评分最高的架构作为目标架构，并用目标架构替换神经细胞的当前架构，即，将神经细胞的当前架构更新为目标架构。

接下来以目标架构为神经细胞的当前架构，继续重复获取以目标架构为基础得到的多个搜索架构，以再得到新的目标架构。

重复得到目标架构以更新当前架构的步骤，直到满足预设条件时，停止更新神经细胞的当前架构，并以最后一次更新的当前架构作为目标神经细胞的架构。将多个相同的目标神经细胞的架构进行堆叠，得到神经网络的架构。

可选地，作为一个实施例，所述预设条件包括：所述神经细胞上一次更新后的架构为被执行终止动作后的架构；和/或

因为当神经细胞被执行终止动作，则被执行终止动作的神经细胞为目标神经细胞，所以停止进行更新的预设条件包括神经细胞上一次更新后的架构为被执行终止动作后的架构。

停止更新的预设条件还可以包括当前架构的评分高于该当前架构被执行多种规定行为后得到的多个搜索架构的评分，即图价值网络对神经细胞的多个搜索架构的评分，低于图价值网络对该神经细胞的上一次更新后的架构的评分。目标神经细胞的架构是价值最高的架构，因此在当前架构的评分高于该当前架构被执行多种规定行为后得到的多个搜索架构的评分时，则无需继续对当前架构执行多种规定行为。

可选地，作为一个实施例，所述方法还包括：

获取神经细胞的多个样本架构；

为了利用图价值网络得到神经细胞的多个搜索架构的评分，以将图价值网络作为强化学习中的价值函数，需要对预设图价值网络进行训练，以得到训练好的图价值网络。

为了训练图价值网络，首先需要获取样本集。样本集为多个不同的神经细胞各自的多个样本架构，其中每个神经细胞的多个样本架构可以是基于同一个当前架构进行多种规定行为后得到的架构。

将多个样本架构和超网络输入预设图价值网络，得到预设图价值网络输出的每个样本架构的预测评分。基于损失函数引导预设图价值网络进行训练，其中损失函数是根据每个样本架构的预测评分和超网络的评分确定的。超网络就是通过标准机器学习训练和测试得到的。超网络本质上是一种权重共享的训练和测试技术，可以在需要同时训练和测试多种神经网络时节省时间，超网络的分数是网络架构通过标准测试加权重共享技术得到的。

当损失函数收敛到最小值时，结束对预设图价值网络的训练，得到训练好的图价值网络。将神经细胞的架构输入到图价值网络，则可以得到图价值网络输出的神经细胞的架构的评分，评分越高证明该架构越好。

可选地，作为一个实施例，将所述神经细胞的多个搜索架构输入所述图价值网络，得到所述图价值网络输出的所述神经细胞的多个搜索架构的评分，包括：

将所述神经细胞的多个搜索架构建模为对应的多个有向图；

图价值网络通过输入的神经细胞的架构得到架构的评分的方法包括先将神经细胞的架构建模为对应的有向图。其中，将神经细胞的架构建模为有向图的方法包括：将所述神经细胞中的块建模为有向图中的点，且以独热编码表征所述块的操作类型；将所述块之间的连接关系建模为有向图中的边；将所述神经细胞的输入建模为有向图中的源；将所述神经细胞的输出建模为有向图中的汇。块之间的有向的连接关系表征了块之间的输入和输出。

图2示出了本发明实施例中一种根据神经细胞的架构建模成的有向图的示意图，其中矩形表征源，空心点表征汇，实心点表征块，有向边表征块之间的连接关系。

可选地，可以用其它符号、形状表征神经细胞的架构，从而建模得到其它形状的有向图。

在图2示出的神经细胞的架构的基础上，可以对该架构执行增加连接关系的行为，以得到图3示出的神经细胞的一个搜索架构示意图。可以理解的是，图3仅仅示出了增加连接关系的行为得到的一个搜索架构，连接关系也可以增加在其它块之间，以得到另一不同的搜索架构。除了增加连接关系之外，还可以对该神经细胞的架构执行其他改变架构的行为。

在将神经细胞的多个搜索架构建模为对应的多个有向图之后，将该多个有向图输入图价值网络的卷积层，得到所述多个有向图的特征，具体地，本申请实施例中利用三层图卷积神经网络来学习有向图的特征，将不同搜索架构的神经细胞输出的特征作为对应的搜索架构的特征。

将多个有向图的特征依次输入图价值网络的一层全连接层和一层激活层，得到多个有向图的价值，其中，激活层可以采用sigmoid函数(一种激活函数)。将多个有向图的价值，作为图价值网络输出的神经细胞的多个搜索架构对应的评分。

采用本申请实施例的技术方案，具有如下优点：

1、神经细胞的块可以接收任意数量个输入，因此得到的神经细胞以及神经网络都可以接收任意数量个输入，从而使神经网络具有更广阔的搜索空间，考虑神经网络架构中的复杂信息，可以搜索出更复杂的神经网络架构；

2、将搜索空间定位为微观架构的框架，因此只需搜索一个神经细胞的微观架构即可搭建出整个神经网络，可以节约计算量；

3、将神经细胞架构建模为有向图，通过图价值网络学习图的特征与神经网络表现之间的关系，以自动搜索出最有价值的神经细胞架构，得到最优的神经网络架构；通过图价值网络对神经网络中的复杂信息进行评估，可以有效提升神经网络架构搜索的效率和效果；

4、强化学习中将状态定义为整个神经细胞的当前架构，将动作定义为改变神经细胞的当前架构的若干种规定行为，因此强化学习过程中可以学习到已搜索的架构。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、装置、电子设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种基于图价值网络的神经网络架构搜索方法，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种基于图价值网络的神经网络架构搜索方法，其特征在于，所述方法包括：

获取神经细胞的当前架构；

2.根据权利要求1所述的方法，其特征在于，以图价值网络为价值函数，以所述神经细胞的当前架构为状态，以改变所述神经细胞的当前架构的多种规定行为为动作，进行强化学习训练，得到目标神经细胞的架构，包括：

步骤1：对所述神经细胞的当前架构执行多种规定行为，得到所述神经细胞的多个搜索架构；

重复步骤1-3，在满足预设条件时，停止更新所述神经细胞的当前架构，将最后一次更新的当前架构作为所述目标神经细胞的架构。

3.根据权利要求2所述的方法，其特征在于，所述预设条件包括：所述神经细胞上一次更新后的架构为被执行终止动作后的架构；和/或

4.根据权利要求2所述的方法，其特征在于，所述方法还包括：

获取神经细胞的多个样本架构；

5.根据权利要求4所述的方法，其特征在于，将所述神经细胞的多个搜索架构输入所述图价值网络，得到所述图价值网络输出的所述神经细胞的多个搜索架构的评分，包括：

将所述神经细胞的多个搜索架构建模为对应的多个有向图；

6.根据权利要求5所述的方法，其特征在于，所述神经细胞包括具有连接关系的多个块；将所述神经细胞的多个搜索架构建模为对应的多个有向图，包括：

将所述块之间的连接关系建模为有向图中的边；

将所述神经细胞的输入建模为有向图中的源；

将所述神经细胞的输出建模为有向图中的汇。

7.根据权利要求1所述的方法，其特征在于，所述神经细胞包括具有连接关系的多个块，所述块接收任意数量个输入，所述输入包括同一个神经细胞中排序在前的块的输出，和/或排序在前的多个神经细胞的输出；

连接所述多个块的输出，得到所述神经细胞的输出。

8.根据权利要求7所述的方法，其特征在于，在连接所述多个块的输出之前，包括：

获取所述多个块中每个块的输入；

9.根据权利要求1所述的方法，其特征在于，所述改变所述神经细胞的当前架构的多种规定行为包括：更改块的操作类型、增加连接关系、删除连接关系、终止动作。