WO2020147450A1

WO2020147450A1 - 基于计算图进化的ai模型自动生成的方法

Info

Publication number: WO2020147450A1
Application number: PCT/CN2019/123267
Authority: WO
Inventors: 钱广锐; 宋煜; 傅志文; 吴开源
Original assignee: 探智立方(北京)科技有限公司
Priority date: 2019-01-15
Filing date: 2019-12-05
Publication date: 2020-07-23
Also published as: CN109784497B; CN109784497A

Abstract

本发明提供一种基于计算图进化的AI模型自动生成的方法,主要包括如下步骤：预设数据；利用遗传算法算子生成第一代计算图模型并根据其计算图结构计算模型性能；去除无效用模型和重复模型，剩余模型作为备选模型并保留作为下一代种子；挑出若干数量最优模型；备选模型使用遗传算法算子产生一个计算图新模型；判断上一步产生的计算图新模型是否生成过；保存新模型为新一代计算图模型，判断其是否满足预设数据和进化结束条件；进化计算结果汇总，选择出最优模型。本发明可以同时做机器学习和深度学习；避免相同模型的被重复计算的次数，提升模型设计效率；跳出局部最优；防止搜索网络的性能的衰退；不需要通过实际数据进行训练就可直接评估。

Description

基于计算图进化的AI模型自动生成的方法

技术领域

本发明涉及AI模型(AI模型即人工智能模型)相关技术领域，具体涉及一种基于计算图进化的AI模型自动生成的方法。

背景技术

AI模型自动生成是前沿的研究领域。自动模型生成可以根据数据的分布生成更加简单高效的神经网络。AI模型自动生成的搜索空间为f ⁿ×2 ^n(n-1)/2，其中f是不同神经元算子个数，n为神经网络最大深度。可以看到在生成过程中，随着支持的神经网络算子的增加和网络的加深，问题的复杂度可能会变成趋近于无穷搜索空间的问题，从而导致无法求解。

目前主要的搜索方法有强化学习(即增强学习)、蒙特卡洛树搜索(随机抽样或统计实验方法)等方法。但是这些方法都需要先积累一定的统计信息，生成一个对模型设计有效的先验概率以后才可能在有限周期内，搜索到较好的神经网络模型结构。在传统算法拟合选出网络后，只能完整运行来寻找进一步的搜索方向。但是在深度学习领域，一次训练的实际时间会是数十分钟，甚至数十小时。而很多时候，当搜索朝向最优解逼近的时候，网络差异也在变小，而类似网络的训练结果会很相近，这样就导致整个模型搜索过程非常的长。目前深度学习的一次完整训练在数小时到数周不等，而自动神经网络设计需要大量的训练为基础才能找到最优解，随着网络的加深，在现有计算力的情况下，几乎会变成一个无解的问题。

发明内容

本发明的目的是：

针对上述现有技术的不足，提供了基于计算图进化的AI模型自动生成的方法，可以同时做机器学习和深度学习；避免相同模型的被重复计算的次数，提升模型设计效率；保证多样性和采样空间的均匀分布，实现在局域最优范围内的搜索，同时实现跳出局部最优；保证搜索的效率，防止搜索网络的性能的衰退；不需要通过实际数据进行训练就可以直接评估。

本发明的目的可通过以下的技术方案来实现：

一种基于计算图进化的AI模型自动生成的方法，包括以下步骤：

步骤(1)：根据用户预设的数据，进行数据准备，设置模型设计平台生产参数，开始模型自动设计；

步骤(2)：利用遗传算法算子生成第一代计算图模型；

步骤(3)：

a、根据第一代计算图结构计算模型性能；

b、根据计算图性能(比如其准确率)和复杂度，计算每一个计算图模型的适应度；

步骤(4)：根据模型适应度，去除无效用模型和重复模型，剩余模型作为备选模型，并保留作为下一代种子；

步骤(5)：根据步骤(4)保留的下一代种子，挑出若干数量最优模型；

步骤(6)：根据步骤(4)选择出的作为下一代种子的备选模型使用遗传算法算子产生一个计算图新模型；

步骤(7)：判断步骤(6)产生的计算图新模型是否为已经生成过的计算图模型，如否，进入步骤(8)；如是，返回步骤(6)；

步骤(8)：保存步骤(5)、(7)的计算图模型为新一代计算图模型；

步骤(9)：判断是否步骤(8)的新一代计算图模型的数量满足步骤(1)中预设的数据，如是，进入下一步；如否，返回步骤(6)；

步骤(10)：

a、对生命周期超过三代的模型，则再进行寻找最优解或者靠近最优解的次优解的超参搜索，所述生命周期超过三代的定义同遗传算法中“代”数的定义，自该模型结构第一次出现在本流程中开始算为第一代，超参搜索后保留下来的模型进入步骤(11)；

b、对生命周期没有超过三代的模型，根据计算图结构计算模型性能，根据计算图性能和复杂度计算每一个计算图模型的适应度，然后进入步骤(11)；

步骤(11)：判断计算图新模型是否满足步骤(1)中预设的进化结束条件，如满足，进入步骤(12)；如不满足，返回步骤(3b)；

步骤(12)：进化计算结果汇总，根据模型复杂度和准确率进行综合评分，选择出最优模型。

所述步骤(1)中用户预设的数据，包括了数据的统计分布、数据维度间相关系数和/ 或数据各维度和标签之间的统计相关性。

所述步骤(1)中设置的模型设计平台生产参数包括了计算资源、作业运行时间、作业目标如新一代计算图模型数量、进化结束条件，和/或遗传学算法参数。所述作业目标包含了计算图模型的适应度阀值：包括了被认为满足进化结束条件的适应度阀值，和被认为是无效用模型的适应度阀值。

所述步骤(2)、(6)所述遗传算法算子包括了随机算子、交叉算子和/或变异算子。

所述随机算子为随机选取神经元个数、随机选取神经元种类和/或随机决定神经元连接关系。

所述步骤(3)、(10)中所述的复杂度指根据计算图的节点数量和边的数量来计算的复杂度。

所述步骤(10)所述超参搜索中超参指的是AI里面神经网络的控制参数，包括了学习率、即参数和/或权值衰减参数。

本发明的有益效果在于：

1、本发明的方法有广泛的使用场景：本发明的方法基于计算图的编码方式，可以实现对机器学习、深度学习的网络的统一编码，采用同一套的框架实现网络的自动化设计，在机器学习(如堆叠(Stacking)模式)和深度学习的神经网络都可以使用。

2、提升模型设计效率：本发明的方法比对相同模型，可以避免相同模型的被重复计算的次数，从而提升了模型设计效率。

3、保证多样性和采样空间的均匀分布，实现在局域最优范围内的搜索，同时实现跳出局部最优：本发明的方法可使用不同的算子——随机算子和交叉算子可以保证多样性和采样空间的均匀分布，变异算子可以实现在局域最优范围内的搜索的同时实现跳出局部最优的特点。

4、保证搜索的效率，防止搜索网络的性能的衰退：每代都保留最优模型，可以保证搜索的效率，防止搜索网络的性能的衰退。

5、本发明的方法根据模型数据进行评分，不需要通过实际数据进行训练就可以直接评估。

附图说明

图1为本发明实现的总流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明。

如图1所示，本发明实现的步骤如下：

步骤(1)：根据用户预设的数据，进行数据准备，设置模型设计平台生产参数，开始模型自动设计。用户预设的数据，包括了数据的统计分布、数据维度间相关系数和/或数据各维度和标签之间的统计相关性。步骤(1)中设置的模型设计平台生产参数包括了计算资源、作业运行时间、作业目标如新一代计算图模型数量、进化结束条件，和/或遗传学算法参数——如种群个数、代数、变异、交叉及随机的所占百分比。所述作业目标包含了计算图模型的适应度阀值：包括了被认为满足进化结束条件的适应度阀值，和被认为是无效用模型的适应度阀值。本步骤中预设的具体数据根据实际生产中用户的需求而定。

步骤(2)：利用遗传算法算子生成第一代计算图模型；所述遗传算法算子包括了随机算子、交叉算子和/或变异算子。所述随机算子为随机选取神经元个数、随机选取神经元种类和/或随机决定神经元连接关系。

步骤(3)：

a、根据第一代计算图结构计算模型性能(比如其准确率)；

b、根据计算图性能和复杂度，计算每一个计算图模型的适应度。本步骤中所述的复杂度指根据计算图的节点数量和边的数量来计算的复杂度。

步骤(6)：根据步骤(4)选择出的作为下一代种子的备选模型使用遗传算法算子产生一个计算图新模型。所述遗传算法算子包括了随机算子、交叉算子和/或变异算子。所述随机算子为随机选取神经元个数、随机选取神经元种类和/或随机决定神经元连接关系。

步骤(10)：

a、对生命周期超过三代的模型，则再进行寻找最优解或者靠近最优解的次优解的超参搜索，所述生命周期超过三代的定义同遗传算法中“代”数的定义，自该模型结构第一次出现在本流程中开始算为第一代，超参搜索后保留下来的模型进入步骤(11)。模型超参数是模型外部的配置，其值不能从数据估计得到，而是通常由实践者直接指定，应用于估计模型参数的过程中，通常可以使用网格搜索、随机搜索、启发式搜索、贝叶斯搜索等方法来设置，根据给定的预测建模问题而调整。本步骤所述“超参搜索”(即超参数搜索)中的超参数指的是AI里面神经网络的控制参数，包括了学习率、即参数和/或权值衰减参数。

b、对生命周期没有超过三代的模型，根据计算图结构计算模型性能，根据计算图性能和复杂度计算每一个计算图模型的适应度，然后进入步骤(11)。本步骤中所述的复杂度指根据计算图的节点数量和边的数量来计算的复杂度。

步骤(11)：判断计算图新模型是否满足步骤(1)中预设的进化结束条件，预设的进化结束条件根据用户具体定义的内容，比如：准确率超过用户期望、用时达到用户设置的最大时长等，如满足，进入步骤(12)；如不满足，返回步骤(3b)；

实施例一：

如步骤(1)所述，用户准备数值计算数据(采用csv格式或图片格式)，且数据中包标签列；设置模型最大进化代数为3代，每一代模型种群数量为5；预设置适应度越小模型性能越优；计算图模型的适应度阀值——如果最优模型适应度小于50则认为满足进化结束条件，计算停止；预设适应度超过1000的模型被认为是无效用模型。

如步骤(2)所述，利用遗传随机算子随机生成第一代5个模型，分别为：随机生成第一代5个模型，分别为：计算图模型1、计算图模型2、计算图模型3、计算图模型4和计算图模型5。

如步骤(3)所述，对计算图模型1、计算图模型2、计算图模型3、计算图模型4和计算图模型5的模型表达向量进行编码：

·计算图模型1:[op1-op2，op2-op3，op2-op4，…，op5-op6]

·计算图模型2:[op1-op2，op1-op3，op2-op4，…，op8-op9]

·计算图模型3:[op1-op2，op1-op3，op1-op4，…，op9-op10]

·计算图模型4:[op1-op2，op2-op3，op2-op4，…，op14-op15]

·计算图模型5:[op1-op2，op1-op3，op2-op3，…，op7-op8]

本实施例中，计算图的性能以计算图模型的准确率为衡量标准。分别计算计算图模型1、计算图模型2、计算图模型3、计算图模型4和计算图模型5的准确率(以下采用P来表示准确率)，本实施例中：计算图模型1的P ₁＝10，计算图模型2的P ₂＝200，计算图模型3的P ₃＝500，计算图模型4的P ₄＝800，计算图模型5的P ₅＝300。

计算复杂度(以下采用N来表示复杂度)，本实施例中：计算图模型1的N ₁＝6，计算图模型2的N ₂＝9，计算图模型3的N ₃＝10，计算图模型4的N ₄＝15，计算图模型5的N ₅＝8。

计算每个计算图模型的适应度(以下采用F来表示适应度)，采用公式F＝P+10*N(适应度公式也可以采用其他公式)，本实施例中：计算图模型1的F ₁＝70，计算图模型2的F ₂＝290，计算图模型3的F ₃＝600，计算图模型4的F ₄＝1050，计算图模型5的F ₅＝380。

如步骤(4)所述，去除无效用模型和重复模型，因上述计算图模型1-5没有重复模型，故去除重复模型，根据本实施例的预设，当适应度超过1000则认为是无效用模型，故去除相应计算图模型4；剩余模型对于计算图模型1、计算图模型2、计算图模型3和计算图模型5作为备选模型，并保留作为下一代种子。

如步骤(5)所述，计算图模型1中F最小，作为最优模型，保留为新一代计算图模型。

如步骤(6)所述，使用遗传随机算子生成计算图模型a，模型表达向量为：

[op1-op2，op1-op3，op2-op4，…，op11-op12]

所述步骤(7)所述，判断模型是否是已经生成过的计算图模型，模型a和已有模型(计算图模型1、计算图模型2、计算图模型3、计算图模型4和计算图模型5)是不相同或者性能不相似的，所以是新模型。计算图模型a的准确率P _a＝250，复杂度N _a＝12，适应度F _a＝370。

如步骤(8)所述，把计算图模型a保存为新一代计算图模型6。

如步骤(9)所述，因为预设的每一代模型种群数量为5个，而目前只有计算图模型6这一个模型，所以不满足预设条件，应返回步骤(6)继续生成计算图模型。

当重复上述步骤(6)—(8)后，得到满足条件的新一代计算图模型7、计算图模型8、计算图模型9和计算图模型10后，种群数量达到5，则满足了预设数据，进入下一步。

如步骤(10)所述，目前保留下来的计算图模型不超过三代。已知计算图模型1的P ₁＝10，N ₁＝6，F ₁＝70。计算步骤(9)产生的计算图模型6、计算图模型7、计算图模型8、计算图模型9和计算图模型10的适应度——计算图模型6的准确率P ₆＝250，复杂度N ₆＝12，适应度为F ₆＝370；计算图模型7的准确率P ₇＝810，复杂度N ₇＝15，适应度为F ₆＝998；计算图模型8的准确率P ₈＝22，复杂度N ₈＝8，适应度为F ₈＝92；计算图模型9的准确率P ₉＝42，复杂度N ₉＝9，适应度为F ₉＝130；计算图模型10的准确率P ₁₀＝4，复杂度N ₁₀＝5，适应度为F ₁₀＝48。

如步骤(11)所述，因计算图模型10的适应度F ₁₀＝48，满足适应度小于50进化条件。

如步骤(12)所述，“根据模型复杂度和性能进行评分”：本实施例的步骤(1)中预设了适应度越小模型性能越优，本实施例的适应度的计算采用公式F＝P+10*N。经比较，计算图模型10的适应度最小，计算图模型10为最优模型。模型自动生成结束。

虽然在这里通过某个或某些特殊配置描述和阐明本发明，然而其目的并不在于限制所述细节，因为可能在专利要求范围内有各种修改和结构变更，并不偏离发明精神。

本发明涉及部分均与现有技术相同或可采用现有技术加以实现。

Claims

一种基于计算图进化的AI模型自动生成的方法，其特征在于包括以下步骤：

步骤(1)：根据用户预设的数据，进行数据准备，设置模型设计平台生产参数，开始模型自动设计；

步骤(2)：利用遗传算法算子生成第一代计算图模型；

步骤(3)：

a、根据第一代计算图结构计算模型性能；

b、根据计算图性能和复杂度，计算每一个计算图模型的适应度；

步骤(4)：根据模型适应度，去除无效用模型和重复模型，剩余模型作为备选模型，并保留作为下一代种子；

步骤(5)：根据步骤(4)保留的下一代种子，挑出若干数量最优模型；

步骤(6)：根据步骤(4)选择出的作为下一代种子的备选模型使用遗传算法算子产生一个计算图新模型；

步骤(7)：判断步骤(6)产生的计算图新模型是否为已经生成过的计算图模型，如否，进入步骤(8)；如是，返回步骤(6)；

步骤(8)：保存步骤(5)、(7)的计算图模型为新一代计算图模型；

步骤(9)：判断是否步骤(8)的新一代计算图模型的数量满足步骤(1)中预设的数据，如是，进入下一步；如否，返回步骤(6)；

步骤(10)：

a、对生命周期超过三代的模型，则再进行寻找最优解或者靠近最优解的次优解的超参搜索，所述生命周期超过三代的定义同遗传算法中“代”数的定义，自该模型结构第一次出现在本流程中开始算为第一代，超参搜索后保留下来的模型进入步骤(11)；

b、对生命周期没有超过三代的模型，根据计算图结构计算模型性能，根据计算图性能和复杂度计算每一个计算图模型的适应度，然后进入步骤(11)；

步骤(11)：判断计算图新模型是否满足步骤(1)中预设的进化结束条件，如满足，进入步骤(12)；如不满足，返回步骤(3b)；

步骤(12)：进化计算结果汇总，根据模型复杂度和准确率进行综合评分，选择出最优模型。
如权利要求1所述的基于计算图进化的AI模型自动生成的方法，其特征在于所述步骤(1)中用户预设的数据，包括了数据的统计分布、数据维度间相关系数和/或数据各维度和标签之间的统计相关性。
如权利要求1所述的基于计算图进化的AI模型自动生成的方法，其特征在于所述步骤(1)中设置的模型设计平台生产参数包括了计算资源、作业运行时间、作业目标和/或遗传学算法参数。
如权利要求3所述的基于计算图进化的AI模型自动生成的方法，其特征在于所述作业目标包含了计算图模型的适应度阀值：包括了被认为满足进化结束条件的适应度阀值，和被认为是无效用模型的适应度阀值。
如权利要求1所述的基于计算图进化的AI模型自动生成的方法，其特征在于所述步骤(2)、(6)所述遗传算法算子包括了随机算子、交叉算子和/或变异算子。
如权利要求5所述的基于计算图进化的AI模型自动生成的方法，其特征在于所述随机算子为随机选取神经元个数、随机选取神经元种类和/或随机决定神经元连接关系。
如权利要求1所述的基于计算图进化的AI模型自动生成的方法，其特征在于所述步骤(3)、(10)中所述的复杂度指根据计算图的节点数量和边的数量来计算的复杂度。
如权利要求1所述的基于计算图进化的AI模型自动生成的方法，其特征在于所述步骤(10)所述超参搜索中超参指的是AI里面神经网络的控制参数，包括了学习率、即参数和/或权值衰减参数。