CN113392983B

CN113392983B - 自动机器学习的超参数自适应寻优优化系统和方法

Info

Publication number: CN113392983B
Application number: CN202110723700.3A
Authority: CN
Inventors: 王军平; 施金彤; 林建鑫; 苑瑞文
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2023-01-13
Anticipated expiration: 2041-06-29
Also published as: CN113392983A

Abstract

本发明属于大数据机器学习领域，具体涉及了一种自动机器学习的超参数寻优优化系统和方法，旨在解决现有的机器学习方法难以支撑数据模态多样化、规模巨大化进行超参数调优的问题。本发明包括：根据现有超参数数据构建超参数初始空间；按照预设的学习目标任务定义超参数自适应选择策略函数，从超参数初始空间筛选出满足所述学习目标任务的候选超参数集合；通过预设的自适应寻优推理算法，遍历候选超参数集合并同时生成参数保真度密度曲线，根据保真度密度曲线的变异获得最优超参数；将所述最优超参数迁移到新增目标任务域超参数空间，完成新增目标任务域超参数初始寻优。本发明解决了大数据机器学习的参数优化耗费计算资源过多，参数共享难的问题。

Description

自动机器学习的超参数自适应寻优优化系统和方法

技术领域

本发明属于大数据自动机器学习领域，具体涉及了一种自动机器学习的超参数自适应寻优优化系统和方法。

背景技术

自动机器自动学习作为新一代人工智能前沿研究热点，与传统机器学习方法相比，从系统认知学角度，按照特定学习任务，自动从多模态大数据中获得高保真系统机理模型。这些优势使得自动机器学习成为推动人工智能走向多用途通用化发展重要里程碑，也就是说让机器像人类一样学习、思考和理解知识。

自动机器学习过程中超参数优化决定模型优劣关键。传统机器学习算法的超参数配置通常基于实验和前人经验进行选择，不仅包括优化器的超参数，还有和网络结构、训练迭代次数等相关的超参数，而且包括学习率、批量尺寸大小等优化器相关的超参数。已取得较好效果的超参数优化方法，通常采用网格搜索、随机搜索、贝叶斯优化、遗传算法、粒子群优化等。这些超参数优化方法使得机器自动化学习成为可能，然而现有方法不能从动态演化的大数据环境，自适应配置机器自动学习超参数集。

发明内容

为了解决现有技术中的上述问题，即现有的方法自适应配置超参数泛化能力差和鲁棒性脆弱，难以从多模态动态大数据中搜索出满足学习任务需求模型的问题，本发明提供了一种自动机器学习的超参数自适应寻优优化系统，应用于图像识别模型的构建，包括：超参数初始空间构建模块、超参数自适应选择策略模块、自适应寻优推理模块和超参数自动迁移模块；

所述超参数初始空间构建模块，配置为基于现有自动机器学习算法的超参数数据，将所述现有自动机器学习算法的超参数数据划分为不同自动机器学习算法超参数种群，进而构建超参数初始空间D_train，所述现有自动机器学习算法的超参数数据包括图像识别模型的超参数数据；

所述超参数自适应选择策略模块，配置为按照预设的学习目标任务，定义超参数自适应选择策略函数，自动从超参数初始空间D_train筛选出满足所述学习目标任务的候选超参数集合γ，所述预设的学习目标任务为图像识别任务，所述候选超参数集合为满足图像识别任务的超参数集合；

所述自适应寻优推理模块，配置为基于所述候选超参数集合，通过自适应寻优推理算法，根据预设的学习目标任务，采用并行和序列相结合的方法迭代探索候选算法最优结构及学习速率、正则化和网络结构深度等超参数组合，每次探索均生成超参数最优曲线，自动比对多次生成的超参数最优曲线的变异，增加干扰信息直至变异超过阈值，终止自适应寻优，获得最优超参数组合；

所述超参数自动迁移模块，配置为将新增学习目标任务与初始空间里已有最优超参数的源任务算法进行同类匹配，将相似度高于预设阈值的算法的最优超参数配置迁移到新增学习目标任务的超参数空间，为新增学习目标任务配置最优超参数，获得最优新增目标任务模型，所述新增学习目标任务是与学习目标任务不同的图像识别任务。

在一些优选的实施方式中，所述超参数初始空间构建模块包括：超参数库获取单元、超参数种群划分单元和超参数初始空间构建单元；

所述超参数库单元，配置为将所述现有自动机器学习算法的超参数数据中的模型结构超参数、优化超参数和自动学习流水线超参数构建为超参数库，模型结构超参数包括与网络结构相关的超参数、隐藏层层数、激活函数的选择、正则化方法；优化超参数包括学习率、批量尺寸大小；自动学习流水线超参数包括卷积核选择、迭代次数、激活函数、滑动窗口和流行共性指数；

所述超参数种群划分单元，配置为将所述超参数分类按照某个算法的模型结构超参数、优化超参数和自动学习流水线超参数，通过分割、复制、合并和更新的聚合划分分类方法，生成多种自动机器学习算法的超参数种群；

所述超参数初始空间构建单元，配置为基于所述自动机器学习算法的超参数种群，计算超参数种群中的超参数欧式相似度，将欧式相似度大于或等于预设共享边阈值的超参数间设置共享边，将欧式相似度小于预设共享边阈值的超参数生成不同种群算法节点相关超参数分布子图，构建超参数初始空间D_train。

在一些优选的实施方式中，所述超参数自适应选择策略函数η为：

其中，V(γ_i,A_i,D_test,D_train)主要用来度量具有满足所述图像识别任务的候选超参数γ_i的算法A_i在超参数初始空间D_train和图像识别任务数据集D_test中的损失，A表示超参数库中的算法。

在一些优选的实施方式中，所述自适应寻优推理算法目标函数y为：

其中，

表示根据图像识别任务定义的超参数选择策略函数

的组合最优曲线函数，

表示按照图像识别任务超参数选择策略从满足图像识别任务的候选超参数集合γ自适应寻优训练函数，所述自适应寻优训练函数结合实时获取的测试样本，自动为每个算法设置最优超参数，c表示第i训练样本超参数组合数目。

在一些优选的实施方式中，所述自适应寻优推理模块，具体包括：基于所述自适应寻优推理算法目标函数y，自动迭代遍历候选超参数集合获取超参数保真度密度函数，随机设定一个超参数最优曲线检查阈值，根据每个阈值自动比对超参数最优曲线变异情况；

若超参数最优曲线的变异度高于预设的阈值，则重复自适应寻优推理模块的功能替换更新最优超参数组合，并添加随机扰动淘汰机制，对算法超参配置进行剔除，直至所述超参数最优曲线的变异度低于或等于预设的阈值，则该目标学习任务获得最优超参数组合。

在一些优选的实施方式中，所述超参数迁移模块，具体包括：

设定最优超参数的源任务域D_s为：

其中，

表示具有具有满足图像识别任务最优超参数选择策略

的超参数集合，η_s表示满足图像识别任务的源算法集合数量，i表示循环迭代计数器，

表示迭代了i次的源算法；

所述目标任务域D_o为：

将所述设定了最优超参数

的满足图像识别任务的源任务域D_s和目标任务域D_o按照预设的迁移权重

通过基于样本的超参数迁移学习函数，迁移到目新增标任务域超参数空间，自动寻优出具有最优超参数

的目标任务模型，完成目标算法模型初始化；

所述基于样本的超参数迁移学习函数为：

其中，

为新增学习目标任务域超参数变量，ι表示超参数库中算法对应的图像识别目标预测函数，

表示根据图像识别任务定义的超参数选择策略函数

的组合最优曲线函数。

本发明的另一方面，提出了一种自动机器学习的超参数寻优优化方法，针对图像识别模型的构建，包括：

步骤S100，构建超参数初始空间，其为获取图像识别模型超参数数据的基础；

基于现有自动机器学习算法的超参数数据，将所述现有自动机器学习算法的超参数数据划分为不同自动机器学习算法超参数种群，进而构建超参数初始空间D_train；

步骤S200，预设学习目标任务为图像识别任务，定义超参数自适应选择策略函数，自动从超参数初始空间D_train筛选出满足所述所述图像识别任务的候选超参数集合γ；

步骤S300，基于所述候选超参数集合γ，通过自适应寻优推理算法，根据预设的学习目标任务，采用并行和序列相结合的方法迭代探索候选算法最优结构及学习速率、正则化和网络结构深度等超参数组合，每探索一次生成超参数最优曲线，自动比对多次生成的超参数最优曲线的变异，增加干扰信息直至变异超过阈值，终止自适应寻优，获得满足图像识别任务的最优超参数组合；

步骤S400，将新增学习目标任务与初始空间里已有最优超参数的满足图像识别任务的源任务算法进行同类匹配，将相似度高于预设阈值的算法的最优超参数配置迁移到新增学习目标任务的超参数空间，为新增学习目标任务配置最优超参数，其中，所述新增学习目标任务是与学习目标任务不同的图像识别任务。

在一些优选的实施方式中，所述步骤S300具体为：通过进化搜索迭代推理计算公式，对所述图像识别任务模型自动化学习流水线进行优化；

所述超参数自适应选择策略函数η为：

其中，V(γ_i,A_i,D_test,D_train)主要用来度量具有满足所述图像识别任务的候选超参数γ_i的算法A_i在超参数初始空间D_train和图像识别任务任务数据集D_test中的损失，A表示超参数库中的算法。

本发明的第三方面，提出了一种电子设备，包括：

至少一个处理器；以及与至少一个所述处理器通信连接的存储器；其中，所述存储器存储有可被所述处理器执行的指令，所述指令用于被所述处理器执行以实现上述的自动机器学习的超参数寻优优化方法。

本发明的第四方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于被所述计算机执行以实现上述自动机器学习的超参数寻优优化方法。

本发明的有益效果：

(1)本发明自动机器学习的超参数寻优优化系统，受自然生物进化机理启发，通过S300自适应寻优推理，对当前输入训练数据集，进行自适应进化寻优预测，自动搜索出不同任务阶段的自动学习最优超参数组合系列，能够自动探索出学习模型的结构和训练机制，使得自动机器学习能够支撑百万级超参数自动选配。

(2)本发明自动机器学习的超参数寻优优化方法，构建了超参数优化贯穿自动学习全流水线自动优化机制，极大了改善了学习模型训练效率和泛化能力，实现超参数迁移共享，提升参数保真度，开辟了自动机器学习的自适应寻优优化新模式。

(3)本发明自动机器学习的超参数寻优优化方法，通过将同类算法的超参数配置进行迁移，解决了需要进行新增学习目标任务时先验信息不足导致的准确性不足的问题。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本发明实施例自动机器学习的超参数寻优优化系统的结构框图；

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本发明提供一种自动机器学习的超参数自适应寻优优化系统，本系统解决了对动态多模态大数据机器自动学习过程的超参数动态优选不仅耗费计算资源过多，有限时间内难以取得预期成效，模型保真度低，参数共享难的问题，开辟了自动机器学习的自适应寻优优化模型，应用于图像识别模型的构建，实现图像识别模型的自适应构建。

本发明的一种自动机器学习的超参数寻优优化系统，应用于图像识别模型的构建，包括：超参数初始空间构建模块、超参数自适应选择策略模块、自适应寻优推理模块和超参数自动迁移模块；

所述自适应寻优推理模块，配置为基于所述候选超参数集合，通过自适应寻优推理算法，根据预设的学习目标任务，采用并行和序列相结合的方法迭代探索候选算法最优结构及学习速率、正则化和网络结构深度等超参数组合，每探索一次生成超参数最优曲线，自动比对多次生成的超参数最优曲线的变异，增加干扰信息直至变异超过阈值，终止自适应寻优，获得最优超参数组合；在本实施例中，所述最优曲线可优选为保真度密度曲线；

为了更清晰地对本发明自动机器学习的超参数寻优优化系统进行说明，下面结合图1对本发明实施例中各功能模块展开详述。

本发明第一实施例的自动机器学习的超参数寻优优化系统，包括超参数初始空间构建模块、超参数自适应选择策略模块、自适应寻优推理模块和超参数自动迁移模块，各模块详细描述如下：

在本实施例中，所述超参数初始空间构建模块包括：超参数库获取单元、超参数种群划分单元和超参数初始空间构建单元；

所述自动机器学习算法超参数库中，包括：学习率、神经元网络层数、网络结构、卷积核选择、迭代次数、隐含层层数、神经元规模、滑动窗口和流行共性指数、激活函数、聚类个数和话题个数。

在本实施例中，所述超参数自适应选择策略函数η为：

其中，V(γ_i,A_i,D_test,D_train)用来度量具有满足所述图像识别任务的候选超参数γ_i的算法A_i在超参数初始空间D_train和图像识别任务数据集D_test中的损失，A表示超参数库中的算法。

在本实施例中，A_i可选取的策略优选算法的包括：基于强化学习的学习式超参数优化、基于进化算法的搜索式超参数优化和基于贝叶斯优化的概率式超参数优化等，通过单个或者组合的超参搜索策略，自动训练评估具有γ_i参数的算法A_i在实验验证数据集D_test和已有超参空间D_train之间损失。

所述自适应寻优推理模块，配置为基于所述候选超参数，通过预设的自适应寻优推理函数，遍历候选超参数集合，并生成参数保真度密度曲线，进而根据保真度密度曲线的变异度获得最优超参数；

在本实施例中，所述自适应寻优推理算法目标函数y为：

其中，

表示根据图像识别任务定义的超参数选择策略函数

的组合最优曲线函数，

表示按照图像识别任务超参数选择策略从满足图像识别任务的候选超参数集合γ自适应寻优训练函数，所述自适应寻优训练函数结合实时获取的测试样本，自动为每个算法设置最优超参数，所述测试样本来源于图像识别任务，c表示第i训练样本超参数组合数目；

所述自适应寻优推理模块，配置为基于所述候选超参数集合γ，通过自适应寻优推理算法，根据预设的学习目标任务，采用并行和序列相结合的方法迭代探索候选算法最优结构及学习速率、正则化和网络结构深度等超参数组合，每探索一次生成超参数最优曲线，自动比对多次生成的超参数最优曲线的变异，增加干扰信息直至变异超过阈值，终止自适应寻优，获得最优超参数组合；

在本实施例中，所述超参数迁移模块，具体包括：

设定最优超参数的源任务域D_s为：

其中，

表示具有具有满足图像识别任务最优超参数选择策略

表示迭代了i次的源算法；

所述目标任务域D_o为：

将所述设定了最优超参数

的目标任务模型，完成目标算法模型初始化；

所述基于样本的超参数迁移学习函数为：

其中，

表示根据图像识别任务定义的超参数选择策略函数

的组合最优曲线函数。

在具体的应用场景中，容易出现模型训练任务的先验信息不足的情况即对应与本发明的新增学习目标任务所需的训练数据不足的情况，可通过本发明的从现有的自动机器学习算法的超参数数据中获取配置最优超参数的模型即学习目标任务的模型，并将模型中的超参数迁移到新增学习目标任务中，新增学习目标任务配置最优超参数，获得获得最优新增目标任务模型。比如，若需要训练一个识别犬类图像的模型，但是先验信息不足无法训练模型，则可通过本发明获取识别猫类图像的算法的最优超参数，进而迁移到识别犬类图像的模型中。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统的具体工作过程及有关说明，可以参考下述方法实施例中的对应过程，在此不再赘述。

需要说明的是，上述实施例提供的自动机器学习的超参数寻优优化系统，仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块来完成，即将本发明实施例中的模块或者步骤再分解或者组合，例如，上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块，以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称，仅仅是为了区分各个模块或者步骤，不视为对本发明的不当限定。

本发明第二实施例的自动机器学习的超参数寻优优化方法，包括：

步骤S200，预设学习目标任务为图像识别任务，定义超参数自适应选择策略函数，自动从超参数初始空间D_train筛选出满足所述学习目标任务的候选超参数集合γ；

在本实施例中所述步骤S300具体为，通过进化搜索迭代推理计算公式，对所述图像识别任务模型自动化学习流水线进行优化；

所述超参数自适应选择策略函数η为：

本发明第三实施例的一种电子设备，包括：

至少一个处理器；以及与至少一个所述处理器通信连接的存储器；其中，所述存储器存储有可被所述处理器执行的指令，所述指令用于被所述处理器执行以实现上述的自动机器学习的超参数自适应寻优优化方法。

本发明第四实施例的一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于被所述计算机执行以实现上述的自动机器学习的超参数自适应寻优优化方法。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的存储装置、处理装置的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

术语“第一”、“第二”等是用于区别类似的对象，而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种自动机器学习的超参数自适应寻优优化系统，其特征在于，应用于图像识别模型的构建，所述系统包括：超参数初始空间构建模块、超参数自适应选择策略模块、自适应寻优推理模块和超参数自动迁移模块；

所述超参数初始空间构建模块包括：超参数库获取单元、超参数种群划分单元和超参数初始空间构建单元；

所述超参数库获取单元，配置为将所述现有自动机器学习算法的超参数数据中的模型结构超参数、优化超参数和自动学习流水线超参数构建为超参数库，模型结构超参数包括与网络结构相关的超参数、隐藏层层数、激活函数的选择、正则化方法；优化超参数包括学习率、批量尺寸大小；自动学习流水线超参数包括卷积核选择、迭代次数、激活函数、滑动窗口和流行共性指数；

所述超参数种群划分单元，配置为将所述超参数按照某个算法的模型结构超参数、优化超参数和自动学习流水线超参数，通过分割、复制、合并和更新的聚合划分分类方法，生成多种自动机器学习算法的超参数种群；

所述超参数初始空间构建单元，配置为基于所述自动机器学习算法的超参数种群，计算超参数种群中的超参数欧式相似度，将欧式相似度大于或等于预设共享边阈值的超参数间设置共享边，将欧式相似度小于预设共享边阈值的超参数生成不同种群算法节点相关超参数分布子图，构建超参数初始空间D_train；

所述自适应寻优推理模块，配置为基于所述候选超参数集合通过自适应寻优推理算法，根据预设的学习目标任务，采用并行和序列相结合的方法迭代探索出候选算法的最优结构、学习速率、正则化和网络结构深度的超参数组合，并生成超参数最优曲线，自动比对多次生成的超参数最优曲线的变异，增加干扰信息直至变异超过阈值，终止自适应寻优，获得最优超参数组合；

基于所述自适应寻优推理算法目标函数y，自动迭代遍历候选超参数集合获取超参数保真度密度函数，随机设定一个超参数最优曲线检查阈值，根据每个阈值自动比对超参数最优曲线变异情况；

若超参数最优曲线的变异度高于预设的阈值，则重复自适应寻优推理模块的功能替换更新最优超参数组合，并添加随机扰动淘汰机制，对算法超参配置进行剔除，直至所述超参数最优曲线的变异度低于或等于预设的阈值，则该学习目标任务获得最优超参数组合；

所述超参数自动迁移模块，配置为将新增学习目标任务与初始空间里已有最优超参数的源任务算法进行同类匹配，将相似度高于预设阈值的算法的最优超参数配置迁移到新增学习目标任务的超参数空间，为新增学习目标任务配置最优超参数，获得最优新增目标任务模型，通过所述最优新增目标任务模型执行新增目标任务获得图像识别结果；所述新增学习目标任务是与学习目标任务不同的图像识别任务；

所述图像识别模型的构建方法为：

步骤S200，预设学习目标任务为图像识别任务，定义超参数自适应选择策略函数，自动从超参数初始空间D_train筛选出满足所述图像识别任务的候选超参数集合γ；

所述超参数自适应选择策略函数η为：

其中，V(γ_i,A_i,D_test,D_train)用来度量具有满足所述图像识别任务的候选超参数γ_i的算法A_i在超参数初始空间D_train和图像识别任务数据集D_test中的损失，A表示超参数库中的算法；

步骤S300，基于所述候选超参数集合γ，通过自适应寻优推理算法，根据预设的图像识别任务，采用并行和序列相结合的方法迭代探索候选算法最优结构及学习速率、正则化和网络结构深度的超参数组合，每探索一次生成超参数最优曲线，自动比对多次生成的超参数最优曲线的变异，增加干扰信息直至变异超过阈值，终止自适应寻优，获得满足图像识别任务的最优超参数组合；通过进化搜索迭代推理计算公式，对所述图像识别模型自动化学习流水线进行优化；

所述自适应寻优推理算法目标函数y为：

其中，

表示根据图像识别任务定义的超参数选择策略函数

的组合最优曲线函数，

步骤S400，将新增学习目标任务与初始空间里已有最优超参数的满足图像识别任务的算法进行同类匹配，将相似度高于预设阈值的算法的最优超参数配置迁移到新增学习目标任务的超参数空间，为新增学习目标任务配置最优超参数，获得最优新增目标任务模型，通过所述最优新增目标任务模型执行新增目标任务获得图像识别结果；其中，所述新增学习目标任务是与学习目标任务不同的图像识别任务；

设定最优超参数的满足图像识别任务的源任务域D_s为：