CN111144581A

CN111144581A - 一种机器学习超参数调节方法及系统

Info

Publication number: CN111144581A
Application number: CN201911407395.6A
Authority: CN
Inventors: 王联军; 马平男; 王有兵; 张珊
Original assignee: Hangzhou Yatuo Information Technology Co ltd
Current assignee: Hangzhou Yatuo Information Technology Co ltd
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2020-05-12

Abstract

本发明公开了一种机器学习超参数调节方法及系统，涉及机器学习技术领域，本发明采用贝叶斯优化框架，通过初始观测集合由高斯过程生成先验概率模型，用混沌粒子群方法搜索下一个评估点，对新的评估点进行评估获取新评估点对应的观测值，通过更新观测集合来更新高斯过程概率代理模型，通过多次迭代搜索更新，获取最优超参数组合。本发明能够有效减少机器学习模型超参数调优的评估次数，并克服传统贝叶斯优化陷入局部最优点的缺陷，可以更准确和高效的进行超参数调优。

Description

一种机器学习超参数调节方法及系统

【技术领域】

本发明涉及机器学习技术领域，具体涉及一种机器学习超参数调节方法及系统。

【背景技术】

机器学习算法的性能高度依赖于超参数的选择，对机器学习超参数调优选择是一项繁琐但至关重要的任务。现有技术所采用的方法有手动调参方法，自动调参方法如网格搜索、随机搜索等方式，贝叶斯优化方法等。但是这些方式都存在着各种各样的问题：手动调参方法对经验的依赖性较强；自动调参方法由于浪费了时间去评估搜索空间中并不太可能找到最优点的区域导致效率较低；贝叶斯优化方法尽管将机器学习模型超参数调优的黑盒优化场景转为了概率代理模型，但求解结果容易陷入局部最优解，且求解结果往往依赖于初始值的选择。有鉴于此，需要有更准确和高效的方法来调优超参数。

【发明内容】

为解决前述问题，本发明提供了一种机器学习超参数调节方法，基于贝叶斯原理和混沌搜索，使机器学习算法模型训练结果最优化。

为了达到上述目的，本发明采用如下技术方案：

一种机器学习超参数调节方法，包括如下步骤：

步骤一：在机器学习模型的超参数范围内随机采样生成初始的超参数集合X，对超参数集合X中的每组超参数进行机器学习模型训练评估，获取预先设置的目标变量V的值作为每组超参数的观测值，由超参数集合X＝{x₁,x₂,x₃,…,x_t}和其观测值Y＝{y₁,y₂,y₃,…,y_t}构成初始的观测集合D；

步骤二：在机器学习模型的超参数范围内随机采样初始的超参数粒子群X_group，并将超参数粒子群X_group中的每个粒子x_particle分别作为观测集合D新输入值，通过贝叶斯后验概率分布计算得到超参数粒子群X_group中每个粒子x_particle的预测值y_particle，取粒子x_particle的预测值y_particle中的最优值所对应的粒子x_particle作为超参数粒子群X_group初始的群体最优值x_{group_best}；

步骤三：对超参数粒子群X_group进行混沌粒子群优化运动更新，更新超参数粒子群X_group，将新的超参数粒子群X_group中每个粒子x_particle分别作为观测集合D新输入值，通过贝叶斯后验概率分布计算得到新的超参数粒子群X_group中每个粒子x_particle的新的预测值y_particle，以粒子x_particle的新的预测值y_particle中的最优值所对应的粒子x_particle更新群体最优值x_{group_best}；

步骤四：重复执行步骤三，直至达到预设的重复次数；

步骤五：将更新后的群体最优值x_{group_best}作为观测集合D新输入值，通过贝叶斯后验概率分布计算得到预测值y_{group_best}，将群体最优值x_{group_best}和y_{group_best}增加至观测集合D中以更新观测集合D，从更新后的观测集合D中取目标变量V的最优值所对应的元素加入到最优超参数记录集合中；

步骤六：重复执行步骤二至步骤五，直至达到预设的重复次数，取最后一次加入最优超参数记录集合的元素作为最优超参数。

可选的，所述步骤二、三中，取预测值y_particle的最优值的步骤为：将粒子x_particle作为观测集合D新的输入，并计算粒子x_particle的预测值y_particle，然后根据预测值y_particle的大小排序，如果目标变量V需要最大化，取预测值y_particle中最大值为最优值，如果目标变量V需要最小化，取预测值y_particle中最小值为最优值，将最优值对应的粒子位置作为粒子群最优位置。

可选的，所述步骤二、步骤三、步骤五中，通过贝叶斯后验概率分布计算预测值y_particle的公式为：

其中，∑表示观测集合D中超参数集合X内的元素构成的协方差矩阵，

为观测集合D中超参数集合X内的每个元素与新加入的元素的协方差构成的向量，K_**为新加入的元素构成的协方差，λ为预先设置的收敛系数，Y为超参数集合X的观测值Y。

本发明具有如下有益效果：

本发明所提供的机器学习超参数调节方法，采用贝叶斯优化框架，通过初始观测集合由高斯过程生成先验概率模型，对机器学习算法模型的超参数执行启发式搜索，相比于网格搜索、随机搜索等自动调参方式，有效地减少了评估次数。本发明所提供的机器学习超参数调节方法还引入了混沌搜索，对新的评估点进行评估获取新评估点对应的观测值，通过更新观测集合来更新高斯过程概率代理模型，通过多次迭代搜索更新，可以克服贝叶斯优化方法搜索陷入局部最优点的缺陷，通过将混沌搜索与贝叶斯优化相结合，可以更准确和高效的调优超参数。并且，无需手动调参，摆脱了对技术人员经验的依赖。

此外，本发明还提供了一种机器学习超参数调节系统，所述机器学习超参数调节系统包括：

贝叶斯优化初始化单元：用以在机器学习模型的超参数范围内随机采样生成初始的超参数集合X，对超参数集合X中的每组超参数进行机器学习模型训练评估，获取预先设置的目标变量V的值作为每组超参数的观测值，由超参数集合X＝{x₁,x₂,x₃,…,x_t}和其观测值Y＝{y₁,y₂,y₃,…,y_t}构成初始的观测集合D；

粒子群初始化单元：用以在机器学习模型的超参数范围内随机采样初始的超参数粒子群X_group，并将超参数粒子群X_group中的每个粒子x_particle分别作为观测集合D新输入值，通过贝叶斯后验概率分布计算得到超参数粒子群X_group中每个粒子x_particle的预测值y_particle，取粒子x_particle的预测值y_particle中的最优值所对应的粒子x_particle作为超参数粒子群X_group初始的群体最优值x_{group_best}；

混沌粒子群运动更新单元：用以对超参数粒子群X_group进行混沌粒子群优化运动更新，更新超参数粒子群X_group，将新的超参数粒子群X_group中每个粒子x_particle分别作为观测集合D新输入值，通过贝叶斯后验概率分布计算得到新的超参数粒子群X_group中每个粒子x_particle的新的预测值y_particle，以粒子x_particle的新的预测值y_particle中的最优值所对应的粒子x_particle更新群体最优值x_{group_best}；

贝叶斯优化更新单元：包括粒子群初始化单元和混沌粒子群运动更新单元，用以基于更新后的群体最优值x_{group_best}，由贝叶斯后验概率分布计算得到预测值y_{group_best}，将群体最优值x_{group_best}和预测值y_{group_best}增加至观测集合D中以更新观测集合D，从更新后的观测集合D中取目标变量V的最优值所对应的元素加入到最优超参数记录集合中，并获取最优超参数。

可选的，粒子群初始化单元和混沌粒子群运动更新单元取预测值y_particle的最优值的步骤为：将粒子x_particle作为观测集合D新的输入，并计算粒子x_particle的预测值y_particle，然后根据预测值y_particle的大小排序，如果目标变量V需要最大化，取预测值y_particle中最大值为最优值，如果目标变量V需要最小化，取预测值y_particle中最小值为最优值，将最优值对应的粒子位置作为粒子群最优位置。

可选的，粒子群初始化单元、混沌粒子群运动更新单元、贝叶斯优化更新单元通过贝叶斯后验概率分布计算预测值的公式为：

可选的，所述最优超参数为粒子群初始化单元、混沌粒子群运动更新单元以及贝叶斯优化更新单元重复执行预设次数后，最后一次加入最优超参数记录集合的元素。

本发明所提供的机器学习超参数调节系统与前述机器学习超参数调节方法的有益效果推理过程相似，在此不再赘述。

本发明的这些特点和优点将会在下面的具体实施方式以及附图中进行详细的揭露。本发明最佳的实施方式或手段将结合附图来详尽表现，但并非是对本发明技术方案的限制。另外，在每个下文和附图中出现的这些特征、要素和组件是具有多个，并且为了表示方便而标记了不同的符号或数字，但均表示相同或相似构造或功能的部件。

【附图说明】

下面结合附图对本发明作进一步说明：

图1为本发明实施例一的流程图；

图2为本发明实施例二的示意图。

【具体实施方式】

下面结合本发明实施例的附图对本发明实施例的技术方案进行解释和说明，但下述实施例仅为本发明的优选实施例，并非全部。基于实施方式中的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得其他实施例，都属于本发明的保护范围。

在本说明书中引用的″一个实施例″或″实例″或″例子″意指结合实施例本身描述的特定特征、结构或特性可被包括在本专利公开的至少一个实施例中。短语″在一个实施例中″在说明书中的各位置的出现不必都是指同一个实施例。

实施例一：

如图1所示，本实施例提供了一种机器学习超参数调节方法，包括如下步骤：

步骤一：在机器学习模型的超参数范围内随机采样生成初始的超参数集合X，即贝叶斯优化初始样本集。本实施例所提供的机器学习超参数调节方法适用于多种机器学习模型，每种机器学习模型具有不同的超参数，而每种机器学习模型的超参数的范围属于现有技术，均为本领域技术人员所知晓，因而在此不再赘述。设定目标变量V作为优化目标，对超参数集合X中的每组超参数进行机器学习模型训练评估。由于不同的机器学习模型中具有不同的超参数组合，而且不同的机器学习模型具有多个可选的优化目标，因此，不同的优化目标对应的最优超参数组合数值不同。而各种机器学习模型的可优化目标也属于现有技术，也为本领域技术人员所知晓，同样在此不再赘述。获取超参数集合X中的每组超参数进行机器学习模型训练评估的目标变量V的值作为每组超参数的观测值，由每组超参数和每组超参数的观测值构成初始的观测集合D；

步骤二：在机器学习模型的超参数范围内随机采样初始的超参数粒子群X_group，并将超参数粒子群X_group中的每个粒子x_particle分别作为观测集合D新输入值，通过贝叶斯后验概率分布计算得到超参数粒子群X_group中每个粒子x_particle的预测值y_particle，取粒子x_particle的预测值y_particle中的最优值所对应的粒子x_particle作为超参数粒子群X_group初始的群体最优值x_{group_best}。

取预测值y_particle中的最优值的步骤为：将粒子x_particle作为观测集合D新的输入，并计算粒子x_particle的预测值y_particle，然后根据预测值y_particle的大小排序，如果目标变量V需要最大化，取预测值y_particle中最大值为最优值，如果目标变量V需要最小化，取预测值y_particle中最小值为最优值，将最优值对应的粒子位置作为粒子群最优位置，计算预测值的公式为：

∑表示观测集合D中超参数集合X内的元素构成的协方差矩阵，

取新的预测值y_particle中的最优值的步骤为：将粒子x_particle作为观测集合D新的输入，并计算粒子x_particle的预测值y_particle，然后根据预测值y_particle的大小排序，如果目标变量V需要最大化，取预测值y_particle中最大值为最优值，如果目标变量V需要最小化，取预测值y_particle中最小值为最优值，将最优值对应的粒子位置作为粒子群最优位置，计算预测值的公式为：

步骤四：重复执行步骤三，直至达到预设的重复次数。而重复次数的设定根据不同的机器学习模型以及不同的超参数属性来设定，属于本领域的现有技术，均为本领域技术人员所知晓，在此不再赘述；

步骤五：步骤三即为混沌搜索，由步骤三混沌搜索所获取的更新后的群体最优值x_{group_best}，作为贝叶斯优化高斯过程的下一个最优评估点，通过贝叶斯后验概率分布更新高斯过程概率模型，计算得到预测值y_{group_best}，将(x_{group_best},y_{group_best})更新至初始的观测集合D，从更新后的观测集合D中取目标变量的最优值所对应的元素，该元素应为(x_best,y_best)的形式，加入到最优超参数记录集合中；

在步骤二、步骤三、步骤五中，计算预测值的公式为：

步骤六：步骤二至步骤五为执行了一次贝叶斯优化，重复执行步骤二至步骤五，直至达到预设重复次数，而重复次数的设定根据不同的机器学习模型以及不同的超参数属性来设定，属于本领域的现有技术，均为本领域技术人员所知晓，在此不再赘述。

取最后一次加入最优超参数记录集合的元素中的超参数数值组合，取元素x_best作为最优超参数。

本实施例所提供的机器学习超参数调节方法，采用贝叶斯优化框架，通过初始观测集合D由高斯过程生成先验概率模型，对机器学习算法模型的超参数执行启发式搜索，相比于网格搜索、随机搜索等自动调参方式，有效地减少了评估次数。本发明所提供的机器学习超参数调节方法还引入了混沌搜索，对新的评估点进行评估获取新评估点对应的观测值，通过更新观测集合D来更新高斯过程概率代理模型，通过多次迭代搜索更新，可以克服贝叶斯优化方法搜索陷入局部最优点的缺陷，通过将混沌搜索与贝叶斯优化相结合，可以更准确和高效的调优超参数。并且，无需手动调参，摆脱了对技术人员经验的依赖。

下面以逻辑回归模型为例说明本实施例所公开的机器学习超参数调节方法：

设置逻辑回归模型要调整的超参数集合为{L₁正则系数，L₂正则系数，训练迭代次数，收敛系数}，调参的优化目标变量为模型的accuracy指标；

设置超参数边界如表1所示；

表1：参数边界数据

L<sub>1</sub>正则系数	L<sub>2</sub>正则系数	训练迭代次数	收敛系数
				[0.0001,0.1]	[0.00001,0.01]	[10,200]	[0.0001,0.001]

设置初始观测集合大小为10，贝叶斯优化搜索次数为5，由参数边界生成超参数对集合，并计算每个超参数对下的逻辑回归模型accuracy值，得到如表2所示的初始观测样本集D，由初始观测样本集生成高斯过程概率模型；

表2：贝叶斯优化初始观测样本集

设置粒子群数量为20，执行混沌搜索次数为1000次，由参数边界随机初始化粒子群，将每个粒子代入高斯过程概率模型，得到粒子的预测值数据y_particle，通过比较y_particle获得粒子群初始最优位置x_{group_best},执行混沌搜索到指定次数，更新得到最优评估点位置x_{group_best}为{L₁正则系数:7.81E-4,L₂正则系数:0.0014,训练迭代次数:164,收敛系数:5.45E-4}

将x_{group_best}作为贝叶斯优化高斯过程的下一个最优评估点，通过贝叶斯后验概率分布更新高斯过程概率模型，计算得到预测值y_{group_best}，由(x_{group_best}，y_{group_best})更新观测集合D，从更新后的D中取y(accuracy)最大值对应的样本(x_best，y_best)加入到historyBest集合中；

按照设置的贝叶斯优化搜索次数，重复执行实施例一中步骤二至步骤五计算过程，得到historyBest集合如表3所示，取其中最后一次的搜索结果{L₁正则系数:1.0E-4,L₂正则系数:5.73E-4,训练迭代次数:161,收敛系数:2.41E-4}作为最优超参数组合导出。

表3：超参数组合调优记录表

实施例二：

本实施例提供了一种机器学习超参数调节系统，以实现实施例一所述的机器学习超参数调节方法。机器学习超参数调节系统包括：

粒子群初始化单元取预测值y_particle的最优值的步骤为：

将粒子x_particle作为观测集合D新的输入，并计算粒子x_particle的预测值y_particle，然后根据预测值y_particle的大小排序，如果目标变量V需要最大化，取预测值y_particle中最大值为最优值，如果目标变量V需要最小化，取预测值y_particle中最小值为最优值，将最优值对应的粒子位置作为粒子群最优位置。

计算预测值的公式为：

混沌粒子群运动更新单元取新的预测值y_particle的最优值的步骤为：

将粒子x_particle作为观测集合D新的输入，并计算粒子x_particle的预测值y_particle，然后根据预测值y_particle的大小排序，如果目标变量V需要最大化，取预测值y_particle中最大值为最优值，如果目标变量V需要最小化，取预测值y_particle中最小值为最优值，将最优值对应的粒子位置作为粒子群最优位置。计算预测值的公式为：

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，熟悉该本领域的技术人员应该明白本发明包括但不限于附图和上面具体实施方式中描述的内容。任何不偏离本发明的功能和结构原理的修改都将包括在权利要求书的范围中。

Claims

1.一种机器学习超参数调节方法，其特征在于，所述机器学习超参数调节方法包括如下步骤：

步骤一：在机器学习模型的超参数范围内随机采样生成初始的超参数集合X，对超参数集合X中的每组超参数进行机器学习模型训练评估，获取预先设置的目标变量V的值作为每组超参数的观测值，由超参数集合X＝{x₁，x₂，x₃，...，x_t}和其观测值Y＝{y₁，y₂，y₃，...，y_t}构成初始的观测集合D；

步骤四：重复执行步骤三，直至达到预设的重复次数；

2.根据权利要求1所述的机器学习超参数调节方法，其特征在于，所述步骤二、三中，取预测值y_particle的最优值的步骤为：将粒子x_particle作为观测集合D新的输入，并计算粒子x_particle的预测值y_particle，然后根据预测值y_particle的大小排序，如果目标变量V需要最大化，取预测值y_particle中最大值为最优值，如果目标变量V需要最小化，取预测值y_particle中最小值为最优值，将最优值对应的粒子位置作为粒子群最优位置。

3.根据权利要求1所述的机器学习超参数调节方法，其特征在于，所述步骤二、步骤三、步骤五中，通过贝叶斯后验概率分布计算预测值y_particle的公式为：

4.一种机器学习超参数调节系统，其特征在于，所述机器学习超参数调节系统包括：

贝叶斯优化初始化单元：用以在机器学习模型的超参数范围内随机采样生成初始的超参数集合X，对超参数集合X中的每组超参数进行机器学习模型训练评估，获取预先设置的目标变量V的值作为每组超参数的观测值，由超参数集合X＝{x₁，x₂，x₃，...，x_t}和其观测值Y＝{y₁，y₂，y₃，...，y_t}构成初始的观测集合D；

5.根据权利要求4所述的机器学习超参数调节系统，其特征在于，粒子群初始化单元和混沌粒子群运动更新单元取预测值y_particle的最优值的步骤为：将粒子x_particle作为观测集合D新的输入，并计算粒子x_particle的预测值y_particle，然后根据预测值y_particle的大小排序，如果目标变量V需要最大化，取预测值y_particle中最大值为最优值，如果目标变量V需要最小化，取预测值y_particle中最小值为最优值，将最优值对应的粒子位置作为粒子群最优位置。

6.根据权利要求4所述的机器学习超参数调节系统，其特征在于，粒子群初始化单元、混沌粒子群运动更新单元、贝叶斯优化更新单元通过贝叶斯后验概率分布计算预测值的公式为：

7.根据权利要求4所述的机器学习超参数调节系统，其特征在于，所述最优超参数为粒子群初始化单元、混沌粒子群运动更新单元以及贝叶斯优化更新单元重复执行预设次数后，最后一次加入最优超参数记录集合的元素。