CN115470910A - 基于贝叶斯优化及K-center采样的自动调参方法 - Google Patents

基于贝叶斯优化及K-center采样的自动调参方法 Download PDF

Info

Publication number
CN115470910A
CN115470910A CN202211287486.2A CN202211287486A CN115470910A CN 115470910 A CN115470910 A CN 115470910A CN 202211287486 A CN202211287486 A CN 202211287486A CN 115470910 A CN115470910 A CN 115470910A
Authority
CN
China
Prior art keywords
parameter
candidate
theta
target algorithm
performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211287486.2A
Other languages
English (en)
Inventor
林锦坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zede Software Beijing Co ltd
Original Assignee
Zede Software Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zede Software Beijing Co ltd filed Critical Zede Software Beijing Co ltd
Priority to CN202211287486.2A priority Critical patent/CN115470910A/zh
Publication of CN115470910A publication Critical patent/CN115470910A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于贝叶斯优化及K‑center采样的自动调参方法。本方法为:1)调参器根据输入的待调参目标算法的可执行文件、优化目标、目标算法的参数信息及调参时间t,生成一组初始参数组集合Φinit;2)调参器根据Φinit中的参数组运行目标算法得到一训练集S;3)使用训练集S构建模型GP;4)调参器生成候选参数组集合Φcandidate并将其中各候选参数组分别输入至模型GP中,预测得到参数组性能;5)调参器选取一候选参数组,运行目标算法得到对应的预测性能,将加入训练集S;然后利用更新后的训练集S训练模型GP;6)循环步骤4)~5)直至达到调参时间t,然后输出最优性能对应的参数组。

Description

基于贝叶斯优化及K-center采样的自动调参方法
技术领域
本发明属于计算机可信计算技术领域,具体涉及一种基于贝叶斯优化及K-center采样的自动调参方法。
背景技术
贝叶斯优化是一种黑盒优化算法,用于求解表达式未知的函数的极值问题。算法根据一组采样点处的函数值预测任意点处函数值的概率分布,此过程通过高斯过程回归实现。
K-center算法是指在n个点中选取k个点使其到其他点的距离之和最小。
专利申请公布号:CN113204450A的发明提出了一种基于遗传算法的数据重构自动调参方法、系统及存储介质,包括以下步骤:
S1:引入遗传算法,在数据恢复控制算法中,累加恢复对象的大小,以及记录恢复对象的总数和恢复的小对象的数目;
S2:判断数据恢复场景的类型,根据步骤S1中得到的恢复的不同方式下,恢复个数占总的恢复对象个数的比例,确定选择最佳参数处理方式;
S3:针对步骤S2确定不同的恢复场景,选用算法权衡权重,匹配不同的参数,从而进行优化不同场景下的恢复参数;
S4:在遗传算法训练器中最后清空步骤S1中计数,以便进行下一周期对恢复场景优化恢复参数;
S5:遗传算法下NVME硬盘的处理步骤;
S6:根据集群规模调整重构速度步骤。
现有调参方式分为两类,第一种是人工调参,算法开发人员根据经验,手动调整超参数,观察算法性能,然后再做调整,直至调整至满意的状态。第二种是使用调参工具自动调参,用户定义好参数类型,取值范围,性能指标(如要使求解时间最短、求解的结果最大或最小等),然后将其输入给自动调参工具,调参工具在参数空间内搜索,直至找到使目标算法性能较好的参数配置。
传统人工手动调参存在以下几个局限:
一、高度依赖算法工程师经验,同时需要花费大量的时间及精力调整,效率不高。
二、对于目标算法参数数量多、取值范围大的情况,参数空间太大,人工手动调参将不可行。
现有自动调参工具存在以下几个问题:
一、调参算法收敛慢,找到较优参数配置花费时间长;
二、基于模型的调参工具,在调参开始时,为了训练模型,会随机采样几组参数尝试以得到初始训练数据,但训练得到的模型并不能很好地反映真实的分布,效果较差。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种基于贝叶斯优化及K-center采样的自动调参方法,可以有效加快调参速度,用更少的时间找到更优的参数配置,从而大大提高调参效率和调参结果稳定性。
本发明的技术方案为:
一种自动调参方法,其步骤包括:
1)调参器根据输入的待调参目标算法的可执行文件、优化目标、目标算法的参数信息及调参时间t,生成一组初始参数组集合Φinit
2)调参器根据初始参数组集合Φinit中的参数组运行所述目标算法的可执行文件得到一训练集S;
3)调参器使用所述训练集S构建代理模型GP;
4)调参器在所述目标算法的各参数取值范围内分别随机采样生成候选参数组集合Φcandidate,调参器将Φcandidate的各候选参数组分别输入至代理模型GP中,预测得到每一候选参数组的参数组性能;
5)调参器根据各候选参数组的性能选取一候选参数组Θselected,运行目标算法的可执行文件,得到对应的预测性能oselected,将(Θselected,oselected)加入训练集S;然后利用更新后的训练集S训练所述代理模型GP;
6)循环步骤4)~5)直至达到调参时间t,然后输出最优性能obest对应的参数组θbest作为所述目标算法的优化参数。
进一步的,步骤4)中,调参器选取ei值最大的候选参数组Θselected,运行目标算法的可执行文件,得到对应的预测性能oselected,将(Θselected,oselected)加入训练集S;然后利用更新后的训练集S训练所述代理模型GP;其中第c个候选参数组Θc对应的ei值为
Figure BDA0003899986350000021
Figure BDA0003899986350000022
oc为候选参数组Θc的性能,stdc为候选参数组Θc的性能与当前候选参数组集合Φcandidate中其他候选参数组Θc的性能的标准差,oincumbent为已获取的最优性能。
进一步的,采用基于K-center的采样方法生成初始参数组集合Φinit,其方法为:
11)在各参数的取值范围内随机采样获取一个参数组集合Φrand={Θ1,…,Θr,…,ΘR};Θr为第r个参数组;12)在Φrand中选取k个参数组得到一参数组集合Φinit使其到其他参数组构成的集合
randinit}的距离之和最小;其中任意两个参数组Θi和Θj之间的距离dis(Θij)计算方式为
Figure BDA0003899986350000031
dis(θi,dj,d)表示参数组Θi和Θj在第d维的距离,θi,d及θj,d分别表示Θi及Θj的第d维参数值。
进一步的,如果参数值类型为整数或实数,则
Figure BDA0003899986350000032
其中max(θi)和min(θi)分别表示目标算法第i个参数取值范围的最大值及最小值;如果参数值不为整数或实数类型,且θi,d和θj,d的值相同,则dis(θi,dj,d)=0,否则dis(θi,dj,d)=1。
进一步的,调参器使用高斯过程回归构建代理模型GP,特征为参数组中的参数值,label为目标算法的性能值。
进一步的,所述参数信息包含目标算法参数的名称、类型、取值范围。
进一步的,所述目标算法为为任意可接受超参输入的算法。
进一步的,所述目标算法为用于图像分类的机器学习算法或随机森林算法。
一种服务器,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行上述方法中各步骤的指令。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明的优点如下:
1)相对于传统手动调参,本发明提出了一种基于贝叶斯优化的高效自动调参方法。
2)传统自动调参算法采样时常使用随机采样的方式,本发明提出了一种基于k-center的采样方法,更能保证采样的均匀性,用得到的训练集训练的代理模型效果更好,能有效加速调参过程。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图对本发明进行进一步详细描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
本方案整体流程如图1所示,用户输入目标算法可执行文件、优化目标、参数信息、调参时间,调参算法进行调参直至调参时间用完,最后输出找到的最优参数组及其性能。目标算法可执行文件是指目标算法的源代码编译后的可执行文件。目标算法是指任意可接受参数输入,同时给出优化目标的程序;如随机森林算法,其输入参数为树的数量、最大树高等参数,调参的目标是最大化分类准确率。
分步骤详述具体方法如下:
一、输入
a)目标算法可执行文件
目标算法可执行文件接受参数组输入,运行后输出性能指标值。
b)优化目标
对目标算法的优化指标可以是最小化运行时间,最优化解质量等。
c)参数信息
参数信息包含了目标算法参数的名称、类型、取值范围。
二、调参器算法
调参器接受用户输入待调参的目标算法可执行文件、优化目标、目标算法的输入参数信息、调参时间t后,首先生成一组初始参数组集合Φinit,然后使用此集合中的参数组运行目标算法的可执行文件得到训练集S,之后使用训练集构建代理模型GP,将生成的候选参数组输入至代理模型中可预测参数组性能,然后选择其中的一个参数组执行目标算法得到一条新的数据加入训练集,循环此过程直至调参时间t用完,最后输出找到的最优性能obest及对应的参数组θbest
其中:
(1)参数组:Θ={θ1,…,θi,…,θd},d表示目标算法有d个参数,θi表示第i个参数值;
(2)初始参数组集合Φinit={Θ1,…,Θk,…,ΘK},Θn表示第n个参数组;
(3)训练集S={(Θ1,o1),…,(Θm,om),…,(ΘM,oM)},(Θm,om)表示使用参数组Θm运行目标算法得到的性能指标值为om
对每个步骤的详细介绍如下:
(1)初始参数组集合生成:
本方案采用基于K-center的采样方法生成初始参数组集合,步骤如下:
a.使用随机采样在参数取值范围内获取一个参数组集合Φrand={Θ1,…,Θr,…,ΘR};
b.在Φrand中选取k(k≤R)个参数组得到一参数组集合Φinit使其到其他参数组构成的集合{Φrandinit}的距离之和最小,其中任意两个参数组Θi和Θj之间的距离dis(Θij)计算方式如下:
Figure BDA0003899986350000051
其中dis(θi,dj,d)表示参数组Θi和Θj在第d维的距离,θi,d及θj,d分别表示Θi及Θj的第d维参数值,距离定义如下:
I.参数值类型为整数或实数:
Figure BDA0003899986350000052
其中max(θd)和min(θd)分别表示目标算法第i个参数取值范围的最大值及最小值。
II.参数值不为整数或实数类型(如枚举类型),如果θi,d和θj,d的值相同,则dis(θi,dj,d)=0,否则dis(θi,dj,d)=1。
(2)构建代理模型:
调参器使用高斯过程回归构建代理模型GP,特征为参数组中的参数值,label为目标算法的性能值。使用历史运行数据组成的训练集S训练代理模型,当输入新的参数组Θnew时,可预测使用该参数组运行目标算法的性能onew
(3)生成候选参数组集合Φcandidate
调参器在目标算法各参数取值范围内分别随机采样生成候选参数组集合Φcandidate={Θ1,…,Θc,…,ΘC},其中C为每次生成的参数组数量。
(4)性能预测及参数组选择:
首先使用代理模型GP预测候选参数组集合Φcandidate中每个参数组的性能oc及标准差stdc,然后使用如下公式计算eic
eic=(oc-oincumbent-0.1)*cdf(zc)+stdc*pdf(zc)
其中,
Figure BDA0003899986350000053
oincumbent为当前找到最佳参数组的性能。
最后选取ei值最大的参数组Θselected,运行目标算法得到其性能oselected,将(Θselected,oselected)加入训练集S。
三、输出
当调参时间t用完时,调参流程结束,输出在此时间内找到的最佳参数组Θbest及使用此参数组运行目标算法的性能obest,如机器学习算法使用调参工具给出的超参数执行分类任务将获得更高的分类准确率。
本发明中代理模型除开使用高斯过程回归,也可以选择其他回归模型,如随机森林、XGBoost等。
初始参数组采样方法可以选择k-center采样以外的方法,如随机采样。
参数组选择方法除选择使用ei作为排序指标外,也可以使用其他指标,如直接使用目标算法给出的性能指标值。
尽管为说明目的公开了本发明的具体实施例,其目的在于帮助理解本发明的内容并据以实施,本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是可能的。因此,本发明不应局限于最佳实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

Claims (10)

1.一种自动调参方法,其步骤包括:
1)调参器根据输入的待调参目标算法的可执行文件、优化目标、目标算法的参数信息及调参时间t,生成一组初始参数组集合Φinit
2)调参器根据初始参数组集合Φinit中的参数组运行所述目标算法的可执行文件得到一训练集S;
3)调参器使用所述训练集S构建代理模型GP;
4)调参器在所述目标算法的各参数取值范围内分别随机采样生成候选参数组集合Φcandidate,调参器将Φcandidate的各候选参数组分别输入至代理模型GP中,预测得到每一候选参数组的参数组性能;
5)调参器根据各候选参数组的性能选取一候选参数组Θselected,运行目标算法的可执行文件,得到对应的预测性能oselected,将(Θselected,oselected)加入训练集S;然后利用更新后的训练集S训练所述代理模型GP;
6)循环步骤4)~5)直至达到调参时间t,然后输出最优性能obest对应的参数组θbest作为所述目标算法的优化参数。
2.根据权利要求1所述的方法,其特征在于,步骤4)中,调参器选取ei值最大的候选参数组Θselected,运行目标算法的可执行文件,得到对应的预测性能oselected,将(Θselected,oselected)加入训练集S;然后利用更新后的训练集S训练所述代理模型GP;其中第c个候选参数组Θc对应的ei值为eic=(oc-oincumbent-0.1)*cdf(zc)+stdc*pdf(zc),
Figure FDA0003899986340000011
oc为候选参数组Θc的性能,stdc为候选参数组Θc的性能与当前候选参数组集合Φcandidate中其他候选参数组Θc的性能的标准差,oincumbent为已获取的最优性能。
3.根据权利要求1所述的方法,其特征在于,采用基于K-center的采样方法生成初始参数组集合Φinit,其方法为:
11)在各参数的取值范围内随机采样获取一个参数组集合Φrand={Θ1,…,Θr,…,ΘR};Θr为第r个参数组;
12)在Φrand中选取k个参数组得到一参数组集合Φinit使其到其他参数组构成的集合{Φrandinit}的距离之和最小;其中任意两个参数组Θi和Θj之间的距离dis(Θij)计算方式为
Figure FDA0003899986340000012
dis(θi,dj,d)表示参数组Θi和Θj在第d维的距离,θi,d及θj,d分别表示Θi及Θj的第d维参数值。
4.根据权利要求3所述的方法,其特征在于,如果参数值类型为整数或实数,则
Figure FDA0003899986340000021
其中max(θi)和min(θi)分别表示目标算法第i个参数取值范围的最大值及最小值;如果参数值不为整数或实数类型,且θi,d和θj,d的值相同,则dis(θi,dj,d)=0,否则dis(θi,dj,d)=1。
5.根据权利要求1或2或3所述的方法,其特征在于,调参器使用高斯过程回归构建代理模型GP,特征为参数组中的参数值,label为目标算法的性能值。
6.根据权利要求1或2或3所述的方法,其特征在于,所述参数信息包含目标算法参数的名称、类型、取值范围。
7.根据权利要求1所述的方法,其特征在于,所述目标算法为任意可接受超参输入的算法。
8.根据权利要求1所述的方法,其特征在于,所述目标算法为用于图像分类的机器学习算法或随机森林算法。
9.一种服务器,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1至8任一所述方法中各步骤的指令。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一所述方法的步骤。
CN202211287486.2A 2022-10-20 2022-10-20 基于贝叶斯优化及K-center采样的自动调参方法 Pending CN115470910A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211287486.2A CN115470910A (zh) 2022-10-20 2022-10-20 基于贝叶斯优化及K-center采样的自动调参方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211287486.2A CN115470910A (zh) 2022-10-20 2022-10-20 基于贝叶斯优化及K-center采样的自动调参方法

Publications (1)

Publication Number Publication Date
CN115470910A true CN115470910A (zh) 2022-12-13

Family

ID=84336222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211287486.2A Pending CN115470910A (zh) 2022-10-20 2022-10-20 基于贝叶斯优化及K-center采样的自动调参方法

Country Status (1)

Country Link
CN (1) CN115470910A (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140307958A1 (en) * 2013-04-16 2014-10-16 The Penn State Research Foundation Instance-weighted mixture modeling to enhance training collections for image annotation
CN109376869A (zh) * 2018-12-25 2019-02-22 中国科学院软件研究所 一种基于异步贝叶斯优化的机器学习超参优化系统及方法
CN110443126A (zh) * 2019-06-27 2019-11-12 平安科技(深圳)有限公司 模型超参数调整控制方法、装置、计算机设备及存储介质
CN111160567A (zh) * 2019-12-27 2020-05-15 第四范式(北京)技术有限公司 一种实现自动超参数选择的方法、装置及系统
CN111652380A (zh) * 2017-10-31 2020-09-11 第四范式(北京)技术有限公司 针对机器学习算法进行算法参数调优的方法及系统
CN112580416A (zh) * 2019-09-27 2021-03-30 英特尔公司 基于深暹罗网络和贝叶斯优化的视频跟踪
CN113042858A (zh) * 2021-04-02 2021-06-29 华东理工大学 一种自适应调参的电弧增材制造方法及系统
CN113064879A (zh) * 2021-03-12 2021-07-02 腾讯科技(深圳)有限公司 数据库参数调整方法、装置及计算机可读存储介质
CN113204450A (zh) * 2021-05-27 2021-08-03 济南浪潮数据技术有限公司 基于遗传算法的数据重构自动调参方法、系统及存储介质
CN113837232A (zh) * 2021-08-30 2021-12-24 厦门大学 一种基于样本选择和加权损失函数的黑盒模型蒸馏方法
WO2022011892A1 (zh) * 2020-07-15 2022-01-20 北京市商汤科技开发有限公司 网络训练方法及装置、目标检测方法及装置和电子设备
CN114332984A (zh) * 2021-12-06 2022-04-12 腾讯科技(深圳)有限公司 训练数据处理方法、装置和存储介质
CN115204064A (zh) * 2022-09-19 2022-10-18 中国石油大学(华东) 一种页岩油开采中注气吞吐参数优化方法及系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140307958A1 (en) * 2013-04-16 2014-10-16 The Penn State Research Foundation Instance-weighted mixture modeling to enhance training collections for image annotation
CN111652380A (zh) * 2017-10-31 2020-09-11 第四范式(北京)技术有限公司 针对机器学习算法进行算法参数调优的方法及系统
CN109376869A (zh) * 2018-12-25 2019-02-22 中国科学院软件研究所 一种基于异步贝叶斯优化的机器学习超参优化系统及方法
CN110443126A (zh) * 2019-06-27 2019-11-12 平安科技(深圳)有限公司 模型超参数调整控制方法、装置、计算机设备及存储介质
CN112580416A (zh) * 2019-09-27 2021-03-30 英特尔公司 基于深暹罗网络和贝叶斯优化的视频跟踪
CN111160567A (zh) * 2019-12-27 2020-05-15 第四范式(北京)技术有限公司 一种实现自动超参数选择的方法、装置及系统
WO2022011892A1 (zh) * 2020-07-15 2022-01-20 北京市商汤科技开发有限公司 网络训练方法及装置、目标检测方法及装置和电子设备
CN113064879A (zh) * 2021-03-12 2021-07-02 腾讯科技(深圳)有限公司 数据库参数调整方法、装置及计算机可读存储介质
CN113042858A (zh) * 2021-04-02 2021-06-29 华东理工大学 一种自适应调参的电弧增材制造方法及系统
CN113204450A (zh) * 2021-05-27 2021-08-03 济南浪潮数据技术有限公司 基于遗传算法的数据重构自动调参方法、系统及存储介质
CN113837232A (zh) * 2021-08-30 2021-12-24 厦门大学 一种基于样本选择和加权损失函数的黑盒模型蒸馏方法
CN114332984A (zh) * 2021-12-06 2022-04-12 腾讯科技(深圳)有限公司 训练数据处理方法、装置和存储介质
CN115204064A (zh) * 2022-09-19 2022-10-18 中国石油大学(华东) 一种页岩油开采中注气吞吐参数优化方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JUNJIE CHEN 等: "Efficient Compiler Autotuning via Bayesian Optimization" *
PENG DONG 等: "An approach for automatic parameters evaluation in unconventional oil reservoirs with deep reinforcement learning" *
丁建立 等: "基于LightGBM的航班延误多分类预测" *

Similar Documents

Publication Publication Date Title
US20090228472A1 (en) Optimization of Discontinuous Rank Metrics
US8639643B2 (en) Classification of a document according to a weighted search tree created by genetic algorithms
Da Silva et al. A hybrid memetic approach for fully automated multi-objective web service composition
CN115469851A (zh) 一种编译器自动调参方法
WO2022227217A1 (zh) 文本分类模型的训练方法、装置、设备及可读存储介质
CN113391894A (zh) 一种基于rbp神经网络的最优超任务网优化方法
CN110738362A (zh) 一种基于改进的多元宇宙算法构建预测模型的方法
Szwarcman et al. Quantum-inspired evolutionary algorithm applied to neural architecture search
CN111832817A (zh) 基于mcp罚函数的小世界回声状态网络时间序列预测方法
Ganepola et al. Automating generative adversarial networks using neural architecture search: A review
US20160189026A1 (en) Running Time Prediction Algorithm for WAND Queries
JP2022015503A (ja) 情報処理システム、情報処理方法及びプログラム
CN116910210A (zh) 基于文档的智能问答模型训练方法、装置及其应用
CN117539977A (zh) 一种语言模型的训练方法及装置
Rodriguez et al. Multi-objective information retrieval-based NSGA-II optimization for requirements traceability recovery
CN115470910A (zh) 基于贝叶斯优化及K-center采样的自动调参方法
Yang et al. A data stream ensemble assisted multifactorial evolutionary algorithm for offline data-driven dynamic optimization
Boateng et al. Predicting building-related carbon emissions: A test of machine learning models
Alaoui et al. Enhanced ant colony algorithm for best features selection for a decision tree classification of medical data
Zerrouk et al. Evolutionary algorithm for optimized CNN architecture search applied to real-time boat detection in aerial images
CN115345303A (zh) 卷积神经网络权重调优方法、装置、存储介质和电子设备
CN111027709B (zh) 信息推荐方法、装置、服务器及存储介质
Chen et al. Dynamic multi-objective ensemble of acquisition functions in batch Bayesian optimization
Jaber et al. HDT-HS: A hybrid decision tree/harmony search algorithm for biological datasets
US20230281496A1 (en) Equilibrium solution searching method and information processing apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20221213