CN115470910A - 基于贝叶斯优化及K-center采样的自动调参方法 - Google Patents
基于贝叶斯优化及K-center采样的自动调参方法 Download PDFInfo
- Publication number
- CN115470910A CN115470910A CN202211287486.2A CN202211287486A CN115470910A CN 115470910 A CN115470910 A CN 115470910A CN 202211287486 A CN202211287486 A CN 202211287486A CN 115470910 A CN115470910 A CN 115470910A
- Authority
- CN
- China
- Prior art keywords
- parameter
- candidate
- theta
- target algorithm
- performance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000005070 sampling Methods 0.000 title claims abstract description 17
- 238000005457 optimization Methods 0.000 title claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 74
- 238000004590 computer program Methods 0.000 claims description 6
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000011084 recovery Methods 0.000 description 9
- 230000002068 genetic effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于贝叶斯优化及K‑center采样的自动调参方法。本方法为:1)调参器根据输入的待调参目标算法的可执行文件、优化目标、目标算法的参数信息及调参时间t,生成一组初始参数组集合Φinit;2)调参器根据Φinit中的参数组运行目标算法得到一训练集S;3)使用训练集S构建模型GP;4)调参器生成候选参数组集合Φcandidate并将其中各候选参数组分别输入至模型GP中,预测得到参数组性能;5)调参器选取一候选参数组,运行目标算法得到对应的预测性能,将加入训练集S;然后利用更新后的训练集S训练模型GP;6)循环步骤4)~5)直至达到调参时间t,然后输出最优性能对应的参数组。
Description
技术领域
本发明属于计算机可信计算技术领域,具体涉及一种基于贝叶斯优化及K-center采样的自动调参方法。
背景技术
贝叶斯优化是一种黑盒优化算法,用于求解表达式未知的函数的极值问题。算法根据一组采样点处的函数值预测任意点处函数值的概率分布,此过程通过高斯过程回归实现。
K-center算法是指在n个点中选取k个点使其到其他点的距离之和最小。
专利申请公布号:CN113204450A的发明提出了一种基于遗传算法的数据重构自动调参方法、系统及存储介质,包括以下步骤:
S1:引入遗传算法,在数据恢复控制算法中,累加恢复对象的大小,以及记录恢复对象的总数和恢复的小对象的数目;
S2:判断数据恢复场景的类型,根据步骤S1中得到的恢复的不同方式下,恢复个数占总的恢复对象个数的比例,确定选择最佳参数处理方式;
S3:针对步骤S2确定不同的恢复场景,选用算法权衡权重,匹配不同的参数,从而进行优化不同场景下的恢复参数;
S4:在遗传算法训练器中最后清空步骤S1中计数,以便进行下一周期对恢复场景优化恢复参数;
S5:遗传算法下NVME硬盘的处理步骤;
S6:根据集群规模调整重构速度步骤。
现有调参方式分为两类,第一种是人工调参,算法开发人员根据经验,手动调整超参数,观察算法性能,然后再做调整,直至调整至满意的状态。第二种是使用调参工具自动调参,用户定义好参数类型,取值范围,性能指标(如要使求解时间最短、求解的结果最大或最小等),然后将其输入给自动调参工具,调参工具在参数空间内搜索,直至找到使目标算法性能较好的参数配置。
传统人工手动调参存在以下几个局限:
一、高度依赖算法工程师经验,同时需要花费大量的时间及精力调整,效率不高。
二、对于目标算法参数数量多、取值范围大的情况,参数空间太大,人工手动调参将不可行。
现有自动调参工具存在以下几个问题:
一、调参算法收敛慢,找到较优参数配置花费时间长;
二、基于模型的调参工具,在调参开始时,为了训练模型,会随机采样几组参数尝试以得到初始训练数据,但训练得到的模型并不能很好地反映真实的分布,效果较差。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种基于贝叶斯优化及K-center采样的自动调参方法,可以有效加快调参速度,用更少的时间找到更优的参数配置,从而大大提高调参效率和调参结果稳定性。
本发明的技术方案为:
一种自动调参方法,其步骤包括:
1)调参器根据输入的待调参目标算法的可执行文件、优化目标、目标算法的参数信息及调参时间t,生成一组初始参数组集合Φinit;
2)调参器根据初始参数组集合Φinit中的参数组运行所述目标算法的可执行文件得到一训练集S;
3)调参器使用所述训练集S构建代理模型GP;
4)调参器在所述目标算法的各参数取值范围内分别随机采样生成候选参数组集合Φcandidate,调参器将Φcandidate的各候选参数组分别输入至代理模型GP中,预测得到每一候选参数组的参数组性能;
5)调参器根据各候选参数组的性能选取一候选参数组Θselected,运行目标算法的可执行文件,得到对应的预测性能oselected,将(Θselected,oselected)加入训练集S;然后利用更新后的训练集S训练所述代理模型GP;
6)循环步骤4)~5)直至达到调参时间t,然后输出最优性能obest对应的参数组θbest作为所述目标算法的优化参数。
进一步的,步骤4)中,调参器选取ei值最大的候选参数组Θselected,运行目标算法的可执行文件,得到对应的预测性能oselected,将(Θselected,oselected)加入训练集S;然后利用更新后的训练集S训练所述代理模型GP;其中第c个候选参数组Θc对应的ei值为 oc为候选参数组Θc的性能,stdc为候选参数组Θc的性能与当前候选参数组集合Φcandidate中其他候选参数组Θc的性能的标准差,oincumbent为已获取的最优性能。
进一步的,采用基于K-center的采样方法生成初始参数组集合Φinit,其方法为:
11)在各参数的取值范围内随机采样获取一个参数组集合Φrand={Θ1,…,Θr,…,ΘR};Θr为第r个参数组;12)在Φrand中选取k个参数组得到一参数组集合Φinit使其到其他参数组构成的集合
{Φrand-Φinit}的距离之和最小;其中任意两个参数组Θi和Θj之间的距离dis(Θi,Θj)计算方式为dis(θi,d,θj,d)表示参数组Θi和Θj在第d维的距离,θi,d及θj,d分别表示Θi及Θj的第d维参数值。
进一步的,如果参数值类型为整数或实数,则其中max(θi)和min(θi)分别表示目标算法第i个参数取值范围的最大值及最小值;如果参数值不为整数或实数类型,且θi,d和θj,d的值相同,则dis(θi,d,θj,d)=0,否则dis(θi,d,θj,d)=1。
进一步的,调参器使用高斯过程回归构建代理模型GP,特征为参数组中的参数值,label为目标算法的性能值。
进一步的,所述参数信息包含目标算法参数的名称、类型、取值范围。
进一步的,所述目标算法为为任意可接受超参输入的算法。
进一步的,所述目标算法为用于图像分类的机器学习算法或随机森林算法。
一种服务器,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行上述方法中各步骤的指令。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明的优点如下:
1)相对于传统手动调参,本发明提出了一种基于贝叶斯优化的高效自动调参方法。
2)传统自动调参算法采样时常使用随机采样的方式,本发明提出了一种基于k-center的采样方法,更能保证采样的均匀性,用得到的训练集训练的代理模型效果更好,能有效加速调参过程。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图对本发明进行进一步详细描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
本方案整体流程如图1所示,用户输入目标算法可执行文件、优化目标、参数信息、调参时间,调参算法进行调参直至调参时间用完,最后输出找到的最优参数组及其性能。目标算法可执行文件是指目标算法的源代码编译后的可执行文件。目标算法是指任意可接受参数输入,同时给出优化目标的程序;如随机森林算法,其输入参数为树的数量、最大树高等参数,调参的目标是最大化分类准确率。
分步骤详述具体方法如下:
一、输入
a)目标算法可执行文件
目标算法可执行文件接受参数组输入,运行后输出性能指标值。
b)优化目标
对目标算法的优化指标可以是最小化运行时间,最优化解质量等。
c)参数信息
参数信息包含了目标算法参数的名称、类型、取值范围。
二、调参器算法
调参器接受用户输入待调参的目标算法可执行文件、优化目标、目标算法的输入参数信息、调参时间t后,首先生成一组初始参数组集合Φinit,然后使用此集合中的参数组运行目标算法的可执行文件得到训练集S,之后使用训练集构建代理模型GP,将生成的候选参数组输入至代理模型中可预测参数组性能,然后选择其中的一个参数组执行目标算法得到一条新的数据加入训练集,循环此过程直至调参时间t用完,最后输出找到的最优性能obest及对应的参数组θbest。
其中:
(1)参数组:Θ={θ1,…,θi,…,θd},d表示目标算法有d个参数,θi表示第i个参数值;
(2)初始参数组集合Φinit={Θ1,…,Θk,…,ΘK},Θn表示第n个参数组;
(3)训练集S={(Θ1,o1),…,(Θm,om),…,(ΘM,oM)},(Θm,om)表示使用参数组Θm运行目标算法得到的性能指标值为om;
对每个步骤的详细介绍如下:
(1)初始参数组集合生成:
本方案采用基于K-center的采样方法生成初始参数组集合,步骤如下:
a.使用随机采样在参数取值范围内获取一个参数组集合Φrand={Θ1,…,Θr,…,ΘR};
b.在Φrand中选取k(k≤R)个参数组得到一参数组集合Φinit使其到其他参数组构成的集合{Φrand-Φinit}的距离之和最小,其中任意两个参数组Θi和Θj之间的距离dis(Θi,Θj)计算方式如下:
其中dis(θi,d,θj,d)表示参数组Θi和Θj在第d维的距离,θi,d及θj,d分别表示Θi及Θj的第d维参数值,距离定义如下:
II.参数值不为整数或实数类型(如枚举类型),如果θi,d和θj,d的值相同,则dis(θi,d,θj,d)=0,否则dis(θi,d,θj,d)=1。
(2)构建代理模型:
调参器使用高斯过程回归构建代理模型GP,特征为参数组中的参数值,label为目标算法的性能值。使用历史运行数据组成的训练集S训练代理模型,当输入新的参数组Θnew时,可预测使用该参数组运行目标算法的性能onew。
(3)生成候选参数组集合Φcandidate:
调参器在目标算法各参数取值范围内分别随机采样生成候选参数组集合Φcandidate={Θ1,…,Θc,…,ΘC},其中C为每次生成的参数组数量。
(4)性能预测及参数组选择:
首先使用代理模型GP预测候选参数组集合Φcandidate中每个参数组的性能oc及标准差stdc,然后使用如下公式计算eic,
eic=(oc-oincumbent-0.1)*cdf(zc)+stdc*pdf(zc)
其中,
最后选取ei值最大的参数组Θselected,运行目标算法得到其性能oselected,将(Θselected,oselected)加入训练集S。
三、输出
当调参时间t用完时,调参流程结束,输出在此时间内找到的最佳参数组Θbest及使用此参数组运行目标算法的性能obest,如机器学习算法使用调参工具给出的超参数执行分类任务将获得更高的分类准确率。
本发明中代理模型除开使用高斯过程回归,也可以选择其他回归模型,如随机森林、XGBoost等。
初始参数组采样方法可以选择k-center采样以外的方法,如随机采样。
参数组选择方法除选择使用ei作为排序指标外,也可以使用其他指标,如直接使用目标算法给出的性能指标值。
尽管为说明目的公开了本发明的具体实施例,其目的在于帮助理解本发明的内容并据以实施,本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是可能的。因此,本发明不应局限于最佳实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
Claims (10)
1.一种自动调参方法,其步骤包括:
1)调参器根据输入的待调参目标算法的可执行文件、优化目标、目标算法的参数信息及调参时间t,生成一组初始参数组集合Φinit;
2)调参器根据初始参数组集合Φinit中的参数组运行所述目标算法的可执行文件得到一训练集S;
3)调参器使用所述训练集S构建代理模型GP;
4)调参器在所述目标算法的各参数取值范围内分别随机采样生成候选参数组集合Φcandidate,调参器将Φcandidate的各候选参数组分别输入至代理模型GP中,预测得到每一候选参数组的参数组性能;
5)调参器根据各候选参数组的性能选取一候选参数组Θselected,运行目标算法的可执行文件,得到对应的预测性能oselected,将(Θselected,oselected)加入训练集S;然后利用更新后的训练集S训练所述代理模型GP;
6)循环步骤4)~5)直至达到调参时间t,然后输出最优性能obest对应的参数组θbest作为所述目标算法的优化参数。
5.根据权利要求1或2或3所述的方法,其特征在于,调参器使用高斯过程回归构建代理模型GP,特征为参数组中的参数值,label为目标算法的性能值。
6.根据权利要求1或2或3所述的方法,其特征在于,所述参数信息包含目标算法参数的名称、类型、取值范围。
7.根据权利要求1所述的方法,其特征在于,所述目标算法为任意可接受超参输入的算法。
8.根据权利要求1所述的方法,其特征在于,所述目标算法为用于图像分类的机器学习算法或随机森林算法。
9.一种服务器,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1至8任一所述方法中各步骤的指令。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211287486.2A CN115470910A (zh) | 2022-10-20 | 2022-10-20 | 基于贝叶斯优化及K-center采样的自动调参方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211287486.2A CN115470910A (zh) | 2022-10-20 | 2022-10-20 | 基于贝叶斯优化及K-center采样的自动调参方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115470910A true CN115470910A (zh) | 2022-12-13 |
Family
ID=84336222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211287486.2A Pending CN115470910A (zh) | 2022-10-20 | 2022-10-20 | 基于贝叶斯优化及K-center采样的自动调参方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115470910A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140307958A1 (en) * | 2013-04-16 | 2014-10-16 | The Penn State Research Foundation | Instance-weighted mixture modeling to enhance training collections for image annotation |
CN109376869A (zh) * | 2018-12-25 | 2019-02-22 | 中国科学院软件研究所 | 一种基于异步贝叶斯优化的机器学习超参优化系统及方法 |
CN110443126A (zh) * | 2019-06-27 | 2019-11-12 | 平安科技(深圳)有限公司 | 模型超参数调整控制方法、装置、计算机设备及存储介质 |
CN111160567A (zh) * | 2019-12-27 | 2020-05-15 | 第四范式(北京)技术有限公司 | 一种实现自动超参数选择的方法、装置及系统 |
CN111652380A (zh) * | 2017-10-31 | 2020-09-11 | 第四范式(北京)技术有限公司 | 针对机器学习算法进行算法参数调优的方法及系统 |
CN112580416A (zh) * | 2019-09-27 | 2021-03-30 | 英特尔公司 | 基于深暹罗网络和贝叶斯优化的视频跟踪 |
CN113042858A (zh) * | 2021-04-02 | 2021-06-29 | 华东理工大学 | 一种自适应调参的电弧增材制造方法及系统 |
CN113064879A (zh) * | 2021-03-12 | 2021-07-02 | 腾讯科技(深圳)有限公司 | 数据库参数调整方法、装置及计算机可读存储介质 |
CN113204450A (zh) * | 2021-05-27 | 2021-08-03 | 济南浪潮数据技术有限公司 | 基于遗传算法的数据重构自动调参方法、系统及存储介质 |
CN113837232A (zh) * | 2021-08-30 | 2021-12-24 | 厦门大学 | 一种基于样本选择和加权损失函数的黑盒模型蒸馏方法 |
WO2022011892A1 (zh) * | 2020-07-15 | 2022-01-20 | 北京市商汤科技开发有限公司 | 网络训练方法及装置、目标检测方法及装置和电子设备 |
CN114332984A (zh) * | 2021-12-06 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 训练数据处理方法、装置和存储介质 |
CN115204064A (zh) * | 2022-09-19 | 2022-10-18 | 中国石油大学(华东) | 一种页岩油开采中注气吞吐参数优化方法及系统 |
-
2022
- 2022-10-20 CN CN202211287486.2A patent/CN115470910A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140307958A1 (en) * | 2013-04-16 | 2014-10-16 | The Penn State Research Foundation | Instance-weighted mixture modeling to enhance training collections for image annotation |
CN111652380A (zh) * | 2017-10-31 | 2020-09-11 | 第四范式(北京)技术有限公司 | 针对机器学习算法进行算法参数调优的方法及系统 |
CN109376869A (zh) * | 2018-12-25 | 2019-02-22 | 中国科学院软件研究所 | 一种基于异步贝叶斯优化的机器学习超参优化系统及方法 |
CN110443126A (zh) * | 2019-06-27 | 2019-11-12 | 平安科技(深圳)有限公司 | 模型超参数调整控制方法、装置、计算机设备及存储介质 |
CN112580416A (zh) * | 2019-09-27 | 2021-03-30 | 英特尔公司 | 基于深暹罗网络和贝叶斯优化的视频跟踪 |
CN111160567A (zh) * | 2019-12-27 | 2020-05-15 | 第四范式(北京)技术有限公司 | 一种实现自动超参数选择的方法、装置及系统 |
WO2022011892A1 (zh) * | 2020-07-15 | 2022-01-20 | 北京市商汤科技开发有限公司 | 网络训练方法及装置、目标检测方法及装置和电子设备 |
CN113064879A (zh) * | 2021-03-12 | 2021-07-02 | 腾讯科技(深圳)有限公司 | 数据库参数调整方法、装置及计算机可读存储介质 |
CN113042858A (zh) * | 2021-04-02 | 2021-06-29 | 华东理工大学 | 一种自适应调参的电弧增材制造方法及系统 |
CN113204450A (zh) * | 2021-05-27 | 2021-08-03 | 济南浪潮数据技术有限公司 | 基于遗传算法的数据重构自动调参方法、系统及存储介质 |
CN113837232A (zh) * | 2021-08-30 | 2021-12-24 | 厦门大学 | 一种基于样本选择和加权损失函数的黑盒模型蒸馏方法 |
CN114332984A (zh) * | 2021-12-06 | 2022-04-12 | 腾讯科技(深圳)有限公司 | 训练数据处理方法、装置和存储介质 |
CN115204064A (zh) * | 2022-09-19 | 2022-10-18 | 中国石油大学(华东) | 一种页岩油开采中注气吞吐参数优化方法及系统 |
Non-Patent Citations (3)
Title |
---|
JUNJIE CHEN 等: "Efficient Compiler Autotuning via Bayesian Optimization" * |
PENG DONG 等: "An approach for automatic parameters evaluation in unconventional oil reservoirs with deep reinforcement learning" * |
丁建立 等: "基于LightGBM的航班延误多分类预测" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20090228472A1 (en) | Optimization of Discontinuous Rank Metrics | |
US8639643B2 (en) | Classification of a document according to a weighted search tree created by genetic algorithms | |
Da Silva et al. | A hybrid memetic approach for fully automated multi-objective web service composition | |
CN115469851A (zh) | 一种编译器自动调参方法 | |
WO2022227217A1 (zh) | 文本分类模型的训练方法、装置、设备及可读存储介质 | |
CN113391894A (zh) | 一种基于rbp神经网络的最优超任务网优化方法 | |
CN110738362A (zh) | 一种基于改进的多元宇宙算法构建预测模型的方法 | |
Szwarcman et al. | Quantum-inspired evolutionary algorithm applied to neural architecture search | |
CN111832817A (zh) | 基于mcp罚函数的小世界回声状态网络时间序列预测方法 | |
Ganepola et al. | Automating generative adversarial networks using neural architecture search: A review | |
US20160189026A1 (en) | Running Time Prediction Algorithm for WAND Queries | |
JP2022015503A (ja) | 情報処理システム、情報処理方法及びプログラム | |
CN116910210A (zh) | 基于文档的智能问答模型训练方法、装置及其应用 | |
CN117539977A (zh) | 一种语言模型的训练方法及装置 | |
Rodriguez et al. | Multi-objective information retrieval-based NSGA-II optimization for requirements traceability recovery | |
CN115470910A (zh) | 基于贝叶斯优化及K-center采样的自动调参方法 | |
Yang et al. | A data stream ensemble assisted multifactorial evolutionary algorithm for offline data-driven dynamic optimization | |
Boateng et al. | Predicting building-related carbon emissions: A test of machine learning models | |
Alaoui et al. | Enhanced ant colony algorithm for best features selection for a decision tree classification of medical data | |
Zerrouk et al. | Evolutionary algorithm for optimized CNN architecture search applied to real-time boat detection in aerial images | |
CN115345303A (zh) | 卷积神经网络权重调优方法、装置、存储介质和电子设备 | |
CN111027709B (zh) | 信息推荐方法、装置、服务器及存储介质 | |
Chen et al. | Dynamic multi-objective ensemble of acquisition functions in batch Bayesian optimization | |
Jaber et al. | HDT-HS: A hybrid decision tree/harmony search algorithm for biological datasets | |
US20230281496A1 (en) | Equilibrium solution searching method and information processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221213 |