CN112541247B - 控制系统的控制参数向量的搜索方法和装置 - Google Patents
控制系统的控制参数向量的搜索方法和装置 Download PDFInfo
- Publication number
- CN112541247B CN112541247B CN201910897481.3A CN201910897481A CN112541247B CN 112541247 B CN112541247 B CN 112541247B CN 201910897481 A CN201910897481 A CN 201910897481A CN 112541247 B CN112541247 B CN 112541247B
- Authority
- CN
- China
- Prior art keywords
- control parameter
- parameter vector
- vector
- data set
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B17/00—Systems involving the use of models or simulators of said systems
- G05B17/02—Systems involving the use of models or simulators of said systems electric
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本申请提供了一种控制系统的控制参数向量的搜索方法和装置,可以应用于人工智能领域。该方法包括:获取控制系统的第一控制参数向量以及第一运行状态,第一控制参数向量为N维向量,第一控制参数向量包含P维的第一子控制参数向量和M维的第二子控制参数向量;基于第一子控制参数向量与第二子控制参数向量之间的相关关系,对第一控制参数向量进行降维处理,得到降维后的第一控制参数向量,降维后的第一控制参数向量为M维向量;基于降维后的第一控制参数向量及其对应的运行状态,以降低确定第三控制参数向量时占用的计算量。
Description
技术领域
本申请涉及人工智能领域,并且更具体地,涉及控制系统的控制参数向量的搜索方法和装置。
背景技术
随着工程技术的不断进步与发展,尤其是自动化控制领域的突破性进展,使得控制系统的规模越来越大,复杂度越来越高。通常,人们无法直接获得控制系统的运行原理,但同时又希望对控制系统的运行原理有所了解,以便通过调整控制系统的控制参数向量使得控制系统的在合适的运行状态下工作。目前,可以通过建立仿真控制系统的方式,使得仿真控制系统描述控制系统在不同控制参数向量下的运行状态,这样,维护人员可以将仿真控制系统作为控制系统的替代模型来进行研究。
在训练仿真控制模型的过程中,首先,需要采集控制系统的在不同控制参数向量下的运行状态,作为控制系统的历史数据,形成控制系统的数据集,再将数据集中的控制参数向量以及运行状态输入仿真控制系统进行训练,使得仿真控制系统的在不同控制参数向量下的运行状态,更加接近控制系统在不同控制参数向量下的运行状态。
目前,在建立上述数据集的过程中,为了提高历史数据的多样性,需要通过采集函数确定需要添加进数据集中的目标控制参数向量。即将已经采集到的控制系统的历史数输入采集函数,并通过确定采集函数的最大值,来搜索下一个需要采集的目标控制参数向量。再将目标控制参数向量输入控制系统,以获取在目标控制参数向量下控制系统的目标运行状态。最后将目标控制参数向量以及目标运行状态作为数据集中的一组历史数据。
然而,如上文所述,随着控制系统的规模越来越大,复杂度越来越高,控制系统的控制参数向量的维度也越来越高,导致在基于采集函数确定目标控制参数向量的过程中所需的计算量也越来越大。
发明内容
本申请提供一种控制系统的控制参数向量的搜索方法和装置,以减少通过采集参数确定控制参数向量过程中所需的计算量。
第一方面,提供了一种控制系统的控制参数向量的搜索方法,获取所述控制系统的第一控制参数向量以及第一运行状态,所述第一控制参数向量为N维向量,所述第一控制参数向量包含P维的第一子控制参数向量和M维的第二子控制参数向量,所述第一子控制参数向量与所述第二子控制参数向量之间存在相关关系,且所述第一子控制参数向量与所述第二子控制参数向量中的参数不同,所述第一运行状态为所述控制系统在所述第一控制参数向量下的运行状态,P<N,M<N,N、M、P均为大于0的正整数;基于所述相关关系,对所述第一控制参数向量进行降维处理,得到降维后的第一控制参数向量,所述降维后的第一控制参数向量为M维向量;将所述降维后的第一控制参数向量以及所述第一运行状态添加至所述第一数据集,得到第二数据集,所述第一数据集包括第二控制参数向量以及第二运行状态,所述第二控制参数向量为M维向量,所述第二运行状态为所述控制系统在所述第二控制参数向量下的运行状态;基于所述第二数据集以及预设的采集函数,得到第三控制参数向量,所述第三控制参数向量为M维向量。
在本申请实施例中,利用第一子控制参数向量与第二子控制参数向量之间的相关关系,对第一控制参数向量进行降维处理,并将降维后的第一控制参数向量添加至第一数据集中,得到第二数据集,再根据第二数据集以及采集函数,确定第三控制参数向量。避免了传统的控制参数向量搜索过程中,基于N维的控制参数向量搜索第二控制参数向量,有利于降低搜索第三控制参数向量时消耗的计算量。
在一种可能的实现方式中,所述相关关系包括所述第一子控制参数向量中的每一维参数,与所述第二子控制参数向量中的一维或多维参数之间的相关关系。
在一种可能的实现方式中,所述方法还包括:对所述第三控制参数向量进行维度恢复处理,得到恢复后的第三控制参数向量,所述恢复后的第三控制参数向量为N维向量;获取所述控制系统在所述恢复后的第三控制参数向量下的第三运行状态;根据所述恢复后的第三控制参数向量以及第三运行状态,对仿真控制系统进行训练,所述仿真控制系统用于描述所述控制系统在不同的控制参数向量下的运行状态。
在本申请实施例中,通过对第二控制参数向量的维度进行恢复,以确定控制系统在第三控制参数向量下的第三运行状态,以提高对仿真控制系统进行训练的准确性。
可选地,基于第一子控制参数向量与第二子控制参数向量之间的相关关系,对所述第三控制参数向量进行维度恢复处理,得到恢复后的第三控制参数向量。其中恢复后的第二控制参数向量为N维向量。
在本申请实施例中,基于第一子控制参数向量与第二子控制参数向量之间的相关关系,对第三控制参数向量的维度进行恢复,以确定控制系统在第三控制参数向量下的第三运行状态,以提高对仿真控制系统进行训练的准确性。
在一种可能的实现方式中,所述基于所述第二数据集以及预设的采集函数,得到第三控制参数向量,包括:通过求解所述采集函数的最大化问题,确定所述第二控制参数向量,所述采集函数基于相关项在控制参数的预设范围内,搜索与所述第一数据集以及所述第二数据集中控制参数向量的相关性最低的控制参数向量。
在本申请实施例中,在采集函数的基础上添加了相关项用于采集函数搜索第三控制参数向量,使得搜索到的第三控制参数向量与第二数据集中控制参数向量的相关性较低,有利于提高搜索到的控制参数向量的多样性。
在一种可能的实现方式中,所述采集参数αt(x)为:αt(X)=βt(X)+e·ηt(X),Xmin<X<Xmax,其中,X表示所述第二数据集中的控制参数向量,t表示当前训练所述仿真控制系统的迭代次数,e为常数,βt(X)表示基于最大值熵搜索算法搜索所述控制系统的控制参数向量时使用的采集函数,所述相关项ηt(X)表示所述第一数据集的第一相关系数与所述第二数据集第二相关系数之间的变化,所述第一相关系数为所述第一数据集中控制参数的第一子控制参数向量,与所述第一数据集中控制参数的第二子控制参数向量之间的相关系数,所述第二相关系数为所述第二数据集中控制参数的第一子控制参数向量,与所述第二数据集中控制参数的第二子控制参数向量之间的相关系数,Xmin表示所述控制系统中控制参数向量的取值范围的最小值,Xmax表示所述控制系统中控制参数向量的取值范围的最大值。
在本申请实施例中,在采集函数的基础上添加了相关项ηt(X)用于采集函数搜索第三控制参数向量,使得搜索到的第三控制参数向量与第二数据集中控制参数向量的相关性较低,有利于提高搜索到的控制参数向量的多样性。
在一种可能的实现方式中,所述相关项ηt(x)为其中,E表示数学期望,d表示所述第一数据集中每维子参数的总数,X'表示所述降维后的第一控制参数向量,y表示所述第一运行状态,r(j,k|Dt)表示所述第一数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,r(j,k|Dt∪(X',y))表示所述第二数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,j的取值从N到1递减,且k的取值从1到N递增。
在本申请实施例中,通过计算第一数据集中不同维度的参数之间的相关系数的期望,与第一数据集中不同维度的参数之间的相关系数之间的变化,确定相关项ηt(x)。有利于基于相关项辅助采集函数搜到多样的控制参数。
在一种可能的实现方式中,在所述基于所述相关关系,对所述第一控制参数向量进行降维处理之前,所述方法还包括:获取所述控制系统的控制参数向量,所述控制系统的控制参数向量为N维向量;将所述控制系统的控制参数向量中的参数划分为多个组合,每个组合中包含的参数所在的维度不同,所述多个组合中不同的组合包含的参数所在的维度不同;从所述多个组合中选择一个或多个第一组合,每个第一组合中参数之间的相关性高于第二组合中参数之间的相关性,所述第二组合为所述多个组合中除所述第一组合之外的组合;确定所述第一组合中每个第一组合的参数之间的相关关系,所述第一组合中作为所述相关关系的自变量的参数属于所述第一子控制参数向量,所述第一组合中作为所述相关关系的因变量的参数属于所述第二子控制参数向量。
在一种可能的实现方式中,所述确定所述第一组合中每个第一组合的参数之间的相关关系,包括:基于最小二乘法,确定所述第一组合中每个第一组合的参数之间的相关关系。
在本申请实施例中,基于最小二乘法,第一组合中每个第一组合的参数之间的相关关系,有利于简化确定相关关系的过程。
在一种可能的实现方式中,所述方法还包括:获取所述控制系统的原始数据集,所述原始数据集中的控制参数向量为N维向量;基于所述相关关系,对所述原始数据集中的控制参数向量进行降维处理,得到所述第一数据集。
在本申请实施例中,利用第一子控制参数向量与第二子控制参数向量之间的相关关系,对原始数据集进行降维处理,得到第一数据集,再根据第一数据集确定第二控制参数向量。避免了传统的控制参数向量搜索过程中,基于N维控制参数向量进行,有利于降低确定第二控制参数向量时所占用的计算量。
第二方面,本申请提供一种搜索目标模型的超参数的方法,获取所述目标模型的第一超参数向量以及第一模型增益,所述第一超参数向量为N维向量,所述第一超参数向量包含P维的第一子参数向量和M维的第二子参数向量,所述第一子参数向量与所述第二子参数向量之间存在相关关系,且所述第一子参数向量与所述第二子参数向量中的参数不同,所述第一模型增益为所述目标模型在所述第一超参数向量下的模型增益,P<N,M<N,N、M、P均为大于0的正整数;基于所述相关关系,对所述第一超参数向量进行降维处理,得到降维后的第一超参数向量,所述降维后的第一超参数向量为M维向量;将所述降维后的第一超参数向量以及所述第一模型增益添加至所述第一数据集,得到第二数据集,所述第一数据集包括第二超参数向量以及第二模型增益,所述第二超参数向量为M维向量,所述第二模型增益为所述目标模型在所述第二超参数向量下的模型增益;基于所述第二数据集以及预设的采集函数,得到第三超参数向量,所述第三超参数向量为M维向量。
在本申请实施例中,利用第一子参数向量与第二子参数向量之间的相关关系,对第一超参数向量进行降维处理,并将降维后的第一超参数向量添加至降维的第一数据集中,得到第二数据集,再根据第二数据集以及采集函数,确定第三超参数向量。避免了传统的超参数搜索过程中,基于N维超参数进行,有利于降低确定第三超参数向量时占用的计算量。
可选地,所述相关关系包括所述第一子参数向量中的每一维参数,与所述第二子参数向量中的一维或多维参数之间的相关关系。
在一种可能的实现方式中,所述方法还包括:对所述第三超参数向量进行维度恢复处理,得到恢复后的第三超参数向量,所述恢复后的第三超参数向量为N维向量;获取所述目标模型在所述恢复后的第三超参数向量下的第三模型增益;根据所述恢复后的第三超参数向量以及第三模型增益,对替代模型进行训练,所述替代模型用于描述所述目标模型在不同的超参数向量下的模型增益。
在本申请实施例中,通过对第三超参数向量的维度进行恢复,以确定目标模型在第三超参数向量下的第三模型增益,以提高对替代模型进行训练的准确性。
可选地,基于第一子参数向量与第二子参数向量之间的相关关系,对所述第三超参数向量进行维度恢复处理,得到恢复后的第三超参数向量。其中恢复后的第三超参数为N维向量。
在本申请实施例中,基于第一子参数向量与第二子参数向量之间的相关关系,对第三超参数向量的维度进行恢复,以确定目标模型在第三超参数向量下的第二模型增益,以提高对替代模型进行训练的准确性。
在一种可能的实现方式中,所述基于所述第二数据集以及采集函数,确定第三超参数向量,包括:通过求解所述采集函数的最大化问题,确定所述第三超参数向量,所述采集函数基于相关项在控制参数的预设范围内,搜索与所述第一数据集以及所述第二数据集中超参数向量的相关性最低的超参数向量。
在本申请实施例中,在采集函数的基础上添加了相关项用于采集函数搜索第三超参数,使得搜索到的第三超参数向量与第二数据集中超参数向量的相关性较低,有利于提高搜索到的超参数向量的多样性。
在一种可能的实现方式中,所述采集参数αt(x)为:αt(X)=βt(X)+e·ηt(X),Xmin<X<Xmax,其中,X表示所述第二数据集中的超参数向量,t表示当前训练所述仿真目标模型的迭代次数,e为常数,βt(X)表示基于最大值熵搜索算法搜索所述目标模型的超参数向量时使用的采集函数,所述相关项ηt(X)表示所述第一数据集的第一相关系数与所述第二数据集第二相关系数之间的变化,所述第一相关系数为所述第一数据集中控制参数的第一子参数向量,与所述第一数据集中控制参数的第二子参数向量之间的相关系数,所述第二相关系数为所述第二数据集中控制参数的第一子参数向量,与所述第二数据集中控制参数的第二子参数向量之间的相关系数,Xmin表示所述目标模型中超参数向量的取值范围的最小值,Xmax表示所述目标模型中超参数向量的取值范围的最大值。
在一种可能的实现方式中,所述相关项ηt(x)为:其中,E表示数学期望,d表示所述第一数据集中每维子参数的总数,X'表示所述降维后的第一超参数向量,y表示所述第一模型增益,r(j,k|Dt)表示所述第一数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,r(j,k|Dt∪(X',y))表示所述第二数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,j的取值从N到1递减,且k的取值从1到N递增。
在一种可能的实现方式中,在所述基于所述相关关系,对所述第一超参数向量进行降维处理之前,所述方法还包括:获取所述目标模型的超参数向量,所述目标模型的超参数向量为N维向量;将所述目标模型的超参数向量中的参数划分为多个组合,每个组合中包含的参数所在的维度不同,所述多个组合中不同的组合包含的参数所在的维度不同;从所述多个组合中选择一个或多个第一组合,每个第一组合中参数之间的相关性高于第二组合中参数之间的相关性,所述第二组合为所述多个组合中除所述第一组合之外的组合;确定所述第一组合中每个第一组合的参数之间的相关关系,所述第一组合中作为所述相关关系的自变量的参数属于所述第一子参数向量,所述第一组合中作为所述相关关系的因变量的参数属于所述第二子参数向量。
在一种可能的实现方式中,所述确定所述第一组合中每个第一组合的参数之间的相关关系,包括:基于最小二乘法,确定所述第一组合中每个第一组合的参数之间的相关关系。
在本申请实施例中,基于最小二乘法,确定所述第一组合中每组第一组合中子参数之间的相关关系,有利于简化确定相关关系的过程。
在一种可能的实现方式中,所述方法还包括:获取所述目标模型的原始数据集,所述原始数据集中的超参数向量为N维向量;基于所述相关关系,对所述原始数据集中的超参数向量进行降维处理,得到所述第一数据集。
在本申请实施例中,利用第一子参数向量与第二子参数向量之间的相关关系,对原始数据集进行降维处理,得到第一数据集,再根据第一数据集确定第三超参数向量。避免了传统的超参数搜索过程中,基于N维超参数进行,有利于降低确定第三超参数向量时的计算量。
第三方面,提供一种搜索控制系统的控制参数向量的装置,所述装置包括用于执行上述第一方面中的方法步骤中的各个模块。
第四方面,提供一种搜索目标模型的超参数向量的装置,所述装置包括用于执行上述第二方面中的方法步骤中的各个模块。
第五方面,提供一种计算设备,所述计算设备可以是独立的计算设备,也可以是具有计算功能的设备内的芯片。所述计算设备可以包括处理模块和获取模块。当所述计算设备是独立的计算设备时,所述处理单元可以是处理器,所述获取单元可以是输入/输出接口;所述计算设备还可以包括存储单元,所述存储单元可以是存储器;所述存储单元用于存储指令,所述处理单元执行所述存储单元所存储的指令,以使所述计算设备执行第一方面或第二方面中的方法。当所述计算设备是芯片时,所述处理模块可以是处理器,所述获取模块可以是输入/输出接口、管脚或电路等;所述处理模块执行存储单元所存储的指令,以使所述计算设备执行第一方面或第二方面中的方法,所述存储单元可以是所述芯片内的存储单元(例如,寄存器、缓存等),也可以是所述计算设备内的位于所述芯片外部的存储单元(例如,只读存储器、随机存取存储器等)。
在上述第五方面中,存储器与处理器耦合,可以理解为,存储器位于处理器内部,或者存储器位于处理器外部,从而独立于处理器。
第六方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述各方面中的方法。
需要说明的是,上述计算机程序代码可以全部或者部分存储在第一存储介质上,其中第一存储介质可以与处理器封装在一起的,也可以与处理器单独封装,本申请实施例对此不作具体限定。
第七方面,提供了一种计算机可读介质,所述计算机可读介质存储有程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述各方面中的方法。
附图说明
图1是本申请实施例适用的调整控制参数向量的场景的示意图。
图2是本申请实施例的控制系统的控制参数向量的搜索方法的流程图。
图3是本申请另一实施例的控制系统的控制参数向量的搜索方法的流程图。
图4是本申请实施例的确定相关关系的方法的流程图。
图5是本申请实施例的目标模型的超参数向量的搜索方法的流程图。
图6是本申请另一实施例的目标模型的超参数向量的搜索方法的流程图。
图7是本申请实施例的确定相关关系的方法的流程图。
图8是本申请实施例的控制系统的控制参数向量的搜索装置的示意图。
图9是本申请实施例的目标模型的超参数向量的搜索装置的示意图。
图10是本申请实施例的计算设备的示意性框图。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。
为了便于理解,先结合图1介绍本申请实施例适用的场景。图1是本申请实施例适用的调整控制参数向量的场景的示意图。图1所示的场景包括控制系统110,控制参数向量搜索装置120以及仿真控制系统130。
控制系统110,指由控制主体、控制客体和控制媒体组成的系统,通常,控制主体可以通过控制媒体控制控制客体,按照预定的运行状态进行工作。例如,工程中的散热系统就是一种典型的控制系统。
控制参数向量搜索装置120,用于基于采集函数通过多次迭代确定多个控制参数向量,这多个控制参数向量用于对仿真控制系统130进行训练。
需要说明的是,上述控制参数向量搜索装置120可以位于控制系统110内,上述控制参数向量搜索装置120还可以位于仿真控制系统130中,上述控制参数向量搜索装置120还可以由独立的具有计算功能的设备实现,本申请实施例对此不做限定。
仿真控制系统130,用于对控制系统110进行仿真,描述控制系统110在不同控制参数向量下的运行状态。
需要说明的是,上述仿真控制系统130可以理解为数学模型,例如,可以为高斯模型,随机森林模型等。
下文基于上述图1所示的场景,结合步骤140至步骤150,介绍基于贝叶斯优化(Bayesian optimization)确定控制参数向量,以训练仿真控制系统的传统方法。
假设在第t次迭代过程中,已经采集到的原始数据集为Dt,其中,原始数据集Dt包括b组历史数据,每组历史数据包括控制参数向量Xt以及在该控制参数向量下控制系统的运行状态y。运行状态y通常为一个1维的数据。控制参数向量Xt为N维向量,即包括N维的分量x1,x2,…,xN,即Xt=[x1,x2,…,xN]。例如,在散热控制系统中,上述控制参数向量可以包括风扇转速、风扇功率等分量,t、b和N为大于或等于1的正整数。
140,控制参数向量搜索装置120根据数据集Dt以及采集函数,确定下一个控制参数向量,即目标控制参数向量X't=[x1t,x2t,…,xNt]。
150,控制参数向量搜索装置120将目标控制参数向量X't发送给控制系统110。
160,控制系统110在目标控制参数向量X't下工作,并得到目标运行状态yt。
170,控制系统110将目标控制参数向量X't以及目标运行状态yt添加到数据集Dt中,得到新的数据集Dt+1。
180,控制系统将新的数据集Dt+1发送到仿真控制系统进行训练,仿真控制系统输出中间结果,以便通过中间结果确定仿真控制系统的准确度。
在下一轮迭代的过程中,将新的数据集Dt+1作为上述已经采集到的原始数据集Dt,并重新执行步骤140至180搜索新的目标控制参数向量,直到迭代次数达到预设的迭代次数阈值,确定训练仿真控制系统的过程结束。
基于上文介绍,由于每一轮的迭代过程中,都需要将数据集输入采集函数,以确定下一个控制参数向量,即目标控制参数向量。当控制参数向量的维数较高时,确定目标控制参数向量所需的计算量较大。另一方面,当控制参数向量的维数较高,例如达到20维甚至50维以上时,由于用于搜索控制参数向量的搜索空间急剧增大,即使经过大量迭代仿真控制系统仍然无法达到预期的准确度。
因此,为了避免上述问题,本申请提供了一种控制系统中控制参数向量的搜索方法,即利用控制参数向量中第一子控制参数向量与第二子控制参数向量之间的相关关系,对控制系统的控制参数向量进行降维处理,并根据降维后的控制参数向量以及采集函数,确定新的控制参数向量,以降低确定目标控制参数向量时的计算量。
下文结合图2介绍本申请实施例的控制系统的控制参数向量的搜索方法的流程。应理解,图2所示的方法可以由图1中的控制参数向量的搜索装置120执行。图2所示的方法包括步骤201至步骤205。
如上文所述,控制系统的控制参数向量(原始控制参数向量)为N维,控制参数向量包含第一子控制参数向量以及第二子控制参数向量,第一子控制参数向量的参数与第二子控制参数向量的参数不同,或者说,第一子控制参数向量中参数所在的维度与第二子控制参数向量中参数所在的维度不同,其中,P<N,M<N,N、M、P均为大于0的正整数。需要说明的是,本申请实施例对上述第一子控制参数向量、第二子控制参数向量与N维向量之间的关系不做限定。第一子控制参数向量与第二子控制参数向量之和可以组成N维向量中的部分或全部参数。
例如,控制系统的第i个控制参数向量为Xi=[x1i,x2i,…,xMi,xPi,…,xNi],其中,控制参数向量Xi包含的N维参数为x1i,x2i,…,xMi,xPi,…,xNi,控制参数向量Xi包含的第二子控制参数向量为x1i,x2i,…,xMi,控制参数向量Xi包含的第一子控制参数向量为xPi,…,xNi。第一子控制参数向量与第二子控制参数向量之和为组成N维参数中的部分参数。
又例如,控制系统的第i个控制参数向量为Xi=[x1i,x2i,…,xMi,x(M+1)i,…,x(P-1)i,xPi,…,xNi],其中,控制参数向量Xi包含的N维参数为x1i,x2i,…,xMi,x(M+1)i,…,x(P-1)i,xPi,…,xNi,控制参数向量Xi包含的第二子控制参数向量为x1i,x2i,…,xMi,控制参数向量Xi包含的第一子控制参数向量为xPi,…,xNi,控制参数向量还包括剩下的参数x(M+1)i,…,x(P-1)i,i为正整数。
201,获取控制系统的第一数据集。
上述第一数据集中包含多个控制参数向量(又称第二控制参数向量),每个控制参数向量为M维向量。也就是说,上述第一数据集中的控制参数向量为降维后的M维控制参数向量。
可选地,上述步骤201包括基于所述第一子控制参数向量与所述第二子控制参数向量之间的相关关系,对原始数据集中的控制参数向量进行降维处理,得到上述第一数据集。其中,原始数据集中的控制参数向量为N维向量,即可以包含控制系统中全部维度的参数。
需要说明的是,在多轮迭代过程中,可以在每轮迭代中对控制系统的原始数据集进行降维处理得到本轮所需的“第一数据集”。然而,由于相邻的两轮迭代过程中使用的第一数据集仅有部分控制参数向量不同,因此为了减少降维处理所需的计算量,也可以使用上轮迭代过程中降维后的数据集,并在降维后的数据集的基础上,对新增的控制参数向量进行降维处理。
例如,上述相邻的两轮迭代过程为迭代过程#1以及迭代过程#2,迭代过程#1中使用的降维后的数据集为第一数据集#1,迭代过程#1中新确定的控制参数向量为第一控制参数向量,迭代过程#2中使用的降维后的数据集为第一数据集#2,第一数据集#2包括第一数据集#1以及降维后的第一控制参数向量,因此,为了减少降维所需的计算量,可以仅对第一控制参数向量进行降维处理,详细请见步骤203。
202,获取控制系统的第一控制参数向量以及第一运行状态,所述第一控制参数向量为N维向量,所述第一控制参数向量包含P维的第一子控制参数向量和M维的第二子控制参数向量,所述第一子控制参数向量与所述第二子控制参数向量之间存在相关关系,且所述第一子控制参数向量与所述第二子控制参数向量中的参数不同,所述第一运行状态为所述控制系统在所述第一控制参数向量下的运行状态。
上述第一控制参数向量的第一子控制参数向量,与控制系统的控制参数的第一子控制参数向量包含参数所在的维度相同。上述第一控制参数向量的第二子控制参数向量,与控制系统的控制参数的第二子控制参数向量包含参数所在的维度相同。
上述第一控制参数向量不属于第一数据集,本申请实施例对第一控制参数向量的获取方式不做限定,例如,上述第一控制参数向量可以是随机确定的。又例如,第一控制参数向量也可以是上一次迭代过程后得到的控制参数向量。即,假设步骤201至步骤205为第t次迭代过程,那么第一控制参数向量可以是在第t-1次迭代后确定的控制参数向量,具体的迭代过程可以参见下文中的介绍,为了简洁,在此不再赘述。
需要说明的是,本申请实施例对上述步骤201和步骤202之间的时间顺序不做限定,步骤201和步骤202可以同时进行,上述步骤201可以在步骤202之前执行,上述步骤201还可以在步骤202之后执行,本申请实施例对此不做限定。
203,基于所述第一子控制参数向量与所述第二子控制参数向量之间的相关关系,对所述第一控制参数向量进行降维处理,得到降维后的第一控制参数向量。上述降维后的第一控制参数向量为M维向量。
上述相关关系可以包括第一子控制参数向量与第二子控制参数向量之间的函数关系,其中第一子控制参数向量中的参数可以作为函数的自变量,第二子控制参数向量中的参数可以作为函数的因变量。或者,第二子控制参数向量中的参数可以作为函数的自变量,第一子控制参数向量中的参数可以作为函数的因变量。
上述第一子控制参数向量与第二子控制参数向量之间的相关关系,可以是第一子控制参数向量中多个维度的参数,和第二子控制参数向量中某一维度的参数之间的相关关系。上述第一子控制参数向量与第二子控制参数向量之间的相关关系,还可以是第一子控制参数向量中某一个维度的参数,和第二子控制参数向量中多个维度的参数之间的相关关系。上述第一子控制参数向量与第二子控制参数向量之间的相关关系,可以是第一子控制参数向量中某一个维度的参数,和第二子控制参数向量中某一维度的参数之间的相关关系。本申请实施例对于上述相关关系不做具体限定。
例如,上述控制系统为散热控制系统,第一子控制参数向量中包括风扇的转速xPi,第二子控制参数向量中包括风扇的功率xMi,则风扇的转速xPi和风扇的功率xMi之间的相关关系为xMi=xPi 3。
上述降维后的第一控制参数向量为M维向量,可以理解为,降维后的第一控制参数向量包含的子参数所在的维度为第二子控制参数向量包含的参数所在的维度。
可选地,上述相关关系可以是线性相关关系也可以是非线性相关关系,本申请实施例对此不做具体限定。
需要说明的是,上述相关关系可以是预先配置的,也可以是控制参数向量搜索装置120在初始化后基于控制系统的数据集预先确定的。具体的确定过程可以参见步骤209。本申请实施例对此不做限定。
204,将所述降维后的第一控制参数向量以及所述第一运行状态添加至所述第一数据集,得到第二数据集。
假设上述第一控制参数向量为X=[x1',x2',…,xM',xP',…,xN'],降维后的第一控制参数向量为X'=[x1',x2',…,xM'],上述第一运行状态为y,第一数据集为Dt,则第二数据集可以表示为Dt∪(X',y)。
205,基于所述第二数据集以及预设的采集函数,得到第三控制参数向量,所述第三控制参数向量为M维向量。
上述仿真控制系统可以理解为数学模型,用于描述控制系统在不同控制参数向量下的运行状态的数学模型。例如,可以是高斯模型、还可以是随机森林等。
上述根据第二数据集以及采集函数确定第三控制参数向量,可以理解为在预设的范围内,根据第二数据集中的数据、采集函数,确定第三控制参数向量。其中预设的范围为控制参数向量的取值的预设范围,通常可以是在初始化控制系统时人工配置的。
上述第三控制参数向量为M维向量,可替换地,第三控制参数向量包含的子参数所在的维度为第二子控制参数向量包含的参数所在的维度。
上述采集函数可以是传统的基于熵搜索(entropy search)的采集函数,也可以是基于最大值熵搜索(Max-value entropy search)的采集函数。本申请实施例对此不做限定。并且,上述采集函数为熵搜索的采集函数或最大值熵搜索中使用的采集函数时,确定第三控制参数向量的方法可以参见传统的确定控制参数向量的方法,为了简洁,在此不再赘述。
然而,上述传统的采集函数并没有考虑控制参数向量中不同维度的参数之间的相关性,使得寻找的第二控制参数向量与第一控制参数向量有可能比较相关,影响控制参数向量的多样性。例如,控制系统为散热控制系统时,搜索的第一控制参数向量与第二控制参数向量可能都是控制系统处于正常室温下的控制参数向量,而无法搜索到散热控制系统处于极端温度下的控制参数向量,导致最终搜索到的控制参数向量有可能局限在正常室温下,降低选取的控制参数向量的多样性。
因此,本申请提供了一种新的采集函数,在上述熵搜索或者最大值熵搜索的基础上进行了改进,新增了“相关项ηt(X)”用于采集函数搜索第三控制参数向量,使得搜索到的第三控制参数向量与第二数据集中控制参数向量的相关性较低,有利于提高搜索到的控制参数向量的多样性。
上述采集函数为:αt(X)=βt(X)+e·ηt(X),且Xmin<X<Xmax,其中,X表示第二数据集中的控制参数向量,βt(X)可以基于最大值熵搜索的采集函数,或基于熵搜索的采集函数,e表示常数,所述相关项ηt(X)表示所述第二数据集的第二相关系数与所述第一数据集第一相关系数之间的变化,所述第一相关系数为所述第一数据集中控制参数的第一子控制参数向量,与所述第一数据集中控制参数的第二子控制参数向量之间的相关系数,所述第二相关系数为所述第二数据集中控制参数的第一子控制参数向量,与所述第二数据集中控制参数的第二子控制参数向量之间的相关系数,Xmin表示控制系统中控制参数向量的取值范围的最小值,或者说,是上文预设的范围的最小值,Xmax表示控制系统中控制参数向量的取值范围的最大值,或者说,是上文预设的范围的最小值。
通常,上述相关性会限制采集函数在预设的范围中控制参数向量的可搜索的范围越小,因此,为了在相关性与可搜索范围之间取得平衡,可以通过e调整相关性对可搜索范围的影响,通常e的取值范围在0到1之间。
可选地,上述相关项ηt(X)可以通过以下公式表示:
其中,E表示数学期望,d表示所述第一数据集中每维子参数的总数,X'表示所述降维后的第一控制参数向量,y表示所述第一运行状态,r(j,k|Dt)表示所述第一数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,r(j,k|Dt∪(X',y))表示所述第二数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,j的取值从N到1递减,且k的取值从1到N递增。
可选地,βt(X)为最大值熵搜索时使用的采集函数时,
βt(X)=H(p(y|Dt,X')-E[H(p(y|Dt,X',y)],
其中,p(y|Dt,X')表示上述第一运行状态y在第一数据集中概率分布,p(y|Dt,X',y)表示上述第一运行状态y在第二数据集中概率分布,H(·)表示信息熵,E(·)表示期望。
可选地,上述相关系数可以皮尔森相关系数,还可以是斯皮尔曼相关系数,本申请实施例对此不做限定。
当上述相关系数为斯皮尔曼相关系数时,其中,n为控制系统的原始数据集中控制参数向量的总数。dz表示第j个维度的参数中第z个值xjz在第j个维度的参数的排列中的等级,与第k个维度的参数中的第z个值xkz在第k个维度的参数排列中的等级的差。上述第j个维度的参数的排列可以通过对原始的数据集中第j个维度的参数xj的值按照预设规则排列后得到。第k个维度的参数的排列可以通过对原始的数据集中第k个维度的参数xk的值按照预设规则排列后得到。应理解,上述预设规则可以是从小到大排列,或者从大到小排列。
需要说明的是,基于采集函数确定第三控制参数向量的方法与传统的确定控制参数向量的方法相同。例如,可以通过求解上述采集函数的最大化问题argmax[αt(X)],以确定第三控制参数向量。
在搜索到第三控制参数向量后,可以使用第三控制参数向量对仿真控制系统进行训练。即,可选地,作为一个实施例,所述方法还包括:步骤206至步骤208,具体的方法流程图可以参见图3。
206,对所述第三控制参数向量进行维度恢复处理,得到恢复后的第三控制参数向量,所述恢复后的第三控制参数向量为N维向量。
或者说,上述第三控制参数向量中参数所在的维度与控制系统的原始的控制参数向量中参数所在的维度相同。
为了提高控制参数向量中参数的真实性,可以基于上述相关关系对第三控制参数向量进行维度恢复,即利用相关关系和第三控制参数向量中包含的M个维度的参数,逆推出P个维度的参数。例如,上述控制系统为散热控制系统,第三控制参数向量的第二子控制参数向量中包括风扇的功率xMi,则风扇的转速xPi和风扇的功率xMi之间的相关关系为xMi=xPi 3,则第三控制参数向量的第一子控制参数向量中的风扇的转速当然,如果对控制参数向量的分量的真实性要求不高,可以基于数据集中已采集的控制参数向量,对上述第三控制参数向量进行维度恢复处理,例如,从数据集中找到与第三控制参数向量中M个维度的参数的取值相近的控制参数向量作为参考控制参数向量,然后将参考控制参数向量中的P个维度的参数取值,作为第三控制参数向量对应的第一子控制参数向量,以得到恢复后的第三控制参数向量。
207,获取所述控制系统在所述恢复后的第三控制参数向量下的第三运行状态。
将恢复后的第三控制参数向量发送到控制系统,使得控制系统在恢复后第三控制参数向量下运行,得到第三运行状态。
208,根据所述恢复后的第三控制参数向量以及第三运行状态,对所述仿真控制系统进行训练,所述仿真控制系统用于描述所述控制系统在不同的控制参数向量下的运行状态。
上述仿真控制系统可以理解为一个数学模型,用于描述控制系统在不同控制参数向量下的运行状态,或者说,仿真控制系统用于对控制系统的性能曲线进行仿真。
需要说明的是,上述对仿真控制系统进行训练可以采用传统的训练方式,例如,可以将恢复后的第三控制参数向量以及第三运行状态添加到原始数据集中,通过回归分析,对仿真控制系统进行迭代,其中,回归分析可以是高斯过程回归(Gaussian ProcessRegression,GPR),本申请实施例对此不做限定。又例如,可以将恢复后的第三控制参数向量以及第三运行状态添加到原始数据集中,基于随机森林算法(Random Forest,RF),对仿真控制系统进行训练。
如上文所述,在基于第一子控制参数向量与第二子控制参数向量之间的相关关系,对第一控制参数向量进行降维处理之前,需要确定第一子控制参数向量与第二子控制参数向量之间的相关关系,因此,图3所示的方法还包括:209,确定第一子控制参数向量与第二子控制参数向量之间的相关关系。
上述步骤209可以细化为两个子步骤:1)选择具有相关关系的多个第一组合;2)确定多个第一组合中每个第一组合内各个之间的相关关系。下文结合图4对上述两个步骤展开说明。图4是本申请实施例的确定相关关系的方法的流程图。图4所示的方法包括步骤410至步骤430。
1)从多个组合中选择具有相关关系的多个第一组合。其中多个组合可以是基于控制系统的N维控制参数向量划分的,具体的划分方式有很多种,例如可以基于经验人工划分,又例如可以基于不同维度的参数之间的相关性,划分上述多个组合,本申请对此不做限定。
下文以每个组合包含两个不同维度的参数为例,介绍基于N维的控制参数向量建立多个组合的方法。假设N维参数包含第j维的参数xj和第k维的参数xk,其中,j的取值从N到1递减,相应地,k的取值从1到N递增,且j≠k,则多个参数组合可以表示为(xj,xk)。
410,确定多个组合(xj,xk)中每个组合的相关性。其中,相关性可以通过相关系数或者偏相关系数表示。可选地,上述相关系数可以是皮尔森相关系数或者斯皮尔曼相关系数。其中,皮尔森相关系数或者斯皮尔曼相关系数的计算方式可以参见上文介绍,为了简洁,在此不再赘述。
下文以计算参数xj和参数xk对运行状态向量y的偏相关系数rjk,y为例,重点介绍计算偏相关系数的方法。其中,运行状态向量y可以通过向量的形式表示,运行状态向量y包含原始数据集中控制系统的全部运行状态。需要说明的是,参数xj、参数xk以及运行状态向量y中包含的分量的数量相同。
在本申请实施例中,通过偏相关系数衡量不同维度的多个分量之间的相关性,可以剔除各个参数对运行状态的影响,以得到多个参数之间的净相关性,有利于提高确定相关系数的准确性。
420,从多个组合中选择第一组合。应理解,上述第一组合的数量可以是一个也可以是多个。
若上述第一组合是一个组合,则第一组合中的参数之间的相关性,高于第二组合中的参数之间的相关性。
假设j=1,k=2的组合(x1,x2)为第一组合,j=3,k=4的组合(x3,x4)为第二组合,第一组合内参数x1和参数x2的皮尔森相关系数为r(1,2|Dt),第二组合内参数x3和参数x4的皮尔森相关系数为r(3,4|Dt),则r(1,2|Dt)>r(3,4|Dt)。
需要说明的是,上述第二组合也可以是多个或一个组合。
若上述第一组合的数量为多个,则第一组合中每个组合的参数之间的相关性,高于第二组合中每个组合的参数之间的相关性。第二组合为所述多个组合中除所述第一组合之外的组合。
假设第一组合包括(x1,x2)和(x5,x7),第二组合包括(x3,x4),第一组合(x1,x2)内的参数x1和参数x2的皮尔森相关系数为r(1,2|Dt),第一组合(x5,x7)内的参数x5和参数x7的皮尔森相关系数为r(5,7|Dt),第二组合内参数x3和参数x4的皮尔森相关系数为r(3,4|Dt),则r(1,2|Dt)>r(3,4|Dt),且r(5,7|Dt)>r(3,4|Dt)。
可选地,可以通过设置相关性阈值的方式,从多个组合中选择第一组合,即,选择的第一组合中参数的相关性高于相关性阈值的。当然,还可以选择多个组合中相关性较高的预设数量的组合作为第一组合。
430,确定第一组合中每个第一组合的参数之间的相关关系,即,每个第一组合中为相关关系的自变量的参数属于所述第二子控制参数向量,每个第一组合中为相关关系的因变量的参数属于所述第一子控制参数向量,因此,上述第一组合中每个第一组合的参数之间的相关关系,又可以称为第一子控制参数向量与第二子控制参数向量之间的相关关系。
如上文所述,相关关系可以是线性的也可以是非线性的,但是,在大多数场景下,不同维度的参数之间通常为线性相关关系,因此,下文以相关关系为线性相关关系为例,介绍确定上述两个维度的参数xj和参数xk之间相关关系的方法。应理解,控制参数向量中不同维度的参数之间的相关性都可以采用下述方法确定。
可选地,基于最小二乘法,确定所述第一子控制参数向量与所述第二子控制参数向量之间的相关关系。具体地,该步骤可以细化为两个子步骤1)确定相关关系的权重Kjk;2)确定相关关系的偏移量bjk。
1)确定相关关系的权重Kjk。
2)确定相关关系的偏移量bjk。
如上文所述,图2至图3所示的方法是对仿真控制系统进行训练的过程中,涉及的某一次迭代过程。通常,可以在控制系统初始化的过程中设置预设的第一迭代次数T,如果达到预设的第一迭代次数后,可以认为仿真控制系统的精度达到预设的精度。
通常,上述基于降维后的第一控制参数向量,确定第三控制参数向量的过程中,由于对第一控制参数向量进行了降维处理,在一定程度上可能降低确定第三控制参数向量的准确度。因此,为了确保在上述多次迭代过程中,确定第三控制参数向量的精度,可以将本申请的搜索控制参数向量的方法与传统的搜索控制参数向量的方法结合。即先按照传统的搜索控制参数向量的方法确定第三控制参数向量,并训练仿真控制系统,达到预设的第二迭代次数T`后,再使用本申请的方法基于降维后的第一控制参数向量确定第三控制参数向量。其中,第二迭代次数T`小于上述第一迭代次数,且为正整数。
上文结合图1至图4介绍了本申请实施例的控制参数向量的搜索方法,本申请提供的方法还可以应用于确定目标模型的超参数向量的场景,即利用超参数向量中不同维度的参数之间的相关关系,对目标模型的超参数向量进行降维处理,并基于降维后的超参数向量以及采集函数,确定第三超参数向量,以降低确定第三超参数向量时的计算量。下文结合图5介绍本申请实施例的超参数向量的搜索方法的流程。应理解,图5所示的方法可以由计算设备执行,其中计算设备可以是具有计算功能的设备,例如服务器、终端设备等。图5所示的方法包括步骤501至步骤505。
为了便于理解,先介绍本申请涉及的术语。
超参数又称“超参数向量”,在机器学习的场景中,超参数向量是在目标模型开始学习过程之前需要设置的多个参数,而不是通过训练目标模型得到的参数。通常情况下,需要对超参数向量进行优化,给目标模型(例如,学习机)选择一组最优超参数向量,以提高学习的性能和效果。例如,超参数向量可以包括树的数量或树的深度、矩阵分解中潜在因素的数量、学习率、深层神经网络隐含层的层数、k均值聚类中的簇数等。
模型增益,用于目标模型指示在超参数向量一定的情况下的性能。例如,可以是在超参数向量一定的情况下,目标模型输出的运算结果。
目标模型的超参数向量(原始超参数向量)为N维向量,超参数向量包含第一子超参数向量以及第二子超参数向量,第一子超参数向量的参数与第二子超参数向量的参数不同,或者说,第一子超参数向量中参数所在的维度与第二子超参数向量中参数所在的维度不同,其中,P<N,M<N,N、M、P均为大于0的正整数。需要说明的是,本申请实施例对上述第一子超参数向量、第二子超参数向量与N维向量之间的关系不做限定。第一子超参数向量与第二子超参数向量之和可以组成N维向量中的部分或全部参数。
例如,目标模型的第i个超参数向量为Xi=[x1i,x2i,…,xMi,xPi,…,xNi],其中,超参数向量Xi包含的N维参数为x1i,x2i,…,xMi,xPi,…,xNi,超参数向量Xi包含的第二子超参数向量为x1i,x2i,…,xMi,超参数向量Xi包含的第一子超参数向量为xPi,…,xNi。第一子超参数向量与第二子超参数向量之和为组成N维参数中的部分参数。
又例如,目标模型的第i个超参数向量为Xi=[x1i,x2i,…,xMi,x(M+1)i,…,x(P-1)i,xPi,…,xNi],其中,超参数向量Xi包含的N维参数为x1i,x2i,…,xMi,x(M+1)i,…,x(P-1)i,xPi,…,xNi,超参数向量Xi包含的第二子超参数向量为x1i,x2i,…,xMi,超参数向量Xi包含的第一子超参数向量为xPi,…,xNi,超参数向量还包括剩下的参数x(M+1)i,…,x(P-1)i,i为正整数。
501,获取目标模型的第一数据集。
上述第一数据集中包含多个超参数向量(又称第二超参数向量),每个超参数向量为M维向量。也就是说,上述第一数据集中的超参数向量为降维后的M维超参数向量。
可选地,上述步骤501包括基于所述第一子超参数向量与所述第二子超参数向量之间的相关关系,对原始数据集中的超参数向量进行降维处理,得到上述第一数据集。其中,原始数据集中的超参数向量为N维向量,即可以包含目标模型中全部维度的参数。
需要说明的是,在多轮迭代过程中,可以在每轮迭代中对目标模型的原始数据集进行降维处理得到本轮所需的“第一数据集”。然而,由于相邻的两轮迭代过程中使用的第一数据集仅有部分超参数向量不同,因此为了减少降维处理所需的计算量,也可以使用上轮迭代过程中降维后的数据集,并在降维后的数据集的基础上,对新增的超参数向量进行降维处理。
例如,上述相邻的两轮迭代过程为迭代过程#1以及迭代过程#2,迭代过程#1中使用的降维后的数据集为第一数据集#1,迭代过程#1中新确定的超参数向量为第一超参数向量,迭代过程#2中使用的降维后的数据集为第一数据集#2,第一数据集#2包括第一数据集#1以及降维后的第一超参数向量,因此,为了减少降维所需的计算量,可以仅对第一超参数向量进行降维处理,详细请见步骤503。
502,获取目标模型的第一超参数向量以及第一模型增益,所述第一超参数向量为N维向量,所述第一超参数向量包含P维的第一子超参数向量和M维的第二子超参数向量,所述第一子超参数向量与所述第二子超参数向量之间存在相关关系,且所述第一子超参数向量与所述第二子超参数向量中的参数不同,所述第一模型增益为所述目标模型在所述第一超参数向量下的模型增益。
上述第一超参数向量的第一子超参数向量,与目标模型的控制参数的第一子超参数向量包含参数所在的维度相同。上述第一超参数向量的第二子超参数向量,与目标模型的控制参数的第二子超参数向量包含参数所在的维度相同。
上述第一超参数向量不属于第一数据集,本申请实施例对第一超参数向量的获取方式不做限定,例如,上述第一超参数向量可以是随机确定的。又例如,第一超参数向量也可以是上一次迭代过程后得到的超参数向量。即,假设步骤501至步骤505为第t次迭代过程,那么第一超参数向量可以是在第t-1次迭代后确定的超参数向量,具体的迭代过程可以参见下文中的介绍,为了简洁,在此不再赘述。
需要说明的是,本申请实施例对上述步骤501和步骤502之间的时间顺序不做限定,步骤501和步骤502可以同时进行,上述步骤501可以在步骤502之前执行,上述步骤501还可以在步骤502之后执行,本申请实施例对此不做限定。
503,基于所述第一子超参数向量与所述第二子超参数向量之间的相关关系,对所述第一超参数向量进行降维处理,得到降维后的第一超参数向量。上述降维后的第一超参数向量为M维向量。
上述相关关系可以包括第一子超参数向量与第二子超参数向量之间的函数关系,其中第一子超参数向量中的参数可以作为函数的自变量,第二子超参数向量中的参数可以作为函数的因变量。或者,第二子超参数向量中的参数可以作为函数的自变量,第一子超参数向量中的参数可以作为函数的因变量。
上述第一子超参数向量与第二子超参数向量之间的相关关系,可以是第一子超参数向量中多个维度的参数,和第二子超参数向量中某一维度的参数之间的相关关系。上述第一子超参数向量与第二子超参数向量之间的相关关系,还可以是第一子超参数向量中某一个维度的参数,和第二子超参数向量中多个维度的参数之间的相关关系。上述第一子超参数向量与第二子超参数向量之间的相关关系,可以是第一子超参数向量中某一个维度的参数,和第二子超参数向量中某一维度的参数之间的相关关系。本申请实施例对于上述相关关系不做具体限定。
上述降维后的第一超参数向量为M维向量,可以理解为,降维后的第一超参数向量包含的子参数所在的维度为第二子超参数向量包含的参数所在的维度。
可选地,上述相关关系可以是线性相关关系也可以是非线性相关关系,本申请实施例对此不做具体限定。
需要说明的是,上述相关关系可以是预先配置的,也可以是超参数向量搜索装置120在初始化后基于目标模型的数据集预先确定的。具体的确定过程可以参见步骤209。本申请实施例对此不做限定。
504,将所述降维后的第一超参数向量以及所述第一模型增益添加至所述第一数据集,得到第二数据集。
假设上述第一超参数向量为X=[x1',x2',…,xM',xP',…,xN'],降维后的第一超参数向量为X'=[x1',x2',…,xM'],上述第一模型增益为y,第一数据集为Dt,则第二数据集可以表示为Dt∪(X',y)。
505,基于所述第二数据集以及预设的采集函数,得到第三超参数向量,所述第三超参数向量为M维向量。
上述替代模型可以理解为数学模型,用于描述目标模型在不同超参数向量下的模型增益的数学模型。例如,可以是高斯模型、还可以是随机森林等。
上述根据第二数据集以及采集函数确定第三超参数向量,可以理解为在预设的范围内,根据第二数据集中的数据、采集函数,确定第三超参数向量。其中预设的范围为超参数向量的取值的预设范围,通常可以是在初始化目标模型时人工配置的。
上述第三超参数向量为M维向量,可替换地,第三超参数向量包含的子参数所在的维度与第二子超参数向量包含的参数所在的维度相同。
上述采集函数可以是传统的基于熵搜索(entropy search)的采集函数,也可以是基于最大值熵搜索(Max-value entropy search)的采集函数。本申请实施例对此不做限定。并且,上述采集函数为熵搜索的采集函数或最大值熵搜索中使用的采集函数时,确定第三超参数向量的方法可以参见传统的确定超参数向量的方法,为了简洁,在此不再赘述。
然而,上述传统的采集函数并没有考虑超参数向量中不同维度的参数之间的相关性,使得寻找的第二超参数向量与第一超参数向量有可能比较相关,影响超参数向量的多样性。例如,目标模型为散热目标模型时,搜索的第一超参数向量与第二超参数向量可能都是目标模型处于正常室温下的超参数向量,而无法搜索到散热目标模型处于极端温度下的超参数向量,导致最终搜索到的超参数向量有可能局限在正常室温下,降低选取的超参数向量的多样性。
因此,本申请提供了一种新的采集函数,在上述熵搜索或者最大值熵搜索的基础上进行了改进,新增了“相关项ηt(X)”用于采集函数搜索第三超参数向量,使得搜索到的第三超参数向量与第二数据集中超参数向量的相关性较低,有利于提高搜索到的超参数向量的多样性。
上述采集函数为:αt(X)=βt(X)+e·ηt(X),且Xmin<X<Xmax,其中,X表示第二数据集中的超参数向量,βt(X)可以基于最大值熵搜索的采集函数,或基于熵搜索的采集函数,e表示常数,所述相关项ηt(X)表示所述第二数据集的第二相关系数与所述第一数据集第一相关系数之间的变化,所述第一相关系数为所述第一数据集中控制参数的第一子超参数向量,与所述第一数据集中控制参数的第二子超参数向量之间的相关系数,所述第二相关系数为所述第二数据集中控制参数的第一子超参数向量,与所述第二数据集中控制参数的第二子超参数向量之间的相关系数,Xmin表示目标模型中超参数向量的取值范围的最小值,或者说,是上文预设的范围的最小值,Xmax表示目标模型中超参数向量的取值范围的最大值,或者说,是上文预设的范围的最小值。
通常,上述相关性会限制采集函数在预设的范围中超参数向量的可搜索的范围越小,因此,为了在相关性与可搜索范围之间取得平衡,可以通过e调整相关性对可搜索范围的影响,通常e的取值范围在0到1之间。
可选地,上述相关项ηt(X)可以通过以下公式表示:
其中,E表示数学期望,d表示所述第一数据集中每维子参数的总数,X'表示所述降维后的第一超参数向量,y表示所述第一模型增益,r(j,k|Dt)表示所述第一数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,r(j,k|Dt∪(X',y))表示所述第二数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,j的取值从N到1递减,且k的取值从1到N递增。
可选地,βt(X)为最大值熵搜索时使用的采集函数时,
βt(X)=H(p(y|Dt,X')-E[H(p(y|Dt,X',y)],
其中,p(y|Dt,X')表示上述第一模型增益y在第一数据集中概率分布,p(y|Dt,X',y)表示上述第一模型增益y在第二数据集中概率分布,H(·)表示信息熵,E(·)表示期望。
可选地,上述相关系数可以皮尔森相关系数,还可以是斯皮尔曼相关系数,本申请实施例对此不做限定。
当上述相关系数为斯皮尔曼相关系数时,其中,n为目标模型的原始数据集中超参数向量的总数。dz表示第j个维度的参数中第z个值xjz在第j个维度的参数的排列中的等级,与第k个维度的参数中的第z个值xkz在第k个维度的参数排列中的等级的差。上述第j个维度的参数的排列可以通过对原始的数据集中第j个维度的参数xj的值按照预设规则排列后得到。第k个维度的参数的排列可以通过对原始的数据集中第k个维度的参数xk的值按照预设规则排列后得到。应理解,上述预设规则可以是从小到大排列,或者从大到小排列。
需要说明的是,基于采集函数确定第三超参数向量的方法与传统的确定超参数向量的方法相同。例如,可以通过求解上述采集函数的最大化问题argmax[αt(X)],以确定第三超参数向量。
在搜索到第三超参数向量后,可以使用第三超参数向量对替代模型进行训练。即,可选地,作为一个实施例,所述方法还包括:步骤506至步骤508,具体的方法流程图可以参见图6。
506,对所述第三超参数向量进行维度恢复处理,得到恢复后的第三超参数向量,所述恢复后的第三超参数向量为N维向量。
或者说,上述第三超参数向量中参数所在的维度与目标模型的原始的超参数向量中参数所在的维度相同。
为了提高超参数向量中参数的真实性,可以基于上述相关关系对第三超参数向量进行维度恢复,即利用相关关系和第三超参数向量中包含的M个维度的参数,逆推出P个维度的参数。当然,如果对超参数向量的分量的真实性要求不高,可以基于数据集中已采集的超参数向量,对上述第三超参数向量进行维度恢复处理,例如,从数据集中找到与第三超参数向量中M个维度的参数的取值相近的超参数向量作为参考超参数向量,然后将参考超参数向量中的P个维度的参数取值,作为第三超参数向量对应的第一子超参数向量,以得到恢复后的第三超参数向量。
507,获取所述目标模型在所述恢复后的第三超参数向量下的第三模型增益。
将恢复后的第三超参数向量发送到目标模型,使得目标模型在恢复后第三超参数向量下运行,得到第三模型增益。
508,根据所述恢复后的第三超参数向量以及第三模型增益,对所述替代模型进行训练,所述替代模型用于描述所述目标模型在不同的超参数向量下的模型增益。
上述替代模型可以理解为一个数学模型,用于描述目标模型在不同超参数向量下的模型增益,或者说,替代模型用于对目标模型的性能曲线进行仿真。
需要说明的是,上述对替代模型进行训练可以采用传统的训练方式,例如,可以将恢复后的第三超参数向量以及第三模型增益添加到原始数据集中,通过回归分析,对替代模型进行迭代,其中,回归分析可以是高斯过程回归(Gaussian Process Regression,GPR),本申请实施例对此不做限定。又例如,可以将恢复后的第三超参数向量以及第三模型增益添加到原始数据集中,基于随机森林算法(Random Forest,RF),对替代模型进行训练。
如上文所述,在基于第一子超参数向量与第二子超参数向量之间的相关关系,对第一超参数向量进行降维处理之前,需要确定第一子超参数向量与第二子超参数向量之间的相关关系,因此,图6所示的方法还包括:509,确定第一子超参数向量与所述第二子超参数向量之间的相关关系。
上述步骤509可以细化为两个子步骤:1)选择具有相关关系的多个第一组合;2)确定多个第一组合中每个第一组合内各个之间的相关关系。下文结合图7对上述两个步骤展开说明。图7是本申请实施例的确定相关关系的方法的流程图。图7所示的方法包括步骤710至步骤730。
1)从多个组合中选择具有相关关系的多个第一组合。其中多个组合可以是基于目标模型的N维超参数向量划分的,具体的划分方式有很多种,例如可以基于经验人工划分,又例如可以基于不同维度的参数之间的相关性,划分上述多个组合,本申请对此不做限定。
下文以每个组合包含两个不同维度的参数为例,介绍基于N维的超参数向量建立多个组合的方法。假设N维参数包含第j维的参数xj和第k维的参数xk,其中,j的取值从N到1递减,相应地,k的取值从1到N递增,且j≠k,则多个参数组合可以表示为(xj,xk)。
710,确定多个组合(xj,xk)中每个组合的相关性。其中,相关性可以通过相关系数或者偏相关系数表示。可选地,上述相关系数可以是皮尔森相关系数或者斯皮尔曼相关系数。其中,皮尔森相关系数或者斯皮尔曼相关系数的计算方式可以参见上文介绍,为了简洁,在此不再赘述。
下文以计算参数xj和参数xk对模型增益向量y的偏相关系数rjk,y为例,重点介绍计算偏相关系数的方法。其中,模型增益向量y可以通过向量的形式表示,模型增益向量y包含原始数据集中目标模型的全部模型增益。需要说明的是,参数xj、参数xk以及模型增益向量y中包含的分量的数量相同。
在本申请实施例中,通过偏相关系数衡量不同维度的多个分量之间的相关性,可以剔除各个参数对模型增益的影响,以得到多个参数之间的净相关性,有利于提高确定相关系数的准确性。
720,从多个组合中选择第一组合。应理解,上述第一组合的数量可以是一个也可以是多个。
若上述第一组合是一个组合,则第一组合中的参数之间的相关性,高于第二组合中的参数之间的相关性。
假设j=1,k=2的组合(x1,x2)为第一组合,j=3,k=4的组合(x3,x4)为第二组合,第一组合内参数x1和参数x2的皮尔森相关系数为r(1,2|Dt),第二组合内参数x3和参数x4的皮尔森相关系数为r(3,4|Dt),则r(1,2|Dt)>r(3,4|Dt)。
需要说明的是,上述第二组合也可以是多个或一个组合。
若上述第一组合的数量为多个,则第一组合中每个组合的参数之间的相关性,高于第二组合中每个组合的参数之间的相关性。第二组合为所述多个组合中除所述第一组合之外的组合。
假设第一组合包括(x1,x2)和(x5,x7),第二组合包括(x3,x4),第一组合(x1,x2)内的参数x1和参数x2的皮尔森相关系数为r(1,2|Dt),第一组合(x5,x7)内的参数x5和参数x7的皮尔森相关系数为r(5,7|Dt),第二组合内参数x3和参数x4的皮尔森相关系数为r(3,4|Dt),则r(1,2|Dt)>r(3,4|Dt),且r(5,7|Dt)>r(3,4|Dt)。
可选地,可以通过设置相关性阈值的方式,从多个组合中选择第一组合,即,选择的第一组合中参数的相关性高于相关性阈值的。当然,还可以选择多个组合中相关性较高的预设数量的组合作为第一组合。
730,确定第一组合中每个第一组合的参数之间的相关关系,即,每个第一组合中为相关关系的自变量的参数属于所述第二子超参数向量,每个第一组合中为相关关系的因变量的参数属于所述第一子超参数向量,因此,上述第一组合中每个第一组合的参数之间的相关关系,又可以称为第一子超参数向量与第二子超参数向量之间的相关关系。
如上文所述,相关关系可以是线性的也可以是非线性的,但是,在大多数场景下,不同维度的参数之间通常为线性相关关系,因此,下文以相关关系为线性相关关系为例,介绍确定上述两个维度的参数xj和参数xk之间相关关系的方法。应理解,超参数向量中不同维度的参数之间的相关性都可以采用下述方法确定。
可选地,基于最小二乘法,确定所述第一子超参数向量与所述第二子超参数向量之间的相关关系。具体地,该步骤可以细化为两个子步骤1)确定相关关系的权重Kjk;2)确定相关关系的偏移量bjk。
1)确定相关关系的权重Kjk。
2)确定相关关系的偏移量bjk。
如上文所述,图5至图7所示的方法是对替代模型进行训练的过程中,涉及的某一次迭代过程。通常,可以在目标模型初始化的过程中设置预设的第一迭代次数T,如果达到预设的第一迭代次数后,可以认为替代模型的精度达到预设的精度。
通常,上述基于降维后的第一超参数向量,确定第三超参数向量的过程中,由于对第一超参数向量进行了降维处理,在一定程度上可能降低确定第三超参数向量的准确度。因此,为了确保在上述多次迭代过程中,确定第三超参数向量的精度,可以将本申请的搜索超参数向量的方法与传统的搜索超参数向量的方法结合。即先按照传统的搜索超参数向量的方法确定第三超参数向量,并训练替代模型,达到预设的第二迭代次数T`后,再使用本申请的方法基于降维后的第一超参数向量确定第三超参数向量。其中,第二迭代次数T`小于上述第一迭代次数,且为正整数。
上文结合图1至图7介绍了本申请实施例的方法,下文结合图8至图10介绍本申请实施例的装置。应理解,图8至图10所示的装置能够实现图2至图7所示的方法流程中的一个或者多个的步骤。为避免重复,在此不再详细赘述。
图8是本申请实施例的控制系统的控制参数向量的搜索装置的示意图。图8所示的装置800包括获取模块810和处理模块820。
获取模块810,用于获取所述控制系统的第一控制参数向量以及第一运行状态,所述第一控制参数向量为N维向量,所述第一控制参数向量包含P维的第一子控制参数向量和M维的第二子控制参数向量,所述第一子控制参数向量与所述第二子控制参数向量之间存在相关关系,且所述第一子控制参数向量与所述第二子控制参数向量中的参数不同,所述第一运行状态为所述控制系统在所述第一控制参数向量下的运行状态,P<N,M<N,N、M、P均为大于0的正整数;
处理模块820,用于基于所述相关关系,对所述第一控制参数向量进行降维处理,得到降维后的第一控制参数向量,所述降维后的第一控制参数向量为M维向量;
所述处理模块820,还用于将所述降维后的第一控制参数向量以及所述第一运行状态添加至所述第一数据集,得到第二数据集,所述第一数据集包括第二控制参数向量以及第二运行状态,所述第二控制参数向量为M维向量,所述第二运行状态为所述控制系统在所述第二控制参数向量下的运行状态;
所述处理模块820,还用于基于所述第二数据集以及预设的采集函数,得到第三控制参数向量,所述第三控制参数向量为M维向量。
可选地,作为一个实施例,所述相关关系包括所述第一子控制参数向量中的每一维参数,与所述第二子控制参数向量中的一维或多维参数之间的相关关系。
可选地,在一个实施例中,所述处理模块820,还用于对所述第三控制参数向量进行维度恢复处理,得到恢复后的第三控制参数向量,所述恢复后的第三控制参数向量为N维向量;所述获取模块810,还用于获取所述控制系统在所述恢复后的第三控制参数向量下的第三运行状态;所述处理模块820,还用于根据所述恢复后的第三控制参数向量以及第三运行状态,对仿真控制系统进行训练,所述仿真控制系统用于描述所述控制系统在不同的控制参数向量下的运行状态。
可选地,在一个实施例中,所述处理模块820,还用于通过求解所述采集函数的最大化问题,确定所述第二控制参数向量,所述采集函数基于相关项在控制参数的预设范围内,搜索与所述第一数据集以及所述第二数据集中控制参数向量的相关性最低的控制参数向量。
可选地,作为一个实施例,所述采集参数αt(x)为:αt(X)=βt(X)+e·ηt(X),Xmin<X<Xmax,其中,X表示所述第二数据集中的控制参数向量,t表示当前训练所述仿真控制系统的迭代次数,e为常数,βt(X)表示基于最大值熵搜索算法搜索所述控制系统的控制参数向量时使用的采集函数,所述相关项ηt(X)表示所述第一数据集的第一相关系数与所述第二数据集第二相关系数之间的变化,所述第一相关系数为所述第一数据集中控制参数的第一子控制参数向量,与所述第一数据集中控制参数的第二子控制参数向量之间的相关系数,所述第二相关系数为所述第二数据集中控制参数的第一子控制参数向量,与所述第二数据集中控制参数的第二子控制参数向量之间的相关系数,Xmin表示所述控制系统中控制参数向量的取值范围的最小值,Xmax表示所述控制系统中控制参数向量的取值范围的最大值。
可选地,作为一个实施例,所述相关项ηt(x)为:其中,E表示数学期望,d表示所述第一数据集中每维子参数的总数,X'表示所述降维后的第一控制参数向量,y表示所述第一运行状态,r(j,k|Dt)表示所述第一数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,r(j,k|Dt∪(X',y))表示所述第二数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,j的取值从N到1递减,且k的取值从1到N递增。
可选地,作为一个实施例,所述获取模块810,还用于获取所述控制系统的控制参数向量,所述控制系统的控制参数向量为N维向量;所述处理模块820,还用于将所述控制系统的控制参数向量中的参数划分为多个组合,每个组合中包含的参数所在的维度不同,所述多个组合中不同的组合包含的参数所在的维度不同;所述处理模块820,还用于从所述多个组合中选择一个或多个第一组合,每个第一组合中参数之间的相关性高于第二组合中参数之间的相关性,所述第二组合为所述多个组合中除所述第一组合之外的组合;所述处理模块820,还用于确定所述第一组合中每个第一组合的参数之间的相关关系,所述第一组合中作为所述相关关系的自变量的参数属于所述第一子控制参数向量,所述第一组合中作为所述相关关系的因变量的参数属于所述第二子控制参数向量。
可选地,作为一个实施例,所述处理模块820,还用于基于最小二乘法,确定所述第一组合中每个第一组合的参数之间的相关关系。
可选地,在一个实施例中,所述获取模块810,还用于获取所述控制系统的原始数据集,所述原始数据集中的控制参数向量为N维向量;所述处理模块820,还用于基于所述相关关系,对所述原始数据集中的控制参数向量进行降维处理,得到所述第一数据集。
图9是本申请实施例的目标模型的超参数向量的搜索装置的示意图。图9所示的装置900包括:获取模块910以及处理模块920。
获取模块910,用于获取所述控制系统的第一控制参数向量以及第一运行状态,所述第一控制参数向量为N维向量,所述第一控制参数向量包含P维的第一子控制参数向量和M维的第二子控制参数向量,所述第一子控制参数向量与所述第二子控制参数向量之间存在相关关系,且所述第一子控制参数向量与所述第二子控制参数向量中的参数不同,所述第一运行状态为所述控制系统在所述第一控制参数向量下的运行状态,P<N,M<N,N、M、P均为大于0的正整数;
处理模块920,用于基于所述相关关系,对所述第一控制参数向量进行降维处理,得到降维后的第一控制参数向量,所述降维后的第一控制参数向量为M维向量;
所述处理模块920,还用于将所述降维后的第一控制参数向量以及所述第一运行状态添加至所述第一数据集,得到第二数据集,所述第一数据集包括第二控制参数向量以及第二运行状态,所述第二控制参数向量为M维向量,所述第二运行状态为所述控制系统在所述第二控制参数向量下的运行状态;
所述处理模块920,还用于基于所述第二数据集以及预设的采集函数,得到第三控制参数向量,所述第三控制参数向量为M维向量。
可选地,作为一个实施例,所述相关关系包括所述第一子控制参数向量中的每一维参数,与所述第二子控制参数向量中的一维或多维参数之间的相关关系。
可选地,作为一个实施例,所述处理模块920,还用于对所述第三控制参数向量进行维度恢复处理,得到恢复后的第三控制参数向量,所述恢复后的第三控制参数向量为N维向量;所述获取模块910,还用于获取所述控制系统在所述恢复后的第三控制参数向量下的第三运行状态;所述处理模块920,还用于根据所述恢复后的第三控制参数向量以及第三运行状态,对仿真控制系统进行训练,所述仿真控制系统用于描述所述控制系统在不同的控制参数向量下的运行状态。
可选地,作为一个实施例,所述处理模块920,还用于通过求解所述采集函数的最大化问题,确定所述第二控制参数向量,所述采集函数基于相关项在控制参数的预设范围内,搜索与所述第一数据集以及所述第二数据集中控制参数向量的相关性最低的控制参数向量。
可选地,作为一个实施例,所述采集参数αt(x)为:αt(X)=βt(X)+e·ηt(X),Xmin<X<Xmax,其中,X表示所述第二数据集中的控制参数向量,t表示当前训练所述仿真控制系统的迭代次数,e为常数,βt(X)表示基于最大值熵搜索算法搜索所述控制系统的控制参数向量时使用的采集函数,所述相关项ηt(X)表示所述第一数据集的第一相关系数与所述第二数据集第二相关系数之间的变化,所述第一相关系数为所述第一数据集中控制参数的第一子控制参数向量,与所述第一数据集中控制参数的第二子控制参数向量之间的相关系数,所述第二相关系数为所述第二数据集中控制参数的第一子控制参数向量,与所述第二数据集中控制参数的第二子控制参数向量之间的相关系数,Xmin表示所述控制系统中控制参数向量的取值范围的最小值,Xmax表示所述控制系统中控制参数向量的取值范围的最大值。
可选地,作为一个实施例,所述相关项ηt(x)为:其中,E表示数学期望,d表示所述第一数据集中每维子参数的总数,X'表示所述降维后的第一控制参数向量,y表示所述第一运行状态,r(j,k|Dt)表示所述第一数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,r(j,k|Dt∪(X',y))表示所述第二数据集中的第j个维度的参数与第k个维度的参数之间的相关系数,j的取值从N到1递减,且k的取值从1到N递增。
可选地,作为一个实施例,所述获取模块910,还用于获取所述控制系统的控制参数向量,所述控制系统的控制参数向量为N维向量;所述处理模块920,还用于将所述控制系统的控制参数向量中的参数划分为多个组合,每个组合中包含的参数所在的维度不同,所述多个组合中不同的组合包含的参数所在的维度不同;所述处理模块920,还用于从所述多个组合中选择一个或多个第一组合,每个第一组合中参数之间的相关性高于第二组合中参数之间的相关性,所述第二组合为所述多个组合中除所述第一组合之外的组合;所述处理模块910,还用于确定所述第一组合中每个第一组合的参数之间的相关关系,所述第一组合中作为所述相关关系的自变量的参数属于所述第一子控制参数向量,所述第一组合中作为所述相关关系的因变量的参数属于所述第二子控制参数向量。
可选地,作为一个实施例,所述处理模块920,还用于基于最小二乘法,确定所述第一组合中每个第一组合的参数之间的相关关系。
可选地,作为一个实施例,所述获取模块910,还用于获取所述控制系统的原始数据集,所述原始数据集中的控制参数向量为N维向量;所述处理模块920,还用于基于所述相关关系,对所述原始数据集中的控制参数向量进行降维处理,得到所述第一数据集。
在可选的实施例中,所述获取模块810可以为通信接口1030,所述处理模块820可以为处理器1020,所述计算设备还可以包括存储器1010,具体如图10所示。
在可选的实施例中,所述获取模块910可以为通信接口1030,所述处理模块920可以为处理器1020,所述计算设备还可以包括存储器1010,具体如图10所示。
图10是本申请实施例的计算设备的示意性框图。图10所示的计算设备1000可以包括:存储器1010、处理器1020、以及通信接口1030。其中,存储器1010、处理器1020,通信接口1030通过内部连接通路相连,该存储器1010用于存储指令,该处理器1020用于执行该存储器1020存储的指令,以控制通信接口1030接收/发送第二信道模型的至少部分参数。可选地,存储器1010既可以和处理器1020通过接口耦合,也可以和处理器1020集成在一起。
需要说明的是,上述通信接口1030使用例如但不限于输入/输出接口(input/output interface)一类的收发装置,来实现通信设备1000与其他设备之间的通信。
在实现过程中,上述方法的各步骤可以通过处理器1020中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1010,处理器1020读取存储器1010中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
应理解,本申请实施例中,该处理器可以为中央处理单元(central processingunit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(digital signalprocessor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
还应理解,本申请实施例中,该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。处理器的一部分还可以包括非易失性随机存取存储器。例如,处理器还可以存储设备类型的信息。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (20)
1.一种控制系统的控制参数向量的搜索方法,其特征在于,包括:
获取所述控制系统的第一控制参数向量以及第一运行状态,所述第一控制参数向量为N维向量,所述第一控制参数向量包含P维的第一子控制参数向量和M维的第二子控制参数向量,所述第一子控制参数向量与所述第二子控制参数向量之间存在相关关系,且所述第一子控制参数向量与所述第二子控制参数向量中的参数不同,所述第一运行状态为所述控制系统在所述第一控制参数向量下的运行状态,P<N,M<N,N、M、P均为大于0的正整数;
基于所述相关关系,对所述第一控制参数向量进行降维处理,得到降维后的第一控制参数向量,所述降维后的第一控制参数向量为M维向量;
将所述降维后的第一控制参数向量以及所述第一运行状态添加至第一数据集,得到第二数据集,所述第一数据集包括第二控制参数向量以及第二运行状态,所述第二控制参数向量为M维向量,所述第二运行状态为所述控制系统在所述第二控制参数向量下的运行状态;
基于所述第二数据集以及预设的采集函数,得到第三控制参数向量,所述第三控制参数向量为M维向量。
2.如权利要求1所述的方法,其特征在于,所述相关关系包括所述第一子控制参数向量中的每一维参数,与所述第二子控制参数向量中的一维或多维参数之间的相关关系。
3.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
对所述第三控制参数向量进行维度恢复处理,得到恢复后的第三控制参数向量,所述恢复后的第三控制参数向量为N维向量;
获取所述控制系统在所述恢复后的第三控制参数向量下的第三运行状态;
根据所述恢复后的第三控制参数向量以及第三运行状态,对仿真控制系统进行训练,所述仿真控制系统用于描述所述控制系统在不同的控制参数向量下的运行状态。
4.如权利要求3所述的方法,其特征在于,所述基于所述第二数据集以及预设的采集函数,得到第三控制参数向量,包括:
通过求解所述采集函数的最大化问题,确定所述第三控制参数向量,所述采集函数基于相关项在控制参数的预设范围内,搜索与所述第一数据集以及所述第二数据集中控制参数向量的相关性最低的控制参数向量。
5.如权利要求4所述的方法,其特征在于,所述采集函数为αt(x):
αt(X)=βt(X)+e·ηt(X),Xmin<X<Xmax,
其中,X表示所述第二数据集中的控制参数向量,t表示当前训练所述仿真控制系统的迭代次数,e为常数,βt(X)表示基于最大值熵搜索算法搜索所述控制系统的控制参数向量时使用的采集函数,相关项ηt(X)表示所述第一数据集的第一相关系数与所述第二数据集的第二相关系数之间的变化,所述第一相关系数为所述第一数据集中控制参数的第一子控制参数向量,与所述第一数据集中控制参数的第二子控制参数向量之间的相关系数,所述第二相关系数为所述第二数据集中控制参数的第一子控制参数向量,与所述第二数据集中控制参数的第二子控制参数向量之间的相关系数,Xmin表示所述控制系统中控制参数向量的取值范围的最小值,Xmax表示所述控制系统中控制参数向量的取值范围的最大值。
7.如权利要求1或2所述的方法,其特征在于,在所述基于所述相关关系,对所述第一控制参数向量进行降维处理之前,所述方法还包括:
获取所述控制系统的控制参数向量,所述控制系统的控制参数向量为N维向量;
将所述控制系统的控制参数向量中的参数划分为多个组合,每个组合中包含的参数所在的维度不同,所述多个组合中不同的组合包含的参数所在的维度不同;
从所述多个组合中选择一个或多个第一组合,每个第一组合中参数之间的相关性高于第二组合中参数之间的相关性,所述第二组合为所述多个组合中除所述第一组合之外的组合;
确定所述第一组合中每个第一组合的参数之间的相关关系,所述第一组合中作为所述相关关系的自变量的参数属于所述第一子控制参数向量,所述第一组合中作为所述相关关系的因变量的参数属于所述第二子控制参数向量。
8.如权利要求7所述的方法,其特征在于,所述确定所述第一组合中每个第一组合的参数之间的相关关系,包括:
基于最小二乘法,确定所述第一组合中每个第一组合的参数之间的相关关系。
9.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取所述控制系统的原始数据集,所述原始数据集中的控制参数向量为N维向量;
基于所述相关关系,对所述原始数据集中的控制参数向量进行降维处理,得到所述第一数据集。
10.一种控制系统的控制参数向量的搜索装置,其特征在于,包括:
获取模块,用于获取所述控制系统的第一控制参数向量以及第一运行状态,所述第一控制参数向量为N维向量,所述第一控制参数向量包含P维的第一子控制参数向量和M维的第二子控制参数向量,所述第一子控制参数向量与所述第二子控制参数向量之间存在相关关系,且所述第一子控制参数向量与所述第二子控制参数向量中的参数不同,所述第一运行状态为所述控制系统在所述第一控制参数向量下的运行状态,P<N,M<N,N、M、P均为大于0的正整数;
处理模块,用于基于所述相关关系,对所述第一控制参数向量进行降维处理,得到降维后的第一控制参数向量,所述降维后的第一控制参数向量为M维向量;
所述处理模块,还用于将所述降维后的第一控制参数向量以及所述第一运行状态添加至第一数据集,得到第二数据集,所述第一数据集包括第二控制参数向量以及第二运行状态,所述第二控制参数向量为M维向量,所述第二运行状态为所述控制系统在所述第二控制参数向量下的运行状态;
所述处理模块,还用于基于所述第二数据集以及预设的采集函数,得到第三控制参数向量,所述第三控制参数向量为M维向量。
11.如权利要求10所述的装置,其特征在于,所述相关关系包括所述第一子控制参数向量中的每一维参数,与所述第二子控制参数向量中的一维或多维参数之间的相关关系。
12.如权利要求10或11所述的装置,其特征在于,
所述处理模块,还用于对所述第三控制参数向量进行维度恢复处理,得到恢复后的第三控制参数向量,所述恢复后的第三控制参数向量为N维向量;
所述获取模块,还用于获取所述控制系统在所述恢复后的第三控制参数向量下的第三运行状态;
所述处理模块,还用于根据所述恢复后的第三控制参数向量以及第三运行状态,对仿真控制系统进行训练,所述仿真控制系统用于描述所述控制系统在不同的控制参数向量下的运行状态。
13.如权利要求12所述的装置,其特征在于,
所述处理模块,还用于通过求解所述采集函数的最大化问题,确定所述第三控制参数向量,所述采集函数基于相关项在控制参数的预设范围内,搜索与所述第一数据集以及所述第二数据集中控制参数向量的相关性最低的控制参数向量。
14.如权利要求13所述的装置,其特征在于,所述采集函数为αt(x):
αt(X)=βt(X)+e·ηt(X),Xmin<X<Xmax
其中,X表示所述第二数据集中的控制参数向量,t表示当前训练所述仿真控制系统的迭代次数,e为常数,βt(X)表示基于最大值熵搜索算法搜索所述控制系统的控制参数向量时使用的采集函数,相关项ηt(X)表示所述第一数据集的第一相关系数与所述第二数据集的第二相关系数之间的变化,所述第一相关系数为所述第一数据集中控制参数的第一子控制参数向量,与所述第一数据集中控制参数的第二子控制参数向量之间的相关系数,所述第二相关系数为所述第二数据集中控制参数的第一子控制参数向量,与所述第二数据集中控制参数的第二子控制参数向量之间的相关系数,Xmin表示所述控制系统中控制参数向量的取值范围的最小值,Xmax表示所述控制系统中控制参数向量的取值范围的最大值。
16.如权利要求10或11所述的装置,其特征在于,
所述获取模块,还用于获取所述控制系统的控制参数向量,所述控制系统的控制参数向量为N维向量;
所述处理模块,还用于将所述控制系统的控制参数向量中的参数划分为多个组合,每个组合中包含的参数所在的维度不同,所述多个组合中不同的组合包含的参数所在的维度不同;
所述处理模块,还用于从所述多个组合中选择一个或多个第一组合,每个第一组合中参数之间的相关性高于第二组合中参数之间的相关性,所述第二组合为所述多个组合中除所述第一组合之外的组合;
所述处理模块,还用于确定所述第一组合中每个第一组合的参数之间的相关关系,所述第一组合中作为所述相关关系的自变量的参数属于所述第一子控制参数向量,所述第一组合中作为所述相关关系的因变量的参数属于所述第二子控制参数向量。
17.如权利要求16所述的装置,其特征在于,
所述处理模块,还用于基于最小二乘法,确定所述第一组合中每个第一组合的参数之间的相关关系。
18.如权利要求10或11所述的装置,其特征在于,
所述获取模块,还用于获取所述控制系统的原始数据集,所述原始数据集中的控制参数向量为N维向量;
所述处理模块,还用于基于所述相关关系,对所述原始数据集中的控制参数向量进行降维处理,得到所述第一数据集。
19.一种计算设备,其特征在于,包括至少一个处理器和存储器,所述至少一个处理器与所述存储器耦合,用于读取并执行所述存储器中的指令,以执行如权利要求1-9中任一项所述的方法。
20.一种计算机可读介质,其特征在于,所述计算机可读介质存储有计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行如权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910897481.3A CN112541247B (zh) | 2019-09-23 | 2019-09-23 | 控制系统的控制参数向量的搜索方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910897481.3A CN112541247B (zh) | 2019-09-23 | 2019-09-23 | 控制系统的控制参数向量的搜索方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112541247A CN112541247A (zh) | 2021-03-23 |
CN112541247B true CN112541247B (zh) | 2023-03-10 |
Family
ID=75013070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910897481.3A Active CN112541247B (zh) | 2019-09-23 | 2019-09-23 | 控制系统的控制参数向量的搜索方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112541247B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190979A (zh) * | 2018-09-03 | 2019-01-11 | 深圳市智物联网络有限公司 | 一种工业物联网数据分析方法、系统及相关设备 |
CN109959891A (zh) * | 2019-04-11 | 2019-07-02 | 南京航空航天大学 | 电磁矢量l阵中空间角与极化参数的降维谱峰搜索方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2965377A1 (fr) * | 2010-09-24 | 2012-03-30 | Univ D Avignon Et Des Pays De Vaucluse | Procede de classification de donnees biometriques |
US9235931B2 (en) * | 2012-05-18 | 2016-01-12 | Eiffel Medtech Inc. | Method and system for the three-dimensional reconstruction of structures |
US20190034802A1 (en) * | 2017-07-28 | 2019-01-31 | Siemens Aktiengesellschaft | Dimensionality reduction in Bayesian Optimization using Stacked Autoencoders |
-
2019
- 2019-09-23 CN CN201910897481.3A patent/CN112541247B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190979A (zh) * | 2018-09-03 | 2019-01-11 | 深圳市智物联网络有限公司 | 一种工业物联网数据分析方法、系统及相关设备 |
CN109959891A (zh) * | 2019-04-11 | 2019-07-02 | 南京航空航天大学 | 电磁矢量l阵中空间角与极化参数的降维谱峰搜索方法 |
Non-Patent Citations (1)
Title |
---|
基于状态指标向量化及霍夫曼编码的变压器缺陷模式识别;袁耀 等;《广东电力》;20180831;第31卷(第8期);第167-174页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112541247A (zh) | 2021-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Belakaria et al. | Uncertainty-aware search framework for multi-objective Bayesian optimization | |
Chen | A tutorial on kernel density estimation and recent advances | |
Antoniadis et al. | The Dantzig selector in Cox's proportional hazards model | |
Volkovs et al. | Boltzrank: learning to maximize expected ranking gain | |
Kartal Koc et al. | Model selection in multivariate adaptive regression splines (MARS) using information complexity as the fitness function | |
Dong et al. | Pattern-aided regression modeling and prediction model analysis | |
Yang et al. | Nonparametric multiple expectile regression via ER-Boost | |
Kuismin et al. | Precision matrix estimation with ROPE | |
Krishnakumar et al. | Nas-bench-suite-zero: Accelerating research on zero cost proxies | |
Ye et al. | Variable selection via penalized neural network: a drop-out-one loss approach | |
Jin et al. | Improvements on score, especially for weak signals | |
Dalalyan et al. | Statistical inference in compound functional models | |
Jagalur-Mohan et al. | Batch greedy maximization of non-submodular functions: Guarantees and applications to experimental design | |
Müller et al. | PFNs4BO: In-context learning for bayesian optimization | |
Freire et al. | On robust randomized neural networks for regression: a comprehensive review and evaluation | |
Levi et al. | Finding our way in the dark: approximate MCMC for approximate Bayesian methods | |
CN112541247B (zh) | 控制系统的控制参数向量的搜索方法和装置 | |
Djukova et al. | On the logical analysis of partially ordered data in the supervised classification problem | |
Choromanski | Taming graph kernels with random features | |
Wang et al. | Are deep learning models superior for missing data imputation in surveys? Evidence from an empirical comparison | |
CN115374775A (zh) | 一种确定文本相似度的方法、装置、设备及存储介质 | |
Liu et al. | High-dimensional learning under approximate sparsity with applications to nonsmooth estimation and regularized neural networks | |
JP7302229B2 (ja) | データ管理システム、データ管理方法、およびデータ管理プログラム | |
He et al. | Rank-based greedy model averaging for high-dimensional survival data | |
Yin et al. | Forecasting of stock price trend based on CART and similar stock |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |