CN110045613B - 基于量子退火的混合整数最优控制数值求解方法 - Google Patents

基于量子退火的混合整数最优控制数值求解方法 Download PDF

Info

Publication number
CN110045613B
CN110045613B CN201910395792.XA CN201910395792A CN110045613B CN 110045613 B CN110045613 B CN 110045613B CN 201910395792 A CN201910395792 A CN 201910395792A CN 110045613 B CN110045613 B CN 110045613B
Authority
CN
China
Prior art keywords
variable
optimal
integer
population
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910395792.XA
Other languages
English (en)
Other versions
CN110045613A (zh
Inventor
刘哲
李树荣
王柏梗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201910395792.XA priority Critical patent/CN110045613B/zh
Publication of CN110045613A publication Critical patent/CN110045613A/zh
Application granted granted Critical
Publication of CN110045613B publication Critical patent/CN110045613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

混合整数最优控制问题是日常生活和工业生产过程中最常见的重要问题之一。针对求解整数决策变量的计算复杂性,本发明提出一种基于量子退火的混合整数最优控制数值求解方法。首先,建立混合整数最优控制模型来描述一个混合整数最优控制问题。然后利用控制向量参数化和四阶Runge‑Kutta方法将混合整数最优控制模型转化成混合整数非线性规划模型。其次,对比于传统智能优化算法,提出收敛速度更快、全局搜索能力更强的量子退火算法,利用量子退火算法求解整数决策变量,对于最优浮点数控制变量,采用并行差分进化算法进行求解。最后通过两部分交互迭代优化获得最优混合整数控制决策。

Description

基于量子退火的混合整数最优控制数值求解方法
一、技术领域
本技术涉及利用量子退火算法求解混合整数最优控制问题,具体地说是一种基于量子退火的混合整数最优控制数值求解方法。
二、背景技术
最优控制研究的主要问题是:在满足动态约束条件下,寻求最优控制策略,使得问题性能指标取极大值或极小值。它属于最优化的范畴,与最优化有着共同的性质和理论基础。这类问题广泛存在于各种技术领域和社会问题中。混合整数最优控制问题是指包含整数决策变量的最优控制问题。该问题属于既包含整数决策变量又包含浮点数控制变量的组合优化问题,在智能城市、智能仓储、化工生产等领域应用极广。但由于求解最优整数决策变量的计算复杂性,混合整数最优控制问题一直是控制和优化领域的棘手问题。因此,研究混合整数最优控制问题就显得尤为重要。
目前混合整数最优控制问题的求解方法大致分为:解析法,间接法,直接法(控制变量参数化方法、联立法)等。其中,解析法主要采用基于变分的最优性必要条件或动态规划理论解析获得问题的解。由于只能求解简单问题,此方法在理论上有指导意义,但一般无法应用于实际。间接法与解析法类似,也是一种基于最优性必要条件的求解方法。根据极大值原理,最优性必要条件可以表述为一个两点边值问题,因此间接求解方法实际为求解微分方程组的两点边值问题。通常对于问题描述较为复杂或者无明确数学表述的混合整数最优控制问题,解析法或间接法并不适用,此时可采用直接法进行求解。
直接法的基本思想是采用一定的参数化技术将问题轨迹在时间域进行离散化,从而实现最优控制问题的静态非线性规划表述,之后采用优化算法实现问题求解。遗传算法、粒子群算法、模拟退火等智能优化算法都是处理该问题的合适工具,但是这些算法或多或少都有局部搜索能力差或收敛速度慢等缺点。量子退火是通过使用量子波动的过程在给定的一组候选解(候选状态)上找到给定目标函数的全局最小值的元启发式算法。它作为一种高效新颖的算法以操作原理简单,参数较少和易实现等特点优于上述诸多智能优化算法。量子退火主要用于搜索离散空间中的整数变量来求解整数规划问题,因此它非常适合求解混合整数最优控制问题。具有收敛速度快、不易陷入局部最优解等特点。
三、发明内容
本发明提出一种基于量子退火的混合整数最优控制数值求解方法,针对一个混合整数最优控制问题,首先建立混合整数最优控制模型,然后利用控制向量参数化和四阶Runge-Kutta方法将混合整数最优控制模型转化成混合整数非线性规划模型。其次,对比于传统智能优化算法,提出收敛速度更快、全局搜索能力更强的量子退火算法,利用量子退火算法求解整数决策变量,对于最优浮点数控制变量,采用并行差分进化算法进行求解;最后通过两部分交互迭代优化获得最优混合整数控制决策。
本发明的目的通过以下技术方案来实现:
该种基于量子退火的混合整数最优控制数值求解方法,包括以下步骤:
1.建立混合整数最优控制模型
对于一个混合整数最优控制问题,首先要对其进行建模。本专利给出一个一般形式的混合整数最优控制模型如下所示:
Figure BDA0002057259600000021
Figure BDA0002057259600000022
a(x(tf),tf)=0,
g(x(t),u(t),w(t),t)≤0,
umin≤u(t)≤umax,w(t)∈Zw
其中,t为时间,J为性能指标,x(t)∈Rn为状态变量,u(t)∈Ru为浮点数控制变量,w(t)∈Zw为整数决策变量,x0为初始状态变量,
Figure BDA0002057259600000026
为关于末端时刻状态变量的函数,
Figure BDA0002057259600000027
为关于控制变量和状态变量的泛函,
Figure BDA00020572596000000210
为微分方程约束,
Figure BDA0002057259600000029
为末端时刻的等式约束,
Figure BDA0002057259600000028
为路径约束,to和tf分别是起始时间和末端时间,umin和umax是u(t)的边界条件。求解该模型即是求解混合整数最优控制变量u(t) 和w(t)使系统在约束条件下实现性能指标的最小化。
2.将模型转化成混合整数非线性规划模型
对于上述的混合整数最优控制模型,采用直接法对其进行转化处理,主要包括:使用控制向量参数化对控制向量u(t)和w(t)进行离散;对于状态变量x(t),使用四阶Runge-Kutta方法对其进行离散处理。将最优控制模型转化成非线性规划模型。
具体步骤:
(1)控制向量参数化
对于一个连续时间域上的控制变量u(t)和w(t),无法直接求解其控制轨迹,需要将其参数化处理转化成多个离散变量。将全部时间域[t0,tf]分成N个子区间:
t0<t1<...<tk-1<tk<tk+1<...<tN=tf,k=1,2,3,...,N-1,
其中,每个子区间的长度Δtk=tk-tk-1可以相等或不等。一般来说,均分法计算量较小但误差较大,采用非均分法则需要将N个间隔长度也看作控制变量进行求解,计算量较大但是相对误差较小,也更贴近实际最优控制轨迹。
在每个区间[tk-1,tk]上,选取一个代表映射关系的基函数bk,它可以被有限个控制参数qk进行参数化,以确保离散的可分离性。常用的基函数主要包括下列三种形式:
分段常数
Figure BDA0002057259600000023
分段线性函数
Figure BDA0002057259600000024
分段样条函数
Figure BDA0002057259600000025
(β为样条函数系数);
不同基函数的选取会导致离散形式的不同,因此需要根据不同的实际最优控制问题以选取相应的基函数。通过控制向量参数化,将连续的控制变量转化成离散的控制变量如下所示:
u(t)=uk(t)=αkbk,w(t)=wk(t)=βkbk,t∈[tk-1,tk],
其中,αk和βk是待求的系数。
(2)四阶Runge-Kutta方法
本发明采用四阶Runge-Kutta方法对状态变量x(t)进行离散化处理,它对比于传统的欧拉法,局部截断误差更小,离散结果更准确。在每个区间[tk-1,tk]上,x(t)的计算过程如下所示:
a.计算k1=f(xk,uk,wk)及其偏导数:
Figure BDA0002057259600000031
b.计算
Figure BDA0002057259600000032
及其偏导数:
Figure BDA0002057259600000033
c.计算
Figure BDA0002057259600000034
及其偏导数:
Figure BDA0002057259600000035
d.计算k4=f(xk+hk3,uk)及其偏导数:
Figure BDA0002057259600000036
e.计算下一个子区间的状态变量及其偏导数:
Figure BDA0002057259600000037
Figure BDA0002057259600000038
Figure BDA0002057259600000039
Figure BDA00020572596000000310
通过上述计算过程,连续时间域的状态变量x(t)转化成了离散的xk以便于后续的模型转换及计算求解。
(3)建立混合整数非线性规划模型
引入一个新变量z满足
Figure BDA00020572596000000313
z(t0)=0.定义X(t)=[x(t)Tz(t)]T和F(t)=[f(t)TL(t)]T。原最优控制模型转化成如下非线性规划模型:
Figure BDA00020572596000000311
s.t.Xk+1(t)=F(Xk(t),uk(t),wk(t),t),t∈[tk-1,tk],k=1,2,...,N,X1(t0)=X0
a(X(tf),tf)=0,
g(Xk(t),uk(t),wk(t),t)≤0,t∈[tk-1,tk],k=1,2,...,N,
umin≤uk≤umax,wk∈Zw.
为了方便计算,本发明对其进行标准化处理。引入标准化时间变量τk∈[0,1]满足
Figure BDA00020572596000000312
第k个子系统表示为:
Figure BDA0002057259600000041
因此,混合整数最优控制模型转化成混合整数非线性规划模型如下所示:
Figure BDA0002057259600000042
Figure BDA0002057259600000043
a(X(τN(1)),τN(1))=0,
Figure BDA0002057259600000044
umin≤uk(τ)≤umax,wk(τ)∈Zw.
它是一个约束优化模型,本发明使用罚函数法对其进行处理从而转化成一个无约束优化模型:
Figure BDA0002057259600000045
Figure BDA0002057259600000046
其中,μi(i=1,2,3,4)为无穷大的惩罚因子。通过本步骤的计算处理,原混合整数最优控制模型转化成了混合整数非线性规划模型。
3.提出量子退火算法
基本思想为:建立包括动能项和势能项的哈密尔顿函数式,利用格雷码对整数决策变量进行编码,然后确定自旋矩阵和变异算子,通过动能项的变化提供扰动从而完成一个退火过程,最后迭代搜索得到最优的自旋矩阵即整数决策变量。
具体步骤:
(1)建立哈密尔顿函数式:H=Hpot/P+δΔHkin,其中P为自旋矩阵个数,Hpot是总势能项,Hkin是动能项,δ=-T/2ln tanh(Γ/PT)是铁磁耦合项,其中T为温度,Γ为隧穿场强系数,PT记为有效量子温度。在哈密尔顿函数式中,势能项Hpot通常为模型的性能指标J。
(2)格雷编码:利用格雷码对整数决策变量进行编码。对于一个任意的二进制数Bn-1Bn-2…B2B1B0, (Bi∈{0,1},i=0,1,...,n-1),都有一个与之对应的格雷码Gn-1Gn-2…G2G1G0,(Gi∈{0,1},i=0,1,...,n-1)。两者之间的转换公式如下所示:
Gn-1=Bn-1
Figure BDA0002057259600000047
i=0,1,2,...,n-2,
其中,
Figure BDA0002057259600000048
表示异或操作。使用格雷编码可以有效的防止在迭代过程中的“数据断崖”现象,既节约了收敛时间又可以加强算法的全局搜索能力。
(3)建立自旋矩阵群体:建立由P个自旋矩阵W所组成的自旋矩阵种群,每个矩阵都代表着一个整数决策变量集,种群中的第z个个体记为Wz。每个自旋矩阵W都是一个q×k维的对称矩阵,其中,k是待求整数决策变量的数量,q是整数变量经过格雷编码后的位数。因此,自旋矩阵W即代表整数决策变量的集合。构建如下自旋矩阵:
Figure BDA0002057259600000051
其中,w1表示第一个整数变量,向量A=[w2,w3,...,wk-1]表示其他k-1个整数变量。由于自旋矩阵必须为对称阵,因此除了第一行(列)的元素以外,矩阵的其余元素都记为0。通过迭代搜索获得最优自旋矩阵W即可得到最优整数决策变量w(k)。
(4)选取变异算子:对于第z个自旋矩阵Wz,设置N个变异算子用来在迭代过程中更新候选矩阵Wz,变异算子通过模拟量子隧穿效应对自旋矩阵进行如下操作:随机选取两个整数变量并交换它们的值;随机选取一个整数变量中两个位并交换它们的值;随机选取一个整数变量,对其中的任意位数值取“逆”操作。通过变异算子对候选矩阵的改变,从而实现淘汰次优解,获得更优解。模拟量子隧穿效应的变异算子具有一个跳出当前搜索区域的机制,因此可以更好的防止搜索过程陷入局部极值。
(5)提供扰动:在量子退火算法的迭代过程中,由动能项Hkin的改变提供一个扰动以促使退火过程的进行。动能项的计算需要首先获知每个自旋矩阵及其相邻自旋矩阵的状态,即
Figure BDA0002057259600000052
其中,
Figure BDA0002057259600000053
表示第z个自旋矩阵的第i个整数变量。表达式的第一项
Figure BDA0002057259600000054
为当前个体Wz与前一个个体Wz+1中所有元素的乘积和;同理,表达式的第二项
Figure BDA0002057259600000055
为当前个体Wz与后一个个体 Wz+1中所有元素的乘积和。ΔHkin可以表示为:
Figure BDA0002057259600000056
其中,
Figure BDA0002057259600000057
表示第z个矩阵变异后得到的自旋矩阵Wz′的第i个整数变量。这样,在退火过程中通过改变动能项Hkin从而改变哈密尔顿函数式,为淘汰劣解提供判别依据。
(6)计算哈密尔顿函数式增量:利用变异后的自旋矩阵计算新的性能指标,结合原性能指标计算两者差值ΔJ。利用动能项的增量ΔHkin计算哈密尔顿函数式增量ΔH=(ΔJ/P)+δΔHkin
(7)选择:如果ΔJ≤0或ΔH≤0,将变异后的自旋矩阵Wz′赋值到Wz;随机设定一个数Θ∈(0,1),如果 exp(-ΔH/T)>Θ,那么也将变异后的自旋矩阵Wz′赋值到Wz,这提供了一个次优解也可以一定概率进入下一代的机制以防止搜索陷入局部极值。记录Wz,更新相应参数,跳转到步骤(4)利用Wz进行新的迭代。
(8)判断是否满足终止条件,如果满足,结束循环,如果不满足,跳转到步骤(4)继续执行。
4.利用基于量子退火的数值求解算法计算混合整数非线性规划
具体过程为:
(1)设定初始浮点数变量:在浮点数变量u(k)的可行域中随机选取一个浮点数变量带入混合整数非线性规划模型中,将模型转化成整数非线性规划模型。记uo(k)为最优浮点数变量;
(2)格雷编码:利用格雷码对整数决策变量进行编码;
(3)建立初始自旋矩阵种群:建立由P个自旋矩阵W所组成的自旋矩阵种群,每个矩阵都代表着一个整数决策变量集,种群中的第z个个体记为Wz
(4)种群变异:从N个变异算子中随机选取一个对自旋矩阵种群执行变异操作,得到新的自旋矩阵种群;
(5)提供扰动:利用原矩阵种群中的个体Wz和变异矩阵种群中的个体Wz′计算得到动能项的增量ΔHkin。利用动能项的增量ΔHkin计算哈密尔顿函数式差值ΔH=(ΔJ/P)+δΔHkin
(6)选择:满足集合Ω={ΔJ≤0,ΔH≤0,exp(-ΔH/T)>random(0,1)}中任意一个条件,则将变异后的自旋矩阵Wz′赋值到Wz,更新相应参数;
(7)判别整数变量中止条件:判断是否满足终止条件,如果满足,结束循环,如果不满足,跳转到步骤(4)继续执行,直到得到最优整数决策变量Wo
(8)建立初始浮点数变量种群:将最优整数决策变量Wo带入混合整数非线性规划模型,将原模型转化成一个浮点数非线性规划模型。建立规模为NP的浮点数变量种群,种群中的第i个个体在第G 代记为
Figure BDA0002057259600000061
其中D是个体所包含的维度,NP=30D,种群初始化采用公式xj,i,0=xj,min+randi,j(0,1)×(xj,max-xj,min),其中xj,i,0表示第G=0代,种群中第i个个体,第j个维度的值;
(9)参数和种群变异:针对两个种群的控制参数和种群,对缩放因子进行自调整。对种群采用 DE/current-to-pbest/1的差分变异策略;
(10)计算适应度函数:将各个控制策略代入非线性规划模型,以性能指标作为适应度函数值;
(11)选择:将每个种群的各个控制策略相应的适应度函数作比较,保留适应度函数最小的控制参数和种群个体存入相应库中,更新相应参数;
(12)判别浮点数变量中止条件:判断是否满足终止条件,如果满足,结束循环,如果不满足,跳转到步骤(9)继续执行,直到得到当前最优浮点数变量u(k)为止,更新uo(k);
(13)交互式迭代搜索:将u(k)带入原混合整数非线性规划模型,将其转化成整数非线性规划模型。跳转到步骤(3);
(14)判别局部最优解条件:判断所得最优浮点数变量是否等于uo(k),如果不满足,跳转到步骤(13),如果满足,说明Wo和uo(k)即为一个局部最优解,记录Wo和uo(k);
(15)判别终止条件:判断是否满足终止条件,如果满足,结束循环,如果不满足,更新uo(k),跳转到步骤(1),进行全局最优解搜索,直到得到最优控制策略结束循环为止。
四、附图说明
图1是本发明的流程示意图
图2是量子退火算法流程图
五、具体实施方式
下面结合附图对本发明作进一步描述:
参照图1,本发明基于量子退火的混合整数最优控制问题数值求解方法具体实施过程如下:
(1)基于实际最优控制问题,建立既包含整数决策变量又包含浮点数控制变量的混合整数最优控制模型;
(2)对于构建好的最优控制模型,利用控制向量参数化对混合整数控制变量进行参数化处理,使用四阶Runge-Kutta方法将状态变量离散。通过控制和状态的离散化处理,将原混合整数最优控制模型转化成混合整数非线性规划模型;
(3)设定初始浮点数变量:在浮点数变量u(k)的可行域中随机选取一个浮点数变量带入混合整数非线性规划模型中,将模型转化成整数非线性规划模型。记uo(k)为最优浮点数变量;
(4)格雷编码:利用格雷码对整数决策变量进行编码;
(5)建立初始自旋矩阵种群:建立由P个自旋矩阵W所组成的自旋矩阵种群,每个矩阵都代表着一个整数决策变量集,种群中的第z个个体记为Wz
(6)种群变异:从N个变异算子中随机选取一个对自旋矩阵种群执行变异操作,得到新的自旋矩阵种群;
(7)提供扰动:利用原矩阵种群中的个体Wz和变异矩阵种群中的个体Wz′计算得到动能项的增量ΔHkin。利用动能项的增量ΔHkin计算哈密尔顿函数式差值ΔH=(ΔJ/P)+δΔHkin
(8)选择:满足集合Ω={ΔJ≤0,ΔH≤0,exp(-ΔH/T)>random(0,1)}中任意一个条件,则将变异后的自旋矩阵Wz′赋值到Wz,更新相应参数;
(9)判别整数变量中止条件:判断是否满足终止条件,如果满足,结束循环,如果不满足,跳转到步骤(6)继续执行,直到得到最优整数决策变量Wo
(10)建立初始浮点数变量种群:将最优整数决策变量Wo带入混合整数非线性规划模型,将原模型转化成一个浮点数非线性规划模型。建立规模为NP的浮点数变量种群,种群中的第i个个体在第G 代记为
Figure BDA0002057259600000071
其中D是个体所包含的维度,NP=30D,种群初始化采用公式xj,i,0=xj,min+randi,j(0,1)×(xj,max-xj,min),其中xj,i,0表示第G=0代,种群中第i个个体,第j个维度的值;
(11)参数和种群变异:针对两个种群的控制参数和种群,对缩放因子进行自调整。对种群采用 DE/current-to-pbest/1的差分变异策略;
(12)计算适应度函数:将各个控制策略代入非线性规划模型,以性能指标作为适应度函数值;
(13)选择:将每个种群的各个控制策略相应的适应度函数作比较,保留适应度函数最小的控制参数和种群个体存入相应库中,更新相应参数;
(14)判别浮点数变量中止条件:判断是否满足终止条件,如果满足,结束循环,如果不满足,跳转到步骤(11)继续执行,直到得到当前最优浮点数变量u(k)为止,更新uo(k);
(15)交互式迭代搜索:将u(k)带入原混合整数非线性规划模型,将其转化成整数非线性规划模型。跳转到步骤(5);
(16)判别局部最优解条件:判断所得最优浮点数变量是否等于uo(k),如果不满足,跳转到步骤(15),如果满足,说明Wo和uo(k)即为一个局部最优解,记录Wo和uo(k);
(17)判别终止条件:判断是否满足终止条件,如果满足,结束循环,如果不满足,更新uo(k),跳转到步骤(3),进行全局最优解搜索,直到得到最优控制策略结束循环为止。

Claims (1)

1.一种基于量子退火的混合整数最优控制数值求解方法,其特征在于:利用一种基于量子退火的数值求解方法来处理混合整数最优控制问题,具体内容如下:
(1)建立混合整数最优控制模型,具体为:
性能指标:
Figure FDA0002544071250000011
状态微分方程:
Figure FDA0002544071250000012
x(t0)=x0
末端时刻约束:a(x(tf),tf)=0
路径约束:g(x(t),u(t),w(t),t)≤0
控制变量约束:umin≤u(t)≤umax,w(t)∈Zw
其中,t为时间,J为性能指标,x(t)∈Rn为状态变量,u(t)∈Ru为浮点数控制变量,w(t)∈Zw为整数决策变量,x0为初始状态变量,
Figure FDA0002544071250000013
为关于末端时刻状态变量的函数,
Figure FDA0002544071250000014
为关于控制变量和状态变量的泛函,
Figure FDA0002544071250000015
为状态微分方程约束,
Figure FDA0002544071250000016
为末端时刻的等式约束,
Figure FDA0002544071250000017
为路径约束,to和tf分别是起始时间和末端时间,umin和umax是u(t)的边界条件,求解该模型即是求解混合整数最优控制变量u(t)和w(t)使系统在约束条件下实现性能指标的最小化;
(2)利用控制向量参数化和四阶Runge-Kutta方法将模型转化成混合整数非线性规划模型,其具体过程为:将全部时间域[t0,tf]分成N个子区间,使用控制向量参数化对控制向量u(t)和w(t)进行离散,将连续的控制变量转化成离散的控制变量,对于状态变量x(t),使用四阶Runge-Kutta方法对其进行离散处理,通过标准化处理,结合罚函数法将混合整数最优控制模型转化成混合整数非线性规划模型;
(3)提出量子退火算法,其基本思想为:建立包括动能项和势能项的哈密尔顿函数式,利用格雷码对整数决策变量进行编码,防止在迭代过程中出现“数据断崖”现象,既节约了收敛时间又加强了算法的全局搜索能力,然后确定自旋矩阵和变异算子以模拟量子隧穿效应,可为种群个体的更新提供一个跳出当前搜索区域的机制,防止搜索过程陷入局部极值,通过动能项的变化提供扰动从而完成一个退火过程,最后迭代得到最优的自旋矩阵即整数决策变量,其具体过程为:建立哈密尔顿函数式,格雷编码,建立自旋矩阵群体,选取变异算子,提供扰动,计算哈密尔顿函数式增量,选择,判断是否满足终止条件;
(4)提出基于量子退火的数值求解方法来求解步骤(2)中的混合整数非线性规划模型,其特征是:利用步骤(3)中提出的量子退火算法计算整数决策变量,引入并行差分进化策略计算最优浮点数控制变量,辅助量子退火算法,通过交互式迭代优化获得最优混合整数控制决策,其具体过程为:
1)设定初始浮点数变量:在浮点数变量u(k)的可行域中随机选取一个浮点数变量带入混合整数非线性规划模型中,将模型转化成整数非线性规划模型,记uo(k)为最优浮点数变量;
2)格雷编码:利用格雷码对整数决策变量进行编码;
3)建立初始自旋矩阵种群:建立由P个自旋矩阵W所组成的自旋矩阵种群,每个矩阵都代表着一个整数决策变量集,种群中的第z个个体记为Wz
4)种群变异:从N个变异算子中随机选取一个对自旋矩阵种群执行变异操作,得到新的自旋矩阵种群;
5)提供扰动:利用原矩阵种群中的个体Wz和变异矩阵种群中的个体Wz′计算得到动能项的增量ΔHkin,利用动能项的增量ΔHkin计算哈密尔顿函数式差值ΔH=(ΔJ/P)+δΔHkin
6)选择:满足集合Ω={ΔJ≤0,ΔH≤0,exp(-ΔH/T)>random(0,1)}中任意一个条件,则将变异后的自旋矩阵Wz′赋值到Wz,更新相应参数;
7)判别整数变量中止条件:判断是否满足终止条件,如果满足,结束循环,如果不满足,跳转到步骤(4)继续执行,直到得到最优整数决策变量Wo
8)建立初始浮点数变量种群:将最优整数决策变量Wo带入混合整数非线性规划模型,将原模型转化成一个浮点数非线性规划模型,建立规模为NP的浮点数变量种群,种群中的第i个个体在第G代记为
Figure FDA0002544071250000021
其中D是个体所包含的维度,NP=30D,种群初始化采用公式xj,i,0=xj,min+randi,j(0,1)×(xj,max-xj,min),其中xj,i,0表示第G=0代,种群中第i个个体,第j个维度的值;
9)参数和种群变异:针对两个种群的控制参数和种群,对缩放因子进行自调整,对种群采用DE/current-to-pbest/1的差分变异策略;
10)计算适应度函数:将各个控制策略代入非线性规划模型,以性能指标作为适应度函数值;
11)选择:将每个种群的各个控制策略相应的适应度函数作比较,保留适应度函数最小的控制参数和种群个体存入相应库中,更新相应参数;
12)判别浮点数变量中止条件:判断是否满足终止条件,如果满足,结束循环,如果不满足,跳转到步骤(9)继续执行,直到得到当前最优浮点数变量u(k)为止,更新uo(k);
13)交互式迭代搜索:将u(k)带入原混合整数非线性规划模型,将其转化成整数非线性规划模型,跳转到步骤(3);
14)判别局部最优解条件:判断所得最优浮点数变量是否等于uo(k),如果不满足,跳转到步骤(13),如果满足,说明Wo和uo(k)即为一个局部最优解,记录Wo和uo(k);
15)判别终止条件:判断是否满足终止条件,如果满足,结束循环,如果不满足,更新uo(k),跳转到步骤(1),进行全局最优解搜索,直到得到最优控制策略结束循环为止。
CN201910395792.XA 2019-05-13 2019-05-13 基于量子退火的混合整数最优控制数值求解方法 Active CN110045613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910395792.XA CN110045613B (zh) 2019-05-13 2019-05-13 基于量子退火的混合整数最优控制数值求解方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910395792.XA CN110045613B (zh) 2019-05-13 2019-05-13 基于量子退火的混合整数最优控制数值求解方法

Publications (2)

Publication Number Publication Date
CN110045613A CN110045613A (zh) 2019-07-23
CN110045613B true CN110045613B (zh) 2020-09-22

Family

ID=67281696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910395792.XA Active CN110045613B (zh) 2019-05-13 2019-05-13 基于量子退火的混合整数最优控制数值求解方法

Country Status (1)

Country Link
CN (1) CN110045613B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021138857A1 (zh) * 2020-01-08 2021-07-15 华为技术有限公司 一种标记数据标签的方法、设备及系统
CN111735443B (zh) * 2020-06-18 2022-04-08 中山大学 一种基于赋值矩阵的密集目标航迹关联方法
CN112488868B (zh) * 2020-11-27 2022-11-01 北京邮电大学 一种基于闭环框架的表面活性剂驱油集成调度优化与控制方法
CN113392580B (zh) * 2021-05-21 2023-07-28 中国人民解放军战略支援部队信息工程大学 基于混合量子算法的组合优化求解方法、系统及求解器架构

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105960650A (zh) * 2014-01-06 2016-09-21 谷歌公司 构建和编程用于鲁棒的量子退火过程的量子硬件
CN106740846A (zh) * 2016-12-02 2017-05-31 大连理工大学 一种双模式切换的电动汽车自适应巡航控制方法
CN109478256A (zh) * 2016-05-26 2019-03-15 1Qb信息技术公司 用于设置具有有界整数域上多项式的哈密顿量表示的超导量子位系统的方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3113084B1 (en) * 2015-06-29 2020-12-09 Parity Quantum Computing GmbH Quantum processing device and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105960650A (zh) * 2014-01-06 2016-09-21 谷歌公司 构建和编程用于鲁棒的量子退火过程的量子硬件
CN109478256A (zh) * 2016-05-26 2019-03-15 1Qb信息技术公司 用于设置具有有界整数域上多项式的哈密顿量表示的超导量子位系统的方法和系统
CN106740846A (zh) * 2016-12-02 2017-05-31 大连理工大学 一种双模式切换的电动汽车自适应巡航控制方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Biclustering with a quantum annealer;Lorenzo Bottarelli等;《METHODOLOGIES AND APPLICATION》;20180129;全文 *
Enhancing quantum annealing performance for the molecular similarity problem;Maritza Hernandez等;《Quantum Inf Process》;20171231;全文 *
基于量子退火Metropolis-Hastings算法的叠前随机反演;张广智等;《石油地球物理勘探》;20180228;第53卷(第1期);全文 *
量子退火算法研究进展;杜卫林等;《计算机研究与发展》;20081231;第45卷(第9期);全文 *

Also Published As

Publication number Publication date
CN110045613A (zh) 2019-07-23

Similar Documents

Publication Publication Date Title
CN110045613B (zh) 基于量子退火的混合整数最优控制数值求解方法
Wang et al. A multiobjective evolutionary nonlinear ensemble learning with evolutionary feature selection for silicon prediction in blast furnace
Kim et al. Designing fuzzy net controllers using genetic algorithms
Anh et al. Hybrid control of a pneumatic artificial muscle (PAM) robot arm using an inverse NARX fuzzy model
Zhang et al. A new approach of Takagi–Sugeno fuzzy modeling using an improved genetic algorithm optimization for oxygen content in a coke furnace
CN111914492B (zh) 一种基于进化优化的半监督学习工业过程软测量建模方法
JP7206874B2 (ja) 制御装置、制御方法及びプログラム
Zhang et al. A real‐time model based on optimized least squares support vector machine for industrial polypropylene melt index prediction
Mitra et al. Blast furnace charging optimization using multi-objective evolutionary and genetic algorithms
Zhan et al. Human-guided robot behavior learning: A gan-assisted preference-based reinforcement learning approach
Masri et al. Training neural networks by adaptive random search techniques
CN114282370B (zh) 考虑操作者体力和脑力负荷的拆卸线设置方法
JP4488964B2 (ja) プロセスの操業状態の制御方法及びコンピュータプログラム
CN113204918B (zh) 水泥窑生产能耗的建模方法
CN113257359A (zh) 一种基于CNN-SVR的CRISPR/Cas9向导RNA编辑效率预测方法
Xu et al. Intelligent train operation based on deep learning from excellent driver manipulation patterns
CN114296354B (zh) 基于多优先级约束放松的混合优化算法
CN112667394B (zh) 一种计算机资源利用率优化方法
Wang et al. A novel PID-like particle swarm optimizer: on terminal convergence analysis
Martynova A novel approach of the approximation by patterns using Hybrid RBF NN with flexible parameters
CN107609678B (zh) 一种考虑矩信息不确定性的同型并行机生产调度方法
CN112070200A (zh) 一种谐波群优化方法及其应用
Xue et al. Crude oil distillation optimization using surrogate-aided constrained evolutionary optimization
Li et al. An Optimized Control Strategy Based on Multidimensional Feature Operation Pattern
Fang et al. ASFC-based DNN modeling for prediction of silicon content in blast furnace ironmaking

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant