CN114296354B - 基于多优先级约束放松的混合优化算法 - Google Patents
基于多优先级约束放松的混合优化算法 Download PDFInfo
- Publication number
- CN114296354B CN114296354B CN202111666402.1A CN202111666402A CN114296354B CN 114296354 B CN114296354 B CN 114296354B CN 202111666402 A CN202111666402 A CN 202111666402A CN 114296354 B CN114296354 B CN 114296354B
- Authority
- CN
- China
- Prior art keywords
- constraint
- priority
- variable
- vector
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 102
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000008901 benefit Effects 0.000 claims abstract description 28
- 230000001364 causal effect Effects 0.000 claims abstract description 10
- 238000005516 engineering process Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 90
- 239000011159 matrix material Substances 0.000 claims description 42
- 230000003190 augmentative effect Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 9
- 230000003416 augmentation Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 230000002040 relaxant effect Effects 0.000 claims description 6
- 230000006399 behavior Effects 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000011960 computer-aided design Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于多优先级约束放松的混合优化算法。针对具有可量化经济效益优化目标,带有复杂约束的广义系统,本发明首先定义了其动态因果关系模型、硬约束或软约束、经济效益指标的数学描述形式;利用已有建模方法,在算法离线执行阶段,根据系统历史运行数据确定所述数学描述形式中的具体参数;在算法在线执行时刻,利用计算机技术迭代求解优先级放松问题规范化形式,按重要程度逐级放松约束条件,在保证可行性的前提下最小化各优先级约束的放松程度;进而实现含复杂约束系统具有可行性保证的在线实时优化,最小化约束放松对系统性能影响。
Description
技术领域
本发明涉及计算机辅助设计技术领域,特别涉及基于多优先级约束放松的混合优化算法。
背景技术
基于模型的约束优化方法已成为各领域智能决策,提高效益的核心技术。在化工、电力、金融等领域广泛存在一类广义系统,这类系统运行过程中存在决定经济效益的关键变量,即输出变量,如化工系统中有限周期内的产率和单位能耗或物耗变量。
在现有技术中,通常通过计算机技术和优化算法,确定系统中可操纵变量,即输入变量,如装置中温度、压力等工况条件的设定值,从而影响关键变量的演化过程并使其满足经济效益和系统约束的需求。
然而,由于关键变量、操纵变量间存在动态因果关系,现有多数优化算法通过求解优化问题实现系统运行优化;优化问题中包含了描述变量间因果关系的预测模型、描述系统效益,即定义在关键变量上的优化目标、系统演化过程所需满足的实际物理约束、和为保证优化性能的算法约束。
尽管现有策略已为所述系统的优化提供了基本思路,其在执行时仍具有诸多限制,主要表现在实际系统存在复杂的物理约束和算法约束时,优化算法在线实施过程出现约束集为空集,算法不可行的问题,进而导致系统性能退化。
因此,如何实现含复杂约束系统具有可行性保证的在线实时优化,最小化约束放松对系统性能影响成为本领域技术人员急需解决的技术问题。
发明内容
有鉴于现有技术的上述缺陷,本发明提供基于多优先级约束放松的混合优化算法,结合计算机技术,构造优先级放松问题规范化形式,在优化算法在线执行阶段实现复杂系统约束集的逐级放松,进而通过实时经济优化提升系统性能。
为实现上述目的,本发明公开了基于模型多优先级约束放松的混合优化算法;包括如下步骤:
步骤1、动态因果关系数学描述;
在数据集中选取与系统的效益和物理约束条件相关的nv个输入变量组成输入向量vt,ns个输出变量组成输出向量st,及nz个中间变量组成状态向量zt;
利用机器学习方法、机理建模或者参数辨识方法获得所述系统的状态方程模型zt+1=Azt+Bvt,st=Czt;
其中,为非负整数集合;
为n维实数列向量空间;
为n行m列实数矩阵空间;
In为n行n列单位矩阵,满足
0n为n行n列零矩阵,满足
t为采样时刻,满足
vt为t时刻可操纵的nv维输入变量取值,满足
st为t时刻决定效益的ns维输出变量取值,满足
zt为t时刻nz维状态变量取值,满足
A为状态转移矩阵,满足
B为输入矩阵,满足
C为输出矩阵,满足
根据所述状态方程模型,引入与输出向量具有相同维数的增广变量dt,得到增广线性模型如下:
其中,dt为t时刻nz维增广变量取值,满足
Bd为增广输入矩阵,满足
Cd为增广输出矩阵,满足
且所述增广线性模型的可观测条件为矩阵满秩;
步骤2、系统效益数学描述;
根据经济指标le(st,vt),设定最优或次优的期望稳态点(s*,v*),使得指标le(s*,v*)的取值尽可能大;
当输入变量设定值恒为v*时,输出变量维持在最优点s*以保证在某段时间内累积效益最优,即性能指标累积值的取值尽可能大;
步骤3、所述系统的硬约束;
所述硬约束具体如下:
Lv≤vt≤Hv,
Ldv≤Δvt≤Hdv, (2)
其中,Δvt:=vt-vt-1,表示输入向量在相邻采样间隔内的增量;
是输入变量vt的约束限制;
是输入向量增量的约束限制;
是输出向量的约束限制;
对于不存在硬约束的变量,向量Hv,Lv中对应行设定为足够大(或小)的常数;
步骤4、所述系统的软约束;
所述软约束包括两类;
第一类所述软约束为关于期望输出稳态点s*的等式约束形式,第二类所述软约束为关于受限制状态变量的不等式约束形式;
第一类所述软约束对应步骤2中所设定的期望稳态点(s*,v*),按照输出向量st中ns个变量的重要程度,设定第1优先级至第peq优先级;
其中peq=ns,优先级序号越小,重要程度越高,且步骤3中硬约束的优先级为0,具体如下:
Rpst+N=Rp(s*+δp,t), (3)
其中,p∈[1,peq]且p为整数是优先级索引;
Rp=[0 ... 0 1 0 ... 0]是ns维行向量,仅在第p优先级约束相关列为1,其余列为0;
Rpst+N表示输出向量st+N中应满足第p优先级约束的变量;
δp,t是ns维松弛向量,该变量是算法中的待优化变量;
t+N中N为算法的预测时域;表示在t时刻的算法执行中,该约束仅对所预测的未来第t+N时刻输出向量起作用,通过算法随时间的滚动和迭代,最终使系统输出转移至期望的稳态点(s*,v*)邻域;
第二类所述软约束为对应状态向量zt中共有pin个变量受所述限制,按重要程度设定为第peq+1至第peq+pin优先级;其中0≤pin≤nz,优先级序号越小,重要程度越高,具体如下:
Spzt≤Ep(h+εp,t), (4)
其中,p∈[peq+1,peq+pin]是优先级索引;
Sp=[0 ... 0 1 0 ... 0]是nz维行向量,仅在第p优先级约束相关列为1,其余列为0;
Spzt表示状态量zt中应满足第p优先级约束的变量;
是pin维向量,该向量中的元素hp表示第p优先级约束上界;
εp,t是pin维松弛向量,该变量是算法中的待优化变量;
Ep=[0 ... 0 1 0 ... 0]是pin维行向量,仅在第p优先级约束相关列为1;
步骤5、混合优化算法的状态观测阶段;
在线执行时刻t,根据上一时刻输入向量设定值,即优化解,vt-1和当前时刻输出变量的测量值st,得到状态组合[zt vt]T的观测值,以修正线性增广模型的稳态输入输出关系使其与非线性对象趋于一致;
其中,龙伯格观测器观测形式如式(5),或者采用卡尔曼滤波器方法;
其中,是t-1时刻根据,观测的状态组合[zt-1 dt-1]T和优化的输入变量vt-1,基于所述增广线性模型(1)得到的输出变量的预测值;
st为输出变量的实测值;
K1和K2为观测器增益;
步骤6、混合优化算法的约束放松阶段;
根据步骤5中状态观测阶段得到的状态组合[zt vt]T,在约束放松阶段逐级放松软约束;
按步骤4中定义的优先级顺序,首先放松等式形式的软约束,其次放松不等式形式的软约束,令矩阵变量函数其中j∈[1,N]且/>则ψ(j)为nz行nv列矩阵,ψ(N)=[AN-1B AN-2 ... B]。将优先级索引p依此设定为1至peq,利用MATLAB中QUADPROG工具迭代求解线性二次约束优化问题(6);
其中,待优化变量为未来[t,t+N]时刻输入向量vt,...,vt+N,以及第p优先级等式形式软约束的松弛变量δp,t,其初始值设定为前次,即第p-1优先级优化问题(6)的最优解
s.t.
其中,为尽可能减小第p优先级约束的违反程度,优化目标函数(6a)是松弛向量中对应变量的方差;
约束(6b)由第0优先级硬约束整理可得,作用在未来[t,t+N]时刻输入向量及其所决定的输入向量增量上;
约束(6c)包含三部分具体如下:
在Cψ(N)[vtL vt+N-1]T=s*+ηt+δp,t中,给定t时刻观测状态[zt vt]T的矩阵,该式由模型(1)和等式形式软约束(4)整理可得;
(A-I)ψ(N)[vtL vt+N-1]T+Bvt+N=-Bddt等价于zt+N=Azt+N+Bvt+N+Bddt,该约束限制了未来第t+N时刻系统状态位于可达稳态点;
在中,/>是ns行ns列常数矩阵;
求解优化问题(6),得到最优解令p=p+1,重复求解问题(6),直至优先级为p=peq的等式形式软约束放松完毕,得到经过等式约束放松后的松弛变量/>以及接近期望设定点(s*,v*)且满足模型(1)的实际可达稳态点:
其次,考虑p∈[peq+1,peq+pin],逐级放松不等式形式的软约束。将优先级索引p依此设定为peq+1至peq+pin,利用MATLAB中QUADPROG工具迭代求解线性二次约束优化问题(7);
其中,待优化变量为未来[t,t+N]时刻输入向量vt,...,vt+N,和第p优先级不等式形式软约束的松弛变量εp,t,其初始可行解设定为前次,即第p-1优先级优化问题(7)的最优解
s.t.
其中,是nz行nz列常数矩阵;
求解优化问题(7),得到最优解令p=p+1,重复求解问题(6),直至优先级为p=peq+pin的不等式形式软约束放松完毕,得到经过不等式约束放松后的松弛变量/>以及t时刻混合优化算法实时优化阶段的软约束上界:
步骤7、混合优化算法的实时优化阶段;
根据步骤5和步骤6确定的实时优化阶段的初始条件,终端条件和约束条件,利用MATLAB中fmincon工具求解下述实时优化问题:
s.t.r=0,1,...,N,
其中,优化目标函数(8a)为未来N个时刻经济指标在预测输入或输出轨迹上的累积量,通过该设置优化经济效益;
待优化变量为未来N个时刻的输入向量vt,...,vt+N;
约束(8b)为模型约束;
约束(8c)为过程硬约束或软约束,由于经过约束放松处理,该约束集内优化问题(8)可行;
约束(8d)为关于可达稳态点即位于期望稳态点(s*,v*)的邻域的终端等式约束,该约束仅对所预测的未来第t+N时刻状态向量起作用;
通过求解问题(8),得到最优输入序列将第一个控制量/>施加到所述系统上;在下一个采样时刻,令t=t+1并返回步骤5,通过算法随时间的滚动和迭代,最终使系统输出量转移至期望稳态点(s*,v*)的邻域,并优化整个运行过程的经济效益。
优选的,利用所述系统的动态因果关系模型对未来演化行为的预测,构造计算机可实时求解的优化问题,通过计算机辅助技术实现系统关于经济目标的带约束实时优化。
优选的,若由于所述系统的所述软约束和所述硬约束导致在线实时优化不可行情况,则将所述系统的所述软约束和所述硬约束按重要程度划分优先级,构造包括等式形式约束、不等式形式约束的优先级放松问题规范化形式,通过快速求解和迭代QP问题,实现对所述软约束和所述硬约束的放松,进而实现系统具有可行性保证的带约束在线实时优化。
本发明的有益效果:
本发明适用于具有可量化经济效益优化目标,带有复杂约束的广义系统,创新性地将滚动时域优化控制思想拓展至含有这类系统的性能优化算法构建中,以实现对系统经济效益的优化。
本发明能够利用系统的动态因果关系模型对未来演化行为的预测,构造计算机可实时求解的优化问题,通过计算机辅助技术实现系统关于经济目标的带约束实时优化。
本发明考虑系统复杂约束下可能出现在线实时优化不可行情况,将系统约束按重要程度划分优先级,构造等式形式约束、不等式形式约束的优先级放松问题规范化形式。通过快速求解和迭代QP问题,实现对约束集的放松。
本发明通过对实时经济优化问题的在线求解,优化系统未来一段时域内的动态性能,通过算法随时间窗口的滚动优化和迭代,最终运行在期望的最优设定点邻域内。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1示出本发明一实施例的执行流程图。
具体实施方式
实施例
如图1至图所示,基于模型多优先级约束放松的混合优化算法;包括如下步骤:
步骤1、动态因果关系数学描述;
在数据集中选取与系统的效益和物理约束条件相关的nv个输入变量组成输入向量vt,ns个输出变量组成输出向量st,及nz个中间变量组成状态向量zt;
利用机器学习方法、机理建模或者参数辨识方法获得所述系统的状态方程模型zt+1=Azt+Bvt,st=Czt;
其中,为非负整数集合;
为n维实数列向量空间;
为n行m列实数矩阵空间;
In为n行n列单位矩阵,满足
0n为n行n列零矩阵,满足
t为采样时刻,满足
vt为t时刻可操纵的nv维输入变量取值,满足
st为t时刻决定效益的ns维输出变量取值,满足
zt为t时刻nz维状态变量取值,满足
A为状态转移矩阵,满足
B为输入矩阵,满足
C为输出矩阵,满足
根据所述状态方程模型,引入与输出向量具有相同维数的增广变量dt,得到增广线性模型如下:
其中,dt为t时刻nz维增广变量取值,满足
Bd为增广输入矩阵,满足
Cd为增广输出矩阵,满足
且所述增广线性模型的可观测条件为矩阵满秩;
步骤2、系统效益数学描述;
根据经济指标le(st,vt),设定最优或次优的期望稳态点(s*,v*),使得指标le(s*,v*)的取值尽可能大;
当输入变量设定值恒为v*时,输出变量维持在最优点s*以保证在某段时间内累积效益最优,即性能指标累积值的取值尽可能大;
步骤3、所述系统的硬约束;
所述硬约束具体如下:
Lv≤vt≤Hv,
Ldv≤Δvt≤Hdv, (2)
其中,Δvt:=vt-vt-1,表示输入向量在相邻采样间隔内的增量;
是输入变量vt的约束限制;
是输入向量增量的约束限制;
是输出向量的约束限制;
对于不存在硬约束的变量,向量Hv,Lv中对应行设定为足够大(或小)的常数;
步骤4、所述系统的软约束;
所述软约束包括两类;
第一类所述软约束为关于期望输出稳态点s*的等式约束形式,第二类所述软约束为关于受限制状态变量的不等式约束形式;
第一类所述软约束对应步骤2中所设定的期望稳态点(s*,v*),按照输出向量st中ns个变量的重要程度,设定第1优先级至第peq优先级;
其中peq=ns,优先级序号越小,重要程度越高,且步骤3中硬约束的优先级为0,具体如下:
Rpst+N=Rp(s*+δp,t), (3)
其中,p∈[1,peq]且p为整数是优先级索引;
Rp=[0 ... 0 1 0 ... 0]是ns维行向量,仅在第p优先级约束相关列为1,其余列为0;
Rpst+N表示输出向量st+N中应满足第p优先级约束的变量;
δp,t是ns维松弛向量,该变量是算法中的待优化变量;
t+N中N为算法的预测时域;表示在t时刻的算法执行中,该约束仅对所预测的未来第t+N时刻输出向量起作用,通过算法随时间的滚动和迭代,最终使系统输出转移至期望的稳态点(s*,v*)邻域;
第二类所述软约束为对应状态向量zt中共有pin个变量受所述限制,按重要程度设定为第peq+1至第peq+pin优先级;其中0≤pin≤nz,优先级序号越小,重要程度越高,具体如下:
Spzt≤Ep(h+εp,t), (4)
其中,p∈[peq+1,peq+pin]是优先级索引;
Sp=[0 ... 0 1 0 ... 0]是nz维行向量,仅在第p优先级约束相关列为1,其余列为0;
Spzt表示状态量zt中应满足第p优先级约束的变量;
是pin维向量,该向量中的元素hp表示第p优先级约束上界;
εp,t是pin维松弛向量,该变量是算法中的待优化变量;
Ep=[0 ... 0 1 0 ... 0]是pin维行向量,仅在第p优先级约束相关列为1;
步骤5、混合优化算法的状态观测阶段;
在线执行时刻t,根据上一时刻输入向量设定值,即优化解,vt-1和当前时刻输出变量的测量值st,得到状态组合[zt vt]T的观测值,以修正线性增广模型的稳态输入输出关系使其与非线性对象趋于一致;
其中,龙伯格观测器观测形式如式(5),或者采用卡尔曼滤波器方法;
其中,是t-1时刻根据,观测的状态组合[zt-1 dt-1]T和优化的输入变量vt-1,基于所述增广线性模型(1)得到的输出变量的预测值;
st为输出变量的实测值;
K1和K2为观测器增益;
步骤6、混合优化算法的约束放松阶段;
根据步骤5中状态观测阶段得到的状态组合[zt vt]T,在约束放松阶段逐级放松软约束;
按步骤4中定义的优先级顺序,首先放松等式形式的软约束,其次放松不等式形式的软约束,令矩阵变量函数其中j∈[1,N]且/>则ψ(j)为nz行nv列矩阵,ψ(N)=[AN-1B AN-2 ... B]。将优先级索引p依此设定为1至peq,利用MATLAB中QUADPROG工具迭代求解线性二次约束优化问题(6);
其中,待优化变量为未来[t,t+N]时刻输入向量vt,...,vt+N,以及第p优先级等式形式软约束的松弛变量δp,t,其初始值设定为前次,即第p-1优先级优化问题(6)的最优解
s.t.
其中,为尽可能减小第p优先级约束的违反程度,优化目标函数(6a)是松弛向量中对应变量的方差;
约束(6b)由第0优先级硬约束整理可得,作用在未来[t,t+N]时刻输入向量及其所决定的输入向量增量上;
约束(6c)包含三部分具体如下:
在Cψ(N)[vtL vt+N-1]T=s*+ηt+δp,t中,给定t时刻观测状态[zt vt]T的矩阵,该式由模型(1)和等式形式软约束(4)整理可得;
(A-I)ψ(N)[vtL vt+N-1]T+Bvt+N=-Bddt等价于zt+N=Azt+N+Bvt+N+Bddt,该约束限制了未来第t+N时刻系统状态位于可达稳态点;
在中,/>是ns行ns列常数矩阵;
求解优化问题(6),得到最优解令p=p+1,重复求解问题(6),直至优先级为p=peq的等式形式软约束放松完毕,得到经过等式约束放松后的松弛变量/>以及接近期望设定点(s*,v*)且满足模型(1)的实际可达稳态点:
其次,考虑p∈[peq+1,peq+pin],逐级放松不等式形式的软约束。将优先级索引p依此设定为peq+1至peq+pin,利用MATLAB中QUADPROG工具迭代求解线性二次约束优化问题(7);
其中,待优化变量为未来[t,t+N]时刻输入向量vt,...,vt+N,和第p优先级不等式形式软约束的松弛变量εp,t,其初始可行解设定为前次,即第p-1优先级优化问题(7)的最优解
s.t.
(7d)
其中,是nz行nz列常数矩阵;
求解优化问题(7),得到最优解令p=p+1,重复求解问题(6),直至优先级为p=peq+pin的不等式形式软约束放松完毕,得到经过不等式约束放松后的松弛变量/>以及t时刻混合优化算法实时优化阶段的软约束上界:
步骤7、混合优化算法的实时优化阶段;
根据步骤5和步骤6确定的实时优化阶段的初始条件,终端条件和约束条件,利用MATLAB中fmincon工具求解下述实时优化问题:
s.t.r=0,1,...,N,
其中,优化目标函数(8a)为未来N个时刻经济指标在预测输入或输出轨迹上的累积量,通过该设置优化经济效益;
待优化变量为未来N个时刻的输入向量vt,...,vt+N;
约束(8b)为模型约束;
约束(8c)为过程硬约束或软约束,由于经过约束放松处理,该约束集内优化问题(8)可行;
约束(8d)为关于可达稳态点即位于期望稳态点(s*,v*)的邻域的终端等式约束,该约束仅对所预测的未来第t+N时刻状态向量起作用;
通过求解问题(8),得到最优输入序列将第一个控制量/>施加到所述系统上;在下一个采样时刻,令t=t+1并返回步骤5,通过算法随时间的滚动和迭代,最终使系统输出量转移至期望稳态点(s*,v*)的邻域,并优化整个运行过程的经济效益。
在步骤1中,所述系统的所述状态方程模型用于描述输入变量及输出变量当前值对未来输出变量的影响;由于上述模型采用矩阵A,B和C描述变量间的固有关系,其实质为线性预测模型,为处理实际系统中广泛存在的复杂非线性关系引起的稳态静差,引入与输出向量具有相同维数的增广变量dt得到增广线性模型。
由于Bd和Cd为合适的增广矩阵,其选取需模型(1)可观测条件,即矩阵满秩。
在步骤2中,系统的综合效益与执行输入变量时引起的能耗或物耗损耗和获得新的输出变量后产生的价值相关,因此采用经济指标le(st,vt)描述t时刻的实际综合效益;同样的,映射关系可通过机器学习方法、机理建模或者参数辨识方法获得。
然而,由于对象真实非线性关系难以获得,通常难以保证所设定的最优或次优的期望稳态点(s*,v*)为对象稳态点,以上稳态条件将在后续步骤中放松,使得系统趋近于次优的实际可达稳态点。
在步骤3中,对于系统中受实际执行规则或者物理条件限制的输入变量,在算法执行中利用硬约束使其严格满足要求。
为保证算法优化问题可行,对输入向量vt所包含的所有变量均设定了上下界约束Hv,Lv;此时对于存在硬约束的变量,向量Hv,Lv中对应行即为约束取值;对于不存在硬约束的变量,向量Hv,Lv中对应行设定为足够大(或小)的常数。对于输入增量向量做相同处理。
在步骤4中,对于系统中受期望要求或者质量基准等限制的状态变量和输出变量,在算法执行过程中利用带优先级的软约束,使得系统状态首先满足重要约束,其次满足,或以较小代价违反次要约束,以此类推。
在完成步骤4之后,形成硬约束和软约束的优先级具体如下表:
在某些实施例中,利用所述系统的动态因果关系模型对未来演化行为的预测,构造计算机可实时求解的优化问题,通过计算机辅助技术实现系统关于经济目标的带约束实时优化。
在某些实施例中,若由于所述系统的所述软约束和所述硬约束导致在线实时优化不可行情况,则将所述系统的所述软约束和所述硬约束按重要程度划分优先级,构造包括等式形式约束、不等式形式约束的优先级放松问题规范化形式,通过快速求解和迭代QP问题,实现对所述软约束和所述硬约束的放松,进而实现系统具有可行性保证的带约束在线实时优化。
在实际应用中,本发明的实施分为离线建模阶段和在线优化阶段。
离线建模阶段,根据系统运行历史数据集,执行步骤1至步骤4,得到混合优化算法的优化指标(经济指标)、预测模型、硬约束和软约束。
在混合优化算法在线执行阶段,时刻t,依次执行步骤5和步骤6,得到优化问题的初始条件、约束集。
执行步骤7,得到最优控制序列并将第一个输入向量施加到系统上。
在时刻t=t+1,重复执行步骤5、步骤6和步骤7,经过不断的滚动和迭代,从而实现对系统运行性能的实时优化。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (3)
1.基于多优先级约束放松的混合优化算法;其特征在于,包括如下步骤:
步骤1、动态因果关系数学描述;
在数据集中选取与系统的效益和物理约束条件相关的nv个输入变量组成输入向量vt,ns个输出变量组成输出向量st,及nz个中间变量组成状态向量zt;
利用机器学习方法、机理建模或者参数辨识方法获得所述系统的状态方程模型zt+1=Azt+Bvt,st=Czt;
其中,¢+为非负整数集合;
为n维实数列向量空间;
为n行m列实数矩阵空间;
In为n行n列单位矩阵,满足
0n为n行n列零矩阵,满足
t为采样时刻,满足t∈¢+;
vt为t时刻可操纵的nv维输入变量取值,满足
st为t时刻决定效益的ns维输出变量取值,满足
zt为t时刻nz维状态变量取值,满足
A为状态转移矩阵,满足
B为输入矩阵,满足
C为输出矩阵,满足
根据所述状态方程模型,引入与输出向量具有相同维数的增广变量dt,得到增广线性模型如下:
其中,dt为t时刻nz维增广变量取值,满足
Bd为增广输入矩阵,满足
Cd为增广输出矩阵,满足
且所述增广线性模型的可观测条件为矩阵满秩;
步骤2、系统效益数学描述;
根据经济指标le(st,vt),设定最优或次优的期望稳态点(s*,v*),使得指标le(s*,v*)的取值尽可能大;
当输入变量设定值恒为v*时,输出变量维持在最优点s*以保证在某段时间内累积效益最优,即性能指标累积值的取值尽可能大;
步骤3、所述系统的硬约束;
所述硬约束具体如下:
Lv≤vt≤Hv,
Ldv≤Δvt≤Hdv, (2)
其中,Δvt:=vt-vt-1,表示输入向量在相邻采样间隔内的增量;
是输入变量vt的约束限制;
是输入向量增量的约束限制;
是输出向量的约束限制;
对于不存在硬约束的变量,向量Hv,Lv中对应行设定为足够大(或小)的常数;
步骤4、所述系统的软约束;
所述软约束包括两类;
第一类所述软约束为关于期望输出稳态点s*的等式约束形式,第二类所述软约束为关于受限制状态变量的不等式约束形式;
第一类所述软约束对应步骤2中所设定的期望稳态点(s*,v*),按照输出向量st中ns个变量的重要程度,设定第1优先级至第peq优先级;
其中peq=ns,优先级序号越小,重要程度越高,且步骤3中硬约束的优先级为0,具体如下:
Rpst+N=Rp(s*+δp,t), (3)
其中,p∈[1,peq]且p为整数是优先级索引;
Rp=[0 ... 0 1 0 ... 0]是ns维行向量,仅在第p优先级约束相关列为1,其余列为0;
Rpst+N表示输出向量st+N中应满足第p优先级约束的变量;
δp,t是ns维松弛向量,该变量是算法中的待优化变量;
t+N中N为算法的预测时域;表示在t时刻的算法执行中,该约束仅对所预测的未来第t+N时刻输出向量起作用,通过算法随时间的滚动和迭代,最终使系统输出转移至期望的稳态点(s*,v*)邻域;
第二类所述软约束为对应状态向量zt中共有pin个变量受所述限制,按重要程度设定为第peq+1至第peq+pin优先级;其中0≤pin≤nz,优先级序号越小,重要程度越高,具体如下:
Spzt≤Ep(h+εp,t), (4)
其中,p∈[peq+1,peq+pin]是优先级索引;
Sp=[0 ... 0 1 0 ... 0]是nz维行向量,仅在第p优先级约束相关列为1,其余列为0;
Spzt表示状态量zt中应满足第p优先级约束的变量;
是pin维向量,该向量中的元素hp表示第p优先级约束上界;
εp,t是pin维松弛向量,该变量是算法中的待优化变量;
Ep=[0 ... 0 1 0 ... 0]是pin维行向量,仅在第p优先级约束相关列为1;
步骤5、混合优化算法的状态观测阶段;
在线执行时刻t,根据上一时刻输入向量设定值,即优化解,vt-1和当前时刻输出变量的测量值st,得到状态组合[zt vt]T的观测值,以修正线性增广模型的稳态输入输出关系使其与非线性对象趋于一致;
其中,龙伯格观测器观测形式如式(5),或者采用卡尔曼滤波器方法;
其中,是t-1时刻根据,观测的状态组合[zt-1 dt-1]T和优化的输入变量vt-1,基于所述增广线性模型(1)得到的输出变量的预测值;
st为输出变量的实测值;
K1和K2为观测器增益;
步骤6、混合优化算法的约束放松阶段;
根据步骤5中状态观测阶段得到的状态组合[zt vt]T,在约束放松阶段逐级放松软约束;
按步骤4中定义的优先级顺序,首先放松等式形式的软约束,其次放松不等式形式的软约束,令矩阵变量函数其中j∈[1,N]且j∈¢+,则ψ(j)为nz行nv列矩阵,ψ(N)=[AN-1B AN-2 ... B];将优先级索引p依此设定为1至peq,利用MATLAB中QUADPROG工具迭代求解线性二次约束优化问题(6);
其中,待优化变量为未来[t,t+N]时刻输入向量vt,...,vt+N,以及第p优先级等式形式软约束的松弛变量δp,t,其初始值设定为前次,即第p-1优先级优化问题(6)的最优解
s.t.
其中,为尽可能减小第p优先级约束的违反程度,优化目标函数(6a)是松弛向量中对应变量的方差;
约束(6b)由第0优先级硬约束整理可得,作用在未来[t,t+N]时刻输入向量及其所决定的输入向量增量上;
约束(6c)包含三部分具体如下:
在Cψ(N)[vtL vt+N-1]T=s*+ηt+δp,t中,给定t时刻观测状态[zt vt]T的矩阵,该式由模型(1)和等式形式软约束(4)整理可得;
(A-I)ψ(N)[vtL vt+N-1]T+Bvt+N=-Bddt等价于zt+N=Azt+N+Bvt+N+Bddt,该约束限制了未来第t+N时刻系统状态位于可达稳态点;
在中,/>是ns行ns列常数矩阵;
求解优化问题(6),得到最优解令p=p+1,重复求解问题(6),直至优先级为p=peq的等式形式软约束放松完毕,得到经过等式约束放松后的松弛变量/>以及接近期望设定点(s*,v*)且满足模型(1)的实际可达稳态点:
其次,考虑p∈[peq+1,peq+pin],逐级放松不等式形式的软约束;将优先级索引p依此设定为peq+1至peq+pin,利用MATLAB中QUADPROG工具迭代求解线性二次约束优化问题(7);
其中,待优化变量为未来[t,t+N]时刻输入向量vt,...,vt+N,和第p优先级不等式形式软约束的松弛变量εp,t,其初始可行解设定为前次,即第p-1优先级优化问题(7)的最优解
s.t.
其中,是nz行nz列常数矩阵;
求解优化问题(7),得到最优解令p=p+1,重复求解问题(6),直至优先级为p=peq+pin的不等式形式软约束放松完毕,得到经过不等式约束放松后的松弛变量以及t时刻混合优化算法实时优化阶段的软约束上界:
步骤7、混合优化算法的实时优化阶段;
根据步骤5和步骤6确定的实时优化阶段的初始条件,终端条件和约束条件,利用MATLAB中fmincon工具求解下述实时优化问题:
s.t.r=0,1,...,N,
其中,优化目标函数(8a)为未来N个时刻经济指标在预测输入或输出轨迹上的累积量,通过该设置优化经济效益;
待优化变量为未来N个时刻的输入向量vt,...,vt+N;
约束(8b)为模型约束;
约束(8c)为过程硬约束或软约束,由于经过约束放松处理,该约束集内优化问题(8)可行;
约束(8d)为关于可达稳态点即位于期望稳态点(s*,v*)的邻域的终端等式约束,该约束仅对所预测的未来第t+N时刻状态向量起作用;
通过求解问题(8),得到最优输入序列将第一个控制量/>施加到所述系统上;在下一个采样时刻,令t=t+1并返回步骤5,通过算法随时间的滚动和迭代,最终使系统输出量转移至期望稳态点(s*,v*)的邻域,并优化整个运行过程的经济效益。
2.根据权利要求1所述的基于多优先级约束放松的混合优化算法,其特征在于,利用所述系统的动态因果关系模型对未来演化行为的预测,构造计算机可实时求解的优化问题,通过计算机辅助技术实现系统关于经济目标的带约束实时优化。
3.根据权利要求1所述的基于多优先级约束放松的混合优化算法,其特征在于,若由于所述系统的所述软约束和所述硬约束导致在线实时优化不可行情况,则将所述系统的所述软约束和所述硬约束按重要程度划分优先级,构造包括等式形式约束、不等式形式约束的优先级放松问题规范化形式,通过快速求解和迭代QP问题,实现对所述软约束和所述硬约束的放松,进而实现系统具有可行性保证的带约束在线实时优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111666402.1A CN114296354B (zh) | 2021-12-31 | 2021-12-31 | 基于多优先级约束放松的混合优化算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111666402.1A CN114296354B (zh) | 2021-12-31 | 2021-12-31 | 基于多优先级约束放松的混合优化算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114296354A CN114296354A (zh) | 2022-04-08 |
CN114296354B true CN114296354B (zh) | 2024-03-08 |
Family
ID=80974500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111666402.1A Active CN114296354B (zh) | 2021-12-31 | 2021-12-31 | 基于多优先级约束放松的混合优化算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114296354B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116560220B (zh) * | 2022-09-27 | 2024-03-01 | 东北大学 | 一种可变优先级的人工胰腺自适应模型预测控制系统 |
CN116307566B (zh) * | 2023-03-12 | 2024-05-10 | 武汉大学 | 大型房屋建筑工程施工组织方案动态设计系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107180279A (zh) * | 2017-06-14 | 2017-09-19 | 重庆科技学院 | 基于qpso‑dmpc的反应再生系统优化控制方法 |
CN108021024A (zh) * | 2016-10-28 | 2018-05-11 | 中国科学院沈阳自动化研究所 | 基于双层结构预测控制的工业循环水节能优化控制方法 |
CN108681521A (zh) * | 2018-04-18 | 2018-10-19 | 大连理工大学 | 一种实时求解模型预测控制律的快速梯度算法 |
CN113031451A (zh) * | 2021-05-31 | 2021-06-25 | 浙江中控技术股份有限公司 | 一种适用于流程工业预测控制的稳态优化方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9753892B2 (en) * | 2014-02-20 | 2017-09-05 | Mitsubishi Electric Research Laboratories, Inc. | Method for solving quadratic programs for convex sets with linear equalities by an alternating direction method of multipliers with optimized step sizes |
US11163273B2 (en) * | 2020-03-02 | 2021-11-02 | Mitsubishi Electric Research Laboratories, Inc. | Active set based interior point optimization method for predictive control |
-
2021
- 2021-12-31 CN CN202111666402.1A patent/CN114296354B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021024A (zh) * | 2016-10-28 | 2018-05-11 | 中国科学院沈阳自动化研究所 | 基于双层结构预测控制的工业循环水节能优化控制方法 |
CN107180279A (zh) * | 2017-06-14 | 2017-09-19 | 重庆科技学院 | 基于qpso‑dmpc的反应再生系统优化控制方法 |
CN108681521A (zh) * | 2018-04-18 | 2018-10-19 | 大连理工大学 | 一种实时求解模型预测控制律的快速梯度算法 |
CN113031451A (zh) * | 2021-05-31 | 2021-06-25 | 浙江中控技术股份有限公司 | 一种适用于流程工业预测控制的稳态优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114296354A (zh) | 2022-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nian et al. | A review on reinforcement learning: Introduction and applications in industrial process control | |
CN114296354B (zh) | 基于多优先级约束放松的混合优化算法 | |
Ma et al. | Partially‐coupled gradient‐based iterative algorithms for multivariable output‐error‐like systems with autoregressive moving average noises | |
Yang et al. | A novel self-constructing radial basis function neural-fuzzy system | |
Han et al. | An efficient optimization method for improving generalization performance of fuzzy neural networks | |
Yang et al. | Constrained robust model predictive control embedded with a new data‐driven technique | |
Zhu et al. | Stochastic energy management of active distribution network based on improved approximate dynamic programming | |
Schiassi et al. | Bellman neural networks for the class of optimal control problems with integral quadratic cost | |
Pelusi | Improving settling and rise times of controllers via intelligent algorithms | |
Liu et al. | Incremental Bayesian broad learning system and its industrial application | |
Ren et al. | An efficient model-free approach for controlling large-scale canals via hierarchical reinforcement learning | |
Ali et al. | Optimal power flow using archimedes optimizer algorithm | |
Aslipour et al. | Identification of wind turbine using fractional order dynamic neural network and optimization algorithm | |
Ding et al. | A unified adaptive control approach of nonlinear continuous non‐parameterized systems with asymmetric control gains for trajectory tracking in different domains | |
Abbaszadeh et al. | Constrained nonlinear model predictive control of an MMA polymerization process via evolutionary optimization | |
Yuxia et al. | Prediction of the chaotic time series based on chaotic simulated annealing and support vector machine | |
CN104484727A (zh) | 基于关联模糊神经网络和漩涡搜索的短期负荷预测方法 | |
Singhal et al. | An efficient approach for availability analysis through fuzzy differential equations and particle swarm optimization | |
Buşoniu et al. | Using prior knowledge to accelerate online least-squares policy iteration | |
Lu et al. | Self-tuning PID control scheme with swarm intelligence based on support vector machine | |
Li et al. | Neuro-fuzzy-based dynamic quadratic criterion-iterative learning control for batch process | |
Mercioni et al. | Weather Forecasting Modeling Using Soft-Clipping Swish Activation Function | |
Li et al. | Remaining useful life prediction of tool with BiGRU-Attention and improved particle filter | |
Orlov | Non-stationary time series forecasting on basis of analysis and prediction of forecasting models efficiency | |
Chagra et al. | Nonlinear Model Predictive Control Based on RBF Neural Network Trained by Stochastic Methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |