CN111552179B - 一种基于神经动态规划的温度分布过程优化控制方法 - Google Patents

一种基于神经动态规划的温度分布过程优化控制方法 Download PDF

Info

Publication number
CN111552179B
CN111552179B CN202010337261.8A CN202010337261A CN111552179B CN 111552179 B CN111552179 B CN 111552179B CN 202010337261 A CN202010337261 A CN 202010337261A CN 111552179 B CN111552179 B CN 111552179B
Authority
CN
China
Prior art keywords
temperature distribution
distribution process
optimization
dynamic programming
neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202010337261.8A
Other languages
English (en)
Other versions
CN111552179A (zh
Inventor
罗彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202010337261.8A priority Critical patent/CN111552179B/zh
Publication of CN111552179A publication Critical patent/CN111552179A/zh
Application granted granted Critical
Publication of CN111552179B publication Critical patent/CN111552179B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Abstract

本发明提供了一种基于神经动态规划的温度分布过程优化控制方法,属于智能控制以及工业过程控制领域。其包括:步骤S1:对于传感器获取的温度分布过程的高维温度分布数据进行降维,获得温度分布过程的低阶模型;步骤S2:根据所得到的低阶模型,设计基于神经网络的执行‑评价结构,分别使用执行网络与评价网络实现控制器与优化性能指标;步骤S3:基于神经动态规划的优化控制器实现,利用神经动态规划实现优化控制器的在线运行。其中,基于神经动态规划的优化控制器通过在线学习以获得优化性能,实现对温度分布过程的优化控制。本发明所设计优化控制器实现简单,对温度分布过程控制效果好。

Description

一种基于神经动态规划的温度分布过程优化控制方法
技术领域
本发明总地涉及智能控制技术领域,且更具体地涉及一种基于神经动态规划的温度分布过程优化控制方法。
背景技术
温度分布过程普遍存在于航空、航天、化工、智能家居等领域,由于其状态信息具有时空分布特性,系统动态一般由偏微分方程表述,这类系统通常被称分布参数系统。为实际温度分布过程设计控制系统时,存在着许多困难:(1)由于温度分布过程具有无穷维自由度特征,所以现有针对集中参数系统的控制方法无法直接用于温度分布过程;(2)实际工业问题需要考虑一系列的性能,如最优性能、干扰衰减性能等;(3)迄今为止,不管是针对集中参数系统,还是分布参数系统,大多数控制理论与方法依赖于动态系统精确的数学模型,它们一般基于这样的思路:首先根据系统的物理化学机理建立精确数学模型,然后基于模型设计控制与优化方法。然而,对于大多数实际温度分布过程,由于系统动态十分复杂且受到各类干扰与不确定性因素的影响,导致精确建立过程的数学模型代价非常大,或建立的模型非常复杂而无法用于控制器设计。近年来,自适应动态规划,也称为强化学习,被用于解决优化控制问题,可以系统模型未知的情况下,利用实际系统的数据,学习优化控制器。然而,现有的自适应动态控制方法主要针对集中参数系统,难以适应于温度分布过程的优化控制。为此,本发明提供了一种基于神经动态规划的温度分布过程优化控制方法,以至少部分的解决上述问题。
发明内容
在发明内容部分中引入了一系列简化形式的概念,这将在具体实施例部分中进一步详细说明。本发明的发明内容部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。
为至少部分地解决上述技术问题,本发明提供了一种基于神经动态规划的温度分布过程优化控制方法,其包括:
步骤S1:对于传感器获取的温度分布过程的高维温度分布数据进行降维,获得温度分布过程的低阶模型;
步骤S2:根据步骤S1所得到的低阶模型,设计基于神经网络的执行-评价结构,分别使用执行网络与评价网络实现控制器与优化性能指标;
步骤S3:基于神经动态规划的优化控制器实现,利用神经动态规划实现优化控制器的在线运行。
进一步地,所述步骤S1包括:
步骤S11:计算高维温度分布数据的协方差矩阵,并计算协方差矩阵的特征值与特征向量,将特征值及其对应的特征向量按递减进行排序,选取前有限个特征向量作为空间经验基向量;
步骤S12:利用空间经验基向量,将温度分布过程分解成一个低阶慢子系统与一个快系统的组合,基于奇异摄动技术得到低阶模型。
本发明使用实际温度分布过程的实际测量数据进行模型降阶,与现有普遍使用的基于模型的降阶方法相比,具有几个明显的优势:(1)本发明利用实际过程数据,避免了复杂的系统建模,比现有方法操作更加简单可行;(2)由于本发明降阶方法不需要过程的数学模型,所以不存在模型不确定性,使用基于数据的方法提高降阶的精度。
进一步地,所述步骤S2包括:
步骤S21:将低阶模型的优化控制问题转化为求解哈密顿-雅可比-贝尔曼方程;
步骤S22:使用神经网络逼近值函数与控制器,设计执行-评价网络结构。
现有温度分布过程的控制方法往往只能实现过程的稳定性,与现有的方法相比,本发明基于低阶模型设计优化控制器,转化为求解哈密顿-雅可比-贝尔曼方程,不仅可以实现温度分布过程的稳定性,还可以实现期望的优化性能,如最小成本代价。另一方面,本发明所设计的执行-评价网络结构,进一步提高了控制器的控制性能。
进一步地,所述步骤S3包括:
步骤S31:使用低阶模型状态x(t)和x(t+Δt),使用如下方法更新学习神经网络的权值:
Figure GDA0003172712650000031
其中,w(t)为神经网络的权值,Φ(x(t))为神经网络的激活函数,a>0为权值的学习速率,C(x(τ),u(x(τ)))表示即时控制成本,ΔΦ(x(t))=Φ(x(t+Δt))-Φ(x(t));
步骤S32:使用如下方法计算在线控制信号:
Figure GDA0003172712650000041
其中,符号
Figure GDA0003172712650000042
表示取导数,R为正定矩阵,B为控制矩阵。
总体来说,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)与现有控制方法相比,本发明的降阶方法与控制器的实现是数据驱动的,不依赖于温度分布过程的数学模型,因而本发明的技术更加简单、易于实现;避免了系统建模所带来的不确实性,因而本发明的技术控制精度更高、控制性能更好。
(2)与现有控制方法相比,本发明所设计的优化控制器不仅可以实现温度分布过程和稳定性,还可以实现期望的优化性能,从而可以降低控制成本,进一步改进控制性能。
附图说明
为了使本发明的优点更容易理解,将通过参考在附图中示出的具体实施方式更详细地描述上文简要描述的本发明。可以理解这些附图只描绘了本发明的典型实施方式,因此不应认为是对其保护范围的限制,通过附图以附加的特性和细节描述和解释本发明。
图1为本发明所述的一种基于神经动态规划的温度分布过程优化控制方法的结构示意图。
图2是本发明实施例提供的一种仿真图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本发明实施方式可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明实施方式发生混淆,对于本领域公知的一些技术特征未进行描述。
为了彻底了解本发明实施方式,将在下列的描述中提出详细的结构。显然,本发明实施方式的施行并不限定于本领域的技术人员所熟习的特殊细节。本发明的较佳实施方式详细描述如下,然而除了这些详细描述外,本发明还可以具有其他实施方式。
参阅图1所示,本发明提供了一种基于神经动态规划的温度分布过程优化控制方法,其包括:
步骤S1:对于传感器获取的温度分布过程的高维温度分布数据进行降维,获得温度分布过程的低阶模型;
步骤S2:根据步骤S1所得到的低阶模型,设计基于神经网络的执行-评价结构,分别使用执行网络与评价网络实现控制器与优化性能指标;
步骤S3:基于神经动态规划的优化控制器实现,利用神经动态规划实现优化控制器的在线运行。
具体而言,步骤S1包括:步骤S11:计算高维温度分布数据的协方差矩阵,并计算协方差矩阵的特征值与特征向量,将特征值及其对应的特征向量按递减进行排序,选取前有限个特征向量作为空间经验基向量;步骤S12:利用空间经验基向量,将温度分布过程分解成一个低阶慢子系统与一个快系统的组合,基于奇异摄动技术得到低阶模型。
具体而言,使用T(l)表示温度状态分布,其中l为空间位置信息,通过将温度分布过程进行空间离散化,取m个空间位置,这样某一时刻过程的温度可以表示成一个m维列向量yi;通过测量获得n个时刻的温度分布,这样可得到一个m×n维的矩阵Y=[y1,y2,…,yn];利用矩阵Y计算协方差矩阵S,通过软件Matlab求解特征方程Sα=λα,计算得到特征值α及特征向量λ,将特征值及其对应的特征向量按递减进行排序,即:λ1≥λ2≥λ3≥…;选取前k个特征向量作为空间经验基向量,参数k的确定满足如下标准:
Figure GDA0003172712650000061
对于温度分布过程,通常有k远小于m。利用空间经验基向量α12,…,αk,低阶系统的状态x=[x1,x2,…,xk]T可以使用如下方法计算:
xi=yTαi,i=1,2,…,k
由于k远小于m,从而达到温度分布过程系统降阶的目的。
具体而言,步骤S2包括:步骤S21:将低阶模型的优化控制问题转化为求解哈密顿-雅可比-贝尔曼方程;步骤S22:使用神经网络逼近值函数与控制器,设计执行-评价网络结构。
具体而言,步骤S3包括:
步骤S31:使用低阶模型状态x(t)和x(t+Δt),使用如下方法更新学习神经网络的权值:
Figure GDA0003172712650000062
其中,w(t)为神经网络的权值,Φ(x(t))为神经网络的激活函数,a>0为权值的学习速率,C(x(τ),u(x(τ)))表示即时控制成本,ΔΦ(x(t))=Φ(x(t+Δt))-Φ(x(t));
步骤S32:使用如下方法计算在线控制信号:
Figure GDA0003172712650000071
其中,符号
Figure GDA0003172712650000075
表示取导数,R为正定矩阵,B为控制矩阵。
具体而言,通过将低阶系统的优化控制任务转化为求解如下形式的哈密顿-雅可比-贝尔曼方程:
Figure GDA0003172712650000072
其中,V*(x)为待求解的最优值函数,Q(x)为正定函数。利用实际系统的状态信息,使用策略迭代方法求解哈密顿-雅可比-贝尔曼方程得到最优值函数V*(x),具体而言,策略迭代包括:1)基于过程数据求解如下方程:
V(i)(x(t))=∫t t+ΔtC(x(τ),u(x(τ)))dτ+V(i)(x(t+Δt))
计算V(i)(x);2)使用如下方法:
Figure GDA0003172712650000074
计算控制策略;3)在线不断迭代上述前两步使得策略迭代算法收敛。为实现上述策略迭代算法,设计执行-评价结构,采用评价神经网络逼近值函数,使用公式(1)更新评价神经网络的权值,并使用公式(2)在线计算实时控制信号,作用于温度分布过程。图2展示了本发明温度分布过程的仿真效果图,可以看出,温度的收敛速度快,控制效果好。
除非另有定义,本文中所使用的技术和科学术语与本发明的技术领域的技术人员通常理解的含义相同。本文中使用的术语只是为了描述具体的实施目的,不是旨在限制本发明。本文中在一个实施方式中描述的特征可以单独地或与其它特征结合地应用于另一个实施方式,除非该特征在该另一个实施方式中不适用或是另有说明。
本发明已经通过上述实施方式进行了说明,但应当理解的是,上述实施方式只是用于举例和说明的目的,而非意在将本发明限制于所描述的实施方式范围内。本领域技术人员可以理解的是,根据本发明的教导还可以做出更多种的变型和修改,这些变型和修改均落在本发明所要求保护的范围以内。

Claims (1)

1.一种基于神经动态规划的温度分布过程优化控制方法,其特征在于,包括:
步骤S1:对于传感器获取的温度分布过程的高维温度分布数据进行降维,获得温度分布过程的低阶模型;
步骤S2:根据步骤S1所得到的低阶模型,设计基于神经网络的执行-评价结构,分别使用执行网络与评价网络实现控制器与优化性能指标;
步骤S3:基于神经动态规划的优化控制器实现,利用神经动态规划实现优化控制器的在线运行;
所述步骤S1包括:
步骤S11:计算高维温度分布数据的协方差矩阵,并计算协方差矩阵的特征值与特征向量,将特征值及其对应的特征向量按递减进行排序,选取前有限个特征向量作为空间经验基向量;
步骤S12:利用空间经验基向量,将温度分布过程分解成一个低阶慢子系统与一个快系统的组合,基于奇异摄动技术得到低阶模型;
所述步骤S2包括:
步骤S21:将低阶模型的优化控制问题转化为求解哈密顿-雅可比-贝尔曼方程;
步骤S22:使用神经网络逼近值函数与控制器,设计执行-评价网络结构;
所述步骤S3包括:
步骤S31:使用低阶模型状态x(t)和x(t+Δt),使用如下方法更新学习神经网络的权值:
Figure FDA0003115857380000021
其中,w(t)为神经网络的权值,Φ(x(t))为神经网络的激活函数,a>0为权值的学习速率,C(x(τ),u(x(τ)))表示即时控制成本,ΔΦ(x(t))=Φ(x(t+Δt))-Φ(x(t));
步骤S32:使用如下方法计算在线控制信号:
Figure FDA0003115857380000022
其中,符号
Figure FDA0003115857380000023
表示取导数,R为正定矩阵,B为控制矩阵。
CN202010337261.8A 2020-04-26 2020-04-26 一种基于神经动态规划的温度分布过程优化控制方法 Expired - Fee Related CN111552179B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010337261.8A CN111552179B (zh) 2020-04-26 2020-04-26 一种基于神经动态规划的温度分布过程优化控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010337261.8A CN111552179B (zh) 2020-04-26 2020-04-26 一种基于神经动态规划的温度分布过程优化控制方法

Publications (2)

Publication Number Publication Date
CN111552179A CN111552179A (zh) 2020-08-18
CN111552179B true CN111552179B (zh) 2021-09-14

Family

ID=71998530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010337261.8A Expired - Fee Related CN111552179B (zh) 2020-04-26 2020-04-26 一种基于神经动态规划的温度分布过程优化控制方法

Country Status (1)

Country Link
CN (1) CN111552179B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506057B (zh) * 2020-12-02 2021-09-17 郑州轻工业大学 不确定奇异摄动系统在线多时间尺度快速自适应控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344518A (zh) * 2018-10-14 2019-02-15 毛述春 一种基站热管理系统的故障诊断方法
CN109784472A (zh) * 2018-12-03 2019-05-21 华南理工大学 一种基于神经网络的非线性时变系统求解方法
CN110361972A (zh) * 2019-07-08 2019-10-22 杭州电子科技大学 一种基于水泥生料燃烧的分解炉炉温快速优化控制方法
CN110837223A (zh) * 2018-08-15 2020-02-25 大唐南京发电厂 一种燃气轮机燃烧优化控制方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665651B2 (en) * 2001-07-18 2003-12-16 Colorado State University Research Foundation Control system and technique employing reinforcement learning having stability and learning phases
US7526414B2 (en) * 2003-07-25 2009-04-28 Siemens Corporate Research, Inc. Density morphing and mode propagation for Bayesian filtering
CN109033505A (zh) * 2018-06-06 2018-12-18 东北大学 一种基于深度学习的超快冷温度控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110837223A (zh) * 2018-08-15 2020-02-25 大唐南京发电厂 一种燃气轮机燃烧优化控制方法及系统
CN109344518A (zh) * 2018-10-14 2019-02-15 毛述春 一种基站热管理系统的故障诊断方法
CN109784472A (zh) * 2018-12-03 2019-05-21 华南理工大学 一种基于神经网络的非线性时变系统求解方法
CN110361972A (zh) * 2019-07-08 2019-10-22 杭州电子科技大学 一种基于水泥生料燃烧的分解炉炉温快速优化控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Data-based approximate policy iteration for affine nonlinear continuous-time optimal control design;Biao Luo 等;《Automatica》;20141025;第50卷(第12期);第3282页右栏第4段-第3286页左栏第1段 *

Also Published As

Publication number Publication date
CN111552179A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
CN110929948B (zh) 基于深度强化学习的完全分布式智能电网经济调度方法
CN113341726B (zh) 一种多质点车辆队列行驶系统的迭代学习控制方法
JP3556956B2 (ja) システム識別装置および方法
CN104597842A (zh) 经遗传算法优化的bp神经网络重型机床热误差建模方法
CN114397043B (zh) 多点温度智能检测系统
CN111552179B (zh) 一种基于神经动态规划的温度分布过程优化控制方法
Wang et al. A new data-driven roll force and roll torque model based on FEM and hybrid PSO-ELM for hot strip rolling
CN114296342B (zh) 一种分布式动态事件触发多智能体系统的一致性控制方法
Zeng et al. DDPG-based continuous thickness and tension coupling control for the unsteady cold rolling process
CN108445758B (zh) 一类具有网络随机时变时延的线性参数变化系统的h∞控制方法
CN108448594B (zh) 微电网频率自适应学习控制方法
CN113591020A (zh) 一种基于轴对称盒空间滤波的非线性系统状态估计方法
CN111240201B (zh) 一种扰动抑制控制方法
CN114415503B (zh) 温度大数据物联网检测与智能控制系统
CN116373846A (zh) 一种基于bp神经网络优化的后轮转向车辆稳定性控制方法
CN115774900A (zh) 一种不确定条件下的变构型飞行器指令鲁棒优化设计方法
CN110794676A (zh) 基于Hammerstein-Wiener模型的CSTR过程非线性控制方法
Chen Research of the Electro-hydraulic Servo System Based on RBF Fuzzy Neural Network Controller.
CN114358244B (zh) 基于物联网的压力大数据智能检测系统
Zhang et al. Rolling force prediction in heavy plate rolling based on uniform differential neural network
CN112947329B (zh) 分布参数系统的事件触发控制方法及系统
CN113625557A (zh) 一种在线优化模型的hvac系统模型预测控制方法
Hu et al. Simulation and analysis of LQG controller in antenna control system
Qin Estimation and identification of nonlinear parameter of motion index based on least squares algorithm
Zhao et al. Layout optimization of FBG sensor for aluminum alloy beam based on MOLA multi-objective optimization algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210914