CN112859604A - 一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法 - Google Patents

一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法 Download PDF

Info

Publication number
CN112859604A
CN112859604A CN202110031486.5A CN202110031486A CN112859604A CN 112859604 A CN112859604 A CN 112859604A CN 202110031486 A CN202110031486 A CN 202110031486A CN 112859604 A CN112859604 A CN 112859604A
Authority
CN
China
Prior art keywords
dimensional
injection molding
state space
molding process
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110031486.5A
Other languages
English (en)
Other versions
CN112859604B (zh
Inventor
施惠元
文馨
苏成利
姜雪莹
彭博
杨晨
李平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Shihua University
Original Assignee
Liaoning Shihua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Shihua University filed Critical Liaoning Shihua University
Priority to CN202110031486.5A priority Critical patent/CN112859604B/zh
Publication of CN112859604A publication Critical patent/CN112859604A/zh
Application granted granted Critical
Publication of CN112859604B publication Critical patent/CN112859604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Injection Moulding Of Plastics Or The Like (AREA)

Abstract

一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法,属于工业过程控制技术领域,具体步骤如下:步骤一:建立具有未知动态的二维注塑成型过程的状态空间模型;步骤二:将构建的二维注塑成型过程状态空间模型转化为新的增广状态空间模型;步骤三:设计具有未知动态注塑成型系统的二维增广状态空间模型的控制器;步骤四:设计控制律以及控制器增益K1,K2;步骤五:通过Q学习算法求解控制器增益K1,K2。本发明所设计的方法能有效地避免具有未知动态注塑成型过程建模困难以及具有重复性等复杂特性的问题,通过采用数据驱动的方式,极大地降低了系统的模型依赖性,降低了计算成本。

Description

一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控 制方法
技术领域
本发明属于工业过程控制技术领域,具体涉及一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法。
背景技术
随着市场经济的发展,产品生产越来越趋向于高质量、小批量的形式,因此以满足客户性能需求的小容量、高附加值的间歇生产过程开始成为研究热点,并被广泛应用于医药产品、化工原料以及塑料制品的生产制备中。作为一种典型的间歇生产过程,塑料制品行业的注塑成型过程有着较强的非线性、重复特性和模型复杂性,这就导致了难以对此过程进行精确的数学建模。因而传统的控制方法通常由于过于依赖模型而难以得到满意的控制效果,更无法满足注塑成型生产过程中柔性制造的需求。
鉴于注塑成型生产过程中每时每刻都会产生并储存大量的、包含时间方向和批次方向上的数据,在无法获得过程精确模型的情况下,如何有效地利用这些二维数据直接进行注塑成型生产过程的控制器设计,是我们有待解决的问题。强化学习由于具有可以在先验信息较少或者无先验信息的情况下,仅仅利用数据,对复杂系统进行优化控制的优势,发展几十年来,在系统的最优跟踪控制问题方面有着大量的研究。但这些研究主要都是针对一维系统,在具有二维特性的间歇过程控制问题方面尚未有相关研究。为此,研究一种基于强化学习的数据驱动控制方法,能使系统不依赖于模型,仅仅依靠时间方向和批次方向的数据不断学习,得到最优的控制律。
发明内容
本发明是针对具有未知系统动态的注塑成型过程,提出的一种二维框架下的数据驱动最优跟踪控制方法,该方法可有效地解决系统无法精确建模的问题,降低系统的模型依赖性,仅仅依靠时间方向和批次方向上的数据不断学习,得到最优的控制律,并很好地跟踪设定值,提高系统的控制和跟踪性能。
本发明是通过以下技术方案实现的:
本发明针对具有未知系统动态的注塑成型过程进行描述,可得相应的二维注塑成型过程状态空间模型,然后通过将输出误差增广到上述模型中,从而可形成新的二维注塑成型过程增广状态空间模型;其次选择合适的二维值函数和二维Q函数,通过分析二维值函数和二维Q函数之间的关系,给出不依赖于模型参数的二维贝尔曼方程;接着设计沿时间方向和沿批次方向的复合型迭代控制律,结合二维贝尔曼方程,用注塑成型过程产生的二维数据进行多次学习后,可获得注塑成型过程的最优控制增益;通过控制增益可得到性能指标下的最优控制律,随后作用于执行器控制系统可使系统的输出逐渐跟踪上设定值;
步骤一:建立具有未知动态的二维注塑成型过程的状态空间模型:
二维注塑成型过程的保压阶段的离散输入输出模型如下:
NP(k+1,p)=1.317NP(k,p)+171.8VO(k,p)-(0.3259NP(k-1,p)+156.8VO(k-1,p))
(21)
其中VO(k,p)表示系统在p批次k时刻的阀门开度,VO(k-1,p)表示系统p批次k-1时刻的阀门开度,NP(k+1,p)表示系统p批次k+1时刻的腔内压力,NP(k,p)表示系统p批次k时刻的腔内压力,NP(k-1,p)表示系统p批次k-1时刻的腔内压力。
取状态变量x(k,p)=[NP(k,p)-0.3259NP(k-1,p)-156.8VO(k-1,p)]T,控制量u(k,p)=VO(k,p),系统输出y(k,p)=NP(k,p)得到保压阶段状态空间模型:
Figure BDA0002892373410000021
其中,
Figure BDA0002892373410000022
C=[1 0]
步骤二:将构建的二维注塑成型过程状态空间模型转化为新的增广状态空间模型;
为了得到系统的增量式模型,利用式(22),用p批次k+1时刻的状态空间减去p-1批次k+1时刻的状态空间,可以得到如下所示的状态空间增量模型:
Figure BDA0002892373410000031
其中,r(k,p)=u(k,p)-u(k,p-1)表示系统p批次k时刻的更新律;
定义yr为保压阶段腔内压力的设定值,该设定值在各批次及各时刻均保持不变,则系统在p批次k+1时刻的输出跟踪误差为e(k+1,p)=yr-y(k+1,p),将系统的状态空间模型(22)代入腔内压力y(k+1,p),可得到
e(k+1,p)=e(k+1,p-1)-CAΔpx(k,p)-CBΔpr(k,p) (24)
将输出跟踪误差和增量的状态变量引入新的状态空间变量中,可以得到新的扩展的状态空间模型,结果如下:
Figure BDA0002892373410000032
其中,
e(k+1,p)=yr(k+1,p)-y(k+1,p),
Figure BDA0002892373410000033
Figure BDA0002892373410000034
Figure BDA0002892373410000035
Figure BDA0002892373410000036
步骤三:设计具有未知动态注塑成型系统的二维增广状态空间模型的控制器;
根据模型(25),可设计具有未知动态注塑成型系统的控制器增益为:
Figure BDA0002892373410000037
式中K1为系统p批次k时刻对应的控制器增益,K2为系统p-1批次k+1时刻对应的控制器增益;
同时可设计具有未知动态注塑成型系统的最优跟踪控制问题的性能指标为如下形式:
Figure BDA0002892373410000041
根据性能指标可设计出系统的二维值函数:
Figure BDA0002892373410000042
其二次型形式如下所示:
Figure BDA0002892373410000043
根据性能指标以及二维值函数,可设计系统对状态评估的二维Q函数为:
Figure BDA0002892373410000044
类似于二维值函数,二维Q函数也可表示为如下形式:
Figure BDA0002892373410000045
因此,将二维值函数和二维Q函数的二次型形式作比较,可得到P矩阵和H矩阵的基于控制器增益的关系:
Figure BDA0002892373410000046
将注塑成型过程的状态空间模型代入二维Q函数求解,可表达出H矩阵的基于模型参数的具体形式:
Figure BDA0002892373410000051
其中,为了简化表达,用x1表示χ(k,p),用x2表示χ(k+1,p-1);
基于动态规划,得到基于Q函数的二维贝尔曼方程,此二维贝尔曼方程不依赖于注塑成型系统的模型参数,仅仅与系统状态有关,具体形式如下:
Figure BDA0002892373410000052
其中z(k,p)=[χT(k,p),χT(k+1,p-1),rT(k,p)]T
根据最优性的必要条件,令
Figure BDA0002892373410000053
可得到最优控制输入:
Figure BDA0002892373410000054
步骤四:设计控制律以及控制器增益K1,K2
采用数据驱动的二维Q学习算法来求解H矩阵参数Hrr
Figure BDA0002892373410000055
Figure BDA0002892373410000056
从而根据
Figure BDA0002892373410000057
以及
Figure BDA0002892373410000058
设计出控制器增益K1,K2
在这里,为了更好地解决Q学习中探索数据和利用数据之间的矛盾,在系统中引入了目标策略rj(k,p),目标策略是在通过行为策略生成的数据中不断优化和学习;在这两种策略的作用下,既保证了数据的全面性,又保证了学习的全局最优性,此时得到了如下的新系统:
Figure BDA0002892373410000059
其中
Figure BDA00028923734100000510
沿着新系统(36)的轨迹,二维贝尔曼方程可以被表示为如下形式:
Figure BDA0002892373410000061
将系统(36)以及P矩阵和H矩阵的关系代入到(37)式中,得到如下所示的二维贝尔曼方程表达式:
Figure BDA0002892373410000062
接着,则用采集到的系统状态数据来求解贝尔曼方程,用克罗内克积、最小二乘计算等理论将(18)式描述为如下形式:
Figure BDA0002892373410000063
其中
Figure BDA0002892373410000064
Figure BDA0002892373410000065
Figure BDA00028923734100000713
Figure BDA0002892373410000071
Figure BDA0002892373410000072
Figure BDA0002892373410000073
Figure BDA0002892373410000074
Figure BDA0002892373410000075
Figure BDA0002892373410000076
Figure BDA0002892373410000077
Figure BDA0002892373410000078
通过对上述各项的计算,可得到控制器增益:
Figure BDA0002892373410000079
Figure BDA00028923734100000710
步骤五:通过Q学习算法求解控制器增益K1,K2
1.数据产生与收集:用稳定的行为策略产生时间和批次方向的注塑成型过程状态数据,并将其存储在
Figure BDA00028923734100000711
和θj+1(p)中;
2.初始化:给定能使系统稳定的初始控制器增益K10,K20,并设j=0,其中j表示迭代次数;
3.算法执行:通过最小二乘以及存储的数据
Figure BDA00028923734100000712
和θj+1(p),可由(19)式计算出Lj+1,接着通过(40)式计算并更新控制器增益K1,K2
4.算法执行至控制器增益满足||Kj+1-Kj||<ε的条件时停止,其中ε是非常小的正整数,若不满足停止条件,令j=j+1,且算法跳转至第2步骤并继续循环执行。
本发明的优点与效果为:
本发明针对具有未知动态注塑成型过程建模困难以及具有重复性等复杂特性的问题,提出一种具有未知动态注塑成型系统的二维数据驱动最优跟踪控制方法;此发明采用完全的数据驱动方式,仅仅利用注塑成型过程在批次和时间方向所测量的数据,不同于以往的对此类间歇过程精确建模的方法,更区别于传统的一维模式,在二维理论的框架下,采用数据驱动的方式,实现二维Q-学习算法对注塑成型过程的最优跟踪控制。所建立的引入输出误差的增广状态空间模型,为控制器的设计提供了更多的自由度,且保证了控制器的跟踪性能;通过采用数据驱动的方式,极大地降低了系统的模型依赖性,降低了计算成本;在求解控制器增益时,将行为策略和目标策略分开考虑,在对数据充分挖掘利用的同时,使系统即使在加入探测噪声后也能保证无偏性;且在多次迭代学习后,H矩阵逐渐趋近于最优的H矩阵,控制器增益也会收敛于最优控制输入。
附图说明
图1为H矩阵的收敛过程;
图2为控制器增益K1的收敛过程;
图3为控制器增益K2的收敛过程;
图4为二维Q学习算法下的控制输入曲线;
图5为二维Q学习算法下的输出跟踪曲线。
具体实施方式
为了进一步说明本发明,下面结合附图及实例对本发明进行详细地描述,但不能将它们理解为对本发明保护范围的限定。
实施例1:
注塑成型作为一种典型的间歇过程,在塑料制品工业中占有重要地位。它具有生产效率高、自动化程度高、加工精度高等特点,并被广泛应用于汽车、电气、通讯、航空航天等领域。压力的大小对塑性材料的密度分布有着重要的影响,也就是说,压力大的部分相对紧实,而压力小的部分相对松散。因此,在注塑成型保压阶段,通过阀门开度的大小来控制喷嘴压力是非常重要的。在这一部分中,用所提出的控制方法来控制这一阶段的两个参数。
在大量试验的基础上,二维注塑成型过程保压阶段喷嘴压力(NP)与阀门开度(VO)的关系式为下式:
NP(k+1,p)=1.317NP(k,p)+171.8VO(k,p)-(0.3259NP(k-1,p)+156.8VO(k-1,p))
(41)
其中,VO(k,p)表示系统在p批次k时刻的阀门开度,VO(k-1,p)表示系统p批次k-1时刻的阀门开度,NP(k+1,p)表示系统p批次k+1时刻的腔内压力,NP(k,p)表示系统p批次k时刻的腔内压力,NP(k-1,p)表示系统p批次k-1时刻的腔内压力。
取状态变量x(k,p)=[NP(k,p) -0.3259NP(k-1,p) -156.8VO(k-1,p)]T,控制量u(k,p)=VO(k,p),系统输出y(k,p)=NP(k,p)得到保压阶段状态空间模型:
Figure BDA0002892373410000091
其中,
Figure BDA0002892373410000092
C=[1 0]
仿真中所采用的控制器参数为:Q1=Q2=diag[6,6,6],R=1。这里,首先用二维离散黎卡提方程求解出最优的P矩阵,结合(12)式求得最优的H矩阵如下(43)式,再代入(20)式即可得出最优的控制器增益如下(44)、(45)式。
Figure BDA0002892373410000093
Figure BDA0002892373410000094
Figure BDA0002892373410000095
经过多次学习之后,本发明提出的二维数据驱动最优跟踪控制方法求得的H矩阵(46)式和控制器增益(47)式、(48)式,逐渐收敛到最优H矩阵和最优控制器增益。
Figure BDA0002892373410000101
Figure BDA0002892373410000102
Figure BDA0002892373410000103
由图1可知,在学习过程中,随着批次数量的增加,H矩阵逐渐接近于最优H矩阵。此外,控制器增益K1 K2逐渐收敛于最优控制器增益的变化趋势如图2和图3所示。为了更直观地展示收敛效果,选取第四、十三、二十、三十批数据进行呈现。从以上三张图可以看出,该方法具有较好的优化效果,且随着批次数量的增加,收敛效果更好。
图4和图5分别展示了二维数据驱动最优跟踪控制方法控制下获得的系统的控制输入曲线和输出跟踪曲线,其中输出的设定值为yr=300。从上面的图片可以看出,在此方法控制下,系统的输出响应与目标轨迹的偏差大大减小并无限趋近于零。并且随着批次数量的增加,跟踪误差越来越小,跟踪效果越来越好。
综上,本发明以具有未知动态注塑成型系统的控制设计为例,来验证本发明所提出的控制方法的有效性和可行性;此发明在模型参数未知的情况下,采用完全的数据驱动方式,仅仅利用注塑成型过程在批次和时间方向所测量的数据,不同于传统的对此类间歇过程精确建模,更区别于传统的一维模式,极大地降低了系统的模型依赖性,降低了计算成本;仿真结果表明系统在多次学习后,可以更好的跟踪输出设定值,具有较好的跟踪性能和收敛性;因此,这种发明方法的提出,为具有未知动态的二维注塑成型过程的控制问题提供全新的设计方案,可以在保证系统跟踪控制效果的同时减少系统建模和计算成本。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (1)

1.一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法,其特征在于:具体步骤如下:
步骤一:建立具有未知动态的二维注塑成型过程的状态空间模型:
二维注塑成型过程的保压阶段的离散输入输出模型如下:
NP(k+1,p)=1.317NP(k,p)+171.8VO(k,p)-(0.3259NP(k-1,p)+156.8VO(k-1,p))
(1)
其中,VO(k,p)表示系统在p批次k时刻的阀门开度,VO(k-1,p)表示系统p批次k-1时刻的阀门开度,NP(k+1,p)表示系统p批次k+1时刻的腔内压力,NP(k,p)表示;
取状态变量x(k,p)=[NP(k,p) -0.3259NP(k-1,p) -156.8VO(k-1,p)]T,控制量u(k,p)=VO(k,p),系统输出y(k,p)=NP(k,p)得到保压阶段状态空间模型:
Figure FDA0002892373400000011
其中,
Figure FDA0002892373400000012
C=[1 0];
步骤二:将构建的二维注塑成型过程状态空间模型转化为新的增广状态空间模型;
利用式(2),用p批次k+1时刻的状态空间减去p-1批次k+1时刻的状态空间,得到如下所示的状态空间增量模型:
Figure FDA0002892373400000013
其中,r(k,p)=u(k,p)-u(k,p-1)表示系统p批次k时刻的更新律;
定义yr为保压阶段腔内压力的设定值,该设定值在各批次及各时刻均保持不变,则系统在p批次k+1时刻的输出跟踪误差为e(k+1,p)=yr-y(k+1,p),将系统的状态空间模型(2)代入腔内压力y(k+1,p),得到
e(k+1,p)=e(k+1,p-1)-CAΔpx(k,p)-CBΔpr(k,p) (4)
将输出跟踪误差和增量的状态变量引入新的状态空间变量中,得到新的扩展的状态空间模型,结果如下:
Figure FDA0002892373400000021
其中,
e(k+1,p)=yr(k+1,p)-y(k+1,p),
Figure FDA0002892373400000022
Figure FDA0002892373400000023
Figure FDA0002892373400000024
Figure FDA0002892373400000025
步骤三:设计具有未知动态注塑成型系统的二维增广状态空间模型的控制器;
根据模型(5),设计具有未知动态注塑成型系统的控制器增益为:
Figure FDA0002892373400000026
式中K1为系统p批次k时刻对应的控制器增益,K2为系统p-1批次k+1时刻对应的控制器增益;
同时设计具有未知动态注塑成型系统的最优跟踪控制问题的性能指标为如下形式:
Figure FDA0002892373400000027
根据性能指标设计出系统的二维值函数:
Figure FDA0002892373400000031
其二次型形式如下所示:
Figure FDA0002892373400000032
根据性能指标以及二维值函数,设计系统对状态评估的二维Q函数为:
Figure FDA0002892373400000033
类似于二维值函数,二维Q函数表示为如下形式:
Figure FDA0002892373400000034
因此,将二维值函数和二维Q函数的二次型形式作比较,得到P矩阵和H矩阵的基于控制器增益的关系:
Figure FDA0002892373400000035
将注塑成型过程的状态空间模型代入二维Q函数求解,表达出H矩阵的基于模型参数的具体形式:
Figure FDA0002892373400000036
其中,为了简化表达,用x1表示χ(k,p),用x2表示χ(k+1,p-1);
基于动态规划,得到基于Q函数的二维贝尔曼方程,具体形式如下:
Figure FDA0002892373400000041
其中z(k,p)=[χT(k,p),χT(k+1,p-1),rT(k,p)]T
根据最优性的必要条件,令
Figure FDA0002892373400000042
得到最优控制输入:
Figure FDA0002892373400000043
步骤四:设计控制律以及控制器增益K1,K2
采用数据驱动的二维Q学习算法来求解H矩阵参数Hrr
Figure FDA0002892373400000044
Figure FDA0002892373400000045
从而根据
Figure FDA0002892373400000046
以及
Figure FDA0002892373400000047
设计出控制器增益K1,K2
在系统中引入了目标策略rj(k,p),此时得到了如下的新系统:
Figure FDA0002892373400000048
其中
Figure FDA0002892373400000049
沿着新系统(16)的轨迹,二维贝尔曼方程表示为如下形式:
Figure FDA00028923734000000410
将系统(16)以及P矩阵和H矩阵的关系代入到(17)式中,得到如下所示的二维贝尔曼方程表达式:
Figure FDA0002892373400000051
接着,则用采集到的系统状态数据来求解贝尔曼方程,用克罗内克积、最小二乘计算等理论将(18)式描述为如下形式:
Figure FDA0002892373400000052
其中
Figure FDA0002892373400000053
Figure FDA0002892373400000054
Figure FDA0002892373400000055
Figure FDA0002892373400000056
Figure FDA0002892373400000057
Figure FDA0002892373400000058
Figure FDA0002892373400000059
Figure FDA00028923734000000510
Figure FDA00028923734000000511
Figure FDA00028923734000000512
Figure FDA0002892373400000061
通过对上述各项的计算,得到控制器增益:
Figure FDA0002892373400000062
Figure FDA0002892373400000063
步骤五:通过Q学习算法求解控制器增益K1,K2
CN202110031486.5A 2021-01-11 2021-01-11 一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法 Active CN112859604B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110031486.5A CN112859604B (zh) 2021-01-11 2021-01-11 一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110031486.5A CN112859604B (zh) 2021-01-11 2021-01-11 一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法

Publications (2)

Publication Number Publication Date
CN112859604A true CN112859604A (zh) 2021-05-28
CN112859604B CN112859604B (zh) 2022-10-14

Family

ID=76002348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110031486.5A Active CN112859604B (zh) 2021-01-11 2021-01-11 一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法

Country Status (1)

Country Link
CN (1) CN112859604B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114137833A (zh) * 2021-11-05 2022-03-04 广东工业大学 一种注塑填充过程的最优反馈控制方法和控制器
CN114200834A (zh) * 2021-11-30 2022-03-18 辽宁石油化工大学 丢包环境下批次过程无模型离轨策略最优跟踪控制方法
CN114237184A (zh) * 2021-12-20 2022-03-25 杭州电子科技大学 一种工业过程的优化学习控制性能提升方法
CN115167150A (zh) * 2022-08-15 2022-10-11 辽宁石油化工大学 具有未知系统动态的批次过程二维离轨策略交错q学习最优跟踪控制方法
CN115327903A (zh) * 2022-08-11 2022-11-11 辽宁石油化工大学 二维状态时滞批处理过程的离轨策略最优跟踪控制方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103713521A (zh) * 2013-12-31 2014-04-09 广州市香港科大霍英东研究院 一种针对注塑过程区间时滞的2d控制器设计方法
CN105334751A (zh) * 2015-11-26 2016-02-17 杭州电子科技大学 一种批次注塑过程的稳定控制器设计方法
CN107831662A (zh) * 2017-11-13 2018-03-23 辽宁石油化工大学 针对存在执行器故障的间歇过程随机2d控制器设计方法
CN107942667A (zh) * 2017-11-29 2018-04-20 辽宁石油化工大学 基于时变时滞和干扰的注塑过程混杂2d跟踪控制方法
CN109932905A (zh) * 2019-03-08 2019-06-25 辽宁石油化工大学 一种基于非策略的观测器状态反馈的优化控制方法
CN110083064A (zh) * 2019-04-29 2019-08-02 辽宁石油化工大学 一种基于非策略q-学习的网络最优跟踪控制方法
CN112180738A (zh) * 2020-10-22 2021-01-05 辽宁石油化工大学 针对非线性注塑成型异步切换过程鲁棒模糊预测控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103713521A (zh) * 2013-12-31 2014-04-09 广州市香港科大霍英东研究院 一种针对注塑过程区间时滞的2d控制器设计方法
CN105334751A (zh) * 2015-11-26 2016-02-17 杭州电子科技大学 一种批次注塑过程的稳定控制器设计方法
CN107831662A (zh) * 2017-11-13 2018-03-23 辽宁石油化工大学 针对存在执行器故障的间歇过程随机2d控制器设计方法
CN107942667A (zh) * 2017-11-29 2018-04-20 辽宁石油化工大学 基于时变时滞和干扰的注塑过程混杂2d跟踪控制方法
CN109932905A (zh) * 2019-03-08 2019-06-25 辽宁石油化工大学 一种基于非策略的观测器状态反馈的优化控制方法
CN110083064A (zh) * 2019-04-29 2019-08-02 辽宁石油化工大学 一种基于非策略q-学习的网络最优跟踪控制方法
CN112180738A (zh) * 2020-10-22 2021-01-05 辽宁石油化工大学 针对非线性注塑成型异步切换过程鲁棒模糊预测控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HUIYUAN SHI 等: "Robust Predictive Fault-Tolerant Control for Multi-Phase Batch Processes With Interval Time-Varying Delay", 《IEEE ACCESS》, 31 December 2019 (2019-12-31) *
王立敏 等: "多阶段间歇过程无穷时域优化线性二次容错控制", 《化工学报》, vol. 70, no. 2, 31 December 2019 (2019-12-31) *
陆宁云等: "注塑成型过程温度启动过渡状态的性能监测与故障诊断", 《化工自动化及仪表》, no. 05, 10 May 2010 (2010-05-10) *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114137833A (zh) * 2021-11-05 2022-03-04 广东工业大学 一种注塑填充过程的最优反馈控制方法和控制器
CN114137833B (zh) * 2021-11-05 2023-04-25 广东工业大学 一种注塑填充过程的最优反馈控制方法和控制器
CN114200834A (zh) * 2021-11-30 2022-03-18 辽宁石油化工大学 丢包环境下批次过程无模型离轨策略最优跟踪控制方法
CN114237184A (zh) * 2021-12-20 2022-03-25 杭州电子科技大学 一种工业过程的优化学习控制性能提升方法
CN115327903A (zh) * 2022-08-11 2022-11-11 辽宁石油化工大学 二维状态时滞批处理过程的离轨策略最优跟踪控制方法
CN115167150A (zh) * 2022-08-15 2022-10-11 辽宁石油化工大学 具有未知系统动态的批次过程二维离轨策略交错q学习最优跟踪控制方法

Also Published As

Publication number Publication date
CN112859604B (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
CN112859604B (zh) 一种针对未知动态注塑成型过程的二维数据驱动最优跟踪控制方法
CN107942667B (zh) 基于时变时滞和干扰的注塑过程混杂2d跟踪控制方法
Bristow et al. A survey of iterative learning control
CN102681489B (zh) 多轴联动数控系统运动平稳性和轮廓加工精度控制方法
CN104698842B (zh) 一种基于内点法的lpv模型非线性预测控制方法
CN107544255B (zh) 一种批次注塑过程的状态补偿模型控制方法
Adnan et al. Self-tuning fuzzy PID controller for electro-hydraulic cylinder
CN109240092B (zh) 基于多智能体可重构模块化柔性机械臂轨迹跟踪控制方法
Commuri et al. CMAC neural network control of robot manipulators
CN112936286A (zh) 一种多柔性机械臂系统自适应一致性追踪控制方法及系统
Osman et al. Predictive functional control with observer (PFC-O) design and loading effects performance for a pneumatic system
Yahagi et al. Non-iterative data-driven tuning of model-free control based on an ultra-local model
CN114200834A (zh) 丢包环境下批次过程无模型离轨策略最优跟踪控制方法
Yousuf et al. Robust trajectory tracking control design for nonholonomic mobile robot (nmr)
Precup et al. On the combination of tensor product and fuzzy models
Darío Luis‐Delgado et al. Design of switching hyperplanes for multi‐inputs multi‐outputs discrete‐time linear systems
Duran-Villalobos et al. Iterative learning modelling and control of batch fermentation processes
CN112286052A (zh) 一种利用线性系统数据解决工业控制最优跟踪控制方法
CN112859598B (zh) 一种重组式经验变换型迭代学习控制方法
Emhemed et al. A new predictive control technique for force control of pneumatic actuator plant
CN115327903A (zh) 二维状态时滞批处理过程的离轨策略最优跟踪控制方法
Trojaola et al. An Innovative MIMO Iterative Learning Control Approach for the Position Control of a Hydraulic Press
Rayme et al. Control System based on Reinforcement Learning applied to a Klatt-Engell Reactor
CN115327904A (zh) 二维间歇过程非策略无模型输出反馈最优跟踪控制方法
CN116719237A (zh) 具有执行器故障的时滞间歇过程q学习最优跟踪控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Shi Huiyuan

Inventor after: Wen Xin

Inventor after: Yang Chen

Inventor after: Su Chengli

Inventor after: Jiang Xueying

Inventor after: Peng Bo

Inventor after: Li Ping

Inventor before: Shi Huiyuan

Inventor before: Wen Xin

Inventor before: Su Chengli

Inventor before: Jiang Xueying

Inventor before: Peng Bo

Inventor before: Yang Chen

Inventor before: Li Ping

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant