CN114935890A - 基于强化学习的大型柔性结构传感器作动器优化配置方法 - Google Patents

基于强化学习的大型柔性结构传感器作动器优化配置方法 Download PDF

Info

Publication number
CN114935890A
CN114935890A CN202210407090.0A CN202210407090A CN114935890A CN 114935890 A CN114935890 A CN 114935890A CN 202210407090 A CN202210407090 A CN 202210407090A CN 114935890 A CN114935890 A CN 114935890A
Authority
CN
China
Prior art keywords
particle
pbest
actuator
matrix
reinforcement learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210407090.0A
Other languages
English (en)
Other versions
CN114935890B (zh
Inventor
黄攀峰
赵卫建
张帆
张夷斋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202210407090.0A priority Critical patent/CN114935890B/zh
Publication of CN114935890A publication Critical patent/CN114935890A/zh
Application granted granted Critical
Publication of CN114935890B publication Critical patent/CN114935890B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Vibration Prevention Devices (AREA)

Abstract

本发明公开了一种基于强化学习的大型柔性结构传感器作动器优化配置方法,首先建立系统动力学模型,再将动力学模型转换到模态空间中表示,根据系统的动态方程和边界条件获得多自由度振动系统的各阶固有频率和相应的振型,然后将多自由度振动系统由模态空间转换到状态空间模型,接下来建立优化目标函数,最后采用强化学习策略的粒子群优化算法进行优化配置。本发明方法使得配置结果更加合理,有效提高了主动振动控制的性能。

Description

基于强化学习的大型柔性结构传感器作动器优化配置方法
技术领域
本发明属于空间结构控制技术领域,具体涉及一种大型柔性结构传感器作动器优化配置方法。
背景技术
随着航天事业的蓬勃发展,火箭发射成功率和载荷能力的不断提高,空间大型结构的需求量变得越来越大。受制于载体空间,现代空间大型结构均被设计成可折叠和展开的形式而被大量采用。现代空间结构正朝着结构大型化、质量轻型化,刚度柔性化的方向不断发展,如大型空间站结构件、太阳能帆板和大型空间天线等。由于此类结构具有柔性大、固有频率低、模态密集等特点,在空间无阻尼的环境中一旦发生振动,将会对整个系统的稳定性和工作性能造成严重影响。
目前对空间大型柔性结构振动问题的研究主要集中在控制方法的研究上,对如何确定作动器的个数和位置问题研究较少。事实上,在大型柔性的振动控制研究中,传感器和作动器的数量和位置优化是一个十分重要的问题,其优化的结果好坏将直接影响控制的优劣。针对大型柔性结构传感器与作动器的优化配置,目前的研究主要可以分为以下两个方面:(1)作动器/传感器优化准则的研究,在这一方面国外的专家学者研究的起点比较早,因此国内的研究基本都是参考国外的研究成果。其中具有代表性的有基于Gram矩阵的系统可控/可观性准则,AMI ARBEL和A HAC等人对基于Gram矩阵的可控性/可观性准则分别做了详细的推导,由此验证了该准则的有效性;基于系统能量的准则也受到学术界的重视并且对其进行了广泛的应用,比如,Schula和Heimbold首次提出了基于系统能量耗散的作动器/传感器优化配置准则;基于系统可靠性的优化准则,由于传感器和作动器存在失效的风险,考虑如何配置使得在个别传感器和作动器失效的情况下仍能满足控制要求;还有考虑控制/观测溢出的优化准则等等。然后根据所求解的具体问题进行分析,选择相应的优化准则。(2)优化算法的研究,目前国内外学者在这方面做出了很多研究,但主要是集中在群体智能优化方法的研究上,如模拟退火算法、粒子群算法和遗传算法及这些方法的相关变体。
虽然针对大型柔性结构主动振动控制的传感器和作动器优化配置已有大量可行方法,但仍然存在问题。要么在寻优过程中由于计算复杂度过大导致收敛速度慢,要么假设配置数目已知只优化传感器和作动器的位置;相应的优化准则设置存在很大的改进空间,使得最终的优化结果并不理想。
发明内容
为了克服现有技术的不足,本发明提供了一种基于强化学习的大型柔性结构传感器作动器优化配置方法,首先建立系统动力学模型,再将动力学模型转换到模态空间中表示,根据系统的动态方程和边界条件获得多自由度振动系统的各阶固有频率和相应的振型,然后将多自由度振动系统由模态空间转换到状态空间模型,接下来建立优化目标函数,最后采用强化学习策略的粒子群优化算法进行优化配置。本发明方法使得配置结果更加合理,有效提高了主动振动控制的性能。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:建立系统动力学模型;
针对多自由度振动系统,通过拉格朗日法建立系统的动力学模型如下:
Figure BDA0003602340010000021
y=Psx
其中M、C和K分别表示系统整体结构的质量矩阵、阻尼矩阵和刚度矩阵,Pa、Ps分别是作动器和传感器的位置矩阵,fc为作动器施加的作动力;x、y分别表示结构振动的位移和传感器处的观测值;
步骤2:将动力学模型转换到模态空间中表示,根据系统的动态方程和边界条件获得多自由度振动系统的各阶固有频率和相应的振型:
Figure BDA0003602340010000022
其中Φi和qi分别表示第i阶模态振型和模态空间坐标,由此可知振动位移为无穷阶模态的叠加;
通过模态截断法将系统的振动近似表示为前nc阶模态的叠加,即:
Figure BDA0003602340010000023
其中,nc为所取阶数;
步骤3:将多自由度振动系统由模态空间转换到状态空间模型;
步骤4:建立优化目标函数;
步骤4-1:最大化作动器传递到柔性结构上的能量表示为:
max[trace(Wc)]
前nc阶模态的每阶模态的最佳控制效果表示为:
Figure BDA0003602340010000031
其中,Wc为可控性格拉姆矩阵,σ(λic)为可控格拉姆矩阵特征值λic的标准差,n表示选取的模态阶数;
由此导出作动器综合指标为:
Figure BDA0003602340010000032
步骤4-2:最大化传感器输出能量:
max[trace(Wo)]
前nc阶模态的每阶模态的最佳观测效果表示为:
Figure BDA0003602340010000033
Wo为可观性格拉姆矩阵,σ(λio)为可观格拉姆矩阵特征值λio的标准差;
由此导出传感器综合指标为:
Figure BDA0003602340010000034
步骤4-3:对于剩余模态,其对系统的影响越小越好,对应的指标越小越好,即:
Figure BDA0003602340010000035
Figure BDA0003602340010000036
其中,Wuc为剩余模态的可控性格拉姆矩阵,σ(λiuc)为剩余模态可控性格拉姆矩阵特征值λiuc的标准差;Wuo为剩余模态的可观性格拉姆矩阵,σ(λiuo)为剩余模态可观性格拉姆矩阵特征值λiuo的标准差;
步骤4-4:综合考虑截断模态和剩余模态,基于最大最小化方法得到最终的目标优化函数:
作动器:
Figure BDA0003602340010000041
其中,ρ1为权重系数;
传感器:
Figure BDA0003602340010000042
其中,ρ2为权重系数;
步骤5:采用强化学习策略的粒子群优化算法进行优化配置;
步骤5-1:初始化粒子种群,粒子群优化算法中的粒子指代传感器和作动器,则在三维空间中有以下位置向量需要进行初始化:
粒子的当前位置向量xi=[xi1,xi2,xi3],xi1,xi2,xi3为三维坐标轴上的标量表示;
搜索空间中所有粒子中的历史个体最优位置pbesti=[pbesti1,pbesti2,pbesti3],pbesti1,pbesti2,pbesti3为三维坐标轴上的标量;
指定数量邻居位置向量的均值nmi=[nmi1,nmi2,nmi3];
步骤5-2:第一次强化学习的过程中粒子向历史个体最优位置学习有:
xi(t+1)=xi(t)+ciri(pbesti(t)-xi(t))
其中ci为加速常数,即学习因子,ri为随机数,在[0,1]范围内变化;xi(t+1)表示粒子下一时刻的位置,xi(t)表示粒子当前位置,pbesti(t)表示历史个体最优位置;
步骤5-3:利用分解策略确定当前粒子邻居,过程包括求每个粒子的惯性权重、每个粒子与种群中其它粒子惯性权重之间的欧式距离、对欧式距离进行排序,并根据惯性权重的距离排序求出给定粒子指定个数的邻居;
取当前粒子N个邻居,则均值x向量表示为:
Figure BDA0003602340010000043
其中,ck、rk、xk分别表示第k个粒子的加速常数,随机数及位置;
于是粒子的二次强化学习过程表示为:
Figure BDA0003602340010000044
步骤5-4:根据步骤5-3中的二次强化学习公式对粒子的位置进行更新,直到满足终止条件;
步骤5-5:完成传感器和作动器的优化配置。
本发明的有益效果如下:
本发明针对大型柔性结构的主动振动控制问题,以多自由度振动系统为具体目标,对传感器和作动器的数目和位置进行了优化配置。基于Gram矩阵导出可控性/可观性优化准则,同时考虑观测及控制溢出的影响和系统的能量,建立了相应的优化目标函数。采用强化学习策略的粒子群优化方法进行传感器和作动器的优化配置,避免了粒子群优化算法在迭代后期易出现早熟收敛和种群多样性丢失的问题。通过上述方法使得配置结果更加合理,有效提高了主动振动控制的性能。
附图说明
图1为本发明实施例桁架结构示意图。
图2为本发明实施例大型桁架结构传感器作动器优化配置方法流程图。
图3为本发明所采用的强化学习算法流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明的目的是在现有技术的基础上,提出一种针对大型柔性结构主动振动控制的传感器/作动器优化配置方法。基于Gram矩阵,综合考虑系统的可控性/可观测性和系统能量,抑制观测和控制溢出的影响。针对多目标粒子群在迭代后期易出现早熟收敛和种群多样性丢失的问题,采用强化学习策略的粒子群优化方法提高优化效率,改善优化配置结果。
一种基于强化学习的大型柔性结构传感器作动器优化配置方法,包括如下步骤:
步骤1:建立系统动力学模型;
针对多自由度振动系统,通过拉格朗日法建立系统的动力学模型如下:
Figure BDA0003602340010000051
y=Psx
其中M、C和K分别表示系统整体结构的质量矩阵、阻尼矩阵和刚度矩阵,Pa、Ps分别是作动器和传感器的位置矩阵,fc为作动器施加的作动力;
步骤2:将动力学模型转换到模态空间中表示,根据系统的动态方程和边界条件获得多自由度振动系统的各阶固有频率和相应的振型:
Figure BDA0003602340010000061
其中,Φi和qi分别表示第i阶模态振型和模态空间坐标,由此可知振动位移为无穷阶模态的叠加;
由于前几阶模态对系统的振动起主要作用,高阶模态不易被激励,所以可以通过模态截断法将系统的振动近似表示为前nc阶模态的叠加,即:
Figure BDA0003602340010000062
其中,nc为所取阶数;
步骤3:将多自由度振动系统由模态空间转换到状态空间模型;
步骤4:确定传感器/作动器配置准则,建立优化目标函数;
对于大型柔性结构的主动振动控制问题
首先应该保证作动器对结构振动的影响尽可能的大;其次作动器对截断的每阶模态都应该有好的作用效果,这样可以避免对某一阶或某几阶模态没有较好的控制效果;
步骤4-1:最大化作动器传递到柔性结构上的能量表示为:
max[trace(Wc)]
使每阶模态都有较好的控制效果可以表示为:
Figure BDA0003602340010000063
其中,Wc为可控性格拉姆矩阵,σ(λic)为可控格拉姆矩阵特征值λic的标准差;
由此导出作动器综合指标为:
Figure BDA0003602340010000064
步骤4-2:最大化传感器输出能量:
max[trace(Wo)]
使对应的模态都能很好的被观测到:
Figure BDA0003602340010000065
Wo为可观性格拉姆矩阵,σ(λio)为可观格拉姆矩阵特征值λio的标准差;
由此导出传感器综合指标为:
Figure BDA0003602340010000071
步骤4-3:虽然剩余模态不易被激励,但还是要考虑其对振动控制的影响,避免观测和控制溢出;
对于剩余模态,其对系统的影响越小越好,对应的指标越小越好,即:
Figure BDA0003602340010000072
Figure BDA0003602340010000073
其中,Wuc为剩余模态的可控性格拉姆矩阵,σ(λiuc)为剩余模态可控性格拉姆矩阵特征值λiuc的标准差;Wuo为剩余模态的可观性格拉姆矩阵,σ(λiuo)为剩余模态可观性格拉姆矩阵特征值λiuo的标准差;
步骤4-4:综合考虑截断模态和剩余模态,基于最大最小化方法得到最终的目标优化函数:
作动器:
Figure BDA0003602340010000074
其中,ρ1为权重系数;
传感器:
Figure BDA0003602340010000075
其中,ρ2为权重系数;
步骤5:采用强化学习策略的粒子群优化算法进行优化配置;
将强化学习与经典粒子群算法结合,旨在克服粒子群算法在迭代后期易出现早熟收敛和种群多样性丢失的问题,以提高传感器和作动器优化配置的性能。
步骤5-1:初始化粒子种群,粒子群优化算法中的粒子指代传感器和作动器,则在三维空间中有以下位置向量需要进行初始化:
粒子的当前位置向量xi=[xi1,xi2,xi3];
搜索空间中所有粒子中的历史个体最优位置pbesti=[pbesti1,pbesti2,pbesti3];
指定数量邻居位置向量的均值nmi=[nmi1,nmi2,nmi3];
步骤5-2:第一次强化学习的过程中粒子向历史个体最优位置学习有:
xi(t+1)=xi(t)+ciri(pbesti(t)-xi(t))
其中ci为加速常数,即学习因子,ri为随机数,在[0,1]范围内变化;
步骤5-3:利用分解策略确定当前粒子邻居,过程包括求每个粒子的惯性权重、每个粒子与种群中其它粒子惯性权重之间的欧式距离、对欧式距离进行排序,并根据惯性权重的距离排序求出给定粒子指定个数的邻居;
取当前粒子N个邻居,则均值x向量表示为:
Figure BDA0003602340010000081
于是粒子的二次强化学习过程表示为:
Figure BDA0003602340010000082
步骤5-4:根据步骤5-3中的二次强化学习公式对粒子的位置进行更新,直到满足终止条件;
步骤5-5:完成传感器和作动器的优化配置。
具体实施例:
1、建立系统动力学模型。
针对大型桁架结构,可以通过拉格朗日法建立起系统的动力学模型如下:
Figure BDA0003602340010000083
y=Psx
其中M、C和K分别表示系统整体结构的质量矩阵、阻尼矩阵和刚度矩阵,Pa、Ps分别是作动器和传感器的位置矩阵,fc为作动器施加的作动力。
2、将上述动力学方程转换到模态空间中表示,即x=Φq,假定结构的阻尼为瑞利阻尼,有:
Figure BDA0003602340010000084
y=Psmq
其中ξ=diag{ξ12,…,ξn}表示对应各阶模态的阻尼比,ω=diag{ω12,…,ωn}表示对应各阶模态频率;Pam=ΦTPa,Psm=PsΦ。
3、建立状态空间模型。
将上述系统模态方程形式转换到状态空间中:
Figure BDA0003602340010000091
Figure BDA0003602340010000092
式中
Figure BDA0003602340010000093
Figure BDA0003602340010000094
Figure BDA0003602340010000095
4、建立优化目标函数。
对于作动器来说,应该使其对系统结构的影响最大,同时避免激起不必要的振动,优化准则如下
Figure BDA0003602340010000096
括号中的前一项保证了被控模态都能尽可能地被控制,后一项保证了剩余模态的能量尽可能地小。
由于
Figure BDA0003602340010000097
结合状态空间表达式可以得到:
Figure BDA0003602340010000098
Wc=diag{Wc1,Wc2,…,Wcn}
对于传感器来说,应该对每一阶模态都有较好的观测效果,同时避免剩余模态的影响,优化准则如下
Figure BDA0003602340010000101
括号中的前一项保证了可以很好的观测到被控模态,后一项使剩余模态在观测结果中的影响尽可能地小。
由于
Figure BDA0003602340010000102
结合状态空间表达式可以得到:
Figure BDA0003602340010000103
Wo=diag{W01,Wo2,…,Won}
5、采用强化学习策略的粒子群优化算法进行优化配置。
本实施例将强化学习与经典粒子群算法结合,旨在克服粒子群算法在迭代后期易出现早熟收敛和种群多样性丢失的问题,以提高传感器和作动器优化配置的性能。
(1)、初始化粒子种群,这里的粒子指代传感器和作动器,则在三维空间中有以下位置向量需要进行初始化:
粒子的当前位置向量xi=[xi1,xi2,xi3]
搜索空间中所有粒子中的历史个体最优位置pbesti=[pbesti1,pbesti2,pbesti3]
指定数量邻居位置向量的均值nmi=[nmi1,nmi2,nmi3]
(2)、第一次强化学习的过程中粒子向历史个体最优位置学习有:
xi(t+1)=xi(t)+ciri(pbesti(t)-xi(t))
其中ci为加速常数(学习因子),ri为随机数,在[0,1]范围内变化。
(3)、利用分解策略确定当前粒子邻居,过程包括求每个粒子的惯性权重、每个粒子与种群中其它粒子惯性权重之间的欧式距离、对欧式距离进行排序,并根据惯性权重的距离排序求出给定粒子指定个数的邻居。取N个邻居,则均值x向量可以表示为:
Figure BDA0003602340010000104
于是粒子的二次强化学习过程可表示为:
Figure BDA0003602340010000105
(4)、根据3中的二次强化学习公式对粒子的位置进行更新,直到满足终止条件。
(5)、完成传感器和作动器的优化配置。

Claims (1)

1.一种基于强化学习的大型柔性结构传感器作动器优化配置方法,其特征在于,包括如下步骤:
步骤1:建立系统动力学模型;
针对多自由度振动系统,通过拉格朗日法建立系统的动力学模型如下:
Figure FDA0003602338000000011
y=Psx
其中M、C和K分别表示系统整体结构的质量矩阵、阻尼矩阵和刚度矩阵,Pa、Ps分别是作动器和传感器的位置矩阵,fc为作动器施加的作动力;x、y分别表示结构振动的位移和传感器处的观测值;
步骤2:将动力学模型转换到模态空间中表示,根据系统的动态方程和边界条件获得多自由度振动系统的各阶固有频率和相应的振型:
Figure FDA0003602338000000012
其中Φi和qi分别表示第i阶模态振型和模态空间坐标,由此可知振动位移为无穷阶模态的叠加;
通过模态截断法将系统的振动近似表示为前nc阶模态的叠加,即:
Figure FDA0003602338000000013
其中,nc为所取阶数;
步骤3:将多自由度振动系统由模态空间转换到状态空间模型;
步骤4:建立优化目标函数;
步骤4-1:最大化作动器传递到柔性结构上的能量表示为:
max[trace(Wc)]
前nc阶模态的每阶模态的最佳控制效果表示为:
Figure FDA0003602338000000014
其中,Wc为可控性格拉姆矩阵,σ(λic)为可控格拉姆矩阵特征值λic的标准差,n表示选取的模态阶数;
由此导出作动器综合指标为:
Figure FDA0003602338000000021
步骤4-2:最大化传感器输出能量:
max[trace(Wo)]
前nc阶模态的每阶模态的最佳观测效果表示为:
Figure FDA0003602338000000022
Wo为可观性格拉姆矩阵,σ(λio)为可观格拉姆矩阵特征值λio的标准差;
由此导出传感器综合指标为:
Figure FDA0003602338000000023
步骤4-3:对于剩余模态,其对系统的影响越小越好,对应的指标越小越好,即:
Figure FDA0003602338000000024
Figure FDA0003602338000000025
其中,Wuc为剩余模态的可控性格拉姆矩阵,σ(λiuc)为剩余模态可控性格拉姆矩阵特征值λiuc的标准差;Wuo为剩余模态的可观性格拉姆矩阵,σ(λiuo)为剩余模态可观性格拉姆矩阵特征值λiuo的标准差;
步骤4-4:综合考虑截断模态和剩余模态,基于最大最小化方法得到最终的目标优化函数:
作动器:
Figure FDA0003602338000000026
其中,ρ1为权重系数;
传感器:
Figure FDA0003602338000000027
其中,ρ2为权重系数;
步骤5:采用强化学习策略的粒子群优化算法进行优化配置;
步骤5-1:初始化粒子种群,粒子群优化算法中的粒子指代传感器和作动器,则在三维空间中有以下位置向量需要进行初始化:
粒子的当前位置向量xi=[xi1,xi2,xi3],xi1,xi2,xi3为三维坐标轴上的标量表示;
搜索空间中所有粒子中的历史个体最优位置pbesti=[pbesti1,pbesti2,pbesti3],pbesti1,pbesti2,pbesti3为三维坐标轴上的标量;
指定数量邻居位置向量的均值nmi=[nmi1,nmi2,nmi3];
步骤5-2:第一次强化学习的过程中粒子向历史个体最优位置学习有:
xi(t+1)=xi(t)+ciri(pbesti(t)-xi(t))
其中ci为加速常数,即学习因子,ri为随机数,在[0,1]范围内变化;xi(t+1)表示粒子下一时刻的位置,xi(t)表示粒子当前位置,pbesti(t)表示历史个体最优位置;
步骤5-3:利用分解策略确定当前粒子邻居,过程包括求每个粒子的惯性权重、每个粒子与种群中其它粒子惯性权重之间的欧式距离、对欧式距离进行排序,并根据惯性权重的距离排序求出给定粒子指定个数的邻居;
取当前粒子N个邻居,则均值x向量表示为:
Figure FDA0003602338000000031
其中,ck、rk、xk分别表示第k个粒子的加速常数,随机数及位置;
于是粒子的二次强化学习过程表示为:
Figure FDA0003602338000000032
步骤5-4:根据步骤5-3中的二次强化学习公式对粒子的位置进行更新,直到满足终止条件;
步骤5-5:完成传感器和作动器的优化配置。
CN202210407090.0A 2022-04-18 2022-04-18 基于强化学习的大型柔性结构传感器作动器优化配置方法 Active CN114935890B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210407090.0A CN114935890B (zh) 2022-04-18 2022-04-18 基于强化学习的大型柔性结构传感器作动器优化配置方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210407090.0A CN114935890B (zh) 2022-04-18 2022-04-18 基于强化学习的大型柔性结构传感器作动器优化配置方法

Publications (2)

Publication Number Publication Date
CN114935890A true CN114935890A (zh) 2022-08-23
CN114935890B CN114935890B (zh) 2023-04-18

Family

ID=82862041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210407090.0A Active CN114935890B (zh) 2022-04-18 2022-04-18 基于强化学习的大型柔性结构传感器作动器优化配置方法

Country Status (1)

Country Link
CN (1) CN114935890B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688826A (zh) * 2023-07-13 2024-03-12 东方空间技术(山东)有限公司 一种海射火箭子级回收方法、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170130802A1 (en) * 2014-07-29 2017-05-11 Industry-Academic Cooperation Foundation, Dankook University Method for calculating optimal control force of active mass damper and controlling active mass damper
CN112698572A (zh) * 2020-12-22 2021-04-23 西安交通大学 一种基于强化学习的结构振动控制方法、介质及设备
CN113032910A (zh) * 2021-04-13 2021-06-25 哈尔滨工业大学 一种挠性航天器作动器布局优化方法
CN113296408A (zh) * 2021-05-25 2021-08-24 浙江大学 基于深度强化学习的抑制涡致振动的主动流动控制器及控制方法
CN113485118A (zh) * 2021-07-28 2021-10-08 华中科技大学 一种基于Nadam改进FUNLMS算法的ANC优化控制方法
CN113960971A (zh) * 2021-10-27 2022-01-21 江南大学 一种基于行为决策网络粒子群优化的柔性车间调度方法
CN114237055A (zh) * 2021-12-19 2022-03-25 西北工业大学 极大型空间刚-柔耦合系统多阶模态主动振动抑制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170130802A1 (en) * 2014-07-29 2017-05-11 Industry-Academic Cooperation Foundation, Dankook University Method for calculating optimal control force of active mass damper and controlling active mass damper
CN112698572A (zh) * 2020-12-22 2021-04-23 西安交通大学 一种基于强化学习的结构振动控制方法、介质及设备
CN113032910A (zh) * 2021-04-13 2021-06-25 哈尔滨工业大学 一种挠性航天器作动器布局优化方法
CN113296408A (zh) * 2021-05-25 2021-08-24 浙江大学 基于深度强化学习的抑制涡致振动的主动流动控制器及控制方法
CN113485118A (zh) * 2021-07-28 2021-10-08 华中科技大学 一种基于Nadam改进FUNLMS算法的ANC优化控制方法
CN113960971A (zh) * 2021-10-27 2022-01-21 江南大学 一种基于行为决策网络粒子群优化的柔性车间调度方法
CN114237055A (zh) * 2021-12-19 2022-03-25 西北工业大学 极大型空间刚-柔耦合系统多阶模态主动振动抑制方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YINGBO LU: "Adaptive anti-windup control of post-capture combination via tethered space robot" *
ZHIQIANG MA等: "Adaptive Fractional-Order Sliding Mode Control for Admittance-Based Telerobotic System With Optimized Order and Force Estimation" *
曹玉岩;王志臣;付世欣;吴庆林;: "智能桁架结构最优振动控制与作动器优化配置" *
李浩君;张鹏威;刘中锋;张征;: "采用二次强化学习策略的多目标粒子群优化算法" *
高维金;王亮;刘永光;: "作动器最优配置的柔性结构振动主动控制" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688826A (zh) * 2023-07-13 2024-03-12 东方空间技术(山东)有限公司 一种海射火箭子级回收方法、设备及存储介质

Also Published As

Publication number Publication date
CN114935890B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN114935890B (zh) 基于强化学习的大型柔性结构传感器作动器优化配置方法
CN111090941A (zh) 一种基于多目标优化算法的航天器最优Lambert轨道交会方法
CN107273613B (zh) 一种基于应力惩罚和自适应体积的结构拓扑优化设计方法
CN109856976A (zh) 一种基于自适应交叉粒子群优化的气垫船航迹跟踪自抗扰控制方法
CN107491599A (zh) 一种应力约束下多相材料柔性机构拓扑优化方法
CN108763658A (zh) 基于等几何方法的组合薄壁结构固有频率设计方法
CN112636368B (zh) 针对多源多区域互联电力系统的自动发电控制方法
CN113062834B (zh) 风力机舱模糊滑模自适应两端悬浮控制方法
CN112016207A (zh) 一种发电机组经济负荷分配优化方法
CN108920793A (zh) 一种基于快速非支配排序算法的机器人关节空间轨迹多目标优化方法
CN110611325A (zh) 一种基于粒子群算法的风电场次同步振荡抑制方法
CN111460723A (zh) 一种基于粒子群算法的水下航行器内部组件分层布局方法
Wang et al. Optimal design of PI/PD controller for non-minimum phase system
CN116587275A (zh) 基于深度强化学习的机械臂智能阻抗控制方法及系统
CN111532453A (zh) 一种用于刚体微纳卫星的固定时间抗干扰姿态控制方法
CN110399697A (zh) 基于改进遗传学习粒子群算法的飞行器的控制分配方法
Cao et al. Inverse kinematics solution of redundant degree of freedom robot based on improved quantum particle swarm optimization
CN116995749A (zh) 基于电能质量调节器的微网功率优化方法
CN115079715B (zh) 角速度及输入约束下分布式航天器编队姿态同步控制方法
CN109695540B (zh) 基于综合关联改进型de算法的风力机翼型最优lqr控制方法
Peng et al. Trajectory multiobjective optimization of hypersonic morphing aircraft based on variable sweep wing
CN108984979B (zh) 基于多变量频域法和启发式搜索算法结合的超超临界机组深度调峰控制器设计方法
CN111306995A (zh) 一种面向弹体颤振抑制的组合控制器设计方法
CN114611345B (zh) 一种阵风响应飞行试验方法
Tomar et al. Conventional and PSO based approaches for model reduction of SISO discrete systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant