CN116841207A - 基于机器学习优化的绕线机张力网络化迭代学习控制方法 - Google Patents
基于机器学习优化的绕线机张力网络化迭代学习控制方法 Download PDFInfo
- Publication number
- CN116841207A CN116841207A CN202310883376.0A CN202310883376A CN116841207A CN 116841207 A CN116841207 A CN 116841207A CN 202310883376 A CN202310883376 A CN 202310883376A CN 116841207 A CN116841207 A CN 116841207A
- Authority
- CN
- China
- Prior art keywords
- tension
- winding
- networked
- iteration
- control system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004804 winding Methods 0.000 title claims abstract description 132
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000005457 optimization Methods 0.000 title claims abstract description 29
- 238000010801 machine learning Methods 0.000 title claims abstract description 28
- 239000002245 particle Substances 0.000 claims abstract description 63
- 230000008859 change Effects 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000013461 design Methods 0.000 claims abstract description 11
- 230000035772 mutation Effects 0.000 claims description 64
- 239000000463 material Substances 0.000 claims description 24
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000011161 development Methods 0.000 claims description 5
- 230000001149 cognitive effect Effects 0.000 claims description 4
- 230000005483 Hooke's law Effects 0.000 claims description 3
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 230000005489 elastic deformation Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 3
- URWAJWIAIPFPJE-YFMIWBNJSA-N sisomycin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H](CC=C(CN)O2)N)[C@@H](N)C[C@H]1N URWAJWIAIPFPJE-YFMIWBNJSA-N 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 claims 2
- 230000002068 genetic effect Effects 0.000 claims 2
- 238000009776 industrial production Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011158 industrial composite Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于机器学习优化的绕线机张力网络化迭代学习控制方法,主要用于解决绕线机在张力控制过程中由于网络控制系统输出端及控制输入端数据丢失导致的张力控制系统不稳定等问题,其主要步骤包括:张力控制系统建模;设计具有初值变化的卷绕张力迭代控制器;绕线机张力网络化迭代控制系统设计;改进粒子群算法优化的张力网络化迭代控制系统设计。所提出的机器学习优化的绕线机张力网络化迭代学习控制方法旨在处理工业网络控制系统中存在初始条件变化和数据丢失的迭代张力控制系统。同时结果表明有效提高了绕线机控制系统的动态性能与稳态性能,提高了张力控制精度。
Description
技术领域
本发明属于绕线机张力控制技术领域,利用机器学习优化的思想设计一种基于机器学习优化的绕线机张力网络化迭代学习控制方案。
背景技术
近年来,我国新能源汽车市场不断发展,新能源汽车竞争力明显提升。按照国家以及新能源汽车行业发展趋势来看,新能源汽车压缩机电机的生产具有广阔的市场前景,绕线机张力控制精度是影响压缩机电机绕组绕制的主要问题。然而,在实际生产中由于工业环境和网络延迟引发的数据丢失等问题会显著降低绕线机张力控制系统的性能,必须考虑一个针对复杂工业环境以及网络延迟引发的数据丢失的安全补偿策略,提高绕线机网络化张力控制精度。
迭代学习控制(Iterative learning control,ILC)是处理周期性重复工作的控制系统最常用的控制方法之一。该方法通过根据上一次迭代中获得的误差信息来修改当前控制动作或者输入命令。因此,迭代学习控制被广泛应用于处理具有周期性动作或扰动的控制系统。卷绕过程迭代学习控制的研究也取得了丰富的研究成果。Garimella和Srinivasan首次提出使用迭代学习控制来抑制张力控制中摩擦引起的周期性扰动。Zhao和C.D.Rahn使用PD反馈控制器和ILC前馈控制器相结合的控制方法解决单轴卷绕系统的张力控制稳定性的问题。因此,在连续缠绕系统中,系统工作具有周期性或重复性的特点,迭代学习的控制在卷绕过程中得到了广泛的应用。同时卷绕过程中卷绕材料半径的时变,又使张力具有一定的缓变趋势。另外,由于卷绕材料的不均匀等一些随机因素的影响,张力又具有一定的随机特征。因此张力是一个既有周期成分,又有缓变趋势,同时又包含随机成分的复杂信号。本发明,将系统卷轴半径变化看作为对迭代学习中的初始条件变化的问题,提出了一种全新的绕线机张力模糊迭代学习控制器。
网络控制系统(networked control systems,NCS)由于其在实施中的鲁棒性、灵活性和便利性等显著优势,已被大量应用于控制系统中。网络控制系统是上世界90年代提出的概念,由于计算机网络与控制技术的不断发展与融合,网络控制系统具有可模块化建构,共享区域内资源,且能进行远程操控的优点。大部分工业绕线机工厂均已实现网络化控制,但是在数据传输过程中,由于网络带宽、流量限制等物理限制,以及通信网络信息的分时复用和网络的不稳定性干扰,从而不可避免的导致网络传输过程中的数据时延和数据丢包等现象,大大降低了网络控制系统的性能。近年来,在使用ILC方法设计控制器的NCS研究中取得了一些成功。卜旭辉研究了一种由伯努利随机变量建模的具有随机数据丢失的随机线性系统的迭代学习控制问题,并提出了解决方法。Wang和Lim针对一类具有单操作伯努利通信延迟的离散线性时变系统,提出来一种数据驱动的网络化最优迭代学习控制策略。上述文献均是从优化迭代学习控制器的角度为出发点,没有考虑优化系统输出本身的问题,网络控制系统中发生的数据丢包其本质问题是其数据丢失的问题,虽然改善控制器可以提高网络控制系统的收敛速度,但是在很多实验场合中如果丢包率过大,其系统仍处于发散状态。基于以上思想,利用机器学习中改进的粒子群算法拟合预测数据的优点,将机器学习与网络化控制系统相结合,使机器学习中的拟合预测值看作系统输出数据丢失值,进一步优化数据丢失下的输出误差,提高网络化迭代控制系统的收敛速度。
发明内容
本发明旨在提高处理工业网络控制系统中初始条件变化和数据丢失的迭代张力控制系统精度,减小网络丢包对网络化张力控制系统的影响;设计一种初始条件变换的迭代学习控制器;同时改进粒子群优化算法,将网络化张力控制系统数据丢包进行数据拟合;最后设计了基于机器学习的绕线机张力网络化迭代学习控制方案。
为了实现上述发明目的,本发明采取如下设计方案:
S1:张力控制系统建模;
S2:设计具有初值变化的卷绕张力迭代控制器;
S3:绕线机张力网络化迭代控制系统设计;
S4:改进粒子群算法优化的张力网络化迭代控制系统设计;
进一步,步骤S1中,所述张力控制系统建模包括:
根据胡克定律分析,卷绕系统的张力可表示为:
其中,σ为卷绕材料表面应力,ε为卷绕材料弹性形变量,E为卷绕材料的弹性模量,T为张力,A为卷绕材料横截面积,L0为卷绕材料的绝对形变量,L为当前状态下由于张力变形的绕组材料长度;
当V1≠V2时,在t+dt时间内的张力变化如下:
V=πDn
其中,n为驱动电机的卷轴卷速;D为卷轴直径。
建立绕线机张力控制系统速度环动力学模型,其方程如下:
其中,J为5收卷轴转动惯量;Ki为单位输入电压下的力矩常数;u为控制输入;B为摩擦与模型结合的等效系数;Ff(ω1)为静摩擦系数;△2(t,T,ω1)为不确定非线性;ω为卷轴角速度;r1为5收卷轴半径。
Ff(ω1)=a1tanh(c1ω1)+a2[tanh(c2ω1)-tanh(c3ω1)]
其中,a1、a2为系统的不同摩擦系数等级,ci,i=1,2,3为近似各种摩擦效应的形状参数。
进一步,步骤S2中,所述设计具有初值变化的卷绕张力迭代控制器包括:
通过电机编码器反馈的数据获得实际电机转动的角度或COUNT指令,计算卷径的变化,其方程如下:
Dun=Du(n-1)-θu(n-1)A/2π
Dwn=Dw(n-1)-θw(n-1)A/2π
其中,Dun和Dwn分别为第n次卷绕前1放卷轴和5收卷轴的直径初值,Du(n-1)和Dw(n-1)为第n-1次卷绕前卷轴的直径初值,θu(n-1)和θw(n-1)为第n-1次卷绕后通过编码器反馈值计算所得的两卷轴转动的角位移。
分别定义模糊控制器的输入和输出的模糊子集为{NB,NM,NS,ZP,PS,PM,PB}。根据模糊调节学习增益的原理,建立模糊规则库,控制规则形式如下:if E is NM and EC isNM then U is NM。模糊推理方法采用Mamdani直接推理法,求解模糊过程采用重心法。
由综合误差ek(t)的基本论域[-|ekmin|,|ekmax|],以及ek(0)的基本论语[-|e0min|,|e0max|],综合误差变化率和/>综合考虑模糊控制器输出的ζk、γk与迭代学习收敛条件可以计算出比例因子kp、ki。迭代学习控制器设计完成。
具有初值变化的模糊张力迭代控制器:
Γk(t)=Γk-1(t)+△k
△k=ξk×kp
ηk(t)=ηk-1(t)+Θk
Θk=γk×ki
ek(t)=yd(t)-yk(t)
其中,u(k)(t)为第k次迭代时系统的控制变量,xk(0)为第k次迭代时系统初始状态,yd(t)为第k次迭代时系统的输出期望值,yk(t)为第k次迭代时系统实际输出值。模糊控制器以系统输出误差ek(t)和误差变化率为输入,通过模糊推理输出调节因子ζk,每次迭代时,控制器提取模糊控制器输出的调节因子ζk乘以比例因子kp,构建一个与Γk相同位数的调节矩阵△k。同理模糊控制器以系统输入误差ek(0)和输入误差变化率/>为输入,通过模糊推理因子γk,每次迭代时,控制器提取模糊控制器输出的调节因子γk乘以比例因子ki,构建一个与ηk相同的调节矩阵Θk。
进一步,步骤S3中,所述绕线机张力网络化迭代控制系统设计包括:
将卷绕系统简化为如下重复运行的SISO非线性离散系统:
其中,x(t)∈Rn,y(t)∈Rm,u(t)∈Rr分别表示系统的状态变量、系统的输出变量以及系统的控制变量。针对上述运行的重复运行的非线性系统,本节将给出如下假设条件。
假设1:非线性函数f(·)、b(·)、g(·)、d(·)对于系统的状态变量x(t)满足全局Lipschitz条件,即对所有的t∈[0,N],存在有限常数kf、kb、kg、kd满足:
||f(x1(t))-f(x2(t))||≤kf||x1(t)-x2(t)||
||b(x1(t))-b(x2(t))||≤kb||x1(t)-x2(t)||
||g(x1(t))-g(x2(t))||≤kg||x1(t)-x2(t)||
||d(x1(t))-d(x2(t))||≤kd||x1(t)-x2(t)||
其中,x1(t)和x2(t)为两个任意的状态变量。
假设2:对于给定的期望轨迹曲线yd(t),存在控制输入ud(t)和状态变量xd(t)满足下列条件:
其中,ud(t)和xd(t)称为期望输入与期望状态。
假设3:上述非线性离散系统的初始条件满足下式:
x(k+1)(0)=xk(0)+ψek(0)
绕线机张力网络化迭代控制:
对于满足假设1-3的卷绕过程非线性系统,使用上述ILC算法。当系统出现数据丢包时,只要控制系统满足下式:
||I-L(dI+ΦJ)||1<1
便可得:
其中,
其中
(1)yk(t)表示卷绕控制系统张力的输出数据;
(2)表示卷绕控制系统张力的输出数据在传输过程中丢失部分进行机器学习优化拟合得到的第k次迭代输出的拟合值;
(3)表示由yk(t)和/>组合而成的输出向量,数据未丢失部分取yk(t),数据丢失部分取/>
(4)表示对第k次迭代拟合数据与真实数据的差值;
(5)表示迭代学习单元的实际输入数据;
(6)表示控制变量传输过程中丢失部分进行机器学习优化拟合得到的第k次迭代输出的拟合值;
(7)uk(t)表示由和/>组成的输出向量,数据未丢失部分取/>数据丢失部分取/>
(8)表示对第k次迭代拟合数据与真实数据的差值;
进一步,步骤S4中,所述改进粒子群算法优化的张力网络化迭代控制系统设计包括:
在公式中可得网络化迭代控制系统的误差1范数取决于数据丢包率与数据的拟合逼近误差,另一方面可以说明,在数据丢包率相同的情况下,找到一个合理的误差拟合逼近策略可以使系统的收敛性能更好。
改进粒子群算法:
其中,Pi为粒子i当前位置;Vi为粒子i当前速度,Pa为粒子i在当前时刻的最佳位置,Pb为在整个粒子群中的最佳位置。c1和c2为认知系数,r1和r2为属于(0,1)的随机实数,βi为惯性权重,用于粒子群在搜索空间的探索和开发中实现平衡。惯性权重在每一代中从1.0到接近0运行期间动态减小,其具体表达式如下:
其中,itermax为最大迭代次数,iter当前迭代次数。
不同类型的突变算子可以用来增加种群的多样性,并帮助粒子群算法跳出局部最小值。变异算子的类型可能更有效,也可能更差,这取决于优化过程的阶段。在本文中,三种不同类型的变异算子应用于问题的不同阶段,以进一步探索搜索空间。本文提出一种自适应的方法来选择适合于问题各个阶段的变异算子。
柯西突变算子(Cauchy Mutation operator):
Vg=Vg exp(δ)
Pg=Pg+Vgδg
其中,Pg和Vg为全局最佳例子的位置和速度。δ和δg为标度参数为1的柯西随机数。
高斯突变算子(Gaussian Mutation operator):
Vg=Vg exp(θ)
Pg=Pg+Vgθg
其中,Pg和Vg为全局最佳例子的位置和速度。δ和δg为平均值为0,方差为1的高斯分布数。
Levy突变算子(Levy Mutation operator):
Vg=Vg exp(L(α))
Pg=Pg+VgLg(α)
其中,L(α)和Lg(α)是由Levy分布阐述的随机实数,参数α设置为1.3。
对自适应变异提出的方法使用了上述三种变异算子。最初,通过该比率将选择比率设置为等于1/3,随后计算每个算子突变的粒子的数量。然后,根据每个变异算子的选择率将其应用于群体粒子中,最后评估由此产生的后代适合度。
与后代适应度较低的另一个突变算子相比,后代适应度值更高的突变算子将被选择。选择最佳的突变算子的步骤如下所示:
每一代粒子群操作进度值评估:
其中,和/>为突变算子i在第t代产生的亲本及其子代的适合度,Mi为突变算子i突变的粒子数。
每一代粒子群反馈值评估:
其中,Zi为算子i在突变之后其子代具有比他们自己更好的适应度的粒子的数量,Ki为突变算子在第t代的选择率,η为介于(0,1)之间的随机权重系数,N为突变运算符的数目,ci为突变算子i的惩罚因子,具体定义为:
突变算子对下一代的选择更新率:
其中,λ为每个突变算子i的最小选择比。
传统PSO智能优化算法的创新来自于群体的社会和认知行为。Tamako’s提出粒子在很大程度上受到其先前最佳粒子和局部粒子的影响。一旦最佳例子的局部最优值没有变化,所有其他粒子将迅速收敛至最佳粒子的位置。本文提出的自适应混合群优化算法在每一代搜索中搜索要突变的全局最佳粒子的邻居,而非选择全局最佳粒子进行突变。因此,对粒子跳出局部最小值将是非常有帮助的,整个粒子群将移动至更好的位置。下面将给出基于自适应混合群优化算法的框架:
1.随机生成粒子群中每个粒子的初始位置和速度。
2.评估每个粒子的适应度,并确定种群中每个粒子的局部和全局最佳适应度。
3.将初始选择比设置为1/3。
4.根据公式更新每个粒子。
5.对于每个粒子i,如果其适应度小于其先前最佳位置Pi的适应度,则更新Pi。
6.如果存在适合度小于当前最佳适合度Pg,则更新所有粒子的最佳位置的适合度。
7.根据粒子的选择比例,将每个突变算子应用于粒子的数量。
8.评估进度值与反馈值,从上述三个突变算子中选择最好的一个,然后更新每个算子对下一代的选择比例。
9.用最佳突变算子突变全局最佳粒子的最佳邻域粒子,并从突变的最佳邻域中选择最佳领域产生
10.比较与Pg选择更好的在下一代中繁殖。
11.如果满足停止标准则停止,不满足则转移至步骤4。
有益效果:
1、为了解决绕线机在张力控制过程中由于网络控制系统输出端及控制输入端数据丢失导致的张力控制系统不稳定等问题,通过分析所示网络化控制系统输出误差大小取决于数据丢包率及对丢包数据的拟合精度,机器学习能够提高模型的泛化能力,即便是没有包含在训练数据里面的未观测数据,模型可以正确的识别。因此,本发明提出利用机器学习算法拟合绕线机网络化系统数据丢失,仿真结果表明了机器学习算法对绕线机数据丢失系统拟合的有效性。
2、在所提出的机器学习拟合张力系统数据丢失的基础上,进一步为了解决张力控制中由于料卷半径时变性导致5收卷轴和1放卷轴半径具有时变性从而使得张力系统控制精度低等问题,提出一种模糊迭代控制器,由于在同一卷绕周期中,料卷半径变化较小,因此在控制中可作为迭代系统初值变化的问题处理,以系统输出误差和误差变化率为输入,通过模糊推理输出调节因子,每次迭代时,控制器提取模糊控制器输出的调节因子乘以比例因子,构建一个与相同位数的调节系数矩阵,从而在单次卷绕中忽略系统的时变性能,提高张力控制精度。
附图说明
图1为基于机器学习优化的绕线机张力网络化迭代学习控制的流程图;
图2是本发明提出的卷绕系统结构图;
图3是本发明提出网络化系统控制结构图;
图4是数据丢包率为25%数据丢失未处理下的输出误差曲线图;
图5是数据丢包率为50%数据丢失未处理下的输出误差曲线图;
图6是数据丢包率为25%数据丢失下系统输出张力跟踪效果图;
图7是数据丢包率为25%数据丢失下系统输出误差曲线图;
图8是数据丢包率为50%数据丢失下系统输出张力跟踪效果图;
图9是数据丢包率为50%数据丢失下系统输出误差曲线图;
具体实施方式
如上所述,针对绕线机张力控制系统由于网络控制系统数据丢失和卷绕材料半径时变导致的漆包线缠绕疏松、分布参差不齐以及绕线过程中漆包线易拉断等问题,为了提高张力控制系统的动态性能和稳态性能,减少数据丢失及卷绕材料半径变化造成的张力的扰动对系统的影响,本发明设计了一种基于机器学习优化的绕线机张力网络化迭代学习控制方法。以下将结合附图,对本发明进行更为详细的描述。
参见图1所示,基于机器学习优化的绕线机张力网络化迭代学习控制的流程图,具体包括以下步骤:
步骤S1:张力控制系统建模:
参见图2所示,本发明卷绕系统结构图:
其中,L-卷绕材料形变后的长度(m)V11放卷轴转速(m/s)V25收卷轴转速(m/s)D11放卷轴直径(m/s)D25收卷轴直径(m/s)
根据胡克定律分析,卷绕系统的张力可表示为:
其中,σ为卷绕材料表面应力,ε为卷绕材料弹性形变量,E为卷绕材料的弹性模量,T为张力,A为卷绕材料横截面积,L0为卷绕材料的绝对形变量,L为当前状态下由于张力变形的绕组材料长度;
当V1≠V2时,在t+dt时间内的张力变化如下:
V=πDn (7)
其中,n为驱动电机的卷轴卷速;D为卷轴直径。
传统的卷绕系统主要通过控制电机驱动转轴来达到卷绕成型的目的。下文中将假设该系统中1放卷轴电机速度已经得到有效的控制,并且可以通过速度传感器测量其电机转速。因此,下文建立5收卷轴电机的数学模型,但该模型同样可以应用于1放卷轴电机。
建立绕线机张力控制系统速度环动力学模型,其方程如下:
其中,J为5收卷轴转动惯量;Ki为单位输入电压下的力矩常数;u为控制输入;B为摩擦与模型结合的等效系数;Ff(ω1)为静摩擦系数;△2(t,T,ω1)为不确定非线性;ω为卷轴角速度;r1为5收卷轴半径。
Ff(ω1)=a1 tanh(c1ω1)+a2[tanh(c2ω1)-tanh(c3ω1)] (10)
其中,a1、a2为系统的不同摩擦系数等级,ci,i=1,2,3为近似各种摩擦效应的形状参数。
步骤S2:设计具有初值变化的卷绕张力迭代控制器:
由公式(8)可知,在系统数学模型中,卷绕材料半径变化会引起卷轴直径D的变化,因此卷绕半径属于时变参数,在每一次的卷绕周期中会引起系统控制参数初值的变化。目前,有二种方法可以测得卷轴直径的变化。一是通过在收、放卷部分系统中配置专用的超声传感器、图像检测器或其他卷径测量装置对卷轴直径进行实时测量,该方法多数用于对测量精度要求高、卷径变化随时间变化大的情况中;另一种方法是通过电机编码器反馈的数据获得实际电机转动的角度或COUNT指令,计算卷轴直径的变化,该方法多数应用于卷径变化小、速度快的情况中。在工业复合材料卷绕系统中,由于卷绕材料半径较小,较多数文献忽略中间变化值的测量。因此,本文将采用第二种方法获取卷轴直径的初值,具体计算公式如下:
Dun=Du(n-1)-θu(n-1)A/2π (13)
Dwn=Dw(n-1)-θw(n-1)A/2π (14)
其中,Dun和Dwn分别为第n次卷绕前1放卷轴和5收卷轴的直径初值,Du(n-1)和Dw(n-1)为第n-1次卷绕前卷轴的直径初值,θu(n-1)和θw(n-1)为第n-1次卷绕后通过编码器反馈值计算所得的两卷轴转动的角位移。
具有初值变化的模糊张力迭代控制器:
Γk(t)=Γk-1(t)+△k (16)
△k=ξk×kp (17)
ηk(t)=ηk-1(t)+Θk (19)
Θk=γk×ki (20)
ek(t)=yd(t)-yk(t) (21)
其中,u(k)(t)为第k次迭代时系统的控制变量,xk(0)为第k次迭代时系统初始状态,yd(t)为第k次迭代时系统的输出期望值,yk(t)为第k次迭代时系统实际输出值。模糊控制器以系统输出误差ek(t)和误差变化率为输入,通过模糊推理输出调节因子ζk,每次迭代时,控制器提取模糊控制器输出的调节因子ζk乘以比例因子kp,构建一个与Γk相同位数的调节矩阵△k。同理模糊控制器以系统输入误差ek(0)和输入误差变化率/>为输入,通过模糊推理因子γk,每次迭代时,控制器提取模糊控制器输出的调节因子γk乘以比例因子ki,构建一个与ηk相同的调节矩阵Θk。
步骤S3:绕线机张力网络化迭代控制系统设计:
将卷绕系统简化为如下重复运行的SISO非线性离散系统:
其中,x(t)∈Rn,y(t)∈Rm,u(t)∈Rr分别表示系统的状态变量、系统的输出变量以及系统的控制变量。针对上述运行的重复运行的非线性系统,本节将给出如下假设条件。
假设1:非线性函数f(·)、b(·)、g(·)、d(·)对于系统的状态变量x(t)满足全局Lipschitz条件,即对所有的t∈[0,N],存在有限常数kf、kb、kg、kd满足:
||f(x1(t))-f(x2(t))||≤kf||x1(t)-x2(t)|| (23)
||b(x1(t))-b(x2(t))||≤kb||x1(t)-x2(t)|| (24)
||g(x1(t))-g(x2(t))||≤kg||x1(t)-x2(t)|| (25)
||d(x1(t))-d(x2(t))||≤kd||x1(t)-x2(t)|| (26)
其中,x1(t)和x2(t)为两个任意的状态变量。
假设2:对于给定的期望轨迹曲线yd(t),存在控制输入ud(t)和状态变量xd(t)满足下列条件:
其中,ud(t)和xd(t)称为期望输入与期望状态。
假设3:上述非线性离散系统的初始条件满足下式:
x(k+1)(0)=xk(0)+ψek(0) (28)
参见图3所示,为本发明网络化系统结构图:
由图3网络化迭代学习控制图可以看出,系统输出yk(t)以及迭代控制中迭代控制单元的控制输出在网络控制系统中由于网络堵塞、信号丢失等原因均会发生数据丢失现象。为了对数据丢失进行分析,在此给出卷绕系统网络化迭代学习控制数据丢包的数学描述。
假设已知变量ω(t),用来表示迭代控制中t时刻数据传输情况,本文假定变量ω(t)服从下列的0-1分布:
其中,X[ω(t)=1]表示变量ω(t)=1的概率;为已知常数,表示数据正常传输的概率。因此,对任意第k次迭代,均可以定义如下所示的丢包矩阵:
相同原理,可以定义迭代控制单元的控制输出在网络中的传输情况:
绕线机张力网络化迭代控制:
对于满足假设1-3的卷绕过程非线性系统,使用上述ILC算法。当系统出现数据丢包时,只要控制系统满足下式:
||I-L(dI+ΦJ)||1<1 (35)
便可得:
其中,
其中
(1)yk(t)表示卷绕控制系统张力的输出数据;
(2)表示卷绕控制系统张力的输出数据在传输过程中丢失部分进行机器学习优化拟合得到的第k次迭代输出的拟合值;
(3)表示由yk(t)和/>组合而成的输出向量,数据未丢失部分取yk(t),数据丢失部分取/>
(4)表示对第k次迭代拟合数据与真实数据的差值;
(5)表示迭代学习单元的实际输入数据;
(6)表示控制变量传输过程中丢失部分进行机器学习优化拟合得到的第k次迭代输出的拟合值;
(7)uk(t)表示由和/>组成的输出向量,数据未丢失部分取/>数据丢失部分取/>
(8)表示对第k次迭代拟合数据与真实数据的差值;
步骤S4:改进粒子群算法优化的张力网络化迭代控制系统设计:
在公式中可得网络化迭代控制系统的误差1范数取决于数据丢包率与数据的拟合逼近误差,另一方面可以说明,在数据丢包率相同的情况下,找到一个合理的误差拟合逼近策略可以使系统的收敛性能更好。
改进粒子群算法:
其中,Pi为粒子i当前位置;Vi为粒子i当前速度,Pa为粒子i在当前时刻的最佳位置,Pb为在整个粒子群中的最佳位置。c1和c2为认知系数,r1和r2为属于(0,1)的随机实数,βi为惯性权重,用于粒子群在搜索空间的探索和开发中实现平衡。惯性权重在每一代中从1.0到接近0运行期间动态减小,其具体表达式如下:
其中,itermax为最大迭代次数,iter当前迭代次数。
不同类型的突变算子可以用来增加种群的多样性,并帮助粒子群算法跳出局部最小值。变异算子的类型可能更有效,也可能更差,这取决于优化过程的阶段。在本文中,三种不同类型的变异算子应用于问题的不同阶段,以进一步探索搜索空间。本文提出一种自适应的方法来选择适合于问题各个阶段的变异算子。
柯西突变算子(Cauchy Mutation operator):
Vg=Vg exp(δ) (43)
Pg=Pg+Vgδg (44)
其中,Pg和Vg为全局最佳例子的位置和速度。δ和δg为标度参数为1的柯西随机数。
高斯突变算子(Gaussian Mutation operator):
Vg=Vg exp(θ) (45)
Pg=Pg+Vgθg (46)
其中,Pg和Vg为全局最佳例子的位置和速度。δ和δg为平均值为0,方差为1的高斯分布数。
Levy突变算子(Levy Mutation operator):
Vg=Vg exp(L(α)) (47)
Pg=Pg+VgLg(α) (48)
其中,L(α)和Lg(α)是由Levy分布阐述的随机实数,参数α设置为1.3。
对自适应变异提出的方法使用了上述三种变异算子。最初,通过该比率将选择比率设置为等于1/3,随后计算每个算子突变的粒子的数量。然后,根据每个变异算子的选择率将其应用于群体粒子中,最后评估由此产生的后代适合度。
与后代适应度较低的另一个突变算子相比,后代适应度值更高的突变算子将被选择。选择最佳的突变算子的步骤如下所示:
每一代粒子群操作进度值评估:
其中,和/>为突变算子i在第t代产生的亲本及其子代的适合度,Mi为突变算子i突变的粒子数。
每一代粒子群反馈值评估:
其中,Zi为算子i在突变之后其子代具有比他们自己更好的适应度的粒子的数量,Ki为突变算子在第t代的选择率,η为介于(0,1)之间的随机权重系数,N为突变运算符的数目,ci为突变算子i的惩罚因子,具体定义为:
突变算子对下一代的选择更新率:
其中,λ为每个突变算子i的最小选择比。
参见图4所示,使用MATLAB建立本发明控制方绕线机张力网络化控制方法并进行仿真,绕线机张力控制系统系统主要由1放卷轴、2放卷轮、3张力检测器、4收卷轮、5收卷轴等组成,绕线机张力控制系统具体参数参考如下,具体参数为:杨氏模量E/(N/m2)1.6×10-9;材料横截面积A/(A/m2)1.2×10-6;放卷线速度v2/(m/s)0.5;5收卷轴直径D1/(m)0.2;5收卷轴转动惯量ε(N/m)0.0146;电压力矩常数Ki 1;摩擦阻尼系数B 0.25;摩擦等级系数a1、a20.02 0.01;摩擦形状系数c1、c2、c3 700 15 15;取学习增益L=0.3。
参见图4、5所示,使用MATLAB仿真数据丢包率为25%和50%下的绕线机张力控制系统未处理下的张力输出误差(1-范数)曲线图根据图4、5可知在网络化迭代控制卷绕过程张力控制系统中,如果对网络化迭代学习系统的丢包数据不作处理,即便丢包率较小,系统都会变得极不稳定,无法达到正常的跟踪效果。因此,设计一种优化的迭代控制算法以实现绕线机系统存在数据丢失时的张力控制。
参见图6、7、8、9所示,通过适当地选择学习增益因子,当网络传输丢包率较小时,采用机器学习优化算法对应用装置输出端以及输入端的逼近较为精确,系统跟踪情况良好;当网络传输丢包率较大时,系统误差会出现小范围波动状态,系统会出现不稳定状态。因此,在进行工程实践之时,要尽量采用传输精度较高的渠道,降低数据丢包概率,以避免系统出现不稳定状态。
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步的详细说明,所应理解的是,实施例仅用于解释本发明,并不用于限定本发明的保护范围。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (5)
1.一种基于机器学习优化的绕线机张力网络化迭代学习控制方法,其特征在于:以绕线机张力差为输入,通过设计具有初值变化的卷绕张力迭代控制器与设计遗传算法优化下的BP神经网络张力控制系统,将绕线半径的缓慢变化设定为迭代学习中的初始状态变化问题,并提出了一种具有初始状态学习律的迭代学习控制算法;考虑到工业实际生产中绕线机网络化控制系统存在数据丢包和时延等现象,将工业生产中的数据包丢失问题描述为一个已知概率的随机伯努利过程,采用机器学习中遗传算法优化下的BP神经网络预测存在数据丢失下的系统输出;所述方法包含以下步骤:
S1:张力控制系统建模;
S2:设计具有初值变化的卷绕张力迭代控制器;
S3:绕线机张力网络化迭代控制系统设计;
S4:改进粒子群算法优化的张力网络化迭代控制系统设计。
2.根据权利要求1所述的一种基于机器学习优化的绕线机张力网络化迭代学习控制方法,其特征在于,步骤S1中,所述张力控制系统建模:
建立绕线机张力控制系统张力环动力学模型,其方程如下:
根据胡克定律分析,卷绕系统的张力可表示为:
其中,σ为卷绕材料表面应力,ε为卷绕材料弹性形变量,E为卷绕材料的弹性模量,T为张力,A为卷绕材料横截面积,L0为卷绕材料的绝对形变量,L为当前状态下由于张力变形的绕组材料长度;
当V1≠V2时,在t+dt时间内的张力变化如下:
V=πDn
其中,n为驱动电机的卷轴卷速;D为卷轴直径;
建立绕线机张力控制系统速度环动力学模型,其方程如下:
其中,J为5收卷轴转动惯量;Ki为单位输入电压下的力矩常数;u为控制输入;B为摩擦与模型结合的等效系数;Ff(ω1)为静摩擦系数;△2(t,T,ω1)为不确定非线性;ω为卷轴角速度;r1为5收卷轴半径;
Ff(ω1)=a1tanh(c1ω1)+a2[tanh(c2ω1)-tanh(c3ω1)]
其中,a1、a2为系统的不同摩擦系数等级,ci,i=1,2,3为近似各种摩擦效应的形状参数;
3.根据权利要求1所述的一种基于机器学习优化的绕线机张力网络化迭代学习控制方法,其特征在于,步骤S2中,所述设计具有初值变化的卷绕张力迭代控制器:
通过电机编码器反馈的数据获得实际电机转动的角度或COUNT指令,计算卷径的变化,其方程如下:
Dun=Du(n-1)-θu(n-1)A/2π
Dwn=Dw(n-1)-θw(n-1)A/2π
其中,Dun和Dwn分别为第n次卷绕前1放卷轴和5收卷轴的直径初值,Du(n-1)和Dw(n-1)为第n-1次卷绕前卷轴的直径初值,θu(n-1)和θw(n-1)为第n-1次卷绕后通过编码器反馈值计算所得的两卷轴转动的角位移;
具有初值变化的模糊张力迭代控制器:
Γk(t)=Γk-1(t)+△k
△k=ξk×kp
ηk(t)=ηk-1(t)+Θk
Θk=γk×ki
ek(t)=yd(t)-yk(t)
其中,u(k)(t)为第k次迭代时系统的控制变量,xk(0)为第k次迭代时系统初始状态,yd(t)为第k次迭代时系统的输出期望值,yk(t)为第k次迭代时系统实际输出值;模糊控制器以系统输出误差ek(t)和误差变化率为输入,通过模糊推理输出调节因子ζk,每次迭代时,控制器提取模糊控制器输出的调节因子ζk乘以比例因子kp,构建一个与Γk相同位数的调节矩阵△k;同理模糊控制器以系统输入误差ek(0)和输入误差变化率/>为输入,通过模糊推理因子γk,每次迭代时,控制器提取模糊控制器输出的调节因子γk乘以比例因子ki,构建一个与ηk相同的调节矩阵Θk。
4.根据权利要求1所述的一种基于机器学习优化的绕线机张力网络化迭代学习控制方法,其特征在于,步骤S3中,所述设绕线机张力网络化迭代控制系统设计:
将卷绕系统简化为如下重复运行的SISO非线性离散系统:
其中,x(t)∈Rn,y(t)∈Rm,u(t)∈Rr分别表示系统的状态变量、系统的输出变量以及系统的控制变量;
使用上述ILC算法,当系统出现数据丢包时,只要控制系统满足下式:
||I-L(dI+ΦJ)||1<1
便可得:
其中,
5.根据权利要求1所述的一种基于机器学习优化的绕线机张力网络化迭代学习控制方法,其特征在于,步骤S4中,所述改进粒子群算法优化的张力网络化迭代控制系统设计:
在公式中可得网络化迭代控制系统的误差1范数取决于数据丢包率与数据的拟合逼近误差,另一方面可以说明,在数据丢包率相同的情况下,找到一个合理的误差拟合逼近策略可以使系统的收敛性能更好;
改进粒子群算法:
其中,Pi为粒子i当前位置;Vi为粒子i当前速度,Pa为粒子i在当前时刻的最佳位置,Pb为在整个粒子群中的最佳位置。c1和c2为认知系数,r1和r2为属于(0,1)的随机实数,βi为惯性权重,用于粒子群在搜索空间的探索和开发中实现平衡;惯性权重在每一代中从1.0到接近0运行期间动态减小,其具体表达式如下:
其中,itermax为最大迭代次数,iter当前迭代次数;
每一代粒子群操作进度值评估:
其中,和/>为突变算子i在第t代产生的亲本及其子代的适合度,Mi为突变算子i突变的粒子数;
每一代粒子群反馈值评估:
其中,Zi为算子i在突变之后其子代具有比他们自己更好的适应度的粒子的数量,Ki为突变算子在第t代的选择率,η为介于(0,1)之间的随机权重系数,N为突变运算符的数目,ci为突变算子i的惩罚因子,具体定义为:
突变算子对下一代的选择更新率:
其中,λ为每个突变算子i的最小选择比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310883376.0A CN116841207A (zh) | 2023-07-18 | 2023-07-18 | 基于机器学习优化的绕线机张力网络化迭代学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310883376.0A CN116841207A (zh) | 2023-07-18 | 2023-07-18 | 基于机器学习优化的绕线机张力网络化迭代学习控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116841207A true CN116841207A (zh) | 2023-10-03 |
Family
ID=88170610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310883376.0A Pending CN116841207A (zh) | 2023-07-18 | 2023-07-18 | 基于机器学习优化的绕线机张力网络化迭代学习控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116841207A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117592872A (zh) * | 2024-01-19 | 2024-02-23 | 钛玛科(北京)工业科技有限公司 | 一种电五金卷绕工序的尺寸闭环控制方法 |
CN117775886A (zh) * | 2024-02-26 | 2024-03-29 | 太原理工大学 | 一种用于纤维缠绕的高性能张力控制方法及系统 |
-
2023
- 2023-07-18 CN CN202310883376.0A patent/CN116841207A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117592872A (zh) * | 2024-01-19 | 2024-02-23 | 钛玛科(北京)工业科技有限公司 | 一种电五金卷绕工序的尺寸闭环控制方法 |
CN117592872B (zh) * | 2024-01-19 | 2024-04-30 | 钛玛科(北京)工业科技有限公司 | 一种电五金卷绕工序的尺寸闭环控制方法 |
CN117775886A (zh) * | 2024-02-26 | 2024-03-29 | 太原理工大学 | 一种用于纤维缠绕的高性能张力控制方法及系统 |
CN117775886B (zh) * | 2024-02-26 | 2024-05-10 | 太原理工大学 | 一种用于纤维缠绕的高性能张力控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116841207A (zh) | 基于机器学习优化的绕线机张力网络化迭代学习控制方法 | |
Soltanpour et al. | A particle swarm optimization approach for fuzzy sliding mode control for tracking the robot manipulator | |
CN108637020B (zh) | 一种自适应变异pso-bp神经网络带钢凸度预测方法 | |
Oh et al. | A comparative experimental study of type-1/type-2 fuzzy cascade controller based on genetic algorithms and particle swarm optimization | |
Duong et al. | A hybrid evolutionary algorithm for recurrent neural network control of a three-dimensional tower crane | |
Lin | A reinforcement learning adaptive fuzzy controller for robots | |
Narendra et al. | Fast Reinforcement Learning using multiple models | |
CN109189075B (zh) | 一种舰船用模糊遗忘因子无模型自适应航向控制方法 | |
Al-Dabooni et al. | Online model-free n-step HDP with stability analysis | |
Hajebi et al. | Online adaptive fuzzy logic controller using genetic algorithm and neural network for networked control systems | |
CN112987572A (zh) | 一种基于先验知识的自适应球杆系统粒子群优化方法 | |
Aghaseyedabdollah et al. | Interval type-2 fuzzy sliding mode control for a cable-driven parallel robot with elastic cables using metaheuristic optimization methods | |
Kumar et al. | An adaptive particle swarm optimization algorithm for robust trajectory tracking of a class of under actuated system | |
Ikemoto et al. | Continuous deep Q-learning with a simulator for stabilization of uncertain discrete-time systems | |
CN116880191A (zh) | 一种基于时序预测的过程工业生产系统的智能控制方法 | |
CN114406996B (zh) | 一种输入受限机械臂的合作博弈最优跟踪控制方法及系统 | |
Tar et al. | Convergence properties of the modified renormalization algorithm based adaptive control supported by ancillary methods | |
CN115741692A (zh) | 一种基于数据驱动的液压机械臂高精度控制方法及系统 | |
Renno | Inverse dynamics based tuning of a fuzzy logic controller for a single-link flexible manipulator | |
CN113485099A (zh) | 一种非线性离散时间系统的在线学习控制方法 | |
Hendzel et al. | Neural network identifier of a four-wheeled mobile robot subject to wheel slip | |
Han et al. | A novel multi-pulse friction compensation strategy for hybrid robots | |
CN110320796A (zh) | 一种基于pid控制器的电气控制方法、装置以及设备 | |
Vijay et al. | Optimal backstepping sliding mode control for robot manipulator | |
CN116864307A (zh) | 基于非线性观测器的多轴绕线机张力滑模自寻优控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |