CN115826570A - 基于ssa-pidnn的太空采矿机器人轨迹控制方法 - Google Patents

基于ssa-pidnn的太空采矿机器人轨迹控制方法 Download PDF

Info

Publication number
CN115826570A
CN115826570A CN202211407575.6A CN202211407575A CN115826570A CN 115826570 A CN115826570 A CN 115826570A CN 202211407575 A CN202211407575 A CN 202211407575A CN 115826570 A CN115826570 A CN 115826570A
Authority
CN
China
Prior art keywords
mining robot
space mining
weight
space
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211407575.6A
Other languages
English (en)
Inventor
刘新华
王百一
华德正
刘霄阳
格热戈尔茨·罗尔奇克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN202211407575.6A priority Critical patent/CN115826570A/zh
Publication of CN115826570A publication Critical patent/CN115826570A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种基于SSA‑PIDNN的太空采矿机器人轨迹控制方法,在太空采矿机器人的基础上,利用反演控制法建立其运动学模型,将复杂的非线性系统分解成多个更简单和阶数更低的系统,实现对太空采矿机器人轨迹控制系统的有效控制和全局调节;在控制算法上,以麻雀搜索算法为基础,同时加入了步长调整因子和飞行策略,较基础的麻雀搜索算法,极大地提高了算法寻优能力,避免算法陷入局部最优;利用智能优化算法的信息综合能力和强学习效率,对神经网络PID控制系统的初始权值和阈值进行最优初始化,使得优化之后的神经网络PID具有较高的自学习能力,保证了整个系统的鲁棒性,极大地增强了该系统的轨迹控制效果。

Description

基于SSA-PIDNN的太空采矿机器人轨迹控制方法
技术领域
本发明涉及一种太空采矿机器人的轨迹控制方法,具体为一种基于SSA-PIDNN的太空采矿机器人轨迹控制方法,属于航天技术领域。
背景技术
根据2022年《世界能源统计年鉴》中的统计数据显示,2021年全球天然气需求增长5.3%,首次超过了4万亿立方米。2021年全球煤炭消费增长超过6%,达到160艾焦,是自2014年以来的最高水平。随着能源需求的不断增加,寻求其他的可利用资源,破解地球矿产资源日益枯竭的难题,开发与利用丰富的太空资源势在必行!
太阳系中,有着超过2300颗的近地小行星,其中C类和M类小行星含有丰富的矿产资源,据科学家估计,其蕴含的矿产、稀有金属资源总价高达千亿,甚至数万亿美元。而且近年来,在各国政府科研院的大力支持下,太空采矿的研究迎来了新的发展机遇。随着空间机器人技术的不断发展和完善,人类对太空探索的需求逐渐增多,太空资源的开发与利用将是未来各国竞争的新方向。
目前,我国在应用到近地小行星的太空机器人的轨迹控制方法方面的研究主要存在以下缺点:
(1)多数的控制器目前仍以PID控制器为主,但是常规的PID控制无法满足太空采矿机器人在其复杂工况下的较高的性能要求;
(2)目前对于太空采矿设备的研究还处于起步阶段,针对该研究对象的控制算法较少,急需一种针对太空设备的、具有较高学习效率和搜索能力的智能控制方法。
发明内容
本发明的目的就在于为了解决上述至少一个技术问题而提供一种基于SSA-PIDNN的太空采矿机器人轨迹控制方法。
本发明通过以下技术方案来实现上述目的:一种基于SSA-PIDNN的太空采矿机器人轨迹控制方法,包括基于太空采矿机器人所构建的太空采矿机器人的运动学模型,所述太空采矿机器人包括车体,所述车体两侧连接有由悬架以及车轮所构成的移动模块,所述车体的上板面前端连接有由抓取机械臂以及配套摄像头所构成的采样抓取模块,所述车体的前侧板面中间部位连接有由螺旋钻头组成的钻探模块,所述车体的前侧板面一侧边角处连接有由摄像头所构成的摄像感知模块;
太空采矿机器人轨迹控制方法包括以下步骤:
步骤一、确定太空采矿机器人神经网络PID控制的网络结构,初始化神经网络的权值和阈值,并将优化参数带入适应度函数计算目标适应度;
步骤二、根据适应度值大小对参数进行排列,适应度最优的前20%的权值、阈值作为发现者,并根据发现者公式更新发现者的位置,适应度最差的后80%的权值、阈值作为跟随者,并根据跟随者公式更新跟随者的位置;
步骤三、随机挑选10%-20%的权值、阈值作为警戒者,并根据警戒者公式更新警戒者的位置,根据适应度大小将每组的权值、阈值更新为最优解;
步骤四、将n组更新后的权值、阈值进行比较,保留其中的最优解;
步骤五、若最优解没有超过最大迭代次数,则重新根据适应度值大小对参数进行排列,若最优解超过最大迭代次数,则获取最优权值,阈值;
步骤六、根据所获取的最优权值以及阈值,进行神经网络模型训练,若训练误差小于目标误差,或者训练次数达到预定值,则输出最优参数值,若训练误差未小于目标误差,或者训练次数未达到预定值,则重新进行神经网络模型训练。
作为本发明再进一步的方案:所述太空采矿机器人的运动学模型构建,具体包括:
太空采矿机器人的运动状态由机器人质心点在所处的坐标系的位置和航向角来表示,令
Figure SMS_1
其中x、y为太空采矿机器人在坐标系下的横纵坐标位置,θ为机器人的航向角,即为太空采矿机器人运动速度方向和x轴方向的夹角;
v,ω分别为太空采矿机器人的运动速度和转动角速度。
则太空采矿机器人在坐标系中的运动学方程可以描述为:
Figure SMS_2
控制系统的误差可以表示为:
ep=[ex,ey,eθ]T=[xd-x,yd-y,θd-θ]T
其中,ex表示x轴方向的位置误差,ey表示y轴方向的位置误差,eθ表示航向角误差。xd,yd表示太空采矿机器人在x轴和y轴下的目标坐标位置,θd表示太空采矿机器人的理想航向角;
通过控制太空采矿机器人的输入量q=[v,ω]T,使其在任意时刻的ep都趋近于0,则可以完成稳定的轨迹跟踪控制。
作为本发明再进一步的方案:所述步骤一中,太空采矿机器人神经网络PID控制的网络结构中的初始权值和阈值通过改进麻雀搜索算法进行修正,将初始的权值阈值输入到麻雀搜索算法中,具体包括:
在麻雀搜索算法中,麻雀种群分为发现者、跟随者和警戒者三类,设置种群中麻雀的数量为n,根据需要初始化权值和阈值的数量,设置待优化问题变量的维数为d,则由n只麻雀组成的种群可以表示为:
Figure SMS_3
全部麻雀的适应度值可以表示为:
Figure SMS_4
在麻雀搜索算法中,在每次迭代都会更新发现者的位置,更新描述如下:
Figure SMS_5
其中,t表示目前的迭代参数,j=1,2,3,…,d表示当前计算的问题维数,itemmax为常数,表示最大迭代次数,xi,j表示第i只麻雀在第j维中的位置信息,α(α∈(0,1])是一个随机数,R2(R2∈[0,1])和ST(ST∈[0.5,1])分别表示预警值和安全值,Q是服从正态分布的随机数,L表示一个1×d的矩阵,其中该矩阵内的每个元素的值均为1。
对于加入者,其位置更新描述如下:
Figure SMS_6
其中,Xp是目前发现者所占据的最优位置,Xworst表示当前全局最差的位置。A表示一个1×d的矩阵,其中每个元素随机赋值为1或-1,并且A+=AT(AAT)-1。当
Figure SMS_7
时,这表明,适应度值较低的第i个加入者没有获得食物,处于十分饥饿的状态,此时需要飞往其它地方觅食,以获得更多的能量。
作为本发明再进一步的方案:所述麻雀搜索算法中,在麻雀种群随机挑选10%~20%的麻雀作为警戒者,这些麻雀的初始位置是在种群中随机产生的。同时,引入Levy飞行策略,其位置更新的表达式可以表示为如下形式:
Figure SMS_8
Figure SMS_9
其中,Xbest是当前的全局最优位置;β和K为步长控制参数;fi则是当前麻雀个体的适应度值;fg和fw分别是当前全局最佳和最差的适应度值;ε是常数,为了避免分母出现零,τ为gamma函数,β为常数,r1和r2分别为0-1的随机数。
作为本发明再进一步的方案:所述太空采矿机器人神经网络PID控制的网络结构最优权值和阈值的确定,具体包括:
对步长控制参数β和K进行改进,改进公式为:
Figure SMS_10
在使用麻雀搜索算法优化神经网络PID初始权值和阈值过程中,目标函数的设置如下:
Figure SMS_11
其中,e(t)表示输入和输出的误差,加入u(t)避免控制幅度过大,ω1和ω2为权重,通过确定初始化神经网络PID最优的权值和阈值,避免传统麻雀搜索算法随机生成的种群分布不均匀,会导致种群多样性减少,种群质量不高,算法的收敛速度较慢等问题。
作为本发明再进一步的方案:所述神经网络PID控制系统中,r1,r2,r3表示该控制系统的输入值,u1,u2,u3是该控制系统的输出值;
其中,设置在采样时刻k时,输入层的神经元的计算公式为:
xsi(k)=usi(k)
式中,usi表示输入层神经元的输入值,xsi表示输入层神经元的输出值,i(i=1,2)为神经网络中单一子网的输入层序号;s(s=1,2,3)为并列的子网的序号数量;
隐含层中各单元总的输入值如下:
Figure SMS_12
隐含层的三个神经元分别对应PID控制系统中的比例、积分、微分项,三个神经元的计算公式为:
比例神经元的计算公式为:
x′s1(k)=u′s1(k)
积分神经元的计算公式为:
x′s2(k)=u′s2(k)+x′s2(k-1)
微分神经元的计算公式为:
x′s3(k)=u′s3(k)-u′s3(k-1)
其中,j(j=1,2,3)分别为隐含层神经元的序号;u′sj和x′sj分别为隐含层的输入值和输出值;ωsij为各子网输入层到隐含层的权值;
输出层神经元的输出值为隐含层全部神经元的输出值的加权和,计算公式如下:
Figure SMS_13
其中,u′h和x′h分别表示输出层神经元的输入值和输出值。
作为本发明再进一步的方案:所述神经网络PID控制系统的PID算法可以根据太空采矿机器人实际轨迹和理想轨迹的误差,按照梯度修正法修改其权重,并逐渐适应太空采矿机器人理想轨迹的特性,使实际轨迹不断逼近理想轨迹,以达到解耦的功能。权值校正过程如下:
Figure SMS_14
其中,r和yh在该控制系统中分别为太空采矿机器人的实际轨迹和理想轨迹。
作为本发明再进一步的方案:所述输入层到隐含层权重的修改方式:
Figure SMS_15
其中,ωij(k+1)表示修正过后的输入层到隐含层权重,ωij(k)表示修正前的权重,μ1表示隐含层到输出层权重修正学习速率因子;
隐含层到输出层权重的修改方式:
Figure SMS_16
其中,ωjk(k+1)表示修正过后的隐含层到输出层权重,ωjk(k)表示修正前的权重,μ2表示隐含层到输出层权重修正学习速率因子。
本发明的有益效果是:
根据太空采矿车的自身特点建立其轨迹控制模型,并且在运动学建模过程中,采用反演控制法对模型进行分析,将复杂的非线性系统分解成多个更简单和阶数更低的系统,然后选择函数来保证系统的稳定性,并逐步导出最终的控制率及参数自适应律,实现对太空采矿机器人轨迹控制系统的有效控制和全局调节;
其次,本发明在控制算法的选取上,以麻雀搜索算法为基础,同时加入了步长调整因子和飞行策略,较基础的麻雀搜索算法,极大地提高了算法寻优能力,避免算法陷入局部最优。利用智能优化算法的信息综合能力和强学习效率,对神经网络PID控制系统的初始权值和阈值进行最优初始化,使得优化之后的神经网络PID具有较高的自学习能力,保证了整个系统的鲁棒性,极大地增强了该系统的轨迹控制效果。
附图说明
图1为本发明研究对象“太空采矿机器人”的三维模型图;
图2为本发明的太空采矿机器人轨迹跟踪的运动学表示图;
图3为本发明的太空采矿机器人的控制系统表示图;
图4为本发明的太空采矿机器人的SSA-PIDNN控制方法表示图;
图5为本发明的多变量神经网络PID控制系统结构图;
图6为本发明的多变量下SSA-PIDNN控制系统对预设目标的控制效果图;
图7为本发明的SSA-PIDNN控制系统与传统PIDNN控制系统在误差变化上的效果对比图。
图中:1、移动模块,2、采样抓取模块,3、钻探模块,4、摄像感知模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图1至图2所示,一种基于SSA-PIDNN的太空采矿机器人轨迹控制方法,包括基于太空采矿机器人所构建的太空采矿机器人的运动学模型,所述太空采矿机器人包括车体,所述车体两侧连接有由悬架以及车轮所构成的移动模块1,所述车体的上板面前端连接有由抓取机械臂以及配套摄像头所构成的采样抓取模块2,所述车体的前侧板面中间部位连接有由螺旋钻头组成的钻探模块3,所述车体的前侧板面一侧边角处连接有由摄像头所构成的摄像感知模块4;
其算法包括以下步骤:
步骤一、确定太空采矿机器人神经网络PID控制的网络结构,初始化神经网络的权值和阈值,并将优化参数带入适应度函数计算目标适应度;
步骤二、根据适应度值大小对参数进行排列,适应度最优的前20%的权值、阈值作为发现者,并根据发现者公式更新发现者的位置,适应度最差的后80%的权值、阈值作为跟随者,并根据跟随者公式更新跟随者的位置;
步骤三、随机挑选10%-20%的权值、阈值作为警戒者,并根据警戒者公式更新警戒者的位置,根据适应度大小将每组的权值、阈值更新为最优解;
步骤四、将n组更新后的权值、阈值进行比较,保留其中的最优解;
步骤五、若最优解没有超过最大迭代次数,则重新根据适应度值大小对参数进行排列,若最优解超过最大迭代次数,则获取最优权值,阈值;
步骤六、根据所获取的最优权值以及阈值,进行神经网络模型训练,若训练误差小于目标误差,或者训练次数达到预定值,则输出最优参数值,若训练误差未小于目标误差,或者训练次数未达到预定值,则重新进行神经网络模型训练。
在本发明实施例中,所述太空采矿机器人的运动学模型构建,具体包括:
太空采矿机器人的运动状态由机器人质心点在所处的坐标系的位置和航向角来表示,令
Figure SMS_17
其中x、y为太空采矿机器人在坐标系下的横纵坐标位置,θ为机器人的航向角,即为太空采矿机器人运动速度方向和x轴方向的夹角;
v,ω分别为太空采矿机器人的运动速度和转动角速度。
则太空采矿机器人在坐标系中的运动学方程可以描述为:
Figure SMS_18
控制系统的误差可以表示为:
ep=[ex,ey,eθ]T=[xd-x,yd-y,θd-θ]T
其中,ex表示x轴方向的位置误差,ey表示y轴方向的位置误差,eθ表示航向角误差。xd,yd表示太空采矿机器人在x轴和y轴下的目标坐标位置,θd表示太空采矿机器人的理想航向角。
通过控制太空采矿机器人的输入量q=[v,ω]T,使其在任意时刻的ep都趋近于0,则可以完成稳定的轨迹跟踪控制。
设太空采矿机器人的理想轨迹为
Figure SMS_19
从式中可以看出,xd,yd,θd三个连之间存在一定关系,只有两个量独立,故设计太空采矿机器人运动学反演控制器,并引入虚拟控制量α,可得
Figure SMS_20
建立Lyapunov函数如下
Figure SMS_21
进行求导,可得
Figure SMS_22
假设
Figure SMS_23
代入上式中可得
Figure SMS_24
Figure SMS_25
则太空采矿车的线速度v和虚拟控制量α为
Figure SMS_26
Figure SMS_27
当太空采矿车的控制系统误差ex,ey趋近于0时,则
Figure SMS_28
当α趋近于θd时,有
Figure SMS_29
因此,为了使θ可以很好的跟踪θd,应使得θ跟踪α。设eθ=α-θd,则
Figure SMS_30
根据Lyapunov函数,设
Figure SMS_31
求导可得
Figure SMS_32
其中,控制量
Figure SMS_33
Figure SMS_34
则当c1>0,C2>0,c3>0时,
Figure SMS_35
此时系统是相对稳定的。
实施例二
如图3至图4所示,本实施例中除包括实施例一中的所有技术特征之外,还包括:
太空采矿机器人神经网络PID控制的网络结构中的初始权值和阈值通过改进麻雀搜索算法进行修正,将初始的权值阈值输入到麻雀搜索算法中,具体包括:
在麻雀搜索算法中,麻雀种群分为发现者、跟随者和警戒者三类,设置种群中麻雀的数量为n,根据需要初始化权值和阈值的数量,设置待优化问题变量的维数为d,则由n只麻雀组成的种群可以表示为:
Figure SMS_36
全部麻雀的适应度值可以表示为:
Figure SMS_37
在麻雀搜索算法中,在每次迭代都会更新发现者的位置,更新描述如下:
Figure SMS_38
其中,t表示目前的迭代参数,j=1,2,3,…,d表示当前计算的问题维数,itemmax为常数,表示最大迭代次数,xi,j表示第i只麻雀在第j维中的位置信息。α(α∈(0,1])是一个随机数,R2(R2∈[0,1])和ST(ST∈[0.5,1])分别表示预警值和安全值。Q是服从正态分布的随机数,L表示一个1×d的矩阵,其中该矩阵内的每个元素的值均为1。
对于加入者,其位置更新描述如下:
Figure SMS_39
其中,Xp是目前发现者所占据的最优位置,Xworst表示当前全局最差的位置。A表示一个1×d的矩阵,其中每个元素随机赋值为1或-1,并且A+=AT(AAT)-1。当
Figure SMS_40
时,这表明,适应度值较低的第i个加入者没有获得食物,处于十分饥饿的状态,此时需要飞往其它地方觅食,以获得更多的能量。
在本发明实施例中,所述麻雀搜索算法中,在麻雀种群随机挑选10%~20%的麻雀作为警戒者,这些麻雀的初始位置是在种群中随机产生的。同时,引入Levy飞行策略,其位置更新的表达式可以表示为如下形式:
Figure SMS_41
其中,Xbest是当前的全局最优位置;β和K为步长控制参数;fi则是当前麻雀个体的适应度值;fg和fw分别是当前全局最佳和最差的适应度值;ε是常数,为了避免分母出现零,τ为gamma函数,β为常数,r1和r2分别为0-1的随机数。
在本发明实施例中,所述太空采矿机器人神经网络PID控制的网络结构最优权值和阈值的确定,具体包括:
对步长控制参数β和K进行改进,改进公式为:
Figure SMS_42
在使用麻雀搜索算法优化神经网络PID初始权值和阈值过程中,目标函数的设置如下:
Figure SMS_43
其中,e(t)表示输入和输出的误差,加入u(t)避免控制幅度过大,ω1和ω2为权重,通过确定初始化神经网络PID最优的权值和阈值,避免传统麻雀搜索算法随机生成的种群分布不均匀,会导致种群多样性减少,种群质量不高,算法的收敛速度较慢等问题。
在本发明实施例中,所述神经网络PID控制系统中,r1,r2,r3表示该控制系统的输入值,u1,u2,u3是该控制系统的输出值;
其中,设置在采样时刻k时,输入层的神经元的计算公式为:
xsi(k)=usi(k)
式中,usi表示输入层神经元的输入值,xsi表示输入层神经元的输出值,i(i=1,2)为神经网络中单一子网的输入层序号;s(s=1,2,3)为并列的子网的序号数量;
隐含层中各单元总的输入值如下:
Figure SMS_44
隐含层的三个神经元分别对应PID控制系统中的比例、积分、微分项,三个神经元的计算公式为:
比例神经元的计算公式为:
x′s1(k)=u′s1(k)
积分神经元的计算公式为:
x′s2(k)=u′s2(k)+x′s2(j-1)
微分神经元的计算公式为:
x′s3(k)=u′s3(k)-u′s3(k-1)
其中,j(j=1,2,3)分别为隐含层神经元的序号;u′sj和x′sj分别为隐含层的输入值和输出值;ωsij为各子网输入层到隐含层的权值;
输出层神经元的输出值为隐含层全部神经元的输出值的加权和,计算公式如下:
Figure SMS_45
其中,u′h和x′h分别表示输出层神经元的输入值和输出值。
在本发明实施例中,所述神经网络PID控制系统的PID算法可以根据太空采矿机器人实际轨迹和理想轨迹的误差,按照梯度修正法修改其权重,并逐渐适应太空采矿机器人理想轨迹的特性,使实际轨迹不断逼近理想轨迹,以达到解耦的功能。权值校正过程如下:
Figure SMS_46
其中,r和yh在该控制系统中分别为太空采矿机器人的实际轨迹和理想轨迹。
在本发明实施例中,所述输入层到隐含层权重的修改方式:
Figure SMS_47
其中,ωij(j+1)表示修正过后的输入层到隐含层权重,ωij(k)表示修正前的权重,μ1表示隐含层到输出层权重修正学习速率因子;
隐含层到输出层权重的修改方式:
Figure SMS_48
其中,ωjk(k+1)表示修正过后的隐含层到输出层权重,ωjk(k)表示修正前的权重,μ2表示隐含层到输出层权重修正学习速率因子。
实施例三
如图5所示,一种基于SSA-PIDNN的太空采矿机器人轨迹控制方法,选取一个三变量的PIDNN解耦控制系统。与基础的PIDNN控制系统进行比较,验证SSA-PIDNN控制系统的控制优势。
该控制系统模型如下:
Figure SMS_49
实施例四
如图6至图7所示,本实施例中除包括实施例三中的所有技术特征之外,还包括:
进行matlab仿真验证,设置麻雀搜索算法的初始种群数量为100,最大迭代次数为150次,控制器的目标分别为[0.7,0.4,0.6],隐含层到输出层的学习率μ1=0.006,输入层到隐含层的学习率μ2=0.001。
如图6是对控制目标跟踪趋近的仿真结果。通过上述结果可以看出,经过麻雀搜索算法优化的PIDNN算法相较于传统的PIDNN算法具有较好的目标响应时间,且整个控制过程较为稳定,具有较好的控制效果。
如图7是对控制系统控制误差的迭代仿真结果。通过上述结果可以看出,经过麻雀搜索算法优化的PIDNN算法相较于传统的PIDNN算法具有较小的控制累计误差,且误差衰减速度较快,验证了整个优化控制系统良好的自学习能力及自适应能力。
在太空采矿机器人的基础上,利用反演控制法建立其运动学模型,将复杂的非线性系统分解成多个更简单和阶数更低的系统,实现对太空采矿机器人轨迹控制系统的有效控制和全局调节。在控制算法上,以麻雀搜索算法为基础,同时加入了步长调整因子和飞行策略,较基础的麻雀搜索算法,极大地提高了算法寻优能力,避免算法陷入局部最优。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (8)

1.一种基于SSA-PIDNN的太空采矿机器人轨迹控制方法,其特征在于:
包括基于太空采矿机器人所构建的太空采矿机器人的运动学模型;
所述太空采矿机器人包括车体;
所述车体两侧连接有由悬架以及车轮所构成的移动模块(1);
所述车体的上板面前端连接有由抓取机械臂以及配套摄像头所构成的采样抓取模块(2);
所述车体的前侧板面中间部位连接有由螺旋钻头组成的钻探模块(3);
所述车体的前侧板面一侧边角处连接有由摄像头所构成的摄像感知模块(4);
所述太空采矿机器人轨迹控制方法包括以下步骤:
步骤一、确定太空采矿机器人神经网络PID控制的网络结构,初始化神经网络的权值和阈值,并将优化参数带入适应度函数计算目标适应度;
步骤二、根据适应度值大小对参数进行排列,适应度最优的前20%的权值、阈值作为发现者,并根据发现者公式更新发现者的位置,适应度最差的后80%的权值、阈值作为跟随者,并根据跟随者公式更新跟随者的位置;
步骤三、随机挑选10%-20%的权值、阈值作为警戒者,并根据警戒者公式更新警戒者的位置,根据适应度大小将每组的权值、阈值更新为最优解;
步骤四、将n组更新后的权值、阈值进行比较,保留其中的最优解;
步骤五、若最优解没有超过最大迭代次数,则重新根据适应度值大小对参数进行排列,若最优解超过最大迭代次数,则获取最优权值,阈值;
步骤六、根据所获取的最优权值以及阈值,进行神经网络模型训练,若训练误差小于目标误差,或者训练次数达到预定值,则输出最优参数值,若训练误差未小于目标误差,或者训练次数未达到预定值,则重新进行神经网络模型训练。
2.根据权利要求1所述的基于SSA-PIDNN的太空采矿机器人轨迹控制方法,其特征在于:所述太空采矿机器人的运动学模型构建包括:
太空采矿机器人的运动状态由机器人质心点在所处的坐标系的位置和航向角来表示:
Figure FDA0003936385320000021
其中x、y为太空采矿机器人在坐标系下的横纵坐标位置,θ为机器人的航向角,即为太空采矿机器人运动速度方向和x轴方向的夹角;
v,ω分别为太空采矿机器人的运动速度和转动角速度;
则,太空采矿机器人在坐标系中的运动学方程描述为:
Figure FDA0003936385320000022
Figure FDA0003936385320000023
控制系统的误差表示为:
ep=[ex,ey,eθ]T=[xd-x,yd-y,θd-θ]T
其中,ex表示x轴方向的位置误差,ey表示y轴方向的位置误差,eθ表示航向角误差,xd,yd表示太空采矿机器人在x轴和y轴下的目标坐标位置,θd表示太空采矿机器人的理想航向角;
通过控制太空采矿机器人的输入量q=[v,ω]T,使其在任意时刻的ep都趋近于0,则完成稳定的轨迹跟踪控制。
3.根据权利要求1所述的基于SSA-PIDNN的太空采矿机器人轨迹控制方法,其特征在于:所述步骤一中,太空采矿机器人神经网络PID控制的网络结构中的初始权值和阈值通过改进麻雀搜索算法进行修正,将初始的权值阈值输入到麻雀搜索算法中,具体包括:
在麻雀搜索算法中,麻雀种群分为发现者、跟随者和警戒者三类,设置种群中麻雀的数量为n,根据需要初始化权值和阈值的数量,设置待优化问题变量的维数为d,则由n只麻雀组成的种群可以表示为:
Figure FDA0003936385320000031
全部麻雀的适应度值表示为:
Figure FDA0003936385320000032
在麻雀搜索算法中,在每次迭代都会更新发现者的位置,更新描述如下:
Figure FDA0003936385320000033
其中,t表示目前的迭代参数,j=1,2,3,…,d表示当前计算的问题维数,itemmax为常数,表示最大迭代次数,xi,j表示第i只麻雀在第j维中的位置信息。α(α∈(0,1])是一个随机数,R2(R2∈[0,1])和ST(ST∈[0.5,1])分别表示预警值和安全值,Q是服从正态分布的随机数,L表示一个1×d的矩阵,其中该矩阵内的每个元素的值均为1;
对于加入者,其位置更新描述如下:
Figure FDA0003936385320000034
其中,Xp是目前发现者所占据的最优位置,Xworst表示当前全局最差的位置,A表示一个1×d的矩阵,其中每个元素随机赋值为1或-1,并且A+=AT(AAT)-1,当
Figure FDA0003936385320000035
时,这表明,适应度值较低的第i个加入者没有获得食物,处于十分饥饿的状态,此时需要飞往其它地方觅食,以获得更多的能量。
4.根据权利要求3所述的基于SSA-PIDNN的太空采矿机器人轨迹控制方法,其特征在于:所述麻雀搜索算法中,在麻雀种群随机挑选10%~20%的麻雀作为警戒者,这些麻雀的初始位置是在种群中随机产生的,同时,引入Levy飞行策略,其位置更新的表达式可以表示为如下形式:
Figure FDA0003936385320000041
Figure FDA0003936385320000042
其中,Xbest是当前的全局最优位置;β和K为步长控制参数;fi则是当前麻雀个体的适应度值;fg和fw分别是当前全局最佳和最差的适应度值;ε是常数,为了避免分母出现零,τ为gamma函数,β为常数,r1和r2分别为0-1的随机数。
5.根据权利要求4所述的基于SSA-PIDNN的太空采矿机器人轨迹控制方法,其特征在于:所述太空采矿机器人神经网络PID控制的网络结构最优权值和阈值的确定,具体包括:
对步长控制参数β和K进行改进,改进公式为:
Figure FDA0003936385320000043
在使用麻雀搜索算法优化神经网络PID初始权值和阈值过程中,目标函数的设置如下:
Figure FDA0003936385320000044
其中,e(t)表示输入和输出的误差,加入u(t)避免控制幅度过大,ω1和ω2为权重。
6.根据权利要求4所述的基于SSA-PIDNN的太空采矿机器人轨迹控制方法,其特征在于:所述神经网络PID控制系统中,r1,r2,r3表示该控制系统的输入值,u1,u2,u3是该控制系统的输出值;
其中,设置在采样时刻k时,输入层的神经元的计算公式为:
xsi(k)=usi(k)
式中,usi表示输入层神经元的输入值,xsi表示输入层神经元的输出值,i(i=1,2)为神经网络中单一子网的输入层序号;s(s=1,2,3)为并列的子网的序号数量;
隐含层中各单元总的输入值如下:
Figure FDA0003936385320000051
隐含层的三个神经元分别对应PID控制系统中的比例、积分、微分项,三个神经元的计算公式为:
比例神经元的计算公式为:
x′s1(k)=u′s1(k)
积分神经元的计算公式为:
x′s2(k)=u′s2(k)+x′s2(k-1)
微分神经元的计算公式为:
x′s3(k)=u′s3(k)-u′s3(k-1)
其中,j(j=1,2,3)分别为隐含层神经元的序号;u′sj和x′sj分别为隐含层的输入值和输出值;ωsij为各子网输入层到隐含层的权值;
输出层神经元的输出值为隐含层全部神经元的输出值的加权和,计算公式如下:
Figure FDA0003936385320000052
其中,u′h和x′h分别表示输出层神经元的输入值和输出值。
7.根据权利要求6所述的基于SSA-PIDNN的太空采矿机器人轨迹控制方法,其特征在于:所述神经网络PID控制系统的PID算法可以根据太空采矿机器人实际轨迹和理想轨迹的误差,按照梯度修正法修改其权重,并逐渐适应太空采矿机器人理想轨迹的特性,使实际轨迹不断逼近理想轨迹,以达到解耦的功能。权值校正过程如下:
Figure FDA0003936385320000061
其中,r和yh在该控制系统中分别为太空采矿机器人的实际轨迹和理想轨迹。
8.根据权利要求6所述的基于SSA-PIDNN的太空采矿机器人轨迹控制方法,其特征在于:所述输入层到隐含层权重的修改方式:
Figure FDA0003936385320000062
其中,ωij(k+1)表示修正过后的输入层到隐含层权重,ωij(k)表示修正前的权重,μ1表示隐含层到输出层权重修正学习速率因子;
隐含层到输出层权重的修改方式:
Figure FDA0003936385320000063
其中,ωjk(k+1)表示修正过后的隐含层到输出层权重,ωjk(k)表示修正前的权重,μ2表示隐含层到输出层权重修正学习速率因子。
CN202211407575.6A 2022-11-10 2022-11-10 基于ssa-pidnn的太空采矿机器人轨迹控制方法 Pending CN115826570A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211407575.6A CN115826570A (zh) 2022-11-10 2022-11-10 基于ssa-pidnn的太空采矿机器人轨迹控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211407575.6A CN115826570A (zh) 2022-11-10 2022-11-10 基于ssa-pidnn的太空采矿机器人轨迹控制方法

Publications (1)

Publication Number Publication Date
CN115826570A true CN115826570A (zh) 2023-03-21

Family

ID=85527601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211407575.6A Pending CN115826570A (zh) 2022-11-10 2022-11-10 基于ssa-pidnn的太空采矿机器人轨迹控制方法

Country Status (1)

Country Link
CN (1) CN115826570A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116861175A (zh) * 2023-06-16 2023-10-10 云浮市赢石网络科技有限公司 一种基于神经网络的运行轨迹校正方法
CN117555341A (zh) * 2024-01-12 2024-02-13 中国石油大学(华东) 基于改进蚁群算法的深海采矿车路径规划方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116861175A (zh) * 2023-06-16 2023-10-10 云浮市赢石网络科技有限公司 一种基于神经网络的运行轨迹校正方法
CN117555341A (zh) * 2024-01-12 2024-02-13 中国石油大学(华东) 基于改进蚁群算法的深海采矿车路径规划方法及系统
CN117555341B (zh) * 2024-01-12 2024-05-24 中国石油大学(华东) 基于改进蚁群算法的深海采矿车路径规划方法及系统

Similar Documents

Publication Publication Date Title
CN115826570A (zh) 基于ssa-pidnn的太空采矿机器人轨迹控制方法
CN108549233B (zh) 一种带有直觉模糊信息的无人机空战机动博弈方法
US20040030420A1 (en) System and method for nonlinear dynamic control based on soft computing with discrete constraints
Abdechiri et al. Neural network learning based on chaotic imperialist competitive algorithm
Li et al. A hybrid assembly sequence planning approach based on discrete particle swarm optimization and evolutionary direction operation
CN112000096A (zh) 一种基于麻雀搜索算法的差速agv轨迹跟踪控制方法
CN111930121A (zh) 一种室内移动机器人的混合路径规划方法
CN110703787A (zh) 基于偏好矩阵的混合多目标pso算法的飞行器冗余控制方法
CN111553469A (zh) 一种无线传感器网络数据融合方法、装置和存储介质
CN110530373A (zh) 一种机器人路径规划方法、控制器及系统
CN108170158A (zh) 基于数据驱动的无人机智能对抗控制方法
CN113836803A (zh) 基于改进狼群算法的无人机群资源调度方法
CN111459221B (zh) 一种光伏发电系统mppt控制方法
CN111722533A (zh) 针对含有传感器故障的多时滞系统滑模预测容错控制方法
CN115730743A (zh) 一种基于深度神经网络的战场作战趋势预测方法
CN113687654A (zh) 一种基于进化算法的神经网络训练方法及路径规划方法
CN110399697B (zh) 基于改进遗传学习粒子群算法的飞行器的控制分配方法
CN114037050B (zh) 一种基于脉冲神经网络内在可塑性的机器人退化环境避障方法
CN109507891B (zh) 一种半主动模糊控制方法
CN112008707B (zh) 一种基于部件分解的机器人控制方法及装置
CN115700414A (zh) 一种机器人运动误差补偿方法
CN112380655B (zh) 一种基于rs-cmsa算法的机器人逆运动学求解方法
ShangDong et al. A new ANN optimized by improved PSO algorithm combined with chaos and its application in short-term load forecasting
CN114970200A (zh) 考虑需求响应的多能源系统多目标安全经济优化调度方法
CN113487870A (zh) 一种基于cw攻击对智能单交叉口的对抗扰动生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination