CN112571420A - 一种未知参数下的双功能模型预测控制方法 - Google Patents
一种未知参数下的双功能模型预测控制方法 Download PDFInfo
- Publication number
- CN112571420A CN112571420A CN202011516992.5A CN202011516992A CN112571420A CN 112571420 A CN112571420 A CN 112571420A CN 202011516992 A CN202011516992 A CN 202011516992A CN 112571420 A CN112571420 A CN 112571420A
- Authority
- CN
- China
- Prior art keywords
- mechanical arm
- model
- function
- control
- unknown parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/1607—Calculation of inertia, jacobian matrixes and inverses
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供了一种未知参数下的双功能模型预测控制方法,对六自由度机械臂进行动力学建模;针对机械臂动力学模型,构建模型预测控制优化问题下的性能指标函数,得到一个目标函数;重构目标函数,求解该优化问题的最优控制输入序列,估计出机械臂动力学模型中的未知参数,该最优控制输入序列的第一个值就是机械臂在每一时刻对应的最优关节驱动力矩。本发明能够在机械臂系统的动力学模型不确定时提高对于机械臂的控制精度。
Description
技术领域
本发明属于工业自动控制领域,涉及一种机械臂控制方法。
背景技术
工业革命以来,各行业尤其是工业界对更好技术的需求飞速增长。随着国际竞争力和经济效益方面的压力不断加剧,对产品质量的要求也不断增加,这些都对加工机器的可靠性和精确性提出了更高的要求,尤其是在高速生产过程中。
在这种背景下,工业机器人成为工业生产过程中不可或缺的自动化设备。其中,机械臂作为一种较早期出现的工业机器人,是工业机器人的重要组成之一。机械臂通过模仿人类手臂完成一些动作及功能,所以常被用于工业制造、军事、医疗、航空航天等领域。随着现代工业技术的飞速发展,对机械臂的速度和精度的要求也越来越高,这不断促使各国的学者将现代控制理论和机械臂控制系统相结合,从而更高效地解决机械臂中的控制问题。
机械臂由多个连杆组成,因此它有着多个自由度,具有高度耦合、多输入多输出以及强非线性的特点。与大多数的机械系统相同,已知机械臂的模型和系统参数时,可以直接用含有机械臂参数的数学模型来表示该机械臂的动态特性。但在实际情况中,常常因为机械臂自身参数的不确定以及外界环境中的干扰,无法得到机械臂准确的数学模型,所以也无法对机械臂进行精确控制。这样一来,机械臂模型的参数辨识问题成为机器人领域研究的热点之一。
基于机械臂系统自身多变量、强非线性及强耦合的特点,再加上参数的不确定和随机干扰影响,机械臂的控制面临极大的困难和挑战。传统的PID控制方法简单、灵活,但难以实现快速和高精度的控制。自适应控制可以根据估计值不断修正控制策略,从而满足实际闭环控制系统的要求,但由于没有考虑系统的动力学约束和不确定性,因此很难同时满足快速性和稳定性的要求。而模型预测控制是一种通过反馈控制来对被控对象进行前向滚动的最优控制方法,所以可以很好的克服模型自身的误差以及环境中的随机干扰。不难看出,模型预测控制对于机械臂这种复杂的控制系统来说,是一种实时有效的控制方法。
因此在实现机械臂控制的同时在线估计其动力学模型中的未知参数,将会是一种解决未知参数下的机械臂控制问题的有效途径。
文献“Heirung,Tor Aksel N,Ydstie,B.Erik,Foss,Bjarne.Towards DualMPC.Ifac Proceedings Volumes,2012,45(17):502-507.”提出了一种双功能模型预测控制的方法,该方法可以在实现控制的同时对模型中的未知参数进行估计。但该方法没有给出一个固定的代价函数形式,因此难以推广使用。
文献“Morinelly,Juan E,Ydstie,B.Erik.Dual MPC with ReinforcementLearning.Ifac Papersonline,49(7):266-271.”提出了一种双功能模型预测控制与强化学习相结合的方法,将算法中的控制和估计部分利用强化学习中的“执行器-评判器”框架进行迭代学习,并在算法控制部分的最优决策中引入探索能力,对未来进行预测,并估计出系统的未知参数。但该算法只适用于系统量测方程上存在未知参数的情况,实际问题中经常会出现状态方程和量测方程同时存在未知参数的情况。因此需要提出一种新的算法,旨在针对当系统的状态方程和量测方程中同时存在未知参数时,在实现系统控制的同时估计出未知参数。将该算法和机械臂模型相结合,就可以在实现机械臂控制的同时,估计出动力学模型中的未知参数,从而实现机械臂的精准控制。
发明内容
为了克服现有技术的不足,本发明提供一种未知参数下的双功能模型预测控制方法,能够在机械臂系统的动力学模型不确定时提高对于机械臂的控制精度。
本发明解决其技术问题所采用的技术方案包括以下步骤:
步骤1,对六自由度机械臂进行动力学建模;
步骤2,针对机械臂动力学模型,构建模型预测控制优化问题下的性能指标函数,得到一个目标函数;
步骤3,重构目标函数,求解该优化问题的最优控制输入序列,估计出机械臂动力学模型中的未知参数,该最优控制输入序列的第一个值就是机械臂在每一时刻对应的最优关节驱动力矩。
所述的机械臂动力学模型为表示第i个关节的位置向量,表示第i个关节的速度,表示第i个关节的加速度,表示第i个关节的驱动力矩向量,M(qi)为机器人的惯性矩阵, 表示该机械臂受到的惯性力大小,是科里奥利矩阵,表示离心力和科氏力,为重力矩阵,表示该机器人受到重力的大小;将模型简化为离散时间下标准状态空间的形式:
xt+1=(A+γI)xt+but
其中,xt表示机械臂在预测时域内第t个采样时刻的预测输出,该模型的控制变量为关节驱动力矩ut,vt表示高斯白噪声,A和b是已知的系数矩阵,I为单位矩阵。γ是状态方程中的未知参数,θ是量测方程中一个未知的系数矩阵。
本发明的有益效果是:通过引入未来的预期信息,沿着控制路径引入探索。在状态方程和量测方程同时存在未知参数时,可以估计出系统的未知参数;同时在强化学习的“执行器-评判器”框架下,能够实现系统边控制边估计的效果。由此可以实现机械臂动力学模型不确定时的准确控制。
附图说明
图1为方法步骤流程框图。
图2为matlab下机械臂建模仿真图。
图3为双功能模型预测控制算法流程图。
图4为matlab下利用双功能模型预测控制算法对未知参数θ和γ估计的仿真图。
图5为matlab下系统控制输出y的仿真图。
具体实施方式
下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
本发明提供一种未知参数下的双功能模型预测控制方法,包括以下步骤:
步骤1:利用拉格朗日法对六自由度机械臂进行动力学建模,并对其进行简化和重构:
简化拉格朗日方程可以得到如下机械臂模型的动力学模型:
其中,表示第i个关节的位置向量;表示第i个关节的速度;表示第i个关节的加速度;表示第i个关节的驱动力矩向量,其与第i个关节的角位移量qi有关;M(qi)为机器人的惯性矩阵, 表示该机械臂受到的惯性力大小。是科里奥利矩阵,表示离心力和科氏力;为重力矩阵,表示该机器人受到重力的大小。
将该模型线性化后再利用泰勒展开对其进行离散化,取采样时间为T。考虑到实际情况,在系统模型中引入高斯白噪声vt,并为了便于后续算法的推导,将模型简化为离散时间下标准状态空间的形式:
其中,xt表示机械臂在预测时域内第t个采样时刻的预测输出,该模型的控制变量为关节驱动力矩ut,噪声A和b是系统已知的系数矩阵,I为单位矩阵。γ是状态方程中的未知参数,θ是量测方程中一个未知的系数矩阵。
步骤2:针对化简后的机械臂模型,构建模型预测控制优化问题下的二次性能指标函数。求解该优化问题所得到的最优控制输入序列u*(xt),就是机械臂在每一时刻对应的最优关节驱动力矩。
将式(2)的状态方程代入量测方程中得:
将式(3)分解为下列两个子式:
其中,m和n都是未知的,r>0为折扣因子。显然,J(xt)是一个关于u(xt)的函数。通过最小化该函数,即可得到最优控制输入序列u*(xt):
设计(N,∞)时间下的终端代价函数:
步骤3:双功能模型预测控制算法控制部分的设计,利用模型预测控制算法实现对机械臂的控制。
基于强化学习中的“执行器-评判器”框架,算法中控制部分和估计部分是一种相互迭代的关系,直至系统收敛。控制部分相当于执行器,通过求解优化问题,求出最优控制策略。估计部分相当于评判器,通过对未知参数进行估计,构造可解的目标函数。
在强化学习的框架下,重构目标函数:
根据贝尔曼方程,式(9)可拓展为如下N步代价函数:
则最优控制策略为:
步骤4:双功能模型预测控制算法估计部分的设计,利用强化学习和参数辨识中的相关知识,估计出机械臂动力学模型中的未知参数。
利用状态和参数联合估计的方法:第一步,给定未知参数初始值,利用其对状态变量进行估计;第二步,利用上一步估计得到的状态变量,对未知参数进行估计。以此不断迭代,交替进行估计,直至参数收敛。
利用估计得到的参数和状态变量,构造近似阶段代价函数:
其中,为了方便表述,定义z1,t+k:=P1,t+k|txt+k|t,z2,t+k:=P2,t+k|tut+k。
重构目标函数:
由此设计出的双功能模型预测控制算法可以很好的解决机械臂动力学模型中含有未知参数时的控制问题。通过求解模型预测控制中的优化问题得到当前时刻的最优控制力矩,输入该力矩后在线估计动力学模型中的未知参数,以此不断进行迭代,直至机械臂到达指定目标点。
本发明的实施例包括以下步骤:
步骤1:利用拉格朗日法对六自由度机械臂进行动力学建模,并对其进行简化和重构;
如图2所示,选取六自由度的机械臂模型作为研究对象,该机械臂包含六个刚性连杆和六个关节。简化拉格朗日方程可以推导出机械臂的动力学方程:
其中,表示第i个关节的位置向量;表示第i个关节的速度;表示第i个关节的加速度;表示第i个关节的驱动力矩向量,其与第i个关节的角位移量qi有关;M(qi)为机器人的惯性矩阵, 表示该机械臂受到的惯性力大小。是科里奥利矩阵,表示离心力和科氏力;为重力矩阵,表示该机器人受到重力的大小。
设采样周期为T,将状态变量中的各个分量利用泰勒展开式进行离散化,由此可以得出系统离散化的状态空间模型:
考虑到在实际情况下,系统环境中总是存在有不确定的干扰,因此在输入信号中引入高斯白噪声vt,为了便于后续算法的推导,改写式(3)为以下离散状态空间:
其中,xt表示机械臂在预测时域内第t个采样时刻的预测输出,该模型的控制变量为关节驱动力矩ut,γ是一个未知参数,θ是一个未知的矩阵向量,噪声A和b是系统已知的系数矩阵,I为单位矩阵。γ是状态方程中的未知参数,θ是量测方程中一个未知的系数矩阵。
步骤2:针对化简后的机械臂模型,构建模型预测控制优化问题下的二次性能指标函数。求解该优化问题所得到的最优控制输入序列u*(xt),就是机械臂在每一时刻对应的最优关节驱动力矩。
根据式(4)不难得到:
将式(6)分解为下列两个子式:
由此构建出如下性能指标函数:
其中,m和n都是未知的,r>0为折扣因子。显然,J(xt)是一个关于u(xt)的函数。通过最小化该函数,即可得到最优控制输入序列u*(xt):
根据预测控制的基本原理,优化得到的控制输入序列的第一个元素会作用于被控系统。在下一采样时刻,系统获得了新的状态值,以该状态值为预测系统未来动态的初始条件,即用该状态值刷新优化问题,再次求解优化问题并得到一个新的控制序列。因此,预测控制利用“滚动优化-重复进行”的机制实现在线优化。
设计局部线性状态反馈控制律u=Lx驱使系统渐近地回到原点,即此时A'+bL是稳定的。则(N,∞)时间下的终端代价函数为:
则该系统无限时域下的目标函数为:
一般地,终端惩罚矩阵K为下面这个代数黎卡提方程的解:
再根据预测的“最优性”,使用线性最优控制方法求解最优反馈控制增益矩阵:
其中,K*是最优控制下的终端惩罚矩阵。
显然,目标函数J(xt)中存在未知参数m和n,该优化问题无法直接用传统的模型预测控制方法对其进行求解。由此,需要先估计出未知参数m和n,才可以求解该目标函数。但在对未知参数进行估计时,又需要利用系统的控制输入u,该控制输入通过求解目标函数J(xt)获得。因此,在该问题下,估计和控制两者之间是一种相互影响、相互耦合的关系。
步骤3:双功能模型预测控制算法控制部分的设计,利用模型预测控制算法实现对机械臂的控制。
这里,运用强化学习中的“执行器-评判器”框架。将估计看作学习中的“评判器”,通过收集环境中的控制输出y,估计出未知参数γ和θ,使得目标函数可解,从而可以用来评估该步控制输入的价值;将控制看作学习中的“执行器”,将动作也就是控制策略u*作用于环境。两者不断进行策略迭代,直至系统收敛,即可实现一种边估计边控制的效果。在该框架下,强化学习是一种通过观察环境对非最优控制策略的实时响应来学习最优行为的方法。
在强化学习的框架下,将目标函数(11)重构为:
其中,c是阶段代价函数,π=μ0,μ1,...,μk:属于一系列可靠的策略集合Π。也就是说,如果给出的策略π是准确性的,那么该策略在每个状态x下的动作也是确定的。α是折扣因子,且0<α≤1。如果增广矩阵{A',b}可控,则当Jπ(xt)取到最小值时的策略即为最优策略,u*=μ*(x)。
根据贝尔曼方程,式(10)可拓展写为如下N步代价函数:
则最优控制策略可由下式求出:
经过不断的策略迭代,最终当K收敛时,即Kl=Kl-1时,此时K*所对应的策略就是所求的最优策略。
引入预期信息,将先前时刻和将来时刻的控制输入以及测量值用下式表示:
不难得出,
t时刻有关未知参数的误差协方差矩阵定义如下:
因此近似代价函数可以写为(k≥0):
为了简化计算,定义z1,t+k:=P1,t+k|txt+k|t,z2,t+k:=P2,t+k|tut+k。因此式(22)可以表示为:
重构目标函数:
其中,
显然,该目标函数中的各个参数都是已知的,所以此时可以用传统的模型预测控制算法求解该目标函数,得到此时的最优控制输入u*。
进一步,为了更清晰的展示目标函数中每一部分的作用,将式(26)可以写为:
步骤4:双功能模型预测控制算法估计部分的设计,利用强化学习和参数辨识中的相关知识,估计出机械臂动力学模型中的未知参数。
由于在状态方程和量测方程上同时存在未知参数γ和θ,这两个未知参数是一种相互耦合的关系,因此无法直接利用递推最小二乘法对其进行估计。所以,这里采用了状态和参数联合估计的方法。
联合估计方法的计算步骤:第一步,假定参数值已知,来估计状态变量;第二步,将上一步估计得到的状态变量代入系统方程中,对参数进行估计。
以此不断进行交替估计。
P2,t+1=(In-G2,t+1ut)P2,t (33)
再联立两个式子解出γ和θ的估计值:
估计出参数后再计算状态量:
由此设计出的双功能模型预测控制算法可以很好的解决机械臂动力学模型中含有未知参数时的控制问题。通过求解模型预测控制中的优化问题得到当前时刻的最优控制力矩,输入该力矩后在线估计动力学模型中的未知参数,以此不断进行迭代,直至机械臂到达指定目标点。
Claims (4)
1.一种未知参数下的双功能模型预测控制方法,其特征在于,包括以下步骤:
步骤1,对六自由度机械臂进行动力学建模;
步骤2,针对机械臂动力学模型,构建模型预测控制优化问题下的性能指标函数,得到一个目标函数;
步骤3,重构目标函数,求解该优化问题的最优控制输入序列,估计出机械臂动力学模型中的未知参数,该最优控制输入序列的第一个值就是机械臂在每一时刻对应的最优关节驱动力矩。
2.根据权利要求1所述的未知参数下的双功能模型预测控制方法,其特征在于,所述的机械臂动力学模型为表示第i个关节的位置向量,表示第i个关节的速度,表示第i个关节的加速度,表示第i个关节的驱动力矩向量,M(qi)为机器人的惯性矩阵,M=MT,表示该机械臂受到的惯性力大小,是科里奥利矩阵,表示离心力和科氏力,为重力矩阵,表示该机器人受到重力的大小;将模型简化为离散时间下标准状态空间的形式:
xt+1=(A+γI)xt+but
yt=θTxt+vt
其中,xt表示机械臂在预测时域内第t个采样时刻的预测输出,该模型的控制变量为关节驱动力矩ut,vt表示高斯白噪声,A和b是已知的系数矩阵,I为单位矩阵。γ是状态方程中的未知参数,θ是量测方程中一个未知的系数矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011516992.5A CN112571420B (zh) | 2020-12-21 | 2020-12-21 | 一种未知参数下的双功能模型预测控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011516992.5A CN112571420B (zh) | 2020-12-21 | 2020-12-21 | 一种未知参数下的双功能模型预测控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112571420A true CN112571420A (zh) | 2021-03-30 |
CN112571420B CN112571420B (zh) | 2022-08-23 |
Family
ID=75136412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011516992.5A Active CN112571420B (zh) | 2020-12-21 | 2020-12-21 | 一种未知参数下的双功能模型预测控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112571420B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113352320A (zh) * | 2021-05-11 | 2021-09-07 | 浙江工业大学 | 一种基于Q学习的Baxter机械臂智能优化控制方法 |
CN113681543A (zh) * | 2021-08-25 | 2021-11-23 | 深圳亿嘉和科技研发有限公司 | 一种基于模型预测的机械臂零力控制方法 |
CN114260877A (zh) * | 2021-07-06 | 2022-04-01 | 深圳市越疆科技有限公司 | 机械臂关节的拖动示教限速方法、装置、电子设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2458979A1 (en) * | 2001-08-31 | 2003-03-13 | George Danko | Coordinated joint motion control system |
CN104842355A (zh) * | 2015-01-20 | 2015-08-19 | 西北工业大学 | 避障约束下冗余空间机器人的混合整数预测控制方法 |
CN106773689A (zh) * | 2016-12-16 | 2017-05-31 | 西北工业大学 | 基于分层分布式模型预测控制的auv编队协同控制方法 |
CN107498562A (zh) * | 2017-04-21 | 2017-12-22 | 浙江工业大学 | 六自由度机械臂动力学模型辨识方法 |
CN107703756A (zh) * | 2017-11-03 | 2018-02-16 | 广州视源电子科技股份有限公司 | 动力学模型参数辨识方法、装置、计算机设备及存储介质 |
CN111241747A (zh) * | 2020-01-13 | 2020-06-05 | 佛山科学技术学院 | 机械臂逆运动学求解方法、系统、计算机设备及存储介质 |
-
2020
- 2020-12-21 CN CN202011516992.5A patent/CN112571420B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2458979A1 (en) * | 2001-08-31 | 2003-03-13 | George Danko | Coordinated joint motion control system |
CN104842355A (zh) * | 2015-01-20 | 2015-08-19 | 西北工业大学 | 避障约束下冗余空间机器人的混合整数预测控制方法 |
CN106773689A (zh) * | 2016-12-16 | 2017-05-31 | 西北工业大学 | 基于分层分布式模型预测控制的auv编队协同控制方法 |
CN107498562A (zh) * | 2017-04-21 | 2017-12-22 | 浙江工业大学 | 六自由度机械臂动力学模型辨识方法 |
CN107703756A (zh) * | 2017-11-03 | 2018-02-16 | 广州视源电子科技股份有限公司 | 动力学模型参数辨识方法、装置、计算机设备及存储介质 |
CN111241747A (zh) * | 2020-01-13 | 2020-06-05 | 佛山科学技术学院 | 机械臂逆运动学求解方法、系统、计算机设备及存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113352320A (zh) * | 2021-05-11 | 2021-09-07 | 浙江工业大学 | 一种基于Q学习的Baxter机械臂智能优化控制方法 |
CN113352320B (zh) * | 2021-05-11 | 2022-06-17 | 浙江工业大学 | 一种基于Q学习的Baxter机械臂智能优化控制方法 |
CN114260877A (zh) * | 2021-07-06 | 2022-04-01 | 深圳市越疆科技有限公司 | 机械臂关节的拖动示教限速方法、装置、电子设备及介质 |
CN113681543A (zh) * | 2021-08-25 | 2021-11-23 | 深圳亿嘉和科技研发有限公司 | 一种基于模型预测的机械臂零力控制方法 |
CN113681543B (zh) * | 2021-08-25 | 2023-02-24 | 深圳亿嘉和科技研发有限公司 | 一种基于模型预测的机械臂零力控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112571420B (zh) | 2022-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112571420B (zh) | 一种未知参数下的双功能模型预测控制方法 | |
Cheng et al. | Real-time optimal control for spacecraft orbit transfer via multiscale deep neural networks | |
US11529733B2 (en) | Method and system for robot action imitation learning in three-dimensional space | |
Zhou et al. | Deep convolutional neural network based fractional-order terminal sliding-mode control for robotic manipulators | |
Qi et al. | Stable indirect adaptive control based on discrete-time T–S fuzzy model | |
CN109375512B (zh) | 基于rbf-arx模型的保证倒立摆系统闭环稳定的预测控制方法 | |
CN112077839B (zh) | 一种机械臂的运动控制方法及装置 | |
CN113910218A (zh) | 基于运动学与深度神经网络融合的机器人标定方法和装置 | |
Sun | Kinematics model identification and motion control of robot based on fast learning neural network | |
CN109764876B (zh) | 无人平台的多模态融合定位方法 | |
CN116460860B (zh) | 一种基于模型的机器人离线强化学习控制方法 | |
WO2023020036A1 (zh) | 一种基于回声状态网络的冗余机械臂追踪控制方法 | |
Kostadinov et al. | Online weight-adaptive nonlinear model predictive control | |
Chen et al. | Learning trajectories for visual-inertial system calibration via model-based heuristic deep reinforcement learning | |
CN115179290A (zh) | 一种机械臂及其轨迹控制方法与装置 | |
Rigatos | Particle Filtering for state estimation in industrial robotic systems | |
Yuqi et al. | Time-varying parameters estimation with adaptive neural network EKF for missile-dual control system | |
CN112000014B (zh) | 一种操控机械臂的模型预测与反演的控制方法 | |
Afzali et al. | A Modified Convergence DDPG Algorithm for Robotic Manipulation | |
Tang et al. | Actively learning Gaussian process dynamical systems through global and local explorations | |
Lu et al. | Active task design in adaptive control of redundant robotic systems | |
El-Fakdi et al. | Autonomous underwater vehicle control using reinforcement learning policy search methods | |
Yan et al. | A neural network approach to nonlinear model predictive control | |
Bahrpeyma et al. | Application of Reinforcement Learning to UR10 Positioning for Prioritized Multi-Step Inspection in NVIDIA Omniverse | |
Drexler et al. | Second-order and implicit methods in numerical integration improve tracking performance of the closed-loop inverse kinematics algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |