CN114700960A - 一种阶次优化的远程操控行为轮廓规划方法 - Google Patents
一种阶次优化的远程操控行为轮廓规划方法 Download PDFInfo
- Publication number
- CN114700960A CN114700960A CN202210198829.1A CN202210198829A CN114700960A CN 114700960 A CN114700960 A CN 114700960A CN 202210198829 A CN202210198829 A CN 202210198829A CN 114700960 A CN114700960 A CN 114700960A
- Authority
- CN
- China
- Prior art keywords
- contour
- order
- error
- approximate
- tracking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000003993 interaction Effects 0.000 claims abstract description 16
- 230000004044 response Effects 0.000 claims abstract description 9
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 230000009471 action Effects 0.000 claims abstract description 5
- 230000008569 process Effects 0.000 claims description 37
- 238000013507 mapping Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 13
- 230000006399 behavior Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005183 dynamical system Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J11/00—Manipulators not otherwise provided for
- B25J11/0005—Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J18/00—Arms
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1656—Programme controls characterised by programming, planning systems for manipulators
- B25J9/1664—Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1679—Programme controls characterised by the tasks executed
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种阶次优化的远程操控行为轮廓规划方法,轮廓规划方法包括以下内容:步骤1.初始化考虑操作人员操作行为的机械臂末端动力学方程的状态以及期望的阻抗结构,计算在操作人员行为作用下生成的机械臂末端运动轨迹;步骤2.进行轮廓的扩张生成,基于所述步骤1中生成的机械臂末端运动轨迹最近生成轮廓的三个点来确定对应的典型的圆形轮廓,根据该几何关系,利用贪心算法,计算获得距离当前位置最近的轮廓点位置xcr作为期望的跟踪位置,定义轮廓跟踪误差。其解决了现有方法动态响应及稳态性能难以满足人机交互要求的问题。
Description
技术领域
本发明属于人机交互技术领域,具体涉及一种阶次优化的远程操控行为轮廓规划方法。
背景技术
人机交互是机器人执行复杂任务时的主要辅助手段,在保障作业安全按的前提下,通过操作人员对任务的理解并施加相应的行为,可以提升任务实施过程的效率。
在人类涉足危险作业环境之前,人机交互仅仅作为辅助手段以提升操作过程的可靠与效率为主要目的,随着机器人技术发展,以及工业化环境中复杂任务增多,作为机器人危险场景中顺利实施高效高精度任务的必要手段,人机交互已经从人机共在同一环境中,转变为可以在时空分离条件下开展机器人智能化作业的必要手段,例如在空间机器人在轨服务中,机器人遥操作的人机交互技术显得尤为重要。
人机交互方面技术的发展对于机器人提升任务作业能力有明显的促进作用,也是机器人智能化发展的重要力量。现有运用整数阶次或者分数阶次的控制方法只能兼顾动态或者稳态特征,即对于轨迹及轮廓跟踪的整体误差难以令人满意。
发明内容
本发明的目的是提供一种阶次优化的远程操控行为轮廓规划方法,以解决现有方法动态响应及稳态性能难以满足人机交互要求的问题。
本发明采用以下技术方案:一种阶次优化的远程操控行为轮廓规划方法,包括以下内容:
步骤1.初始化考虑操作人员操作行为的机械臂末端动力学方程的状态以及期望的阻抗结构,计算在操作人员行为作用下生成的机械臂末端运动轨迹,
步骤2.进行轮廓的扩张生成,基于所述步骤1中生成的机械臂末端运动轨迹最近生成轮廓的三个点:xr(k-2)=(x1,y1),xr(k-1)=(x2,y2),xr(k)=(x3,y3)来确定对应的典型的圆形轮廓,所述圆形轮廓的圆心和半径分别为:
其中,A=(x1-x2)(y1-y3)-(x1-x3)(y1-y2);
根据该几何关系,利用贪心算法,计算获得距离当前位置最近的轮廓点位置xcr作为期望的跟踪位置,定义轮廓跟踪误差为:e=x-xcr;
根据所述圆形轮廓确定的轨迹微元,最终确定机械臂末端的轨迹。
本发明采用的第二种技术方案是,一种阶次优化的远程操控行为轮廓控制方法,其基于一种阶次优化的远程操控行为轮廓规划方法,包括以下内容:
步骤1.选定可行的阶次集合与误差集合;
步骤2.初始化近似求解过程的参数,包括Markov决策过程的误差集合及可行的阶次集合设定,以及迭代目标值∈Q,即收敛过程的收敛值的差,一旦收敛值的差小于迭代目标值,则求解过程完成,求解i=1∶N,j=1∶M条件下的
直到||ξk′+1-ξk′||≤∈Q;
步骤3.根据步骤1中的轮廓跟踪误差及步骤2中的阶次选择策略,基于轮廓跟踪误差的变化阶次滑模面为:
s=Dαe+ce (4)
控制指令为:
进一步的,可行的阶次集合中包含所有能够使控制器稳定的机械臂末端运动跟踪误差的分数阶次,具体为大于0小于1的实数,误差集合具体指包括控制过程中所有出现的机械臂末端运动跟踪误差的实数集。
本发明的有益效果是:本发明运用Q学习方法获取跟踪过程中兼顾动态及稳态特征的最优阶次,提升跟踪控制效果。运用Q学习方法获得近最优的阶次选择策略是综合固定分数阶条件下不同阶次对于动态及稳态过程响应优势的方法,属于本方法的创新点,此外,运用轮廓误差的思想优化任务实施过程也是本发明的重要创新。相比现有方法,全局最优的阶次优化是本发明首次提出的,综合考虑期望阻抗的轮廓扩张结构也未见报道。
附图说明
图1为本发明实施例中机械臂末端的轮廓跟踪效果示意图;
图2为本发明实施例中机械臂末端轮廓跟踪细节示意图;
图3为本发明实施例中机械臂末端跟踪轨迹误差示意图;
图4为本发明实施例中操作人员的操作力示意图;
图5为本发明实施例中阶次选择策略示意图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
一、本发明提供了一种阶次优化的远程操控行为轮廓规划方法,包括以下内容:
考虑人在环路的二维平面运动的机械臂末端人机交互动力学模型可以表示如下:
其中,是机械臂末端操作空间的质量/惯量矩阵,是机械臂末端操作空间的科里奥利力矩阵,是机械臂末端空间的重力矩阵,是操作人员在机械臂末端实施的作用力,本发明中认为是可以测量的已知量,是需要发明的控制器输出的控制力。
本发明的目标是在控制力的作用下,操作人员在机械臂末端能够感受到接近期望阻抗的作用力,该作用力中包含了末端为操作者提供的轮廓跟踪引导力。
人机交互的期望阻抗数学描述由期望质量/惯量矩阵期望阻尼参数矩阵以及期望弹性参数矩阵构建如下的表达式-其中,是操作人员的力在期望阻抗条件下生成的期望轨迹,是预先设定的期望轨迹,在无操作人员的介入下,机械臂末端将跟踪该轨迹运动。
值得注意的是,生成的期望轨迹是操作人员根据自身的需求发明的,对于机械臂末端而言,由于该轨迹的位置与时序关系是固定的,可能存在连续间隔的期望跟踪点存在非平滑等情况,为此,本发明将机械臂末端的操作平滑性作为人机交互过程的一个重要指标,进一步对操作人员作用力下的轨迹指令进行规划。
任意生成轨迹的轮廓扩张准则是轮廓的扩张生成是有已知的最近生成轮廓的三个点xr(k-2)=(x1,y1),xr(k-1)=(x2,y2),xr(k)=(x3,y3)确定的,对应的轮廓为典型的圆形,其圆心和半径分别为:
其中,A=(x1-x2)(y1-y3)-(x1-x3)(y1-y2)。
根据该几何关系,利用贪心算法,计算获得距离当前位置最近的轮廓点位置xcr作为期望的跟踪位置,x是机械臂末端位置,定义轮廓跟踪误差为:
e=x-xcr (3);
根据所述圆形轮廓确定的轨迹微元,最终确定机械臂末端的轨迹。最近生成轮廓的三个点可以确定一段尽可能小的轨迹微元,考虑到任意轨迹可以利用无穷多个轨迹微元进行近似,而三点确定的轨迹微元可以描述某一个圆轮廓的弧段,所以根据几何关系确定该小弧段所对应的近似典型圆形轮廓,求出圆形轮廓的圆心和半径,最终就可以确定机械臂末端的轨迹。
二、本发明还提供了一种阶次优化的远程操控行为轮廓控制方法,包括以下内容:
本发明基于轮廓跟踪误差的变化阶次滑模面:
s=Dαe+ce (4),
其中,s是滑模面,e是机械臂末端跟踪误差,c是正实数,
为了实现人机交互过程中的轮廓跟踪,发明如下的控制指令,实现系统稳定控制。
为了提升人机交互条件下轮廓跟踪性能,基于Mittage-Leffler稳定性理论,固定阶次的分数阶控制系统难以同时兼顾动力学响应快速性与稳态高精度,为了提升固定分数阶次闭环系统的快速响应与高精度稳态性能。本发明综合模糊Q学习算法与连续分数阶系统的数值近似扩展表达进行分数阶次的优化,增强机械臂末端的轮廓跟踪性能,实现有人参与的期望阻抗条件下生成参考规划轮廓的高质量跟踪效果。
滑模控制趋近律作能够保证滑模面始终存在,则满足如下的数学描述:
s=0 (6),
继而有
Dαe=-ce (7)。
上述动力学系统响应可以利用欧拉法构建为一个确定的Markov决策过程:
ek+1=f(ek,αk) (8),
其中,ek+1是第k+1个采样时间时的误差,αk是第k+1个采样时间时的阶次,f(ek,αk)=-Dαek+1/c在该过程中,误差所在集合为误差空间ε,而阶次可选集合为可行阶次空间可行阶次空间与误差空间满足如下关系
定义在时刻k的可行阶次为αk,所选择的阶次对应产生的效果可以通过评价如下代价函数进行评价
其中,rk+1第k+1个时刻的奖励函数,公式(9)描述了在是有界的假设条件下,存在状态以依赖的策略使得最优的阶次选择αk=p(ek)满足系统响应性能要求。本发明采用带有折扣参数的回报评价最优阶次选择的长期性能,回报评价的数学描述如下:
其中,γ∈[0,1)是折扣参数。
上述描述中,要求阶次选择是最优的,继而对应的最优策略可以定义如下
基于Bellman函数的最优值函数可以描述如下:
实际上,根据分数阶RL定义,动力学系统响应可以通过数值方法近似,为了降低算法的复杂度,本专利的阶次选择可以做如下的离散化表达:
是归一化的隶属度函数。
从Q函数到近似参数的映射具有如下特征:
ξ(i,j)=Q(xi,uj), (21),
表示误差-阶次对在被选点(i,j)上是精确估计。
因此如下表达式成立:
其表明,近似求解的在特定点是有效的。结合MDP过程,可以采用如下的过程,进行阶次的近最优求解。
迭代求解算法步骤包括以下内容:
步骤11、初始化近似求解过程的参数,包括MDP过程的误差及阶次的可行集合设定,以及迭代目标值∈Q。
步骤12、求解i=1∶N,j=1∶M条件下的
直到||ξk′+1-ξk′||≤∈Q。
其中,是i个时刻的代价函数,ek+1=f(ek,αk)是描述动力学响应过程的Markov过程,ek+1和是ek第k+1个和第k个采样时间时的误差,αk是第k个采样时间时的阶次,γ是折扣参数,是不大于1的正数,φi′(f(ei,αj))是第i′次迭代的隶属度函数,是第k′+1次迭代选择第i个误差与第j个阶次对所对应的近似Q值估计;
从而可以获得近似最优的阶次选择策略为,数学描述如下:
在一些实施例中,可行的阶次集合中包含所有能够使控制器稳定的机械臂末端运动跟踪误差的分数阶次,具体为大于0小于1的实数,误差集合具体指包括控制过程中所有出现的机械臂末端运动跟踪误差的实数集。
图1为本发明实施例中,机械臂末端的轮廓跟踪效果示意图,为了说明本发明相比现有固定阶次方法的优势,实施例中还给出了阶次固定为α=0.5的相同结构控制器对于参考轮廓跟踪。图1中的初始轮廓刻画了在操作人员未进行干预前的预定任务轮廓轨迹为一个半径为0.5m的平面圆,利用本发明的期望轨迹及轮廓生成方法,获得了参考轮廓。
图2为本发明实施例中,机械臂末端轮廓跟踪细节,从图中不难发现,本发明作用下轮廓跟踪轨迹与参考轮廓的距离更近,误差更小,轮廓跟踪效果比固定阶次方法更好。
图3为本发明实施例中,机械臂末端跟踪轨迹误差,从误差水平上看,本发明提供的方法跟踪误差更小,波动水平更低,误差曲线平缓,适合人机交互过程,满足轮廓跟踪要求。
图4为本发明实施例中,操作人员的操作力,选用的为高斯函数描述的钟型力生成过程,与人类操作行为特征一致。
图5为本发明实施例中,阶次选择策略的轨迹,从图中可以发现,为了同时兼顾动态及稳态过程,阶次选择策略在误差不同阶段根据本发明的算法进行了适应性调整。
本发明运用Q学习方法获取跟踪过程中兼顾动态及稳态特征的最优阶次,提升跟踪控制效果。运用Q学习方法获得近最优的阶次选择策略是综合固定分数阶条件下不同阶次对于动态及稳态过程响应优势的方法,属于本方法的创新点,此外,运用轮廓误差的思想优化任务实施过程也是本发明的重要创新。相比现有方法,全局最优的阶次优化是本发明首次提出的,综合考虑期望阻抗的轮廓扩张结构也未见报道。
Claims (3)
1.一种阶次优化的远程操控行为轮廓规划方法,其特征在于,包括以下内容:
步骤1.初始化考虑操作人员操作行为的机械臂末端动力学方程的状态以及期望的阻抗结构,计算在操作人员行为作用下生成的机械臂末端运动轨迹;
步骤2.进行轮廓的扩张生成,基于所述步骤1中生成的机械臂末端运动轨迹最近生成轮廓的三个点:xr(k-2)=(x1,y1),xr(k-1)=(x2,y2),xr(k)=(x3,y3)来确定对应的典型的圆形轮廓,所述圆形轮廓的圆心和半径分别为:
其中,A=(x1-x2)(y1-y3)-(x1-x3)(y1-y2);
利用贪心算法,计算获得距离当前位置最近的轮廓点位置xcr作为期望的跟踪位置,即为可行的偏差最小的扩张轮廓点,定义轮廓跟踪误差为:e=x-xcr;其中,x是机械臂末端位置;根据所述圆形轮廓确定轨迹微元,根据所述轨迹微元最终确定机械臂末端的轨迹。
2.一种阶次优化的远程操控行为轮廓控制方法,其基于权利要求1所述的一种人机交互行为的轮廓规划方法,包括以下内容:
步骤1.选定可行的阶次集合与误差集合;
步骤2.初始化近似求解过程的参数,包括Markov决策过程的误差集合及可行的阶次集合设定,以及迭代目标值∈Q,即收敛过程的收敛值的差,一旦收敛值的差小于迭代目标值,则求解过程完成,求解i=1:N,j=1:M条件下的
直到||ξk′+1-ξk′||≤∈Q;其中,是i个时刻的代价函数,ek+1=f(ek,αk)是描述动力学响应过程的Markov过程,ek+1和是ek第k+1个和第k个采样时间时的误差,αk是第k个采样时间时的阶次,γ是折扣参数,是不大于1的正数,φi′(f(ei,αj))是第i′次迭代的隶属度函数,是第k′+1次迭代选择第i个误差与第j个阶次对所对应的近似Q值估计;
从而可以获得近似最优的阶次选择策略为:使得近似Q值函数最大的对应的阶次选择策略:
步骤3.根据步骤1中的轮廓跟踪误差及步骤2中的阶次选择策略,则基于轮廓跟踪误差的变化阶次滑模面为:
s=Dαe+ce’
其中,s是滑模面,e是机械臂末端跟踪误差,c是正实数,
则控制指令为:
其中,e=x-xcr是轮廓误差,x是机械臂末端位置,xcr是生成的期望轮廓位置。
3.如权利要求2所述的一种人机交互行为的轮廓规划的控制方法,其特征在于,所述可行的阶次集合中,包含所有能够使控制器稳定的机械臂末端运动跟踪误差的分数阶次,所述误差集合指包括控制过程中所有出现的机械臂末端运动跟踪误差的实数集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210198829.1A CN114700960B (zh) | 2022-03-02 | 2022-03-02 | 一种阶次优化的远程操控行为轮廓规划方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210198829.1A CN114700960B (zh) | 2022-03-02 | 2022-03-02 | 一种阶次优化的远程操控行为轮廓规划方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114700960A true CN114700960A (zh) | 2022-07-05 |
CN114700960B CN114700960B (zh) | 2023-09-08 |
Family
ID=82166125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210198829.1A Active CN114700960B (zh) | 2022-03-02 | 2022-03-02 | 一种阶次优化的远程操控行为轮廓规划方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114700960B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105435997A (zh) * | 2015-12-14 | 2016-03-30 | 江苏大学 | 基于Bézier曲线的喷涂机器人路径规划方法 |
CN106970594A (zh) * | 2017-05-09 | 2017-07-21 | 京东方科技集团股份有限公司 | 一种柔性机械臂的轨迹规划方法 |
WO2017219640A1 (zh) * | 2016-06-20 | 2017-12-28 | 广州视源电子科技股份有限公司 | 一种机械臂的轨迹规划方法及装置 |
CN107870570A (zh) * | 2017-12-26 | 2018-04-03 | 电子科技大学 | 基于分数阶幂次趋近律的终端滑模机械臂轨迹跟踪方法 |
CN109343345A (zh) * | 2018-09-28 | 2019-02-15 | 江南大学 | 基于qpso算法的机械臂多项式插值轨迹规划方法 |
CN110456641A (zh) * | 2019-07-23 | 2019-11-15 | 西北工业大学 | 一种固定时预定性能循环神经网络机械臂控制方法 |
CN113182701A (zh) * | 2021-03-29 | 2021-07-30 | 大族激光科技产业集团股份有限公司 | 激光加工方法、装置、设备及存储介质 |
-
2022
- 2022-03-02 CN CN202210198829.1A patent/CN114700960B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105435997A (zh) * | 2015-12-14 | 2016-03-30 | 江苏大学 | 基于Bézier曲线的喷涂机器人路径规划方法 |
WO2017219640A1 (zh) * | 2016-06-20 | 2017-12-28 | 广州视源电子科技股份有限公司 | 一种机械臂的轨迹规划方法及装置 |
CN106970594A (zh) * | 2017-05-09 | 2017-07-21 | 京东方科技集团股份有限公司 | 一种柔性机械臂的轨迹规划方法 |
CN107870570A (zh) * | 2017-12-26 | 2018-04-03 | 电子科技大学 | 基于分数阶幂次趋近律的终端滑模机械臂轨迹跟踪方法 |
CN109343345A (zh) * | 2018-09-28 | 2019-02-15 | 江南大学 | 基于qpso算法的机械臂多项式插值轨迹规划方法 |
CN110456641A (zh) * | 2019-07-23 | 2019-11-15 | 西北工业大学 | 一种固定时预定性能循环神经网络机械臂控制方法 |
CN113182701A (zh) * | 2021-03-29 | 2021-07-30 | 大族激光科技产业集团股份有限公司 | 激光加工方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114700960B (zh) | 2023-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110238839B (zh) | 一种利用环境预测优化非模型机器人多轴孔装配控制方法 | |
CN107984472B (zh) | 一种用于冗余度机械臂运动规划的变参神经求解器设计方法 | |
CN105676636B (zh) | 一种基于nsga-ii算法的冗余度空间机械臂多目标优化方法 | |
CN105159096A (zh) | 一种基于粒子群算法的冗余度空间机械臂关节力矩优化方法 | |
Gao | Inverse kinematics solution of Robotics based on neural network algorithms | |
CN111890351A (zh) | 机器人及其控制方法、计算机可读存储介质 | |
CN102819264A (zh) | 移动机器人路径规划q学习初始化方法 | |
Xie et al. | A bi-criteria kinematic strategy for motion/force control of robotic manipulator | |
CN114967472A (zh) | 一种无人机轨迹跟踪状态补偿深度确定性策略梯度控制方法 | |
CN118192646A (zh) | 自主式水下航行器模型预测控制参数自适应轨迹跟踪方法 | |
CN116300977A (zh) | 一种依托强化学习的铰接车轨迹跟踪控制方法及装置 | |
CN114943182B (zh) | 基于图神经网络的机器人线缆形状控制方法及设备 | |
CN112947430A (zh) | 一种移动机器人的智能轨迹跟踪控制方法 | |
CN115570565A (zh) | 基于改进粒子群算法的工业机器人多目标轨迹优化方法 | |
CN113954077B (zh) | 带有能量优化的水下游动机械臂轨迹跟踪控制方法及装置 | |
Chen et al. | QPSO-MPC based tracking algorithm for cable-driven continuum robots | |
Afzali et al. | A modified convergence ddpg algorithm for robotic manipulation | |
CN114879508A (zh) | 一种基于模型预测控制的磨削机器人路径跟踪控制方法 | |
CN114700960A (zh) | 一种阶次优化的远程操控行为轮廓规划方法 | |
Gao et al. | Learning end-to-end visual servoing using an improved soft actor-critic approach with centralized novelty measurement | |
Tang et al. | Actively learning Gaussian process dynamical systems through global and local explorations | |
Meng et al. | Automatic control method of automobile steering-by-wire based on fuzzy PID | |
CN114918919B (zh) | 一种机器人运动技能学习方法及系统 | |
CN114905505B (zh) | 一种移动机器人的导航控制方法、系统及存储介质 | |
Yao et al. | An approach to solving optimal control problems of nonlinear systems by introducing detail-reward mechanism in deep reinforcement learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |