CN106970594A - 一种柔性机械臂的轨迹规划方法 - Google Patents
一种柔性机械臂的轨迹规划方法 Download PDFInfo
- Publication number
- CN106970594A CN106970594A CN201710320365.6A CN201710320365A CN106970594A CN 106970594 A CN106970594 A CN 106970594A CN 201710320365 A CN201710320365 A CN 201710320365A CN 106970594 A CN106970594 A CN 106970594A
- Authority
- CN
- China
- Prior art keywords
- mechanical arm
- flexible mechanical
- function
- determined
- movement locus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/408—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by data handling or data format, e.g. reading, buffering or conversion of data
- G05B19/4083—Adapting programme, configuration
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/35—Nc in input of data, input till input file format
- G05B2219/35356—Data handling
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Manufacturing & Machinery (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
Abstract
本发明公开了一种柔性机械臂的轨迹规划方法,不依赖于柔性机械臂的数学模型,而是通过强化学习算法动态地调整控制参数,从而为解决柔性机械臂的轨迹规划问题提供了一个新思路。所述柔性机械臂的轨迹规划方法,该方法包括:根据柔性机械臂的当前位姿和期望位姿,确定所述柔性机械臂运动轨迹的跟踪误差方程;根据柔性机械臂的状态和所述跟踪误差方程,确定所述柔性机械臂运动轨迹的代价函数;根据所述代价函数,和对所述柔性机械臂的控制策略,确定所述柔性机械臂运动轨迹的性能指标函数;基于强化学习算法确定使所述性能指标函数最小的最优控制策略,得到对期望运动轨迹的跟踪。
Description
技术领域
本发明涉及机械臂技术领域,尤其涉及一种柔性机械臂的轨迹规划方法。
背景技术
柔性机械臂由于其高速、低耗、质轻等优点,在制作业、航空航天等领域的应用越来越多。因此,目前对柔性机械臂的研究收到广泛的关注。机械臂轨迹规划是其中一个重要问题,关键是根据作业任务的要求,计算出机械臂预期的运动轨迹。
现有的轨迹规划算法重要的是要求机械臂对环境有全面的感知能力,对工作环境状态信息的依赖程度也相对较高。例如,现有的采用遗传算法对机械臂进行轨迹规划时,首先要对机械臂建立精确的运动学和动力学模型,然后基于模型再优化末端执行器的轨迹曲线。考虑到柔性机械臂本身所具有的高度非线性、强耦合和时变等特点,建立起精确的模型往往很难,导致传统的基于模型的算法无法进行有效控制和轨迹规划。
因此,现有技术中主要是在对机械臂进行运动学和动力学建模基础上,然后在关节空间或笛卡尔空间中,通过解变换方程、运动学/动力学方程反解,或者差值运算来实现柔性机械臂的轨迹规划。但是如果对机械臂建模不精确或运行环境发生变化,传统的计算方法可靠性会降低,无法有效控制和轨迹规划。
发明内容
本发明提供一种柔性机械臂轨的迹规划方法,不依赖于柔性机械臂的数学模型,而是通过强化学习算法动态地调整控制参数,从而为解决柔性机械臂的轨迹规划问题提供了一个新思路。
本发明实施例提供了一种柔性机械臂的轨迹规划方法,该方法包括:
根据机械臂的当前位姿和期望位姿,确定所述机械臂运动轨迹的跟踪误差方程;
根据柔性机械臂的状态和所述跟踪误差方程,确定所述柔性机械臂运动轨迹的代价函数;
根据所述代价函数,和对所述柔性机械臂的控制策略,确定所述柔性机械臂运动轨迹的性能指标函数;
基于强化学习算法确定使所述性能指标函数最小的最优控制策略,得到对期望运动轨迹的跟踪。
在一种可能的实施方式中,本发明实施例提供的上述机械臂轨迹规划的方法中,根据机械臂的当前位姿和期望位姿,确定所述柔性机械臂运动轨迹的跟踪误差方程,包括:
采用下述公式确定所述跟踪误差方程:
其中,yk为第k时刻机械臂的当前位姿,为第k时刻机械臂的期望位姿。
在一种可能的实施方式中,本发明实施例提供的上述柔性机械臂轨的迹规划方法中,根据柔性机械臂的状态和所述跟踪误差方程,确定所述柔性机械臂运动轨迹的代价函数,具体包括:
采用下述公式确定所述柔性机械臂运动轨迹的代价函数:
其中,
xk为第k时刻所述柔性机械臂的状态,ek为第k时刻所述柔性机械臂的跟踪误差,P、S和R分别为对应的权重矩阵。
在一种可能的实施方式中,本发明实施例提供的上述柔性机械臂轨的迹规划方法中,根据所述代价函数和对所述柔性机械臂的控制策略,确定所述柔性机械臂运动轨迹的性能指标函数,具体包括:
采用下述公式确定所述性能指标:
其中,xk为第k时刻所述机械臂的状态,ek为第k时刻所述柔性机械臂的跟踪误差,uk为所述柔性机械臂的控制策略且作为第k时刻所需要的输入值。
在一种可能的实施方式中,本发明实施例提供的上述柔性机械臂的轨迹规划方法中,基于强化学习算法确定使所述性能指标最小的最优控制策略,包括:
根据强化学习算法中的SARSA算法的动作值函数Q和动作值函数Q的更新表达式,确定最优控制策略的函数:
根据所述最优控制策略的函数,确定所述性能指标函数的最小值。
在一种可能的实施方式中,本发明实施例提供的上述柔性机械臂的轨迹规划方法中,根据强化学习算法中的SARSA算法的动作值函数Q和动作值函数Q的更新表达式,确定最优控制策略的函数,具体包括:
采用下述方式确定所述最优控制策略的函数:
Q(xk,ek,uk)=r(xk,ek,uk)+V(xk,ek,uk),
Q(xk,ek,uk)←Q(xk,ek,uk)+α[rk+1+γQ(xk+1,ek+1,uk+1)-Q(xk,ek,uk)],k≥0;
其中,α为对新得到的信息覆盖旧信息的程度的学习率,γ为对未来回报的重视程度的折扣因子,xk+1为第k+1时刻所述柔性机械臂的状态,ek+1为第k+1时刻所述柔性机械臂的跟踪误差,uk+1为第k+1时刻所需要的输入值,Q*(xk,ek,uk)为Q(xk,ek,uk)的最优。
在一种可能的实施方式中,本发明实施例提供的上述柔性机械臂的轨迹规划方法中,根据所述最优控制策略的函数,确定所述性能指标函数的最小值,具体包括:
采用下述方式确定所述最小值:
本发明有益效果如下:
本发明实施例提供的柔性机械臂的轨迹规划方法,包括:根据机械臂的当前位姿和期望位姿,确定所述柔性机械臂运动轨迹的跟踪误差方程;根据柔性机械臂的状态和所述跟踪误差方程,确定所述柔性机械臂运动轨迹的代价函数;根据所述代价函数,和对所述柔性机械臂的控制策略,确定所述柔性机械臂运动轨迹的性能指标函数;基于强化学习算法确定使所述性能指标函数最小的最优控制策略,得到对期望运动轨迹的跟踪。因此,本发明实施例中的提供的柔性机械臂的轨迹规划方法,主要是采用强化学习算法确定的机械臂规划的轨迹,且在采用强化学习算法时,主要是基于柔性机械臂运动轨迹的跟踪误差、柔性机械臂运动轨迹的代价函数和柔性机械臂的控制策略确定的性能指标函数,从而确定最优轨迹规划,相比现有技术,不依赖于柔性机械臂的数学模型,而是通过强化学习算法通过不断的探索和试错学习来发现最优控制策略,从而为解决柔性机械臂的轨迹规划问题提供了一个新思路。
附图说明
图1为本发明实施例提供的一种柔性机械臂轨迹规划的方法的流程示意图;
图2为本发明实施例提供的一种SARSA算法的状态-动作对序列片段示意图;
图3为本发明实施例提供的一种柔性机械臂轨迹规划的结构示意图;
图4为本发明实施例提供的一种柔性机械臂轨迹规划的仿真结果示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供一种柔性机械臂的轨迹规划方法,不依赖于柔性机械臂的数学模型,而是通过强化学习算法动态地调整控制参数,从而为解决柔性机械臂的轨迹规划问题提供了一个新思路。
参见图1,本发明实施例提供的一种柔性机械臂的轨迹规划方法,该方法包括:
S101、根据机械臂的当前位姿和期望位姿,确定柔性机械臂运动轨迹的跟踪误差方程;
S102、根据柔性机械臂的状态和跟踪误差方程,确定柔性机械臂运动轨迹的代价函数;
其中,本发明实施例中的状态可以采用现有技术中的方法确定柔性机械臂的状态。具体地,首先对多自由度柔性机械臂进行分析,确定柔性机械臂的状态空间表达式。
S103、根据代价函数,和对柔性机械臂的控制策略,确定柔性机械臂运动轨迹的性能指标函数;
S104、基于强化学习算法确定使性能指标函数最小的最优控制策略,得到对期望运动轨迹的跟踪,实现对期望运动轨迹的跟踪。
其中,常用的强化学习算法包括TD算法、Q学习算法和SARSA算法。本发明实施例中再确定性能指标函数的最小值时,主要基于Q学习算法和SARSA算法以及不断的学习和试错发现最优控制策略,实现对期望运动轨迹的跟踪。
通过本发明实施例提供的柔性机械臂的轨迹规划方法,主要是通过在对柔性机械臂进行分析后,确定柔性机械臂的状态,并根据机械臂的当前位姿和期望位姿,确定柔性机械臂运动轨迹的跟踪误差方程,从而使得将轨迹规划问题转化为轨迹跟踪问题,然后通过确定柔性机械臂的控制策略后,轨迹跟踪问题转化为最优跟踪控制问题,目标是找寻最优的控制策略使得机械臂运动轨迹的性能指标函数最小,进一步地,根据强化学习算法确定性能指标函数的最小值,从而得到柔性机械臂轨迹规划的最优值,较好地实现了对柔性机械臂运动轨迹的跟踪和期望。
下面首先介绍下如何确定柔性机械臂的状态空间表达式。
首先对多自由度柔性机械臂进行分析,在不考虑外部末端执行器作用力和静摩擦力的作用下,建立自由度为n的柔性机械臂在关节空间下相应的动力学模型为:
其中,公式(1)中,τ为柔性机械臂关节的转矩,q为柔性机械臂关节的变量,为柔性机械臂关节变量的速度,为柔性机械臂关节变量的加速度。其中,M(q)为n*n的对称矩阵,称为惯性矩阵,是n*1的科氏力和离心力矢量,G(q)为n*1的重力矢量。
根据公式(1),进一步确定柔性机械臂的状态空间表达式为:
或其中,
结合采样保持方法,将公式(2)-(3)进行离散化,从而得到公式(4),
xk+1=f(xk)+g(xk)uk,yk=xk (4)
然后,本发明实施例中根据柔性机械臂的状态空间表达式,以及公式(4)确定柔性机械臂的控制策略,进一步解决柔性机械臂的轨迹规划问题。
可选地,本发明实施例提供的上述柔性机械臂的轨迹规划方法中,步骤S101根据柔性机械臂的当前位姿和期望位姿,确定柔性机械臂运动轨迹的跟踪误差方程,包括:
采用下述公式(1)确定跟踪误差方程:
其中,yk为第k时刻柔性机械臂的当前位姿,为第k时刻柔性机械臂的期望位姿。
具体地,假设柔性机械臂在第k时刻期望的位姿为而实际上柔性机械臂的位姿为yk,因此,为了使得当前位姿与期望位姿相同,则确定使得跟踪误差的值越小越好。具体地,如何使ek最小,进一步需要建立关于ek的方程,从而使得ek最小。
可选地,本发明实施例提供的上述柔性机械臂的轨迹规划方法中,步骤S102根据柔性机械臂的状态(4)和跟踪误差方程(5),确定柔性机械臂运动轨迹的代价函数,具体包括:
采用下述公式确定柔性机械臂运动轨迹的代价函数:
其中,xk为第k时刻柔性机械臂的状态,ek为第k时刻柔性机械臂的跟踪误差,P、S和R分别为相应的权重矩阵。
具体地,本发明实施例中的代价函数是指柔性机械臂所得到的回报,对柔性机械臂在第k时刻所作出的动作的好坏作出一种评价。因为对于柔性机械臂系统,在试错学习过程中需要考虑到当前采取的动作对所得到的回报和下一个时刻的影响,从而避免出现Cliff Walkking现象。另外,本发明实施例中采用SARSA算法也是为了需要考虑到当前采取的动作对所得到的回报和下一个时刻的影响,从而避免出现Cliff Walkking现象。
可选地,本发明实施例提供的上述柔性机械臂的轨迹规划方法中,步骤S103根据代价函数和对柔性机械臂的控制策略,确定柔性机械臂运动轨迹的性能指标函数,具体包括:
采用下述公式确定运动轨迹的性能指标函数:
其中,xk为第k时刻柔性机械臂的状态,ek为第k时刻柔性机械臂的跟踪误差,uk为柔性机械臂的控制策略且作为第k时刻所需要的输入值。
具体地,本发明实施例中的控制策略为uk=h(xk,ek),根据第k时刻的状态,以及跟踪误差,确定对柔性机械臂的控制策略为uk,即uk为柔性机械臂的控制策略且作为第k时刻所需要的输入值。通过控制策略的确定进一步将轨迹规划问题转化为了最优跟踪控制问题,即得到公式即通过强化学习算法,确定最优值。
可选地,本发明实施例提供的上述柔性机械臂的轨迹规划方法中,步骤S104基于强化学习算法确定使性能指标最小的最优控制策略,包括:
根据强化学习算法中的SARSA算法的动作值函数Q和动作值函数Q的更新表达式,确定最优控制策略的函数:
根据最优控制策略的函数,确定性能指标函数的最小值。
具体地,强化学习算法包括TD算法、Q学习算法和SARSA算法。Q学习算法要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。这个很具有普遍性的问题应用于学习控制移动机器人,在工厂中学习最优操作工序以及学习棋类对奕等。当agent在其环境中做出每个动作时,施教者会提供奖励或惩罚信息,以表示结果状态的正确与否。另外,SARSA算法是一种策略算法,它是将预测的算法扩展到控制学习中而形成,即是基于执行策略所获取的经验来更新函数,从而得到最优值。
可选地,本发明实施例提供的上述柔性机械臂的轨迹规划方法中,根据强化学习算法中的SARSA算法的动作值函数Q和动作值函数Q的更新表达式,确定最优控制策略的函数,具体包括:
采用下述方式确定最优控制策略的函数:
Q(xk,ek,uk)=r(xk,ek,uk)+V(xk,ek,uk), (9)
Q(xk,ek,uk)←Q(xk,ek,uk)+α[rk+1+γQ(xk+1,ek+1,uk+1)-Q(xk,ek,uk)],k≥0;(10)
其中,α为对新得到的信息覆盖旧信息的程度的学习率,γ为对未来回报的重视程度的折扣因子,xk+1为第k+1时刻柔性机械臂的状态,ek+1为第k+1时刻柔性机械臂的跟踪误差,uk+1为第k+1时刻所需要的输入值,Q*(xk,ek,uk)为Q(xk,ek,uk)的最优。
具体地,参见图2所示的SARSA算法的状态-动作对序列片段的示意图。根据图2可见xk+1与xk,uk,rk+1有关,xk+2与xk+1,uk+1,rk+2有关。即动作值函数Q的每次更新都与xk,ek,uk,rk+1,xk+1,ek+1,uk+1的值有关。因此,通过SARSA算法可以考虑到当前输入值和下一个输入值的状态和跟踪误差,从而进一步有效地确定最优控制策略。
可选地,本发明实施例提供的上述柔性机械臂的轨迹规划方法中,根据最优控制策略的函数,确定性能指标函数的最小值,具体包括:
采用下述方式确定所述最小值:
具体地,在得到公式(8)时,进一步根据通过公式(11)确定最优控制策略函数的最优值。
因此,本发明实施例中基于SARSA算法,柔性机械臂可以通过不断的探索和试错学习来发现最优控制策略,从而不依赖运动学或动力学模型,更好地实现了对机械臂运动轨迹的跟踪。
另外,通过本发明实施例提供的柔性机械臂的轨迹规划方法步骤,进一步可以根据几个阶段进行描述,参见图3,在实现柔性机械臂的轨迹规划方法包括:
轨迹规划器02根据柔性机械臂的期望位姿和当前位姿,确定柔性机械臂运动轨迹的跟踪误差方程;根据柔性机械臂的状态和跟踪误差方程,确定柔性机械臂运动轨迹的代价函数,以及根据回报评价器对代价函数的更新,和对柔性机械臂的控制策略,确定柔性机械臂运动轨迹的性能指标函数;
柔性机械臂01在该控制策略下产生动作;
回报评价器03根据柔性机械臂01的运行环境和动作对柔性机械臂的轨迹进行评价,并将该评价情况反馈给轨迹规划器02。
例如,当柔性机械臂具有三个关节时,采用本发明实施例提供的柔性机械臂的轨迹规划方法后,并且在仿真模型中得到图4所示的轨迹跟踪示意图。从图4中可以看出,通过本发明实施例提供的柔性机械臂的轨迹规划方法,得到的柔性机械臂的有效跟踪,且当前位姿与期望位姿几乎一致。
综上,本发明实施例提供的柔性机械臂的轨迹规划方法,包括:根据机械臂的当前位姿和期望位姿,确定柔性机械臂运动轨迹的跟踪误差方程;根据柔性机械臂的状态和跟踪误差方程,确定柔性机械臂运动轨迹的代价函数;根据代价函数,和对柔性机械臂的控制策略,确定柔性机械臂运动轨迹的性能指标函数;基于强化学习算法确定使性能指标函数最小的最优控制策略,得到对期望运动轨迹的跟踪。因此,本发明实施例中的提供的柔性机械臂的轨迹规划方法,主要是采用强化学习算法确定的柔性机械臂规划的轨迹,且在采用强化学习算法时,主要是基于柔性机械臂运动轨迹的跟踪误差、柔性机械臂运动轨迹的代价函数和柔性机械臂的控制策略确定的性能指标函数,从而确定的最优轨迹规划,相比现有技术,不依赖于柔性机械臂的数学模型,而是通过强化学习算法通过不断的探索和试错学习来发现最优控制策略,从而为解决柔性机械臂的轨迹规划问题提供了一个新思路。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (7)
1.一种柔性机械臂的轨迹规划方法,其特征在于,该方法包括:
根据柔性机械臂的当前位姿和期望位姿,确定所述柔性机械臂运动轨迹的跟踪误差方程;
根据柔性机械臂的状态和所述跟踪误差方程,确定所述柔性机械臂运动轨迹的代价函数;
根据所述代价函数,和对所述柔性机械臂的控制策略,确定所述柔性机械臂运动轨迹的性能指标函数;
基于强化学习算法确定使所述性能指标函数最小的最优控制策略,得到对期望运动轨迹的跟踪。
2.根据权利要求1所述的方法,其特征在于,根据柔性机械臂的当前位姿和期望位姿,确定所述柔性机械臂运动轨迹的跟踪误差方程,包括:
采用下述公式确定所述跟踪误差方程:
其中,yk为第k时刻机械臂的当前位姿,为第k时刻机械臂的期望位姿。
3.据权利要求2述的方法,其特征在于,根据柔性机械臂的状态和所述跟踪误差方程,确定所述柔性机械臂运动轨迹的代价函数,具体包括:
采用下述公式确定所述柔性机械臂运动轨迹的代价函数:
其中,
xk为第k时刻所述柔性机械臂的状态,ek为第k时刻所述机械臂的跟踪误差,P、S和R分别为对应的权重矩阵。
4.根据权利要求3述的方法,其特征在于,根据所述代价函数和对所述柔性机械臂的控制策略,确定所述柔性机械臂运动轨迹的性能指标函数,具体包括:
采用下述公式确定所述性能指标:
其中,xk为第k时刻所述柔性机械臂的状态,ek为第k时刻所述柔性机械臂的跟踪误差,uk为所述柔性机械臂的控制策略且作为第k时刻所需要的输入值。
5.根据权利要求4述的方法,其特征在于,基于强化学习算法确定使所述性能指标最小的最优控制策略,包括:
根据强化学习算法中的SARSA算法的动作值函数Q和动作值函数Q的更新表达式,确定最优控制策略的函数:
根据所述最优控制策略的函数,确定所述性能指标函数的最小值。
6.根据权利要求5所述的方法,其特征在于,根据强化学习算法中的SARSA算法的动作值函数Q和动作值函数Q的更新表达式,确定最优控制策略的函数,具体包括:
采用下述方式确定所述最优控制策略的函数:
Q(xk,ek,uk)←Q(xk,ek,uk)+α[rk+1+γQ(xk+1,ek+1,uk+1)-Q(xk,ek,uk)],k≥0;
其中,α为对新得到的信息覆盖旧信息的程度的学习率,γ为对未来回报的重视程度的折扣因子,xk+1为第k+1时刻所述柔性机械臂的状态,ek+1为第k+1时刻所述柔性机械臂的跟踪误差,uk+1为第k+1时刻所需要的输入值,Q*(xk,ek,uk)为Q(xk,ek,uk)的最优。
7.根据权利要求6所述的方法,其特征在于,根据所述最优控制策略的函数,确定所述性能指标函数的最小值,具体包括:
采用下述方式确定所述最小值:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710320365.6A CN106970594B (zh) | 2017-05-09 | 2017-05-09 | 一种柔性机械臂的轨迹规划方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710320365.6A CN106970594B (zh) | 2017-05-09 | 2017-05-09 | 一种柔性机械臂的轨迹规划方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106970594A true CN106970594A (zh) | 2017-07-21 |
CN106970594B CN106970594B (zh) | 2019-02-12 |
Family
ID=59332125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710320365.6A Active CN106970594B (zh) | 2017-05-09 | 2017-05-09 | 一种柔性机械臂的轨迹规划方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106970594B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107398903A (zh) * | 2017-09-04 | 2017-11-28 | 杭州电子科技大学 | 工业机械手臂执行端的轨迹控制方法 |
CN108656107A (zh) * | 2018-04-04 | 2018-10-16 | 北京航空航天大学 | 一种基于图像处理的机械臂抓取系统及方法 |
CN109240092A (zh) * | 2018-11-30 | 2019-01-18 | 长春工业大学 | 基于多智能体可重构模块化柔性机械臂轨迹跟踪控制方法 |
CN109491320A (zh) * | 2018-10-31 | 2019-03-19 | 华中科技大学 | 一种基于强化学习的刀具路径生成与优化方法 |
CN110017790A (zh) * | 2019-03-15 | 2019-07-16 | 南京航空航天大学 | 一种基于测量精度的曲面扫描轨迹生成与优化方法 |
CN110154020A (zh) * | 2019-05-14 | 2019-08-23 | 浙江树人学院(浙江树人大学) | 一种自适应动态规划的柔性机械臂控制方法 |
CN110244626A (zh) * | 2019-06-21 | 2019-09-17 | 南京邮电大学 | 基于强化学习的多用户水产养殖自动调控系统及方法 |
CN111086268A (zh) * | 2019-11-08 | 2020-05-01 | 新疆天业(集团)有限公司 | 一种电石炉石灰粉料压球控制系统的积分强化学习控制方法 |
CN112428278A (zh) * | 2020-10-26 | 2021-03-02 | 北京理工大学 | 机械臂的控制方法、装置及人机协同模型的训练方法 |
CN114700960A (zh) * | 2022-03-02 | 2022-07-05 | 西北工业大学 | 一种阶次优化的远程操控行为轮廓规划方法 |
CN114698624A (zh) * | 2022-04-27 | 2022-07-05 | 中垦种业股份有限公司 | 一种水稻田高效除草方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8700307B1 (en) * | 2013-03-04 | 2014-04-15 | Mitsubishi Electric Research Laboratories, Inc. | Method for determining trajectories manipulators to avoid obstacles |
CN105549598A (zh) * | 2016-02-16 | 2016-05-04 | 江南大学 | 一种二维运动移动机器人的迭代学习轨迹跟踪控制及其鲁棒优化方法 |
CN105598968A (zh) * | 2016-01-26 | 2016-05-25 | 中山大学 | 一种并联机械臂的运动规划与控制方法 |
CN106094516A (zh) * | 2016-06-08 | 2016-11-09 | 南京大学 | 一种基于深度强化学习的机器人自适应抓取方法 |
CN106094813A (zh) * | 2016-05-26 | 2016-11-09 | 华南理工大学 | 基于模型相关强化学习的仿人机器人步态控制方法 |
CN106078741A (zh) * | 2016-06-21 | 2016-11-09 | 华南理工大学 | 基于确定学习理论的性能受限柔性机械臂控制方法 |
-
2017
- 2017-05-09 CN CN201710320365.6A patent/CN106970594B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8700307B1 (en) * | 2013-03-04 | 2014-04-15 | Mitsubishi Electric Research Laboratories, Inc. | Method for determining trajectories manipulators to avoid obstacles |
CN105598968A (zh) * | 2016-01-26 | 2016-05-25 | 中山大学 | 一种并联机械臂的运动规划与控制方法 |
CN105549598A (zh) * | 2016-02-16 | 2016-05-04 | 江南大学 | 一种二维运动移动机器人的迭代学习轨迹跟踪控制及其鲁棒优化方法 |
CN106094813A (zh) * | 2016-05-26 | 2016-11-09 | 华南理工大学 | 基于模型相关强化学习的仿人机器人步态控制方法 |
CN106094516A (zh) * | 2016-06-08 | 2016-11-09 | 南京大学 | 一种基于深度强化学习的机器人自适应抓取方法 |
CN106078741A (zh) * | 2016-06-21 | 2016-11-09 | 华南理工大学 | 基于确定学习理论的性能受限柔性机械臂控制方法 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107398903A (zh) * | 2017-09-04 | 2017-11-28 | 杭州电子科技大学 | 工业机械手臂执行端的轨迹控制方法 |
CN107398903B (zh) * | 2017-09-04 | 2020-06-30 | 杭州电子科技大学 | 工业机械手臂执行端的轨迹控制方法 |
CN108656107B (zh) * | 2018-04-04 | 2020-06-26 | 北京航空航天大学 | 一种基于图像处理的机械臂抓取系统及方法 |
CN108656107A (zh) * | 2018-04-04 | 2018-10-16 | 北京航空航天大学 | 一种基于图像处理的机械臂抓取系统及方法 |
CN109491320A (zh) * | 2018-10-31 | 2019-03-19 | 华中科技大学 | 一种基于强化学习的刀具路径生成与优化方法 |
CN109240092A (zh) * | 2018-11-30 | 2019-01-18 | 长春工业大学 | 基于多智能体可重构模块化柔性机械臂轨迹跟踪控制方法 |
CN109240092B (zh) * | 2018-11-30 | 2021-09-10 | 长春工业大学 | 基于多智能体可重构模块化柔性机械臂轨迹跟踪控制方法 |
CN110017790A (zh) * | 2019-03-15 | 2019-07-16 | 南京航空航天大学 | 一种基于测量精度的曲面扫描轨迹生成与优化方法 |
CN110017790B (zh) * | 2019-03-15 | 2021-02-09 | 南京航空航天大学 | 一种基于测量精度的曲面扫描轨迹生成与优化方法 |
CN110154020A (zh) * | 2019-05-14 | 2019-08-23 | 浙江树人学院(浙江树人大学) | 一种自适应动态规划的柔性机械臂控制方法 |
CN110244626A (zh) * | 2019-06-21 | 2019-09-17 | 南京邮电大学 | 基于强化学习的多用户水产养殖自动调控系统及方法 |
CN110244626B (zh) * | 2019-06-21 | 2021-09-14 | 南京邮电大学 | 基于强化学习的多用户水产养殖自动调控系统及方法 |
CN111086268A (zh) * | 2019-11-08 | 2020-05-01 | 新疆天业(集团)有限公司 | 一种电石炉石灰粉料压球控制系统的积分强化学习控制方法 |
CN111086268B (zh) * | 2019-11-08 | 2021-02-23 | 新疆天业(集团)有限公司 | 一种电石炉石灰粉料压球控制系统的积分强化学习控制方法 |
CN112428278A (zh) * | 2020-10-26 | 2021-03-02 | 北京理工大学 | 机械臂的控制方法、装置及人机协同模型的训练方法 |
CN114700960A (zh) * | 2022-03-02 | 2022-07-05 | 西北工业大学 | 一种阶次优化的远程操控行为轮廓规划方法 |
CN114700960B (zh) * | 2022-03-02 | 2023-09-08 | 西北工业大学 | 一种阶次优化的远程操控行为轮廓规划方法 |
CN114698624A (zh) * | 2022-04-27 | 2022-07-05 | 中垦种业股份有限公司 | 一种水稻田高效除草方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106970594B (zh) | 2019-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106970594A (zh) | 一种柔性机械臂的轨迹规划方法 | |
CN105093934B (zh) | 考虑干扰与模型不确定性的多机器人系统分布式有限时间跟踪控制方法 | |
Argall et al. | A survey of robot learning from demonstration | |
Konar et al. | A deterministic improved Q-learning for path planning of a mobile robot | |
Argall et al. | Learning robot motion control with demonstration and advice-operators | |
Yuguang et al. | Dynamic modeling and adaptive fuzzy sliding mode control for multi-link underwater manipulators | |
Kronander et al. | Online learning of varying stiffness through physical human-robot interaction | |
CN108161934A (zh) | 一种利用深度强化学习实现机器人多轴孔装配的方法 | |
Liu et al. | Modelling and remote control of an excavator | |
Chaimowicz et al. | A paradigm for dynamic coordination of multiple robots | |
Hoque et al. | Lazydagger: Reducing context switching in interactive imitation learning | |
CN103433924A (zh) | 串联机器人高精度位置控制方法 | |
Sun et al. | Trajectory tracking of constrained robotic systems via a hybrid control strategy | |
CN107685343A (zh) | 一种机械臂运动学参数标定构型优化方法 | |
Noshadi et al. | Active disturbance rejection control of a parallel manipulator with self learning algorithm for a pulsating trajectory tracking task | |
CN107589671A (zh) | 一种基于事件驱动的卫星姿态控制方法 | |
CN106406098A (zh) | 一种机器人系统在未知环境下的人机交互控制方法 | |
Kshirsagar et al. | Evaluating guided policy search for human-robot handovers | |
Jin et al. | Task-driven hybrid model reduction for dexterous manipulation | |
Jin et al. | Learning from human directional corrections | |
CN101635063A (zh) | 一种椭圆截面弹性柱体自由扭转/变形的模拟方法 | |
CN111890364A (zh) | 机器人的运动控制方法、装置、电子设备及存储介质 | |
Kwon et al. | SSPQL: stochastic shortest path-based Q-learning | |
CN116604532A (zh) | 一种上肢康复机器人智能控制方法 | |
Er et al. | Real-time hybrid adaptive fuzzy control of a SCARA robot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |