CN100498600C - 大型冷凝器水下作业环境下二关节机器人的控制方法 - Google Patents

大型冷凝器水下作业环境下二关节机器人的控制方法 Download PDF

Info

Publication number
CN100498600C
CN100498600C CNB2007100357659A CN200710035765A CN100498600C CN 100498600 C CN100498600 C CN 100498600C CN B2007100357659 A CNB2007100357659 A CN B2007100357659A CN 200710035765 A CN200710035765 A CN 200710035765A CN 100498600 C CN100498600 C CN 100498600C
Authority
CN
China
Prior art keywords
partiald
omega
fuzzy
joint
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2007100357659A
Other languages
English (en)
Other versions
CN101122777A (zh
Inventor
王耀南
张辉
彭金柱
余洪山
孙炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CNB2007100357659A priority Critical patent/CN100498600C/zh
Publication of CN101122777A publication Critical patent/CN101122777A/zh
Application granted granted Critical
Publication of CN100498600C publication Critical patent/CN100498600C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明公开了一种大型冷凝器水下作业环境下二关节机器人的控制方法,其步骤为:(1)建立模糊高斯基神经网络控制器结构,每个子网代表一个关节的伺服控制器;(2)初始化控制系统的各个参数及网络权值,并根据当前二关节的角位移和期望的运动角位移,得到二关节角位移的误差和误差变化率;(3)将误差和误差变化率作为模糊高斯基神经网络控制器的输入,通过模糊高斯基神经网络控制器求取二关节运动点上施加的力矩,根据力矩控制电机使关节到达预期定位坐标。本发明能克服由于机器人自身建模困难、环境扰动不确定性等带来的影响、既能综合人类专家的控制经验,又具有神经网络控制器的自学习功能,从而达到较高控制精度。

Description

大型冷凝器水下作业环境下二关节机器人的控制方法
技术领域
本发明主要涉及到二关节机器人的控制领域,特指一种大型冷凝器水下作业环境下二关节机器人的控制方法。
背景技术
机器人的真正研制工作起始于20世纪40年代,第一台工业用机器人于1959年在美国Unimation公司问世,这标志着机器人开始进入工业应用。至今应用于实际的机器人中大约有80%位于工业现场,属于工业机器人,此类机器人具有:结构简单、工作环境已知、机器人的工作预先设定等特点,因此也决定了机器人的控制属于示教再现型,机器人的作业路径、运动参数需要操作人员手把手示教或通过在线编程实现,基本上只能重复操作人员示范的操作。随着传感器技术、计算机技术、网络等技术的发展,机器人拥有了外部传感器,对工作对象、外界环境具有了一定的感知能力,并将这些感知的信息作为反馈形成闭环控制。到目前,机器人不仅具有了对外界的感知能力,还可以进行复杂的逻辑思维和决策,完成智能化作业。因此,随着机器人技术的发展,机器人控制技术也得到了迅速的发展。
机器人的控制问题就是使机器人的各关节或末端执行器的位置能够以理想的动态品质跟踪给定的轨迹或稳定在指定的位置上。此问题存在的两个难点:一是如何实现闭环误差系统的稳定,使轨迹跟踪误差尽快趋近于零;另一个是如何抑制干扰,尽可能地减少干扰信号对跟踪进入的影响。
作为控制对象,机器人自身是一个具有时变、强耦合的多输入多输出非线性系统,其控制是十分复杂的。本专利提出的大型冷凝器水下作业环境下的智能二关节机器人控制方法是在专利“冷凝器铜管二关节式在线清洗机器人”(公开号:CN1945196)和“在线清洗热交换器的水中作业机器人”(授权号:CN2631712Y)的基础上,将此专利的机器人作为控制对象,研究其作业过程中的控制方法。由于此机器人工作在水下环境,信号测量和系统建模存在不精确定性,再加上复杂的环境变化以及受水流(速度、强度)、水温、水压等带来的外界不确定扰动影响,因此无法获得机器人精确、完整的运动模型,所以常规的控制方法和现代控制法方也无法或难以保证其控制精度,存在要么过于复杂要么无法保证其控制的实时性等问题。所以,在满足机器人控制精度的前提下,设计一种简单可靠、实时性好、便于实现、能够在水下工作的智能二关节机器人控制方法是保证机器人正常工作的关键技术难题。
发明内容
本发明要解决的问题就在于:针对现有技术存在的技术问题,本发明提供一种基于模糊高斯基神经网络控制方法、能够克服由于机器人自身建模困难、环境扰动不确定性等带来的影响、既能综合人类专家的控制经验,又具有神经网络控制器的自学习功能,从而达到较高控制精度的大型冷凝器水下作业环境下二关节机器人的控制方法。
为解决上述技术问题,本发明提出的解决方案为:一种大型冷凝器水下作业环境下二关节机器人的控制方法,其特征在于步骤为:
(1)、建立模糊高斯基神经网络控制器结构,整个网络分为两个子网,每个子网代表一个关节的伺服控制器,考虑到关节之间的耦合作用,两子网的输出u1和u2分别乘以相应的影响因子得到整个网络的输出y1和y2
(2)、初始化控制系统的各个参数及网络权值,取控制周期T值,通过轴编码器获取机器人当前二关节的角位移(θ1、θ2),并通过预期定位坐标,计算出二关节的期望运动角位移(θd1、θd2),从而求取二关节角位移的误差和误差变化率e1=θd11、e2=θd22 ec 1 = de 1 dT , ec 2 = de 2 dT ;
(3)、将(e1、e2、ec1、ec2)作为模糊高斯基神经网络控制器的输入,通过模糊高斯基神经网络控制器求取二关节运动点上施加的力矩(t1、t2),其中(t1、t2)满足关系式:t1=y1,t2=y2,根据力矩(t1、t2)控制二关节机器人上两个关节的电机运动,到达预期定位坐标。
所述步骤(1)中模糊高斯基神经网络控制器依次分为5层,在下列各式中
Figure C200710035765D00073
分别代表第k个子网的第i层网络的第j个神经元的输入和输出:
①计算输入;第1层将输入误差和误差变化率(e1、e2、ec1、ec2)引入网络,每个输入的论域均为[-1,1];
out i ( 1 ) k = in i ( 1 ) = x i , k k k = 1,2 ; i = 1,2 - - - ( 1 )
其中kxi代表第k个子网的第i个输入;
②模糊化;第2层对输入进行模糊化,对应于每个输入有3个模糊语言词集{N,Z,P}={“负”,“零”,“正”},隶属函数采用高斯基函数,与{N,Z,P}对应的中心值分别为{-1,0,1},宽度为{0.5,0.5,0.5},
out ij ( 2 ) k = in ij ( 2 ) k = μ A j i k ( out i ( 1 ) k ) = e ( out i ( 1 ) - a ij k k ) 2 b ij 2 k , k = 1,2 ; i = 1,2 ; j = 1 , 2,3 - - - ( 2 )
式中,
Figure C200710035765D00082
代表第k个子网中第i个输入对应的第j个语言词集, A i j k ∈ { N , Z , P } , kaijkbij分别为
Figure C200710035765D00084
的中心值和宽度;
③交叉相乘;第3层代表“and”操作,在此网络中用乘法代替取小运算,
out ij ( 3 ) k = in ij ( 3 ) k = out 1 i ( 2 ) k · out 2 j ( 2 ) k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 3 )
④去模糊化;第4层代表去模糊化过程,在这里采用权值平均判决法,
in ( 4 ) k = Σ i , j = 1 3 ( out ij ( 3 ) · ω ij ( 3 ) k k ) , k = 1,2 - - - ( 4 )
u k = out ( 4 ) k = in ( 4 ) k / Σ i , j = 1 3 out ij ( 3 ) k , k = 1,2 - - - ( 5 )
在式中,
Figure C200710035765D00088
为网络的权值,其物理意义是各控制规则的输出对应的语言词集的中心值;
⑤耦合处理;第5层代表关节之间的耦合作用,
y l = Σ k = 1 2 ( u k · ω kl ( 4 ) ) , l = 1,2 - - - ( 6 )
其中,为网络权值,它反映了各关节之间的耦合作用。
所述步骤(2)中,使模糊高斯基神经网络控制器完成“离线学习”,其步骤为:
①采用随机函数初始化网络各权值
Figure C200710035765D000811
和高斯函数的参数kaijkbij
②在模糊高斯基神经网络控制器中输入离线学习样本数据
Figure C200710035765D000812
Figure C200710035765D000813
③通过模糊高斯基神经网络计算网络输出y1和y2
④根据下列公式(7),计算Joff
J off = 1 2 Σ l = 1 2 ( y ^ l - y l ) 2 - - - ( 7 )
式中,
Figure C200710035765D00092
为样本输出,即网络期望输出,yl为网络实际输出;
⑤如果Joff小于或等于0.01,则离线学习结束,得到权值
Figure C200710035765D00093
和高斯函数的参数kaijkbij
⑥如果Joff大于0.01,则通过下列公式(7)~公式(10),计算并更新参数
Figure C200710035765D00094
Figure C200710035765D00095
kaijkbij,并返回第③步进入计算流程,直至得到符合要求的权值
Figure C200710035765D00096
和高斯函数的参数kaijkbij
ω kl ( 4 ) ( t + 1 ) = ω kl ( 4 ) ( t ) - η 1 ∂ J off ∂ ω kl ( 4 ) , k = 1,2 ; l = 1,2 - - - ( 8 )
ω ij ( 3 ) k ( t + 1 ) = ω ij ( 3 ) k ( t ) - η 2 ∂ J off ∂ ω ij ( 3 ) k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 9 )
a ij k ( t + 1 ) = a ij k ( t ) - η 3 ∂ J off ∂ a ij k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 10 )
b ij k ( t + 1 ) = b ij k ( t ) - η 4 ∂ J off ∂ b ij k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 11 )
其中,η1、η2、η3和η4为学习率。
所述模糊高斯基神经网络控制器完成“离线学习”后,可进行“在线学习”,在此,为保证控制系统的实时性,仅对参数
Figure C200710035765D000911
Figure C200710035765D000912
进行“在线学习”,其步骤为:
①用离线学习方法得到的参数
Figure C200710035765D000913
Figure C200710035765D000914
kaijkbij赋值于模糊高斯基神经网络;
②根据机器人实际运行的控制输入,通过模糊高斯基神经网络控制机器人的动作,获得机器人的实际输出θ1、θ2
③根据参考期望输出θd1、θd2和θ1、θ2,采用下列公式(12),计算Jon
J on = 1 2 Σ m = 1 2 ( θ dm - θ m ) 2 = 1 2 Σ m = 1 2 e m 2 - - - ( 12 )
④如果Jon小于或等于0.005,则结束在线学习,得到权值
⑤如果Jon大于0.005,则通过下列公式(12)~公式(17),计算并更新参数
Figure C200710035765D00102
且返回步骤②进入计算流程,直至得到符合要求的权值
Figure C200710035765D00104
ω kl ( 4 ) ( t + 1 ) = ω kl ( 4 ) ( t ) - η 1 ∂ J on ∂ ω kl ( 4 ) , k = 1,2 ; l = 1,2 - - - ( 13 )
ω ij ( 3 ) k ( t + 1 ) = ω ij ( 3 ) k ( t ) - η 2 ∂ J on ∂ ω ij ( 3 ) k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 14 )
∂ J on ∂ ω kl ( 4 ) = - Σ m = 1 2 ( - e m · ∂ θ m ∂ y l ) · u k , k = 1,2 , l = 1,2 - - - ( 15 )
∂ J on ∂ ω ij ( 3 ) k = Σ l = 1 2 [ - Σ m = 1 2 ( - e m · ∂ θ m ∂ y l ) · ω kl ( 4 ) out ij ( 3 ) / Σ i , j out ij ( 3 ) k ] ,
k = 1,2 ; i = 1,2,3 ; j = 1,2,3 ; l = 1,2 - - - ( 16 )
∂ θ m ∂ y l ≈ θ m ( t ) - θ m ( t - 1 ) y l ( t ) - y l ( t - 1 ) + ϵ - - - ( 17 )
其中,η1、η2、η3和η4为学习率,ε是个极小的正数。
与现有技术相比,本发明的优点就在于:
1、本发明采用模糊高斯基神经网络控制方法,将神经网络与模糊控制相结合,能够较好的克服两者各自的缺点,既可以使模糊控制具有自学习的能力,又可以赋予神经网络推理归纳的能力,同时还能够使网络的结构、权值具有明确的物理意义;
2、本发明与以往传统的机器人控制方法相比,该方法能在水下恶劣环境下,具有根据环境的变化进行控制器在线参数学习整定的功能,因此使机器人的控制具有了很强的鲁棒性;
3、本方法解决了因外界参数不确定性和干扰未知时的二关节机器人控制问题,能实现水下环境的精确作业控制。
附图说明
图1是基于模糊高斯基神经网络的二关节机器人控制系统结构示意图;
图2是模糊高斯基神经网络控制器的结构示意图;
图3是隶属函数的初始形状与分布示意图;
图4是关节1的轨迹跟踪控制曲线示意图;
图5是关节1的跟踪误差曲线示意图;
图6是关节2的轨迹跟踪控制曲线示意图;
图7是关节2的跟踪误差曲线示意图;
图8是模糊高斯基神经网络的二关节机器人控制系统作业的流程示意图;
图9是模糊高斯基神经网络输入输出处理的流程示意图;
图10是离线学习算法的流程示意图;
图11是在线学习算法的流程示意图。
具体实施方式
以下将结合附图和具体实施例对本发明做进一步详细说明。
如图8所示,本发明一种大型冷凝器水下作业环境下二关节机器人的控制方法,其步骤为:
(1)、建立模糊高斯基神经网络控制器结构,整个网络分为两个子网,每个子网代表一个关节的伺服控制器,考虑到关节之间的耦合作用,两子网的输出u1和u2分别乘以相应的影响因子得到整个网络的输出y1和y2
(2)、初始化控制系统的各个参数及网络权值,取控制周期T值,通过轴编码器获取机器人当前二关节的角位移(θ1、θ2),并通过预期定位坐标,计算出二关节的期望运动角位移(θd1、θd2),从而求取二关节角位移的误差和误差变化率e1=θd11、e2=θd22 ec 1 = de 1 dT , ec 2 = de 2 dT ;
(3)、将(e1、e2、ec1、ec2)作为模糊高斯基神经网络控制器的输入,通过模糊高斯基神经网络控制器求取二关节运动点上施加的力矩(t1、t2),其中(t1、t2)满足关系式:t1=y1,t2=y2,根据力矩(t1、t2)控制二关节机器人上两个关节的电机运动,到达预期定位坐标。
如图1、图2和图9所示,在上述步骤(1)中模糊高斯基神经网络控制器依次分为5层,在下列各式中分别代表第k个子网的第i层网络的第j个神经元的输入和输出:
①计算输入;第1层将输入误差和误差变化率(e1、e2、ec1、ec2)引入网络,每个输入的论域均为[-1,1];
out i ( 1 ) k = in i ( 1 ) = x i , k k k = 1,2 ; i = 1,2 - - - ( 1 )
其中kxi代表第k个子网的第i个输入;
②模糊化;第2层对输入进行模糊化,对应于每个输入有3个模糊语言词集{N,Z,P}={“负”,“零”,“正”},隶属函数采用高斯基函数,与{N,Z,P}对应的中心值分别为{-1,0,1},宽度为{0.5,0.5,0.5},
out ij ( 2 ) k = in ij ( 2 ) k = μ A j i k ( out i ( 1 ) k ) = e ( out i ( 1 ) - a ij k k ) 2 b ij 2 k , k = 1,2 ; i = 1,2 ; j = 1 , 2,3 - - - ( 2 )
式中,
Figure C200710035765D00123
代表第k个子网中第i个输入对应的第j个语言词集, A i j k ∈ { N , Z , P } , kaijkbij分别为
Figure C200710035765D00125
的中心值和宽度;
③交叉相乘;第3层代表“and”操作,在此网络中用乘法代替取小运算,
out ij ( 3 ) k = in ij ( 3 ) k = out 1 i ( 2 ) k · out 2 j ( 2 ) k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 3 )
④去模糊化;第4层代表去模糊化过程,在这里采用权值平均判决法,
in ( 4 ) k = Σ i , j = 1 3 ( out ij ( 3 ) · ω ij ( 3 ) k k ) , k = 1,2 - - - ( 4 )
u k = out ( 4 ) k = in ( 4 ) k / Σ i , j = 1 3 out ij ( 3 ) k , k = 1,2 - - - ( 5 )
在式中,
Figure C200710035765D00129
为网络的权值,其物理意义是各控制规则的输出对应的语言词集的中心值;
⑤耦合处理;第5层代表关节之间的耦合作用,
y l = Σ k = 1 2 ( u k · ω kl ( 4 ) ) , l = 1,2 - - - ( 6 )
其中,
Figure C200710035765D001211
为网络权值,它反映了各关节之间的耦合作用。
在图1中,θd1、θd2是二关节的期望位置,θ1、θ2为二关节的实际位置,e1、e2为二关节的位置误差,e1、e2经微分后得到误差变化率ec1、ec2。t1、t2为作用于二关节的转矩。图1中,模糊高斯基神经网络被用作关节伺服控制器。下面的符号存在以下关系:1x1=e11x2=ec12x1=e22x2=ec2,t1=y1,t2=y2
如图9所示,在上述步骤(2)中,使模糊高斯基神经网络控制器完成“离线学习”,其步骤为:
①采用随机函数初始化网络各权值
Figure C200710035765D00131
和高斯函数的参数kaijkbij
②在模糊高斯基神经网络控制器中输入离线学习样本数据
Figure C200710035765D00132
Figure C200710035765D00133
③通过模糊高斯基神经网络计算网络输出y1和y2
④根据下列公式(7),计算Joff
J off = 1 2 Σ l = 1 2 ( y ^ l - y l ) 2 - - - ( 7 )
式中,
Figure C200710035765D00135
为样本输出,即网络期望输出,yl为网络实际输出;
⑤如果Joff小于或等于0.01,则离线学习结束,得到权值
Figure C200710035765D00136
和高斯函数的参数kaijkbij
⑥如果Joff大于0.01,则通过下列公式(8)~公式(11),计算并更新参数
Figure C200710035765D00137
Figure C200710035765D00138
kaijkbij,并返回第③步进入计算流程,直至得到符合要求的权值
Figure C200710035765D00139
和高斯函数的参数kaijkbij
ω kl ( 4 ) ( t + 1 ) = ω kl ( 4 ) ( t ) - η 1 ∂ J off ∂ ω kl ( 4 ) , k = 1,2 ; l = 1,2 - - - ( 8 )
ω ij ( 3 ) k ( t + 1 ) = ω ij ( 3 ) k ( t ) - η 2 ∂ J off ∂ ω ij ( 3 ) k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 9 )
a ij k ( t + 1 ) = a ij k ( t ) - η 3 ∂ J off ∂ a ij k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 10 )
b ij k ( t + 1 ) = b ij k ( t ) - η 4 ∂ J off ∂ b ij k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 11 )
其中,η1、η2、η3和η4为学习率
在具体实施例中,“离线学习”的具体步骤为:在离线学习阶段,首先选取一组样本数据 ( x ^ 1 1 , x ^ 2 1 , x ^ 1 2 , x ^ 2 2 , y ^ 1 , y ^ 2 ) , 然后用此样本数据对网络进行训练,训练的值包括
Figure C200710035765D00142
以及高斯函数的参数kaijkbij。通过迭代公式(8)~公式(11)计算。
训练的目标函数为:
J off = 1 2 Σ l = 1 2 ( y ^ l - y l ) 2 - - - ( 11 )
式中,为样本输出,即网络期望输出,yl为网络实际输出。则有:
∂ J off ∂ ω kl ( 4 ) = ∂ J off ∂ y l · ∂ y l ∂ ω kl ( 4 ) = - ( y ^ l - y l ) · u k , k = 1,2 , l = 1,2 - - - ( 12 )
∂ J off ∂ ω ij ( 3 ) k = Σ l = 1 2 ( ∂ J off ∂ y l · ∂ y l ∂ u k · ∂ u k ∂ ω ij ( 3 ) k ) = Σ l = 1 2 [ - ( y ^ l - y l ) ω kl ( 4 ) out ij ( 3 ) / Σ i , j out ij ( 3 ) k ] ,
k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 13 )
∂ J off ∂ a 1 i k = Σ l = 1 2 Σ j = 1 3 ( ∂ J off ∂ y l · ∂ y l ∂ u k · ∂ u k ∂ out ij ( 3 ) k · ∂ out ij ( 3 ) k ∂ out 1 i ( 2 ) k · ∂ out 1 i ( 2 ) k ∂ a 1 i k )
= 2 Σ l = 1 2 Σ j = 1 3 ( - ( y ^ l - y l ) · ω kl ( 4 ) · ω ij ( 3 ) k - u k Σ i , j out ij ( 3 ) k · out ij ( 3 ) k x ^ 1 k - a 1 i k b 1 i 2 k ) , k = 1,2 ; i = 1,2,3 - - - ( 14 )
∂ J off ∂ b 1 i k = Σ l = 1 2 Σ j = 1 3 ( ∂ J off ∂ y l · ∂ y l ∂ u k · ∂ u k ∂ out ij ( 3 ) k · ∂ out ij ( 3 ) k ∂ out 1 i ( 2 ) k · ∂ out 1 i ( 2 ) k ∂ b 1 i k )
= 2 Σ l = 1 2 Σ j = 1 3 ( - ( y ^ l - y l ) · ω kl ( 4 ) · ω ij ( 3 ) k - u k Σ i , j out ij ( 3 ) k · out ij ( 3 ) k ( x ^ 1 k - a 1 i k ) 2 b 1 i 2 k ) , k = 1,2 ; i = 1,2,3 - - - ( 15 )
∂ J off ∂ a 2 j k = Σ l = 1 2 Σ j = 1 3 ( ∂ J off ∂ y l · ∂ y l ∂ u k · ∂ u k ∂ out ij ( 3 ) k · ∂ out ij ( 3 ) k ∂ out 2 j ( 2 ) k · ∂ out 2 j ( 2 ) k ∂ a 2 j k )
= 2 Σ l = 1 2 Σ i = 1 3 ( - ( y ^ l - y l ) · ω kl ( 4 ) · ω ij ( 3 ) k - u k Σ i , j out ij ( 3 ) k · out ij ( 3 ) k x ^ 2 k - a 2 j k b 2 j 2 k ) , k = 1,2 ; j = 1,2,3 - - - ( 16 )
∂ J off ∂ b 2 j k = Σ l = 1 2 Σ i = 1 3 ( ∂ J off ∂ y l · ∂ y l ∂ u k · ∂ u k ∂ out ij ( 3 ) k · ∂ out ij ( 3 ) k ∂ out 2 j ( 2 ) k · ∂ out 2 j ( 2 ) k ∂ b 2 j k )
= 2 Σ l = 1 2 Σ i = 1 3 ( - ( y ^ l - y l ) · ω kl ( 4 ) · ω ij ( 3 ) k - u k Σ i , j out ij ( 3 ) k · out ij ( 3 ) k ( x ^ 2 k - a 2 j k ) 2 b 2 j 3 k ) , k = 1,2 ; j = 1,2,3 - - - ( 17 )
如图10所示,模糊高斯基神经网络控制器完成“离线学习”后,可进行“在线学习”,其步骤为:
①用离线学习方法得到的参数
Figure C200710035765D00153
kaijkbij赋值于模糊高斯基神经网络;
②根据机器人实际运行的控制输入,通过模糊高斯基神经网络控制机器人的动作,获得机器人的实际输出θ1、θ2
③根据参考期望输出θd1、θd2和θ1、θ2,采用下列公式(18),计算Jon
J on = 1 2 Σ m = 1 2 ( θ dm - θ m ) 2 = 1 2 Σ m = 1 2 e m 2 - - - ( 18 )
④如果Jon小于或等于0.005,则结束在线学习,得到权值
Figure C200710035765D00155
⑤如果Jon大于0.005,则通过下列公式(19)~公式(23),计算并更新参数
Figure C200710035765D00156
Figure C200710035765D00157
且返回步骤②进入计算流程,直至得到符合要求的权值
Figure C200710035765D00158
ω kl ( 4 ) ( t + 1 ) = ω kl ( 4 ) ( t ) - η 1 ∂ J on ∂ ω kl ( 4 ) , k = 1,2 ; l = 1,2 - - - ( 19 )
ω ij ( 3 ) k ( t + 1 ) = ω ij ( 3 ) k ( t ) - η 2 ∂ J on ∂ ω ij ( 3 ) k , k = 1,2 ; i = 1,2,3 ; j = 1,2,3 - - - ( 20 )
∂ J on ∂ ω kl ( 4 ) = - Σ m = 1 2 ( - e m · ∂ θ m ∂ y l ) · u k , k = 1,2 , l = 1,2 - - - ( 21 )
∂ J on ∂ ω ij ( 3 ) k = Σ l = 1 2 [ - Σ m = 1 2 ( - e m · ∂ θ m ∂ y l ) · ω kl ( 4 ) out ij ( 3 ) / Σ i , j out ij ( 3 ) k ] ,
k = 1,2 ; i = 1,2,3 ; j = 1,2,3 ; l = 1,2 - - - ( 22 )
∂ θ m ∂ y l ≈ θ m ( t ) - θ m ( t - 1 ) y l ( t ) - y l ( t - 1 ) + ϵ - - - ( 23 )
其中,η1、η2、η3和η4为学习率,ε是个极小的正数。
以下用一个具体应用实例对本发明的操作进行详细说明。本专利的智能二关节机器人的控制方法应用于水下冷凝器清洗机器人的控制中,具体的参数为:m1=10kg,m2=2kg和l1=1.1m,l2=0.8m。初始条件为θ1(0)=0rad,θ2(0)=1rad, θ 1 · ( 0 ) = θ · 2 ( 0 ) = 0 rad / s . 期望轨迹为θd1(t)=sin(2πt),θd2(t)=cos(2πt),采样周期T为0.0005s。假设摩擦项和扰动项分别为 F ( Θ · ) = 0.5 sign ( Θ · ) , T d = ( Θ , Θ · ) = 5 cos ( 5 t ) 5 cos ( 5 t ) N · m . 网络的权值
Figure C200710035765D00164
的初值分别如表1、表2、表3所示。
表1权值
Figure C200710035765D00165
的初值
Figure C200710035765D00166
表2权值
Figure C200710035765D00167
的初值
Figure C200710035765D00168
表3权值
Figure C200710035765D00169
的初值
Figure C200710035765D001610
如图4~7所示,给出了所提模糊高斯基神经网络控制方法的结果,并与传统的模糊控制结果进行了比较。图4给出了关节1的轨迹跟踪曲线,在图中的三条曲线中,——表示关节1的角位移期望曲线;-----表示采用模糊高斯基控制器时,关节1的角位移变化曲线;…………表示采用传统模糊逻辑控制器时,关节1的角位移变化曲线;从图中可以看出,模糊高斯基控制器的更能使关节1的角位移最大限度的跟踪期望曲线,因此性能优于传统的模糊逻辑控制器。
如图5所示,给出了关节1的跟踪误差曲线,在图中的两条曲线中,_____表示表示采用模糊高斯基控制器时,关节1的角位移的误差曲线;______表示采用传统模糊逻辑控制器时,关节1的角位移的误差曲线;从图中可以看出,采用模糊高斯基控制器,误差较小,并能很快使误差接近零值。
如图6所示,给出了关节2的轨迹跟踪曲线,在图中的三条曲线中,_____表示关节2的角位移期望曲线;______表示采用模糊高斯基控制器时,关节2的角位移变化曲线;...............表示采用传统模糊逻辑控制器时,关节2的角位移变化曲线;从图中可以看出,模糊高斯基控制器的更能使关节2的角位移最大限度的跟踪期望曲线,因此性能优于传统的模糊逻辑控制器。
如图7所示,给出了关节2的跟踪误差曲线,在图中的两条曲线中,______表示表示采用模糊高斯基控制器时,关节2的角位移的误差曲线;_____表示采用传统模糊逻辑控制器时,关节2的角位移的误差曲线;从图中可以看出,采用模糊高斯基控制器,误差较小,并能很快使误差接近零值。从控制结果可以看出,模糊高斯基神经网络能够很好地用于机器人的控制,其性能与模糊控制器相比有了较大的提高。

Claims (5)

1、一种大型冷凝器水下作业环境下二关节机器人的控制方法,其特征在于步骤为:
(1)、建立模糊高斯基神经网络控制器结构,整个网络分为两个子网,每个子网代表一个关节的伺服控制器,考虑到关节之间的耦合作用,两子网的输出u1和u2分别乘以相应的影响因子得到整个网络的输出y1和y2
(2)、初始化控制系统的各个参数及网络权值,取控制周期T值,通过轴编码器获取机器人当前二关节的角位移(θ1、θ2),并通过预期定位坐标,计算出二关节的期望运动角位移(θd1、θd2),从而求取二关节角位移的误差和误差变化率e1=θd11、e2=θd22 ec 1 = de 1 dT , ec 2 = de 2 dT ;
(3)、将(e1、e2、ec1、ec2)作为模糊高斯基神经网络控制器的输入,通过模糊高斯基神经网络控制器求取二关节运动点上施加的力矩(t1、t2),其中(t1、t2)满足关系式:t1=y1,t2=y2,根据力矩(t1、t2)控制二关节机器人上两个关节的电机运动,到达预期定位坐标。
2、根据权利要求1所述的大型冷凝器水下作业环境下二关节机器人的控制方法,其特征在于所述步骤(1)中模糊高斯基神经网络控制器依次分为5层,在下列各式中 分别代表第k个子网的第i层网络的第j个神经元的输入和输出:
①计算输入;第1层将输入误差和误差变化率(e1、e2、ec1、ec2)引入网络,每个输入的论域均为[-1,1];
k out i ( 1 ) = k in i ( 1 ) = k x i , k=1,2;i=1,2             (1)
其中kxi代表第k个子网的第i个输入;
②模糊化;第2层对输入进行模糊化,对应于每个输入有3个模糊语言词集{N,Z,P}={“负”,“零”,“正”},隶属函数采用高斯基函数,与{N,Z,P}对应的中心值分别为{-1,0,1},宽度为{0.5,0.5,0.5},
out ij ( 2 ) k = in ij ( 2 ) = k μ A i j k ( out i ( 1 ) k ) = e - ( out i ( 1 ) - a ij k k ) 2 b ij 2 k , k=1,2;i=1,2;j=1,2,3     (2)
式中,代表第k个子网中第i个输入对应的第j个语言词集, k A i j ∈ { N , Z , P } , kaijkbij分别为
Figure C200710035765C00034
的中心值和宽度;
③交叉相乘;第3层代表“and”操作,在此网络中用乘法代替取小运算,
k out ij ( 3 ) = k in ij ( 3 ) = k out 1 i ( 2 ) · k out 2 j ( 2 ) , k=1,2;i=1,2,3;j=1,2,3      (3);
④去模糊化;第4层代表去模糊化过程,在这里采用权值平均判决法,
k in ( 4 ) = Σ i , j = 1 3 ( k out ij ( 3 ) · k ω ij ( 3 ) ) , k = 1,2 - - - ( 4 )
u k = k out ( 4 ) = k in ( 4 ) / Σ i , j = 1 3 k out ij ( 3 ) , k = 1,2 - - - ( 5 )
在式中,
Figure C200710035765C00038
为网络的权值,其物理意义是各控制规则的输出对应的语言词集的中心值;
⑤耦合处理;第5层代表关节之间的耦合作用,
y l = Σ k = 1 2 ( u k · ω kl ( 4 ) ) , l = 1,2 - - - ( 6 )
其中,
Figure C200710035765C000310
为网络权值,它反映了各关节之间的耦合作用。
3、根据权利要求1或2所述的大型冷凝器水下作业环境下二关节机器人的控制方法,其特征在于所述步骤(2)中,使模糊高斯基神经网络控制器完成“离线学习”,其步骤为:
①初始化网络各权值
Figure C200710035765C000312
和高斯函数的参数kaijkbij
②在模糊高斯基神经网络控制器中输入离线学习样本数据 ( 1 x ^ 1 , 1 x ^ 2 , 2 x ^ 1 , 2 x ^ 2 , y ^ 1 , y ^ 2 ) ;
③通过模糊高斯基神经网络计算网络输出y1和y2
④根据下列公式(7),计算Joff
J off = 1 2 Σ l = 1 2 ( y ^ l - y l ) 2 - - - ( 7 )
式中,为样本输出,即网络期望输出,yl为网络实际输出;Joff为训练的目标函数;
⑤如果Joff小于或等于0.01,则离线学习结束,得到权值
Figure C200710035765C00042
Figure C200710035765C00043
和高斯函数的参数kaijkbij
⑥如果Joff大于0.01,则通过下列公式(8)~公式(11),计算并更新参数
Figure C200710035765C00044
Figure C200710035765C00045
kaijkbij,并返回第③步进入计算流程,直至得到符合要求的权值
Figure C200710035765C00046
和高斯函数的参数kaijkbij
ω kl ( 4 ) ( t + 1 ) = ω kl ( 4 ) ( t ) - η 1 ∂ J off ∂ ω kl ( 4 ) ,  k=1,2;l=1,2       (8)
k ω ij ( 3 ) ( t + 1 ) = k ω ij ( 3 ) ( t ) - η 2 ∂ J off ∂ k ω ij ( 3 ) ,  k=1,2;i=1,2,3;j=1,2,3     (9)
k a ij ( t + 1 ) = k a ij ( t ) - η 3 ∂ J off ∂ k a ij ,  k=1,2;i=1,2,3;j=1,2,3        (10)
k b ij ( t + 1 ) = k b ij ( t ) - η 4 ∂ J off ∂ k b ij ,  k=1,2;i=1,2,3;j=1,2,3        (11)
其中,η1、η2、η3和η4为学习率。
4、根据权利要求3所述的大型冷凝器水下作业环境下二关节机器人的控制方法,其特征在于:所述模糊高斯基神经网络控制器完成“离线学习”后,可进行“在线学习”,为保证控制系统的实时性,仅对参数
Figure C200710035765C000412
Figure C200710035765C000413
进行“在线学习”,其步骤为:
①用离线学习方法得到的参数
Figure C200710035765C000415
kaijkbij赋值于模糊高斯基神经网络;
②根据机器人实际运行的控制输入,通过模糊高斯基神经网络控制机器人的动作,获得机器人的实际输出θ1、θ2
③根据参考期望输出θd1、θd2和θ1、θ2,采用下列公式(12),计算Jon
J on = 1 2 Σ m = 1 2 ( θ dm - θ m ) 2 = 1 2 Σ m = 1 2 e m 2 - - - ( 12 )
④如果Jon小于或等于0.005,则结束在线学习,得到权值
Figure C200710035765C000417
Figure C200710035765C000418
⑤如果Jon大于0.005,则通过下列公式(12)~公式(17),计算并更新参数
Figure C200710035765C00051
Figure C200710035765C00052
且返回步骤②进入计算流程,直至得到符合要求的权值
Figure C200710035765C00053
Figure C200710035765C00054
ω kl ( 4 ) ( t + 1 ) = ω kl ( 4 ) ( t ) - η 1 ∂ J on ∂ ω kl ( 4 ) , k=1,2;l=1,2           (13)
k ω ij ( 3 ) ( t + 1 ) = k ω ij ( 3 ) ( t ) - η 2 ∂ J on ∂ k ω ij ( 3 ) , k=1,2;i=1,2,3;j=1,2,3      (14)
∂ J on ∂ ω kl ( 4 ) = - Σ m = 1 2 ( - e m · ∂ θ m ∂ y l ) · u k ,  k=1,2,l=1,2      (15)
∂ J on ∂ k ω ij ( 3 ) = Σ l = 1 2 [ - Σ m = 1 2 ( - e m · ∂ θ m ∂ y l ) ω kl ( 4 ) k out ij ( 3 ) / Σ i , j out ij ( 3 ) ] ,
k=1,2;i=1,2,3;j=1,2,3;l=1,2           (16)
∂ θ m ∂ y l ≈ θ m ( t ) - θ m ( t - 1 ) y l ( t ) - y l ( t - 1 ) + ϵ - - - ( 17 )
其中,η1、η2、η3和η4为学习率,ε是个极小的正数。
CNB2007100357659A 2007-09-18 2007-09-18 大型冷凝器水下作业环境下二关节机器人的控制方法 Expired - Fee Related CN100498600C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2007100357659A CN100498600C (zh) 2007-09-18 2007-09-18 大型冷凝器水下作业环境下二关节机器人的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2007100357659A CN100498600C (zh) 2007-09-18 2007-09-18 大型冷凝器水下作业环境下二关节机器人的控制方法

Publications (2)

Publication Number Publication Date
CN101122777A CN101122777A (zh) 2008-02-13
CN100498600C true CN100498600C (zh) 2009-06-10

Family

ID=39085134

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007100357659A Expired - Fee Related CN100498600C (zh) 2007-09-18 2007-09-18 大型冷凝器水下作业环境下二关节机器人的控制方法

Country Status (1)

Country Link
CN (1) CN100498600C (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101551661B (zh) * 2009-05-12 2013-04-24 广东工业大学 一种面向多机器人系统的控制方法
CN101833333B (zh) * 2009-12-23 2011-09-14 湖南大学 水下清洗作业机器人未知环境路径规划方法
CN103279039A (zh) * 2013-05-17 2013-09-04 安徽工业大学 一种机器人神经网络式计算力矩控制器训练平台及训练方法
CN103927583B (zh) * 2014-04-28 2017-06-20 莫小钧 人工神经网络
CN109202861B (zh) * 2017-06-30 2021-11-23 沈阳新松机器人自动化股份有限公司 一种药剂调配机器人集成平台
CN107972036B (zh) * 2017-12-25 2021-04-27 厦门大学嘉庚学院 基于TensorFlow的工业机器人动力学控制系统及方法
CN109623819B (zh) * 2018-12-25 2020-08-21 哈工大机器人集团股份有限公司 一种机器人谐波传动关节实际力矩值的获取方法及装置
CN110109363B (zh) * 2019-05-28 2022-10-21 重庆理工大学 一种轮式移动机器人编队的神经网络自适应控制方法
CN115648227B (zh) * 2022-12-27 2023-03-31 珞石(北京)科技有限公司 一种机器人运动轨迹神经网络模糊控制优化方法

Also Published As

Publication number Publication date
CN101122777A (zh) 2008-02-13

Similar Documents

Publication Publication Date Title
CN100498600C (zh) 大型冷凝器水下作业环境下二关节机器人的控制方法
Wen et al. Path planning for active SLAM based on deep reinforcement learning under unknown environments
CN110238839B (zh) 一种利用环境预测优化非模型机器人多轴孔装配控制方法
CN104614991B (zh) 提高机器人参数辨识精度的方法
Valasek et al. Improved adaptive–reinforcement learning control for morphing unmanned air vehicles
CN101520857B (zh) 一种基于神经网络的永磁球形电动机逆运动学求解方法
Luo et al. Human–robot shared control based on locally weighted intent prediction for a teleoperated hydraulic manipulator system
CN106569487A (zh) 一种基于观测器的伺服系统的故障检测方法
Jha et al. A neural network approach for inverse kinematic of a SCARA manipulator
CN112207835B (zh) 一种基于示教学习实现双臂协同作业任务的方法
CN109799829B (zh) 一种基于自组织映射的机器人群体协同主动感知方法
CN116460860B (zh) 一种基于模型的机器人离线强化学习控制方法
Jiang et al. Energy consumption prediction and optimization of industrial robots based on LSTM
Guo et al. Local path planning of mobile robot based on long short-term memory neural network
CN113199477B (zh) 一种基于强化学习的Baxter机械臂轨迹跟踪控制方法
Qun Intelligent control technology of agricultural greenhouse operation robot based on fuzzy PID path tracking algorithm.
Tian et al. Network teleoperation robot system control based on fuzzy sliding mode
CN114012733A (zh) 一种用于pc构件模具划线的机械臂控制方法
Khan et al. Prediction of muscle activations for reaching movements using deep neural networks
CN106875008A (zh) 一种机械手运动学逆解方法及系统
Mokri et al. Real time implementation of NARMA L2 feedback linearization and smoothed NARMA L2 controls of a single link manipulator
Ramírez et al. Human behavior learning in joint space using dynamic time warping and neural networks
Xue et al. A robotic learning and generalization framework for curved surface based on modified DMP
Luo et al. On research progress and trend of motion control in industrial robot applications
Shen et al. Bilateral motion prediction and tracking control for nonlinear teleoperation system with time-varying delays

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090610

Termination date: 20180918