CN112859601B - 机器人控制器设计方法、装置、设备及可读存储介质 - Google Patents

机器人控制器设计方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN112859601B
CN112859601B CN202110028180.4A CN202110028180A CN112859601B CN 112859601 B CN112859601 B CN 112859601B CN 202110028180 A CN202110028180 A CN 202110028180A CN 112859601 B CN112859601 B CN 112859601B
Authority
CN
China
Prior art keywords
robot
model
control
target
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110028180.4A
Other languages
English (en)
Other versions
CN112859601A (zh
Inventor
胡慧
易伟
郭鹏
李洋
王越彪
屈繁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Institute of Engineering
Original Assignee
Hunan Institute of Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Institute of Engineering filed Critical Hunan Institute of Engineering
Priority to CN202110028180.4A priority Critical patent/CN112859601B/zh
Publication of CN112859601A publication Critical patent/CN112859601A/zh
Application granted granted Critical
Publication of CN112859601B publication Critical patent/CN112859601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种机器人控制器设计方法、装置、设备及可读存储介质。本发明通过建立所述机器人的动力学模型,并确定所述机器人的目标控制模型,根据所述动力学模型设计所述机器人的事件触发机制,并对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型,基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律,确定所述机器人的闭环控制模型,并利用所述控制律、所述自适应律以及所述闭环控制模型,建立所述机器人的目标控制器,解决了事件触发机制的非线性问题,提高了基于事件触发的风机检测机器人操作臂的控制系统的稳定性和可行性。

Description

机器人控制器设计方法、装置、设备及可读存储介质
技术领域
本发明涉及机器人控制领域,尤其涉及一种机器人控制器设计方法、装置、设备及可读存储介质。
背景技术
随着风力发电技术的发展,风力成为必不可少的可再生能源,特别是目前全世界正面临的巨大的能源需求,预计未来50年全球能源需求将继续增长,风力发电机的使用也将越来越广泛。风力发电机由于大多在室外运行,其叶片因受紫外线辐射、雨雪、冰雹、温度骤变等自然因素的影响会导致风机部件应力疲劳,或因冲击破坏,灰尘和盐分等恶劣环境影响会导致风机部件的效率和性能下降,从而引发风机故障,为避免风机发生故障必须定期检查风机叶片。因此,最近几年诸如无人机和风机检测之类的机器人在执行风力发电机检查中,发挥着越来越重要的作用。在风力发电厂中长期使用自主风机检测机器人并根据电厂自身发送的数据和事件,最大限度地利用预防措施并降低活动成本,从而减少了预期的故障数量并最大限度地提高预防性维护的效果。
目前广泛应用在生产工业、医疗医药、航空航天、农业及生活服务等多个领域的现代机器人控制系统,大多数是基于时间触发的,即每隔固定的时间间隔就会触发周期性的时间激励信号,导致了大量不必要的通信,并因此增加了通信负担和能耗。因此,为节省通信资源提出基于事件触发机制的机器人控制系统。但由于机器人的操作臂系统是非线性的,且控制器的结构设计较为复杂,为解决此类问题,许多人在设计控制系统时,往往会使用多个模糊逻辑或神经网络假设非线性函数被线性参数化,但是在最终设计的控制系统中,这种假设通常很难检验,因此,最终设计的控制系统并不能很好的解决事件触发的非线性,导致控制系统的稳定性和可行性较低,甚至不具有稳定性和可行性。
发明内容
本发明的主要目的在于提供一种机器人控制器设计方法、装置、设备及可读存储介质,旨在解决现有基于事件触发机制的机器人控制系统,由于无法解决事件触发的非线性导致系统稳定性和可行性低的技术问题。
此外,为实现上述目的,本发明还提供一种机器人控制器设计方法,所述方法包括以下步骤:
建立所述机器人的动力学模型,并确定所述机器人的目标控制模型;
根据所述动力学模型设计所述机器人的事件触发机制,并对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型;
基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律;
确定所述机器人的闭环控制模型,并利用所述控制律、所述自适应律以及所述闭环控制模型,建立所述机器人的目标控制器。
可选地,所述建立所述机器人的动力学模型的步骤包括:
确定所述机器人的动力学参数;
根据所述动力学参数中的广义关节位置,建立所述机器人的惯性矩阵;
根据所述动力学参数和所述惯性矩阵,生成所述机器人的动力学模型。
可选地,所述根据所述动力学模型设计所述机器人的事件触发机制的步骤,包括:
利用所述动力学模型中的关节位置和关节速度,确定所述机器人的状态向量;
利用所述状态向量定义所述机器人的测量误差;
确定所述机器人的事件触发参数,并利用所述测量误差和所述事件触发参数确定所述机器人的事件触发机制。
可选地,所述对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型的步骤,包括:
定义所述目标控制模型的描述函数,并确定所述目标控制模型的控制参数;
根据所述描述函数和所述控制参数,构造所述目标控制模型的函数近似模型。
可选地,所述基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律的步骤,包括:
利用所述函数近似模型,构建所述机器人的控制输入模型,以确定所述机器人的控制律;
基于所述事件触发机制,确定在事件触发时刻,所述控制输入模型中的控制变量的更新规律;
根据所述更新规律确定所述机器人的自适应律。
可选地,所述根据所述控制律和所述自适应律,确定所述机器人的目标控制器之后的步骤,包括:
对所述目标控制器进行稳定性验证,以确定所述目标控制器是否具有稳定性;
若所述目标控制器具有稳定性,对所述目标控制器进行可行性验证,以确定所述目标控制器是否具有可行性。
可选地,所述对所述目标控制器进行稳定性验证,以确定所述目标控制器是否具有稳定性的步骤,包括:
利用所述目标控制器中的控制参数,构建稳定性函数;
利用所述稳定性函数和预设稳定性算法,验证所述控制参数的有界性;
根据所述控制参数的有界性,确定所述目标控制器是否具有稳定性。
此外,为实现上述目的,本发明还提供一种机器人控制器设计装置,所述机器人控制器设计装置包括:
模型建立模块,用于建立所述机器人的动力学模型,并确定所述机器人的目标控制模型;
模型设计模块,用于根据所述动力学模型设计所述机器人的事件触发机制,并对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型;
控制设计模块,用于基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律;
控制建立模块,用于确定所述机器人的闭环控制模型,并利用所述控制律、所述自适应律以及所述闭环控制模型,建立所述机器人的目标控制器。
此外,为实现上述目的,本发明还提供一种机器人控制器设计设备,所述机器人控制器设计设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机器人控制器设计程序,所述机器人控制器设计程序被所述处理器执行时实现如上述的机器人控制器设计方法的步骤。
此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有机器人控制器设计程序,所述机器人控制器设计程序被处理器执行时实现如上述的机器人控制器设计方法的步骤。
本发明实施例提出的一种机器人控制器设计方法、装置、设备及可读存储介质。现有技术中,基于事件触发机制的机器人控制系统,由于无法很好的解决函数的非线性问题,导致机器人的控制系统稳定性和可行性较低,与现有技术相比,本发明实施例中,通过建立所述机器人的动力学模型,并确定所述机器人的目标控制模型,根据所述动力学模型设计所述机器人的事件触发机制,并对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型,基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律,然后确定所述机器人的闭环控制模型,并利用所述控制律、所述自适应律以及所述闭环控制模型,建立所述机器人的目标控制器。即本申请中的目标控制器的函数近似模型具有良好的函数逼近能力,能将非线性的函数近似为分段线性函数,结合自适应反推技术能有效解决控制系统中因非线性函数导致的稳定性问题,因此,根据所述目标控制器建立的机器人控制系统,能很好地解决控制系统中的函数的非线性问题,从而提高机器人控制系统的稳定性和可行性。
附图说明
图1为本发明实施例提供的设备一种实施方式的硬件结构示意图;
图2为本发明机器人控制器设计方法第一实施例的流程示意图;
图3为本发明机器人控制器设计装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
本发明实施例机器人控制器设计设备(又叫终端、设备或者终端设备)可以是PC,也可以是智能手机、平板电脑和便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在移动终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及机器人控制器设计程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的机器人控制器设计程序,所述机器人控制器设计程序被处理器执行时实现下述实施例提供的机器人控制器设计方法中的操作。
基于上述设备硬件结构,提出了本发明机器人控制器设计方法的实施例。
参照图2,在本发明机器人控制器设计方法的第一实施例中,所述机器人控制器设计方法包括:
步骤S10,建立所述机器人的动力学模型,并确定所述机器人的目标控制模型;
本发明中的机器人控制器设计方法应用于机器人,包括但不限于风力发电机检测机器人,以下以风机检测机器人(简称机器人)为例进行说明,运用本发明中的机器人控制器设计方法设计的控制器,用于控制机器人的操作臂,该机器人的操作臂可以是任意自由度的,例如二自由度、四自由度或六自由度等,本实施例中,对机器人操作臂的自由度不做限定。建立机器人的动力学模型,机器人的动力学模型包括但不限于以下公式1所示的模型:
Figure GDA0002996316140000061
其中,
Figure GDA0002996316140000062
是广义关节位置和速度矢量,M(q)∈Rn×n为惯性矩阵,
Figure GDA0002996316140000063
中包括了机器人操作臂的离心力和哥氏力矩,φ(q)∈Rn×n为重力向量,d(t)∈Rn是外部干扰力矩,u(t)∈Rn是控制输入向量,代表了机器人的关节驱动力矩,Rn和Rn×n都是特征矩阵。
在机器人的动力学模型中,控制模型的输入不仅要包括机器人自身的内部驱动力,还要考虑外部干扰和误差等,在建立机器人的动力学模型后,选择机器人的目标控制模型,本实施例中的目标控制模型为基于事件触发机制的神经网络控制模型,其中一种优选模型为基于事件触发机制的RBF(Radial Basis Function,径向基函数)神经网络控制模型,RBF神经网络具有良好的函数逼近能力,在状态空间的紧凑区域上能够近似任何连续的未知函数,本实施例以RBF神经网络为例进行说明。
步骤S20,根据所述动力学模型设计所述机器人的事件触发机制,并对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型;
在建立机器人的动力学模型并选择目标控制模型后,根据机器人的动力学模型设计事件触发机制,然后描述RBF神经网络,由于RBF神经网络控制模型主要用于近似未知函数,因此需要确定RBF的函数近似模型,对RBF进行模型描述以确定RBF神经网络的函数近似模型。
步骤S30,基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律;
机器人的控制律包括在事件触发时刻,机器人的控制模型中的参数更新规律,机器人的自适应律包括机器人在事件触发时刻,按照控制律更新的参数的误差估计参数的更新律,机器人在事件触发时刻,不但可以按照触发的事件更新相应的控制参数,控制参数如目标控制模型的目标权重等,还可以根据触发的事件更新控制参数的误差估计参数,例如外部干扰和重构误差等。对外部干扰重构误差的更新为机器人的自适应律。
步骤S10的细化步骤,包括步骤A1-A3:
步骤A1,确定所述机器人的动力学参数;
步骤A2,根据所述动力学参数中的广义关节位置,建立所述机器人的惯性矩阵;
步骤A3,根据所述动力学参数和所述惯性矩阵,生成所述机器人的动力学模型。
在建立机器人的动力学模型时,需要先确定机器人的动力学参数,包括机器人操作臂的广义关节位置、机器人操作臂的速度矢量、操作臂的离心力和哥氏力矩等,针对动力学参数中的广义关节位置,建立机器人操作臂的惯性矩阵,然后根据建立的惯性矩阵和动力学参数建立机器人的动力学模型,建立的动力学模型如上述公式1所示,在此不再赘述。
步骤S20的细化步骤,包括步骤B1-B5:
步骤B1,利用所述动力学模型中的关节位置和关节速度,确定所述机器人的状态向量;
步骤B2,利用所述状态向量定义所述机器人的测量误差;
步骤B3,确定所述机器人的事件触发参数,并利用所述测量误差和所述事件触发参数确定所述机器人的事件触发机制。
步骤B4,定义所述目标控制模型的描述函数,并确定所述目标控制模型的控制参数;
步骤B5,根据所述描述函数和所述控制参数,构造所述目标控制模型的函数近似模型。
机器人操作臂的关节的位置和速度确定了该操作臂的状态,利用动力学模型中的关节位置和关节速度,确定所述机器人的状态向量,利用定义的机器人操作臂关节的状态向量定义机器人的测量误差,然后确定机器人的事件触发参数,利用机器人的事件触发参数和机器人的状态向量,确定机器人的事件触发机制,机器人的事件触发机制设计过程如下列公式所示(公式2-7):
定义机器人操作臂的状态向量:
Figure GDA0002996316140000081
定义测量误差:
e(t)=x(t)-x(tk) t∈[tk,tk+1) (3)
设计机器人的事件触发机制:
D(||e(t)||)≤σs||x(t)|| (4)
Figure GDA0002996316140000082
Figure GDA0002996316140000083
定义死区:
Figure GDA0002996316140000084
其中,x(t)即为由机器人操作臂的关节位置和速度定义的状态向量,tk为事件触发的瞬间,σs为事件触发参数,Γs为事件触发参数的常数,且0<Γs<1,
Figure GDA0002996316140000085
为李普希茨常数,P=PT>0和Q>0为满足李雅普诺夫方程的矩阵,λmin(Q)为矩阵Q的最小特征值,bM为大于0的常数,
Figure GDA0002996316140000086
为状态向量x的界限。
基于事件触发的时刻,在不丧失一般性的情况下,若第一个事件发生在t0=0的时刻,在每个触发时刻,对被控对象即机器人的操作臂的状态x(t)进行采样,并相应地更新控制律和参数自适应律,两个连续触发时刻之间的间隔长度称为事件间隔时间,一旦检测到有事件触发,将测量误差e(t)重置为零,根据定义的死区可知,当对机器操作人的驱动控制超出最大驱动范围时,控制机器人操作臂在状态范围内运动,当对机器操作人的驱动控制达不到最小驱范围时,对触发的事件不作响应,其中,机器人操作臂的驱动范围可以根据不同自由度的机器人进行自定义设置。
在完成机器人的事件触发机制设计后,定义RBF神经网络模型的描述函数,对RBF神经网络进行描述,RBF神经网络的描述函数包括激励函数、目标权重以及重构误差等,然后确定RBF神经网络的控制参数,RBF神经网络的控制参数包括神经网络隐含层、输入层和输出层的神经元数量,核向量等,利用描述函数和控制参数构建RBF神经网络的函数近似模型,具体构建过程如下列公式所示(公式8-12):
定义RBF神经网络的激励函数
Figure GDA0002996316140000091
RBF神经网络的目标权重矩阵wu,RBF神经网络的重构误差函数εu(x),wu
Figure GDA0002996316140000092
εu(x)在紧集合中应当是有界的,且
Figure GDA0002996316140000093
应当为李普希茨连续函数,则有:
Figure GDA0002996316140000094
其中,
Figure GDA0002996316140000095
是正常数,由于
Figure GDA0002996316140000096
应当是李普希茨连续函数,则对于每一个
Figure GDA0002996316140000097
都存在一个李普希茨常数
Figure GDA0002996316140000098
使得:
Figure GDA0002996316140000099
RBF神经网络具有良好的函数逼近能力,在状态空间的紧凑区域上能够近似未知函数f(x),即存在未知的目标权重矩阵w,通过选择合适的激活函数和足够数量的隐含层神经元,以任意期望的精度水平在一个紧凑的集合
Figure GDA00029963161400000910
上,f(x)可以写成:
Figure GDA00029963161400000911
Figure GDA00029963161400000912
Figure GDA00029963161400000913
其中,w*∈Rl×b是RBF神经网络的目标权重矩阵向量、x∈Ra×l是输入向量,
Figure GDA00029963161400000914
是RBF神经网络的核向量,
Figure GDA00029963161400000915
是RBF神经网络的激活函数,εf(x)是RBF神经网络的逼近误差函数,ci为隐含层中第i层神经元的中心点,μi为隐含层中第i层神经元的径基宽度,常数l,a和b分别是神经网络隐含层中的神经元数量、输入层神经元数量和输出层神经元数量。理想的目标权重矩阵向量有如下列公式所示的关系:
Figure GDA0002996316140000101
Figure GDA0002996316140000102
Figure GDA0002996316140000103
函数f(x)的表达式即为RBF神经网络的函数近似模型。
步骤S30的细化步骤,还包括步骤C1-C3:
步骤C1,利用所述函数近似模型,构建所述机器人的控制输入模型,以确定所述机器人的控制律;
步骤C2,基于所述事件触发机制,确定在事件触发时刻,所述控制输入模型中的控制变量的更新规律;
步骤C3,根据所述更新规律确定所述机器人的自适应律。
利用建立好的函数近似模型,构建机器人的自适应神经网络控制输入模型,由于对机器人的控制主要是根据目标控制器的输入进行的,需要明确目标控制器的输入包括哪些参数,且各个参数的性质如何,参数的性质包括变量、非变量等,一般变量为需要控制的参数,将需要控制的变量定义为控制变量,根据目标控制器的输入不同,即触发事件的不同,控制不同的变量,且对不同性质的变量采用不同的控制方式,要控制的变量以及对变量的控制方式即为机器人的控制律。具体地,从所有参数中确定需要对哪些变量进行控制,不同性质的变量应如何控制,这些内容即为控制规律,也即控制律,因此,确定机器人的控制律实际上是确定机器人的目标控制器的输入控制律。以上述公式10所示的函数近似模型为例,构建的控制输入模型如下:
Figure GDA0002996316140000104
Figure GDA0002996316140000105
其中,
Figure GDA0002996316140000106
是RBF神经网络目标权重矩阵估计,
Figure GDA0002996316140000107
是tk时刻RBF神经网络的激励函数,λ*表示外部干扰和重构误差的上限,l=lu和b=bu分别是RBF神经网络隐含层和输出层的神经元数量,
Figure GDA0002996316140000108
分别是最优参数
Figure GDA0002996316140000109
λ*的估计值,且仅在事件触发时间间隔内更新,根据公式2至7所示的事件触发机制,当在事件触发的时刻,参数的更新规律如下:
定义
Figure GDA00029963161400001010
的初始状态:
Figure GDA0002996316140000111
在触发时刻,
Figure GDA0002996316140000112
的更新状态为:
Figure GDA0002996316140000113
其中,
Figure GDA0002996316140000114
是在触发时刻之后立即更新的RBF神经网络目标权重的估计值,αu和αλ是RBF神经网络的学习速率。a1和a2是两个正数,σ是修正项,公式19所示的参数更新规律即为本实施例中的控制律。在确定控制律后,需要确定RBF神经网络控制的自适应律,对RBF神经网络的目标权重估计误差定义如下:
Figure GDA0002996316140000115
在触发时刻tk,神经网络估计误差参数
Figure GDA0002996316140000116
Figure GDA0002996316140000117
为:
Figure GDA0002996316140000118
Figure GDA0002996316140000119
确定在事件触发间隔间隔中,RBF神经网络的控制变量更新规律,即确定了RBF神经网络的自适应律,这是由于,按照控制律对控制变量进行控制后,控制变量的变化规律就是机器人的自适应律,即控制变量能根据事件触发后的不同的输入,自适应地把控制变量调整为最优参数值。
步骤S40,确定所述机器人的闭环控制模型,并利用所述控制律、所述自适应律以及所述闭环控制模型,建立所述机器人的目标控制器。
在构造机器人的控制律和自适应律后,确定机器人的闭环控制模型,即将机器人的动力学模型改为状态空间的表达式,然后结合构造的控制律、自适应律,建立机器人的目标控制器,机器人的目标控制器即为控制方程,具体地,根据机器人接收到的控制指令,对操作臂产生驱动力,利用驱动力控制机器人的操作臂移动,并控制机器人按照驱动力将操作臂精准移动至控制指令中的状态,以完成检测作业。
在对机器人的操作臂进行驱动时,往往会存在一定的外接因素的干扰,因此,在设计机器人的控制器时,需要考虑外部干扰因素,本实施例中的基于事件触发机制的神经网络控制器,在解决事件触发的非线性时,也要解决外部干扰的问题,进而实现对机器人操作臂的精准控制,即提高机器人控制的稳定性,当检测到外部干扰时,需要根据外部干扰对输入进行调整,因此,目标控制器对机器人采用的是闭环控制,可以向输入端反馈外部干扰信息。在本实施例中,设计机器人的控制器时,首先利用RBF神经网络的函数逼近能力,将非线性的事件触发近似为分段的线性函数,然后通过设计的控制律和自适应律,在事件触发后,根据实际的驱动力和外部干扰力对控制参数进行更新,从而实现对机器人操作臂的精准控制。
基于上述构建的动力学模型、目标控制器、事件触发机制、控制律以及自适应律,将公式1所示的机器人的动力学模型改为状态空间表达式的形式,然后建立机器人的目标控制器,具体地,机器人的目标控制器的建立过程如下:
机器人的动力学模型的状态空间表达式为:
Figure GDA0002996316140000121
Figure GDA0002996316140000122
Figure GDA0002996316140000123
其中,u∈R和y∈R分别代表器人操作臂闭环系统的输入和输出。
机器人操作臂闭环系统的状态空间表达式,即公式23可写为:
Figure GDA0002996316140000124
其中,F(x)和G(x)是系统函数,若F(x)和G(x)是已知的并且系统不存在外部干扰的情况下,理想输入控制模型可以设计为:
u*=-G-1(x)[F(x)+kTx] (27)
若G(x)是已知的,且存在正常数bm和bM使得0<bm<|G(x)|≤bM,存在未知的常数P*>0使得|D(t)|≤P*,则考虑公式27,公式26可以写为:
Figure GDA0002996316140000125
基于RBF神经网络函数逼近理论,将目标控制器的输入控制模型设计成如下:
Figure GDA0002996316140000131
其中,
Figure GDA0002996316140000132
是RBF神经网络输出层的最优目标权重矩阵,
Figure GDA0002996316140000133
是RBF神经网络的激励函数,εu(x)为RBF神经网络的重构误差。把控制输入公
式29代入公式28可得:
Figure GDA0002996316140000134
Ac=A-BkT,v=-εu(x)+G-1(x)D(t) (31)
|v|≤|-εu(x)+g-1(x)d(t)|≤λ* (32)
λ*=sup{-εu(x)+G-1(x)D(t)} (33)
其中,RBF神经网络的参数λ*表示外部干扰和重构误差的上限,基于公
式16至17构造的实际控制律,公式30可以写成:
Figure GDA0002996316140000135
同时由公式20可得:
Figure GDA0002996316140000136
公式34可变为:
Figure GDA0002996316140000137
在本实施例中,公式35中的
Figure GDA0002996316140000138
等参数即为控制变量,在事件触发的时刻,按照公式18至22所示的控制律和自适应律进行更新,从而确定
Figure GDA0002996316140000139
所表示的机器人操作臂的状态,进而实现对机器人操作臂的控制,公式35说实话的状态空间方程是目标控制器的闭环控制方程。
在本实施例中,通过建立所述机器人的动力学模型,并确定所述机器人的目标控制模型,根据所述动力学模型设计所述机器人的事件触发机制,并对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型,基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律,然后确定所述机器人的闭环控制模型,并利用所述控制律、所述自适应律以及所述闭环控制模型,建立所述机器人的目标控制器。即本申请中的目标控制器的函数近似模型具有良好的函数逼近能力,能将非线性的函数近似为分段线性函数,结合自适应反推技术能有效解决控制系统中非线性函数导致的稳定性问题,因此,根据所述目标控制器建立的机器人控制系统,能很好地解决事件触发的非线性问题,从而提高机器人控制系统的稳定性和可行性。
进一步地,在本发明上述实施例的基础上,提出了本发明机器人控制器设计方法的第二实施例。
本实施例是第一实施例中步骤S40之后的步骤,本实施例中步骤S40之后包括步骤D1-D2:
步骤D1,对所述目标控制器进行稳定性验证,以确定所述目标控制器是否具有稳定性;
步骤D2,若所述目标控制器具有稳定性,对所述目标控制器进行可行性验证,以确定所述目标控制器是否具有可行性。
在确定了机器人操作臂的控制器之后,需要对设计的控制器的稳定性和可行性进行验证,以上述实施例中公式1至35所示的目标控制器为例进行验证,若公司1值35所示的目标控制器具有稳定性,则进一步对该目标控制器的可行性进行验证,确定该目标控制器是否具有可行性。在对目标控制器进验证时,都是先构造响应的函数,利用构造的函数对目标控制器的性能进行验证,具体地,以验证目标控制器的稳定性为例进行说明,具体验证过程如下。
步骤D1的细化步骤,包括步骤D11-D13:
步骤D11,利用所述目标控制器中的控制参数,构建稳定性函数;
步骤D12,利用所述稳定性函数和预设稳定性算法,验证所述控制参数的有界性;
步骤D13,根据所述控制参数的有界性,确定所述目标控制器是否具有稳定性。
在验证目标控制器的稳定性时,利用目标控制器的参数构造稳定性函数,利用构造的稳定性函数和预设的稳定性验证算法,证明目标控制器的控制参数的有界性,若目标控制器的控制参数都是有界的,则控制参数的取值范围是可控的,证明目标控制器的控制参数都处于可控状态,具有稳定性,因此,通过证明目标控制器中控制参数的有界性,就可以验证目标控制器的稳定性,具体需要验证那些控制参数的有界性,需要根据建立的动力学模型、控制模型和控制器确定,本实施例以上述公式1至35建立的目标控制器为例,具体验证过程如下列公式所示:
参考公式21至22,存在正常数τ、αu、αλ以及
Figure GDA0002996316140000151
使得神经网络估计误差
Figure GDA0002996316140000152
Figure GDA0002996316140000153
是有界的:
证明神经网络权重估计误差
Figure GDA0002996316140000154
的有界性:构造一个稳定性函数,以李雅普诺夫函数为例,基于构造一个李雅普诺夫函数,每个事件触发时间间隔t∈[tk,tk+1)的
Figure GDA0002996316140000155
导数为:
Figure GDA0002996316140000156
这表示在t∈[tk,tk+1)时,神经网络权重估计误差
Figure GDA0002996316140000157
是保持不变的,因此,只需要考虑触发时刻的李雅普诺夫函数的变化量即可,在t=tk时,
Figure GDA0002996316140000158
的变化量为:
Figure GDA0002996316140000159
根据公式21,公式37可以写成:
Figure GDA00029963161400001510
在公式38中,利用
Figure GDA00029963161400001511
进行替换,根据柯西不等式得出:
Figure GDA0002996316140000161
由于
Figure GDA0002996316140000162
根据不等式2ab≤a2+b2,则有:
Figure GDA0002996316140000163
Figure GDA0002996316140000164
定义
Figure GDA0002996316140000165
Figure GDA0002996316140000166
公式40可以写成:
Figure GDA0002996316140000167
其中,
Figure GDA0002996316140000168
从公式42可以得出,若
Figure GDA0002996316140000169
Figure GDA00029963161400001610
根据李雅普洛夫稳定性原理,神经网络权值估计误差
Figure GDA00029963161400001611
是最终有界的。
证明神经网络参数估计
Figure GDA00029963161400001612
的有界性:与
Figure GDA00029963161400001613
的证明方法相同,构造一个李雅普诺夫函数
Figure GDA00029963161400001614
每个事件触发时间间隔t∈[tk,tk+1)的
Figure GDA00029963161400001615
导数为:
Figure GDA00029963161400001616
在t=tk时刻,
Figure GDA00029963161400001617
的变化量为:
Figure GDA0002996316140000171
由于
Figure GDA0002996316140000172
公式44可以变为:
Figure GDA0002996316140000173
Figure GDA0002996316140000174
从公式45可以得出,若
Figure GDA0002996316140000175
Figure GDA0002996316140000176
根据李雅普诺夫稳定性原理可以得出,神经网络参数估计误差
Figure GDA0002996316140000177
是有界的。
利用李雅普诺夫稳定性原理证明了神经网络参数估计误差
Figure GDA0002996316140000178
Figure GDA0002996316140000179
的有界性,还需要机器人操作臂闭环控制的有界性。
公式1所示的机器人操作臂的动力学模型、公式7所示的自适应神经网络的控制输入模型、以及公式19至22所示的神经网络参数自适应律,满足公式4所示的事件触发条件,因此,机器人操作臂的闭环控制中的所有信号都是半全局有界的,只能确定目标控制器是半全局稳定的,需要验证目标控制器闭环控制的稳定性,以进一步验证目标控制器的稳定性,闭环控制稳定性的具体验证过程如下:
构造一个李雅普诺夫函数:
Figure GDA0002996316140000181
其中,Vx=xTPx、
Figure GDA0002996316140000182
可知地,V(t)是一个分段连续函数,且在事件触发时间间隔[tk,tk+1)内是连续可微的。根据公式21至22所示的神经网络参数估计误差,以及公式35所示的机器人操作臂闭环控制方程,在每个事件触发时间间隔[tk,tk+1)上的V(t)导数为:
Figure GDA0002996316140000183
基于李雅普诺夫方程
Figure GDA0002996316140000184
和公式48,可得:
Figure GDA0002996316140000185
对公式49中不等号右侧的公式分别进行处理:
Figure GDA0002996316140000191
利用下列公式51所示的不等式关系对公式50进行变换,得到公式52:
Figure GDA0002996316140000192
Figure GDA0002996316140000193
其中,M>0为设计参数。
利用不等式2ab≤a2+b2和不等式关系
Figure GDA0002996316140000194
公式49右侧其余公式满足以下关系:
Figure GDA0002996316140000195
Figure GDA0002996316140000196
-xTQx≤-qmin||x||2 (55)
Figure GDA0002996316140000197
将公式50至56代入公式49,在每个事件触发时间间隔[tk,tk+1)上的V(t)导数为:
Figure GDA0002996316140000198
其中,
Figure GDA0002996316140000201
从公式57可知,若
Figure GDA0002996316140000202
Figure GDA0002996316140000203
因此,该目标控制器的闭环控制状态是有界的,从V(t)的定义出发,目标控制器的所有控制变量如x,
Figure GDA0002996316140000204
Figure GDA0002996316140000205
等都是有界的,从公式16所示的神经网络自适应控制输入模型u也是有界的,因此,机器人操作臂的闭环控制也是稳定的,目标控制器具有稳定性。
在确定目标控制器具有稳定性后,需要对目标控制器的可行性进行验证,在验证目标控制器的可行性时,主要是验证目标控制器中事件触发机制的可行性,在本实施例中,通过排除Zeno(在有限时间间隔内无限触发的现象)行为来分析事件触发机制的可行性。在证明事件触发机制的可行性时,需要证明对于所有的k∈Ν由公式4所示的所有触发事件之间时间间隔的下限δtk=tk+1-tk都有界且远离零,从公式35所示的机器人操作臂闭环控制方程,以及公式18所示的神经网络参数自适应律,可得到:
Figure GDA0002996316140000206
Figure GDA0002996316140000207
其中,n1,k是分段常数函数,在每个第k的整数倍的事件触发时间间隔中,由于控制模型的目标权重没有更新,因此,神经网络权重估计误差
Figure GDA0002996316140000208
和权重估计
Figure GDA0002996316140000209
都是恒定的。
事件触发误差e的导数为:
Figure GDA00029963161400002010
当tk≤t≤tk+1时,具有初始条件t=tk时e+=0,公式60所示的微分不等式的解的上限为:
Figure GDA00029963161400002011
第k的整数倍个触发事件时间间隔的下限δtk=tk+1-tk是所有间隔内||e||从0上升到阈值系数的最小值σs,min=min(σs,k||x||)所需的时间。由于参数在变化期间不会更新,因此,阈值系数σs是分段常数函数,在所有触发事件时间间隔(tk,tk+1],k=1,2,...,内,阈值系数σs的最小值从公式4变为:
Figure GDA0002996316140000211
其中,对于触发事件
Figure GDA0002996316140000212
在下一个事件中,满足
Figure GDA0002996316140000213
与公式61进行比较,得出:
Figure GDA0002996316140000214
求解公式62,可得触发事件时间间隔的下限:
Figure GDA0002996316140000215
从公式64可知,由于
Figure GDA0002996316140000216
对于所有的k=1,2,...,所有触发事件时间间隔的下限δtk>0,因此机器人操作臂的神经网络控制器具有可行性。
在本实施例中,通过对所述目标控制器进行稳定性验证,以确定所述目标控制器是否具有稳定性,若所述目标控制器具有稳定性,对所述目标控制器进行可行性验证,以确定所述目标控制器是否具有可行性,在建立机器人的目标控制器后,通过对目标控制器的稳定性和可行性进行验证,可以确定控制模型对事件触发机制的非线性的解决效果,根据验证结果可以对目标控制器中的控制参数进行调整,从而进一步提高目标控制器对机器人控制的稳定性和可行性。
此外,参照图3,本发明实施例还提出一种机器人控制器设计装置,所述机器人控制器设计装置包括:
模型建立模块10,用于建立所述机器人的动力学模型,并确定所述机器人的目标控制模型;
模型设计模块20,用于根据所述动力学模型设计所述机器人的事件触发机制,并对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型;
控制设计模块30,用于基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律;
控制建立模块40,用于确定所述机器人的闭环控制模型,并利用所述控制律、所述自适应律以及所述闭环控制模型,建立所述机器人的目标控制器。
可选地,所述模型建立模块10,包括:
确定单元,用于确定所述机器人的动力学参数;
矩阵建立单元,用于根据所述动力学参数中的广义关节位置,建立所述机器人的惯性矩阵;
模型生成单元,用于根据所述动力学参数和所述惯性矩阵,生成所述机器人的动力学模型。
可选地,所述模型设计模块20,包括:
向量确定单元,用于利用所述动力学模型中的关节位置和关节速度,确定所述机器人的状态向量;
误差定义单元,用于利用所述状态向量定义所述机器人的测量误差;
触发机制设计单元,用于确定所述机器人的事件触发参数,并利用所述测量误差和所述事件触发参数确定所述机器人的事件触发机制。
可选地,所述所述模型设计模块20,还包括:
函数定义单元,用于定义所述目标控制模型的描述函数,并确定所述目标控制模型的控制参数;
模型构造单元,用于根据所述描述函数和所述控制参数,构造所述目标控制模型的函数近似模型。
可选地,所述控制设计模块30,包括:
输入模型构建单元,用于利用所述函数近似模型,构建所述机器人的控制输入模型,以确定所述机器人的控制律;
更新规律确定单元,用于基于所述事件触发机制,确定在事件触发时刻,所述控制输入模型中的控制变量的更新规律;
自适应律确定单元,用于根据所述更新规律确定所述机器人的自适应律。
可选地,所述机器人控制器设计装置,还包括:
第一验证单元,用于对所述目标控制器进行稳定性验证,以确定所述目标控制器是否具有稳定性;
第二验证单元,用于若所述目标控制器具有稳定性,对所述目标控制器进行可行性验证,以确定所述目标控制器是否具有可行性。
可选地,所述第一验证单元,包括:
构建子单元,用于利用所述目标控制器中的控制参数,构建稳定性函数;
验证子单元,用于利用所述稳定性函数和预设稳定性算法,验证所述控制参数的有界性;
确定子单元,用于根据所述控制参数的有界性,确定所述目标控制器是否具有稳定性。
此外,本发明实施例还提出一种可读存储介质,所述可读存储介质上存储有机器人控制器设计程序,所述机器人控制器设计程序被处理器执行时实现上述实施例提供的机器人控制器设计方法中的操作。
上述各程序模块所执行的方法可参照本发明方法各个实施例,此处不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的机器人控制器设计方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种机器人控制器设计方法,其特征在于,所述机器人控制器设计方法应用于机器人,所述机器人控制器设计方法包括以下步骤:
建立所述机器人的动力学模型,并确定所述机器人的目标控制模型;
根据所述动力学模型设计所述机器人的事件触发机制,并对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型;
基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律;
确定所述机器人的闭环控制模型,并利用所述控制律、所述自适应律以及所述闭环控制模型,建立所述机器人的目标控制器;
所述基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律的步骤,包括:
利用所述函数近似模型,构建所述机器人的控制输入模型,以确定所述机器人的控制律;
基于所述事件触发机制,确定在事件触发时刻,所述控制输入模型中的控制变量的更新规律;
根据所述更新规律确定所述机器人的自适应律;
其中,所述控制律为:
Figure FDA0003904109650000011
在触发时刻tk,所述更新规律为:
Figure FDA0003904109650000012
Figure FDA0003904109650000013
其中,
Figure FDA0003904109650000014
是在触发时刻之后立即更新的目标控制模型目标权重的估计值,αu和αλ是目标控制模型的学习速率,a1和a2是两个正数,σ是修正项。
2.如权利要求1所述的机器人控制器设计方法,其特征在于,所述建立所述机器人的动力学模型的步骤包括:
确定所述机器人的动力学参数;
根据所述动力学参数中的广义关节位置,建立所述机器人的惯性矩阵;
根据所述动力学参数和所述惯性矩阵,生成所述机器人的动力学模型。
3.如权利要求1所述的机器人控制器设计方法,其特征在于,所述根据所述动力学模型设计所述机器人的事件触发机制的步骤,包括:
利用所述动力学模型中的关节位置和关节速度,确定所述机器人的状态向量;
利用所述状态向量定义所述机器人的测量误差;
确定所述机器人的事件触发参数,并利用所述测量误差和所述事件触发参数确定所述机器人的事件触发机制。
4.如权利要求1所述的机器人控制器设计方法,其特征在于,所述对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型的步骤,包括:
定义所述目标控制模型的描述函数,并确定所述目标控制模型的控制参数;
根据所述描述函数和所述控制参数,构造所述目标控制模型的函数近似模型。
5.如权利要求1所述的机器人控制器设计方法,其特征在于,所述根据所述控制律和所述自适应律,确定所述机器人的目标控制器之后的步骤,包括:
对所述目标控制器进行稳定性验证,以确定所述目标控制器是否具有稳定性;
若所述目标控制器具有稳定性,对所述目标控制器进行可行性验证,以确定所述目标控制器是否具有可行性。
6.如权利要求5所述的机器人控制器设计方法,其特征在于,所述对所述目标控制器进行稳定性验证,以确定所述目标控制器是否具有稳定性的步骤,包括:
利用所述目标控制器中的控制参数,构建稳定性函数;
利用所述稳定性函数和预设稳定性算法,验证所述控制参数的有界性;
根据所述控制参数的有界性,确定所述目标控制器是否具有稳定性。
7.一种机器人控制器设计装置,其特征在于,所述机器人控制器设计装置包括:
模型建立模块,用于建立所述机器人的动力学模型,并确定所述机器人的目标控制模型;
模型设计模块,用于根据所述动力学模型设计所述机器人的事件触发机制,并对所述目标控制模型进行模型描述,以确定所述目标控制模型的函数近似模型;
控制设计模块,用于基于所述事件触发机制,利用所述函数近似模型构造所述机器人的控制律和自适应律;
控制建立模块,用于确定所述机器人的闭环控制模型,并利用所述控制律、所述自适应律以及所述闭环控制模型,建立所述机器人的目标控制器;
所述控制设计模块,包括:
输入模型构建单元,用于利用所述函数近似模型,构建所述机器人的控制输入模型,以确定所述机器人的控制律;
更新规律确定单元,用于基于所述事件触发机制,确定在事件触发时刻,所述控制输入模型中的控制变量的更新规律;
自适应律确定单元,用于根据所述更新规律确定所述机器人的自适应律;
其中,所述控制律为:
Figure FDA0003904109650000041
在触发时刻tk,所述更新规律为:
Figure FDA0003904109650000042
Figure FDA0003904109650000043
其中,
Figure FDA0003904109650000044
是在触发时刻之后立即更新的目标控制模型目标权重的估计值,αu和αλ是目标控制模型的学习速率,a1和a2是两个正数,σ是修正项。
8.一种机器人控制器设计设备,其特征在于,所述机器人控制器设计设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机器人控制器设计程序,所述机器人控制器设计程序被所述处理器执行时实现如权利要求1至6中任一项所述的机器人控制器设计方法的步骤。
9.一种可读存储介质,其特征在于,所述可读存储介质上存储有机器人控制器设计程序,所述机器人控制器设计程序被处理器执行时实现如权利要求1至6中任一项所述的机器人控制器设计方法的步骤。
CN202110028180.4A 2021-01-11 2021-01-11 机器人控制器设计方法、装置、设备及可读存储介质 Active CN112859601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110028180.4A CN112859601B (zh) 2021-01-11 2021-01-11 机器人控制器设计方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110028180.4A CN112859601B (zh) 2021-01-11 2021-01-11 机器人控制器设计方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN112859601A CN112859601A (zh) 2021-05-28
CN112859601B true CN112859601B (zh) 2023-01-20

Family

ID=76002098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110028180.4A Active CN112859601B (zh) 2021-01-11 2021-01-11 机器人控制器设计方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112859601B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297798B (zh) * 2021-06-10 2022-10-11 重庆邮电大学工业互联网研究院 一种基于人工神经网络的机器人外界接触力估计方法
CN113504727B (zh) * 2021-07-14 2022-06-17 桂林理工大学 一种带有自适应阈值的混合阶非线性系统事件触发协同控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107065902A (zh) * 2017-01-18 2017-08-18 中南大学 基于非线性模型的无人机姿态模糊自适应预测控制方法及系统
CN109176525A (zh) * 2018-09-30 2019-01-11 上海神添实业有限公司 一种基于rbf的移动机械手自适应控制方法
CN109514564A (zh) * 2019-01-22 2019-03-26 江西理工大学 一种复合二次型多关节机械臂最优控制方法
CN110597069A (zh) * 2019-10-17 2019-12-20 哈尔滨工程大学 一种基于rbf神经网络的水下机器人自适应区域动力定位控制方法
CN112180729A (zh) * 2020-10-09 2021-01-05 电子科技大学中山学院 一种机械臂自适应轨迹跟踪控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107065902A (zh) * 2017-01-18 2017-08-18 中南大学 基于非线性模型的无人机姿态模糊自适应预测控制方法及系统
CN109176525A (zh) * 2018-09-30 2019-01-11 上海神添实业有限公司 一种基于rbf的移动机械手自适应控制方法
CN109514564A (zh) * 2019-01-22 2019-03-26 江西理工大学 一种复合二次型多关节机械臂最优控制方法
CN110597069A (zh) * 2019-10-17 2019-12-20 哈尔滨工程大学 一种基于rbf神经网络的水下机器人自适应区域动力定位控制方法
CN112180729A (zh) * 2020-10-09 2021-01-05 电子科技大学中山学院 一种机械臂自适应轨迹跟踪控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于模型控制和无模型控制的机械臂系统轨迹跟踪研究";邱学超;《万方学位论文数据库》;20201202;正文第9-25页 *

Also Published As

Publication number Publication date
CN112859601A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
Zhao et al. Neuroadaptive robotic control under time-varying asymmetric motion constraints: A feasibility-condition-free approach
US11275345B2 (en) Machine learning Method and machine learning device for learning fault conditions, and fault prediction device and fault prediction system including the machine learning device
CN112859601B (zh) 机器人控制器设计方法、装置、设备及可读存储介质
CN110023850B (zh) 用于控制技术系统的方法和控制装置
US11627165B2 (en) Multi-agent reinforcement learning with matchmaking policies
KR102506122B1 (ko) 강화 학습 모델 구축 방법, 장치, 전자 기기 및 매체
Rahmani et al. Adaptive neural network output feedback control for flexible multi-link robotic manipulators
Zhang et al. Adaptive fault diagnosis and fault-tolerant control of MIMO nonlinear uncertain systems
JP7279445B2 (ja) 予測方法、予測プログラムおよび情報処理装置
EP3291035B1 (en) Plant control device, plant control method, and recording medium
Ni et al. Reinforcement learning control based on multi-goal representation using hierarchical heuristic dynamic programming
Mendoza et al. Output‐feedback proportional–integral–derivative‐type control with simple tuning for the global regulation of robot manipulators with input constraints
CN110297460A (zh) 热位移修正系统以及计算机
US20220343157A1 (en) Robust reinforcement learning for continuous control with model misspecification
KR20220154785A (ko) 다중 태스크 강화 학습에서 메타-그래디언트를 사용한 액션 선택을 위한 학습 옵션
Cheng et al. Bounded decoupling control for flexible‐joint robot manipulators with state estimation
JP2015148934A (ja) 発電量予測装置および発電量予測方法
Ellis Machine learning enhanced grey-box modeling for building thermal modeling
CN113821903B (zh) 温度控制方法和设备、模块化数据中心及存储介质
Chen et al. Indirect iterative learning control for robot manipulator with non‐Gaussian disturbances
Liao et al. Design and implementation of a hierarchical‐clustering CMAC PID controller
CN110297496B (zh) 电力巡检机器人的控制方法、装置、电子设备及存储介质
CN103176573B (zh) 散热控制系统及其控制方法
Yan et al. A neural network approach to nonlinear model predictive control
Liu et al. Adaptive Event-triggered Control with Prescribed Performance for Nonlinear System with Full-state Constraints.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant