CN112859601B

CN112859601B - 机器人控制器设计方法、装置、设备及可读存储介质

Info

Publication number: CN112859601B
Application number: CN202110028180.4A
Authority: CN
Inventors: 胡慧; 易伟; 郭鹏; 李洋; 王越彪; 屈繁
Original assignee: Hunan Institute of Engineering
Current assignee: Hunan Institute of Engineering
Priority date: 2021-01-11
Filing date: 2021-01-11
Publication date: 2023-01-20
Anticipated expiration: 2041-01-11
Also published as: CN112859601A

Abstract

本发明公开了一种机器人控制器设计方法、装置、设备及可读存储介质。本发明通过建立所述机器人的动力学模型，并确定所述机器人的目标控制模型，根据所述动力学模型设计所述机器人的事件触发机制，并对所述目标控制模型进行模型描述，以确定所述目标控制模型的函数近似模型，基于所述事件触发机制，利用所述函数近似模型构造所述机器人的控制律和自适应律，确定所述机器人的闭环控制模型，并利用所述控制律、所述自适应律以及所述闭环控制模型，建立所述机器人的目标控制器，解决了事件触发机制的非线性问题，提高了基于事件触发的风机检测机器人操作臂的控制系统的稳定性和可行性。

Description

机器人控制器设计方法、装置、设备及可读存储介质

技术领域

本发明涉及机器人控制领域，尤其涉及一种机器人控制器设计方法、装置、设备及可读存储介质。

背景技术

随着风力发电技术的发展，风力成为必不可少的可再生能源，特别是目前全世界正面临的巨大的能源需求，预计未来50年全球能源需求将继续增长，风力发电机的使用也将越来越广泛。风力发电机由于大多在室外运行，其叶片因受紫外线辐射、雨雪、冰雹、温度骤变等自然因素的影响会导致风机部件应力疲劳，或因冲击破坏，灰尘和盐分等恶劣环境影响会导致风机部件的效率和性能下降，从而引发风机故障，为避免风机发生故障必须定期检查风机叶片。因此，最近几年诸如无人机和风机检测之类的机器人在执行风力发电机检查中，发挥着越来越重要的作用。在风力发电厂中长期使用自主风机检测机器人并根据电厂自身发送的数据和事件，最大限度地利用预防措施并降低活动成本，从而减少了预期的故障数量并最大限度地提高预防性维护的效果。

目前广泛应用在生产工业、医疗医药、航空航天、农业及生活服务等多个领域的现代机器人控制系统，大多数是基于时间触发的，即每隔固定的时间间隔就会触发周期性的时间激励信号，导致了大量不必要的通信，并因此增加了通信负担和能耗。因此，为节省通信资源提出基于事件触发机制的机器人控制系统。但由于机器人的操作臂系统是非线性的，且控制器的结构设计较为复杂，为解决此类问题，许多人在设计控制系统时，往往会使用多个模糊逻辑或神经网络假设非线性函数被线性参数化，但是在最终设计的控制系统中，这种假设通常很难检验，因此，最终设计的控制系统并不能很好的解决事件触发的非线性，导致控制系统的稳定性和可行性较低，甚至不具有稳定性和可行性。

发明内容

本发明的主要目的在于提供一种机器人控制器设计方法、装置、设备及可读存储介质，旨在解决现有基于事件触发机制的机器人控制系统，由于无法解决事件触发的非线性导致系统稳定性和可行性低的技术问题。

此外，为实现上述目的，本发明还提供一种机器人控制器设计方法，所述方法包括以下步骤：

建立所述机器人的动力学模型，并确定所述机器人的目标控制模型；

根据所述动力学模型设计所述机器人的事件触发机制，并对所述目标控制模型进行模型描述，以确定所述目标控制模型的函数近似模型；

基于所述事件触发机制，利用所述函数近似模型构造所述机器人的控制律和自适应律；

确定所述机器人的闭环控制模型，并利用所述控制律、所述自适应律以及所述闭环控制模型，建立所述机器人的目标控制器。

可选地，所述建立所述机器人的动力学模型的步骤包括：

确定所述机器人的动力学参数；

根据所述动力学参数中的广义关节位置，建立所述机器人的惯性矩阵；

根据所述动力学参数和所述惯性矩阵，生成所述机器人的动力学模型。

可选地，所述根据所述动力学模型设计所述机器人的事件触发机制的步骤，包括：

利用所述动力学模型中的关节位置和关节速度，确定所述机器人的状态向量；

利用所述状态向量定义所述机器人的测量误差；

确定所述机器人的事件触发参数，并利用所述测量误差和所述事件触发参数确定所述机器人的事件触发机制。

可选地，所述对所述目标控制模型进行模型描述，以确定所述目标控制模型的函数近似模型的步骤，包括：

定义所述目标控制模型的描述函数，并确定所述目标控制模型的控制参数；

根据所述描述函数和所述控制参数，构造所述目标控制模型的函数近似模型。

可选地，所述基于所述事件触发机制，利用所述函数近似模型构造所述机器人的控制律和自适应律的步骤，包括：

利用所述函数近似模型，构建所述机器人的控制输入模型，以确定所述机器人的控制律；

基于所述事件触发机制，确定在事件触发时刻，所述控制输入模型中的控制变量的更新规律；

根据所述更新规律确定所述机器人的自适应律。

可选地，所述根据所述控制律和所述自适应律，确定所述机器人的目标控制器之后的步骤，包括：

对所述目标控制器进行稳定性验证，以确定所述目标控制器是否具有稳定性；

若所述目标控制器具有稳定性，对所述目标控制器进行可行性验证，以确定所述目标控制器是否具有可行性。

可选地，所述对所述目标控制器进行稳定性验证，以确定所述目标控制器是否具有稳定性的步骤，包括：

利用所述目标控制器中的控制参数，构建稳定性函数；

利用所述稳定性函数和预设稳定性算法，验证所述控制参数的有界性；

根据所述控制参数的有界性，确定所述目标控制器是否具有稳定性。

此外，为实现上述目的，本发明还提供一种机器人控制器设计装置，所述机器人控制器设计装置包括：

模型建立模块，用于建立所述机器人的动力学模型，并确定所述机器人的目标控制模型；

模型设计模块，用于根据所述动力学模型设计所述机器人的事件触发机制，并对所述目标控制模型进行模型描述，以确定所述目标控制模型的函数近似模型；

控制设计模块，用于基于所述事件触发机制，利用所述函数近似模型构造所述机器人的控制律和自适应律；

控制建立模块，用于确定所述机器人的闭环控制模型，并利用所述控制律、所述自适应律以及所述闭环控制模型，建立所述机器人的目标控制器。

此外，为实现上述目的，本发明还提供一种机器人控制器设计设备，所述机器人控制器设计设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的机器人控制器设计程序，所述机器人控制器设计程序被所述处理器执行时实现如上述的机器人控制器设计方法的步骤。

此外，为实现上述目的，本发明还提供一种可读存储介质，所述可读存储介质上存储有机器人控制器设计程序，所述机器人控制器设计程序被处理器执行时实现如上述的机器人控制器设计方法的步骤。

本发明实施例提出的一种机器人控制器设计方法、装置、设备及可读存储介质。现有技术中，基于事件触发机制的机器人控制系统，由于无法很好的解决函数的非线性问题，导致机器人的控制系统稳定性和可行性较低，与现有技术相比，本发明实施例中，通过建立所述机器人的动力学模型，并确定所述机器人的目标控制模型，根据所述动力学模型设计所述机器人的事件触发机制，并对所述目标控制模型进行模型描述，以确定所述目标控制模型的函数近似模型，基于所述事件触发机制，利用所述函数近似模型构造所述机器人的控制律和自适应律，然后确定所述机器人的闭环控制模型，并利用所述控制律、所述自适应律以及所述闭环控制模型，建立所述机器人的目标控制器。即本申请中的目标控制器的函数近似模型具有良好的函数逼近能力，能将非线性的函数近似为分段线性函数，结合自适应反推技术能有效解决控制系统中因非线性函数导致的稳定性问题，因此，根据所述目标控制器建立的机器人控制系统，能很好地解决控制系统中的函数的非线性问题，从而提高机器人控制系统的稳定性和可行性。

附图说明

图1为本发明实施例提供的设备一种实施方式的硬件结构示意图；

图2为本发明机器人控制器设计方法第一实施例的流程示意图；

图3为本发明机器人控制器设计装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身没有特定的意义。因此，“模块”、“部件”或“单元”可以混合地使用。

本发明实施例机器人控制器设计设备(又叫终端、设备或者终端设备)可以是PC，也可以是智能手机、平板电脑和便携计算机等具有显示功能的可移动式终端设备。

如图1所示，该终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在移动终端移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；当然，移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及机器人控制器设计程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的机器人控制器设计程序，所述机器人控制器设计程序被处理器执行时实现下述实施例提供的机器人控制器设计方法中的操作。

基于上述设备硬件结构，提出了本发明机器人控制器设计方法的实施例。

参照图2，在本发明机器人控制器设计方法的第一实施例中，所述机器人控制器设计方法包括：

步骤S10，建立所述机器人的动力学模型，并确定所述机器人的目标控制模型；

本发明中的机器人控制器设计方法应用于机器人，包括但不限于风力发电机检测机器人，以下以风机检测机器人(简称机器人)为例进行说明，运用本发明中的机器人控制器设计方法设计的控制器，用于控制机器人的操作臂，该机器人的操作臂可以是任意自由度的，例如二自由度、四自由度或六自由度等，本实施例中，对机器人操作臂的自由度不做限定。建立机器人的动力学模型，机器人的动力学模型包括但不限于以下公式1所示的模型：

其中，

是广义关节位置和速度矢量，M(q)∈R^n×n为惯性矩阵，

中包括了机器人操作臂的离心力和哥氏力矩，φ(q)∈R^n×n为重力向量，d(t)∈Rⁿ是外部干扰力矩，u(t)∈Rⁿ是控制输入向量，代表了机器人的关节驱动力矩，Rⁿ和R^n×n都是特征矩阵。

在机器人的动力学模型中，控制模型的输入不仅要包括机器人自身的内部驱动力，还要考虑外部干扰和误差等，在建立机器人的动力学模型后，选择机器人的目标控制模型，本实施例中的目标控制模型为基于事件触发机制的神经网络控制模型，其中一种优选模型为基于事件触发机制的RBF(Radial Basis Function，径向基函数)神经网络控制模型，RBF神经网络具有良好的函数逼近能力，在状态空间的紧凑区域上能够近似任何连续的未知函数，本实施例以RBF神经网络为例进行说明。

步骤S20，根据所述动力学模型设计所述机器人的事件触发机制，并对所述目标控制模型进行模型描述，以确定所述目标控制模型的函数近似模型；

在建立机器人的动力学模型并选择目标控制模型后，根据机器人的动力学模型设计事件触发机制，然后描述RBF神经网络，由于RBF神经网络控制模型主要用于近似未知函数，因此需要确定RBF的函数近似模型，对RBF进行模型描述以确定RBF神经网络的函数近似模型。

步骤S30，基于所述事件触发机制，利用所述函数近似模型构造所述机器人的控制律和自适应律；

机器人的控制律包括在事件触发时刻，机器人的控制模型中的参数更新规律，机器人的自适应律包括机器人在事件触发时刻，按照控制律更新的参数的误差估计参数的更新律，机器人在事件触发时刻，不但可以按照触发的事件更新相应的控制参数，控制参数如目标控制模型的目标权重等，还可以根据触发的事件更新控制参数的误差估计参数，例如外部干扰和重构误差等。对外部干扰重构误差的更新为机器人的自适应律。

步骤S10的细化步骤，包括步骤A1-A3：

步骤A1，确定所述机器人的动力学参数；

步骤A2，根据所述动力学参数中的广义关节位置，建立所述机器人的惯性矩阵；

步骤A3，根据所述动力学参数和所述惯性矩阵，生成所述机器人的动力学模型。

在建立机器人的动力学模型时，需要先确定机器人的动力学参数，包括机器人操作臂的广义关节位置、机器人操作臂的速度矢量、操作臂的离心力和哥氏力矩等，针对动力学参数中的广义关节位置，建立机器人操作臂的惯性矩阵，然后根据建立的惯性矩阵和动力学参数建立机器人的动力学模型，建立的动力学模型如上述公式1所示，在此不再赘述。

步骤S20的细化步骤，包括步骤B1-B5：

步骤B1，利用所述动力学模型中的关节位置和关节速度，确定所述机器人的状态向量；

步骤B2，利用所述状态向量定义所述机器人的测量误差；

步骤B3，确定所述机器人的事件触发参数，并利用所述测量误差和所述事件触发参数确定所述机器人的事件触发机制。

步骤B4，定义所述目标控制模型的描述函数，并确定所述目标控制模型的控制参数；

步骤B5，根据所述描述函数和所述控制参数，构造所述目标控制模型的函数近似模型。

机器人操作臂的关节的位置和速度确定了该操作臂的状态，利用动力学模型中的关节位置和关节速度，确定所述机器人的状态向量，利用定义的机器人操作臂关节的状态向量定义机器人的测量误差，然后确定机器人的事件触发参数，利用机器人的事件触发参数和机器人的状态向量，确定机器人的事件触发机制，机器人的事件触发机制设计过程如下列公式所示(公式2-7)：

定义机器人操作臂的状态向量：

定义测量误差：

e(t)＝x(t)-x(t_k) t∈[t_k,t_k+1) (3)

设计机器人的事件触发机制：

D(||e(t)||)≤σ_s||x(t)|| (4)

定义死区：

其中，x(t)即为由机器人操作臂的关节位置和速度定义的状态向量，t_k为事件触发的瞬间，σ_s为事件触发参数，Γ_s为事件触发参数的常数，且0<Γ_s<1，

为李普希茨常数，P＝P^T>0和Q>0为满足李雅普诺夫方程的矩阵，λ_min(Q)为矩阵Q的最小特征值，b_M为大于0的常数，

为状态向量x的界限。

基于事件触发的时刻，在不丧失一般性的情况下，若第一个事件发生在t₀＝0的时刻，在每个触发时刻，对被控对象即机器人的操作臂的状态x(t)进行采样，并相应地更新控制律和参数自适应律，两个连续触发时刻之间的间隔长度称为事件间隔时间，一旦检测到有事件触发，将测量误差e(t)重置为零，根据定义的死区可知，当对机器操作人的驱动控制超出最大驱动范围时，控制机器人操作臂在状态范围内运动，当对机器操作人的驱动控制达不到最小驱范围时，对触发的事件不作响应，其中，机器人操作臂的驱动范围可以根据不同自由度的机器人进行自定义设置。

在完成机器人的事件触发机制设计后，定义RBF神经网络模型的描述函数，对RBF神经网络进行描述，RBF神经网络的描述函数包括激励函数、目标权重以及重构误差等，然后确定RBF神经网络的控制参数，RBF神经网络的控制参数包括神经网络隐含层、输入层和输出层的神经元数量，核向量等，利用描述函数和控制参数构建RBF神经网络的函数近似模型，具体构建过程如下列公式所示(公式8-12)：

定义RBF神经网络的激励函数

RBF神经网络的目标权重矩阵w_u，RBF神经网络的重构误差函数ε_u(x)，w_u，

ε_u(x)在紧集合中应当是有界的，且

应当为李普希茨连续函数，则有：

其中，

是正常数，由于

应当是李普希茨连续函数，则对于每一个

都存在一个李普希茨常数

使得：

RBF神经网络具有良好的函数逼近能力，在状态空间的紧凑区域上能够近似未知函数f(x)，即存在未知的目标权重矩阵w，通过选择合适的激活函数和足够数量的隐含层神经元，以任意期望的精度水平在一个紧凑的集合

上，f(x)可以写成：

其中，w^*∈R^l×b是RBF神经网络的目标权重矩阵向量、x∈R^a×l是输入向量，

是RBF神经网络的核向量，

是RBF神经网络的激活函数，ε_f(x)是RBF神经网络的逼近误差函数，c_i为隐含层中第i层神经元的中心点，μ_i为隐含层中第i层神经元的径基宽度，常数l,a和b分别是神经网络隐含层中的神经元数量、输入层神经元数量和输出层神经元数量。理想的目标权重矩阵向量有如下列公式所示的关系：

函数f(x)的表达式即为RBF神经网络的函数近似模型。

步骤S30的细化步骤，还包括步骤C1-C3：

步骤C1，利用所述函数近似模型，构建所述机器人的控制输入模型，以确定所述机器人的控制律；

步骤C2，基于所述事件触发机制，确定在事件触发时刻，所述控制输入模型中的控制变量的更新规律；

步骤C3，根据所述更新规律确定所述机器人的自适应律。

利用建立好的函数近似模型，构建机器人的自适应神经网络控制输入模型，由于对机器人的控制主要是根据目标控制器的输入进行的，需要明确目标控制器的输入包括哪些参数，且各个参数的性质如何，参数的性质包括变量、非变量等，一般变量为需要控制的参数，将需要控制的变量定义为控制变量，根据目标控制器的输入不同，即触发事件的不同，控制不同的变量，且对不同性质的变量采用不同的控制方式，要控制的变量以及对变量的控制方式即为机器人的控制律。具体地，从所有参数中确定需要对哪些变量进行控制，不同性质的变量应如何控制，这些内容即为控制规律，也即控制律，因此，确定机器人的控制律实际上是确定机器人的目标控制器的输入控制律。以上述公式10所示的函数近似模型为例，构建的控制输入模型如下：

其中，

是RBF神经网络目标权重矩阵估计，

是t_k时刻RBF神经网络的激励函数，λ^*表示外部干扰和重构误差的上限，l＝l_u和b＝b_u分别是RBF神经网络隐含层和输出层的神经元数量，

分别是最优参数

λ^*的估计值，且仅在事件触发时间间隔内更新，根据公式2至7所示的事件触发机制，当在事件触发的时刻，参数的更新规律如下：

定义

的初始状态：

在触发时刻，

的更新状态为：

其中，

是在触发时刻之后立即更新的RBF神经网络目标权重的估计值，α_u和α_λ是RBF神经网络的学习速率。a₁和a₂是两个正数，σ是修正项，公式19所示的参数更新规律即为本实施例中的控制律。在确定控制律后，需要确定RBF神经网络控制的自适应律，对RBF神经网络的目标权重估计误差定义如下：

在触发时刻t_k，神经网络估计误差参数

和

为:

确定在事件触发间隔间隔中，RBF神经网络的控制变量更新规律，即确定了RBF神经网络的自适应律，这是由于，按照控制律对控制变量进行控制后，控制变量的变化规律就是机器人的自适应律，即控制变量能根据事件触发后的不同的输入，自适应地把控制变量调整为最优参数值。

步骤S40，确定所述机器人的闭环控制模型，并利用所述控制律、所述自适应律以及所述闭环控制模型，建立所述机器人的目标控制器。

在构造机器人的控制律和自适应律后，确定机器人的闭环控制模型，即将机器人的动力学模型改为状态空间的表达式，然后结合构造的控制律、自适应律，建立机器人的目标控制器，机器人的目标控制器即为控制方程，具体地，根据机器人接收到的控制指令，对操作臂产生驱动力，利用驱动力控制机器人的操作臂移动，并控制机器人按照驱动力将操作臂精准移动至控制指令中的状态，以完成检测作业。

在对机器人的操作臂进行驱动时，往往会存在一定的外接因素的干扰，因此，在设计机器人的控制器时，需要考虑外部干扰因素，本实施例中的基于事件触发机制的神经网络控制器，在解决事件触发的非线性时，也要解决外部干扰的问题，进而实现对机器人操作臂的精准控制，即提高机器人控制的稳定性，当检测到外部干扰时，需要根据外部干扰对输入进行调整，因此，目标控制器对机器人采用的是闭环控制，可以向输入端反馈外部干扰信息。在本实施例中，设计机器人的控制器时，首先利用RBF神经网络的函数逼近能力，将非线性的事件触发近似为分段的线性函数，然后通过设计的控制律和自适应律，在事件触发后，根据实际的驱动力和外部干扰力对控制参数进行更新，从而实现对机器人操作臂的精准控制。

基于上述构建的动力学模型、目标控制器、事件触发机制、控制律以及自适应律，将公式1所示的机器人的动力学模型改为状态空间表达式的形式，然后建立机器人的目标控制器，具体地，机器人的目标控制器的建立过程如下：

机器人的动力学模型的状态空间表达式为：

其中，u∈R和y∈R分别代表器人操作臂闭环系统的输入和输出。

机器人操作臂闭环系统的状态空间表达式，即公式23可写为：

其中，F(x)和G(x)是系统函数，若F(x)和G(x)是已知的并且系统不存在外部干扰的情况下，理想输入控制模型可以设计为：

u^*＝-G^-1(x)[F(x)+k^Tx] (27)

若G(x)是已知的，且存在正常数b_m和b_M使得0<b_m<|G(x)|≤b_M，存在未知的常数P^*>0使得|D(t)|≤P^*，则考虑公式27，公式26可以写为：

基于RBF神经网络函数逼近理论，将目标控制器的输入控制模型设计成如下：

其中，

是RBF神经网络输出层的最优目标权重矩阵，

是RBF神经网络的激励函数，ε_u(x)为RBF神经网络的重构误差。把控制输入公

式29代入公式28可得：

A_c＝A-Bk^T，v＝-ε_u(x)+G^-1(x)D(t) (31)

|v|≤|-ε_u(x)+g^-1(x)d(t)|≤λ^* (32)

λ^*＝sup{-ε_u(x)+G^-1(x)D(t)} (33)

其中，RBF神经网络的参数λ^*表示外部干扰和重构误差的上限，基于公

式16至17构造的实际控制律，公式30可以写成：

同时由公式20可得：

公式34可变为：

在本实施例中，公式35中的

等参数即为控制变量，在事件触发的时刻，按照公式18至22所示的控制律和自适应律进行更新，从而确定

所表示的机器人操作臂的状态，进而实现对机器人操作臂的控制，公式35说实话的状态空间方程是目标控制器的闭环控制方程。

在本实施例中，通过建立所述机器人的动力学模型，并确定所述机器人的目标控制模型，根据所述动力学模型设计所述机器人的事件触发机制，并对所述目标控制模型进行模型描述，以确定所述目标控制模型的函数近似模型，基于所述事件触发机制，利用所述函数近似模型构造所述机器人的控制律和自适应律，然后确定所述机器人的闭环控制模型，并利用所述控制律、所述自适应律以及所述闭环控制模型，建立所述机器人的目标控制器。即本申请中的目标控制器的函数近似模型具有良好的函数逼近能力，能将非线性的函数近似为分段线性函数，结合自适应反推技术能有效解决控制系统中非线性函数导致的稳定性问题，因此，根据所述目标控制器建立的机器人控制系统，能很好地解决事件触发的非线性问题，从而提高机器人控制系统的稳定性和可行性。

进一步地，在本发明上述实施例的基础上，提出了本发明机器人控制器设计方法的第二实施例。

本实施例是第一实施例中步骤S40之后的步骤，本实施例中步骤S40之后包括步骤D1-D2：

步骤D1，对所述目标控制器进行稳定性验证，以确定所述目标控制器是否具有稳定性；

步骤D2，若所述目标控制器具有稳定性，对所述目标控制器进行可行性验证，以确定所述目标控制器是否具有可行性。

在确定了机器人操作臂的控制器之后，需要对设计的控制器的稳定性和可行性进行验证，以上述实施例中公式1至35所示的目标控制器为例进行验证，若公司1值35所示的目标控制器具有稳定性，则进一步对该目标控制器的可行性进行验证，确定该目标控制器是否具有可行性。在对目标控制器进验证时，都是先构造响应的函数，利用构造的函数对目标控制器的性能进行验证，具体地，以验证目标控制器的稳定性为例进行说明，具体验证过程如下。

步骤D1的细化步骤，包括步骤D11-D13：

步骤D11，利用所述目标控制器中的控制参数，构建稳定性函数；

步骤D12，利用所述稳定性函数和预设稳定性算法，验证所述控制参数的有界性；

步骤D13，根据所述控制参数的有界性，确定所述目标控制器是否具有稳定性。

在验证目标控制器的稳定性时，利用目标控制器的参数构造稳定性函数，利用构造的稳定性函数和预设的稳定性验证算法，证明目标控制器的控制参数的有界性，若目标控制器的控制参数都是有界的，则控制参数的取值范围是可控的，证明目标控制器的控制参数都处于可控状态，具有稳定性，因此，通过证明目标控制器中控制参数的有界性，就可以验证目标控制器的稳定性，具体需要验证那些控制参数的有界性，需要根据建立的动力学模型、控制模型和控制器确定，本实施例以上述公式1至35建立的目标控制器为例，具体验证过程如下列公式所示：

参考公式21至22，存在正常数τ、α_u、α_λ以及

使得神经网络估计误差

和

是有界的：

证明神经网络权重估计误差

的有界性：构造一个稳定性函数，以李雅普诺夫函数为例，基于构造一个李雅普诺夫函数，每个事件触发时间间隔t∈[t_k,t_k+1)的

导数为：

这表示在t∈[t_k,t_k+1)时，神经网络权重估计误差

是保持不变的，因此，只需要考虑触发时刻的李雅普诺夫函数的变化量即可，在t＝t_k时，

的变化量为：

根据公式21，公式37可以写成：

在公式38中，利用

进行替换，根据柯西不等式得出：

由于

根据不等式2ab≤a²+b²，则有：

定义

和

公式40可以写成：

其中，

从公式42可以得出，若

则

根据李雅普洛夫稳定性原理，神经网络权值估计误差

是最终有界的。

证明神经网络参数估计

的有界性：与

的证明方法相同，构造一个李雅普诺夫函数

每个事件触发时间间隔t∈[t_k,t_k+1)的

导数为：

在t＝t_k时刻，

的变化量为：

由于

公式44可以变为：

从公式45可以得出，若

则

根据李雅普诺夫稳定性原理可以得出，神经网络参数估计误差

是有界的。

利用李雅普诺夫稳定性原理证明了神经网络参数估计误差

和

的有界性，还需要机器人操作臂闭环控制的有界性。

公式1所示的机器人操作臂的动力学模型、公式7所示的自适应神经网络的控制输入模型、以及公式19至22所示的神经网络参数自适应律，满足公式4所示的事件触发条件，因此，机器人操作臂的闭环控制中的所有信号都是半全局有界的，只能确定目标控制器是半全局稳定的，需要验证目标控制器闭环控制的稳定性，以进一步验证目标控制器的稳定性，闭环控制稳定性的具体验证过程如下：

构造一个李雅普诺夫函数：

其中，V_x＝x^TPx、

可知地，V(t)是一个分段连续函数，且在事件触发时间间隔[t_k,t_k+1)内是连续可微的。根据公式21至22所示的神经网络参数估计误差，以及公式35所示的机器人操作臂闭环控制方程，在每个事件触发时间间隔[t_k,t_k+1)上的V(t)导数为：

基于李雅普诺夫方程

和公式48，可得：

对公式49中不等号右侧的公式分别进行处理：

利用下列公式51所示的不等式关系对公式50进行变换，得到公式52：

其中，M>0为设计参数。

利用不等式2ab≤a²+b²和不等式关系

公式49右侧其余公式满足以下关系：

-x^TQx≤-q_min||x||² (55)

将公式50至56代入公式49，在每个事件触发时间间隔[t_k,t_k+1)上的V(t)导数为：

其中，

从公式57可知，若

则

因此，该目标控制器的闭环控制状态是有界的，从V(t)的定义出发，目标控制器的所有控制变量如x，

和

等都是有界的，从公式16所示的神经网络自适应控制输入模型u也是有界的，因此，机器人操作臂的闭环控制也是稳定的，目标控制器具有稳定性。

在确定目标控制器具有稳定性后，需要对目标控制器的可行性进行验证，在验证目标控制器的可行性时，主要是验证目标控制器中事件触发机制的可行性，在本实施例中，通过排除Zeno(在有限时间间隔内无限触发的现象)行为来分析事件触发机制的可行性。在证明事件触发机制的可行性时，需要证明对于所有的k∈Ν由公式4所示的所有触发事件之间时间间隔的下限δt_k＝t_k+1-t_k都有界且远离零，从公式35所示的机器人操作臂闭环控制方程，以及公式18所示的神经网络参数自适应律，可得到：

其中，n_1,k是分段常数函数，在每个第k的整数倍的事件触发时间间隔中，由于控制模型的目标权重没有更新，因此，神经网络权重估计误差

和权重估计

都是恒定的。

事件触发误差e的导数为：

当t_k≤t≤t_k+1时，具有初始条件t＝t_k时e⁺＝0，公式60所示的微分不等式的解的上限为：

第k的整数倍个触发事件时间间隔的下限δt_k＝t_k+1-t_k是所有间隔内||e||从0上升到阈值系数的最小值σ_s,min＝min(σ_s,k||x||)所需的时间。由于参数在变化期间不会更新，因此，阈值系数σ_s是分段常数函数，在所有触发事件时间间隔(t_k,t_k+1]，k＝1,2,...,内，阈值系数σ_s的最小值从公式4变为：

其中，对于触发事件

在下一个事件中，满足

与公式61进行比较，得出：

求解公式62，可得触发事件时间间隔的下限：

从公式64可知，由于

对于所有的k＝1,2,...,所有触发事件时间间隔的下限δt_k>0，因此机器人操作臂的神经网络控制器具有可行性。

在本实施例中，通过对所述目标控制器进行稳定性验证，以确定所述目标控制器是否具有稳定性，若所述目标控制器具有稳定性，对所述目标控制器进行可行性验证，以确定所述目标控制器是否具有可行性，在建立机器人的目标控制器后，通过对目标控制器的稳定性和可行性进行验证，可以确定控制模型对事件触发机制的非线性的解决效果，根据验证结果可以对目标控制器中的控制参数进行调整，从而进一步提高目标控制器对机器人控制的稳定性和可行性。

此外，参照图3，本发明实施例还提出一种机器人控制器设计装置，所述机器人控制器设计装置包括：

模型建立模块10，用于建立所述机器人的动力学模型，并确定所述机器人的目标控制模型；

模型设计模块20，用于根据所述动力学模型设计所述机器人的事件触发机制，并对所述目标控制模型进行模型描述，以确定所述目标控制模型的函数近似模型；

控制设计模块30，用于基于所述事件触发机制，利用所述函数近似模型构造所述机器人的控制律和自适应律；

控制建立模块40，用于确定所述机器人的闭环控制模型，并利用所述控制律、所述自适应律以及所述闭环控制模型，建立所述机器人的目标控制器。

可选地，所述模型建立模块10，包括：

确定单元，用于确定所述机器人的动力学参数；

矩阵建立单元，用于根据所述动力学参数中的广义关节位置，建立所述机器人的惯性矩阵；

模型生成单元，用于根据所述动力学参数和所述惯性矩阵，生成所述机器人的动力学模型。

可选地，所述模型设计模块20，包括：

向量确定单元，用于利用所述动力学模型中的关节位置和关节速度，确定所述机器人的状态向量；

误差定义单元，用于利用所述状态向量定义所述机器人的测量误差；

触发机制设计单元，用于确定所述机器人的事件触发参数，并利用所述测量误差和所述事件触发参数确定所述机器人的事件触发机制。

可选地，所述所述模型设计模块20，还包括：

函数定义单元，用于定义所述目标控制模型的描述函数，并确定所述目标控制模型的控制参数；

模型构造单元，用于根据所述描述函数和所述控制参数，构造所述目标控制模型的函数近似模型。

可选地，所述控制设计模块30，包括：

输入模型构建单元，用于利用所述函数近似模型，构建所述机器人的控制输入模型，以确定所述机器人的控制律；

更新规律确定单元，用于基于所述事件触发机制，确定在事件触发时刻，所述控制输入模型中的控制变量的更新规律；

自适应律确定单元，用于根据所述更新规律确定所述机器人的自适应律。

可选地，所述机器人控制器设计装置，还包括：

第一验证单元，用于对所述目标控制器进行稳定性验证，以确定所述目标控制器是否具有稳定性；

第二验证单元，用于若所述目标控制器具有稳定性，对所述目标控制器进行可行性验证，以确定所述目标控制器是否具有可行性。

可选地，所述第一验证单元，包括：

构建子单元，用于利用所述目标控制器中的控制参数，构建稳定性函数；

验证子单元，用于利用所述稳定性函数和预设稳定性算法，验证所述控制参数的有界性；

确定子单元，用于根据所述控制参数的有界性，确定所述目标控制器是否具有稳定性。

此外，本发明实施例还提出一种可读存储介质，所述可读存储介质上存储有机器人控制器设计程序，所述机器人控制器设计程序被处理器执行时实现上述实施例提供的机器人控制器设计方法中的操作。

上述各程序模块所执行的方法可参照本发明方法各个实施例，此处不再赘述。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来，而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序；术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的机器人控制器设计方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。