CN114610039A

CN114610039A - 机器人的控制方法、装置、机器人和存储介质

Info

Publication number: CN114610039A
Application number: CN202210318960.7A
Authority: CN
Inventors: 曹盼; 周嘉星
Original assignee: Suzhou Hezhong Intelligent Technology Co ltd
Current assignee: Suzhou Hezhong Intelligent Technology Co ltd
Priority date: 2022-03-29
Filing date: 2022-03-29
Publication date: 2022-06-10

Abstract

本发明公开了一种机器人的控制方法、装置、机器人和存储介质。该控制方法，包括以下步骤：获取所述机器人的混合偏差值和所述混合偏差值对应的变化率；基于模型预测控制算法、混合偏差值和变化率、得到被跟踪路径和第一控制量、以及第一控制量是否为全局最优解，所述被跟踪路径用于描述在未来预设时间段中，所述机器人的轨迹；基于模糊控制算法、混合偏差值、变化率和所述被跟踪路径中N个采集点的曲率值、得到第二控制量；基于不同的情形情况，预测控制量为第一控制量，或者第一、第二控制量加权，但第一控制量权重高，或者第一、第二控制量加权，但第二控制量权重高。从而能够获取该机器人的最优控制量。

Description

机器人的控制方法、装置、机器人和存储介质

技术领域

本发明涉及机器人路径控制技术领域，尤其涉及一种机器人的控制方法、装置、机器人和存储介质。

背景技术

机器人的无人自主导航是通过如全球定位系统(Global Positioning System，GPS)、超宽带(Ultra Wide Band，UWB)等设备采集车辆实时的偏差值(例如，位置信息和位姿信息等)，然后将采集的信息输入给路径规划模块，进而规划出一条最优路径，并传给路径跟踪控制模块，计算得到最优控制量并下发给执行机构，完成自动驾驶。机器人能够从其所在位置沿着一条已经规划好的可行路径进行跟踪操作，快速地到达指定地点，这便是机器人的路径跟踪问题。路径跟踪控制是机器人自动驾驶系统中最基本也是最核心的功能，是实现自动驾驶的最终手段。

模型预测控制(Model Predictive Control，MPC)算法是一种常用的机器人路径跟踪控制算法，模型预测控制是利用优化的方法，将一个车辆误差的控制问题转化为求解最优解的问题。

在大多数情况下，整个优化问题是一个凸问题，那么经过优化一定可以获取到整个预测周期的最优控制量(例如，驱动轮的角速度，车头偏向角等)，在滚动迭代中这种特性得到延续，使得整个控制过程快速平稳。但是在实际的场景中，由于变量本身的非线性特性，求解计算会不时出现一些异常数据，而这些数据往往会引起车身的摆动，进而使得控制环境恶化，反过来影响预测控制的计算。以内点法求解为例，可能会出现以下的失败情况：求解达到最大迭代次数、求解下降速度太慢、求解未达到最佳的精度、求解结果不可靠即算法收敛到一个不可行的点、求解返回值不能发生、求解迭代发散、求解恢复失败即算法不知道如何进行、求解计算搜索方向失败且无法恢复、求解遇到无效数字、求解自由度太小有太多的相等约束、求解遇到未知的内部错误等。

可以看到模型预测控制存在很大的风险，计算失败后会获取到的无效的结果，或者直接无法得到结果。而目前的预测控制方法还没有很好的方法应对这样的情况，大致的方案都是将车辆降至最低速运行，直到计算恢复正常，或者是直接停车重新初始化启动。

因此，在基于模型预测控制算法求解最优控制量时，如何处理这些失败情况，就成为一个亟待解决的问题。

发明内容

有鉴于此，本发明的主要目的在于提供一种机器人的控制方法、装置、机器人和存储介质。

为达到上述目的，本发明的技术方案是这样实现的：一种机器人的控制方法，包括以下步骤：

获取所述机器人的混合偏差值E和所述混合偏差值E对应的变化率ΔE，混合偏差值E＝f(E₁,E₂,...,E_num)，其中，num为自然数、且num≤3，E₁,E₂,...,E_num为num个互不相同的偏差，f()为函数；

基于模型预测控制算法、混合偏差值E、变化率ΔE和预设的被跟踪路径、得到第一控制量U₁、以及第一控制量U₁是否为全局最优解，所述被跟踪路径用于描述在未来预设时间段中，所述机器人的轨迹；基于模糊控制算法、混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值、得到第二控制量U₂，其中，N为自然数，且N≥2；

当第一控制量U₁是全局最优解时，预测控制量U₃＝U₁；当第一控制量U₁不是全局最优解、且|U₁-U₂|>预设阀值时，所述预测控制量U₃＝U₂，其中，预设阀值>0，第一控制量U₁、第二控制量U₂和预测控制量U₃同时为机器人底部的驱动轮的角速度、或同时为车头偏向角。

作为本发明实施例的一种改进，时间被划分为多个连续的时间段，在每个时间段中均运行所述控制方法；还包括以下步骤：获取上一次执行所述控制方法所得到的预测控制量U₃，以所述预测控制量U₃设置所述机器人，当U₃是全局最优解时，执行以下操作：当第一控制量U₁不是全局最优解、且|U₁-U₂|≤所述预设阀值、且|U₁-U₃|≤所述预设阀值时，所述预测控制量U₃＝U₁*K₁+U₂*K₂，0.5<K₁≤1，K₂＝1-K₁；当第一控制量U₁不是全局最优解、且|U₁-U₂|≤所述预设阀值、且|U₁-U₃|>所述预设阀值时，所述预测控制量U₃＝U₁*K₁+U₂*K₂，0≤K₁≤0.5，K₂＝1-K₁。

作为本发明实施例的一种改进，不同的时间段的长度均相等且为T；以时间先后次序排列，N个采集点中的最后一个与当前采集点之间的距离的ds＝Win*V_max/f，其中，f＝1/T，Win为所述模型预测控制算法中的窗口大小，V_max为所述机器人的最高运动速度。

作为本发明实施例的一种改进，num＝2，E₁为横向误差，E₂为角度误差，其中，横向为所述机器人的前进方向。

作为本发明实施例的一种改进，所述“基于模糊控制算法、混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值、得到第二控制量U₂”具体包括：对混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值共N+2个输入值x_i均采用高斯隶属度函数获取每个输入值对应的隶属度，其中，高斯隶属度函数为

其中，x₁为对混合偏差值E，x₂为变化率ΔE，x₃，x₄，...，x_N+2分别为第1个采集点的曲率值，第2个采集点的曲率值，...，第N个采集点的曲率值，i＝1，2，...，N+2；采用Mamdani推理法得到t范式，第j条规则的前提条件为α_j，各输入变量的隶属度为μ₁，μ₂，...，μ_N+2，则α_j＝μ₁*μ₂*...*μ_N+2，j＝1，2，...，M，M为模糊规则的数量；最终的输出量为

y_j为第j条模糊规则中模糊输出语言变量对应的输出值。

作为本发明实施例的一种改进，还包括以下步骤：将混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值共N+2个输入值x_i输入预设的模糊神经网络，得到δ_i、μ_i和y_j；所述模糊神经网络包括：输入层、输入模糊层、模糊规则层，归一化层和输出层；所述输入层用于接收N+2个输入值x_i；所述输入模糊层用于：

其中，j∈{1,2,...,q_i}，q_i为第i个输入值x_i的模糊分割数，μ_ij是x_i对应的隶属度函数的参数μ_i，σ_ij是x_i对应的隶属度函数的参数σ_i，

是x_i对x_j所对应的隶属度函数的适配度；所述模糊规则层用于：

α_k为N+2个输入值x_i对第j条模糊规则的适配程度；所述归一化层用于：

所述输出层用于：最终的输出量为

作为本发明实施例的一种改进，所述模糊神经网络的假设代价函数为

其中，t为样本理想输出。

本发明实施例还提供了一种用于机器人的控制装置，包括以下模块：信息获取模块，用于获取所述机器人的混合偏差值E和所述混合偏差值E对应的变化率ΔE，混合偏差值E＝f(E₁,E₂,...,E_num)，其中，num为自然数、且num≤3，E₁,E₂,...,E_num为num个互不相同的偏差，f()为函数；信息处理模块，用于基于模型预测控制算法、混合偏差值E、变化率ΔE和预设的被跟踪路径、得到第一控制量U₁、以及第一控制量U₁是否为全局最优解，所述被跟踪路径用于描述在未来预设时间段中，所述机器人的轨迹；基于模糊控制算法、混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值、得到第二控制量U₂，其中，N为自然数，且N≥2；决策模块，用于当第一控制量U₁是全局最优解时，预测控制量U₃＝U₁；当第一控制量U₁不是全局最优解、且|U₁-U₂|>预设阀值时，所述预测控制量U₃＝U₂，其中，预设阀值>0，第一控制量U₁、第二控制量U₂和预测控制量U₃同时为机器人底部的驱动轮的角速度、或同时为车头偏向角。

本发明实施例还提供了一种机器人，包括：存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现上述的的控制方法的步骤。

本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述的控制方法的步骤。

本发明实施例所提供的药库具有以下优点：本发明实施例公开了一种机器人的控制方法、装置、机器人和存储介质。该控制方法，包括以下步骤：获取所述机器人的混合偏差值和所述混合偏差值对应的变化率；基于模型预测控制算法、混合偏差值和变化率、得到被跟踪路径和第一控制量、以及第一控制量是否为全局最优解，所述被跟踪路径用于描述在未来预设时间段中，所述机器人的轨迹；基于模糊控制算法、混合偏差值、变化率和所述被跟踪路径中N个采集点的曲率值、得到第二控制量；当第一控制量是全局最优解时，预测控制量为第一控制量；当第一控制量不是全局最优解、且|第一、第二控制量的差值的绝对值预设阀值时，预测控制量为第二控制量。从而能够获取该机器人的最优控制量。

附图说明

图1为本发明实施例提供的神经网络的生成方法的流程示意图；

图2为本发明实施例提供的生成方法的原理图；

图3为本发明实施例提供的神经网络的结构图。

具体实施方式

以下将结合附图所示的实施方式对本发明进行详细描述。但该实施方式并不限制本发明，本领域的普通技术人员根据该实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。

以下描述和附图充分地示出本文的具体实施方案，以使本领域的技术人员能够实践它们。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本文的实施方案的范围包括权利要求书的整个范围，以及权利要求书的所有可获得的等同物。本文中，术语“第一”、“第二”等仅被用来将一个元素与另一个元素区分开来，而不要求或者暗示这些元素之间存在任何实际的关系或者顺序。实际上第一元素也能够被称为第二元素，反之亦然。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的结构、装置或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种结构、装置或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的结构、装置或者设备中还存在另外的相同要素。本文中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

本文中的术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本文和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。在本文的描述中，除非另有规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

本发明实施例一提供了一种机器人的控制方法，这里，可以在该机器人中设置有一个控制装置，由该控制装置来执行该控制方法。

如图1所示，包括以下步骤：

步骤101：获取所述机器人的混合偏差值E和所述混合偏差值E对应的变化率ΔE，混合偏差值E＝f(E₁,E₂,...,E_num)，其中，num为自然数、且num≤3，E₁,E₂,...,E_num为num个互不相同的偏差，f()为函数；这里，E₁,E₂,...,E_N可以为横向偏差，纵向偏差或角度偏差等等，其中，在函数f()中，不同的E_i的偏差对应的权重可以不同，i为自然数，1≤i≤num。可选的，混合偏差值

在不同的时间段中，混合偏差值E通常是不一样的，变化率ΔE就是用于描述混合偏差值E的变化的快慢；变化率ΔE>0时，则表示混合偏差值E有变大的趋势，且变化率ΔE越大，则变大的趋势越快；变化率ΔE＝0时，则表示混合偏差值E有保持恒定的趋势；变化率ΔE<0时，则表示混合偏差值E有变小的趋势，且变化率ΔE的绝对值越大，则变小的趋势越快。

步骤102：基于模型预测控制算法、混合偏差值E、变化率ΔE和预设的被跟踪路径、得到第一控制量U₁、以及第一控制量U₁是否为全局最优解，所述被跟踪路径用于描述在未来预设时间段中，所述机器人的轨迹；基于模糊控制算法、混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值、得到第二控制量U₂，其中，N为自然数，且N≥2；

这里，模糊控制算法是利用模糊数学的基本思想和理论的控制方法，在实际中，要实现模糊控制算法，通常需要实现以下步骤：(1)模糊化，主要作用是选定模糊控制器的输入量，并将其转换为系统可识别的模糊量；(2)规则库，根据人类专家的经验建立模糊规则库，模糊规则库包含众多控制规则，是从实际控制经验过渡到模糊控制器的关键步骤；(3)模糊推理，主要实现基于知识的推理决策；(4)解模糊。主要作用是将推理得到的控制量转化为控制输出。

在使用模糊控制算法进行误差消除时，主要的输入参数选择为误差信息，包括误差，误差变化率和误差变化加速度等等，发明人在长期的工作中，发现这些信息只能反应当前时刻的控制状态，并不能反映运动方向上路径参数的变化，这会导致以下现象发生：如图2所示，当三个路径(即路径a、b和c)在运动方向上沿着不同方向伸展时，模型预测控制算法分别对这三个路径进行处理，会得到三个不同的结果；由于这三个路径的当前的误差信息是相同的，模糊控制算法(仅向该模糊控制算法输入误差信息)分别对这三条路径进行处理，会得到三个相同的结果，可以理解的是，这明显是错误的。因此，为了防止该错误的发生，在本实施例的控制方法中，还会向模糊控制算法输入路径上的N个采集点的曲率值，从而能够兼顾预测控制的前瞻特性，能够一定程度上反映路径从当前采集点沿不同方向延伸的状态。

在实际上，在运行该模糊控制算法时，需要兼顾如下几个原则：

(1)模型预测控制算法输出的变化，很大程度上受路径曲率变化的影响，因此在模糊控制算法的输入的选择上需要兼顾运动方向上不同采集点的曲率；

(2)模糊控制算法的运算成本与输入变量的数量以及变量本身的划分粒度有关，因此在输入变量的数量N上应该做一定的控制，不能随意增加数量，且在变量划分上也不宜太细，否则会引起计算成本的指数型增长。

步骤103：当第一控制量U₁是全局最优解时，预测控制量U₃＝U₁；当第一控制量U₁不是全局最优解、且|U₁-U₂|>预设阀值时，所述预测控制量U₃＝U₂，其中，预设阀值>0，第一控制量U₁、第二控制量U₂和预测控制量U₃同时为机器人底部的驱动轮的角速度、或同时为车头偏向角。

这里，当该模型预测控制算法输出的第一控制量U₁是有效的(即是全局最优解)，预测控制量U₃＝U₁，反之如果是无效的，且|U₁-U₂|>预设阀值，预测控制量U₃＝U₂，在之后的合适的时间，可以用该预测控制量U₃来设置该机器人。

当|U₁-U₂|>预设阀值时，表面说明模型预测控制算法的结果U₁合理的可能性进一步降低，因此预测控制量U₃＝U₂。

该控制方法会每隔一段时间就执行一次，从而就计算出了未来多个时刻的最优控制量，进而能够使得机器人的轨迹最接近被跟踪路径。

本实施例中，时间被划分为多个连续的时间段，在每个时间段中均运行所述控制方法；

如图1所示，还包括以下步骤：

步骤104：获取上一次执行所述控制方法所得到的预测控制量U₃，以所述预测控制量U₃设置所述机器人，当U₃是全局最优解时，执行以下操作：当第一控制量U₁不是全局最优解、且|U₁-U₂|≤所述预设阀值、且|U₁-U₃|≤所述预设阀值时，所述预测控制量U₃＝U₁*K₁+U₂*K₂，0.5<K₁≤1，K₂＝1-K₁；当第一控制量U₁不是全局最优解、且|U₁-U₂|≤所述预设阀值、且|U₁-U₃|>所述预设阀值时，所述预测控制量U₃＝U₁*K₁+U₂*K₂，0≤K₁≤0.5，K₂＝1-K₁。

当第一控制量U₁不是全局最优解、且|U₁-U₂|≤所述预设阀值、且|U₁-U₃|≤所述预设阀值时，表明模型预测控制算法的结果虽然不是全局最优，但是与模糊控制算法以及上一时间段的预测控制量都接近，所以可以更信任预测结果；

当第一控制量U₁不是全局最优解、且|U₁-U₂|≤所述预设阀值、且|U₁-U₃|>所述预设阀值时，表明模型预测控制算法的结果与模糊控制算法的结果接近，但是偏离上一次的预测控制量结果，所以认为使用模型预测控制算法的稳定性更高，增大模糊部分的权重。

这里，该控制装置每隔一个预设的时间就执行一次该控制方法，于是，时间就会划分多个时间段了，在上一个时间段里面会执行该控制方法，当得到预测控制量U₃之后，在下一个时间段中，就可以用该预测控制量来设置机器人了。可以理解的是，当预测控制量U₃为机器人底部的驱动轮的角速度时，需要基于预测控制量U₃设置所述驱动轮的角速度；当预测控制量U₃为车头偏向角时，需要基于预测控制量U₃设置所述机器人的车头偏向角。

本实施例中，不同的时间段的长度均相等且为T；以时间先后次序排列，N个采集点中的最后一个与当前采集点之间的距离的ds＝Win*V_max/f，其中，f＝1/T，Win为所述模型预测控制算法中的窗口大小，V_max为所述机器人的最高运动速度。

这里，可以理解的是，路径上当前采集点与最后一个采集点之间的距离间隔ds与模型预测控制算法的参数有关，假设机器人的控制频率为f(即一秒钟，运行该控制方法的次数)，预测控制的窗口大小为Win，机器人的最高运行速度为V_max，则ds＝N*V_max/f，因为太长的采集路径，一方面会使得在采集点数量确定的情况下，采集的密度降低，另一方面会使采集范围超出模型预测控制算法的预测范围，反而不利于对模型预测控制算法的补偿；

采集点的数量N需要在最终模糊控制算法的计算强度以及对模型预测控制算法的拟合度之间做平衡，采集点数的增加有利于细化模糊控制算法的输入信息，但是相应的计算周期会增加，考虑模糊控制算法只是一个辅助控制算法，因此需要将其运算的周期压缩在一定范围，假设模型预测控制算法的周期为T₁，模糊控制算法的周期为T₂，发明人在长期的实践中发现，当采集点的数量N₁保证模糊控制算法的时长T₂<0.3*T₁，整个控制方法具有较快的执行速度。

在图2所示的情形中，路径a、b和c中，均包含有5个采集点，且当前采集点均为采集点1，最后一个采集点可以均为采集点5。

本实施例中，num＝2，E₁为横向误差，E₂为角度误差，其中，横向为所述机器人的前进方向。这里，可以为曲率的采集密度预留出更多的余量。

本实施例中，所述“基于模糊控制算法、混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值、得到第二控制量U₂”具体包括：

对混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值共N+2个输入值x_i均采用高斯隶属度函数获取每个输入值对应的隶属度，其中，高斯隶属度函数为

其中，x₁为对混合偏差值E，x₂为变化率ΔE，x₃，x₄，...，x_N+2分别为第1个采集点的曲率值，第2个采集点的曲率值，...，第N个采集点的曲率值，i＝1，2，...，N+2；

采用Mamdani推理法得到t范式，第j条规则的前提条件为α_j，各输入变量的隶属度为μ₁，μ₂，...，μ_N+2，则α_j＝μ₁*μ₂*...*μ_N+2，j＝1，2，...，M，M为模糊规则的数量；

最终的输出量为

y_j为第j条模糊规则中模糊输出语言变量对应的输出值。

本实施例中，还包括以下步骤：

将混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值共N+2个输入值x_i输入预设的模糊神经网络，得到δ_i、μ_i和y_j；

如图3所示，所述模糊神经网络包括：输入层、输入模糊层、模糊规则层，归一化层和输出层；所述输入层用于接收N+2个输入值x_i；这里，该层的作用主要就是将输入值x_i接入到该模糊神经网络，本层的节点数为输入值x_i的数量N+2。

所述输入模糊层用于：

是x_i对x_j所对应的隶属度函数的适配度；这里，该层主要的功能就是计算当前输入值x_i对某一特定模糊语言变量的隶属度，高斯隶属度函数的参数μ和σ就包含在这一层。

所述模糊规则层用于：

α_k为N+2个输入值x_i对第j条模糊规则的适配程度；这里，在该层中，每个节点代表一条模糊规则，主要功能是计算模糊规则的前提条件，获取全部的N+2个输入值x_i对模糊规则的匹配程度。

所述归一化层用于：

这里，该层的作用就是进行前提条件的归一化处理，因此节点数与模糊规则层相同。

所述输出层用于：最终的输出量为

这里，该层的作用就是根据输入对每条模糊规则的触发程度最终获取到机器人实际的输出量；

这里，模糊控制算法需要优化的模糊参数主要有三个，高斯隶属度函数的参数μ_i、σ_i、以及每条模糊规则中模糊输出语言变量对应的输出值y_j，该模糊神经网络采用1个输入层，3个中间隐藏层和1个输出层的结构，对模糊系统进行网络化处理。

本实施例中，所述模糊神经网络的假设代价函数为

其中，t为样本理想输出。

在该模糊神经网络的学习过程中，通过梯度下降法，不断更新网络中与模糊系统相关的参数，使得网络的输出更加接近样本输出。假设代价函数为E，则

由于最终要优化的参数包括第k条模糊规则中模糊输出语言变量对应的模糊值y_k，第i个输入变量第j个隶属度函数的参数σ_ij，μ_ij，因此以这三个参数为自变量，对代价函数求导，结果如下：

其中，

当采用相乘的策略计算模糊规则前提条件时，

这里，将j分割为m_j份，i_j∈{1,2,...,m_j}最终的学习算法为：

本发明实施例二提供了一种用于机器人的控制装置，包括以下模块：

信息获取模块，用于获取所述机器人的混合偏差值E和所述混合偏差值E对应的变化率ΔE，混合偏差值E＝f(E₁,E₂,...,E_num)，其中，num为自然数、且num≤3，E₁,E₂,...,E_num为num个互不相同的偏差，f()为函数；

信息处理模块，用于基于模型预测控制算法、混合偏差值E、变化率ΔE和预设的被跟踪路径、得到第一控制量U₁、以及第一控制量U₁是否为全局最优解，所述被跟踪路径用于描述在未来预设时间段中，所述机器人的轨迹；基于模糊控制算法、混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值、得到第二控制量U₂，其中，N为自然数，且N≥2；

决策模块，用于当第一控制量U₁是全局最优解时，预测控制量U₃＝U₁；当第一控制量U₁不是全局最优解、且|U₁-U₂|>预设阀值时，所述预测控制量U₃＝U₂，其中，预设阀值>0，第一控制量U₁、第二控制量U₂和预测控制量U₃同时为机器人底部的驱动轮的角速度、或同时为车头偏向角。

本发明实施例三提供了一种机器人，包括：存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现如实施例一中的控制方法的步骤。

本发明实施例四提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如实施例一中的控制方法的步骤。

应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施方式中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明，它们并非用以限制本发明的保护范围，凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims

1.一种机器人的控制方法，其特征在于，包括以下步骤：

获取所述机器人的混合偏差值E和所述混合偏差值E对应的变化率ΔE，混合偏差值E＝f(E₁，E₂，...，E_num)，其中，num为自然数、且num≤3，E₁，E₂，...，E_num为num个互不相同的偏差，f()为函数；

当第一控制量U₁是全局最优解时，预测控制量U₃＝U₁；当第一控制量U₁不是全局最优解、且|U₁-U₂|＞预设阀值时，所述预测控制量U₃＝U₂，其中，预设阀值＞0，第一控制量U₁、第二控制量U₂和预测控制量U₃同时为机器人底部的驱动轮的角速度、或同时为车头偏向角。

2.根据权利要求1所述的控制方法，其特征在于，

时间被划分为多个连续的时间段，在每个时间段中均运行所述控制方法；

还包括以下步骤：获取上一次执行所述控制方法所得到的预测控制量U₃，以所述预测控制量U₃设置所述机器人，当U₃是全局最优解时，执行以下操作：当第一控制量U₁不是全局最优解、且|U₁-U₂|≤所述预设阀值、且|U₁-U₃|≤所述预设阀值时，所述预测控制量U₃＝U₁*K₁+U₂*K₂，0.5＜K₁≤1，K₂＝1-K₁；当第一控制量U₁不是全局最优解、且|U₁-U₂|≤所述预设阀值、且|U₁-U₃|＞所述预设阀值时，所述预测控制量U₃＝U₁*K₁+U₂*K₂，0≤K₁≤0.5，K₂＝1-K₁。

3.根据权利要求1所述的控制方法，其特征在于：

不同的时间段的长度均相等且为T；

以时间先后次序排列，N个采集点中的最后一个与当前采集点之间的距离的ds＝Win*V_max/f，其中，f＝1/T，Win为所述模型预测控制算法中的窗口大小，V_max为所述机器人的最高运动速度。

4.根据权利要求1所述的控制方法，其特征在于：

num＝2，E₁为横向误差，E₂为角度误差，其中，横向为所述机器人的前进方向。

5.根据权利要求1所述的控制方法，其特征在于，所述“基于模糊控制算法、混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值、得到第二控制量U₂”具体包括：

其中，x₁为对混合偏差值E，x₂为变化率ΔE，x₃，x₄，…，x_N+2分别为第1个采集点的曲率值，第2个采集点的曲率值，…，第N个采集点的曲率值，i＝1，2，…，N+2；

采用Mamdani推理法得到t范式，第j条规则的前提条件为α_j，各输入变量的隶属度为μ₁，μ₂，…，μ_N+2，则α_j＝μ₁*μ₂*…*μ_N+2，j＝1，2，…，M，M为模糊规则的数量；

最终的输出量为

y_j为第j条模糊规则中模糊输出语言变量对应的输出值。

6.根据权利要求5所述的控制方法，其特征在于，还包括以下步骤：

将混合偏差值E、变化率ΔE和所述被跟踪路径中N个采集点的曲率值共N+2个输入值xi输入预设的模糊神经网络，得到δ_i、μ_i和y_j；

所述模糊神经网络包括：输入层、输入模糊层、模糊规则层，归一化层和输出层；

所述输入层用于接收N+2个输入值x_i；

所述输入模糊层用于：

其中，j∈{1，2，...，q_i}，q_i为第i个输入值x_i的模糊分割数，μ_ij是x_i对应的隶属度函数的参数μ_i，σ_ij是x_i对应的隶属度函数的参数σ_i，

是x_i对x_j所对应的隶属度函数的适配度；

所述模糊规则层用于：

i₁∈{1，2，…，q₁}，…，i_N∈{1，2，…，q_N}，α_k为N+2个输入值x_i对第j条模糊规则的适配程度；

所述归一化层用于：

所述输出层用于：最终的输出量为

7.根据权利要求6所述的控制方法，其特征在于：

所述模糊神经网络的假设代价函数为

其中，t为样本理想输出。

8.一种用于机器人的控制装置，其特征在于，包括以下模块：

信息获取模块，用于获取所述机器人的混合偏差值E和所述混合偏差值E对应的变化率ΔE，混合偏差值E＝f(E₁，E₂，...，E_num)，其中，num为自然数、且num≤3，E₁，E₂，...，E_num为num个互不相同的偏差，f()为函数；

决策模块，用于当第一控制量U₁是全局最优解时，预测控制量U₃＝U₁；当第一控制量U₁不是全局最优解、且|U₁-U₂|＞预设阀值时，所述预测控制量U₃＝U₂，其中，预设阀值＞0，第一控制量U₁、第二控制量U₂和预测控制量U₃同时为机器人底部的驱动轮的角速度、或同时为车头偏向角。

9.一种机器人，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任一项所述的控制方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的控制方法的步骤。