WO2018227820A1

WO2018227820A1 - 控制机械臂运动的方法及装置、存储介质和终端设备

Info

Publication number: WO2018227820A1
Application number: PCT/CN2017/104502
Authority: WO
Inventors: 罗汉杰
Original assignee: 广州视源电子科技股份有限公司
Priority date: 2017-06-13
Filing date: 2017-09-29
Publication date: 2018-12-20
Also published as: CN107457780B; CN107457780A

Abstract

一种控制机械臂运动的方法和装置、存储介质与终端设备，所述方法包括：获取所述机械臂运动的目标轨迹训练集（S1）；对目标轨迹模型的参数种群进行初始化以及迭代更新，并依次将参数种群中的参数组作为所述目标轨迹模型的参数组，计算每一个目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合成的曲线之间的拟合程度（S2）；根据每一个参数组对应的拟合程度，选取一个参数组作为所述目标轨迹模型的参数组（S3）；当接收到当前所述机械臂运动的状态参数时，将获取到的状态参数输入所述目标轨迹模型中，获得当前控制所述机械臂运动的控制参数，并根据所获得的控制参数控制所述机械臂运动（S4）。采用本方法，可以提高建立控制机械臂运动模型的准确度，以及方便控制机械臂执行复杂的运动。

Description

控制机械臂运动的方法及装置、存储介质和终端设备

技术领域

本发明涉及机械控制技术领域，尤其涉及一种控制机械臂运动的方法及装置、存储介质和终端设备。

背景技术

在传统的机械臂系统中，机械臂的运动轨迹需要用户提前设定。运动轨迹一般是用空间中的一些关键点和关键点间的连线(直线/曲线)来描述。当今，机器人需要解决越来越复杂的任务，对于一些运动轨迹，难以采用传统的方法去描述，也就是机器人无法将这些复杂的运动轨迹复现出来。

发明内容

本发明实施例提出的一种控制机械臂运动的方法及装置、存储介质和终端设备，提高建立控制机械臂运动模型的准确度，以及方便控制机械臂执行复杂的运动。

在第一方面，本发明实施例提供了一种控制机械臂运动的方法，包括：

获取所述机械臂运动的目标轨迹训练集；所述目标轨迹训练集中的每一个元素包括所述机械臂运动的状态参数和与所述状态参数对应的控制所述机械臂运动的控制参数；

对目标轨迹模型的参数种群进行初始化以及迭代更新，并依次将参数种群中的参数组作为所述目标轨迹模型的参数组，计算每一个目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合成的曲线之间的拟合程度；

根据每一个参数组对应的拟合程度，选取一个参数组作为所述目标轨迹模型的参数组；

当接收到当前所述机械臂运动的状态参数时，将获取到的状态参数输入所述目标轨迹模型中，获得当前控制所述机械臂运动的控制参数，并根据所获得的控制参数控制所述机械臂运动。

在第一方面的第一种可能的实现方式中，所述对目标轨迹模型的参数种群进行初始化以及迭代更新，并依次将参数种群中的参数组作为所述目标轨迹模型的参数组，计算每一个目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合成的曲线之间的拟合程度，具体为：

初始化设置所述目标轨迹模型的参数种群中的每一个参数组的数值；

对于所述参数种群中的每一个参数组，将所述参数组作为所述目标轨迹模型的参数组，并计算所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度；

根据所述参数种群的每一个参数组对应的拟合程度，从所述参数种群中选取两个参数组；

以分别在所选取出的两个参数组中的同一含义的两个参数值进行交叉互换的原则，获取新的参数组，直至生成参数组的数量与所述参数种群的参数组的数量相同；

以新生成的所有参数组更新替代所述参数种群，并对迭代次数加一；

判断所述迭代次数是否达到预设次数；

若否，返回继续计算更新后的参数种群的每一个参数组对应的拟合程度，直至迭代次数达到所述预设次数。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，在作为所述目标轨迹模型的参数组为所述参数种群中的第j个参数组p_j时，所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度为：

其中，x_i为所述目标轨迹训练集中的第i个状态参数；y_i为所述目标轨迹训练集中的第i个状态参数对应的控制参数；f(x_i，p_j)为以所述第j个参数组为所述目标轨迹模型的参数组时，所述第i个状态参数在所述目标轨迹模型中对应的控制参数。

结合第一方面，在第一方面的第三种可能的实现方式中，所述根据每一个参数组对应的拟合程度，选取一个参数组作为所述目标轨迹模型的参数组，具体为：

对于每一个参数种群，从所述参数种群中选取拟合程度最高的参数组；

从选取出的所有参数组中，选取拟合程度最高的参数组作为所述目标轨迹模型的参数组。

结合第一方面，在第一方面的第四种可能的实现方式中，所述目标轨迹模型为

其中，

为第i个高斯核函数；w_i为第i个高斯核函数占的权重系数，i≤N；其中，c_i为所述第i个高斯核函数的中心值；σ_i为所述第i个高斯核函数的宽度。

在第二方面，本发明实施例还提供一种控制机械臂运动的装置，包括：

训练集获取模块，用于获取所述机械臂运动的目标轨迹训练集；所述目标轨迹训练集中的每一个元素包括所述机械臂运动的状态参数和与所述状态参数对应的控制所述机械臂运动的控制参数；

种群迭代计算模块，用于对目标轨迹模型的参数种群进行初始化以及迭代更新，并依次将参数种群中的参数组作为所述目标轨迹模型的参数组，计算每一个目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合成的曲线之间的拟合程度；

参数组选取模块，用于根据每一个参数组对应的拟合程度，选取一个参数组作为所述目标轨迹模型的参数组；

机械运动控制模块，用于当接收到当前所述机械臂运动的状态参数时，将获取到的状态参数输入所述目标轨迹模型中，获得当前控制所述机械臂运动的控制参数，并根据所获得的控制参数控制所述机械臂运动。

在第二方面的第一种可能的实现方式中，所述种群迭代计算模块，具体包括：

初始化单元，用于初始化设置所述目标轨迹模型的参数种群中的每一个参数组的数值；

拟合程度计算单元，用于对于所述参数种群中的每一个参数组，将所述参数组作为所述目标轨迹模型的参数组，并计算所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度；

参数组选取单元，用于根据所述参数种群的每一个参数组对应的拟合程度，从所述参数种群中选取两个参数组；

新参数组生成单元，用于以分别在所选取出的两个参数组中的同一含义的两个参数值进行交叉互换的原则，获取新的参数组，直至生成参数组的数量与所述参数种群的参数组的数量相同；

更新替代单元，用于以新生成的所有参数组更新替代所述参数种群，并对迭代次数加一；

判断迭代单元，用于判断所述迭代次数是否达到预设次数；

拟合程度计算单元，还用于当所述迭代次数没有达到预设次数时，返回继续计算更新后的参数种群的每一个参数组对应的拟合程度，直至迭代次数达到所述预设次数。

结合第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，在作为所述目标轨迹模型的参数组为所述参数种群中的第j个参数组p_j时，所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度为：

以及，本发明实施例提供一种存储介质，其中存储有多条指令，所述指令被处理器执行时实现第一方面提供的任一实施例的控制机械臂运动的方法。

另外，本发明实施例提供一种终端设备，包括存储介质、处理器及存储在所述存储介质上并可在所述处理器上运行的多条指令，其中，所述处理器执行所述指令时实现第一方面提供的任一实施例的控制机械臂运动的方法。

实施本发明实施例，具有如下有益效果：

本发明实施例提供的控制机械臂运动的方法和装置以及存储介质和终端设备，通过不断迭代更新参数种群，使得利用参数种群的参数组建立目标轨迹模型收敛趋向于目标轨迹训练集构建的曲线，确保建模的准确性，以及建模完成后，只需要根据用户输入的机械臂的状态参数，即可从目标轨迹模型中获取得到控制机械臂工作的控制参数，直接控制机械臂工作，能够配合种动态控制机械臂的工作，方便对运动轨迹的修改以及预测。

附图说明

图1是本发明提供的控制机械臂运动的方法的一个实施例的流程示意图；

图2是本发明提供的控制机械臂运动的方法的参数种群迭代更新的一个实施例的流程示意图；

图3是本发明提供的控制机械臂运动的装置的一个实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，是本发明提供的控制机械臂运动的方法的一个实施例的结构示意图；该控制机械臂运动的方法，包括步骤S1至S4，具体如下：

S1，获取所述机械臂运动的目标轨迹训练集；所述目标轨迹训练集中的每一个元素包括所述机械臂运动的状态参数和与所述状态参数对应的控制所述机械臂运动的控制参数；

S2，对目标轨迹模型的参数种群进行初始化以及迭代更新，并依次将参数种群中的参数组作为所述目标轨迹模型的参数组，计算每一个目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合成的曲线之间的拟合程度；

S3，根据每一个参数组对应的拟合程度，选取一个参数组作为所述目标轨迹模型的参数组；

S4，当接收到当前所述机械臂运动的状态参数时，将获取到的状态参数输入所述目标轨迹模型中，获得当前控制所述机械臂运动的控制参数，并根据所获得的控制参数控制所述机械臂运动。

需要说明的是，通过迭代更新出足够多的参数种群，计算所有参数种群的参数组对应的目标轨迹模型拟合成的曲线与目标轨迹训练集组合成的曲线之间的拟合程度，来提高目标轨迹模型的拟合准确度，以及之后根据参数组对应的拟合程度来选取一个参数组为目标轨迹模型的参数组，通常选取拟合程度最高的参数组，能够更进一步地提高目标轨迹模型的拟合准确度，使得机械臂运动时基于该目标轨迹模型获得的控制参数更为准确，机械臂运动轨迹更符合用户的需求。

作为上述实施例的进一步改进，对于步骤S2对参数种群的初始化和迭代更新过程，如图2所示，采用以下优选实施方式，包括步骤S21至S26，具体如下：

S21，初始化设置所述目标轨迹模型的参数种群中的每一个参数组的数值；需要说明的是，对于参数组的一个参数会提供对应的参数值区间，初始化设置时，从对应的参数值区间中随机选取一个数值作为该参数，可以加快收敛，使得后续迭代生成的参数种群中的参数组作为目标轨迹模型的参数组时，目标轨迹模型的拟合程度更好。

S22，对于所述参数种群中的每一个参数组，将所述参数组作为所述目标轨迹模型的参数组，并计算所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度；在本发明实施例中，在设置作为所述目标轨迹模型的参数组是所述参数种群中的第j个参数组p_j时，则所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度h_j为：

需要说明的是，h_j的数值越小，表示目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度越高。

S23，根据所述参数种群的每一个参数组对应的拟合程度，从所述参数种群中选取两个参数组；

S24，以分别在所选取出的两个参数组中的同一含义的两个参数值进行交叉互换的原则，获取新的参数组，直至生成参数组的数量与所述参数种群的参数组的数量相同；假设初始化的参数种群的参数组为M个，则生成新的参数组的数量达到M个，则暂停继续生成新的参数组。

S25，以新生成的所有参数组更新替代所述参数种群，并对迭代次数加一；迭代次数的初始值为零。

S26，判断所述迭代次数是否达到预设次数；

若否，返回步骤S22继续计算更新后的参数种群的每一个参数组对应的拟合程度，直至迭代次数达到所述预设次数；

若是，则完成参数种群的迭代更新。

作为本发明实施例的进一步改进，上述步骤S3的具体实施过程，具体为：

作为本发明实施例的优选实施方式，优选采用的目标轨迹模型为

其中，

为第i个高斯核函数；w_i为第i 个高斯核函数占的权重系数，i≤N；其中，c_i为所述第i个高斯核函数的中心值；σ_i为所述第i个高斯核函数的宽度。

在本发明实施例中，采用多个高斯核函数并配以不同的权重组合而成，使得目标轨迹模型能够拟合任意曲线，即使得拟合而成的目标轨迹模型能够表达机械臂的非线性运动。

需要说明的是，对于以上目标轨迹模型的设置，一个确定的目标轨迹模型包括了N个高斯核函数，则第i个高斯核函数

包括参数{w_i，c_i，σ_i}，则参数组种群包含的第j参数组p_j＝{w₁，c₂，σ₃，w₂，c₂，σ₂，……，w_N，c_N，σ_N}。

本发明实施例提供的控制机械臂运动的方法，通过不断迭代更新参数种群，使得利用参数种群的参数组建立目标轨迹模型收敛趋向于目标轨迹训练集构建的曲线，确保建模的准确性，以及建模完成后，只需要根据用户输入的机械臂的状态参数，即可从目标轨迹模型中获取得到控制机械臂工作的控制参数，直接控制机械臂工作，能够配合种动态控制机械臂的工作，方便对运动轨迹的修改以及预测。

参见图3，是本发明提供的控制机械臂运动的装置的一个实施例的结构示意图，该装置为设置在控制处理器中的软系统，能够实施上述实施例提供的控制机械臂运动的方法的全部流程，该装置包括：

训练集获取模块10，用于获取所述机械臂运动的目标轨迹训练集；所述目标轨迹训练集中的每一个元素包括所述机械臂运动的状态参数和与所述状态参数对应的控制所述机械臂运动的控制参数；

种群迭代计算模块20，用于对目标轨迹模型的参数种群进行初始化以及迭代更新，并依次将参数种群中的参数组作为所述目标轨迹模型的参数组，计算每一个目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合成的曲线之间的拟合程度；

参数组选取模块30，用于根据每一个参数组对应的拟合程度，选取一个参数组作为所述目标轨迹模型的参数组；

机械运动控制模块40，用于当接收到当前所述机械臂运动的状态参数时，将获取到的状态参数输入所述目标轨迹模型中，获得当前控制所述机械臂运动的控制参数，并根据所获得的控制参数控制所述机械臂运动。

拟合程度计算单元，用于对于所述参数种群中的每一个参数组，将所述参数组作为所述目标轨迹模型的参数组，计算所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度；

判断迭代单元，用于判断所述迭代次数是否达到预设次数；

结合第二方面，在第二方面的第三种可能的实现方式中，所述参数组选取模块具体包括：

第一选取单元，用于对于每一个参数种群，从所述参数种群中选取拟合程度最高的参数组；

第二选取单元，用于从选取出的所有参数组中，选取拟合程度最高的参数组作为所述目标轨迹模型的参数组。

结合第二方面，在第二方面的第四种可能的实现方式中，所述目标轨迹模型为

其中，

实施本发明实施例，具有如下有益效果：

本发明实施例提供的控制机械臂运动的装置，通过不断迭代更新参数种群，使得利用参数种群的参数组建立目标轨迹模型收敛趋向于目标轨迹训练集构建的曲线，确保建模的准确性，以及建模完成后，只需要根据用户输入的机械臂的状态参数，即可从目标轨迹模型中获取得到控制机械臂工作的控制参数，直接控制机械臂工作，能够配合种动态控制机械臂的工作，方便对运动轨迹的修改以及预测。

以及，本发明实施例提供一种存储介质，其中存储有多条指令，所述指令被处理器执行时实现上述任一实施例提供的控制机械臂运动的方法。

另外，本发明实施例提供一种终端设备，包括存储介质、处理器及存储在所述存储介质上并可在所述处理器上运行的多条指令，其中，所述处理器执行所述指令时实现上述任一实施例提供的控制机械臂运动的方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

一种控制机械臂运动的方法，其特征在于，包括：

获取所述机械臂运动的目标轨迹训练集；所述目标轨迹训练集中的每一个元素包括所述机械臂运动的状态参数和与所述状态参数对应的控制所述机械臂运动的控制参数；

对目标轨迹模型的参数种群进行初始化以及迭代更新，并依次将参数种群中的参数组作为所述目标轨迹模型的参数组，计算每一个目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合成的曲线之间的拟合程度；

根据每一个参数组对应的拟合程度，选取一个参数组作为所述目标轨迹模型的参数组；

当接收到当前所述机械臂运动的状态参数时，将获取到的状态参数输入所述目标轨迹模型中，获得当前控制所述机械臂运动的控制参数，并根据所获得的控制参数控制所述机械臂运动。
如权利要求1所述的控制机械臂运动的方法，其特征在于，所述对目标轨迹模型的参数种群进行初始化以及迭代更新，并依次将参数种群中的参数组作为所述目标轨迹模型的参数组，计算每一个目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合成的曲线之间的拟合程度，具体为：

初始化设置所述目标轨迹模型的参数种群中的每一个参数组的数值；

对于所述参数种群中的每一个参数组，将所述参数组作为所述目标轨迹模型的参数组，并计算所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度；

根据所述参数种群的每一个参数组对应的拟合程度，从所述参数种群中选取两个参数组；

以分别在所选取出的两个参数组中的同一含义的两个参数值进行交叉互换的原则，获取新的参数组，直至生成参数组的数量与所述参数种群的参数组的数量相同；

以新生成的所有参数组更新替代所述参数种群，并对迭代次数加一；

判断所述迭代次数是否达到预设次数；

若否，返回继续计算更新后的参数种群的每一个参数组对应的拟合程度，直至迭代次数达到所述预设次数。
如权利要求2所述的控制机械臂运动的方法，其特征在于，在作为所述目标轨迹模型的参数组为所述参数种群中的第j个参数组p_j时，所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度为：

其中，x_i为所述目标轨迹训练集中的第i个状态参数；y_i为所述目标轨迹训练集中的第i个状态参数对应的控制参数；f(x_i，p_j)为以所述第j个参数组为所述目标轨迹模型的参数组时，所述第i个状态参数在所述目标轨迹模型中对应的控制参数。
如权利要求1所述的控制机械臂运动的方法，其特征在于，所述根据每一个参数组对应的拟合程度，选取一个参数组作为所述目标轨迹模型的参数组，具体为：

对于每一个参数种群，从所述参数种群中选取拟合程度最高的参数组；

从选取出的所有参数组中，选取拟合程度最高的参数组作为所述目标轨迹模型的参数组。
如权利要求1所述的控制机械臂运动的方法，其特征在于，所述目标轨迹模型为
其中，

为第i个高斯核函数；w_i为第i个高斯核函数占的权重系数，i≤N；其中，c_i为所述第i个高斯核函数的中心值；σ_i为所述第i个高斯核函数的宽度。
一种控制机械臂运动的装置，其特征在于，包括：

训练集获取模块，用于获取所述机械臂运动的目标轨迹训练集；所述目标轨迹训练集中的每一个元素包括所述机械臂运动的状态参数和与所述状态参数对应的控制所述机械臂运动的控制参数；

种群迭代计算模块，用于对目标轨迹模型的参数种群进行初始化以及迭代更新，并依次将参数种群中的参数组作为所述目标轨迹模型的参数组，计算每一个目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合成的曲线之间的拟合程度；

参数组选取模块，用于根据每一个参数组对应的拟合程度，选取一个参数组作为所述目标轨迹模型的参数组；

机械运动控制模块，用于当接收到当前所述机械臂运动的状态参数时，将获取到的状态参数输入所述目标轨迹模型中，获得当前控制所述机械臂运动的控制参数，并根据所获得的控制参数控制所述机械臂运动。
如权利要求6所述的控制机械臂运动的装置，其特征在于，所述种群迭代计算模块，具体包括：

初始化单元，用于初始化设置所述目标轨迹模型的参数种群中的每一个参数组的数值；

拟合程度计算单元，用于对于所述参数种群中的每一个参数组，将所述参数组作为所述目标轨迹模型的参数组，并计算所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度；

参数组选取单元，用于根据所述参数种群的每一个参数组对应的拟合程度，从所述参数种群中选取两个参数组；

新参数组生成单元，用于以分别在所选取出的两个参数组中的同一含义的两个参数值进行交叉互换的原则，获取新的参数组，直至生成参数组的数量与所述参数种群的参数组的数量相同；

更新替代单元，用于以新生成的所有参数组更新替代所述参数种群，并对迭代次数加一；

判断迭代单元，用于判断所述迭代次数是否达到预设次数；

拟合程度计算单元，还用于当所述迭代次数没有达到预设次数时，返回继续计算更新后的参数种群的每一个参数组对应的拟合程度，直至迭代次数达到所述预设次数。
如权利要求7所述的控制机械臂运动的装置，其特征在于，在作为所述目标轨迹模型的参数组为所述参数种群中的第j个参数组p_j时，所述目标轨迹模型拟合成的曲线与所述目标轨迹训练集组合的曲线之间的拟合程度为：

其中，x_i为所述目标轨迹训练集中的第i个状态参数；y_i为所述目标轨迹训练集中的第i个状态参数对应的控制参数；f(x_i，p_j)为以所述第j个参数组为所述目标轨迹模型的参数组时，所述第i个状态参数在所述目标轨迹模型中对应的控制参数。
一种存储介质，其中存储有多条指令，其特征在于，所述指令被处理器执行时实现如权利要求1至5任一项所述的控制机械臂运动的方法。
一种终端设备，其特征在于，包括存储介质、处理器及存储在所述存储介质上并可在所述处理器上运行的多条指令，其中，所述处理器执行所述指令时实现如权利要求1至5任一项所述的控制机械臂运动的方法。