CN111241747A

CN111241747A - 机械臂逆运动学求解方法、系统、计算机设备及存储介质

Info

Publication number: CN111241747A
Application number: CN202010030079.8A
Authority: CN
Inventors: 周恒旭; 何志敏
Original assignee: Foshan University
Current assignee: Foshan University
Priority date: 2020-01-13
Filing date: 2020-01-13
Publication date: 2020-06-05
Anticipated expiration: 2040-01-13
Also published as: CN111241747B

Abstract

本发明公开了一种机械臂逆运动学求解方法、系统、计算机设备及存储介质，所述方法包括：建立机械臂的D‑H模型；对机械臂的D‑H模型进行工作空间的分析；根据分析结果，记录相应的分析数据，形成数据集；利用数据集对长短期记忆网络进行训练；利用训练好的长短期记忆网络模型对给定路径信息进行关节空间的映射，得到给定路径信息对应的关节信息。本发明避免了传统求解方法复杂操作过程，只需将包含末端姿态的路径信息输入到训练好的长短期记忆网络模型进行预测，即可得到与之对应关节信息，并且神经网络具有传播速度快的特点，因此机械臂的逆运动求解速度较传统的几何法，代数法、数值法等方法快。

Description

机械臂逆运动学求解方法、系统、计算机设备及存储介质

技术领域

本发明涉及一种机械臂逆运动学求解方法、系统、计算机设备及存储介质，属于机器人自动化领域。

背景技术

工业机械臂当代机电一体化程度最高的设备，而逆运动学的求解是机器人领域中的重要问题之一，它关系着机器人的其他任务的进行。求解机械臂型机器人的逆运动学解有多种方法，常见有几何法，代数法和数值法。几何法和代数法可以求得解析解，可将其带入解析函数求得正确的相应变量，因此，解析解也被称为闭式解。求解闭式解一般比数值解快，且容易区分可能的解，但闭式解的缺点是不通用，对求解的机械臂有限制，且需满足Pieper准则才能具有逆运动学闭式解，绝大多数机械臂构型为了扩大末端姿态调整范围，是不满足Pieper准则的。常见的数值解方法有延拓法、迭代法和消元法，对于数值解方法，它不依赖于特定形式的运动学结构，但求解速度慢，函数构造复杂。

根据以上所述，一方面求解机械臂的逆运动学方法传统上主要是改进各种迭代法和消元法，但依然存在求解过程复杂、操作繁琐、求解角度精度不佳和耗时过多等缺点；另一方面，深度学习作为一种计算机通过读取和学习海量数据并从这些数据自行找到某些规律的技术，且然仍保持足够的准确度，以深度学习为代表的人工智能在应用领域正在快速扩张，如人脸识别、语音检索、围棋机器人和自动驾驶等，但深度学习在求解机械臂的逆运动学这一领域上并不算广泛。

发明内容

有鉴于此，本发明提供了一种机械臂逆运动学求解方法、系统、计算机设备及存储介质，其避免了传统求解方法复杂操作过程，只需将包含末端姿态的路径信息输入到训练好的长短期记忆网络模型进行预测，即可得到与之对应关节信息，并且神经网络具有传播速度快的特点，因此机械臂的逆运动求解速度较传统的几何法，代数法、数值法等方法快。

本发明的第一个目的在于提供一种机械臂逆运动学求解方法。

本发明的第二个目的在于提供一种机械臂逆运动学求解系统。

本发明的第三个目的在于提供一种计算机设备。

本发明的第四个目的在于提供一种存储介质。

本发明的第一个目的可以通过采取如下技术方案达到：

一种机械臂逆运动学求解方法，所述方法包括：

建立机械臂的D-H模型；

对机械臂的D-H模型进行工作空间的分析；

根据分析结果，记录相应的分析数据，形成数据集；

利用数据集对长短期记忆网络进行训练；

利用训练好的长短期记忆网络模型对给定路径信息进行关节空间的映射，得到给定路径信息对应的关节信息。

进一步的，所述对机械臂的D-H模型进行工作空间的分析，具体包括：

设置关节限制角度，使用蒙特卡罗法，产生机械臂的D-H模型各关节的随机变量；

根据各关节的随机变量，使用ikine函数进行求解，得到多组随机采样点的各关节值对应的末端值。

进一步的，所述利用数据集对长短期记忆网络进行训练，具体包括：

将数据集的一部分划分为训练集，一部分划分为验证集；

将训练集输入长短期记忆网络进行训练，得到初始长短期记忆网络模型；

利用验证集对初始长短期记忆网络模型进行评估验证；

判断验证结果是否达到预设要求，若是，将初始长短期记忆网络模型作为训练后的长短期记忆网络模型，若否，则对初始长短期记忆网络模型参数进行调整，继续对参数调整后的长短期记忆网络模型进行训练，直到验证结果达到预设要求，将此时得到的长短期记忆网络模型作为训练好的长短期记忆网络模型。

进一步的，所述验证结果为均方误差；

判断验证结果是否达到预设要求，具体为：判断均方误差的值是否达到预设值。

进一步的，所述将训练集输入长短期记忆网络进行训练的训练参数设置为：BATCH_SIZE为30；隐含层单元CELL_SIZE为10；学习率LR为0.006。

进一步的，所述根据分析结果，记录相应的分析数据，形成数据集之后，还包括：

对数据集中的数据进行预处理。

本发明的第二个目的可以通过采取如下技术方案达到：

一种机械臂逆运动学求解系统，所述系统包括：

建立模块，用于建立机械臂的D-H模型；

分析模块，用于对机械臂的D-H模型进行工作空间的分析；

记录模块，用于根据分析结果，记录相应的分析数据，形成数据集；

训练模块，用于利用数据集对长短期记忆网络进行训练；

预测模块，用于利用训练好的长短期记忆网络模型对给定路径信息进行关节空间的映射，得到给定路径信息对应的关节信息。

进一步的，所述记录模块之后，还包括：

预处理模块，用于对数据集中的数据进行预处理。

本发明的第三个目的可以通过采取如下技术方案达到：

一种计算机设备，包括处理器以及用于存储处理器可执行程序的存储器，所述处理器执行存储器存储的程序时，实现上述的机械臂逆运动学求解方法。

本发明的第四个目的可以通过采取如下技术方案达到：

一种存储介质，存储有程序，所述程序被处理器执行时，实现上述的机械臂逆运动学求解方法。

本发明相对于现有技术具有如下的有益效果：

1、本发明基于长短期记忆网络实现，首先建立机械臂的D-H模型，然后对机械臂的D-H模型进行工作空间的分析，形成数据集，利用数据集对长短期记忆网络进行训练，避免了传统求解方法复杂操作过程，只需将包含末端姿态的路径信息输入到训练好的长短期记忆网络模型进行预测，即可得到与之对应关节信息；同时，神经网络具有传播速度快的特点，因此使得机械臂的逆运动求解速度较传统的几何法，代数法和数值法等方法快。

2、本发明训练集由于采用的蒙特卡罗的方法在整个机械臂的有效工作空间中进行大量密集的随机采样，故训练出来的长短期记忆网络模型鲁棒性极强，另外长短期记忆网络能记忆很长各个末端信息并能联想之前拟合过的关节信息，若面对路径信息中存在的缺失的片段或者某些噪声值，其求解结果也不能出现较大的偏差，与本发明相比，传统的方法在面对包含缺失或噪声的路径信息时，就会出现严重的偏差。

3、本发明通过设置长短期记忆网络的训练参数，经过训练可获得误差极小的逆运动学求解结果，能适用于一些工业领域，如抓取，码垛和喷漆等。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1为本发明实施例1的机械臂逆运动学求解方法的流程图。

图2为本发明实施例1的机械臂的D-H模型的可视化示意图。

图3为本发明实施例1的对机械臂的D-H模型进行工作空间的分析的流程图。

图4为本发明实施例1的机械臂的D-H模型的工作空间可视化示意图。

图5为本发明实施例1的长短期记忆区块的示意图。

图6为本发明实施例1的长短期记忆网络的计算图。

图7为本发明实施例1的利用数据集对长短期记忆网络进行训练的流程图。

图8为本发明实施例1的第一个关节在测试集上的预测图。

图9为本发明实施例1的机械臂末端的路径轨迹的示意图。

图10为本发明实施例2的机械臂逆运动学求解系统的结构框图。

图11为本发明实施例2的分析模块的结构框图。

图12为本发明实施例2的训练模块的结构框图。

图13为本发明实施例3的计算机设备的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1：

深度学习是一种模拟人脑神经元连接而开发的系统，理论上，在训练好的网络上经过一次传播即可得到相关的映射结果，且结果精度足够高。利用神经网络技术求解机械臂的逆运动学本质是对机械臂工作空间中的笛卡尔坐标系与关节空间坐标系之间的映射，同时也是同种坐标系下时序值之间的拟合。

在深度学习中的有监督学习领域里，主流的网络是卷积神经网络(ConvolutionalNeuralNetwork，简称CNN)与循环神经网络(RecurrentNeuralNetwork，简称RNN)。卷积神经网络主要用于图像领域的分类等任务，而循环神经网络主要用于自然语言处理方面。循环神经网络和卷积神经网络最大的不同就在于循环神经网络能够实现特定的记忆存储功能，是进行时间序列分析时最好的选择。循环神经网络实现了类似于人脑能够凭借过往的记忆去认识这个世界这一机制，对所处理过的信息留存有一定的记忆，而不像其他类型的神经网络并不能对处理过的信息留存记忆，这种特性在时序预测的至关重要，因为时序信息只跟前后内容相关。另一方面，对于机械臂，其运动过程也是一种时序过程，且前后每一个关节的空间变化是存在相关的，并非孤立。故利用循环神经网络进行机械臂的笛卡尔坐标系与关节空间坐标系的映射和对应数值拟合预测是可行的。但是由于循环神经网络也有梯度消失的问题，因此很难处理长序列的数据。长短期记忆(LongShort-TermMemory，简称LSTM)网络是一种时间循环神经网络，是为了解决一般的循环神经网络存在的问题而专门设计出来的。

因此，本实施例基于长短期记忆网络实现了机械臂逆运动学求解方法，如图1所示，该方法包括以下步骤：

S101、建立机械臂的D-H模型。

本实施例的机械臂为串联型的机械臂，以库卡的KR5机械臂为例，其D-H参数如表1所示。

表1 KR5机械臂的D-H参数表

结合表1，配合MATLAB与roboticstoolbox(机器人学工具箱)对KR5机械臂进行建模，其可视化如图2所示。

S102、对机械臂的D-H模型进行工作空间的分析。

进一步地，该步骤102如图3所示，具体包括：

S1021、设置关节限制角度，使用蒙特卡罗法，产生机械臂的D-H模型各关节的随机变量。

S1022、根据各关节的随机变量，使用ikine函数进行求解，得到多组随机采样点的各关节值对应的末端值。

本实施例的蒙特卡罗随机采样点为30000组，将KR5机械臂的D-H模型工作空间可视化，如图4所示，结合表1，KR5机械臂共有六个关节值，对应的末端值共有十二个。

S103、根据分析结果，记录相应的分析数据，形成数据集。

具体地，将随机采样点30000组的六个关节值和对应求解出的十二个末端值记录下来，以.csv格式保存，得到18维30000组数据的数据集，这十二个末端值是由一个3×3的旋转矩阵和3×1的平移矩阵展开得来。

S104、对数据集中的数据进行预处理。

具体地，对数据集中的数据进行标准化处理，将数据变换到均值为0，标准差为1范围内，标准化是为了避免某个维度的特征重要程度过大或过小，使得数据集里的异常点影响降低。

S105、利用数据集对长短期记忆网络进行训练。

在时序预测和数据拟合方面，长短期记忆网络已经成为主流的方法之一。长短期记忆网络是一种含有长短期记忆区块或其他的一种类神经网络，是一种循环神经网络的变种。长短期记忆区块如图5所示，引入了三个门输入门、遗忘门和输出门，以及与隐藏信息状态形状相同的记忆细胞，从而记录额外的信息。其中，同时为控制参数，决定着信息的保留或遗忘，是一种门，决定着信息通过的方式，使用Sigmoid函数实现该功能的计算。多个长短期记忆区块的连接再配合一些隐含层和全连接层即可组成长短期记忆网络。

长短期记忆网络的优势主要体现在以下几个方面：1)长短期记忆区块通过拷贝自身状态的真实值和累积的外部信号，比循环神经网络拥有更加有效的记忆；2)长短期记忆区块内部使用累计形式技术，且一个长短期记忆区块是由另一个长短期记忆区块决定着何时清除记忆内容，避免了循环神经网络存在的梯度消失问题。

本实施例设计长短期记忆网络结构，基于TensorFlow框架和python语言，使用TensorBoard可视化工具对长短期记忆网络进行可视化，其计算图如图6所示。

进一步地，该步骤105如图7所示，具体包括：

S1051、将数据集的一部分划分为训练集，一部分划分为验证集。

本实施例利用步骤S103获得18维30000组数据的数据集，数据集前20000组划分为训练集，5000组划分为验证集，5000组划分为测试集，其中测试集不在训练过程中使用，而是在训练结束后测试长短期记忆网络模型的效果。

S1052、将训练集输入长短期记忆网络进行训练，得到初始长短期记忆网络模型。

本实施例的训练参数设置为：BATCH_SIZE为30；隐含层单元CELL_SIZE为10；学习率LR为0.006。

S1053.、利用验证集对初始长短期记忆网络模型进行评估验证。

S1054、判断验证结果是否达到预设要求，若是，将初始长短期记忆网络模型作为训练后的长短期记忆网络模型，若否，则对初始长短期记忆网络模型参数进行调整，继续对参数调整后的长短期记忆网络模型进行训练，直到验证结果达到预设要求，将此时得到的长短期记忆网络模型作为训练好的长短期记忆网络模型。

本实施例得到的验证结果均方误差，预设要求为预设值，该预设值为0.0007，在经过1000次训练后，均方误差的值为0.0007左右，即验证结果达到预设要求，此时可结束训练，长短期记忆网络模型已经训练好。

使用测试集对训练好的长短期记忆网络模型进行测试，以第一个关节为例，其测试预测效果如图8所示，图中蓝虚线为长短期记忆网络模型预测的值，红线为实际值，纵坐标表示关节值，横坐标表示5000组测试集的前40组。

S106、利用训练好的长短期记忆网络模型对给定路径信息进行关节空间的映射，得到给定路径信息对应的关节信息。

本实施例将测试训练好的长短期记忆网络模型在仿真环境中使用的效果，给定一条具体的路径信息L＝[n₁,…,n_t],其中n＝[r_x,r_y,r_z,t_x,t_y,t_z,b_x,b_y,b_z,p_x,p_y,p_z]，将其训练好的长短期记忆网络模型进行预测，获得对应路径信息的关节信息θ_l＝[θ₁,θ₂,θ₃,θ₄,θ₅,θ₆]。利用θ_l输入到fkine()函数里即可获得KR5机械臂末端的姿态，连续的末端姿态的组合即为路径轨迹，如图9所示。

本领域技术人员可以理解，实现上述实施例的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成，相应的程序可以存储于计算机可读存储介质中。

应当注意，尽管在附图中以特定顺序描述了上述实施例的方法操作，但是这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。相反，描绘的步骤可以改变执行顺序。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

实施例2：

如图10所示，本实施例提供了一种机械臂逆运动学求解系统，该系统包括建立模块1001、分析模块1002、记录模块1003、预处理模块1004、训练模块1005和预测模块1006，各个模块的具体功能如下：

所述建立模块1001，用于建立机械臂的D-H模型。

所述分析模块1002，用于对机械臂的D-H模型进行工作空间的分析。

所述记录模块1003，用于根据分析结果，记录相应的分析数据，形成数据集。

所述预处理模块1004，用于对数据集中的数据进行预处理。

所述训练模块1005，用于利用数据集对长短期记忆网络进行训练。

所述预测模块1006，用于利用训练好的长短期记忆网络模型对给定路径信息进行关节空间的映射，得到给定路径信息对应的关节信息。

进一步地，所述分析模块1002如图11所示，具体包括：

随机变量产生单元10021，用于设置关节限制角度，使用蒙特卡罗法，产生机械臂的D-H模型各关节的随机变量。

求解单元10022，用于根据各关节的随机变量，使用ikine函数进行求解，得到多组随机采样点的各关节值对应的末端值。

进一步地，所述训练模块1005如图12所示，具体包括：

划分单元10051，用于将数据集的一部分划分为训练集，一部分划分为验证集。

训练单元10052，用于将训练集输入长短期记忆网络进行训练，得到初始长短期记忆网络模型。

验证单元10053，用于利用验证集对初始长短期记忆网络模型进行评估验证。

判断单元10054，用于判断验证结果是否达到预设要求，若是，将初始长短期记忆网络模型作为训练后的长短期记忆网络模型，若否，则对初始长短期记忆网络模型参数进行调整，继续对参数调整后的长短期记忆网络模型进行训练，直到验证结果达到预设要求，将此时得到的长短期记忆网络模型作为训练好的长短期记忆网络模型。

本实施例中各个模块的具体实现可以参见上述实施例1，在此不再一一赘述；需要说明的是，本实施例提供的系统仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

实施例3：

本实施例提供了一种计算机设备，该计算机设备可以为计算机，如图13所示，其包括通过系统总线1301连接的处理器1302、存储器、输入装置1303、显示器1304和网络接口1305，该处理器用于提供计算和控制能力，该存储器包括非易失性存储介质1306和内存储器1307，该非易失性存储介质1306存储有操作系统、计算机程序和数据库，该内存储器1307为非易失性存储介质中的操作系统和计算机程序的运行提供环境，处理器1302执行存储器存储的计算机程序时，实现上述实施例1的机械臂逆运动学求解方法，如下：

建立机械臂的D-H模型；

对机械臂的D-H模型进行工作空间的分析；

根据分析结果，记录相应的分析数据，形成数据集；

利用数据集对长短期记忆网络进行训练；

进一步地，所述对机械臂的D-H模型进行工作空间的分析，具体包括：

进一步地，所述利用数据集对长短期记忆网络进行训练，具体包括：

将数据集的一部分划分为训练集，一部分划分为验证集；

利用验证集对初始长短期记忆网络模型进行评估验证；

进一步地，所述验证结果为均方误差；

进一步地，所述根据分析结果，记录相应的分析数据，形成数据集之后，还可包括：

对数据集中的数据进行预处理。

实施例4：

本实施例提供了一种存储介质，该存储介质为计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时，实现上述实施例1的机械臂逆运动学求解方法，如下：

建立机械臂的D-H模型；

对机械臂的D-H模型进行工作空间的分析；

根据分析结果，记录相应的分析数据，形成数据集；

利用数据集对长短期记忆网络进行训练；

将数据集的一部分划分为训练集，一部分划分为验证集；

利用验证集对初始长短期记忆网络模型进行评估验证；

进一步地，所述验证结果为均方误差；

对数据集中的数据进行预处理。

本实施例中所述的存储介质可以是磁盘、光盘、计算机存储器、随机存取存储器(RAM，RandomAccessMemory)、U盘、移动硬盘等介质。

综上所述，本发明基于长短期记忆网络实现，首先建立机械臂的D-H模型，然后对机械臂的D-H模型进行工作空间的分析，形成数据集，利用数据集对长短期记忆网络进行训练，避免了传统求解方法复杂操作过程，只需将包含末端姿态的路径信息输入到训练好的长短期记忆网络模型进行预测，即可得到与之对应关节信息；同时，神经网络具有传播速度快的特点，因此使得机械臂的逆运动求解速度较传统的几何法，代数法和数值法等方法快。

以上所述，仅为本发明专利较佳的实施例，但本发明专利的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明专利所公开的范围内，根据本发明专利的技术方案及其发明构思加以等同替换或改变，都属于本发明专利的保护范围。

Claims

1.一种机械臂逆运动学求解方法，其特征在于，所述方法包括：

建立机械臂的D-H模型；

对机械臂的D-H模型进行工作空间的分析；

根据分析结果，记录相应的分析数据，形成数据集；

利用数据集对长短期记忆网络进行训练；

2.根据权利要求1所述的机械臂逆运动学求解方法，其特征在于，所述对机械臂的D-H模型进行工作空间的分析，具体包括：

3.根据权利要求1所述的机械臂逆运动学求解方法，其特征在于，所述利用数据集对长短期记忆网络进行训练，具体包括：

将数据集的一部分划分为训练集，一部分划分为验证集；

利用验证集对初始长短期记忆网络模型进行评估验证；

4.根据权利要求3所述的机械臂逆运动学求解方法，其特征在于，所述验证结果为均方误差；

5.根据权利要求3所述的机械臂逆运动学求解方法，其特征在于，所述将训练集输入长短期记忆网络进行训练的训练参数设置为：BATCH_SIZE为30；隐含层单元CELL_SIZE为10；学习率LR为0.006。

6.根据权利要求1-5任一项所述的机械臂逆运动学求解方法，其特征在于，所述根据分析结果，记录相应的分析数据，形成数据集之后，还包括：

对数据集中的数据进行预处理。

7.一种机械臂逆运动学求解系统，其特征在于，所述系统包括：

建立模块，用于建立机械臂的D-H模型；

分析模块，用于对机械臂的D-H模型进行工作空间的分析；

训练模块，用于利用数据集对长短期记忆网络进行训练；

8.根据权利要求7所述的机械臂逆运动学求解系统，其特征在于，所述记录模块之后，还包括：

预处理模块，用于对数据集中的数据进行预处理。

9.一种计算机设备，包括处理器以及用于存储处理器可执行程序的存储器，其特征在于，所述处理器执行存储器存储的程序时，实现权利要求1-6任一项所述的机械臂逆运动学求解方法。

10.一种存储介质，存储有程序，其特征在于，所述程序被处理器执行时，实现权利要求1-6任一项所述的机械臂逆运动学求解方法。