CN116408804A

CN116408804A - 一种基于门控循环单元的轴孔装配插孔方法

Info

Publication number: CN116408804A
Application number: CN202310542545.4A
Authority: CN
Inventors: 吴俊�; 申志飞; 朱秋国; 文宣璋; 梁世豪
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2023-05-15
Filing date: 2023-05-15
Publication date: 2023-07-11

Abstract

本发明公开了一种基于门控循环单元的轴孔装配插孔方法。该方法基于门控循环网络来对轴孔装配过程中的带有时序信息的动态接触力进行分类预测，结合基于速度的导纳控制，实现底座处于不确定姿态下的轴孔装配插孔任务。不同的接触状态主要分为八类，分别位于笛卡尔坐标系的坐标轴上和坐标轴之间，每一类的接触状态的变化过程为轴与孔存在一定倾角姿态差到轴顺利入孔的过程。基于门控循环单元方法，能够快速实现对八类不同的动态接触力序列的接触状态识别。本发明可以实现底座处于不确定姿态下的轴孔装配任务，带有时序信息的动态接触力可以提高接触状态识别的准确性，并且基于数据驱动的方法可以使其快速迁移到其他轴孔装配平台。

Description

一种基于门控循环单元的轴孔装配插孔方法

技术领域

本发明属于机器人技术领域，涉及一种基于门控循环单元的轴孔装配插孔方法。

技术背景

近几年，工业机器人技术得到快速发展，在制造业的装配作业中得到了广泛地应用，比如航空部件的装配、汽车零件的装配、以及3C零件的装配。在工业机器人的装配作业中，轴孔装配作为零件装配中的典型任务，约占总装配任务的40％。

因此，开展轴孔装配研究对于发展机器人装配技术具有重要实际应用价值。但是，由于轴孔装配任务接触复杂，采用传统的经典控制方法需要大量时间进行繁琐的参数调整，并且更换新的任务场景后，需要重新调整参数，无法适应新环境。近些年，机器学习和深度学习研究得到了快速发展，已经有许多学者将深度学习和强化学习等算法引入工业机器人的轴孔装配任务中，实现机器人的自动化装配。例如专利“基于深度强化学习实现机器人方形零件装配的方法”，专利号CN201910858957.2中，王永青等人利用深度强化学习方法实现了机器人的方形零件装配；专利“一种利用深度强化学习实现机器人多轴孔装配的方法”，专利号CN201711420089.7中，徐静等人利用普通经验数据和深度强化学习方法获取的专家经验数据，结合模糊控制实现机器人的多轴孔装配。

这些方法都是基于深度强化学习的方法开展轴孔装配的，存在训练时间长，Sim2real复杂并且耗时等问题。因此，本文将结合一种基于门控循环单元的深度学习方法和基于速度的导纳控制方法，实现底座处于不确定姿态下的轴孔装配插孔任务。

发明内容

本发明的目的在于针对现有技术的不足，本发明要解决的技术问题是针对上述技术的不足，提供一种基于门控循环单元的轴孔装配插孔方法，以实现底座处于不确定姿态下的轴孔装配插孔任务。

本发明所采取的技术方案是：一种基于门控循环单元的轴孔装配插孔方法，包括以下步骤：

(1)结合末端六维力传感器和基于速度的导纳控制完成机械臂在末端笛卡尔坐标系的导纳控制；所述末端六维力传感器为型号为MINI45的力与力矩传感器；

(2)在步骤(1)中导纳控制的基础上，采集不同接触状态的末端接触力数据；

(3)对采集到数据进行预处理，使其能够用门控循环单元建立时序分类预测模型；

(4)根据步骤(3)数据处理后得到的数据，基于门控循环单元建立接触力的时序分类预测模型；

(5)结合基于速度的导纳控制，将训练得到的模型应用到不确定姿态下的轴孔装配插孔任务中，最终完成轴孔装配插孔任务。

进一步地，所述步骤(1)中基于速度的导纳控制的离散控制率如下公式所示：

其中，k＝0,1,...,n为对时间离散后的各个离散时刻，T为离散时间间隔，

分别为第k时刻和第k-1时刻期望的速度，/>

为第k时刻期望的力，V^k,V^k-1分别为第k时刻和第k-1时刻末端实际的速度，F^k为第k时刻末端实际的力，M_d,B_d为期望的质量矩阵和阻尼矩阵；公式中除了时间间隔T，其余各个变量均是六维的向量或矩阵。

进一步地，所述步骤(1)中基于速度的导纳控制具体包括如下子步骤：

(1.1)通过六维力传感器测得力传感器下的末端六维接触力，然后通过重力补偿消除力传感器的末端重力对力传感器读数的影响，通过坐标变换，将力传感器下的末端六维接触力转换到末端笛卡尔坐标系下，得到末端笛卡尔坐标系下的六维接触力F；

(1.2)给定期望的质量矩阵M_d和阻尼矩阵B_d，以及末端期望的接触力F_d，末端期望的速度V_d，通过导纳控制结算，可以求得末端实际的速度V；

(1.3)将末端实际的速度V通过机械臂末端速度的控制接口发送给机械臂的工具中心点TCP，实现机械臂在末端笛卡尔坐标系的导纳控制。

进一步地，所述步骤(2)具体为：

所述接触状态一共分为八类，分别位于笛卡尔坐标系的坐标轴上和坐标轴之间，每一类的接触状态变化过程均相同，用α表示轴的轴线与孔的轴线之间的夹角，每一类的接触状态的变化过程为轴与孔存在θ姿态差到轴顺利入孔，即α＝θ到α＝0°的过程；采集每一类接触状态变化过程中的一系列时间上连续变化的离散接触力训练数据

其中，i＝1,2,...,8分别表示八类不同的接触状态，k＝0,1,2,...,n为每一类接触状态变化过程中的各个离散时刻，下标6表示/>

是六维向量；每一类的导纳控制设定值F_id为：

第1类：F_1d＝[0 0 f_zd 0 t_yd 0]；

第2类：F_2d＝[0 0 f_zd -t_xd 0 0]；

第3类：F_3d＝[0 0 f_zd 0 -t_yd 0]；

第4类：F_4d＝[0 0 f_zd t_xd 0 0]；

第5类：F_5d＝[0 0 f_zd -t_xd t_yd 0]；

第6类：F_6d＝[0 0 f_zd -t_xd -t_yd 0]；

第7类：F_7d＝[0 0 f_zd t_xd -t_yd 0]；

第8类：F_8d＝[0 0f_zd t_xd t_yd 0]；

其中，f_zd为笛卡尔坐标系下z轴期望的接触力，t_xd,t_yd分别为笛卡尔坐标系下x轴和y轴期望的接触力矩；其他的导纳控制参数均相同，V_d＝[0 0 0 0 0 0]，M_d,B_d根据实际需要合理设置。

进一步地，所述步骤(3)具体为：每一类接触力时间序列共有n个接触力向量：

由于期望的z接触力f_zd是人为设定的，并且接触过程中t_z变化不大，故删去f_z和t_z；得到处理后的n个接触力向量：

以m(m＜＝n+1)个接触力向量为一组，对n个接触力向量序列进行划分，得到n-m+2组时间上连续，长度为m的接触力向量序列；对每n-m+2组的接触力向量序列打上此类接触状态的标签，若第1类的n-m+2组的接触力向量对应的标签均为1；则其他七类数据均作同样的处理。

进一步地，所述步骤(4)具体包括如下子步骤：

(4.1)将八类不同的接触状态的接触力数据

经过归一化处理作为输入，对应的标签Y_i作为输出；用基于门控循环单元建立接触力的时序分类预测模型去拟合数据

其中，基于门控循环单元建立接触力的时序分类预测模型由多层门控循环单元GRU以及多层感知机MLP构成；门控循环单元和多层感知器的层数根据实验数据进行合理设置，以下神经网络的计算公式仅表示其原理；门控循环单元用以下公式进行计算：

其中，W_xr，W_hr，W_xz，W_hz,W_xh,W_hh是门控循环单元的权重参数，b_r，b_r，b_r是门控循环单元的偏置参数；δ(·)是激活函数，符号⊙是Hadamard积；

(4.2)得到门控循环单元的输出

之后，输入到多层感知机网络，多层感知机用以下公式进行计算：

其中，W_ij，W_jk是多层感知机的权重参数，b_j，b_k是多层感知机的偏置参数；

(4.3)模型输出最后的接触状态分类预测值为

与接触状态分类真实值Y_i作交叉熵定义损失函数，用ω表示基于门控循环单元的时序分类预测模型的神经网络参数，神经网络的损失函数为多分类交叉熵损失函数，其计算公式为：

采用Adam优化器更新神经网络的参数，训练后得到基于门控循环单元的时序分类预测模型。

进一步地，所述步骤(5)具体为：当轴孔稳定接触后，以概率1/8随机选取八类F_id中的一个，使轴孔之间的接触状态发生变化，读取接下来连续时间内长度为m的离散接触力向量序列

然后输入到基于门控循环单元建立接触力的时序分类预测模型中，得到相应的输出标签Y_i，更新F_id；更新规则为Y_i对应F_id，即Y₁对应F_1d，其他七类同理；继续读取接下来连续时间内长度为m的离散接触力向量序列，然后通过基于门控循环单元建立接触力的时序分类预测模型，得到新的输出标签Y_i，继续更新F_id；循环往复，直到完成轴孔装配插孔任务。

本发明有益效果如下：

本发明提供的一种基于门控循环单元的轴孔装配插孔方法，将门控循环单元方法引入轴孔装配的插孔任务中来处理连续时间，不同时间段内的离散接触力序列，结合基于速度的导纳控制，实现底座处于不确定姿态下的轴孔装配插孔任务。带有时序信息的动态接触力可以提高接触轴孔装配插孔阶段接触状态识别的准确性，并且基于数据驱动的方法可以使其快速部署到其他轴孔装配平台，提高了算法的可迁移性。

附图说明

图1为本发明实施例提供的基于速度的导纳控制结构原理图；

图2为本发明实施例提供的数据采集过程中八类不同的接触状态示意图；

图3为本发明实施例提供的数据采集中每一类接触状态变化过程示意图；

图4为本发明实施例提供的数据处理中对第1类接触状态的数据进行处理的过程示意图；

图5为本发明实施例提供的基于门控循环单元的时序分类预测模型训练示意图；

图6为本发明实施例提供的基于门控循环单元的轴孔装配插孔控制结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明中涉及到的末端六维力传感器即为型号为MINI45的力与力矩传感器；

本实施例一种基于门控循环单元的轴孔装配插孔方法，包括以下步骤。

步骤1：结合末端六维力传感器和基于速度的导纳控制实现机械臂在末端笛卡尔坐标系的导纳控制。基于速度的导纳控制的离散控制率如下公式所示。

分别为第k时刻和第k-1时刻期望的速度，/>

为第k时刻期望的力，V^k,V^k-1分别为第k时刻和第k-1时刻末端实际的速度，F^k为第k时刻末端实际的力，M_d,B_d为期望的质量矩阵和阻尼矩阵。公式中除了时间间隔T，其余各个变量均是六维的向量或矩阵。

基于速度的导纳控制对应的整体结构原理图如图1所示。由图1可知，通过六维力传感器测得力传感器下的末端六维接触力，然后通过重力补偿消除力传感器的末端重力对力传感器读数的影响，然后通过坐标变换，将力传感器下的末端六维接触力转换到末端笛卡尔坐标系下，得到末端笛卡尔坐标系下的六维接触力F。给定期望的质量矩阵M_d和阻尼矩阵B_d，以及末端期望的接触力F_d，末端期望的速度V_d，通过导纳控制结算，可以求得末端实际的速度V。将末端实际的速度V通过机械臂末端速度的控制接口发送给机械臂的工具中心点(Tool Central Point，TCP)，实现机械臂在末端笛卡尔坐标系的导纳控制。

步骤2：在步骤1中导纳控制的基础上，采集不同接触状态的末端接触力数据。如图2所示，接触状态一共分为八类，分别位于笛卡尔坐标系的坐标轴上和坐标轴之间。如图3所示，每一类的接触状态变化过程均相同。其中，α表示轴的轴线与孔的轴线之间的夹角。每一类的接触状态的变化过程为轴与孔存在θ姿态差(α＝θ)到轴顺利入孔(α＝0°)的过程。采集每一类接触状态变化过程中的一系列时间上连续变化的离散接触力数据

是六维向量。每一类的导纳控制设定值F_id为：

第1类：F_1d＝[0 0 f_zd 0 t_yd 0]；

第2类：F_2d＝[0 0 f_zd -t_xd 0 0]；

第3类：F_3d＝[0 0 f_zd 0 -t_yd 0]；

第4类：F_4d＝[0 0 f_zd t_xd 0 0]；

第5类：F_5d＝[0 0 f_zd -t_xd t_yd 0]；

第6类：F_6d＝[0 0 f_zd -t_xd -t_yd 0]；

第7类：F_7d＝[0 0 f_zd t_xd -t_yd 0]；

第8类：F_8d＝[0 0 f_zd t_xd t_yd 0]。

其中，f_zd为笛卡尔坐标系下z轴期望的接触力，t_xd,t_yd分别为笛卡尔坐标系下x轴和y轴期望的接触力矩。其他的导纳控制参数均相同，V_d＝[0 0 0 0 0 0]，M_d,B_d根据实际需要合理设置。

步骤3：对采集到数据进行预处理，使其能够用门控循环单元建立时序分类预测模型。步骤2中采集得到八类不同的时间上连续变化的离散接触力数据

先对每一类接触力数据做处理。每一类接触力时间序列共有n个接触力向量

其中，

分别表示第i类接触状态k时刻力传感器的六维接触力。

由于期望的z接触力f_zd是人为设定的，并且接触过程中t_z变化不大，故删去f_z和t_z。得到处理后的n个接触力向量

以m(m＜＝n+1)个接触力向量为一组，对n个接触力向量序列进行划分，得到n-m+2组时间上连续，长度为m的接触力向量序列。对每n-m+2组的接触力向量序列打上此类接触状态的标签，例如，第1类的n-m+2组的接触力向量对应的标签均为1。图4是对第1类数据的处理过程，其他七类数据均作同样的处理。

步骤4：根据第3步数据处理后得到的数据，基于门控循环单元建立接触力的时序分类预测模型。时序分类预测模型的训练过程如图5所示。将八类不同的接触状态的接触力数据X_it经过归一化处理作为输入，对应的标签Y_i作为输出。用基于门控循环单元建立接触力的时序分类预测模型去拟合数据(X_it，Y_i)。其中，基于门控循环单元建立接触力的时序分类预测模型由多层门控循环单元(Gate Recurrent Unit,GRU)以及多层感知机(MultiLayer Perceptron，MLP)构成。门控循环单元和多层感知器的层数根据实验数据进行合理设置，以下神经网络的计算公式仅表示其原理。门控循环单元用以下公式进行计算

其中，W_xr，W_hr，W_xz，W_hz,W_xh,W_hh是门控循环单元的权重参数，b_r，b_r，b_r是门控循环单元的偏置参数。δ(·)是激活函数，符号⊙是Hadamard积。

得到门控循环单元的输出

其中，W_ij，W_jk是多层感知机的权重参数，b_j，b_k是多层感知机的偏置参数。

如图5所示，模型输出最后的接触状态分类预测值为

与接触状态分类真实值Y_i作交叉熵定义损失函数，用ω表示基于门控循环单元的时序分类预测模型的神经网络参数，神经网络的损失函数为多分类交叉熵损失函数，其计算公式为

步骤5：结合基于速度的导纳控制，将训练得到的模型应用到不确定姿态下的轴孔装配插孔任务中。实验初始条件为：轴孔装配任务已完成了搜孔任务，即轴孔之间已经不存在位置误差，底座处于随机倾角，轴孔稳定接触，轴孔存在不确定的姿态误差。整体控制结构框图，如图6所示，主要包括上层的规划部分和下层的导纳控制部分。轴孔稳定接触后，以概率1/8随机选取八类F_id中的一个，使轴孔之间的接触状态发生变化，读取接下来连续时间内长度为m的离散接触力向量序列

然后输入到基于门控循环单元建立接触力的时序分类预测模型中，得到相应的输出标签Y_i，更新F_id。更新规则为Y_i对应F_id，即Y₁对应F_1d，其他七类同理。继续读取接下来连续时间内长度为m的离散接触力向量序列，然后通过基于门控循环单元建立接触力的时序分类预测模型，得到新的输出标签Y_i，继续更新F_id。循环往复，直到完成轴孔装配插孔任务。

上述实施例仅示例性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。