CN116408804A - 一种基于门控循环单元的轴孔装配插孔方法 - Google Patents

一种基于门控循环单元的轴孔装配插孔方法 Download PDF

Info

Publication number
CN116408804A
CN116408804A CN202310542545.4A CN202310542545A CN116408804A CN 116408804 A CN116408804 A CN 116408804A CN 202310542545 A CN202310542545 A CN 202310542545A CN 116408804 A CN116408804 A CN 116408804A
Authority
CN
China
Prior art keywords
contact force
contact
shaft hole
gating
circulation unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310542545.4A
Other languages
English (en)
Inventor
吴俊�
申志飞
朱秋国
文宣璋
梁世豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202310542545.4A priority Critical patent/CN116408804A/zh
Publication of CN116408804A publication Critical patent/CN116408804A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • B25J9/1687Assembly, peg and hole, palletising, straight line, weaving pattern movement
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/1633Programme controls characterised by the control loop compliant, force, torque control, e.g. combined with position control
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于门控循环单元的轴孔装配插孔方法。该方法基于门控循环网络来对轴孔装配过程中的带有时序信息的动态接触力进行分类预测,结合基于速度的导纳控制,实现底座处于不确定姿态下的轴孔装配插孔任务。不同的接触状态主要分为八类,分别位于笛卡尔坐标系的坐标轴上和坐标轴之间,每一类的接触状态的变化过程为轴与孔存在一定倾角姿态差到轴顺利入孔的过程。基于门控循环单元方法,能够快速实现对八类不同的动态接触力序列的接触状态识别。本发明可以实现底座处于不确定姿态下的轴孔装配任务,带有时序信息的动态接触力可以提高接触状态识别的准确性,并且基于数据驱动的方法可以使其快速迁移到其他轴孔装配平台。

Description

一种基于门控循环单元的轴孔装配插孔方法
技术领域
本发明属于机器人技术领域,涉及一种基于门控循环单元的轴孔装配插孔方法。
技术背景
近几年,工业机器人技术得到快速发展,在制造业的装配作业中得到了广泛地应用,比如航空部件的装配、汽车零件的装配、以及3C零件的装配。在工业机器人的装配作业中,轴孔装配作为零件装配中的典型任务,约占总装配任务的40%。
因此,开展轴孔装配研究对于发展机器人装配技术具有重要实际应用价值。但是,由于轴孔装配任务接触复杂,采用传统的经典控制方法需要大量时间进行繁琐的参数调整,并且更换新的任务场景后,需要重新调整参数,无法适应新环境。近些年,机器学习和深度学习研究得到了快速发展,已经有许多学者将深度学习和强化学习等算法引入工业机器人的轴孔装配任务中,实现机器人的自动化装配。例如专利“基于深度强化学习实现机器人方形零件装配的方法”,专利号CN201910858957.2中,王永青等人利用深度强化学习方法实现了机器人的方形零件装配;专利“一种利用深度强化学习实现机器人多轴孔装配的方法”,专利号CN201711420089.7中,徐静等人利用普通经验数据和深度强化学习方法获取的专家经验数据,结合模糊控制实现机器人的多轴孔装配。
这些方法都是基于深度强化学习的方法开展轴孔装配的,存在训练时间长,Sim2real复杂并且耗时等问题。因此,本文将结合一种基于门控循环单元的深度学习方法和基于速度的导纳控制方法,实现底座处于不确定姿态下的轴孔装配插孔任务。
发明内容
本发明的目的在于针对现有技术的不足,本发明要解决的技术问题是针对上述技术的不足,提供一种基于门控循环单元的轴孔装配插孔方法,以实现底座处于不确定姿态下的轴孔装配插孔任务。
本发明所采取的技术方案是:一种基于门控循环单元的轴孔装配插孔方法,包括以下步骤:
(1)结合末端六维力传感器和基于速度的导纳控制完成机械臂在末端笛卡尔坐标系的导纳控制;所述末端六维力传感器为型号为MINI45的力与力矩传感器;
(2)在步骤(1)中导纳控制的基础上,采集不同接触状态的末端接触力数据;
(3)对采集到数据进行预处理,使其能够用门控循环单元建立时序分类预测模型;
(4)根据步骤(3)数据处理后得到的数据,基于门控循环单元建立接触力的时序分类预测模型;
(5)结合基于速度的导纳控制,将训练得到的模型应用到不确定姿态下的轴孔装配插孔任务中,最终完成轴孔装配插孔任务。
进一步地,所述步骤(1)中基于速度的导纳控制的离散控制率如下公式所示:
Figure BDA0004228475970000021
其中,k=0,1,...,n为对时间离散后的各个离散时刻,T为离散时间间隔,
Figure BDA0004228475970000022
分别为第k时刻和第k-1时刻期望的速度,/>
Figure BDA0004228475970000023
为第k时刻期望的力,Vk,Vk-1分别为第k时刻和第k-1时刻末端实际的速度,Fk为第k时刻末端实际的力,Md,Bd为期望的质量矩阵和阻尼矩阵;公式中除了时间间隔T,其余各个变量均是六维的向量或矩阵。
进一步地,所述步骤(1)中基于速度的导纳控制具体包括如下子步骤:
(1.1)通过六维力传感器测得力传感器下的末端六维接触力,然后通过重力补偿消除力传感器的末端重力对力传感器读数的影响,通过坐标变换,将力传感器下的末端六维接触力转换到末端笛卡尔坐标系下,得到末端笛卡尔坐标系下的六维接触力F;
(1.2)给定期望的质量矩阵Md和阻尼矩阵Bd,以及末端期望的接触力Fd,末端期望的速度Vd,通过导纳控制结算,可以求得末端实际的速度V;
(1.3)将末端实际的速度V通过机械臂末端速度的控制接口发送给机械臂的工具中心点TCP,实现机械臂在末端笛卡尔坐标系的导纳控制。
进一步地,所述步骤(2)具体为:
所述接触状态一共分为八类,分别位于笛卡尔坐标系的坐标轴上和坐标轴之间,每一类的接触状态变化过程均相同,用α表示轴的轴线与孔的轴线之间的夹角,每一类的接触状态的变化过程为轴与孔存在θ姿态差到轴顺利入孔,即α=θ到α=0°的过程;采集每一类接触状态变化过程中的一系列时间上连续变化的离散接触力训练数据
Figure BDA0004228475970000024
其中,i=1,2,...,8分别表示八类不同的接触状态,k=0,1,2,...,n为每一类接触状态变化过程中的各个离散时刻,下标6表示/>
Figure BDA0004228475970000025
是六维向量;每一类的导纳控制设定值Fid为:
第1类:F1d=[0 0 fzd 0 tyd 0];
第2类:F2d=[0 0 fzd -txd 0 0];
第3类:F3d=[0 0 fzd 0 -tyd 0];
第4类:F4d=[0 0 fzd txd 0 0];
第5类:F5d=[0 0 fzd -txd tyd 0];
第6类:F6d=[0 0 fzd -txd -tyd 0];
第7类:F7d=[0 0 fzd txd -tyd 0];
第8类:F8d=[0 0fzd txd tyd 0];
其中,fzd为笛卡尔坐标系下z轴期望的接触力,txd,tyd分别为笛卡尔坐标系下x轴和y轴期望的接触力矩;其他的导纳控制参数均相同,Vd=[0 0 0 0 0 0],Md,Bd根据实际需要合理设置。
进一步地,所述步骤(3)具体为:每一类接触力时间序列共有n个接触力向量:
Figure BDA0004228475970000031
由于期望的z接触力fzd是人为设定的,并且接触过程中tz变化不大,故删去fz和tz;得到处理后的n个接触力向量:
Figure BDA0004228475970000032
以m(m<=n+1)个接触力向量为一组,对n个接触力向量序列进行划分,得到n-m+2组时间上连续,长度为m的接触力向量序列;对每n-m+2组的接触力向量序列打上此类接触状态的标签,若第1类的n-m+2组的接触力向量对应的标签均为1;则其他七类数据均作同样的处理。
进一步地,所述步骤(4)具体包括如下子步骤:
(4.1)将八类不同的接触状态的接触力数据
Figure BDA0004228475970000034
经过归一化处理作为输入,对应的标签Yi作为输出;用基于门控循环单元建立接触力的时序分类预测模型去拟合数据
Figure BDA0004228475970000035
其中,基于门控循环单元建立接触力的时序分类预测模型由多层门控循环单元GRU以及多层感知机MLP构成;门控循环单元和多层感知器的层数根据实验数据进行合理设置,以下神经网络的计算公式仅表示其原理;门控循环单元用以下公式进行计算:
Figure BDA0004228475970000033
Figure BDA0004228475970000041
Figure BDA0004228475970000042
Figure BDA0004228475970000043
其中,Wxr,Whr,Wxz,Whz,Wxh,Whh是门控循环单元的权重参数,br,br,br是门控循环单元的偏置参数;δ(·)是激活函数,符号⊙是Hadamard积;
(4.2)得到门控循环单元的输出
Figure BDA0004228475970000047
之后,输入到多层感知机网络,多层感知机用以下公式进行计算:
Figure BDA0004228475970000044
其中,Wij,Wjk是多层感知机的权重参数,bj,bk是多层感知机的偏置参数;
(4.3)模型输出最后的接触状态分类预测值为
Figure BDA0004228475970000045
与接触状态分类真实值Yi作交叉熵定义损失函数,用ω表示基于门控循环单元的时序分类预测模型的神经网络参数,神经网络的损失函数为多分类交叉熵损失函数,其计算公式为:
Figure BDA0004228475970000046
采用Adam优化器更新神经网络的参数,训练后得到基于门控循环单元的时序分类预测模型。
进一步地,所述步骤(5)具体为:当轴孔稳定接触后,以概率1/8随机选取八类Fid中的一个,使轴孔之间的接触状态发生变化,读取接下来连续时间内长度为m的离散接触力向量序列
Figure BDA0004228475970000048
然后输入到基于门控循环单元建立接触力的时序分类预测模型中,得到相应的输出标签Yi,更新Fid;更新规则为Yi对应Fid,即Y1对应F1d,其他七类同理;继续读取接下来连续时间内长度为m的离散接触力向量序列,然后通过基于门控循环单元建立接触力的时序分类预测模型,得到新的输出标签Yi,继续更新Fid;循环往复,直到完成轴孔装配插孔任务。
本发明有益效果如下:
本发明提供的一种基于门控循环单元的轴孔装配插孔方法,将门控循环单元方法引入轴孔装配的插孔任务中来处理连续时间,不同时间段内的离散接触力序列,结合基于速度的导纳控制,实现底座处于不确定姿态下的轴孔装配插孔任务。带有时序信息的动态接触力可以提高接触轴孔装配插孔阶段接触状态识别的准确性,并且基于数据驱动的方法可以使其快速部署到其他轴孔装配平台,提高了算法的可迁移性。
附图说明
图1为本发明实施例提供的基于速度的导纳控制结构原理图;
图2为本发明实施例提供的数据采集过程中八类不同的接触状态示意图;
图3为本发明实施例提供的数据采集中每一类接触状态变化过程示意图;
图4为本发明实施例提供的数据处理中对第1类接触状态的数据进行处理的过程示意图;
图5为本发明实施例提供的基于门控循环单元的时序分类预测模型训练示意图;
图6为本发明实施例提供的基于门控循环单元的轴孔装配插孔控制结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明中涉及到的末端六维力传感器即为型号为MINI45的力与力矩传感器;
本实施例一种基于门控循环单元的轴孔装配插孔方法,包括以下步骤。
步骤1:结合末端六维力传感器和基于速度的导纳控制实现机械臂在末端笛卡尔坐标系的导纳控制。基于速度的导纳控制的离散控制率如下公式所示。
Figure BDA0004228475970000051
其中,k=0,1,...,n为对时间离散后的各个离散时刻,T为离散时间间隔,
Figure BDA0004228475970000052
分别为第k时刻和第k-1时刻期望的速度,/>
Figure BDA0004228475970000053
为第k时刻期望的力,Vk,Vk-1分别为第k时刻和第k-1时刻末端实际的速度,Fk为第k时刻末端实际的力,Md,Bd为期望的质量矩阵和阻尼矩阵。公式中除了时间间隔T,其余各个变量均是六维的向量或矩阵。
基于速度的导纳控制对应的整体结构原理图如图1所示。由图1可知,通过六维力传感器测得力传感器下的末端六维接触力,然后通过重力补偿消除力传感器的末端重力对力传感器读数的影响,然后通过坐标变换,将力传感器下的末端六维接触力转换到末端笛卡尔坐标系下,得到末端笛卡尔坐标系下的六维接触力F。给定期望的质量矩阵Md和阻尼矩阵Bd,以及末端期望的接触力Fd,末端期望的速度Vd,通过导纳控制结算,可以求得末端实际的速度V。将末端实际的速度V通过机械臂末端速度的控制接口发送给机械臂的工具中心点(Tool Central Point,TCP),实现机械臂在末端笛卡尔坐标系的导纳控制。
步骤2:在步骤1中导纳控制的基础上,采集不同接触状态的末端接触力数据。如图2所示,接触状态一共分为八类,分别位于笛卡尔坐标系的坐标轴上和坐标轴之间。如图3所示,每一类的接触状态变化过程均相同。其中,α表示轴的轴线与孔的轴线之间的夹角。每一类的接触状态的变化过程为轴与孔存在θ姿态差(α=θ)到轴顺利入孔(α=0°)的过程。采集每一类接触状态变化过程中的一系列时间上连续变化的离散接触力数据
Figure BDA0004228475970000061
其中,i=1,2,...,8分别表示八类不同的接触状态,k=0,1,2,...,n为每一类接触状态变化过程中的各个离散时刻,下标6表示/>
Figure BDA0004228475970000062
是六维向量。每一类的导纳控制设定值Fid为:
第1类:F1d=[0 0 fzd 0 tyd 0];
第2类:F2d=[0 0 fzd -txd 0 0];
第3类:F3d=[0 0 fzd 0 -tyd 0];
第4类:F4d=[0 0 fzd txd 0 0];
第5类:F5d=[0 0 fzd -txd tyd 0];
第6类:F6d=[0 0 fzd -txd -tyd 0];
第7类:F7d=[0 0 fzd txd -tyd 0];
第8类:F8d=[0 0 fzd txd tyd 0]。
其中,fzd为笛卡尔坐标系下z轴期望的接触力,txd,tyd分别为笛卡尔坐标系下x轴和y轴期望的接触力矩。其他的导纳控制参数均相同,Vd=[0 0 0 0 0 0],Md,Bd根据实际需要合理设置。
步骤3:对采集到数据进行预处理,使其能够用门控循环单元建立时序分类预测模型。步骤2中采集得到八类不同的时间上连续变化的离散接触力数据
Figure BDA0004228475970000063
先对每一类接触力数据做处理。每一类接触力时间序列共有n个接触力向量
Figure BDA0004228475970000064
其中,
Figure BDA0004228475970000065
分别表示第i类接触状态k时刻力传感器的六维接触力。
由于期望的z接触力fzd是人为设定的,并且接触过程中tz变化不大,故删去fz和tz。得到处理后的n个接触力向量
Figure BDA0004228475970000071
以m(m<=n+1)个接触力向量为一组,对n个接触力向量序列进行划分,得到n-m+2组时间上连续,长度为m的接触力向量序列。对每n-m+2组的接触力向量序列打上此类接触状态的标签,例如,第1类的n-m+2组的接触力向量对应的标签均为1。图4是对第1类数据的处理过程,其他七类数据均作同样的处理。
步骤4:根据第3步数据处理后得到的数据,基于门控循环单元建立接触力的时序分类预测模型。时序分类预测模型的训练过程如图5所示。将八类不同的接触状态的接触力数据Xit经过归一化处理作为输入,对应的标签Yi作为输出。用基于门控循环单元建立接触力的时序分类预测模型去拟合数据(Xit,Yi)。其中,基于门控循环单元建立接触力的时序分类预测模型由多层门控循环单元(Gate Recurrent Unit,GRU)以及多层感知机(MultiLayer Perceptron,MLP)构成。门控循环单元和多层感知器的层数根据实验数据进行合理设置,以下神经网络的计算公式仅表示其原理。门控循环单元用以下公式进行计算
Figure BDA0004228475970000072
Figure BDA0004228475970000073
Figure BDA0004228475970000074
Figure BDA0004228475970000075
其中,Wxr,Whr,Wxz,Whz,Wxh,Whh是门控循环单元的权重参数,br,br,br是门控循环单元的偏置参数。δ(·)是激活函数,符号⊙是Hadamard积。
得到门控循环单元的输出
Figure BDA0004228475970000078
之后,输入到多层感知机网络,多层感知机用以下公式进行计算:
Figure BDA0004228475970000076
其中,Wij,Wjk是多层感知机的权重参数,bj,bk是多层感知机的偏置参数。
如图5所示,模型输出最后的接触状态分类预测值为
Figure BDA0004228475970000077
与接触状态分类真实值Yi作交叉熵定义损失函数,用ω表示基于门控循环单元的时序分类预测模型的神经网络参数,神经网络的损失函数为多分类交叉熵损失函数,其计算公式为
Figure BDA0004228475970000081
采用Adam优化器更新神经网络的参数,训练后得到基于门控循环单元的时序分类预测模型。
步骤5:结合基于速度的导纳控制,将训练得到的模型应用到不确定姿态下的轴孔装配插孔任务中。实验初始条件为:轴孔装配任务已完成了搜孔任务,即轴孔之间已经不存在位置误差,底座处于随机倾角,轴孔稳定接触,轴孔存在不确定的姿态误差。整体控制结构框图,如图6所示,主要包括上层的规划部分和下层的导纳控制部分。轴孔稳定接触后,以概率1/8随机选取八类Fid中的一个,使轴孔之间的接触状态发生变化,读取接下来连续时间内长度为m的离散接触力向量序列
Figure BDA0004228475970000082
然后输入到基于门控循环单元建立接触力的时序分类预测模型中,得到相应的输出标签Yi,更新Fid。更新规则为Yi对应Fid,即Y1对应F1d,其他七类同理。继续读取接下来连续时间内长度为m的离散接触力向量序列,然后通过基于门控循环单元建立接触力的时序分类预测模型,得到新的输出标签Yi,继续更新Fid。循环往复,直到完成轴孔装配插孔任务。
上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (7)

1.一种基于门控循环单元的轴孔装配插孔方法,其特征在于,包括以下步骤:
(1)结合末端六维力传感器和基于速度的导纳控制完成机械臂在末端笛卡尔坐标系的导纳控制;所述末端六维力传感器为力与力矩传感器;
(2)在步骤(1)中导纳控制的基础上,采集不同接触状态的末端接触力数据;
(3)对采集到数据进行预处理,使其能够用门控循环单元建立时序分类预测模型;
(4)根据步骤(3)数据处理后得到的数据,基于门控循环单元建立接触力的时序分类预测模型;
(5)结合基于速度的导纳控制,将训练得到的模型应用到不确定姿态下的轴孔装配插孔任务中,最终完成轴孔装配插孔任务。
2.根据权利要求1所述的一种基于门控循环单元的轴孔装配插孔方法,其特征在于,
所述步骤(1)中基于速度的导纳控制的离散控制率如下公式所示:
Figure FDA0004228475960000011
其中,k=0,1,...,n为对时间离散后的各个离散时刻,T为离散时间间隔,
Figure FDA0004228475960000012
分别为第k时刻和第k-1时刻期望的速度,/>
Figure FDA0004228475960000013
为第k时刻期望的力,Vk,Vk-1分别为第k时刻和第k-1时刻末端实际的速度,Fk为第k时刻末端实际的力,Md,Bd为期望的质量矩阵和阻尼矩阵;公式中除了时间间隔T,其余各个变量均是六维的向量或矩阵。
3.根据权利要求1所述的一种基于门控循环单元的轴孔装配插孔方法,其特征在于,
所述步骤(1)中基于速度的导纳控制具体包括如下子步骤:
(1.1)通过六维力传感器测得力传感器下的末端六维接触力,然后通过重力补偿消除力传感器的末端重力对力传感器读数的影响,通过坐标变换,将力传感器下的末端六维接触力转换到末端笛卡尔坐标系下,得到末端笛卡尔坐标系下的六维接触力F;
(1.2)给定期望的质量矩阵Md和阻尼矩阵Bd,以及末端期望的接触力Fd,末端期望的速度Vd,通过导纳控制结算,可以求得末端实际的速度V;
(1.3)将末端实际的速度V通过机械臂末端速度的控制接口发送给机械臂的工具中心点TCP,实现机械臂在末端笛卡尔坐标系的导纳控制。
4.根据权利要求1所述的一种基于门控循环单元的轴孔装配插孔方法,其特征在于,所述步骤(2)具体为:
所述接触状态一共分为八类,分别位于笛卡尔坐标系的坐标轴上和坐标轴之间,每一类的接触状态变化过程均相同,用α表示轴的轴线与孔的轴线之间的夹角,每一类的接触状态的变化过程为轴与孔存在θ姿态差到轴顺利入孔,即α=θ到α=0⊙的过程;采集每一类接触状态变化过程中的一系列时间上连续变化的离散接触力训练数据
Figure FDA0004228475960000021
其中,i=1,2,...,8分别表示八类不同的接触状态,k=0,1,2,...,n为每一类接触状态变化过程中的各个离散时刻,下标6表示/>
Figure FDA0004228475960000022
是六维向量;每一类的导纳控制设定值Fid为:
第1类:F1d=[0 0 fzd 0 tyd 0];
第2类:F2d=[0 0 fzd -txd 0 0];
第3类:F3d=[0 0 fzd 0 -tyd 0];
第4类:F4d=[0 0 fzd txd 0 0];
第5类:F5d=[0 0 fzd -txd tyd 0];
第6类:F6d=[0 0 fzd -txd -tyd 0];
第7类:F7d=[0 0 fzd txd-tyd 0];
第8类:F8d=[0 0 fzd txd tyd 0];
其中,fzd为笛卡尔坐标系下z轴期望的接触力,txd,tyd分别为笛卡尔坐标系下x轴和y轴期望的接触力矩;其他的导纳控制参数均相同,Vd=[0 0 0 0 0 0],Md,Bd根据实际需要合理设置。
5.根据权利要求1所述的一种基于门控循环单元的轴孔装配插孔方法,其特征在于,所述步骤(3)具体为:每一类接触力时间序列共有n个接触力向量:
Figure FDA0004228475960000023
由于期望的z接触力fzd是人为设定的,并且接触过程中tz变化不大,故删去fz和tz;得到处理后的n个接触力向量:
Figure FDA0004228475960000024
以m(m<=n+1)个接触力向量为一组,对n个接触力向量序列进行划分,得到n-m+2组时间上连续,长度为m的接触力向量序列;对每n-m+2组的接触力向量序列打上此类接触状态的标签,若第1类的n-m+2组的接触力向量对应的标签均为1;则其他七类数据均作同样的处理。
6.根据权利要求1所述的一种基于门控循环单元的轴孔装配插孔方法,其特征在于,所述步骤(4)具体包括如下子步骤:
(4.1)将八类不同的接触状态的接触力数据
Figure FDA0004228475960000031
经过归一化处理作为输入,对应的标签Yi作为输出;用基于门控循环单元建立接触力的时序分类预测模型去拟合数据/>
Figure FDA0004228475960000032
其中,基于门控循环单元建立接触力的时序分类预测模型由多层门控循环单元GRU以及多层感知机MLP构成;门控循环单元和多层感知器的层数根据实验数据进行合理设置,以下神经网络的计算公式仅表示其原理;门控循环单元用以下公式进行计算:
Figure FDA0004228475960000033
Figure FDA0004228475960000034
Figure FDA0004228475960000035
Figure FDA0004228475960000036
其中,Wxr,Whr,Wxz,Whz,Wxh,Whh是门控循环单元的权重参数,br,br,br是门控循环单元的偏置参数;δ(·)是激活函数,符号⊙是Hadamard积;
(4.2)得到门控循环单元的输出
Figure FDA00042284759600000310
之后,输入到多层感知机网络,多层感知机用以下公式进行计算:
Figure FDA0004228475960000037
其中,Wij,Wjk是多层感知机的权重参数,bj,bk是多层感知机的偏置参数;
(4.3)模型输出最后的接触状态分类预测值为
Figure FDA0004228475960000038
与接触状态分类真实值Yi作交叉熵定义损失函数,用ω表示基于门控循环单元的时序分类预测模型的神经网络参数,神经网络的损失函数为多分类交叉熵损失函数,其计算公式为:
Figure FDA0004228475960000039
采用Adam优化器更新神经网络的参数,训练后得到基于门控循环单元的时序分类预测模型。
7.根据权利要求1所述的一种基于门控循环单元的轴孔装配插孔方法,其特征在于,所述步骤(5)具体为:当轴孔稳定接触后,以概率1/8随机选取八类Fid中的一个,使轴孔之间的接触状态发生变化,读取接下来连续时间内长度为m的离散接触力向量序列
Figure FDA0004228475960000041
然后输入到基于门控循环单元建立接触力的时序分类预测模型中,得到相应的输出标签Yi,更新Fid;更新规则为Yi对应Fid,即Y1对应F1d,其他七类同理;继续读取接下来连续时间内长度为m的离散接触力向量序列,然后通过基于门控循环单元建立接触力的时序分类预测模型,得到新的输出标签Yi,继续更新Fid;循环往复,直到完成轴孔装配插孔任务。
CN202310542545.4A 2023-05-15 2023-05-15 一种基于门控循环单元的轴孔装配插孔方法 Pending CN116408804A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310542545.4A CN116408804A (zh) 2023-05-15 2023-05-15 一种基于门控循环单元的轴孔装配插孔方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310542545.4A CN116408804A (zh) 2023-05-15 2023-05-15 一种基于门控循环单元的轴孔装配插孔方法

Publications (1)

Publication Number Publication Date
CN116408804A true CN116408804A (zh) 2023-07-11

Family

ID=87049536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310542545.4A Pending CN116408804A (zh) 2023-05-15 2023-05-15 一种基于门控循环单元的轴孔装配插孔方法

Country Status (1)

Country Link
CN (1) CN116408804A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116619007A (zh) * 2023-07-24 2023-08-22 季华实验室 一种基于前馈虚拟控制力的插孔方法及其相关设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116619007A (zh) * 2023-07-24 2023-08-22 季华实验室 一种基于前馈虚拟控制力的插孔方法及其相关设备
CN116619007B (zh) * 2023-07-24 2023-10-20 季华实验室 一种基于前馈虚拟控制力的插孔方法及其相关设备

Similar Documents

Publication Publication Date Title
Su et al. An incremental learning framework for human-like redundancy optimization of anthropomorphic manipulators
US11904469B2 (en) Machine learning device, robot controller, robot system, and machine learning method for learning action pattern of human
Gu et al. Deep reinforcement learning for robotic manipulation
CN108161934B (zh) 一种利用深度强化学习实现机器人多轴孔装配的方法
Giorelli et al. Neural network and jacobian method for solving the inverse statics of a cable-driven soft arm with nonconstant curvature
Köker et al. A study of neural network based inverse kinematics solution for a three-joint robot
CN116408804A (zh) 一种基于门控循环单元的轴孔装配插孔方法
CN113043275B (zh) 基于专家演示和强化学习的微零件装配方法
CN113910218B (zh) 一种基于运动学与深度神经网络融合的机器人标定方法和装置
CN111582395A (zh) 一种基于卷积神经网络的产品质量分类系统
CN111639749A (zh) 一种基于深度学习的工业机器人摩擦力辨识方法
CN116460860B (zh) 一种基于模型的机器人离线强化学习控制方法
Aljalbout et al. Learning vision-based reactive policies for obstacle avoidance
US20230311309A1 (en) Method and system for determining optimized program parameters for a robot program
Liu et al. An Image Based Visual Servo Approach with Deep Learning for Robotic Manipulation
Hu et al. Fault diagnosis of robot joint based on BP neural network
Xing et al. A brain-inspired approach for collision-free movement planning in the small operational space
Su et al. Incremental learning with balanced update on receptive fields for multi-sensor data fusion
CN112264995B (zh) 一种基于层级强化学习的机器人双轴孔装配方法
CN116330259A (zh) 一种基于决策树的协作机器人碰撞检测方法
Brockmann et al. The voraus-AD Dataset for Anomaly Detection in Robot Applications
Arie et al. Reinforcement learning of a continuous motor sequence with hidden states
Zhao et al. RNN learning controller trained by ADRC
Xia et al. Data association-based fault diagnosis of IMUs: Optimized DBN design and wheeled robot evaluation
CN114406996B (zh) 一种输入受限机械臂的合作博弈最优跟踪控制方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination