CN116408804A - 一种基于门控循环单元的轴孔装配插孔方法 - Google Patents
一种基于门控循环单元的轴孔装配插孔方法 Download PDFInfo
- Publication number
- CN116408804A CN116408804A CN202310542545.4A CN202310542545A CN116408804A CN 116408804 A CN116408804 A CN 116408804A CN 202310542545 A CN202310542545 A CN 202310542545A CN 116408804 A CN116408804 A CN 116408804A
- Authority
- CN
- China
- Prior art keywords
- contact force
- contact
- shaft hole
- gating
- circulation unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000008569 process Effects 0.000 claims abstract description 26
- 230000008859 change Effects 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 33
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013016 damping Methods 0.000 claims description 6
- 230000005484 gravity Effects 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 125000004122 cyclic group Chemical group 0.000 claims 1
- 230000036544 posture Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 8
- 230000002787 reinforcement Effects 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1679—Programme controls characterised by the tasks executed
- B25J9/1687—Assembly, peg and hole, palletising, straight line, weaving pattern movement
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/1605—Simulation of manipulator lay-out, design, modelling of manipulator
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/1633—Programme controls characterised by the control loop compliant, force, torque control, e.g. combined with position control
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于门控循环单元的轴孔装配插孔方法。该方法基于门控循环网络来对轴孔装配过程中的带有时序信息的动态接触力进行分类预测,结合基于速度的导纳控制,实现底座处于不确定姿态下的轴孔装配插孔任务。不同的接触状态主要分为八类,分别位于笛卡尔坐标系的坐标轴上和坐标轴之间,每一类的接触状态的变化过程为轴与孔存在一定倾角姿态差到轴顺利入孔的过程。基于门控循环单元方法,能够快速实现对八类不同的动态接触力序列的接触状态识别。本发明可以实现底座处于不确定姿态下的轴孔装配任务,带有时序信息的动态接触力可以提高接触状态识别的准确性,并且基于数据驱动的方法可以使其快速迁移到其他轴孔装配平台。
Description
技术领域
本发明属于机器人技术领域,涉及一种基于门控循环单元的轴孔装配插孔方法。
技术背景
近几年,工业机器人技术得到快速发展,在制造业的装配作业中得到了广泛地应用,比如航空部件的装配、汽车零件的装配、以及3C零件的装配。在工业机器人的装配作业中,轴孔装配作为零件装配中的典型任务,约占总装配任务的40%。
因此,开展轴孔装配研究对于发展机器人装配技术具有重要实际应用价值。但是,由于轴孔装配任务接触复杂,采用传统的经典控制方法需要大量时间进行繁琐的参数调整,并且更换新的任务场景后,需要重新调整参数,无法适应新环境。近些年,机器学习和深度学习研究得到了快速发展,已经有许多学者将深度学习和强化学习等算法引入工业机器人的轴孔装配任务中,实现机器人的自动化装配。例如专利“基于深度强化学习实现机器人方形零件装配的方法”,专利号CN201910858957.2中,王永青等人利用深度强化学习方法实现了机器人的方形零件装配;专利“一种利用深度强化学习实现机器人多轴孔装配的方法”,专利号CN201711420089.7中,徐静等人利用普通经验数据和深度强化学习方法获取的专家经验数据,结合模糊控制实现机器人的多轴孔装配。
这些方法都是基于深度强化学习的方法开展轴孔装配的,存在训练时间长,Sim2real复杂并且耗时等问题。因此,本文将结合一种基于门控循环单元的深度学习方法和基于速度的导纳控制方法,实现底座处于不确定姿态下的轴孔装配插孔任务。
发明内容
本发明的目的在于针对现有技术的不足,本发明要解决的技术问题是针对上述技术的不足,提供一种基于门控循环单元的轴孔装配插孔方法,以实现底座处于不确定姿态下的轴孔装配插孔任务。
本发明所采取的技术方案是:一种基于门控循环单元的轴孔装配插孔方法,包括以下步骤:
(1)结合末端六维力传感器和基于速度的导纳控制完成机械臂在末端笛卡尔坐标系的导纳控制;所述末端六维力传感器为型号为MINI45的力与力矩传感器;
(2)在步骤(1)中导纳控制的基础上,采集不同接触状态的末端接触力数据;
(3)对采集到数据进行预处理,使其能够用门控循环单元建立时序分类预测模型;
(4)根据步骤(3)数据处理后得到的数据,基于门控循环单元建立接触力的时序分类预测模型;
(5)结合基于速度的导纳控制,将训练得到的模型应用到不确定姿态下的轴孔装配插孔任务中,最终完成轴孔装配插孔任务。
进一步地,所述步骤(1)中基于速度的导纳控制的离散控制率如下公式所示:
其中,k=0,1,...,n为对时间离散后的各个离散时刻,T为离散时间间隔,分别为第k时刻和第k-1时刻期望的速度,/>为第k时刻期望的力,Vk,Vk-1分别为第k时刻和第k-1时刻末端实际的速度,Fk为第k时刻末端实际的力,Md,Bd为期望的质量矩阵和阻尼矩阵;公式中除了时间间隔T,其余各个变量均是六维的向量或矩阵。
进一步地,所述步骤(1)中基于速度的导纳控制具体包括如下子步骤:
(1.1)通过六维力传感器测得力传感器下的末端六维接触力,然后通过重力补偿消除力传感器的末端重力对力传感器读数的影响,通过坐标变换,将力传感器下的末端六维接触力转换到末端笛卡尔坐标系下,得到末端笛卡尔坐标系下的六维接触力F;
(1.2)给定期望的质量矩阵Md和阻尼矩阵Bd,以及末端期望的接触力Fd,末端期望的速度Vd,通过导纳控制结算,可以求得末端实际的速度V;
(1.3)将末端实际的速度V通过机械臂末端速度的控制接口发送给机械臂的工具中心点TCP,实现机械臂在末端笛卡尔坐标系的导纳控制。
进一步地,所述步骤(2)具体为:
所述接触状态一共分为八类,分别位于笛卡尔坐标系的坐标轴上和坐标轴之间,每一类的接触状态变化过程均相同,用α表示轴的轴线与孔的轴线之间的夹角,每一类的接触状态的变化过程为轴与孔存在θ姿态差到轴顺利入孔,即α=θ到α=0°的过程;采集每一类接触状态变化过程中的一系列时间上连续变化的离散接触力训练数据其中,i=1,2,...,8分别表示八类不同的接触状态,k=0,1,2,...,n为每一类接触状态变化过程中的各个离散时刻,下标6表示/>是六维向量;每一类的导纳控制设定值Fid为:
第1类:F1d=[0 0 fzd 0 tyd 0];
第2类:F2d=[0 0 fzd -txd 0 0];
第3类:F3d=[0 0 fzd 0 -tyd 0];
第4类:F4d=[0 0 fzd txd 0 0];
第5类:F5d=[0 0 fzd -txd tyd 0];
第6类:F6d=[0 0 fzd -txd -tyd 0];
第7类:F7d=[0 0 fzd txd -tyd 0];
第8类:F8d=[0 0fzd txd tyd 0];
其中,fzd为笛卡尔坐标系下z轴期望的接触力,txd,tyd分别为笛卡尔坐标系下x轴和y轴期望的接触力矩;其他的导纳控制参数均相同,Vd=[0 0 0 0 0 0],Md,Bd根据实际需要合理设置。
进一步地,所述步骤(3)具体为:每一类接触力时间序列共有n个接触力向量:
由于期望的z接触力fzd是人为设定的,并且接触过程中tz变化不大,故删去fz和tz;得到处理后的n个接触力向量:
以m(m<=n+1)个接触力向量为一组,对n个接触力向量序列进行划分,得到n-m+2组时间上连续,长度为m的接触力向量序列;对每n-m+2组的接触力向量序列打上此类接触状态的标签,若第1类的n-m+2组的接触力向量对应的标签均为1;则其他七类数据均作同样的处理。
进一步地,所述步骤(4)具体包括如下子步骤:
(4.1)将八类不同的接触状态的接触力数据经过归一化处理作为输入,对应的标签Yi作为输出;用基于门控循环单元建立接触力的时序分类预测模型去拟合数据其中,基于门控循环单元建立接触力的时序分类预测模型由多层门控循环单元GRU以及多层感知机MLP构成;门控循环单元和多层感知器的层数根据实验数据进行合理设置,以下神经网络的计算公式仅表示其原理;门控循环单元用以下公式进行计算:
其中,Wxr,Whr,Wxz,Whz,Wxh,Whh是门控循环单元的权重参数,br,br,br是门控循环单元的偏置参数;δ(·)是激活函数,符号⊙是Hadamard积;
其中,Wij,Wjk是多层感知机的权重参数,bj,bk是多层感知机的偏置参数;
(4.3)模型输出最后的接触状态分类预测值为与接触状态分类真实值Yi作交叉熵定义损失函数,用ω表示基于门控循环单元的时序分类预测模型的神经网络参数,神经网络的损失函数为多分类交叉熵损失函数,其计算公式为:
采用Adam优化器更新神经网络的参数,训练后得到基于门控循环单元的时序分类预测模型。
进一步地,所述步骤(5)具体为:当轴孔稳定接触后,以概率1/8随机选取八类Fid中的一个,使轴孔之间的接触状态发生变化,读取接下来连续时间内长度为m的离散接触力向量序列然后输入到基于门控循环单元建立接触力的时序分类预测模型中,得到相应的输出标签Yi,更新Fid;更新规则为Yi对应Fid,即Y1对应F1d,其他七类同理;继续读取接下来连续时间内长度为m的离散接触力向量序列,然后通过基于门控循环单元建立接触力的时序分类预测模型,得到新的输出标签Yi,继续更新Fid;循环往复,直到完成轴孔装配插孔任务。
本发明有益效果如下:
本发明提供的一种基于门控循环单元的轴孔装配插孔方法,将门控循环单元方法引入轴孔装配的插孔任务中来处理连续时间,不同时间段内的离散接触力序列,结合基于速度的导纳控制,实现底座处于不确定姿态下的轴孔装配插孔任务。带有时序信息的动态接触力可以提高接触轴孔装配插孔阶段接触状态识别的准确性,并且基于数据驱动的方法可以使其快速部署到其他轴孔装配平台,提高了算法的可迁移性。
附图说明
图1为本发明实施例提供的基于速度的导纳控制结构原理图;
图2为本发明实施例提供的数据采集过程中八类不同的接触状态示意图;
图3为本发明实施例提供的数据采集中每一类接触状态变化过程示意图;
图4为本发明实施例提供的数据处理中对第1类接触状态的数据进行处理的过程示意图;
图5为本发明实施例提供的基于门控循环单元的时序分类预测模型训练示意图;
图6为本发明实施例提供的基于门控循环单元的轴孔装配插孔控制结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明中涉及到的末端六维力传感器即为型号为MINI45的力与力矩传感器;
本实施例一种基于门控循环单元的轴孔装配插孔方法,包括以下步骤。
步骤1:结合末端六维力传感器和基于速度的导纳控制实现机械臂在末端笛卡尔坐标系的导纳控制。基于速度的导纳控制的离散控制率如下公式所示。
其中,k=0,1,...,n为对时间离散后的各个离散时刻,T为离散时间间隔,分别为第k时刻和第k-1时刻期望的速度,/>为第k时刻期望的力,Vk,Vk-1分别为第k时刻和第k-1时刻末端实际的速度,Fk为第k时刻末端实际的力,Md,Bd为期望的质量矩阵和阻尼矩阵。公式中除了时间间隔T,其余各个变量均是六维的向量或矩阵。
基于速度的导纳控制对应的整体结构原理图如图1所示。由图1可知,通过六维力传感器测得力传感器下的末端六维接触力,然后通过重力补偿消除力传感器的末端重力对力传感器读数的影响,然后通过坐标变换,将力传感器下的末端六维接触力转换到末端笛卡尔坐标系下,得到末端笛卡尔坐标系下的六维接触力F。给定期望的质量矩阵Md和阻尼矩阵Bd,以及末端期望的接触力Fd,末端期望的速度Vd,通过导纳控制结算,可以求得末端实际的速度V。将末端实际的速度V通过机械臂末端速度的控制接口发送给机械臂的工具中心点(Tool Central Point,TCP),实现机械臂在末端笛卡尔坐标系的导纳控制。
步骤2:在步骤1中导纳控制的基础上,采集不同接触状态的末端接触力数据。如图2所示,接触状态一共分为八类,分别位于笛卡尔坐标系的坐标轴上和坐标轴之间。如图3所示,每一类的接触状态变化过程均相同。其中,α表示轴的轴线与孔的轴线之间的夹角。每一类的接触状态的变化过程为轴与孔存在θ姿态差(α=θ)到轴顺利入孔(α=0°)的过程。采集每一类接触状态变化过程中的一系列时间上连续变化的离散接触力数据其中,i=1,2,...,8分别表示八类不同的接触状态,k=0,1,2,...,n为每一类接触状态变化过程中的各个离散时刻,下标6表示/>是六维向量。每一类的导纳控制设定值Fid为:
第1类:F1d=[0 0 fzd 0 tyd 0];
第2类:F2d=[0 0 fzd -txd 0 0];
第3类:F3d=[0 0 fzd 0 -tyd 0];
第4类:F4d=[0 0 fzd txd 0 0];
第5类:F5d=[0 0 fzd -txd tyd 0];
第6类:F6d=[0 0 fzd -txd -tyd 0];
第7类:F7d=[0 0 fzd txd -tyd 0];
第8类:F8d=[0 0 fzd txd tyd 0]。
其中,fzd为笛卡尔坐标系下z轴期望的接触力,txd,tyd分别为笛卡尔坐标系下x轴和y轴期望的接触力矩。其他的导纳控制参数均相同,Vd=[0 0 0 0 0 0],Md,Bd根据实际需要合理设置。
由于期望的z接触力fzd是人为设定的,并且接触过程中tz变化不大,故删去fz和tz。得到处理后的n个接触力向量
以m(m<=n+1)个接触力向量为一组,对n个接触力向量序列进行划分,得到n-m+2组时间上连续,长度为m的接触力向量序列。对每n-m+2组的接触力向量序列打上此类接触状态的标签,例如,第1类的n-m+2组的接触力向量对应的标签均为1。图4是对第1类数据的处理过程,其他七类数据均作同样的处理。
步骤4:根据第3步数据处理后得到的数据,基于门控循环单元建立接触力的时序分类预测模型。时序分类预测模型的训练过程如图5所示。将八类不同的接触状态的接触力数据Xit经过归一化处理作为输入,对应的标签Yi作为输出。用基于门控循环单元建立接触力的时序分类预测模型去拟合数据(Xit,Yi)。其中,基于门控循环单元建立接触力的时序分类预测模型由多层门控循环单元(Gate Recurrent Unit,GRU)以及多层感知机(MultiLayer Perceptron,MLP)构成。门控循环单元和多层感知器的层数根据实验数据进行合理设置,以下神经网络的计算公式仅表示其原理。门控循环单元用以下公式进行计算
其中,Wxr,Whr,Wxz,Whz,Wxh,Whh是门控循环单元的权重参数,br,br,br是门控循环单元的偏置参数。δ(·)是激活函数,符号⊙是Hadamard积。
其中,Wij,Wjk是多层感知机的权重参数,bj,bk是多层感知机的偏置参数。
如图5所示,模型输出最后的接触状态分类预测值为与接触状态分类真实值Yi作交叉熵定义损失函数,用ω表示基于门控循环单元的时序分类预测模型的神经网络参数,神经网络的损失函数为多分类交叉熵损失函数,其计算公式为
采用Adam优化器更新神经网络的参数,训练后得到基于门控循环单元的时序分类预测模型。
步骤5:结合基于速度的导纳控制,将训练得到的模型应用到不确定姿态下的轴孔装配插孔任务中。实验初始条件为:轴孔装配任务已完成了搜孔任务,即轴孔之间已经不存在位置误差,底座处于随机倾角,轴孔稳定接触,轴孔存在不确定的姿态误差。整体控制结构框图,如图6所示,主要包括上层的规划部分和下层的导纳控制部分。轴孔稳定接触后,以概率1/8随机选取八类Fid中的一个,使轴孔之间的接触状态发生变化,读取接下来连续时间内长度为m的离散接触力向量序列然后输入到基于门控循环单元建立接触力的时序分类预测模型中,得到相应的输出标签Yi,更新Fid。更新规则为Yi对应Fid,即Y1对应F1d,其他七类同理。继续读取接下来连续时间内长度为m的离散接触力向量序列,然后通过基于门控循环单元建立接触力的时序分类预测模型,得到新的输出标签Yi,继续更新Fid。循环往复,直到完成轴孔装配插孔任务。
上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (7)
1.一种基于门控循环单元的轴孔装配插孔方法,其特征在于,包括以下步骤:
(1)结合末端六维力传感器和基于速度的导纳控制完成机械臂在末端笛卡尔坐标系的导纳控制;所述末端六维力传感器为力与力矩传感器;
(2)在步骤(1)中导纳控制的基础上,采集不同接触状态的末端接触力数据;
(3)对采集到数据进行预处理,使其能够用门控循环单元建立时序分类预测模型;
(4)根据步骤(3)数据处理后得到的数据,基于门控循环单元建立接触力的时序分类预测模型;
(5)结合基于速度的导纳控制,将训练得到的模型应用到不确定姿态下的轴孔装配插孔任务中,最终完成轴孔装配插孔任务。
3.根据权利要求1所述的一种基于门控循环单元的轴孔装配插孔方法,其特征在于,
所述步骤(1)中基于速度的导纳控制具体包括如下子步骤:
(1.1)通过六维力传感器测得力传感器下的末端六维接触力,然后通过重力补偿消除力传感器的末端重力对力传感器读数的影响,通过坐标变换,将力传感器下的末端六维接触力转换到末端笛卡尔坐标系下,得到末端笛卡尔坐标系下的六维接触力F;
(1.2)给定期望的质量矩阵Md和阻尼矩阵Bd,以及末端期望的接触力Fd,末端期望的速度Vd,通过导纳控制结算,可以求得末端实际的速度V;
(1.3)将末端实际的速度V通过机械臂末端速度的控制接口发送给机械臂的工具中心点TCP,实现机械臂在末端笛卡尔坐标系的导纳控制。
4.根据权利要求1所述的一种基于门控循环单元的轴孔装配插孔方法,其特征在于,所述步骤(2)具体为:
所述接触状态一共分为八类,分别位于笛卡尔坐标系的坐标轴上和坐标轴之间,每一类的接触状态变化过程均相同,用α表示轴的轴线与孔的轴线之间的夹角,每一类的接触状态的变化过程为轴与孔存在θ姿态差到轴顺利入孔,即α=θ到α=0⊙的过程;采集每一类接触状态变化过程中的一系列时间上连续变化的离散接触力训练数据其中,i=1,2,...,8分别表示八类不同的接触状态,k=0,1,2,...,n为每一类接触状态变化过程中的各个离散时刻,下标6表示/>是六维向量;每一类的导纳控制设定值Fid为:
第1类:F1d=[0 0 fzd 0 tyd 0];
第2类:F2d=[0 0 fzd -txd 0 0];
第3类:F3d=[0 0 fzd 0 -tyd 0];
第4类:F4d=[0 0 fzd txd 0 0];
第5类:F5d=[0 0 fzd -txd tyd 0];
第6类:F6d=[0 0 fzd -txd -tyd 0];
第7类:F7d=[0 0 fzd txd-tyd 0];
第8类:F8d=[0 0 fzd txd tyd 0];
其中,fzd为笛卡尔坐标系下z轴期望的接触力,txd,tyd分别为笛卡尔坐标系下x轴和y轴期望的接触力矩;其他的导纳控制参数均相同,Vd=[0 0 0 0 0 0],Md,Bd根据实际需要合理设置。
6.根据权利要求1所述的一种基于门控循环单元的轴孔装配插孔方法,其特征在于,所述步骤(4)具体包括如下子步骤:
(4.1)将八类不同的接触状态的接触力数据经过归一化处理作为输入,对应的标签Yi作为输出;用基于门控循环单元建立接触力的时序分类预测模型去拟合数据/>其中,基于门控循环单元建立接触力的时序分类预测模型由多层门控循环单元GRU以及多层感知机MLP构成;门控循环单元和多层感知器的层数根据实验数据进行合理设置,以下神经网络的计算公式仅表示其原理;门控循环单元用以下公式进行计算:
其中,Wxr,Whr,Wxz,Whz,Wxh,Whh是门控循环单元的权重参数,br,br,br是门控循环单元的偏置参数;δ(·)是激活函数,符号⊙是Hadamard积;
其中,Wij,Wjk是多层感知机的权重参数,bj,bk是多层感知机的偏置参数;
(4.3)模型输出最后的接触状态分类预测值为与接触状态分类真实值Yi作交叉熵定义损失函数,用ω表示基于门控循环单元的时序分类预测模型的神经网络参数,神经网络的损失函数为多分类交叉熵损失函数,其计算公式为:
采用Adam优化器更新神经网络的参数,训练后得到基于门控循环单元的时序分类预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310542545.4A CN116408804A (zh) | 2023-05-15 | 2023-05-15 | 一种基于门控循环单元的轴孔装配插孔方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310542545.4A CN116408804A (zh) | 2023-05-15 | 2023-05-15 | 一种基于门控循环单元的轴孔装配插孔方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116408804A true CN116408804A (zh) | 2023-07-11 |
Family
ID=87049536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310542545.4A Pending CN116408804A (zh) | 2023-05-15 | 2023-05-15 | 一种基于门控循环单元的轴孔装配插孔方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116408804A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116619007A (zh) * | 2023-07-24 | 2023-08-22 | 季华实验室 | 一种基于前馈虚拟控制力的插孔方法及其相关设备 |
-
2023
- 2023-05-15 CN CN202310542545.4A patent/CN116408804A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116619007A (zh) * | 2023-07-24 | 2023-08-22 | 季华实验室 | 一种基于前馈虚拟控制力的插孔方法及其相关设备 |
CN116619007B (zh) * | 2023-07-24 | 2023-10-20 | 季华实验室 | 一种基于前馈虚拟控制力的插孔方法及其相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Su et al. | An incremental learning framework for human-like redundancy optimization of anthropomorphic manipulators | |
US11904469B2 (en) | Machine learning device, robot controller, robot system, and machine learning method for learning action pattern of human | |
Gu et al. | Deep reinforcement learning for robotic manipulation | |
CN108161934B (zh) | 一种利用深度强化学习实现机器人多轴孔装配的方法 | |
Giorelli et al. | Neural network and jacobian method for solving the inverse statics of a cable-driven soft arm with nonconstant curvature | |
Köker et al. | A study of neural network based inverse kinematics solution for a three-joint robot | |
CN116408804A (zh) | 一种基于门控循环单元的轴孔装配插孔方法 | |
CN113043275B (zh) | 基于专家演示和强化学习的微零件装配方法 | |
CN113910218B (zh) | 一种基于运动学与深度神经网络融合的机器人标定方法和装置 | |
CN111582395A (zh) | 一种基于卷积神经网络的产品质量分类系统 | |
CN111639749A (zh) | 一种基于深度学习的工业机器人摩擦力辨识方法 | |
CN116460860B (zh) | 一种基于模型的机器人离线强化学习控制方法 | |
Aljalbout et al. | Learning vision-based reactive policies for obstacle avoidance | |
US20230311309A1 (en) | Method and system for determining optimized program parameters for a robot program | |
Liu et al. | An Image Based Visual Servo Approach with Deep Learning for Robotic Manipulation | |
Hu et al. | Fault diagnosis of robot joint based on BP neural network | |
Xing et al. | A brain-inspired approach for collision-free movement planning in the small operational space | |
Su et al. | Incremental learning with balanced update on receptive fields for multi-sensor data fusion | |
CN112264995B (zh) | 一种基于层级强化学习的机器人双轴孔装配方法 | |
CN116330259A (zh) | 一种基于决策树的协作机器人碰撞检测方法 | |
Brockmann et al. | The voraus-AD Dataset for Anomaly Detection in Robot Applications | |
Arie et al. | Reinforcement learning of a continuous motor sequence with hidden states | |
Zhao et al. | RNN learning controller trained by ADRC | |
Xia et al. | Data association-based fault diagnosis of IMUs: Optimized DBN design and wheeled robot evaluation | |
CN114406996B (zh) | 一种输入受限机械臂的合作博弈最优跟踪控制方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |