CN114474078B - 机械臂的摩擦力补偿方法、装置、电子设备及存储介质 - Google Patents
机械臂的摩擦力补偿方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114474078B CN114474078B CN202210380072.8A CN202210380072A CN114474078B CN 114474078 B CN114474078 B CN 114474078B CN 202210380072 A CN202210380072 A CN 202210380072A CN 114474078 B CN114474078 B CN 114474078B
- Authority
- CN
- China
- Prior art keywords
- training
- deep learning
- learning model
- mechanical arm
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012549 training Methods 0.000 claims abstract description 184
- 238000013136 deep learning model Methods 0.000 claims abstract description 101
- 238000012360 testing method Methods 0.000 claims abstract description 57
- 230000006870 function Effects 0.000 claims abstract description 33
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000011478 gradient descent method Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 18
- 230000009471 action Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005293 physical law Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/1641—Programme controls characterised by the control loop compensation for backlash, friction, compliance, elasticity in the joints
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J13/00—Controls for manipulators
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/1605—Simulation of manipulator lay-out, design, modelling of manipulator
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Automation & Control Theory (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及机械臂控制技术领域,具体公开了一种机械臂的摩擦力补偿方法、装置、电子设备及存储介质,其中,方法包括以下步骤:获取训练数据集;将训练数据集拆分为第一训练集和第一测试集;将第一训练集拆分为第二训练集和第二测试集;根据第二训练集和第二测试集训练获取非线性模型;设计深度学习模型,深度学习模型的目标函数具有基于非线性模型定义的正则项;根据第一训练集和第一测试集训练深度学习模型;利用训练后的深度学习模型进行摩擦力补偿;该方法将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习。
Description
技术领域
本申请涉及机械臂控制技术领域,具体而言,涉及一种机械臂的摩擦力补偿方法、装置、电子设备及存储介质。
背景技术
机械臂运动过程存在着静摩擦、滑动摩擦、粘性摩擦等摩擦力。这些摩擦力可能会增大伺服定位系统的稳态误差,导致伺服系统运行中反复调整而产生振动,并增大高速运行时伺服系统的跟踪误差。
因此,机械臂运行控制时需要对这些摩擦力进行补偿以确保机械臂运动动作准确;现有技术中,一般采用线性模型、非线性模型进行简单地摩擦力补偿,但这些模型的补偿精度较低,因此产生了采用学习模型进行摩擦力补偿的方法,但深度学习模型训练过程存在一定的不确定性,可能导致过拟合和泛化误差增大等问题。
针对上述问题,目前尚未有有效的技术解决方案。
发明内容
本申请的目的在于提供一种机械臂的摩擦力补偿方法、装置、电子设备及存储介质,降低了深度学习模型的不确定性,解决过拟合、泛化误差增大等问题。
第一方面,本申请提供了一种机械臂的摩擦力补偿方法,用于机械臂运行控制时进行摩擦力补偿,所述方法包括以下步骤:
获取关于所述机械臂运行状态的训练数据集;
将所述训练数据集拆分为第一训练集和第一测试集;
将所述第一训练集拆分为第二训练集和第二测试集;
根据第二训练集和所述第二测试集训练获取非线性模型;
设计深度学习模型,所述深度学习模型的目标函数具有基于所述非线性模型定义的正则项;
根据所述第一训练集和所述第一测试集训练所述深度学习模型;
利用训练后的所述深度学习模型进行摩擦力补偿。
本申请的一种机械臂的摩擦力补偿方法,将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
所述的一种机械臂的摩擦力补偿方法,其中,所述获取关于所述机械臂运行状态的训练数据集的步骤包括:
获取所述机械臂运行时的实际状态参数集;
根据所述实际状态参数集及规划状态参数集获取力矩差值集;
根据所述实际状态参数及所述力矩差值集建立所述训练数据集。
所述的一种机械臂的摩擦力补偿方法,其中,所述实际状态参数集包括:机械臂负载信息、各轴位置规划信息、各轴速度规划信息、各轴反馈力矩信息及温度信息。
在该示例的一种机械臂的摩擦力补偿方法中,机械臂负载信息反映了机械臂的负载重量、位置等信息,各轴位置规划信息反映了机械臂完成指定动作时各个轴端规划的移动位置;各轴速度规划信息反映了机械臂完成指定动作时各个轴端规划的移动速度;温度信息反映了当前环境温度或机械臂温度。
所述的一种机械臂的摩擦力补偿方法,其中,所述力矩差值集为根据所述各轴反馈力矩信息及基于动力学计算的各轴规划力矩信息计算获取。
在该示例的一种机械臂的摩擦力补偿方法中,力矩差值需要根据实际输出力矩和预期输出力矩进行计算,各轴规划力矩信息为各个轴的预期输出力矩;各轴反馈力矩信息反映了机械臂各轴的实际输出力矩,预期输出力矩能根据机械臂的输入数据进行计算,主要通过机械臂负载信息、各轴位置规划信息、各轴速度规划信息进行计算。
所述的一种机械臂的摩擦力补偿方法,其中,所述根据所述第一训练集和所述第一测试集训练所述深度学习模型的步骤包括:
利用梯度下降法将所述第一训练集代入所述深度学习模型中以使所述目标函数收敛;
在所述目标函数收敛后,利用所述第一测试集验证所述深度学习模型。
所述的一种机械臂的摩擦力补偿方法,其中,所述根据第二训练集和所述第二测试集训练获取非线性模型的步骤包括:
根据所述训练数据集包含的元素类型设计初始非线性模型;
利用梯度下降法将所述第二训练集代入所述初始非线性模型中更新所述初始非线性模型;
利用所述第二测试集验证更新后的所述初始非线性模型,并在验证合格时,将所述初始非线性模型视为所述非线性模型。
第二方面,本申请还提供了一种机械臂的摩擦力补偿装置,用于机械臂运行控制时进行摩擦力补偿,所述装置包括:
获取模块,用于获取关于所述机械臂运行状态的训练数据集;
第一分集模块,用于将所述训练数据集拆分为第一训练集和第一测试集;
第二分集模块,用于将所述第一训练集拆分为第二训练集和第二测试集;
第一训练模块,用于根据第二训练集和所述第二测试集训练获取非线性模型;
建模模块,用于设计深度学习模型,所述深度学习模型的目标函数具有基于所述非线性模型定义的正则项;
第二训练模块,用于根据所述第一训练集和所述第一测试集训练所述深度学习模型;
补偿模块,用于利用训练后的所述深度学习模型进行摩擦力补偿。
本申请的一种机械臂的摩擦力补偿装置,利用建模模块将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型通过第二训练模块进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
第三方面,本申请还提供了一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
由上可知,本申请提供了机械臂的摩擦力补偿方法、装置、电子设备及存储介质,其中,方法将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
附图说明
图1为本申请实施例提供的机械臂的摩擦力补偿方法的流程图。
图2为本申请实施例提供的机械臂的摩擦力补偿方法中的深度学习模型的神经网络示意图。
图3为本申请实施例提供的机械臂的摩擦力补偿装置的结构示意图。
图4为本申请实施例提供的电子设备的结构示意图。
附图标记:201、获取模块;202、第一分集模块;203、第二分集模块;204、第一训练模块;205、建模模块;206、第二训练模块;207、补偿模块;301、处理器;302、存储器;303、通信总线。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
第一方面,请参照图1,图1是本申请一些实施例中的一种机械臂的摩擦力补偿方法,用于机械臂运行控制时进行摩擦力补偿,方法包括以下步骤:
S1、获取关于机械臂运行状态的训练数据集;
具体地,机械臂运行过程中会产生各类运行参数,主要包括根据输入数据计算产生的规划参数以及机械臂实际运行产生的实际运行参数,前者反映了机械臂的预期运行情况,后者反映了机械臂的实际运行情况;通过分析两种情况的参数的关系能获知摩擦力对机械臂运行状态的影响,故获取训练数据集能作为本申请实施例的机械臂的摩擦力补偿方法进行摩擦力补偿的数据基础。
更具体地,对上述训练数据集进行分析能获知摩擦力对机械臂运行产生的跟踪误差的关系,本申请实施例的机械臂的摩擦力补偿方法旨在根据该关系建立并训练出合适的模型以进行摩擦力补偿。
S2、将训练数据集拆分为第一训练集和第一测试集;
具体地,训练集用于训练模型,测试集用于测试验证训练出来的模型的训练效果。
更具体地,对于模型的训练而言,足够体量的训练集才能确保模型训练能顺利执行,使得训练出来的模型能根据不同情况下产生的数据进行输出,训练完成后利用测试集对模型进行测试来验证模型是否能适用于训练集以外的数据集,从而判断模型的训练效果。
S3、将第一训练集拆分为第二训练集和第二测试集;
具体地,本申请实施例利用步骤S2-S3对训练数据集进行二次拆分,以供后续两个模型进行训练使用。
S4、根据第二训练集和第二测试集训练获取非线性模型;
具体地,采用数据量较少的第二训练集和第二测试集进行训练能快速获取一个关于摩擦力的先验物理模型,由于机械臂运行产生的跟踪误差与多个方面的摩擦力有关,因此,在本申请实施例中,步骤S4优选为获取训练过程相对简单、包含多个参数项且能初步反映摩擦力对机械臂运行影响的非线性模型。
S5、设计深度学习模型,深度学习模型的目标函数具有基于非线性模型定义的正则项;
具体地,正则项为目标函数中添加的正则化范数;正则化(regularization)是指为解决适定性问题或过拟合而加入额外信息的过程,能用于避免模型训练时产生过拟合的情况出现。
更具体地,在本申请实施例中,基于非线性模型定义正则项,能指导深度学习模型的训练方向,即在训练过程中的深度学习模型靠近非线性模型变化时,该正则项产生对应的奖励值鼓励目标函数朝该方向变化,反之产生对应的惩罚值,能有效抑制深度学习模型训练过程中的不确定性。
更具体地,非线性模型设定为正则项中一正则项参数。
S6、根据第一训练集和第一测试集训练深度学习模型;
具体地,非线性模型基于第二训练集和第二测试集进行训练而成,具有一定地先验规律,能初步反映出机械臂运行过程中摩擦力与跟踪误差的关系,在此基础上进行深度学习模型训练能使得深度学习模型朝向该先验规律的方向进行训练以提高目标函数的收率速度,有效提高模型训练效率、减小泛化误差,并防止过拟合问题出现;结合非线性模型获取深度学习模型也提高模型的分析精度。
更具体地,第一训练集由第二训练集和第二测试集组成,因此,对于第一训练集而言,训练好的非线性模型具有符合预期的输入输出关系,因此,在利用第一训练集对该深度学习模型训练的过程中,作为正则项参数的非线性模型能顺利地对深度学习模型的目标函数起到奖惩作用。
S7、利用训练后的深度学习模型进行摩擦力补偿。
具体地,训练后的深度学习模型能根据机械臂运行的各类运行参数进行计算分析,获取摩擦力相关参数或直接获取摩擦力补偿值以进行摩擦力补偿;将该训练后的深度学习模型部署在机械臂控制器中便能对机械臂进行摩擦力补偿以提高机械臂的运行精度。
更具体地,在该深度学习模型部署在机械臂控制器后,机械臂控制器能根据深度学习模型的输出结果补偿输出参数,以使机械臂实际运动动作符合预期要求,降低机械臂运动产生的跟踪误差。
本申请实施例的一种机械臂的摩擦力补偿方法,将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,并解决了过拟合、泛化误差增大等问题。
另外,非线性模型的训练过程与深度学习模型的训练过程相比较为简单,且本申请实施例中,非线性模型仅作为先验的物理模型来指导深度信息模型进行训练,其识别精度不需要太高,故本申请实施例将训练数据集进行二次拆分,减少非线性模型训练采用的数据集体量,保留第一测试集进行深度学习模型的验证,在最大限度利用训练数据集的同时加快非线性模型的训练效率。
在一些优选的实施方式中,步骤S2包括:
按照预设的第一比例将训练数据集随机拆分为第一训练集和第一测试集。
具体地,随机拆分训练数据集的过程应按组拆分元素以进行运行参数的分配,即将同一时刻产生的各个运行参数视为一组数据划分至目标集中;随机拆分指不按照每组数据的产生顺序或输入顺序而随机地将对应数据分配至第一训练集或第一测试集中,使得第一训练集和第一测试集的数据分配更均匀,从而优化模型训练效果。
在一些优选的实施方式中,预设的第一比例为8:2。
在一些优选的实施方式中,步骤S3包括:
按照预设的第二比例将第一训练集随机拆分为第二训练集和第二测试集。
在一些优选的实施方式中,预设的第二比例为8:2。
具体地,在满足训练集具有足够多的数据进行训练的情况下,还需确保测试集具有足够的数据进行测试验证,才能保证模型的训练效果;本申请实施例中,将第一比例和第二比例均设定为8:2能有效地保证模型训练效果和测试验证的准确率,使得非线性模型具有符合预期的先验特性,也使得深度学习模型能精准地辅助机械臂控制器进行摩擦力补偿。
在一些优选的实施方式中,获取关于机械臂运行状态的训练数据集的步骤包括:
S11、获取机械臂运行时的实际状态参数集;
具体地,由于本申请实施例的机械臂的摩擦力补偿方法主要用于机械臂摩擦力补偿,因此,获取的实际状态参数集中的参数类型应与机械臂运行过程中会产生的摩擦力的部位有关,或者是与对机械臂运行过程中基于摩擦力产生的跟踪误差有关。
更具体地,不同机械臂的安装结构、轴的数量、轴的类型具有一定差异,该步骤获取的实际状态参数集中的参数类型按需选择,相应地,步骤S4中的非线性模型应当按照训练数据集中的参数类型进行设定调整。
S12、根据实际状态参数集及规划状态参数集获取力矩差值集;
具体地,摩擦力引起机械臂运行的跟踪误差的过程主要表现为:摩擦力妨碍机械臂运行使得机械臂按照输入参数运行时其轴端未能产生预期大小的输出力矩而引起运动偏移,即机械臂中的摩擦力产生了摩擦力矩而影响了机械臂的输出力矩;因此,为了补偿这部分摩擦力矩,需要利用模型计算出摩擦力矩的大小,而为了计算摩擦力矩的大小则需要先计算机械臂实际输出力矩和机械臂预期输出力矩的大小,故在该步骤需要先计算出实际输出力矩和预期输出力矩之间的差值以作为模型训练的数据基础,这些差值构成了力矩差值集;值得一提的是,本申请实施例的机械臂的摩擦力补偿方法在进行摩擦力补偿时,主要是利用深度学习模型来推算机械臂运动时产生的摩擦力矩以使机械臂控制器能根据该推算的摩擦力矩调节输入参数以修正力矩,以减小机械臂运行的跟踪误差。
更具体地,由于非线性模型属于深度学习模型训练过程中的目标函数中的正则项参数,因此,步骤S4获取的非线性模型应当理解为能初步推算摩擦力矩。
S13、根据实际状态参数及力矩差值集建立训练数据集。
具体地,最终获取的深度学习模型部署在机械臂控制器中时,能根据机械臂的运行状态来推算摩擦力矩以使机械臂控制器能进行摩擦力补偿,因此,供深度学习模型训练用的训练数据集应当包含实际状态参数及力矩差值集,使得训练后的深度学习模型能根据机械臂当前的实际状态参数预测机械臂当前的力矩差值或预测摩擦力矩。
在一些优选的实施方式中,实际状态参数集包括:机械臂负载信息、各轴位置规划信息、各轴速度规划信息、各轴反馈力矩信息及温度信息。
具体地,机械臂运行过程对跟踪误差影响的摩擦因素主要包括:静摩擦、滑动摩擦及粘性摩擦,其中,机械臂的负载情况、各轴需要移动到的规划位置、各轴运行过程中规划的速度以及温度属于影响上述摩擦因素的主要数据特征,因此,为了准确地构建深度学习模型来进行摩擦力补偿,需要获取机械臂负载信息、各轴位置规划信息、各轴速度规划信息及温度信息来组成状态向量来建立训练数据集。
更具体地,机械臂负载信息反映了机械臂的负载重量、位置等信息,各轴位置规划信息反映了机械臂完成指定动作时各个轴端规划的移动位置;各轴速度规划信息反映了机械臂完成指定动作时各个轴端规划的移动速度;温度信息反映了当前环境温度或机械臂温度。
在一些优选的实施方式中,力矩差值集为根据各轴反馈力矩信息及基于动力学计算的各轴规划力矩信息计算获取。
具体地,力矩差值y需要根据实际输出力矩和预期输出力矩进行计算,各轴规划力矩信息为各个轴的预期输出力矩;各轴反馈力矩信息反映了机械臂各轴的实际输出力矩,预期输出力矩能根据机械臂的输入数据进行计算,主要通过机械臂负载信息、各轴位置规划信息、各轴速度规划信息进行计算。
更具体地,预期输出力矩能通过根据机械臂负载信息、各轴位置规划信息、各轴速度规划信息以及机械臂自身的结构参数(如D-H参数、机械臂质量、惯性矩等)进行动力学计算得出。
在一些优选的实施方式中,步骤S11为根据预设的采样间隔采集获取机械臂运行时的实际状态参数集。
具体地,预设的采样间隔为4-10ms。
在一些优选的实施方式中,根据第一训练集和第一测试集训练深度学习模型的步骤包括:
S61、利用梯度下降法将第一训练集代入深度学习模型中以使目标函数收敛;
更具体地,深度学习模型为前馈神经网络模型,其神经网络结构如图2所示,其每层神经网络含批量标准化层、全连接层和激活层,使得本申请实施例的深度学习模型能利用梯度下降法进行训练。
S62、在目标函数收敛后,利用第一测试集验证深度学习模型。
具体地,目标函数收敛表明深度学习模型训练到预期效果,然后对该深度学习模型输入在第一训练集以外的第一测试集的数据,并通过判断深度学习模型的输出结果是否符合预期来判断该深度学习模型是否适用于其他数据;在该深度学习模型的输出结果符合预期时,表明该深度学习模型普遍适用于对应的机械臂的应用场合来进行摩擦力补偿;在该深度学习模型的输出结果不符合预期时,需重新训练深度学习模型或对深度学习模型进行调整。
在一些优选的实施方式中,根据第二训练集和第二测试集训练获取非线性模型的步骤包括:
S41、根据训练数据集包含的元素类型设计初始非线性模型;
S42、利用梯度下降法将第二训练集代入初始非线性模型中更新初始非线性模型;
S43、利用第二测试集验证更新后的初始非线性模型,并在验证合格时,将初始非线性模型视为非线性模型。
具体地,利用第二训练集对非线性模型完成训练后,需要对该非线性模型输入在第二训练集以外的第二测试集的数据,并通过判断非线性模型的输出结果是否符合预期来判断该非线性模型是否适用于其他数据;在该非线性模型的输出结果符合预期时,表明该非线性模型对于由第二训练集和第二测试集组成的第一训练集而言符合先验的物理规律,即表明该非线性模型能够作为正则项参数使用;在该非线性模型的输出结果不符合预期时,需重新训练非线性模型或对非线性模型进行调整。
在一些优选的实施方式中,非线性模型为按照训练数据集中的参数类型进行设计,在本申请实施例中,步骤S41优选为将非线性模型设计为:
在一些优选的实施方式中,在步骤S4训练获取非线性模型后,式(1)可以表示为基于单一变量的函数形式,故可将该非线性模型简化表示为,N(·)为基于式(1)及状态向量确定的变换函数,相当于非线性模型的简写式,使得正则项表示为:
i代表输入数据的编号下标,可以是按照时间排序或按照其所在集合中的元素顺序排序,在训练过程中,定义第一训练集为S,S中具有n(n≥2)个元素,则有i=1,2,3……,n;
第二方面,请参照图3,图3是本申请一些实施例中提供的一种机械臂的摩擦力补偿装置,用于机械臂运行控制时进行摩擦力补偿,装置包括:
获取模块201,用于获取关于机械臂运行状态的训练数据集;
第一分集模块202,用于将训练数据集拆分为第一训练集和第一测试集;
第二分集模块203,用于将第一训练集拆分为第二训练集和第二测试集;
第一训练模块204,用于根据第二训练集和第二测试集训练获取非线性模型;
建模模块205,用于设计深度学习模型,深度学习模型的目标函数具有基于非线性模型定义的正则项;
第二训练模块206,用于根据第一训练集和第一测试集训练深度学习模型;
补偿模块207,用于利用训练后的深度学习模型进行摩擦力补偿。
本申请实施例的一种机械臂的摩擦力补偿装置,利用建模模块205将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型通过第二训练模块206进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
在一些优选的实施方式中,本申请实施例的机械臂的摩擦力补偿装置用于执行上述第一方面提供的机械臂的摩擦力补偿方法。
第三方面,请参照图4,图4为本申请实施例提供的一种电子设备的结构示意图,本申请提供一种电子设备,包括:处理器301和存储器302,处理器301和存储器302通过通信总线303和/或其他形式的连接机构(未标出)互连并相互通讯,存储器302存储有处理器301可执行的计算机程序,当计算设备运行时,处理器301执行该计算机程序,以执行时执行上述实施例的任一可选的实现方式中的方法。
第四方面,本申请实施例提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,执行上述实施例的任一可选的实现方式中的方法。其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory, 简称SRAM),电可擦除可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory, 简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory, 简称EPROM),可编程只读存储器(Programmable Red-Only Memory, 简称PROM),只读存储器(Read-Only Memory, 简称ROM),磁存储器,快闪存储器,磁盘或光盘。
综上,本申请实施例提供了机械臂的摩擦力补偿方法、装置、电子设备及存储介质,其中,方法将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种机械臂的摩擦力补偿方法,用于机械臂运行控制时进行摩擦力补偿,其特征在于,所述方法包括以下步骤:
获取关于所述机械臂运行状态的训练数据集;
将所述训练数据集拆分为第一训练集和第一测试集;
将所述第一训练集拆分为第二训练集和第二测试集;
根据第二训练集和所述第二测试集训练获取非线性模型;
设计深度学习模型,所述深度学习模型的目标函数具有基于所述非线性模型定义的正则项;
根据所述第一训练集和所述第一测试集训练所述深度学习模型;
利用训练后的所述深度学习模型进行摩擦力补偿。
2.根据权利要求1所述的一种机械臂的摩擦力补偿方法,其特征在于,所述获取关于所述机械臂运行状态的训练数据集的步骤包括:
获取所述机械臂运行时的实际状态参数集;
根据所述实际状态参数集及规划状态参数集获取力矩差值集;
根据所述实际状态参数集 及所述力矩差值集建立所述训练数据集。
3.根据权利要求2所述的一种机械臂的摩擦力补偿方法,其特征在于,所述实际状态参数集包括:机械臂负载信息、各轴位置规划信息、各轴速度规划信息、各轴反馈力矩信息及温度信息。
4.根据权利要求3所述的一种机械臂的摩擦力补偿方法,其特征在于,所述力矩差值集为根据所述各轴反馈力矩信息及基于动力学计算的各轴规划力矩信息计算获取。
5.根据权利要求1所述的一种机械臂的摩擦力补偿方法,其特征在于,所述根据所述第一训练集和所述第一测试集训练所述深度学习模型的步骤包括:
利用梯度下降法将所述第一训练集代入所述深度学习模型中以使所述目标函数收敛;
在所述目标函数收敛后,利用所述第一测试集验证所述深度学习模型。
6.根据权利要求1所述的一种机械臂的摩擦力补偿方法,其特征在于,所述根据第二训练集和所述第二测试集训练获取非线性模型的步骤包括:
根据所述训练数据集包含的元素类型设计初始非线性模型;
利用梯度下降法将所述第二训练集代入所述初始非线性模型中更新所述初始非线性模型;
利用所述第二测试集验证更新后的所述初始非线性模型,并在验证合格时,将所述初始非线性模型视为所述非线性模型。
8.一种机械臂的摩擦力补偿装置,用于机械臂运行控制时进行摩擦力补偿,其特征在于,所述装置包括:
获取模块,用于获取关于所述机械臂运行状态的训练数据集;
第一分集模块,用于将所述训练数据集拆分为第一训练集和第一测试集;
第二分集模块,用于将所述第一训练集拆分为第二训练集和第二测试集;
第一训练模块,用于根据第二训练集和所述第二测试集训练获取非线性模型;
建模模块,用于设计深度学习模型,所述深度学习模型的目标函数具有基于所述非线性模型定义的正则项;
第二训练模块,用于根据所述第一训练集和所述第一测试集训练所述深度学习模型;
补偿模块,用于利用训练后的所述深度学习模型进行摩擦力补偿。
9.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-7任一项所述方法中的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-7任一项所述方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210380072.8A CN114474078B (zh) | 2022-04-12 | 2022-04-12 | 机械臂的摩擦力补偿方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210380072.8A CN114474078B (zh) | 2022-04-12 | 2022-04-12 | 机械臂的摩擦力补偿方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114474078A CN114474078A (zh) | 2022-05-13 |
CN114474078B true CN114474078B (zh) | 2022-06-17 |
Family
ID=81487492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210380072.8A Active CN114474078B (zh) | 2022-04-12 | 2022-04-12 | 机械臂的摩擦力补偿方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114474078B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115091470B (zh) * | 2022-08-18 | 2022-11-18 | 季华实验室 | 摩擦力补偿模型训练方法、装置、电子设备和存储介质 |
CN117984334B (zh) * | 2024-04-03 | 2024-05-28 | 泓浒(苏州)半导体科技有限公司 | 一种自适应晶圆机械臂力矩调整系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428317A (zh) * | 2020-04-06 | 2020-07-17 | 宁波智诚祥科技发展有限公司 | 一种基于5g和循环神经网络的关节摩擦力矩补偿方法 |
CN111639749A (zh) * | 2020-05-25 | 2020-09-08 | 上海智殷自动化科技有限公司 | 一种基于深度学习的工业机器人摩擦力辨识方法 |
CN114074332A (zh) * | 2022-01-19 | 2022-02-22 | 季华实验室 | 一种摩擦力补偿方法、装置、电子设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3975065A1 (en) * | 2020-09-25 | 2022-03-30 | Dassault Systèmes | Deep-learning generative model |
-
2022
- 2022-04-12 CN CN202210380072.8A patent/CN114474078B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428317A (zh) * | 2020-04-06 | 2020-07-17 | 宁波智诚祥科技发展有限公司 | 一种基于5g和循环神经网络的关节摩擦力矩补偿方法 |
CN111639749A (zh) * | 2020-05-25 | 2020-09-08 | 上海智殷自动化科技有限公司 | 一种基于深度学习的工业机器人摩擦力辨识方法 |
CN114074332A (zh) * | 2022-01-19 | 2022-02-22 | 季华实验室 | 一种摩擦力补偿方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114474078A (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114474078B (zh) | 机械臂的摩擦力补偿方法、装置、电子设备及存储介质 | |
CN112445131A (zh) | 一种线性系统自适应最优跟踪控制方法 | |
CN112207834B (zh) | 一种基于干扰观测器的机器人关节系统控制方法及系统 | |
CN109188907A (zh) | 一种应用于稳定平台控制系统的遗传退火粒子群混合算法及其稳定平台控制系统 | |
CN111273544A (zh) | 基于预测rbf前馈补偿型模糊pid的雷达俯仰运动控制方法 | |
Abouheaf et al. | Online model‐free reinforcement learning for the automatic control of a flexible wing aircraft | |
CN112416021A (zh) | 一种基于学习的旋翼无人机路径跟踪预测控制方法 | |
CN114290339B (zh) | 基于强化学习和残差建模的机器人现实迁移方法 | |
CN113985732B (zh) | 针对飞行器系统的自适应神经网络控制方法及装置 | |
CN109062040A (zh) | 基于系统嵌套优化的预测pid方法 | |
CN116627157A (zh) | 一种运载火箭的运行控制方法、装置及设备 | |
Malekzadeh et al. | Hardware-in-the-loop attitude control via a high-order sliding mode controller/observer | |
Ates et al. | Modified monarch butterfly optimization with distribution functions and its application for 3 DOF Hover flight system | |
CN111531543B (zh) | 基于生物启发式神经网络的机器人自适应阻抗控制方法 | |
He et al. | Robust Controller Designing for an Air‐Breathing Hypersonic Vehicle with an HOSVD‐Based LPV Model | |
Abdulla et al. | Roll control system design using auto tuning LQR technique | |
CN113219842B (zh) | 基于自适应动态规划的机械臂最优跟踪控制方法、系统、处理设备、存储介质 | |
Wang et al. | Continuous time-varying feedback control of a robotic manipulator with base vibration and load uncertainty | |
Jia et al. | Data-driven active flutter control of airfoil with input constraints based on adaptive dynamic programming method | |
Mok et al. | Smoothed Functional Algorithm with Norm-limited Update Vector for Identification of Continuous-time Fractional-order Hammerstein Models | |
Sun et al. | Ascent trajectory tracking method using time-varying quadratic adaptive dynamic programming | |
Zhou et al. | An incremental approximate dynamic programming flight controller based on output feedback | |
Afshar et al. | Tennis ball trajectory estimation using GA-based fuzzy adaptive nonlinear observer | |
Hendzel et al. | Optimal Control of a Wheeled Robot | |
Hu et al. | Meta-learning-based fault-tolerant attitude control of hypersonic flight vehicle with input constraints |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |