CN114474078B - 机械臂的摩擦力补偿方法、装置、电子设备及存储介质 - Google Patents

机械臂的摩擦力补偿方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114474078B
CN114474078B CN202210380072.8A CN202210380072A CN114474078B CN 114474078 B CN114474078 B CN 114474078B CN 202210380072 A CN202210380072 A CN 202210380072A CN 114474078 B CN114474078 B CN 114474078B
Authority
CN
China
Prior art keywords
training
deep learning
learning model
mechanical arm
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210380072.8A
Other languages
English (en)
Other versions
CN114474078A (zh
Inventor
许泳
林才纺
杨远达
张校志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ji Hua Laboratory
Original Assignee
Ji Hua Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ji Hua Laboratory filed Critical Ji Hua Laboratory
Priority to CN202210380072.8A priority Critical patent/CN114474078B/zh
Publication of CN114474078A publication Critical patent/CN114474078A/zh
Application granted granted Critical
Publication of CN114474078B publication Critical patent/CN114474078B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/1641Programme controls characterised by the control loop compensation for backlash, friction, compliance, elasticity in the joints
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/161Hardware, e.g. neural networks, fuzzy logic, interfaces, processor

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及机械臂控制技术领域,具体公开了一种机械臂的摩擦力补偿方法、装置、电子设备及存储介质,其中,方法包括以下步骤:获取训练数据集;将训练数据集拆分为第一训练集和第一测试集;将第一训练集拆分为第二训练集和第二测试集;根据第二训练集和第二测试集训练获取非线性模型;设计深度学习模型,深度学习模型的目标函数具有基于非线性模型定义的正则项;根据第一训练集和第一测试集训练深度学习模型;利用训练后的深度学习模型进行摩擦力补偿;该方法将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习。

Description

机械臂的摩擦力补偿方法、装置、电子设备及存储介质
技术领域
本申请涉及机械臂控制技术领域,具体而言,涉及一种机械臂的摩擦力补偿方法、装置、电子设备及存储介质。
背景技术
机械臂运动过程存在着静摩擦、滑动摩擦、粘性摩擦等摩擦力。这些摩擦力可能会增大伺服定位系统的稳态误差,导致伺服系统运行中反复调整而产生振动,并增大高速运行时伺服系统的跟踪误差。
因此,机械臂运行控制时需要对这些摩擦力进行补偿以确保机械臂运动动作准确;现有技术中,一般采用线性模型、非线性模型进行简单地摩擦力补偿,但这些模型的补偿精度较低,因此产生了采用学习模型进行摩擦力补偿的方法,但深度学习模型训练过程存在一定的不确定性,可能导致过拟合和泛化误差增大等问题。
针对上述问题,目前尚未有有效的技术解决方案。
发明内容
本申请的目的在于提供一种机械臂的摩擦力补偿方法、装置、电子设备及存储介质,降低了深度学习模型的不确定性,解决过拟合、泛化误差增大等问题。
第一方面,本申请提供了一种机械臂的摩擦力补偿方法,用于机械臂运行控制时进行摩擦力补偿,所述方法包括以下步骤:
获取关于所述机械臂运行状态的训练数据集;
将所述训练数据集拆分为第一训练集和第一测试集;
将所述第一训练集拆分为第二训练集和第二测试集;
根据第二训练集和所述第二测试集训练获取非线性模型;
设计深度学习模型,所述深度学习模型的目标函数具有基于所述非线性模型定义的正则项;
根据所述第一训练集和所述第一测试集训练所述深度学习模型;
利用训练后的所述深度学习模型进行摩擦力补偿。
本申请的一种机械臂的摩擦力补偿方法,将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
所述的一种机械臂的摩擦力补偿方法,其中,所述获取关于所述机械臂运行状态的训练数据集的步骤包括:
获取所述机械臂运行时的实际状态参数集;
根据所述实际状态参数集及规划状态参数集获取力矩差值集;
根据所述实际状态参数及所述力矩差值集建立所述训练数据集。
所述的一种机械臂的摩擦力补偿方法,其中,所述实际状态参数集包括:机械臂负载信息、各轴位置规划信息、各轴速度规划信息、各轴反馈力矩信息及温度信息。
在该示例的一种机械臂的摩擦力补偿方法中,机械臂负载信息反映了机械臂的负载重量、位置等信息,各轴位置规划信息反映了机械臂完成指定动作时各个轴端规划的移动位置;各轴速度规划信息反映了机械臂完成指定动作时各个轴端规划的移动速度;温度信息反映了当前环境温度或机械臂温度。
所述的一种机械臂的摩擦力补偿方法,其中,所述力矩差值集为根据所述各轴反馈力矩信息及基于动力学计算的各轴规划力矩信息计算获取。
在该示例的一种机械臂的摩擦力补偿方法中,力矩差值需要根据实际输出力矩和预期输出力矩进行计算,各轴规划力矩信息为各个轴的预期输出力矩;各轴反馈力矩信息反映了机械臂各轴的实际输出力矩,预期输出力矩能根据机械臂的输入数据进行计算,主要通过机械臂负载信息、各轴位置规划信息、各轴速度规划信息进行计算。
所述的一种机械臂的摩擦力补偿方法,其中,所述根据所述第一训练集和所述第一测试集训练所述深度学习模型的步骤包括:
利用梯度下降法将所述第一训练集代入所述深度学习模型中以使所述目标函数收敛;
在所述目标函数收敛后,利用所述第一测试集验证所述深度学习模型。
所述的一种机械臂的摩擦力补偿方法,其中,所述根据第二训练集和所述第二测试集训练获取非线性模型的步骤包括:
根据所述训练数据集包含的元素类型设计初始非线性模型;
利用梯度下降法将所述第二训练集代入所述初始非线性模型中更新所述初始非线性模型;
利用所述第二测试集验证更新后的所述初始非线性模型,并在验证合格时,将所述初始非线性模型视为所述非线性模型。
所述的一种机械臂的摩擦力补偿方法,其中,所述目标函数为:
Figure DEST_PATH_IMAGE001
,其中,F为所述深度学习模型,
Figure 553784DEST_PATH_IMAGE002
为损失函数,
Figure 205345DEST_PATH_IMAGE004
为正则项,
Figure DEST_PATH_IMAGE005
为预设的正则项控制系数。
第二方面,本申请还提供了一种机械臂的摩擦力补偿装置,用于机械臂运行控制时进行摩擦力补偿,所述装置包括:
获取模块,用于获取关于所述机械臂运行状态的训练数据集;
第一分集模块,用于将所述训练数据集拆分为第一训练集和第一测试集;
第二分集模块,用于将所述第一训练集拆分为第二训练集和第二测试集;
第一训练模块,用于根据第二训练集和所述第二测试集训练获取非线性模型;
建模模块,用于设计深度学习模型,所述深度学习模型的目标函数具有基于所述非线性模型定义的正则项;
第二训练模块,用于根据所述第一训练集和所述第一测试集训练所述深度学习模型;
补偿模块,用于利用训练后的所述深度学习模型进行摩擦力补偿。
本申请的一种机械臂的摩擦力补偿装置,利用建模模块将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型通过第二训练模块进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
第三方面,本申请还提供了一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请还提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
由上可知,本申请提供了机械臂的摩擦力补偿方法、装置、电子设备及存储介质,其中,方法将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
附图说明
图1为本申请实施例提供的机械臂的摩擦力补偿方法的流程图。
图2为本申请实施例提供的机械臂的摩擦力补偿方法中的深度学习模型的神经网络示意图。
图3为本申请实施例提供的机械臂的摩擦力补偿装置的结构示意图。
图4为本申请实施例提供的电子设备的结构示意图。
附图标记:201、获取模块;202、第一分集模块;203、第二分集模块;204、第一训练模块;205、建模模块;206、第二训练模块;207、补偿模块;301、处理器;302、存储器;303、通信总线。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
第一方面,请参照图1,图1是本申请一些实施例中的一种机械臂的摩擦力补偿方法,用于机械臂运行控制时进行摩擦力补偿,方法包括以下步骤:
S1、获取关于机械臂运行状态的训练数据集;
具体地,机械臂运行过程中会产生各类运行参数,主要包括根据输入数据计算产生的规划参数以及机械臂实际运行产生的实际运行参数,前者反映了机械臂的预期运行情况,后者反映了机械臂的实际运行情况;通过分析两种情况的参数的关系能获知摩擦力对机械臂运行状态的影响,故获取训练数据集能作为本申请实施例的机械臂的摩擦力补偿方法进行摩擦力补偿的数据基础。
更具体地,对上述训练数据集进行分析能获知摩擦力对机械臂运行产生的跟踪误差的关系,本申请实施例的机械臂的摩擦力补偿方法旨在根据该关系建立并训练出合适的模型以进行摩擦力补偿。
S2、将训练数据集拆分为第一训练集和第一测试集;
具体地,训练集用于训练模型,测试集用于测试验证训练出来的模型的训练效果。
更具体地,对于模型的训练而言,足够体量的训练集才能确保模型训练能顺利执行,使得训练出来的模型能根据不同情况下产生的数据进行输出,训练完成后利用测试集对模型进行测试来验证模型是否能适用于训练集以外的数据集,从而判断模型的训练效果。
S3、将第一训练集拆分为第二训练集和第二测试集;
具体地,本申请实施例利用步骤S2-S3对训练数据集进行二次拆分,以供后续两个模型进行训练使用。
S4、根据第二训练集和第二测试集训练获取非线性模型;
具体地,采用数据量较少的第二训练集和第二测试集进行训练能快速获取一个关于摩擦力的先验物理模型,由于机械臂运行产生的跟踪误差与多个方面的摩擦力有关,因此,在本申请实施例中,步骤S4优选为获取训练过程相对简单、包含多个参数项且能初步反映摩擦力对机械臂运行影响的非线性模型。
S5、设计深度学习模型,深度学习模型的目标函数具有基于非线性模型定义的正则项;
具体地,正则项为目标函数中添加的正则化范数;正则化(regularization)是指为解决适定性问题或过拟合而加入额外信息的过程,能用于避免模型训练时产生过拟合的情况出现。
更具体地,在本申请实施例中,基于非线性模型定义正则项,能指导深度学习模型的训练方向,即在训练过程中的深度学习模型靠近非线性模型变化时,该正则项产生对应的奖励值鼓励目标函数朝该方向变化,反之产生对应的惩罚值,能有效抑制深度学习模型训练过程中的不确定性。
更具体地,非线性模型设定为正则项中一正则项参数。
S6、根据第一训练集和第一测试集训练深度学习模型;
具体地,非线性模型基于第二训练集和第二测试集进行训练而成,具有一定地先验规律,能初步反映出机械臂运行过程中摩擦力与跟踪误差的关系,在此基础上进行深度学习模型训练能使得深度学习模型朝向该先验规律的方向进行训练以提高目标函数的收率速度,有效提高模型训练效率、减小泛化误差,并防止过拟合问题出现;结合非线性模型获取深度学习模型也提高模型的分析精度。
更具体地,第一训练集由第二训练集和第二测试集组成,因此,对于第一训练集而言,训练好的非线性模型具有符合预期的输入输出关系,因此,在利用第一训练集对该深度学习模型训练的过程中,作为正则项参数的非线性模型能顺利地对深度学习模型的目标函数起到奖惩作用。
S7、利用训练后的深度学习模型进行摩擦力补偿。
具体地,训练后的深度学习模型能根据机械臂运行的各类运行参数进行计算分析,获取摩擦力相关参数或直接获取摩擦力补偿值以进行摩擦力补偿;将该训练后的深度学习模型部署在机械臂控制器中便能对机械臂进行摩擦力补偿以提高机械臂的运行精度。
更具体地,在该深度学习模型部署在机械臂控制器后,机械臂控制器能根据深度学习模型的输出结果补偿输出参数,以使机械臂实际运动动作符合预期要求,降低机械臂运动产生的跟踪误差。
本申请实施例的一种机械臂的摩擦力补偿方法,将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,并解决了过拟合、泛化误差增大等问题。
另外,非线性模型的训练过程与深度学习模型的训练过程相比较为简单,且本申请实施例中,非线性模型仅作为先验的物理模型来指导深度信息模型进行训练,其识别精度不需要太高,故本申请实施例将训练数据集进行二次拆分,减少非线性模型训练采用的数据集体量,保留第一测试集进行深度学习模型的验证,在最大限度利用训练数据集的同时加快非线性模型的训练效率。
在一些优选的实施方式中,步骤S2包括:
按照预设的第一比例将训练数据集随机拆分为第一训练集和第一测试集。
具体地,随机拆分训练数据集的过程应按组拆分元素以进行运行参数的分配,即将同一时刻产生的各个运行参数视为一组数据划分至目标集中;随机拆分指不按照每组数据的产生顺序或输入顺序而随机地将对应数据分配至第一训练集或第一测试集中,使得第一训练集和第一测试集的数据分配更均匀,从而优化模型训练效果。
在一些优选的实施方式中,预设的第一比例为8:2。
在一些优选的实施方式中,步骤S3包括:
按照预设的第二比例将第一训练集随机拆分为第二训练集和第二测试集。
在一些优选的实施方式中,预设的第二比例为8:2。
具体地,在满足训练集具有足够多的数据进行训练的情况下,还需确保测试集具有足够的数据进行测试验证,才能保证模型的训练效果;本申请实施例中,将第一比例和第二比例均设定为8:2能有效地保证模型训练效果和测试验证的准确率,使得非线性模型具有符合预期的先验特性,也使得深度学习模型能精准地辅助机械臂控制器进行摩擦力补偿。
在一些优选的实施方式中,获取关于机械臂运行状态的训练数据集的步骤包括:
S11、获取机械臂运行时的实际状态参数集;
具体地,由于本申请实施例的机械臂的摩擦力补偿方法主要用于机械臂摩擦力补偿,因此,获取的实际状态参数集中的参数类型应与机械臂运行过程中会产生的摩擦力的部位有关,或者是与对机械臂运行过程中基于摩擦力产生的跟踪误差有关。
更具体地,不同机械臂的安装结构、轴的数量、轴的类型具有一定差异,该步骤获取的实际状态参数集中的参数类型按需选择,相应地,步骤S4中的非线性模型应当按照训练数据集中的参数类型进行设定调整。
S12、根据实际状态参数集及规划状态参数集获取力矩差值集;
具体地,摩擦力引起机械臂运行的跟踪误差的过程主要表现为:摩擦力妨碍机械臂运行使得机械臂按照输入参数运行时其轴端未能产生预期大小的输出力矩而引起运动偏移,即机械臂中的摩擦力产生了摩擦力矩而影响了机械臂的输出力矩;因此,为了补偿这部分摩擦力矩,需要利用模型计算出摩擦力矩的大小,而为了计算摩擦力矩的大小则需要先计算机械臂实际输出力矩和机械臂预期输出力矩的大小,故在该步骤需要先计算出实际输出力矩和预期输出力矩之间的差值以作为模型训练的数据基础,这些差值构成了力矩差值集;值得一提的是,本申请实施例的机械臂的摩擦力补偿方法在进行摩擦力补偿时,主要是利用深度学习模型来推算机械臂运动时产生的摩擦力矩以使机械臂控制器能根据该推算的摩擦力矩调节输入参数以修正力矩,以减小机械臂运行的跟踪误差。
更具体地,由于非线性模型属于深度学习模型训练过程中的目标函数中的正则项参数,因此,步骤S4获取的非线性模型应当理解为能初步推算摩擦力矩。
S13、根据实际状态参数及力矩差值集建立训练数据集。
具体地,最终获取的深度学习模型部署在机械臂控制器中时,能根据机械臂的运行状态来推算摩擦力矩以使机械臂控制器能进行摩擦力补偿,因此,供深度学习模型训练用的训练数据集应当包含实际状态参数及力矩差值集,使得训练后的深度学习模型能根据机械臂当前的实际状态参数预测机械臂当前的力矩差值或预测摩擦力矩。
在一些优选的实施方式中,训练数据集中每个元素包含表征实际状态参数的状态向量
Figure DEST_PATH_IMAGE007
以及力矩差值y,即元素记为
Figure DEST_PATH_IMAGE009
在一些优选的实施方式中,实际状态参数集包括:机械臂负载信息、各轴位置规划信息、各轴速度规划信息、各轴反馈力矩信息及温度信息。
其中,状态向量
Figure 63711DEST_PATH_IMAGE007
包括机械臂负载信息、各轴位置规划信息、各轴速度规划信息及温度信息。
具体地,机械臂运行过程对跟踪误差影响的摩擦因素主要包括:静摩擦、滑动摩擦及粘性摩擦,其中,机械臂的负载情况、各轴需要移动到的规划位置、各轴运行过程中规划的速度以及温度属于影响上述摩擦因素的主要数据特征,因此,为了准确地构建深度学习模型来进行摩擦力补偿,需要获取机械臂负载信息、各轴位置规划信息、各轴速度规划信息及温度信息来组成状态向量
Figure 193341DEST_PATH_IMAGE007
来建立训练数据集。
更具体地,机械臂负载信息反映了机械臂的负载重量、位置等信息,各轴位置规划信息反映了机械臂完成指定动作时各个轴端规划的移动位置;各轴速度规划信息反映了机械臂完成指定动作时各个轴端规划的移动速度;温度信息反映了当前环境温度或机械臂温度。
在一些优选的实施方式中,力矩差值集为根据各轴反馈力矩信息及基于动力学计算的各轴规划力矩信息计算获取。
具体地,力矩差值y需要根据实际输出力矩和预期输出力矩进行计算,各轴规划力矩信息为各个轴的预期输出力矩;各轴反馈力矩信息反映了机械臂各轴的实际输出力矩,预期输出力矩能根据机械臂的输入数据进行计算,主要通过机械臂负载信息、各轴位置规划信息、各轴速度规划信息进行计算。
更具体地,预期输出力矩能通过根据机械臂负载信息、各轴位置规划信息、各轴速度规划信息以及机械臂自身的结构参数(如D-H参数、机械臂质量、惯性矩等)进行动力学计算得出。
在一些优选的实施方式中,步骤S11为根据预设的采样间隔采集获取机械臂运行时的实际状态参数集。
具体地,预设的采样间隔为4-10ms。
在一些优选的实施方式中,根据第一训练集和第一测试集训练深度学习模型的步骤包括:
S61、利用梯度下降法将第一训练集代入深度学习模型中以使目标函数收敛;
具体地,利用第一训练集更新深度学习模型的目标函数并使之收敛,使得深度学习模型能根据第一训练集中任一状态向量
Figure 476554DEST_PATH_IMAGE007
而推算出与对应力矩差值y关联的摩擦力矩(下面简称为预期摩擦力矩)。
更具体地,深度学习模型为前馈神经网络模型,其神经网络结构如图2所示,其每层神经网络含批量标准化层、全连接层和激活层,使得本申请实施例的深度学习模型能利用梯度下降法进行训练。
S62、在目标函数收敛后,利用第一测试集验证深度学习模型。
具体地,目标函数收敛表明深度学习模型训练到预期效果,然后对该深度学习模型输入在第一训练集以外的第一测试集的数据,并通过判断深度学习模型的输出结果是否符合预期来判断该深度学习模型是否适用于其他数据;在该深度学习模型的输出结果符合预期时,表明该深度学习模型普遍适用于对应的机械臂的应用场合来进行摩擦力补偿;在该深度学习模型的输出结果不符合预期时,需重新训练深度学习模型或对深度学习模型进行调整。
在一些优选的实施方式中,根据第二训练集和第二测试集训练获取非线性模型的步骤包括:
S41、根据训练数据集包含的元素类型设计初始非线性模型;
S42、利用梯度下降法将第二训练集代入初始非线性模型中更新初始非线性模型;
具体地,非线性模型的更新过程主要是更新其各个参数项,使得其能大致地根据第二训练集中任一状态向量
Figure 767858DEST_PATH_IMAGE007
而推算出与对应力矩差值y关联的摩擦力矩。
S43、利用第二测试集验证更新后的初始非线性模型,并在验证合格时,将初始非线性模型视为非线性模型。
具体地,利用第二训练集对非线性模型完成训练后,需要对该非线性模型输入在第二训练集以外的第二测试集的数据,并通过判断非线性模型的输出结果是否符合预期来判断该非线性模型是否适用于其他数据;在该非线性模型的输出结果符合预期时,表明该非线性模型对于由第二训练集和第二测试集组成的第一训练集而言符合先验的物理规律,即表明该非线性模型能够作为正则项参数使用;在该非线性模型的输出结果不符合预期时,需重新训练非线性模型或对非线性模型进行调整。
在一些优选的实施方式中,目标函数为:
Figure DEST_PATH_IMAGE011
,其中,F为深度学习模型,
Figure DEST_PATH_IMAGE013
为损失函数,
Figure DEST_PATH_IMAGE015
为正则项,
Figure DEST_PATH_IMAGE017
为预设的正则项控制系数。
具体地,在本申请实施例中,调节正则项控制系数
Figure 113520DEST_PATH_IMAGE017
的大小能调节非线性模型对深度学习模型的影响程度,即影响目标函数靠近非线性模型的转变效果、效率。
在本申请实施例中,正则项控制系数
Figure 781262DEST_PATH_IMAGE017
设置在0.1-0.3之间,能有效消除深度学习模型训练过程中的不确定性及过拟合、泛化误差大等问题的同时,避免非线性模型影响深度学习模型对于预期摩擦力矩的输出精度。
在一些优选的实施方式中,非线性模型为按照训练数据集中的参数类型进行设计,在本申请实施例中,步骤S41优选为将非线性模型设计为:
Figure DEST_PATH_IMAGE019
(1)
其中,
Figure DEST_PATH_IMAGE021
为非线性模型预测的摩擦力矩;
Figure DEST_PATH_IMAGE023
为最大静摩擦力矩;
Figure DEST_PATH_IMAGE025
为Coulomb(库伦)摩擦力矩;
Figure DEST_PATH_IMAGE027
为各轴速度;
Figure DEST_PATH_IMAGE029
为Stribeck(斯特里贝克)摩擦速度阈值,满足
Figure DEST_PATH_IMAGE031
Figure DEST_PATH_IMAGE033
为Coulomb摩擦速度阈值,满足
Figure DEST_PATH_IMAGE035
Figure DEST_PATH_IMAGE037
为最大静摩擦速度;
Figure DEST_PATH_IMAGE039
为粘性摩擦系数;
步骤S42主要是利用第二训练集更新
Figure 401206DEST_PATH_IMAGE023
Figure 863411DEST_PATH_IMAGE025
Figure 86582DEST_PATH_IMAGE037
Figure 292435DEST_PATH_IMAGE039
来确定该非线性模型的表现形式,其中,通过随机初始化
Figure 19083DEST_PATH_IMAGE023
Figure 917769DEST_PATH_IMAGE025
Figure 628236DEST_PATH_IMAGE037
Figure 652429DEST_PATH_IMAGE039
来建立初始状态的非线性模型。
在一些优选的实施方式中,在步骤S4训练获取非线性模型后,式(1)可以表示为
Figure 764741DEST_PATH_IMAGE021
基于单一变量
Figure 568749DEST_PATH_IMAGE007
的函数形式,故可将该非线性模型简化表示为
Figure DEST_PATH_IMAGE041
N(·)为基于式(1)及状态向量
Figure 969775DEST_PATH_IMAGE007
确定的变换函数,相当于非线性模型的简写式,使得正则项
Figure 517431DEST_PATH_IMAGE015
表示为:
Figure DEST_PATH_IMAGE043
(2)
损失函数
Figure DEST_PATH_IMAGE044
表示为:
Figure DEST_PATH_IMAGE046
(3)
其中,
Figure DEST_PATH_IMAGE048
为某一时刻深度学习模型预测的摩擦力矩,由前述内容可知,F为能根据状态向量
Figure 359616DEST_PATH_IMAGE007
预测摩擦力矩的深度学习模型,故有
Figure DEST_PATH_IMAGE050
,其中,
Figure DEST_PATH_IMAGE052
为某一时刻的状态向量;
i代表输入数据的编号下标,可以是按照时间排序或按照其所在集合中的元素顺序排序,在训练过程中,定义第一训练集为S,S中具有n(n≥2)个元素,则有i=1,2,3……,n;
式(2)和式(3)中l满足
Figure DEST_PATH_IMAGE054
,故有
Figure DEST_PATH_IMAGE056
,以及
Figure DEST_PATH_IMAGE058
,其中,
Figure DEST_PATH_IMAGE060
为某一时刻非线性模型预测的摩擦力矩,
Figure DEST_PATH_IMAGE062
为某一时刻的力矩差值。
第二方面,请参照图3,图3是本申请一些实施例中提供的一种机械臂的摩擦力补偿装置,用于机械臂运行控制时进行摩擦力补偿,装置包括:
获取模块201,用于获取关于机械臂运行状态的训练数据集;
第一分集模块202,用于将训练数据集拆分为第一训练集和第一测试集;
第二分集模块203,用于将第一训练集拆分为第二训练集和第二测试集;
第一训练模块204,用于根据第二训练集和第二测试集训练获取非线性模型;
建模模块205,用于设计深度学习模型,深度学习模型的目标函数具有基于非线性模型定义的正则项;
第二训练模块206,用于根据第一训练集和第一测试集训练深度学习模型;
补偿模块207,用于利用训练后的深度学习模型进行摩擦力补偿。
本申请实施例的一种机械臂的摩擦力补偿装置,利用建模模块205将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型通过第二训练模块206进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
在一些优选的实施方式中,本申请实施例的机械臂的摩擦力补偿装置用于执行上述第一方面提供的机械臂的摩擦力补偿方法。
第三方面,请参照图4,图4为本申请实施例提供的一种电子设备的结构示意图,本申请提供一种电子设备,包括:处理器301和存储器302,处理器301和存储器302通过通信总线303和/或其他形式的连接机构(未标出)互连并相互通讯,存储器302存储有处理器301可执行的计算机程序,当计算设备运行时,处理器301执行该计算机程序,以执行时执行上述实施例的任一可选的实现方式中的方法。
第四方面,本申请实施例提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,执行上述实施例的任一可选的实现方式中的方法。其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory, 简称SRAM),电可擦除可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory, 简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory, 简称EPROM),可编程只读存储器(Programmable Red-Only Memory, 简称PROM),只读存储器(Read-Only Memory, 简称ROM),磁存储器,快闪存储器,磁盘或光盘。
综上,本申请实施例提供了机械臂的摩擦力补偿方法、装置、电子设备及存储介质,其中,方法将根据训练数据集部分数据进行训练获取的非线性模型作为正则项参数构建深度学习模型的目标函数,使得深度学习模型进行训练时能朝向具有先验特性的非线性模型进行学习,从而提高了深度学习模型的训练效率,提高学习精度,极大地降低了深度学习模型的不确定性,解决了过拟合、泛化误差增大等问题。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种机械臂的摩擦力补偿方法,用于机械臂运行控制时进行摩擦力补偿,其特征在于,所述方法包括以下步骤:
获取关于所述机械臂运行状态的训练数据集;
将所述训练数据集拆分为第一训练集和第一测试集;
将所述第一训练集拆分为第二训练集和第二测试集;
根据第二训练集和所述第二测试集训练获取非线性模型;
设计深度学习模型,所述深度学习模型的目标函数具有基于所述非线性模型定义的正则项;
根据所述第一训练集和所述第一测试集训练所述深度学习模型;
利用训练后的所述深度学习模型进行摩擦力补偿。
2.根据权利要求1所述的一种机械臂的摩擦力补偿方法,其特征在于,所述获取关于所述机械臂运行状态的训练数据集的步骤包括:
获取所述机械臂运行时的实际状态参数集;
根据所述实际状态参数集及规划状态参数集获取力矩差值集;
根据所述实际状态参数集 及所述力矩差值集建立所述训练数据集。
3.根据权利要求2所述的一种机械臂的摩擦力补偿方法,其特征在于,所述实际状态参数集包括:机械臂负载信息、各轴位置规划信息、各轴速度规划信息、各轴反馈力矩信息及温度信息。
4.根据权利要求3所述的一种机械臂的摩擦力补偿方法,其特征在于,所述力矩差值集为根据所述各轴反馈力矩信息及基于动力学计算的各轴规划力矩信息计算获取。
5.根据权利要求1所述的一种机械臂的摩擦力补偿方法,其特征在于,所述根据所述第一训练集和所述第一测试集训练所述深度学习模型的步骤包括:
利用梯度下降法将所述第一训练集代入所述深度学习模型中以使所述目标函数收敛;
在所述目标函数收敛后,利用所述第一测试集验证所述深度学习模型。
6.根据权利要求1所述的一种机械臂的摩擦力补偿方法,其特征在于,所述根据第二训练集和所述第二测试集训练获取非线性模型的步骤包括:
根据所述训练数据集包含的元素类型设计初始非线性模型;
利用梯度下降法将所述第二训练集代入所述初始非线性模型中更新所述初始非线性模型;
利用所述第二测试集验证更新后的所述初始非线性模型,并在验证合格时,将所述初始非线性模型视为所述非线性模型。
7.根据权利要求1所述的一种机械臂的摩擦力补偿方法,其特征在于,所述目标函数为:
Figure DEST_PATH_IMAGE002
,其中,F为所述深度学习模型,
Figure DEST_PATH_IMAGE004
为损失函数,
Figure DEST_PATH_IMAGE006
为正则项,
Figure DEST_PATH_IMAGE008
为预设的正则项控制系数。
8.一种机械臂的摩擦力补偿装置,用于机械臂运行控制时进行摩擦力补偿,其特征在于,所述装置包括:
获取模块,用于获取关于所述机械臂运行状态的训练数据集;
第一分集模块,用于将所述训练数据集拆分为第一训练集和第一测试集;
第二分集模块,用于将所述第一训练集拆分为第二训练集和第二测试集;
第一训练模块,用于根据第二训练集和所述第二测试集训练获取非线性模型;
建模模块,用于设计深度学习模型,所述深度学习模型的目标函数具有基于所述非线性模型定义的正则项;
第二训练模块,用于根据所述第一训练集和所述第一测试集训练所述深度学习模型;
补偿模块,用于利用训练后的所述深度学习模型进行摩擦力补偿。
9.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-7任一项所述方法中的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-7任一项所述方法中的步骤。
CN202210380072.8A 2022-04-12 2022-04-12 机械臂的摩擦力补偿方法、装置、电子设备及存储介质 Active CN114474078B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210380072.8A CN114474078B (zh) 2022-04-12 2022-04-12 机械臂的摩擦力补偿方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210380072.8A CN114474078B (zh) 2022-04-12 2022-04-12 机械臂的摩擦力补偿方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114474078A CN114474078A (zh) 2022-05-13
CN114474078B true CN114474078B (zh) 2022-06-17

Family

ID=81487492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210380072.8A Active CN114474078B (zh) 2022-04-12 2022-04-12 机械臂的摩擦力补偿方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114474078B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115091470B (zh) * 2022-08-18 2022-11-18 季华实验室 摩擦力补偿模型训练方法、装置、电子设备和存储介质
CN117984334B (zh) * 2024-04-03 2024-05-28 泓浒(苏州)半导体科技有限公司 一种自适应晶圆机械臂力矩调整系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428317A (zh) * 2020-04-06 2020-07-17 宁波智诚祥科技发展有限公司 一种基于5g和循环神经网络的关节摩擦力矩补偿方法
CN111639749A (zh) * 2020-05-25 2020-09-08 上海智殷自动化科技有限公司 一种基于深度学习的工业机器人摩擦力辨识方法
CN114074332A (zh) * 2022-01-19 2022-02-22 季华实验室 一种摩擦力补偿方法、装置、电子设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3975065A1 (en) * 2020-09-25 2022-03-30 Dassault Systèmes Deep-learning generative model

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428317A (zh) * 2020-04-06 2020-07-17 宁波智诚祥科技发展有限公司 一种基于5g和循环神经网络的关节摩擦力矩补偿方法
CN111639749A (zh) * 2020-05-25 2020-09-08 上海智殷自动化科技有限公司 一种基于深度学习的工业机器人摩擦力辨识方法
CN114074332A (zh) * 2022-01-19 2022-02-22 季华实验室 一种摩擦力补偿方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN114474078A (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN114474078B (zh) 机械臂的摩擦力补偿方法、装置、电子设备及存储介质
CN112445131A (zh) 一种线性系统自适应最优跟踪控制方法
CN112207834B (zh) 一种基于干扰观测器的机器人关节系统控制方法及系统
CN109188907A (zh) 一种应用于稳定平台控制系统的遗传退火粒子群混合算法及其稳定平台控制系统
CN111273544A (zh) 基于预测rbf前馈补偿型模糊pid的雷达俯仰运动控制方法
Abouheaf et al. Online model‐free reinforcement learning for the automatic control of a flexible wing aircraft
CN112416021A (zh) 一种基于学习的旋翼无人机路径跟踪预测控制方法
CN114290339B (zh) 基于强化学习和残差建模的机器人现实迁移方法
CN113985732B (zh) 针对飞行器系统的自适应神经网络控制方法及装置
CN109062040A (zh) 基于系统嵌套优化的预测pid方法
CN116627157A (zh) 一种运载火箭的运行控制方法、装置及设备
Malekzadeh et al. Hardware-in-the-loop attitude control via a high-order sliding mode controller/observer
Ates et al. Modified monarch butterfly optimization with distribution functions and its application for 3 DOF Hover flight system
CN111531543B (zh) 基于生物启发式神经网络的机器人自适应阻抗控制方法
He et al. Robust Controller Designing for an Air‐Breathing Hypersonic Vehicle with an HOSVD‐Based LPV Model
Abdulla et al. Roll control system design using auto tuning LQR technique
CN113219842B (zh) 基于自适应动态规划的机械臂最优跟踪控制方法、系统、处理设备、存储介质
Wang et al. Continuous time-varying feedback control of a robotic manipulator with base vibration and load uncertainty
Jia et al. Data-driven active flutter control of airfoil with input constraints based on adaptive dynamic programming method
Mok et al. Smoothed Functional Algorithm with Norm-limited Update Vector for Identification of Continuous-time Fractional-order Hammerstein Models
Sun et al. Ascent trajectory tracking method using time-varying quadratic adaptive dynamic programming
Zhou et al. An incremental approximate dynamic programming flight controller based on output feedback
Afshar et al. Tennis ball trajectory estimation using GA-based fuzzy adaptive nonlinear observer
Hendzel et al. Optimal Control of a Wheeled Robot
Hu et al. Meta-learning-based fault-tolerant attitude control of hypersonic flight vehicle with input constraints

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant