CN114976802A - 射频连接器自适应装配方法及系统 - Google Patents

射频连接器自适应装配方法及系统 Download PDF

Info

Publication number
CN114976802A
CN114976802A CN202210499879.3A CN202210499879A CN114976802A CN 114976802 A CN114976802 A CN 114976802A CN 202210499879 A CN202210499879 A CN 202210499879A CN 114976802 A CN114976802 A CN 114976802A
Authority
CN
China
Prior art keywords
electric connector
network
target
socket
contact force
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210499879.3A
Other languages
English (en)
Other versions
CN114976802B (zh
Inventor
刘清昊
胡贺南
王世龙
钱晓硕
田威
王长瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202210499879.3A priority Critical patent/CN114976802B/zh
Publication of CN114976802A publication Critical patent/CN114976802A/zh
Application granted granted Critical
Publication of CN114976802B publication Critical patent/CN114976802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01RELECTRICALLY-CONDUCTIVE CONNECTIONS; STRUCTURAL ASSOCIATIONS OF A PLURALITY OF MUTUALLY-INSULATED ELECTRICAL CONNECTING ELEMENTS; COUPLING DEVICES; CURRENT COLLECTORS
    • H01R43/00Apparatus or processes specially adapted for manufacturing, assembling, maintaining, or repairing of line connectors or current collectors or for joining electric conductors
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明提供了一种射频连接器自适应装配方法及系统,为实现射频连接器的自适应装配,一方面,本发明提供了一种结合双目相机识别电连接器插座初始位姿与通过力控制微调电连接器位姿的射频电连接器自适应装配方法,实现了电连接器装配的精确力控,提升了电连接器的装配效果,有效降低了电连接器与插座间的姿态误差。另一方面,本发明还提供了一种基于强化学习的变阻抗控制方法,实现了接触力的准确控制,降低了接触力的跟踪误差,优化了电连接器插装过程中的接触力控制。

Description

射频连接器自适应装配方法及系统
技术领域
本发明涉及机器人柔性控制领域,尤其涉及一种射频连接器自适应装配方法及系统。
背景技术
射频连接器作为阵列天线中信号传输的关键零件,具有尺寸小、装配精度要求高、数量众多,现有射频电连接器装配依靠工人实施,然而人工装配的装配质量一致性差,装配效率低以及装配一次成功率低,严重制约了阵列天线的产品质量与生产效率。
当前的自动化装配方法以提高装配设备的定位精度为主,但是缺少对电连接器插座位姿误差的补偿,并且仅依靠视觉的定位过程会受到视觉遮挡、照明条件等问题的影响,影响射频连接器的插装成功效率。
发明内容
发明目的:提出一种射频连接器自适应装配方法,并进一步提出一种用于实现上述方法的系统,以解决现有技术存在的上述问题。
一种射频连接器自适应装配方法及系统,该方法步骤如下:
步骤S100,由双目相机拍照获取电连接器插座的初始位姿信息,驱动高精度三轴模组平台运动,完成电连接器与电连接器插座的初始位姿对准;
步骤S200,执行电连接器-插座装配策略,根据传感器信息与离线数据库精确电连接器与插座间的相对位姿误差,并做出补偿;
步骤S300,基于所述六维力传感器信息,通过基于强化学习的变阻抗控制器控制接触力对剩余的位姿误差进行柔顺补偿,将电连接器与电连接器插座进行装配。
所述电连接器装配策略基于电连接器-插座接触模型得到,接触模型假设为:
(1)电连接器刚度远小于夹持器刚度,装配过程中夹持器与电连接器插座为刚性,在装配过程中只有电连接器发生弹性变形;
(2)电连接器插装过程为准静态过程,忽略装配过程中运动加速度产生的惯性力作用。
基于所述的电连接器-插座接触模型,提供了一种电连接器-插座装配策略包括:
(1)双目相机拍照,获取电连接器插座初始位姿,驱动高精度三轴模组移动,初步对准电连接器与电连接器插座;
(2)初始位置对准后,电连接器夹持器向下移动,实时监测力传感器信息,若径向接触力大于径向接触力阈值则进入步骤(3),否则进入步骤(4);
(3)根据力传感器信息,调整x、y方向位置,至x、y轴方向接触力小于径向接触力阈值,则进入步骤(4);
(4)电连接器夹持器下移,监测z轴力传感器信息,若z轴方向接触力小于插装力阈值则进入步骤(6),否则进入步骤(5);
(5)由所述接触模型,将电连接器位姿向步骤(1)中得到的电连接器姿态方向偏转至轴向插装力小于阈值则进入步骤(6);
(6)电连接器夹持器下移,由所述变阻抗控制器控制插装过程中的插装力跟踪确定好的电连接器插装工艺参数;
(7)电连接装配任务结束;
所述装配策略中的轴向力阈值与径向力阈值通过离线实验中测量电连接器-插座不同相对姿态误差下的轴向力确定。
所述的基于强化学习的变阻抗控制器目的是通过在装配任务中不断与环境交互,改进控制器的表现性能,实现较小的跟踪力误差,最终很好地完成电连接器装配任务,所述变阻抗控制器为:
变阻抗控制器根据控制系统状态即机械臂的实际位置、实际速度、加速度与实际接触力实时更新目标阻尼参数;
进一步,变阻抗控制器根据系统状态、预先设置的目标惯性参数与所述计算得到的目标阻尼参数由阻抗控制关系得到期望轨迹的修正值,修正机械臂的期望轨迹。
在现有阻抗控制基础上,所述基于强化学习变阻抗控制器的射频电连接器的装配方法包括如下步骤:
(1)根据射频电连接器的刚度变化范围初始化变阻抗控制器参数u=[md,bd(t)],其中md为目标惯性参数、bd(t)为目标阻尼参数,bd(t)是变阻抗控制器的控制变量;
(2)基于强化学习框架获得当前状态S的最优动作输出bd(t);
(3)基于确定性策略梯度算法搜索最优阻抗控制策略π(s;θ),对π(s;θ)进行更新;
(4)使用更新后的最优阻抗控制策略π(s;θ)进行力控制,同时采集新的状态数据S;
(5)重复步骤(2-4)至控制器达到满意的力跟踪效果,得到满意的控制策略。
所述方法的强化学习框架包括评价网络、目标评价网络、动作网络和目标动作网络。
所述评价网络通过最小化损失函数L更新评价网络参数w来训练自身:
Figure BDA0003629148490000031
其中L(w)表示损失函数,q(st,at;w)表示价值函数由评价网络实现,q(st+1,a′t+1;w-)表示目标价值函数由目标评价网络实现,rt表示t时刻环境反馈的奖励由奖励函数生成,γ为超参数,表示折扣率来平衡即时回报与未来回报,γ∈[0,1],a′t+1=π(st+1,θ-),a′t+1为目标动作网络的输出值;
所述动作网络通过确定性梯度上升法来更新动作网络来优化动作策略,进而得到最优的目标阻尼参数变化规律:
Figure BDA0003629148490000032
其中π(st,θ)为策略函数由动作网络实现,β为学习率;
所述目标动作网络与目标评价网络分别与动作网络和评价网络具有相同的网络结构;
所述目标动作网络与目标评价网路的参数更新方式为:
w-=τw+(1-τ)w-,θ-=τθ+(1-τ)θ-
其中τ为超参数,τ∈[0,1];
所述强化学习框架中q(st,at;w)、π(s;θ)、q(st+1,a′t+1;w-)、π(st+1,θ-)、rt的具体实现包括:
(1)设置状态空间、设计网络结构与设计奖励函数,状态空间设置为:
Figure BDA0003629148490000033
其中Δx,
Figure BDA0003629148490000034
Δf
Figure BDA0003629148490000035
分别表示机械臂在接触空间中的位移、速度、加速度、实际接触力与期望接触力误差以及实际接触力与期望接触力误差的变化率;
(2)网络结构设计为:
动作网络:由特征提取层-全连接器层-全连接器层-tanh激活层-缩放层构成,其中特征提取层接受状态向量输入,缩放层对tanh层后的动作值进行缩放使输出的动作值可以保证变阻尼控制器的稳定性;
评价网路:由特征提取层-全连接层-全连接层与特征提取层-全连接器层组合成,两特征提取层分别接受状态向量输入与动作网络输出;
目标动作网络与目标评价网络分别与动作网络与评价网络具有相同的网络结构但具有不同的网络参数;
预处理网络:力传感器得到的力/力矩信息中存在噪声,设置卡尔曼滤波网络对传感器得到的信息进行滤波处理,降低噪声影响。
(3)奖励函数设置为:
Figure BDA0003629148490000041
其中,Q1,Q2,Q3,Q4分别为接触力误差、接触力与接触力变化率综合项、接触力与机械臂广义加速度综合项以及接触力误差阈值与接触力误差差值的奖励权重,Ulimt表示期望接触力误差的阈值,Ulimt越小表示训练期望的接触力误差越小,但是训练回合将增加,训练时间变长;
所述基于强化学习的变阻抗控制器为基于位置的阻抗控制器,由反馈的接触力误差与经强化学习得到的动态变化的阻抗控制关系得到期望轨迹的修正量Δxr,进而得到修正后的机械臂轨迹;
变阻抗控制器的具体形式为:
Figure BDA0003629148490000042
其中
Figure BDA0003629148490000043
分别为机械臂实际加速度、期望加速度、实际速度与期望速度,Ω(t)为对环境不确定部分的补偿量,b为目标阻尼参数的初始值。
Ω(t)的变化规律由式
Figure BDA0003629148490000044
确定,其中σ为补偿量的更新率,T为补偿量的更新周期;
更新率σ的变化规律由所述强化学习算法在装配过程中与环境不断交互的过程中得到,具体的为所述强化学习算法中的动作网络输出。
进一步地,期望轨迹修正后的控制量xc为:
Figure BDA0003629148490000045
与现有射频电连接器装配方法相比,本发明提供的方法可以取得下列有益效果:
(1)本发明提供了一种结合视觉与力觉控制的射频电连接器插装方法,视觉用于获取电连接器插座的基本位姿信息,主要为其空间位姿方向,进一步的通过接触力反馈,基于实验建立的离线数据库精确两者间的相对位姿信息,降低了装配误差,实现了电连接器高的精密装配。
(2)本发明提供了一种基于强化学习的变阻抗控制方法,通过在装配过程中不断与环境交互学习目标阻尼参数的变化规律,提高了电连接器装配过程中的力控制效果,避免了因装配过程中刚度突变、刚度不确定与位置不确定引起的接触力超调并大大减小了接触力跟踪误差,装配力控制更加准确。
附图说明
图1是本发明提供的射频电连接器-插座装配策略流程图。
图2是本发明提供的基于强化学习变阻抗控制的整体示意图。
图3是本发明提供的深度强化学习的框架示意图。
图4是本发明提供的基于强化学习的变阻抗控制框图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。
本发明实例第一方面,提供了一种射频电连接器的装配方法,包括以下步骤:
步骤S1,由单目相机拍照获取电连接器插座的初始位置信息,驱动高精度三轴模组平台运动,完成电连接器与电连接器插座的初始位置对准;
步骤S2,执行电连接器-插座装配策略,根据传感器信息与离线数据库精确电连接器与插座间的相对位姿误差;
步骤S3,基于所述六维力传感器信息,通过基于强化学习的变阻抗控制器控制插装过程中的接触力对剩余的误差进行柔顺补偿将电连接器与电连接器插座进行装配;
具体的,如图1所示,所述装配方法包括:
(1)单目相机拍照,获取电连接器插座位置,驱动高精度三轴模组移动,初步对准电连接器与电连接器插座;
(2)初始位置对准后,电连接器夹持器向下移动,实时监测力传感器信息,若径向接触力大于径向接触力阈值则进入步骤(3),否则进入步骤(4);
(3)根据力传感器信息,调整x、y方向位置,至x、y轴方向接触力小于径向接触力阈值,则进入步骤(4);
(4)电连接器夹持器下移,监测z轴力传感器信息,若z轴方向接触力小于插装力阈值则进入步骤(6),否则进入步骤(5);
(5)由所述接触模型,将电连接器位姿向力矩变化量增大的方向偏转至z轴方向插装力小于插装力阈值,则进入步骤(6);
(6)电连接器夹持器下移,由所述变阻抗控制器控制插装过程中的插装力跟踪确定好的电连接器插装工艺参数;
(7)电连接装配任务结束。
本发明实例所述方法,依据装配工艺流程,将装配过程分为自由空间阶段、寻孔阶段、倒角阶段、孔内阶段以及装配完成五个阶段,通过双目视觉获取了插座的位姿基本信息,通过对倒角阶段的装配力分析并离线采集相关的实验数据,进一步精确了电连接器与插座间的相对位姿关系,在此基础上,提出融合视觉与力觉的射频电连接器装配策略,有效降低了装配后电连接器与插座间的相对位姿误差,提高了射频电连接器的装配质量。
具体的所述的装配五个阶段中,各阶段包含以下内容:
S1:自由空间阶段采取双目视觉相机获得电连接器插座轴线的空间位姿信息。
S2:寻孔阶段采取变阻抗控制根据电连接器-插座接触力模型对视觉定位及机器人定位的位置误差进行补偿,使电连接器进入倒角接触阶段。
S3:倒角阶段根据双目视觉确定的基本位姿信息与通过离线实验建立的数据库获得电连接器与插座间更精确的相对位姿信息,以小步距对电连接器位姿进行微调,使轴向接触力与径向接触力均小于确定好的接触力阈值。
S4.孔内及装配完成阶段采取变阻抗控制控制装配接触力并根据接触力反馈确定电连接器装配是否到位。
本发明实例的第二方面,如图2所示,提供了一种基于深度强化学习的变阻抗控制方法。
所述的基于强化学习的变阻抗控制器目的是通过在装配任务中不断与环境交互,改进控制器的表现性能,实现较小的跟踪力误差,最终很好地完成电连接器装配任务,所述变阻抗控制器为:
如图2所示,变阻抗控制器将控制系统状态即机械臂的实际位置、速度、加速度与环境接触力作为通过离线训练得到的动作神经网络输入,输出为目标阻尼参数的更新率大小,并结合目标阻尼参数自适应更新率得到下一控制周期的目标阻尼参数;
进一步,变阻抗控制器根据系统状态、预先设置的目标惯性参数与所述计算得到的目标阻尼参数由阻抗控制关系得到期望轨迹的修正值,修正机械臂的期望轨迹。
所述基于强化学习变阻抗控制器的射频电连接器的装配方法包括如下步骤:
(1)根据射频电连接器的刚度变化范围初始化变阻抗控制器参数u=[md,bd(t)],其中md为目标惯性参数、bd(t)为目标阻尼参数,bd(t)是变阻抗控制器的控制变量;
(2)基于强化学习框架获得当前状态S的最优动作输出bd(t);
(3)基于确定性策略梯度算法搜索最优阻抗控制策略π(s;θ),对π(s;θ)进行更新;
(4)使用更新后的最优阻抗控制策略π(s;θ)进行力控制,同时采集新的状态数据S;
(5)重复步骤(2-4)至控制器达到满意的力跟踪效果,得到满意的控制策略。
如图3所示,所述深度强化学习框架包括评价网络、目标评价网络、动作网络和目标动作网络。
所述评价网络通过最小化损失函数L更新评价网络参数w来训练自身:
Figure BDA0003629148490000071
其中L(w)表示损失函数,q(st,at;w)表示价值函数由评价网络实现,q(st+1,a′t+1;w-)表示目标价值函数由目标评价网络实现,rt表示t时刻环境反馈的奖励由奖励函数生成,γ为超参数,表示折扣率来平衡即时回报与未来回报,γ∈[0,1],a′t+1=π(st+1,θ-),a′t+1为目标动作网络的输出值;
所述动作网络通过确定性梯度上升法来更新动作网络来优化动作策略,进而得到最优的目标阻尼参数变化规律:
Figure BDA0003629148490000072
其中π(st,θ)为策略函数由动作网络实现,β为学习率;
所述目标动作网络与目标评价网络分别与动作网络和评价网络具有相同的网络结构;
所述目标动作网络与目标评价网路的参数更新方式为:
w-=τw+(1-τ)w-,θ-=τθ+(1-τ)θ-
其中τ为超参数,τ∈[0,1];
所述强化学习框架中q(st,at;w)、π(s;θ)、q(st+1,a′t+1;w-)、π(st+1,θ-)、rt的具体实现包括:
(1)设置状态空间、设计网络结构与设计奖励函数,状态空间设置为:
Figure BDA0003629148490000081
其中Δx,
Figure BDA0003629148490000082
Δf
Figure BDA0003629148490000083
分别表示机械臂在接触空间中的位移、速度、加速度、实际接触力与期望接触力误差以及实际接触力与期望接触力误差的变化率;
(2)网络结构设计为:
动作网络:由特征提取层-全连接器层-全连接器层-tanh激活层-缩放层构成,其中特征提取层接受状态向量输入,缩放层对tanh激活层后的动作值进行缩放使输出的动作值可以保证变阻尼控制器的稳定性;
评价网路:由特征提取层-全连接层-全连接层与特征提取层-全连接器层组合成,两特征提取层分别接受状态向量输入与动作网络输出;
目标动作网络与目标评价网络分别与动作网络与评价网络具有相同的网络结构但具有不同的网络参数;
预处理网络:力传感器得到的力/力矩信息中存在噪声,设置卡尔曼滤波网络对传感器得到的信息进行滤波处理,降低噪声影响。
(3)奖励函数设置为:
Figure BDA0003629148490000084
其中,Q1,Q2,Q3,Q4分别为接触力误差、接触力与接触力变化率综合项、接触力与机械臂广义加速度综合项以及接触力误差阈值与接触力误差差值的奖励权重,Ulimt表示期望接触力误差的阈值,Ulimt越小表示训练期望的接触力误差越小,但是训练回合将增加,训练时间变长;
所述奖励函数的设置综合虑了阻抗控制不同阶段的接触力特点,具体的:
-Q1Δf2主要考虑了力控制的稳态力误差,
Figure BDA0003629148490000091
主要考虑了接触阶段抑制接触力超调,
Figure BDA0003629148490000092
主要考虑了由于环境不确定或时变引起的接触力跟踪误差,而Q4(Ulimt-|Δf|)是对跟踪力误差满足阈值要求时的奖励项;
所述基于强化学习的变阻抗控制器为基于位置的阻抗控制器,由反馈的接触力误差与经强化学习得到的动态变化的阻抗控制关系得到期望轨迹的修正量Δxr,进而得到修正后的机械臂轨迹;
如图4所示,变阻抗控制器的具体形式为:
Figure BDA0003629148490000093
其中
Figure BDA0003629148490000094
分别为机械臂实际加速度、期望加速度、实际速度与期望速度,Ω(t)为对环境不确定部分的补偿量,b为目标阻尼参数的初始值。
Ω(t)的变化规律由式
Figure BDA0003629148490000095
确定,其中σ为补偿量的更新率,T为Ω(t)的更新周期;
更新率σ由所述强化学习算法在装配过程中与环境不断交互的过程中得到,具体的为所述强化学习算法中的动作网络输出。
进一步地,期望轨迹修正后的控制量xc为:
Figure BDA0003629148490000096
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上做出各种变化。

Claims (10)

1.射频连接器自适应装配方法,其特征在于,包括如下步骤:
S100,由双目相机拍照获取电连接器插座的初始位姿信息,驱动高精度三轴模组平台运动,完成电连接器与电连接器插座的初始位姿对准;
S200,执行电连接器-插座装配策略,根据传感器信息与离线数据库精确电连接器与插座间的相对位姿误差,并做出补偿;
S300,通过基于强化学习的变阻抗控制器控制接触力对剩余的位姿误差进行柔顺补偿,将电连接器与电连接器插座进行装配。
2.根据权利要求1所述的射频连接器自适应装配方法,其特征在于,步骤S200中执行电连接器-插座装配策略的过程进一步包括:
S201、双目相机拍照,获取电连接器插座初始位姿,驱动高精度三轴模组移动,初步对准电连接器与电连接器插座;
S202、初始位置对准后,电连接器夹持器向下移动,实时监测力传感器信息,若径向接触力大于径向接触力阈值则进入步骤S203,否则进入步骤S204;
S203、根据力传感器信息,调整x、y方向位置,至x、y轴方向接触力小于径向接触力阈值,则进入步骤S204;
S204、电连接器夹持器下移,监测z轴力传感器信息,若z轴方向接触力小于插装力阈值则进入步骤S206,否则进入步骤S205;
S205、由所述电连接器-插座接触模型,将电连接器位姿向步骤S201中得到的电连接器姿态方向偏转至轴向插装力小于阈值则进入步骤S206;
S206、电连接器夹持器下移,由所述变阻抗控制器控制插装过程中的插装力跟踪确定好的电连接器插装工艺参数;
S207、电连接装配任务结束。
3.根据权利要求1所述的射频连接器自适应装配方法,其特征在于,所述变阻抗控制器根据系统状态、预先设置的目标惯性参数、以及计算得到的目标阻尼参数,由阻抗控制关系得到期望轨迹的修正值,修正机械臂的期望轨迹。
4.根据权利要求3所述的射频连接器自适应装配方法,其特征在于,步骤S300进一步包括:
S301、根据射频电连接器的刚度变化范围初始化变阻抗控制器参数u=[md,bd(t)],其中,md为目标惯性参数、bd为目标阻尼参数,bd(t)是变阻抗控制器的控制变量;
S302、基于强化学习框架获得当前状态的最优动作输出bd(t);
S303、基于确定性策略梯度算法搜索最优阻抗控制策略π(s;θ),对π(s;θ)进行更新;
其中,s表示系统状态向量,θ表示动作网络参数;
S304、使用更新后的最优阻抗控制策略π(s;θ)进行力控制,同时采集新的状态数据S;
S305、重复步骤S302至步骤S304,直至控制器达到满意的力跟踪效果,得到满意的控制策略。
5.根据权利要求4所述的射频连接器自适应装配方法,其特征在于,步骤S302中所述强化学习框架包括:
评价网络,通过最小化损失函数L更新评价网络参数w来训练自身:
Figure FDA0003629148480000021
其中,L(w)表示损失函数,st表示t时刻采样时的系统状态向量,at表示t时刻动作网络输出,w表示评价网络参数,w-表示目标评价网络参数,st+1表示t+1时刻采样时的系统状态向量,q(st,at;w)表示价值函数由评价网络实现,q(st+1,a′t+1;w-)表示目标价值函数由目标评价网络实现,rt表示t时刻环境反馈的奖励由奖励函数生成,γ为超参数,表示折扣率来平衡即时回报与未来回报,γ∈[0,1],a′t+1=π(st+1,θ-),a′t+1为目标动作网络的输出值,θ-表示目标动作网络的参数;
动作网络,通过确定性梯度上升法来更新动作网络来优化动作策略,进而得到最优的目标阻尼参数变化规律:
Figure FDA0003629148480000022
其中,π(st,θ)为最优阻抗控制策略函数,由动作网络实现,β为学习率,θ表示动作网络的参数,w表示评价网络的参数,
Figure FDA0003629148480000023
表示动作网络对其参数偏导,
Figure FDA0003629148480000024
表示评价网络对其参数偏导;
目标动作网络,与所述动作网络的结构一致;
目标评价网络,与所述评价网络的结构一致。
6.根据权利要求4所述的射频连接器自适应装配方法,其特征在于,所述变阻抗控制器的具体形式为:
Figure FDA0003629148480000031
其中,
Figure FDA0003629148480000032
Figure FDA0003629148480000033
分别为机械臂实际加速度、期望加速度、实际速度与期望速度,Ω(t)为对环境不确定部分的补偿量,b为目标阻尼参数的初始值;
Ω(t)的变化规律由式
Figure FDA0003629148480000034
确定,其中σ为补偿量的更新率,由所述强化学习算法在装配过程中与环境不断交互的过程中得到,T为补偿量的更新周期,fd表示期望接触力,fe表示传感器读取到的接触力信息。
7.根据权利要求6所述的射频连接器自适应装配方法,其特征在于,k时刻期望轨迹修正后的控制量xc为:
Figure FDA0003629148480000035
式中,bd为目标阻尼参数,md为目标惯性参数,其余各符号含义同上。
8.射频连接器自适应装配系统,用于执行并实现如权利要求1至7任一项所述的自适应装配方法,其特征在于,所述系统包括:
目视模块,用于拍照获取电连接器插座的初始位姿信息,驱动高精度三轴模组平台运动,完成电连接器与电连接器插座的初始位姿对准;
执行模块,用于执行电连接器-插座装配策略,根据传感器信息与离线数据库精确电连接器与插座间的相对位姿误差,并做出补偿;
补偿模块,通过基于强化学习的变阻抗控制器控制接触力对剩余的位姿误差进行柔顺补偿,将电连接器与电连接器插座进行装配。
9.射频连接器自适应装配设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
至少一个处理器执行所述存储器存储的计算机执行指令,使得至少一个处理器执行如权利要求1至7中任一项所述的射频连接器自适应装配方法。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至7中任一项所述的射频连接器自适应装配方法。
CN202210499879.3A 2022-05-06 2022-05-06 射频连接器自适应装配方法及系统 Active CN114976802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210499879.3A CN114976802B (zh) 2022-05-06 2022-05-06 射频连接器自适应装配方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210499879.3A CN114976802B (zh) 2022-05-06 2022-05-06 射频连接器自适应装配方法及系统

Publications (2)

Publication Number Publication Date
CN114976802A true CN114976802A (zh) 2022-08-30
CN114976802B CN114976802B (zh) 2023-11-03

Family

ID=82982054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210499879.3A Active CN114976802B (zh) 2022-05-06 2022-05-06 射频连接器自适应装配方法及系统

Country Status (1)

Country Link
CN (1) CN114976802B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4482220A (en) * 1980-08-09 1984-11-13 Ernst Leitz Wetzlar Gmbh Device for correctively compensating the aperture error in reproducing systems
CN103153553A (zh) * 2010-08-27 2013-06-12 Abb研究有限公司 视觉引导对准系统和方法
CN103288039A (zh) * 2013-05-24 2013-09-11 中国科学院自动化研究所 微零件装配系统及相应的在线装配方法
CN106272416A (zh) * 2016-08-29 2017-01-04 上海交通大学 基于力觉和视觉的机器人细长轴精密装配系统及方法
CN106335057A (zh) * 2016-09-27 2017-01-18 东南大学 一种基于实时力控的装配机器人全空间柔顺插孔控制方法
CN106584093A (zh) * 2015-10-20 2017-04-26 沈阳新松机器人自动化股份有限公司 工业机器人自我装配系统及方法
CN108972557A (zh) * 2018-08-16 2018-12-11 中国科学院自动化研究所 微零件位姿自动对准装置及其方法
CN109591013A (zh) * 2018-12-12 2019-04-09 山东大学 一种柔性装配仿真系统及其实现方法
CN111752231A (zh) * 2019-03-28 2020-10-09 华南理工大学 基于自适应力和姿态控制的自动化端子装配方法
CN112631128A (zh) * 2020-11-27 2021-04-09 广东省科学院智能制造研究所 一种多模异构信息融合的机器人装配技能学习方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4482220A (en) * 1980-08-09 1984-11-13 Ernst Leitz Wetzlar Gmbh Device for correctively compensating the aperture error in reproducing systems
CN103153553A (zh) * 2010-08-27 2013-06-12 Abb研究有限公司 视觉引导对准系统和方法
CN103288039A (zh) * 2013-05-24 2013-09-11 中国科学院自动化研究所 微零件装配系统及相应的在线装配方法
CN106584093A (zh) * 2015-10-20 2017-04-26 沈阳新松机器人自动化股份有限公司 工业机器人自我装配系统及方法
CN106272416A (zh) * 2016-08-29 2017-01-04 上海交通大学 基于力觉和视觉的机器人细长轴精密装配系统及方法
CN106335057A (zh) * 2016-09-27 2017-01-18 东南大学 一种基于实时力控的装配机器人全空间柔顺插孔控制方法
CN108972557A (zh) * 2018-08-16 2018-12-11 中国科学院自动化研究所 微零件位姿自动对准装置及其方法
CN109591013A (zh) * 2018-12-12 2019-04-09 山东大学 一种柔性装配仿真系统及其实现方法
CN111752231A (zh) * 2019-03-28 2020-10-09 华南理工大学 基于自适应力和姿态控制的自动化端子装配方法
CN112631128A (zh) * 2020-11-27 2021-04-09 广东省科学院智能制造研究所 一种多模异构信息融合的机器人装配技能学习方法及系统

Also Published As

Publication number Publication date
CN114976802B (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
CN108241292B (zh) 一种基于扩张状态观测器的水下机器人滑模控制方法
CN110253574B (zh) 一种多任务机械臂位姿检测和误差补偿方法
CN112859600B (zh) 一种基于扩张状态观测器的机械系统有限时间控制方法
CN113459094B (zh) 一种工业机器人工具坐标系及零点自标定方法
CN115256401A (zh) 一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法
CN112571420A (zh) 一种未知参数下的双功能模型预测控制方法
Tan et al. New varying-parameter recursive neural networks for model-free kinematic control of redundant manipulators with limited measurements
CN116587275A (zh) 基于深度强化学习的机械臂智能阻抗控制方法及系统
CN112192614A (zh) 一种基于人机合作的核运维机器人轴孔装配方法
CN109764876B (zh) 无人平台的多模态融合定位方法
CN113670314B (zh) 基于pi自适应两级卡尔曼滤波的无人机姿态估计方法
CN113340324B (zh) 一种基于深度确定性策略梯度的视觉惯性自校准方法
CN112797979B (zh) 一种应用于agv的惯性姿态导航系统
CN113175926B (zh) 一种基于运动状态监测的自适应水平姿态测量方法
CN114976802A (zh) 射频连接器自适应装配方法及系统
Gu et al. Homography‐based uncalibrated visual servoing with neural‐network‐assisted robust filtering scheme and adaptive servo gain
CN112428273A (zh) 一种考虑机械臂物理约束和模型未知的控制方法及系统
CN115586724B (zh) 一种齿轮巡检机器人系统自适应分数阶全局滑模控制方法
CN115143954B (zh) 一种基于多源信息融合的无人车导航方法
CN112987770B (zh) 两栖仿蟹多足机器人步行足抗饱和有限时间运动控制方法
CN111338347B (zh) 一种基于单目视觉的水面航行器有限时间连续控制方法
CN112591153B (zh) 基于抗干扰多目标h2/h∞滤波的空间机械臂末端定位方法
CN114952858A (zh) 一种基于摩擦补偿控制的工业机器人轨迹跟踪方法和系统
CN114877871A (zh) 未标定视频卫星进行深空目标观测的姿态凝视控制方法
CN113305831B (zh) 空间机械臂自适应协调控制的位置观测器设计方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant