CN116329949A

CN116329949A - 刀塔的智能化装配方法及其系统

Info

Publication number: CN116329949A
Application number: CN202310567189.1A
Authority: CN
Inventors: 张跃前
Original assignee: Zhejiang Hexin Cnc Machine Tool Co ltd
Current assignee: Zhejiang Hexin Cnc Machine Tool Co ltd
Priority date: 2023-05-19
Filing date: 2023-05-19
Publication date: 2023-06-27

Abstract

公开了一种刀塔的智能化装配方法及其系统。该方法包括：将待装配的刀塔零件放置在料盘中，并将所述料盘送入视觉系统的视野范围内；使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果；通过机器人控制器对所述识别结果进行分析，以计算出机器人抓取各个所述刀塔零件所需的运动参数，并控制所述机器人按照预定的顺序和路径执行抓取动作；通过所述机器人将抓取到的零件送到指定的装配位置，并根据所述视觉系统提供的反馈信息进行微调，使所述零件与刀塔本体或其他已装配好的零件对准；通过所述机器人执行相应的装配动作，以完成一个零件的装配；以及，重复执行上述步骤，直到所有零件都被装配到所述刀塔上，完成装配。

Description

刀塔的智能化装配方法及其系统

技术领域

本申请涉及智能化装配领域，且更为具体地，涉及一种刀塔的智能化装配方法及其系统。

背景技术

数控机床的刀塔是一种用于安装和更换刀具的重要部件，它可以实现多种刀具的快速切换，提高加工效率和质量。刀塔的结构一般包括刀塔本体、刀座、定位销、弹簧、螺钉等零件，这些零件需要在装配过程中进行精确的对准和固定，以保证刀塔的运行精度和稳定性。

目前，数控机床的刀塔的装配工作主要依靠人工完成，这种方式存在以下缺点：人工装配效率低，耗时长，容易出现误差和疏漏；人工装配质量不稳定，受操作者技能和经验的影响，造成刀塔性能的波动；人工装配环境恶劣，存在安全隐患，对操作者的身体健康有损害。

因此，期望一种优化的刀塔的智能化装配方案，以提高刀塔装配的效率、质量和安全性。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种刀塔的智能化装配方法及其系统。该方法包括：将待装配的刀塔零件放置在料盘中，并将所述料盘送入视觉系统的视野范围内；使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果；通过机器人控制器对所述识别结果进行分析，以计算出机器人抓取各个所述刀塔零件所需的运动参数，并控制所述机器人按照预定的顺序和路径执行抓取动作；通过所述机器人将抓取到的零件送到指定的装配位置，并根据所述视觉系统提供的反馈信息进行微调，使所述零件与刀塔本体或其他已装配好的零件对准；通过所述机器人执行相应的装配动作，以完成一个零件的装配；以及，重复执行上述步骤，直到所有零件都被装配到所述刀塔上，完成装配。

根据本申请的一个方面，提供了一种刀塔的智能化装配方法，其包括：将待装配的刀塔零件放置在料盘中，并将所述料盘送入视觉系统的视野范围内；使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果；通过机器人控制器对所述识别结果进行分析，以计算出机器人抓取各个所述刀塔零件所需的运动参数，并控制所述机器人按照预定的顺序和路径执行抓取动作；通过所述机器人将抓取到的零件送到指定的装配位置，并根据所述视觉系统提供的反馈信息进行微调，使所述零件与刀塔本体或其他已装配好的零件对准；通过所述机器人执行相应的装配动作，以完成一个零件的装配；以及重复执行上述步骤，直到所有零件都被装配到所述刀塔上，完成装配。

在上述的刀塔的智能化装配方法中，使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果，包括：获取所述料盘中刀塔零件的检测图像；将所述料盘中刀塔零件的检测图像进行图像预处理以得到预处理后检测图像；将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列；将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量；将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵；对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵；以及将所述优化分类特征矩阵通过分类器以得到分类结果，所述分类结果用于表示刀塔零件的类型标签。

在上述的刀塔的智能化装配方法中，将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列，包括：将所述预处理后检测图像进行均匀地图像分块处理以得到检测图像块的序列。

在上述的刀塔的智能化装配方法中，将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量，包括：使用所述ViT模型的所述嵌入层分别对所述检测图像块的序列中各个检测图像块进行嵌入化以得到检测图像块嵌入向量的序列；以及将所述检测图像块嵌入向量的序列通过所述ViT模型以得到所述多个上下文检测图像块特征向量。

在上述的刀塔的智能化装配方法中，使用所述ViT模型的所述嵌入层分别对所述检测图像块的序列中各个检测图像块进行嵌入化以得到检测图像块嵌入向量的序列，包括：将所述检测图像块的序列中的各个检测图像块的二维像素值矩阵展开为一维像素值向量以得到一维像素值向量的序列；以及使用所述嵌入层分别对所述一维像素值向量的序列中的各个一维像素值向量进行全连接编码以得到所述检测图像块嵌入向量的序列。

在上述的刀塔的智能化装配方法中，将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵，包括：将所述多个上下文检测图像块特征向量排列为二维特征矩阵以得到上下文检测图像块特征矩阵；将所述上下文检测图像块特征矩阵分别沿着水平方向和垂直方向进行池化以得到第一向池化向量和第二向池化向量；对所述第一向池化向量和所述第二向池化向量进行关联编码以得到双向关联矩阵；将所述双向关联矩阵输入Sigmoid激活函数以得到注意力特征矩阵；将所述上下文检测图像块特征矩阵和所述注意力特征矩阵分别展开为特征向量以得到上下文检测图像块特征向量和注意力特征向量；融合所述上下文检测图像块特征向量和所述注意力特征向量以得到融合关联特征向量；以及将所述融合关联特征向量进行维度重构以得到所述分类特征矩阵。

在上述的刀塔的智能化装配方法中，对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵，包括：将所述分类特征矩阵通过线性变换转换为正方矩阵；以及对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵。

在上述的刀塔的智能化装配方法中，对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵，包括：以如下优化公式对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵；其中，所述优化公式为：

，其中，/>

是所述正方矩阵，/>

表示矩阵的转置矩阵或者向量的转置向量，/>

是所述分类特征矩阵，/>

表示所述正方矩阵的各个行特征向量，且/>

是所述正方矩阵的每两个相应行特征向量之间的距离组成的距离矩阵，/>

表示矩阵的指数运算，所述矩阵的指数运算表示以矩阵中各个位置特征值为幂的自然指数函数值，/>

和/>

分别表示按位置点乘和矩阵加法。

在上述的刀塔的智能化装配方法中，将所述优化分类特征矩阵通过分类器以得到分类结果，所述分类结果用于表示刀塔零件的类型标签，包括：将所述优化分类特征矩阵按照行向量或列向量展开为优化分类特征向量；使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量；以及将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。

根据本申请的另一个方面，提供了一种刀塔的智能化装配系统，其包括：零件提供模块，用于将待装配的刀塔零件放置在料盘中，并将所述料盘送入视觉系统的视野范围内；识别模块，用于使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果；分析控制模块，用于通过机器人控制器对所述识别结果进行分析，以计算出机器人抓取各个所述刀塔零件所需的运动参数，并控制所述机器人按照预定的顺序和路径执行抓取动作；零件对准模块，用于通过所述机器人将抓取到的零件送到指定的装配位置，并根据所述视觉系统提供的反馈信息进行微调，使所述零件与刀塔本体或其他已装配好的零件对准；单零件装配模块，用于通过所述机器人执行相应的装配动作，以完成一个零件的装配；以及装配模块，用于重复执行上述步骤，直到所有零件都被装配到所述刀塔上，完成装配。

与现有技术相比，本申请提供的刀塔的智能化装配方法及其系统，该方法包括：将待装配的刀塔零件放置在料盘中，并将所述料盘送入视觉系统的视野范围内；使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果；通过机器人控制器对所述识别结果进行分析，以计算出机器人抓取各个所述刀塔零件所需的运动参数，并控制所述机器人按照预定的顺序和路径执行抓取动作；通过所述机器人将抓取到的零件送到指定的装配位置，并根据所述视觉系统提供的反馈信息进行微调，使所述零件与刀塔本体或其他已装配好的零件对准；通过所述机器人执行相应的装配动作，以完成一个零件的装配；以及，重复执行上述步骤，直到所有零件都被装配到所述刀塔上，完成装配。这样，可以实现刀塔的智能化装配。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员而言，在没有做出创造性劳动的前提下，还可以根据这些附图获得其他的附图。以下附图并未刻意按实际尺寸等比例缩放绘制，重点在于示出本申请的主旨。

图1为根据本申请实施例的刀塔的智能化装配方法的流程图。

图2为根据本申请实施例的刀塔的智能化装配方法中子步骤S120的应用场景图。

图3为根据本申请实施例的刀塔的智能化装配方法中子步骤S120的流程图。

图4为根据本申请实施例的刀塔的智能化装配方法中子步骤S120的架构示意图。

图5为根据本申请实施例的刀塔的智能化装配方法的子步骤S124的流程图。

图6为根据本申请实施例的刀塔的智能化装配方法的子步骤S1241的流程图。

图7为根据本申请实施例的刀塔的智能化装配方法的子步骤S125的流程图。

图8为根据本申请实施例的刀塔的智能化装配方法的子步骤S126的流程图。

图9为根据本申请实施例的刀塔的智能化装配方法的子步骤S127的流程图。

图10为根据本申请实施例的刀塔的智能化装配系统的框图。

图11为根据本申请实施例的组装完成的刀塔的结构示意图。

实施方式

下面将结合附图对本申请实施例中的技术方案进行清楚、完整地描述，显而易见地，所描述的实施例仅仅是本申请的部分实施例，而不是全部的实施例。基于本申请实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，也属于本申请保护的范围。

如本申请和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其他的步骤或元素。

虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用，然而，任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的，并且所述系统和方法的不同方面可以使用不同模块。

本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是，前面或下面操作不一定按照顺序来精确地执行。相反，根据需要，可以按照倒序或同时处理各种步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

如上所述，目前，数控机床的刀塔的装配工作主要依靠人工完成，这种方式存在以下缺点：人工装配效率低，耗时长，容易出现误差和疏漏；人工装配质量不稳定，受操作者技能和经验的影响，造成刀塔性能的波动；人工装配环境恶劣，存在安全隐患，对操作者的身体健康有损害。因此，期望一种优化的刀塔的智能化装配方案，以提高刀塔装配的效率、质量和安全性。

具体地，在本申请的技术方案中，提出了一种刀塔的智能化装配方法，如图1所示，其包括以下步骤：S110，将待装配的刀塔零件放置在料盘中，并将所述料盘送入视觉系统的视野范围内；S120，使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果；S130，通过机器人控制器对所述识别结果进行分析，以计算出机器人抓取各个所述刀塔零件所需的运动参数，并控制所述机器人按照预定的顺序和路径执行抓取动作；S140，通过所述机器人将抓取到的零件送到指定的装配位置，并根据所述视觉系统提供的反馈信息进行微调，使所述零件与刀塔本体或其他已装配好的零件对准；S150，通过所述机器人执行相应的装配动作，以完成一个零件的装配；以及，S160，重复执行上述步骤，直到所有零件都被装配到所述刀塔上，完成装配。这样，能够利用机器人和视觉系统实现刀塔零件的自动识别、抓取、定位和装配，从而提高刀塔装配的效率、质量和安全性。

相应地，考虑到在实际使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果的过程中，为了保证后续所述机器人抓取刀塔零件类型的精准度，从而提高装配质量和效率，需要对于所述料盘中刀塔零件的检测图像进行分析，以此来识别刀塔零件的类型。但是，由于所述料盘中刀塔零件的检测图像中存在有大量的信息量，而关于刀塔零件类型的隐含特征为小尺度的隐性特征信息，难以通过传统的特征提取方式进行有效识别检测。因此，在此过程中，难点在于如何进行所述检测图像中关于刀塔零件的类型隐含特征分布信息的充分表达，以此来精准识别料盘中的刀塔零件类型，从而优化刀塔的装配质量和效率。

近年来，深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述检测图像中关于刀塔零件的类型隐含特征分布信息提供了新的解决思路和方案。

更具体地，在本申请的技术方案中，首先，获取料盘中刀塔零件的检测图像。应可以理解，所述检测图像中的刀塔零件与背景颜色可能会相近,导致对比度不明显，也就是说，背景信息会影响到刀塔零件特征的提取和识别，从而影响对刀塔零件的类型检测精准度。因此，为了提高所述检测图像中关于刀塔零件的对比度,以提高刀塔零件特征的表达能力，需要对原始图片进行图像预处理。也就是，将所述料盘中刀塔零件的检测图像进行图像预处理，以去除所述检测图像中除去刀塔零件的料盘等背景部分，以得到预处理后检测图像。特别地，在本申请的技术方案中，可以对所述检测图像进行灰度转换、图像标准化、对比度受限自适应直方图均衡化(CLAHE)和伽马校正处理。

进一步地，使用在图像的隐含特征提取方面具有优异表现的卷积神经网络模型来进行所述预处理后检测图像的特征挖掘，但是由于卷积运算的固有局限性，纯CNN的方法很难学习明确的全局和远程语义信息交互。并且，还考虑到由于所述预处理后检测图像中关于刀塔零件类型的隐含特征为小尺度的细微特征，难以进行捕捉提取。因此，为了能够提高所述预处理后检测图像中关于刀塔零件类型的隐含小尺度细微特征的表达能力，以此来提高对刀塔零件类型检测的精准度，在本申请的技术方案中，将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列后，将所述检测图像块的序列通过包含嵌入层的ViT模型中进行编码，以提取出所述预处理后检测图像中关于刀塔零件的隐含局部上下文语义关联特征分布信息，从而得到多个上下文检测图像块特征向量。应可以理解，在对于所述预处理后检测图像进行图像分块处理后的各个检测图像块中关于刀塔零件的小尺度隐含特征不再是小尺度的特征信息，有利于后续对刀塔零件的类型检测。特别地，这里，所述嵌入层通过可学习嵌入矩阵将所述各个图像块线性投影为一维嵌入向量。嵌入化的实现过程是先分别将各个所述检测图像块中所有像素位置的像素值排列为一维向量，然后使用全连接层对该一维向量进行全连接编码以实现嵌入化。并且，这里，所述ViT模型可以像Transformer一样直接通过自注意机制处理所述各个检测图像块，以此来分别提取出所述各个检测图像块中基于所述预处理后检测图像整体的关于所述刀塔零件的隐含上下文语义关联特征信息。

然后，考虑到由于刀塔零件的类型复杂多样,保留和传递浅层细节特征对提高算法分割准确率非常重要。因此，期望在U-Net网络中,通过跳跃连接将编码器的特征信息直接传递到解码器,实现浅层特征与深层特征融合,补充解码器细节特征信息,但这种在同尺度之间特征直接传递的方式过于简单，没有对料盘中刀塔零件特征进行筛选,进而无法准确地进行刀塔零件的类型识别检测。因此，在本申请的技术方案中，进一步将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵。这样，能够充分利用上下文信息来增强刀塔零件的特征响应和抑制背景特征响应。具体地，所述双向注意力模块分别从水平方向和垂直方向对整个二维特征矩阵的注意力权重校准并获取复杂特征关系,从而能够从空间的全局特征中获取局部特征信息。

接着，进一步再将所述分类特征矩阵通过分类器中进行分类处理，以得到用于表示刀塔零件的类型标签的分类结果。也就是说，在本申请的技术方案中，所述分类器的标签为刀塔零件的类型标签，因此，在得到所述分类结果后，可基于所述分类结果来进行刀塔零件的类型是被检测，有利于后续使用所述机器人进行刀塔零件的装配。

特别地，在本申请的技术方案中，将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵时，本申请的申请人考虑到每个上下文检测图像块特征向量表达相应检测图像分块的上下文关联编码图像语义特征，由此，在将其二维排列并通过双向注意力机制模块进行行和列空间强化的注意力特征提取时，会由于各个上下文检测图像块特征向量的内部图像特征语义与特征向量排列导致的合成噪声特征发生混淆，使得有意义的类回归图像语义特征与噪声特征之间分界的模糊性影响所述分类特征矩阵的类回归特征分布表达效果，从而降低所述分类特征矩阵的分类结果的准确性。

因此，首先将所述分类特征矩阵通过线性变换转换为正方矩阵，即使得其行数和列数相同，再对所述正方矩阵，例如记为

进行向量谱聚类代理学习融合优化，来得到优化后的分类特征矩阵，例如表示为/>

，这里，优化后的分类特征矩阵/>

具体为：

，其中，/>

表示所述正方矩阵

的各个行特征向量，且/>

是相应向量之间的距离组成的距离矩阵。

这里，对于将所述多个上下文检测图像块特征向量的关联编码上下文图像语义特征进行注意力特征提取时，由于各个上下文检测图像块特征向量的内部图像特征语义与合成噪声特征发生混淆而导致有意义的类回归图像语义特征与噪声特征之间分界的模糊性，所述向量谱聚类代理学习融合优化通过引入用于表示特征向量间的空间布局和语义相似性的谱聚类代理学习，来利用类回归语义特征和类回归场景之间的关联的概念化信息，对各个上下文检测图像块特征向量间的潜在关联属性进行隐性监督传播，从而提高合成特征的整体分布依赖性，由此提升所述分类特征矩阵的整体类回归特征分布表达效果，以提升其通过分类器得到的分类结果的准确性。这样，能够精准识别料盘中的刀塔零件类型，从而优化刀塔的装配质量和效率。

图2为根据本申请实施例的刀塔的智能化装配方法中子步骤S120的应用场景图。如图2所示，在该应用场景中，首先，获取所述料盘中刀塔零件（例如，图2中所示意的N）的检测图像（例如，图2中所示意的D），然后，将所述料盘中刀塔零件的检测图像输入至部署有刀塔的智能化装配算法的服务器中（例如，图2中所示意的S），其中，所述服务器能够使用所述刀塔的智能化装配算法对所述料盘中刀塔零件的检测图像进行处理以得到用于表示刀塔零件的类型标签的分类结果。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

图3为根据本申请实施例的刀塔的智能化装配方法中子步骤S120的流程图。如图3所示，根据本申请实施例的刀塔的智能化装配方法，使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果，包括步骤：S121，获取所述料盘中刀塔零件的检测图像；S122，将所述料盘中刀塔零件的检测图像进行图像预处理以得到预处理后检测图像；S123，将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列；S124，将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量；S125，将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵；S126，对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵；以及，S127，将所述优化分类特征矩阵通过分类器以得到分类结果，所述分类结果用于表示刀塔零件的类型标签。

图4为根据本申请实施例的刀塔的智能化装配方法中子步骤S120的架构示意图。如图4所示，在该网络架构中，首先，获取所述料盘中刀塔零件的检测图像；接着，将所述料盘中刀塔零件的检测图像进行图像预处理以得到预处理后检测图像；然后，将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列；接着，将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量；然后，将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵；接着，对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵；最后，将所述优化分类特征矩阵通过分类器以得到分类结果，所述分类结果用于表示刀塔零件的类型标签。

更具体地，在步骤S121中，获取所述料盘中刀塔零件的检测图像。在实际使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果的过程中，为了保证后续所述机器人抓取刀塔零件类型的精准度，从而提高装配质量和效率，可以对所述料盘中刀塔零件的检测图像进行分析，以此来识别刀塔零件的类型。

更具体地，在步骤S122中，将所述料盘中刀塔零件的检测图像进行图像预处理以得到预处理后检测图像。所述检测图像中的刀塔零件与背景颜色可能会相近,导致对比度不明显，也就是说，背景信息会影响到刀塔零件特征的提取和识别，从而影响对刀塔零件的类型检测精准度。因此，为了提高所述检测图像中关于刀塔零件的对比度,以提高刀塔零件特征的表达能力，需要对原始图片进行图像预处理。也就是，将所述料盘中刀塔零件的检测图像进行图像预处理，以去除所述检测图像中除去刀塔零件的料盘等背景部分，以得到预处理后检测图像。

更具体地，在步骤S123中，将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列。由于卷积运算的固有局限性，纯CNN的方法很难学习明确的全局和远程语义信息交互。并且，还考虑到由于所述预处理后检测图像中关于刀塔零件类型的隐含特征为小尺度的细微特征，难以进行捕捉提取。因此，为了能够提高所述预处理后检测图像中关于刀塔零件类型的隐含小尺度细微特征的表达能力，以此来提高对刀塔零件类型检测的精准度。

相应地，在一个具体示例中，将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列，包括：将所述预处理后检测图像进行均匀地图像分块处理以得到检测图像块的序列。

更具体地，在步骤S124中，将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量。这样，可以提取出所述预处理后检测图像中关于刀塔零件的隐含局部上下文语义关联特征分布信息，从而得到多个上下文检测图像块特征向量。

这里，所述嵌入层通过可学习嵌入矩阵将所述各个图像块线性投影为一维嵌入向量。嵌入化的实现过程是先分别将各个所述检测图像块中所有像素位置的像素值排列为一维向量，然后使用全连接层对该一维向量进行全连接编码以实现嵌入化。并且，这里，所述ViT模型可以像Transformer一样直接通过自注意机制处理所述各个检测图像块，以此来分别提取出所述各个检测图像块中基于所述预处理后检测图像整体的关于所述刀塔零件的隐含上下文语义关联特征信息。

相应地，在一个具体示例中，如图5所示，将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量，包括：S1241，使用所述ViT模型的所述嵌入层分别对所述检测图像块的序列中各个检测图像块进行嵌入化以得到检测图像块嵌入向量的序列；以及，S1242，将所述检测图像块嵌入向量的序列通过所述ViT模型以得到所述多个上下文检测图像块特征向量。

相应地，在一个具体示例中，如图6所示，使用所述ViT模型的所述嵌入层分别对所述检测图像块的序列中各个检测图像块进行嵌入化以得到检测图像块嵌入向量的序列，包括：S12411，将所述检测图像块的序列中的各个检测图像块的二维像素值矩阵展开为一维像素值向量以得到一维像素值向量的序列；以及，S12412，使用所述嵌入层分别对所述一维像素值向量的序列中的各个一维像素值向量进行全连接编码以得到所述检测图像块嵌入向量的序列。

更具体地，在步骤S125中，将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵。这样，能够充分利用上下文信息来增强刀塔零件的特征响应和抑制背景特征响应。具体地，所述双向注意力模块分别从水平方向和垂直方向对整个二维特征矩阵的注意力权重校准并获取复杂特征关系,从而能够从空间的全局特征中获取局部特征信息。

相应地，在一个具体示例中，如图7所示，将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵，包括：S1251，将所述多个上下文检测图像块特征向量排列为二维特征矩阵以得到上下文检测图像块特征矩阵；S1252，将所述上下文检测图像块特征矩阵分别沿着水平方向和垂直方向进行池化以得到第一向池化向量和第二向池化向量；S1253，对所述第一向池化向量和所述第二向池化向量进行关联编码以得到双向关联矩阵；S1254，将所述双向关联矩阵输入Sigmoid激活函数以得到注意力特征矩阵；S1255，将所述上下文检测图像块特征矩阵和所述注意力特征矩阵分别展开为特征向量以得到上下文检测图像块特征向量和注意力特征向量；S1256，融合所述上下文检测图像块特征向量和所述注意力特征向量以得到融合关联特征向量；以及，S1257，将所述融合关联特征向量进行维度重构以得到所述分类特征矩阵。

更具体地，在步骤S126中，对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵。

相应地，在一个具体示例中，如图8所示，对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵，包括：S1261，将所述分类特征矩阵通过线性变换转换为正方矩阵；以及，S1262，对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵。

特别地，在本申请的技术方案中，将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵时，本申请的申请人考虑到每个上下文检测图像块特征向量表达相应检测图像分块的上下文关联编码图像语义特征，由此，在将其二维排列并通过双向注意力机制模块进行行和列空间强化的注意力特征提取时，会由于各个上下文检测图像块特征向量的内部图像特征语义与特征向量排列导致的合成噪声特征发生混淆，使得有意义的类回归图像语义特征与噪声特征之间分界的模糊性影响所述分类特征矩阵的类回归特征分布表达效果，从而降低所述分类特征矩阵的分类结果的准确性。因此，首先将所述分类特征矩阵通过线性变换转换为正方矩阵，即使得其行数和列数相同，再对所述正方矩阵，例如记为

进行向量谱聚类代理学习融合优化，来得到优化后的分类特征矩阵。

相应地，在一个具体示例中，对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵，包括：以如下优化公式对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵；其中，所述优化公式为：

，其中，/>

是所述正方矩阵，/>

表示矩阵的转置矩阵或者向量的转置向量，/>

是所述分类特征矩阵，/>

表示所述正方矩阵的各个行特征向量，且/>

和/>

分别表示按位置点乘和矩阵加法。

更具体地，在步骤S127中，将所述优化分类特征矩阵通过分类器以得到分类结果，所述分类结果用于表示刀塔零件的类型标签。在得到所述分类结果后，可基于所述分类结果来进行刀塔零件的类型是被检测，有利于后续使用所述机器人进行刀塔零件的装配。

应可以理解，分类器的作用是利用给定的类别、已知的训练数据来学习分类规则和分类器，然后对未知数据进行分类（或预测）。逻辑回归（logistics）、SVM等常用于解决二分类问题，对于多分类问题（multi-class classification），同样也可以用逻辑回归或SVM，只是需要多个二分类来组成多分类，但这样容易出错且效率不高，常用的多分类方法有Softmax分类函数。

相应地，在一个具体示例中，如图9所示，将所述优化分类特征矩阵通过分类器以得到分类结果，所述分类结果用于表示刀塔零件的类型标签，包括：S1271，将所述优化分类特征矩阵按照行向量或列向量展开为优化分类特征向量；S1272，使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量；以及，S1273，将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。

综上，基于本申请实施例的刀塔的智能化装配方法，其首先获取所述料盘中刀塔零件的检测图像，接着，将所述料盘中刀塔零件的检测图像进行图像预处理以得到预处理后检测图像，然后，将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列，接着，将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量，然后，将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵，接着，对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵，最后，将所述优化分类特征矩阵通过分类器以得到用于表示刀塔零件的类型标签的分类结果。

进一步地，图11示出了通过上述方法组装完成的刀塔的结构示意图。

图10为根据本申请实施例的刀塔的智能化装配系统100的框图。如图10所示，根据本申请实施例的刀塔的智能化装配系统100，包括：零件提供模块110，用于将待装配的刀塔零件放置在料盘中，并将所述料盘送入视觉系统的视野范围内；识别模块120，用于使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果；分析控制模块130，用于通过机器人控制器对所述识别结果进行分析，以计算出机器人抓取各个所述刀塔零件所需的运动参数，并控制所述机器人按照预定的顺序和路径执行抓取动作；零件对准模块140，用于通过所述机器人将抓取到的零件送到指定的装配位置，并根据所述视觉系统提供的反馈信息进行微调，使所述零件与刀塔本体或其他已装配好的零件对准；单零件装配模块150，用于通过所述机器人执行相应的装配动作，以完成一个零件的装配；以及，装配模块160，用于重复执行上述步骤，直到所有零件都被装配到所述刀塔上，完成装配。

在一个示例中，在上述刀塔的智能化装配系统100中，所述识别模块120，包括：图像获取单元，用于获取所述料盘中刀塔零件的检测图像；图像预处理单元，用于将所述料盘中刀塔零件的检测图像进行图像预处理以得到预处理后检测图像；图像分块单元，用于将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列；嵌入编码单元，用于将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量；双向注意力编码单元，用于将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵；特征分布优化单元，用于对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵；以及，分类单元，用于将所述优化分类特征矩阵通过分类器以得到分类结果，所述分类结果用于表示刀塔零件的类型标签。

在一个示例中，在上述刀塔的智能化装配系统100中，所述图像分块单元，用于：将所述预处理后检测图像进行均匀地图像分块处理以得到检测图像块的序列。

在一个示例中，在上述刀塔的智能化装配系统100中，所述嵌入编码单元，用于，包括：使用所述ViT模型的所述嵌入层分别对所述检测图像块的序列中各个检测图像块进行嵌入化以得到检测图像块嵌入向量的序列；以及，将所述检测图像块嵌入向量的序列通过所述ViT模型以得到所述多个上下文检测图像块特征向量。

在一个示例中，在上述刀塔的智能化装配系统100中，使用所述ViT模型的所述嵌入层分别对所述检测图像块的序列中各个检测图像块进行嵌入化以得到检测图像块嵌入向量的序列，包括：将所述检测图像块的序列中的各个检测图像块的二维像素值矩阵展开为一维像素值向量以得到一维像素值向量的序列；以及，使用所述嵌入层分别对所述一维像素值向量的序列中的各个一维像素值向量进行全连接编码以得到所述检测图像块嵌入向量的序列。

在一个示例中，在上述刀塔的智能化装配系统100中，所述双向注意力编码单元，用于：将所述多个上下文检测图像块特征向量排列为二维特征矩阵以得到上下文检测图像块特征矩阵；将所述上下文检测图像块特征矩阵分别沿着水平方向和垂直方向进行池化以得到第一向池化向量和第二向池化向量；对所述第一向池化向量和所述第二向池化向量进行关联编码以得到双向关联矩阵；将所述双向关联矩阵输入Sigmoid激活函数以得到注意力特征矩阵；将所述上下文检测图像块特征矩阵和所述注意力特征矩阵分别展开为特征向量以得到上下文检测图像块特征向量和注意力特征向量；融合所述上下文检测图像块特征向量和所述注意力特征向量以得到融合关联特征向量；以及，将所述融合关联特征向量进行维度重构以得到所述分类特征矩阵。

在一个示例中，在上述刀塔的智能化装配系统100中，所述特征分布优化单元，用于：将所述分类特征矩阵通过线性变换转换为正方矩阵；以及，对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵。

在一个示例中，在上述刀塔的智能化装配系统100中，对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵，包括：以如下优化公式对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵；其中，所述优化公式为：

，其中，/>

是所述正方矩阵，

表示矩阵的转置矩阵或者向量的转置向量，/>

是所述分类特征矩阵，/>

表示所述正方矩阵的各个行特征向量，且/>

和/>

分别表示按位置点乘和矩阵加法。

在一个示例中，在上述刀塔的智能化装配系统100中，所述分类单元，用于：将所述优化分类特征矩阵按照行向量或列向量展开为优化分类特征向量；使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量；以及，将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。

这里，本领域技术人员可以理解，上述刀塔的智能化装配系统100中的各个模块的具体功能和操作已经在上面参考图1到图9的刀塔的智能化装配方法的描述中得到了详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的刀塔的智能化装配系统100可以实现在各种无线终端中，例如具有刀塔的智能化装配算法的服务器等。在一个示例中，根据本申请实施例的刀塔的智能化装配系统100可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如，该刀塔的智能化装配系统100可以是该无线终端的操作系统中的一个软件模块，或者可以是针对于该无线终端所开发的一个应用程序；当然，该刀塔的智能化装配系统100同样可以是该无线终端的众多硬件模块之一。

替换地，在另一示例中，该刀塔的智能化装配系统100与该无线终端也可以是分立的设备，并且该刀塔的智能化装配系统100可以通过有线和/或无线网络连接到该无线终端，并且按照约定的数据格式来传输交互信息。

根据本申请的另一方面，还提供了一种非易失性的计算机可读存储介质，其上存储有计算机可读的指令，当利用计算机执行所述指令时可以执行如前所述的方法。

技术中的程序部分可以被认为是以可执行的代码和/或相关数据的形式而存在的“产品”或“制品”，通过计算机可读的介质所参与或实现的。有形的、永久的储存介质可以包括任何计算机、处理器、或类似设备或相关的模块所用到的内存或存储器。例如，各种半导体存储器、磁带驱动器、磁盘驱动器或者类似任何能够为软件提供存储功能的设备。

所有软件或其中的一部分有时可能会通过网络进行通信，如互联网或其他通信网络。此类通信可以将软件从一个计算机设备或处理器加载到另一个。例如：从视频目标检测设备的一个服务器或主机计算机加载至一个计算机环境的硬件平台，或其他实现系统的计算机环境，或与提供目标检测所需要的信息相关的类似功能的系统。因此，另一种能够传递软件元素的介质也可以被用作局部设备之间的物理连接，例如光波、电波、电磁波等，通过电缆、光缆或者空气等实现传播。用来载波的物理介质如电缆、无线连接或光缆等类似设备，也可以被认为是承载软件的介质。在这里的用法除非限制了有形的“储存”介质，其他表示计算机或机器“可读介质”的术语都表示在处理器执行任何指令的过程中参与的介质。

本申请使用了特定词语来描述本申请的实施例。如“第一/第二实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此，应强调并注意的是，本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外，本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外，本领域技术人员可以理解，本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外，本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

除非另有定义，这里使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。还应当理解，诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义，而不应用理想化或极度形式化的意义来解释，除非这里明确地这样定义。

上面是对本发明的说明，而不应被认为是对其的限制。尽管描述了本发明的若干示例性实施例，但本领域技术人员将容易地理解，在不背离本发明的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此，所有这些修改都意图包含在权利要求书所限定的本发明范围内。应当理解，上面是对本发明的说明，而不应被认为是限于所公开的特定实施例，并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本发明由权利要求书及其等效物限定。

Claims

1.一种刀塔的智能化装配方法，其特征在于，包括：将待装配的刀塔零件放置在料盘中，并将所述料盘送入视觉系统的视野范围内；使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果；通过机器人控制器对所述识别结果进行分析，以计算出机器人抓取各个所述刀塔零件所需的运动参数，并控制所述机器人按照预定的顺序和路径执行抓取动作；通过所述机器人将抓取到的零件送到指定的装配位置，并根据所述视觉系统提供的反馈信息进行微调，使所述零件与刀塔本体或其他已装配好的零件对准；通过所述机器人执行相应的装配动作，以完成一个零件的装配；以及重复执行上述步骤，直到所有零件都被装配到所述刀塔上，完成装配。

2.根据权利要求1所述的刀塔的智能化装配方法，其特征在于，使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果，包括：获取所述料盘中刀塔零件的检测图像；将所述料盘中刀塔零件的检测图像进行图像预处理以得到预处理后检测图像；将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列；将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量；将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵；对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵；以及将所述优化分类特征矩阵通过分类器以得到分类结果，所述分类结果用于表示刀塔零件的类型标签。

3.根据权利要求2所述的刀塔的智能化装配方法，其特征在于，将所述预处理后检测图像进行图像分块处理以得到检测图像块的序列，包括：将所述预处理后检测图像进行均匀地图像分块处理以得到检测图像块的序列。

4.根据权利要求3所述的刀塔的智能化装配方法，其特征在于，将所述检测图像块的序列通过包含嵌入层的ViT模型以得到多个上下文检测图像块特征向量，包括：使用所述ViT模型的所述嵌入层分别对所述检测图像块的序列中各个检测图像块进行嵌入化以得到检测图像块嵌入向量的序列；以及将所述检测图像块嵌入向量的序列通过所述ViT模型以得到所述多个上下文检测图像块特征向量。

5.根据权利要求4所述的刀塔的智能化装配方法，其特征在于，使用所述ViT模型的所述嵌入层分别对所述检测图像块的序列中各个检测图像块进行嵌入化以得到检测图像块嵌入向量的序列，包括：将所述检测图像块的序列中的各个检测图像块的二维像素值矩阵展开为一维像素值向量以得到一维像素值向量的序列；以及使用所述嵌入层分别对所述一维像素值向量的序列中的各个一维像素值向量进行全连接编码以得到所述检测图像块嵌入向量的序列。

6.根据权利要求5所述的刀塔的智能化装配方法，其特征在于，将所述多个上下文检测图像块特征向量排列为二维特征矩阵后通过双向注意力机制模块以得到分类特征矩阵，包括：将所述多个上下文检测图像块特征向量排列为二维特征矩阵以得到上下文检测图像块特征矩阵；将所述上下文检测图像块特征矩阵分别沿着水平方向和垂直方向进行池化以得到第一向池化向量和第二向池化向量；对所述第一向池化向量和所述第二向池化向量进行关联编码以得到双向关联矩阵；将所述双向关联矩阵输入Sigmoid激活函数以得到注意力特征矩阵；将所述上下文检测图像块特征矩阵和所述注意力特征矩阵分别展开为特征向量以得到上下文检测图像块特征向量和注意力特征向量；融合所述上下文检测图像块特征向量和所述注意力特征向量以得到融合关联特征向量；以及将所述融合关联特征向量进行维度重构以得到所述分类特征矩阵。

7.根据权利要求6所述的刀塔的智能化装配方法，其特征在于，对所述分类特征矩阵进行特征分布优化以得到优化分类特征矩阵，包括：将所述分类特征矩阵通过线性变换转换为正方矩阵；以及对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵。

8.根据权利要求7所述的刀塔的智能化装配方法，其特征在于，对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵，包括：以如下优化公式对所述正方矩阵进行向量谱聚类代理学习融合优化以得到所述优化分类特征矩阵；其中，所述优化公式为：

，其中，/>

是所述正方矩阵，/>

表示矩阵的转置矩阵或者向量的转置向量，/>

是所述分类特征矩阵，/>

表示所述正方矩阵的各个行特征向量，且/>

和/>

分别表示按位置点乘和矩阵加法。

9.根据权利要求8所述的刀塔的智能化装配方法，其特征在于，将所述优化分类特征矩阵通过分类器以得到分类结果，所述分类结果用于表示刀塔零件的类型标签，包括：将所述优化分类特征矩阵按照行向量或列向量展开为优化分类特征向量；使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量；以及将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。

10.一种刀塔的智能化装配系统，其特征在于，包括：零件提供模块，用于将待装配的刀塔零件放置在料盘中，并将所述料盘送入视觉系统的视野范围内；识别模块，用于使用所述视觉系统对所述料盘中的刀塔零件进行图像采集和识别以得到识别结果；分析控制模块，用于通过机器人控制器对所述识别结果进行分析，以计算出机器人抓取各个所述刀塔零件所需的运动参数，并控制所述机器人按照预定的顺序和路径执行抓取动作；零件对准模块，用于通过所述机器人将抓取到的零件送到指定的装配位置，并根据所述视觉系统提供的反馈信息进行微调，使所述零件与刀塔本体或其他已装配好的零件对准；单零件装配模块，用于通过所述机器人执行相应的装配动作，以完成一个零件的装配；以及装配模块，用于重复执行上述步骤，直到所有零件都被装配到所述刀塔上，完成装配。