CN116167989A

CN116167989A - 铝杯的智能化生产方法及其系统

Info

Publication number: CN116167989A
Application number: CN202310097580.XA
Authority: CN
Inventors: 陈剑永; 罗启甲; 陈程; 杨晓; 林天郎
Original assignee: Shengxing Bode New Material Wenzhou Co ltd
Current assignee: Shengxing Bode New Material Wenzhou Co ltd
Priority date: 2023-02-10
Filing date: 2023-02-10
Publication date: 2023-05-26

Abstract

公开了一种铝杯的智能化生产方法及其系统，其采用基于深度学习的人工智能检测技术，以通过将孔洞所在检测图像中的位置处进行目标锚定来进行孔洞感兴趣区域的特征挖掘，以此来提取出关于小尺度的孔洞隐含特征信息，并且还利用所述检测图像中关于孔洞的位置特征信息，以此来综合对于加工成型的铝杯的打孔是否发生偏移进行检测。这样，能够准确地对于加工成型的铝杯的打孔质量进行检测，进而提高铝杯加工的工作效率和生产质量。

Description

铝杯的智能化生产方法及其系统

技术领域

本申请涉及铝杯生产技术领域，且更为具体地，涉及一种铝杯的智能化生产方法及其系统。

背景技术

铝杯，因其表面有一层致密的氧化膜而不容易被腐蚀，故被用于器皿。目前很多企业在生产铝杯，但是当铝杯的形状和结构较为复杂时，铝杯的制备工艺受到挑战。

一般企业在加工铝杯时，其加工成型的工艺为：工人将铝合金材料拿到车床进行车削加工成型，加工成型后的铝杯还需要拿去钻床上进行钻孔。也就是，将不同的加工工序在不同加工设备上来进行，这种模式工作效率低、加工步骤复杂，且人工操作中还会发生安全事故。

针对上述技术问题，中国专利CN 103691806B公开了一种铝杯加工成型的工艺，其包括步骤：第一步，铝杯的一次性预成型加工：将要加工的铝合金材料放置到预成型加工设备上预成型加工设备中的上模与下模配合,将铝合金材料冲压成型；第二步，铝杯的定位打孔加工：将加工成型的半成品铝杯放置到定位打孔装置上，定位打孔装置中上模上的冲针对铝杯进行打孔。

虽然上述铝杯加工成型的工艺可以优化工作效率，但在生产过程中发现在打孔阶段会因振动或者设备的移位而导致打孔偏移，如果没有及时发现会导致大量残次品的出现。

因此，期待一种更为优化的铝杯的智能化生产方案。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种铝杯的智能化生产方法及其系统，其采用基于深度学习的人工智能检测技术，以通过将孔洞所在检测图像中的位置处进行目标锚定来进行孔洞感兴趣区域的特征挖掘，以此来提取出关于小尺度的孔洞隐含特征信息，并且还利用所述检测图像中关于孔洞的位置特征信息，以此来综合对于加工成型的铝杯的打孔是否发生偏移进行检测。这样，能够准确地对于加工成型的铝杯的打孔质量进行检测，进而提高铝杯加工的工作效率和生产质量。

根据本申请的一个方面，提供了一种铝杯的智能化生产方法，其包括：获取加工成型的铝杯的检测图像；基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像；将所述掩码图像和所述检测图像沿着通道维度进行聚合以得到多通道检测图像；将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图；以及将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移。

在上述铝杯的智能化生产方法中，所述基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像，包括：将所述检测图像通过孔洞目标识别网络以锚定所述孔洞在所述铝杯的位置。

在上述铝杯的智能化生产方法中，所述孔洞目标识别网络为Fast R-CNN、FasterR-CNN、RetinaNet。

在上述铝杯的智能化生产方法中，所述将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图，包括：使用所述卷积神经网络模型的卷积编码部分对所述多通道检测图像进行深度卷积编码以得到初始卷积特征图；将所述初始卷积特征图输入所述卷积神经网络模型的空间注意力部分以得到空间注意力图；将所述空间注意力图通过Softmax激活函数以得到空间注意力特征图；以及，计算所述空间注意力特征图和所述初始卷积特征图的按位置点乘以得到分类特征图。

在上述铝杯的智能化生产方法中，所述将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移，包括：将所述分类特征图中各个分类特征矩阵按照行向量或者列向量展开为一维特征向量后进行级联以得到分类特征向量；使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量；以及，将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。

在上述铝杯的智能化生产方法中，还包括训练步骤：对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练。

在上述铝杯的智能化生产方法中，所述训练步骤，包括：获取训练数据，所述训练数据包括加工成型的铝杯的训练检测图像，以及，所述加工成型的铝杯的打孔是否发生偏移的真实值；基于孔洞在所述铝杯的位置，对所述训练检测图像的相应位置处施加掩码以得到训练掩码图像；将所述训练掩码图像和所述训练检测图像沿着通道维度进行聚合以得到训练多通道检测图像；将所述训练多通道检测图像通过所述使用空间注意力机制的卷积神经网络模型以得到训练分类特征图；将所述训练分类特征图通过所述分类器以得到分类损失函数值；以及，基于所述分类损失函数值并通过梯度下降的反向传播来对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练，其中，在所述训练过程的每一轮迭代中，计算所述训练分类特征图的基于跨分类器软相似性的自由标签优化因数来作为所述分类器的标签值。

在上述铝杯的智能化生产方法中，所述在所述训练过程的每一轮迭代中，以如下公式计算所述训练分类特征向量的基于跨分类器软相似性的自由标签优化因数来作为所述分类器的标签值；其中，所述公式为：

，

其中

是所述训练分类特征图展开后得到的训练分类特征向量，/>

是所述分类器对所述训练分类特征图展开后得到的训练分类特征向量的权重矩阵，/>

和/>

分别表示张量乘法和张量加法，/>

表示向量之间的距离，/>

表示向量的二范数，且/>

和/>

是权重超参数，/>

表示向量的指数运算，所述向量的指数运算表示计算以向量中各个位置的特征值为幂的自然指数函数值，/>

表示所述分类器的标签值。

根据本申请的另一方面，提供了一种铝杯的智能化生产系统，包括：检测图像获取单元，用于获取加工成型的铝杯的检测图像；掩码施加单元，用于基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像；多通道聚合单元，用于将所述掩码图像和所述检测图像沿着通道维度进行聚合以得到多通道检测图像；空间注意力施加单元，用于将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图；以及检测结果生成单元，用于将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移。

在上述铝杯的智能化生产系统中，所述掩码施加单元，用于将所述检测图像通过孔洞目标识别网络以锚定所述孔洞在所述铝杯的位置。

在上述铝杯的智能化生产系统中，所述孔洞目标识别网络为Fast R-CNN、FasterR-CNN、RetinaNet。

在上述铝杯的智能化生产系统中，所述空间注意力施加单元，进一步用于：使用所述卷积神经网络模型的卷积编码部分对所述多通道检测图像进行深度卷积编码以得到初始卷积特征图；将所述初始卷积特征图输入所述卷积神经网络模型的空间注意力部分以得到空间注意力图；将所述空间注意力图通过Softmax激活函数以得到空间注意力特征图；以及，计算所述空间注意力特征图和所述初始卷积特征图的按位置点乘以得到分类特征图。

在上述铝杯的智能化生产系统中，所述检测结果生成单元，进一步用于：将所述分类特征图中各个分类特征矩阵按照行向量或者列向量展开为一维特征向量后进行级联以得到分类特征向量；使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量；以及，将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。

在上述铝杯的智能化生产系统中，还包括用于对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练的训练模块。

在上述铝杯的智能化生产系统中，所述训练模块，包括：训练数据获取单元，用于获取训练数据，所述训练数据包括加工成型的铝杯的训练检测图像，以及，所述加工成型的铝杯的打孔是否发生偏移的真实值；训练掩码施加单元，用于基于孔洞在所述铝杯的位置，对所述训练检测图像的相应位置处施加掩码以得到训练掩码图像；训练多通道聚合单元，用于将所述训练掩码图像和所述训练检测图像沿着通道维度进行聚合以得到训练多通道检测图像；训练空间注意力施加单元，用于将所述训练多通道检测图像通过所述使用空间注意力机制的卷积神经网络模型以得到训练分类特征图；分类损失单元，用于将所述训练分类特征图通过所述分类器以得到分类损失函数值；以及，训练单元，用于基于所述分类损失函数值并通过梯度下降的反向传播来对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练，其中，在所述训练过程的每一轮迭代中，计算所述训练分类特征图的基于跨分类器软相似性的自由标签优化因数来作为所述分类器的标签值。

在上述铝杯的智能化生产系统中，所述在所述训练过程的每一轮迭代中，以如下公式计算所述训练分类特征向量的基于跨分类器软相似性的自由标签优化因数来作为所述分类器的标签值；其中，所述公式为：

，

其中

是所述训练分类特征图展开后得到的训练分类特征向量，/>

和/>

分别表示张量乘法和张量加法，/>

表示向量之间的距离，/>

表示向量的二范数，且/>

和/>

是权重超参数，/>

表示所述分类器的标签值。

根据本申请的再一方面，提供了一种电子设备，包括：处理器；以及，存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的铝杯的智能化生产方法。

根据本申请的又一方面，提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的铝杯的智能化生产方法。

与现有技术相比，本申请提供的铝杯的智能化生产方法及其系统，其采用基于深度学习的人工智能检测技术，以通过将孔洞所在检测图像中的位置处进行目标锚定来进行孔洞感兴趣区域的特征挖掘，以此来提取出关于小尺度的孔洞隐含特征信息，并且还利用所述检测图像中关于孔洞的位置特征信息，以此来综合对于加工成型的铝杯的打孔是否发生偏移进行检测。这样，能够准确地对于加工成型的铝杯的打孔质量进行检测，进而提高铝杯加工的工作效率和生产质量。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1为根据本申请实施例的铝杯的智能化生产方法的应用场景图。

图2为根据本申请实施例的铝杯的智能化生产方法的流程图。

图3为根据本申请实施例的铝杯的智能化生产方法的架构图。

图4为根据本申请实施例的铝杯的智能化生产方法中对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练的流程图。

图5为根据本申请实施例的铝杯的智能化生产系统的框图。

图6为根据本申请实施例的铝杯的智能化生产系统中训练模块的框图。

图7为根据本申请实施例的电子设备的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

申请概述：如上所述，在专利CN 103691806B公开的一种铝杯加工成型的工艺中，虽然该铝杯加工成型的工艺可以优化工作效率，但在生产过程中发现在打孔阶段会因振动或者设备的移位而导致打孔偏移，如果没有及时发现会导致大量残次品的出现。因此，期待一种更为优化的铝杯的智能化生产方案。

具体地，在实际进行铝杯的生产制造过程中，需要对于铝杯的打孔进行质量检测，以此来保证铝杯的打孔合格率以及铝杯的加工成型质量。相应地，考虑到在进行打孔质量检测时，可以通过对于加工成型的铝杯的检测图像进行分析，但是由于加工成型的铝杯的检测图像中存在的信息量较多，存在有大量的无用信息干扰，而关于铝杯孔洞的特征信息在图像中为小尺度特征，难以对其进行挖掘获取。

近年来，深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外，深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域，也展现出了接近甚至超越人类的水平。

深度学习以及神经网络的发展为加工成型的铝杯的打孔质量检测提供了新的解决思路和方案。

具体地，在本申请的技术方案中，采用基于深度学习的人工智能检测技术，以通过将孔洞所在检测图像中的位置处进行目标锚定来进行孔洞感兴趣区域的特征挖掘，以此来提取出关于小尺度的孔洞隐含特征信息，并且还利用所述检测图像中关于孔洞的位置特征信息，以此来综合对于加工成型的铝杯的打孔是否发生偏移进行检测。这样，能够准确地对于加工成型的铝杯的打孔质量进行检测，进而提高铝杯加工的工作效率和生产质量。

更具体地，在本申请的技术方案中，首先，通过摄像头获取加工成型的铝杯的检测图像。接着，考虑到在所述检测图像中，对于加工成型的铝杯的打孔是否发生偏移的检测与孔洞的形状、尺寸以及平滑度有关，而对于所述检测图像来说，所述孔洞在所述检测图像中的特征信息为小尺度的特征，其在特征提取时会受到其余无用的干扰特征的影响，难以进行孔洞的隐含特征挖掘。因此，在特征提取时需要聚焦于孔洞区域的隐含特征而滤除其余无用的干扰特征信息。基于此，在本申请的技术方案中，基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像。具体地，将所述检测图像通过孔洞目标识别网络以锚定所述孔洞在所述铝杯的位置。特别地，这里，所述孔洞目标识别网络为基于锚窗的目标识别网络，且所述基于锚窗的目标识别网络为Fast R-CNN、Faster R-CNN或RetinaNet。

然后，考虑到在进行所述加工成型的铝杯的打孔是否发生偏移检测时，还需要关注于所述孔洞在所述检测图像中的位置特征信息，因此，在本申请的技术方案中，进一步将所述掩码图像和所述检测图像沿着通道维度进行聚合，以此来得到具有聚焦于孔洞信息与原始图像信息的多通道检测图像。

进一步地，使用在图像的隐含特征提取方面具有优异表现的卷积神经网络模型来进行所述多通道检测图像的特征提取，特别地，考虑到在进行所述加工成型的铝杯的打孔质量检测时，应关注于空间位置上关于孔洞的隐含特征信息和位置特征信息而忽略与铝杯的打孔质量无关的干扰特征，鉴于注意力机制能够选择聚焦位置，产生更具分辨性的特征表示，且加入注意力模块后的特征会随着网络的加深产生适应性的改变。因此，在本申请的技术方案中，将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型中进行处理，以提取出所述铝杯的检测图像中聚焦于空间上的关于孔洞的隐含特征分布信息与空间位置分布特征信息，从而得到分类特征图。值得一提的是，这里，所述空间注意力所提取到的图像特征则反映了空间维度特征差异的权重，用来抑制或强化不同空间位置的特征，以此来提取出空间上聚焦于所述加工成型的铝杯的特征信息。

接着，进一步再将具有铝杯孔洞的隐含特征和空间位置特征分布信息的分类特征图通过分类器中进行分类处理，以得到用于表示加工成型的铝杯的打孔是否发生偏移的分类结果。也就是，在本申请的技术方案中，所述分类器的标签包括加工成型的铝杯的打孔发生偏移，以及，加工成型的铝杯的打孔没有发生偏移，其中，所述分类器通过软最大值函数来确定所述分类特征图属于哪个分类标签。这样，能够对于加工成型的铝杯的打孔质量进行检测，以提高铝杯加工的工作效率和生产质量。

特别地，在本申请的技术方案中，通过将所述掩码图像和所述检测图像沿着通道维度进行聚合得到所述多通道检测图像，可以充分提取所述掩码图像和所述检测图像的高维图像语义特征，但是与此同时，所述掩码图像和所述检测图像各自的高维图像语义特征在所述分类特征图内的表达会降低所述分类特征图整体的特征分布的关联度。进一步地，由于所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型得到所述分类特征图，会在强化所述掩码图像和所述检测图像各自的高维空间语义特征分布的情况下进一步弱化所述掩码图像和所述检测图像之间的高维空间语义特征分布的关联，从而导致所述分类特征图的整体特征分布可能具有较强的离散性，使得分类器的训练困难，尤其是分类器的标签值的收敛困难。

因此，优选地使用软标签学习来代替常用的硬标签学习，具体地，在每次迭代时，计算所述分类特征图的基于跨分类器软相似性的自由标签优化因数来作为分类器的标签值，表示为：

，

是所述分类特征图展开后得到的分类特征向量，/>

是所述分类器对所述分类特征向量/>

的权重矩阵，/>

和/>

分别表示张量乘法和张量加法，/>

表示向量之间的距离，/>

表示向量的二范数，且/>

和/>

是权重超参数。

这里，所述基于跨分类器软相似性的自由标签优化因数作为分类器的标签值，可以代替以硬标签值计算所述分类特征图的分类概率，对所述分类特征图展开后得到的所述分类特征向量和分类器的权重矩阵进行双向聚簇，来通过所述分类特征向量与权重矩阵的跨分类器的软相似性模拟基于分类器权重矩阵的伪类别，从而以软相似性学习来避免了硬标签学习带来的分类量化损失，实现了更关注于分类器的内在权重结构的自由标签优化，从而优化了分类器的标签值的训练，提升了分类器的训练速度。这样，能够准确地对于加工成型的铝杯的打孔质量进行检测，进而提高铝杯加工的工作效率和生产质量。

基于此，本申请提出了一种铝杯的智能化生产方法，其包括：获取加工成型的铝杯的检测图像；基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像；将所述掩码图像和所述检测图像沿着通道维度进行聚合以得到多通道检测图像；将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图；以及，将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移。

图1为根据本申请实施例的铝杯的智能化生产方法的应用场景图。如图1所示，在该应用场景中，首先，由摄像头（例如，如图1中所示意的Ca）获取加工成型的铝杯（例如，如图1中所示意的Cu）的检测图像。进而，将所述加工成型的铝杯的检测图像输入至部署有铝杯的智能化生产算法的服务器（例如，如图1所示意的S）中，其中，所述服务器能够基于所述铝杯的智能化生产算法对所述加工成型的铝杯的检测图像进行处理，以得到用于表示加工成型的铝杯的打孔是否发生偏移的分类结果。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法：图2为根据本申请实施例的铝杯的智能化生产方法的流程图。如图2所示，根据本申请实施例的铝杯的智能化生产方法，包括：S110，获取加工成型的铝杯的检测图像；S120，基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像；S130，将所述掩码图像和所述检测图像沿着通道维度进行聚合以得到多通道检测图像；S140，将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图；以及，S150，将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移。

图3为根据本申请实施例的铝杯的智能化生产方法的架构图。如图3所示，在该架构中，首先，获取加工成型的铝杯的检测图像；接着，基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像；然后，将所述掩码图像和所述检测图像沿着通道维度进行聚合以得到多通道检测图像；继而，将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图；最后，将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移。

如上所述，在专利CN 103691806B公开的一种铝杯加工成型的工艺中，虽然该铝杯加工成型的工艺可以优化工作效率，但在生产过程中发现在打孔阶段会因振动或者设备的移位而导致打孔偏移，如果没有及时发现会导致大量残次品的出现。因此，期待一种更为优化的铝杯的智能化生产方案。

在步骤S110中，获取加工成型的铝杯的检测图像。在本申请的技术方案中，可以通过摄像头获取加工成型的铝杯的检测图像。

在步骤S120中，基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像。考虑到在所述检测图像中，对于加工成型的铝杯的打孔是否发生偏移的检测与孔洞的形状、尺寸以及平滑度有关，而对于所述检测图像来说，所述孔洞在所述检测图像中的特征信息为小尺度的特征，其在特征提取时会受到其余无用的干扰特征的影响，难以进行孔洞的隐含特征挖掘。因此，在特征提取时需要聚焦于孔洞区域的隐含特征而滤除其余无用的干扰特征信息。基于此，在本申请的技术方案中，基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像。

具体地，将所述检测图像通过孔洞目标识别网络以锚定所述孔洞在所述铝杯的位置。特别地，这里，所述孔洞目标识别网络为基于锚窗的目标识别网络，且所述基于锚窗的目标识别网络为Fast R-CNN、Faster R-CNN或RetinaNet。

在步骤S130中，将所述掩码图像和所述检测图像沿着通道维度进行聚合以得到多通道检测图像。考虑到在进行所述加工成型的铝杯的打孔是否发生偏移检测时，还需要关注于所述孔洞在所述检测图像中的位置特征信息，因此，在本申请的技术方案中，进一步将所述掩码图像和所述检测图像沿着通道维度进行聚合，以此来得到具有聚焦于孔洞信息与原始图像信息的多通道检测图像。

在步骤S140中，将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图。也就是，使用在图像的隐含特征提取方面具有优异表现的卷积神经网络模型来进行所述多通道检测图像的特征提取，特别地，考虑到在进行所述加工成型的铝杯的打孔质量检测时，应关注于空间位置上关于孔洞的隐含特征信息和位置特征信息而忽略与铝杯的打孔质量无关的干扰特征，鉴于注意力机制能够选择聚焦位置，产生更具分辨性的特征表示，且加入注意力模块后的特征会随着网络的加深产生适应性的改变。因此，在本申请的技术方案中，将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型中进行处理，以提取出所述铝杯的检测图像中聚焦于空间上的关于孔洞的隐含特征分布信息与空间位置分布特征信息，从而得到分类特征图。值得一提的是，这里，所述空间注意力所提取到的图像特征则反映了空间维度特征差异的权重，用来抑制或强化不同空间位置的特征，以此来提取出空间上聚焦于所述加工成型的铝杯的特征信息。

具体地，在本申请实施例中，所述将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图，包括：使用所述卷积神经网络模型的卷积编码部分对所述多通道检测图像进行深度卷积编码以得到初始卷积特征图；将所述初始卷积特征图输入所述卷积神经网络模型的空间注意力部分以得到空间注意力图；将所述空间注意力图通过Softmax激活函数以得到空间注意力特征图；以及，计算所述空间注意力特征图和所述初始卷积特征图的按位置点乘以得到分类特征图。

在步骤S150中，将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移。也就是，将具有铝杯孔洞的隐含特征和空间位置特征分布信息的分类特征图通过分类器中进行分类处理，以得到用于表示加工成型的铝杯的打孔是否发生偏移的分类结果。在本申请的技术方案中，所述分类器的标签包括加工成型的铝杯的打孔发生偏移，以及，加工成型的铝杯的打孔没有发生偏移，其中，所述分类器通过软最大值函数来确定所述分类特征图属于哪个分类标签。这样，能够对于加工成型的铝杯的打孔质量进行检测，以提高铝杯加工的工作效率和生产质量。

具体地，在本申请实施例中，所述将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移，包括：将所述分类特征图中各个分类特征矩阵按照行向量或者列向量展开为一维特征向量后进行级联以得到分类特征向量；使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量；以及，将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。

在上述铝杯的智能化生产方法中，还包括对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练。

图4为根据本申请实施例的铝杯的智能化生产方法中对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练的流程图。如图4所示，所述对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练，包括步骤：S210，获取训练数据，所述训练数据包括加工成型的铝杯的训练检测图像，以及，所述加工成型的铝杯的打孔是否发生偏移的真实值；S220，基于孔洞在所述铝杯的位置，对所述训练检测图像的相应位置处施加掩码以得到训练掩码图像；S230，将所述训练掩码图像和所述训练检测图像沿着通道维度进行聚合以得到训练多通道检测图像；S240，将所述训练多通道检测图像通过所述使用空间注意力机制的卷积神经网络模型以得到训练分类特征图；S250，将所述训练分类特征图通过所述分类器以得到分类损失函数值；以及，S260，基于所述分类损失函数值并通过梯度下降的反向传播来对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练，其中，在所述训练过程的每一轮迭代中，计算所述训练分类特征图的基于跨分类器软相似性的自由标签优化因数来作为所述分类器的标签值。

，

其中

是所述训练分类特征图展开后得到的训练分类特征向量，/>

和/>

分别表示张量乘法和张量加法，/>

表示向量之间的距离，/>

表示向量的二范数，且/>

和/>

是权重超参数，/>

表示所述分类器的标签值。

综上，基于本申请实施例的铝杯的智能化生产方法被阐明，其采用基于深度学习的人工智能检测技术，以通过将孔洞所在检测图像中的位置处进行目标锚定来进行孔洞感兴趣区域的特征挖掘，以此来提取出关于小尺度的孔洞隐含特征信息，并且还利用所述检测图像中关于孔洞的位置特征信息，以此来综合对于加工成型的铝杯的打孔是否发生偏移进行检测。这样，能够准确地对于加工成型的铝杯的打孔质量进行检测，进而提高铝杯加工的工作效率和生产质量。

示例性系统：图5为根据本申请实施例的铝杯的智能化生产系统的框图。如图5所示，根据本申请实施例的铝杯的智能化生产系统100，包括：检测图像获取单元110，用于获取加工成型的铝杯的检测图像；掩码施加单元120，用于基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像；多通道聚合单元130，用于将所述掩码图像和所述检测图像沿着通道维度进行聚合以得到多通道检测图像；空间注意力施加单元140，用于将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图；以及，检测结果生成单元150，用于将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移。

在一个示例中，在上述铝杯的智能化生产系统100中，所述掩码施加单元120，用于将所述检测图像通过孔洞目标识别网络以锚定所述孔洞在所述铝杯的位置。

在一个示例中，在上述铝杯的智能化生产系统100中，所述孔洞目标识别网络为Fast R-CNN、Faster R-CNN、RetinaNet。

在一个示例中，在上述铝杯的智能化生产系统100中，所述空间注意力施加单元140，进一步用于：使用所述卷积神经网络模型的卷积编码部分对所述多通道检测图像进行深度卷积编码以得到初始卷积特征图；将所述初始卷积特征图输入所述卷积神经网络模型的空间注意力部分以得到空间注意力图；将所述空间注意力图通过Softmax激活函数以得到空间注意力特征图；以及，计算所述空间注意力特征图和所述初始卷积特征图的按位置点乘以得到分类特征图。

在一个示例中，在上述铝杯的智能化生产系统100中，所述检测结果生成单元150，进一步用于：将所述分类特征图中各个分类特征矩阵按照行向量或者列向量展开为一维特征向量后进行级联以得到分类特征向量；使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量；以及，将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。

在一个示例中，在上述铝杯的智能化生产系统100中，还包括用于对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练的训练模块200。

图6为根据本申请实施例的铝杯的智能化生产系统中训练模块的框图。如图6所示，所述训练模块200，包括：训练数据获取单元210，用于获取训练数据，所述训练数据包括加工成型的铝杯的训练检测图像，以及，所述加工成型的铝杯的打孔是否发生偏移的真实值；训练掩码施加单元220，用于基于孔洞在所述铝杯的位置，对所述训练检测图像的相应位置处施加掩码以得到训练掩码图像；训练多通道聚合单元230，用于将所述训练掩码图像和所述训练检测图像沿着通道维度进行聚合以得到训练多通道检测图像；训练空间注意力施加单元240，用于将所述训练多通道检测图像通过所述使用空间注意力机制的卷积神经网络模型以得到训练分类特征图；分类损失单元250，用于将所述训练分类特征图通过所述分类器以得到分类损失函数值；以及，训练单元260，用于基于所述分类损失函数值并通过梯度下降的反向传播来对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练，其中，在所述训练过程的每一轮迭代中，计算所述训练分类特征图的基于跨分类器软相似性的自由标签优化因数来作为所述分类器的标签值。

在一个示例中，在上述铝杯的智能化生产系统100中，所述在所述训练过程的每一轮迭代中，以如下公式计算所述训练分类特征向量的基于跨分类器软相似性的自由标签优化因数来作为所述分类器的标签值；其中，所述公式为：

，

其中

是所述训练分类特征图展开后得到的训练分类特征向量，/>

和/>

分别表示张量乘法和张量加法，/>

表示向量之间的距离，/>

表示向量的二范数，且/>

和/>

是权重超参数，/>

表示所述分类器的标签值。

这里，本领域技术人员可以理解，上述铝杯的智能化生产系统 100中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的铝杯的智能化生产方法的描述中得到了详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的铝杯的智能化生产系统 100可以实现在各种终端设备中，例如用于铝杯的智能化生产的服务器等。在一个示例中，根据本申请实施例的铝杯的智能化生产系统 100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该铝杯的智能化生产系统100可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该铝杯的智能化生产系统 100同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该铝杯的智能化生产系统 100与该终端设备也可以是分立的设备，并且该铝杯的智能化生产系统 100可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

示例性电子设备：下面，参考7来描述根据本申请实施例的电子设备。图7为根据本申请实施例的电子设备的框图。如图7所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元（CPU）或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器（RAM）和/或高速缓冲存储器（cache）等。所述非易失性存储器例如可以包括只读存储器（ROM）、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的铝杯的智能化生产方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如加工成型的铝杯的检测图像等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线系统和/或其他形式的连接机构（未示出）互连。

该输入装置13可以包括例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图7中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质：除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的铝杯的智能化生产方法中的功能中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的铝杯的智能化生产方法中的功能中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种铝杯的智能化生产方法，其特征在于，包括：获取加工成型的铝杯的检测图像；基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像；将所述掩码图像和所述检测图像沿着通道维度进行聚合以得到多通道检测图像；将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图；以及将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移。

2.根据权利要求1所述的铝杯的智能化生产方法，其特征在于，所述基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像，包括：将所述检测图像通过孔洞目标识别网络以锚定所述孔洞在所述铝杯的位置。

3.根据权利要求2所述的铝杯的智能化生产方法，其特征在于，所述孔洞目标识别网络为Fast R-CNN、Faster R-CNN、RetinaNet。

4.根据权利要求3所述的铝杯的智能化生产方法，其特征在于，所述将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图，包括：使用所述卷积神经网络模型的卷积编码部分对所述多通道检测图像进行深度卷积编码以得到初始卷积特征图；将所述初始卷积特征图输入所述卷积神经网络模型的空间注意力部分以得到空间注意力图；将所述空间注意力图通过Softmax激活函数以得到空间注意力特征图；以及计算所述空间注意力特征图和所述初始卷积特征图的按位置点乘以得到分类特征图。

5.根据权利要求4所述的铝杯的智能化生产方法，其特征在于，所述将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移，包括：将所述分类特征图中各个分类特征矩阵按照行向量或者列向量展开为一维特征向量后进行级联以得到分类特征向量；使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量；以及将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。

6.根据权利要求1所述的铝杯的智能化生产方法，其特征在于，还包括训练步骤：对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练。

7.根据权利要求6所述的铝杯的智能化生产方法，其特征在于，所述训练步骤，包括：获取训练数据，所述训练数据包括加工成型的铝杯的训练检测图像，以及，所述加工成型的铝杯的打孔是否发生偏移的真实值；基于孔洞在所述铝杯的位置，对所述训练检测图像的相应位置处施加掩码以得到训练掩码图像；将所述训练掩码图像和所述训练检测图像沿着通道维度进行聚合以得到训练多通道检测图像；将所述训练多通道检测图像通过所述使用空间注意力机制的卷积神经网络模型以得到训练分类特征图；将所述训练分类特征图通过所述分类器以得到分类损失函数值；以及基于所述分类损失函数值并通过梯度下降的反向传播来对所述使用空间注意力机制的卷积神经网络模型和所述分类器进行训练，其中，在所述训练过程的每一轮迭代中，计算所述训练分类特征图的基于跨分类器软相似性的自由标签优化因数来作为所述分类器的标签值。

8.根据权利要求7所述的铝杯的智能化生产方法，其特征在于，所述在所述训练过程的每一轮迭代中，以如下公式计算所述训练分类特征向量的基于跨分类器软相似性的自由标签优化因数来作为所述分类器的标签值；其中，所述公式为：

，

其中

是所述训练分类特征图展开后得到的训练分类特征向量，/>

和/>

分别表示张量乘法和张量加法，/>

表示向量之间的距离，/>

表示向量的二范数，且/>

和/>

是权重超参数，/>

表示所述分类器的标签值。

9.一种铝杯的智能化生产系统，其特征在于，包括：检测图像获取单元，用于获取加工成型的铝杯的检测图像；掩码施加单元，用于基于孔洞在所述铝杯的位置，对所述检测图像的相应位置处施加掩码以得到掩码图像；多通道聚合单元，用于将所述掩码图像和所述检测图像沿着通道维度进行聚合以得到多通道检测图像；空间注意力施加单元，用于将所述多通道检测图像通过使用空间注意力机制的卷积神经网络模型以得到分类特征图；以及检测结果生成单元，用于将所述分类特征图通过分类器以得到分类结果，所述分类结果用于表示加工成型的铝杯的打孔是否发生偏移。

10.根据权利要求9所述的铝杯的智能化生产系统，其特征在于，所述掩码施加单元，进一步用于：将所述检测图像通过孔洞目标识别网络以锚定所述孔洞在所述铝杯的位置。