WO2024066061A1

WO2024066061A1 - 基于图像识别的斗轮损伤判定方法及其系统

Info

Publication number: WO2024066061A1
Application number: PCT/CN2022/138434
Authority: WO
Inventors: 郑安; 张波; 刘鹏飞; 马广玉; 咸金龙; 刘强; 刘跃; 郑树坤; 冯川; 刘立丰
Original assignee: 华能伊敏煤电有限责任公司
Priority date: 2022-09-28
Filing date: 2022-12-12
Publication date: 2024-04-04
Also published as: CN115620270A

Abstract

公开了一种基于图像识别的斗轮损伤判定方法及其系统，其通过作为过滤器的第一卷积神经网络模型提取预定时间段内多个预定时间点的斗齿监控图像在高维特征空间中的局部隐含特征；然后，利用每两个斗齿监控图像的隐含特征差分相似性来对于斗齿表面是否存在损伤进行判定。这样，可以对于斗齿表面是否存在损伤进行准确地判定，进而能够及时有效地对于表面有损伤的斗齿进行维修更换，以保证挖掘机的正常安全运行。

Description

基于图像识别的斗轮损伤判定方法及其系统

技术领域

本申请涉及智能化检测技术领域，且更为具体地，涉及一种基于图像识别的斗轮损伤判定方法及其系统。

背景技术

随着社会和经济的发展，城市的建设越来越快，在城市建设中当然少不了挖掘机，挖掘机挖掘时，主要是利用铲斗挖掘高于或低于承机面的物料，并装入运输车辆或卸至堆料场的土方机械，从近几年工程机械的发展来看，挖掘机的发展相对较快，挖掘机已经成为工程建设中最主要的工程机械之一。挖掘机斗齿是挖掘机的关键易损件，由于其在使用过程中直接与矿石、砂土、岩石等接触，工作条件十分恶劣，使用寿命短，更换频繁，消耗量巨大。

目前，现有的挖掘机上通过安装摄像头来采集图像进行处理，以判断斗齿是否存在损伤。但是，斗齿在工作的过程中保持着旋转状态，摄像头在每个预定时间点仅能采集到斗齿的局部区域的图像，这会导致对于斗齿损伤的判断不够精准。并且，由于在检测的过程中，斗齿表面会附着泥土等干扰对象以对于斗齿损伤的判断带来干扰。

因此，期待一种优化的基于图像识别的斗轮损伤判定方案。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种基于图像识别的斗轮损伤判定方法及其系统，其通过作为过滤器的第一卷积神经网络模型提取预定时间段内多个预定时间点的斗齿监控图像在高维特征空间中的局部隐含特征；然后，利用每两个斗齿监控图像的隐含特征差分相似性比较基于斗齿监控图像的全局隐含特征信息来对于斗齿表面是否存在损伤进行判定。这样，可以对于斗齿表面是否存在损伤进行准确地判定，进而能够及时有效地对于表面有损伤的斗齿进行维修更换，以保证挖掘机的正常安全运行。

根据本申请的一个方面，提供了一种基于图像识别的斗轮损伤判定方法，其包括：

获取由摄像头采集的预定时间段内多个预定时间点的斗齿监控图像；

将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量；

计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵；

将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵；将所述多个斗齿局部特征向量进行二维排列以得到全局斗齿特征矩阵；

将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵；

对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵；以及

将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，所述分类结果用于表示斗齿表面是否存在损伤。

在上述基于图像识别的斗轮损伤判定方法中，所述将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量，包括：使用所述作为过滤器的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：对所述输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于特征矩阵的均值池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为过滤器的第一卷积神经网络模型的最后一层的输出为所述多个斗齿局部特征向量，所述作为过滤器的第一卷积神经网络模型的第一层的输入为所述各个预定时间点的斗齿监控图像。

在上述基于图像识别的斗轮损伤判定方法中，所述计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵，包括：以如下公式来计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到多个相似度；其中，所述公式为：

其中V _i和V _j分别表示所述多个斗齿局部特征向量中每两个斗齿局部特征向量，

和

分别表示所述多个斗齿局部特征向量中每两个斗齿局部特征向量的各个位置的特征值，d(V _i，V _j)表示所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度；以及，将所述多个相似度进行二维排列以得到所述相似度矩阵。

在上述基于图像识别的斗轮损伤判定方法中，所述将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵，包括：使用所述作为特征提取器的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：对所述输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行沿通道维度的池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为特征提取器的第二卷积神经网络模型的最后一层的输出为所述相似度特征矩阵，所述作为特征提取器的第二卷积神经网络模型的第一层的输入为所述相似度矩阵。

在上述基于图像识别的斗轮损伤判定方法中，所述对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵，包括：以如下公式对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到所述优化相似度拓扑全局斗齿特征矩阵；其中，所述公式为：

M′＝p ^p·M ^p-1⊙e ^-p·M

其中M表示所述相似度拓扑全局斗齿特征矩阵，M′表示所述优化相似度拓扑全局斗齿特征矩阵，p表示所述相似度拓扑全局斗齿特征矩阵通过所述分类器获得的概率值，⊙表示按位置点乘。

在上述基于图像识别的斗轮损伤判定方法中，所述将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，包括：使用所述分类器以如下公式对所述优化相似度拓扑全局斗齿特征矩阵进行处理以生成分类结果，其中，所述公式为：softmax{(W _n，B _n)：...：(W ₁，B ₁)|Project(F)}，其中Project(F)表示将所述优化相似度拓扑全局斗齿特征矩阵投影为向量，W ₁至W _n为各层全连接层的权重矩阵，B ₁至B _n表示各层全连接层的偏置矩阵。

根据本申请的另一方面，提供了一种基于图像识别的斗轮损伤判定系统，其包括：

图像采集模块，用于获取由摄像头采集的预定时间段内多个预定时间点的斗齿监控图像；斗齿局部特征提取模块，用于将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量；

相似度计算模块，用于计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵；

相似度特征提取模块，用于将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵；

二维排列模块，用于将所述多个斗齿局部特征向量进行二维排列以得到全局斗齿特征矩阵；图结构数据编码模块，用于将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵；

特征补偿模块，用于对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵；以及

损伤判定结果生成模块，用于将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，所述分类结果用于表示斗齿表面是否存在损伤。

与现有技术相比，本申请提供的基于图像识别的斗轮损伤判定方法及其系统，其通过作为过滤器的第一卷积神经网络模型提取预定时间段内多个预定时间点的斗齿监控图像在高维特征空间中的局部隐含特征；然后，利用每两个斗齿监控图像的隐含特征差分相似性比较基于斗齿监控图像的全局隐含特征信息来对于斗齿表面是否存在损伤进行判定。这样，可以对于斗齿表面是否存在损伤进行准确地判定，进而能够及时有效地对于表面有损伤的斗齿进行维修更换，以保证挖掘机的正常安全运行。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法的应用场景图。

图2图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法的流程图。

图3图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法的架构示意图。

图4图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法中，将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量的流程图。

图5图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法中，将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵的流程图。

图6图示了根据本申请实施例的基于图像识别的斗轮损伤判定系统的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

场景概述

如上所述，现有的挖掘机上通过安装摄像头来采集图像进行处理，以判断斗齿是否存在损伤。但是，斗齿在工作的过程中保持着旋转状态，摄像头在每个预定时间点仅能采集到斗齿的局部区域的图像，这会导致对于斗齿损伤的判断不够精准。并且，由于在检测的过程中，斗齿表面会附着泥土等干扰对象以对于斗齿损伤的判断带来干扰。因此，期待一种优化的基于图像识别的斗轮损伤判定方案。

目前，深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外，深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域，也展现出了接近甚至超越人类的水平。

深度学习以及神经网络的发展为斗轮损伤的智能判定提供了新的解决思路和方案。

具体地，在本申请的技术方案中，通过采用基于深度学习的人工智能判定方法以利用图像识别技术来对于斗轮是否损伤进行精准判断。具体地，在此过程中，通过对于在时序维度上的多个斗齿监控图像中的隐含特征分布信息进行提取来得到所述斗齿在该时间点上的深层隐含特征，从而滤除泥土等干扰对象带来的识别影响。并且，进一步利用每两个所述斗齿监控图像的隐含特征差分相似性比较来基于所述斗齿的全局隐含特征信息来提高对于所述斗齿表面的损伤判定。这样，能够准确地对于所述斗齿表面是否存在损伤进行判断，进而能够及时有效地对于所述斗齿进行维修更换，以保证挖掘机的正常安全运行。

具体地，在本申请的技术方案中，首先，通过摄像头采集预定时间段内多个预定时间点的斗齿监控图像。然后，为了在斗齿损伤判断中滤除所述斗齿表面附着的泥土等干扰对象的影响，进一步将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型中进行特征挖掘，以提取出所述斗齿监控图像在高维特征空间中的局部隐含特征，从而得到多个斗齿局部特征向量。

接着，由于所述斗齿在工作过程中保持旋转状态，因此，所述摄像头在每个预定时间点仅能采集到所述斗齿的局部区域的图像。并且，考虑到在对于所述斗齿表面损伤的判断过程中，由于该所述斗齿表面的损伤是存在局部特性的，但是需要基于所述斗齿表面的整体来进行全局检测。因此，在本申请的技术方案中，进一步以每两个所述斗齿监控图像的隐含特征差分相似性比较来优化对于所述斗齿表面损伤的判定。

也就是，具体地，进一步计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度，例如余弦距离来得到相似度矩阵。然后，将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型中进行特征提取，以提取出所述相似度矩阵中每两个所述斗齿监控图像的隐含特征的相似度的隐藏关联性特征，从而得到相似度特征矩阵。

进一步地，以所述各个预定时间点的斗齿局部特征向量作为节点的特征表示，而以所述相似度特征矩阵作为节点与节点之间的边的特征表示，将由所述多个斗齿局部特征向量经二维排列得到的所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵。具体地，所述图神经网络通过可学习的神经网络参数对所述全局斗齿特征矩阵和所述相似度特征矩阵进行图结构数据编码以得到包含相似度关联特征和所述各个预定时间点的斗齿隐含特征信息的所述相似度拓扑全局斗齿特征矩阵。然后，将所述优化相似度拓扑全局斗齿特征矩阵通过分类器就可以得到用于表示斗齿表面是否存在损伤的分类结果。

特别地，在本申请的技术方案中，这里，由于所述相似度拓扑全局斗齿特征矩阵是将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络得到的，因此所述相似度拓扑全局斗齿特征矩阵的各个行向量之间具有相似性拓扑关联关系。因此，当将所述相似度拓扑全局斗齿特征矩阵通过分类器进行分类时，容易发生类相干干涉。

因此，在本申请的技术方案中，优选地对所述相似度拓扑全局斗齿特征矩阵，例如记为M进行基于预分类的类概率相干补偿机制校正，表示为：

M′＝p ^p·M ^p-1⊙ ^e-p·M

其中p是所述相似度拓扑全局斗齿特征矩阵M通过分类器获得的概率值。

也就是，由于所述相似度拓扑全局斗齿特征矩阵M的各个行向量之间具有的相似性拓扑关联关系，在对其进行分类时，分类器本身的权重矩阵会在分类过程中对各个行向量具有类相干性，从而对所述相似度拓扑全局斗齿特征矩阵M造成类相干干涉。基于此，将通过预分类得到的分类器的类别概率值作为所述相似度拓扑全局斗齿特征矩阵M的乘性干扰噪声项，来对所述相似度拓扑全局斗齿特征矩阵M来进行类概率的相干补偿，可以恢复无干扰情况下的所述相似度拓扑全局斗齿特征矩阵M的等效概率强度表征，即优化后的所述相似度拓扑全局斗齿特征矩阵M′，从而实现所述相似度拓扑全局斗齿特征矩阵M的校正，提高了分类结果的准确性。这样，能够对于所述斗齿表面是否存在损伤进行准确地判断，进而能够及时有效地对于表面有损伤的斗齿进行维修更换，以保证挖掘机的正常安全运行。

基于此，本申请提出了一种基于图像识别的斗轮损伤判定方法，其包括：获取由摄像头采集的预定时间段内多个预定时间点的斗齿监控图像；将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量；计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵；将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵；将所述多个斗齿局部特征向量进行二维排列以得到全局斗齿特征矩阵；将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵；对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵；以及，将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，所述分类结果用于表示斗齿表面是否存在损伤。

图1图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法的应用场景图。如图1所示，在该应用场景中，首先通过摄像头(例如，如图1中所示意的C)采集挖掘机斗齿(例如，如图1中所示意的F)的预定时间段内多个预定时间点的斗齿监控图像(例如，如图1中所示意的M)；然后，将采集的斗齿监控图像输入至部署有基于图像识别的斗轮损伤判定算法的服务器中(例如，如图1中所示意的S)，其中，所述服务器以基于图像识别的斗轮损伤判定算法对所述斗齿监控图像进行处理，以输出得到用于表示斗齿表面是否存在损伤的分类结果。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图2图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法的流程图。如图2所示，根据本申请实施例的基于图像识别的斗轮损伤判定方法，包括：S110，获取由摄像头采集的预定时间段内多个预定时间点的斗齿监控图像；S120，将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量；S130，计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵；S140，将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵；S150，将所述多个斗齿局部特征向量进行二维排列以得到全局斗齿特征矩阵；S160，将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵；S170，对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵；以及，S180，将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，所述分类结果用于表示斗齿表面是否存在损伤。

图3图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法的架构示意图。如图3所示，在所述基于图像识别的斗轮损伤判定方法的网络架构中，首先，获取由摄像头采集的预定时间段内多个预定时间点的斗齿监控图像；然后，将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量；接着，计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵；然后，将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵；接着，将所述多个斗齿局部特征向量进行二维排列以得到全局斗齿特征矩阵；然后，将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵；接着，对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵；以及，最后，将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，所述分类结果用于表示斗齿表面是否存在损伤。

在步骤S110中，获取由摄像头采集的预定时间段内多个预定时间点的斗齿监控图像。如前所述，现有的挖掘机上通过安装摄像头来采集图像进行处理，以判断斗齿是否存在损伤。但是，斗齿在工作的过程中保持着旋转状态，摄像头在每个预定时间点仅能采集到斗齿的局部区域的图像，这会导致对于斗齿损伤的判断不够精准。并且，由于在检测的过程中，斗齿表面会附着泥土等干扰对象以对于斗齿损伤的判断带来干扰。因此，期待一种优化的基于图像识别的斗轮损伤判定方案。

更具体地，在本申请的技术方案中，首先，通过摄像头采集预定时间段内多个预定时间点的斗齿监控图像。

在步骤S120中，将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量。应可以理解，在得到所述斗齿监控图像后，为了在斗齿损伤判断中滤除所述斗齿表面附着的泥土等干扰对象的影响，进一步将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型中进行特征挖掘，以提取出所述斗齿监控图像在高维特征空间中的局部隐含特征，从而得到多个斗齿局部特征向量。具体地，在本申请实施例中，图4图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法中，将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量的流程图，如图4所示，所述将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量，包括：使用所述作为过滤器的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：S210，对所述输入数据进行卷积处理以得到卷积特征图；S220，对所述卷积特征图进行基于特征矩阵的均值池化处理以得到池化特征图；以及，S230，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为过滤器的第一卷积神经网络模型的最后一层的输出为所述多个斗齿局部特征向量，所述作为过滤器的第一卷积神经网络模型的第一层的输入为所述各个预定时间点的斗齿监控图像。

在步骤S130中，计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵。由于所述斗齿在工作过程中保持旋转状态，因此，所述摄像头在每个预定时间点仅能采集到所述斗齿的局部区域的图像。并且，考虑到在对于所述斗齿表面损伤的判断过程中，由于该所述斗齿表面的损伤是存在局部特性的，但是需要基于所述斗齿表面的整体来进行全局检测。

因此，在本申请的技术方案中，进一步以每两个所述斗齿监控图像的隐含特征差分相似性比较来优化对于所述斗齿表面损伤的判定。也就是，具体地，进一步计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度，例如余弦距离来得到相似度矩阵。

进一步地，所述计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵，包括：以如下公式来计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到多个相似度；其中，所述公式为：

和

在步骤S140中，将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵。也就是，将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型中进行特征提取，以提取出所述相似度矩阵中每两个所述斗齿监控图像的隐含特征的相似度的隐藏关联性特征，从而得到相似度特征矩阵。

具体地，在本申请实施例中，图5图示了根据本申请实施例的基于图像识别的斗轮损伤判定方法中，将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵的流程图，如图5所示，所述将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵，包括：使用所述作为特征提取器的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：S310，对所述输入数据进行卷积处理以得到卷积特征图；S320，对所述卷积特征图进行沿通道维度的池化处理以得到池化特征图；以及，S330，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为特征提取器的第二卷积神经网络模型的最后一层的输出为所述相似度特征矩阵，所述作为特征提取器的第二卷积神经网络模型的第一层的输入为所述相似度矩阵。

在步骤S150和步骤S160中，将所述多个斗齿局部特征向量进行二维排列以得到全局斗齿特征矩阵，然后，将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵。进一步地，以所述各个预定时间点的斗齿局部特征向量作为节点的特征表示，而以所述相似度特征矩阵作为节点与节点之间的边的特征表示，将由所述多个斗齿局部特征向量经二维排列得到的所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵。

具体地，所述图神经网络通过可学习的神经网络参数对所述全局斗齿特征矩阵和所述相似度特征矩阵进行图结构数据编码以得到包含相似度关联特征和所述各个预定时间点的斗齿隐含特征信息的所述相似度拓扑全局斗齿特征矩阵。然后，将所述优化相似度拓扑全局斗齿特征矩阵通过分类器就可以得到用于表示斗齿表面是否存在损伤的分类结果。

在步骤S170中，对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵。特别地，在本申请的技术方案中，这里，由于所述相似度拓扑全局斗齿特征矩阵是将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络得到的，因此所述相似度拓扑全局斗齿特征矩阵的各个行向量之间具有相似性拓扑关联关系。因此，当将所述相似度拓扑全局斗齿特征矩阵通过分类器进行分类时，容易发生类相干干涉。

因此，在本申请的技术方案中，优选地对所述相似度拓扑全局斗齿特征矩阵，例如记为M进行基于预分类的类概率相干补偿机制校正，也就是，以如下公式对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到所述优化相似度拓扑全局斗齿特征矩阵；其中，所述公式为：

M′＝p ^p·M ^p-1⊙ ^e-p·M

在步骤S180中，将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，所述分类结果用于表示斗齿表面是否存在损伤。

具体地，在本申请实施例中，使用所述分类器以如下公式对所述优化相似度拓扑全局斗齿特征矩阵进行处理以生成分类结果，其中，所述公式为：softmax{(W _n，B _n)：...：(W ₁，B ₁)|Project(F)}，其中Project(F)表示将所述优化相似度拓扑全局斗齿特征矩阵投影为向量，W ₁至W _n为各层全连接层的权重矩阵，B ₁至B _n表示各层全连接层的偏置矩阵。

进一步地，所述基于图像识别的斗轮损伤判定方法，还包括：从所述优化相似度拓扑全局斗齿特征矩阵提取待评估斗齿对应的行向量作为分类特征向量；以及，将所述分类特征向量通过所述分类器以得到用于表示待评估斗齿是否发生损坏的第二分类结果。

综上，基于本申请实施例的基于图像识别的斗轮损伤判定方法及其系统被阐明，其通过作为过滤器的第一卷积神经网络模型提取预定时间段内多个预定时间点的斗齿监控图像在高维特征空间中的局部隐含特征；然后，利用每两个斗齿监控图像的隐含特征差分相似性比较基于斗齿监控图像的全局隐含特征信息来对于斗齿表面是否存在损伤进行判定。这样，可以对于斗齿表面是否存在损伤进行准确地判定，进而能够及时有效地对于表面有损伤的斗齿进行维修更换，以保证挖掘机的正常安全运行。

示例性系统

图6图示了根据本申请实施例的基于图像识别的斗轮损伤判定系统的框图。如图6所示，根据本申请实施例的基于图像识别的斗轮损伤判定系统100，包括：图像采集模块110，用于获取由摄像头采集的预定时间段内多个预定时间点的斗齿监控图像；斗齿局部特征提取模块120，用于将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量；相似度计算模块130，用于计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵；相似度特征提取模块140，用于将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵；二维排列模块150，用于将所述多个斗齿局部特征向量进行二维排列以得到全局斗齿特征矩阵；图结构数据编码模块160，用于将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵；特征补偿模块170，用于对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵；以及，损伤判定结果生成模块180，用于将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，所述分类结果用于表示斗齿表面是否存在损伤。

在一个示例中，在上述基于图像识别的斗轮损伤判定系统100中，所述斗齿局部特征提取模块，用于：使用所述作为过滤器的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：对所述输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于特征矩阵的均值池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为过滤器的第一卷积神经网络模型的最后一层的输出为所述多个斗齿局部特征向量，所述作为过滤器的第一卷积神经网络模型的第一层的输入为所述各个预定时间点的斗齿监控图像。

如前所述，现有的挖掘机上通过安装摄像头来采集图像进行处理，以判断斗齿是否存在损伤。但是，斗齿在工作的过程中保持着旋转状态，摄像头在每个预定时间点仅能采集到斗齿的局部区域的图像，这会导致对于斗齿损伤的判断不够精准。并且，由于在检测的过程中，斗齿表面会附着泥土等干扰对象以对于斗齿损伤的判断带来干扰。因此，期待一种优化的基于图像识别的斗轮损伤判定方案。

在一个示例中，在上述基于图像识别的斗轮损伤判定系统100中，所述相似度计算模块，用于：以如下公式来计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到多个相似度；其中，所述公式为：

和

也就是，具体地，进一步计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度，例如余弦距离来得到相似度矩阵。

在一个示例中，在上述基于图像识别的斗轮损伤判定系统100中，所述相似度特征提取模块，用于：使用所述作为特征提取器的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：对所述输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行沿通道维度的池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为特征提取器的第二卷积神经网络模型的最后一层的输出为所述相似度特征矩阵，所述作为特征提取器的第二卷积神经网络模型的第一层的输入为所述相似度矩阵。

也就是，得到所述相似度矩阵后，接着，将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型中进行特征提取，以提取出所述相似度矩阵中每两个所述斗齿监控图像的隐含特征的相似度的隐藏关联性特征，从而得到相似度特征矩阵。

在一个示例中，在上述基于图像识别的斗轮损伤判定系统100中，所述特征补偿模块，用于：以如下公式对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到所述优化相似度拓扑全局斗齿特征矩阵；其中，所述公式为：

M′＝p ^p·M ^p-1⊙ ^e-p·M

因此，在本申请的技术方案中，优选地对所述相似度拓扑全局斗齿特征矩阵，例如记为M进行基于预分类的类概率相干补偿机制校正，也就是，由于所述相似度拓扑全局斗齿特征矩阵M的各个行向量之间具有的相似性拓扑关联关系，在对其进行分类时，分类器本身的权重矩阵会在分类过程中对各个行向量具有类相干性，从而对所述相似度拓扑全局斗齿特征矩阵M造成类相干干涉。基于此，将通过预分类得到的分类器的类别概率值作为所述相似度拓扑全局斗齿特征矩阵M的乘性干扰噪声项，来对所述相似度拓扑全局斗齿特征矩阵M来进行类概率的相干补偿，可以恢复无干扰情况下的所述相似度拓扑全局斗齿特征矩阵M的等效概率强度表征，即优化后的所述相似度拓扑全局斗齿特征矩阵M′，从而实现所述相似度拓扑全局斗齿特征矩阵M的校正，提高了分类结果的准确性。这样，能够对于所述斗齿表面是否存在损伤进行准确地判断，进而能够及时有效地对于表面有损伤的斗齿进行维修更换，以保证挖掘机的正常安全运行。

在一个示例中，在上述基于图像识别的斗轮损伤判定系统100中，所述损伤判定结果生成模块，用于：使用所述分类器以如下公式对所述优化相似度拓扑全局斗齿特征矩阵进行处理以生成分类结果，其中，所述公式为：softmax{(W _n，B _n)：...：(W ₁，B ₁)|Project(F)}，其中Project(F)表示将所述优化相似度拓扑全局斗齿特征矩阵投影为向量，W ₁至W _n为各层全连接层的权重矩阵，B ₁至B _n表示各层全连接层的偏置矩阵。

在一个示例中，在上述基于图像识别的斗轮损伤判定系统100中，还包括：提取单元：用于从所述优化相似度拓扑全局斗齿特征矩阵提取待评估斗齿对应的行向量作为分类特征向量；以及，第二分类结果生成单元：用于将所述分类特征向量通过所述分类器以得到用于表示待评估斗齿是否发生损坏的第二分类结果。

这里，本领域技术人员可以理解，上述基于图像识别的斗轮损伤判定系统100中的各个单元和模块的具体功能和操作已经在上面参考图1到图5的基于图像识别的斗轮损伤判定方法描述中得到了详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的基于图像识别的斗轮损伤判定系统100可以实现在各种终端设备中，例如用于基于图像识别的斗轮损伤判定的服务器等。在一个示例中，根据本申请实施例的基于图像识别的斗轮损伤判定系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该基于图像识别的斗轮损伤判定系统100可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该基于图像识别的斗轮损伤判定系统100同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该基于图像识别的斗轮损伤判定系统100与该终端设备也可以是分立的设备，并且该基于图像识别的斗轮损伤判定系统100可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

Claims

一种基于图像识别的斗轮损伤判定方法，其特征在于，包括：

获取由摄像头采集的预定时间段内多个预定时间点的斗齿监控图像；

将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量；

计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵；

将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵；

将所述多个斗齿局部特征向量进行二维排列以得到全局斗齿特征矩阵；

将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵；

对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵；以及

将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，所述分类结果用于表示斗齿表面是否存在损伤。
根据权利要求1所述的基于图像识别的斗轮损伤判定方法，其特征在于，所述将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量，包括：使用所述作为过滤器的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：

对所述输入数据进行卷积处理以得到卷积特征图；

对所述卷积特征图进行基于特征矩阵的均值池化处理以得到池化特征图；以及

对所述池化特征图进行非线性激活以得到激活特征图；

其中，所述作为过滤器的第一卷积神经网络模型的最后一层的输出为所述多个斗齿局部特征向量，所述作为过滤器的第一卷积神经网络模型的第一层的输入为所述各个预定时间点的斗齿监控图像。
根据权利要求2所述的基于图像识别的斗轮损伤判定方法，其特征在于，所述计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵，包括：以如下公式来计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到多个相似度；

其中，所述公式为：

其中V _i和V _j分别表示所述多个斗齿局部特征向量中每两个斗齿局部特征向量，
和
分别表示所述多个斗齿局部特征向量中每两个斗齿局部特征向量的各个位置的特征值，d(V _i，V _j)表示所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度；以及将所述多个相似度进行二维排列以得到所述相似度矩阵。
根据权利要求3所述的基于图像识别的斗轮损伤判定方法，其特征在于，所述将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵，包括：使用所述作为特征提取器的第二卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：

对所述输入数据进行卷积处理以得到卷积特征图；

对所述卷积特征图进行沿通道维度的池化处理以得到池化特征图；以及

对所述池化特征图进行非线性激活以得到激活特征图；

其中，所述作为特征提取器的第二卷积神经网络模型的最后一层的输出为所述相似度特征矩阵，所述作为特征提取器的第二卷积神经网络模型的第一层的输入为所述相似度矩阵。
根据权利要求4所述的基于图像识别的斗轮损伤判定方法，其特征在于，所述对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵，包括：

以如下公式对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到所述优化相似度拓扑全局斗齿特征矩阵；

其中，所述公式为：

M′＝p ^p·M ^p-1⊙e ^-p·M

其中M表示所述相似度拓扑全局斗齿特征矩阵，M′表示所述优化相似度拓扑全局斗齿特征矩阵，p表示所述相似度拓扑全局斗齿特征矩阵通过所述分类器获得的概率值，⊙表示按位置点乘。
根据权利要求5所述的基于图像识别的斗轮损伤判定方法，其特征在于，所述将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，包括：使用所述分类器以如下公式对所述优化相似度拓扑全局斗齿特征矩阵进行处理以生成分类结果，其中，所述公式为：softmax{(W _n，B _n)：...：(W ₁，B ₁)|Project(F)}，其中Project(F)表示将所述优化相似度拓扑全局斗齿特征矩阵投影为向量，W ₁至W _n为各层全连接层的权重矩阵，B ₁至B _n表示各层全连接层的偏置矩阵。
根据权利要求6所述基于图像识别的斗轮损伤判定方法，其特征在于，还包括：

从所述优化相似度拓扑全局斗齿特征矩阵提取待评估斗齿对应的行向量作为分类特征向量；以及

将所述分类特征向量通过所述分类器以得到用于表示待评估斗齿是否发生损坏的第二分类结果。
一种基于图像识别的斗轮损伤判定系统，其特征在于，包括：

图像采集模块，用于获取由摄像头采集的预定时间段内多个预定时间点的斗齿监控图像；斗齿局部特征提取模块，用于将所述各个预定时间点的斗齿监控图像分别通过作为过滤器的第一卷积神经网络模型以得到多个斗齿局部特征向量；

相似度计算模块，用于计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到相似度矩阵；

相似度特征提取模块，用于将所述相似度矩阵通过作为特征提取器的第二卷积神经网络模型以得到相似度特征矩阵；

二维排列模块，用于将所述多个斗齿局部特征向量进行二维排列以得到全局斗齿特征矩阵；图结构数据编码模块，用于将所述全局斗齿特征矩阵和所述相似度特征矩阵通过图神经网络以得到相似度拓扑全局斗齿特征矩阵；

特征补偿模块，用于对所述相似度拓扑全局斗齿特征矩阵进行基于预分类的特征补偿以得到优化相似度拓扑全局斗齿特征矩阵；以及

损伤判定结果生成模块，用于将所述优化相似度拓扑全局斗齿特征矩阵通过分类器以得到分类结果，所述分类结果用于表示斗齿表面是否存在损伤。
根据权利要求8所述的基于图像识别的斗轮损伤判定系统，其特征在于，所述斗齿局部特征提取模块，用于：使用所述作为过滤器的第一卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：

对所述输入数据进行卷积处理以得到卷积特征图；

对所述卷积特征图进行基于特征矩阵的均值池化处理以得到池化特征图；以及

对所述池化特征图进行非线性激活以得到激活特征图；

其中，所述作为过滤器的第一卷积神经网络模型的最后一层的输出为所述多个斗齿局部特征向量，所述作为过滤器的第一卷积神经网络模型的第一层的输入为所述各个预定时间点的斗齿监控图像。
根据权利要求9所述的基于图像识别的斗轮损伤判定系统，其特征在于，所述相似度计算模块，用于：以如下公式来计算所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度以得到多个相似度；

其中，所述公式为：

其中V _i和V _j分别表示所述多个斗齿局部特征向量中每两个斗齿局部特征向量，
和
分别表示所述多个斗齿局部特征向量中每两个斗齿局部特征向量的各个位置的特征值，d(V _i，V _j)表示所述多个斗齿局部特征向量中每两个斗齿局部特征向量之间的相似度；以及将所述多个相似度进行二维排列以得到所述相似度矩阵。