WO2022047736A1

WO2022047736A1 - 一种基于卷积神经网络的损伤检测方法

Info

Publication number: WO2022047736A1
Application number: PCT/CN2020/113533
Authority: WO
Inventors: 瓦尔·阿波得莫姆·阿波得莫姆阿塔贝; 默罕默德努里; 洪卫星
Original assignee: 江苏前沿交通研究院有限公司; 南京智行信息科技有限公司
Priority date: 2020-09-04
Filing date: 2020-09-04
Publication date: 2022-03-10

Abstract

一种基于卷积神经网络的损伤检测方法，可以接收输入图像，生成不同尺度的卷积多特征映射；通过双/多区域建议网络处理生成的卷积特征映射，为图像中的每个候选损伤生成双/多损伤建议，并创建双/多区域建议边界框；将双/多边界框投影回各个卷积层的特征映射，得到一组双/多关注区域；通过对它们进行比较，创建一个置信分数，表示在边界框中检测到期望损伤的可能性，从而只需一步就可检测到期望的损伤。本申请的有益效果是：用时短，高的精度和查全率，增加数据集尺寸和卷积层可以提高模型的速度和精度，可取得高达98％至99％左右的平均精度均佰。

Description

一种基于卷积神经网络的损伤检测方法

技术领域

本发明涉及神经网络领域，特别涉及一种基于卷积神经网络的损伤检测方法。

背景技术

若结构发生损伤，会有几个重要的迹象表明结构退化，甚至可能预示着严重失效的开始。已经在有可能替代人工检测的研究社区中进行了图像损伤检测的尝试。

在众多的损伤检测方法中，基于深度学习的损伤检测方法近年来得到了积极的探索。

下面快速总结一下基于区域的卷积神经网络R-CNN(Region-based convolutional neural network)家族中的不同算法：R-CNN、快速R-CNN(Fast R-CNN)和更快速R-CNN(Faster R-CNN)。

R-CNN使用选择性搜索从给定的图像中提取一组区域，然后检查任一方框中是否包含对象。首先提取这些区域，对于每个区域，CNN被用来提取特定的特征。最后，这些特征被用来检测对象。不幸的是，因为这个过程中涉及多个步骤，R-CNN变得相当缓慢。

快速R-CNN将整个图像传递给卷积网络，卷积网络生成关注区域ROI(Regions of interest)，而不是从图像中传递提取的区域。此外，它没有使用三个不同的模型(如我们在R-CNN中所见)，而是使用一个从区域中提取特征、将它们分为不同类型并返回边界框的单一模型。所有这些步骤都是同时完成的，因此与R-CNN相比，它的执行速度更快。然而，因为快速R-CNN还使用选择性搜索来提取区域，所以它在应用于大型数据集时速度不够快。

更快速R-CNN通过用区域建议网络RPN(Region Proposal Network)代替它来解决选择性搜索的问题。首先使用卷积网络从输入图像中提取特征图，然后通过返回对象建议的RPN传递这些特征图。最后，对这些特征图进行分类并预测边界框。

然而，如何在像素级快速、准确地自动提取损伤，即实时的损伤描述(包括检测和分割)是一个具有挑战性的问题。

发明内容

为了克服现有技术存在的问题，本发明提出了一种基于R-CNN家族结构的进行损伤检测的新方法，其基于双/多区域的更快速卷积神经网络的算法，用于高精度的实时目标(损伤)检测和分类。在本发明中，将基于双/多区域的更快速卷积神经网络的算法命名为更快速双/多区域卷积神经网络(Faster Dual/Multi Region-based Convolution Neural Network，简称为更快速D/M-R-CNN)算法。

为达到上述目的，本发明提供了一种基于卷积神经网络的损伤检测方法，所述方法包括：

步骤1-1将待检图像输入到更快速D/M-R-CNN模型；

步骤1-2所述更快速D/M-R-CNN模型处理所述待检图像，输出最终的损伤图像以及置信分数，其中，所述置信分数是指所述最终的损伤图像中的损伤是期望损伤的可能性；

其中，所述更快速D/M-R-CNN模型包括：

深度CNN，用于生成所述待检图像的特征映射；

双/多区域建议网络(Dual/Multi Region Proposal Network，D/M-RPN)模型，包括两个或两个以上的区域建议网络模型RPN，用于对所述待检图像中的每个候选损伤生成两个或两个以上的损伤建议，并对所述两个或两个以上的损伤建议进行比较以得到置信度，以及将得到的所有的所述损伤建议进行分类和回归，输出所述最终的损伤图像以及所述置信分数；其中，所述置信度是指所述两个或两个以上的损伤建议是所述期望损伤的可能性。

进一步地，所述深度CNN生成不同尺度的所述特征映射。

进一步地，所述两个或两个以上的损伤建议中的每一个包括边界框(bounding box，bbox)，所述边界框用于表示所述D/M-RPN模型检测到的损伤。

进一步地，所述D/M-RPN模型包括双/多关注区域(Dual/Multi regions of interest，D/M-ROI)池化层，所述D/M-ROI池化层包括两个或两个以上的关注区域ROI池化层，用于生成所述待检图像中所述每个候选损伤的所述两个或两个以上的损伤建议，并对所述两个或两个以上的损伤建议进行比较以得到所述置信度。

进一步地，所述D/M-ROI池化层是最大池化层和平均池化层中的一个。

进一步地，所述D/M-RPN模型还包括完全连接(Fully connected，FC)层，所述FC层用于对所述bbox进行分类和回归。

本发明还提供了一种基于卷积神经网络的损伤检测方法，所述方法包括：

步骤2-1将待检图像输入到深度CNN，得到所述待检图像的特征映射；

步骤2-2将所述特征映射输入到D/M-RPN模型中的D/M-ROI池化层，其中，所述D/M-RPN模型包括两个或两个以上的RPN模型，以及所述D/M-ROI池化层包括两个或两个以上的关注区域ROI池化层；

步骤2-3所述D/M-ROI池化层对所述待检图像中每个候选损伤生成两个或两个以上的损伤建议，然后比较所述两个或两个以上的损伤建议，以创建表示在边界框 bbox中检测到的损伤是期望损伤的置信度，其中，所述置信度是指所述两个或两个以上的损伤建议是所述期望损伤的可能性；

步骤2-4将所述损伤建议输入所述D/M-RPN模型的完全连接FC层，以对所述bbox进行分类和回归；

步骤2-5根据所述分类和回归的结果，得到最终的损伤图像，并计算置信分数，输出包括所述分类结果和所述置信分数的结果，其中，所述置信分数是指所述最终的损伤图像中的损伤是所述期望损伤的可能性。

进一步地，所述深度CNN和所述D/M-RPN模型构成更快速D/M-R-CNN模型，以及所述方法还包括对所述更快速D/M-R-CNN模型进行训练的步骤，其中所述训练的步骤包括：

步骤3-1、取得训练用的源图像，所述源图像是单个对象的图像序列；

步骤3-2、对所述源图像进行增强和标注；

步骤3-3、选择权重；

步骤3-4、设计并训练所述更快速D/M-R-CNN模型。

进一步地，所述步骤3-3、3-4中，进一步包括以下步骤：

步骤4-1、初始化所述更快速D/M-R-CNN模型；

步骤4-2、训练所述深度CNN和所述D/M-RPN模型，训练完成后，两者组成第一模型；

步骤4-3、使用所述步骤4-2得到的所述第一模型生成损伤建议；

步骤4-4、使用所述步骤4-3中得到的所述损伤建议训练分类器；

步骤4-5、使用所述步骤4-2得到的所述第一模型的参数重新初始化所述更快速D/M-R-CNN模型，得到第二模型；

步骤4-6、利用所述第二模型的权值再次训练所述D/M-RPN模型；

步骤4-7、使用所述第二模型生成损伤建议；

步骤4-8、使用所述步骤4-7中获得的损伤建议训练所述分类器。

进一步地，所述步骤4-2中，先单独训练所述深度CNN，训练完成后，固定所述深度CNN，训练所述D/M-RPN模型。

进一步地，所述步骤4-6中，训练所述D/M-RPN模型时，固定所述深度CNN。

进一步地，步骤4-4、4-8中，根据所述损伤建议在所述源图像中提取出损伤图像序列，用于训练所述分类器。

进一步地，所述步骤4-4、4-8中，在训练所述分类器时，在两个或两个以上的CNN的每一个的后面附加支持向量机(Support Vector Machine，SVM)；所述SVM仅在训练时使用，训练完成后被移除。

进一步地，所述步骤4-4、4-8中，在训练所述分类器时，最终预测的得分计算过程包括：

步骤5-1、计算P张量；

步骤5-2、计算E张量；

步骤5-3、计算V张量；

步骤5-4、计算Φ向量；

步骤5-5、计算预测得分S；

其中，所述P张量表示将N个CNN中的每一个的SVM输出的损伤特征；所述E张量表示所述源图像的尺寸估算张量；所述V张量表示所述源图像的速度张量；所述Φ向量表示为所有的所述P张量融合后的向量。

进一步地，所述步骤5-1中，所述P张量表示如下：

式中，c _i，j是类(i，j)的概率，nc是类的数目，n是用于训练的所述源图像的数目，因此所述图像序列中的每个都有一个所述P张量；

所述图像序列的组合P张量为：

进一步地，所述步骤5-2中，计算所述图像序列的尺寸估算的平均值，从尺寸查找表中检查包含平均尺寸的所有类e，其中，将一些元素转换为1，将其他元素设置为0，从而得到所述E张量：

其中：

进一步地，所述步骤5-3中，从速度查找表中检查包含所提供速度v的所有类别，将一些元素转换为1，将其他元素转换为0，得到所述V张量：

其中：

进一步地，所述步骤5-4中，所述Φ向量为：

Φ _(i，j)＝P _(i，j).*V _(i，j).*E _(i，j) (7)

其中(.*)表示按元素进行的乘法运算。

进一步地，所述步骤5-5中，所述预测得分S为：

S _(i，j)＝max _mΦ _(i，j) (8)

m＝arg max _mΦ _(i，j) (9)

其中，m表示所述S _(i，j)的平均值。

本发明具有如下技术效果：

该算法用时短、检测精度高，不必遵循R-CNN家族其他网络的传统方法，通过在数据库中添加更多的图像来减少过拟合，提高检测精度。

更快速D/M-R-CNN具有很高的精度和查全率，对于从图像中实时提取所有目标(损伤)特征具有很高的速度，这对于从采集的图像中准确检测损伤非常重要，提高了以往损伤检测系统实现实时检测的能力。

具体来说，增加数据集尺寸和卷积层可以提高模型的速度和精度，并将取得高达98％至99％左右的平均精度均值(mAP)。

本发明将为在结构损伤检测系统中应用新一代的深度学习技术及解决基于深度学习的现有结构损伤检测系统中的缺陷奠定基础。

附图说明

图1是描述更快速D/M-R-CNN的结构和功能示意图。

图2是R-CNN家族算法和更快速D/M-R-CNN之间的比较。

图3是更快速D/M-R-CNN训练和应用总体流程图。

图4是更快速D/M-R-CNN训练过程流程图。

图5是更快速D/M-R-CNN中分类器的训练说明图。

图6是本申请一个实施例中D/M-CNN操作说明图。

图7是本申请一个实施例中最大池操作说明图。

图8是本申请一个实施例中D/M-CNN层和D/M-Sub-Sampling层的连接。

图9是本算法与更快速R-CNN算法对比图。

具体实施方式

以下参考说明书附图介绍本申请的优选实施例，使其技术内容更加清楚和便于理解。本申请可以通过许多不同形式的实施例来得以体现，本申请的保护范围并非仅限于文中提到的实施例。

以下将对本发明的构思、具体结构及产生的技术效果作进一步的说明，以充分地了解本发明的目的、特征和效果，但本发明的保护不仅限于此。

图1显示了本发明提供的基于卷积神经网络的损伤检测方法的流程图，包括：

将待检图像10输入到更快速双/多区域卷积神经网络(更快速D/M-R-CNN)模型20中，然后更快速D/M-R-CNN模型20处理待检图像，输出最终的损伤图像30，同时，也可以输出置信分数，置信分数指最终的损伤图像30中的损伤是期望损伤的可能性。其中，所使用的更快速D/M-R-CNN模型20是基于R-CNN家族结构提出的一种算法。

参见图1，更快速D/M-R-CNN模型包括深度CNN21和双/多区域建议网络(Dual/Multi Region Proposal Network，D/M-RPN)模型22，其中，深度CNN21用于生成待检图像的特征映射；D/M-RPN模型22，包括两个或两个以上的区域建议网络RPN模型，用于对待检图像10中的每个候选损伤生成两个或两个以上的损伤建议，并对两个或两个以上的损伤建议进行比较以得到置信度(置信度是指两个或两个以上的损伤建议是期望损伤的可能性)，以及将得到的所有的损伤建议进行分类和回归，输出最终的损伤图像30以及置信分数。D/M-RPN模型以待检图像10作为输入，并输出一组对象建议，包括在每个建议中成为目标损伤的概率。D/M-RPN模型使用深度CNN(Deep-CNN)来提取图像中的特征(深度-CNN的最后一层作为输出)，并在图像上滑动另一卷积层。卷积层之后是整流线性单元(RELU)激活函数，其提供非线性并提高收敛速度。特征映射，然后是RELU，将每个窗口的特征映射到一个矢量中，该矢量被馈送到回归层和分类层，然后分别预测多个边界框的坐标和每个框中的对象的概率。为了生成目标建议，每个对应的特征映射(Conv)都与被称为锚点的九个矩形框相关联。如图1所示，特征映射之后是RELU，被馈送到FC层。使用矢量和初始权重，针对每个生成的框中的对象计算两个输出，它们是框中的对象或仅仅是背景的一部分(没有对象)的概率。为每个边界框计算的客观性概率介于0和1之间，并且在训练过程中更新，以使其对于正锚点或负锚点分别于0或1的差值最小。对于分类层和回归层，D/M-RPN都是端到端训练的。锚点是输入图像中在目标对象之间的区域。

更快速D/M-R-CNN算法能够应用于实时提供各种结构图像中快速、准确的损伤检测和分类，可被用作各种结构物(如桥梁、高层建筑、大坝、管道、储罐等)、交通控制系统和运输系统中损伤识别的系统。应当理解，更快速D/M-R-CNN算法也可以用于行业内图像分析和处理，如智慧城市、交通控制和运输系统等。

更快速D/M-R-CNN算法不必遵循R-CNN家族其他网络的传统方法，即通过在数据库中添加更多图像来减少过拟合以提高精测精度，就可以达到用时短、检测精度高的效果。

图2显示了本申请的更快速D/M-R-CNN算法与R-CNN家族其他算法的比较。CNN算法将图像分成多个区域，然后将每个区域分成不同的类，但是，该算法需要大量的区域来准确预测，因此，计算时间很长。R-CNN算法使用选择性搜索生成区域，从每个图像中提取大约2000个区域，但是，当每个区域分别传递给CNN 时，计算时间很长，此外，该算法还使用三种不同的模型进行预测。快速R-CNN算法中，每个图像只传递一次到CNN，并提取特征映射，在这些映射上使用选择性搜索来生成预测，该算法将R-CNN中使用的三种模型结合在一起，但是，该算法仍基于选择性搜索，速度慢，因此，计算时间仍然很长。更快速R-CNN算法用于区域建议网络(RPN)代替选择搜索法，提高了算法速度，但是，在该算法中，对象建议需要时间，由于有不同的系统相继工作，因此系统的性能取决于前一个系统的性能。在本申请的更快速D/M-R-CNN算法中，应用两个或两个以上的区域建议网络(即双/多区域建议网络D/M-RPN)，对同一图像中的每个候选目标(损伤)进行目标(损伤)建议，并将这些建议进行比较，得到期望的目标，使算法具有更高的精度和更快的速度。

图9显示了本申请的更快速D/M-R-CNN算法与更快速R-CNN算法的区别以及效果的提升。更快速R-CNN采用单个RPN网络，而更快速D/M-R-CNN算法可以采用双区域建议网络，即两个区域建议网络(D-RPN)，对同一图像中的每个候选对象进行双目标(损伤)建议，并对这两个建议进行比较，得到期望对象。图9中，更快速D/M-R-CNN算法使用两个RPN，应当理解，在实际应用中，可以使用更多个RPN，要获得更佳的效果，需要优化RPN的数目。

更快速D/M-R-CNN算法可以接收输入图像，生成不同尺度的卷积多特征映射；通过双/多区域建议网络D/M-RPN处理生成的卷积特征映射，为图像中的每个候选对象(损伤)生成两个或两个以上的建议(即双/多建议)，并创建两个或两个以上的区域建议边界框(双/多区域建议边界框)；将双/多边界框投影回各个卷积层的特征映射，得到一组双/多关注区域(D/M-ROI)；此过程的输出是对同一输入图像的不同区域建议的双/多堆栈，通过对它们进行比较，创建一个置信度，表示在边界框中检测到期望对象(损伤)的可能性，从而只需一步就可检测到期望的对象(损伤)。

回到图1，深度CNN21能够接收输入的待检图像，并生成不同尺度的卷积多特征映射，其可以采用现有技术中的方式来进行。双/多区域建议网络D/M-RPN模型22包括双/多关注区域D/M-ROI池化层23和完全连接FC层25。其中，双/多关注区域D/M-ROI池化层23包括两个或两个以上的关注区域ROI池化层，如图1所示，池化层的层数为(A)，A大于等于2，在一个池化层中，还可以使用完全连接FC层。双/多关注区域D/M-ROI池化层23用于生成待检图像中每个候选损伤的两个或两个以上的损伤建议，并对两个或两个以上的损伤建议进行比较以得到置信度。双/多关注区域D/M-ROI池化层23可以设置为最大池化层或平均池化层。损伤建议中的每一个包括边界框bbox24，用于表示检测到的损伤。完全连接FC层用于对边界框bbox24进行分类和回归。

具体来说，采用更快速D/M-R-CNN算法进行损伤检测的方法包括如下步骤：

步骤一将待检图像10输入到深度CNN21，得到待检图像10的特征映射；

步骤二将得到的特征映射输入到双/多区域建议网络D/M-RPN模型22中的双/多关注区域D/M-ROI池化层23，其中，双/多区域建议网络D/M-RPN模型22包括两个或两个以上的区域建议RPN网络模型，以及双/多关注区域D/M-ROI池化层23包括两个或两个以上的关注区域ROI池化层；

步骤三双/多关注区域D/M-ROI池化层23对待检图像10中每个候选损伤生成两个或两个以上的损伤建议，然后比较这两个或两个以上的损伤建议，以创建表示在边界框bbox24中检测到的损伤是期望损伤的置信度，其中，置信度是指两个或两个以上的损伤建议是期望损伤的可能性；

步骤四将损伤建议输入双/多区域建议网络D/M-RPN模型22的完全连接FC层25，以对边界框进行bbox24分类和回归；

步骤五根据分类和回归的结果，得到最终的损伤图像30，并计算置信分数，输出包括分类结果和置信分数的结果，其中，置信分数是指最终的损伤图像中的损伤是期望损伤的可能性。

在应用本申请的算法之前，必须对其进行训练。如图3所示，包含训练和应用步骤的流程图，包括以下步骤：

步骤3-1、取得训练用源图像

步骤3-2、对图像进行增强和标注

步骤3-3、选择权重

步骤3-4、设计和训练更快速D/M-R-CNN模型

步骤3-5、比较算法的输出与目标之间的误差，判断误差是否在可接受范围，若是，则继续执行下一步骤，若否，则返回步骤3-3

步骤3-6、使用深度CNN生成卷积特征映射

步骤3-7、根据卷积特征映射生成建议

步骤3-8、对建议的对象(损伤)进行分类和评分

步骤3-9、输出带有分类和/或评分的图像

其中，更快速D/M-R-CNN的训练过程如图4所示，包括以下步骤：

步骤4-1、初始化更快速D/M-R-CNN模型；

步骤4-2、训练深度CNN和双/多区域建议网络D/M-RPN模型，训练完成后，两者组成第一模型，该模型包括了深度CNN和双/多区域建议网络D/M-RPN模型，两者组合后，称为D/M-CRPN(1)；

步骤4-3、使用所述步骤4-2得到的第一模型D/M-CRPN(1)生成损伤建议；

步骤4-4、使用所述步骤4-3中得到的损伤建议训练分类器(图1中的FC25)；

步骤4-5、使用第一模型D/M-CRPN(1)重新初始化更快速D/M-R-CNN模型，并用所述步骤4-3中得到的损伤建议再训练该更快速D/M-R-CNN模型，得到第二模型D/M-CRPN(2)；

步骤4-6、利用第二模型D/M-CRPN(2)的权值再次训练双/多区域建议网络D/M-RPN模型；

步骤4-7、使用第二模型D/M-CRPN(2)生成新的损伤建议；

在步骤4-2中，深度CNN和D/M-RPN的训练可以分开进行：先单独训练深度CNN，训练完成后，固定深度CNN，训练D/M-RPN。

步骤4-4、4-8中分类器的训练过程如图5所示。从单个对象的图像(即损伤类型的时间连续帧序列)中提取图像序列，该图像序列被馈送到D/M-CNN以提取图像特征。将前N-1层视为特征映射，对D/M-CNN(即图1中的FC25，其过程参见图6，图8描述了其与D/M-Sub-Sampling层的连接)进行训练，并利用这些映射训练双/多支持向量机(D/M-SVM)分类器(D/M-SVM仅在训练时使用，训练完成后被移除)。将每个CNN的SVM输出与它们进行比较，以高精度收集图像中的所有损伤特征，并以P张量表示如下：

式中，c _i，j是类(i，j)，的概率，nc是类的数目，n是训练示例的图像的数目，因此任何给定图像序列中的每个图像都有一个P张量。P张量表示SVM的结果，包括多组表示归属概率的向量。

张量的组成如下：计算图像序列尺寸估算的平均值，从尺寸查找表中检查包含平均尺寸的所有类e，将一些元素转换为1，将其他元素设置为0，从而得到

其中：

E张量表示大小估计。

当目标移动时，目标的速度被改写为相似方式的V张量。对象损伤类型的速度的构成方式与尺寸估算中的E张量类似，即从速度查找表中检查包含所提供速度v的所有类别，将这些元素转换为1，将其他元素转换为0。

其中：

最终分类是通过提供的参数和图像分类器的预测值之间的融合来实现的。一系列图像的组合P张量为：

其中n是每个序列中的图像数量，融合向量Φ为：

Φ _(i，j)＝P _(i，j).*V _(i，j).*E _(i，j) (7)

其中(.*)表示按元素进行的乘法运算。最终预测的得分S为：

S _(i，j)＝max _mΦ _(i，j) (8)

m＝arg max _mΦ _(i，j) (9)

一个实施例，如图6所示，说明了双/多卷积和池处理，在双/多卷积操作中，输入数据由7×7×3数据集组成，其中7×7表示宽度和高度像素，3表示R、G、B色通道。

M/D-滤波器W0(i，j)和M/D-滤波器W1(i，j)有两个不同的滤波器组。步长为2，表示窗口提取3x3本地数据，每次跨两步。零填充＝1。在左窗口平滑移动的情况下，滤波器组利用窗口覆盖的不同局部数据进行卷积。分别用两个滤波器组计算双/多个卷积运算，给出了两组结果的双卷积运算和多卷积运算。

在双/多卷积神经网络(D/M-CNN)中，采用D/M滤波器(一组固定权值的神经元)对局部输入数据进行卷积运算。在计算每个窗口中的数据之后，数据窗口以特定的步幅平滑地移动，直到完成所有卷积操作。有几个参数需要计算出来：(1)深度：神经元(过滤器)的数量，确定深度，(2)跨距：覆盖数据的跨距，(3)零填充：补充几个零，使窗口从初始位置到数据集末尾的距离更大。

一个实施例，如图7所示，是最大池操作，这意味着获取特定数据窗口区域的最大值。另一种池方法是更快速D/M-R-CNN算法中的平均池，即取特定数据窗口区域的平均值。

一个实施例，如图8所示，描述了D/M-CNN层和D/M-sub-sampling层连接的基本架构。CNN一般由交替卷积运算和二次采样运算组成，最后一层表示为一般的多层网络。在子采样层之间设置卷积层，提高了计算效率，进一步改善了结构不变性和空间不变性。C(1，j)是一个D/M-CNN层，每个CNN层由六个特征映射组成。通过卷积运算，可以增强原始信号的特征，降低噪声影响。特征映射的每个神经元与输入图像的16×16邻域相连。特征映射尺寸为196×196。C(1，j)有156个调谐参数(每个滤波器有16×16个单位参数和一个偏置参数，共6个滤波器，所以(16×16+1)×6＝1542个参数。输入和C(1，j)之间使用一个内核，因此总共 1542×(196×196)＝59237472个连接。

S(2，j)是一个D/M-sub-sampling层。根据图像的局部相关原理，每个子采样都可以应用于图像，从而降低了数据处理能力，保留了有用信息。两张98×98的特征映射各一张。特征映射的每一单元都与C(1，j)的8×8邻域相连。S(2，j)的每单位的16个输入相加，乘以带调谐偏置的调谐参数。结果可用s形函数计算。调谐参数和调谐控制了s形函数的非线性。如果这些参数相对较小，则操作与线性操作类似。通过降低图像像素，每个子采样都与模糊图像等价。如果这些参数相对较大，则每个子采样可被视为具有噪声的“或”或“和”操作。每个单位8×8的接收域不重叠，因此S(2，j)中每个特征映射的尺寸是C(1，j)的1/4。S(2，j)具有(1+1)×2＝4个调谐参数和(8×8+1)×2×(98×98)＝1248520个连接。

以上详细描述了本申请的较佳具体实施例。应当理解，本领域的普通技术无需创造性劳动就可以根据本申请的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本申请的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

一种基于卷积神经网络的损伤检测方法，其中，所述方法包括：

步骤1-1将待检图像输入到更快速双/多区域卷积神经网络D/M-R-CNN模型；

步骤1-2所述更快速D/M-R-CNN模型处理所述待检图像，输出最终的损伤图像以及置信分数，其中，所述置信分数是指所述最终的损伤图像中的损伤是期望损伤的可能性；

其中，所述更快速D/M-R-CNN模型包括：

深度CNN，用于生成所述待检图像的特征映射；

双/多区域建议网络模型，包括两个或两个以上的区域建议网络模型，用于对所述待检图像中的每个候选损伤生成两个或两个以上的损伤建议，并对所述两个或两个以上的损伤建议进行比较以得到置信度，以及将得到的所有的所述损伤建议进行分类和回归，输出所述最终的损伤图像以及所述置信分数；其中，所述置信度是指所述两个或两个以上的损伤建议是所述期望损伤的可能性。
如权利要求1所述的损伤检测方法，其中，所述深度CNN生成不同尺度的所述特征映射。
如权利要求2所述的损伤检测方法，其中，所述两个或两个以上的损伤建议中的每一个包括边界框，所述边界框用于表示所述双/多区域建议网络模型检测到的损伤。
如权利要求3所述的损伤检测方法，其中，所述双/多区域建议网络模型包括双/多关注区域池化层，所述双/多关注区域池化层包括两个或两个以上的关注区域池化层，用于生成所述待检图像中所述每个候选损伤的所述两个或两个以上的损伤建议，并对所述两个或两个以上的损伤建议进行比较以得到所述置信度。
如权利要求4所述的损伤检测方法，其中，所述双/多关注区域池化层是最大池化层和平均池化层中的一个。
如权利要求5所述的损伤检测方法，其中，所述双/多区域建议网络模型还包括完全连接层，所述完全连接层用于对所述边界框进行分类和回归。
如权利要求1所述的损伤检测方法，其中，输出所述深度CNN的最后一层作为所述特征映射。
一种基于卷积神经网络的损伤检测方法，其中，所述方法包括：

步骤2-1将待检图像输入到深度CNN，得到所述待检图像的特征映射；

步骤2-2将所述特征映射输入到双/多区域建议网络模型中的双/多关注区域池化层，其中，所述双/多区域建议网络模型包括两个或两个以上的区域建议网络模型，以及所述双/多关注区域池化层包括两个或两个以上的关注区域池化层；

步骤2-3所述双/多关注区域池化层对所述待检图像中每个候选损伤生成两个或两个以上的损伤建议，然后比较所述两个或两个以上的损伤建议，以创建表示在边界框中检测到的损伤是期望损伤的置信度，其中，所述置信度是指所述两个或两个以上的损伤建议是所述期望损伤的可能性；

步骤2-4将所述损伤建议输入所述双/多区域建议网络模型的完全连接层，以对所述边界框进行分类和回归；

步骤2-5根据所述分类和回归的结果，得到最终的损伤图像，并计算置信分数，输出包括所述分类结果和所述置信分数的结果，其中，所述置信分数是指所述最终的损伤图像中的损伤是所述期望损伤的可能性。
如权利要求8所述的损伤检测方法，其中，所述深度CNN和所述双/多区域建议网络模型构成更快速双/多区域卷积神经网络D/M-R-CNN模型，以及所述方法还包括对所述更快速D/M-R-CNN模型进行训练的步骤，其中所述训练的步骤包括：

步骤3-1、取得训练用的源图像，所述源图像是单个对象的图像序列；

步骤3-2、对所述源图像进行增强和标注；

步骤3-3、选择权重；

步骤3-4、设计并训练所述更快速D/M-R-CNN模型。
如权利要求9所述的损伤检测方法，其中，所述步骤3-3、3-4中，进一步包括以下步骤：

步骤4-1、初始化所述更快速D/M-R-CNN模型；

步骤4-2、训练所述深度CNN和所述双/多区域建议网络模型，训练完成后，两者组成第一模型；

步骤4-3、使用所述步骤4-2得到的所述第一模型生成损伤建议；

步骤4-4、使用所述步骤4-3中得到的所述损伤建议训练分类器；

步骤4-5、使用所述步骤4-2得到的所述第一模型的参数重新初始化所述更快速D/M-R-CNN模型，得到第二模型；

步骤4-6、利用所述第二模型的权值再次训练所述双/多区域建议网络模型；

步骤4-7、使用所述第二模型生成损伤建议；

步骤4-8、使用所述步骤4-7中获得的损伤建议训练所述分类器。
如权利要求10所述的损伤检测方法，其中，所述步骤4-2中，先单独训练所述深度CNN，训练完成后，固定所述深度CNN，训练所述双/多区域建议网络模型。
如权利要求10所述的损伤检测方法，其中，所述步骤4-6中，训练所述双/多区域建议网络模型时，固定所述深度CNN。
如权利要求10所述的损伤检测方法，其中，步骤4-4、4-8中，根据所述损伤建议在所述源图像中提取出损伤图像序列，用于训练所述分类器。
如权利要求10所述的损伤检测方法，其中，所述步骤4-4、4-8中，在训练所述分类器时，在两个或两个以上的CNN的每一个的后面附加支持向量机；所述支持向量机仅在训练时使用，训练完成后被移除。
如权利要求14所述的损伤检测方法，其中，所述步骤4-4、4-8中，在训练所述分类器时，最终预测的得分计算过程包括：

步骤5-1、计算P张量；

步骤5-2、计算E张量；

步骤5-3、计算V张量；

步骤5-4、计算Φ向量；

步骤5-5、计算预测得分S；

其中，所述P张量表示将N个CNN中的每一个的支持向量机输出的损伤特征；所述E张量表示所述源图像的尺寸估算张量；所述V张量表示所述源图像的速度张量；所述Φ向量表示为所有的所述P张量融合后的向量。
如权利要求15所述的损伤检测方法，其中，所述步骤5-1中，所述P张量表示如下：

式中，c _i，j是类(i，j)的概率，nc是类的数目，n是用于训练的所述源图像的数目，因此所述图像序列中的每个都有一个所述P张量；

所述图像序列的组合P张量为：
如权利要求16所述的损伤检测方法，其中，所述步骤5-2中，计算所述图像序列的尺寸估算的平均值，从尺寸查找表中检查包含平均尺寸的所有类e，其中，将一些元素转换为1，将其他元素设置为0，从而得到所述E张量：

其中：
如权利要求17所述的损伤检测方法，其中，所述步骤5-3中，从速度查找表中检查包含所提供速度v的所有类别，将一些元素转换为1，将其他元素转换为0，得到所述V张量：

其中：
如权利要求18所述的损伤检测方法，其中，所述步骤5-4中，所述Φ向量为：

Φ _(i，j)＝P _(i，j).*V _(i，j).*E _(i，j) (7)

其中(.*)表示按元素进行的乘法运算。
如权利要求19所述的损伤检测方法，其中，所述步骤5-5中，所述预测得分S为：

S _(i，j)＝max _mΦ _(i，j) (8)

m＝arg max _mΦ _(i，j) (9)

其中，m表示所述S _(i，j)的平均值。