CN116403071B - 基于特征重构的少样本混凝土缺陷检测方法及装置 - Google Patents

基于特征重构的少样本混凝土缺陷检测方法及装置 Download PDF

Info

Publication number
CN116403071B
CN116403071B CN202310292198.4A CN202310292198A CN116403071B CN 116403071 B CN116403071 B CN 116403071B CN 202310292198 A CN202310292198 A CN 202310292198A CN 116403071 B CN116403071 B CN 116403071B
Authority
CN
China
Prior art keywords
network
meta
feature
reconstruction
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310292198.4A
Other languages
English (en)
Other versions
CN116403071A (zh
Inventor
陈志浩
毛莺池
杜建民
李志兴
蒋金磊
王子成
张浩江
苏健
熊力
孟欢
魏子钧
曹林
杨崇香
梁国峰
胡奇玮
杨文云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Huaneng Lancang River Hydropower Co Ltd
PowerChina Kunming Engineering Corp Ltd
Original Assignee
Hohai University HHU
Huaneng Lancang River Hydropower Co Ltd
PowerChina Kunming Engineering Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU, Huaneng Lancang River Hydropower Co Ltd, PowerChina Kunming Engineering Corp Ltd filed Critical Hohai University HHU
Priority to CN202310292198.4A priority Critical patent/CN116403071B/zh
Publication of CN116403071A publication Critical patent/CN116403071A/zh
Application granted granted Critical
Publication of CN116403071B publication Critical patent/CN116403071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/778Active pattern-learning, e.g. online learning of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于特征重构的少样本混凝土缺陷检测方法及装置,获取公开数据集作为基类数据集;获取所需检测目标的样本图像,并进行标注,得到新类数据集;将所述基类数据集和新类数据集分别划分为元训练集、元验证集、元测试集;特征重构网络利用特征提取子网络对支持图像和查询图像进行特征提取,并使用区域建议子网络提出建议区域,利用特征对齐子网络对建议区域进行特征对齐,利用特征重构子网络对建议区域的查询特征进行特征重构,利用相似度计算子网络计算重构特征和对其特征的相似度并进行分类。本发明解决了混凝土缺陷样本不足条件下,目标检测模型易出现过拟合的现象,提升了少样本条件下的模型精度。

Description

基于特征重构的少样本混凝土缺陷检测方法及装置
技术领域
本发明涉及一种基于特征重构的少样本混凝土缺陷检测方法及装置,具体是一种针对样本数量较少情况下的目标检测,属于目标检测技术领域。
背景技术
目标检测作为数字图像处理和计算机视觉中的一个重要方向,被广泛应用于智能辅助驾驶、工业检测等领域,通过计算机视觉算法可显著减少人力的消耗,为使用者提供更精准的服务。因此,目标检测成为近几年来学术界与工业界的研究热点,它是计算机视觉与图像处理学科的重要分支,也是人工智能应用于现实生活的典型案例。目标检测是识别领域的一个非常重要的分支,它是基于目标分类的各个基础网络进行改进,得以实现对图片或视频中的物体的识别。
然而目标检测算法在深度学习框架下完成训练过程需要大量标注的数据集进行支撑,这对资源的消耗是巨大的。当样本不足时,目标检测模型易出现过拟合现象。当前世界中,针对部分新类别图像样本的获取以及标注都需要较高成本。
在工程领域,混凝土缺陷的检测是一个常见的问题。混凝土缺陷复杂多样,包含裂缝、渗漏、钙化等多种缺陷。然而,混凝土缺陷的高质量数据集却极为稀少,工程中所获的高质量样本则更难获得。如果使用目标检测算法,则会出现过拟合,使模型在实际检测中精度较低,无法满足工程要求。通过少样本目标检测,则能够在仅收集少量样本的情况下快速获得一个目标检测模型,这节省了大量人力物力,能够在项目初期就进行智能检测模型的部署。
发明内容
发明目的:针对现有技术存在的问题与不足,本发明提供一种基于特征重构的少样本混凝土缺陷检测方法及装置。
技术方案:一种基于特征重构的少样本混凝土缺陷检测方法,方法处理的对象为三通道光学图像,主要为混凝土表面光学图像。所述方法包括以下步骤:
步骤1)获取互联网上目标检测的公开数据集作为基类数据集(如PASCAL VOC、MSCOCO、ImageNet等数据集);获取混凝土缺陷样本图像,并进行标注,得到新类数据集;将所述基类数据集和新类数据集分别划分为元训练集、元验证集、元测试集;
步骤2)在基类数据集的元训练集、元验证集上训练特征重构网络;使用基类数据集的元训练集对所述特征重构网络进行训练,并在元验证集上验证网络的检测效果;直到所述特征重构网络的检测效果在元验证集上的检测效果达到目标,并选取在元验证集上检测效果最好的若干次特征重构网络作为模型进行保存;随后在所述基类数据集的元测试集上测试模型的检测效果,选择检测效果最好的特征重构网络备用;
步骤3)在新类数据集的元训练集、元验证集上进行对备用的特征重构网络进行微调;使用新类数据集的元训练集对特征重构网络进行训练,并在元验证集上验证网络的检测效果;直到所述特征重构网络的检测效果在元验证集上的检测效果达到目标,并选取在元验证集上最好的若干次特征重构网络作为模型进行保存;随后在所述新类数据集的元测试集上测试模型的检测效果,选择检测效果最好的特征重构网络使用;
步骤4)将效果最好的特征重构网络迁移到一台或多台设备上,通过应用设备组合形成应用系统,由应用系统采集查询图像,所述查询图像通过所述特征重构网络进行检测。
其中所述步骤1)的基类数据集,被划分为元训练集、元验证集、元测试集;所述新类数据集,同样被划分为元训练集、元验证集、元测试集。其中基类数据集包含样本数量较大,而新类数据集包含样本数量较少。其中元训练集、元验证集、元测试集的基本单元为任务;每个任务包含若干类别的支持图像和查询图像;所述支持图像由数据集中某一图像经过目标区域的裁剪获得,所述查询图像直接来源于数据集中某一图像。基类数据集和新类数据集中的图像均为三通道彩色图像。
所述步骤1)具体包含以下过程:
步骤1-1)获取公开数据集作为基类数据集;获取混凝土缺陷样本图像,并进行标注,得到新类数据集;所述基类数据集与新类数据集共同构成训练数据集;
步骤1-2)对所述训练数据集中的各类数据,构建若干任务;所述某一任务包含若干类别的支持图像和查询图像;对于所述任务中的某一类支持图像和查询图像,支持图像由训练数据集中图像经过目标区域的裁剪获得,查询图像来源于训练数据集中的图像;所述查询图像中一定包含支持图像中包含的实例;
步骤1-3)对于所述任务,构建元训练集、元验证集、元测试集;元训练集、元验证集、元测试集均包含若干任务,三者包含的任务数量的比例为6:2:2。
所述步骤2)中所述特征重构网络是一种神经网络,包含特征提取子网络、区域建议子网络、特征对齐子网络、特征重构子网络、相似度计算子网络。
步骤2)具体如下:
步骤2-1)从所述元训练集中抽取一个任务,所述任务中包含若干支持图像和查询图像;支持图像首先经过特征提取子网络,获得支持特征;查询图像通过特征提取子网络,获得查询特征;
步骤2-2)支持特征与查询特征共同通过区域建议子网络,获得若干建议区域,所述建议区域为一个矩形区域;
步骤2-3)将建议区域与查询特征输入特征对齐子网络;特征对齐子网络根据建议区域,将该区域查询特征裁剪并进行缩放到统一尺寸,获得对齐特征;
步骤2-4)使用特征重构子网络,将对齐特征与支持特征进行重构,获得重构特征;
步骤2-5)使用相似度子网络,计算对齐特征与重构特征之间的相似度,并根据相似度确定建议区域中的物体是哪一类;特征重构网络输出预测结果;
步骤2-6)将预测结果与标注进行损失计算,并通过反向传播对特征重构网络的参数进行更新;
步骤2-7)重复步骤2-1)至步骤2-6),直到特征重构网络遍历过元训练集的所有任务;此时从元验证集中抽取任务,输入特征重构网络,获得预测结果;将预测结果与标注进行精度计算,衡量特征重构网络的精度;
步骤2-8)当精度多次满足要求时,保存精度最高的若干次网络参数;
步骤2-9)从元测试集上抽取任务,带入上述网络参数的情况下进行精度测试;选取精度最高的网络参数使用。
所述步骤3)中,冻结特征提取子网络的网络参数;在新类数据集上的元训练集、元验证集上进行训练;保存精度最好的几个网络参数;在新类数据集上的元测试集进行测试,保存精度最高的网络参数使用。
所述特征重构网络中,特征提取子网络是一个多层级的卷积神经网络,它是由卷积层、池化层、残差块、全连接层、归一化层等层级组成的任一神经网络。
所述特征重构网络中,区域建议子网络包含通道注意力模块、空间注意力模块、RPN(Region Proposal Network,区域建议网络)模块。区域建议子网络的计算流程为:支持特征通过通道注意力模块计算通道注意力向量;所述通道注意力向量与查询特征相乘获得通道特征;通道特征随后通过空间注意力获得空间注意力向量;通道特征与空间注意力向量相乘,获得多注意力特征;多注意力特征通过RPN模块,获得建议区域。
所述特征重构网络中,特征对齐子网络的主要作用是:根据建议区域,将该区域查询特征裁剪并进行缩放到统一尺寸,获得对齐特征。特征对齐子网络使用RoI Align或RoIPooling方法进行特征对齐。
所述特征重构网络中,特征重构子网络使用岭回归或正则化方法来进行特征重构。
所述特征重构网络中,相似度计算子网络通过计算对齐特征与重构特征之间的欧氏距离来计算相似度。
所述步骤4)中应用设备为无人机设备与控制中心,监控设备与数据中心组成应用系统,应用系统包括:
1)数据采集模块,属于无人机设备,由一种成像设备构成,能够采集拍摄范围内的混凝土表面光学图像;
2)数据存储模块;无人机设备和控制中心均包括数据存储模块;无人机的数据存储模块主要存储数据采集模块采集的光学图像;控制中心的数据存储模块主要保存网络模型,无人机拍摄的图像和检测结果;
3)数据发送模块,无人机设备与控制中心均包括数据发送模块;无人机设备的数据发送模块将监控设备数据存储模块中的光学图像传输至数据中心以供分析;控制中心的数据发送模块发送无人机的操作指令;
4)数据接收模块,无人机设备与控制中心均包括数据接收模块;无人机设备的数据接收模块接受控制中心发送的无人机操作指令;控制中心的数据接收模块接受来自监控设备传输的光学图像;
5)数据分析模块,属于数据中心,使用特征重构网络对光学图像进行处理分析,获得检测结果,并保存在数据中心的数据存储模块中。
一种基于特征重构的少样本混凝土缺陷检测装置,包括存储单元、计算单元、信息传输单元和成像单元;存储单元提供存储功能,用于存储用于训练网络的数据集、特征重构网络模型及参数、装置采集的光学影像和检测结果;计算单元提供计算功能,用于运行特征重构网络;信息传输单元提供通信功能,用于与其他设备进行通信;成像单元提供成像功能,用于收集指定区域场景的光学影像。
一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述计算机程序时实现如上所述的基于特征重构的少样本混凝土缺陷检测方法。
一种计算机可读存储介质,该计算机可读存储介质存储有执行如上所述的基于特征重构的少样本混凝土缺陷检测方法的计算机程序。
有益效果:混凝土缺陷的检测是一个常见的问题,混凝土缺陷复杂多样,包含裂缝、渗漏、钙化等多种缺陷。然而,混凝土缺陷的高质量数据集却极为稀少,工程中所获的高质量样本则更难获得。如果使用目标检测算法,则会出现过拟合,使模型在实际检测中精度较低,无法满足工程要求。现有混凝土缺陷样本较少,难以很好地训练目标检测。本发明解决了混凝土缺陷样本不足条件下,目标检测模型易出现过拟合的现象,提升了少样本条件下的混凝土缺陷检测精度。
附图说明
图1为本发明实施例的装置实现原理图;
图2为本发明实施例的区域建议子网络结构示意图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明实施例所使用的环境:服务器的CPU为Intel(R)Xeon(R)Gold 6326CPU@2.90GHz,GPU为2台NVIDIA TESLA A100 80G,操作系统为Ubuntu18.04 64位,编译环境为Python3.8,Pytorch 1.8。
一种基于特征重构的少样本混凝土缺陷检测方法,具体包括步骤如下:
步骤1)获取公开数据集作为基类数据集;获取所需检测目标的样本图像,并进行标注,得到新类数据集;具体如下:
步骤1-1)在本实例中,使用FSOD数据集作为基类数据集进行训练。该数据集是专为少样本目标检测构建的数据集,总共包含1000个类别,其中800个类别被划分为基类数据集,余下200个类别弃用。FSOD数据集的图片均为三通道彩色图像。共计66502张图像和182591个标注框。收集混凝土缺陷图像并标注,作为新类数据集。
步骤1-2)对训练数据集中的各类数据,进行任务划分。首先将数据集的类别进行组别划分,每组包含五个类别,各组之间包含的类别互不交叉。基类数据集的类别被分为160个组。各组包含五个类别的所有图片,即该组任意一张图片必定含有这五个类别实例中的一种。对于每个组,每个类别随机抽取5张图片,每张图选取一个目标区域进行裁剪,获得支持图像。查询图像在剩余的图像中抽取16张。这25张支持图像和16张查询图像构成一个任务。如此反复划分,直到各组图片不足以划分成任务。新类数据集同理,首先划分成40个组,随后划分任务。
步骤1-3)对基类数据集和新类数据集,分别随机抽取若干任务构建元训练集、元验证集和元测试集;三者任务数量比例为6:2:2。
步骤2)在基类数据集的元训练集、元验证集上对特征重构网络进行训练;使用基类数据集的元训练集对特征重构网络进行大量训练,并在元验证集上验证网络的检测效果;直到特征重构网络的检测效果在元验证集上的检测效果达到目标,选取在元验证集上最好的若干次特征重构网络进行保存;随后在基类数据集的元测试集上测试检测效果,选择检测效果最好的特征重构网络备用;具体如下:
步骤2-1)从元训练集中抽取一个任务,任务中包含若干支持图像和查询图像;支持图像首先经过特征提取子网络,获得支持特征;查询图像通过特征提取子网络,获得查询特征;特征提取子网络采用带FPN的ResNet50作为基准网络。
步骤2-2)支持特征与查询特征共同通过区域建议子网络,获得若干建议区域,建议区域为一个矩形区域;所述区域建议子网络包含通道注意力模块、空间注意力模块、RPN(Region Proposal Network,区域建议网络)模块。
通道注意力模块由一个全局平均池化和两个全连接层组成。支持图像特征图的宽×高×通道数记为ws×hs×c全局平均池化将每个通道的像素值做平均,获得一个尺寸为1×1×c的向量,该向量通过两个全连接层,尺寸不变。得到的向量为通道注意力向量。查询图像特征图的宽×高×通道数记为wq×hq×c,其与通道注意力向量相乘。具体操作为,查询特征图某一通道的所有像素值(wq×hq)乘以通道注意力向量对应通道上的值。经过此操作获得通道特征。
空间注意力模块由Inception块、一层1×1的卷积和softmax组成。查询特征图通过Inception块,长宽不变,通道数转变为1024。经过1×1的卷积,长宽不变,通道数缩减为2。经过softmax,获得尺寸为wq×hq×2的空间注意力向量。空间注意力向量所有值在0到1之间。对应像素位置上,两个通道的值相加等于1。两个通道分别代表着这个像素点属于物体和背景的概率。
将属于物体概率通道与通道特征相乘,操作具体为对应位置像素点值相乘;获得的向量为多注意力特征。
多注意力特征通过RPN模块,输出若干组浮点数组。每个浮点数组包含四个浮点数(x1,y1,x2,y2),对应一个矩形区域。其中,(x1,y1)和(x2,y2)分别对应着矩形的左上角点和右下角点坐标。
步骤2-3)将建议区域与查询特征输入特征对齐子网络;特征对齐子网络根据建议区域,将该区域查询特征裁剪并进行缩放到统一尺寸,获得对齐特征;
如果特征对齐子网络使用RoI Pooling进行缩放,则将该矩形平均区域划分为5×5的区域,每个区域选择像素最大值,从而获得若干个5×5的对齐特征。
如果特征对齐子网络使用RoI Align进行缩放,则将该矩形平均区域划分为5×5的区域,每个区域进行双线性插值,计算出5×5区域每个格点上的数值,从而获得若干个5×5的对齐特征。本实验使用RoI Align进行缩放。
步骤2-4)使用特征重构子网络,将对齐特征与支持特征进行重构,获得重构特征;具体步骤如下:
设Xs表示n-way k-shot集中的具有相应标签的支持图像集合。希望为单个输入图像xq预测一个类标签yq。xq的卷积特征提取的输出是一个特征图Q∈Rr×d,r代表特征图的高度乘以宽度的空间分别率,d为通道数量。对于每一个支持类c∈C,将k个支持图像的特征集合到一个支持特征矩阵Sc∈Rkr×d。然后通过找到矩阵W∈Rr×kr,将Q重构为Sc中的加权行和,从而使得WSc≈Q。找到最优相当于解决线性最小二乘问题:
其中||·||是Frobennius范数,λ加权了线性系统过度约束或者欠约束时用于确保可处理性的岭回归惩罚项(kr≠d)。
岭回归的好处是可以给出一个解析解和最优重建/>如式2~3所示,其中I为一个正常数矩阵:
对于给定的c类,所有特征图位置上Q和之间的负平方欧氏距离产生的标量概率对数,此外增加一个可学习的温度因子γ。最后的预测概率为:
上述公式1中的重构问题存在难度上的差异,如果kr>d,特征重构问题会变得繁杂,因为支持特征会延展为特征空间,相反,当kr<d时,重构难度会有所增加。
为了保证目标的平衡和稳定的训练,本实施例使用正则化方法进行特征重构:
将正则化器λ缩放为提高模型的鲁棒性并允许网络选择一个程度的正则化,而不是严格的最小二乘优化。
通过改变λ可以取得多种效果,较大的λ阻止了对W中的特定权重的过度依赖,但是也降低了重构的标准,增加了重构误差和限制鉴别的能力。因此引入一个可学习的重新校准项ρ,将正则化程度从的大小中解放出来。/>计算如式7所示。
通过增加ρ和λ来使得网络获得惩罚较大权重的能力。ρ和λ分别用式8和式9参数化为eβ和eα来保证非负,α,β初始化为零,因此最终预测为:
步骤2-5)使用相似度子网络,计算对齐特征与重构特征之间的相似度,并根据相似度确定建议区域中的物体是哪一类;特征重构网络输出预测结果;
欧氏距离是欧几里得空间中的两点间的直线距离,在n维空间,点x的坐标为(x1,x2,…,xn),点y的坐标为(y1,y2,…,yn),点x和点y的距离表达式如式(12)所示:
欧氏距离是Bregman散度中的一种,它有一个良好的性质,即给定集合S,总体的Bregman information(所有xi到E(x)的Bregman散度的均值)不变。因此,在聚类时只要使得每一个簇(每一种类型的样本集合)的Bregman information值最小化,即可使得簇与簇之间的Bregman information值最大化。在计算距离时利用Bregman散度的性质,可以使得每个类型簇之间的Bregman information值最大,也就是每个类型之间的差异性最大,这样模型可以具有更好的分类效果。
步骤2-6)将预测结果与标注进行损失计算,并通过反向传播对特征重构网络的参数进行更新;
步骤2-7)重复步骤2-1)至步骤2-6),直到特征重构网络遍历过元训练集的所有任务;此时从元验证集中抽取任务,输入特征重构网络,获得预测结果;将预测结果与标注进行精度计算,衡量特征重构网络的精度;
步骤2-8)当精度多次满足要求时,保存精度最高的若干个特征重构网络;
步骤2-9)从元测试集上抽取任务,带入上述特征重构网络的情况下进行精度测试;选取检测效果最好的(精度最高)特征重构网络使用。
步骤3)在新类数据集的元训练集、元验证集上对特征重构网络进行微调;使用新类数据集的元训练集对特征重构网络进行训练少量训练,并在元验证集上验证网络的检测效果;直到所述特征重构网络的检测效果在元验证集上的检测效果达到目标,选取在元验证集上最好的若干次模型进行保存;随后在所述新类数据集的元测试集上测试检测效果,选择检测效果最好的特征重构网络使用;
步骤3-1)冻结特征提取子网络的网络参数;
步骤3-2)在新类数据集上的元训练集、元验证集上进行训练;保存精度最好的几个网络参数;该步骤与步骤2)类似;
步骤3-3)在新类数据集上的元测试集进行测试,保存检测效果最好(精度最高)的特征重构网络使用。
步骤4)将步骤3-3)中检测效果最好的特征重构网络迁移到一台或多台设备上,通过应用设备组合形成应用系统,由应用系统采集查询图像,查询图像通过所述特征重构网络进行检测。本例中具体实现是利用多台监控设备和数据中心进行在线监测。具体实现如下:
1)每台监控设备采集图像,以一秒10帧的格式传输至数据中心;
2)数据中心将采集的图像输入特征重构网络,进行目标检测,并输出分类结果;
3)数据中心解析分类结果,在图中标注出来;
4)数据中心将标注过的图像存入数据库,并推送至用户界面,以供用户查看。
应用系统具体包括:
1)数据采集模块,属于监控设备,由一种成像设备构成,能够采集拍摄范围内的光学图像;
2)数据存储模块;属于监控设备和数据中心,能够存储数据采集模块采集的光学图像,也能够保存网络模型,检测结果;
3)数据发送模块,属于监控设备,将监控设备数据存储模块中的光学图像传输至数据中心以供分析;
4)数据接收模块,属于数据中心,接受来自监控设备传输的光学图像;
5)数据分析模块,属于数据中心,使用特征重构网络对光学图像进行处理分析,获得检测结果,并保存在数据中心的数据存储模块中。
一种基于特征重构的少样本混凝土缺陷检测装置,包括存储单元、计算单元、信息传输单元和成像单元;存储单元提供存储功能,用于存储用于训练网络的数据集、特征重构网络模型及参数、装置采集的光学影像和检测结果;计算单元提供计算功能,用于运行特征重构网络;信息传输单元提供通信功能,用于与其他设备进行通信;成像单元提供成像功能,用于收集指定区域场景的光学影像。
显然,本领域的技术人员应该明白,上述的本发明实施例的基于特征重构的少样本混凝土缺陷检测方法各步骤或基于特征重构的少样本混凝土缺陷检测装置各单元可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。

Claims (9)

1.一种基于特征重构的少样本混凝土缺陷检测方法,其特征在于,方法处理的对象为三通道光学图像,是混凝土表面光学图像,所述方法包括以下步骤:
步骤1)获取目标检测的公开数据集作为基类数据集;获取混凝土缺陷样本图像,并进行标注,得到新类数据集;将所述基类数据集和新类数据集分别划分为元训练集、元验证集、元测试集;
步骤2)在基类数据集的元训练集、元验证集上训练特征重构网络;使用基类数据集的元训练集对所述特征重构网络进行训练,并在元验证集上验证网络的检测效果;直到所述特征重构网络的检测效果在元验证集上的检测效果达到目标,并选取在元验证集上检测效果最好的若干次特征重构网络进行保存;随后在所述基类数据集的元测试集上测试模型的检测效果,选择检测效果最好的特征重构网络备用;
步骤3)在新类数据集的元训练集、元验证集上进行对备用的特征重构网络进行微调;使用新类数据集的元训练集对特征重构网络进行训练,并在元验证集上验证网络的检测效果;直到所述特征重构网络的检测效果在元验证集上的检测效果达到目标,并选取在元验证集上最好的若干次特征重构网络进行保存;随后在所述新类数据集的元测试集上测试模型的检测效果,选择检测效果最好的特征重构网络使用;
步骤4)将所述步骤3)中的检测效果最好的特征重构网络迁移到一台或多台设备上,通过应用设备组合形成应用系统,由应用系统采集查询图像,所述查询图像通过所述特征重构网络进行检测;
所述步骤2)中所述特征重构网络是一种神经网络,包含特征提取子网络、区域建议子网络、特征对齐子网络、特征重构子网络、相似度计算子网络;
步骤2)具体如下:
步骤2-1)从所述元训练集中抽取一个任务,所述任务中包含若干支持图像和查询图像;支持图像首先经过特征提取子网络,获得支持特征;查询图像通过特征提取子网络,获得查询特征;
步骤2-2)支持特征与查询特征共同通过区域建议子网络,获得若干建议区域,所述建议区域为一个矩形区域;
步骤2-3)将建议区域与查询特征输入特征对齐子网络;特征对齐子网络根据建议区域,将该区域查询特征裁剪并进行缩放到统一尺寸,获得对齐特征;
步骤2-4)使用特征重构子网络,将对齐特征与支持特征进行重构,获得重构特征;
步骤2-5)使用相似度子网络,计算对齐特征与重构特征之间的相似度,并根据相似度确定建议区域中的物体是哪一类;特征重构网络输出预测结果;
步骤2-6)将预测结果与标注进行损失计算,并通过反向传播对特征重构网络的参数进行更新;
步骤2-7)重复步骤2-1)至步骤2-6),直到特征重构网络遍历过元训练集的所有任务;此时从元验证集中抽取任务,输入特征重构网络,获得预测结果;将预测结果与标注进行精度计算,衡量特征重构网络的精度;
步骤2-8)当精度多次满足要求时,保存精度最高的若干次网络参数;
步骤2-9)从元测试集上抽取任务,带入上述网络参数的情况下进行精度测试;选取精度最高的网络参数使用。
2.根据权利要求1所述的基于特征重构的少样本混凝土缺陷检测方法,其特征在于,所述步骤1)的基类数据集,被划分为元训练集、元验证集、元测试集;所述新类数据集,同样被划分为元训练集、元验证集、元测试集,其中基类数据集包含样本数量较大,而新类数据集包含样本数量较少;其中元训练集、元验证集、元测试集的基本单元为任务;每个任务包含若干类别的支持图像和查询图像;所述支持图像由数据集中某一图像经过目标区域的裁剪获得,所述查询图像直接来源于数据集中某一图像;
所述步骤1)具体包含以下过程:
步骤1-1)获取公开数据集作为基类数据集;获取混凝土缺陷样本图像,并进行标注,得到新类数据集;所述基类数据集与新类数据集共同构成训练数据集;
步骤1-2)对所述训练数据集中的各类数据,构建若干任务;每一任务包含若干类别的支持图像和查询图像;对于所述任务中的任一一类支持图像和查询图像,支持图像由训练数据集中图像经过目标区域的裁剪获得,查询图像来源于训练数据集中的图像;所述查询图像中一定包含支持图像中包含的实例;
步骤1-3)对于所述任务,构建元训练集、元验证集、元测试集;元训练集、元验证集、元测试集均包含若干任务,三者包含的任务数量的比例为6:2:2。
3.根据权利要求1所述的基于特征重构的少样本混凝土缺陷检测方法,其特征在于,所述步骤3)中,冻结特征提取子网络的网络参数;在新类数据集上的元训练集、元验证集上进行训练;保存精度最好的几个网络参数;在新类数据集上的元测试集进行测试,保存精度最高的网络参数使用。
4.根据权利要求2所述的基于特征重构的少样本混凝土缺陷检测方法,其特征在于,所述特征重构网络中,特征提取子网络是一个多层级的卷积神经网络,它是由卷积层、池化层、残差块、全连接层、归一化层组成的任一神经网络。
5. 根据权利要求2所述的基于特征重构的少样本混凝土缺陷检测方法,其特征在于,所述特征重构网络中,区域建议子网络包含通道注意力模块、空间注意力模块、RPN(RegionProposal Network,区域建议网络)模块,区域建议子网络的计算流程为:支持特征通过通道注意力模块计算通道注意力向量;所述通道注意力向量与查询特征相乘获得通道特征;通道特征随后通过空间注意力获得空间注意力向量;通道特征与空间注意力向量相乘,获得多注意力特征;多注意力特征通过RPN模块,获得建议区域;
所述特征重构网络中,特征对齐子网络的主要作用是:根据建议区域,将该区域查询特征裁剪并进行缩放到统一尺寸,获得对齐特征;特征对齐子网络使用RoI Align或RoIPooling方法进行特征对齐;
所述特征重构网络中,特征重构子网络使用岭回归或正则化方法来进行特征重构;
所述特征重构网络中,相似度计算子网络通过计算对齐特征与重构特征之间的欧氏距离来计算相似度。
6.根据权利要求1所述的基于特征重构的少样本混凝土缺陷检测方法,其特征在于,所述步骤4)中应用设备为无人机设备与控制中心,监控设备与数据中心组成应用系统,应用系统包括:
1)数据采集模块,属于无人机设备,由一种成像设备构成,能够采集拍摄范围内的混凝土表面光学图像;
2)数据存储模块;无人机设备和控制中心均包括数据存储模块;无人机的数据存储模块主要存储数据采集模块采集的光学图像;控制中心的数据存储模块主要保存网络模型,无人机拍摄的图像和检测结果;
3)数据发送模块,无人机设备与控制中心均包括数据发送模块;无人机设备的数据发送模块将监控设备数据存储模块中的光学图像传输至数据中心以供分析;控制中心的数据发送模块发送无人机的操作指令;
4)数据接收模块,无人机设备与控制中心均包括数据接收模块;无人机设备的数据接收模块接受控制中心发送的无人机操作指令;控制中心的数据接收模块接受来自监控设备传输的光学图像;
5)数据分析模块,属于数据中心,使用特征重构网络对光学图像进行处理分析,获得检测结果,并保存在数据中心的数据存储模块中。
7.一种运行如权利要求1所述的基于特征重构的少样本混凝土缺陷检测方法的装置,其特征在于,包括存储单元、计算单元、信息传输单元和成像单元;存储单元提供存储功能,用于存储用于训练网络的数据集、特征重构网络模型及参数、装置采集的光学影像和检测结果;计算单元提供计算功能,用于运行特征重构网络;信息传输单元提供通信功能,用于与其他设备进行通信;成像单元提供成像功能,用于收集指定区域场景的光学影像。
8.一种计算机设备,其特征在于:该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述计算机程序时实现如权利要求1-6中任一项所述的基于特征重构的少样本混凝土缺陷检测方法。
9.一种计算机可读存储介质,其特征在于:该计算机可读存储介质存储有执行如权利要求1-6中任一项所述的基于特征重构的少样本混凝土缺陷检测方法的计算机程序。
CN202310292198.4A 2023-03-23 2023-03-23 基于特征重构的少样本混凝土缺陷检测方法及装置 Active CN116403071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310292198.4A CN116403071B (zh) 2023-03-23 2023-03-23 基于特征重构的少样本混凝土缺陷检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310292198.4A CN116403071B (zh) 2023-03-23 2023-03-23 基于特征重构的少样本混凝土缺陷检测方法及装置

Publications (2)

Publication Number Publication Date
CN116403071A CN116403071A (zh) 2023-07-07
CN116403071B true CN116403071B (zh) 2024-03-26

Family

ID=87015222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310292198.4A Active CN116403071B (zh) 2023-03-23 2023-03-23 基于特征重构的少样本混凝土缺陷检测方法及装置

Country Status (1)

Country Link
CN (1) CN116403071B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116993996B (zh) * 2023-09-08 2024-01-12 腾讯科技(深圳)有限公司 对图像中的对象进行检测的方法及装置

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569886A (zh) * 2019-08-20 2019-12-13 天津大学 一种双向通道注意力元学习的图像分类方法
WO2020181685A1 (zh) * 2019-03-12 2020-09-17 南京邮电大学 一种基于深度学习的车载视频目标检测方法
CN112434721A (zh) * 2020-10-23 2021-03-02 特斯联科技集团有限公司 一种基于小样本学习的图像分类方法、系统、存储介质及终端
CN112926485A (zh) * 2021-03-15 2021-06-08 河海大学 一种少样本水闸图像分类方法
CN113222896A (zh) * 2021-04-12 2021-08-06 河海大学 一种基于元学习的光伏面板缺陷检测方法
CN113221795A (zh) * 2021-05-24 2021-08-06 大连恒锐科技股份有限公司 用于视频中鞋样检索的特征提取、融合与比对方法及其装置
CN113420642A (zh) * 2021-06-21 2021-09-21 西安电子科技大学 一种基于类别语义特征重加权的小样本目标检测方法及系统
CN113435509A (zh) * 2021-06-28 2021-09-24 山东力聚机器人科技股份有限公司 基于元学习的小样本场景分类识别方法及系统
CN113642574A (zh) * 2021-07-30 2021-11-12 中国人民解放军军事科学院国防科技创新研究院 基于特征加权与网络微调的小样本目标检测方法
CN114140398A (zh) * 2021-11-15 2022-03-04 上海大学 一种利用无缺陷图像的少样本缺陷检测方法
CN114663707A (zh) * 2022-03-28 2022-06-24 中国科学院光电技术研究所 基于Faster RCNN改进的少样本目标检测方法
CN114818963A (zh) * 2022-05-10 2022-07-29 电子科技大学 一种基于跨图像特征融合的小样本检测算法
CN114861842A (zh) * 2022-07-08 2022-08-05 中国科学院自动化研究所 少样本目标检测方法、装置和电子设备
CN115049870A (zh) * 2022-05-07 2022-09-13 电子科技大学 一种基于小样本的目标检测方法
CN115147615A (zh) * 2022-07-01 2022-10-04 河海大学 一种基于度量元学习网络的岩石图像分类方法及装置
CN115457042A (zh) * 2022-11-14 2022-12-09 四川路桥华东建设有限责任公司 一种基于蒸馏学习的螺纹套丝表面缺陷检测的方法及系统
CN115661637A (zh) * 2022-09-28 2023-01-31 中国电子科技集团公司第五十四研究所 一种基于元学习的遥感场景小样本目标检测方法及装置
CN115797691A (zh) * 2022-11-29 2023-03-14 浙江大华技术股份有限公司 一种基于小样本学习的目标检测方法、装置及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764306B (zh) * 2018-05-15 2022-04-22 深圳大学 图像分类方法、装置、计算机设备和存储介质
US20220300823A1 (en) * 2021-03-17 2022-09-22 Hanwen LIANG Methods and systems for cross-domain few-shot classification

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020181685A1 (zh) * 2019-03-12 2020-09-17 南京邮电大学 一种基于深度学习的车载视频目标检测方法
CN110569886A (zh) * 2019-08-20 2019-12-13 天津大学 一种双向通道注意力元学习的图像分类方法
CN112434721A (zh) * 2020-10-23 2021-03-02 特斯联科技集团有限公司 一种基于小样本学习的图像分类方法、系统、存储介质及终端
CN112926485A (zh) * 2021-03-15 2021-06-08 河海大学 一种少样本水闸图像分类方法
CN113222896A (zh) * 2021-04-12 2021-08-06 河海大学 一种基于元学习的光伏面板缺陷检测方法
CN113221795A (zh) * 2021-05-24 2021-08-06 大连恒锐科技股份有限公司 用于视频中鞋样检索的特征提取、融合与比对方法及其装置
CN113420642A (zh) * 2021-06-21 2021-09-21 西安电子科技大学 一种基于类别语义特征重加权的小样本目标检测方法及系统
CN113435509A (zh) * 2021-06-28 2021-09-24 山东力聚机器人科技股份有限公司 基于元学习的小样本场景分类识别方法及系统
CN113642574A (zh) * 2021-07-30 2021-11-12 中国人民解放军军事科学院国防科技创新研究院 基于特征加权与网络微调的小样本目标检测方法
CN114140398A (zh) * 2021-11-15 2022-03-04 上海大学 一种利用无缺陷图像的少样本缺陷检测方法
CN114663707A (zh) * 2022-03-28 2022-06-24 中国科学院光电技术研究所 基于Faster RCNN改进的少样本目标检测方法
CN115049870A (zh) * 2022-05-07 2022-09-13 电子科技大学 一种基于小样本的目标检测方法
CN114818963A (zh) * 2022-05-10 2022-07-29 电子科技大学 一种基于跨图像特征融合的小样本检测算法
CN115147615A (zh) * 2022-07-01 2022-10-04 河海大学 一种基于度量元学习网络的岩石图像分类方法及装置
CN114861842A (zh) * 2022-07-08 2022-08-05 中国科学院自动化研究所 少样本目标检测方法、装置和电子设备
CN115661637A (zh) * 2022-09-28 2023-01-31 中国电子科技集团公司第五十四研究所 一种基于元学习的遥感场景小样本目标检测方法及装置
CN115457042A (zh) * 2022-11-14 2022-12-09 四川路桥华东建设有限责任公司 一种基于蒸馏学习的螺纹套丝表面缺陷检测的方法及系统
CN115797691A (zh) * 2022-11-29 2023-03-14 浙江大华技术股份有限公司 一种基于小样本学习的目标检测方法、装置及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Few-Shot Classification with Feature Map Reconstruction Networks;Davis Wertheimer 等;《arXiv:2012.01506v2 [cs.CV]》;20210427;1-18 *
Generalized Ridge Regression-Based Channelwise Feature Map Weighted Reconstruction Network for Fine-Grained Few-Shot Ship Classification;Yangfan Li 等;《IEEE Transactions on Geoscience and Remote Sensing 》;20230110;1-10 *
克服小样本学习中灾难性遗忘方法研究;李文煜;帅仁俊;郭汉;;计算机应用与软件;20200712(第07期);142-147+153 *
基于自适应特征比较的少样本学习算法;年福东;束建华;吕刚;;西安文理学院学报(自然科学版);20201015(第04期);55-61 *
面向小样本目标检测任务的自适应特征重构算法;刘丁菠;《中国优秀硕士学位论文全文数据库 信息科技辑》;20230115;I138-3050 *

Also Published As

Publication number Publication date
CN116403071A (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN110245709B (zh) 基于深度学习和自注意力的3d点云数据语义分割方法
CN110263705B (zh) 面向遥感技术领域两期高分辨率遥感影像变化检测系统
CN112396002B (zh) 一种基于SE-YOLOv3的轻量级遥感目标检测方法
CN106096561B (zh) 基于图像块深度学习特征的红外行人检测方法
CN104599275B (zh) 基于概率图模型的非参数化的rgb-d场景理解方法
CN112633382A (zh) 一种基于互近邻的少样本图像分类方法及系统
CN108428220A (zh) 静止轨道卫星序列遥感影像海岛礁区域自动几何校正方法
CN115035295B (zh) 一种基于共享卷积核和边界损失函数的遥感图像语义分割方法
CN114067118B (zh) 一种航空摄影测量数据的处理方法
CN113313164A (zh) 一种基于超像素分割与图卷积的数字病理图像分类方法及系统
CN116403071B (zh) 基于特征重构的少样本混凝土缺陷检测方法及装置
CN112989942A (zh) 一种基于交通监控视频的目标实例分割方法
CN116091946A (zh) 一种基于YOLOv5的无人机航拍图像目标检测方法
CN114863348A (zh) 基于自监督的视频目标分割方法
CN115908421A (zh) 一种基于超像素和多样性的主动学习医学图像分割方法
CN111931867A (zh) 基于轻量级模型的新冠肺炎x射线图像分类方法及系统
CN115147615A (zh) 一种基于度量元学习网络的岩石图像分类方法及装置
CN111242028A (zh) 基于U-Net的遥感图像地物分割方法
CN114332473A (zh) 目标检测方法、装置、计算机设备、存储介质及程序产品
CN114358279A (zh) 图像识别网络模型剪枝方法、装置、设备及存储介质
CN117132910A (zh) 一种用于无人机的车辆检测方法、装置及存储介质
CN115546735B (zh) 一种冷却塔结冰检测识别系统、方法和存储介质
CN114943834B (zh) 一种少标注样本下基于原型队列学习的全场景语义分割方法
CN115953371A (zh) 一种绝缘子缺陷检测方法、装置、设备和存储介质
CN113269171B (zh) 车道线检测方法、电子设备及车辆

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant