CN116862883A - 基于图像语义分割的混凝土坍落度检测方法 - Google Patents
基于图像语义分割的混凝土坍落度检测方法 Download PDFInfo
- Publication number
- CN116862883A CN116862883A CN202310860689.4A CN202310860689A CN116862883A CN 116862883 A CN116862883 A CN 116862883A CN 202310860689 A CN202310860689 A CN 202310860689A CN 116862883 A CN116862883 A CN 116862883A
- Authority
- CN
- China
- Prior art keywords
- slump
- image
- concrete
- semantic segmentation
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 43
- 238000001514 detection method Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000012805 post-processing Methods 0.000 claims abstract description 15
- 238000010276 construction Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000000605 extraction Methods 0.000 claims description 32
- 238000010586 diagram Methods 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 230000009969 flowable effect Effects 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30132—Masonry; Concrete
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/06—Recognition of objects for industrial automation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于语义分割的混凝土坍落度检测方法,具体包括如下步骤:步骤1,图像预处理与数据集构建;步骤2,构建基于多尺度通道注意力特征的语义分割模块;步骤3,图像后处理与结果输出;采用本发明,能够克服现有混凝土坍落度检测方法依赖于人工操作和主观判断等误差引入问题,输出的坍落度检测结果更加精准,丰富了计算机视觉及人工智能技术的方法体系,为提升混凝土坍落度检测精度提供了一种选择。
Description
技术领域
本发明属于计算机视觉及人工智能技术领域,具体涉及基于图像语义分割的混凝土坍落度检测方法。
背景技术
近年来,混凝土坍落度检测在工程建设和质量控制中变得越来越重要,混凝土坍落度是评估混凝土的流动性和可塑性的指标,它是指混凝土在塌落锥试验中塌落的程度;
传统的混凝土坍落度检测方法有塌落锥试验、压力板法、流度计等,这些方法通常依赖于人工操作和主观判断,存在主观性、不稳定性和人力资源的限制。
发明内容
本发明的目的在于提供基于图像语义分割的混凝土坍落度检测方法,解决了现有检测方法依赖于人工操作和主观判断的问题。
本发明所采用的技术方案是:基于图像语义分割的混凝土坍落度检测方法,具体按以下步骤实施:
步骤1,图像预处理与数据集构建;
步骤2,构建基于多尺度通道注意力特征的语义分割模块;
步骤3,图像后处理与结果输出。
本发明的特点还在于:
其中步骤1具体按以下步骤实施:
步骤1.1,将各种坍落度桶与具有不同坍落度的混凝土样本图像进行图像切割与图像增强;
步骤1.2,将步骤1.1处理后的样本图像,在labelme中进行标注,样本图像中坍落度桶和坍落后的混凝土分别标注为坍落度桶类和混凝土类;
步骤1.3,保存生成的json文件,将其批量转化为分割的可视化图像,再进行颜色填充,生成对应图像的标注图片,作为GroundTruth,与原始图像一并构成训练集、验证集和测试集;
其中步骤2具体按以下步骤实施:
步骤2.1,构建编码器子模块,由卷积层和下采样层组成,包含原始特征提取单元和多尺度特征提取单元;
步骤2.2,构建解码器子模块,由通道注意力层与上采样层组成,用于逐步恢复特征图的分辨率;
步骤2.3,设置训练超参,进行网络的训练与测试;
其中步骤2.1中构建编码器子模块具体按以下步骤实施:
步骤2.1.1,构建初始特征提取单元,包含一个步长为2的3×3卷积和两个步长为1的3×3卷积,实现初始特征的提取;
步骤2.1.2,构建多尺度特征提取模块,卷积均为标准卷积和空洞卷积;
其中步骤2.1.2中构建多尺度特征提取模块具体按以下步骤实施:
步骤2.1.2.1,输入特征首先经过一个3×3标准卷积进行特征提取并将通道数调整为一半;
步骤2.1.2.2,经过三个感受野不同的特征提取分支,提取三个分支的多尺度特征;
步骤2.1.2.3,将三个分支的多尺度特征进行相加融合,并使用一个1×1卷积来恢复通道数;
步骤2.1.2.4,使用通道混洗进行各个通道间的信息交互,并在混洗前引入了特征提取分支之前的残差连;
其中步骤2.1.2.2具体按以下步骤实施:
步骤2.1.2.2.1,第一个分支为3×3标准卷积,其感受野为3×3,用于提取局部信息;
步骤2.1.2.2.2,第二个分支为空洞率为d的3×3空洞卷积,其感受野为(2×d+1)×(2×d+1);
步骤2.1.2.2.3,第三个分支为空洞率为d+1的3×3空洞卷积,其感受野为(2×d+3)×(2×d+3);
其中步骤2.2中构建解码器子模块具体按以下步骤实施:
步骤2.2.1,通道数为512的1/32大小的特征图首先经过通道注意力层,计算新特征;
步骤2.2.2,将步骤2.2.1得到的通道数为512的1/32特征图经过上采样层与经过通道注意力层得到的通道数为256的1/16特征图相加融合;
步骤2.2.3,融合后的特征再进行上采样后与经过通道注意力层得到的通道数为128的1/8大小的特征图相加融合;
步骤2.2.4,最后再次上采样后与经过通道注意力层得到的通道数为64的1/4大小的特征图融合;
步骤2.2.5,将上采样为16通道1/2大小的特征图送入输出卷积层中,输出卷积层步长为2,输出通道为类别数的二维转置卷积;
其中步骤2.2.1具体按以下步骤实施:
步骤2.2.1.1,对输入大小为H×W×C的特征F分别进行空间的全局最大池化和平均池化得到两个大小为1×1×C的通道描述Favg、Fmax;
步骤2.2.1.2,将步骤2.2.1.1的输出送入多层感知机网络中,由两个全连接层和一个Relu激活层构成;
步骤2.2.1.3将步骤2.2.1.2输出的两个特征相加后通过一个Sigmoid激活函数得到权重系数Mc(F),与大小为H×W×C的特征F相乘得到放缩后的新特征,其中Mc(F)的计算,如下式所示:
其中步骤3图像后处理与结果输出具体按以下步骤实施:
步骤3.1,将拍摄的坍落度实验前后对比图像送入步骤2构建完成的基于多尺度特征提取的语义分割方法模块中,输出预测的分割图像P1、P2;
步骤3.2,对步骤3.1得到的分割图像P1、P2进行后处理,进行区域连通以及噪点处理,确保P1实现坍落度桶的分割、P2实现混凝土的分割;
步骤3.3,对步骤3.2输出的后处理图像P1、P2进行查找,找到P1中类别为坍落度桶的所有像素中y轴坐标值的最高点Y1和最低点Y2,找到P2中类别为混凝土的所有像素中y轴坐标值的最低点Y3,计算Y1和Y2在y轴坐标值上的绝对差值,根据坍落度桶的实际高度,计算出图像尺寸和实际尺寸的比值K,再计算Y2和Y3在y轴坐标值上的绝对差值,根据K计算出塌落度的实际高度;
步骤3.4,根据坍落度分级计算混凝土分类结果,其中坍落度在10~40mm内为低塑性混凝土;坍落度在50~90mm内为塑性混凝土;坍落度在100~150mm内为流动性混凝土;坍落度大于160mm的为大流动性混凝土;
步骤3.5,输出P1、P2、坍落度与混凝土分类结果。
本发明的有益效果是:
本发明的基于图像语义分割的混凝土坍落度检测方法中数据预处理工作和图像后处理与结果输出不参与模型训练过程;基于多尺度通道注意力特征的语义分割,其中多尺度特征提取模块使用三个分支来提取多尺度信息,模块拥有更丰富的上下文信息;在每次下采样前,将当前特征图与下采样至相同分辨率的三通道输入图像以及上一次下采样后的特征图进行级联;此外,除第一次上采样外,在每次上采样前,将当前特征图与经过通道注意力具有相同通道数和分辨率的多尺度特征图进行相加,进一步提高预测性能;本方法克服了现有混凝土坍落度检测方法依赖于人工操作和主观判断等误差引入问题,输出的坍落度检测结果更加精准,丰富了计算机视觉及人工智能技术的方法体系,为提升混凝土坍落度检测精度提供了一种选择。
附图说明
图1是本发明的基于图像语义分割的混凝土坍落度检测方法中实施步骤2中基于多尺度通道注意力特征的网络结构示意图;
图2是本发明的基于图像语义分割的混凝土坍落度检测方法中实施步骤2.1.2中多尺度特征提取模块的结构示意图;
图3是本发明的基于图像语义分割的混凝土坍落度检测方法中实施步骤2.2中解码器模块的结构示意图;
图4是本发明的基于图像语义分割的混凝土坍落度检测方法中实施步骤2.2.1中通道注意力层的结构示意图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
随着机器学习和深度学习的发展,混凝土坍落度的自动检测得到了广泛研究;这些方法可以基于颜色、纹理、形状等特征来识别和测量混凝土的坍落度;与传统方法相比,基于深度学习的方法能够从大量数据中学习特征表示,自动提取对坍落度预测有用的特征;模型能够适应不同的混凝土特性和施工条件;并且具备较高的预测准确性和稳定性。
本发明提供了基于图像语义分割的混凝土坍落度检测方法,选择以卷积神经网络为基础,围绕语义分割技术展开研究,关键技术包括以下三项:图像预处理、构建基于多尺度特征提取的语义分割模块、图像后处理与结果输出;通过这三项关键技术的实现,共同完成混凝土坍落度检测的任务,从而弥补现有混凝土坍落度检测方法依赖于人工操作和主观判断等问题;这对实现高精度坍落度检测判断混凝土是否易于施工操作和均匀密实的性能,从而保证施工的正常进行具有重要意义。
实施例1
基于图像语义分割的混凝土坍落度检测方法,具体按以下步骤实施:
步骤1,图像预处理与数据集构建;
步骤2,构建基于多尺度通道注意力特征的语义分割模块;
步骤3,图像后处理与结果输出。
实施例2
基于语义分割的混凝土坍落度检测方法,具体按以下步骤实施:
步骤1,进行图像预处理与数据集构建:
步骤1.1,将各种坍落度桶与具有不同坍落度的混凝土样本图像进行图像切割与图像增强,保证目标物体在图像中的占比接近真实实验环境,同时确保两类关键分割对象的数据平衡;
步骤1.2,将步骤1.1处理后的样本图像,在labelme中进行标注,样本图像中坍落度桶和坍落后的混凝土分别标注为坍落度桶类和混凝土类;
步骤1.3,保存生成的json文件,将其批量转化为分割的可视化图像,再进行颜色填充,生成对应图像的标注图片,作为GroundTruth,与原始图像一并构成训练集、验证集和测试集;
步骤2,基于多尺度注意力通道特征的语义分割模块对图像进行语义分割,网络结构示意图如图1所示,具体步骤如下:
步骤2.1,构建编码器子模块,主要由卷积层和下采样层组成,包含原始特征提取单元和多尺度特征提取单元;
步骤2.2,构建解码器子模块,主要由通道注意力层与上采样层组成,用于逐步恢复特征图的分辨率,如图3所示,具体如下:
步骤2.2.1,通道数为512的1/32大小的特征图首先经过通道注意力层,计算新特征,如图4所示;
步骤2.2.1.1,对输入大小为H×W×C的特征F分别进行空间的全局最大池化和平均池化得到两个大小为1×1×C的通道描述Favg、Fmax;
步骤2.2.1.2,将步骤2.2.1.1的输出送入多层感知机网络中,由两个全连接层和一个Relu激活层构成;
步骤2.2.1.3将步骤2.2.1.2输出的两个特征相加后通过一个Sigmoid激活函数得到权重系数Mc(F),与大小为H×W×C的特征F相乘得到放缩后的新特征,其中Mc(F)的计算,如下式所示:
步骤2.2.2,将步骤2.2.1得到的通道数为512的1/32特征图经过上采样层与经过通道注意力层得到的通道数为256的1/16特征图相加融合;
步骤2.2.3,融合后的特征再进行上采样后与经过通道注意力层,如步骤2.2.1所示,得到的通道数为128的1/8大小的特征图相加融合;
步骤2.2.4,最后再次上采样后与经过通道注意力层,如步骤2.2.1所示,得到的通道数为64的1/4大小的特征图融合;
步骤2.2.5,将上采样为16通道1/2大小的特征图送入输出卷积层中,输出卷积层步长为2,输出通道为类别数的二维转置卷积。
步骤2.3,设置训练超参,进行网络的训练与测试;
步骤3,进行图像后处理与结果输出,具体步骤如下:
步骤3.1,将拍摄的坍落度实验前后对比图像送入步骤2构建完成的基于多尺度特征提取的语义分割方法模块中,输出预测的分割图像P1、P2;
步骤3.2,对步骤3.1得到的分割图像P1、P2进行后处理,进行区域连通以及噪点处理,确保P1实现坍落度桶的分割、P2实现混凝土的分割;
步骤3.3,对步骤3.2输出的后处理图像P1、P2进行查找,找到P1中类别为坍落度桶的所有像素中y轴坐标值的最高点Y1和最低点Y2,找到P2中类别为混凝土的所有像素中y轴坐标值的最低点Y3,计算Y1和Y2在y轴坐标值上的绝对差值,根据坍落度桶的实际高度,计算出图像尺寸和实际尺寸的比值K,再计算Y2和Y3在y轴坐标值上的绝对差值,根据K计算出塌落度的实际高度;
步骤3.4,根据坍落度分级计算混凝土分类结果,其中坍落度在10~40mm内为低塑性混凝土;坍落度在50~90mm内为塑性混凝土;坍落度在100~150mm内为流动性混凝土;坍落度大于160mm的为大流动性混凝土;
步骤3.5,输出P1、P2、坍落度与混凝土分类结果;
实施例3
本实施例对步骤2.1构建编码器子模块采用的方案具体为:
步骤2.1.1,构建初始特征提取单元,包含一个步长为2的3×3卷积和两个步长为1的3×3卷积,该单元的作用是实现初始特征的提取;
步骤2.1.2,构建多尺度特征提取模块,如图2所示,为了追求更高的分割性能,所使用的卷积均为标准卷积和空洞卷积;
步骤2.1.2.1,输入特征首先经过一个3×3标准卷积进行特征提取并将通道数调整为一半;
步骤2.1.2.2,经过三个感受野不同的特征提取分支,提取三个分支的多尺度特征,具体步骤如下:
步骤2.1.2.2.1,第一个分支为3×3标准卷积,其感受野为3×3,用于提取局部信息;
步骤2.1.2.2.2,第二个分支为空洞率为d的3×3空洞卷积,其感受野为(2×d+1)×(2×d+1);
步骤2.1.2.2.3,第三个分支为空洞率为d+1的3×3空洞卷积,其感受野为(2×d+3)×(2×d+3);
步骤2.1.2.3,将三个分支的多尺度特征进行相加融合,并使用一个1×1卷积来恢复通道数;
步骤2.1.2.4,使用通道混洗进行各个通道间的信息交互,并在混洗前引入了特征提取分支之前的残差连,促进训练、避免梯度消失。
Claims (9)
1.基于图像语义分割的混凝土坍落度检测方法,其特征在于,具体按以下步骤实施:
步骤1,图像预处理与数据集构建;
步骤2,构建基于多尺度通道注意力特征的语义分割模块;
步骤3,图像后处理与结果输出。
2.根据权利要求1所述的基于图像语义分割的混凝土坍落度检测方法,其特征在于,所述步骤1具体按以下步骤实施:
步骤1.1,将各种坍落度桶与具有不同坍落度的混凝土样本图像进行图像切割与图像增强;
步骤1.2,将步骤1.1处理后的样本图像,在labelme中进行标注,样本图像中坍落度桶和坍落后的混凝土分别标注为坍落度桶类和混凝土类;
步骤1.3,保存生成的json文件,将其批量转化为分割的可视化图像,再进行颜色填充,生成对应图像的标注图片,作为GroundTruth,与原始图像一并构成训练集、验证集和测试集。
3.根据权利要求1所述的基于图像语义分割的混凝土坍落度检测方法,其特征在于,所述步骤2具体按以下步骤实施:
步骤2.1,构建编码器子模块,由卷积层和下采样层组成,包含原始特征提取单元和多尺度特征提取单元;
步骤2.2,构建解码器子模块,由通道注意力层与上采样层组成,用于逐步恢复特征图的分辨率;
步骤2.3,设置训练超参,进行网络的训练与测试。
4.根据权利要求3所述的基于图像语义分割的混凝土坍落度检测方法,其特征在于,所述步骤2.1中构建编码器子模块具体按以下步骤实施:
步骤2.1.1,构建初始特征提取单元,包含一个步长为2的3×3卷积和两个步长为1的3×3卷积,实现初始特征的提取;
步骤2.1.2,构建多尺度特征提取模块,卷积均为标准卷积和空洞卷积。
5.根据权利要求4所述的基于图像语义分割的混凝土坍落度检测方法,其特征在于,所述步骤2.1.2中构建多尺度特征提取模块具体按以下步骤实施:
步骤2.1.2.1,输入特征首先经过一个3×3标准卷积进行特征提取并将通道数调整为一半;
步骤2.1.2.2,经过三个感受野不同的特征提取分支,提取三个分支的多尺度特征;
步骤2.1.2.3,将三个分支的多尺度特征进行相加融合,并使用一个1×1卷积来恢复通道数;
步骤2.1.2.4,使用通道混洗进行各个通道间的信息交互,并在混洗前引入了特征提取分支之前的残差连。
6.根据权利要求5所述的基于图像语义分割的混凝土坍落度检测方法,其特征在于,所述步骤2.1.2.2具体按以下步骤实施:
步骤2.1.2.2.1,第一个分支为3×3标准卷积,其感受野为3×3,用于提取局部信息;
步骤2.1.2.2.2,第二个分支为空洞率为d的3×3空洞卷积,其感受野为(2×d+1)×(2×d+1);
步骤2.1.2.2.3,第三个分支为空洞率为d+1的3×3空洞卷积,其感受野为(2×d+3)×(2×d+3)。
7.根据权利要求3所述的基于图像语义分割的混凝土坍落度检测方法,其特征在于,所述步骤2.2中构建解码器子模块具体按以下步骤实施:
步骤2.2.1,通道数为512的1/32大小的特征图首先经过通道注意力层,计算新特征;
步骤2.2.2,将步骤2.2.1得到的通道数为512的1/32特征图经过上采样层与经过通道注意力层得到的通道数为256的1/16特征图相加融合;
步骤2.2.3,融合后的特征再进行上采样后与经过通道注意力层得到的通道数为128的1/8大小的特征图相加融合;
步骤2.2.4,最后再次上采样后与经过通道注意力层得到的通道数为64的1/4大小的特征图融合;
步骤2.2.5,将上采样为16通道1/2大小的特征图送入输出卷积层中,输出卷积层步长为2,输出通道为类别数的二维转置卷积。
8.根据权利要求7所述的基于图像语义分割的混凝土坍落度检测方法,其特征在于,所述步骤2.2.1具体按以下步骤实施:
步骤2.2.1.1,对输入大小为H×W×C的特征F分别进行空间的全局最大池化和平均池化得到两个大小为1×1×C的通道描述Favg、Fmax;
步骤2.2.1.2,将步骤2.2.1.1的输出送入多层感知机网络中,由两个全连接层和一个Relu激活层构成;
步骤2.2.1.3将步骤2.2.1.2输出的两个特征相加后通过一个Sigmoid激活函数得到权重系数Mc(F),与大小为H×W×C的特征F相乘得到放缩后的新特征,其中Mc(F)的计算,如下式所示:
9.根据权利要求1所述的基于图像语义分割的混凝土坍落度检测方法,其特征在于,所述步骤3图像后处理与结果输出具体按以下步骤实施:
步骤3.1,将拍摄的坍落度实验前后对比图像送入步骤2构建完成的基于多尺度特征提取的语义分割方法模块中,输出预测的分割图像P1、P2;
步骤3.2,对步骤3.1得到的分割图像P1、P2进行后处理,进行区域连通以及噪点处理,确保P1实现坍落度桶的分割、P2实现混凝土的分割;
步骤3.3,对步骤3.2输出的后处理图像P1、P2进行查找,找到P1中类别为坍落度桶的所有像素中y轴坐标值的最高点Y1和最低点Y2,找到P2中类别为混凝土的所有像素中y轴坐标值的最低点Y3,计算Y1和Y2在y轴坐标值上的绝对差值,根据坍落度桶的实际高度,计算出图像尺寸和实际尺寸的比值K,再计算Y2和Y3在y轴坐标值上的绝对差值,根据K计算出塌落度的实际高度;
步骤3.4,根据坍落度分级计算混凝土分类结果,其中坍落度在10~40mm内为低塑性混凝土;坍落度在50~90mm内为塑性混凝土;坍落度在100~150mm内为流动性混凝土;坍落度大于160mm的为大流动性混凝土;
步骤3.5,输出P1、P2、坍落度与混凝土分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310860689.4A CN116862883A (zh) | 2023-07-13 | 2023-07-13 | 基于图像语义分割的混凝土坍落度检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310860689.4A CN116862883A (zh) | 2023-07-13 | 2023-07-13 | 基于图像语义分割的混凝土坍落度检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116862883A true CN116862883A (zh) | 2023-10-10 |
Family
ID=88233778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310860689.4A Pending CN116862883A (zh) | 2023-07-13 | 2023-07-13 | 基于图像语义分割的混凝土坍落度检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116862883A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117422709A (zh) * | 2023-12-13 | 2024-01-19 | 福建南方路面机械股份有限公司 | 基于rgb图像和深度图像的坍落度预测方法及装置 |
-
2023
- 2023-07-13 CN CN202310860689.4A patent/CN116862883A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117422709A (zh) * | 2023-12-13 | 2024-01-19 | 福建南方路面机械股份有限公司 | 基于rgb图像和深度图像的坍落度预测方法及装置 |
CN117422709B (zh) * | 2023-12-13 | 2024-04-16 | 福建南方路面机械股份有限公司 | 基于rgb图像和深度图像的坍落度预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115049936B (zh) | 一种面向高分遥感影像的边界增强型语义分割方法 | |
CN111210435B (zh) | 一种基于局部和全局特征增强模块的图像语义分割方法 | |
CN106547880B (zh) | 一种融合地理区域知识的多维度地理场景识别方法 | |
CN108399419B (zh) | 基于二维递归网络的自然场景图像中中文文本识别方法 | |
CN109829891B (zh) | 一种基于密集生成对抗神经网络的磁瓦表面缺陷检测方法 | |
CN111612807A (zh) | 一种基于尺度和边缘信息的小目标图像分割方法 | |
CN110910368B (zh) | 基于语义分割的注射器缺陷检测方法 | |
CN115063573B (zh) | 一种基于注意力机制的多尺度目标检测方法 | |
CN111950453A (zh) | 一种基于选择性注意力机制的任意形状文本识别方法 | |
CN107229757A (zh) | 基于深度学习和哈希编码的视频检索方法 | |
CN110827312B (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN111768388A (zh) | 一种基于正样本参考的产品表面缺陷检测方法及系统 | |
CN114998566A (zh) | 一种可解释的多尺度红外弱小目标检测网络设计方法 | |
CN113139544A (zh) | 一种基于多尺度特征动态融合的显著性目标检测方法 | |
CN116862883A (zh) | 基于图像语义分割的混凝土坍落度检测方法 | |
CN114359297A (zh) | 基于注意力金字塔的多分辨率语义分割方法及装置 | |
CN116206133A (zh) | 一种rgb-d显著性目标检测方法 | |
CN112365478A (zh) | 一种基于语义分割的电机换向器表面缺陷检测模型 | |
CN117456330A (zh) | 一种基于MSFAF-Net的低照度目标检测方法 | |
CN116258990A (zh) | 一种基于跨模态亲和力的小样本参考视频目标分割方法 | |
CN115797808A (zh) | 一种无人机巡检缺陷图像的识别方法、系统、装置及介质 | |
CN113361496B (zh) | 一种基于U-Net的城市建成区统计方法 | |
CN114820423A (zh) | 一种基于显著性目标检测的自动抠图方法及其配套系统 | |
CN117830889A (zh) | 基于光流图特征融合机制的视频显著性检测方法、系统及存储介质 | |
CN113066074A (zh) | 一种基于双目视差偏移融合的视觉显著性预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |