CN111222512A - 适用于储罐金属立面表面场景的深度学习语义分割方法 - Google Patents

适用于储罐金属立面表面场景的深度学习语义分割方法 Download PDF

Info

Publication number
CN111222512A
CN111222512A CN201911391140.5A CN201911391140A CN111222512A CN 111222512 A CN111222512 A CN 111222512A CN 201911391140 A CN201911391140 A CN 201911391140A CN 111222512 A CN111222512 A CN 111222512A
Authority
CN
China
Prior art keywords
feature graph
convolution
feature
semantic segmentation
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911391140.5A
Other languages
English (en)
Other versions
CN111222512B (zh
Inventor
张小俊
王志鹏
孙凌宇
万媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei University of Technology
Original Assignee
Hebei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei University of Technology filed Critical Hebei University of Technology
Priority to CN201911391140.5A priority Critical patent/CN111222512B/zh
Publication of CN111222512A publication Critical patent/CN111222512A/zh
Application granted granted Critical
Publication of CN111222512B publication Critical patent/CN111222512B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种适用于储罐金属立面表面场景的深度学习语义分割方法,其技术特点是:采集制作储罐金属立面表面场景的数据集;构建包括输入层、卷积层、反卷积层、SoftMax层和输出层的语义分割网络模型;对储罐金属立面表面场景的数据集进行预处理,得到训练数据集和测试数据集;根据训练数据集和测试数据集对语义分割网络模型进行训练并生成图像。本发明针对储罐金属里面表面场景数据特点通过构建深度学习语义分割网络,语义分割综合了图像分割任务和物体识别任务,对图像进行像素级别的分类,返回带有语义信息的分割图像,将其应用爬壁机器人上,能够更加灵活可靠地完成各项工作。

Description

适用于储罐金属立面表面场景的深度学习语义分割方法
技术领域
本发明属于计算机图形学与多媒体技术领域,尤其是一种适用于储罐金属立面表面场景的深度学习语义分割方法。
背景技术
利用爬壁机器人对石化储罐表面进行检测维护作业的方式取代了以往搭建脚手架的人工维护方式,不仅提高了工作效率,也极大地减小了对工作人员生命安全的威胁。但是,储罐的表面情况较为复杂,以应用最为广泛地拱顶储罐为例,除壁面之外,还存在着加强圈、旋梯、消防喷淋管以及密封圈、取样口、人孔等装置,这些装置使罐体壁面的复杂性大大提高,而机器人缺乏对这些附件的辨别能力,因而在一定程度上降低了爬壁机器人工作时的灵活性和可靠性。
使机器人对工作场景拥有较高的理解能力,是提高机器人自主能力的关键。对石化储罐壁面场景而言,只有机器人拥有了对壁面上不同装置的“认知能力”,才能使爬壁机器人能够更加灵活可靠的完成各项工作。传统的机器人感知技术虽然能够获取储罐表面附件的位置信息和几何信息,但并不能完全理解环境中具体物体的所包含的语义信息,无法判断物体之间的相互逻辑关系。
发明内容
本发明的目的在于克服现有技术的不足,提出一种设计合理、精度高且能够满足复杂环境的适用于储罐金属立面表面场景的深度学习语义分割方法。
本发明解决其技术问题是采取以下技术方案实现的:
一种适用于储罐金属立面表面场景的深度学习语义分割方法,包括以下步骤:
步骤1、采集制作储罐金属立面表面场景的数据集;
步骤2、构建包括输入层、卷积层、反卷积层、SoftMax层和输出层的语义分割网络模型;
步骤3、对储罐金属立面表面场景的数据集进行预处理,得到训练数据集和测试数据集;
步骤4、根据训练数据集和测试数据集对语义分割网络模型进行训练并生成图像。
进一步,所述步骤1的具体实现方法为:首先采集储罐金属立面表面场景的消防喷淋管、加强圈、壁面、旋梯、排污管道和电线管道的图像并以不同颜色进行标注,然后对其进行数据增强和灰度化处理。
进一步,所述步骤2的具体构建方法包括以下步骤:
步骤2.1、所述语义分割网络模型由一个输入层、三个卷积模块和残差连接模块、四个反卷积层、一个SoftMax层和一个输出层构成,三个卷积模块和八个残差连接模块共包括47个卷积层,每个卷积层后都进行Relu和BN操作,并进行Zero-Padding填充;
步骤2.2、特征图经第一个卷积层后,进入第一个卷积模块,一方面通过三个卷积层进行特征提取,另一方面经过一个卷积层进行特征提取,将生成的两种特征图通过相加得到新的特征图A;
步骤2.3、特征图A进入第一个残差连接模块,通过三次卷积后生成特征图后与特征图A相加,生成特征图B;
步骤2.4、特征图B进入第二个残差连接模块,通过三次卷积后生成特征图后与特征图B相加,生成特征图C;
步骤2.5、特征图C进入第二个卷积模块,一方面通过三个卷积层进行特征提取,另一方面经过一个卷积层进行特征提取,生成的两种特征图通过相加得到新的特征图D;
步骤2.6、特征图D进入第三个残差连接模块,通过三次卷积后生成特征图后与特征图D相加,生成特征图E;
步骤2.7、特征图E进入第四个残差连接模块,通过三次卷积后生成特征图后与特征图E相加,生成特征图F;
步骤2.8、特征图F进入第五个残差连接模块,通过三次卷积后生成特征图后与特征图F相加,生成特征图G;
步骤2.9、特征图G进入第三个卷积模块,一方面通过三个卷积层进行特征提取,另一方面经过一个卷积层进行特征提取,生成的两种特征图并通过相加得到特征图H;
步骤2.10、特征图H进入第六个残差连接模块,一方面通过三次卷积后生成特征图后与特征图H相加,生成特征图I;
步骤2.11、特征图I进入第七个残差连接模块,通过三次卷积后生成特征图后与特征图I相加,生成特征图J;
步骤2.12、特征图J进入第八个残差连接模块,通过三次卷积后生成特征图后与特征图J相加,生成特征图K;
步骤2.13、特征图K进入ASPP模块,经过四个卷积层之后进行融合,生成特征图L;
步骤2.14、特征图L经过卷积层生成特征图M;
步骤2.15、特征图M经过一次反卷积之后生成特征图N;
步骤2.16、特征图N经过一次反卷积之后生成特征图O;
步骤2.17、特征图O与第一个卷积模块中三个卷积层中第一个卷积层的输出融合生成特征图P,特征图P经过卷积层后生成特征图Q;
步骤2.18、特征图Q经过一次反卷积之后生成特征图R;
步骤2.19、特征图R经过一次反卷积之后生成特征图S;
步骤2.20、特征图S经过SoftMax层,进入输出层,从而得到语义分割网络模型。
进一步,所述步骤3的具体实现方法包括以下步骤:
步骤3.1、利用标注软件做好对应图像的标签,准备训练数据集和测试数据集;
步骤3.2、将训练数据集和测试数据集的图像统一缩放到固定像素大小。
进一步,所述步骤4的具体实现方法包括以下步骤:
步骤4.1、将训练数据集的图像输入语义分割网络模型,对网络参数进行采用初始化;
步骤4.2、将图像数据转化为语义分割网络模型能识别的数据类型;
步骤4.3、将测试数据集送入语义分割网络模型,提取测试图像的多尺度特征;通过前向传播和反向传播两个步骤反复训练直到达到最大的迭代次数,使损失函数值趋于稳定且最小;
步骤4.4、输出尺寸大小与原图一致的分割效果图。
进一步,所述步骤4.1采用Xavier初始化权重对网络参数进行采用初始化。
进一步,所述步骤4.2通过Python语言,并使用TensorFlow深度学习框架将图像数据转化为语义分割网络模型能识别的数据类型。
进一步,所述步骤4.3采用Opencv图像处理进行图像输出。
本发明的优点和积极效果是:
1、本发明针对储罐金属里面表面场景数据特点通过构建深度学习语义分割网络,语义分割综合了图像分割任务和物体识别任务,对图像进行像素级别的分类,返回带有语义信息的分割图像,将其应用爬壁机器人上,能够更加灵活可靠地完成各项工作。
2、本发明能够通过残差连接和空间金字塔结构实现多尺度的特征提取,压缩卷积核数目以减小过拟合,采用能够进行参数训练的反卷积进行上采样,使上采样效果更加优化。
附图说明
图1是本发明方法流程图;
图2是本发明深度学习语义分割网络框架示意图;
图3是本发明深度学习语义分割网络的构成模块示意图;
图4是本发明原图、标注图和效果图对比。
具体实施方式
以下结合附图对本发明做进一步详述。
一种适用于储罐金属立面表面场景的深度学习语义分割方法,如图1所示,包括以下步骤:
步骤1、采集制作储罐金属立面表面场景的数据集。
本实施案例中,石化储罐金属立面表面场景的1026张图片中共有消防喷淋管、加强圈、壁面、旋梯、排污管道和电线管道6类,使用图像标注软件将其以不同的颜色进行标注。其中喷淋管(255,255,0)、消防管(255,0,0)、壁面(0,255,0)、旋梯(0,255,255)、排污管道(85,0,128)和电线管道(0,0,128),并将制作好的数据集进行数据增强和灰度化处理。
步骤2、构建语义分割网络模型,该语义分割网络模型的构建过程如下:
(1)该语义分割网络模型由一个输入层,三个卷积模块和八个残差连接模块共计47个卷积层(Conv),4个反卷积层(DeConv),一个SoftMax层,一个输出层构成,其中,每个卷积层后都进行Relu和BN操作,并进行Zero-Padding填充;如图2及图3所示。
(2)第一个卷积层卷积核个数为32,卷积核大小为3*3,步长为2;
(3)之后一方面经过卷积核个数为32,卷积核大小为3*3,步长为2;卷积核个数为32,卷积核大小为3*3,步长为1;卷积核个数为64,卷积核大小为1*1,步长为1的三个卷积层,另一方面经过卷积核个数为64,卷积核大小为3*3,步长为2的卷积层,并将两者结果进行相加。其中记三个卷积层中的第一个所产生的特征图为I;
(4)之后一方面经过卷积核个数为32,卷积核大小为1*1,步长为1;卷积核个数为32,卷积核大小为3*3,步长为1;卷积核个数为32,卷积核大小为3*3,步长为1的三个卷积层;
(5)之后一方面经过卷积核个数为32,卷积核大小为1*1,步长为1;卷积核个数为32,卷积核大小为3*3,步长为1;卷积核个数为32,卷积核大小为3*3,步长为1的三个卷积层,输出的结果与输入相加;
(6)之后一方面经过卷积核个数为64,卷积核大小为3*3,步长为2;卷积核个数为64,卷积核大小为3*3,步长为1;卷积核个数为128,卷积核大小为1*1,步长为1的三个卷积层,另一方面经过卷积核个数为128,卷积核大小为3*3,步长为2的卷积层,并将两者结果进行相加;
(7)之后一方面经过卷积核个数为64,卷积核大小为1*1,步长为1;卷积核个数为64,卷积核大小为3*3,步长为1;卷积核个数为128,卷积核大小为3*3,步长为1的三个卷积层,输出的结果与输入相加;
(8)之后一方面经过卷积核个数为64,卷积核大小为1*1,步长为1;卷积核个数为64,卷积核大小为3*3,步长为1;卷积核个数为128,卷积核大小为3*3,步长为1的三个卷积层,输出的结果与输入相加;
(9)之后一方面经过卷积核个数为64,卷积核大小为1*1,步长为1;卷积核个数为64,卷积核大小为3*3,步长为1;卷积核个数为128,卷积核大小为3*3,步长为1的三个卷积层,输出的结果与输入相加;
(10)之后一方面经过卷积核个数为128,卷积核大小为3*3,步长为2;卷积核个数为64,卷积核大小为3*3,步长为1;卷积核个数为256,卷积核大小为1*1,步长为1的三个卷积层,另一方面经过卷积核个数为256,卷积核大小为3*3,步长为2的卷积层,并将两者结果进行相加;
(11)之后一方面经过卷积核个数为128,卷积核大小为1*1,步长为1;卷积核个数为128,卷积核大小为3*3,步长为1;卷积核个数为256,卷积核大小为3*3,步长为1的三个卷积层,输出的结果与输入相加;
(12)之后输出的结果分别经过卷积核个数为256,卷积核大小为3*3,rate为6、12、18的带孔卷积,和卷积核大小为1*1的卷积,输出结果相加;
(13)之后经过卷积核个数为512,卷积核大小为1*1,步长为1的卷积层;
(14)之后经过卷积核个数为256,卷积核大小为3*3,步长为1的反卷积层;
(15)之后经过卷积核个数为128,卷积核大小为3*3,步长为1的反卷积层,与特征图I融合;
(16)之后经过卷积核个数为64,卷积核大小为3*3,步长为1的反卷积层;
(17)之后经过卷积核个数为32,卷积核大小为3*3,步长为1的反卷积层;
(18)之后通过SoftMax函数进行分类,并生成效果图;
步骤3、对储罐金属立面表面场景的数据集进行预处理,得到训练数据集和测试数据集,过程如下:
(1)利用标注软件做好对应图像的标签,准备训练数据集和测试数据集。
(2)将数据集图像统一缩放到固定像素大小。
步骤4、对语义分割网络模型进行训练并生成图像,过程如下:
(1)将训练样本预处理后的图像输入语义分割网络,并采用Xavier初始化权重对网络参数进行采用初始化。
(2)通过Python语言,使用TensorFlow深度学习框架将图像数据转化为神经网络能识别的数据类型。
(3)将预处理好的测试数据集送入训练好的网络模型,提取测试图像的多尺度特征;通过前向传播和反向传播两个步骤反复训练直到达到最大的迭代次数,使损失函数值趋于稳定且最小,并保存网络模型。
(4)使用Opencv图像处理包将输出尺寸大小与原图一致的分割效果图。
图4从左至右给出了原图、标注图和效果图对比。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (8)

1.一种适用于储罐金属立面表面场景的深度学习语义分割方法,其特征在于包括以下步骤:
步骤1、采集制作储罐金属立面表面场景的数据集;
步骤2、构建包括输入层、卷积层、反卷积层、SoftMax层和输出层的语义分割网络模型;
步骤3、对储罐金属立面表面场景的数据集进行预处理,得到训练数据集和测试数据集;
步骤4、根据训练数据集和测试数据集对语义分割网络模型进行训练并生成图像。
2.根据权利要求1所述的适用于储罐金属立面表面场景的深度学习语义分割方法,其特征在于:所述步骤1的具体实现方法为:首先采集储罐金属立面表面场景的消防喷淋管、加强圈、壁面、旋梯、排污管道和电线管道的图像并以不同颜色进行标注,然后对其进行数据增强和灰度化处理。
3.根据权利要求1所述的适用于储罐金属立面表面场景的深度学习语义分割方法,其特征在于:所述步骤2的具体构建方法包括以下步骤:
步骤2.1、所述语义分割网络模型由一个输入层、三个卷积模块和残差连接模块、四个反卷积层、一个SoftMax层和一个输出层构成,三个卷积模块和八个残差连接模块共包括47个卷积层,每个卷积层后都进行Relu和BN操作,并进行Zero-Padding填充;
步骤2.2、特征图经第一个卷积层后,进入第一个卷积模块,一方面通过三个卷积层进行特征提取,另一方面经过一个卷积层进行特征提取,将生成的两种特征图通过相加得到新的特征图A;
步骤2.3、特征图A进入第一个残差连接模块,通过三次卷积后生成特征图后与特征图A相加,生成特征图B;
步骤2.4、特征图B进入第二个残差连接模块,通过三次卷积后生成特征图后与特征图B相加,生成特征图C;
步骤2.5、特征图C进入第二个卷积模块,一方面通过三个卷积层进行特征提取,另一方面经过一个卷积层进行特征提取,生成的两种特征图通过相加得到新的特征图D;
步骤2.6、特征图D进入第三个残差连接模块,通过三次卷积后生成特征图后与特征图D相加,生成特征图E;
步骤2.7、特征图E进入第四个残差连接模块,通过三次卷积后生成特征图后与特征图E相加,生成特征图F;
步骤2.8、特征图F进入第五个残差连接模块,通过三次卷积后生成特征图后与特征图F相加,生成特征图G;
步骤2.9、特征图G进入第三个卷积模块,一方面通过三个卷积层进行特征提取,另一方面经过一个卷积层进行特征提取,生成的两种特征图并通过相加得到特征图H;
步骤2.10、特征图H进入第六个残差连接模块,一方面通过三次卷积后生成特征图后与特征图H相加,生成特征图I;
步骤2.11、特征图I进入第七个残差连接模块,通过三次卷积后生成特征图后与特征图I相加,生成特征图J;
步骤2.12、特征图J进入第八个残差连接模块,通过三次卷积后生成特征图后与特征图J相加,生成特征图K;
步骤2.13、特征图K进入ASPP模块,经过四个卷积层之后进行融合,生成特征图L;
步骤2.14、特征图L经过卷积层生成特征图M;
步骤2.15、特征图M经过一次反卷积之后生成特征图N;
步骤2.16、特征图N经过一次反卷积之后生成特征图O;
步骤2.17、特征图O与第一个卷积模块中三个卷积层中第一个卷积层的输出融合生成特征图P,特征图P经过卷积层后生成特征图Q;
步骤2.18、特征图Q经过一次反卷积之后生成特征图R;
步骤2.19、特征图R经过一次反卷积之后生成特征图S;
步骤2.20、特征图S经过SoftMax层,进入输出层,从而得到语义分割网络模型。
4.根据权利要求1所述的适用于储罐金属立面表面场景的深度学习语义分割方法,其特征在于:所述步骤3的具体实现方法包括以下步骤:
步骤3.1、利用标注软件做好对应图像的标签,准备训练数据集和测试数据集;
步骤3.2、将训练数据集和测试数据集的图像统一缩放到固定像素大小。
5.根据权利要求1所述的适用于储罐金属立面表面场景的深度学习语义分割方法,其特征在于:所述步骤4的具体实现方法包括以下步骤:
步骤4.1、将训练数据集的图像输入语义分割网络模型,对网络参数进行采用初始化;
步骤4.2、将图像数据转化为语义分割网络模型能识别的数据类型;
步骤4.3、将测试数据集送入语义分割网络模型,提取测试图像的多尺度特征;通过前向传播和反向传播两个步骤反复训练直到达到最大的迭代次数,使损失函数值趋于稳定且最小;
步骤4.4、输出尺寸大小与原图一致的分割效果图。
6.根据权利要求5所述的适用于储罐金属立面表面场景的深度学习语义分割方法,其特征在于:所述步骤4.1采用Xavier初始化权重对网络参数进行采用初始化。
7.根据权利要求5所述的适用于储罐金属立面表面场景的深度学习语义分割方法,其特征在于:所述步骤4.2通过Python语言,并使用TensorFlow深度学习框架将图像数据转化为语义分割网络模型能识别的数据类型。
8.根据权利要求5所述的适用于储罐金属立面表面场景的深度学习语义分割方法,其特征在于:所述步骤4.3采用Opencv图像处理进行图像输出。
CN201911391140.5A 2019-12-30 2019-12-30 适用于储罐金属立面表面场景的深度学习语义分割方法 Active CN111222512B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911391140.5A CN111222512B (zh) 2019-12-30 2019-12-30 适用于储罐金属立面表面场景的深度学习语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911391140.5A CN111222512B (zh) 2019-12-30 2019-12-30 适用于储罐金属立面表面场景的深度学习语义分割方法

Publications (2)

Publication Number Publication Date
CN111222512A true CN111222512A (zh) 2020-06-02
CN111222512B CN111222512B (zh) 2023-04-21

Family

ID=70829193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911391140.5A Active CN111222512B (zh) 2019-12-30 2019-12-30 适用于储罐金属立面表面场景的深度学习语义分割方法

Country Status (1)

Country Link
CN (1) CN111222512B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112767369A (zh) * 2021-01-25 2021-05-07 佛山科学技术学院 小五金的缺陷识别检测方法、装置及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180068429A1 (en) * 2015-04-15 2018-03-08 Institute Of Automation Chinese Academy Of Sciences Image Steganalysis Based on Deep Learning
CN107945185A (zh) * 2017-11-29 2018-04-20 北京工商大学 基于宽残差金字塔池化网络的图像分割方法及系统
CN108985250A (zh) * 2018-07-27 2018-12-11 大连理工大学 一种基于多任务网络的交通场景解析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180068429A1 (en) * 2015-04-15 2018-03-08 Institute Of Automation Chinese Academy Of Sciences Image Steganalysis Based on Deep Learning
CN107945185A (zh) * 2017-11-29 2018-04-20 北京工商大学 基于宽残差金字塔池化网络的图像分割方法及系统
CN108985250A (zh) * 2018-07-27 2018-12-11 大连理工大学 一种基于多任务网络的交通场景解析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张小俊;李辰政;孙凌宇;张明路: "基于改进3D卷积神经网络的行为识别" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112767369A (zh) * 2021-01-25 2021-05-07 佛山科学技术学院 小五金的缺陷识别检测方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN111222512B (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
CN109086768B (zh) 卷积神经网络的语义图像分割方法
CN110766746B (zh) 一种基于联合2d-3d神经网络的3d驾驶员姿态估计方法
CN112562255B (zh) 微光环境下电缆沟道烟雾火情的智能图像检测方法
CN112365434B (zh) 一种基于双掩膜图像分割的无人机狭窄通道检测方法
CN112329780A (zh) 一种基于深度学习的深度图像语义分割方法
CN112418235B (zh) 一种基于膨胀最近邻特征增强的点云语义分割方法
CN112163447B (zh) 基于Attention和SqueezeNet的多任务实时手势检测和识别方法
CN111222512B (zh) 适用于储罐金属立面表面场景的深度学习语义分割方法
CN114004766A (zh) 一种水下图像增强方法、系统和设备
CN111368637B (zh) 一种基于多掩模卷积神经网络的搬运机器人识别目标方法
CN115908793A (zh) 一种基于位置注意力机制的编解码结构语义分割模型
CN111104855B (zh) 一种基于时序行为检测的工作流识别方法
CN110728186B (zh) 一种基于多网融合的火灾检测方法
CN116485867A (zh) 一种面向自动驾驶的结构化场景深度估计方法
CN113627093A (zh) 一种基于改进Unet网络的水下机构跨尺度流场特征预测方法
CN115311274A (zh) 一种基于空间变换自注意力模块的焊缝检测方法及系统
Xu et al. Tackling small data challenges in visual fire detection: a deep convolutional generative adversarial network approach
CN114022777A (zh) 一种遥感影像地物要素的样本制作方法及装置
House et al. Using deep learning to identify potential roof spaces for solar panels
CN116894941A (zh) 一种轻量级图像分割神经网络构建方法、基于轻量级图像分割神经网络的实时鲁棒焊缝跟踪检测方法及系统
CN116258715A (zh) 一种粉尘回收方法、装置及电子设备
CN115359411A (zh) 一种基于改进DeepLab V3+网络的变电站环境理解方法
CN114494934A (zh) 一种基于信息减少率的无监督运动目标检测方法
CN117789184B (zh) 一种统一的焊缝射线图像智能识别方法
Gaur et al. Underwater Image Enhancement Using Generative Adversarial Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant