CN110781895B - 一种基于卷积神经网络的图像语义分割方法 - Google Patents

一种基于卷积神经网络的图像语义分割方法 Download PDF

Info

Publication number
CN110781895B
CN110781895B CN201910957201.3A CN201910957201A CN110781895B CN 110781895 B CN110781895 B CN 110781895B CN 201910957201 A CN201910957201 A CN 201910957201A CN 110781895 B CN110781895 B CN 110781895B
Authority
CN
China
Prior art keywords
output
image
model
convolution
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910957201.3A
Other languages
English (en)
Other versions
CN110781895A (zh
Inventor
熊炜
童磊
管来福
王传胜
李敏
李利荣
曾春艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN201910957201.3A priority Critical patent/CN110781895B/zh
Publication of CN110781895A publication Critical patent/CN110781895A/zh
Application granted granted Critical
Publication of CN110781895B publication Critical patent/CN110781895B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于卷积神经网络的图像语义分割方法,选择ResNet101作为骨架网络进行特征提取,提出了一个JFP模型将ResNet101输出的后三层进行联合,完善ResNet101对特征的提取,解决图像信息丢失的问题;然后将JFP的输出接入ASPP模型进一步提取图像的空间尺度信息,这部分作为编码结构能够更好的对图像信息进行提取;最后应用简单的解码结构将神经网络的输出图像恢复为原始大小,完成对图像的语义分割;同时,本发明设计了一个注意力模型,将这个模型的损失函数与语义分割网络的损失函数结合,辅助网络进行训练,提升训练模型的效果。本发明显著提高了复杂情景下的图像语义分割效果,能够适用于多种场景,具有对包20多种物体类别图像的语义分割处理能力。

Description

一种基于卷积神经网络的图像语义分割方法
技术领域
本发明属于数字图像处理、模式识别与机器学习技术领域,涉及一种图像语义分割方法,特别是涉及一种基于卷积神经网络的图像语义分割方法。
背景技术
基于图像的语义分割是对图像进行像素级分割,需要对图像的每一个像素从语义上进行分类,同一类别的像素标记同一类别标签,体现在分割结果上就是同一类别的物体采用相同颜色标记,而不同颜色就是不同类别的物体。
卷积神经网络(CNN)的应用使得图像语义分割快速得到发展,各种基于卷积神经网络的语义分割网络结构被提出,完全卷积网络(FCN)的提出使得基于卷积神经网络的图像语义分割方法得到了突破,其去掉了CNN末端使用的全连接层,使得网络最后生成的不是固定的特征向量,而是可以变换尺寸的特征图像,最后进行逐像素的分类以达到语义分割的目的。
由于语义分割是逐像素的分类过程,卷积操作使得网络的参数量变大,常常需要加入池化层对图像进行降维处理,以减少参数,这又会产生图像信息丢失等问题,而进行语义分割必须要保持与原图像的像素对齐,每个像素的信息都有意义,这是语义分割面临的最大问题。
目前语义分割的网络模型绝大部分都采用了深度卷积神经网络(DCNN)作为骨架网络,在此基础上设计针对图像语义分割的特定神经网络模型,但是DCNN也不能完整提取图像特征,存在信息丢失的问题,同时,目前的方法,如空洞卷积、金字塔模型和全局池化等,也并不能处理复杂的语义信息。
发明内容
为了解决上述技术问题,本发明提供了一种基于卷积神经网络的图像语义分割方法,显著提高了复杂情景下的图像语义分割效果,能够适用于多种场景,具有对包含20多种物体类别的图像进行语义分割处理的能力。
本发明所采用的技术方案是:一种基于卷积神经网络的图像语义分割方法,选择ResNet101作为骨架网络进行特征提取,提出了一个联合特征金字塔(JFP)模型将ResNet101输出的后三层进行联合,完善ResNet101对特征的提取,解决图像信息丢失的问题;然后将JFP的输出接入暗黑空间金字塔(ASPP)模型进一步提取图像的空间尺度信息,这部分作为编码结构能够更好的对图像信息进行提取;最后应用简单的解码结构将神经网络的输出图像恢复为原始大小,完成对图像的语义分割;同时,本文设计了一个注意力模型作为辅助语义分割网络,将这个模型的损失函数与语义分割网络的损失函数结合,辅助网络进行训练,提升训练模型的效果。
本发明提出了一种基于卷积神经网络的图像语义分割方法,与现有算法相比,其显著优点在于:
(1)本发明采用双线性插值法对图像进行处理,避免过多使用池化操作降低图像维度,较大地减少了图像的信息缺失;
(2)本发明采用金字塔模型,结合ResNet101最后三层输出,较大地保留了图像的空间信息;
(3)本发明在JFP和ASPP模型上采用不同的空洞卷积率的空洞卷积,即能提取更多的空间信息,又能加大感受域,提升语义分割效果;
(4)本发明在JFP和ASPP模型上采用不同概率的DropOut,防止过拟合,配合不同的参数设置,进一步结合两个模型的优点;
(5)本发明设计了注意力模型作为辅助网络,加快网络的训练。
附图说明
图1为本发明实施例的原理图;
图2为本发明实施例的联合特征金字塔模型JFP示意图;
图3为本发明实施例的暗黑空间金字塔模型ASPP示意图;
图4为本发明实施例的解码结构示意图;
图5为本发明实施例的注意力模型示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种基于卷积神经网络的图像语义分割方法,包括以下步骤:
步骤1:采用ResNet101作为骨架网络进行图像特征提取;
本实施例结合ResNet101、JFP和ASPP三个模型作为编码结构,以提取图像的信息,ResNet101为当前常用的骨架网络,使用预训练的模型提取图像信息,然后通过JFP模型,进行特征的结合,如图2所示。
步骤2:采用联合特征金字塔JFP模型将ResNet101输出的后三层进行联合;
本实施例中,ResNet101输出的最后三层分别为Block1、Block2和Block3,这三层的输出尺寸减半而深度增加一倍,将这三层的输出分别通过一个卷积,其中,卷积核尺寸为3,激活函数为ReLu,激活函数为ReLu,如式(1)所示:
Figure BDA0002227737700000031
在图像边界进行1个像素值为0的填充,从而不改变输出图像的尺寸,加入批量归一化处理,采用DropOut为0.3以防止过拟合,卷积核的深度为512,使得输出的深度都变成512,然后分别通过空洞卷积率为1、2、4的3×3卷积,其中像素填充分别与空洞卷积率相同,不采用DropOut处理,其中空洞卷积率为2和4的卷积输出还要在图像边界加入2和4个像素值为0的填充,保持输出尺寸与输入的相同,再加入双线性插值,对这两个输出进行调整,使得输出的尺寸与Block1相同,由ResNet101的三层输出经过不同的卷积处理得到三个尺寸与深度相同的输出,与Block1层的输出尺寸与深度相同,最后将这三个输出与Block1的输出相加,因此JFP模型输出的特征图尺寸与Block1的输出相同,而深度为2048。JFP模型中使用的空洞卷积率较小,能更好的提取图像特征,它的感受域提升并不大,模型也比采用大空洞卷积率的模型要小,但十分有效。
步骤3:将JFP模型的输出接入暗黑空间金字塔ASPP模型进一步提取图像的空间尺度信息;
本实施例中,将JFP的输出再输入到ASPP模型,如图2所示。ASPP模型输出是由五个相同尺寸和深度的特征图相加得来。将JFP模型的输出作为输入,首先,应用1×1的卷积,将JFP的输出深度降为256,生成一个尺寸为(h,w)、深度为256的特征图,其中,h表示图像高度,w表示图像宽度;;其次,应用空洞卷积率为6、8和10的空洞卷积,在图像边界进行6、8和10个像素值为0的填充,不改变图像尺寸,输出三个尺寸为(h,w)、深度为256的特征图;然后,应用全局池化结合1×1卷积,使用双线性插值法恢复图像尺寸,输出一个尺寸为(h,w)、深度为256的特征图;最后,由这5个输出特征图相加得到与JFP的输出特征图尺寸相同、深度为1280的输出。其中,卷积的激活函数为ReLu,加入了批量归一化处理。采用相对大的空洞卷积率,较大的增加了感受域的大小,ASPP在JFP的基础上进一步提取图片的空间尺度信息,能更好地提升特征提取的效果。
步骤4:应用解码结构将步骤3的输出图像恢复为原始大小,完成对图像的语义分割;
本实施例中,采用的解码结构如图4所示,采用1×1卷积、3×3卷积和1×1卷积的组合,第一个卷积将输入的深度降为256,第二个卷积作进一步特征处理,第三个卷积将深度降为21,与Pascal VOC 2012数据集的类别数相同(包括背景),最后通过双线性插值法将图像尺寸变为400×400,这个尺寸是数据集裁剪的尺寸,与最开始输入神经网络的图像尺寸保持相同。卷积的激活函数为ReLu,加入批量归一化处理,而其中3×3卷积加入了0.1的DropOut,与JFP模型中DropOut的值不同,因为设置不同的DropOut可以得到更好结果。
本实施例中,设计了一个注意力模型作为语义分割网络的辅助网络,其结构如图5所示,采用注意力模型作为辅助语义分割网络,将注意力模型的损失函数与语义分割网络的损失函数结合,辅助语义分割网络进行训练;
首先将ResNet101的Block2的输出做一个1×1卷积处理,将特征图输出深度降为21,然后进行全局池化处理,其中卷积过程的激活函数为ReLu,加入批量归一化处理,最后通过双线性插值法将输出图像尺寸变为400×400。
这一部分的网络是作为辅助网络的,将这个网络的损失函数作为语义分割模型损失的一部分,辅助本文设计的神经网络进行训练,如图1中所示,语义分割网络的损失为Loss1,辅助网络的损失为Loss2,Loss1和Loss2均为SoftMax CrossEntropy损失函数所定义,为式(2)所示:
Figure BDA0002227737700000041
其中,i∈{1,2,3…,21},y'i为标签图像中属于第i个类的概率值,即真实分布值,yi为语义分割模型输出预测属于第i个类的概率值,即预测分布值,y由SoftMax函数定义,如式(3)所示:
Figure BDA0002227737700000042
其中,j∈{1,2,3…,21}。最终训练网络的损失函数为Loss,其关系式如式(4)所示:
Figure BDA0002227737700000051
其中,0.5为本文设置辅助网络对整个模型损失函数的影响系数。
应当理解的是,本说明书未详细阐述的部分均属于现有技术;上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (5)

1.一种基于卷积神经网络的图像语义分割方法,其特征在于,包括以下步骤:
步骤1:采用ResNet101作为骨架网络进行图像特征提取;
步骤2:采用联合特征金字塔JFP模型将ResNet101输出的后三层进行联合;
其中,ResNet101输出的最后三层分别为Block1、Block2和Block3,这三层的输出尺寸减半而深度增加一倍,将这三层的输出分别通过一个卷积,其中,卷积核尺寸为3,激活函数为ReLu,如式(1)所示:
Figure FDA0004217562150000011
在图像边界进行1个像素值为0的填充,从而不改变输出图像的尺寸,加入批量归一化处理,采用DropOut为0.3以防止过拟合,卷积核的深度为512,使得输出的深度都变成512,然后分别通过空洞卷积率为1、2、4的3×3卷积,其中像素填充分别与空洞卷积率相同,不采用DropOut处理,其中空洞卷积率为2和4的卷积输出还要在图像边界加入2和4个像素值为0的填充,保持输出尺寸与输入的相同,再加入双线性插值,对这两个输出进行调整,使得输出的尺寸与Block1相同,由ResNet101的三层输出经过不同的卷积处理得到三个尺寸与深度相同的输出,与Block1层的输出尺寸与深度相同,最后将这三个输出与Block1的输出相加;因此JFP模型输出的特征图尺寸与Block1的输出相同,而深度为2048;
步骤3:将JFP模型的输出接入暗黑空间金字塔ASPP模型进一步提取图像的空间尺度信息;
步骤4:应用解码结构将步骤3的输出图像恢复为原始大小,完成对图像的语义分割。
2.根据权利要求1所述的基于卷积神经网络的图像语义分割方法,其特征在于:步骤1中,采用ResNet101作为骨架网络,使用预训练的模型提取图像信息。
3.根据权利要求1所述的基于卷积神经网络的图像语义分割方法,其特征在于:步骤3中,将JFP模型的输出再输入到ASPP模型;ASPP模型输出是由五个相同尺寸和深度的特征图相加得来;将JFP模型的输出作为输入,首先,应用1×1的卷积,将JFP的输出深度降为256,生成一个尺寸为(h,w)、深度为256的特征图,其中,h表示图像高度,w表示图像宽度;其次,应用空洞卷积率为6、8和10的空洞卷积,在图像边界进行6、8和10个像素值为0的填充,不改变图像尺寸,输出三个尺寸为(h,w)、深度为256的特征图;然后,应用全局池化结合1×1卷积,使用双线性插值法恢复图像尺寸,输出一个尺寸为(h,w)、深度为256的特征图;最后,由这5个输出特征图相加得到与JFP模型的输出特征图尺寸相同、深度为1280的输出;其中,卷积的激活函数为ReLu,加入了批量归一化处理。
4.根据权利要求1所述的基于卷积神经网络的图像语义分割方法,其特征在于:步骤4中,所述解码结构,采用1×1卷积、3×3卷积和1×1卷积的组合,第一个卷积将输入的深度降为256,第二个卷积作进一步特征处理,第三个卷积将深度降为21,与Pascal VOC 2012数据集的类别数相同,包括背景;最后通过双线性插值法将图像尺寸变为400×400,这个尺寸是数据集裁剪的尺寸,与最开始输入神经网络的图像尺寸保持相同;卷积的激活函数为ReLu,加入批量归一化处理,而其中3×3卷积加入了0.1的DropOut,与JFP模型中DropOut的值不同,因为设置不同的DropOut得到更好结果。
5.根据权利要求1-4任意一项所述的基于卷积神经网络的图像语义分割方法,其特征在于:步骤1中,采用注意力模型作为辅助语义分割网络,将注意力模型的损失函数与语义分割网络的损失函数结合,辅助语义分割网络进行训练;
具体实现包括以下子步骤:
步骤1.1:将ResNet101的Block2的输出做一个1×1卷积处理,将特征图输出深度降为21,然后进行全局池化处理,其中卷积过程的激活函数为ReLu,加入批量归一化处理,最后通过双线性插值法将输出图像尺寸变为400×400;
步骤1.2:定义语义分割网络的损失为Loss1,辅助网络的损失为Loss2;Loss1和Loss2均为SoftMax CrossEntropy损失函数所定义,为式(2)所示:
Figure FDA0004217562150000021
其中,i∈{1,2,3…,21},yi'为标签图像中属于第i个类的概率值,即真实分布值,yi为语义分割模型输出预测属于第i个类的概率值,即预测分布值,y由SoftMax函数定义,如式(3)所示:
Figure FDA0004217562150000022
其中,j∈{1,2,3…,21};
最终训练网络的损失函数为Loss,其关系式如式(4)所示:
Figure FDA0004217562150000023
其中,0.5为设置辅助网络对整个模型损失函数的影响系数。
CN201910957201.3A 2019-10-10 2019-10-10 一种基于卷积神经网络的图像语义分割方法 Active CN110781895B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910957201.3A CN110781895B (zh) 2019-10-10 2019-10-10 一种基于卷积神经网络的图像语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910957201.3A CN110781895B (zh) 2019-10-10 2019-10-10 一种基于卷积神经网络的图像语义分割方法

Publications (2)

Publication Number Publication Date
CN110781895A CN110781895A (zh) 2020-02-11
CN110781895B true CN110781895B (zh) 2023-06-20

Family

ID=69384922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910957201.3A Active CN110781895B (zh) 2019-10-10 2019-10-10 一种基于卷积神经网络的图像语义分割方法

Country Status (1)

Country Link
CN (1) CN110781895B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259983B (zh) * 2020-02-13 2022-05-20 电子科技大学 基于深度学习的图像语义分割方法及存储介质
CN111401379A (zh) * 2020-03-24 2020-07-10 北方民族大学 基于编解码结构的DeepLabv3plus-IRCNet图像语义分割算法
CN111523546B (zh) * 2020-04-16 2023-06-16 湖南大学 图像语义分割方法、系统及计算机存储介质
CN112001391A (zh) * 2020-05-11 2020-11-27 江苏鲲博智行科技有限公司 一种图像特征融合图像语义分割的方法
CN111832453B (zh) * 2020-06-30 2023-10-27 杭州电子科技大学 基于双路深度神经网络的无人驾驶场景实时语义分割方法
CN112085031A (zh) * 2020-09-11 2020-12-15 河北工程大学 目标检测方法及系统
CN112233129B (zh) * 2020-10-20 2023-06-27 湘潭大学 基于深度学习的并行多尺度注意力机制语义分割方法及装置
CN112381097A (zh) * 2020-11-16 2021-02-19 西南石油大学 一种基于深度学习的场景语义分割方法
CN112465834B (zh) * 2020-11-26 2024-05-24 中科麦迪人工智能研究院(苏州)有限公司 一种血管分割方法及装置
CN112949732B (zh) * 2021-03-12 2022-04-22 中国人民解放军海军航空大学 基于自适应多模态遥感图像融合语义标注方法及系统
CN113011429B (zh) * 2021-03-19 2023-07-25 厦门大学 基于阶段性特征语义对齐的实时街景图像语义分割方法
CN113139551A (zh) * 2021-04-23 2021-07-20 桂林电子科技大学 一种基于DeepLabv3+的改进语义分割方法
CN112966672B (zh) * 2021-04-29 2024-04-05 上海海事大学 一种复杂背景下的手势识别方法
CN114220098A (zh) * 2021-12-21 2022-03-22 一拓通信集团股份有限公司 一种基于改进的多尺度全卷积网络语义分割方法
CN115205300B (zh) * 2022-09-19 2022-12-09 华东交通大学 基于空洞卷积和语义融合的眼底血管图像分割方法与系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108986124A (zh) * 2018-06-20 2018-12-11 天津大学 结合多尺度特征卷积神经网络视网膜血管图像分割方法
WO2019024808A1 (zh) * 2017-08-01 2019-02-07 北京市商汤科技开发有限公司 语义分割模型的训练方法和装置、电子设备、存储介质
CN109409435A (zh) * 2018-11-01 2019-03-01 上海大学 一种基于卷积神经网络的深度感知显著性检测方法
CN109902693A (zh) * 2019-02-16 2019-06-18 太原理工大学 一种基于多注意力空间金字塔特征图像识别方法
CN110059772A (zh) * 2019-05-14 2019-07-26 温州大学 基于迁移vgg网络的遥感图像语义分割方法
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
CN110232394A (zh) * 2018-03-06 2019-09-13 华南理工大学 一种多尺度图像语义分割方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10635927B2 (en) * 2017-03-06 2020-04-28 Honda Motor Co., Ltd. Systems for performing semantic segmentation and methods thereof
US11587304B2 (en) * 2017-03-10 2023-02-21 Tusimple, Inc. System and method for occluding contour detection

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019024808A1 (zh) * 2017-08-01 2019-02-07 北京市商汤科技开发有限公司 语义分割模型的训练方法和装置、电子设备、存储介质
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
CN110232394A (zh) * 2018-03-06 2019-09-13 华南理工大学 一种多尺度图像语义分割方法
CN108986124A (zh) * 2018-06-20 2018-12-11 天津大学 结合多尺度特征卷积神经网络视网膜血管图像分割方法
CN109409435A (zh) * 2018-11-01 2019-03-01 上海大学 一种基于卷积神经网络的深度感知显著性检测方法
CN109902693A (zh) * 2019-02-16 2019-06-18 太原理工大学 一种基于多注意力空间金字塔特征图像识别方法
CN110059772A (zh) * 2019-05-14 2019-07-26 温州大学 基于迁移vgg网络的遥感图像语义分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于多尺度特征提取的图像语义分割;熊志勇;张国丰;王江晴;;中南民族大学学报(自然科学版)(第03期);第122-128页 *
基于彩色-深度图像和深度学习的场景语义分割网络;代具亭;汤心溢;刘鹏;邵保泰;;科学技术与工程(第20期);第291-296页 *

Also Published As

Publication number Publication date
CN110781895A (zh) 2020-02-11

Similar Documents

Publication Publication Date Title
CN110781895B (zh) 一种基于卷积神经网络的图像语义分割方法
Li et al. A closed-form solution to photorealistic image stylization
Hao et al. Low-light image enhancement with semi-decoupled decomposition
CN107644006B (zh) 一种基于深度神经网络的手写体中文字库自动生成方法
CN107492070B (zh) 一种双通道卷积神经网络的单图像超分辨率计算方法
CN107798381B (zh) 一种基于卷积神经网络的图像识别方法
CN108875935B (zh) 基于生成对抗网络的自然图像目标材质视觉特征映射方法
CN109919830B (zh) 一种基于美学评价的带参考人眼图像修复方法
CN109858487B (zh) 基于分水岭算法和图像类别标签的弱监督语义分割方法
CN111340814A (zh) 一种基于多模态自适应卷积的rgb-d图像语义分割方法
CN107392244B (zh) 基于深度神经网络与级联回归的图像美感增强方法
CN110880165A (zh) 一种基于轮廓和颜色特征融合编码的图像去雾方法
CN111401380B (zh) 一种基于深度特征增强和边缘优化的rgb-d图像语义分割方法
CN113313173B (zh) 基于图表示和改进Transformer的人体解析方法
CN112991173A (zh) 基于双通道特征迁移网络的单帧图像超分辨率重建方法
Chen et al. Towards Deep Style Transfer: A Content-Aware Perspective.
CN113837946B (zh) 一种基于递进蒸馏网络的轻量化图像超分辨率重建方法
CN107463932A (zh) 一种使用二进制瓶颈神经网络来抽取图片特征的方法
CN111768335A (zh) 一种基于cnn的用户交互式图像局部服饰风格迁移方法
CN110751271B (zh) 一种基于深度神经网络的图像溯源特征表征方法
CN114445651A (zh) 一种语义分割模型的训练集构建方法、装置及电子设备
Cai et al. Multiscale attentive image de-raining networks via neural architecture search
CN113298704B (zh) 一种广播电视新闻下利用图迁移的肤色分割及美化方法
CN106296749B (zh) 基于l1范数约束的rgb-d图像本征分解方法
Mun et al. Texture preserving photo style transfer network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant