CN109740451A - 基于重要性加权的道路场景图像语义分割方法 - Google Patents

基于重要性加权的道路场景图像语义分割方法 Download PDF

Info

Publication number
CN109740451A
CN109740451A CN201811544813.1A CN201811544813A CN109740451A CN 109740451 A CN109740451 A CN 109740451A CN 201811544813 A CN201811544813 A CN 201811544813A CN 109740451 A CN109740451 A CN 109740451A
Authority
CN
China
Prior art keywords
importance
road scene
scene image
semantic segmentation
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811544813.1A
Other languages
English (en)
Other versions
CN109740451B (zh
Inventor
袁夏
周宏扬
马浩炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201811544813.1A priority Critical patent/CN109740451B/zh
Publication of CN109740451A publication Critical patent/CN109740451A/zh
Application granted granted Critical
Publication of CN109740451B publication Critical patent/CN109740451B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了基于重要性加权的道路场景图像语义分割方法,首先建立基于重要性加权的损失函数的SegNet神经网络架构;然后选择CityScapes数据集,划分成训练数据集、验证数据集、测试数据集,训练神经网络模型,进行道路场景图像语义分割。本发明使用损失函数加权的方法分割道路场景图像,车辆和行人的分割更精细。

Description

基于重要性加权的道路场景图像语义分割方法
技术领域
本发明属于道路分割技术,具体是涉及一种基于重要性加权的道路场景图像语义分割方法。
背景技术
语义分割是计算机视觉中十分重要的领域,它是指像素级地识别图像,即标注出图像中每个像素所属的对象类别。近年的自动驾驶技术中,也需要用到这种技术。车载摄像头探查到图像,后台计算机可以自动将图像分割归类,以避让行人和车辆等障碍。目前图像语义分割大部分都在采用深度学习技术,但是基于深度学习的几种网络模型都各有侧重点,专门用于道路场景的图像分割的方法比较少。
发明内容
本发明的目的在于提供一种基于重要性加权的道路场景图像语义分割方法,提升了车辆和行人的分割精度。
实现本发明目的的技术解决方案为:一种基于重要性加权的道路场景图像语义分割方法,首先建立基于重要性加权的损失函数的SegNet神经网络架构;然后选择CityScapes数据集,划分成训练数据集、验证数据集、测试数据集,训练神经网络模型,进行道路场景图像语义分割。
作为一种优选实施方式,SegNet神经网络架构包括5个卷积模块和反卷积模块,每个卷积模块中包含3个卷积层和一个最大池化的池化层,每个反卷积模块包含3个反卷积层和一个上采样层。
作为一种更优选实施方式,卷积模块和反卷积模块的卷积核选取大小为3*3的卷积核。
作为一种更优选实施方式,卷积模块和反卷积模块采用ReLu激活函数。
作为一种优选实施方式,重要性加权的损失函数,将道路场景中车辆和行人作为重要类别,确定重要类别和非重要类别的交叉熵损失值,再按照两种重要性类别的系数进行加权,得到重要性加权的损失函数值;使用向量IG1,IG2来表示两种重要性类别的交叉熵损失值,则第j个元素(IGi)j(i=1,2)的损失函数值具体为:
其中,Wi表示第i组像素点的重要性权重,P表示像素点在整个图片所有像素点中所占的频率,q表示独热编码(one-hot),c表示第c种场景类别的像素点。
作为一种优选实施方式,训练神经网络模型时,把整个数据集均分成K个子集,每次选取一个子集作为测试集,从K-1个子集中选出3/4作为训练数据集,剩下的1/4作为验证数据集,进行K次交叉验证,得到训练好的神经网络模型。
作为一种优选实施方式,在训练前,对CityScapes数据集的图像进行基于色彩饱和度的图像增强、基于图像尺寸的数据增强,扩充数据集。
本发明与现有技术相比,其显著优点为:1)本发明使用损失函数加权的方法分割道路场景图像,车辆和行人的分割更精细;2)本发明在网络结构的反卷积和上采样部分,使用在卷积阶段记录的最大池化的指数信息,使得最后分割结果更好。
附图说明
图1为本发明的基于重要性加权的道路场景图像语义分割方法的流程图。
图2为最大池化的池化层的示意图。
图3为第一层卷积的变换示意图。
图4为第二层卷积的变换示意图。
具体实施方式
下面结合附图和具体实施例,进一步说明本发明方案。
一种重要性加权的道路场景图像语义分割方法,包括以下步骤:
步骤1、建立基于重要性加权的损失函数的SegNet神经网络架构,使用卷积神经网络对道路场景图像进行多级分层的特征提取,产生多级特征图,然后对多级特征图按照从低级到高级的顺序,进行对称性的反卷积和上采样操作,在最终的输出结果前加入基于重要性加权的损失函数,不断更新模型参数,使得最后的分割结果中,车辆和行人的分割效果更好。
本发明采用的是经典神经网络结构SegNet,同时进行结构上的改进,具体是构建5个卷积模块(CONV_BLOCK),每个卷积块中包含3个卷积层和一个最大池化的池化层,如图2所示。通过对每张输入图像进行第一层的卷积和池化的处理,使得通道数变为64,特征图尺寸变为原来的1/2,如图3所示;通过对中间层的特征图进行卷积和池化处理,使得通道数翻倍,特征图尺寸变为上一层的1/2,如图4所示。对称地,构建5个反卷积模块,每个反卷积模块包含3个反卷积层和一个上采样层。
关于卷积核的选择,鉴于以往的深度学习经验,本发明选取大小为3*3的卷积核,所有的卷积层都是用这个卷积核的尺寸。
关于激活函数,本发明使用ReLu作为激活函数,这是由于ReLu激活函数本身的一些优点,包括:
(1)采用sigmoid等函数,算激活函数时(指数运算),计算量大,反向传播求误差梯度时,求导涉及除法,计算量相对大,而采用Relu激活函数,整个过程的计算量节省很多。
(2)对于深层网络,sigmoid函数反向传播时,很容易就会出现梯度消失的情况,ReLu能有效解决这个问题。
(3)ReLu会使一部分神经元的输出为0,这样就造成了网络的稀疏性,并且减少了参数的相互依存关系,缓解了过拟合问题的发生。
关于架构的损失函数,采用重要性加权的损失函数,将道路场景中车辆和行人作为重要类别,确定重要类别和非重要类别的交叉熵损失值,再按照两种重要性类别的系数进行加权,得到重要性加权的损失函数值;使用向量IG1,IG2来表示两种重要性类别的交叉熵损失值,则第j个元素(IGi)j(i=1,2)的损失函数值具体为:
其中,Wi表示第i组像素点的重要性权重,P表示像素点在整个图片所有像素点中所占的频率,q表示独热编码(one-hot),c表示第c种场景类别的像素点,本发明中设置这个比例系数为2,也就是说,车辆和行人的重要性是其他类别的两倍。
步骤2、选择CityScapes数据集,划分成训练数据集、验证数据集、测试数据集,训练神经网络模型;
先介绍数据集各组成部分的作用,训练数据用于模型构建;验证数据可选,用于辅助模型构建,可以重复使用。测试数据用于检测模型构建,此数据只在模型检验时使用,用于评估模型的准确率,绝对不允许用于模型构建过程,否则会导致过拟合。
本发明把整个数据集均分成K个子集,每次选取一个子集作为测试集,从K-1个子集中选出3/4作为训练数据集,剩下的1/4作为验证数据集,进行K次交叉验证,得到训练好的神经网络模型。
训练神经网络模型时,卷积部分,使用VGG16在ImageNet上进行预训练的权重初始化,反卷积部分,使用随机初始化参数的方法,这样可以明显减少训练时间,在更少的时间内取得更好的分割效果。此外还需要设置一些超参数,包括迭代次数epoch,每次输入到神经网络进行训练的图像数量batch-size的大小设置,确定训练结束条件。本发明中设置epoch的值为50,batch-size的大小为64。通过设置初始网络权重,网络参数采用随机初始化的方法,不断进行迭代训练,直到加权平均损失小于设定的阈值或者迭代次数大于设定的阈值,结束训练。
作为一种优选实施方式,还可以在训练前,对CityScapes数据集的图像进行基于色彩饱和度的图像增强、基于图像尺寸的数据增强,扩充数据集,然后对扩充的数据集,进行上述处理。
步骤3、利用训练好的模型,进行道路场景图像语义分割。
本发明在分割道路场景图像的车辆和行人部分时,利用损失函数加权的方法,使得重要部分的分割精度更高;在分割道路场景图像的非车辆和行人部分时,使用权重较低的损失函数进行训练;然后得到最终的神经网络模型,即得到训练好的参数值。

Claims (7)

1.基于重要性加权的道路场景图像语义分割方法,其特点在于,首先建立基于重要性加权的损失函数的SegNet神经网络架构;然后选择CityScapes数据集,划分成训练数据集、验证数据集、测试数据集,训练神经网络模型,进行道路场景图像语义分割。
2.根据权利要求1所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,SegNet神经网络架构包括5个卷积模块和反卷积模块,每个卷积块中包含3个卷积层和一个最大池化的池化层,每个反卷积模块包含3个反卷积层和一个上采样层。
3.根据权利要求2所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,卷积模块和反卷积模块的卷积核选取大小为3*3的卷积核。
4.根据权利要求2所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,卷积模块和反卷积模块采用ReLu激活函数。
5.根据权利要求1所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,重要性加权的损失函数,将道路场景中车辆和行人作为重要类别,确定重要类别和非重要类别的交叉熵损失值,再按照两种重要性类别的系数进行加权,得到重要性加权的损失函数值;使用向量IG1,IG2来表示两种重要性类别的交叉熵损失值,则第j个元素(IGi)j(i=1,2)的损失函数值具体为:
其中,Wi表示第i组类别像素的重要性权重值,P表示像素点在整个图片所有像素点中所占的频率,q表示独热编码(one-hot),c表示第c种场景类别的像素点。
6.根据权利要求1所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,训练神经网络模型时,把整个数据集均分成K个子集,每次选取一个子集作为测试集,从K-1个子集中选出3/4作为训练数据集,剩下的1/4作为验证数据集,进行K次交叉验证,得到训练好的神经网络模型。
7.根据权利要求1所述的基于重要性加权的道路场景图像语义分割方法,其特点在于,在训练前,对CityScapes数据集的图像进行基于色彩饱和度的图像增强、基于图像尺寸的数据增强,扩充数据集。
CN201811544813.1A 2018-12-17 2018-12-17 基于重要性加权的道路场景图像语义分割方法 Active CN109740451B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811544813.1A CN109740451B (zh) 2018-12-17 2018-12-17 基于重要性加权的道路场景图像语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811544813.1A CN109740451B (zh) 2018-12-17 2018-12-17 基于重要性加权的道路场景图像语义分割方法

Publications (2)

Publication Number Publication Date
CN109740451A true CN109740451A (zh) 2019-05-10
CN109740451B CN109740451B (zh) 2022-11-25

Family

ID=66360360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811544813.1A Active CN109740451B (zh) 2018-12-17 2018-12-17 基于重要性加权的道路场景图像语义分割方法

Country Status (1)

Country Link
CN (1) CN109740451B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135591A (zh) * 2019-05-16 2019-08-16 数坤(北京)网络科技有限公司 一种基于深度学习的损失值优化方法及设备
CN110287932A (zh) * 2019-07-02 2019-09-27 中国科学院遥感与数字地球研究所 基于深度学习图像语义分割的道路阻断信息提取
CN110349124A (zh) * 2019-06-13 2019-10-18 平安科技(深圳)有限公司 车辆外观损伤智能检测方法、装置及计算机可读存储介质
CN110853069A (zh) * 2019-10-09 2020-02-28 上海眼控科技股份有限公司 一种用于车辆外观分割的神经网络模型构建方法与系统
CN111080551A (zh) * 2019-12-13 2020-04-28 太原科技大学 基于深度卷积特征和语义近邻的多标签图像补全方法
CN112101364A (zh) * 2020-09-10 2020-12-18 西安电子科技大学 基于参数重要性增量学习的语义分割方法
WO2022121214A1 (zh) * 2020-12-08 2022-06-16 广州汽车集团股份有限公司 自动驾驶的损失评估方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319972A (zh) * 2018-01-18 2018-07-24 南京师范大学 一种针对图像语义分割的端到端差异网络学习方法
CN108446616A (zh) * 2018-03-09 2018-08-24 西安电子科技大学 基于全卷积神经网络集成学习的道路提取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319972A (zh) * 2018-01-18 2018-07-24 南京师范大学 一种针对图像语义分割的端到端差异网络学习方法
CN108446616A (zh) * 2018-03-09 2018-08-24 西安电子科技大学 基于全卷积神经网络集成学习的道路提取方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135591A (zh) * 2019-05-16 2019-08-16 数坤(北京)网络科技有限公司 一种基于深度学习的损失值优化方法及设备
CN110349124A (zh) * 2019-06-13 2019-10-18 平安科技(深圳)有限公司 车辆外观损伤智能检测方法、装置及计算机可读存储介质
CN110287932A (zh) * 2019-07-02 2019-09-27 中国科学院遥感与数字地球研究所 基于深度学习图像语义分割的道路阻断信息提取
CN110853069A (zh) * 2019-10-09 2020-02-28 上海眼控科技股份有限公司 一种用于车辆外观分割的神经网络模型构建方法与系统
CN111080551A (zh) * 2019-12-13 2020-04-28 太原科技大学 基于深度卷积特征和语义近邻的多标签图像补全方法
CN111080551B (zh) * 2019-12-13 2023-05-05 太原科技大学 基于深度卷积特征和语义近邻的多标签图像补全方法
CN112101364A (zh) * 2020-09-10 2020-12-18 西安电子科技大学 基于参数重要性增量学习的语义分割方法
CN112101364B (zh) * 2020-09-10 2023-10-20 西安电子科技大学 基于参数重要性增量学习的语义分割方法
WO2022121214A1 (zh) * 2020-12-08 2022-06-16 广州汽车集团股份有限公司 自动驾驶的损失评估方法及装置
CN114945953A (zh) * 2020-12-08 2022-08-26 广州汽车集团股份有限公司 自动驾驶的损失评估方法及装置

Also Published As

Publication number Publication date
CN109740451B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
CN109740451A (zh) 基于重要性加权的道路场景图像语义分割方法
CN110210551B (zh) 一种基于自适应主体敏感的视觉目标跟踪方法
CN110210486B (zh) 一种基于素描标注信息的生成对抗迁移学习方法
CN106845529B (zh) 基于多视野卷积神经网络的影像特征识别方法
CN109035260A (zh) 一种天空区域分割方法、装置和卷积神经网络
CN105512684B (zh) 基于主成分分析卷积神经网络的车标自动识别方法
CN106446942A (zh) 基于增量学习的农作物病害识别方法
CN108764471A (zh) 基于特征冗余分析的神经网络跨层剪枝方法
US9449253B2 (en) Learning painting styles for painterly rendering
CN109102014A (zh) 基于深度卷积神经网络的类别不平衡的图像分类方法
CN110399821B (zh) 基于人脸表情识别的顾客满意度获取方法
CN110084285A (zh) 基于深度学习的鱼类细粒度分类方法
CN109583483A (zh) 一种基于卷积神经网络的目标检测方法和系统
CN109285162A (zh) 一种基于局部区域条件随机场模型的图像语义分割方法
CN108830330A (zh) 基于自适应特征融合残差网的多光谱图像分类方法
CN112365514A (zh) 基于改进PSPNet的语义分割方法
CN112115967B (zh) 一种基于数据保护的图像增量学习方法
CN109741341A (zh) 一种基于超像素和长短时记忆网络的图像分割方法
CN107506792B (zh) 一种半监督的显著对象检测方法
CN110503613A (zh) 基于级联空洞卷积神经网络的面向单幅图像去雨方法
CN112446381B (zh) 一种利用全卷积网络驱动的基于测地线活动轮廓的混合语义分割方法
CN107564009A (zh) 基于深度卷积神经网络的室外场景多目标分割方法
CN108932455B (zh) 遥感图像场景识别方法及装置
CN109190666B (zh) 基于改进的深度神经网络的花卉图像分类方法
CN107016371A (zh) 基于改进的深度置信网络的无人机着陆地貌分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant