CN114565766A - 基于BiSeNet V2的路面图像语义分割方法及装置 - Google Patents
基于BiSeNet V2的路面图像语义分割方法及装置 Download PDFInfo
- Publication number
- CN114565766A CN114565766A CN202210195769.8A CN202210195769A CN114565766A CN 114565766 A CN114565766 A CN 114565766A CN 202210195769 A CN202210195769 A CN 202210195769A CN 114565766 A CN114565766 A CN 114565766A
- Authority
- CN
- China
- Prior art keywords
- semantic
- feature map
- bisenet
- pooling
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 101
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000011176 pooling Methods 0.000 claims abstract description 139
- 230000004913 activation Effects 0.000 claims abstract description 20
- 238000010606 normalization Methods 0.000 claims abstract description 16
- 230000004927 fusion Effects 0.000 claims abstract description 12
- 239000010410 layer Substances 0.000 description 107
- 238000005070 sampling Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000002085 persistent effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002355 dual-layer Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种基于BiSeNet V2的路面图像语义分割方法及装置。该方法包括:通过改造后的BiSeNet V2的语义分支获得路面图像的1/32分辨率的语义特征图,其中以BiSeNet V2为基础,在BiSeNet V2的语义分支的每个下采样层增加卷积层、批量归一化层、激活层,删除BiSeNet V2的细节分支,增加全局池化层,获得所述改造后的BiSeNet V2;通过所述全局池化层对1/32分辨率的语义特征图进行全局池化,获得全局池化特征图;通过所述改造后的BiSeNet V2的特征融合模块融合全局池化特征图和1/32分辨率的语义特征图,获得融合后的特征图;通过所述改造后的BiSeNet V2依据所述融合后的特征图,获得所述路面图像的路面元素的语义分割结果。本申请提供的方案,能够准确地获得路面图像中路面元素的语义分割结果。
Description
技术领域
本申请涉及导航技术领域,尤其涉及一种基于BiSeNet V2的路面图像语义分割方法及装置。
背景技术
相关技术中,路面要素包括路面交通标志,例如标划于路面上的各种线条、箭头、文字、立面标记、突起路标和轮廓标等。自动驾驶车辆通过图像对路面要素的准确识别,是自动驾驶车辆完成安全、智能行驶的重要前提。相关技术采用神经网络对图像进行语义分割,根据语义分割结果获得路面要素的识别结果,能够为自动驾驶车辆的导航提供准确的道路信息,使得自动驾驶车辆能够实现安全的自动驾驶功能。
相关技术采用BiSeNet V2(双边分割网络)的路面要素图像语义分割,BiSeNet V2包括细节分支和语义分支,其中细节分支感受野小,提取到分辨率大的特征表示。语义分支感受野相对大,提取到分辨率小的特征表示。BiSeNet V2将细节分支使用小感受野提取到的特征和语义分支使用大感受野提取到的特征融合。BiSeNet V2将不同感受野得到的特征融合,对于有些元素在图片中很大,有些元素在图片中很小的真实街道场景和路面场景的图片,例如近处的大路牌或者路面在图片中目标很大,远处的路牌或者行人在图片中很小,BiSeNet V2很好地适应了街道和道路全要素场景的语义分割。但是,相关技术的BiSeNetV2并不适用于车辆自动驾驶时路面元素的语义分割,可能将部分路面分割为背景,无法准确地获得路面图像中路面元素的语义分割结果。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种基于BiSeNet V2的路面图像语义分割方法及装置,能够准确地获得路面图像中路面元素的语义分割结果。
本申请第一方面提供一种基于BiSeNet V2的路面图像语义分割方法,所述方法包括:
通过改造后的BiSeNet V2的语义分支获得路面图像的1/32分辨率的语义特征图,其中以BiSeNet V2为基础,在BiSeNet V2的语义分支的每个下采样层增加卷积层、批量归一化层、激活层,删除BiSeNet V2的细节分支,增加全局池化层,获得所述改造后的BiSeNetV2;
通过所述全局池化层对所述1/32分辨率的语义特征图进行全局池化,获得全局池化特征图;
通过所述改造后的BiSeNet V2的特征融合模块融合所述全局池化特征图和所述1/32分辨率的语义特征图,获得融合后的特征图;
通过所述改造后的BiSeNet V2依据所述融合后的特征图,获得所述路面图像的路面元素的语义分割结果。
优选的,所述方法还包括:
对所述语义分割结果进行闭运算,获得所述闭运算后的语义分割结果。
优选的,所述方法还包括:
对所述语义分割结果进行开运算,获得所述开运算后的语义分割结果。
优选的,所述全局池化层包括并行的平均池化层和最大池化层;
所述通过所述全局池化层对所述1/32分辨率的语义特征图进行全局池化,获得全局池化特征图,包括:
通过所述平均池化层对所述1/32分辨率的语义特征图进行全局平均池化,获得平均池化特征图;
通过所述最大池化层对所述1/32分辨率的语义特征图进行全局最大池化,获得最大池化特征图;
将所述平均池化特征图和所述最大池化特征图相加,获得全局池化特征图。
本申请第二方面提供一种基于BiSeNet V2的路面图像语义分割装置,所述装置包括:
语义特征获取模块,用于通过改造后的BiSeNet V2的语义分支获得路面图像的1/32分辨率的语义特征图,其中以BiSeNet V2为基础,在BiSeNet V2的语义分支的每个下采样层增加卷积层、批量归一化层、激活层,删除BiSeNet V2的细节分支,增加全局池化层,获得所述改造后的BiSeNet V2;
池化特征获取模块,用于通过所述全局池化层对所述语义特征获取模块获得的1/32分辨率的语义特征图进行全局池化,获得全局池化特征图;
融合特征获取模块,用于通过所述改造后的BiSeNet V2的特征融合模块融合所述池化特征获取模块获得的全局池化特征图和所述语义特征获取模块获得的1/32分辨率的语义特征图,获得融合后的特征图;
分割结果获取模块,用于通过所述改造后的BiSeNet V2依据所述融合特征获取模块获得的融合后的特征图,获得所述路面图像的路面元素的语义分割结果。
优选的,所述装置还包括:
闭运算模块,用于对所述分割结果获取模块获得的语义分割结果进行闭运算,获得所述闭运算后的语义分割结果。
优选的,所述装置还包括:
开运算模块,用于对所述分割结果获取模块获得的语义分割结果进行开运算,获得所述开运算后的语义分割结果。
优选的,所述全局池化层包括并行的平均池化层和最大池化层;
所述池化特征获取模块包括:
平均池化特征获取子模块,用于通过所述平均池化层对所述语义特征获取模块获得的1/32分辨率的语义特征图进行全局平均池化,获得平均池化特征图;
最大池化特征获取子模块,用于通过所述最大池化层对所述语义特征获取模块获得的1/32分辨率的语义特征图进行全局最大池化,获得最大池化特征图;
池化特征相加子模块,用于将所述平均池化特征获取子模块获得的平均池化特征图和所述最大池化特征获取子模块获得的最大池化特征图相加,获得全局池化特征图。
本申请第三方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
本申请提供的技术方案可以包括以下有益效果:
本申请的技术方案,删除现有BiSeNet V2的细节分支,保留感受野较大的现有BiSeNet V2的语义分支,并加深语义分支的网络深度,增加全局池化层,获得改造后的BiSeNet V2,改造后的BiSeNet V2进一步提升语义分支的感受野,通过与语义分支并行的全局池化层对语义分支的特征图进行池化,使得改造后的BiSeNet V2的感受野覆盖整张路面图像,改造后的BiSeNet V2提高了对路面图像中路面特征的提取能力,能够准确地获得路面图像中路面元素的语义分割结果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例示出的基于BiSeNet V2的路面图像语义分割方法的流程示意图;
图2是本申请实施例示出的基于BiSeNet V2的路面图像语义分割方法的另一流程示意图;
图3是本申请实施例示出的基于BiSeNet V2的路面图像语义分割装置的结构示意图;
图4是本申请实施例示出的基于BiSeNet V2的路面图像语义分割装置的另一结构示意图;
图5是本申请实施例示出的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
本申请实施例提供一种基于BiSeNet V2的路面图像语义分割方法,能够准确地获得路面图像中路面元素的语义分割结果。
实施例一:
以下结合附图详细描述本申请实施例的技术方案。
图1是本申请实施例示出的基于BiSeNet V2的路面图像语义分割方法的流程示意图。
参见图1,一种基于BiSeNet V2的路面图像语义分割方法,包括:
在步骤S101中,通过改造后的BiSeNet V2的语义分支获得路面图像的1/32分辨率的语义特征图,其中以BiSeNet V2为基础,在BiSeNet V2的语义分支的每个下采样层增加卷积层、批量归一化层、激活层,删除BiSeNet V2的细节分支,增加全局池化层,获得改造后的BiSeNet V2。
在一种实施方式中,现有BiSeNet V2的语义分支(Semantic Branch)可以依据输入的路面图像,分别获得路面图像分辨率1/2、1/4、1/8、1/16、1/32的语义特征图。依据现有BiSeNet V2的语义分支获得语义特征图的大小,将现有BiSeNet V2的语义分支分为获得分辨率1/2的语义特征图的2倍下采样层、获得分辨率1/4的语义特征图的4倍下采样层、获得分辨率1/8的语义特征图的8倍下采样层、获得分辨率1/16的语义特征图的16倍下采样层、获得分辨率1/32的语义特征图的32倍下采样层;分别在2倍下采样层、4倍下采样层、8倍下采样层、16倍下采样层、32倍下采样层增加卷积层(Conv)、批量归一化层、激活层,即加深现有BiSeNet V2的语义分支的各下采样层的深度,删除现有BiSeNet V2的细节分支,增加与语义分支并行的全局池化层,代替现有BiSeNet V2的细节分支,获得改造后的BiSeNet V2,改造后的BiSeNet V2的批量归一化层为BN(Batch Normalization,批量归一化)层,激活层为包括Relu(Rectified Linear Units,校正线性单位)激活函数的Relu层。
在一种实施方式中,通过改造后的BiSeNet V2的语义分支的增加卷积层、批量归一化层、激活层的2倍下采样层,依据路面图像,获得改造后的BiSeNet V2的语义分支的分辨率1/2的语义特征图,即对现有BiSeNet V2的语义分支获得的分辨率1/2的语义特征图再采用一个卷积进行一次卷积操作,卷积操作后进行一次BN操作和一次ReLU函数激活,获得改造后的BiSeNet V2的语义分支的分辨率1/2的语义特征图;通过改造后的BiSeNet V2的语义分支的增加卷积层、批量归一化层、激活层的4倍下采样层,依据获得的改造后的BiSeNet V2的语义分支的分辨率1/2的语义特征图,获得改造后的BiSeNet V2的语义分支的分辨率1/4的语义特征图,即对现有BiSeNet V2的语义分支获得的分辨率1/4的语义特征图再采用一个卷积进行一次卷积操作,卷积操作后进行一次BN操作和一次ReLU函数激活,获得改造后的BiSeNet V2的语义分支的分辨率1/4的语义特征图;通过改造后的BiSeNetV2的语义分支的增加卷积层、批量归一化层、激活层的8倍下采样层,依据获得的改造后的BiSeNet V2的语义分支的分辨率1/4的语义特征图,获得改造后的BiSeNet V2的语义分支的分辨率1/8的语义特征图,即对现有BiSeNet V2的语义分支获得的分辨率1/8的语义特征图再采用一个卷积进行一次卷积操作,卷积操作后进行一次BN操作和一次ReLU函数激活,获得改造后的BiSeNet V2的语义分支的分辨率1/8的语义特征图;通过改造后的BiSeNetV2的语义分支的增加卷积层、批量归一化层、激活层的16倍下采样层,依据获得的改造后的BiSeNet V2的语义分支的分辨率1/8的语义特征图,获得改造后的BiSeNet V2的语义分支的分辨率1/16的语义特征图,即对现有BiSeNet V2的语义分支获得的分辨率1/16的语义特征图再采用一个卷积进行一次卷积操作,卷积操作后进行一次BN操作和一次ReLU函数激活,获得改造后的BiSeNet V2的语义分支的分辨率1/16的语义特征图;通过改造后的BiSeNet V2的语义分支的增加卷积层、批量归一化层、激活层的32倍下采样层,依据获得的改造后的BiSeNet V2的语义分支的分辨率1/16的语义特征图,获得改造后的BiSeNet V2的语义分支的分辨率1/32的语义特征图,即对现有BiSeNet V2的语义分支获得的分辨率1/32的语义特征图再采用一个卷积进行一次卷积操作,卷积操作后进行一次BN操作和一次ReLU函数激活,获得改造后的BiSeNet V2的语义分支的分辨率1/32的语义特征图。
在一种实施方式中,在2倍下采样层、4倍下采样层、8倍下采样层、16倍下采样层、32倍下采样层增加的卷积层为一个3×3卷积。
在步骤S102中,通过全局池化层对1/32分辨率的语义特征图进行全局池化,获得全局池化特征图。
在一种实施方式中,通过全局池化层对改造后的BiSeNet V2的语义分支的分辨率1/32的语义特征图进行池化,获得路面图像的全局池化特征图。
在步骤S103中,通过改造后的BiSeNet V2的特征融合模块融合全局池化特征图和1/32分辨率的语义特征图,获得融合后的特征图。
在一种实施方式中,将路面图像的全局池化特征图和1/32分辨率的语义特征图输入改造后的BiSeNet V2的特征融合模块;通过特征融合模块对全局池化特征图和1/32分辨率的语义特征图按元素相乘,获得融合后的特征图。
在步骤S104中,通过改造后的BiSeNet V2依据融合后的特征图,获得路面图像的路面元素的语义分割结果。
在一种实施方式中,改造后的BiSeNet V2利用上采样操作,将融合后的特征图的大小恢复到输入改造后的BiSeNet V2的路面图像的分辨率大小;利用Softmax分类层对恢复大小的融合后的特征图的每个像素都进行分类预测,获得改造后的BiSeNet V2输出的路面图像中路面元素的语义分割结果。
本申请实施例示出的基于BiSeNet V2的路面图像语义分割方法,删除现有BiSeNet V2的细节分支,保留感受野较大的现有BiSeNet V2的语义分支,并加深语义分支的网络深度,增加全局池化层,获得改造后的BiSeNet V2,改造后的BiSeNet V2进一步提升语义分支的感受野,通过与语义分支并行的全局池化层对语义分支的特征图进行池化,使得改造后的BiSeNet V2的感受野覆盖整张路面图像,改造后的BiSeNet V2提高了对路面图像中路面特征的提取能力,能够准确地获得路面图像中路面元素的语义分割结果。
实施例二:
图2是本申请实施例示出的基于BiSeNet V2的路面图像语义分割方法的另一流程示意图。图2相对于图1更详细描述了本申请的方案。
参见图2,一种基于BiSeNet V2的路面图像语义分割方法,包括:
在步骤S201中,通过改造后的BiSeNet V2的语义分支获得路面图像的1/32分辨率的语义特征图,其中以BiSeNet V2为基础,在BiSeNet V2的语义分支的每个下采样层增加卷积层、批量归一化层、激活层,删除BiSeNet V2的细节分支,增加全局池化层,获得改造后的BiSeNet V2。
该步骤可以参见步骤S101的描述,此处不再赘述。
在步骤S202中,通过平均池化层对1/32分辨率的语义特征图进行全局平均池化,获得平均池化特征图;通过最大池化层对1/32分辨率的语义特征图进行全局最大池化,获得最大池化特征图。
在一种实施方式中,全局池化层包括并行的平均池化层和最大池化层。通过平均池化层对改造后的BiSeNet V2的语义分支的分辨率1/32的语义特征图进行全局平均池化,获得路面图像的平均池化特征图。对分辨率1/32的语义特征图进行全局平均池化,能够保留路面图像中更多的背景信息,使得提取路面元素特征更加平滑。通过最大池化层对改造后的BiSeNet V2的语义分支的分辨率1/32的语义特征图进行全局最大池化,获得路面图像的最大池化特征图。对分辨率1/32的语义特征图进行全局最大池化,能够提取到路面元素特征的纹理,提取到路面元素特征边缘的最重要特征。
在步骤S203中,将平均池化特征图和最大池化特征图相加,获得全局池化特征图。
在一种实施方式中,通过全局池化层将路面图像的平均池化特征图和最大池化特征图相加,获得路面图像的全局池化特征图。
在步骤S204中,通过改造后的BiSeNet V2的特征融合模块融合全局池化特征图和1/32分辨率的语义特征图,获得融合后的特征图。
该步骤可以参见步骤S103的描述,此处不再赘述。
在步骤S205中,通过改造后的BiSeNet V2依据融合后的特征图,获得路面图像的路面元素的语义分割结果。
该步骤可以参见步骤S104的描述,此处不再赘述。
在步骤S206中,对语义分割结果进行闭运算,获得闭运算后的语义分割结果。
在一种实施方式中,通过闭运算对语义分割结果中路面特征的空洞部分进行填充,弥合路面特征的裂缝,获得闭运算后的语义分割结果。
在步骤S207中,对语义分割结果进行开运算,获得开运算后的语义分割结果。
在一种实施方式中,计算闭运算后的语义分割结果中各个连通像素的面积,设定开运算的阈值,去掉面积小于阈值的连通像素集和面积小于阈值的空洞,通过开运算,去除语义分割结果的噪点。根据闭运算和开运算后的语义分割结果,可以获得路面图像的路面区域。
本申请实施例示出的基于BiSeNet V2的路面图像语义分割方法,删除现有BiSeNet V2的细节分支,保留感受野较大的现有BiSeNet V2的语义分支,并加深语义分支的网络深度,增加全局池化层,获得改造后的BiSeNet V2,改造后的BiSeNet V2进一步提升语义分支的感受野,通过与语义分支并行的全局池化层对语义分支的特征图进行池化,使得改造后的BiSeNet V2的感受野覆盖整张路面图像,改造后的BiSeNet V2提高了对路面图像中路面特征的提取能力,能够准确地获得路面图像中路面元素的语义分割结果。
进一步的,本申请实施例示出的基于BiSeNet V2的路面图像语义分割方法,改造后的BiSeNet V2通过包括并行的平均池化层和最大池化层的全局池化层代替现有BiSeNetV2的细节分支,改造后的BiSeNet V2减少了网络参数,减少了计算量,改造后的BiSeNet V2提高了对路面图像中路面元素的特征提取速度,能够快速地、准确地获得路面图像中路面元素的语义分割结果,满足自动驾驶快速识别路面要素的需要。
进一步的,本申请实施例示出的基于BiSeNet V2的路面图像语义分割方法,将全局池化特征图与1/32分辨率的语义特征图融合,获得融合后的特征图,融合后的特征图中路面元素特征与背景特征更加清晰,路面元素特征与背景特征的边缘更加明显,依据融合后的特征图,能够准确地获得路面图像中路面元素的语义分割结果。
进一步的,本申请实施例示出的基于BiSeNet V2的路面图像语义分割方法,通过对语义分割结果进行闭运算,能够对语义分割结果中路面特征的孔洞进行填补,对闭运算后的语义分割结果进行开运算,能够有效去除语义分割结果的噪点,能够提高对路面图像中路面语义分割的效果。
实施例三:
与前述应用功能实现方法实施例相对应,本申请还提供了一种基于BiSeNet V2的路面图像语义分割装置、电子设备及相应的实施例。
图3是本申请实施例示出的基于BiSeNet V2的路面图像语义分割装置的结构示意图。
参见图3,一种基于BiSeNet V2的路面图像语义分割装置,包括语义特征获取模块301、池化特征获取模块302、融合特征获取模块303、分割结果获取模块304。
语义特征获取模块301,用于通过改造后的BiSeNet V2的语义分支获得路面图像的1/32分辨率的语义特征图,其中以BiSeNet V2为基础,在BiSeNet V2的语义分支的每个下采样层增加卷积层、批量归一化层、激活层,删除BiSeNet V2的细节分支,增加全局池化层,获得改造后的BiSeNet V2。
池化特征获取模块302,用于通过全局池化层对语义特征获取模块301获得的1/32分辨率的语义特征图进行全局池化,获得全局池化特征图。
融合特征获取模块303,用于通过改造后的BiSeNet V2的特征融合模块融合池化特征获取模块302获得的全局池化特征图和语义特征获取模块301获得的1/32分辨率的语义特征图,获得融合后的特征图。
分割结果获取模块304,用于通过改造后的BiSeNet V2依据融合特征获取模块303获得的融合后的特征图,获得路面图像的路面元素的语义分割结果。
本申请实施例示出的技术方案,删除现有BiSeNet V2的细节分支,保留感受野较大的现有BiSeNet V2的语义分支,并加深语义分支的网络深度,增加全局池化层,获得改造后的BiSeNet V2,改造后的BiSeNet V2进一步提升语义分支的感受野,通过与语义分支并行的全局池化层对语义分支的特征图进行池化,使得改造后的BiSeNet V2的感受野覆盖整张路面图像,改造后的BiSeNet V2提高了对路面图像中路面特征的提取能力,能够准确地获得路面图像中路面元素的语义分割结果。
实施例四:
图4是本申请实施例示出的基于BiSeNet V2的路面图像语义分割装置的另一结构示意图。
参见图4,一种基于BiSeNet V2的路面图像语义分割装置,包括语义特征获取模块301、池化特征获取模块302、融合特征获取模块303、分割结果获取模块304、闭运算模块401、开运算模块402。
语义特征获取模块301、融合特征获取模块303、分割结果获取模块304的功能可以参见图3所示。
池化特征获取模块302包括平均池化特征获取子模块3021、最大池化特征获取子模块3022、池化特征相加子模块3023
平均池化特征获取子模块3021,用于通过平均池化层对语义特征获取模块301获得的1/32分辨率的语义特征图进行全局平均池化,获得平均池化特征图。
最大池化特征获取子模块3022,用于通过最大池化层对语义特征获取模块301获得的1/32分辨率的语义特征图进行全局最大池化,获得最大池化特征图。
池化特征相加子模块3023,用于将平均池化特征获取子模块3021获得的平均池化特征图和最大池化特征获取子模块3022获得的最大池化特征图相加,获得全局池化特征图。
闭运算模块401,用于对分割结果获取模块304获得的语义分割结果进行闭运算,获得闭运算后的语义分割结果。
开运算模块402,用于对分割结果获取模块304获得的语义分割结果进行开运算,获得开运算后的语义分割结果。
在一种实施方式中,开运算模块402,还用于对闭运算模块401获得的闭运算后的语义分割结果进行开运算,获得开运算后的语义分割结果。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
实施例五:
图5是本申请实施例示出的电子设备的结构示意图。
参见图5,电子设备500包括存储器510和处理器520。
处理器520可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器510可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器520或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器510可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器510可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器510上存储有可执行代码,当可执行代码被处理器520处理时,可以使处理器520执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。
Claims (10)
1.一种基于BiSeNet V2的路面图像语义分割方法,其特征在于,包括:
通过改造后的BiSeNet V2的语义分支获得路面图像的1/32分辨率的语义特征图,其中以BiSeNet V2为基础,在BiSeNet V2的语义分支的每个下采样层增加卷积层、批量归一化层、激活层,删除BiSeNet V2的细节分支,增加全局池化层,获得所述改造后的BiSeNet V2;
通过所述全局池化层对所述1/32分辨率的语义特征图进行全局池化,获得全局池化特征图;
通过所述改造后的BiSeNet V2的特征融合模块融合所述全局池化特征图和所述1/32分辨率的语义特征图,获得融合后的特征图;
通过所述改造后的BiSeNet V2依据所述融合后的特征图,获得所述路面图像的路面元素的语义分割结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述语义分割结果进行闭运算,获得所述闭运算后的语义分割结果。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述语义分割结果进行开运算,获得所述开运算后的语义分割结果。
4.根据权利要求1所述的方法,其特征在于,所述全局池化层包括并行的平均池化层和最大池化层;
所述通过所述全局池化层对所述1/32分辨率的语义特征图进行全局池化,获得全局池化特征图,包括:
通过所述平均池化层对所述1/32分辨率的语义特征图进行全局平均池化,获得平均池化特征图;
通过所述最大池化层对所述1/32分辨率的语义特征图进行全局最大池化,获得最大池化特征图;
将所述平均池化特征图和所述最大池化特征图相加,获得全局池化特征图。
5.一种基于BiSeNet V2的路面图像语义分割装置,其特征在于,包括:
语义特征获取模块,用于通过改造后的BiSeNet V2的语义分支获得路面图像的1/32分辨率的语义特征图,其中以BiSeNet V2为基础,在BiSeNet V2的语义分支的每个下采样层增加卷积层、批量归一化层、激活层,删除BiSeNet V2的细节分支,增加全局池化层,获得所述改造后的BiSeNet V2;
池化特征获取模块,用于通过所述全局池化层对所述语义特征获取模块获得的1/32分辨率的语义特征图进行全局池化,获得全局池化特征图;
融合特征获取模块,用于通过所述改造后的BiSeNet V2的特征融合模块融合所述池化特征获取模块获得的全局池化特征图和所述语义特征获取模块获得的1/32分辨率的语义特征图,获得融合后的特征图;
分割结果获取模块,用于通过所述改造后的BiSeNet V2依据所述融合特征获取模块获得的融合后的特征图,获得所述路面图像的路面元素的语义分割结果。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
闭运算模块,用于对所述分割结果获取模块获得的语义分割结果进行闭运算,获得所述闭运算后的语义分割结果。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
开运算模块,用于对所述分割结果获取模块获得的语义分割结果进行开运算,获得所述开运算后的语义分割结果。
8.根据权利要求5所述的装置,其特征在于,所述全局池化层包括并行的平均池化层和最大池化层;
所述池化特征获取模块包括:
平均池化特征获取子模块,用于通过所述平均池化层对所述语义特征获取模块获得的1/32分辨率的语义特征图进行全局平均池化,获得平均池化特征图;
最大池化特征获取子模块,用于通过所述最大池化层对所述语义特征获取模块获得的1/32分辨率的语义特征图进行全局最大池化,获得最大池化特征图;
池化特征相加子模块,用于将所述平均池化特征获取子模块获得的平均池化特征图和所述最大池化特征获取子模块获得的最大池化特征图相加,获得全局池化特征图。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于:其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210195769.8A CN114565766B (zh) | 2022-03-01 | 2022-03-01 | 基于BiSeNet V2的路面图像语义分割方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210195769.8A CN114565766B (zh) | 2022-03-01 | 2022-03-01 | 基于BiSeNet V2的路面图像语义分割方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114565766A true CN114565766A (zh) | 2022-05-31 |
CN114565766B CN114565766B (zh) | 2024-06-18 |
Family
ID=81715409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210195769.8A Active CN114565766B (zh) | 2022-03-01 | 2022-03-01 | 基于BiSeNet V2的路面图像语义分割方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114565766B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109101907A (zh) * | 2018-07-28 | 2018-12-28 | 华中科技大学 | 一种基于双边分割网络的车载图像语义分割系统 |
CN110796147A (zh) * | 2019-10-21 | 2020-02-14 | Oppo广东移动通信有限公司 | 图像分割方法及相关产品 |
CN111292330A (zh) * | 2020-02-07 | 2020-06-16 | 北京工业大学 | 基于编解码器的图像语义分割方法及装置 |
CN111325751A (zh) * | 2020-03-18 | 2020-06-23 | 重庆理工大学 | 基于注意力卷积神经网络的ct图像分割系统 |
CN111666948A (zh) * | 2020-05-27 | 2020-09-15 | 厦门大学 | 一种基于多路聚合的实时高性能语义分割方法和装置 |
US20200334819A1 (en) * | 2018-09-30 | 2020-10-22 | Boe Technology Group Co., Ltd. | Image segmentation apparatus, method and relevant computing device |
US20200372648A1 (en) * | 2018-05-17 | 2020-11-26 | Tencent Technology (Shenzhen) Company Limited | Image processing method and device, computer apparatus, and storage medium |
CN112163449A (zh) * | 2020-08-21 | 2021-01-01 | 同济大学 | 一种轻量化的多分支特征跨层融合图像语义分割方法 |
CN113011336A (zh) * | 2021-03-19 | 2021-06-22 | 厦门大学 | 一种基于深度多分支聚合的实时街景图像语义分割方法 |
CN113989773A (zh) * | 2021-10-27 | 2022-01-28 | 智道网联科技(北京)有限公司 | 用于自动驾驶的基于BiSeNet的交通标志识别方法及装置 |
-
2022
- 2022-03-01 CN CN202210195769.8A patent/CN114565766B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200372648A1 (en) * | 2018-05-17 | 2020-11-26 | Tencent Technology (Shenzhen) Company Limited | Image processing method and device, computer apparatus, and storage medium |
CN109101907A (zh) * | 2018-07-28 | 2018-12-28 | 华中科技大学 | 一种基于双边分割网络的车载图像语义分割系统 |
US20200334819A1 (en) * | 2018-09-30 | 2020-10-22 | Boe Technology Group Co., Ltd. | Image segmentation apparatus, method and relevant computing device |
CN110796147A (zh) * | 2019-10-21 | 2020-02-14 | Oppo广东移动通信有限公司 | 图像分割方法及相关产品 |
CN111292330A (zh) * | 2020-02-07 | 2020-06-16 | 北京工业大学 | 基于编解码器的图像语义分割方法及装置 |
CN111325751A (zh) * | 2020-03-18 | 2020-06-23 | 重庆理工大学 | 基于注意力卷积神经网络的ct图像分割系统 |
CN111666948A (zh) * | 2020-05-27 | 2020-09-15 | 厦门大学 | 一种基于多路聚合的实时高性能语义分割方法和装置 |
CN112163449A (zh) * | 2020-08-21 | 2021-01-01 | 同济大学 | 一种轻量化的多分支特征跨层融合图像语义分割方法 |
CN113011336A (zh) * | 2021-03-19 | 2021-06-22 | 厦门大学 | 一种基于深度多分支聚合的实时街景图像语义分割方法 |
CN113989773A (zh) * | 2021-10-27 | 2022-01-28 | 智道网联科技(北京)有限公司 | 用于自动驾驶的基于BiSeNet的交通标志识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
MINGYUAN FAN 等: "Mingyuan Fan", ARXIV:2104.13188V1, 27 April 2021 (2021-04-27) * |
任天赐;黄向生;丁伟利;安重阳;翟鹏博;: "全局双边网络的语义分割算法", 计算机科学, no. 1, 15 June 2020 (2020-06-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN114565766B (zh) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107341517B (zh) | 基于深度学习层级间特征融合的多尺度小物体检测方法 | |
CN108334892B (zh) | 一种基于卷积神经网络的车型识别方法、装置及设备 | |
CN109885718B (zh) | 一种基于深度车贴检测的嫌疑车辆检索方法 | |
CN113989773B (zh) | 用于自动驾驶的基于BiSeNet的交通标志识别方法及装置 | |
CN115272330B (zh) | 基于电池表面图像的缺陷检测方法、系统及相关设备 | |
CN113269164B (zh) | 车道线检测方法及其检测装置 | |
CN108765449B (zh) | 一种基于卷积神经网络的图像背景分割和识别方法 | |
CN111062347B (zh) | 一种自动驾驶中交通要素分割方法、电子设备及存储介质 | |
CN111401421A (zh) | 基于深度学习的图像类别判定方法、电子设备以及介质 | |
CN115376089A (zh) | 一种基于深度学习的车道线检测方法 | |
CN112052907A (zh) | 基于图像边缘信息的目标检测方法、装置及存储介质 | |
CN114440903A (zh) | 一种高精地图构建方法、装置、存储介质及电子设备 | |
CN114565766A (zh) | 基于BiSeNet V2的路面图像语义分割方法及装置 | |
CN113792583A (zh) | 基于可行驶区域的障碍物检测方法、系统和智能终端 | |
CN110991414B (zh) | 一种交通要素高精度分割方法、电子设备及存储介质 | |
CN116843983A (zh) | 路面病害识别方法、模型训练方法、电子设备及介质 | |
CN110555344B (zh) | 车道线识别方法、装置、电子设备、存储介质 | |
CN116453086A (zh) | 识别交通标志的方法、装置和电子设备 | |
CN112019925B (zh) | 视频水印识别处理方法及装置 | |
CN113989759A (zh) | 用于自动驾驶的基于BiSeNet的车道线识别方法及装置 | |
CN114022756A (zh) | 排水盖周边垃圾的视觉识别方法、电子设备及存储介质 | |
CN114581876A (zh) | 构建复杂场景下车道检测模型的方法和检测车道线方法 | |
CN111899264A (zh) | 一种目标图像分割方法、设备及介质 | |
CN114548275A (zh) | 基于BiSeNetV2的路面全要素图像语义分割方法及装置 | |
CN114782907A (zh) | 无人车行驶环境识别方法、装置、设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |