CN111242132A - 室外道路场景语义分割方法、装置、电子设备及存储介质 - Google Patents

室外道路场景语义分割方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111242132A
CN111242132A CN202010013648.8A CN202010013648A CN111242132A CN 111242132 A CN111242132 A CN 111242132A CN 202010013648 A CN202010013648 A CN 202010013648A CN 111242132 A CN111242132 A CN 111242132A
Authority
CN
China
Prior art keywords
feature points
network architecture
layer
image
semantic segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010013648.8A
Other languages
English (en)
Inventor
赖志林
俞锦涛
李睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Saite Intelligent Technology Co Ltd
Original Assignee
Guangzhou Saite Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Saite Intelligent Technology Co Ltd filed Critical Guangzhou Saite Intelligent Technology Co Ltd
Priority to CN202010013648.8A priority Critical patent/CN111242132A/zh
Publication of CN111242132A publication Critical patent/CN111242132A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了室外道路场景语义分割方法,包括如下步骤:采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;创建卷积网络架构以及反卷积网络架构;将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。本发明通过不同层多维度融合特征进行分割,很好地解决道路分割时由于场景,光照,天气等因素引起的误分割、空洞等问题;最后通过对分割图作后端优化,使得边缘分割精确。

Description

室外道路场景语义分割方法、装置、电子设备及存储介质
技术领域
本发明涉及图像处理技术,尤其涉及室外道路场景语义分割方法、装置、电子设备及存储介质。
背景技术
目前实时语义分割网络,一般采用轻量级的分类骨干网络对RGB提取特征,之后再采用FCN,UNet等网络结构进行语义分割。室外主要分割:路面,人,摩托车,自行车,小车,货车,巴士,房子,天空,植被等。实时语义分割网络普遍存在着以下问题:由于不同场景(地面纹理各种各样),光照差异,天气等因素引起很多误分割、空洞等问题。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供室外道路场景语义分割方法,其能解决现有技术的语义分割网络存在误分割、空洞等问题。
本发明的目的之二在于提供室外道路场景语义分割装置,其能解决现有技术的语义分割网络存在误分割、空洞等问题。
本发明的目的之三在于提供电子设备,其能解决现有技术的语义分割网络存在误分割、空洞等问题。
本发明的目的之四在于提供存储介质,其能解决现有技术的语义分割网络存在误分割、空洞等问题。
本发明的目的之一采用以下技术方案实现:
室外道路场景语义分割方法,包括如下步骤:
采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;
创建卷积网络架构以及反卷积网络架构;
将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;
反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
优选的,所述优化处理的具体方式为在反卷积网络架构将每一层的融合特征点反向运算后,输出至CRF随机场网络层对图像边缘进行精细分割,之后输出语义分割图像。
优选的,所述卷积网络架构以及反卷积网络架构均为五层。
优选的,将当前的RGB图像以及深度图像输入至卷积网络架构之前将所述RGB图像以及深度图像进行归一化处理。
本发明的目的之二采用以下技术方案实现:
室外道路场景语义分割装置,包括,
采集单元:配置于采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;
创建单元:配置于创建卷积网络架构以及反卷积网络架构;
运算单元:配置于将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;
输出单元:配置于反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
优选的,所述优化处理的具体方式为在反卷积网络架构将每一层的融合特征点反向运算后,输出至CRF随机场网络层对图像边缘进行精细分割,之后输出语义分割图像。
本发明的目的之三采用以下技术方案实现:
一种电子设备,其上设有存储器、处理器以及存储在存储器中并可被处理器执行的计算机可读程序,所述计算机可读程序被处理器执行时,实现如下步骤:
采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;
创建卷积网络架构以及反卷积网络架构;
将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;
反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
优选的,所述优化处理的具体方式为在反卷积网络架构将每一层的融合特征点反向运算后,输出至CRF随机场网络层对图像边缘进行精细分割,之后输出语义分割图像。
本发明的目的之四采用以下技术方案实现:
一种存储介质,其上存储有可被处理器执行的计算机可读程序,所述计算机可读程序被处理器执行时,实现如下步骤:
采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;
创建卷积网络架构以及反卷积网络架构;
将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;
反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
优选的,所述优化处理的具体方式为在反卷积网络架构将每一层的融合特征点反向运算后,输出至CRF随机场网络层对图像边缘进行精细分割,之后输出语义分割图像。
相比现有技术,本发明的有益效果在于:
本发明通过不同层多维度融合特征进行分割,很好地解决道路分割时由于场景,光照,天气等因素引起的误分割、空洞等问题;最后通过对分割图作后端优化,使得边缘分割精确。
附图说明
图1为本发明的室外道路场景语义分割方法的流程图;
图2为本发明的网络整体框架图;
图3为本发明的卷积网络架构和反卷积网络架构图;
图4为本发明的卷积网络结构的层结构图;
图5为本发明的反卷积网络结构的层结构图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述:
如图1所示,本发明提供室外道路场景语义分割方法,包括如下步骤:
S1:采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像。
本步骤中,通过在本地Nvidia Tx2平台上,通过RGBD摄像头获取场景的RGB图像以及深度图像;算法在本地AI芯片上直接运算,最大化减小系统延时。
对于RGB图像和深度图像分别先进行归一化后,分别输入SXNet骨干网络进行编码。
本发明没采用采用分类/检测模型常用的骨干网络,如VGG16,Mobilenet,IncpetionNet,ResNet58等,而是采用针对语义分割场景定制优化的轻量级SXNet网络,最大特点是先通过一级的InceptionLayer_1层再级联多层轻量化的卷积网络架构;在底层尽量提取各维度的特征,有利于提高边缘分割的精度;多级卷积网络架构增加网络感受,有利于减少物体内部分割的误差,同时对网络进行轻量化,使得网络能在AI芯片上可以实时分割。
S2:创建卷积网络架构以及反卷积网络架构;
S3:将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;
在本步骤之前,将所述RGB图像以及深度图像进行归一化处理。之后输入值SXNet网络进行编码以提取特征点。编码阶段也就是输出语义分割图像的阶段。
S4:反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
在本发明中,所述卷积网络架构以及反卷积网络架构均为五层。反卷积网络架构将每一层的融合特征点反向运算后再进行优化并输出语义分割图像。
具体的,下面结合图2至图5对本发明如何输出语义分割图像的过程进行说明。
将当前的RGB图像以及深度图像输入至5X5卷积网络架构提取第一层低层语义特征,其卷积的步长为2,把输出图像下采样,缩小一倍,通过归一化操作进行归一化处理,通过Relu激活函数对特征进行非线性映射,提升模型表达能力。以Conv0层输出作为InceptionLayer_1的输入,InceptionLayer_1的特点是:4个分支都通过Conv1x1对输入特征分别升维,InceptionLayer_1最左边分支1,通过Conv1x1对特征升维直接输出,最大的保存低层语义特征;InceptionLayer_1分支2在Conv1x1后接入conv3x3的卷积,但这里为了轻量化网络,把conv3x3改为conv3x1再进行conv1x3,再通过通过BatchNormalize归一化,通过Relu激活函数对特征进行非线性映射;InceptionLayer_1分支3在Conv1x1后接入conv5x5的卷积,把conv5x5改为conv5x1再进行conv1x5,再通过通过BatchNormalize归一化,通过Relu激活函数对特征进行非线性映射;InceptionLayer_1分支4在Conv1x1后接入conv7x7的卷积,把conv7x7改为conv7x1再进行conv1x7,再通过通过BatchNormalize归一化,通过Relu激活函数对特征进行非线性映射;InceptionLayer_1网络层通过不同尺度卷积提取丰富低层特征;最后InceptionLayer_1输出两个分支,1个分支给下层的ConvGroup_2继续进行提取特征,另1个分支把RGB图像与Depth图像(深度图像)在InceptionLayer_1的输出进行Concat运算融合,输出到Decoder阶段对应的DeConvGroup1。
以InceptionLayer_1层输出作为Conv Group_2的输入,其中”x4”表示ConvGroup_2后面重复4个Conv3x1/Conv1x3/BN/Relu结构,Conv Group的网络结构为先使用Conv1x1对数据进行升维,通过N次Conv3x1/Conv1x3/BN/Relu串连,后面再接一个Conv3x3,stride=2的卷积进行下采样,通过Conv1x1对数据进行降维,提取出有用的特征进行输出。最后Conv Group_2输出两个分支,1个分支给到下层的Conv Group_3继续进行提取特征,另1个分支把RGB图像与Depth图像在Conv Group_2的输出进行Concat运算融合,输出到Decoder阶段对应的DeConv Group2。以Conv Group_2层输出作为Conv Group_3的输入,其中”x8”表示Conv Group_3后面重复8个Conv3x1/Conv1x3/BN/Relu结构。最后Conv Group_3输出两个分支,1个分支给到下层的Conv Group_4继续进行提取特征,另1个分支把RGB图像与Depth图像在Conv Group_3的输出进行Concat运算融合,输出到Decoder阶段对应的DeConv Group3。以Conv Group_3层输出作为Conv Group_4的输入,其中”x16”表示ConvGroup_4后面重复16个Conv3x1/Conv1x3/BN/Relu结构。最后Conv Group_4输出两个分支,1个分支给到下层的Conv Group_5继续进行提取特征,另1个分支把RGB图像与Depth图像在Conv Group_4的输出进行Concat运算融合,输出到Decoder阶段对应的DeConv Group4。以Conv Group_4层输出作为Conv Group_5的输入,其中”x8”表示ConvGroup_5后面重复8个Conv3x1/Conv1x3/BN/Relu结构。最后ConvGroup_5输出把RGB图像与Depth图像在ConvGroup_5的输出进行Concat运算融合,输出到Decoder阶段对应的DeConv Group5。DeConvGroup5层以Conv Group_5融合特征为输入,通过DeConvGroup层输出到DeConv Group4;DeConv Group层结构为:先通过Conv1x1进行降维,再通过Conv3x3,stride=1/2进行上采样,重复3个Conv3x1/Conv1x3/BN/Relu结构,通过Conv1x1进行升维输出;DeConv Group4层以Conv Group_4融合特征和DeConv Group5为输入,通过DeConv Group层输出到DeConvGroup3;DeConv Group层结构为:先通过Conv1x1进行降维,再通过Conv3x3,stride=1/2进行上采样,重复3个Conv3x1/Conv1x3/BN/Relu结构,通过Conv1x1进行升维输出;DeConvGroup3层以Conv Group_3融合特征和DeConv Group4为输入,通过DeConv Group层输出到DeConvGroup2;DeConv Group2层以Conv Group_2融合特征和DeConvGroup3为输入,通过DeConv Group层输出到DeConv Group1;DeConv Group1层以Conv Group_1融合特征和DeConv Group2为输入,通过DeConv Group层输出到分割图像给到Local CRF条件随机场网络层;最后以Local CRF条件随机场作为分割图像的后端优化处理,输出最终的语义分割图像使得边缘分割更加精细。
本发明提供一种室外道路场景的语义分割装置,包括采集单元:配置于采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;创建单元:配置于创建卷积网络架构以及反卷积网络架构;运算单元:配置于将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;输出单元:配置于反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
本发明还提供一种电子设备,其上设有存储器、处理器以及存储在存储器中并可被处理器执行的计算机可读程序,所述计算机可读程序被处理器执行时,实现如下步骤:
采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;创建卷积网络架构以及反卷积网络架构;将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
本发明还提供一种存储介质,其上存储有可被处理器执行的计算机可读程序,所述计算机可读程序被处理器执行时,实现如下步骤:采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;创建卷积网络架构以及反卷积网络架构;将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
本发明加入了深度图像信息与RGB图像分别采用专为语义分割设计的特有轻量化骨干网络(SXNet)进行特征提取,通过不同层多维度融合特征进行分割,很好地解决道路分割时由于场景,光照,天气等因素引起的误分割、空洞等问题;最后通过Local CRF对分割图作后端优化,使得边缘分割精确。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

Claims (10)

1.室外道路场景语义分割方法,其特征在于,包括如下步骤:
采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;
创建卷积网络架构以及反卷积网络架构;
将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;
反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
2.如权利要求1所述的室外道路场景语义分割方法,其特征在于,所述优化处理的具体方式为在反卷积网络架构将每一层的融合特征点反向运算后,输出至CRF随机场网络层对图像边缘进行精细分割,之后输出语义分割图像。
3.如权利要求1所述的室外道路场景语义分割方法,其特征在于,所述卷积网络架构以及反卷积网络架构均为五层。
4.如权利要求1所述的室外道路场景语义分割方法,其特征在于,将当前的RGB图像以及深度图像输入至卷积网络架构之前将所述RGB图像以及深度图像进行归一化处理。
5.室外道路场景语义分割装置,其特征在于,包括,
采集单元:配置于采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;
创建单元:配置于创建卷积网络架构以及反卷积网络架构;
运算单元:配置于将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;
输出单元:配置于反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
6.如权利要求5所述的室外道路场景语义分割装置,其特征在于,所述优化处理的具体方式为在反卷积网络架构将每一层的融合特征点反向运算后,输出至CRF随机场网络层对图像边缘进行精细分割,之后输出语义分割图像。
7.一种电子设备,其上设有存储器、处理器以及存储在存储器中并可被处理器执行的计算机可读程序,其特征在于,所述计算机可读程序被处理器执行时,实现如下步骤:
采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;
创建卷积网络架构以及反卷积网络架构;
将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;
反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
8.如权利要求7所述的电子设备,其特征在于,所述优化处理的具体方式为在反卷积网络架构将每一层的融合特征点反向运算后,输出至CRF随机场网络层对图像边缘进行精细分割,之后输出语义分割图像。
9.一种存储介质,其上存储有可被处理器执行的计算机可读程序,其特征在于,所述计算机可读程序被处理器执行时,实现如下步骤:
采集RGB图像信息以及深度信息,以获取RGB图像以及深度图像;
创建卷积网络架构以及反卷积网络架构;
将当前的RGB图像以及深度图像输入至卷积网络架构中分别逐层提取特征点,并将每一层的RGB图像的特征点与深度图像的特征点融合后作为融合特征点,输出至反卷积网络架构中;
反卷积网络架构将每一层的融合特征点反向运算,并进行优化处理后输出语义分割图像。
10.如权利要求9所述的存储介质,其特征在于,所述优化处理的具体方式为在反卷积网络架构将每一层的融合特征点反向运算后,输出至CRF随机场网络层对图像边缘进行精细分割,之后输出语义分割图像。
CN202010013648.8A 2020-01-07 2020-01-07 室外道路场景语义分割方法、装置、电子设备及存储介质 Pending CN111242132A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010013648.8A CN111242132A (zh) 2020-01-07 2020-01-07 室外道路场景语义分割方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010013648.8A CN111242132A (zh) 2020-01-07 2020-01-07 室外道路场景语义分割方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN111242132A true CN111242132A (zh) 2020-06-05

Family

ID=70864874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010013648.8A Pending CN111242132A (zh) 2020-01-07 2020-01-07 室外道路场景语义分割方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111242132A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743410A (zh) * 2021-02-09 2021-12-03 京东数字科技控股股份有限公司 图像处理方法、装置和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910202A (zh) * 2017-02-15 2017-06-30 武汉喜恩卓科技有限责任公司 一种遥感图像地物的图像分割方法及系统
CN109271990A (zh) * 2018-09-03 2019-01-25 北京邮电大学 一种针对rgb-d图像的语义分割方法及装置
WO2019109524A1 (zh) * 2017-12-07 2019-06-13 平安科技(深圳)有限公司 入侵检测方法、应用服务器及计算机可读存储介质
CN110298361A (zh) * 2019-05-22 2019-10-01 浙江省北大信息技术高等研究院 一种rgb-d图像的语义分割方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910202A (zh) * 2017-02-15 2017-06-30 武汉喜恩卓科技有限责任公司 一种遥感图像地物的图像分割方法及系统
WO2019109524A1 (zh) * 2017-12-07 2019-06-13 平安科技(深圳)有限公司 入侵检测方法、应用服务器及计算机可读存储介质
CN109271990A (zh) * 2018-09-03 2019-01-25 北京邮电大学 一种针对rgb-d图像的语义分割方法及装置
CN110298361A (zh) * 2019-05-22 2019-10-01 浙江省北大信息技术高等研究院 一种rgb-d图像的语义分割方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743410A (zh) * 2021-02-09 2021-12-03 京东数字科技控股股份有限公司 图像处理方法、装置和计算机可读存储介质
CN113743410B (zh) * 2021-02-09 2024-04-09 京东科技控股股份有限公司 图像处理方法、装置和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109241972B (zh) 基于深度学习的图像语义分割方法
CN112541503B (zh) 基于上下文注意力机制和信息融合的实时语义分割方法
CN111462013B (zh) 一种基于结构化残差学习的单图去雨方法
CN113392960B (zh) 一种基于混合空洞卷积金字塔的目标检测网络及方法
CN111325751A (zh) 基于注意力卷积神经网络的ct图像分割系统
CN109635662B (zh) 一种基于卷积神经网络的道路场景语义分割方法
CN111340814A (zh) 一种基于多模态自适应卷积的rgb-d图像语义分割方法
CN110738200A (zh) 车道线3d点云地图构建方法、电子设备及存储介质
CN111666948A (zh) 一种基于多路聚合的实时高性能语义分割方法和装置
CN114387512B (zh) 基于多尺度特征融合与增强的遥感影像建筑物提取方法
CN116469100A (zh) 一种基于Transformer的双波段图像语义分割方法
CN113066089A (zh) 一种基于注意力引导机制的实时图像语义分割网络
CN113538402B (zh) 一种基于密度估计的人群计数方法及系统
CN115272677A (zh) 一种多尺度特征融合的语义分割方法、设备及存储介质
CN111242132A (zh) 室外道路场景语义分割方法、装置、电子设备及存储介质
CN115082928A (zh) 面向复杂场景的不对称双分支实时语义分割网络的方法
CN113888505A (zh) 一种基于语义分割的自然场景文本检测方法
CN116434039B (zh) 一种基于多尺度拆分注意力机制的目标检测方法
CN115995002B (zh) 一种网络构建方法及城市场景实时语义分割方法
CN109241872B (zh) 基于多级网络的图像语义快速分割方法
CN106203442A (zh) 一种基于深度学习的拷贝图像特征提取方法
CN113962332B (zh) 基于自优化融合反馈的显著目标识别方法
AU2021104479A4 (en) Text recognition method and system based on decoupled attention mechanism
CN115115577A (zh) 一种基于混合感知的多阶段器官分割方法及装置
CN112529064B (zh) 一种高效的实时语义分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 510000 201, building a, No.19 nanxiangsan Road, Huangpu District, Guangzhou City, Guangdong Province

Applicant after: GUANGZHOU SAITE INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: 510000 Room 303, 36 Kaitai Avenue, Huangpu District, Guangzhou City, Guangdong Province

Applicant before: GUANGZHOU SAITE INTELLIGENT TECHNOLOGY Co.,Ltd.