CN109325534B - 一种基于双向多尺度金字塔的语义分割方法 - Google Patents

一种基于双向多尺度金字塔的语义分割方法 Download PDF

Info

Publication number
CN109325534B
CN109325534B CN201811111230.XA CN201811111230A CN109325534B CN 109325534 B CN109325534 B CN 109325534B CN 201811111230 A CN201811111230 A CN 201811111230A CN 109325534 B CN109325534 B CN 109325534B
Authority
CN
China
Prior art keywords
features
pyramid
convolution
scale
fused
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201811111230.XA
Other languages
English (en)
Other versions
CN109325534A (zh
Inventor
庞彦伟
李亚钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201811111230.XA priority Critical patent/CN109325534B/zh
Publication of CN109325534A publication Critical patent/CN109325534A/zh
Application granted granted Critical
Publication of CN109325534B publication Critical patent/CN109325534B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明涉及一种基于双向多尺度金字塔的语义分割方法,包含:收集训练图像;设计基于双向多尺度金字塔的深度卷积神经网络结构以适用于语义分割;设计该网络的主干子网络,用以提取图像的基础特征;设计自下而上的多尺度金字塔模块;设计自上而下的多尺度金字塔模块;将自下而上的多尺度金字塔提取的特征与自上而下的多尺度金字塔提取的特征进行融合;基于融合的特征,卷积得到最终的分割结果。输入数据进行训练;将训练好的模型应用于实际任务中,通过训练好的模型,前向计算预测并输出分割的结果,并辅助实际场景中的决策。

Description

一种基于双向多尺度金字塔的语义分割方法
技术领域
本发明涉及计算机视觉领域中高性能的语义分割方法,特别是涉及采用深度学习方法进行语义分割的方法。
背景技术
作为人工智能中的关键任务,语义分割成为研究的热点。在语义分割任务中,由摄像机所拍摄的周围场景图片中的每一个像素将会通过算法被预测为一个特定的类别,如将该位置判断为车、或人、或道路等类别中的某一类。由于语义分割是对周围视觉场景的一种深度理解,其在场景解析、人机交互、视频监控以及辅助驾驶中有广泛的应用。随着自动驾驶的兴起,通过语义分割实现对场景中的各个物体以及周围环境的感知成为自动驾驶解决方案中的重要一环。因此,提升语义分割的精度至关重要。
以自动驾驶系统为例,如图1所示,在语义分割任务中,首先通过车载相机捕获现实场景中的视频/图像;进一步地,将相机捕获的视频/图像输入到语义分割算法中;通过语义分割算法的运行,输出分割结果图,代表每个像素点所对应的物体的类别;经过决策层,根据所得到的物体信息进行自动驾驶的决策,实现安全的自动驾驶。由于语义分割的结果直接影响到自动驾驶中的行驶决策,因此提升语义分割的精度,能够有效保证自动驾驶的安全性,进一步推动自动驾驶技术的发展。
现有的较优的语义分割算法是基于深度卷积神经网络的语义分割方法。其中,基于膨胀卷积的空间金字塔网络在语义分割中取得了显著效果。Chen等人提出的DeepLab方法[1]中,为保持图像分辨率,同时提升感受野,引入了膨胀卷积构建深度神经网络,以提升语义分割的精度。为进一步提取更加丰富的语义信息,Chen等人[2][3]进一步深化膨胀卷积,设计了一种空洞空间金字塔池化(以下称:空洞金字塔)的模块,通过在同一层中采用不同膨胀率的膨胀卷积,实现丰富语义信息的提取和融合,进一步提升了语义分割的性能,也成为当前一种主流的语义分割方法。Zhao等人[4]提出了一种金字塔场景解析网络,通过在网络最后层引入一种空间池化金字塔模块来增强对场景语义信息的提取。然而,这些方法中,空洞金字塔只用在网络的最后一层上,而忽略了多尺度信息的提取,也忽略了浅层特征对于信息融合和增强的作用。因此,上述的基于空洞金字塔的可以归结为单尺度金字塔方法,如图2所示。
针对单尺度金字塔方法无法有效融合多尺度的特征信息,无法有效提取多尺度的语义信息的缺点,本发明提出一种新型的双向多尺度金字塔语义分割方法。通过在传统的语义分割网络基础上,构建一种自上而下的金字塔和一种自下而上的金字塔,实现多尺度特征的融合,能够有效提取多尺度的语义信息,进而提升语义分割的性能。本发明所提出的语义分割方法可用于上述的相关领域中实现高精度的语义分割和场景理解。
参考文献:
[1]L.-C.Chen,G.Papandreou,I.Kokkinos,et al.Semantic ImageSegmentation with Deep Convolutional Nets and Fully Connected CRFs.arXiv:1412.7062,2014.
[2]L.-C.Chen,G.Papandreou,I.Kokkinos,K.Murphy,and A.L.Yuille.Deeplab:Semantic image segmentation with deep convolutional nets,atrous convolution,and fully connected crfs.TPAMI,2017.
[3]L.-C.Chen,G.Papandreou,F.Schroff,and H.Adam.Rethinking atrousconvolution for semantic image segmentation.arXiv:1706.05587,2017.
[4]H.Zhao,J.Shi,X.Qi,X.Wang,and J.Jia.Pyramid scene parsingnetwork.arXiv:1612.01105,2016.
发明内容
本发明的目的是克服现有的基于深度卷积神经网络的语义分割算法精度较低的问题,提出了一种基于双向多尺度金字塔的语义分割方法,以有效实现多尺度的特征融合和语义信息的提取,能够有效提升语义分割的精度,进一步促进语义分割的实际应用。技术方案如下:
一种基于双向多尺度金字塔的语义分割方法,包含下列步骤:
(1)收集训练图像;确定方法应用场景,收集该场景下的相关图像;对收集的图像进行标注,标注每个像素点的类别,并以其作为训练图像的标签;将训练图像划分为训练集和验证集;训练集用于训练不同的模型,验证集用于选择最佳的训练模型;
(1)设计基于双向多尺度金字塔的深度卷积神经网络结构以适用于语义分割;
1)设计该网络的主干子网络,用以提取图像的基础特征,主干子网络包括卷积层、池化层、归一化层、非线性激活层深度卷积神经网络模块,采用5个卷积块,为保持分割的分辨率,在卷积块4和卷积块5之前未采用池化层,为了避免减少池化层造成的感受野下降问题,在卷积块4和卷积块5中,采用空洞卷积代替传统的池化卷积,能够有效提升感受野;
2)设计自下而上的多尺度金字塔模块,由于卷积块3、4、5三个卷积块的特征图有相同的分辨率,为提取多尺度的特征,进而实现自下而上的多尺度金字塔模块,将卷积块3输出的特征图进行下采样2倍,并经过空洞金字塔模块提升语义层级,进而与卷积块4输出的特征图进行融合,进一步,将融合后的特征经过另一个空洞金字塔模块提升特征语义层级;再将融合的特征上采样2倍,与卷积块5提取的特征上采样2倍后的特征进行融合,再经过另一个空洞金字塔模块得到最后的融合特征;
3)设计自上而下的多尺度金字塔模块,为充分利用不同特征层级的特征信息,将卷积块5输出的特征图进行下采样2倍,并经过空洞金字塔模块的特征提取,进而与卷积块4输出的特征图进行融合;进一步,将融合后的特征经过另一个空洞金字塔模块提升特征语义层级;再将融合的特征上采样2倍,与卷积块3提取的特征上采样2倍后的特征进行融合,再经过另一个空洞金字塔模块得到最后的融合特征;
4)将自下而上的多尺度金字塔提取的特征与自上而下的多尺度金字塔提取的特征进行融合;基于融合的特征,卷积得到最终的分割结果。
(3)输入数据进行训练;通过前向计算预测分割结果,并与对应标签求取损失代价,通过反向传播算法计算参数的梯度并更新参数;迭代训练直至代价函数收敛;
(4)将训练好的模型应用于实际任务中,通过训练好的模型,前向计算预测并输出分割的结果,并辅助实际场景中的决策。
本发明通过设计一种新型的双向多尺度金字塔网络,能够有效的融合多尺度的特征,同时有效提取多尺度的语义信息,以提升语义分割的精度。将该方法应用于实际任务中,能够实现高效的场景感知,进一步促进其在智能监控、辅助驾驶以及自动驾驶等诸多领域的应用。
附图说明
图1中描述了本发明在自动驾驶中实现语义分割的应用示例。
图2中描述了传统的深度卷积神经网络应用于物体检测的方法示例。
图3描述了本发明提出的基于双向多尺度金字塔的深度卷积神经网络应用于语义分割的示例。
具体实施方式
下面结合附图对本发明作进一步的描述。
图2描述了传统的单尺度金字塔的深度卷积神经网络应用于语义分割的示例。具体地,该类方法中的只采用了一个空洞金字塔模块作用于最终尺度的特征上,因而无法有效的利用浅层的特征信息,限制了语义分割的性能。
图3描述了本发明所提出的双向多尺度金字塔网络应用于语义分割的示例。具体地,该网络包含三个主要分支:主干子网络,自下而上金字塔和自上而下金字塔。其中主干网络主要用于提取层次的特征,自下而上金字塔分支实现多尺度特征自下而上的融合,自上而下金字塔分支实现多尺度特征自上而下的融合。最终将双向金字塔融合的特征结果进一步融合,并预测得到最终的分割结果。通过双向金字塔的作用,多尺度的特征得以有效融合,进而提取多尺度的上下文信息以得到更精确的分割结果。
具体地,本发明的具体实施方式包含以下几个步骤:
第一步:准备训练所用数据集
(1)准备标注好的图像。所准备的图像应能包含所应用的实际场景,每张图像应包括所感兴趣的多类物体。由于基于深度神经网络的语义分割方法是一种有监督的学习方法,因此需要对所准备的图像进行标注。具体地,应对感兴趣的物体种类进行编号,并对一张图像中的每一个像素进行类别的标注。
(2)处理数据集。将所准备的数据集划分为训练数据集、验证数据集。训练数据集用于训练模型,验证数据集用于验证并挑选设计的哪种结构为最优。
(3)增强数据。为提升模型的检测精度,应对数据进行增强。增强的方式包括但不限于:随机翻转,随机裁剪,图像缩放,加入随机噪声等。
第二步:设计基于双向多尺度金字塔的深度卷积神经网络结构以适用于语义分割。
(1)设计该网络的主干子网络。主干子网络由卷积层、池化层、归一化层、非线性激活层等常用的深度卷积神经网络模块组成。以图3为例,主干子网络包括卷积块1-5。为保持分割的分辨率,在卷积块4和卷积块5之前未采用池化层。同时,为了避免减少池化层造成的感受野下降问题,在卷积块4和卷积块5中,采用空洞卷积代替传统的池化卷积,能够有效提升感受野。在语义分割中,经常采用ImageNet预训练的网络参数以初始化检测的主干网络,主干网络可以选取ResNet,DenseNet等经过预训练的网络模型用于初始化当前网络参数,用以提取图像的基础特征。
(2)设计自下而上的多尺度金字塔模块。由于卷积块3、4、5三个卷积块的特征图有相同的分辨率,为提取多尺度的特征,进而实现自下而上的多尺度金字塔模块,将卷积块3输出的特征图进行下采样2倍,并经过空洞金字塔模块提升语义层级,进而与卷积块4输出的特征图进行融合。进一步,将融合后的特征经过另一个空洞金字塔模块提升特征语义层级。再将融合的特征上采样2倍,与卷积块5提取的特征上采样2倍后的特征进行融合,再经过另一个空洞金字塔模块得到最后的融合特征。设计自下而上的多尺度金字塔模块,应包含但不限于上述示例模块,具体设计应包括融合的尺度层次,空洞金字塔模块结构配置,上下采样所采用的方法等。经过自下而上的多尺度金字塔特征融合,能够有效的增强最终的预测特征。
(3)设计自上而下的多尺度金字塔模块。传统的单尺度金字塔的语义分割网络只利用深层特征用于预测结果,忽略了浅层特征的细节信息(浅层特征主要包含物体的细节信息,深层特征为更加抽象的语义信息),而造成分割结果不佳。为充分利用不同特征层级的特征信息,将卷积块5输出的特征图进行下采样2倍,并经过空洞金字塔模块的特征提取,进而与卷积块4输出的特征图进行融合。进一步,将融合后的特征经过另一个空洞金字塔模块提升特征语义层级。再将融合的特征上采样2倍,与卷积块3提取的特征上采样2倍后的特征进行融合,再经过另一个空洞金字塔模块得到最后的融合特征。设计自上而下的多尺度金字塔模块,应包含但不限于上述示例模块,具体设计应包括融合的尺度层次,空洞金字塔模块结构,上下采样所采用的方法等。经过自上而下的多尺度金字塔模块,融合浅层特征的细节信息和深层特征的语义信息,增强特征的表达能力,进而提升分割性能。
(4)将自下而上的多尺度金字塔提取的特征与自上而下的多尺度金字塔提取的特征进行融合。基于融合的特征,卷积得到最终的分割结果。
(5)设计网络训练过程中所需要的损失代价函数,语义分割中常用的代价函数为Softmax交叉熵损失。
(6)初始化网络参数。参数包括卷积层的滤波器参数,归一化层的参数,以及需要手工设定如损失权重、学习率、权重衰减系数等参数。主干网络通常由预训练的权重进行初始化,其他分支中的参数则采用Gaussian、Xavier等方法对其进行随机初始化。
第三步:训练本发明的双向多尺度金字塔网络用语语义分割。
(1)前向计算:(结合图3说明)
a)将训练图像输入网络中,通过主干子网络的各层计算,得到主干网络各卷积块的输出特征。Ci表示第i个卷积块的特征图。
b)计算自下而上的金字塔的融合特征图DT5.具体地,通过C3计算DT3,将DT3与C4融合,并计算得到DT4。将DT4与C5特征进行融合,并计算得到DT5。
c)计算自上而下的金字塔的融合特征图TD3。具体地,通过C5计算TD5,将TD5与C4融合,并计算得到TD4。将TD4与C3特征进行融合,并计算得到TD3。
d)融合TD3与DT5特征,并计算分割结果。
e)根据分割结果,根据分割损失SoftmaxLoss函数,计算分割损失L。
(2)反向传播:
通过反向传播算法,计算每一层待学习参数的梯度,采用批量随机梯度下降法更新参数。
(3)迭代训练:
迭代的进行上述的(1)前向传播和(2)反向传播过程,不断的更新参数。停止标准可以选择损失函数的损失值趋近于收敛(在一个稳定值附近波动,无明显变化)停止迭代信号。
第四步:将上述训练得到的本发明的双向多尺度金字塔网络应用于实际语义分割中。
(1)获取实际应用中采集的相关场景图像。
(2)将输入图像输入已经训练好的模型中得到实际预测结果。
a)将训练图像输入网络中,根据第三步中的a)~d)计算,得到最终的分割结果。
b)分割结果作为对周围场景的感知,及时准确发现周围存在的安全隐患,进一步辅助实际应用中的智能决策。

Claims (1)

1.一种基于双向多尺度金字塔的语义分割方法,包含下列步骤:
(1)收集训练图像;确定方法应用场景,收集该场景下的相关图像;对收集的图像进行标注,标注每个像素点的类别,并以其作为训练图像的标签;将训练图像划分为训练集和验证集;训练集用于训练不同的模型,验证集用于选择最佳的训练模型;
(2)设计基于双向多尺度金字塔的深度卷积神经网络结构以适用于语义分割;
1)设计该网络的主干子网络,用以提取图像的基础特征,主干子网络包括卷积层、池化层、归一化层、非线性激活层深度卷积神经网络模块,采用5个卷积块,为保持分割的分辨率,在卷积块4和卷积块5之前未采用池化层,为了避免减少池化层造成的感受野下降问题,在卷积块4和卷积块5中,采用空洞卷积代替传统的池化卷积,能够有效提升感受野;
2)设计自下而上的多尺度金字塔模块,由于卷积块3、4、5三个卷积块的特征图有相同的分辨率,为提取多尺度的特征,进而实现自下而上的多尺度金字塔模块,将卷积块3输出的特征图进行下采样2倍,并经过空洞金字塔模块提升语义层级,进而与卷积块4输出的特征图进行融合,进一步,将融合后的特征经过另一个空洞金字塔模块提升特征语义层级;再将融合的特征上采样2倍,与卷积块5提取的特征上采样2倍后的特征进行融合,再经过另一个空洞金字塔模块得到最后的融合特征;
3)设计自上而下的多尺度金字塔模块,为充分利用不同特征层级的特征信息,将卷积块5输出的特征图进行下采样2倍,并经过空洞金字塔模块的特征提取,进而与卷积块4输出的特征图进行融合;进一步,将融合后的特征经过另一个空洞金字塔模块提升特征语义层级;再将融合的特征上采样2倍,与卷积块3提取的特征上采样2倍后的特征进行融合,再经过另一个空洞金字塔模块得到最后的融合特征;
4)将自下而上的多尺度金字塔提取的特征与自上而下的多尺度金字塔提取的特征进行融合;基于融合的特征,卷积得到最终的分割结果;
(3)输入数据进行训练;通过前向计算预测分割结果,并与对应标签求取损失代价,通过反向传播算法计算参数的梯度并更新参数;迭代训练直至代价函数收敛;
(4)将训练好的模型应用于实际任务中,通过训练好的模型,前向计算预测并输出分割的结果,并辅助实际场景中的决策。
CN201811111230.XA 2018-09-22 2018-09-22 一种基于双向多尺度金字塔的语义分割方法 Expired - Fee Related CN109325534B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811111230.XA CN109325534B (zh) 2018-09-22 2018-09-22 一种基于双向多尺度金字塔的语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811111230.XA CN109325534B (zh) 2018-09-22 2018-09-22 一种基于双向多尺度金字塔的语义分割方法

Publications (2)

Publication Number Publication Date
CN109325534A CN109325534A (zh) 2019-02-12
CN109325534B true CN109325534B (zh) 2020-03-17

Family

ID=65265704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811111230.XA Expired - Fee Related CN109325534B (zh) 2018-09-22 2018-09-22 一种基于双向多尺度金字塔的语义分割方法

Country Status (1)

Country Link
CN (1) CN109325534B (zh)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858451B (zh) * 2019-02-14 2020-10-23 清华大学深圳研究生院 一种非配合手部检测方法
CN110110578B (zh) * 2019-02-21 2023-09-29 北京工业大学 一种室内场景语义标注方法
CN109919206B (zh) * 2019-02-25 2021-03-16 武汉大学 一种基于全空洞卷积神经网络的遥感影像地表覆盖分类方法
CN110020606B (zh) * 2019-03-13 2021-03-30 北京工业大学 一种基于多尺度卷积神经网络的人群密度估计方法
CN109978032B (zh) * 2019-03-15 2022-12-06 西安电子科技大学 基于空间金字塔空洞卷积网络的桥梁裂缝检测方法
CN109948707B (zh) * 2019-03-20 2023-04-18 腾讯科技(深圳)有限公司 模型训练方法、装置、终端及存储介质
CN109961446B (zh) * 2019-03-27 2021-06-01 深圳视见医疗科技有限公司 Ct/mr三维图像分割处理方法、装置、设备及介质
CN109934241B (zh) * 2019-03-28 2022-12-09 南开大学 可集成到神经网络架构中的图像多尺度信息提取方法
CN110044964A (zh) * 2019-04-25 2019-07-23 湖南科技大学 基于无人飞机热成像视频的建筑饰面层脱粘缺陷识别方法
CN110245665B (zh) * 2019-05-13 2023-06-06 天津大学 基于注意力机制的图像语义分割方法
CN110399840B (zh) * 2019-05-22 2024-04-02 西南科技大学 一种快速的草坪语义分割及边界检测方法
CN110136136B (zh) 2019-05-27 2022-02-08 北京达佳互联信息技术有限公司 场景分割方法、装置、计算机设备及存储介质
CN110175613B (zh) * 2019-06-03 2021-08-10 常熟理工学院 基于多尺度特征和编解码器模型的街景图像语义分割方法
CN110310289A (zh) * 2019-06-17 2019-10-08 北京交通大学 基于深度学习的肺部组织图像分割方法
CN110348390B (zh) * 2019-07-12 2023-05-16 创新奇智(重庆)科技有限公司 一种火焰检测模型的训练方法、计算机可读介质及系统
CN110675407B (zh) * 2019-09-17 2022-08-05 北京达佳互联信息技术有限公司 一种图像实例分割方法、装置、电子设备及存储介质
CN110689083B (zh) * 2019-09-30 2022-04-12 苏州大学 一种上下文金字塔融合网络及图像分割方法
CN110941995A (zh) * 2019-11-01 2020-03-31 中山大学 基于轻量级网络的实时目标检测与语义分割的多任务学习方法
CN111104962B (zh) * 2019-11-05 2023-04-18 北京航空航天大学青岛研究院 图像的语义分割方法、装置、电子设备及可读存储介质
CN111062386B (zh) * 2019-11-28 2023-12-29 大连交通大学 基于深度金字塔注意力和特征融合的自然场景文本检测方法
US11416772B2 (en) 2019-12-02 2022-08-16 International Business Machines Corporation Integrated bottom-up segmentation for semi-supervised image segmentation
CN111160109B (zh) * 2019-12-06 2023-08-18 北京联合大学 一种基于深度神经网络的道路分割方法及系统
CN111126202B (zh) * 2019-12-12 2022-03-04 天津大学 基于空洞特征金字塔网络的光学遥感图像目标检测方法
CN111062854B (zh) * 2019-12-26 2023-08-25 Oppo广东移动通信有限公司 检测水印的方法、装置、终端及存储介质
CN111179283A (zh) * 2019-12-30 2020-05-19 深圳市商汤科技有限公司 图像语义分割方法及装置、存储介质
CN111260618B (zh) * 2020-01-13 2023-08-25 北京妙医佳健康科技集团有限公司 病灶检测系统构建的方法、装置及电子设备
CN111275643B (zh) * 2020-01-20 2022-09-02 西南科技大学 基于通道和空间注意力的真实噪声盲去噪网络系统及方法
CN111507984B (zh) * 2020-02-12 2024-02-27 杰创智能科技股份有限公司 一种基于多接受野的交替更新网络的场景分割方法
CN111429473B (zh) * 2020-02-27 2023-04-07 西北大学 基于多尺度特征融合的胸片肺野分割模型建立及分割方法
CN111507359A (zh) * 2020-03-09 2020-08-07 杭州电子科技大学 一种图像特征金字塔的自适应加权融合方法
CN111402264A (zh) * 2020-03-11 2020-07-10 南京三百云信息科技有限公司 图像区域分割方法、装置及其模型训练方法及计算机设备
CN111508263A (zh) * 2020-04-03 2020-08-07 西安电子科技大学 停车场智能引导机器人及智能引导方法
CN111476188B (zh) * 2020-04-14 2023-09-12 山东师范大学 基于特征金字塔的人群计数方法、系统、介质及电子设备
CN111563508B (zh) * 2020-04-20 2023-05-23 华南理工大学 一种基于空间信息融合的语义分割方法
CN111582126B (zh) * 2020-04-30 2024-02-27 浙江工商大学 基于多尺度行人轮廓分割融合的行人重识别方法
CN111914853B (zh) * 2020-07-17 2023-10-31 三峡大学 一种用于立体匹配的特征提取方法
CN111860386B (zh) * 2020-07-27 2022-04-08 山东大学 一种基于ConvLSTM卷积神经网络的视频语义分割方法
CN112116594B (zh) * 2020-09-10 2023-12-19 福建省海峡智汇科技有限公司 一种基于语义分割的风飘异物识别方法和装置
CN112164065B (zh) * 2020-09-27 2023-10-13 华南理工大学 一种基于轻量化卷积神经网络的实时图像语义分割方法
CN112364699A (zh) * 2020-10-14 2021-02-12 珠海欧比特宇航科技股份有限公司 基于加权损失融合网络的遥感图像分割方法、装置及介质
CN112396060B (zh) * 2020-11-17 2024-03-15 中国平安人寿保险股份有限公司 基于身份证分割模型的身份证识别方法及其相关设备
CN112418674A (zh) * 2020-11-24 2021-02-26 中国地质大学(武汉) 基于城市多源数据的街道空间品质测度评价方法和系统
CN112418176A (zh) * 2020-12-09 2021-02-26 江西师范大学 一种基于金字塔池化多级特征融合网络的遥感图像语义分割方法
CN112651973B (zh) * 2020-12-14 2022-10-28 南京理工大学 基于特征金字塔注意力和混合注意力级联的语义分割方法
CN112950553A (zh) * 2021-02-05 2021-06-11 慧影医疗科技(北京)有限公司 一种多尺度肺叶分割方法、系统、存储介质及电子设备
CN113033570B (zh) * 2021-03-29 2022-11-11 同济大学 一种改进空洞卷积和多层次特征信息融合的图像语义分割方法
CN113221985B (zh) * 2021-04-29 2024-04-05 大连海事大学 基于金字塔模型的融合网络来提取图像基础特征的方法
CN113486890A (zh) * 2021-06-16 2021-10-08 湖北工业大学 基于注意力特征融合和空洞残差特征增强的文本检测方法
CN113537004B (zh) * 2021-07-01 2023-09-01 大连民族大学 图像的双金字塔多元特征提取网络、图像分割方法、系统和介质
CN113673506A (zh) * 2021-07-13 2021-11-19 山东师范大学 一种基于多尺度特征金字塔的场景文本检测方法及系统
CN113361528B (zh) * 2021-08-10 2021-10-29 北京电信易通信息技术股份有限公司 一种多尺度目标检测方法及系统
CN113705583B (zh) * 2021-08-16 2024-03-22 南京莱斯电子设备有限公司 一种基于卷积神经网络模型的目标检测识别方法
CN113807362B (zh) * 2021-09-03 2024-02-27 西安电子科技大学 基于层间语义信息融合深度卷积网络的图像分类方法
CN117314932A (zh) * 2023-09-12 2023-12-29 四川大学华西第四医院(四川大学华西职业病医院) 基于令牌金字塔的胰胆管分割方法、模型及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956532B (zh) * 2016-04-25 2019-05-21 大连理工大学 一种基于多尺度卷积神经网络的交通场景分类方法
CN107480726A (zh) * 2017-08-25 2017-12-15 电子科技大学 一种基于全卷积和长短期记忆单元的场景语义分割方法
CN108062756B (zh) * 2018-01-29 2020-04-14 重庆理工大学 基于深度全卷积网络和条件随机场的图像语义分割方法

Also Published As

Publication number Publication date
CN109325534A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
CN109325534B (zh) 一种基于双向多尺度金字塔的语义分割方法
CN109214349B (zh) 一种基于语义分割增强的物体检测方法
CN109389057B (zh) 一种基于多尺度高级语义融合网络的物体检测方法
CN107239730B (zh) 智能汽车交通标志识别的四元数深度神经网络模型方法
CN106971155B (zh) 一种基于高度信息的无人车车道场景分割方法
CN113705636B (zh) 一种自动驾驶车辆轨迹预测方法、装置及电子设备
CN111539887A (zh) 一种基于混合卷积的通道注意力机制和分层学习的神经网络图像去雾方法
CN110781850A (zh) 道路识别的语义分割系统和方法、计算机存储介质
CN111339849A (zh) 一种融合行人属性的行人重识别的方法
CN116485717B (zh) 一种基于像素级深度学习的混凝土坝表面裂缝检测方法
CN114693924A (zh) 一种基于多模型融合的道路场景语义分割方法
CN104301735A (zh) 城市交通监控视频全局编码方法及系统
CN116797787B (zh) 基于跨模态融合与图神经网络的遥感影像语义分割方法
CN114067292A (zh) 用于智能驾驶的图像处理方法和装置
CN115690153A (zh) 一种智能体轨迹预测方法及系统
CN111046723B (zh) 一种基于深度学习的车道线检测方法
CN112785610B (zh) 一种融合低层特征的车道线语义分割方法
CN111612803A (zh) 一种基于图像清晰度的车辆图像语义分割方法
CN116402874A (zh) 基于时序光学图像与激光雷达数据的航天器深度补全方法
CN116704203A (zh) 目标检测方法、装置、电子设备、计算机可读存储介质
CN110738113B (zh) 一种基于邻近尺度特征滤除与转移的物体检测方法
CN112634289B (zh) 一种基于非对称空洞卷积的快速可行域分割方法
CN115439692A (zh) 一种图像处理方法、装置、电子设备及介质
CN114119757A (zh) 图像处理方法、装置、设备、介质和计算机程序产品
CN115129886A (zh) 驾驶场景的识别方法、装置及车辆

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200317

Termination date: 20210922