CN109241972B - 基于深度学习的图像语义分割方法 - Google Patents
基于深度学习的图像语义分割方法 Download PDFInfo
- Publication number
- CN109241972B CN109241972B CN201810947587.5A CN201810947587A CN109241972B CN 109241972 B CN109241972 B CN 109241972B CN 201810947587 A CN201810947587 A CN 201810947587A CN 109241972 B CN109241972 B CN 109241972B
- Authority
- CN
- China
- Prior art keywords
- semantic segmentation
- semantic
- model
- feature
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000013135 deep learning Methods 0.000 title claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000012937 correction Methods 0.000 claims abstract description 25
- 238000013145 classification model Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000005070 sampling Methods 0.000 claims abstract description 7
- 238000003062 neural network model Methods 0.000 claims abstract description 5
- 238000012544 monitoring process Methods 0.000 claims abstract description 3
- 230000008569 process Effects 0.000 claims description 17
- 230000007704 transition Effects 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 4
- 241000287196 Asthenes Species 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 3
- 101100351303 Caenorhabditis elegans pdfr-1 gene Proteins 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 101100256358 Caenorhabditis elegans seb-2 gene Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于深度学习的图像语义分割方法,涉及图像语义分割和深度学习领域,包括如下步骤:选择训练数据集;构建基于深度学习的语义分割模型;语义分割模型包括:语义监督模块、语义嵌入分值模块、特征重校正模块、上采样层和卷积层;通过分类模型对训练数据集进行预处理,并将分类模型的中间层输出的不同尺度的特征图输入构建好的语义分割模型中的语义监督模块中;对整个图像语义分割模型进行训练;步骤5:输入新的图像,在已训练好的深度神经网络模型中进行一次前向传播,端到端地输出预测的语义分割结果。本发明解决了现有技术中的图像语义分割准确率较低的问题。
Description
技术领域
本发明涉及图像语义分割和深度学习领域,尤其涉及基于深度学习的图像语义分割方法。
背景技术
目前,因为深度卷积神经网络的强大特征表征能力,基于深度卷积神经网络的方法在图像分类,目标检测和图像语义分割获得了巨大的进步。语义分割的目的就是给一个给定图像的每一个像素赋一个语义标签。
近年来,绝大多数当前最佳的图像语义分割方法都是基于全卷积神经网络的。全卷积神经网络结构是一个典型的编码器解码器结构,语义信息经过编码器被嵌入到特征图当中,然后解码器负责产生语义分割结果。通常解码器就是预训练好的卷积神经网络分类模型用于提取图像特征,而解码器则含有多种上采样操作,用于恢复图像分辨率。尽管编码器前端的特征图含有更多的语义但是在重建细节时会受限于低分辨率,这是编码器常见的问题。为了解决它,我们需要更好的将高级别特征与低级别特征进行融合,避免高低级别的特征融合不充分,造成的语义分割结果的精度较低。
发明内容
本发明的目的在于:为解决现有技术中的图像语义分割准确率较低的问题,本发明提供一种基于深度学习的图像语义分割方法。
本发明的技术方案如下:
基于深度学习的图像语义分割方法,包括如下步骤:
步骤1:选择训练数据集;
步骤2:构建基于深度学习的语义分割模型;
语义分割模型包括:语义监督模块、语义嵌入分支模块、特征重校正模块、上采样层和卷积层;
步骤3:通过分类模型对训练数据集进行预处理,并将分类模型的中间层输出的不同尺度的特征图输入构建好的语义分割模型中的语义监督模块中;
步骤4:对整个图像语义分割模型进行训练;
步骤5:输入新的图像,在已训练好的深度神经网络模型中进行一次前向传播,端到端地输出预测的语义分割结果。
具体地,所述分类模型包括1个Convolution、4个密集连接块,3个过渡层,1个Convolution和3个Transition layer输出的特征图分别为特征图DN_1、特征图DN_2、特征图DN_3和特征图DN_4。
具体地,所述语义分割模型中,特征图DN_1、特征图DN_2、特征图DN_3和特征图DN_4经过语义监督模块后的输出图分别为输出图SS_1、输出图SS_2、输出图SS_3和输出图SS_4,输出图SS_3和输出图SS_4共同输入到一个语义嵌入分支模块,输出图SS_3和输出图SS_2共同输入到一个语义嵌入分支模块,输出图SS_2和输出图SS_1共同输入到一个语义嵌入分支模块。
具体地,所述分类模型中,第一个密集连接块包含6个1×1和3×3的卷积层,第二个密集连接块包含12个1×1和3×3的卷积层,第三个密集连接块包含32个1×1和3×3的卷积层,第四个密集连接块包含32个1×1和3×3的卷积层。
具体地,所述语义监督模块包括2个3×3的卷积、1个全局池化层和2个全连接层。
具体地,所述特征重校正模块为结合了空间特征重矫正与通道特征重矫正的网络模块。
具体地,步骤4的过程为:
步骤4.1:对训练数据集中的图像进行预处理,将图像剪裁为固定尺寸;
步骤4.2:对整个图像语义分割模型进行初始化;
步骤4.3:对训练数据集中的数据通过翻转、缩放和旋转的方式进行扩增;
步骤4.4:记训练过程中模型预测的语义分割结果与标注图像的交叉熵损失为loss1,再加上正则化项:
其中:||·||2表示矩阵的2-范数;ωp表示训练过程中前端网络更新的权值,ω0是预训练模型初始化网络时的权值。ω*表示后端网络的权值;λ,κ分别是每个部分的正则化参数,表示正则化强度;
其中,baselr为初始学习率,这里设置为0.001,power设置化0.9。
采用上述方案后,本发明的有益效果如下:
(1)本发明所述基于深度学习的图像语义分割方法采用预训练好的网络分类模型做基础模型进行特征提取,得到的特征图经过深度语义监督和语义嵌入分支促进高低层特征图的融合,经特征重校正模块进行特征重校正,有效提高语义分割的准确率,最终得到较好的语义分割结果。
(2)在原始交叉熵损失函数的基础上,加上一个正则化项,当使用预训练模型来初始化现有模型时,参数的正则化项时非常重要的,使用正则化项的目的就在于通过潜在的限制网络的能力(也就是有效的权值参数搜索空间的大小),加速收敛与避免过拟合。但是加上上述正则化项,由于预训练模型是在ImageNet上训练得到的分类模型,使用训练过程中的前端网络的权值减去预训练模型初始化网络时的权值可以避免网络权值更新时传递的关于原先分类任务的信息,避免网络能力被潜在的限制,能够在训练过程中更加有效的搜索参数的空间。
附图说明
图1为本发明的流程图;
图2为本发明的图像语义分割模型结构图;
图3为本发明的语义监督模块结构图;
图4为本发明的语义嵌入分支模块结构图;
图5为本发明的特征重校正模块结构图;
图6为本发明所述的通道压缩激励模块结构图;
图7为本发明所述的空间压缩激励模块结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施与和附图,对本发明作进一步详细说明。
为解决现有技术中的图像语义分割准确率较低的问题,本发明提供一种基于深度学习的图像语义分割方法。本发明的方法改善了现有图像语义分割方法的精度,在图像识别和应用中具有重要意义。
下面,将具体结合一个最优选的实施例,来对本发明进行更加清楚、完整的说明。
如图1所示,本发明的基于深度学习的图像语义分割方法,包括如下步骤:
步骤1:选择训练数据集;本实施例中以VOC 2012数据集的21类(其中1类为背景)场景类别为基准,采集COCO数据集中包含上述20类类别目标的图像加入数据集,最终得到训练和测试数据集。
步骤2:构建基于深度学习的语义分割模型。
如图2所示,语义分割模型包括:语义监督模块、语义嵌入分值模块、特征重校正模块、上采样层和卷积层。
步骤3:通过分类模型对训练数据集进行预处理,并将分类模型的中间层输出的不同尺度的特征图输入构建好的语义分割模型中的语义监督模块中;所述分类模型包括1个Convolution、4个密集连接块,3个过渡层,1个Convolution和3个Transition layer输出的特征图分别为特征图DN_1、特征图DN_2、特征图DN_3和特征图DN_4。具体而言,具体结构如表1所示:
表1
从上表可以看出,分类模型中,第一个密集连接块包含6个1×1和3×3的卷积层,第二个密集连接块包含12个1×1和3×3的卷积层,第三个密集连接块包含32个1×1和3×3的卷积层,第四个密集连接块包含32个1×1和3×3的卷积层。分类模型中的中每个密集连接块(Dense Block)都采用密集连接,即每一层的输入都包含了所有较早的层的特征图,且它的输出被传递至每个后续层,而且每一层的特征图都是通过深度级联在一起。这种密集接连结构加强了特征图的传递,更有效地利用特征。
基于上述的预处理模型,如图2所示,在语义分割模型中,特征图DN_1、特征图DN_2、特征图DN_3和特征图DN_4经过语义监督模块后的输出图分别为输出图SS_1、输出图SS_2、输出图SS_3和输出图SS_4,输出图SS_3和输出图SS_4共同输入到一个语义嵌入分支模块,输出图SS_3和输出图SS_2共同输入到一个语义嵌入分支模块,输出图SS_2和输出图SS_1共同输入到一个语义嵌入分支模块。
如图3所示,语义监督模块包括2个3×3的卷积、1个全局池化层和2个全连接层。所述特征重校正模块为结合了空间特征重矫正与通道特征重矫正的网络模块。通过给DenseNet输出的特征图DN_1、特征图DN_2、特征图DN_3、特征图DN_4均直接分配一个语义监督模块,能够让低级别的特征包含更多的语义信息。
如图4所示,语义嵌入分支模块是一个将高层特征融入到低层特征的模块,主要是将低层特征图上采样后,与高层特征图逐像素相乘。语义嵌入分支模块的作用主要是为了从高层特征引入更多的语义信息来指导特征融合。
如图5所示,本发明的特征重校正模块为结合了空间特征重矫正与通道特征重矫正的网络模块。下面将分开进行说明:
如图6所示,空间特征重校正模块中过程为:
(2)再将其经过一个sigmoid层,将Mc的每个空间位置M′(i,,j),i∈{1,2,…,H},j∈{1,2,…,W}的重要性重新校正,并赋以每个空间位置一个权值p(i,j),得到的p(i,j)与原始特征图Mc进行点乘。
最终,Mc经过空间特征重校正得到的特征图为:
空间特征重校正能够更好的将空间中所有同一位置像素的重要性得到重新校正,并赋以相应的权值,提高语义分割的准确率。
如图7所示,通道特征重校正模块中过程为:
(2)整合后的特征图再经过一个线性修正单元,对特征进行修正。
经过通道特征重校正,能够将重要的通道赋以高权值,突出重要性。
步骤4:对整个图像语义分割模型进行训练;步骤4的过程为:
步骤4.1:对训练数据集中的图像进行预处理,将图像剪裁为固定尺寸513×513。
步骤4.2:对整个图像语义分割模型进行初始化,即以预训练好的图像语义分割模型的参数值为初始值。
步骤4.3:对训练数据集中的数据通过翻转、缩放和旋转的方式进行扩增;具体地,翻转为随机翻转;在原图像的在0.5到2倍之间随机缩放图像;在原图像在-10到10度之间,随机旋转图像。
步骤4.4:记训练过程中模型预测的语义分割结果与标注图像的交叉熵损失为loss1,再加上正则化项:
其中:||·||2表示矩阵的2-范数;ωp表示训练过程中前端网络更新的权值,ω0是预训练模型初始化网络时的权值。ω*表示后端网络的权值;λ,κ分别是每个部分的正则化参数,表示正则化强度;
其中,baselr为初始学习率,这里设置为0.001,power设置化0.9。
步骤5:输入新的图像,在已训练好的深度神经网络模型中进行一次前向传播,端到端地输出预测的语义分割结果。
本发明的工作原理和过程为:分类模型作为预处理模型,用于提取原始图像的特征。DenseNet169网络结构如表1所示,主体网络结构为4个Dense Block,3个Transitionlayer,其中Dense Block(1)是6个1×1和3×3的卷积组成,Dense Block(2)是12个1×1和3×3的卷积组成,Dense Block(3)是32个1×1和3×3的卷积组成,Dense Block(4)是32个1×1和3×3的卷积组成。取Convolution输出的特征图(尺寸为112×112)、TransitionLayer(1)输出的特征图(尺寸为56×56)、Transition Layer(2)输出的特征图(尺寸为28×28)、Transition Layer(3)输出的特征图(尺寸为14×14)分别为网络结构中提取特征(编码器)的第一层(记为DN_1)、第二层(记为DN_2)、第三层(记为DN_3)和第四层(记为DN_4)。将特征图DN_1、特征图DN_2、特征图DN_3和特征图DN_4分别经过一个语义监督模块(SS),输出的特征图分别记为SS_1,SS_2,SS_3,SS_4。然后将SS_4与SS_3输入到语义嵌入分支模块(SEB),输出的特征图记为SEB_3,将SS_3与SS_2输入到语义嵌入分支模块,输出的特征图记为SEB_2,将SS_2与SS_1输入至语义嵌入分支模块中,输出的特征图记为SEB_1。将SEB_3上采样4倍得到的特征图,SEB_3上采样2倍得到的特征图与SEB_1进行串联得到的特征图输入至空间通道激励模块(SCSE)中,最后将得到的特征图上采样4倍,得到的特征图再经过1个1×1的卷积,得到特征图与语义分割标注计算交叉熵损失,误差反向传播,更新模型参数,得到神经网络模型。本发明在VOC2012语义分割数据集上取得了mIoU为77.12%的结果。
凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。
Claims (1)
1.基于深度学习的图像语义分割方法,其特征在于,包括如下步骤:
步骤1:选择训练数据集;
步骤2:构建基于深度学习的语义分割模型;
语义分割模型包括:语义监督模块、语义嵌入分支模块、特征重校正模块、上采样层和卷积层;
步骤3:通过分类模型对训练数据集进行预处理,并将分类模型的中间层输出的不同尺度的特征图输入构建好的语义分割模型中的语义监督模块中;
步骤4:对整个图像语义分割模型进行训练;
步骤5:输入新的图像,在已训练好的深度神经网络模型中进行一次前向传播,端到端地输出预测的语义分割结果;
所述分类模型包括1个Convolution、4个密集连接块,3个过渡层,1个Convolution和3个Transition layer输出的特征图分别为特征图DN_1、特征图DN_2、特征图DN_3和特征图DN_4;
所述语义分割模型中,特征图DN_1、特征图DN_2、特征图DN_3和特征图DN_4经过语义监督模块后的输出图分别为输出图SS_1、输出图SS_2、输出图SS_3和输出图SS_4,输出图SS_3和输出图SS_4共同输入到一个语义嵌入分支模块,输出图SS_3和输出图SS_2共同输入到一个语义嵌入分支模块,输出图SS_2和输出图SS_1共同输入到一个语义嵌入分支模块;
所述分类模型中,第一个密集连接块包含6个1×1和3×3的卷积层,第二个密集连接块包含12个1×1和3×3的卷积层,第三个密集连接块包含32个1×1和3×3的卷积层,第四个密集连接块包含32个1×1和3×3的卷积层;
所述语义监督模块包括2个3×3的卷积、1个全局池化层和2个全连接层;
所述特征重校正模块为结合了空间特征重校正与通道特征重校正的网络模块;
步骤4的过程为:
步骤4.1:对训练数据集中的图像进行预处理,将图像剪裁为固定尺寸;
步骤4.2:对整个图像语义分割模型进行初始化;
步骤4.3:对训练数据集中的数据通过翻转、缩放和旋转的方式进行扩增;
步骤4.4:记训练过程中模型预测的语义分割结果与标注图像的交叉熵损失为loss1,再加上正则化项:
其中:‖·‖2表示矩阵的2-范数;ωp表示训练过程中前端网络更新的权值,ω0是预训练模型初始化网络时的权值;ω*表示后端网络的权值;λ,κ分别是每个部分的正则化参数,表示正则化强度;
其中,baselr为初始学习率,这里设置为0.001,power设置化0.9,iter为当前迭代次数,total_iter为设置的总迭代次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810947587.5A CN109241972B (zh) | 2018-08-20 | 2018-08-20 | 基于深度学习的图像语义分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810947587.5A CN109241972B (zh) | 2018-08-20 | 2018-08-20 | 基于深度学习的图像语义分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109241972A CN109241972A (zh) | 2019-01-18 |
CN109241972B true CN109241972B (zh) | 2021-10-01 |
Family
ID=65071158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810947587.5A Expired - Fee Related CN109241972B (zh) | 2018-08-20 | 2018-08-20 | 基于深度学习的图像语义分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109241972B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858539A (zh) * | 2019-01-24 | 2019-06-07 | 武汉精立电子技术有限公司 | 一种基于深度学习图像语义分割模型的roi区域提取方法 |
CN109919080B (zh) * | 2019-03-05 | 2019-10-11 | 南京航空航天大学 | 多解码器全卷积神经网络及其相应的细观结构识别方法 |
CN109961095B (zh) * | 2019-03-15 | 2023-04-28 | 深圳大学 | 基于非监督深度学习的图像标注系统及标注方法 |
CN110059769B (zh) * | 2019-04-30 | 2022-11-18 | 福州大学 | 用于街景理解的基于像素重排重建的语义分割方法及系统 |
CN110059698B (zh) * | 2019-04-30 | 2022-12-23 | 福州大学 | 用于街景理解的基于边缘稠密重建的语义分割方法及系统 |
CN110059768B (zh) * | 2019-04-30 | 2022-11-15 | 福州大学 | 用于街景理解的融合点与区域特征的语义分割方法及系统 |
CN110148142B (zh) * | 2019-05-27 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 图像分割模型的训练方法、装置、设备和存储介质 |
CN110276402B (zh) * | 2019-06-25 | 2021-06-11 | 北京工业大学 | 一种基于深度学习语义边界增强的盐体识别方法 |
CN110428410B (zh) * | 2019-07-31 | 2024-02-27 | 腾讯医疗健康(深圳)有限公司 | 眼底医学图像处理方法、装置、设备及存储介质 |
CN110555424A (zh) * | 2019-09-10 | 2019-12-10 | 深圳前海微众银行股份有限公司 | 港口集装箱布局检测方法、装置、设备及可读存储介质 |
CN110930409B (zh) * | 2019-10-18 | 2022-10-14 | 电子科技大学 | 一种基于深度学习的盐体语义分割方法及语义分割系统 |
CN111062395B (zh) * | 2019-11-27 | 2020-12-18 | 北京理工大学 | 一种实时的视频语义分割方法 |
CN110895815A (zh) * | 2019-12-02 | 2020-03-20 | 西南科技大学 | 一种基于深度学习的胸部x线气胸分割方法 |
CN111259983B (zh) * | 2020-02-13 | 2022-05-20 | 电子科技大学 | 基于深度学习的图像语义分割方法及存储介质 |
CN111652231B (zh) * | 2020-05-29 | 2023-05-30 | 沈阳铸造研究所有限公司 | 一种基于特征自适应选择的铸件缺陷语义分割方法 |
CN112034456B (zh) * | 2020-08-27 | 2023-10-17 | 五邑大学 | 烟雾巡检系统、方法、控制装置及存储介质 |
CN112686906B (zh) * | 2020-12-25 | 2022-06-14 | 山东大学 | 基于均匀分布迁移引导的图像分割方法及系统 |
CN112669343A (zh) * | 2021-01-04 | 2021-04-16 | 桂林电子科技大学 | 一种基于深度学习的壮族少数民族服饰分割方法 |
CN113076926B (zh) * | 2021-04-25 | 2022-11-18 | 华南理工大学 | 一种带语义引导的多尺度目标检测方法及系统 |
CN115063591B (zh) * | 2022-07-26 | 2022-11-29 | 之江实验室 | 一种基于边缘度量关系的rgb图像语义分割方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2154631A2 (en) * | 2008-08-14 | 2010-02-17 | Xerox Corporation | System and method for object class localization and semantic class based image segmentation |
US9443320B1 (en) * | 2015-05-18 | 2016-09-13 | Xerox Corporation | Multi-object tracking with generic object proposals |
CN106408562A (zh) * | 2016-09-22 | 2017-02-15 | 华南理工大学 | 基于深度学习的眼底图像视网膜血管分割方法及系统 |
CN107545903A (zh) * | 2017-07-19 | 2018-01-05 | 南京邮电大学 | 一种基于深度学习的语音转换方法 |
-
2018
- 2018-08-20 CN CN201810947587.5A patent/CN109241972B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2154631A2 (en) * | 2008-08-14 | 2010-02-17 | Xerox Corporation | System and method for object class localization and semantic class based image segmentation |
US9443320B1 (en) * | 2015-05-18 | 2016-09-13 | Xerox Corporation | Multi-object tracking with generic object proposals |
CN106408562A (zh) * | 2016-09-22 | 2017-02-15 | 华南理工大学 | 基于深度学习的眼底图像视网膜血管分割方法及系统 |
CN107545903A (zh) * | 2017-07-19 | 2018-01-05 | 南京邮电大学 | 一种基于深度学习的语音转换方法 |
Non-Patent Citations (5)
Title |
---|
Concurrent Spatial and Channel Squeeze & Excitation in Fully Convolutional Networks;Abhijit Guha Roy 等;《Computer Vision and Pattern Recognition》;20180608;1-8 * |
Densely Connected Convolutional Networks;Gao Huang 等;《2017 CVPR》;20171109;1-9 * |
ExFuse: Enhancing Feature Fusion for Semantic Segmentation;Zhenli Zhang等;《European Conference on Computer Vision,ECCV 2018》;20180411;273-288 * |
基于卷积神经网络的图像语义分割;陈鸿翔;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160715(第07期);I138-1091 * |
基于多尺度特征提取的图像语义分割;熊志勇 等;《中南民族大学学报(自然科学版)》;20170930;第36卷(第3期);118-124 * |
Also Published As
Publication number | Publication date |
---|---|
CN109241972A (zh) | 2019-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241972B (zh) | 基于深度学习的图像语义分割方法 | |
CN109101975B (zh) | 基于全卷积神经网络的图像语义分割方法 | |
CN110232394B (zh) | 一种多尺度图像语义分割方法 | |
CN112364699B (zh) | 基于加权损失融合网络的遥感图像分割方法、装置及介质 | |
CN113807355A (zh) | 一种基于编解码结构的图像语义分割方法 | |
CN110674742B (zh) | 基于DLinkNet的遥感图像道路提取方法 | |
CN112862774B (zh) | 一种遥感影像建筑物精确分割方法 | |
CN110517272B (zh) | 基于深度学习的血细胞分割方法 | |
CN113240683B (zh) | 基于注意力机制的轻量化语义分割模型构建方法 | |
CN111127538A (zh) | 一种基于卷积循环编码-解码结构的多视影像三维重建方法 | |
CN116469100A (zh) | 一种基于Transformer的双波段图像语义分割方法 | |
CN111798469A (zh) | 基于深度卷积神经网络的数字图像小数据集语义分割方法 | |
CN110930409A (zh) | 一种基于深度学习的盐体语义分割方法及语义分割模型 | |
CN112149526B (zh) | 一种基于长距离信息融合的车道线检测方法及系统 | |
CN114742985A (zh) | 一种高光谱特征提取方法、装置及存储介质 | |
CN117058367A (zh) | 高分辨率遥感影像建筑物语义分割方法及装置 | |
CN115293986A (zh) | 一种多时相遥感图像云区重建方法 | |
CN117726954B (zh) | 一种遥感图像海陆分割方法及系统 | |
CN115272670A (zh) | 一种基于掩膜注意交互的sar图像舰船实例分割方法 | |
Xing et al. | MABNet: a lightweight stereo network based on multibranch adjustable bottleneck module | |
CN113538402B (zh) | 一种基于密度估计的人群计数方法及系统 | |
CN114996495A (zh) | 一种基于多原型和迭代增强的单样本图像分割方法及装置 | |
CN114529793A (zh) | 一种基于门控循环特征融合的深度图像修复系统及方法 | |
CN110633706A (zh) | 一种基于金字塔网络的语义分割方法 | |
CN117935259A (zh) | 一种多模态遥感图像分割装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211001 |
|
CF01 | Termination of patent right due to non-payment of annual fee |