CN107480726A - 一种基于全卷积和长短期记忆单元的场景语义分割方法 - Google Patents
一种基于全卷积和长短期记忆单元的场景语义分割方法 Download PDFInfo
- Publication number
- CN107480726A CN107480726A CN201710739098.6A CN201710739098A CN107480726A CN 107480726 A CN107480726 A CN 107480726A CN 201710739098 A CN201710739098 A CN 201710739098A CN 107480726 A CN107480726 A CN 107480726A
- Authority
- CN
- China
- Prior art keywords
- module
- shot
- long term
- image
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于全卷积和长短期记忆单元的场景语义分割方法,涉及图像处理技术领域,包括如下步骤:S1:构建基于全卷积、金字塔池化模块与长短期记忆单元模块的深度神经网络;S2:比对预测图像和标注图像,并以Softmax损失为目标函数、随机梯度下降为优化方法进行训练,对步骤1得到的深度神经网络进行权值更新;S3:多次进行步骤S2,直到损失下降到无法下降时结束训练;S4:输入新的场景图像至已训练好的深度神经网络,并做双线性插值到原图分辨率,得到该场景的语义分割结果。本发明解决了目前场景图像分割准确率低、图像中目标过分割和欠分割的问题。
Description
技术领域
本发明涉及图像语义分割和深度学习领域,尤其涉及一种基于全卷积和长短期记忆单元的场景语义分割方法。
背景技术
场景语义分割应属于图像语义分割在场景图像上的应用。场景语义分割对后续的计算机视觉任务具有至关重要的作用,例如无人驾驶视频分析中道路和非道路场景的区分。场景语义分割一般建模为像素级别的多分类问题,其目标是将图像的每一像素区分为预定义的多个类别之一。
传统的场景语义分割方法一般从图像像素邻域小窗提取人为设计的特征在做判别,例如纹理特征。同时,考虑到图像像素间的空间依赖性,研究人员基于低级视觉特征的相似性构建更高级的全局上下文的表征,例如马尔科夫随机场和条件随机场。
近年来,绝大多数当前最佳的场景语义分割方法都是基于卷积神经网络的。卷积神经网络能够学习到优于传统手工特征的具有区分性的特征,尤其全卷积网络能够端到端地从原始的场景图像预测得到稠密的分割结果。另外,循环神经网络在自然语言处理和语音识别等领域显示出了其建模的有效性。研究人员将语音或文本这些一维数据间的时域依赖拓展到二维图像的空间依赖,构建了一些循环神经网络的变体应用于图像识别以及语义分割。在其中,长短期记忆单元是为了解决基础循环神经网络难以学习长期依赖的一种循环网络结构。
已有的场景语义分割方法多数基于传统特征的概率图模型(马尔科夫随机场和条件随机场均属于概率图模型范畴)。
发明内容
本发明的目的在于:为解决现有技术中的场景图像分割准确率低、图像中目标过分割和欠分割的问题,本发明提供一种基于全卷积和长短期记忆单元的场景语义分割方法。
本发明的技术方案如下:
一种基于全卷积和长短期记忆单元的场景语义分割方法,包括如下步骤:
S1:构建基于全卷积、金字塔池化模块与长短期记忆单元模块的深度神经网络。
S2:输入场景图像,在深度神经网络中进行一次前向传播得到预测图像A;对标注图像进行尺度缩减后得到与预测图像同分辨率的标注图像A,这里的标注图像是对应于原图像的人工分割好的标注;比对预测图像A和标注图像A,以Softmax损失为目标函数、随机梯度下降为优化方法,对步骤1得到的深度神经网络进行权值更新。
S3:多次进行步骤S2,直到损失无法下降时结束训练。
S4:输入新的场景图像至已训练好的深度神经网络,并做双线性插值到原图分辨率,得到该场景的语义分割结果。
具体地,所述深度神经网络的结构包括前端网络和后端网络,所述前端网络基于VGG网络,由5个卷积模块组成:卷积模块一、卷积模块二均包括2个卷积层、1个修正线性单元层和1个池化层,卷积模块三包括3个卷积层、1个修正线性单元层和1个池化层,卷积模块四、卷积模块五均包括3个卷积层和1个修正线性单元层;所述后端网络由金字塔池化模块和长短期记忆单元模块组成。
具体地,所述金字塔池化模块针对场景图像中的不同尺度目标提取特征;所述金字塔池化模块分别进行4种不同核大小的池化操作,使得具有较小卷积核的池化层学习较小目标的特征,具有较大卷积核的池化层学习较大目标的特征;在每个池化层后分别连接一个卷积层,使得池化后的特征根据反向传播的误差进行微调。由于不同核大小的池化会得到不同分辨率的特征图,加入反卷积引入上采样得到相同的分辨率,使最后的特征图串联成为可能。
具体地,所述长短期记忆单元模块从图像在二维邻域上强相关性出发,得深度神经网络学习的特征图在二维结构上进行邻域间的全局信息交流;该模块由两部分组成,垂直扫描模块和水平扫描模块,垂直扫描模块垂直扫描特征图得到一个序列,水平扫描模块水平扫描特征图得到另一个序列,利用长短期记忆单元对于序列相关性的建模能力,学习图像的全局特征。
具体地,S2中,所述权值更新的具体过程为:
S21:网络初始化:使用在ImageNet数据集上预训练的VGG-16网络的参数作为前端网络的初始值,金字塔池化模块中的卷积层由标准高斯分布进行参数初始化,长短期记忆单元模块中的循环卷积层使用标准均匀分布初始化参数。
S22:训练:以每一像素的交叉熵损失的和作为损失函数,使用随机梯度下降法为优化方法,初始学习率设置为0.001,后面根据loss的下降效果适当降低学习率,当loss下降到一定程度不再下降时结束训练。
建立场景分割图像数据集以及训练图像和标注图像的预处理,构建深度神经网络,以Softmax为损失函数进行训练。
采用上述方案后,本发明的有益效果如下:
(1).金字塔池化模块以不同核大小的池化方式,得到具有不同感受野的特征图,使得对于一个像素的分类不仅取决于固定大小的周围邻域信息,也依赖于更大范围以及更小范围的上下文信息。该模块分别进行4种不同核大小的池化操作,跨度较小的池化层学习较小目标的特征,跨度较大的池化层学习较大目标的特征,一定程度地解决了图像目标过分割和欠分割的问题。
(2).长短期记忆单元模块将图像上下方向、左右方向进行扫描得到两种序列,输入至LSTM网络得到新的输出序列,借助LSTM能够建模全局依赖,使得每一像素的判别在全局上取决于上下左右的像素,最后恢复至二维图像,提升了图像分割的准确率。
总的来说,本发明的基于全卷积和长短期记忆单元的场景语义分割方法通过金字塔池化模块引入多尺度信息、通过长短期记忆单元模块联系全局和局部信息,首次同时将金字塔池化模块和长短期记忆单元模块同时运用在场景语义分割中,能够有效地解决场景图像分割准确率低、图像过分割和欠分割的问题,最终得到较好的场景标注结果。
附图说明
图1为本发明场景语义分割方法的训练测试流程图;
图2为本发明的前端网络结构图;
图3为本发明的金字塔池化模块和长短期记忆单元模块结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施与和附图,对本发明作进一步详细说明。
如图1所示,本实施例中的基于全卷积和长短期记忆单元的场景语义分割方法,其具体步骤如下:
S1:构建基于全卷积、结合多尺度融合与长短期记忆单元的深度神经网络。
如图2所示,前端卷积神经网络模块基本结构由VGG-16修改而来,VGG-16的主要组成部分是5个group的卷积层、3个全连接层、1个Softmax层,本实施例中使用前端网络采用VGG-16的前5个group的卷积层,并去除第4和第5个group的池化层以及最后3个全连接层。其中,第1个group(即卷积模块一)包含2个卷积层和ReLU层以及1个最大池化层,卷积核大小为3x3,fi lter个数为64,池化层间隔为2;第2个group(即卷积模块二)包含2个卷积层和ReLU层以及1个最大池化层,卷积核大小为3x3,fi lter个数为128,池化层间隔为2;第3个group(即卷积模块三)包含3个卷积层和ReLU层以及1个最大池化层,卷积核大小为3x3,filter个数为256,池化层间隔为2;第4个group(即卷积模块四)包含3个卷积层和ReLU层,卷积核大小为3x3,fi lter个数为512;第5个group(即卷积模块五)包含3个卷积层和ReLU层,卷积核大小为3x3,filter个数为512。上述描述中,ReLU层为修正线性单元层。
如图3所示,其中CNN和Feature Map分别表示前端网络和由前端网络得到的特征图。金字塔池化模块由4个不同核大小的池化分支组成,4个分支分别使用间隔为2、4、6、8的方式进行池化来针对不同尺度的目标得到不同分辨率的特征图,并在池化后的特征图增加一个3x3的卷积以提升网络的学习能力。由于不同池化方式带来的特征图分辨率不同的问题,本方法使用转置卷积对池化后的特征图进行分辨率提升,分别对池化间隔为2、4、6、8的特征图进行间隔为2、4、6、8的转置卷积操作。
如图3所示,长短期记忆单元模块包含两个方向的扫描序列,对前端网络得到的特征图进行上下方向的扫描得到上下序列、进行左右方向的扫描得到左右序列。本方法分别将每一通扫描得到的序列输入长短期记忆单元,其隐层单元个数和序列长度相同,最终得到相同长度的输出序列,并恢复为二维特征图。
本发明的方法中,最终将三个模块得到特征图做串联连接,并增加额外的一层卷积层得到分类特征,输入给最后的Softmax层。
S2:输入场景图像,在深度神经网络中进行一次前向传播得到预测图像A;输入标注图像进行尺度缩减得到与预测图像相同分辨率的标注图像A;以Softmax损失为目标函数、随机梯度下降为优化方法,对步骤S1得到的深度神经网络进行更新。标注图像和场景图像属于训练数据集的构建问题,图像分类问题中,本发明的训练集中,有一系列图片和相应的类别标签,分别作为原始的场景图像和标注图像,这是本领域内的公知常识,故在本发明中不作过多讨论。
S2中,所述权值更新的具体过程为:
S21:网络初始化:使用在ImageNet数据集上预训练的VGG-16网络的参数作为前端网络的初始值,金字塔池化模块中的所有卷积层由标准高斯分布进行参数初始化,长短期记忆单元使用标准均匀分布初始化参数。
S22:训练:比对预测图像和标注图像,以每一像素的softmax损失的和作为目标函数,使用随机梯度下降法为优化方法,初始学习率设置为0.001,对深度神经网络进行权值更新。
S3:循环步骤S22,根据loss的下降效果适当降低学习率,直到损失下降到无法下降是结束训练。
S4:输入新的场景图像至已训练好的深度神经网络,并做双线性插值到原图分辨率,得到该场景的语义分割结果。本方法在训练阶段对图像标注以图像金字塔的方式做尺度缩减,使得标注图像分辨率和最终深度神经网络得到的特征图相同。以图像标注为准,计算每一个像素的Softmax损失,并将所有像素的损失和作为目标函数进行优化。
本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。
Claims (5)
1.一种基于全卷积和长短期记忆单元的场景语义分割方法,其特征在于,包括如下步骤:
S1:构建基于全卷积、金字塔池化模块与长短期记忆单元模块的深度神经网络;
S2:输入场景图像,在深度神经网络中进行一次前向传播得到预测图像A;输入标注图像进行尺度缩减后得到与预测图像同分辨率的标注图像A;比对预测图像A和标注图像A,以Softmax损失为目标函数,对步骤1得到的深度神经网络进行权值更新;
S3:多次进行步骤S2,直到损失无法下降时结束训练;
S4:输入新的场景图像至已训练好的深度神经网络,并做双线性插值到原图分辨率,得到该场景的语义分割结果。
2.根据权利要求1所述的一种基于全卷积和长短期记忆单元的场景语义分割方法,其特征在于,所述深度神经网络的结构包括前端网络和后端网络,所述前端网络基于VGG网络,由5个卷积模块组成;其中,卷积模块一、卷积模块二均包括2个卷积层、1个修正线性单元层和1个池化层,卷积模块三包括3个卷积层、个修正线性单元层和1个池化层,卷积模块四、卷积模块五均包括3个卷积层和1个修正线性单元层;所述后端网络由金字塔池化模块和长短期记忆单元组成。
3.根据权利要求2所述的基于全卷积和长短期记忆单元的场景语义分割方法,其特征在于:所述金字塔池化模块针对场景图像中的不同尺度目标提取特征;所述金字塔池化模块中分别进行4种不同核大小的池化操作;在每个池化层后分别连接一个卷积层。
4.根据权利要求2或3所述的基于全卷积和长短期记忆单元的场景语义分割方法,其特征在于:所述长短期记忆单元从图像在二维邻域上强相关性出发;该模块由两部分组成,垂直扫描模块和水平扫描模块。
5.根据权利要求2所述的基于全卷积和长短期记忆单元的场景语义分割方法,其特征在于,S2中,所述权值更新的具体过程为:
S21:网络初始化:使用在ImageNet数据集上预训练的VGG-16网络的参数作为前端网络的初始值,金字塔池化模块中的所有卷积层由标准高斯分布进行参数初始化,长短期记忆单元使用标准均匀分布初始化参数;
S22:训练:比对预测图像A和标注图像A,以每一像素的softmax损失的和作为目标函数,使用随机梯度下降法为优化方法,初始学习率设置为0.001,后面根据loss的下降效果适当降低学习率,当loss下降到一定程度不再下降时结束训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710739098.6A CN107480726A (zh) | 2017-08-25 | 2017-08-25 | 一种基于全卷积和长短期记忆单元的场景语义分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710739098.6A CN107480726A (zh) | 2017-08-25 | 2017-08-25 | 一种基于全卷积和长短期记忆单元的场景语义分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107480726A true CN107480726A (zh) | 2017-12-15 |
Family
ID=60602293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710739098.6A Pending CN107480726A (zh) | 2017-08-25 | 2017-08-25 | 一种基于全卷积和长短期记忆单元的场景语义分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107480726A (zh) |
Cited By (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108549895A (zh) * | 2018-04-17 | 2018-09-18 | 深圳市唯特视科技有限公司 | 一种基于对抗网络的半监督语义分割方法 |
CN108764333A (zh) * | 2018-05-28 | 2018-11-06 | 北京纵目安驰智能科技有限公司 | 一种基于时间序列级联的语义分割方法、系统、终端和存储介质 |
CN108791302A (zh) * | 2018-06-25 | 2018-11-13 | 大连大学 | 驾驶员行为建模系统 |
CN108830855A (zh) * | 2018-04-02 | 2018-11-16 | 华南理工大学 | 一种基于多尺度低层特征融合的全卷积网络语义分割方法 |
CN108921852A (zh) * | 2018-06-01 | 2018-11-30 | 大连理工大学 | 基于视差与平面拟合的双分支室外非结构化地形分割网络 |
CN109101975A (zh) * | 2018-08-20 | 2018-12-28 | 电子科技大学 | 基于全卷积神经网络的图像语义分割方法 |
CN109145920A (zh) * | 2018-08-21 | 2019-01-04 | 电子科技大学 | 一种基于深度神经网络的图像语义分割方法 |
CN109145922A (zh) * | 2018-09-10 | 2019-01-04 | 成都品果科技有限公司 | 一种自动抠图系统 |
CN109145983A (zh) * | 2018-08-21 | 2019-01-04 | 电子科技大学 | 一种基于轻量化网络的实时场景图像语义分割方法 |
CN109241872A (zh) * | 2018-08-20 | 2019-01-18 | 电子科技大学 | 基于多级网络的图像语义快速分割方法 |
CN109300470A (zh) * | 2018-09-17 | 2019-02-01 | 平安科技(深圳)有限公司 | 混音分离方法和混音分离装置 |
CN109325534A (zh) * | 2018-09-22 | 2019-02-12 | 天津大学 | 一种基于双向多尺度金字塔的语义分割方法 |
CN109360206A (zh) * | 2018-09-08 | 2019-02-19 | 华中农业大学 | 基于深度学习的大田稻穗分割方法 |
CN109522600A (zh) * | 2018-10-16 | 2019-03-26 | 浙江大学 | 基于组合深度神经网络的复杂装备剩余使用寿命预测方法 |
CN109635662A (zh) * | 2018-11-14 | 2019-04-16 | 浙江科技学院 | 一种基于卷积神经网络的道路场景语义分割方法 |
CN109636905A (zh) * | 2018-12-07 | 2019-04-16 | 东北大学 | 基于深度卷积神经网络的环境语义建图方法 |
CN109919059A (zh) * | 2019-02-26 | 2019-06-21 | 四川大学 | 基于深度网络层次化与多任务训练的显著性物体检测方法 |
CN109949332A (zh) * | 2017-12-20 | 2019-06-28 | 北京京东尚科信息技术有限公司 | 用于处理图像的方法和装置 |
CN109949209A (zh) * | 2019-03-06 | 2019-06-28 | 武汉工程大学 | 一种基于深度学习的绳索检测与去除方法 |
CN110047075A (zh) * | 2019-03-15 | 2019-07-23 | 天津大学 | 一种基于对抗网络的ct图像分割方法 |
CN110110578A (zh) * | 2019-02-21 | 2019-08-09 | 北京工业大学 | 一种室内场景语义标注方法 |
CN110119681A (zh) * | 2019-04-04 | 2019-08-13 | 平安科技(深圳)有限公司 | 一种文本行提取方法及装置、电子设备 |
CN110222752A (zh) * | 2019-05-28 | 2019-09-10 | 北京金山数字娱乐科技有限公司 | 图像处理方法、系统、计算机设备、存储介质和芯片 |
CN110232394A (zh) * | 2018-03-06 | 2019-09-13 | 华南理工大学 | 一种多尺度图像语义分割方法 |
CN110246084A (zh) * | 2019-05-16 | 2019-09-17 | 五邑大学 | 一种超分辨率图像重构方法及其系统、装置、存储介质 |
CN110322446A (zh) * | 2019-07-01 | 2019-10-11 | 华中科技大学 | 一种基于相似性空间对齐的域自适应语义分割方法 |
CN110363210A (zh) * | 2018-04-10 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种图像语义分割模型的训练方法和服务器 |
CN110706239A (zh) * | 2019-09-26 | 2020-01-17 | 哈尔滨工程大学 | 融合全卷积神经网络与改进aspp模块的场景分割方法 |
CN110738107A (zh) * | 2019-09-06 | 2020-01-31 | 上海衡道医学病理诊断中心有限公司 | 一种具备模型迁移功能的显微图像识别分割方法 |
CN110766152A (zh) * | 2018-07-27 | 2020-02-07 | 富士通株式会社 | 用于训练深度神经网络的方法和装置 |
CN110782466A (zh) * | 2018-07-31 | 2020-02-11 | 阿里巴巴集团控股有限公司 | 图片分割方法、装置和系统 |
CN111160109A (zh) * | 2019-12-06 | 2020-05-15 | 北京联合大学 | 一种基于深度神经网络的道路分割方法及系统 |
CN111444834A (zh) * | 2020-03-26 | 2020-07-24 | 同盾控股有限公司 | 图像文本行检测方法、装置、设备及存储介质 |
CN111444914A (zh) * | 2020-03-23 | 2020-07-24 | 复旦大学 | 一种基于PU-Learning的图像语义分割方法 |
CN111786738A (zh) * | 2020-07-01 | 2020-10-16 | 中国人民解放军陆军工程大学 | 基于长短期记忆的抗干扰学习的网络结构及学习方法 |
CN112132257A (zh) * | 2020-08-17 | 2020-12-25 | 河北大学 | 基于金字塔池化及长期记忆结构的神经网络模型训练方法 |
CN112164065A (zh) * | 2020-09-27 | 2021-01-01 | 华南理工大学 | 一种基于轻量化卷积神经网络的实时图像语义分割方法 |
CN112465826A (zh) * | 2019-09-06 | 2021-03-09 | 上海高德威智能交通系统有限公司 | 视频语义分割方法及装置 |
CN115100540A (zh) * | 2022-06-30 | 2022-09-23 | 电子科技大学 | 一种高分辨率遥感影像道路自动提取的方法 |
CN118588245A (zh) * | 2024-07-29 | 2024-09-03 | 阿尔麦德智慧医疗(湖州)有限公司 | 基于ai移动医疗超声造影图像分析与辅助系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787482A (zh) * | 2016-02-26 | 2016-07-20 | 华北电力大学 | 一种基于深度卷积神经网络的特定目标轮廓图像分割方法 |
CN105844239A (zh) * | 2016-03-23 | 2016-08-10 | 北京邮电大学 | 一种基于cnn和lstm的暴恐视频检测方法 |
CN106022353A (zh) * | 2016-05-05 | 2016-10-12 | 浙江大学 | 一种基于超像素分割的图像语义标注方法 |
CN106570497A (zh) * | 2016-10-08 | 2017-04-19 | 中国科学院深圳先进技术研究院 | 一种场景图像的文本检测方法和装置 |
-
2017
- 2017-08-25 CN CN201710739098.6A patent/CN107480726A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787482A (zh) * | 2016-02-26 | 2016-07-20 | 华北电力大学 | 一种基于深度卷积神经网络的特定目标轮廓图像分割方法 |
CN105844239A (zh) * | 2016-03-23 | 2016-08-10 | 北京邮电大学 | 一种基于cnn和lstm的暴恐视频检测方法 |
CN106022353A (zh) * | 2016-05-05 | 2016-10-12 | 浙江大学 | 一种基于超像素分割的图像语义标注方法 |
CN106570497A (zh) * | 2016-10-08 | 2017-04-19 | 中国科学院深圳先进技术研究院 | 一种场景图像的文本检测方法和装置 |
Cited By (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109949332A (zh) * | 2017-12-20 | 2019-06-28 | 北京京东尚科信息技术有限公司 | 用于处理图像的方法和装置 |
CN110232394B (zh) * | 2018-03-06 | 2021-08-10 | 华南理工大学 | 一种多尺度图像语义分割方法 |
CN110232394A (zh) * | 2018-03-06 | 2019-09-13 | 华南理工大学 | 一种多尺度图像语义分割方法 |
CN108830855A (zh) * | 2018-04-02 | 2018-11-16 | 华南理工大学 | 一种基于多尺度低层特征融合的全卷积网络语义分割方法 |
CN108830855B (zh) * | 2018-04-02 | 2022-03-25 | 华南理工大学 | 一种基于多尺度低层特征融合的全卷积网络语义分割方法 |
CN110363210A (zh) * | 2018-04-10 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种图像语义分割模型的训练方法和服务器 |
CN110363210B (zh) * | 2018-04-10 | 2023-05-05 | 腾讯科技(深圳)有限公司 | 一种图像语义分割模型的训练方法和服务器 |
CN108549895A (zh) * | 2018-04-17 | 2018-09-18 | 深圳市唯特视科技有限公司 | 一种基于对抗网络的半监督语义分割方法 |
CN108764333B (zh) * | 2018-05-28 | 2024-07-26 | 北京纵目安驰智能科技有限公司 | 一种用于语义分割的学习器训练方法、系统、终端和存储介质 |
CN108764333A (zh) * | 2018-05-28 | 2018-11-06 | 北京纵目安驰智能科技有限公司 | 一种基于时间序列级联的语义分割方法、系统、终端和存储介质 |
CN108921852B (zh) * | 2018-06-01 | 2021-05-07 | 大连理工大学 | 基于视差与平面拟合的双分支室外非结构化地形分割网络 |
CN108921852A (zh) * | 2018-06-01 | 2018-11-30 | 大连理工大学 | 基于视差与平面拟合的双分支室外非结构化地形分割网络 |
CN108791302B (zh) * | 2018-06-25 | 2020-05-19 | 大连大学 | 驾驶员行为建模系统 |
CN108791302A (zh) * | 2018-06-25 | 2018-11-13 | 大连大学 | 驾驶员行为建模系统 |
CN110766152A (zh) * | 2018-07-27 | 2020-02-07 | 富士通株式会社 | 用于训练深度神经网络的方法和装置 |
CN110766152B (zh) * | 2018-07-27 | 2023-08-04 | 富士通株式会社 | 用于训练深度神经网络的方法和装置 |
CN110782466A (zh) * | 2018-07-31 | 2020-02-11 | 阿里巴巴集团控股有限公司 | 图片分割方法、装置和系统 |
CN110782466B (zh) * | 2018-07-31 | 2023-05-02 | 阿里巴巴集团控股有限公司 | 图片分割方法、装置和系统 |
CN109241872A (zh) * | 2018-08-20 | 2019-01-18 | 电子科技大学 | 基于多级网络的图像语义快速分割方法 |
CN109101975B (zh) * | 2018-08-20 | 2022-01-25 | 电子科技大学 | 基于全卷积神经网络的图像语义分割方法 |
CN109241872B (zh) * | 2018-08-20 | 2022-03-18 | 电子科技大学 | 基于多级网络的图像语义快速分割方法 |
CN109101975A (zh) * | 2018-08-20 | 2018-12-28 | 电子科技大学 | 基于全卷积神经网络的图像语义分割方法 |
CN109145983A (zh) * | 2018-08-21 | 2019-01-04 | 电子科技大学 | 一种基于轻量化网络的实时场景图像语义分割方法 |
CN109145920A (zh) * | 2018-08-21 | 2019-01-04 | 电子科技大学 | 一种基于深度神经网络的图像语义分割方法 |
CN109360206B (zh) * | 2018-09-08 | 2021-11-12 | 华中农业大学 | 基于深度学习的大田稻穗分割方法 |
CN109360206A (zh) * | 2018-09-08 | 2019-02-19 | 华中农业大学 | 基于深度学习的大田稻穗分割方法 |
CN109145922B (zh) * | 2018-09-10 | 2022-03-29 | 成都品果科技有限公司 | 一种自动抠图系统 |
CN109145922A (zh) * | 2018-09-10 | 2019-01-04 | 成都品果科技有限公司 | 一种自动抠图系统 |
CN109300470A (zh) * | 2018-09-17 | 2019-02-01 | 平安科技(深圳)有限公司 | 混音分离方法和混音分离装置 |
CN109325534A (zh) * | 2018-09-22 | 2019-02-12 | 天津大学 | 一种基于双向多尺度金字塔的语义分割方法 |
CN109522600A (zh) * | 2018-10-16 | 2019-03-26 | 浙江大学 | 基于组合深度神经网络的复杂装备剩余使用寿命预测方法 |
CN109635662B (zh) * | 2018-11-14 | 2022-06-21 | 浙江科技学院 | 一种基于卷积神经网络的道路场景语义分割方法 |
CN109635662A (zh) * | 2018-11-14 | 2019-04-16 | 浙江科技学院 | 一种基于卷积神经网络的道路场景语义分割方法 |
CN109636905A (zh) * | 2018-12-07 | 2019-04-16 | 东北大学 | 基于深度卷积神经网络的环境语义建图方法 |
CN109636905B (zh) * | 2018-12-07 | 2023-01-24 | 东北大学 | 基于深度卷积神经网络的环境语义建图方法 |
CN110110578A (zh) * | 2019-02-21 | 2019-08-09 | 北京工业大学 | 一种室内场景语义标注方法 |
CN110110578B (zh) * | 2019-02-21 | 2023-09-29 | 北京工业大学 | 一种室内场景语义标注方法 |
CN109919059A (zh) * | 2019-02-26 | 2019-06-21 | 四川大学 | 基于深度网络层次化与多任务训练的显著性物体检测方法 |
CN109919059B (zh) * | 2019-02-26 | 2021-01-26 | 四川大学 | 基于深度网络层次化与多任务训练的显著性物体检测方法 |
CN109949209B (zh) * | 2019-03-06 | 2022-07-19 | 武汉工程大学 | 一种基于深度学习的绳索检测与去除方法 |
CN109949209A (zh) * | 2019-03-06 | 2019-06-28 | 武汉工程大学 | 一种基于深度学习的绳索检测与去除方法 |
CN110047075A (zh) * | 2019-03-15 | 2019-07-23 | 天津大学 | 一种基于对抗网络的ct图像分割方法 |
CN110119681A (zh) * | 2019-04-04 | 2019-08-13 | 平安科技(深圳)有限公司 | 一种文本行提取方法及装置、电子设备 |
CN110119681B (zh) * | 2019-04-04 | 2023-11-24 | 平安科技(深圳)有限公司 | 一种文本行提取方法及装置、电子设备 |
CN110246084B (zh) * | 2019-05-16 | 2023-03-31 | 五邑大学 | 一种超分辨率图像重构方法及其系统、装置、存储介质 |
CN110246084A (zh) * | 2019-05-16 | 2019-09-17 | 五邑大学 | 一种超分辨率图像重构方法及其系统、装置、存储介质 |
CN110222752B (zh) * | 2019-05-28 | 2021-11-16 | 北京金山数字娱乐科技有限公司 | 图像处理方法、系统、计算机设备、存储介质和芯片 |
CN110222752A (zh) * | 2019-05-28 | 2019-09-10 | 北京金山数字娱乐科技有限公司 | 图像处理方法、系统、计算机设备、存储介质和芯片 |
CN110322446A (zh) * | 2019-07-01 | 2019-10-11 | 华中科技大学 | 一种基于相似性空间对齐的域自适应语义分割方法 |
CN110738107A (zh) * | 2019-09-06 | 2020-01-31 | 上海衡道医学病理诊断中心有限公司 | 一种具备模型迁移功能的显微图像识别分割方法 |
CN112465826B (zh) * | 2019-09-06 | 2023-05-16 | 上海高德威智能交通系统有限公司 | 视频语义分割方法及装置 |
CN112465826A (zh) * | 2019-09-06 | 2021-03-09 | 上海高德威智能交通系统有限公司 | 视频语义分割方法及装置 |
CN110706239A (zh) * | 2019-09-26 | 2020-01-17 | 哈尔滨工程大学 | 融合全卷积神经网络与改进aspp模块的场景分割方法 |
CN111160109B (zh) * | 2019-12-06 | 2023-08-18 | 北京联合大学 | 一种基于深度神经网络的道路分割方法及系统 |
CN111160109A (zh) * | 2019-12-06 | 2020-05-15 | 北京联合大学 | 一种基于深度神经网络的道路分割方法及系统 |
CN111444914A (zh) * | 2020-03-23 | 2020-07-24 | 复旦大学 | 一种基于PU-Learning的图像语义分割方法 |
CN111444834A (zh) * | 2020-03-26 | 2020-07-24 | 同盾控股有限公司 | 图像文本行检测方法、装置、设备及存储介质 |
CN111444834B (zh) * | 2020-03-26 | 2024-10-01 | 同盾控股有限公司 | 图像文本行检测方法、装置、设备及存储介质 |
CN111786738B (zh) * | 2020-07-01 | 2022-06-03 | 中国人民解放军陆军工程大学 | 基于长短期记忆的抗干扰学习的网络结构及学习方法 |
CN111786738A (zh) * | 2020-07-01 | 2020-10-16 | 中国人民解放军陆军工程大学 | 基于长短期记忆的抗干扰学习的网络结构及学习方法 |
CN112132257A (zh) * | 2020-08-17 | 2020-12-25 | 河北大学 | 基于金字塔池化及长期记忆结构的神经网络模型训练方法 |
CN112164065A (zh) * | 2020-09-27 | 2021-01-01 | 华南理工大学 | 一种基于轻量化卷积神经网络的实时图像语义分割方法 |
CN112164065B (zh) * | 2020-09-27 | 2023-10-13 | 华南理工大学 | 一种基于轻量化卷积神经网络的实时图像语义分割方法 |
CN115100540A (zh) * | 2022-06-30 | 2022-09-23 | 电子科技大学 | 一种高分辨率遥感影像道路自动提取的方法 |
CN115100540B (zh) * | 2022-06-30 | 2024-05-07 | 电子科技大学 | 一种高分辨率遥感影像道路自动提取的方法 |
CN118588245A (zh) * | 2024-07-29 | 2024-09-03 | 阿尔麦德智慧医疗(湖州)有限公司 | 基于ai移动医疗超声造影图像分析与辅助系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107480726A (zh) | 一种基于全卷积和长短期记忆单元的场景语义分割方法 | |
CN110428428B (zh) | 一种图像语义分割方法、电子设备和可读存储介质 | |
CN110334705B (zh) | 一种结合全局和局部信息的场景文本图像的语种识别方法 | |
CN107506761B (zh) | 基于显著性学习卷积神经网络的脑部图像分割方法及系统 | |
CN106157319B (zh) | 基于卷积神经网络的区域和像素级融合的显著性检测方法 | |
CN110210551B (zh) | 一种基于自适应主体敏感的视觉目标跟踪方法 | |
CN105205448B (zh) | 基于深度学习的文字识别模型训练方法和识别方法 | |
CN110956185B (zh) | 一种图像显著目标的检测方法 | |
CN110119703B (zh) | 一种安防场景下融合注意力机制和时空图卷积神经网络的人体动作识别方法 | |
Kumar et al. | Image based tomato leaf disease detection | |
CN104217214B (zh) | 基于可配置卷积神经网络的rgb‑d人物行为识别方法 | |
CN105701507B (zh) | 基于动态随机池化卷积神经网络的图像分类方法 | |
CN107679462A (zh) | 一种基于小波的深度多特征融合分类方法 | |
CN109711413A (zh) | 基于深度学习的图像语义分割方法 | |
CN110276402B (zh) | 一种基于深度学习语义边界增强的盐体识别方法 | |
CN107516096A (zh) | 一种字符识别方法及装置 | |
CN107368831A (zh) | 一种自然场景图像中的英文文字和数字识别方法 | |
CN112347970B (zh) | 一种基于图卷积神经网络的遥感影像地物识别方法 | |
CN110852316A (zh) | 一种采用密集结构卷积网络的图像篡改检测和定位方法 | |
CN106778768A (zh) | 基于多特征融合的图像场景分类方法 | |
CN113256649B (zh) | 一种基于深度学习的遥感图像选站选线语义分割方法 | |
CN113378937B (zh) | 一种基于自监督增强的小样本图像分类方法及系统 | |
CN110675405B (zh) | 基于注意力机制的one-shot图像分割方法 | |
CN113298817A (zh) | 一种准确率高的遥感图像语义分割方法 | |
CN116091946A (zh) | 一种基于YOLOv5的无人机航拍图像目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171215 |
|
RJ01 | Rejection of invention patent application after publication |