CN107644426A - 基于金字塔池化编解码结构的图像语义分割方法 - Google Patents
基于金字塔池化编解码结构的图像语义分割方法 Download PDFInfo
- Publication number
- CN107644426A CN107644426A CN201710948567.5A CN201710948567A CN107644426A CN 107644426 A CN107644426 A CN 107644426A CN 201710948567 A CN201710948567 A CN 201710948567A CN 107644426 A CN107644426 A CN 107644426A
- Authority
- CN
- China
- Prior art keywords
- mrow
- characteristic pattern
- msub
- network
- cnn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于金字塔池化编解码结构的图像语义分割方法,包括:通过一个包含卷积神经网络模型和金字塔池化模型的编码网络对输入图像进行处理,提取输入图像的高维特征信息,构成深层特征图;通过一个包含反向卷积神经网络模型的解码网络,将深层特征图恢复至与输入图像相同的分辨率;通过一个包含输出通道为类别数的卷积层和一个Softmax层的分类器,将解码网络输出的特征图进行分类,实现图像语义分割。该方法在进一步提高网络对图像语义分割的能力的同时兼顾了网络模型大小和运算速度。
Description
技术领域
本发明涉及计算机视觉领域,尤其涉及一种基于金字塔池化编解码结构的图像语义分割方法。
背景技术
图像语义分割融合了传统的图像分割和目标识别任务,需要将图像分割成几组具有特定语义含义的像素区域并且识别出每一类区域,得到一幅具有语义标注的图像。例如,对于一张包含复杂场景的交通图像,计算机需要自动识别出行人、车辆、建筑物等类别,对于同一类别的目标,需要自动分割出其准确的形状和位置,用同一种像素值表示出来。
目前图像语义分割的算法主要分为两类。第一类可以称之为传统方法,其利用图像像素值之间的联系,通过简单加权或者概率图模型来判断不同的像素值是否属于同一类别。这类方法的典型代表是N-cut算法,但是由于这类方法只利用了图像中的颜色信息,对于颜色相近的不同类目标或颜色反差较大的同类目标都不能较好地识别出来,其分割结果并不准确。第二类可以称之为主流方法,其利用深度卷积网络来进行图像语义分割。利用神经网络良好的学习性能,来学习不同目标物体的深度特征信息,并且将传统的分类网络的全连接层改为卷积层,直接得到分割好的图像。
现有主流方法具有几下不足:
由于神经网络的发展,当前主流方法均采用了深度神经网络作为其主要框架,并且为了进一步提升性能,一般还将条件随机场等概率模型作为一种后处理手段或嵌入到神经网络中。这种追求高性能的方式使得主流方法的网络模型极其庞大,需要大量的运算资源,很难实际应用于生活中。同时,随着自动驾驶等领域的发展,急需一种可以对图片进行实时分割的方法,而目前的主流方法在运行速度上都比较欠缺。
发明内容
本发明的目的是提供一种基于金字塔池化编解码结构的图像语义分割方法,在进一步提高网络对图像语义分割的能力的同时兼顾了网络模型大小和运算速度。
本发明的目的是通过以下技术方案实现的:
一种基于金字塔池化编解码结构的图像语义分割方法,包括:
通过一个包含卷积神经网络模型和金字塔池化模型的编码网络对输入图像进行处理,提取输入图像的高维特征信息,构成深层特征图;
通过一个包含反向卷积神经网络模型的解码网络,将深层特征图恢复至与输入图像相同的分辨率;
通过一个包含输出通道为类别数的卷积层和一个Softmax层的分类器,将解码网络输出的特征图进行分类,实现图像语义分割。
所述通过一个包含卷积神经网络模型和金字塔池化模型的编码网络对输入图像进行处理,提取输入图像的高维特征信息,构成深层特征图包括:
卷积神经网络模型包括卷积操作fcnn和最大池化操作fmp,操作过程表示为:
X1=fcnn(I;θcnn),X1∈RM×N×D;
X2=fmp(X1),X2∈RM×N×D;
其中,I表示输入图像,Xi,i=1,2,表示相应操作后提取的特征图,θcnn表示数学计算过程中需要通过机器学习确定的参数,M和N表示特征图的空间分辨率,D表示特征图的通道数;
通过金字塔池化模型对卷积神经网络模型输出的特征图,分别进行P个平行的池化操作,得到P组不同尺度的特征图;P组不同尺度的特征图代表了不同子区域的上下文信息;并使用卷积层对每一尺度的特征图进行调整,然后各自通过一个上采样过程恢复到池化之前的大小,再与卷积神经网络模型输出的特征图按通道叠加在一起得到一个包含不同区域特性的深层特征图。
所述通过一个包含反向卷积神经网络模型的解码网络,将深层特征图恢复至与输入图像相同的分辨率包括:
反向卷积神经网络模型包括上采样操作fus和卷积操作fcnn,操作过程表示为:
其中,X表示深层特征图,θcnn表示数学计算过程中需要通过机器学习确定的参数,M'和N'表示特征图的空间分辨率,Dj,j=1,2表示相应特征图的通道数。
所述通过一个包含输出通道为类别数的卷积层和一个Softmax层的分类器,将解码网络输出的特征图进行分类包括:
先通过卷积操作fcnn将特征图的通道数减少为需要识别的目标的总数目L,再通过Softmax层的分类操作fs得到最后的分类结果I’,操作过程表示为:
X'=fcnn(Y;θcnn),X'∈RM'×N'×L;
I'=fs(X');
其中,Y表示解码网络输出的特征图,θcnn表示数学计算过程中需要通过机器学习确定的参数,M'和N'表示特征图的空间分辨率。
由上述本发明提供的技术方案可以看出,利用一种新的网络结构来优化网络提取特征信息的能力,使得其在性能上有较大的提升,同时采用非对称设计进一步减少模型参数,提升运行速度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于金字塔池化编解码结构的图像语义分割方法的流程图;
图2为本发明实施例提供的金字塔池化模型的结构示意图;
图3为本发明实施例提供的两种金字塔池化操作的示意图;
图4为本发明实施例提供的分类结果示意图;
图5为本发明实施例提供的图像语义分割网络的结构示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
图1为本发明实施例提供的一种基于金字塔池化编解码结构的图像语义分割方法的流程图。如图1所示,其主要包括:
步骤1、通过一个包含卷积神经网络模型和金字塔池化模型的编码网络对输入图像进行处理,提取输入图像的高维特征信息,构成深层特征图。
本发明实施例中,卷积神经网络模型可以为VGG16网络模型,并且去掉了原来VGG16网络模型的全连接层,仅保留卷积层,并且在Conv5-2处用一个特别设计的金字塔池化模型来提高网络对于不同层面,不同大小区域的上下文信息的提取能力。
本发明实施例中,卷积神经网络模型主要包括卷积操作fcnn和最大池化操作fmp,操作过程表示为:
X1=fcnn(I;θcnn),X1∈RM×N×D;
X2=fmp(X1),X2∈RM×N×D;
其中,I表示输入图像,Xi,i=1,2,表示相应操作后提取的特征图,θcnn表示数学计算过程中需要通过机器学习确定的参数,M和N表示特征图的空间分辨率,D表示特征图的通道数。
通过金字塔池化模型对卷积神经网络模型输出的特征图,分别进行P个平行的池化操作,得到P组不同尺度的特征图;P组不同尺度的特征图代表了不同子区域的上下文信息;并使用卷积层(可以使用卷积核为1×1的卷积层)对每一尺度的特征图进行调整,然后各自通过一个上采样过程(双线性插值)恢复到池化之前的大小,再与卷积神经网络模型输出的特征图按通道叠加在一起得到一个包含不同区域特性的深层特征图。
金字塔池化级数,即池化层的个数可以根据需要进行调整,池化窗口的大小也可以相应地修改。示例性的,如图2所示,采用了三层结构,池化后的特征图大小分别选择1×1、2×2和4×4。但是,考虑到场景的不同,池化形式也可以不同。一般来说,特征图的分辨率越大,金字塔池化级数就可以取得越高,提取的上下文信息就越丰富;相反,如果特征图的分辨率本身就较低,那么就只能相应降低级数。同时,池化时的stride选取在水平和竖直方向上可以不同,根据场景本身的特性而定。例如道路场景中一般中间是路面,两侧是建筑物,见图3,则将池化后的特征图分别设置成1×1、3×2和6×4更为合理。为了区分这两种模型,称前一种为原始金字塔池化(Original Pyramid Pooling),后一种为集中金字塔池化(Attention Pyramid Pooling)。本发明中选择平均池化作为该模型的池化方式。应用金字塔池化模型,该网络可以有效地提取到局部和全局信息来进行像素级的场景解析。
步骤2、通过一个包含反向卷积神经网络模型的解码网络,将深层特征图恢复至与输入图像相同的分辨率。
反向卷积神经网络模型包括上采样操作fus和卷积操作fcnn,每一个上采样层都和编码网络中的最大池化层一一对应,并且利用了最大池化层保留下来的参数来加快运算。
操作过程表示为:
其中,X表示深层特征图,θcnn表示数学计算过程中需要通过机器学习确定的参数,M'和N'表示特征图的空间分辨率,Dj,j=1,2表示相应特征图的通道数。
与许多分割算法不同,本发明中采用非对称结构,即解码网络不是编码网络的镜像,以此来减少模型参数,提升网络处理速度。通过实验,本发明发现在每两个上采样层之间只保留一个卷积层可以在确保网络性能下降不多的情况下较大地压缩网络规模。在编码网络中,最大池化过程中并没有像大多数网络那样存储完整的池化前的特征图来用于上采样过程,而是只保存了每一个池化窗口中最大值的位置和数值。这样在上采样中生成的特征图便是稀疏的,需要经过接下来的卷积层使其变密集。通过该设计,极大地减少了网络参数数目,提高了其处理速度。
步骤3、通过一个包含输出通道为类别数的卷积层和一个Softmax层的分类器,将解码网络输出的特征图进行分类,实现图像语义分割。
本发明实施例中,先通过卷积操作fcnn将特征图的通道数减少为需要识别的目标的总数目L,再通过Softmax层的分类操作fs得到最后的分类结果I’,操作过程表示为:
X'=fcnn(Y;θcnn),X'∈RM'×N'×L;
I'=fs(X');
其中,Y表示解码网络输出的特征图,θcnn表示数学计算过程中需要通过机器学习确定的参数,M'和N'表示特征图的空间分辨率。
如图4所示,右侧为分类前的原始图,左侧为最终分类结果。
基于本发明实施例提供的上述方案,通过编码网络、解码网络及分类器构成了图像语义分割网络,整个网络结构如图5所示。该网络可以通过端到端的fine-tune来使其适应于不同的任务,训练时采用加权的交叉熵损失函数作为loss函数。
本发明实施例提供的上述技术方案主要具有如下优点:在进一步提高网络对图像语义分割的能力的同时兼顾了网络模型大小和运算速度,该方案的高性能和实时处理的能力还可以为自动驾驶提供即时的场景解析数据,提升自动驾驶系统快速应对道路环境变化的能力。一方面,利用特别设计的金字塔池化模型有效地提取多层次不同区域大小的特征信息,提高原始网络对图像局部和全局信息的理解;另一方面,采用非对称网络结构,设计了解码网络,利用最大池化操作时保留的信息来恢复特征图的分辨率。通过以上设计,本技术方案在CamVid测试集中取得了64.2%mIoU的成绩,并且处理速度达到16.4FPS。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (4)
1.一种基于金字塔池化编解码结构的图像语义分割方法,其特征在于,包括:
通过一个包含卷积神经网络模型和金字塔池化模型的编码网络对输入图像进行处理,提取输入图像的高维特征信息,构成深层特征图;
通过一个包含反向卷积神经网络模型的解码网络,将深层特征图恢复至与输入图像相同的分辨率;
通过一个包含输出通道为类别数的卷积层和一个Softmax层的分类器,将解码网络输出的特征图进行分类,实现图像语义分割。
2.根据权利要求1所述的一种基于金字塔池化编解码结构的图像语义分割方法,其特征在于,所述通过一个包含卷积神经网络模型和金字塔池化模型的编码网络对输入图像进行处理,提取输入图像的高维特征信息,构成深层特征图包括:
卷积神经网络模型包括卷积操作fcnn和最大池化操作fmp,操作过程表示为:
X1=fcnn(I;θcnn),X1∈RM×N×D;
X2=fmp(X1),X2∈RM×N×D;
其中,I表示输入图像,Xi,i=1,2,表示相应操作后提取的特征图,θcnn表示数学计算过程中需要通过机器学习确定的参数,M和N表示特征图的空间分辨率,D表示特征图的通道数;
通过金字塔池化模型对卷积神经网络模型输出的特征图,分别进行P个平行的池化操作,得到P组不同尺度的特征图;P组不同尺度的特征图代表了不同子区域的上下文信息;并使用卷积层对每一尺度的特征图进行调整,然后各自通过一个上采样过程恢复到池化之前的大小,再与卷积神经网络模型输出的特征图按通道叠加在一起得到一个包含不同区域特性的深层特征图。
3.根据权利要求1所述的一种基于金字塔池化编解码结构的图像语义分割方法,其特征在于,所述通过一个包含反向卷积神经网络模型的解码网络,将深层特征图恢复至与输入图像相同的分辨率包括:
反向卷积神经网络模型包括上采样操作fus和卷积操作fcnn,操作过程表示为:
<mrow>
<msub>
<mi>X</mi>
<mn>3</mn>
</msub>
<mo>=</mo>
<msub>
<mi>f</mi>
<mrow>
<mi>u</mi>
<mi>s</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>X</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
<msub>
<mi>X</mi>
<mn>3</mn>
</msub>
<mo>&Element;</mo>
<msup>
<mi>R</mi>
<mrow>
<msup>
<mi>M</mi>
<mo>,</mo>
</msup>
<mo>&times;</mo>
<msup>
<mi>N</mi>
<mo>,</mo>
</msup>
<mo>&times;</mo>
<msub>
<mi>D</mi>
<mn>1</mn>
</msub>
</mrow>
</msup>
<mo>;</mo>
</mrow>
<mrow>
<mi>Y</mi>
<mo>=</mo>
<msub>
<mi>f</mi>
<mrow>
<mi>c</mi>
<mi>n</mi>
<mi>n</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>X</mi>
<mn>3</mn>
</msub>
<mo>;</mo>
<msub>
<mi>&theta;</mi>
<mrow>
<mi>c</mi>
<mi>n</mi>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>,</mo>
<mi>Y</mi>
<mo>&Element;</mo>
<msup>
<mi>R</mi>
<mrow>
<msup>
<mi>M</mi>
<mo>,</mo>
</msup>
<mo>&times;</mo>
<msup>
<mi>N</mi>
<mo>,</mo>
</msup>
<mo>&times;</mo>
<msub>
<mi>D</mi>
<mn>2</mn>
</msub>
</mrow>
</msup>
<mo>;</mo>
</mrow>
其中,X表示深层特征图,θcnn表示数学计算过程中需要通过机器学习确定的参数,M'和N'表示特征图的空间分辨率,Dj,j=1,2表示相应特征图的通道数。
4.根据权利要求1所述的一种基于金字塔池化编解码结构的图像语义分割方法,其特征在于,所述通过一个包含输出通道为类别数的卷积层和一个Softmax层的分类器,将解码网络输出的特征图进行分类包括:
先通过卷积操作fcnn将特征图的通道数减少为需要识别的目标的总数目L,再通过Softmax层的分类操作fs得到最后的分类结果I’,操作过程表示为:
X'=fcnn(Y;θcnn),X'∈RM'×N'×L;
I'=fs(X');
其中,Y表示解码网络输出的特征图,θcnn表示数学计算过程中需要通过机器学习确定的参数,M'和N'表示特征图的空间分辨率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710948567.5A CN107644426A (zh) | 2017-10-12 | 2017-10-12 | 基于金字塔池化编解码结构的图像语义分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710948567.5A CN107644426A (zh) | 2017-10-12 | 2017-10-12 | 基于金字塔池化编解码结构的图像语义分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107644426A true CN107644426A (zh) | 2018-01-30 |
Family
ID=61113523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710948567.5A Pending CN107644426A (zh) | 2017-10-12 | 2017-10-12 | 基于金字塔池化编解码结构的图像语义分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107644426A (zh) |
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427951A (zh) * | 2018-02-08 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质和计算机设备 |
CN108596330A (zh) * | 2018-05-16 | 2018-09-28 | 中国人民解放军陆军工程大学 | 一种并行特征全卷积神经网络及其构建方法 |
CN108830327A (zh) * | 2018-06-21 | 2018-11-16 | 中国科学技术大学 | 一种人群密度估计方法 |
CN108898594A (zh) * | 2018-06-27 | 2018-11-27 | 湖北工业大学 | 一种均质面板缺陷的检测方法 |
CN109002840A (zh) * | 2018-06-26 | 2018-12-14 | 北京纵目安驰智能科技有限公司 | 一种基于级联的语义分割方法、系统、终端和存储介质 |
CN109034162A (zh) * | 2018-07-13 | 2018-12-18 | 南京邮电大学 | 一种图像语义分割方法 |
CN109190752A (zh) * | 2018-07-27 | 2019-01-11 | 国家新闻出版广电总局广播科学研究院 | 基于深度学习的全局特征和局部特征的图像语义分割方法 |
CN109190626A (zh) * | 2018-07-27 | 2019-01-11 | 国家新闻出版广电总局广播科学研究院 | 一种基于深度学习的多路径特征融合的语义分割方法 |
CN109215034A (zh) * | 2018-07-06 | 2019-01-15 | 成都图必优科技有限公司 | 一种基于空间金字塔掩盖池化的弱监督图像语义分割方法 |
CN109241872A (zh) * | 2018-08-20 | 2019-01-18 | 电子科技大学 | 基于多级网络的图像语义快速分割方法 |
CN109389076A (zh) * | 2018-09-29 | 2019-02-26 | 深圳市商汤科技有限公司 | 图像分割方法及装置 |
CN109447994A (zh) * | 2018-11-05 | 2019-03-08 | 陕西师范大学 | 结合完全残差与特征融合的遥感图像分割方法 |
CN109766918A (zh) * | 2018-12-18 | 2019-05-17 | 南开大学 | 基于多层次上下文信息融合的显著性物体检测方法 |
CN109784283A (zh) * | 2019-01-21 | 2019-05-21 | 陕西师范大学 | 基于场景识别任务下的遥感图像目标提取方法 |
CN109919948A (zh) * | 2019-02-26 | 2019-06-21 | 华南理工大学 | 基于深度学习的鼻咽癌病灶分割模型训练方法及分割方法 |
CN110047068A (zh) * | 2019-04-19 | 2019-07-23 | 山东大学 | 基于金字塔场景分析网络的mri脑肿瘤分割方法及系统 |
CN110070091A (zh) * | 2019-04-30 | 2019-07-30 | 福州大学 | 用于街景理解的基于动态插值重建的语义分割方法及系统 |
CN110084274A (zh) * | 2019-03-29 | 2019-08-02 | 南京邮电大学 | 实时图像语义分割方法及系统、可读存储介质和终端 |
CN110136141A (zh) * | 2019-04-24 | 2019-08-16 | 佛山科学技术学院 | 一种面向复杂环境的图像语义分割方法及装置 |
CN110188768A (zh) * | 2019-05-09 | 2019-08-30 | 南京邮电大学 | 实时图像语义分割方法及系统 |
CN110197492A (zh) * | 2019-05-23 | 2019-09-03 | 山东师范大学 | 一种心脏mri左心室分割方法及系统 |
CN110232394A (zh) * | 2018-03-06 | 2019-09-13 | 华南理工大学 | 一种多尺度图像语义分割方法 |
CN110349164A (zh) * | 2019-07-19 | 2019-10-18 | 北京华捷艾米科技有限公司 | 一种图像语义分割方法、装置及终端设备 |
CN110363776A (zh) * | 2019-06-28 | 2019-10-22 | 联想(北京)有限公司 | 图像处理方法及电子设备 |
WO2019222951A1 (en) * | 2018-05-24 | 2019-11-28 | Nokia Technologies Oy | Method and apparatus for computer vision |
CN110533045A (zh) * | 2019-07-31 | 2019-12-03 | 中国民航大学 | 一种结合注意力机制的行李x光违禁品图像语义分割方法 |
CN110633706A (zh) * | 2019-08-02 | 2019-12-31 | 杭州电子科技大学 | 一种基于金字塔网络的语义分割方法 |
WO2020078269A1 (zh) * | 2018-10-16 | 2020-04-23 | 腾讯科技(深圳)有限公司 | 三维图像的语义分割方法、装置、终端及存储介质 |
CN111091524A (zh) * | 2018-10-08 | 2020-05-01 | 天津工业大学 | 基于深度卷积神经网络的前列腺经直肠超声图像分割方法 |
CN111292330A (zh) * | 2020-02-07 | 2020-06-16 | 北京工业大学 | 基于编解码器的图像语义分割方法及装置 |
CN111310523A (zh) * | 2018-12-12 | 2020-06-19 | 北京沃东天骏信息技术有限公司 | 弹幕的显示方法及装置 |
CN111508263A (zh) * | 2020-04-03 | 2020-08-07 | 西安电子科技大学 | 停车场智能引导机器人及智能引导方法 |
CN111582111A (zh) * | 2020-04-29 | 2020-08-25 | 电子科技大学 | 一种基于语义分割的细胞各成分分割方法 |
CN111818346A (zh) * | 2019-04-11 | 2020-10-23 | 富士通株式会社 | 图像编码方法和装置、图像解码方法和装置 |
CN111988609A (zh) * | 2019-05-22 | 2020-11-24 | 富士通株式会社 | 图像编码装置、概率模型生成装置和图像解码装置 |
CN112313662A (zh) * | 2018-06-26 | 2021-02-02 | 诺基亚技术有限公司 | 用于计算机视觉的方法和装置 |
CN112906706A (zh) * | 2021-03-31 | 2021-06-04 | 西南科技大学 | 一种改进的基于编解码器的图像语义分割方法 |
CN112966791A (zh) * | 2021-04-30 | 2021-06-15 | 平安科技(深圳)有限公司 | 基于语义分割的图像分类方法、装置、设备及介质 |
CN113159057A (zh) * | 2021-04-01 | 2021-07-23 | 湖北工业大学 | 一种图像语义分割方法和计算机设备 |
CN113168558A (zh) * | 2018-10-05 | 2021-07-23 | 罗伯特·博世有限公司 | 用于图像数据的语义分割的方法、人工神经网络、设备、计算机程序和机器可读存储介质 |
CN113516012A (zh) * | 2021-04-09 | 2021-10-19 | 湖北工业大学 | 一种基于多层级特征融合的行人重识别方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104036323A (zh) * | 2014-06-26 | 2014-09-10 | 叶茂 | 一种基于卷积神经网络的车辆检测方法 |
CN104850845A (zh) * | 2015-05-30 | 2015-08-19 | 大连理工大学 | 一种基于非对称卷积神经网络的交通标志识别方法 |
CN106372577A (zh) * | 2016-08-23 | 2017-02-01 | 北京航空航天大学 | 一种基于深度学习的交通标志自动识别与标注方法 |
US20170124415A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Subcategory-aware convolutional neural networks for object detection |
CN106991382A (zh) * | 2017-03-13 | 2017-07-28 | 南京信息工程大学 | 一种遥感场景分类方法 |
-
2017
- 2017-10-12 CN CN201710948567.5A patent/CN107644426A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104036323A (zh) * | 2014-06-26 | 2014-09-10 | 叶茂 | 一种基于卷积神经网络的车辆检测方法 |
CN104850845A (zh) * | 2015-05-30 | 2015-08-19 | 大连理工大学 | 一种基于非对称卷积神经网络的交通标志识别方法 |
US20170124415A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Subcategory-aware convolutional neural networks for object detection |
CN106372577A (zh) * | 2016-08-23 | 2017-02-01 | 北京航空航天大学 | 一种基于深度学习的交通标志自动识别与标注方法 |
CN106991382A (zh) * | 2017-03-13 | 2017-07-28 | 南京信息工程大学 | 一种遥感场景分类方法 |
Non-Patent Citations (1)
Title |
---|
HE K ET AL: "《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
Cited By (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427951B (zh) * | 2018-02-08 | 2023-08-04 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质和计算机设备 |
CN108427951A (zh) * | 2018-02-08 | 2018-08-21 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质和计算机设备 |
CN110232394A (zh) * | 2018-03-06 | 2019-09-13 | 华南理工大学 | 一种多尺度图像语义分割方法 |
CN110232394B (zh) * | 2018-03-06 | 2021-08-10 | 华南理工大学 | 一种多尺度图像语义分割方法 |
CN108596330A (zh) * | 2018-05-16 | 2018-09-28 | 中国人民解放军陆军工程大学 | 一种并行特征全卷积神经网络及其构建方法 |
WO2019222951A1 (en) * | 2018-05-24 | 2019-11-28 | Nokia Technologies Oy | Method and apparatus for computer vision |
CN108830327A (zh) * | 2018-06-21 | 2018-11-16 | 中国科学技术大学 | 一种人群密度估计方法 |
CN108830327B (zh) * | 2018-06-21 | 2022-03-01 | 中国科学技术大学 | 一种人群密度估计方法 |
CN112313662A (zh) * | 2018-06-26 | 2021-02-02 | 诺基亚技术有限公司 | 用于计算机视觉的方法和装置 |
CN109002840A (zh) * | 2018-06-26 | 2018-12-14 | 北京纵目安驰智能科技有限公司 | 一种基于级联的语义分割方法、系统、终端和存储介质 |
CN108898594A (zh) * | 2018-06-27 | 2018-11-27 | 湖北工业大学 | 一种均质面板缺陷的检测方法 |
CN109215034A (zh) * | 2018-07-06 | 2019-01-15 | 成都图必优科技有限公司 | 一种基于空间金字塔掩盖池化的弱监督图像语义分割方法 |
CN109034162A (zh) * | 2018-07-13 | 2018-12-18 | 南京邮电大学 | 一种图像语义分割方法 |
CN109190626A (zh) * | 2018-07-27 | 2019-01-11 | 国家新闻出版广电总局广播科学研究院 | 一种基于深度学习的多路径特征融合的语义分割方法 |
CN109190752A (zh) * | 2018-07-27 | 2019-01-11 | 国家新闻出版广电总局广播科学研究院 | 基于深度学习的全局特征和局部特征的图像语义分割方法 |
CN109190752B (zh) * | 2018-07-27 | 2021-07-23 | 国家新闻出版广电总局广播科学研究院 | 基于深度学习的全局特征和局部特征的图像语义分割方法 |
CN109241872B (zh) * | 2018-08-20 | 2022-03-18 | 电子科技大学 | 基于多级网络的图像语义快速分割方法 |
CN109241872A (zh) * | 2018-08-20 | 2019-01-18 | 电子科技大学 | 基于多级网络的图像语义快速分割方法 |
CN109389076A (zh) * | 2018-09-29 | 2019-02-26 | 深圳市商汤科技有限公司 | 图像分割方法及装置 |
CN109389076B (zh) * | 2018-09-29 | 2022-09-27 | 深圳市商汤科技有限公司 | 图像分割方法及装置 |
CN113168558A (zh) * | 2018-10-05 | 2021-07-23 | 罗伯特·博世有限公司 | 用于图像数据的语义分割的方法、人工神经网络、设备、计算机程序和机器可读存储介质 |
CN111091524A (zh) * | 2018-10-08 | 2020-05-01 | 天津工业大学 | 基于深度卷积神经网络的前列腺经直肠超声图像分割方法 |
US11861501B2 (en) | 2018-10-16 | 2024-01-02 | Tencent Technology (Shenzhen) Company Limited | Semantic segmentation method and apparatus for three-dimensional image, terminal, and storage medium |
WO2020078269A1 (zh) * | 2018-10-16 | 2020-04-23 | 腾讯科技(深圳)有限公司 | 三维图像的语义分割方法、装置、终端及存储介质 |
CN109447994A (zh) * | 2018-11-05 | 2019-03-08 | 陕西师范大学 | 结合完全残差与特征融合的遥感图像分割方法 |
CN111310523A (zh) * | 2018-12-12 | 2020-06-19 | 北京沃东天骏信息技术有限公司 | 弹幕的显示方法及装置 |
CN109766918A (zh) * | 2018-12-18 | 2019-05-17 | 南开大学 | 基于多层次上下文信息融合的显著性物体检测方法 |
CN109784283A (zh) * | 2019-01-21 | 2019-05-21 | 陕西师范大学 | 基于场景识别任务下的遥感图像目标提取方法 |
CN109919948A (zh) * | 2019-02-26 | 2019-06-21 | 华南理工大学 | 基于深度学习的鼻咽癌病灶分割模型训练方法及分割方法 |
CN110084274A (zh) * | 2019-03-29 | 2019-08-02 | 南京邮电大学 | 实时图像语义分割方法及系统、可读存储介质和终端 |
CN110084274B (zh) * | 2019-03-29 | 2022-09-06 | 南京邮电大学 | 实时图像语义分割方法及系统、可读存储介质和终端 |
CN111818346A (zh) * | 2019-04-11 | 2020-10-23 | 富士通株式会社 | 图像编码方法和装置、图像解码方法和装置 |
CN111818346B (zh) * | 2019-04-11 | 2023-04-18 | 富士通株式会社 | 图像编码方法和装置、图像解码方法和装置 |
US11468602B2 (en) | 2019-04-11 | 2022-10-11 | Fujitsu Limited | Image encoding method and apparatus and image decoding method and apparatus |
CN110047068A (zh) * | 2019-04-19 | 2019-07-23 | 山东大学 | 基于金字塔场景分析网络的mri脑肿瘤分割方法及系统 |
CN110136141B (zh) * | 2019-04-24 | 2023-07-11 | 佛山科学技术学院 | 一种面向复杂环境的图像语义分割方法及装置 |
CN110136141A (zh) * | 2019-04-24 | 2019-08-16 | 佛山科学技术学院 | 一种面向复杂环境的图像语义分割方法及装置 |
CN110070091A (zh) * | 2019-04-30 | 2019-07-30 | 福州大学 | 用于街景理解的基于动态插值重建的语义分割方法及系统 |
CN110070091B (zh) * | 2019-04-30 | 2022-05-24 | 福州大学 | 用于街景理解的基于动态插值重建的语义分割方法及系统 |
CN110188768B (zh) * | 2019-05-09 | 2022-10-14 | 南京邮电大学 | 实时图像语义分割方法及系统 |
CN110188768A (zh) * | 2019-05-09 | 2019-08-30 | 南京邮电大学 | 实时图像语义分割方法及系统 |
CN111988609A (zh) * | 2019-05-22 | 2020-11-24 | 富士通株式会社 | 图像编码装置、概率模型生成装置和图像解码装置 |
CN110197492A (zh) * | 2019-05-23 | 2019-09-03 | 山东师范大学 | 一种心脏mri左心室分割方法及系统 |
CN110363776A (zh) * | 2019-06-28 | 2019-10-22 | 联想(北京)有限公司 | 图像处理方法及电子设备 |
CN110349164A (zh) * | 2019-07-19 | 2019-10-18 | 北京华捷艾米科技有限公司 | 一种图像语义分割方法、装置及终端设备 |
CN110533045B (zh) * | 2019-07-31 | 2023-01-17 | 中国民航大学 | 一种结合注意力机制的行李x光违禁品图像语义分割方法 |
CN110533045A (zh) * | 2019-07-31 | 2019-12-03 | 中国民航大学 | 一种结合注意力机制的行李x光违禁品图像语义分割方法 |
CN110633706B (zh) * | 2019-08-02 | 2022-03-29 | 杭州电子科技大学 | 一种基于金字塔网络的语义分割方法 |
CN110633706A (zh) * | 2019-08-02 | 2019-12-31 | 杭州电子科技大学 | 一种基于金字塔网络的语义分割方法 |
CN111292330A (zh) * | 2020-02-07 | 2020-06-16 | 北京工业大学 | 基于编解码器的图像语义分割方法及装置 |
CN111508263A (zh) * | 2020-04-03 | 2020-08-07 | 西安电子科技大学 | 停车场智能引导机器人及智能引导方法 |
CN111582111B (zh) * | 2020-04-29 | 2022-04-29 | 电子科技大学 | 一种基于语义分割的细胞各成分分割方法 |
CN111582111A (zh) * | 2020-04-29 | 2020-08-25 | 电子科技大学 | 一种基于语义分割的细胞各成分分割方法 |
CN112906706A (zh) * | 2021-03-31 | 2021-06-04 | 西南科技大学 | 一种改进的基于编解码器的图像语义分割方法 |
CN113159057B (zh) * | 2021-04-01 | 2022-09-02 | 湖北工业大学 | 一种图像语义分割方法和计算机设备 |
CN113159057A (zh) * | 2021-04-01 | 2021-07-23 | 湖北工业大学 | 一种图像语义分割方法和计算机设备 |
CN113516012B (zh) * | 2021-04-09 | 2022-04-15 | 湖北工业大学 | 一种基于多层级特征融合的行人重识别方法及系统 |
CN113516012A (zh) * | 2021-04-09 | 2021-10-19 | 湖北工业大学 | 一种基于多层级特征融合的行人重识别方法及系统 |
CN112966791A (zh) * | 2021-04-30 | 2021-06-15 | 平安科技(深圳)有限公司 | 基于语义分割的图像分类方法、装置、设备及介质 |
CN112966791B (zh) * | 2021-04-30 | 2024-05-28 | 平安科技(深圳)有限公司 | 基于语义分割的图像分类方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107644426A (zh) | 基于金字塔池化编解码结构的图像语义分割方法 | |
CN111047551B (zh) | 一种基于U-net改进算法的遥感影像变化检测方法及系统 | |
CN107564025B (zh) | 一种基于深度神经网络的电力设备红外图像语义分割方法 | |
CN108171701B (zh) | 基于u网络和对抗学习的显著性检测方法 | |
CN112183360A (zh) | 高分辨率遥感影像的轻量化语义分割方法 | |
CN110889449A (zh) | 一种增强边缘的、多尺度的遥感影像建筑物语义特征提取方法 | |
CN110175613A (zh) | 基于多尺度特征和编解码器模型的街景图像语义分割方法 | |
CN111178213A (zh) | 一种基于深度学习的航拍车辆检测方法 | |
CN115049936A (zh) | 一种面向高分遥感影像的边界增强型语义分割方法 | |
CN110503613B (zh) | 基于级联空洞卷积神经网络的面向单幅图像去雨方法 | |
CN109285162A (zh) | 一种基于局部区域条件随机场模型的图像语义分割方法 | |
CN113642390B (zh) | 一种基于局部注意力网络的街景图像语义分割方法 | |
CN113807355A (zh) | 一种基于编解码结构的图像语义分割方法 | |
CN112927253B (zh) | 基于卷积神经网络的岩心fib-sem图像分割方法 | |
CN113034506B (zh) | 遥感图像语义分割方法、装置、计算机设备和存储介质 | |
CN113095277B (zh) | 一种基于目标空间分布特征的无人机航拍车辆检测方法 | |
CN107516103A (zh) | 一种影像分类方法和系统 | |
CN107092884A (zh) | 一种快速粗精级联行人检测方法 | |
Xiang et al. | Lightweight fully convolutional network for license plate detection | |
CN114820579A (zh) | 一种基于语义分割的图像复合缺陷的检测方法及系统 | |
CN113780132A (zh) | 一种基于卷积神经网络的车道线检测方法 | |
CN106056102A (zh) | 基于视频图像分析的道路车型分类方法 | |
CN115620010A (zh) | 一种rgb-t双模态特征融合的语义分割方法 | |
CN107958219A (zh) | 基于多模型和多尺度特征的图像场景分类方法 | |
CN114299286A (zh) | 一种异常天气下基于类别分组的道路场景语义分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180130 |