CN109685067B - 一种基于区域和深度残差网络的图像语义分割方法 - Google Patents
一种基于区域和深度残差网络的图像语义分割方法 Download PDFInfo
- Publication number
- CN109685067B CN109685067B CN201811596891.6A CN201811596891A CN109685067B CN 109685067 B CN109685067 B CN 109685067B CN 201811596891 A CN201811596891 A CN 201811596891A CN 109685067 B CN109685067 B CN 109685067B
- Authority
- CN
- China
- Prior art keywords
- region
- image
- layer
- pixel
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于区域和深度残差网络的图像语义分割方法。基于区域的语义分割方法使用多尺度提取相互重叠的区域,可识别多种尺度的目标并得到精细的物体分割边界。基于全卷积网络的方法使用卷积神经网络自主学习特征,可以针对逐像素分类任务进行端到端训练,但是这种方法通常会产生粗糙的分割边界。本发明将两种方法的优点结合起来:首先使用区域生成网络在图像中生成候选区域,然后将图像通过带扩张卷积的深度残差网络进行特征提取得到特征图,结合候选区域以及特征图得到区域的特征,并将其映射到区域中每个像素上;最后使用全局平均池化层进行逐像素分类。本发明还使用了多模型融合的方法,在相同的网络模型中设置不同的输入进行训练得到多个模型,然后在分类层进行特征融合,得到最终的分割结果。在SIFT FLOW和PASCAL Context数据集上的实验结果表明本发明算法具有较高的平均准确率。
Description
技术领域
本发明属于计算机视觉领域,涉及对数字图像的预处理、模型的改进、图像语义分割与仿真实现。
背景技术
图像语义分割结合了图像分割和目标识别任务,其目的是将图像分割成若干组具有特定语义含义的区域,并标记出每个区域的类别,实现从底层到高层语义的推理过程,最终获得一幅具有像素语义标注的分割图像,即为图像中每个像素分配一个表示其语义目标类别的标签。图像语义分割在生活中有着很广泛的应用,如自动驾驶,地理信息系统,医疗影像分析以及虚拟或增强现实等穿戴式应用设备系统。越来越多新兴的应用领域需要精确和高效的分割机制,图像语义分割是计算机视觉任务中的研究热点之一。
基于区域的语义分割方法使用多尺度提取相互重叠的区域,可识别多种尺度的目标并得到精细的物体分割边界;基于全卷积网络的方法使用卷积神经网络自主学习特征,可以针对逐像素分类任务进行端到端训练,但是这种方法通常会产生粗糙的分割边界。本发明提出了一种结合区域与深度残差网络的图像语义分割方法:首先使用区域生成网络在图像中生成候选区域,然后将图像通过带扩张卷积的深度残差网络进行特征提取得到特征图,结合候选区域以及特征图得到区域的特征,并将其映射到区域中每个像素上;最后使用全局平均池化层进行逐像素分类。本发明使用了多模型融合的方法,在相同的网络模型中设置不同的输入进行训练得到多个模型,然后在分类层进行特征融合,得到最终的分割结果。
发明内容
1.发明目的:
本发明的目的是提出基于区域和深度残差网络的图像语义分割方法。
2.技术方案:
本发明提出一种结合区域和深度残差网络的语义分割模型,网络分为三个部分,第一部分生成候选区域,第二部分是全卷积网络,用于特征提取。本发明使用残差网络ResNet-50前五层卷积层作为基础网络,在基础网络中的部分卷积层使用不同的扩张率,在最后一层卷积层得到高分辨率的特征图。第三部分为分割网络,输入第一部分生成的候选区域和第二部分得到的特征图,输出分割图像。具体流程如下:在训练阶段,首先在输入图像上生成候选区域集,同时将输入图像归一化后输入到带扩张卷积的深度残差网络中进行特征提取,得到相应的特征图。然后将候选区域以及特征图输入到自由形状的ROI(RegionOf Interest)池化层中,得到候选区域特征。通过全局平均池化层代替全连接层对候选区域分类,并使用区域到像素层将区域类别信息映射到区域内每个像素,最终得到像素级预测结果。由于全连接层需要固定尺寸的输入,一般的语义分割方法都是将候选区域缩放至某种固定尺寸(一般为7×7),从而得到固定尺寸的特征图。考虑到不同尺寸的特征图包含的细节信息不一致,且本发明使用的全局平均池化分类层可接受任意尺度的特征图,故将候选区域缩放成多种不同的尺度,并在ROI池化层中得到相应尺度的特征图,尽尽可能的保留特征图的细节信息。所以通过每次选择不同尺度进行缩放,可以训练学习得到不同的模型。在测试阶段,将测试图像同时输入这些模型中,将在全局平均池化分类层得到的特征进行融合,旨在得到一个更鲁棒的结果。
本发明所述的一种基于区域和深度残差网络的图像语义分割方法,包括以下步骤:
步骤(1):在使用Selective Search在图像上生成候选区域的基础上,将每个候选区域缩放为四种不同的尺度,每个候选区域由三部分进行描述:边界框、前景掩膜、前景大小;
步骤(2):在原残差网络ResNet-50的基础上,在第四层与第五层卷积层中加入扩张因子,并将这两层的步长设为1;
步骤(3):将图像输入到由步骤(2)得到的带扩张卷积的深度残差网络中进行特征提取,得到特征图;
步骤(4):将由步骤(1)得到的候选区域与步骤(3)得到的特征图输入到ROI池化层中,得到区域特征;结合前景掩膜得到区域前景特征,将区域特征与区域前景特征进行串联;
步骤(5):将步骤(4)中串联后特征通过全局平均池化层进行逐像素分类,得到每个像素的类别预测值;
步骤(6):对步骤(1)中每个尺度的候选区域,保持模型中其他参数不变,分别进行训练最终得到四个模型。
步骤(7):将测试集图像分别通过这四个模型,并将其在分类层中得到的特征进行融合,使用融合后的特征进行预测,对分割效果进行分析。
3.有益效果:
本发明公开了一种结合区域和深度残差网络的语义分割方法,结合了基于区域和深度残差网络两种分割方法的优点,解决了一般语义分割方法容易出现粗糙分割边界的缺点,并且使得整个框架都能进行端到端训练。在SIFT FLOW和PASCAL Context数据集上的实验结果表明本发明具有较好的分割效果。
附图说明
图1为本发明整体流程框架。
图2为本发明特征图大小变化情况示意图。
图3为本发明获取区域特征过程。
图4为本发明全局平均池化层结构示意图。
图5为本发明模型融合框架示意图。
图6为本发明在SIFT FLOW数据集上图像分割效果。
图7为本发明在PASCAL Context数据集上图像分割效果。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步说明。一种基于区域和深度残差网络的图像语义分割方法,其具体实施方式步骤如下:
(S1):提取候选区域。
在Selective Search的基础上,使用过分割将原图分割成多个原始区域,依据区域的颜色、纹理、尺寸和交叠计算区域间的相似度,依次对最相似的区域进行合并,一直重复此操作直到合并成一个区域,从而得到不同层次的候选区域,通过设定区域的尺寸最小值筛选一定数量的候选区域。在SIFT FLOW数据集和PASCAL Context数据集中,本发明设置的最小尺寸分别为100像素和400像素,最终在每张图像上得到候选区域数量平均为370个和150个。
生成的候选区域由三个部分来描述:边界框(bounding box),前景掩膜(mask),前景大小(size)。其中边界框是一个四维坐标,表示候选区域在原图上的位置;前景掩膜是覆盖在候选区域上表示区域前景的二进制掩码。将区域特征在每个通道上与其对应的前景掩膜相乘可得到区域前景特征,如图1所示。
为了充分保留图像中候选区域的空间细节信息,本发明将每个候选区域缩放至四种不同尺度(7×7,9×9,13×13,15×15)输入到网络中。虽然本发明提出的模型理论上可以接收任意尺寸的候选区域输入,但考虑到候选区域尺度太大会造成计算量剧增的问题,以及目标尺寸的分布情况,故只考虑使用上述四种合理的尺度进行实验。
(S2):修改原残差网络,并进行特征提取
修改原50层残差网络(ResNet-50)的前五层卷积层作为本发明特征提取网络的基础网络。网络的输入为经过归一化大小的图像(600×600),输出为特征图(75×75),如图2所示。
在基础网络的第四层Res4和第五层卷积层Res5中引入扩张卷积核。具体做法如下,首先将第四层和五层的卷积步长设置为1,并且设置第四层Res4的扩张率dilated=2,第五层Res5的扩张率dilated=4。原ResNet-50网络中Res5层分辨率分别相对于Res4层和Res3层输出下降了2倍和4倍,但是经过扩张卷积操作,特征图的尺度没有发生改变,最终输出的特征图大小为75×75,保留了更多的图像空间信息,结构如图2所示。
(S3):提取区域特征以及特征串联。
使用ROI池化层可以将原图经过卷积神经网络得到的特征映射到每个候选区域上,流程如图3所示。ROI池化层的输入由两部分组成,第一部分为候选区域在原图上的位置坐标,即边界框;第二部分为原图经特征提取网络得到的特征图。首先将候选区域坐标映射到特征图上,得到候选区域在特征图上的位置,然后将映射后的区域划分成与输出维度个数相同的部分,并对每一部分进行最大池化,从而得到固定大小的区域特征,此时得到的区域特征包含了候选区域的前景与背景信息。
为了更加突显前景特征,本发明考虑第二种特征:区域前景特征,即把区域前景的特征从区域特征中提取出来,实现方法是在区域特征的每个通道上乘以其对应的前景掩膜,即可得到候选区域的前景特征。将区域特征和区域前景特征串联起来,然后将串联后的特征通过全局平均池化分类层,得到区域的类别预测值,再将类别预测值映射到区域内每个像素上。由于语义分割目标是给每一个像素分配一个语义标签,相当于多分类问题,故采用SOFTMAX回归进行分类。
对于候选区域r,经网络的全局平均池化分类层得到激活值Fr,使用区域到像素层从所有包含像素p的区域中选取激活值最大的作为像素p的激活值,即
经过SOFTMAX层得到像素p属于第i类的概率θp,i为
从而p的语义类别lp可由以下公式预测
本发明模型的损失函数采用对数似然函数,如式(4)所示,其中y为像素p的真实标签,P为训练集中的像素总数,C为数据集的类别总数。
(S4):使用全局平均池化对图像中的每一个像素进行分类.
本发明提出适用于语义分割任务的全局平均池化层结构,来代替全连接层进行分类,结构如图4所示,输入特征向量的大小为(H,W),通道数为D,C为类别总数。实现过程为:首先使用C个1×1×D的卷积核对输入特征向量H×W×D进行卷积,得到H×W×C特征图,这里使用1×1×D卷积核进行卷积的目的是实现跨通道的信息整合。然后使用与特征图大小相同的池化核对其进行平均池化,如图4所示,得到最终的类别预测值。本发明提出的全局平均池化分类层可以接收任意尺度输入,对每张特征图使用全局平均池化得到一个输出,这个输出即表示类别预测值。相较于普通的全连接层,全局平均池化层更符合卷积结构,加强了特征映射与分类的对应关系,同时由于没有需要优化的参数,大大减少了参数量,从而可以加速训练过程和减轻过拟合风险。
(S5)分别训练得多个模型。
为了得到平均性能更好的语义分割结果,将候选区域缩放成四种尺度:7×7,9×9,13×13,15×15,分别训练学习得到四个不同的模型。在测试阶段,按照每个模型不同的候选区域尺寸参数设置,将测试图像分别输入到这四个模型中,然后将图像在全局平均池化分类层得到的激活值进行融合,融合方式为取对应激活值的最大值。框架图如图5所示。
以下结合分割效果图实施例对本发明效果进行详细描述。
图6示例了本发明在SIFT FLOW测试集的一些测试图片上得到的分割效果图。从图6可以看出,本发明在物体边界处分割精确,分割边缘几乎与真实标注结果一致,如图6(a)中的建筑物,图6(d)、图6(f)和图6(h)中的树木。由于生成候选区域算法使用了多尺度,提取相互重叠的区域,并且后续使用了多尺度融合,使得各个尺度的目标都有概率被识别出来,故本发明方法在一些小物体上也有不错的识别效果,如图6(g)中的路灯与标志物,图6(i)与图6(j)中的电线杆。甚至在真实标注中未精准标注的类别都被识别出来,如图6(b)、图6(c)和图6(e)中的草坪,真实标注为田野,而本发明算法识别为草地,但这反而会影响本发明算法在某些类别上的准确度。
图7示例了一些本发明在PASCAL Context验证集上得到的分割结果。本发明得到的分割结果接近于真实标注,如图7(e)中的狗,有些结果甚至要优于真实标注,如图7(f)中的猫胡须。在一些小物体识别上也取得了很好的识别效果,如图7(d)中的食物以及杯子,图7(c)中的雪,图7(b)中的标志物。在图7(a)中,本发明提出的方法把被围栏分割的天空完整识别出来了,而真实标注忽略了这个目标,并且在该图中本发明方法也将椅子的轮廓较完整地分割了出来。
本发明提出的基于区域和深度残差网络的语义分割方法,结合了基于区域方法中可以得到清晰物体边界的优点和基于全卷积网络的可进行端到端训练的优点。通过使用带扩张卷积的深度残差网络来提取特征,得到了包含更多信息的高分辨率的特征图。使用全局平均池化分类方法,从而输入到该层的特征图可以是任意尺度。在SIFT FLOW和PASCALContext数据集上的测试结果表明本发明在语义分割任务中具有很好的性能。
Claims (1)
1.一种基于区域和深度残差网络的图像语义分割方法,包括以下步骤:
步骤(1):在使用Selective Search在图像上生成候选区域的基础上,将每个候选区域缩放为四种不同的尺度,每个候选区域由三部分进行描述:边界框、前景掩膜、前景大小;
步骤(2):在原残差网络ResNet-50的基础上,在第四层与第五层卷积层中加入扩张因子,并将这两层的步长设为1;
步骤(3):将图像输入到由步骤(2)得到的带扩张卷积的深度残差网络中进行特征提取,得到特征图;
步骤(4):将由步骤(1)得到的候选区域与步骤(3)得到的特征图输入到ROI池化层中,得到区域特征;结合前景掩膜得到区域前景特征,将区域特征与区域前景特征进行串联;
步骤(5):将步骤(4)中串联后特征通过全局平均池化层进行逐像素分类,得到每个像素的类别预测值;
步骤(6):对步骤(1)中每个尺度的候选区域,保持模型中其他参数不变,分别进行训练最终得到四个模型;
步骤(7):将测试集图像分别通过这四个模型,并将其在分类层中得到的特征进行融合,使用融合后的特征进行预测,对分割效果进行分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811596891.6A CN109685067B (zh) | 2018-12-26 | 2018-12-26 | 一种基于区域和深度残差网络的图像语义分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811596891.6A CN109685067B (zh) | 2018-12-26 | 2018-12-26 | 一种基于区域和深度残差网络的图像语义分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109685067A CN109685067A (zh) | 2019-04-26 |
CN109685067B true CN109685067B (zh) | 2022-05-03 |
Family
ID=66188574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811596891.6A Active CN109685067B (zh) | 2018-12-26 | 2018-12-26 | 一种基于区域和深度残差网络的图像语义分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109685067B (zh) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399840B (zh) * | 2019-05-22 | 2024-04-02 | 西南科技大学 | 一种快速的草坪语义分割及边界检测方法 |
CN110222636B (zh) * | 2019-05-31 | 2023-04-07 | 中国民航大学 | 基于背景抑制的行人属性识别方法 |
CN110246141B (zh) * | 2019-06-13 | 2022-10-21 | 大连海事大学 | 一种基于联合角点池化的复杂交通场景下车辆图像分割方法 |
CN110276316B (zh) * | 2019-06-26 | 2022-05-24 | 电子科技大学 | 一种基于深度学习的人体关键点检测方法 |
CN110378911B (zh) * | 2019-07-11 | 2022-06-21 | 太原科技大学 | 基于候选区域和邻域分类器的弱监督图像语义分割方法 |
CN110533113B (zh) * | 2019-09-04 | 2022-11-11 | 湖南大学 | 一种数字图像中树状结构的分支点检测方法 |
CN110610509B (zh) * | 2019-09-18 | 2023-07-21 | 上海大学 | 可指定类别的优化抠图方法及系统 |
CN110660066B (zh) * | 2019-09-29 | 2023-08-04 | Oppo广东移动通信有限公司 | 网络的训练方法、图像处理方法、网络、终端设备及介质 |
CN110782023B (zh) * | 2019-11-04 | 2023-04-07 | 华南理工大学 | 约简残差模块多孔卷积架构网络及快速语义分割方法 |
CN111127470B (zh) * | 2019-12-24 | 2023-06-16 | 江西理工大学 | 一种基于上下文和浅层空间编解码网络的图像语义分割方法 |
CN111209808B (zh) * | 2019-12-25 | 2023-07-18 | 北京航空航天大学杭州创新研究院 | 一种基于分层处理的无人机图像语义分割识别方法 |
CN111210443B (zh) * | 2020-01-03 | 2022-09-13 | 吉林大学 | 基于嵌入平衡的可变形卷积混合任务级联语义分割方法 |
CN111223041B (zh) * | 2020-01-12 | 2022-10-14 | 大连理工大学 | 一种全自动自然图像抠图方法 |
US11195044B2 (en) | 2020-01-12 | 2021-12-07 | Dalian University Of Technology | Fully automatic natural image matting method |
CN111259758B (zh) * | 2020-01-13 | 2023-04-07 | 中国矿业大学 | 一种针对密集区域的两阶段遥感图像目标检测方法 |
CN111275732B (zh) * | 2020-01-16 | 2023-05-02 | 北京师范大学珠海分校 | 一种基于深度卷积神经网络的前景对象图像分割方法 |
CN111274981B (zh) * | 2020-02-03 | 2021-10-08 | 中国人民解放军国防科技大学 | 目标检测网络构建方法及装置、目标检测方法 |
CN111340047B (zh) * | 2020-02-28 | 2021-05-11 | 江苏实达迪美数据处理有限公司 | 基于多尺度特征与前背景对比的图像语义分割方法及系统 |
CN111368899B (zh) * | 2020-02-28 | 2023-07-25 | 中国人民解放军南部战区总医院 | 一种基于递归聚合深度学习分割超声心动图的方法和系统 |
CN111368845B (zh) * | 2020-03-16 | 2023-04-07 | 河南工业大学 | 基于深度学习的特征字典构建及图像分割方法 |
CN111695569B (zh) * | 2020-05-12 | 2023-04-18 | 东南大学 | 一种基于多分割图融合的图像像素级分类方法 |
CN111652930B (zh) * | 2020-06-04 | 2024-02-27 | 上海媒智科技有限公司 | 一种图像目标检测方法、系统及设备 |
CN111738310B (zh) * | 2020-06-04 | 2023-12-01 | 科大讯飞股份有限公司 | 物料分类方法、装置、电子设备和存储介质 |
CN111860173B (zh) * | 2020-06-22 | 2021-10-15 | 中国科学院空天信息创新研究院 | 一种基于弱监督的遥感图像地物要素提取方法及系统 |
CN111881914B (zh) * | 2020-06-23 | 2024-02-13 | 安徽清新互联信息科技有限公司 | 一种基于自学习阈值的车牌字符分割方法及系统 |
CN113111886B (zh) * | 2021-04-19 | 2023-03-24 | 太原科技大学 | 一种基于双层残差网络的交通场景图像语义分割方法 |
CN113392840B (zh) * | 2021-05-20 | 2023-07-25 | 大连大学 | 基于多尺度分割融合的实时语义分割方法 |
CN113516668B (zh) * | 2021-06-16 | 2024-03-29 | 郑州大学 | 物联网应用中图像语义分割方法 |
CN113379738A (zh) * | 2021-07-20 | 2021-09-10 | 重庆大学 | 一种基于图像的疫木检测与定位方法及系统 |
CN113569507A (zh) * | 2021-09-27 | 2021-10-29 | 中国人民解放军海军工程大学 | 一种基于机器学习的定子线棒绝缘老化状态复合预测方法 |
CN113887524B (zh) * | 2021-11-04 | 2024-06-25 | 华北理工大学 | 基于语义分割的磁铁矿显微图像分割方法 |
CN114219976B (zh) * | 2021-11-04 | 2024-07-26 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备、存储介质及计算机产品 |
CN116071607B (zh) * | 2023-03-08 | 2023-08-08 | 中国石油大学(华东) | 基于残差网络的水库航拍图像分类及图像分割方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107591200A (zh) * | 2017-08-25 | 2018-01-16 | 卫宁健康科技集团股份有限公司 | 基于深度学习及影像组学的骨龄标记识别评估方法及系统 |
CN107704866A (zh) * | 2017-06-15 | 2018-02-16 | 清华大学 | 基于新型神经网络的多任务场景语义理解模型及其应用 |
CN108345911A (zh) * | 2018-04-16 | 2018-07-31 | 东北大学 | 基于卷积神经网络多级特征的钢板表面缺陷检测方法 |
CN108550162A (zh) * | 2018-03-27 | 2018-09-18 | 清华大学 | 一种基于深度强化学习的物体检测方法 |
CN108734694A (zh) * | 2018-04-09 | 2018-11-02 | 华南农业大学 | 基于faster r-cnn的甲状腺肿瘤超声图像自动识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10451700B2 (en) * | 2016-09-08 | 2019-10-22 | Regents Of The University Of Minnesota | System and method for reducing partial voluming artifacts in quantitative myocardial tissue characterization |
-
2018
- 2018-12-26 CN CN201811596891.6A patent/CN109685067B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107704866A (zh) * | 2017-06-15 | 2018-02-16 | 清华大学 | 基于新型神经网络的多任务场景语义理解模型及其应用 |
CN107591200A (zh) * | 2017-08-25 | 2018-01-16 | 卫宁健康科技集团股份有限公司 | 基于深度学习及影像组学的骨龄标记识别评估方法及系统 |
CN108550162A (zh) * | 2018-03-27 | 2018-09-18 | 清华大学 | 一种基于深度强化学习的物体检测方法 |
CN108734694A (zh) * | 2018-04-09 | 2018-11-02 | 华南农业大学 | 基于faster r-cnn的甲状腺肿瘤超声图像自动识别方法 |
CN108345911A (zh) * | 2018-04-16 | 2018-07-31 | 东北大学 | 基于卷积神经网络多级特征的钢板表面缺陷检测方法 |
Non-Patent Citations (5)
Title |
---|
Selective search for object recognition;J. R. R. Uijlings等;《International journal of computer vision》;20131231;第104卷(第2期);第154-171页 * |
valuation of deep neural networks for traffic sign detection systems;álvaroArcos-García等;《Neurocomputing》;20181117;第316卷;第332-344页 * |
基于区域与深度残差网络的图像语义分割;卢飞;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20200115(第01期);第I138-1400页 * |
基于区域与深度残差网络的图像语义分割;罗会兰等;《电子与信息学报》;20191130;第41卷(第11期);第2777-2786页 * |
基于选择性搜索和卷积神经网络的人脸检测;吴素雯等;《计算机应用研究》;20170930;第34卷(第9期);第2854-2857页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109685067A (zh) | 2019-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109685067B (zh) | 一种基于区域和深度残差网络的图像语义分割方法 | |
CN109614985B (zh) | 一种基于密集连接特征金字塔网络的目标检测方法 | |
CN107092870B (zh) | 一种高分辨率影像语义信息提取方法 | |
CN111640125B (zh) | 基于Mask R-CNN的航拍图建筑物检测和分割方法及装置 | |
Dornaika et al. | Building detection from orthophotos using a machine learning approach: An empirical study on image segmentation and descriptors | |
Chen et al. | Vehicle detection in high-resolution aerial images based on fast sparse representation classification and multiorder feature | |
CN109325484B (zh) | 基于背景先验显著性的花卉图像分类方法 | |
CN110458172A (zh) | 一种基于区域对比度检测的弱监督图像语义分割方法 | |
CN112036231B (zh) | 一种基于车载视频的车道线和路面指示标志检测与识别方法 | |
CN114648665B (zh) | 一种弱监督目标检测方法及系统 | |
CN114694038A (zh) | 基于深度学习的高分辨率遥感影像分类方法及系统 | |
CN107506792B (zh) | 一种半监督的显著对象检测方法 | |
CN111914720B (zh) | 一种输电线路绝缘子爆裂识别方法及装置 | |
CN111886600A (zh) | 一种用于图像的实例级别分割的设备和方法 | |
CN111768415A (zh) | 一种无量化池化的图像实例分割方法 | |
CN110992379B (zh) | 一种基于方向超像素的快速图像分割方法 | |
CN116645592B (zh) | 一种基于图像处理的裂缝检测方法和存储介质 | |
CN111401380A (zh) | 一种基于深度特征增强和边缘优化的rgb-d图像语义分割方法 | |
CN112528058B (zh) | 基于图像属性主动学习的细粒度图像分类方法 | |
CN115661777A (zh) | 一种联合语义的雾天道路目标检测算法 | |
CN114511627A (zh) | 一种目标果实定位分割方法及系统 | |
CN115393635A (zh) | 一种基于超像素分割以及数据增强的红外小目标检测方法 | |
CN110634142B (zh) | 一种复杂车路图像边界优化方法 | |
Huang et al. | Segdiscover: Visual concept discovery via unsupervised semantic segmentation | |
Ng et al. | Scalable Feature Extraction with Aerial and Satellite Imagery. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |