CN109598269A - 一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法 - Google Patents
一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法 Download PDFInfo
- Publication number
- CN109598269A CN109598269A CN201811353131.2A CN201811353131A CN109598269A CN 109598269 A CN109598269 A CN 109598269A CN 201811353131 A CN201811353131 A CN 201811353131A CN 109598269 A CN109598269 A CN 109598269A
- Authority
- CN
- China
- Prior art keywords
- branch
- resolution
- feature
- network
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000013461 design Methods 0.000 claims abstract description 10
- 230000004927 fusion Effects 0.000 claims abstract description 8
- 238000005457 optimization Methods 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 3
- 230000000153 supplemental effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims 1
- 238000013135 deep learning Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法,包括下列步骤:确定基础双支路网络架构,用于从不同分辨率的输入图像中提取不同尺度的特征:该基础双支路网络架构的两个支路的输入图像分辨率不同,均由多个卷积模块和降采样模块组成,卷积模块包含多个卷积层,用于提取特征;降采样模块由池化层组成;输入低分辨率图像的支路的卷积层较多,用于提取特征并进行分类,输出粗糙的预测结果;输入高分辨率图像的支路的卷积层较少,用于优化预测结果的空间位置信息,提升分割结果的像素精度。设计金字塔膨胀卷积模块,用于提取不同尺度的特征;设计两条支路特征融合模块。
Description
技术领域
本发明涉及计算机视觉、语义分割、深度学习领域,特别涉及一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法。
背景技术
语义分割是图像理解中的重要技术手段,是计算机视觉中的一项重要研究内容。图像是由很多像素组成的,语义分割就是将图像中的所有像素按照其表达的语义含义进行不同的分类分组,也就是像素级分类。相比于目标识别和物体检测,语义分割可以实现对图像更加细致的理解。鉴于语义分割的稠密预测性,语义分割在很多实际应用领域中都有着巨大的作用,比如自动驾驶系统中的路面场景理解,无人机系统中的着陆点判断以及可穿戴设备中的图像理解等。
自深度学习发展以来,基于深度学习的图像算法层出不穷。Long等人提出了全卷积神经网络(FCN),为将卷积神经网络应用到语义分割领域中打下了基础。FCN提出后,广大研究学者均在此基础上不断改进,发展出一系列基于深度学习的语义分割算法。Badrinarayana等人提出了SegNet,采用对称的编码-解码架构,完善了语义分割中常用的编解码架构;Chen等人提出了DeepLab,利用空洞空间金字塔池化增大卷积核感受野,聚合不同区域的上下文信息,并在网络末端加入全连接条件随机场用于锐化分割结果。Lin等人提出了RefineNet,利用长距离残差连接对不同尺度的特征进行融合,充分利用底层特征的边缘优势和高层特征的语义优势,实现用低层空间信息优化高层语义信息,进而提升网络分割精度。这些语义分割算法在分割精度方面有了较大的进步,但这些算法在分割效率方面依然比较低,而且这些算法对不同尺度目标的分割精度比较差。
输入分辨率是影响网络分割效率的一个重要因素。将输入图像压缩作为网络输入可以大大提高网络的分割效率,但会损失大量的空间细节信息,使网络的分割像素精度降低。用高分辨率图像作为网络输入可以保留所有的空间细节信息,但会大大降低网络的分割效率。同时,固定的卷积层和池化层会使各卷积层的感受野单一,关注的区域单一,这会限制网络对不同尺度目标的分割精度,使网络不能精确地分割不同尺度的目标。
发明内容
针对上述输入分辨率对网络的效率限制问题和固定感受野对网络处理不同尺度目标的精度限制问题,本发明提供一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法。本发吗设计一种基于多分辨率输入的语义分割网络结构,充分利用低分辨率图像处理效率高,高分辨率图像空间细节信息保存好的优点,在保持网络分割精度的同时提升网络分割效率并设计一种金字塔膨胀卷积模块。该模块融合多个不同膨胀率的卷积用于提取不同尺寸区域内的特征,提升网络对不同尺度目标的分割精度。技术方案如下:
第一步:确定基础双支路网络架构,用于从不同分辨率的输入图像中提取不同尺度的特征:该基础双支路网络架构的两个支路的输入图像分辨率不同,均由多个卷积模块和降采样模块组成,卷积模块包含多个卷积层,用于提取特征;降采样模块由池化层组成;输入低分辨率图像的支路的卷积层较多,用于提取特征并进行分类,输出粗糙的预测结果;输入高分辨率图像的支路的卷积层较少,用于优化预测结果的空间位置信息,提升分割结果的像素精度。
第二步:设计金字塔膨胀卷积模块,用于提取不同尺度的特征:利用4个不同膨胀率的卷积核的不同感受野提取不同尺寸区域的特征,然后通过级联操作,融合这4个不同尺寸区域内的特征,从而让网络能提取到多尺度的特征,提升网络对不同尺度目标的分割效果。
第三步:设计两条支路特征融合模块,用于融合低分辨率图像支路提取的特征和高分辨率图像支路提取的特征。高分辨率图像支路得到原始图像1/8大小的特征图,低分辨率图像支路得到原始图像1/16大小的特征图。对低分辨率图像支路的特征图用去卷积操作做上采样,使其分辨率与高分辨率图像支路的特征图大小一致,并通过1×1的卷积将其两支路通道数设为一致。最后将两支路的特征图进行逐通道加和,完成不同支路特征的融合。
第四步:确定网络训练、测试所用的数据集,输入训练、测试图像,输出网络的分割结果。利用原始分辨率的标签进行训练,利用1/4分辨率的标签进行辅助训练,选定一张图像,将其输入网络高分辨率支路;将输入图像压缩为1/2分辨率后输入网络的低分辨率支路,利用两支路提取语义信息和空间位置信息,完成分割。
相比于当前其它的语义分割算法而言,采用本发明提出的基于多分辨率输入的语义分割网络结构可以充分利用低分辨率图像处理效率高的优点和高分辨率图像空间细节信息保存好的优点,让网络在保持较高分割精度的同时,提升网络的分割效率。同时本发明提出的金字塔膨胀卷积模块可以提取不同尺寸区域内的特征并将这些特征进行融合,这能使网络对不同尺度目标的分割精度大大提升,进而提升网络的总体分割精度。
附图说明
图1网络结构
图2金字塔膨胀卷积模块
具体实施方式
通常情况下影响网络分割效率的一个重要因素就是特征图分辨率,据此广大研究学者提出了几种提升网络效率的方法:对输入图像做降采样,对特征图做降采样,对网络模型进行压缩。对输入图像做降采样主要是指对输入图像进行压缩,将其压缩到原来的1/4或1/2大小之后再将其输入到网络结构中;对特征图做降采样主要是指利用卷积或池化操作对特征图进行降采样,不断压缩特征图的分辨率,通常按照1:8、1:16或1:32的比例进行压缩;对网络模型进行压缩主要是指减少网络每一层中滤波器的个数,首先对网络各层中的每个滤波器计算其权重的L1范数,然后按照降序排列这些L1范数,最后只保留一些比较重要(L1范数比较大)的滤波器。
本发明针对输入图像分辨率对网络分割效率的影响,设计了一种基于多分辨率输入的语义分割网络结构,如图1所示。该结构可以结合低分辨率图像处理效率高和高分辨率图像空间细节信息保留好的优点,实现精确高效的语义分割。如图1所示,本发明所提的网络结构分为两个支路,一个支路输入原始分辨率的高分辨率图像,一个支路输入压缩到1/2分辨率的低分辨率图像。两个支路都由多个卷积模块和降采样模块组成。卷积模块包含多个卷积层,用于提取特征;降采样模块由池化层组成,用于降低特征图分辨率。低分辨率图像支路的卷积模块较多(14个),主要用于提取特征并进行分类,输出粗糙的预测结果。高分辨率图像支路的卷积模块较少(仅3个),主要用于优化预测结果的空间位置信息,提升分割的像素精度。高分辨率图像仅经过极少层的卷积,大大节省了网络的计算量,使得网络的分割效率比较高。另外,由于用了高分辨率图像支路的空间信息对低分辨率图像支路的预测结果进行优化,网络的分割精度大大提高。具体而言,首先用低分辨率图像作为输入进行分类预测,得到一个原始图像1/16大小的特征图。然后输入高分辨率图像,让其经过比低分辨率图像支路少一些的卷积层,得到一个原始图像1/16大小的特征图。对高分辨率图像支路得到的1/16大小的特征图做上采样并将其与低分辨率图像支路得到的1/8大小的特征图逐通道加和,进行两条支路特征间的融合,得到原始图像1/8大小的融合特征图。用去卷积操作对融合特征图做上采样,得到原始图像1/4大小的特征图,之后用双线性插值将特征图恢复到输入分辨率。为了加强学习过程,本发明额外采用了1/4大小的标签来进行辅助训练。最终本发明设计的语义分割网络可以达到精确高效的语义分割。
一般情况下影响网络对不同尺度目标分割精度的一个重要因素就是卷积核的感受野固定,能感受到的区域固定。为解决该问题,本发明提出了一种金字塔膨胀卷积模块,如图2所示,并将其加入到设计的语义分割网络结构中。该金字塔膨胀卷积模块采用4个不同膨胀率的卷积提取特征,之后对提取的特征进行融合。由于该模块4个卷积核的膨胀率不同,这4个卷积核的感受野也就不同。因为该模块4个卷积核感受到的区域大小不同,所以该模块可以提取到不同尺寸区域的特征并进行融合。利用本发明设计的金字塔膨胀卷积模块可以融合不同尺度的特征,进而解决网络对多尺度目标分割能力弱的问题。
利用本发明提出的基于多分辨输入的语义分割网络结构,并加入提出的金字塔膨胀卷积模块,可以解决当前语义分割算法计算效率低和对不同尺度目标分割精度低的问题,实现精确高效的语义分割。
本方法的具体实施步骤包括训练和测试过程。训练过程可以得到使网络损失函数值最小的网络参数。测试过程可以利用训练得到的网络对新的图像进行语义分割,并可以将其迁移到实际应用中。
训练过程:
步骤1:准备训练要用的语义分割数据集,本发明采用PASCAL VOC 2012数据集对网络进行训练。
步骤2:构建本发明提出的基于多分辨率输入的语义分割网络结构,并在其中加入金字塔膨胀卷积模块。
步骤3:前向传播。用在ImageNet数据集上预训练得到的网络参数对本发明所提网络的所有参数进行初始化。输入训练图像并对网络进行前向计算,得到像素级分类概率预测结果。
步骤4:反向传播。分析前向传播得到的预测结果和输入图像真实标签之间的差别,计算softmax平均交并比损失,并根据链式法则将损失进行反向传播,计算损失函数针对各卷积层参数的梯度。
步骤5:权重更新。采用随机梯度下降法(SGD)对权重进行更新,使得损失函数值逐渐减小。
步骤6:迭代训练。重复执行第3~5步,直至网络最终收敛或达到最大迭代次数。
测试过程:
步骤1:确定需要测试的图像,本发明采用PASCAL VOC 2012数据集的测试集和车载摄像头拍摄的图像进行测试。
步骤2:用训练好的网络对测试所用的图像进行处理。根据单张图像处理时间评价网络分割效率,根据网络预测结果和数据集真实标签之间的差异评价网络分割精度。
Claims (1)
1.一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法,包括下列步骤:
(1)确定基础双支路网络架构,用于从不同分辨率的输入图像中提取不同尺度的特征:该基础双支路网络架构的两个支路的输入图像分辨率不同,均由多个卷积模块和降采样模块组成,卷积模块包含多个卷积层,用于提取特征;降采样模块由池化层组成;输入低分辨率图像的支路的卷积层较多,用于提取特征并进行分类,输出粗糙的预测结果;输入高分辨率图像的支路的卷积层较少,用于优化预测结果的空间位置信息,提升分割结果的像素精度。
(2)设计金字塔膨胀卷积模块,用于提取不同尺度的特征:利用4个不同膨胀率的卷积核的不同感受野提取不同尺寸区域的特征,然后通过级联操作,融合这4个不同尺寸区域内的特征,从而让网络能提取到多尺度的特征,提升网络对不同尺度目标的分割效果;
(3)设计两条支路特征融合模块,用于融合低分辨率图像支路提取的特征和高分辨率图像支路提取的特征;高分辨率图像支路得到原始图像1/8大小的特征图,低分辨率图像支路得到原始图像1/16大小的特征图;对低分辨率图像支路的特征图用去卷积操作做上采样,使其分辨率与高分辨率图像支路的特征图大小一致,并通过1×1的卷积将其两支路通道数设为一致;最后将两支路的特征图进行逐通道加和,完成不同支路特征的融合;
(4)确定网络训练、测试所用的数据集,输入训练、测试图像,输出网络的分割结果;利用原始分辨率的标签进行训练,利用1/4分辨率的标签进行辅助训练,选定一张图像,将其输入网络高分辨率支路;将输入图像压缩为1/2分辨率后输入网络的低分辨率支路,利用两支路提取语义信息和空间位置信息,完成分割。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811353131.2A CN109598269A (zh) | 2018-11-14 | 2018-11-14 | 一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811353131.2A CN109598269A (zh) | 2018-11-14 | 2018-11-14 | 一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109598269A true CN109598269A (zh) | 2019-04-09 |
Family
ID=65958098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811353131.2A Pending CN109598269A (zh) | 2018-11-14 | 2018-11-14 | 一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109598269A (zh) |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110047069A (zh) * | 2019-04-22 | 2019-07-23 | 北京青燕祥云科技有限公司 | 一种图像检测装置 |
CN110136141A (zh) * | 2019-04-24 | 2019-08-16 | 佛山科学技术学院 | 一种面向复杂环境的图像语义分割方法及装置 |
CN110188768A (zh) * | 2019-05-09 | 2019-08-30 | 南京邮电大学 | 实时图像语义分割方法及系统 |
CN110348390A (zh) * | 2019-07-12 | 2019-10-18 | 创新奇智(重庆)科技有限公司 | 一种火焰检测模型的训练方法、计算机可读介质及系统 |
CN110490118A (zh) * | 2019-08-14 | 2019-11-22 | 厦门美图之家科技有限公司 | 图像处理方法及装置 |
CN110517267A (zh) * | 2019-08-02 | 2019-11-29 | Oppo广东移动通信有限公司 | 一种图像分割方法及装置、存储介质 |
CN110532868A (zh) * | 2019-07-23 | 2019-12-03 | 西安交通大学 | 一种预测自由空间语义边界的方法 |
CN110543849A (zh) * | 2019-08-30 | 2019-12-06 | 北京市商汤科技开发有限公司 | 检测器的配置方法及装置、电子设备和存储介质 |
CN110689083A (zh) * | 2019-09-30 | 2020-01-14 | 苏州大学 | 一种上下文金字塔融合网络及图像分割方法 |
CN110717873A (zh) * | 2019-10-09 | 2020-01-21 | 安徽建筑大学 | 一种基于多尺度残差的交通标识去模糊检测识别算法 |
CN110766670A (zh) * | 2019-10-18 | 2020-02-07 | 厦门粉红思黛医学科技有限公司 | 一种基于深度卷积神经网络的乳腺钼靶图像肿瘤定位算法 |
CN110929685A (zh) * | 2019-12-10 | 2020-03-27 | 电子科技大学 | 基于混合特征金字塔和混合膨胀卷积的行人检测网络结构 |
CN111062324A (zh) * | 2019-12-17 | 2020-04-24 | 上海眼控科技股份有限公司 | 人脸检测方法、装置、计算机设备和存储介质 |
CN111160413A (zh) * | 2019-12-12 | 2020-05-15 | 天津大学 | 一种基于多尺度特征融合的甲状腺结节分类方法 |
CN111259901A (zh) * | 2020-01-13 | 2020-06-09 | 镇江优瞳智能科技有限公司 | 一种利用空间信息提升语义分割精度的高效方法 |
CN111291763A (zh) * | 2020-04-01 | 2020-06-16 | 广东工业大学 | 大理石板图像分割方法、装置设备及存储介质 |
CN111325093A (zh) * | 2020-01-15 | 2020-06-23 | 北京字节跳动网络技术有限公司 | 视频分割方法、装置及电子设备 |
CN111382685A (zh) * | 2020-03-04 | 2020-07-07 | 电子科技大学 | 一种基于深度学习的场景识别方法和系统 |
CN111523521A (zh) * | 2020-06-18 | 2020-08-11 | 西安电子科技大学 | 一种双支路融合多尺度注意神经网络的遥感图像分类方法 |
CN111914853A (zh) * | 2020-07-17 | 2020-11-10 | 三峡大学 | 一种用于立体匹配的特征提取方法 |
CN112163449A (zh) * | 2020-08-21 | 2021-01-01 | 同济大学 | 一种轻量化的多分支特征跨层融合图像语义分割方法 |
CN112233052A (zh) * | 2020-10-15 | 2021-01-15 | 北京四维图新科技股份有限公司 | 膨胀卷积处理方法、图像处理方法、设备及存储介质 |
CN112580561A (zh) * | 2020-12-25 | 2021-03-30 | 上海高德威智能交通系统有限公司 | 目标检测方法、装置、电子设备及存储介质 |
CN112734642A (zh) * | 2021-01-12 | 2021-04-30 | 武汉工程大学 | 多尺度纹理转移残差网络的遥感卫星超分辨率方法及装置 |
CN112785636A (zh) * | 2021-02-18 | 2021-05-11 | 上海理工大学 | 一种多尺度增强式的单目深度估计方法 |
CN113191390A (zh) * | 2021-04-01 | 2021-07-30 | 华中科技大学 | 一种图像分类模型的构建方法、图像分类方法及存储介质 |
CN113536973A (zh) * | 2021-06-28 | 2021-10-22 | 杭州电子科技大学 | 一种基于显著性的交通标志检测方法 |
CN114267062A (zh) * | 2021-12-07 | 2022-04-01 | 北京的卢深视科技有限公司 | 模型训练方法、电子设备和计算机可读存储介质 |
CN115496808A (zh) * | 2022-11-21 | 2022-12-20 | 中山大学中山眼科中心 | 一种角膜缘定位方法及其系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062756A (zh) * | 2018-01-29 | 2018-05-22 | 重庆理工大学 | 基于深度全卷积网络和条件随机场的图像语义分割方法 |
CN108268870A (zh) * | 2018-01-29 | 2018-07-10 | 重庆理工大学 | 基于对抗学习的多尺度特征融合超声图像语义分割方法 |
-
2018
- 2018-11-14 CN CN201811353131.2A patent/CN109598269A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062756A (zh) * | 2018-01-29 | 2018-05-22 | 重庆理工大学 | 基于深度全卷积网络和条件随机场的图像语义分割方法 |
CN108268870A (zh) * | 2018-01-29 | 2018-07-10 | 重庆理工大学 | 基于对抗学习的多尺度特征融合超声图像语义分割方法 |
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110047069A (zh) * | 2019-04-22 | 2019-07-23 | 北京青燕祥云科技有限公司 | 一种图像检测装置 |
CN110047069B (zh) * | 2019-04-22 | 2021-06-04 | 北京青燕祥云科技有限公司 | 一种图像检测装置 |
CN110136141A (zh) * | 2019-04-24 | 2019-08-16 | 佛山科学技术学院 | 一种面向复杂环境的图像语义分割方法及装置 |
CN110136141B (zh) * | 2019-04-24 | 2023-07-11 | 佛山科学技术学院 | 一种面向复杂环境的图像语义分割方法及装置 |
CN110188768A (zh) * | 2019-05-09 | 2019-08-30 | 南京邮电大学 | 实时图像语义分割方法及系统 |
CN110188768B (zh) * | 2019-05-09 | 2022-10-14 | 南京邮电大学 | 实时图像语义分割方法及系统 |
CN110348390A (zh) * | 2019-07-12 | 2019-10-18 | 创新奇智(重庆)科技有限公司 | 一种火焰检测模型的训练方法、计算机可读介质及系统 |
CN110532868A (zh) * | 2019-07-23 | 2019-12-03 | 西安交通大学 | 一种预测自由空间语义边界的方法 |
CN110532868B (zh) * | 2019-07-23 | 2022-05-20 | 西安交通大学 | 一种预测自由空间语义边界的方法 |
CN110517267A (zh) * | 2019-08-02 | 2019-11-29 | Oppo广东移动通信有限公司 | 一种图像分割方法及装置、存储介质 |
CN110517267B (zh) * | 2019-08-02 | 2022-05-10 | Oppo广东移动通信有限公司 | 一种图像分割方法及装置、存储介质 |
CN110490118A (zh) * | 2019-08-14 | 2019-11-22 | 厦门美图之家科技有限公司 | 图像处理方法及装置 |
CN110543849B (zh) * | 2019-08-30 | 2022-10-04 | 北京市商汤科技开发有限公司 | 检测器的配置方法及装置、电子设备和存储介质 |
CN110543849A (zh) * | 2019-08-30 | 2019-12-06 | 北京市商汤科技开发有限公司 | 检测器的配置方法及装置、电子设备和存储介质 |
CN110689083A (zh) * | 2019-09-30 | 2020-01-14 | 苏州大学 | 一种上下文金字塔融合网络及图像分割方法 |
CN110689083B (zh) * | 2019-09-30 | 2022-04-12 | 苏州大学 | 一种上下文金字塔融合网络及图像分割方法 |
CN110717873A (zh) * | 2019-10-09 | 2020-01-21 | 安徽建筑大学 | 一种基于多尺度残差的交通标识去模糊检测识别算法 |
CN110766670A (zh) * | 2019-10-18 | 2020-02-07 | 厦门粉红思黛医学科技有限公司 | 一种基于深度卷积神经网络的乳腺钼靶图像肿瘤定位算法 |
CN110929685A (zh) * | 2019-12-10 | 2020-03-27 | 电子科技大学 | 基于混合特征金字塔和混合膨胀卷积的行人检测网络结构 |
CN111160413B (zh) * | 2019-12-12 | 2023-11-17 | 天津大学 | 一种基于多尺度特征融合的甲状腺结节分类方法 |
CN111160413A (zh) * | 2019-12-12 | 2020-05-15 | 天津大学 | 一种基于多尺度特征融合的甲状腺结节分类方法 |
CN111062324A (zh) * | 2019-12-17 | 2020-04-24 | 上海眼控科技股份有限公司 | 人脸检测方法、装置、计算机设备和存储介质 |
CN111259901A (zh) * | 2020-01-13 | 2020-06-09 | 镇江优瞳智能科技有限公司 | 一种利用空间信息提升语义分割精度的高效方法 |
CN111325093A (zh) * | 2020-01-15 | 2020-06-23 | 北京字节跳动网络技术有限公司 | 视频分割方法、装置及电子设备 |
CN111382685A (zh) * | 2020-03-04 | 2020-07-07 | 电子科技大学 | 一种基于深度学习的场景识别方法和系统 |
CN111291763A (zh) * | 2020-04-01 | 2020-06-16 | 广东工业大学 | 大理石板图像分割方法、装置设备及存储介质 |
CN111523521A (zh) * | 2020-06-18 | 2020-08-11 | 西安电子科技大学 | 一种双支路融合多尺度注意神经网络的遥感图像分类方法 |
CN111523521B (zh) * | 2020-06-18 | 2023-04-07 | 西安电子科技大学 | 一种双支路融合多尺度注意神经网络的遥感图像分类方法 |
CN111914853A (zh) * | 2020-07-17 | 2020-11-10 | 三峡大学 | 一种用于立体匹配的特征提取方法 |
CN111914853B (zh) * | 2020-07-17 | 2023-10-31 | 三峡大学 | 一种用于立体匹配的特征提取方法 |
CN112163449A (zh) * | 2020-08-21 | 2021-01-01 | 同济大学 | 一种轻量化的多分支特征跨层融合图像语义分割方法 |
CN112233052B (zh) * | 2020-10-15 | 2024-04-30 | 北京四维图新科技股份有限公司 | 膨胀卷积处理方法、图像处理方法、设备及存储介质 |
CN112233052A (zh) * | 2020-10-15 | 2021-01-15 | 北京四维图新科技股份有限公司 | 膨胀卷积处理方法、图像处理方法、设备及存储介质 |
CN112580561B (zh) * | 2020-12-25 | 2023-11-03 | 上海高德威智能交通系统有限公司 | 目标检测方法、装置、电子设备及存储介质 |
CN112580561A (zh) * | 2020-12-25 | 2021-03-30 | 上海高德威智能交通系统有限公司 | 目标检测方法、装置、电子设备及存储介质 |
CN112734642B (zh) * | 2021-01-12 | 2023-03-10 | 武汉工程大学 | 多尺度纹理转移残差网络的遥感卫星超分辨率方法及装置 |
CN112734642A (zh) * | 2021-01-12 | 2021-04-30 | 武汉工程大学 | 多尺度纹理转移残差网络的遥感卫星超分辨率方法及装置 |
CN112785636A (zh) * | 2021-02-18 | 2021-05-11 | 上海理工大学 | 一种多尺度增强式的单目深度估计方法 |
CN112785636B (zh) * | 2021-02-18 | 2023-04-28 | 上海理工大学 | 一种多尺度增强式的单目深度估计方法 |
CN113191390B (zh) * | 2021-04-01 | 2022-06-14 | 华中科技大学 | 一种图像分类模型的构建方法、图像分类方法及存储介质 |
CN113191390A (zh) * | 2021-04-01 | 2021-07-30 | 华中科技大学 | 一种图像分类模型的构建方法、图像分类方法及存储介质 |
CN113536973A (zh) * | 2021-06-28 | 2021-10-22 | 杭州电子科技大学 | 一种基于显著性的交通标志检测方法 |
CN114267062B (zh) * | 2021-12-07 | 2022-12-16 | 合肥的卢深视科技有限公司 | 人脸解析模型的训练方法、电子设备和存储介质 |
CN114267062A (zh) * | 2021-12-07 | 2022-04-01 | 北京的卢深视科技有限公司 | 模型训练方法、电子设备和计算机可读存储介质 |
CN115496808B (zh) * | 2022-11-21 | 2023-03-24 | 中山大学中山眼科中心 | 一种角膜缘定位方法及其系统 |
CN115496808A (zh) * | 2022-11-21 | 2022-12-20 | 中山大学中山眼科中心 | 一种角膜缘定位方法及其系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109598269A (zh) | 一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法 | |
CN114937151B (zh) | 基于多感受野和注意力特征金字塔的轻量级目标检测方法 | |
CN112541503A (zh) | 基于上下文注意力机制和信息融合的实时语义分割方法 | |
CN110929736B (zh) | 多特征级联rgb-d显著性目标检测方法 | |
CN110110692A (zh) | 一种基于轻量级全卷积神经网络的实时图像语义分割方法 | |
CN109871798A (zh) | 一种基于卷积神经网络的遥感影像建筑物提取方法 | |
CN109670529A (zh) | 一种用于快速语义分割的可分离分解残差模块设计方法 | |
CN110837887A (zh) | 一种深度卷积神经网络的压缩及加速方法、神经网络模型及其应用 | |
CN110363204A (zh) | 一种基于多任务特征学习的对象表示方法 | |
CN112766280A (zh) | 一种基于图卷积的遥感图像道路提取方法 | |
CN114022770A (zh) | 基于改进自注意力机制与迁移学习的山体裂缝检测方法 | |
CN109255296A (zh) | 一种基于深度卷积神经网络的日常人体行为识别方法 | |
CN115116054B (zh) | 一种基于多尺度轻量级网络的病虫害识别方法 | |
CN110210550A (zh) | 基于集成学习策略的图像细粒度识别方法 | |
CN113780132A (zh) | 一种基于卷积神经网络的车道线检测方法 | |
CN113269224A (zh) | 一种场景图像分类方法、系统及存储介质 | |
CN114463340B (zh) | 一种边缘信息引导的敏捷型遥感图像语义分割方法 | |
CN113298817A (zh) | 一种准确率高的遥感图像语义分割方法 | |
Liu et al. | Image retrieval using CNN and low-level feature fusion for crime scene investigation image database | |
CN115965864A (zh) | 一种用于农作物病害识别的轻量级注意力机制网络 | |
CN109033971A (zh) | 一种基于残差网络思想的高效行人重识别方法 | |
CN110264483B (zh) | 一种基于深度学习的语义图像分割方法 | |
Manzari et al. | A robust network for embedded traffic sign recognition | |
CN113343861B (zh) | 一种基于神经网络模型的遥感图像水体区域提取方法 | |
CN113807366A (zh) | 一种基于深度学习的点云关键点提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190409 |