CN111461130A - 一种高精度图像语义分割算法模型及分割方法 - Google Patents

一种高精度图像语义分割算法模型及分割方法 Download PDF

Info

Publication number
CN111461130A
CN111461130A CN202010281360.9A CN202010281360A CN111461130A CN 111461130 A CN111461130 A CN 111461130A CN 202010281360 A CN202010281360 A CN 202010281360A CN 111461130 A CN111461130 A CN 111461130A
Authority
CN
China
Prior art keywords
semantic segmentation
target
segmentation algorithm
algorithm model
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010281360.9A
Other languages
English (en)
Other versions
CN111461130B (zh
Inventor
王磊
吴伟龙
周建品
李争
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shiyan Intelligent Technology Guangzhou Co ltd
Original Assignee
Shiyan Intelligent Technology Guangzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shiyan Intelligent Technology Guangzhou Co ltd filed Critical Shiyan Intelligent Technology Guangzhou Co ltd
Priority to CN202010281360.9A priority Critical patent/CN111461130B/zh
Publication of CN111461130A publication Critical patent/CN111461130A/zh
Application granted granted Critical
Publication of CN111461130B publication Critical patent/CN111461130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/273Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised

Abstract

本发明涉及一种高精度图像语义分割算法模型及分割方法,所述模型为了全局信息在多级融合过程中的损失,对目标细节不确定性进行建模,可以很大程度上消除图像噪声干扰及图像局部信息较少导致的细节不确定性,从而提升目标边缘的语义分割精度。所述分割方法基于所述分割算法模型来实现,所述分割方法降低了卷积神经网络识别细节特征的难度,提升了卷积神经网络对细节的建模能力和建模精度,能有效识别目标的细节结构及特征,降低遮挡和图像质量等因素对语义分割照成的干扰。

Description

一种高精度图像语义分割算法模型及分割方法
技术领域
本发明涉及图像语义分割技术领域,更具体地,涉及一种高精度图像语义分割算法模型及分割方法。
背景技术
近年来,基于深度学习网络的机器学习算法得到了快速的发展。其中,深度卷积神经网络已被成功应用于人脸识别,车牌识别等领域。然而,现有的深度卷积神经网络在对细节识别精度要求较高的领域(比如工业零件测量,高精度地图制作,医疗影像分析等领域)的成功应用案例仍然较少。其主要原因在于现有的深度卷积神经网络对目标边界等细节的识别精度较差,其识别结果容易受遮挡以及图像局部细节缺失等因素的影响。
使用深度神经网络进行图像细节的精准分类和识别的主要难点在于图像数据中的噪声干扰以及局部图像局部信息较少。在遮挡情况下,局部细节则完全缺失。现有的卷积神经网络多采用多尺度特征融合来提升神经网络对细节的识别能力。多尺度渐进特征融合是一种常用的特征融合技术,但是全局信息会在多级融合的过程中逐渐丢失。同时,现有的图像语义分割算法缺乏对目标形状特征进行学习和推理的能力。在图像噪声干扰及图像局部信息较少等因素导致目标细节不确定时,边缘无法被正确恢复。
发明内容
本发明为克服上述现有技术所述的目标边缘的语义分割精度不够高的缺陷,提供一种高精度图像语义分割算法模型及分割方法。
所述模型以PSPNet作为骨架网络,模型中PSPNet的第一层(conv1)被替换为:
conv3x3x64-BN-ReLU-conv3x3x64-BN-ReLU-conv3x3x128-BN-ReLU
其中,BN表示批标准化,ReLU表示线性整流函数,conv3x3x64表示卷积核为3x3x64的卷积层,conv3x3x128表示卷积核为3x3x128的卷积层。第一个conv3x3x64的卷积移动步长为2,其他卷积层的步长为1。
优选地,所述模型中PSPNet的第一层中第一个conv3x3x64的卷积移动步长为2,其他卷积层的步长为1。
优选地,所述模型采用复合多尺度特征融合结构;
所述结构采用PSPNet-resnet101在8,4,2,1等四个尺度的特征作为输入,输出2倍尺度的融合特征;
其中8,4,2尺度的输入特征分别为conv5_4,conv2_x,conv1_3/ReLU。
优选地,所述模型在融合的特征上采用了一个金字塔池化层,即将融合特征重采样到1,2,3,6等4个尺度,获得4个不同尺度的特征,每个特征分别经过数层卷积处理之后再重采样到原始特征长宽,最后堆叠4个特征得到输出特征。
优选地,所述模型采用一对多的模式建模,即在一次前向传播的过程中生成多个可能的预测结果,选择损失函数值最低的预测结果进行后向传播训练。
优选地,所述多模态建模过程为:首先从随机数中生成N个特征图,然后将这N个特征图和现有的数据特征进行叠加,使用叠加后的特征进行分类。
优选地,所述模型在res5,res4b22,b21,b20这4层中使用了注意力机制。
优选地,所述模型的推理层采用以下网络结构:
conv3x3-BN-ReLU-dropout-conv1x1-CELoss
其中CELoss为交叉熵损失函数。
本发明还提供一种高精度图像语义分割方法,所述方法基于所述的高精度图像语义分割算法模型来实现,所述方法包括以下步骤:
S1:对若干个目标图像进行人工标注真值处理,所述标注真值指人工绘制的图像中每个目标的精确轮廓;
每个目标轮廓由若干个多边形表示;
人工标注完成后将标注的多边形数据栅格化,得到和目标图像长宽相同的真值图像;
其中属于目标的像素值为1,否则为0;
S2:利用训练数据集中的数据来训练本发明所述模型,直到系统收敛,即平滑过后的损失函数在一定的训练轮数中保持不变;
S3:使用S2训练完成的模型识别目标图像,生成目标语义分割结果。
与现有技术相比,本发明技术方案的有益效果是:本发明所述模型为了全局信息在多级融合过程中的损失,对目标细节不确定性进行建模,可以很大程度上消除图像噪声干扰及图像局部信息较少导致的细节不确定性,从而提升目标边缘的语义分割精度。
本发明所述方法降低了卷积神经网络识别细节特征的难度,提升了卷积神经网络对细节的建模能力和建模精度,能有效识别目标的细节结构及特征,降低遮挡和图像质量等因素对语义分割照成的干扰。
附图说明
图1为实施例1所述高精度图像语义分割算法模型结构示意图。
图2为渐进多尺度融合结构示意图。
图3为多模态建模结构示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
本发明提供一种高精度图像语义分割算法模型,如图1所示,所述模型主要包括以下模块:
(1)基础网络。
本实施例采用修改后的PSPNet作为骨架网络。PSPNet的第一层(conv1)被替换为:
conv3x3x64-BN-ReLU-conv3x3x64-BN-ReLU-conv3x3x128-BN-ReLU
其中,BN表示批标准化,ReLU表示线性整流函数,conv3x3x64表示卷积核为3x3x64的卷积层,conv3x3x128表示卷积核为3x3x128的卷积层。第一个conv3x3x64的卷积移动步长为2,其他卷积层的步长为1。修改过后的模型比原始模型在图像2倍尺度(特征长宽为原始图像的1/2)下具有更多的卷积层。在后续由上至下的渐进多尺度融合中可在2倍尺度时获取更优的特征。
(2)复合多尺度特征融合结构。
这个结构采用了从粗到精的渐进融合模式。其相邻两个尺度间的渐进融合网络结构设计参见图2。此结构采用PSPNet-resnet101在8,4,2,1等四个尺度的特征作为输入,输出2倍尺度的融合特征。其中8,4,2尺度的输入特征分别为conv5_4,conv2_x,conv1_3/ReLU。
为了补偿粗分辨率的信息在渐进多尺度融合的过程中丢失的情况,本文在融合的特征上采用了一个金字塔池化层,即将融合特征重采样到1,2,3,6等4个尺度,获得4个不同尺度的特征,每个特征分别经过数层卷积处理之后再重采样到原始特征长宽,最后堆叠4个特征得到输出特征。
(3)多模态建模。
多模态建模用于对数据分析中的不确定性进行建模。这种不确定可能来源于遮挡,局部噪声,局部数据缺失等问题。此模型采用一对多的模式,即在一次前向传播的过程中生成多个可能的预测结果,选择损失函数值最低的预测结果进行后向传播训练。首先从随机数中生成N个特征图,然后将这N个特征图和现有的数据特征进行叠加,使用叠加后的特征进行分类。具体结构见图3。
(4)注意力机制。
注意力机制的使用可以扩大相应卷积层的FOV(field-of-view),可以使神经网络学习并选择有用的区域进行特征计算。在res5,res4b22,b21,b20这4层中使用了注意力机制。
(5)推理层。
推理层采用以下网络结构:conv3x3-BN-ReLU-dropout-conv1x1-CELoss,其中CELoss为交叉熵损失函数。
实施例2:
本实施例提供一种高精度图像语义分割方法,所述方法基于实施例1所述的高精度图像语义分割算法模型来实现,所述方法包括以下步骤:
S1:对若干个目标图像进行人工标注真值处理,所述标注真值指人工绘制的图像中每个目标的精确轮廓;
每个目标轮廓由若干个多边形表示;
人工标注完成后将标注的多边形数据栅格化,得到和目标图像长宽相同的真值图像;
其中属于目标的像素值为1,否则为0;
S2:利用训练数据集中的数据来训练实施例1所述模型,直到系统收敛,即平滑过后的损失函数在一定的训练轮数中保持不变;
S3:使用S2训练完成的模型识别目标图像,生成目标语义分割结果。
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (9)

1.一种高精度图像语义分割算法模型,所述模型以PSPNet作为骨架网络,其特征在于,所述模型中PSPNet的第一层(conv1)被替换为:
conv3x3x64-BN-ReLU-conv3x3x64-BN-ReLU-conv3x3x128-BN-ReLU
其中,BN表示批标准化,ReLU表示线性整流函数,conv3x3x64表示卷积核为3x3x64的卷积层,conv3x3x128表示卷积核为3x3x128的卷积层;第一个conv3x3x64的卷积移动步长为2,其他卷积层的步长为1。
2.根据权利要求1所述的高精度图像语义分割算法模型,其特征在于,所述模型中PSPNet的第一层中第一个conv3x3x64的卷积移动步长为2,其他卷积层的步长为1。
3.根据权利要求2所述的高精度图像语义分割算法模型,其特征在于,所述模型采用复合多尺度特征融合结构;
所述结构采用PSPNet-resnet101在8,4,2,1四个尺度的特征作为输入,输出2倍尺度的融合特征;
其中8,4,2尺度的输入特征分别为conv5_4,conv2_x,conv1_3/ReLU。
4.根据权利要求3所述的高精度图像语义分割算法模型,其特征在于,所述模型在融合的特征上采用了一个金字塔池化层,即将融合特征重采样到1,2,3,6四个尺度,获得4个不同尺度的特征,每个特征分别经过数层卷积处理之后再重采样到原始特征长宽,最后堆叠4个特征得到输出特征。
5.根据权利要求4所述的高精度图像语义分割算法模型,其特征在于,所述模型采用多模态建模,具体为一对多的模式建模,即在一次前向传播的过程中生成多个可能的预测结果,选择损失函数值最低的预测结果进行后向传播训练。
6.根据权利要求4或5所述的高精度图像语义分割算法模型,其特征在于,所述多模态建模的过程为:首先从随机数中生成N个特征图,然后将这N个特征图和现有的数据特征进行叠加,使用叠加后的特征进行分类。
7.根据权利要求6所述的高精度图像语义分割算法模型,其特征在于,所述模型在res5,res4b22,b21,b20这4层中使用了注意力机制。
8.根据权利要求7所述的高精度图像语义分割算法模型,其特征在于,所述模型的推理层采用以下网络结构:
conv3x3-BN-ReLU-dropout-conv1x1-CELoss
其中CELoss为交叉熵损失函数。
9.一种基于权利要求8所述的高精度图像语义分割算法模型的分割方法,其特征在于,所述方法包括以下步骤:
S1:对若干个目标图像进行人工标注真值处理,所述标注真值指人工绘制的图像中每个目标的精确轮廓;
每个目标轮廓由若干个多边形表示;
人工标注完成后将标注的多边形数据栅格化,得到和目标图像长宽相同的真值图像;
其中属于目标的像素值为1,否则为0;
S2:利用训练数据集中的数据来训练权利要求8所述模型,直到系统收敛;
S3:使用S2训练完成的模型识别目标图像,生成目标语义分割结果。
CN202010281360.9A 2020-04-10 2020-04-10 一种高精度图像语义分割算法模型及分割方法 Active CN111461130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010281360.9A CN111461130B (zh) 2020-04-10 2020-04-10 一种高精度图像语义分割算法模型及分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010281360.9A CN111461130B (zh) 2020-04-10 2020-04-10 一种高精度图像语义分割算法模型及分割方法

Publications (2)

Publication Number Publication Date
CN111461130A true CN111461130A (zh) 2020-07-28
CN111461130B CN111461130B (zh) 2021-02-09

Family

ID=71681048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010281360.9A Active CN111461130B (zh) 2020-04-10 2020-04-10 一种高精度图像语义分割算法模型及分割方法

Country Status (1)

Country Link
CN (1) CN111461130B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949732A (zh) * 2021-03-12 2021-06-11 中国人民解放军海军航空大学 基于自适应多模态遥感图像融合语义标注方法及系统

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830176A (zh) * 2018-05-25 2018-11-16 深圳市太空科技南方研究院 一种睡眠觉醒检测方法、装置及终端
CN109145769A (zh) * 2018-08-01 2019-01-04 辽宁工业大学 融合图像分割特征的目标检测网络设计方法
CN109214406A (zh) * 2018-05-16 2019-01-15 长沙理工大学 基于D-MobileNet神经网络图像分类方法
CN109360206A (zh) * 2018-09-08 2019-02-19 华中农业大学 基于深度学习的大田稻穗分割方法
CN109410185A (zh) * 2018-10-10 2019-03-01 腾讯科技(深圳)有限公司 一种图像分割方法、装置和存储介质
CN109446951A (zh) * 2018-10-16 2019-03-08 腾讯科技(深圳)有限公司 三维图像的语义分割方法、装置、设备及存储介质
CN109447994A (zh) * 2018-11-05 2019-03-08 陕西师范大学 结合完全残差与特征融合的遥感图像分割方法
CN109657538A (zh) * 2018-11-05 2019-04-19 中国科学院计算技术研究所 基于上下文信息指导的场景分割方法和系统
CN109670450A (zh) * 2018-12-20 2019-04-23 天津天地伟业信息系统集成有限公司 一种基于视频的人车物检测方法
CN109902693A (zh) * 2019-02-16 2019-06-18 太原理工大学 一种基于多注意力空间金字塔特征图像识别方法
CN110059758A (zh) * 2019-04-24 2019-07-26 海南长光卫星信息技术有限公司 一种基于语义分割的遥感影像养殖塘检测方法
CN110110617A (zh) * 2019-04-22 2019-08-09 腾讯科技(深圳)有限公司 医学影像分割方法、装置、电子设备和存储介质
CN110176027A (zh) * 2019-05-27 2019-08-27 腾讯科技(深圳)有限公司 视频目标跟踪方法、装置、设备及存储介质
CN110263833A (zh) * 2019-06-03 2019-09-20 韩慧慧 基于编码-解码结构的图像语义分割方法
CN110363204A (zh) * 2019-06-24 2019-10-22 杭州电子科技大学 一种基于多任务特征学习的对象表示方法
CN110675419A (zh) * 2019-10-11 2020-01-10 上海海事大学 一种自适应注意门的多模态脑胶质瘤影像分割方法
CN110942465A (zh) * 2019-11-08 2020-03-31 浙江工业大学 一种基于ResUnet的3视图PET图像分割方法
CN110942464A (zh) * 2019-11-08 2020-03-31 浙江工业大学 一种融合2维和3维模型的pet图像分割方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109214406A (zh) * 2018-05-16 2019-01-15 长沙理工大学 基于D-MobileNet神经网络图像分类方法
CN108830176A (zh) * 2018-05-25 2018-11-16 深圳市太空科技南方研究院 一种睡眠觉醒检测方法、装置及终端
CN109145769A (zh) * 2018-08-01 2019-01-04 辽宁工业大学 融合图像分割特征的目标检测网络设计方法
CN109360206A (zh) * 2018-09-08 2019-02-19 华中农业大学 基于深度学习的大田稻穗分割方法
CN109410185A (zh) * 2018-10-10 2019-03-01 腾讯科技(深圳)有限公司 一种图像分割方法、装置和存储介质
CN109446951A (zh) * 2018-10-16 2019-03-08 腾讯科技(深圳)有限公司 三维图像的语义分割方法、装置、设备及存储介质
CN109447994A (zh) * 2018-11-05 2019-03-08 陕西师范大学 结合完全残差与特征融合的遥感图像分割方法
CN109657538A (zh) * 2018-11-05 2019-04-19 中国科学院计算技术研究所 基于上下文信息指导的场景分割方法和系统
CN109670450A (zh) * 2018-12-20 2019-04-23 天津天地伟业信息系统集成有限公司 一种基于视频的人车物检测方法
CN109902693A (zh) * 2019-02-16 2019-06-18 太原理工大学 一种基于多注意力空间金字塔特征图像识别方法
CN110110617A (zh) * 2019-04-22 2019-08-09 腾讯科技(深圳)有限公司 医学影像分割方法、装置、电子设备和存储介质
CN110059758A (zh) * 2019-04-24 2019-07-26 海南长光卫星信息技术有限公司 一种基于语义分割的遥感影像养殖塘检测方法
CN110176027A (zh) * 2019-05-27 2019-08-27 腾讯科技(深圳)有限公司 视频目标跟踪方法、装置、设备及存储介质
CN110263833A (zh) * 2019-06-03 2019-09-20 韩慧慧 基于编码-解码结构的图像语义分割方法
CN110363204A (zh) * 2019-06-24 2019-10-22 杭州电子科技大学 一种基于多任务特征学习的对象表示方法
CN110675419A (zh) * 2019-10-11 2020-01-10 上海海事大学 一种自适应注意门的多模态脑胶质瘤影像分割方法
CN110942465A (zh) * 2019-11-08 2020-03-31 浙江工业大学 一种基于ResUnet的3视图PET图像分割方法
CN110942464A (zh) * 2019-11-08 2020-03-31 浙江工业大学 一种融合2维和3维模型的pet图像分割方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HENGSHUANG ZHAO 等: "Pyramid Scene Parsing Network", 《ARXIV:1612.01105V2 [CS.CV]》 *
XIANFENG WANG 等: "Research and Application of Cell Image Segmentation Based on Generative Adversarial Network", 《2019 ASSOCIATION FOR COMPUTING MACHINERY》 *
马小啸 等: "为什么一个5*5的卷积核可以用两个3*3的卷积核代替,一个7*7的卷积核可以用三个3*3的卷积核代替", 《知乎》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949732A (zh) * 2021-03-12 2021-06-11 中国人民解放军海军航空大学 基于自适应多模态遥感图像融合语义标注方法及系统
CN112949732B (zh) * 2021-03-12 2022-04-22 中国人民解放军海军航空大学 基于自适应多模态遥感图像融合语义标注方法及系统

Also Published As

Publication number Publication date
CN111461130B (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
CN111191583B (zh) 基于卷积神经网络的空间目标识别系统及方法
CN110532920B (zh) 基于FaceNet方法的小数量数据集人脸识别方法
CN109359534B (zh) 一种三维物体几何特征提取方法及系统
CN111652273B (zh) 一种基于深度学习的rgb-d图像分类方法
CN114758288A (zh) 一种配电网工程安全管控检测方法及装置
CN114863407B (zh) 一种基于视觉语言深度融合的多任务冷启动目标检测方法
CN113076804B (zh) 基于YOLOv4改进算法的目标检测方法、装置及系统
CN109002771B (zh) 一种基于递归神经网络的遥感图像分类方法
CN114492634B (zh) 一种细粒度装备图片分类识别方法及系统
CN109919215B (zh) 基于聚类算法改进特征金字塔网络的目标检测方法
CN110851627B (zh) 一种用于描述全日面图像中太阳黑子群的方法
CN113657414B (zh) 一种物体识别方法
Yang et al. Gangue localization and volume measurement based on adaptive deep feature fusion and surface curvature filter
CN114626476A (zh) 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置
CN111461130B (zh) 一种高精度图像语义分割算法模型及分割方法
CN114332921A (zh) 基于改进聚类算法的Faster R-CNN网络的行人检测方法
CN105844299A (zh) 一种基于词袋模型的图像分类方法
CN115578574A (zh) 一种基于深度学习和拓扑感知的三维点云补全方法
CN114898464A (zh) 一种基于机器视觉的轻量化精准手指语智能算法识别方法
CN113344110A (zh) 一种基于超分辨率重建的模糊图像分类方法
CN113688864A (zh) 一种基于分裂注意力的人-物交互关系分类方法
Sengottuvelan et al. Object classification using substance based neural network
CN110956177A (zh) 一种混合型验证码的识别方法及系统
Aggarwal et al. Object Detection Based Approaches in Image Classification: A Brief Overview
Anilkumar et al. A Survey on Semantic Segmentation of Aerial Images using Deep Learning Techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant