CN109902693A - 一种基于多注意力空间金字塔特征图像识别方法 - Google Patents
一种基于多注意力空间金字塔特征图像识别方法 Download PDFInfo
- Publication number
- CN109902693A CN109902693A CN201910118538.5A CN201910118538A CN109902693A CN 109902693 A CN109902693 A CN 109902693A CN 201910118538 A CN201910118538 A CN 201910118538A CN 109902693 A CN109902693 A CN 109902693A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- attention
- module
- spatial pyramid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
一种基于多注意力空间金字塔特征图像识别方法,属于网络模式识别技术领域,其特征是结合对浅层网络加深的方法,加强卷积神经网络的特征提取能力,通过注意力模块,融合多尺度的注意力特征来获得更加丰富的特征表示,在每个分支网络的最后,加入了空间金字塔池化操作进行多尺度的特征提取,使任意大小的特征图转换成固定大小的特征向量送入全连接层。本发明的网络可以输入任意大小的图像而不需要缩放或裁减,更好的保留了图像的特征信息,对于复杂环境下的图像精细化识别,低像素图像的分类识别方面,具有更好的鲁棒性和准确率。
Description
技术领域
本发明属于网络模式识别技术领域,一种多注意力空间金字塔特征提取网络结构,结合对浅层网络加深的方法,加强卷积神经网络的特征提取能力,是一种改进的深度卷积网络结构。
背景技术
随着移动互联网以及模式识别技术的不断发展,信息的传递变得更加快速,而信息量的剧增使得交流媒介已经逐渐由文本转向图片或视频。相较于传统对图像处理的耗时耗力,深度学习凭借其强大的数据处理能力和较高的准确率,成为图像识别,人工智能等领域的研究热点。
其中卷积神经网络作为深度学习领域一种数据驱动方法,在图像分类等领域有着不错的效果,传统的卷积神经网络包括卷积层、pooling层、全连接层,这些都是现代CNN网络的基本组件。不同的卷积核能够提取到图像中的不同特征,卷积层对图像的每个像素的邻域加权求和得到该像素点的输出值,得到的输出值通过池化操作来降低卷积层输出的特征向量,同时降低模型的过拟合程度,最后全连接层连接所有的特征,将输出值送给分类器。
之后,Alex Krizhevsky发表了AlexNet网络结构,并在当年取得了ImageNet最好的成绩,也是在那年之后像VGG-Net,Resnet等网络已相继被提出,这些方法在图像识别方面都取得了不错的效果,随之深度学习的不断发展,对图像细粒度特征的识别要求,模型的鲁棒性和识别准确率等方面有了更高的要求,虽然现有的方法对图像分类问题有着不错的效果,但是对于像素较低的以及在复杂环境下的图像,现有的方法不能满足识别的精度要求,并且在图像的细粒度特征识别方面现有的方法也存在识别精度不高的问题。
发明内容
为了提升网络的性能,使其在复杂的环境下也拥有更好的鲁棒性和更高的识别精度,解决对于像素较低的图像以及在复杂环境下的图像识别的精度不高,且图像的细粒度特征提取难度较大的问题,提出了一种基于多注意力空间金字塔特征图像识别方法,加强卷积神经网络的特征提取能力,实现在复杂环境下的图像精细化识别。
一种基于多注意力空间金字塔特征图像识别方法,包括以下步骤,(1)首先经过如图1中,CNN卷积层进行初步的特征提取,所述CNN卷积层包括五个卷积和两个平均池化操作;然后输入到三个Inception模块进行进一步的特征提取。其中Inception3 ,Inception2模块对包括手提包、短发的图像细粒度特征提取效果较好,而inception1模块抓住包括纹理、边界的细节特征,主网络与分支网络共享CNN模型卷积层。
(2)如图1虚线所示,对于每个Inception的输出,通过1×1的卷积进行降维,然后进行BN(标准化)和Relud激活函数操作,降维后的8个通道每个通道提取图像不同的特征,而且每个通道有着不同的注意力(高亮)区域,对于不同的注意力区域,细粒度特征可以被单独的识别,多个注意通道的多样性丰富了特征表示,提高了识别的准确性,然后通过注意力模块融合多尺度的注意力特征来获得更加丰富的特征表示。
(3)在每个分支网络的最后,加入了空间金字塔池化操作进行多尺度的特征提取,并且空间金字塔池化,使得任意大小的特征图都能够转换成固定大小的特征向量送入全连接层,使网络输入任意大小的图像而不需要缩放或裁减,更好的保留了图像的特征信息,最后融合各个分支网络的特征作为最后的特征表达送入全连接层。
本发明对浅层网络加深的方法,加强卷积神经网络的特征提取能力,实现在复杂环境下的图像精细化识别,得益于多注意力通道对高亮区域特征的提取能力,而且对于不同的注意力区域,细粒度特征可以被单独的识别,多个注意通道的多样性丰富了特征表示,提高了识别的准确性,模型中加入spp(空间金字塔池化)层后,对输入的图像大小不再有所限制,可以输入任意大小的图片,更多的保留了图像的信息,进一步提高了行人属性识别的准确率。相对于传统深度学习的方法,本发明可以提取到行人更高层的语义信息,受复杂环境以及光照,视角的影响较小,具有更好的鲁棒性和准确率。
附图说明
图1为本发明的网络结构图。
图2为inception1结构图。
图3为inception2结构图。
图4为inception3结构图,n等于7。
具体实施方式
图1所示,在图像输入层,因为模型加入空间金字塔池化,使得任意大小的特征图都能够转换成固定大小的特征向量,对输入图像的尺寸不再有要求,可以输入任意大小的图像,在特征提取阶段:
构建基于多注意力空间金字塔特征提取网络具体为:基于Inceptionv3网络提出了自己的特征提取网络,所述特征提取网络有一个主网络,三个分支网络,每个分支网络共享CNN模型卷积层,每个分支与主网络有相同的inception模块,在如图1中,CNN结构中包含五个卷积层,两个平均池化层,每次卷积后加入Relud激活函数和BN(标准化)操作,具体为:
卷积核大小为3×3,深度为32,步长为2,Padding方式为Valid
卷积核大小为3×3,深度为32,步长为1,Padding方式为Valid
卷积核大小为3×3,深度为64,步长为1,Padding方式为Valid
卷积核大小为3×3,步长为2的平均池化
卷积核大小为1×1,深度为80,步长为1,Padding方式为Valid
卷积核大小为3×3,深度为192,步长为1,Padding方式为Valid
卷积核大小为3×3,步长为2的平均池化
之后在主网络后紧随三个inception模块(即 inception1模块、inception2模块、inception3模块),在每个inception模块中,将一个较大的卷积拆成两个较小的卷积,例如把7×7的卷积拆成1×7和7×1的卷积,3×3的卷积拆成1×3和3×1的卷积,这样一方面节约了大量的参数,加速运算减轻了过拟合,同时增加了一层非线性扩展了模型的表达能力。
在每个分支网络加入注意力机制来强化对特征的提取,对于主网络中每个inception模块的输出,用1×1的卷积对其进行降维操作,使其维度降为L=8,之后进行ReLU和BN操作,公式如下:
L为注意力映射的通道数,W为宽度,H为高度,降维后的特征与三个分支网络相应的inception输出进行逐像素点相乘,公式如下:
=×,
为分支网络进行降维后的特征映射,L为通道数,得到的特征映射随后输入紧接着的inception模块进行特征提取,得益于多注意力通道对高亮区域特征的提取能力,而且对于不同的注意力区域,细粒度特征可以被单独的识别,多个注意通道的多样性丰富了特征表示,提高了识别的准确性。之后在主网络和分支网络中加入了三层spp(空间金字塔池化)操作,进行多尺度的特征提取,以及524个节点的全连接层,BN和Dropout层加在全连接层之后防止模型的过拟合,加快模型的收敛,随后将主网络和三个分支网络进行特征融合,融合后的特征输入到全连接层当中,最后loss函数将全连接层得到的结果通过sigmod函数进行概率计算,得到预测标记,与真实标签进行比较,计算损失,优化模型。
在模型训练的过程中,将每一层的输出进行反卷积,将该层的输入与反卷积输出结果进行比较,通过梯度下降法不断调整卷积核权值大小,学习速率设置为0.0001,学习速率每轮下降1/300,权重衰减为0.00004,使用sigmod交叉熵损失函数对模型训练300次。
Claims (2)
1.一种基于多注意力空间金字塔特征图像识别方法,其特征是结合对浅层网络加深的方法,加强卷积神经网络的特征提取能力,通过注意力模块,融合多尺度的注意力特征来获得更加丰富的特征表示,在每个分支网络的最后,加入了空间金字塔池化操作进行多尺度的特征提取,使任意大小的特征图转换成固定大小的特征向量送入全连接层。
2.根据权利要求1所述一种基于多注意力空间金字塔特征图像识别方法,其特征是包括以下内容:
(1)主网络与分支网络共享CNN卷积层;先经过CNN卷积层对图像进行初步特征提取,然后将提取到的初步特征分别输入到Inception3模块 、Inception2模块、Inception1模块,对输入到Inception3模块 、Inception2模块的初步特征进行细粒度特征提取,对输入到Inception1模块的初步特征进行细节特征提取;所述细粒度特征包括手提包、短发图像,细节特征包括纹理、边界图像;
(2)对于每个Inception的输出,通过1×1的卷积进行降维,然后进行标准化操作和
Relud激活函数操作,降维后的8个通道每个通道提取图像不同的特征;
L为注意力映射的通道数,W为宽度,H为高度,为每
个Inception的输出,为对降维后的特征映射,为对得到的特征进行标准化
操作和Relud操作;
(3)降维后的特征与三个分支网络相应的inception输出进行逐像素点相乘,公式如下:
=×,
为分支网络进行降维后的特征映射,L为通道数,为得到的特征映射;
(4)在每个分支网络的最后,加入空间金字塔池化操作进行多尺度的特征提取,使任意大小的特征图转换成固定大小的特征向量送入全连接层,使网络输入任意大小的图像;
(5)融合各个分支网络的特征作为最后的特征表达,送入全连接层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910118538.5A CN109902693A (zh) | 2019-02-16 | 2019-02-16 | 一种基于多注意力空间金字塔特征图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910118538.5A CN109902693A (zh) | 2019-02-16 | 2019-02-16 | 一种基于多注意力空间金字塔特征图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109902693A true CN109902693A (zh) | 2019-06-18 |
Family
ID=66944786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910118538.5A Pending CN109902693A (zh) | 2019-02-16 | 2019-02-16 | 一种基于多注意力空间金字塔特征图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109902693A (zh) |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503635A (zh) * | 2019-07-30 | 2019-11-26 | 浙江工业大学 | 一种基于异构数据融合网络的手骨x光片骨龄评估方法 |
CN110598716A (zh) * | 2019-09-09 | 2019-12-20 | 北京文安智能技术股份有限公司 | 一种人员属性识别方法、装置及系统 |
CN110598029A (zh) * | 2019-09-06 | 2019-12-20 | 西安电子科技大学 | 基于注意力转移机制的细粒度图像分类方法 |
CN110751212A (zh) * | 2019-10-21 | 2020-02-04 | 南京大学 | 一种移动设备上高效的细粒度图像识别方法 |
CN110781895A (zh) * | 2019-10-10 | 2020-02-11 | 湖北工业大学 | 一种基于卷积神经网络的图像语义分割方法 |
CN110807401A (zh) * | 2019-10-29 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 用户身份识别、多用户打卡方法、装置、存储介质及设备 |
CN111126258A (zh) * | 2019-12-23 | 2020-05-08 | 深圳市华尊科技股份有限公司 | 图像识别方法及相关装置 |
CN111145170A (zh) * | 2019-12-31 | 2020-05-12 | 电子科技大学 | 一种基于深度学习的医学影像分割方法 |
CN111199212A (zh) * | 2020-01-02 | 2020-05-26 | 西安工程大学 | 基于注意力模型的行人属性识别方法 |
CN111241326A (zh) * | 2019-12-26 | 2020-06-05 | 同济大学 | 基于注意力金字塔图网络的图像视觉关系指代定位方法 |
CN111461130A (zh) * | 2020-04-10 | 2020-07-28 | 视研智能科技(广州)有限公司 | 一种高精度图像语义分割算法模型及分割方法 |
CN111539458A (zh) * | 2020-04-02 | 2020-08-14 | 咪咕文化科技有限公司 | 特征图处理方法、装置、电子设备及存储介质 |
CN111860693A (zh) * | 2020-07-31 | 2020-10-30 | 元神科技(杭州)有限公司 | 一种轻量级视觉目标检测方法及系统 |
CN111898608A (zh) * | 2020-07-04 | 2020-11-06 | 西北工业大学 | 一种基于边界预测的自然场景多语言文字检测方法 |
CN112149582A (zh) * | 2020-09-27 | 2020-12-29 | 中国科学院空天信息创新研究院 | 一种高光谱图像材质识别方法及系统 |
CN112241740A (zh) * | 2019-07-19 | 2021-01-19 | 新华三技术有限公司 | 一种特征提取方法及装置 |
CN112288074A (zh) * | 2020-08-07 | 2021-01-29 | 京东安联财产保险有限公司 | 图像识别网络生成方法及装置、存储介质及电子设备 |
CN112418005A (zh) * | 2020-11-06 | 2021-02-26 | 北京工业大学 | 一种基于反向辐射注意力金字塔网络的烟雾多分类识别方法 |
WO2021051511A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 信息提取的方法、装置、计算机设备和存储介质 |
CN112580660A (zh) * | 2020-11-17 | 2021-03-30 | 上海闻泰信息技术有限公司 | 图像处理方法、装置、计算机设备和可读存储介质 |
CN112653899A (zh) * | 2020-12-18 | 2021-04-13 | 北京工业大学 | 一种基于联合注意力ResNeSt的复杂场景下网络直播视频特征提取方法 |
CN112651960A (zh) * | 2020-12-31 | 2021-04-13 | 上海联影智能医疗科技有限公司 | 一种图像处理方法、装置、设备及存储介质 |
CN112766409A (zh) * | 2021-02-01 | 2021-05-07 | 西北工业大学 | 一种遥感图像目标检测的特征融合方法 |
CN112906701A (zh) * | 2021-02-08 | 2021-06-04 | 重庆兆光科技股份有限公司 | 一种基于多注意力神经网络的细粒度图像识别方法及系统 |
CN113111711A (zh) * | 2021-03-11 | 2021-07-13 | 浙江理工大学 | 一种基于双线性和空间金字塔的池化方法 |
CN113222904A (zh) * | 2021-04-21 | 2021-08-06 | 重庆邮电大学 | 改进PoolNet网络结构的混凝土路面裂缝检测方法 |
CN113222044A (zh) * | 2021-05-25 | 2021-08-06 | 合肥工业大学 | 一种基于三元注意力和尺度关联融合的宫颈液基细胞分类方法 |
CN113807362A (zh) * | 2021-09-03 | 2021-12-17 | 西安电子科技大学 | 基于层间语义信息融合深度卷积网络的图像分类方法 |
CN114821121A (zh) * | 2022-05-09 | 2022-07-29 | 盐城工学院 | 一种基于rgb三分量分组注意力加权融合的图像分类方法 |
CN115205614A (zh) * | 2022-05-20 | 2022-10-18 | 钟家兴 | 一种用于智能制造的矿石x光图像识别方法 |
CN115276784A (zh) * | 2022-07-26 | 2022-11-01 | 西安电子科技大学 | 基于深度学习的轨道角动量模态识别方法 |
CN118247784A (zh) * | 2024-05-28 | 2024-06-25 | 南昌大学第二附属医院 | 一种基于深度卷积神经网络的隐球菌图像识别方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105894045A (zh) * | 2016-05-06 | 2016-08-24 | 电子科技大学 | 一种基于空间金字塔池化的深度网络模型的车型识别方法 |
CN107680106A (zh) * | 2017-10-13 | 2018-02-09 | 南京航空航天大学 | 一种基于Faster R‑CNN的显著性目标检测方法 |
EP3301617A1 (fr) * | 2016-09-30 | 2018-04-04 | Safran Identity & Security | Procédés d'apprentissage sécurisé de paramètres d'un réseau de neurones à convolution, et de classification sécurisée d'une donnée d'entrée |
CN108154145A (zh) * | 2018-01-24 | 2018-06-12 | 北京地平线机器人技术研发有限公司 | 检测自然场景图像中的文本的位置的方法和装置 |
CN108229478A (zh) * | 2017-06-30 | 2018-06-29 | 深圳市商汤科技有限公司 | 图像语义分割及训练方法和装置、电子设备、存储介质和程序 |
CN109033998A (zh) * | 2018-07-04 | 2018-12-18 | 北京航空航天大学 | 基于注意力机制卷积神经网络的遥感影像地物标注方法 |
CN109165697A (zh) * | 2018-10-12 | 2019-01-08 | 福州大学 | 一种基于注意力机制卷积神经网络的自然场景文字检测方法 |
-
2019
- 2019-02-16 CN CN201910118538.5A patent/CN109902693A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105894045A (zh) * | 2016-05-06 | 2016-08-24 | 电子科技大学 | 一种基于空间金字塔池化的深度网络模型的车型识别方法 |
EP3301617A1 (fr) * | 2016-09-30 | 2018-04-04 | Safran Identity & Security | Procédés d'apprentissage sécurisé de paramètres d'un réseau de neurones à convolution, et de classification sécurisée d'une donnée d'entrée |
CN108229478A (zh) * | 2017-06-30 | 2018-06-29 | 深圳市商汤科技有限公司 | 图像语义分割及训练方法和装置、电子设备、存储介质和程序 |
CN107680106A (zh) * | 2017-10-13 | 2018-02-09 | 南京航空航天大学 | 一种基于Faster R‑CNN的显著性目标检测方法 |
CN108154145A (zh) * | 2018-01-24 | 2018-06-12 | 北京地平线机器人技术研发有限公司 | 检测自然场景图像中的文本的位置的方法和装置 |
CN109033998A (zh) * | 2018-07-04 | 2018-12-18 | 北京航空航天大学 | 基于注意力机制卷积神经网络的遥感影像地物标注方法 |
CN109165697A (zh) * | 2018-10-12 | 2019-01-08 | 福州大学 | 一种基于注意力机制卷积神经网络的自然场景文字检测方法 |
Cited By (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112241740B (zh) * | 2019-07-19 | 2024-03-26 | 新华三技术有限公司 | 一种特征提取方法及装置 |
CN112241740A (zh) * | 2019-07-19 | 2021-01-19 | 新华三技术有限公司 | 一种特征提取方法及装置 |
CN110503635A (zh) * | 2019-07-30 | 2019-11-26 | 浙江工业大学 | 一种基于异构数据融合网络的手骨x光片骨龄评估方法 |
CN110503635B (zh) * | 2019-07-30 | 2022-04-05 | 浙江工业大学 | 一种基于异构数据融合网络的手骨x光片骨龄评估方法 |
CN110598029A (zh) * | 2019-09-06 | 2019-12-20 | 西安电子科技大学 | 基于注意力转移机制的细粒度图像分类方法 |
CN110598029B (zh) * | 2019-09-06 | 2022-03-22 | 西安电子科技大学 | 基于注意力转移机制的细粒度图像分类方法 |
CN110598716A (zh) * | 2019-09-09 | 2019-12-20 | 北京文安智能技术股份有限公司 | 一种人员属性识别方法、装置及系统 |
WO2021051511A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 信息提取的方法、装置、计算机设备和存储介质 |
CN110781895B (zh) * | 2019-10-10 | 2023-06-20 | 湖北工业大学 | 一种基于卷积神经网络的图像语义分割方法 |
CN110781895A (zh) * | 2019-10-10 | 2020-02-11 | 湖北工业大学 | 一种基于卷积神经网络的图像语义分割方法 |
CN110751212B (zh) * | 2019-10-21 | 2023-08-22 | 南京大学 | 一种移动设备上高效的细粒度图像识别方法 |
CN110751212A (zh) * | 2019-10-21 | 2020-02-04 | 南京大学 | 一种移动设备上高效的细粒度图像识别方法 |
CN110807401A (zh) * | 2019-10-29 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 用户身份识别、多用户打卡方法、装置、存储介质及设备 |
CN111126258B (zh) * | 2019-12-23 | 2023-06-23 | 深圳市华尊科技股份有限公司 | 图像识别方法及相关装置 |
CN111126258A (zh) * | 2019-12-23 | 2020-05-08 | 深圳市华尊科技股份有限公司 | 图像识别方法及相关装置 |
CN111241326A (zh) * | 2019-12-26 | 2020-06-05 | 同济大学 | 基于注意力金字塔图网络的图像视觉关系指代定位方法 |
CN111241326B (zh) * | 2019-12-26 | 2023-09-26 | 同济大学 | 基于注意力金字塔图网络的图像视觉关系指代定位方法 |
CN111145170B (zh) * | 2019-12-31 | 2022-04-22 | 电子科技大学 | 一种基于深度学习的医学影像分割方法 |
CN111145170A (zh) * | 2019-12-31 | 2020-05-12 | 电子科技大学 | 一种基于深度学习的医学影像分割方法 |
CN111199212A (zh) * | 2020-01-02 | 2020-05-26 | 西安工程大学 | 基于注意力模型的行人属性识别方法 |
CN111199212B (zh) * | 2020-01-02 | 2023-04-07 | 西安工程大学 | 基于注意力模型的行人属性识别方法 |
CN111539458B (zh) * | 2020-04-02 | 2024-02-27 | 咪咕文化科技有限公司 | 特征图处理方法、装置、电子设备及存储介质 |
CN111539458A (zh) * | 2020-04-02 | 2020-08-14 | 咪咕文化科技有限公司 | 特征图处理方法、装置、电子设备及存储介质 |
CN111461130B (zh) * | 2020-04-10 | 2021-02-09 | 视研智能科技(广州)有限公司 | 一种高精度图像语义分割算法模型及分割方法 |
CN111461130A (zh) * | 2020-04-10 | 2020-07-28 | 视研智能科技(广州)有限公司 | 一种高精度图像语义分割算法模型及分割方法 |
CN111898608A (zh) * | 2020-07-04 | 2020-11-06 | 西北工业大学 | 一种基于边界预测的自然场景多语言文字检测方法 |
CN111860693A (zh) * | 2020-07-31 | 2020-10-30 | 元神科技(杭州)有限公司 | 一种轻量级视觉目标检测方法及系统 |
CN112288074A (zh) * | 2020-08-07 | 2021-01-29 | 京东安联财产保险有限公司 | 图像识别网络生成方法及装置、存储介质及电子设备 |
CN112149582A (zh) * | 2020-09-27 | 2020-12-29 | 中国科学院空天信息创新研究院 | 一种高光谱图像材质识别方法及系统 |
CN112418005A (zh) * | 2020-11-06 | 2021-02-26 | 北京工业大学 | 一种基于反向辐射注意力金字塔网络的烟雾多分类识别方法 |
CN112418005B (zh) * | 2020-11-06 | 2024-05-28 | 北京工业大学 | 一种基于反向辐射注意力金字塔网络的烟雾多分类识别方法 |
CN112580660A (zh) * | 2020-11-17 | 2021-03-30 | 上海闻泰信息技术有限公司 | 图像处理方法、装置、计算机设备和可读存储介质 |
CN112653899B (zh) * | 2020-12-18 | 2022-07-12 | 北京工业大学 | 一种基于联合注意力ResNeSt的复杂场景下网络直播视频特征提取方法 |
CN112653899A (zh) * | 2020-12-18 | 2021-04-13 | 北京工业大学 | 一种基于联合注意力ResNeSt的复杂场景下网络直播视频特征提取方法 |
CN112651960A (zh) * | 2020-12-31 | 2021-04-13 | 上海联影智能医疗科技有限公司 | 一种图像处理方法、装置、设备及存储介质 |
CN112766409A (zh) * | 2021-02-01 | 2021-05-07 | 西北工业大学 | 一种遥感图像目标检测的特征融合方法 |
CN112906701A (zh) * | 2021-02-08 | 2021-06-04 | 重庆兆光科技股份有限公司 | 一种基于多注意力神经网络的细粒度图像识别方法及系统 |
CN112906701B (zh) * | 2021-02-08 | 2023-07-14 | 重庆兆光科技股份有限公司 | 一种基于多注意力神经网络的细粒度图像识别方法及系统 |
CN113111711A (zh) * | 2021-03-11 | 2021-07-13 | 浙江理工大学 | 一种基于双线性和空间金字塔的池化方法 |
CN113222904A (zh) * | 2021-04-21 | 2021-08-06 | 重庆邮电大学 | 改进PoolNet网络结构的混凝土路面裂缝检测方法 |
CN113222044A (zh) * | 2021-05-25 | 2021-08-06 | 合肥工业大学 | 一种基于三元注意力和尺度关联融合的宫颈液基细胞分类方法 |
CN113807362A (zh) * | 2021-09-03 | 2021-12-17 | 西安电子科技大学 | 基于层间语义信息融合深度卷积网络的图像分类方法 |
CN113807362B (zh) * | 2021-09-03 | 2024-02-27 | 西安电子科技大学 | 基于层间语义信息融合深度卷积网络的图像分类方法 |
CN114821121A (zh) * | 2022-05-09 | 2022-07-29 | 盐城工学院 | 一种基于rgb三分量分组注意力加权融合的图像分类方法 |
CN114821121B (zh) * | 2022-05-09 | 2023-02-03 | 盐城工学院 | 一种基于rgb三分量分组注意力加权融合的图像分类方法 |
CN115205614B (zh) * | 2022-05-20 | 2023-12-22 | 深圳市沃锐图像技术有限公司 | 一种用于智能制造的矿石x光图像识别方法 |
CN115205614A (zh) * | 2022-05-20 | 2022-10-18 | 钟家兴 | 一种用于智能制造的矿石x光图像识别方法 |
CN115276784B (zh) * | 2022-07-26 | 2024-01-23 | 西安电子科技大学 | 基于深度学习的轨道角动量模态识别方法 |
CN115276784A (zh) * | 2022-07-26 | 2022-11-01 | 西安电子科技大学 | 基于深度学习的轨道角动量模态识别方法 |
CN118247784A (zh) * | 2024-05-28 | 2024-06-25 | 南昌大学第二附属医院 | 一种基于深度卷积神经网络的隐球菌图像识别方法 |
CN118247784B (zh) * | 2024-05-28 | 2024-08-06 | 南昌大学第二附属医院 | 一种基于深度卷积神经网络的隐球菌图像识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109902693A (zh) | 一种基于多注意力空间金字塔特征图像识别方法 | |
Wang et al. | OAENet: Oriented attention ensemble for accurate facial expression recognition | |
Sun et al. | Optical flow guided feature: A fast and robust motion representation for video action recognition | |
CN107220657B (zh) | 一种面向小数据集的高分辨率遥感影像场景分类的方法 | |
Cai et al. | A unified multi-scale deep convolutional neural network for fast object detection | |
CN105320965B (zh) | 基于深度卷积神经网络的空谱联合的高光谱图像分类方法 | |
CN110516670A (zh) | 基于场景级与区域建议自注意模块的目标检测方法 | |
Zhang et al. | Content-adaptive sketch portrait generation by decompositional representation learning | |
CN107992842A (zh) | 活体检测方法、计算机装置及计算机可读存储介质 | |
Shang et al. | Using lightweight deep learning algorithm for real-time detection of apple flowers in natural environments | |
CN106909887A (zh) | 一种基于cnn和svm的动作识别方法 | |
CN109543632A (zh) | 一种基于浅层特征融合引导的深层网络行人检测方法 | |
CN110020681A (zh) | 基于空间注意力机制的点云特征提取方法 | |
Li et al. | Dynamic Hand Gesture Recognition Using Multi-direction 3D Convolutional Neural Networks. | |
CN108830913A (zh) | 基于用户颜色引导的语义级别线稿上色方法 | |
Li et al. | LBAN-IL: A novel method of high discriminative representation for facial expression recognition | |
Gupta et al. | Exploring person context and local scene context for object detection | |
Nie et al. | Urca-gan: Upsample residual channel-wise attention generative adversarial network for image-to-image translation | |
Li et al. | Multi-scale residual network model combined with Global Average Pooling for action recognition | |
Nag et al. | Facial micro-expression spotting and recognition using time contrasted feature with visual memory | |
Chen et al. | DB-BlendMask: Decomposed attention and balanced BlendMask for instance segmentation of high-resolution remote sensing images | |
Xu et al. | Grouped bidirectional LSTM network and multistage fusion convolutional transformer for hyperspectral image classification | |
Wang et al. | PPDet: A novel infrared pedestrian detection network in a per-pixel prediction fashion | |
Saeidi et al. | High-performance and deep pedestrian detection based on estimation of different parts | |
Shan et al. | A Data-Related Patch Proposal for Semantic Segmentation of Aerial Images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190618 |
|
RJ01 | Rejection of invention patent application after publication |