CN108510012A - 一种基于多尺度特征图的目标快速检测方法 - Google Patents

一种基于多尺度特征图的目标快速检测方法 Download PDF

Info

Publication number
CN108510012A
CN108510012A CN201810417918.4A CN201810417918A CN108510012A CN 108510012 A CN108510012 A CN 108510012A CN 201810417918 A CN201810417918 A CN 201810417918A CN 108510012 A CN108510012 A CN 108510012A
Authority
CN
China
Prior art keywords
characteristic pattern
analysis
convolution
scale features
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810417918.4A
Other languages
English (en)
Other versions
CN108510012B (zh
Inventor
何小海
单倩文
滕奇志
吴晓红
卿粼波
王正勇
余艳梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201810417918.4A priority Critical patent/CN108510012B/zh
Publication of CN108510012A publication Critical patent/CN108510012A/zh
Application granted granted Critical
Publication of CN108510012B publication Critical patent/CN108510012B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Abstract

本发明公开了一种基于多尺度特征图的目标快速检测方法。包括以下步骤:首先,通过卷积神经网络自动提取多尺度特征图,避免了传统方法中复杂的特征设计及提取过程。其次,考虑到不同卷积层学习到的特征表达各不相同,提出一种有效的特征图融合方法,并通过轻量级的压缩型双线性函数来实现,以提升特征图融合效率,丰富上下文信息。在此基础上,将多尺度特征图与通道注意机制结合,突出有用信息,抑制冗余信息,进一步增强特征图的表征能力。最后,将增强后的多尺度特征图用于目标检测,通过多次迭代训练得到最优模型。相比现有技术,本发明所提方法在提升检测精度的同时尽量降低时间成本,实现了目标的快速检测,在移动机器人、自动驾驶及智能视频监控等方面具有广阔的应用前景。

Description

一种基于多尺度特征图的目标快速检测方法
技术领域
本发明涉及一种基于多尺度特征图的目标快速检测方法,属于计算机视觉与智能信息处理领域。
背景技术
目标检测,作为其他高层视觉处理和分析任务的基础,一直是计算机视觉领域的核心问题之一,在移动机器人、自动驾驶以及智能视频监控系统等诸多方面具有重要的经济和实用价值,潜力巨大。针对海量的图像数据和动态变化的场景,高效地获取并识别各类感兴趣目标,实现精确而快速的目标检测,具有重要意义。
传统的目标检测方法依赖于人工设计特征,并将提取的特征输入分类器进行分类与识别。然而,人工设计特征存在诸多局限,如数据规模较小,泛化能力差,难以应用于复杂多变的实际场景等。近年来,深度学习,尤其是卷积神经网络在计算机视觉领域和自然语言处理领域的巨大成功,引发了学者浓厚的研究兴趣。随着一系列深度卷积神经网络的提出,如AlexNet、VGGNet、GoogLeNet、ResNet以及DenseNet等,目标检测方法的研究取得了飞跃性的进展。目前,基于深度学习的目标检测与识别方法大致分为两类:基于区域建议的方法和无区域建议的方法。基于区域建议的方法大致遵循区域建议、特征表示和区域分类三个步骤,包括R-CNN系列方法,取得了较高的检测精度,但计算复杂度相对较高,难以满足实时性的应用需求。无区域建议的方法一般采用回归的思想来检测边框位置及所属类别,主要包括YOLO、SSD等。无区域建议的方法突破了实时性方面的瓶颈,但是检测效果有限,对相互靠近的群体以及小目标检测精度不高。因此,如何在提高检测精度的同时兼顾速度,实现精确的目标快速检测,逐渐成为目标检测方向的研究趋势。
发明内容
本发明提出了一种基于多尺度特征图的目标快速检测方法,目的就在于为解决上述问题而提供一种精度较高的目标快速检测方法。
本发明通过以下技术方案来实现上述目的:
一种基于多尺度特征图的目标快速检测方法,包括以下步骤:
(1)初步提取多尺度特征图
本发明通过卷积神经网络模型提取多尺度特征图,模型主要包括两部分:一部分是用来初步提取特征的基础网络,采用VGG-16网络模型,包括从Conv1到Conv5的5组卷积层,及转换为卷积层的FC6和FC7,所有卷积层使用相同大小的卷积核;另一部分是末端添加的多个级联卷积层,用于提取不同尺度的卷积特征图。
(2)构建特征图融合模块
卷积神经网络通过不同的卷积核自行提取特征,将原始数据经过一些非线性变换转变为更高层次的、更加抽象的表达,再进行分类识别等。随着网络层数的加深,深层特征图的抽象能力更强,语义类别信息更丰富,而浅层特征图包含的细节信息更多,能很好地定位目标。本发明采用6组不同尺度的卷积特征图,还增加了基础网络中卷积层Conv5_3的特征图,并将其与FC7层特征图进行融合,以丰富上下文信息,增强特征图的表达能力。
(3)压缩型双线性融合方法
当前的特征融合方法主要包括加性融合、最大值融合以及级联融合。其实,双线性融合方法能更好地捕捉特征之间的复杂联系,它通过计算两组特征向量的外积后求和,使得所有元素充分进行相互作用。本发明通过一种压缩型双线性函数将Conv5_3与FC7层特征图进行融合,将传统的双线性变换看成一种多项式核函数,并根据Tensor Sketch方法来近似地计算出融合后的D维向量。
考虑到待融合的卷积层通道数不同,在融合之前先引入卷积核大小为1×1的卷积层,统一特征图的尺寸。令F1,F2∈RH×W×C分别表示两组特征图,H、W和C分别表示特征图的长、宽和通道数,则在位置(h,w)处分别存在C维的特征向量f1(h,w),f2(h,w)∈RC,这里h∈[1,H],w∈[1,W],为方便表示后面均省略了(h,w)。首先,利用Count Sketch函数Ψ将特征向量fk∈RC映射到特征空间,k=1,2。定义两个向量vk∈{-1,1}C,rk={1,...,D}C,服从均匀分布初始化,并在之后的调用中保持不变。这里rk用于寻找特征向量的第i个元素fk(i)在特征空间中对应的索引j=rk(i),则有
Ψ(fk,rk,vk)={Q1,Q2,...QD} (1)
式中i∈{1,...,C},j∈{1,...,D}。
其次,两个向量外积的Count Sketch可以通过计算各自Count Sketch的卷积得到,即
式中*表示卷积运算。另外,卷积定理指出,时域中的卷积等价于频域中的乘积。于是上述公式(3)可进一步表示为
式中表示逐元素乘积。
需要注意的是,传统的双线性融合方法在计算出外积后还要对特征图上所有元素进行累加。本发明为了使融合后的卷积特征保持二维特征图的形式,不进行池化运算,令融合后的特征图先经过求平方根处理,再通过卷积核大小为1×1的卷积层恢复至C个通道,最后通过L2正则化生成最终的特征图,作为后续网络结构的输入。
(4)将多尺度特征图与通道注意机制结合
卷积神经网络通过堆叠一系列的卷积层、非线性层和池化层,捕捉能够充分表征全局信息的特征作为图像描述符。其中,每个卷积层利用多个卷积核学习局部感受野上的空间信息和通道维度信息,生成一组多通道的特征图,实现有效的特征提取。考虑到浅层卷积特征普遍是类别信息不可知的,而较深层的特征具有更高的类别特异性,本发明将融合后的多尺度特征图与通道注意机制结合,即在特征检测网络的浅层和深层均置入Squeeze-and-Excitation模块,学习多尺度特征图不同通道之间的相互关系,自适应地调整各通道权重,然后对原特征图进行重新标定后再输入检测模块。
给定一组卷积特征图F∈RH×W×C,通道数为C,首先利用全局平均池化(Globalaverage pooling)对其进行Squeeze操作,将每个通道中的特征图大小变为1×1,使之具有全局感受野,生成向量Z∈R1×1×C,i∈[1,C],即
其次是Excitation操作,构造一种基于Sigmoid函数的简单门限机制,来自适应地学习各个通道的权重。先是通过全连接(Fully-connected,FC)层将通道数降到原本的1/16,经ReLu激活层后通过下一个FC层还原至C个通道,以更好地拟合通道之间复杂的非线性关系。之后利用Sigmoid函数将各个通道的权重归一化至区间[0,1]。这一过程可表示为
ω=Sigmoid[W2δ(W1f)] (6)
式中δ为ReLU激活函数,f为输入的向量,W1和W2分别对应两个FC层的权重。最后,通过乘法操作将各个通道的权重赋予相应的原始特征图,完成通道特征的自适应标定过程。
(5)通过多次迭代训练最优模型
在训练阶段,对目标对象的位置偏移量和类别置信度同时进行回归,损失函数可表示为位置损失Lloc和类别置信度损失Lconf的加权和,即
式中N为与真实物体框所匹配的默认框个数,x为默认框与真实物体框的匹配结果,l和s分别表示预测结果的位置信息和类别置信度,g为真实物体框,α为权重。通过多次迭代训练,减小损失函数值,不断提升目标检测模型的性能。
本发明的有益效果在于:本发明通过卷积神经网络初步提取卷积特征图,提出特征图融合模块以增加特征来源,再将多尺度特征图与通道注意机制结合,增强特征图的表达能力,明显提升了检测精度,同时检测速度达到63fps,较好地平衡了检测精度与速度之间的关系,在移动机器人、自动驾驶及智能视频监控等方面具有广泛的应用价值。
附图说明
图1为本发明基于多尺度特征图的目标快速检测方法流程图。
图2为本发明基于多尺度特征图的目标快速检测方法结构示意图。
具体实施方式
下面结合附图对本发明作进一步说明:
如图1所示,一种基于多尺度特征图的目标快速检测方法,包括以下步骤:
(1)输入待检测图像,搭建卷积神经网络模型。如图2所示,选择VGG-16网络作为基础网络,末端辅以一系列卷积层,初步生成多尺度的卷积特征图。
(2)构建一种轻量级的卷积特征图融合模块,将Conv5_3层与FC7层的特征图进行融合,生成新的特征图,并采用一种压缩型双线性函数来实现。
(3)将融合后的特征图与通道注意机制结合,对特征图各个通道之间的相互关系进行建模,优化检测网络的特征表达能力。
(4)将增强后的特征图输入检测模型,在训练阶段同时对目标位置和类别进行回归,通过多次迭代最小化损失函数,直至得到性能较好的检测模型。
(5)最后使用非极大值抑制(NMS)方法过滤重复检测的边框,依次执行排序-遍历-消除步骤选出置信度最高的边框,作为最终的检测结果。
为了验证本发明所述基于多尺度特征图的目标快速检测方法的合理性和有效性,选取PASCAL VOC 2007和VOC 2012两个标准数据集进行实验,并采用mAP(mean averageprecision)作为检测精度的客观评价指标,fps(frames per second)作为检测速度的客观评价指标。本发明基于深度学习框架Caffe实现,并利用图像处理器(GPU)加速运算,实验平台为英特尔Core i7-7700K@4.20GHz四核处理器,12GB内存,Nvidia GeForce GTX 1080Ti显卡。
对于VOC 2007数据集,使用VOC 2007trainval和VOC 2012trainval数据集的16551张图像作为训练数据,VOC 2007test中的4952张图像作为测试数据。设置输入图像的分辨率为300×300,批次规模为16,添加的网络层初始化方式为xavier,设置初始学习率为10-3,先迭代60K次,再降至10-4的学习率迭代60K次,得到最终模型。表1列出了本发明的实验结果,mAP达到78.5%,检测速度为63fps,检测性能优于其他同类方法,实现了目标的快速检测。
本发明也使用了更加具有挑战性的VOC 2012数据库进行实验,并将测试结果上传至官方的评估服务器来获取检测精度。训练数据由VOC 2007trainval、2007test和VOC2012trainval中的21503张图像组成,测试集VOC 2012test包含10991张图像。考虑到训练数据变多,迭代次数亦随之增加,先以10-3的学习率迭代80K,再以10-4和10-5的学习率分别迭代40K和60K次,其他设置与VOC2007实验相同。实验结果如表2所示,本发明的mAP达到76.4%,与其他方法相比,检测精度均有不同程度的提升,因而本发明的合理性和有效性得到充分证实。
表1 VOC 2007数据集实验结果
表2 VOC 2012数据集实验结果

Claims (5)

1.一种基于多尺度特征图的目标快速检测方法,其特征在于包括以下步骤:
步骤一:搭建卷积神经网络,以包含5组卷积层的VGG-16模型作为基础网络,并添加多个额外的卷积层,初步提取多尺度的卷积特征图;
步骤二:构建卷积特征图融合模块,将基础网络中Conv5_3层与FC7层的特征图进行融合,增加特征来源,丰富上下文信息;
步骤三:使用一种压缩型双线性函数实现特征图的融合,得到融合后的特征图;
步骤四:将多尺度特征图与通道注意机制结合,进一步增强特征图的判别能力;
步骤五:将增强后的多尺度特征图输入检测模型,在训练阶段同时对目标位置和类别进行回归,通过多次迭代最小化损失函数,直至得到性能较好的检测模型。
2.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤一中所述的卷积神经网络模型主要包括从Conv1到Conv5的5组卷积层,由全连接层转变的卷积层FC6和FC7,末端添加的一系列级联卷积层,及激活层、池化层等。
3.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤二中所述构建卷积特征图融合模块:卷积神经网络通过不同的卷积核自行提取特征,将原始数据经过一些非线性变换转变为更高层次的、更加抽象的表达,再进行分类识别,考虑到每一个卷积层所学习的特征表达均不同,本发明在采用6组不同特征图的基础上,增加了基础网络中卷积层Conv5_3的特征图,并将其与FC7层特征图进行融合,以增强特征图的表达能力。
4.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤三所述的融合方法包括以下步骤:
(1)考虑到待融合的卷积特征图通道数不同,在融合之前先引入卷积核大小为1×1的卷积层,在通道的维度上进行线性组合,以统一特征图的通道数;
(2)采用压缩型双线性函数来实现卷积特征图的融合,将传统的双线性变换看成一种多项式核函数,并根据Tensor Sketch方法来近似地计算出融合后的D维向量,令F1,F2∈RH ×W×C分别表示两组特征图,H、W和C分别表示特征图的长、宽和通道数,则在位置(h,w)处分别存在C维的特征向量f1(h,w),f2(h,w)∈RC,这里h∈[1,H],w∈[1,W],为方便表示后面均省略了(h,w),首先利用Count Sketch函数Ψ将特征向量fk∈RC映射到特征空间,k=1,2,定义两个向量vk∈{-1,1}C,rk={1,...,D}C,服从均匀分布初始化,并在之后的调用中保持不变,这里rk用于寻找特征向量的第i个元素fk(i)在特征空间中对应的索引j=rk(i),则有
Ψ(fk,rk,vk)={Q1,Q2,...QD} (1)
式中i∈{1,...,C},j∈{1,...,D},其次,两个向量外积的Count Sketch可以通过计算各自Count Sketch的卷积得到,即
式中*表示卷积运算,另外,卷积定理指出,时域中的卷积等价于频域中的乘积,于是上述公式(3)可进一步表示为
式中表示逐元素乘积;
(3)为了使融合后的卷积特征保持二维特征图的形式,不进行池化运算,令融合后的特征图先经过求平方根处理,再通过卷积核大小为1×1的卷积层恢复至C个通道,最后通过L2正则化生成最终的特征图,作为后续网络结构的输入。
5.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤四中所述,将融合后的多尺度特征图与通道注意机制结合,即在特征检测网络的浅层和深层位置均置入通道注意机制,学习特征图不同通道之间的相互关系,自适应地调整各通道权重,给定一组卷积特征图F∈RH×W×C,通道数为C,首先利用全局平均池化对其进行Squeeze操作,将每个通道中的特征图大小变为1×1,使之具有全局感受野,生成向量Z∈R1×1×C,i∈[1,C],即
其次是Excitation操作,构造一种基于Sigmoid函数的简单门限机制,来自适应地学习各个通道的权重,先是通过全连接层将通道数降到原本的1/16,经ReLu激活层后通过下一个FC层还原至C个通道,以更好地拟合通道之间复杂的非线性关系,之后利用Sigmoid函数将各个通道的权重归一化至区间[0,1],这一过程可表示为
ω=Sigmoid[W2δ(W1f)] (6)
式中δ为ReLU激活函数,f为输入的向量,W1和W2分别对应两个FC层的权重,最后,通过乘法操作将各个通道的权重赋予相应的原始特征图,完成通道特征的自适应标定过程。
CN201810417918.4A 2018-05-04 2018-05-04 一种基于多尺度特征图的目标快速检测方法 Active CN108510012B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810417918.4A CN108510012B (zh) 2018-05-04 2018-05-04 一种基于多尺度特征图的目标快速检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810417918.4A CN108510012B (zh) 2018-05-04 2018-05-04 一种基于多尺度特征图的目标快速检测方法

Publications (2)

Publication Number Publication Date
CN108510012A true CN108510012A (zh) 2018-09-07
CN108510012B CN108510012B (zh) 2022-04-01

Family

ID=63399800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810417918.4A Active CN108510012B (zh) 2018-05-04 2018-05-04 一种基于多尺度特征图的目标快速检测方法

Country Status (1)

Country Link
CN (1) CN108510012B (zh)

Cited By (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109214399A (zh) * 2018-10-12 2019-01-15 清华大学深圳研究生院 一种嵌入SENet结构的改进YOLOV3目标识别算法
CN109272039A (zh) * 2018-09-19 2019-01-25 北京航空航天大学 一种基于无人机的水坝周边异常监测方法与装置
CN109376594A (zh) * 2018-09-11 2019-02-22 百度在线网络技术(北京)有限公司 基于自动驾驶车辆的视觉感知方法、装置、设备以及介质
CN109447066A (zh) * 2018-10-18 2019-03-08 中国人民武装警察部队海警学院 一种快速精确的单阶段目标检测方法及装置
CN109522958A (zh) * 2018-11-16 2019-03-26 中山大学 基于跨尺度特征融合的深度卷积神经网络目标检测方法
CN109544563A (zh) * 2018-11-12 2019-03-29 北京航空航天大学 一种面向违禁物安检的被动毫米波图像人体目标分割方法
CN109726683A (zh) * 2018-12-29 2019-05-07 北京市商汤科技开发有限公司 目标对象检测方法和装置、电子设备和存储介质
CN109753959A (zh) * 2018-12-21 2019-05-14 西北工业大学 基于自适应多尺度特征融合的路面交通标志检测方法
CN109766790A (zh) * 2018-12-24 2019-05-17 重庆邮电大学 一种基于自适应特征通道的行人检测方法
CN109886871A (zh) * 2019-01-07 2019-06-14 国家新闻出版广电总局广播科学研究院 基于通道注意力机制和多层特征融合的图像超分辨率方法
CN109886286A (zh) * 2019-01-03 2019-06-14 武汉精测电子集团股份有限公司 基于级联检测器的目标检测方法、目标检测模型及系统
CN109886357A (zh) * 2019-03-13 2019-06-14 哈尔滨工程大学 一种基于特征融合的自适应权重深度学习目标分类方法
CN109902629A (zh) * 2019-03-01 2019-06-18 成都康乔电子有限责任公司 一种复杂交通场景下的实时车辆目标检测模型
CN109919249A (zh) * 2019-03-19 2019-06-21 北京字节跳动网络技术有限公司 用于生成特征图的方法和装置
CN109934241A (zh) * 2019-03-28 2019-06-25 南开大学 可集成到神经网络架构中的图像多尺度信息提取方法及应用
CN109934848A (zh) * 2019-03-07 2019-06-25 贵州大学 一种基于深度学习的运动物体精准定位的方法
CN110046650A (zh) * 2019-03-15 2019-07-23 中科院微电子研究所昆山分所 一种快递包裹条形码快速检测方法
CN110084299A (zh) * 2019-04-24 2019-08-02 中国人民解放军国防科技大学 基于多头融合注意力的目标检测方法和装置
CN110097090A (zh) * 2019-04-10 2019-08-06 东南大学 一种基于多尺度特征融合的图像细粒度识别方法
CN110110719A (zh) * 2019-03-27 2019-08-09 浙江工业大学 一种基于注意层区域卷积神经网络的目标检测方法
CN110188692A (zh) * 2019-05-30 2019-08-30 南通大学 一种有效目标快速识别的强化循环级联方法
CN110222755A (zh) * 2019-05-30 2019-09-10 国网山东省电力公司枣庄供电公司 基于特征融合的深度学习场景识别方法
CN110222173A (zh) * 2019-05-16 2019-09-10 吉林大学 基于神经网络的短文本情感分类方法及装置
CN110298387A (zh) * 2019-06-10 2019-10-01 天津大学 融入像素级attention机制的深度神经网络目标检测方法
CN110309839A (zh) * 2019-08-27 2019-10-08 北京金山数字娱乐科技有限公司 一种图像描述的方法及装置
CN110334716A (zh) * 2019-07-04 2019-10-15 北京迈格威科技有限公司 特征图处理方法、图像处理方法及装置
CN110335270A (zh) * 2019-07-09 2019-10-15 华北电力大学(保定) 基于层级区域特征融合学习的输电线路缺陷检测方法
CN110348437A (zh) * 2019-06-27 2019-10-18 电子科技大学 一种基于弱监督学习与遮挡感知的目标检测方法
CN110349147A (zh) * 2019-07-11 2019-10-18 腾讯医疗健康(深圳)有限公司 模型的训练方法、眼底黄斑区病变识别方法、装置及设备
CN110378243A (zh) * 2019-06-26 2019-10-25 深圳大学 一种行人检测方法及装置
CN110415795A (zh) * 2019-08-02 2019-11-05 杭州智团信息技术有限公司 一种荧光染色ctc图像的识别方法
CN110414417A (zh) * 2019-07-25 2019-11-05 电子科技大学 一种基于多层次融合多尺度预测的交通标志牌识别方法
CN110516305A (zh) * 2019-07-26 2019-11-29 西安交通大学 基于注意机制元学习模型的小样本下故障智能诊断方法
CN110929587A (zh) * 2019-10-30 2020-03-27 杭州电子科技大学 一种基于层次注意力机制的双向重构网络视频描述方法
CN111241910A (zh) * 2019-12-10 2020-06-05 电子科技大学 基于双信息流与视网膜感受野结构的行人检测模型设计方法
CN111275066A (zh) * 2018-12-05 2020-06-12 北京嘀嘀无限科技发展有限公司 一种图像特征的融合方法、装置以及电子设备
CN111312224A (zh) * 2020-02-20 2020-06-19 北京声智科技有限公司 语音分割模型的训练方法、装置和电子设备
CN111407260A (zh) * 2020-03-30 2020-07-14 华南理工大学 方向盘嵌入心电传感器的基于脑电和心电的疲劳检测方法
CN111444865A (zh) * 2020-03-31 2020-07-24 盐城禅图智能科技有限公司 一种基于逐步求精的多尺度目标检测方法
WO2020151247A1 (zh) * 2019-01-23 2020-07-30 华为技术有限公司 图像分析方法以及系统
CN111612751A (zh) * 2020-05-13 2020-09-01 河北工业大学 基于嵌入分组注意力模块的Tiny-yolov3网络的锂电池缺陷检测方法
CN111723829A (zh) * 2019-03-18 2020-09-29 四川大学 一种基于注意力掩模融合的全卷积目标检测方法
CN111738218A (zh) * 2020-07-27 2020-10-02 成都睿沿科技有限公司 人体异常行为识别系统及方法
CN111753825A (zh) * 2020-03-27 2020-10-09 北京京东尚科信息技术有限公司 图像描述生成方法、装置、系统、介质及电子设备
CN111783506A (zh) * 2019-05-17 2020-10-16 北京京东尚科信息技术有限公司 目标特征的确定方法、装置和计算机可读存储介质
CN111832348A (zh) * 2019-04-17 2020-10-27 中国科学院宁波材料技术与工程研究所 基于像素和通道注意力机制的行人重识别方法
CN111832336A (zh) * 2019-04-16 2020-10-27 四川大学 一种基于改进的c3d视频行为检测方法
CN111860039A (zh) * 2019-04-26 2020-10-30 四川大学 一种基于跨连cnn+svr的街道空间品质量化方法
CN111881262A (zh) * 2020-08-06 2020-11-03 重庆邮电大学 基于多通道神经网络的文本情感分析方法
CN112164041A (zh) * 2020-09-18 2021-01-01 南昌航空大学 基于多尺度深度神经网络的黄龙病自动诊疗系统及方法
CN112183269A (zh) * 2020-09-18 2021-01-05 哈尔滨工业大学(深圳) 一种适用于智能视频监控的目标检测方法与系统
CN112613505A (zh) * 2020-12-18 2021-04-06 安徽丹姆斯生物科技有限公司 一种基于深度学习的细胞微核识别、定位和计数方法
CN112651345A (zh) * 2020-12-29 2021-04-13 深圳市优必选科技股份有限公司 一种人体姿态识别模型优化方法、装置和终端设备
CN112686274A (zh) * 2020-12-31 2021-04-20 上海智臻智能网络科技股份有限公司 目标对象的检测方法及设备
CN112949672A (zh) * 2019-12-11 2021-06-11 顺丰科技有限公司 商品识别方法、装置、设备以及计算机可读存储介质
CN112949673A (zh) * 2019-12-11 2021-06-11 四川大学 一种基于全局注意力的特征融合目标检测与识别方法
CN113111879A (zh) * 2021-04-30 2021-07-13 上海睿钰生物科技有限公司 一种细胞检测的方法和系统
CN113128558A (zh) * 2021-03-11 2021-07-16 重庆邮电大学 基于浅层空间特征融合与自适应通道筛选的目标检测方法
CN113420729A (zh) * 2021-08-23 2021-09-21 城云科技(中国)有限公司 多尺度目标检测方法、模型、电子设备及其应用
CN113469099A (zh) * 2021-07-13 2021-10-01 北京航科威视光电信息技术有限公司 目标检测模型的训练方法、检测方法、装置、设备及介质
WO2021218037A1 (zh) * 2020-04-29 2021-11-04 北京迈格威科技有限公司 目标检测方法、装置、计算机设备和存储介质
CN113971427A (zh) * 2020-07-23 2022-01-25 四川大学 基于改进模型的岩屑识别方法
CN114037885A (zh) * 2020-07-21 2022-02-11 四川大学 一种基于可选择的膨胀卷积核大小的目标检测方法
CN117726807A (zh) * 2024-02-08 2024-03-19 北京理工大学 基于尺度和位置敏感性的红外小目标检测方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345763A (zh) * 2013-06-25 2013-10-09 西安理工大学 一种基于多尺度可变块的运动注意力计算方法
US20150138245A1 (en) * 2013-11-21 2015-05-21 Samsung Medison Co., Ltd. Image display system and method of fitting multiple models to image
CN106599907A (zh) * 2016-11-29 2017-04-26 北京航空航天大学 多特征融合的动态场景分类方法与装置
CN106815604A (zh) * 2017-01-16 2017-06-09 大连理工大学 基于多层信息融合的注视点检测方法
CN107424159A (zh) * 2017-07-28 2017-12-01 西安电子科技大学 基于超像素边缘和全卷积网络的图像语义分割方法
CN107423760A (zh) * 2017-07-21 2017-12-01 西安电子科技大学 基于预分割和回归的深度学习目标检测方法
CN107608943A (zh) * 2017-09-08 2018-01-19 中国石油大学(华东) 融合视觉注意力和语义注意力的图像字幕生成方法及系统
CN107862695A (zh) * 2017-12-06 2018-03-30 电子科技大学 一种基于全卷积神经网络的改进型图像分割训练方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345763A (zh) * 2013-06-25 2013-10-09 西安理工大学 一种基于多尺度可变块的运动注意力计算方法
US20150138245A1 (en) * 2013-11-21 2015-05-21 Samsung Medison Co., Ltd. Image display system and method of fitting multiple models to image
CN106599907A (zh) * 2016-11-29 2017-04-26 北京航空航天大学 多特征融合的动态场景分类方法与装置
CN106815604A (zh) * 2017-01-16 2017-06-09 大连理工大学 基于多层信息融合的注视点检测方法
CN107423760A (zh) * 2017-07-21 2017-12-01 西安电子科技大学 基于预分割和回归的深度学习目标检测方法
CN107424159A (zh) * 2017-07-28 2017-12-01 西安电子科技大学 基于超像素边缘和全卷积网络的图像语义分割方法
CN107608943A (zh) * 2017-09-08 2018-01-19 中国石油大学(华东) 融合视觉注意力和语义注意力的图像字幕生成方法及系统
CN107862695A (zh) * 2017-12-06 2018-03-30 电子科技大学 一种基于全卷积神经网络的改进型图像分割训练方法

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
JIE HU等: "Squeeze-and-Excitation Networks", 《ARXIV:1709.01507V1》 *
LIANG-CHIEH CHEN等: "Attention to Scale: Scale-aware Semantic Image Segmentation", 《ARXIV:1511.03339V2》 *
NINH PHAM等: "Fast and Scalable Polynomial Kernels via Explicit Feature Maps", 《ACM DIGITAL LIBRARY》 *
SHITALA PRASAD等: "Medicinal Plant Leaf Information Extraction Using Deep Features", 《2017 IEEE REGION 10 CONFERENCE》 *
杨天明等: "基于视频深度学习的时空双流人物动作识别模型", 《计算机应用》 *
王娇娇: "特征融合的显著目标检测方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
王宇: "复杂场景下基于深度学习的物体检测与识别算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
蔡玉柱等: "基于自适应卷积特征的目标跟踪算法", 《光学学报》 *
谢锋明等: "基于多尺度特征提取的场景文本检测新方法", 《化工自动化及仪表》 *

Cited By (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376594A (zh) * 2018-09-11 2019-02-22 百度在线网络技术(北京)有限公司 基于自动驾驶车辆的视觉感知方法、装置、设备以及介质
US11120275B2 (en) 2018-09-11 2021-09-14 Baidu Online Network Technology (Beijing) Co., Ltd. Visual perception method, apparatus, device, and medium based on an autonomous vehicle
CN109272039A (zh) * 2018-09-19 2019-01-25 北京航空航天大学 一种基于无人机的水坝周边异常监测方法与装置
CN109214399A (zh) * 2018-10-12 2019-01-15 清华大学深圳研究生院 一种嵌入SENet结构的改进YOLOV3目标识别算法
CN109447066A (zh) * 2018-10-18 2019-03-08 中国人民武装警察部队海警学院 一种快速精确的单阶段目标检测方法及装置
CN109447066B (zh) * 2018-10-18 2021-08-20 中国人民武装警察部队海警学院 一种快速精确的单阶段目标检测方法及装置
CN109544563A (zh) * 2018-11-12 2019-03-29 北京航空航天大学 一种面向违禁物安检的被动毫米波图像人体目标分割方法
CN109544563B (zh) * 2018-11-12 2021-08-17 北京航空航天大学 一种面向违禁物安检的被动毫米波图像人体目标分割方法
CN109522958A (zh) * 2018-11-16 2019-03-26 中山大学 基于跨尺度特征融合的深度卷积神经网络目标检测方法
CN111275066A (zh) * 2018-12-05 2020-06-12 北京嘀嘀无限科技发展有限公司 一种图像特征的融合方法、装置以及电子设备
CN109753959A (zh) * 2018-12-21 2019-05-14 西北工业大学 基于自适应多尺度特征融合的路面交通标志检测方法
CN109753959B (zh) * 2018-12-21 2022-05-13 西北工业大学 基于自适应多尺度特征融合的路面交通标志检测方法
CN109766790B (zh) * 2018-12-24 2022-08-23 重庆邮电大学 一种基于自适应特征通道的行人检测方法
CN109766790A (zh) * 2018-12-24 2019-05-17 重庆邮电大学 一种基于自适应特征通道的行人检测方法
US11423666B2 (en) 2018-12-29 2022-08-23 Beijing Sensetime Technology Development Co., Ltd. Method of detecting target object detection method and device for detecting target object, electronic apparatus and storage medium
CN109726683A (zh) * 2018-12-29 2019-05-07 北京市商汤科技开发有限公司 目标对象检测方法和装置、电子设备和存储介质
CN109886286A (zh) * 2019-01-03 2019-06-14 武汉精测电子集团股份有限公司 基于级联检测器的目标检测方法、目标检测模型及系统
CN109886871A (zh) * 2019-01-07 2019-06-14 国家新闻出版广电总局广播科学研究院 基于通道注意力机制和多层特征融合的图像超分辨率方法
CN109886871B (zh) * 2019-01-07 2023-04-07 国家新闻出版广电总局广播科学研究院 基于通道注意力机制和多层特征融合的图像超分辨率方法
WO2020151247A1 (zh) * 2019-01-23 2020-07-30 华为技术有限公司 图像分析方法以及系统
CN109902629A (zh) * 2019-03-01 2019-06-18 成都康乔电子有限责任公司 一种复杂交通场景下的实时车辆目标检测模型
CN109934848B (zh) * 2019-03-07 2023-05-23 贵州大学 一种基于深度学习的运动物体精准定位的方法
CN109934848A (zh) * 2019-03-07 2019-06-25 贵州大学 一种基于深度学习的运动物体精准定位的方法
CN109886357B (zh) * 2019-03-13 2022-12-13 哈尔滨工程大学 一种基于特征融合的自适应权重深度学习目标分类方法
CN109886357A (zh) * 2019-03-13 2019-06-14 哈尔滨工程大学 一种基于特征融合的自适应权重深度学习目标分类方法
CN110046650A (zh) * 2019-03-15 2019-07-23 中科院微电子研究所昆山分所 一种快递包裹条形码快速检测方法
CN111723829A (zh) * 2019-03-18 2020-09-29 四川大学 一种基于注意力掩模融合的全卷积目标检测方法
CN111723829B (zh) * 2019-03-18 2022-05-06 四川大学 一种基于注意力掩模融合的全卷积目标检测方法
CN109919249A (zh) * 2019-03-19 2019-06-21 北京字节跳动网络技术有限公司 用于生成特征图的方法和装置
CN109919249B (zh) * 2019-03-19 2020-07-31 北京字节跳动网络技术有限公司 用于生成特征图的方法和装置
CN110110719A (zh) * 2019-03-27 2019-08-09 浙江工业大学 一种基于注意层区域卷积神经网络的目标检测方法
CN109934241B (zh) * 2019-03-28 2022-12-09 南开大学 可集成到神经网络架构中的图像多尺度信息提取方法
CN109934241A (zh) * 2019-03-28 2019-06-25 南开大学 可集成到神经网络架构中的图像多尺度信息提取方法及应用
CN110097090A (zh) * 2019-04-10 2019-08-06 东南大学 一种基于多尺度特征融合的图像细粒度识别方法
CN111832336A (zh) * 2019-04-16 2020-10-27 四川大学 一种基于改进的c3d视频行为检测方法
CN111832348A (zh) * 2019-04-17 2020-10-27 中国科学院宁波材料技术与工程研究所 基于像素和通道注意力机制的行人重识别方法
CN111832348B (zh) * 2019-04-17 2022-05-06 中国科学院宁波材料技术与工程研究所 基于像素和通道注意力机制的行人重识别方法
CN110084299A (zh) * 2019-04-24 2019-08-02 中国人民解放军国防科技大学 基于多头融合注意力的目标检测方法和装置
CN110084299B (zh) * 2019-04-24 2021-08-06 中国人民解放军国防科技大学 基于多头融合注意力的目标检测方法和装置
CN111860039B (zh) * 2019-04-26 2022-08-02 四川大学 一种基于跨连cnn+svr的街道空间品质量化方法
CN111860039A (zh) * 2019-04-26 2020-10-30 四川大学 一种基于跨连cnn+svr的街道空间品质量化方法
CN110222173A (zh) * 2019-05-16 2019-09-10 吉林大学 基于神经网络的短文本情感分类方法及装置
CN110222173B (zh) * 2019-05-16 2022-11-04 吉林大学 基于神经网络的短文本情感分类方法及装置
CN111783506A (zh) * 2019-05-17 2020-10-16 北京京东尚科信息技术有限公司 目标特征的确定方法、装置和计算机可读存储介质
CN110188692B (zh) * 2019-05-30 2023-06-06 南通大学 一种有效目标快速识别的强化循环级联方法
CN110222755A (zh) * 2019-05-30 2019-09-10 国网山东省电力公司枣庄供电公司 基于特征融合的深度学习场景识别方法
CN110222755B (zh) * 2019-05-30 2023-01-24 国网山东省电力公司枣庄供电公司 基于特征融合的深度学习场景识别方法
CN110188692A (zh) * 2019-05-30 2019-08-30 南通大学 一种有效目标快速识别的强化循环级联方法
CN110298387A (zh) * 2019-06-10 2019-10-01 天津大学 融入像素级attention机制的深度神经网络目标检测方法
CN110378243A (zh) * 2019-06-26 2019-10-25 深圳大学 一种行人检测方法及装置
CN110348437A (zh) * 2019-06-27 2019-10-18 电子科技大学 一种基于弱监督学习与遮挡感知的目标检测方法
CN110334716A (zh) * 2019-07-04 2019-10-15 北京迈格威科技有限公司 特征图处理方法、图像处理方法及装置
CN110335270A (zh) * 2019-07-09 2019-10-15 华北电力大学(保定) 基于层级区域特征融合学习的输电线路缺陷检测方法
CN110335270B (zh) * 2019-07-09 2022-09-13 华北电力大学(保定) 基于层级区域特征融合学习的输电线路缺陷检测方法
CN110349147B (zh) * 2019-07-11 2024-02-02 腾讯医疗健康(深圳)有限公司 模型的训练方法、眼底黄斑区病变识别方法、装置及设备
CN110349147A (zh) * 2019-07-11 2019-10-18 腾讯医疗健康(深圳)有限公司 模型的训练方法、眼底黄斑区病变识别方法、装置及设备
CN110414417A (zh) * 2019-07-25 2019-11-05 电子科技大学 一种基于多层次融合多尺度预测的交通标志牌识别方法
CN110414417B (zh) * 2019-07-25 2022-08-12 电子科技大学 一种基于多层次融合多尺度预测的交通标志牌识别方法
CN110516305A (zh) * 2019-07-26 2019-11-29 西安交通大学 基于注意机制元学习模型的小样本下故障智能诊断方法
CN110415795A (zh) * 2019-08-02 2019-11-05 杭州智团信息技术有限公司 一种荧光染色ctc图像的识别方法
CN110309839A (zh) * 2019-08-27 2019-10-08 北京金山数字娱乐科技有限公司 一种图像描述的方法及装置
CN110309839B (zh) * 2019-08-27 2019-12-03 北京金山数字娱乐科技有限公司 一种图像描述的方法及装置
CN110929587B (zh) * 2019-10-30 2021-04-20 杭州电子科技大学 一种基于层次注意力机制的双向重构网络视频描述方法
CN110929587A (zh) * 2019-10-30 2020-03-27 杭州电子科技大学 一种基于层次注意力机制的双向重构网络视频描述方法
CN111241910A (zh) * 2019-12-10 2020-06-05 电子科技大学 基于双信息流与视网膜感受野结构的行人检测模型设计方法
CN112949673A (zh) * 2019-12-11 2021-06-11 四川大学 一种基于全局注意力的特征融合目标检测与识别方法
CN112949672A (zh) * 2019-12-11 2021-06-11 顺丰科技有限公司 商品识别方法、装置、设备以及计算机可读存储介质
CN112949673B (zh) * 2019-12-11 2023-04-07 四川大学 一种基于全局注意力的特征融合目标检测与识别方法
CN111312224B (zh) * 2020-02-20 2023-04-21 北京声智科技有限公司 语音分割模型的训练方法、装置和电子设备
CN111312224A (zh) * 2020-02-20 2020-06-19 北京声智科技有限公司 语音分割模型的训练方法、装置和电子设备
CN111753825A (zh) * 2020-03-27 2020-10-09 北京京东尚科信息技术有限公司 图像描述生成方法、装置、系统、介质及电子设备
CN111407260A (zh) * 2020-03-30 2020-07-14 华南理工大学 方向盘嵌入心电传感器的基于脑电和心电的疲劳检测方法
CN111444865A (zh) * 2020-03-31 2020-07-24 盐城禅图智能科技有限公司 一种基于逐步求精的多尺度目标检测方法
WO2021218037A1 (zh) * 2020-04-29 2021-11-04 北京迈格威科技有限公司 目标检测方法、装置、计算机设备和存储介质
CN111612751A (zh) * 2020-05-13 2020-09-01 河北工业大学 基于嵌入分组注意力模块的Tiny-yolov3网络的锂电池缺陷检测方法
CN114037885B (zh) * 2020-07-21 2023-06-20 四川大学 一种基于可选择的膨胀卷积核大小的目标检测方法
CN114037885A (zh) * 2020-07-21 2022-02-11 四川大学 一种基于可选择的膨胀卷积核大小的目标检测方法
CN113971427B (zh) * 2020-07-23 2023-08-18 四川大学 基于改进模型的岩屑识别方法
CN113971427A (zh) * 2020-07-23 2022-01-25 四川大学 基于改进模型的岩屑识别方法
CN111738218A (zh) * 2020-07-27 2020-10-02 成都睿沿科技有限公司 人体异常行为识别系统及方法
CN111881262A (zh) * 2020-08-06 2020-11-03 重庆邮电大学 基于多通道神经网络的文本情感分析方法
CN112164041A (zh) * 2020-09-18 2021-01-01 南昌航空大学 基于多尺度深度神经网络的黄龙病自动诊疗系统及方法
CN112183269A (zh) * 2020-09-18 2021-01-05 哈尔滨工业大学(深圳) 一种适用于智能视频监控的目标检测方法与系统
CN112183269B (zh) * 2020-09-18 2023-08-29 哈尔滨工业大学(深圳) 一种适用于智能视频监控的目标检测方法与系统
CN112164041B (zh) * 2020-09-18 2023-05-12 南昌航空大学 基于多尺度深度神经网络的黄龙病自动诊疗系统及方法
CN112613505A (zh) * 2020-12-18 2021-04-06 安徽丹姆斯生物科技有限公司 一种基于深度学习的细胞微核识别、定位和计数方法
CN112651345A (zh) * 2020-12-29 2021-04-13 深圳市优必选科技股份有限公司 一种人体姿态识别模型优化方法、装置和终端设备
CN112651345B (zh) * 2020-12-29 2023-11-10 深圳市优必选科技股份有限公司 一种人体姿态识别模型优化方法、装置和终端设备
CN112686274A (zh) * 2020-12-31 2021-04-20 上海智臻智能网络科技股份有限公司 目标对象的检测方法及设备
CN113128558A (zh) * 2021-03-11 2021-07-16 重庆邮电大学 基于浅层空间特征融合与自适应通道筛选的目标检测方法
CN113111879A (zh) * 2021-04-30 2021-07-13 上海睿钰生物科技有限公司 一种细胞检测的方法和系统
CN113469099A (zh) * 2021-07-13 2021-10-01 北京航科威视光电信息技术有限公司 目标检测模型的训练方法、检测方法、装置、设备及介质
CN113469099B (zh) * 2021-07-13 2024-03-15 北京航科威视光电信息技术有限公司 目标检测模型的训练方法、检测方法、装置、设备及介质
CN113420729B (zh) * 2021-08-23 2021-12-03 城云科技(中国)有限公司 多尺度目标检测方法、模型、电子设备及其应用
CN113420729A (zh) * 2021-08-23 2021-09-21 城云科技(中国)有限公司 多尺度目标检测方法、模型、电子设备及其应用
CN117726807A (zh) * 2024-02-08 2024-03-19 北京理工大学 基于尺度和位置敏感性的红外小目标检测方法及系统

Also Published As

Publication number Publication date
CN108510012B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN108510012A (zh) 一种基于多尺度特征图的目标快速检测方法
CN111126472B (zh) 一种基于ssd改进的目标检测方法
CN109685819B (zh) 一种基于特征增强的三维医学图像分割方法
CN110210551A (zh) 一种基于自适应主体敏感的视觉目标跟踪方法
CN112308158A (zh) 一种基于部分特征对齐的多源领域自适应模型及方法
CN112651438A (zh) 多类别图像的分类方法、装置、终端设备和存储介质
CN108921822A (zh) 基于卷积神经网络的图像目标计数方法
CN108304826A (zh) 基于卷积神经网络的人脸表情识别方法
CN111832546B (zh) 一种轻量级自然场景文本识别方法
CN107844795A (zh) 基于主成分分析的卷积神经网络特征提取方法
CN109711422A (zh) 图像数据处理、模型的建立方法、装置、计算机设备和存储介质
CN110020681A (zh) 基于空间注意力机制的点云特征提取方法
CN111046917B (zh) 基于深度神经网络的对象性增强目标检测方法
CN110765960B (zh) 一种自适应多任务深度学习的行人再识别方法
CN109255339B (zh) 基于自适应深度森林人体步态能量图的分类方法
CN108416270A (zh) 一种基于多属性联合特征的交通标志识别方法
Zhang et al. Channel-wise and feature-points reweights densenet for image classification
CN109934272A (zh) 一种基于全卷积网络的图像匹配方法
CN110298841A (zh) 一种基于融合网络的图像多尺度语义分割方法及装置
CN114330516A (zh) 基于多图引导神经网络模型的小样本徽景图像分类
Wang et al. SAS: painting detection and recognition via smart art system with mobile devices
CN114092926A (zh) 一种复杂环境下的车牌定位和识别方法
Tripathi et al. Real time object detection using CNN
CN113988164B (zh) 一种面向代表点自注意力机制的轻量级点云目标检测方法
Zheng et al. Feature enhancement for multi-scale object detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant