CN107886117A - 基于多特征提取和多任务融合的目标检测算法 - Google Patents
基于多特征提取和多任务融合的目标检测算法 Download PDFInfo
- Publication number
- CN107886117A CN107886117A CN201711038002.XA CN201711038002A CN107886117A CN 107886117 A CN107886117 A CN 107886117A CN 201711038002 A CN201711038002 A CN 201711038002A CN 107886117 A CN107886117 A CN 107886117A
- Authority
- CN
- China
- Prior art keywords
- target
- target detection
- feature
- multitask
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Abstract
本发明涉及一种基于多特征提取和多任务融合的目标检测算法,其技术特点是:基于深度学习卷积神经网络架构提取图像特征,提取多层卷积输出结果形成多特征图,在多特征图上提取不同可视野的目标感兴趣区域并进行特征连接;对原图实现语义分割提取目标分割区域结果,并将目标检测结果和目标分割结果在全连接层中通过一定的比例系数进行多任务交叉辅助目标检测;上述结果通过最后的全连接层后,通过组合分类定位损失函数对图像特征进行分类和回归定位,得到最终目标检测的结果。本发明通过深度学习卷积神经网络提取特征、对图像特征进行多组多层融合连接及组合损失函数实现了高精度的目标检测定位和分类,获得了良好的目标检测结果。
Description
技术领域
本发明属于目标检测技术领域,尤其是一种基于多特征提取和多任务融合的目标检测算法。
背景技术
目标检测的主要任务是对图像序列中的目标物体进行自动检测,包括分类和定位。目前流行的目标检测算法,首先在一张图片上生成1K-2K的候选框,然后对于每个候选框使用CNN卷积神经网络提取特征,其次将特征输入每一类的SVM分类器或Softmax分类器来判断目标是否属于该类,最后使用回归器修正候选框的位置实现目标的精准定位。传统的目标检测算法采用SIFT、HOG和LBP等特征,通过寻找图片中具有平移、仿设、旋转等变换情况下的不变特征点实现图像间的匹配,从而实现目标检测。然而提取特征的好坏直接影响到分类的准确性,由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设计一个鲁棒的特征并不是那么容易,传统特征的适应能力并不强。而基于CNN卷积神经网络的特征提取具有很好的鲁棒性,卷积神经网络是为识别二维形状而特殊设计的一个多层感知器,这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。提取特征的CNN模型经过预先训练得到,预训练基于ILVCR 2012计算机视觉识别挑战赛的全部数据集进行训练,然后针对预训练模型基于PASCAL VOC 2007训练集进行调优训练,从而实现通过CNN网络提取图片特征。
深度学习广泛应用于目标检测源于Alex等人提出的深度卷积神经网AlexNet网络架构,该框架在ILSVRC 2012比赛中取得了非常好的成绩,此后,卷积神经网络被广泛应用于各类图像相关领域。Geoffrey Hinton设计的AlexNet是一个8层CNN架构,包括5个卷积层和3个全连接层,将当时最好算法的错误率减半,其证明了CNN在复杂模型下的有效性,且GPU使得训练在可接受的时间范围内得到结果。在2014年,Christian Szegedy提出了GoogleNet架构在ILSVRC 2014分类比赛中取得第一名,与AlexNet不同的是:GoogleNet的深度(层数)更深,宽度(层核或者神经元数)更宽。同年,Andrew Zisserman提出的VGG-Net架构在ILSVRC 2014定位比赛中取得第一名,与AlexNet不同的是:VGG-Net使用更多的层,通常有16-19层。在2015年,Kaiming He提出的Res-Net架构在ILSVRC 2015分类和定位比赛中取得第一名,该模型采用了152层的深层卷积神经网络。Hinton教授的成功,吸引了国内外大量学者的关注;同时,工业界加入深度学习的研究中来,百度、google、facebook纷纷建立深度学习实验室,通过深度学习,进行图像识别与分类。虽然研究人员提出了很多基于深度学习卷积神经网络的目标检测算法,这些算法也取得了良好的效果,但是仍有许多方面有待改进,如图片背景复杂、网络输入尺寸固定、候选框过多、训练速度慢、消耗电脑内存、小物体检测不准确、步骤繁琐和定位不精准等问题。
发明内容
本发明的目地在于克服现有技术的不足,提出一种设计合理、精度高且稳定性强的基于多特征提取和多任务融合的目标检测算法。
本发明解决其技术问题是采取以下技术方案实现的:
一种基于多特征提取和多任务融合的目标检测算法,包括以下步骤:
步骤1、基于深度学习卷积神经网络架构提取图像特征,提取多层卷积输出结果形成多特征图,并在多特征图上提取不同可视野的目标感兴趣区域,对提取的目标感兴趣区域进行特征连接;
步骤2、对原图实现语义分割提取目标分割区域结果,并将目标检测结果和目标分割结果在全连接层中通过一定的比例系数进行多任务交叉辅助目标检测;
步骤3、上述结果通过最后的全连接层后,通过组合分类定位损失函数对图像特征进行分类和回归定位,得到最终目标检测的结果。
所述深度学习卷积神经网络架构为VGG-16卷积神经网络架构。
所述步骤1的具体实现方法包括以下步骤:
⑴将带有物体真实包围框的图片输入到目标检测卷积神经网络架构中,使用Caffe框架提取图像并通过卷积神经网络输出的不同层的图像特征;
⑵隔层提取出多层卷积层的输出并进行连接形成多特征的特征图,第一个卷积层输出卷积特征最大池化,最后一个卷基层输出卷积特征反卷积,使两个卷积层的输出特征尺寸与中间卷积层的输出特征尺寸大小一致,连接多层卷积层的输出图像特征形成多特征图;
⑶在多特征图上,对于生成的可能包含物体的目标感兴趣区域,进行不同倍数的区域缩放,得到不同的目标感兴趣区域,然后将不同的目标感兴趣区域进行连接形成最终的目标感兴趣区域。
所述⑵隔层提取出多层卷积层的输出并进行连接形成多特征的特征图的方法为:基于深度学习VGG-16卷积神经网络架构提取图像特征,提取其中第1层、第3层和第5层卷积输出结果形成多特征图,并在特征图上提取目标感兴趣区域面积的1、2和3倍特征区域,得到不同可视野感兴趣区域,并对提取结果进行特征连接。
所述步骤2的具体实现方法以下步骤:
⑴将带有物体真实包围框的图片输入到目标分割卷积神经网络架构中,提取卷积神经网络的输出结果;
⑵按照目标检测比例系数为0.7及目标分割比例系数为0.3融合目标检测结果和目标分割结果,实现输出结果交叉连接功能;
⑶将最后一层全连接层的结果输出到下一模块。
所述步骤3的具体实现方法包括以下步骤:
⑴通过Softmax分类损失函数算法对图像特征进行分类,基于目标检测的公开标准数据集,每类物体具有自己相应的精度;
⑵通过Overlap定位损失函数算法对图像位置进行定位,使得目标检测生成的包围物体的候选框更加接近物体输入的真实包围框;
⑶根据Softmax输出的分类损失值进行排序,选出得分最高的类别,作为该物体最有可能属于哪一个类别;
⑷根据Overlap输出的定位损失值反向传播梯度,使得损失值逐渐下降,实现物体候选框更加接近物体的真实包围框。
本发明的优点和积极效果是:
本发明设计合理,其利用深度学习框架卷积神经网络VGG-16进行多特征提取并提取不同可视野的感兴趣区域,实现更加准确的分类;且在定位中采用了多任务交叉辅助定位,能够更加准确的定位出目标物体所在位置,获得了良好的目标检测结果。本发明在现有的公开数据集PASCALVOC上进行试验,实验表明结果优于其他主流目标检测框架如Fast R-CNN的检测效果,提高了检测精度和稳定性。
附图说明
图1为本发明提出的目标检测框架;
图2为本发明提出的多特征提取和不同倍数可视野的感兴趣区域示意图;
图3为本发明提出的多任务交叉辅助定位原理示意图;
图4为基于PASCAL VOC的目标检测精度结果对照图。
具体实施方式
以下结合附图对本发明实施例做进一步详述。
一种基于多特征提取和多任务融合的目标检测算法,是在图1给出的目标检测框架上实现的,其通过多特征提取和多任务融合方法改善目标检测性能。其设计思路为:首先基于深度学习VGG-16卷积神经网络架构提取图像特征,提取其中1、3和5层卷积输出结果形成多特征图,并在特征图上提取目标感兴趣区域面积的1、2和3倍特征区域,得到不同可视野感兴趣区域,然后对提取结果进行特征连接;其次对原图实现语义分割提取目标分割区域结果,并将目标检测结果和目标分割结果在全连接层中通过一定的比例系数进行多任务交叉辅助目标检测,其中目标检测比例系数为0.7和目标分割比例系数为0.3;最后上述结果通过全连接层8后,通过组合Softmax分类损失函数算法和Overlap定位损失函数算法分别对图像特征进行分类和回归定位,得到最终目标检测的结果。
本实施例给出的基于多特征提取和多任务融合的目标检测算法包括以下步骤:
S1、基于深度学习VGG-16卷积神经网络架构提取图像特征,提取1、3和5层卷积输出结果形成多特征图,并在特征图上提取目标感兴趣区域面积的1、2和3倍特征区域,然后对提取结果进行特征连接。
本步骤的具体实现方法细化为如下步骤:
S1.1、将带有物体真实包围框的图片输入到VGG-16目标检测卷积神经网络架构中,通过Caffe框架提取图像通过卷积神经网络输出的不同层的特征。
S1.2、隔层提取出3层卷积层的输出并进行连接形成多特征的特征图,对于第一卷积层输出的卷积特征最大池化,对于第五卷基层输出的卷积特征反卷积,实现两个卷积层的输出特征尺寸与第三卷积层的输出特征尺寸大小一致,连接三层卷积层的输出图像特征形成多特征图。
S1.3、在特征图上,对于生成的可能包含物体的目标感兴趣区域,以该目标感兴趣区域中点为放大中心,实现*1、*2和*3三种倍数的区域缩放,得到3种不同的目标感兴趣区域,然后将区域特征进行连接形成最终的目标感兴趣区域。
图2给出了本发明提出的多特征提取和不同倍数可视野的感兴趣区域,因此,步骤S1.3进一步包括:
S1.3.1、在上述S1.2步骤中提取卷积层1、3和5的输出特征进行融合形成多特征图,在多特征图上提取目标物体的感兴趣区域;
S1.3.2、对于目标物体的感兴趣区域,由于其周围的内容信息有助于目标物体的分类和定位,所以以该目标感兴趣区域中点为放大中心,实现*1、*2和*3三种倍数的区域放大,并将3个区域图像特征进行连接形成最终的目标感兴趣区域特征。
步骤2、对原图实现语义分割提取目标分割区域结果,并将目标检测结果和目标分割结果在全连接层中通过一定的比例系数进行多任务交叉辅助目标检测,其中目标检测比例系数为0.7和目标分割比例系数为0.3。
图3给出了本发明中提出的多任务交叉辅助定位原理图,本步骤的具体实现方法细化为如下步骤:
S2.1、将带有物体真实包围框的图片输入到VGG-16目标分割卷积神经网络架构中,提取卷积神经网络的输出结果;
S2.2、目标分割结果可以辅助目标检测结果,所以我们将二者的卷积层输出结果在全连接层6、7和8中实现输出结果交叉连接,即按照一定的比例系数融合目标检测结果和目标分割结果,实现多任务交叉辅助目标检测结果,其中目标检测比例系数为0.7和目标分割比例系数为0.3的时候,目标检测结果精度最高,所述多任务检查辅助定位公式以及反向传播梯度计算公式分别为:
t′1=α11t1+α21t2
t′2=α12t1+α22t2
S2.3、将最后一层全连接层的结果输出到分类和定位模块。
步骤3、上述结果通过最后的全连接层后,通过组合Softmax分类损失函数算法和Overlap定位损失函数算法分别对图像特征进行分类和回归定位,得到最终目标检测的结果。
本步骤的具体实现方法细化为如下步骤:
S3.1、上述步骤S2.3中的交叉辅助检测结果输出后,通过Softmax分类损失函数算法对图像特征进行分类,基于目标检测的公开标准数据集PASCAL VOC,分类结果包含20类物体,可以在该数据集上测试所提出的框架对各类物体的检测精度。
S3.2、上述步骤S2.3中的交叉辅助检测结果输出后,通过Overlap定位损失函数算法对图像位置进行定位,使得目标检测生成的包围物体的候选框更加接近物体输入的真实包围框,损失函数值越接近1说明候选框和真实包围框重合度越大;
S3.3、根据Softmax输出的分类损失值进行排序,选出20类中得分最高的类别,即该物体最有可能属于哪一个类别;
S3.4、根据Overlap输出的定位损失值,即候选框和真实包围框之间的差值,通过随机梯度下降法反向传播梯度,使得损失值逐渐下降,实现物体候选框更加接近物体的真实包围框。
下面,按照本发明的方法进行实验,说明本发明的实验效果。
测试环境:MATLAB 2014b;Caffe框架;Ubuntu14.04系统;NVIDIA GTX 1070p GPU。
测试序列:所选测试序列和其对应标准目标检测物体真实包围框(GroundTruth),均来自目标检测的PASCAL VOC数据集(M.Everingham,L.Van Gool,C.K.Williams,J.Winn,and A.Zisserman,“The pascal visual object classes(voc)challenge,”International journal of computer vision,vol.88,no.2,pp.303–338,2007.)。其中包含的图像有20个类别,分别为人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。选用目标均是日常中最常见的物体,为的就是能更好的体现算法的实用性,共包含9,963张图片,有24,640个被标记的目标物体。
测试指标:本发明使用了一种评价指标,为精度mAP(mean average precision)。精度mAP是目标检测结果的平均准确度测量,与理想目标检测结果进行比较并对数据库中所有物体类别进行加权平均计算,对当今流行的不同算法计算此参数值然后进行结果对比,证明本文算法在目标检测领域得到较好的结果。
测试结果如图4所示,图中给出了基于PASCAL VOC 2102数据集中所有图像类别测试精度的平均结果,可以看出本发明算法在mAP上相比其他目标检测算法有明显提高,其中Our[1]代表加入多特征提取,Our[2]代表加入多特征提取和组合损失函数,Our[3]代表加入多特征提取和多任务辅助定位,Our[4]代表同时加入多特征提取、多任务辅助定位和组合损失函数。目前目标检测Fast R-CNN的mAP为68.4%,本发明Our[4]的mAP为71.2%,比Faster R-CNN的检测精度提高了2.8%。而且,在小物体检测方面,如瓶子、飞机和植物,本发明算法比其他算法得到更高的检测精度。上述结果表明本发明算法所产生的目标检测结果拥有更高的精度,而且能更好的解决小目标检测的难题。
表1基于PASCAL VOC的交叉辅助定位系数
表1是基于PASCALVOC 2012数据集中不同的多任务辅助定位系数所得到的不同目标检测和目标分割结果。可以看出当目标检测比例系数为0.7和目标分割比例系数为0.3的时候,目标检测和目标分割结果精度最高,即70%目标检测的输出特征占主要部分,30%目标分割的输出特征作为辅助检测,能达到最好的目标检测效果。其中第一组系数代表目标分割90%占主要部分,目标检测10%占小部分,其效果并不好;最后一组系数代表只有100%目标检测,不采用目标分割作为辅助,其效果也没有本文算法的好。上述结果表明本发明算法使用目标分割辅助目标检测,所产生的目标检测结果拥有更高的精度,说明本发明算法具有前沿性。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。
Claims (6)
1.一种基于多特征提取和多任务融合的目标检测算法,其特征在于包括以下步骤:
步骤1、基于深度学习卷积神经网络架构提取图像特征,提取多层卷积输出结果形成多特征图,并在多特征图上提取不同可视野的目标感兴趣区域,对提取的目标感兴趣区域进行特征连接;
步骤2、对原图实现语义分割提取目标分割区域结果,并将目标检测结果和目标分割结果在全连接层中通过一定的比例系数进行多任务交叉辅助目标检测;
步骤3、上述结果通过最后的全连接层后,通过组合分类定位损失函数对图像特征进行分类和回归定位,得到最终目标检测的结果。
2.根据权利要求1所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述深度学习卷积神经网络架构为VGG-16卷积神经网络架构。
3.根据权利要求1或2所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述步骤1的具体实现方法包括以下步骤:
⑴将带有物体真实包围框的图片输入到目标检测卷积神经网络架构中,使用Caffe框架提取图像并通过卷积神经网络输出的不同层的图像特征;
⑵隔层提取出多层卷积层的输出并进行连接形成多特征的特征图,第一个卷积层输出卷积特征最大池化,最后一个卷基层输出卷积特征反卷积,使两个卷积层的输出特征尺寸与中间卷积层的输出特征尺寸大小一致,连接多层卷积层的输出图像特征形成多特征图;
⑶在多特征图上,对于生成的可能包含物体的目标感兴趣区域,进行不同倍数的区域缩放,得到不同的目标感兴趣区域,然后将不同的目标感兴趣区域进行连接形成最终的目标感兴趣区域。
4.根据权利要求3所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述⑵隔层提取出多层卷积层的输出并进行连接形成多特征的特征图的方法为:基于深度学习VGG-16卷积神经网络架构提取图像特征,提取其中第1层、第3层和第5层卷积输出结果形成多特征图,并在特征图上提取目标感兴趣区域面积的1、2和3倍特征区域,得到不同可视野感兴趣区域,并对提取结果进行特征连接。
5.根据权利要求1或2所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述步骤2的具体实现方法以下步骤:
⑴将带有物体真实包围框的图片输入到目标分割卷积神经网络架构中,提取卷积神经网络的输出结果;
⑵按照目标检测比例系数为0.7及目标分割比例系数为0.3融合目标检测结果和目标分割结果,实现输出结果交叉连接功能;
⑶将最后一层全连接层的结果输出到下一模块。
6.根据权利要求1或2所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述步骤3的具体实现方法包括以下步骤:
⑴通过Softmax分类损失函数算法对图像特征进行分类,基于目标检测的公开标准数据集,每类物体具有自己相应的精度;
⑵通过Overlap定位损失函数算法对图像位置进行定位,使得目标检测生成的包围物体的候选框更加接近物体输入的真实包围框;
⑶根据Softmax输出的分类损失值进行排序,选出得分最高的类别,作为该物体最有可能属于哪一个类别;
⑷根据Overlap输出的定位损失值反向传播梯度,使得损失值逐渐下降,实现物体候选框更加接近物体的真实包围框。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711038002.XA CN107886117A (zh) | 2017-10-30 | 2017-10-30 | 基于多特征提取和多任务融合的目标检测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711038002.XA CN107886117A (zh) | 2017-10-30 | 2017-10-30 | 基于多特征提取和多任务融合的目标检测算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107886117A true CN107886117A (zh) | 2018-04-06 |
Family
ID=61783005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711038002.XA Pending CN107886117A (zh) | 2017-10-30 | 2017-10-30 | 基于多特征提取和多任务融合的目标检测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107886117A (zh) |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596101A (zh) * | 2018-04-25 | 2018-09-28 | 上海交通大学 | 一种基于卷积神经网络的遥感图像多目标检测方法 |
CN108965982A (zh) * | 2018-08-28 | 2018-12-07 | 百度在线网络技术(北京)有限公司 | 视频录制方法、装置、电子设备和可读存储介质 |
CN108960074A (zh) * | 2018-06-07 | 2018-12-07 | 西安电子科技大学 | 基于深度学习的小尺寸行人目标检测方法 |
CN108985269A (zh) * | 2018-08-16 | 2018-12-11 | 东南大学 | 基于卷积和空洞卷积结构的融合网络驾驶环境感知模型 |
CN109034162A (zh) * | 2018-07-13 | 2018-12-18 | 南京邮电大学 | 一种图像语义分割方法 |
CN109034183A (zh) * | 2018-06-07 | 2018-12-18 | 北京飞搜科技有限公司 | 一种目标检测方法、装置及设备 |
CN109101932A (zh) * | 2018-08-17 | 2018-12-28 | 佛山市顺德区中山大学研究院 | 基于目标检测的多任务及临近信息融合的深度学习算法 |
CN109344897A (zh) * | 2018-09-29 | 2019-02-15 | 中山大学 | 一种基于图片蒸馏的通用物体检测框架及其实现方法 |
CN109446911A (zh) * | 2018-09-28 | 2019-03-08 | 北京陌上花科技有限公司 | 图像检测方法及系统 |
CN109508672A (zh) * | 2018-11-13 | 2019-03-22 | 云南大学 | 一种实时的视频目标检测方法 |
CN109543519A (zh) * | 2018-10-15 | 2019-03-29 | 天津大学 | 一种用于物体检测的深度分割引导网络 |
CN109583517A (zh) * | 2018-12-26 | 2019-04-05 | 华东交通大学 | 一种适用于小目标检测的增强的全卷积实例语义分割算法 |
CN109685008A (zh) * | 2018-12-25 | 2019-04-26 | 云南大学 | 一种实时的视频目标检测方法 |
CN109711326A (zh) * | 2018-12-25 | 2019-05-03 | 云南大学 | 一种基于浅层残差网络的视频目标检测方法 |
CN109753959A (zh) * | 2018-12-21 | 2019-05-14 | 西北工业大学 | 基于自适应多尺度特征融合的路面交通标志检测方法 |
CN109886357A (zh) * | 2019-03-13 | 2019-06-14 | 哈尔滨工程大学 | 一种基于特征融合的自适应权重深度学习目标分类方法 |
CN109919218A (zh) * | 2019-02-28 | 2019-06-21 | 上海交通大学 | 混合连接的多任务fcn模型系统 |
CN109948616A (zh) * | 2019-03-26 | 2019-06-28 | 北京迈格威科技有限公司 | 图像检测方法、装置、电子设备及计算机可读存储介质 |
CN110020658A (zh) * | 2019-03-28 | 2019-07-16 | 大连理工大学 | 一种基于多任务深度学习的显著目标检测方法 |
CN110188607A (zh) * | 2019-04-23 | 2019-08-30 | 深圳大学 | 一种多线程并行计算的交通视频目标检测方法及装置 |
CN110751215A (zh) * | 2019-10-21 | 2020-02-04 | 腾讯科技(深圳)有限公司 | 一种图像识别方法、装置、设备、系统及介质 |
CN110929805A (zh) * | 2019-12-05 | 2020-03-27 | 上海肇观电子科技有限公司 | 神经网络的训练方法、目标检测方法及设备、电路和介质 |
CN111104943A (zh) * | 2019-12-17 | 2020-05-05 | 西安电子科技大学 | 基于决策级融合的彩色图像感兴趣区域提取方法 |
CN111222454A (zh) * | 2020-01-03 | 2020-06-02 | 暗物智能科技(广州)有限公司 | 训练多任务目标检测模型、多任务目标检测的方法及系统 |
CN111294512A (zh) * | 2020-02-10 | 2020-06-16 | 深圳市铂岩科技有限公司 | 图像处理方法、装置、存储介质及摄像装置 |
CN112132816A (zh) * | 2020-09-27 | 2020-12-25 | 北京理工大学 | 一种基于多任务与感兴趣区域分割引导的目标检测方法 |
CN112990348A (zh) * | 2021-04-12 | 2021-06-18 | 华南理工大学 | 一种自调节特征融合的小目标检测方法 |
CN112989867A (zh) * | 2019-12-02 | 2021-06-18 | 北京华航无线电测量研究所 | 目标检测与场景分割一体化网络设计方法 |
CN113537242A (zh) * | 2021-07-19 | 2021-10-22 | 安徽炬视科技有限公司 | 一种基于密集反卷积及特定损失函数的小目标检测算法 |
CN113568889A (zh) * | 2021-07-30 | 2021-10-29 | 上海无线电设备研究所 | 面向天基光学探测的空中目标特征库及其构建方法 |
CN114170642A (zh) * | 2020-09-09 | 2022-03-11 | 成都鼎桥通信技术有限公司 | 图像检测的处理方法、装置、设备及存储介质 |
CN115170802A (zh) * | 2022-07-15 | 2022-10-11 | 四川大学 | 微小实性异生组织的分割方法、系统、电子设备及介质 |
JP2022548293A (ja) * | 2019-09-25 | 2022-11-17 | ▲蘇▼州浪潮智能科技有限公司 | 目標検出モデルの自動モデリング方法及び装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740773A (zh) * | 2016-01-25 | 2016-07-06 | 重庆理工大学 | 基于深度学习和多尺度信息的行为识别方法 |
CN106599883A (zh) * | 2017-03-08 | 2017-04-26 | 王华锋 | 一种基于cnn的多层次图像语义的人脸识别方法 |
CN106709568A (zh) * | 2016-12-16 | 2017-05-24 | 北京工业大学 | 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法 |
-
2017
- 2017-10-30 CN CN201711038002.XA patent/CN107886117A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740773A (zh) * | 2016-01-25 | 2016-07-06 | 重庆理工大学 | 基于深度学习和多尺度信息的行为识别方法 |
CN106709568A (zh) * | 2016-12-16 | 2017-05-24 | 北京工业大学 | 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法 |
CN106599883A (zh) * | 2017-03-08 | 2017-04-26 | 王华锋 | 一种基于cnn的多层次图像语义的人脸识别方法 |
Non-Patent Citations (4)
Title |
---|
ABHINAV SHRIVASTAVA ET AL: "Contextual Priming and Feedback for Faster R-CNN", 《ECCV 2016, PART I, LNCS》 * |
SANG-IL OH ET AL: "Object Detection and Classification by Decision-Level Fusion for Intelligent Vehicle Systems", 《SENSORS》 * |
TAO KONG ET AL: "HyperNet: Towards Accurate Region Proposal Generation and Joint Object Detection", 《2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
YINGXIN LOU ET AL: "PBG-NET: OBJECT DETECTION WITH A MULTI-FEATURE AND ITERATIVE CNN MODEL", 《PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO WORKSHOPS (ICMEW) 2017》 * |
Cited By (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596101A (zh) * | 2018-04-25 | 2018-09-28 | 上海交通大学 | 一种基于卷积神经网络的遥感图像多目标检测方法 |
CN108596101B (zh) * | 2018-04-25 | 2021-07-27 | 上海交通大学 | 一种基于卷积神经网络的遥感图像多目标检测方法 |
CN108960074B (zh) * | 2018-06-07 | 2020-09-04 | 西安电子科技大学 | 基于深度学习的小尺寸行人目标检测方法 |
CN108960074A (zh) * | 2018-06-07 | 2018-12-07 | 西安电子科技大学 | 基于深度学习的小尺寸行人目标检测方法 |
CN109034183B (zh) * | 2018-06-07 | 2021-05-18 | 苏州飞搜科技有限公司 | 一种目标检测方法、装置及设备 |
CN109034183A (zh) * | 2018-06-07 | 2018-12-18 | 北京飞搜科技有限公司 | 一种目标检测方法、装置及设备 |
CN109034162A (zh) * | 2018-07-13 | 2018-12-18 | 南京邮电大学 | 一种图像语义分割方法 |
CN108985269B (zh) * | 2018-08-16 | 2022-06-10 | 东南大学 | 基于卷积和空洞卷积结构的融合网络驾驶环境感知模型 |
CN108985269A (zh) * | 2018-08-16 | 2018-12-11 | 东南大学 | 基于卷积和空洞卷积结构的融合网络驾驶环境感知模型 |
CN109101932A (zh) * | 2018-08-17 | 2018-12-28 | 佛山市顺德区中山大学研究院 | 基于目标检测的多任务及临近信息融合的深度学习算法 |
CN109101932B (zh) * | 2018-08-17 | 2020-07-24 | 佛山市顺德区中山大学研究院 | 基于目标检测的多任务及临近信息融合的深度学习方法 |
US10880495B2 (en) | 2018-08-28 | 2020-12-29 | Baidu Online Network Technology (Beijing) Co., Ltd. | Video recording method and apparatus, electronic device and readable storage medium |
CN108965982A (zh) * | 2018-08-28 | 2018-12-07 | 百度在线网络技术(北京)有限公司 | 视频录制方法、装置、电子设备和可读存储介质 |
CN109446911A (zh) * | 2018-09-28 | 2019-03-08 | 北京陌上花科技有限公司 | 图像检测方法及系统 |
CN109344897A (zh) * | 2018-09-29 | 2019-02-15 | 中山大学 | 一种基于图片蒸馏的通用物体检测框架及其实现方法 |
CN109344897B (zh) * | 2018-09-29 | 2022-03-25 | 中山大学 | 一种基于图片蒸馏的通用物体检测系统及其实现方法 |
CN109543519A (zh) * | 2018-10-15 | 2019-03-29 | 天津大学 | 一种用于物体检测的深度分割引导网络 |
CN109543519B (zh) * | 2018-10-15 | 2022-04-15 | 天津大学 | 一种用于物体检测的深度分割引导网络 |
CN109508672A (zh) * | 2018-11-13 | 2019-03-22 | 云南大学 | 一种实时的视频目标检测方法 |
CN109753959B (zh) * | 2018-12-21 | 2022-05-13 | 西北工业大学 | 基于自适应多尺度特征融合的路面交通标志检测方法 |
CN109753959A (zh) * | 2018-12-21 | 2019-05-14 | 西北工业大学 | 基于自适应多尺度特征融合的路面交通标志检测方法 |
CN109685008A (zh) * | 2018-12-25 | 2019-04-26 | 云南大学 | 一种实时的视频目标检测方法 |
CN109711326A (zh) * | 2018-12-25 | 2019-05-03 | 云南大学 | 一种基于浅层残差网络的视频目标检测方法 |
CN109583517A (zh) * | 2018-12-26 | 2019-04-05 | 华东交通大学 | 一种适用于小目标检测的增强的全卷积实例语义分割算法 |
CN109919218A (zh) * | 2019-02-28 | 2019-06-21 | 上海交通大学 | 混合连接的多任务fcn模型系统 |
CN109886357B (zh) * | 2019-03-13 | 2022-12-13 | 哈尔滨工程大学 | 一种基于特征融合的自适应权重深度学习目标分类方法 |
CN109886357A (zh) * | 2019-03-13 | 2019-06-14 | 哈尔滨工程大学 | 一种基于特征融合的自适应权重深度学习目标分类方法 |
CN109948616A (zh) * | 2019-03-26 | 2019-06-28 | 北京迈格威科技有限公司 | 图像检测方法、装置、电子设备及计算机可读存储介质 |
CN110020658A (zh) * | 2019-03-28 | 2019-07-16 | 大连理工大学 | 一种基于多任务深度学习的显著目标检测方法 |
CN110188607B (zh) * | 2019-04-23 | 2022-10-21 | 深圳大学 | 一种多线程并行计算的交通视频目标检测方法及装置 |
CN110188607A (zh) * | 2019-04-23 | 2019-08-30 | 深圳大学 | 一种多线程并行计算的交通视频目标检测方法及装置 |
JP7335430B2 (ja) | 2019-09-25 | 2023-08-29 | ▲蘇▼州浪潮智能科技有限公司 | 目標検出モデルの自動モデリング方法及び装置 |
JP2022548293A (ja) * | 2019-09-25 | 2022-11-17 | ▲蘇▼州浪潮智能科技有限公司 | 目標検出モデルの自動モデリング方法及び装置 |
CN110751215A (zh) * | 2019-10-21 | 2020-02-04 | 腾讯科技(深圳)有限公司 | 一种图像识别方法、装置、设备、系统及介质 |
CN112989867A (zh) * | 2019-12-02 | 2021-06-18 | 北京华航无线电测量研究所 | 目标检测与场景分割一体化网络设计方法 |
CN110929805A (zh) * | 2019-12-05 | 2020-03-27 | 上海肇观电子科技有限公司 | 神经网络的训练方法、目标检测方法及设备、电路和介质 |
CN110929805B (zh) * | 2019-12-05 | 2023-11-10 | 上海肇观电子科技有限公司 | 神经网络的训练方法、目标检测方法及设备、电路和介质 |
CN111104943A (zh) * | 2019-12-17 | 2020-05-05 | 西安电子科技大学 | 基于决策级融合的彩色图像感兴趣区域提取方法 |
CN111104943B (zh) * | 2019-12-17 | 2022-05-17 | 西安电子科技大学 | 基于决策级融合的彩色图像感兴趣区域提取方法 |
CN111222454A (zh) * | 2020-01-03 | 2020-06-02 | 暗物智能科技(广州)有限公司 | 训练多任务目标检测模型、多任务目标检测的方法及系统 |
CN111222454B (zh) * | 2020-01-03 | 2023-04-07 | 暗物智能科技(广州)有限公司 | 训练多任务目标检测模型、多任务目标检测的方法及系统 |
CN111294512A (zh) * | 2020-02-10 | 2020-06-16 | 深圳市铂岩科技有限公司 | 图像处理方法、装置、存储介质及摄像装置 |
US11900661B2 (en) | 2020-02-10 | 2024-02-13 | Boyan Technologies (Shenzhen) Co., Ltd | Image processing method, device, storage medium and camera |
CN114170642A (zh) * | 2020-09-09 | 2022-03-11 | 成都鼎桥通信技术有限公司 | 图像检测的处理方法、装置、设备及存储介质 |
CN112132816B (zh) * | 2020-09-27 | 2022-12-30 | 北京理工大学 | 一种基于多任务与感兴趣区域分割引导的目标检测方法 |
CN112132816A (zh) * | 2020-09-27 | 2020-12-25 | 北京理工大学 | 一种基于多任务与感兴趣区域分割引导的目标检测方法 |
CN112990348B (zh) * | 2021-04-12 | 2023-08-22 | 华南理工大学 | 一种自调节特征融合的小目标检测方法 |
CN112990348A (zh) * | 2021-04-12 | 2021-06-18 | 华南理工大学 | 一种自调节特征融合的小目标检测方法 |
CN113537242A (zh) * | 2021-07-19 | 2021-10-22 | 安徽炬视科技有限公司 | 一种基于密集反卷积及特定损失函数的小目标检测算法 |
CN113568889A (zh) * | 2021-07-30 | 2021-10-29 | 上海无线电设备研究所 | 面向天基光学探测的空中目标特征库及其构建方法 |
CN113568889B (zh) * | 2021-07-30 | 2024-02-23 | 上海无线电设备研究所 | 面向天基光学探测的空中目标特征库及其构建方法 |
CN115170802B (zh) * | 2022-07-15 | 2023-03-28 | 四川大学 | 微小实性异生组织的分割方法、系统、电子设备及介质 |
CN115170802A (zh) * | 2022-07-15 | 2022-10-11 | 四川大学 | 微小实性异生组织的分割方法、系统、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107886117A (zh) | 基于多特征提取和多任务融合的目标检测算法 | |
CN107563381B (zh) | 基于全卷积网络的多特征融合的目标检测方法 | |
CN107316058A (zh) | 通过提高目标分类和定位准确度改善目标检测性能的方法 | |
Amit et al. | Disaster detection from aerial imagery with convolutional neural network | |
Zhao et al. | Object-based convolutional neural network for high-resolution imagery classification | |
CN106815601B (zh) | 基于递归神经网络的高光谱图像分类方法 | |
CN106651830A (zh) | 一种基于并行卷积神经网络的图像质量测试方法 | |
Wang et al. | Research on face recognition based on CNN | |
CN107492095A (zh) | 基于深度学习的医学图像肺结节检测方法 | |
CN112446388A (zh) | 一种基于轻量化二阶段检测模型的多类别蔬菜幼苗识别方法及系统 | |
CN108230329A (zh) | 基于多尺度卷积神经网络的语义分割方法 | |
CN108596329A (zh) | 基于端到端深度集成学习网络的三维模型分类方法 | |
CN106127173A (zh) | 一种基于深度学习的人体属性识别方法 | |
CN104933417A (zh) | 一种基于稀疏时空特征的行为识别方法 | |
CN110378242A (zh) | 一种双重注意力机制的遥感目标检测方法 | |
Zheng et al. | Large-scale oil palm tree detection from high-resolution remote sensing images using faster-rcnn | |
CN110211127B (zh) | 基于双相关性网络的图像分割方法 | |
CN111339935B (zh) | 一种基于可解释cnn图像分类模型的光学遥感图片分类方法 | |
CN106408030A (zh) | 基于中层语义属性和卷积神经网络的sar图像分类方法 | |
CN107169954A (zh) | 一种基于并行卷积神经网络的图像显著性检测方法 | |
CN106203450A (zh) | 基于深度学习框架对图像进行特征提取的目标检测方法 | |
CN111723685A (zh) | 基于支路特征融合卷积网络的遥感场景分类方法 | |
Liu et al. | Coastline extraction method based on convolutional neural networks—A case study of Jiaozhou Bay in Qingdao, China | |
CN108416397A (zh) | 一种基于ResNet-GCN网络的图像情感分类方法 | |
CN108875819A (zh) | 一种基于长短期记忆网络的物体和部件联合检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180406 |