CN107038448A - 目标检测模型构建方法 - Google Patents
目标检测模型构建方法 Download PDFInfo
- Publication number
- CN107038448A CN107038448A CN201710116891.0A CN201710116891A CN107038448A CN 107038448 A CN107038448 A CN 107038448A CN 201710116891 A CN201710116891 A CN 201710116891A CN 107038448 A CN107038448 A CN 107038448A
- Authority
- CN
- China
- Prior art keywords
- target
- target detection
- detected
- feature
- coordinate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 17
- 230000004807 localization Effects 0.000 claims abstract description 16
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims description 23
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000013135 deep learning Methods 0.000 claims description 7
- 230000004069 differentiation Effects 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 230000000452 restraining effect Effects 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 18
- 238000003475 lamination Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种目标检测模型构建方法,包括以下步骤:步骤1,选取包含有待检测目标的图片,对各待检测目标在图片中的进行位置标注,记录各待检测目标的坐标信息构成目标检测定位数据集;所述位置标注为在所述图片中绘制包含各待检测目标的最小矩形框;所述目标检测定位数据集中各待检测目标的坐标信息为各最小矩形框的左上角坐标信息和右下角坐标信息;步骤2,根据所述目标检测定位数据集对深度卷积神经网络进行训练;步骤3,输出训练完成后的目标检测模型。本发明中,有效地提升了对目标检测的准确度。
Description
技术领域
本发明属于计算机视觉领域,具体涉及一种目标检测模型构建方法。
背景技术
目标检测是计算机视觉中的经典问题之一,也是基于视觉的模式识别应用的一个重要研究方向。它需要对任意画面进行搜索,对画面中存在的目标进行有效的标注以及外接矩形框提取。由于需要对画面中呈现出多样性姿态的目标进行有效检出,因此需要目标的特征表示具有极强的表达能力和判别力。而传统的基于图像局部统计特性表达的手工设计特征难以区分目标的多样性、复杂性,其难以在一般性的目标检测问题上达到较好的效果。
深度学习是近年来机器学习领域一个热门研究方向,已经在计算机视觉、自然语言处理等领域获得了巨大的成功。尤其是深度卷积神经网络,凭借局部感受野、共享权值以及空间或时序下采样这三大结构特点,能够从二维图像中提取出语义信息丰富和判别力强的特征,在大规模图像分类和检索任务中均表现出优越的性能。近两年,已经出现一些将深度学习应用于专用的目标检测的技术,如CN104537647A利用深度学习模型的最后一层隐节点的状态值训练分类器,用于改善行人检测问题;CN105718912A采用传统方法和深度学习方法相结合的方式进行车辆检测,其利用传统方法提取目标候选区域,并在候选区域的基础上利用深度学习模型进行后续的特征提取以及目标类别判别。
现有的基于深度学习的一般性目标检测技术尚有以下不足:首先,一般的检测方法在其前端、或后端均结合了传统方法进行辅助,其采用的深度神经网络难以实现端到端的设计,从而提高了深度学习模型的训练难度,使得模型难以收敛;其次,由于图像中一般性目标的姿态呈现出多样性,如在一幅图像中可能出现一个人躺在沙发上看电视的场景,该图中人、沙发、电视分别呈现出截然不同的长宽比例、外观表现等形式,采用如行人、车辆等固定比例框的方式对目标外接矩形框进行预测难以有效的对目标的紧致位置表达;另外,图像中存在的不同类物体,由于其姿态、尺度的巨大差异,可能呈现出巨大的外观差异,如一幅图像中出现一个人弯腰捡起地下瓶子的场景,瓶子相对于图像尺寸呈现出非常小的尺度,由于深度神经网络具有层级卷积下采样的特性,其在处理小目标时采用单级判别的方式难以对小目标进行有效地提取。因此,上述已有的针对特定目标的检测方法在处理一般性目标检测问题难以同时处理目标外观、比例、尺度差异较大等问题,在进行一般性目标检测时判别力较为不足。
发明内容
为了解决现有技术中的上述问题,本发明提出了一种目标检测模型构建方法,有效提升目标检测准确度。
该构建方法包括以下步骤:
步骤1,选取包含有待检测目标的图片,对各待检测目标在图片中的进行位置标注,记录各待检测目标的坐标信息构成目标检测定位数据集;所述位置标注为在所述图片中绘制包含各待检测目标的最小矩形框;所述目标检测定位数据集中各待检测目标的坐标信息为各最小矩形框的左上角坐标信息和右下角坐标信息;
步骤2,根据所述目标检测定位数据集对深度卷积神经网络进行训练;
步骤3,输出训练完成后的目标检测模型。
优选地,所述深度卷积神经网络为输入原始图像,输出图像中目标定位矩形框左上角和右下角坐标及其对应的目标类别的神经网络结构。
优选地,所述步骤2包括:
步骤21,根据所述目标检测定位数据集做卷积特征和反卷积特征提取,得到图像稠密特征;
步骤22,对所述图像稠密特征进行物体性目标提取,得到物体性检测结果;
步骤23,利用非极大抑制处理对所述物体性检测结果进行重复过滤;
步骤24,利用自适应尺度选择对过滤后的物体性检测结果做自动特征尺度映射处理,得到不同尺度的物体性目标;
步骤25,根据感兴趣区域池化操作,在所述不同尺度的物体性目标中提取具有固定维度的目标特征;
步骤26,利用自适应空间仿射变换层对所述具有固定维度的目标特征进行标准化映射;
步骤27,根据不同维度的目标特征对不同尺度的物体性目标进行外接矩形框坐标回归处理;
步骤28,根据不同维度的目标特征和所述图像稠密特征对所述待检测目标类别进行判别。
优选地,所述步骤21具体为:
对所述目标检测定位数据集做图片的高分辨率特征提取,将卷积特征、反卷积特征进行采样串联得到图像的稠密特征。
优选地,所述步骤22具体为:
在进行物体性目标提取时,对物体性目标检测输出特征图的预测结果进行筛选,选取和待检测目标真实坐标重合度最大、且分类得分最高的预测结果组成困难样本集。
优选地,所述步骤24具体为:
对物体性检测结果进行尺度自适应映射,将不同尺度目标映射至不同深度特征中,得到不同尺度的物体性目标。
优选地,
所述外接矩形坐标回归处理中的外接矩形坐标回归特征由不同尺度对应深度学习特征层构成;
目标类别判别中的目标类别判别特征由对应层深度学习特征同物体性判别对应特征串联组成。
优选地,将所述步骤27的回归处理和步骤28的类别判别处理做联合优化处理,所述优化处理具体为输入单张图片,在线选取分类和坐标回归损失最大的目标样本参与多个损失计算,并针对每张图片将其在多个损失中对应的梯度累加,并进行一次梯度反传。
与现有技术相比,本发明至少具有以下优点:
通过本发明中目标检测模型的构建设计,有效地提升了对目标检测的准确度。
附图说明
图1为本发明所提供的目标检测模型构建方法的流程示意图;
图2为本发明所提供的目标检测深度神经网络总体结构示意图;
图3为本发明所提供的目标检测深度神经网络子网络示意图。
具体实施方式
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
本发明实施例包括目标检测模型构建方法,如图1所示,该方法包括以下步骤:
步骤A1,图片中待检测目标的位置标注。
选取包含有待检测目标的图片,对各待检测目标的图片进行目标位置标注,具体为绘制图片中包含各待检测目标的最小矩形框,记录该矩形框的左上角和右下角坐标信息,形成目标检测定位数据集。
其中,目标图片的来源可以有很多种方式,比如从网络上收集或自行拍摄,目标图片需要包含目标的50%以上;本实施例中采用手工标注的方式对图片进行目标位置标注,当然这只是其中一种标注方式,其它任意能够实现在图片中对待检测目标进行标注的方式均包含在本发明的范围之内。
步骤A2,对深度卷积神经网络进行训练。
利用目标检测定位数据集,训练用于目标检测深度卷积神经网络,并输出训练好的用于目标检测的深度卷积神经网络。其中,所述深度卷积神经网络具有端到端的特点,其输入为原始图像,输出为图像中目标定位矩形框左上角和右下角坐标以及其对应的目标类别。
在步骤A2中深度卷积神经网络训练过程中的损失分别有多级采用分类损失以及平滑1-范数(L1)损失加权组成;所述深度卷积神经网络由级联的多层监督组成,不同的网络监督层对应输出分类损失以及平滑L1损失,不同的网络输出层共同组成深度神经网络最终的检测损失。
为了加快用于目标检测的深度卷积神经网络的训练速度,在步骤A2中利用在线困难样本挖掘策略和一种改进的端到端的梯度反传优化算法来加快用于目标检测的深度卷积神经网络的收敛。
本实施案例所涉及的用于目标检测的深度卷积神经网络总体结构示意图如图1所示,由卷积子网络和后续的多层特征提取、物体性目标判别、尺度自适应、仿射变换校正、感兴趣区域池化、目标分类回归、非极大抑制等部分组成。其中物体性目标判别、以及目标分类、坐标回归等网络输出分别接分类损失以及平滑1范数回归损失,图2为了简洁,只画出了接在网络最后的损失层。
目标检测流程中的卷积网络具体结构示意图如图3所示,其中卷积子网络由1个输入层,15个卷积层、4个最大值池化层(分别用P1、P2、P3、P4表示)组成。具体来说,4个最大值池化层分别接在第3、6、9、12个卷积层之后,其池化核均为2×2。15个卷积层的卷积核均为3×3,卷积层的通道个数分别为64,64,64,128,128,128,256,256,256,512,512,512,512,512,512。
卷积子网络后面分别接2个反卷积层(通道数均为512)、1个特征串联层、以及10个卷积核为1×1的卷积层(fc1,fc3,fc5,fc7,fc9通道数分均512,fc2,fc4,fc6,fc8,fc10通道数均为5)。其后接尺度选择层、空间仿射变换层、感兴趣区域池化层(池化核为7×7)、4个平滑L1回归损失层以及2个分类损失层。
卷积子网络的15个卷积层输出均需要经过一个批规范化(Batch Normalization,BN)处理,这一处理具体是由一个批归一化(batch norm)步骤和一个尺度处理(scale)步骤组成的。Batch norm负责对输入数据进行均值为0方差为1的归一化,scale负责对输入数据进行缩放和平移。Batch norm的均值和方差来自于输入数据,scale的缩放平移参数需要从训练数据中学习。BN处理通过对网络输入做归一化,有效消除了网络内部的协变量转移,加快了网络收敛,有效防止了网络过拟合。BN处理之后再输入激活函数(Rectified LinearUnits,ReLu),该激活函数是一种常用的有效的非线性激活函数。
本发明考虑了一般目标在图片中呈现多姿态、多尺度等特点,将深度卷积神经网络的参数学习分为了层次化的递进的损失计算过程,以及端到端的一体化的梯度反传参数学习过程。故此将步骤A2拆分为以下步骤:
步骤A21,根据所述目标检测定位数据集做卷积特征和反卷积特征提取,得到图像稠密特征。
对于输入层对应的不限定大小的原始目标图片和相应的目标外接矩形框、目标类别标签,通过粗略的物体性检测过程提取粗略目标定位信息。对于步骤A2中的网络,将第15层卷积层及其后2个反卷积层(反卷积层1、反卷积层2)的输出作为目标图片的高分辨率特征提取。将第15个卷积层、第2个反卷积层分别上采样和下采样至第1个反卷积层大小后,将三层特征输出进行串联,得到图像的稠密特征表达。
步骤A22,对所述图像稠密特征进行物体性目标提取,得到物体性检测结果;具体为在进行物体性目标提取时,对物体性目标检测输出特征图的预测结果进行筛选,选取和待检测目标真实坐标重合度最大、且分类得分最高的预测结果组成困难样本集。
额外接2个1×1的卷积层,来对特征图上的每个位置进行目标粗略判别。对于特征图上的每个点,预先定义多个不同尺度(Scale)、不同比例(Ratio)目标参考输出结果:
Scale=2,4,8,16
Ratio=0.5,1,2 (1)
其中,Scale代表目标在特征图上可能的尺度大小,其对应的实际目标在原图中的尺寸大小(用像素数量,Area表示)计算为:
Area=2Scale*stride (2)
其中,stride为特征图相对于原始图像的下采样比例。在本发明样例中,stride=16。目标比例Ratio代表参考目标的实际高宽比。对于特征图上每一个点,均产生Scale*Ratio个目标参考输出结果,该参考输出结果通过卷积操作进行目标外接矩形框的粗略预测。
对于步骤A22,1×1卷积层输出特征图中每个特征点的对应目标参考输出的分类判别结果,以及相应的参考坐标拟合输出结果。该分类判别以及坐标拟合输出结果粗略地对目标参考输出进行判别,将可能的目标从背景中分离出来,该分类判别过程以及相应的参考坐标拟合输出结果不对不同目标之间的类别进行区分,仅对目标与背景进行区分。
在本发明实施例中,该模型在训练阶段粗略物体性检测结果中的判别结果后面连接交叉熵分类损失,坐标拟合结果后面连接平滑L1损失,通过网络初始输入的目标类别、以及目标真实坐标值进行损失计算。物体性检测损失如下表达式所示:
L(p,k*,t,t*)=Lcls(p,k*)+λ[k*≥1]Lloc(t,t*) (3)
这里k*为预测框的真实类标,代表其是否为目标物体之一,即为交叉熵分类损失。k*≥1代表只对目标品类进行坐标回归。Lloc为平滑1范数损失,其定义了对第k*类目标预测的的外接矩形框坐标t对人工标注的真实目标外接矩形框t*进行回归的损失。
为了加速上述物体性检测网络训练过程的收敛性,对上述物体性目标检测输出特征图的预测结果进行筛选,选取和目标真实坐标重合度最大、且分类得分最高的部分预测结果组成困难样本集,用于计算损失以及网络参数更新。
步骤A23,利用非极大抑制处理对所述物体性检测结果进行重复过滤。
该结果输出为额外卷积层在目标图片特征图每一个点上进行多尺度、多比例的目标判别输出,输出的物体性检测结果包括物体性判别得分和物体的左上角和右下角坐标输出结果。
优选地,在步骤A23中对目标图片特征图的每一个点进行多尺度、多比例的目标判别时,针对每个特征点预先定义多个不同尺度、不同长宽比例的参考输出结果,初始检测结果中的坐标输出为在该参考输出结果上的坐标偏差预测。
优选地,上述物体性目标检测过程不区分不同目标之间的类别差异性,该物体性类别判别输出仅区分该物体是否为目标或背景。
优选地,该物体性判别输出结果后面接分类损失,在目标坐标拟合结果输出接平滑L1损失,通过网络初始输入的目标类别、以及目标真实坐标值进行物体性目标检测判别监督。
优选地,为了加速上述物体性检测网络训练过程的收敛性,对上述物体性目标检测输出特征图的预测结果进行筛选,选取和目标真实坐标重合度最大、且分类得分最高的部分预测结果组成困难样本集,用于计算损失以及网络参数更新。
步骤A24,利用自适应尺度选择对过滤后的物体性检测结果做自动特征尺度映射处理,得到不同尺度的物体性目标。
尺寸较大的目标映射到分辨率较低的第15层卷积层中,一般尺寸目标映射到第1层反卷积层,尺寸较小的目标映射到第2层反卷积层。
对于物体性检测得到的粗略目标外接矩形框,输入自适应尺度选择层,将不同目标映射到不同特征图中进行特征提取。
对于步骤A24中的尺度选择层,预先对训练样本中的目标标注矩形框的尺度进行聚类,确定尺度变化范围。对于一幅图像,其给定的目标标注信息为[x,y,w,h],其中(x,y)为标注框左上角坐标,(w,h)为标注框宽和高,则目标尺度定义为
同过对标注样本的尺度进行k均值聚类,得到N个聚类中心,自适应尺度判别层通过对物体性矩形框尺度归类为最近邻聚类中心来进行尺度判别,进而将物体性检测结果映射至更合适的特征层进行特征提取。在本实施例中,取尺度聚类中心N=3,分别对应特征映射为第15层卷积层(大尺度目标)、第1层卷积层(中等尺度目标)以及第2层卷积层(小尺度目标)。对于第i个物体性目标,其坐标映射特征图Fi对应为:
其中,ssmall,smiddle,slarge分别为三个聚类中心对应的目标尺度。
步骤A25,根据感兴趣区域池化操作,在所述不同尺度的物体性目标中提取具有固定维度的目标特征。
将映射后的目标框及其对应特征图输入感兴趣区域池化层,提取固定维度的特征表达。将映射后的目标框划分为p×p个均匀的目标框,将每个框内的特征进行最大化池化提取操作,得到宽高固定的特征表达。在本实施例中,p=7。
步骤A26,利用自适应空间仿射变换层对所述具有固定维度的目标特征进行标准化映射。
对于固定宽高的目标特征表达,将其输入空间仿射变换层进行形态校正,辅助提高特征判别力。对于图片中的待检测目标,其姿态呈现出多样性,这里我们定义目标具有一个“标准形态”,标准形态下的目标能够更加合理地展现出目标表观特性,从而能够有效提升目标特征判别力。对于原始特征表达中的每一个坐标点其经过仿射后的坐标表示为:
其中,为对应的仿射变换矩阵。其中,六元参数包含对特征图的的裁剪、旋转、平移、尺度变换、倾斜等变换过程。在本发明中,我们对特征图的变换过程进行简化,定义了一种近似的空间仿射变换过程:
其中,为近似空间仿射变换矩阵。这里我们将六参数缩减为二元参数,在保留了仿射变换特性的同时,简化了参数训练时的计算复杂度。这里的m为对应特征图上的坐标位置均值,即
近似空间仿射变换矩阵参数的求解如下:
其中,
由近似仿射变换矩阵我们就可以得到特征图Fs(xs,ys)的标准形式表达特征图Ft(xt,yt)。由于标注形式的特征图表达与变换前的特征图尺寸相同,即有Ft(xt,yt)=Fs(xs,ys)。在训练过程中,我们并不需要显式的定义标准形式的表达,其均由网络参数学习得到。由链式求导法则可知,近似仿射变换矩阵回传梯度的过程表示为:
其中,为由下一层网络传回的梯度,与为原始特征图在水平与竖直方向上的梯度。的计算过程于此类似。由此,我们可以得到近似空间仿射变换层回传的梯度。
步骤A27,根据不同维度的目标特征对不同尺度的物体性目标进行外接矩形框坐标回归处理。
所述外接矩形坐标回归处理中的外接矩形坐标回归特征由不同尺度对应深度学习特征层构成;在空间仿射变换后的目标特征层后接1×1卷积层,进行不同尺度目标外接矩形框预测,预测结果后面接平滑1范数损失。
步骤A28,根据不同维度的目标特征和所述图像稠密特征对所述待检测目标类别进行判别。
目标类别判别中的目标类别判别特征由对应层深度学习特征同物体性判别对应特征串联组成;将空间仿射变换后的目标特征同步骤A22中物体性检测层提取的特征进行串联,得到目标类别判别的特征表达,其后接1×1卷积层进行目标类别预测,预测结果后接softmax分类损失。
目标类别判别与外接矩形框预测的联合损失定义为:
其中,Lobj cls为物体类别判别交叉熵损失,Lobj loc(ti,ti *)为不同尺度对应的平滑1范数回归损失。
将所述步骤27的回归处理和步骤28的类别判别处理做联合优化处理,所述优化处理具体为输入单张图片,在线选取分类和坐标回归损失最大的目标样本参与多个损失计算,并针对每张图片将其在多个损失中对应的梯度累加,并进行一次梯度反传。
优选地,在进行第二级目标判别损失计算时,选取损失最大的前N个样本作为困难样本,其计算得到的损失加入最终的损失计算和网络参数更新。
优选地,所述的网络训练过程中采用一种改进的梯度反传优化算法,具体为:输入单张图片,在线选取分类和坐标回归损失最大的目标样本参与上述的6个损失计算,并针对每张图片将其在多个损失中对应的梯度累加,并进行一次梯度反传。
步骤A3,输出目标检测模型。
本发明通过所涉及的一种深层的卷积神经网络结构,采用层级的检测流程,联合使用多级分类损失和利用不同层级特性的多级平滑L1回归损失来监督网络的训练,并提出了一种在线困难样本挖掘策略和改进的一体化梯度反传优化算法来加快网络收敛。本发明方法通过将目标检测过程分为多级、多尺度的检测流程,使得训练的到的深层卷积神经网络能够从输入图片中提取出的目标语义信息更丰富,对小尺寸目标提取判别力更强的特征表达,从而使得在目标检测时有效提升目标检测和定位精度。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (8)
1.一种目标检测模型构建方法,其特征在于,包括以下步骤:
步骤1,选取包含有待检测目标的图片,对各待检测目标在图片中的进行位置标注,记录各待检测目标的坐标信息构成目标检测定位数据集;所述位置标注为在所述图片中绘制包含各待检测目标的最小矩形框;所述目标检测定位数据集中各待检测目标的坐标信息为各最小矩形框的左上角坐标信息和右下角坐标信息;
步骤2,根据所述目标检测定位数据集对深度卷积神经网络进行训练;
步骤3,输出训练完成后的目标检测模型。
2.根据权利要求1所述的目标检测模型构建方法,其特征在于,所述深度卷积神经网络为输入原始图像,输出图像中目标定位矩形框左上角和右下角坐标及其对应的目标类别的神经网络结构。
3.根据权利要求2所述的目标检测模型构建方法,其特征在于,所述步骤2包括:
步骤21,根据所述目标检测定位数据集做卷积特征和反卷积特征提取,得到图像稠密特征;
步骤22,对所述图像稠密特征进行物体性目标提取,得到物体性检测结果;
步骤23,利用非极大抑制处理对所述物体性检测结果进行重复过滤;
步骤24,利用自适应尺度选择对过滤后的物体性检测结果做自动特征尺度映射处理,得到不同尺度的物体性目标;
步骤25,根据感兴趣区域池化操作,在所述不同尺度的物体性目标中提取具有固定维度的目标特征;
步骤26,利用自适应空间仿射变换层对所述具有固定维度的目标特征进行标准化映射;
步骤27,根据不同维度的目标特征对不同尺度的物体性目标进行外接矩形框坐标回归处理;
步骤28,根据不同维度的目标特征和所述图像稠密特征对所述待检测目标类别进行判别。
4.根据权利要求3所述的目标检测模型构建方法,其特征在于,所述步骤21具体为:
对所述目标检测定位数据集做图片的高分辨率特征提取,将卷积特征、反卷积特征进行采样串联得到图像的稠密特征。
5.根据权利要求3所述的目标检测模型构建方法,其特征在于,所述步骤22具体为:
在进行物体性目标提取时,对物体性目标检测输出特征图的预测结果进行筛选,选取和待检测目标真实坐标重合度最大、且分类得分最高的预测结果组成困难样本集。
6.根据权利要求3所述的目标检测模型构建方法,其特征在于,所述步骤24具体为:
对物体性检测结果进行尺度自适应映射,将不同尺度目标映射至不同深度特征中,得到不同尺度的物体性目标。
7.根据权利要求3所述的目标检测模型构建方法,其特征在于,
所述外接矩形坐标回归处理中的外接矩形坐标回归特征由不同尺度对应深度学习特征层构成;
目标类别判别中的目标类别判别特征由对应层深度学习特征同物体性判别对应特征串联组成。
8.根据权利要求7所述的目标检测模型构建方法,其特征在于,将所述步骤27的回归处理和步骤28的类别判别处理做联合优化处理,所述优化处理具体为输入单张图片,在线选取分类和坐标回归损失最大的目标样本参与多个损失计算,并针对每张图片将其在多个损失中对应的梯度累加,并进行一次梯度反传。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710116891.0A CN107038448B (zh) | 2017-03-01 | 2017-03-01 | 目标检测模型构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710116891.0A CN107038448B (zh) | 2017-03-01 | 2017-03-01 | 目标检测模型构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107038448A true CN107038448A (zh) | 2017-08-11 |
CN107038448B CN107038448B (zh) | 2020-02-28 |
Family
ID=59534346
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710116891.0A Active CN107038448B (zh) | 2017-03-01 | 2017-03-01 | 目标检测模型构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107038448B (zh) |
Cited By (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107742093A (zh) * | 2017-09-01 | 2018-02-27 | 国网山东省电力公司电力科学研究院 | 一种红外图像电力设备部件实时检测方法、服务器及系统 |
CN107818302A (zh) * | 2017-10-20 | 2018-03-20 | 中国科学院光电技术研究所 | 基于卷积神经网络的非刚性多尺度物体检测方法 |
CN107958200A (zh) * | 2017-10-13 | 2018-04-24 | 上海眼控科技股份有限公司 | 一种轿车改装排气扇的智能检测系统及方法 |
CN108062754A (zh) * | 2018-01-19 | 2018-05-22 | 深圳大学 | 基于密集网络图像的分割、识别方法和装置 |
CN108062552A (zh) * | 2017-10-13 | 2018-05-22 | 上海眼控科技股份有限公司 | 一种用于车辆年检的车身喷绘智能检测系统及方法 |
CN108109385A (zh) * | 2018-01-18 | 2018-06-01 | 南京杰迈视讯科技有限公司 | 一种输电线防外破的车辆识别与危险行为判别系统与方法 |
CN108108754A (zh) * | 2017-12-15 | 2018-06-01 | 北京迈格威科技有限公司 | 重识别网络的训练、重识别方法、装置和系统 |
CN108133197A (zh) * | 2018-01-05 | 2018-06-08 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN108182456A (zh) * | 2018-01-23 | 2018-06-19 | 哈工大机器人(合肥)国际创新研究院 | 一种基于深度学习的目标检测模型及其训练方法 |
CN108347643A (zh) * | 2018-03-05 | 2018-07-31 | 成都索贝数码科技股份有限公司 | 一种基于深度学习的字幕叠加截图的实现方法 |
CN108596184A (zh) * | 2018-04-25 | 2018-09-28 | 清华大学深圳研究生院 | 图像语义分割模型的训练方法、可读存储介质及电子设备 |
CN108694401A (zh) * | 2018-05-09 | 2018-10-23 | 北京旷视科技有限公司 | 目标检测方法、装置及系统 |
CN108764247A (zh) * | 2018-04-13 | 2018-11-06 | 中国科学院自动化研究所 | 基于稠密连接的深度学习物体检测方法及装置 |
CN108810538A (zh) * | 2018-06-08 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、终端及存储介质 |
CN108875487A (zh) * | 2017-09-29 | 2018-11-23 | 北京旷视科技有限公司 | 行人重识别网络的训练及基于其的行人重识别 |
CN108960314A (zh) * | 2018-06-26 | 2018-12-07 | 北京旷视科技有限公司 | 基于难样本的训练方法、装置及电子设备 |
CN109359207A (zh) * | 2018-12-24 | 2019-02-19 | 焦点科技股份有限公司 | 一种易于快速迭代更新的Logo检测方法 |
CN109583321A (zh) * | 2018-11-09 | 2019-04-05 | 同济大学 | 一种基于深度学习的结构化道路中小物体的检测方法 |
CN109671064A (zh) * | 2018-12-14 | 2019-04-23 | 大连理工大学 | 一种工业零部件表面裂纹的多目标检测方法 |
CN109697464A (zh) * | 2018-12-17 | 2019-04-30 | 环球智达科技(北京)有限公司 | 基于物体检测和特征搜索的精确目标识别的方法及系统 |
CN109697397A (zh) * | 2017-10-24 | 2019-04-30 | 高德软件有限公司 | 一种目标检测方法及装置 |
CN109785385A (zh) * | 2019-01-22 | 2019-05-21 | 中国科学院自动化研究所 | 视觉目标跟踪方法及系统 |
CN109803090A (zh) * | 2019-01-25 | 2019-05-24 | 睿魔智能科技(深圳)有限公司 | 无人拍摄自动变焦方法及系统、无人摄像机及存储介质 |
CN109816727A (zh) * | 2019-01-29 | 2019-05-28 | 江苏医像信息技术有限公司 | 三维图集的目标识别方法 |
CN109993789A (zh) * | 2017-12-29 | 2019-07-09 | 杭州海康威视数字技术股份有限公司 | 一种共享单车的违停判定方法、装置及相机 |
CN110020592A (zh) * | 2019-02-03 | 2019-07-16 | 平安科技(深圳)有限公司 | 物体检测模型训练方法、装置、计算机设备及存储介质 |
CN110084304A (zh) * | 2019-04-28 | 2019-08-02 | 北京理工大学 | 一种基于合成数据集的目标检测方法 |
CN110321867A (zh) * | 2019-07-09 | 2019-10-11 | 西安电子科技大学 | 基于部件约束网络的遮挡目标检测方法 |
CN110390691A (zh) * | 2019-06-12 | 2019-10-29 | 合肥合工安驰智能科技有限公司 | 一种基于深度学习的矿石尺度测量方法及应用系统 |
CN110532886A (zh) * | 2019-07-31 | 2019-12-03 | 国网江苏省电力有限公司 | 一种基于孪生神经网络的目标检测算法 |
CN110717534A (zh) * | 2019-09-30 | 2020-01-21 | 中国科学院大学 | 一种基于网络监督的目标分类和定位方法 |
CN110751163A (zh) * | 2018-07-24 | 2020-02-04 | 杭州海康威视数字技术股份有限公司 | 目标定位方法及其装置、计算机可读存储介质和电子设备 |
CN110826411A (zh) * | 2019-10-10 | 2020-02-21 | 电子科技大学 | 一种基于无人机图像的车辆目标快速识别方法 |
WO2020048273A1 (zh) * | 2018-09-07 | 2020-03-12 | 阿里巴巴集团控股有限公司 | 用于图片匹配定位的神经网络系统,方法及装置 |
CN111126278A (zh) * | 2019-12-24 | 2020-05-08 | 北京邮电大学 | 针对少类别场景的目标检测模型优化与加速的方法 |
CN111259710A (zh) * | 2018-12-03 | 2020-06-09 | 初速度(苏州)科技有限公司 | 采用停车位框线、端点的停车位结构检测模型训练方法 |
CN111291651A (zh) * | 2020-01-21 | 2020-06-16 | 中国科学院西安光学精密机械研究所 | 用于遥感场景分类的多任务神经网络框架及分类方法 |
CN111553428A (zh) * | 2020-04-30 | 2020-08-18 | 北京百度网讯科技有限公司 | 用于训练判别模型的方法、装置、设备及可读存储介质 |
CN111814860A (zh) * | 2020-07-01 | 2020-10-23 | 浙江工业大学 | 一种面向垃圾分类的多目标检测方法 |
CN111860197A (zh) * | 2020-06-26 | 2020-10-30 | 中国人民解放军32802部队 | 基于多光谱多模的低慢小目标感知方法及系统 |
CN112085042A (zh) * | 2019-06-14 | 2020-12-15 | 顺丰科技有限公司 | 一种图像检测网络模型、装置、方法、及存储介质 |
CN112183358A (zh) * | 2020-09-29 | 2021-01-05 | 新石器慧拓(北京)科技有限公司 | 一种目标检测模型的训练方法及装置 |
WO2021088700A1 (zh) * | 2019-11-05 | 2021-05-14 | 京东数科海益信息科技有限公司 | 喷头控制方法、装置、计算机设备和存储介质 |
CN112818965A (zh) * | 2021-04-16 | 2021-05-18 | 武汉光谷信息技术股份有限公司 | 多尺度影像目标检测方法、系统、电子设备及存储介质 |
CN113313213A (zh) * | 2021-07-28 | 2021-08-27 | 中国航空油料集团有限公司 | 一种加速目标检测算法训练的数据集处理方法 |
CN113348663A (zh) * | 2021-03-23 | 2021-09-03 | 深圳市锐明技术股份有限公司 | 一种货箱监控方法、终端设备及存储介质 |
CN113673271A (zh) * | 2020-05-13 | 2021-11-19 | 北京君正集成电路股份有限公司 | 一种基于宠物检测的双层标注计算二级损失的方法 |
CN114926657A (zh) * | 2022-06-09 | 2022-08-19 | 山东财经大学 | 显著性目标检测方法及系统 |
CN115049734A (zh) * | 2022-08-12 | 2022-09-13 | 摩尔线程智能科技(北京)有限责任公司 | 在图像中定位目标物的方法和装置 |
CN115953665A (zh) * | 2023-03-09 | 2023-04-11 | 武汉人工智能研究院 | 一种目标检测方法、装置、设备及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112505049B (zh) * | 2020-10-14 | 2021-08-03 | 上海互觉科技有限公司 | 基于蒙版抑制的精密零组件表面缺陷检测方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077577A (zh) * | 2014-07-03 | 2014-10-01 | 浙江大学 | 一种基于卷积神经网络的商标检测方法 |
CN104217225A (zh) * | 2014-09-02 | 2014-12-17 | 中国科学院自动化研究所 | 一种视觉目标检测与标注方法 |
CN104573731A (zh) * | 2015-02-06 | 2015-04-29 | 厦门大学 | 基于卷积神经网络的快速目标检测方法 |
WO2016054778A1 (en) * | 2014-10-09 | 2016-04-14 | Microsoft Technology Licensing, Llc | Generic object detection in images |
US20160140424A1 (en) * | 2014-11-13 | 2016-05-19 | Nec Laboratories America, Inc. | Object-centric Fine-grained Image Classification |
CN105975941A (zh) * | 2016-05-31 | 2016-09-28 | 电子科技大学 | 一种基于深度学习的多方向车型检测识别系统 |
CN106022237A (zh) * | 2016-05-13 | 2016-10-12 | 电子科技大学 | 一种端到端的卷积神经网络的行人检测方法 |
-
2017
- 2017-03-01 CN CN201710116891.0A patent/CN107038448B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077577A (zh) * | 2014-07-03 | 2014-10-01 | 浙江大学 | 一种基于卷积神经网络的商标检测方法 |
CN104217225A (zh) * | 2014-09-02 | 2014-12-17 | 中国科学院自动化研究所 | 一种视觉目标检测与标注方法 |
WO2016054778A1 (en) * | 2014-10-09 | 2016-04-14 | Microsoft Technology Licensing, Llc | Generic object detection in images |
US20160140424A1 (en) * | 2014-11-13 | 2016-05-19 | Nec Laboratories America, Inc. | Object-centric Fine-grained Image Classification |
CN104573731A (zh) * | 2015-02-06 | 2015-04-29 | 厦门大学 | 基于卷积神经网络的快速目标检测方法 |
CN106022237A (zh) * | 2016-05-13 | 2016-10-12 | 电子科技大学 | 一种端到端的卷积神经网络的行人检测方法 |
CN105975941A (zh) * | 2016-05-31 | 2016-09-28 | 电子科技大学 | 一种基于深度学习的多方向车型检测识别系统 |
Non-Patent Citations (1)
Title |
---|
卢宏涛,张秦川: "深度卷积神经网络在计算机视觉中的应用研究综述", 《数据采集与处理》 * |
Cited By (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107742093A (zh) * | 2017-09-01 | 2018-02-27 | 国网山东省电力公司电力科学研究院 | 一种红外图像电力设备部件实时检测方法、服务器及系统 |
CN107742093B (zh) * | 2017-09-01 | 2020-05-05 | 国网山东省电力公司电力科学研究院 | 一种红外图像电力设备部件实时检测方法、服务器及系统 |
CN108875487A (zh) * | 2017-09-29 | 2018-11-23 | 北京旷视科技有限公司 | 行人重识别网络的训练及基于其的行人重识别 |
CN108875487B (zh) * | 2017-09-29 | 2021-06-15 | 北京旷视科技有限公司 | 行人重识别网络的训练及基于其的行人重识别 |
CN108062552A (zh) * | 2017-10-13 | 2018-05-22 | 上海眼控科技股份有限公司 | 一种用于车辆年检的车身喷绘智能检测系统及方法 |
CN107958200A (zh) * | 2017-10-13 | 2018-04-24 | 上海眼控科技股份有限公司 | 一种轿车改装排气扇的智能检测系统及方法 |
CN107818302A (zh) * | 2017-10-20 | 2018-03-20 | 中国科学院光电技术研究所 | 基于卷积神经网络的非刚性多尺度物体检测方法 |
CN109697397A (zh) * | 2017-10-24 | 2019-04-30 | 高德软件有限公司 | 一种目标检测方法及装置 |
CN109697397B (zh) * | 2017-10-24 | 2021-07-30 | 阿里巴巴(中国)有限公司 | 一种目标检测方法及装置 |
CN108108754A (zh) * | 2017-12-15 | 2018-06-01 | 北京迈格威科技有限公司 | 重识别网络的训练、重识别方法、装置和系统 |
CN109993789B (zh) * | 2017-12-29 | 2021-05-25 | 杭州海康威视数字技术股份有限公司 | 一种共享单车的违停判定方法、装置及相机 |
CN109993789A (zh) * | 2017-12-29 | 2019-07-09 | 杭州海康威视数字技术股份有限公司 | 一种共享单车的违停判定方法、装置及相机 |
CN108133197A (zh) * | 2018-01-05 | 2018-06-08 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN108109385A (zh) * | 2018-01-18 | 2018-06-01 | 南京杰迈视讯科技有限公司 | 一种输电线防外破的车辆识别与危险行为判别系统与方法 |
CN108109385B (zh) * | 2018-01-18 | 2022-06-14 | 南京杰迈视讯科技有限公司 | 一种输电线防外破的车辆识别与危险行为判别系统与方法 |
CN108062754A (zh) * | 2018-01-19 | 2018-05-22 | 深圳大学 | 基于密集网络图像的分割、识别方法和装置 |
CN108062754B (zh) * | 2018-01-19 | 2020-08-25 | 深圳大学 | 基于密集网络图像的分割、识别方法和装置 |
CN108182456A (zh) * | 2018-01-23 | 2018-06-19 | 哈工大机器人(合肥)国际创新研究院 | 一种基于深度学习的目标检测模型及其训练方法 |
CN108182456B (zh) * | 2018-01-23 | 2022-03-18 | 哈工大机器人(合肥)国际创新研究院 | 一种基于深度学习的目标检测模型及其训练方法 |
CN108347643A (zh) * | 2018-03-05 | 2018-07-31 | 成都索贝数码科技股份有限公司 | 一种基于深度学习的字幕叠加截图的实现方法 |
CN108347643B (zh) * | 2018-03-05 | 2020-09-15 | 成都索贝数码科技股份有限公司 | 一种基于深度学习的字幕叠加截图的实现方法 |
CN108764247B (zh) * | 2018-04-13 | 2020-11-10 | 中国科学院自动化研究所 | 基于稠密连接的深度学习物体检测方法及装置 |
CN108764247A (zh) * | 2018-04-13 | 2018-11-06 | 中国科学院自动化研究所 | 基于稠密连接的深度学习物体检测方法及装置 |
CN108596184A (zh) * | 2018-04-25 | 2018-09-28 | 清华大学深圳研究生院 | 图像语义分割模型的训练方法、可读存储介质及电子设备 |
CN108596184B (zh) * | 2018-04-25 | 2021-01-12 | 清华大学深圳研究生院 | 图像语义分割模型的训练方法、可读存储介质及电子设备 |
CN108694401A (zh) * | 2018-05-09 | 2018-10-23 | 北京旷视科技有限公司 | 目标检测方法、装置及系统 |
US11250591B2 (en) | 2018-05-09 | 2022-02-15 | Beijing Kuangshi Technology Co., Ltd. | Target detection method, system, and non-volatile storage medium |
CN108810538A (zh) * | 2018-06-08 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、终端及存储介质 |
CN108810538B (zh) * | 2018-06-08 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、终端及存储介质 |
CN108960314B (zh) * | 2018-06-26 | 2022-02-11 | 北京旷视科技有限公司 | 基于难样本的训练方法、装置及电子设备 |
CN108960314A (zh) * | 2018-06-26 | 2018-12-07 | 北京旷视科技有限公司 | 基于难样本的训练方法、装置及电子设备 |
CN110751163A (zh) * | 2018-07-24 | 2020-02-04 | 杭州海康威视数字技术股份有限公司 | 目标定位方法及其装置、计算机可读存储介质和电子设备 |
WO2020048273A1 (zh) * | 2018-09-07 | 2020-03-12 | 阿里巴巴集团控股有限公司 | 用于图片匹配定位的神经网络系统,方法及装置 |
CN109583321A (zh) * | 2018-11-09 | 2019-04-05 | 同济大学 | 一种基于深度学习的结构化道路中小物体的检测方法 |
CN111259710B (zh) * | 2018-12-03 | 2022-06-10 | 魔门塔(苏州)科技有限公司 | 采用停车位框线、端点的停车位结构检测模型训练方法 |
CN111259710A (zh) * | 2018-12-03 | 2020-06-09 | 初速度(苏州)科技有限公司 | 采用停车位框线、端点的停车位结构检测模型训练方法 |
CN109671064A (zh) * | 2018-12-14 | 2019-04-23 | 大连理工大学 | 一种工业零部件表面裂纹的多目标检测方法 |
CN109697464A (zh) * | 2018-12-17 | 2019-04-30 | 环球智达科技(北京)有限公司 | 基于物体检测和特征搜索的精确目标识别的方法及系统 |
CN109359207A (zh) * | 2018-12-24 | 2019-02-19 | 焦点科技股份有限公司 | 一种易于快速迭代更新的Logo检测方法 |
CN109359207B (zh) * | 2018-12-24 | 2021-01-22 | 焦点科技股份有限公司 | 一种易于快速迭代更新的Logo检测方法 |
CN109785385B (zh) * | 2019-01-22 | 2021-01-29 | 中国科学院自动化研究所 | 视觉目标跟踪方法及系统 |
CN109785385A (zh) * | 2019-01-22 | 2019-05-21 | 中国科学院自动化研究所 | 视觉目标跟踪方法及系统 |
CN109803090A (zh) * | 2019-01-25 | 2019-05-24 | 睿魔智能科技(深圳)有限公司 | 无人拍摄自动变焦方法及系统、无人摄像机及存储介质 |
CN109816727B (zh) * | 2019-01-29 | 2023-05-02 | 江苏医像信息技术有限公司 | 三维图集的目标识别方法 |
CN109816727A (zh) * | 2019-01-29 | 2019-05-28 | 江苏医像信息技术有限公司 | 三维图集的目标识别方法 |
CN110020592A (zh) * | 2019-02-03 | 2019-07-16 | 平安科技(深圳)有限公司 | 物体检测模型训练方法、装置、计算机设备及存储介质 |
WO2020155518A1 (zh) * | 2019-02-03 | 2020-08-06 | 平安科技(深圳)有限公司 | 物体检测方法、装置、计算机设备及存储介质 |
CN110020592B (zh) * | 2019-02-03 | 2024-04-09 | 平安科技(深圳)有限公司 | 物体检测模型训练方法、装置、计算机设备及存储介质 |
CN110084304A (zh) * | 2019-04-28 | 2019-08-02 | 北京理工大学 | 一种基于合成数据集的目标检测方法 |
CN110390691A (zh) * | 2019-06-12 | 2019-10-29 | 合肥合工安驰智能科技有限公司 | 一种基于深度学习的矿石尺度测量方法及应用系统 |
CN112085042A (zh) * | 2019-06-14 | 2020-12-15 | 顺丰科技有限公司 | 一种图像检测网络模型、装置、方法、及存储介质 |
CN110321867B (zh) * | 2019-07-09 | 2022-03-04 | 西安电子科技大学 | 基于部件约束网络的遮挡目标检测方法 |
CN110321867A (zh) * | 2019-07-09 | 2019-10-11 | 西安电子科技大学 | 基于部件约束网络的遮挡目标检测方法 |
CN110532886A (zh) * | 2019-07-31 | 2019-12-03 | 国网江苏省电力有限公司 | 一种基于孪生神经网络的目标检测算法 |
CN110717534A (zh) * | 2019-09-30 | 2020-01-21 | 中国科学院大学 | 一种基于网络监督的目标分类和定位方法 |
CN110717534B (zh) * | 2019-09-30 | 2020-09-15 | 中国科学院大学 | 一种基于网络监督的目标分类和定位方法 |
CN110826411A (zh) * | 2019-10-10 | 2020-02-21 | 电子科技大学 | 一种基于无人机图像的车辆目标快速识别方法 |
CN110826411B (zh) * | 2019-10-10 | 2022-05-03 | 电子科技大学 | 一种基于无人机图像的车辆目标快速识别方法 |
WO2021088700A1 (zh) * | 2019-11-05 | 2021-05-14 | 京东数科海益信息科技有限公司 | 喷头控制方法、装置、计算机设备和存储介质 |
CN111126278A (zh) * | 2019-12-24 | 2020-05-08 | 北京邮电大学 | 针对少类别场景的目标检测模型优化与加速的方法 |
CN111126278B (zh) * | 2019-12-24 | 2023-06-20 | 北京邮电大学 | 针对少类别场景的目标检测模型优化与加速的方法 |
CN111291651B (zh) * | 2020-01-21 | 2023-05-05 | 中国科学院西安光学精密机械研究所 | 用于遥感场景分类的多任务神经网络框架及分类方法 |
CN111291651A (zh) * | 2020-01-21 | 2020-06-16 | 中国科学院西安光学精密机械研究所 | 用于遥感场景分类的多任务神经网络框架及分类方法 |
CN111553428A (zh) * | 2020-04-30 | 2020-08-18 | 北京百度网讯科技有限公司 | 用于训练判别模型的方法、装置、设备及可读存储介质 |
CN111553428B (zh) * | 2020-04-30 | 2024-01-12 | 北京百度网讯科技有限公司 | 用于训练判别模型的方法、装置、设备及可读存储介质 |
CN113673271A (zh) * | 2020-05-13 | 2021-11-19 | 北京君正集成电路股份有限公司 | 一种基于宠物检测的双层标注计算二级损失的方法 |
CN113673271B (zh) * | 2020-05-13 | 2023-04-28 | 北京君正集成电路股份有限公司 | 一种基于宠物检测的双层标注计算二级损失的方法 |
CN111860197A (zh) * | 2020-06-26 | 2020-10-30 | 中国人民解放军32802部队 | 基于多光谱多模的低慢小目标感知方法及系统 |
CN111814860A (zh) * | 2020-07-01 | 2020-10-23 | 浙江工业大学 | 一种面向垃圾分类的多目标检测方法 |
CN112183358B (zh) * | 2020-09-29 | 2024-04-23 | 新石器慧通(北京)科技有限公司 | 一种目标检测模型的训练方法及装置 |
CN112183358A (zh) * | 2020-09-29 | 2021-01-05 | 新石器慧拓(北京)科技有限公司 | 一种目标检测模型的训练方法及装置 |
CN113348663B (zh) * | 2021-03-23 | 2023-01-24 | 深圳市锐明技术股份有限公司 | 一种货箱监控方法、终端设备及存储介质 |
CN113348663A (zh) * | 2021-03-23 | 2021-09-03 | 深圳市锐明技术股份有限公司 | 一种货箱监控方法、终端设备及存储介质 |
CN112818965A (zh) * | 2021-04-16 | 2021-05-18 | 武汉光谷信息技术股份有限公司 | 多尺度影像目标检测方法、系统、电子设备及存储介质 |
CN112818965B (zh) * | 2021-04-16 | 2021-07-30 | 武汉光谷信息技术股份有限公司 | 多尺度影像目标检测方法、系统、电子设备及存储介质 |
CN113313213A (zh) * | 2021-07-28 | 2021-08-27 | 中国航空油料集团有限公司 | 一种加速目标检测算法训练的数据集处理方法 |
CN113313213B (zh) * | 2021-07-28 | 2021-11-19 | 中国航空油料集团有限公司 | 一种加速目标检测算法训练的数据集处理方法 |
CN114926657B (zh) * | 2022-06-09 | 2023-12-19 | 山东财经大学 | 显著性目标检测方法及系统 |
CN114926657A (zh) * | 2022-06-09 | 2022-08-19 | 山东财经大学 | 显著性目标检测方法及系统 |
CN115049734A (zh) * | 2022-08-12 | 2022-09-13 | 摩尔线程智能科技(北京)有限责任公司 | 在图像中定位目标物的方法和装置 |
CN115953665A (zh) * | 2023-03-09 | 2023-04-11 | 武汉人工智能研究院 | 一种目标检测方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107038448B (zh) | 2020-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038448A (zh) | 目标检测模型构建方法 | |
CN111259850B (zh) | 一种融合随机批掩膜和多尺度表征学习的行人重识别方法 | |
CN109543606A (zh) | 一种加入注意力机制的人脸识别方法 | |
CN105069746B (zh) | 基于局部仿射和颜色迁移技术的视频实时人脸替换方法及其系统 | |
CN109829893A (zh) | 一种基于注意力机制的缺陷目标检测方法 | |
CN110135375A (zh) | 基于全局信息整合的多人姿态估计方法 | |
CN106778604B (zh) | 基于匹配卷积神经网络的行人再识别方法 | |
CN109948425A (zh) | 一种结构感知自注意和在线实例聚合匹配的行人搜索方法及装置 | |
CN110147743A (zh) | 一种复杂场景下的实时在线行人分析与计数系统及方法 | |
CN109559320A (zh) | 基于空洞卷积深度神经网络实现视觉slam语义建图功能的方法及系统 | |
CN104933755B (zh) | 一种静态物体重建方法和系统 | |
CN111325111A (zh) | 一种融合逆注意力和多尺度深度监督的行人重识别方法 | |
CN105869178B (zh) | 一种基于多尺度组合特征凸优化的复杂目标动态场景无监督分割方法 | |
CN109344821A (zh) | 基于特征融合和深度学习的小目标检测方法 | |
CN110533640A (zh) | 基于改进YOLOv3网络模型的轨道线路病害辨识方法 | |
CN109800629A (zh) | 一种基于卷积神经网络的遥感图像目标检测方法 | |
CN106683091A (zh) | 一种基于深度卷积神经网络的目标分类及姿态检测方法 | |
CN109934862A (zh) | 一种点线特征结合的双目视觉slam方法 | |
CN111368769B (zh) | 基于改进锚点框生成模型的船舶多目标检测方法 | |
CN108334847A (zh) | 一种真实场景下的基于深度学习的人脸识别方法 | |
CN102509104B (zh) | 基于置信度图的增强现实场景虚拟对象判别和检测方法 | |
CN107038422A (zh) | 基于空间几何约束深度学习的疲劳状态识别方法 | |
CN110322453A (zh) | 基于位置注意力和辅助网络的3d点云语义分割方法 | |
CN110378997A (zh) | 一种基于orb-slam2的动态场景建图与定位方法 | |
CN110197152A (zh) | 一种用于自动驾驶系统的道路目标识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180508 Address after: 102308 room 3, building 3, Yongan Road, Shilong Economic Development Zone, Mentougou, Beijing, A-6193 Applicant after: Sino Science (Beijing) science and Technology Co., Ltd. Address before: 100080 No. 95 East Zhongguancun Road, Beijing, Haidian District Applicant before: Institute of Automation, Chinese Academy of Sciences |
|
GR01 | Patent grant | ||
GR01 | Patent grant |