CN109359555A - 一种高精度的人脸快速检测方法 - Google Patents
一种高精度的人脸快速检测方法 Download PDFInfo
- Publication number
- CN109359555A CN109359555A CN201811107210.5A CN201811107210A CN109359555A CN 109359555 A CN109359555 A CN 109359555A CN 201811107210 A CN201811107210 A CN 201811107210A CN 109359555 A CN109359555 A CN 109359555A
- Authority
- CN
- China
- Prior art keywords
- layer
- network
- convolutional layer
- face
- convolutional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种高精度的人脸快速检测方法,涉及人脸识别技术领域,该方法通过设计快速消化卷积层和多尺度卷积层等轻量级的网络结构,结合新的锚点密集化策略,在保证检测速度的同时,提高面部识别准确度;同时通过调制因子结合标准的交叉熵损失重塑得到动态缩放交叉熵,从而构建得到全新的损失函数,处理极端前景背景类别失衡的问题,在保证检测速度的同时,进一步提高面部识别准确度,最终不仅可以实现在单个CPU上以65FPS的速度运行,而且显著提高了小脸部的召回率,充分满足了工程的需要。
Description
技术领域
本发明涉及人脸识别技术领域,尤其是一种高精度的人脸快速检测方法。
背景技术
随着人脸检测领域的不断发展,现代人脸检测方法大致可分为两类:一种是基于手工检测,另一种是基于CNN(Convolutional Neural Network,卷积神经网络)检测。
近年来,基于CNN的人脸探测器得到快速发展:Farfade在CNN功能之上使用增强功能进行人脸检测;Faceness训练了一系列CNN用于面部属性识别且能在部分遮挡的情况下实现检测;CascadeCNN开发了一种基于CNN的级联架构,具有强大的判别能力和高性能;UnitBox引入了一种新的交叉联合损失函数;CMS-RCNN在面部检测中使用faster RCNN和上下文信息;Convnet将CNN与3D人脸模型成功集成在了一个端到端的多任务学习框架中。尽管人脸检测已经取得巨大进步,但在实际工程中仍存在巨大挑战,例如在CPU上实现实时速度并且保持高性能是较为困难的。
发明内容
本发明人针对上述问题及技术需求,提出了一种高精度的人脸快速检测方法,本方法不仅可以加快检测速度,还可以提高小脸部的召回率,充分满了工程的需要。
本发明的技术方案如下:
一种高精度的人脸快速检测方法,该方法包括:
获取人脸图像训练样本;
构建人脸检测网络,人脸检测网络包括卷积神经网络和分类器,卷积神经网络包括快速消化卷积层以及多尺度卷积层,快速消化卷积层包括M个网络层,快速消化卷积层中的每个网络层的步幅均大于等于2;多尺度卷积层包括N个网络层,M和N均为整数;
将人脸图像训练样本输入卷积神经网络,通过卷积神经网络提取得到人脸图像训练样本的人脸特征映射图;
将人脸特征映射图输入分类器得到人脸图像训练样本的人脸检测结果,人脸检测结果包括人脸图像训练样本中的各个人脸候选框及对应的预测概率,预测概率是人脸候选框中的图像为人脸图像的概率;
根据预测概率和动态缩放交叉熵构建损失函数,动态缩放交叉熵包括基于预测概率的调制因子;
根据人脸检测结果计算损失函数的值,并根据损失函数的值训练人脸检测网络,并利用训练得到的人脸检测网络进行人脸检测。
其进一步的技术方案为,动态缩放交叉熵的计算方式为:FL(pt)=-αt(1-pt)γlog(pt),其中,pt是预测概率,(1-pt)γ是调制因子,γ为聚焦参数,αt是权重参数。
其进一步的技术方案为,快速消化卷积层包括第一卷积层和池化层,第一卷积层和池化层的步幅均为4,第一卷积层的内核尺寸为7*7,池化层的内核尺寸为5*5。
其进一步的技术方案为,快速消化卷积层还用于对输入的特征进行取反以提取输入的正负相位信息,实现相位先验。
其进一步的技术方案为,多尺度卷积层中包括N个尺度不同的网络层,N个网络层中包括K个目标网络层,1≤K<N,K个目标网络层具有不同的分辨率,通过卷积神经网络提取得到人脸图像训练样本的人脸特征映射图,包括:
通过快速消化卷积层缩小人脸图像训练样本的图像尺寸;
通过多尺度卷积层对尺寸处理后的人脸图像训练样本进行特征提取得到N层尺度不同的特征映射图,根据K个目标网络层对应的K层特征映射图得到人脸特征映射图。
其进一步的技术方案为,多尺度卷积层中包括7个网络层,7个网络层依次为第一Resnet模块、第二Resnet模块、第三Resnet模块、第二卷积层、第三卷积层、第四卷积层和第五卷积层,每个Resnet模块包括至少两个不同内核尺寸的卷积分支;7个网络层中包括3个目标网络层,3个目标网络层分别为第三Resnet模块、第三卷积层和第五卷积层为目标网络层,每个目标网络层上分别设置锚点。
其进一步的技术方案为,每个目标网络层的滤波器的中心点周围均匀平铺设置n2个锚点,锚点的尺寸越小,对应的n的值越大,n为正整数。
其进一步的技术方案为,锚点的纵横比为1:1,第三Resnet模块包括三个卷积分支,设置在第三Resnet模块的三个卷积分支上的锚点的尺寸分别为8、16和32像素,设置在第三卷积层上的锚点的尺寸为64像素,设置在第五卷积层上的锚点的尺寸为256像素。
本发明的有益技术效果是:
本申请公开了一种高精度的人脸快速检测方法,首先设计快速消化卷积层,通过设置大步幅缩小输入空间的大小,通过选择合适的内核尺寸并采用SoftMax激活函数,同时通过加入相位先验来哦移除冗余滤波器,最终在CPU上提高实时速度。然后设计了多尺度卷积层,通过设置多尺度滤波器和多种离散锚点达到对面部检测的多尺度化处理操作,并结合了新的锚点密集化策略,从而提高面部检测的召回率。最后,通过调制因子结合标准的交叉熵损失重塑得到动态缩放交叉熵,从而构建得到全新的损失函数,处理极端前景背景类别失衡的问题,在保证检测速度的同时,提高面部识别准确度。最终不仅可以实现在单个CPU上以65FPS的速度运行,而且显著提高了小脸部的召回率,提高检测准确度,充分满足了工程的需要。
附图说明
图1是本申请公开的高精度的人脸快速检测方法的流程示意图。
图2是Resnet模块的示意图。
图3是人脸检测网络对人脸图像训练样本进行人脸检测时的信息流向示意图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
本申请公开了一种高精度的人脸快速检测方法,该方法包括如下步骤,请参考图1示出的流程示意图:
一、获取人脸图像训练样本,人脸图像训练样本可以是AFW、PASCAL、FDDB人脸检测基准数据集中的样本,获取到的人脸图像训练样本中通常有人脸标注框。
二、构建人脸检测网络。人脸检测网络包括卷积神经网络和分类器,卷积神经网络包括快速消化卷积层以及多尺度卷积层。
其中,快速消化卷积层包括M个网络层,M为整数,快速消化卷积层中的每个网络层的步幅均大于等于2,以快速缩小图像尺寸。在本申请中,M=2,快速消化卷积层包括第一卷积层(Conv1)和池化层(Pool1),第一卷积层和池化层的步幅均为4,因此快速消化卷积层的总步幅为16,可使输入空间大小快速减少16倍。由于一个网络中前几层的内核尺寸较小时可以加速,内核尺寸较大时可以减轻空间大小变化带来的信息损失,因此分别为第一卷积层和池化层选择7*7和5*5的内核尺寸。快速消化卷积层中的激活函数采用SoftMax激活函数。同时,本申请中的快速消化卷积层还用于对输入的特征进行额外的取反以提取输入的正负相位信息,从而实现在网络中加入相位先验的目的,从而使滤波器的数量减半,减少输出通道的数量,从而提高速度。
多尺度卷积层包括N个网络层,N为整数,在本申请中,N=7,这7个网络层依次为第一Resnet模块(Resnet1)、第二Resnet模块(Resnet2)、第三Resnet模块(Resnet3)、第二卷积层(Conv2_1)、第三卷积层(Conv2_2)、第四卷积层(Conv3_1)和第五卷积层(Conv3_2)。本申请中的多尺度卷积层沿网络深度所在维度和网络宽度所在维度都进行了多尺度设计:
(1)、沿网络宽度所在维度的多尺度设计,为学习不同尺度的面部视觉模式,锚相关层的输出特征应该对应于各种尺寸的滤波器,这里的锚相关层是指设置锚点的目标网络层。每个Resnet模块包括至少两个不同内核尺寸的卷积分支,这些分支作为沿网络宽度所在维度的多尺度设计,能够丰富滤波器,Resnet模块的一种示意图请参考图2,其包括3个卷积分支,图2中的Conv表示卷积层、Pool表示池化层,各个卷积分支的内核尺寸不同,本申请不对图2中各个卷积分支的内核尺寸进行举例。
(2)、沿网络深度所在维度的多尺度设计,多尺度卷积层包括的N个网络层尺度不同,通常是尺度依次减小。N个网络层中包括K个设置有锚点的目标网络层,1≤K<N,在本申请中,这7个网络层中包括3个目标网络层,3个目标网络层分别为第三Resnet模块(Resnet3)、第三卷积层(Conv2_2)和第五卷积层(Conv3_2)为目标网络层,每个目标网络层上分别设置锚点,这三个目标网络层作为沿网络深度所在维度的多尺度设计,具有不同分辨率,从而可以自然地处理各种尺度的面部特征。
进一步的,本申请中的锚点为方形锚点,其纵横比为1:1,本申请中的第三Resnet模块(Resnet3)包括三个卷积分支,则设置在第三Resnet模块(Resnet3)上的锚点的尺寸分别为8、16和32像素,设置在第三卷积层上的锚点的尺寸为64像素,设置在第五卷积层上的锚点的尺寸为256像素。为了避免不同尺寸的锚点之间存在密度不平衡的问题,在每个目标网络层的滤波器的中心点周围均匀平铺设置n2个锚点,采用的锚点的尺寸越小,对应的n的值越大,n为正整数。也即对于尺寸较小的锚点,锚点密集多次,比如将32像素(也即32*32)的锚点固定4次,将64像素的锚点固定2次,这保证锚点的尺寸在不同尺度的图像上具有相同的密度,因此各种尺度的面部特征可以匹配几乎相同数量的锚点,避免面部较小时召回率较低。
本申请中的分类器基于sigmoid函数,通过sigmoid操作进行二元分类。
三、利用构建得到的人脸检测网络对人脸图像训练样本进行人脸检测,信息流向图请参考图3。在将人脸图像训练样本输入人脸检测网络后,卷积神经网络会对人脸图像训练样本进行特征提取,具体的:利用大步幅的快速消化卷积层快速缩小人脸图像训练样本的图像尺寸,尺寸处理后的人脸图像训练样本由多尺度卷积层中的N个网络层依次进行特征提取生成N层尺度不同的特征映射图,提取其中由K个目标网络层生成的K层特征映射图,对这K层特征映射图进行加权得到人脸特征映射图。将经过卷积神经网络提取到的人脸特征映射图输入分类器进行sigmoid操作,得到人脸图像训练样本的人脸检测结果,人脸检测结果包括人脸图像训练样本中的各个人脸候选框及对应的预测概率,每个人脸检测结果可以表示为(x1,y1,x2,y2,pt),其中,(x1,y1)和(x2,y2)分别为人脸候选框的对角线的坐标值,pt为该人脸候选框对应的预测概率,该预测概率pt是人脸候选框中的图像为人脸图像的概率。
四、构建损失函数。本申请首先重塑了标准的交叉熵损失,通过在标准的交叉熵损失中加入调制因子得到本申请中的动态缩放交叉熵,利用调制因子处理极端前景背景类别失衡问题,现有的二元分类的标准的交叉熵损失可以表示为:CE(pt)=-αtlog(pt),αt是权重参数,αt的取值根据实际情况决定,pt是预测概率。本申请在此基础上加入基于预测概率pt的调制因子,从而得到了本申请中的动态缩放交叉熵,表示为:FL(pt)=(1-pt)γCE(pt)=-αt(1-pt)γlog(pt),其中,(1-pt)γ即为调制因子,γ为聚焦参数,其可平滑调整示例的权重,当γ=0时,FL(pt)=CE(pt),随着γ增大,调制因子的作用增加,γ的实际取值根据需要选定。在得到动态缩放交叉熵后FL(pt),根据预测概率pt和动态缩放交叉熵FL(pt)构建损失函数,比如采用将两者直接相加的方式,或者采用将两者按照各自对应权重相加的方式等等,通过将预测概率pt和动态缩放交叉熵FL(pt)相结合,可以提高检测准确度。由本申请的损失函数的表达式可知,当分类错误且预测概率pt较小时,调制因子接近1,动态缩放交叉熵和损失函数基本不受影响;当分类正确且预测概率pt接近1时,该调制因子接近0,分类正确的例子的损失被降低。
五、利用损失函数训练人脸检测网络。在上述步骤中,已经构建得到了损失函数的表达式,也得到了人脸图像训练样本的人脸检测结果,将人脸检测结果代入损失函数的表达式中就能计算得到损失函数的值。以最小化损失函数为目标对人脸检测网络进行网络训练以训练得到人脸检测网络的网络参数,从而训练得到人脸检测网络。然后可以利用训练得到的人脸检测网络进行人脸检测。
在训练期间,算法需要输出大量的框(例如用于VGA分辨率的图像需要525个框)。因此,具体处理时首先通过0.05的置信度阈值过滤掉大多数框,在应用NMS之前确保只保留400个框。然后执行NMS,其中IOU重叠为0.3的框进行保留,确保保留前200个框。与最近基于CNN的人脸检测方法相比,本算法可以在CPU上以65FPS运行,且具有目前较为先进的精度。
申请人采用本申请公开的方法在AFW、PASCAL人脸和FDDB人脸检测基准数据集上进行全面评估,实验结果表明本算法的速度对面部数量是不变的,且可实现在单个CPU上以65FPS运行。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
Claims (8)
1.一种高精度的人脸快速检测方法,其特征在于,所述方法包括:
获取人脸图像训练样本;
构建人脸检测网络,所述人脸检测网络包括卷积神经网络和分类器,所述卷积神经网络包括快速消化卷积层以及多尺度卷积层,所述快速消化卷积层包括M个网络层,所述快速消化卷积层中的每个网络层的步幅均大于等于2;所述多尺度卷积层包括N个网络层,M和N均为整数;
将所述人脸图像训练样本输入所述卷积神经网络,通过所述卷积神经网络提取得到所述人脸图像训练样本的人脸特征映射图;
将所述人脸特征映射图输入所述分类器得到所述人脸图像训练样本的人脸检测结果,所述人脸检测结果包括所述人脸图像训练样本中的各个人脸候选框及对应的预测概率,所述预测概率是所述人脸候选框中的图像为人脸图像的概率;
根据预测概率和动态缩放交叉熵构建损失函数,所述动态缩放交叉熵包括基于所述预测概率的调制因子;
根据所述人脸检测结果计算损失函数的值,并根据所述损失函数的值训练所述人脸检测网络,并利用训练得到的所述人脸检测网络进行人脸检测。
2.根据权利要求1所述的方法,其特征在于,
所述动态缩放交叉熵的计算方式为:FL(pt)=-αt(1-pt)γlog(pt),其中,pt是所述预测概率,(1-pt)γ是调制因子,γ为聚焦参数,αt是权重参数。
3.根据权利要求1所述的方法,其特征在于,
所述快速消化卷积层包括第一卷积层和池化层,所述第一卷积层和所述池化层的步幅均为4,所述第一卷积层的内核尺寸为7*7,所述池化层的内核尺寸为5*5。
4.根据权利要求1所述的方法,其特征在于,所述快速消化卷积层还用于对输入的特征进行取反以提取输入的正负相位信息,实现相位先验。
5.根据权利要求1所述的方法,其特征在于,所述多尺度卷积层中包括N个尺度不同的网络层,所述N个网络层中包括K个目标网络层,1≤K<N,所述K个目标网络层具有不同的分辨率,所述通过所述卷积神经网络提取得到所述人脸图像训练样本的人脸特征映射图,包括:
通过所述快速消化卷积层缩小所述人脸图像训练样本的图像尺寸;
通过所述多尺度卷积层对尺寸处理后的所述人脸图像训练样本进行特征提取得到N层尺度不同的特征映射图,根据所述K个目标网络层对应的K层特征映射图得到所述人脸特征映射图。
6.根据权利要求5所述的方法,其特征在于,所述多尺度卷积层中包括7个网络层,所述7个网络层依次为第一Resnet模块、第二Resnet模块、第三Resnet模块、第二卷积层、第三卷积层、第四卷积层和第五卷积层,每个Resnet模块包括至少两个不同内核尺寸的卷积分支;所述7个网络层中包括3个目标网络层,所述3个目标网络层分别为所述第三Resnet模块、第三卷积层和第五卷积层为目标网络层,每个所述目标网络层上分别设置锚点。
7.根据权利要求6所述的方法,其特征在于,每个所述目标网络层的滤波器的中心点周围均匀平铺设置n2个锚点,所述锚点的尺寸越小,对应的n的值越大,n为正整数。
8.根据权利要求7所述的方法,其特征在于,所述锚点的纵横比为1:1,所述第三Resnet模块包括三个卷积分支,设置在所述第三Resnet模块的三个卷积分支上的锚点的尺寸分别为8、16和32像素,设置在所述第三卷积层上的锚点的尺寸为64像素,设置在所述第五卷积层上的锚点的尺寸为256像素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811107210.5A CN109359555A (zh) | 2018-09-21 | 2018-09-21 | 一种高精度的人脸快速检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811107210.5A CN109359555A (zh) | 2018-09-21 | 2018-09-21 | 一种高精度的人脸快速检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109359555A true CN109359555A (zh) | 2019-02-19 |
Family
ID=65351202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811107210.5A Withdrawn CN109359555A (zh) | 2018-09-21 | 2018-09-21 | 一种高精度的人脸快速检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109359555A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096964A (zh) * | 2019-04-08 | 2019-08-06 | 厦门美图之家科技有限公司 | 一种生成图像识别模型的方法 |
CN110096947A (zh) * | 2019-03-15 | 2019-08-06 | 昆明理工大学 | 一种基于深度学习的行人再识别算法 |
CN110188720A (zh) * | 2019-06-05 | 2019-08-30 | 上海云绅智能科技有限公司 | 一种基于卷积神经网络的目标检测方法及系统 |
CN110197113A (zh) * | 2019-03-28 | 2019-09-03 | 杰创智能科技股份有限公司 | 一种高精度锚点匹配策略的人脸检测方法 |
CN110334602A (zh) * | 2019-06-06 | 2019-10-15 | 武汉市公安局视频侦查支队 | 一种基于卷积神经网络的人流量统计方法 |
CN110674886A (zh) * | 2019-10-08 | 2020-01-10 | 中兴飞流信息科技有限公司 | 一种融合多层级特征的视频目标检测方法 |
CN110717387A (zh) * | 2019-09-02 | 2020-01-21 | 东南大学 | 一种基于无人机平台的实时车辆检测方法 |
CN111079707A (zh) * | 2019-12-31 | 2020-04-28 | 深圳云天励飞技术有限公司 | 人脸检测方法及相关装置 |
CN111738133A (zh) * | 2020-06-17 | 2020-10-02 | 北京奇艺世纪科技有限公司 | 模型训练方法、目标检测方法、装置、电子设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160034748A1 (en) * | 2014-07-29 | 2016-02-04 | Microsoft Corporation | Computerized Prominent Character Recognition in Videos |
CN106372581A (zh) * | 2016-08-25 | 2017-02-01 | 中国传媒大学 | 构建及训练人脸识别特征提取网络的方法 |
KR20170124686A (ko) * | 2016-05-02 | 2017-11-13 | 한국전자통신연구원 | 트랜잭션 레벨 모델 기반의 얼굴 검출 및 인식 모듈 |
CN108171196A (zh) * | 2018-01-09 | 2018-06-15 | 北京智芯原动科技有限公司 | 一种人脸检测方法及装置 |
-
2018
- 2018-09-21 CN CN201811107210.5A patent/CN109359555A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160034748A1 (en) * | 2014-07-29 | 2016-02-04 | Microsoft Corporation | Computerized Prominent Character Recognition in Videos |
KR20170124686A (ko) * | 2016-05-02 | 2017-11-13 | 한국전자통신연구원 | 트랜잭션 레벨 모델 기반의 얼굴 검출 및 인식 모듈 |
CN106372581A (zh) * | 2016-08-25 | 2017-02-01 | 中国传媒大学 | 构建及训练人脸识别特征提取网络的方法 |
CN108171196A (zh) * | 2018-01-09 | 2018-06-15 | 北京智芯原动科技有限公司 | 一种人脸检测方法及装置 |
Non-Patent Citations (3)
Title |
---|
SHIFENG ZHANG等: "FaceBoxes: A CPU Real-time Face Detector with High Accuracy", 《2017 IEEE INTERNATIONAL JOINT CONFERENCE ON BIOMETRICS》 * |
TSUNG-YI LIN等: "Focal Loss for Dense Object Detection", 《2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 * |
高志强等: "《深度学习 从入门到实战》", 30 June 2018, 中国铁道出版社 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096947A (zh) * | 2019-03-15 | 2019-08-06 | 昆明理工大学 | 一种基于深度学习的行人再识别算法 |
CN110197113A (zh) * | 2019-03-28 | 2019-09-03 | 杰创智能科技股份有限公司 | 一种高精度锚点匹配策略的人脸检测方法 |
CN110197113B (zh) * | 2019-03-28 | 2021-06-04 | 杰创智能科技股份有限公司 | 一种高精度锚点匹配策略的人脸检测方法 |
CN110096964B (zh) * | 2019-04-08 | 2021-05-04 | 厦门美图之家科技有限公司 | 一种生成图像识别模型的方法 |
CN110096964A (zh) * | 2019-04-08 | 2019-08-06 | 厦门美图之家科技有限公司 | 一种生成图像识别模型的方法 |
CN110188720A (zh) * | 2019-06-05 | 2019-08-30 | 上海云绅智能科技有限公司 | 一种基于卷积神经网络的目标检测方法及系统 |
CN110334602A (zh) * | 2019-06-06 | 2019-10-15 | 武汉市公安局视频侦查支队 | 一种基于卷积神经网络的人流量统计方法 |
CN110334602B (zh) * | 2019-06-06 | 2021-10-26 | 武汉市公安局视频侦查支队 | 一种基于卷积神经网络的人流量统计方法 |
CN110717387A (zh) * | 2019-09-02 | 2020-01-21 | 东南大学 | 一种基于无人机平台的实时车辆检测方法 |
CN110717387B (zh) * | 2019-09-02 | 2022-07-08 | 东南大学 | 一种基于无人机平台的实时车辆检测方法 |
CN110674886A (zh) * | 2019-10-08 | 2020-01-10 | 中兴飞流信息科技有限公司 | 一种融合多层级特征的视频目标检测方法 |
CN110674886B (zh) * | 2019-10-08 | 2022-11-25 | 中兴飞流信息科技有限公司 | 一种融合多层级特征的视频目标检测方法 |
CN111079707A (zh) * | 2019-12-31 | 2020-04-28 | 深圳云天励飞技术有限公司 | 人脸检测方法及相关装置 |
CN111738133A (zh) * | 2020-06-17 | 2020-10-02 | 北京奇艺世纪科技有限公司 | 模型训练方法、目标检测方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359555A (zh) | 一种高精度的人脸快速检测方法 | |
CN110533084A (zh) | 一种基于自注意力机制的多尺度目标检测方法 | |
CN107766839A (zh) | 基于神经网络的动作识别方法和装置 | |
CN107368845A (zh) | 一种基于优化候选区域的Faster R‑CNN目标检测方法 | |
CN106960206A (zh) | 字符识别方法和字符识别系统 | |
CN108346154A (zh) | 基于Mask-RCNN神经网络的肺结节分割装置的建立方法 | |
CN106909887A (zh) | 一种基于cnn和svm的动作识别方法 | |
CN108171196A (zh) | 一种人脸检测方法及装置 | |
CN104850818A (zh) | 人脸检测器训练方法、人脸检测方法及装置 | |
CN110532914A (zh) | 基于精细特征学习的建筑物检测方法 | |
CN110472628A (zh) | 一种基于视频特征的改进Faster R-CNN网络检测漂浮物方法 | |
CN109766873A (zh) | 一种混合可变形卷积的行人再识别方法 | |
CN110490188A (zh) | 一种基于ssd网络改进型的目标物体快速检测方法 | |
CN110472699A (zh) | 一种基于gan的电力场所有害生物运动模糊图像检测方法 | |
CN109272044A (zh) | 一种图像相似度确定方法、装置、设备及存储介质 | |
Yan et al. | A new two-stage object detection network without RoI-Pooling | |
Chen et al. | Irregular scene text detection via attention guided border labeling | |
CN110334775A (zh) | 一种基于宽度学习的无人机线路故障识别方法和装置 | |
CN109284667B (zh) | 一种面向视频的三流式人体运动行为空间域检测方法 | |
CN110298345A (zh) | 一种医学图像数据集的感兴趣区域自动标注方法 | |
Chen et al. | Headnet: pedestrian head detection utilizing body in context | |
Chen et al. | Fresh tea sprouts detection via image enhancement and fusion SSD | |
CN110009611A (zh) | 一种面向图像序列的视觉目标动态计数方法及系统 | |
Peng et al. | A face detection framework based on deep cascaded full convolutional neural networks | |
CN107545238A (zh) | 基于深度学习的煤矿井下行人检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190219 |