CN109902631B - 一种基于图像金字塔的快速人脸检测方法 - Google Patents

一种基于图像金字塔的快速人脸检测方法 Download PDF

Info

Publication number
CN109902631B
CN109902631B CN201910157381.7A CN201910157381A CN109902631B CN 109902631 B CN109902631 B CN 109902631B CN 201910157381 A CN201910157381 A CN 201910157381A CN 109902631 B CN109902631 B CN 109902631B
Authority
CN
China
Prior art keywords
scale
image
sub
feature map
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910157381.7A
Other languages
English (en)
Other versions
CN109902631A (zh
Inventor
安玉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunhe Interactive Information Technology Co ltd
Original Assignee
Beijing Shizhen Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shizhen Intelligent Technology Co ltd filed Critical Beijing Shizhen Intelligent Technology Co ltd
Priority to CN201910157381.7A priority Critical patent/CN109902631B/zh
Publication of CN109902631A publication Critical patent/CN109902631A/zh
Application granted granted Critical
Publication of CN109902631B publication Critical patent/CN109902631B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种基于图像金字塔的快速人脸检测方法,所述方法包括:将待检测图片构建图像金字塔;选取图像金字塔中子图像输入至预设的尺度感知预测网络;根据人脸关键点信息生成尺度预测特征图Fi;对尺度预测特征图进行最大池化操作生成尺度预测向量Si;对尺度预测向量Fi进行非极大值抑制操作获取目标概率值,根据预设定的概率阈值,选择目标概率值高于概率阈值的相应尺度的子图像进行人脸检测操作,实现在人脸检测时无需对全部尺寸范围的图像进行检测,只需要从图像金字塔中挑选有效尺度范围的图像进行检测即可,极大的减少了需要进行人脸检测处理的图像的数量,有效地降低了计算量,提高了检测速度和准确度。

Description

一种基于图像金字塔的快速人脸检测方法
技术领域
本发明实施例涉及计算机视觉处理技术领域,具体涉及一种基于图像金字塔的快速人脸检测方法。
背景技术
随着人脸对齐、人脸识别以及人脸跟踪技术的发展,人脸检测技术也受到广泛关注,人脸检测技术是指对于任意一幅给定的图像,采用一定的策略对其进行搜索以确定其中是否含有人脸,如果是则返回一脸的位置、大小和姿态的技术。在实际应用时,要求人脸检测器能够实时的应对人脸不同尺度、姿态与外形的变化,但是一般的基于神经网络的人脸检测方法缺乏应对大尺度人脸变化的内在处理机制。
受通用物体检测领域的影响,一些基于特征金字塔的诸如SSD、RetinaNet等方法被提出以应对检测目标大尺度的变化,金字塔的每一层特征包含了不同的语义特征与尺度特征,可以方便的应用于人脸检测,这种特征金字塔的机制在人脸检测中取得了较大的突破,其在参数充足的情况下能够较好的应对尺度变化。SNIP方法已经验证,卷积神经网络对于尺度的变化是不具有鲁棒性的,检测器需要对不同尺度的目标都要训练一个滤波器,因此同时应对所有目标尺度的检测器是较为困难的。在实际应用中,有限的计算量极大地限制了检测器的检测能力和速度,因此多尺度检测器在处理大规模尺度变化时由于参数不足而更加困难。
发明内容
为此,本发明实施例提供一种基于图像金字塔的快速人脸检测方法,以解决现有的人脸检测方法在对多尺度目标检测时任务计算量大、耗时大、准确度有限、检测速度慢的问题。
为了实现上述目的,本发明实施例提供如下技术方案:一种基于图像金字塔的快速人脸检测方法,所述方法包括:
将待检测图片构建图像金字塔,所述图像金字塔中包含不同尺度子图像;
选取所述图像金字塔中子图像输入至预设的尺度感知预测网络;
根据人脸关键点信息生成尺度预测特征图Fi
对所述尺度预测特征图Fi进行最大池化操作生成尺度预测向量Si,所述尺度预测向量Si中的值表示相应尺度下目标的存在概率;
对所述尺度预测向量Si进行非极大值抑制操作获取目标概率值,根据预设定的概率阈值,选择目标概率值高于所述概率阈值的相应尺度的子图像进行人脸检测操作。
优选的,所述方法还包括:
选取所述图像金字塔中中间尺度子图像输入至所述尺度感知预测网络;
根据人脸关键点信息生成中间尺度的尺度预测特征图;
根据中间尺度的尺度预测特征图通过预设的语义信息转化网络生成不同尺度的尺度预测特征图。
优选的,所述根据人脸关键点信息生成尺度预测特征图包括:
通过Pi(t)={p1(t)=(xt1,yt1),p2(t)=(xt2,yt2),p3(t)=(xt3,yt3)}表示人脸关键点坐标信息集合,其中p1(t)、p2(t)、p3(t)分别表示人脸的左眼、右眼和鼻子三个关键点的坐标,对于左眼和右眼关键点,尺度预测特征图Fi上的每个点都通过如下原则分配数值大小:
Figure GDA0002012459570000021
其中Ns表示网络的步长;
对于鼻子关键点p3(t),采用曼哈顿距离dm对尺度预测特征图Fi上的数值进行分配:
Nt(t)={(x,y)|dm((x,y),(xl3,xl3))≤r};
Figure GDA0002012459570000031
Figure GDA0002012459570000032
优选的,所述对所述尺度预测特征图进行最大池化操作生成尺度预测向量包括:
当输入子图像大小为224×224,尺度感知预测网络通过1x1的卷积生成60张尺度预测特征图Fi,对尺度预测特征图的每个通道上做最大池化生成含有60个值的尺度预测向量Si,尺度预测向量Si中的每个值均表示相应尺度下目标的存在概率;
尺度预测向量Si和所输入图像的目标框位置信息的映射关系表示为:
Figure GDA0002012459570000033
Figure GDA0002012459570000034
Si(k(t))=1;
其中t∈[0,T],T表示输入子图像中目标的数量,(xlt,ylt)、(xrd,yrd)分别为所输入图像的目标框的左上角和右下角的坐标,当输入子图像的长边为2048时,将(32,2048]范围内的目标尺度编码生成尺度预测向量Si
优选的,所述图像金字塔表示为:
Figure GDA0002012459570000035
其中N表示图像金字塔的尺度等级,I1是金字塔中尺度最大的子图像,长边大小为2048,
Figure GDA0002012459570000036
是I1经一系列降采样生成的不同尺度的子图像,不同尺度子图像集合共同组成了图像金字塔。
优选的,所述根据所述中间尺度的尺度预测特征图通过预设的语义信息转化网络生成不同尺度的尺度预测特征图包括:
所述语义信息转化网络包括上采样模块U(·)和下采样模块D(·),所述上采样模块U(·)和下采样模块D(·)均为一系列带批量归一化的卷积,卷积步长均为2,所述上采样模块U(.)用于估计图像金字塔中尺度为所输入子图像尺度的2倍的子图像的尺度预测特征图,所述下采样模块D(·)用于估计图像金字塔中尺度为所输入子图像尺度的
Figure GDA0002012459570000041
的子图像的尺度预测特征图;
fs4(·),fs8(·),fs16(·)分别表示在步长Ns为4、8、16时网络中间输出的尺度预测特征图,图像金字塔中尺度为所输入图像尺度的
Figure GDA0002012459570000042
的图像的尺度预测特征图表示为:
Figure GDA0002012459570000043
Figure GDA0002012459570000044
Figure GDA0002012459570000045
由此,所述上采样模块和下采样模块表示为:
Figure GDA0002012459570000046
Figure GDA0002012459570000047
其中M∈[1,N],表示语义信息转化网络选用的中间尺度等级,wU和wD分别表示上采样模块和下采样模块中的参数。
优选的,所述方法还包括:
通过交叉熵损失函数对尺度感知预测网络对尺度预测特征图和尺度预测向量的学习进行训练,定义如下:
Figure GDA0002012459570000048
其中Fn表示网络的监督样本,
Figure GDA0002012459570000049
表示网络的输出。
优选的,所述方法还包括:
采用L2 loss作为损失函数对所述语义信息转化网络进行训练优化,定义如下:
Figure GDA0002012459570000051
其中N为尺度预测特征图F中的像素数量,F是输入图像通过前向网络生成的尺度预测特征图,
Figure GDA0002012459570000052
是经语义信息转化网络生成的相应尺度的尺度预测特征图。
本发明实施例具有如下优点:
本发明实施例提出的一种基于图像金字塔的快速人脸检测方法,采用图像金字塔和卷积神经网络技术,通过将不同尺度图像的尺度信息编码生成尺度预测特征向量,得到不同尺度图像中目标存在的概率分布,根据目标概率值选取一定尺度范围的图像进行人脸检测,由此实现在人脸检测时无需对全部尺寸范围的图像进行检测,只需要从图像金字塔中挑选有效尺度范围的图像进行检测即可,极大的减少了需要进行人脸检测处理的图像的数量,有效地降低了计算量,提高了检测速度和准确度。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能生成的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
图1为本发明实施例1提供的一种基于图像金字塔的快速人脸检测方法的流程示意图。
图2为本发明实施例1提供的一种基于图像金字塔的快速人脸检测方法的语义信息转化流程示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,本实施例提出了一种基于图像金字塔的快速人脸检测方法,该方法包括:
S100、将待检测图片构建图像金字塔,图像金字塔中包含不同尺度子图像。
图像金字塔表示为:
Figure GDA0002012459570000061
其中N表示图像金字塔的尺度等级,本实施例中,N默认为4,I1是金字塔中尺度最大的子图像,长边大小为2048,
Figure GDA0002012459570000062
是I1经一系列降采样生成的不同尺度的子图像,不同尺度子图像集合共同组成了图像金字塔。
S200、选取图像金字塔中子图像输入至预设的尺度感知预测网络。本实施例的尺度感知预测网络基于卷积神经网络,通过一定的网络设计来让网络学习到目标尺度的信息。
S300、根据人脸关键点信息生成尺度预测特征图Fi。为了使尺度感知预测网络对不同尺度范围的目标更加鲁棒,本实施例使用人脸关键点信息去引导网络学习尺度对应的尺度预测特征图Fi
具体的,根据人脸关键点信息生成尺度预测特征图包括:
通过Pi(t)={p1(t)=(xt1,yt1),p2(t)=(xt2,yt2),P3(t)=(xt3,yt3)}表示人脸关键点坐标信息集合,其中p1(t)、p2(t)、p3(t)分别表示人脸的左眼、右眼和鼻子三个关键点的坐标,对于左眼和右眼关键点,尺度预测特征图Fi上的每个点都通过如下原则分配数值大小:
Figure GDA0002012459570000071
其中Ns表示网络的步长;
对于鼻子关键点p3(t),采用曼哈顿距离dm对尺度预测特征图Fi上的数值进行分配:
Nt(t)={(x,y)|dm((x,y),(xl3,xl3))≤r};
Figure GDA0002012459570000072
Figure GDA0002012459570000073
S400、对尺度预测特征图进行最大池化操作生成尺度预测向量Si,尺度预测向量中的值表示相应尺度下目标的存在概率。
具体的,对尺度预测特征图进行最大池化操作生成尺度预测向量包括:
输入子图像大小为224×224,尺度感知预测网络在最后通过1x1的卷积生成60张尺度预测特征图Fi,对尺度预测特征图的每个通道上做最大池化生成含有60个值的尺度预测向量Si,尺度预测向量Si中的每个值均表示相应尺度下目标的存在概率;
尺度预测向量Si和所输入图像的目标框位置信息的映射关系表示为:
Figure GDA0002012459570000074
Figure GDA0002012459570000075
Si(k(t))=1;
其中t∈[0,T],T表示输入子图像中目标的数量,(xlt,ylt)、(xrd,yrd)分别为所输入图像的目标框的左上角和右下角的坐标,当输入子图像的长边为2048时,将(32,2048]范围内的目标尺度编码生成尺度预测向量Si
在训练过程,通过交叉熵损失函数对尺度感知预测网络对尺度预测特征图和尺度预测向量的学习进行训练,定义如下:
Figure GDA0002012459570000076
其中Fn表示网络的监督样本,
Figure GDA0002012459570000077
表示网络的输出。
S500、对尺度预测向量进行非极大值抑制操作获取目标概率值,根据预设定的概率阈值,选择目标概率值高于概率阈值的相应尺度的子图像进行人脸检测操作。由此,尺度感知预测网络可以从图像金字塔中挑选有效尺度的图像进行人脸检测,而无需对全部尺度图片进行检测,极大地减少了需要人脸检测处理的图片的数量。
虽然尺度感知预测网络可以从图像金字塔中挑选有效尺度范围的图像进行人脸检测,但是网络仍然需要重复处理一张待检测图片多次,即需要对图像金字塔中不同尺度的图像进行处理以生成不同尺度的尺度预测特征图,为了进一步加快检测速度,本实施例还设置了语义信息转化网络,可以通过语义信息转化网络将中间尺度的尺度预测特征图转化为其他不同尺度的图像的尺度预测特征图,从而避免了网络对图像金字塔中所有尺度图像进行处理,进一步极大的加快了网络检测速度,如图2所示,具体包括:
S600、选取图像金字塔中中间尺度子图像输入至尺度感知预测网络。
S700、根据人脸关键点信息生成中间尺度的尺度预测特征图。
S800、根据中间尺度的尺度预测特征图通过预设的语义信息转化网络生成不同尺度的尺度预测特征图。
具体的,根据中间尺度的尺度预测特征图通过预设的语义信息转化网络生成不同尺度的尺度预测特征图包括:
语义信息转化网络包括上采样模块U(·)和下采样模块D(·),上采样模块U(·)和下采样模块D(·)均为一系列带批量归一化的卷积,卷积步长均为2,上采样模块U(·)用于估计图像金字塔中尺度为所输入子图像尺度的2倍的子图像的尺度预测特征图,下采样模块D(·)用于估计图像金字塔中尺度为所输入子图像尺度的
Figure GDA0002012459570000081
的子图像的尺度预测特征图。
优选的,采用L2loss作为损失函数对语义信息转化网络进行训练优化,定义如下:
Figure GDA0002012459570000082
其中N为尺度预测特征图F中的像素数量,F是输入图像通过前向网络生成的尺度预测特征图,
Figure GDA0002012459570000083
是经语义信息转化网络生成的相应尺度的尺度预测特征图。
fs4(·),fs8(·),fs16(·)分别表示在步长Ns为4、8、16时网络中间输出的尺度预测特征图,图像金字塔中尺度为所输入图像尺度的
Figure GDA0002012459570000091
的图像的尺度预测特征图表示为:
Figure GDA0002012459570000092
Figure GDA0002012459570000093
Figure GDA0002012459570000094
由此,上采样模块和下采样模块表示为:
Figure GDA0002012459570000095
Figure GDA0002012459570000096
其中M∈[1,N],表示语义信息转化网络选用的中间尺度等级,wU和wD分别表示上采样模块和下采样模块中的参数。
在检测阶段,图像金字塔中中间尺度的图像
Figure GDA0002012459570000097
被用于计算前向特征图,然后通过下采样模块D(·)和上采样模U(·)生成
Figure GDA0002012459570000098
Figure GDA0002012459570000099
最后这些特征图可以用于检测不同尺度范围的图像。
通过语义信息转化网络的设置,基于语义信息流,可以将中间尺度的尺度预测特征图转化为其他不同尺度的图像对应的尺度预测特征图,通过单一尺度语义信息预测其他尺度语义信息,只需要基于中间尺度的尺度预测特征图即可,相比于一般的需要对图像金字塔中所有尺度图像进行处理得到特征图,进一步大大减少了网络处理过程中的图像处理量,避免了检测器反复输入图像带来的计算损失,有效减少了计算消耗,加快了检测速度,提高了准确度。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (7)

1.一种基于图像金字塔的快速人脸检测方法,其特征在于,所述方法包括:
将待检测图片构建图像金字塔,所述图像金字塔中包含不同尺度子图像;
选取所述图像金字塔中子图像输入至预设的尺度感知预测网络;
根据人脸关键点信息生成尺度预测特征图Fi
对所述尺度预测特征图Fi进行最大池化操作生成尺度预测向量Si,所述尺度预测向量Si中的值表示相应尺度下目标的存在概率;
对所述尺度预测向量Si进行非极大值抑制操作获取目标概率值,根据预设定的概率阈值,选择目标概率值高于所述概率阈值的相应尺度的子图像进行人脸检测操作;
所述根据人脸关键点信息生成尺度预测特征图包括:
通过Pi(t)={p1(t)=(xt1,yt1),p2(t)=(xt2,yt2),p3(t)=(xt3,yt3)}表示人脸关键点坐标信息集合,其中p1(t)、p2(t)、p3(t)分别表示人脸的左眼、右眼和鼻子三个关键点的坐标,对于左眼和右眼关键点,尺度预测特征图Fi上的每个点都通过如下原则分配数值大小:
Figure FDA0002892719200000011
其中Ns表示网络的步长,k(t)表示尺度预测特征图Fi的通道序号;
对于鼻子关键点p3(t),采用曼哈顿距离dm对尺度预测特征图Fi上的数值进行分配:
Ni(t)={(x,y)|dm((x,y),(xt3,xt3))≤r};
Figure FDA0002892719200000012
Figure FDA0002892719200000013
其中,Ni(t)表示满足与鼻子关键点曼哈顿距离dm≤预设半径r的临近坐标点集合。
2.根据权利要求1所述的一种基于图像金字塔的快速人脸检测方法,其特征在于,所述方法还包括:
选取所述图像金字塔中中间尺度子图像输入至所述尺度感知预测网络;
根据人脸关键点信息生成中间尺度的尺度预测特征图;
根据中间尺度的尺度预测特征图通过预设的语义信息转化网络生成不同尺度的尺度预测特征图。
3.根据权利要求1所述的一种基于图像金字塔的快速人脸检测方法,其特征在于,所述对所述尺度预测特征图进行最大池化操作生成尺度预测向量包括:
当输入子图像大小为224×224,尺度感知预测网络通过1x1的卷积生成60张尺度预测特征图Fi,对尺度预测特征图的每个通道上做最大池化生成含有60个值的尺度预测向量Si,尺度预测向量Si中的每个值均表示相应尺度下目标的存在概率;
尺度预测向量Si和所输入图像的目标框位置信息的映射关系表示为:
Figure FDA0002892719200000021
Figure FDA0002892719200000022
Si(k(t))=1;
其中t∈[0,T],T表示输入子图像中目标的数量,(xlt,ylt)、(xrd,yrd)分别为所输入图像的目标框的左上角和右下角的坐标,k(t)表示尺度预测特征图的通道序号,Lmax代表输入子图像的长边像素,当输入子图像的长边为2048时,将(32,2048]范围内的目标尺度编码生成尺度预测向量Si
4.根据权利要求1所述的一种基于图像金字塔的快速人脸检测方法,其特征在于,所述图像金字塔表示为:
Figure FDA0002892719200000023
其中N表示图像金字塔的尺度等级,I1是金字塔中尺度最大的子图像,长边大小为2048,
Figure FDA0002892719200000024
是I1经一系列降采样生成的不同尺度的子图像,不同尺度子图像集合共同组成了图像金字塔。
5.根据权利要求2所述的一种基于图像金字塔的快速人脸检测方法,其特征在于,所述根据所述中间尺度的尺度预测特征图通过预设的语义信息转化网络生成不同尺度的尺度预测特征图包括:
所述语义信息转化网络包括上采样模块U(·)和下采样模块D(·),所述上采样模块U(·)和下采样模块D(·)均为一系列带批量归一化的卷积,卷积步长均为2,所述上采样模块U(·)用于估计图像金字塔中尺度为所输入子图像尺度的2倍的子图像的尺度预测特征图,所述下采样模块D(·)用于估计图像金字塔中尺度为所输入子图像尺度的
Figure FDA0002892719200000031
的子图像的尺度预测特征图,其中n∈[1,N];
fs4(·),fs8(·),fs16(·)分别表示在步长Ns为4、8、16时网络中间输出的尺度预测特征图,图像金字塔中尺度为所输入图像尺度的
Figure FDA0002892719200000032
的图像的尺度预测特征图表示为:
Figure FDA0002892719200000033
Figure FDA0002892719200000034
Figure FDA0002892719200000035
由此,所述上采样模块和下采样模块表示为:
Figure FDA0002892719200000036
Figure FDA0002892719200000037
其中M∈[1,N],表示语义信息转化网络选用的中间尺度等级,wU和wD分别表示上采样模块和下采样模块中的参数。
6.根据权利要求1所述的一种基于图像金字塔的快速人脸检测方法,其特征在于,所述方法还包括:
通过交叉熵损失函数对尺度感知预测网络对尺度预测特征图和尺度预测向量的学习进行训练,定义如下:
Figure FDA0002892719200000041
其中Fn表示网络的监督样本,
Figure FDA0002892719200000042
表示网络的输出。
7.根据权利要求2所述的一种基于图像金字塔的快速人脸检测方法,其特征在于,所述方法还包括:
采用L2 loss作为损失函数对所述语义信息转化网络进行训练优化,定义如下:
Figure FDA0002892719200000043
其中N为尺度预测特征图F中的像素数量,F是输入图像通过前向网络生成的尺度预测特征图,
Figure FDA0002892719200000044
是经语义信息转化网络生成的相应尺度的尺度预测特征图。
CN201910157381.7A 2019-03-01 2019-03-01 一种基于图像金字塔的快速人脸检测方法 Active CN109902631B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910157381.7A CN109902631B (zh) 2019-03-01 2019-03-01 一种基于图像金字塔的快速人脸检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910157381.7A CN109902631B (zh) 2019-03-01 2019-03-01 一种基于图像金字塔的快速人脸检测方法

Publications (2)

Publication Number Publication Date
CN109902631A CN109902631A (zh) 2019-06-18
CN109902631B true CN109902631B (zh) 2021-02-26

Family

ID=66946110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910157381.7A Active CN109902631B (zh) 2019-03-01 2019-03-01 一种基于图像金字塔的快速人脸检测方法

Country Status (1)

Country Link
CN (1) CN109902631B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110533000A (zh) * 2019-09-06 2019-12-03 厦门美图之家科技有限公司 人脸图像检测方法、装置、计算机设备和可读存储介质
CN110717424B (zh) * 2019-09-26 2023-06-30 南昌大学 一种基于预处理机制的实时极小人脸检测方法
CN112616023A (zh) * 2020-12-22 2021-04-06 荆门汇易佳信息科技有限公司 复杂环境下的多摄像机视频目标追踪方法
CN113344877A (zh) * 2021-06-08 2021-09-03 武汉工程大学 基于卷积神经网络的钢筋模型训练方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512638A (zh) * 2015-12-24 2016-04-20 黄江 一种基于融合特征的人脸检测与对齐方法
CN109241835A (zh) * 2018-07-27 2019-01-18 上海商汤智能科技有限公司 图像处理方法及装置、电子设备和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184278B (zh) * 2015-09-30 2017-04-26 深圳市商汤科技有限公司 一种人脸检测方法和装置
US10354362B2 (en) * 2016-09-08 2019-07-16 Carnegie Mellon University Methods and software for detecting objects in images using a multiscale fast region-based convolutional neural network
CN107871101A (zh) * 2016-09-23 2018-04-03 北京眼神科技有限公司 一种人脸检测方法及装置
CN106778773B (zh) * 2016-11-23 2020-06-02 北京小米移动软件有限公司 图片中目标物的定位方法及装置
US10262237B2 (en) * 2016-12-08 2019-04-16 Intel Corporation Technologies for improved object detection accuracy with multi-scale representation and training
CN107194341B (zh) * 2017-05-16 2020-04-21 西安电子科技大学 Maxout多卷积神经网络融合人脸识别方法和系统
CN107563350A (zh) * 2017-09-21 2018-01-09 深圳市唯特视科技有限公司 一种基于尺度建议网络的人脸检测方法
CN107886074B (zh) * 2017-11-13 2020-05-19 苏州科达科技股份有限公司 一种人脸检测方法以及人脸检测系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512638A (zh) * 2015-12-24 2016-04-20 黄江 一种基于融合特征的人脸检测与对齐方法
CN109241835A (zh) * 2018-07-27 2019-01-18 上海商汤智能科技有限公司 图像处理方法及装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN109902631A (zh) 2019-06-18

Similar Documents

Publication Publication Date Title
CN109902631B (zh) 一种基于图像金字塔的快速人脸检测方法
CN110458095B (zh) 一种有效手势的识别方法、控制方法、装置和电子设备
CN106845487B (zh) 一种端到端的车牌识别方法
WO2021249255A1 (zh) 一种基于RP-ResNet网络的抓取检测方法
CN111062263B (zh) 手部姿态估计的方法、设备、计算机设备和存储介质
CN111507222B (zh) 一种基于多源数据知识迁移的三维物体检测框架
CN112966659B (zh) 一种基于深度学习的视频图像小目标检测方法
WO2021098802A1 (en) Object detection device, method, and systerm
CN115147488B (zh) 一种基于密集预测的工件位姿估计方法与抓取系统
CN113487610B (zh) 疱疹图像识别方法、装置、计算机设备和存储介质
CN112651423A (zh) 一种智能视觉系统
CN114594461A (zh) 基于注意力感知与缩放因子剪枝的声呐目标检测方法
CN111914756A (zh) 一种视频数据处理方法和装置
CN110310305A (zh) 一种基于bssd检测与卡尔曼滤波的目标跟踪方法与装置
CN111709268A (zh) 一种深度图像中的基于人手结构指导的人手姿态估计方法和装置
CN111368637B (zh) 一种基于多掩模卷积神经网络的搬运机器人识别目标方法
CN115147418A (zh) 缺陷检测模型的压缩训练方法和装置
CN113243886B (zh) 一种基于深度学习的视力检测系统、方法和存储介质
CN112800932B (zh) 海上背景下显著船舶目标的检测方法及电子设备
CN117058235A (zh) 跨多种室内场景的视觉定位方法
CN114998701B (zh) 基于像素特征匹配的目标检测损失优化方法
CN116229584A (zh) 一种人工智能领域的文本分割识别方法、系统、设备及介质
CN115170456A (zh) 检测方法及相关设备
Liu et al. UnitModule: A lightweight joint image enhancement module for underwater object detection
CN116958774B (zh) 一种基于自适应空间特征融合的目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230111

Address after: 406A, Floor 4, Building 1, No. 25, North Taipingzhuang Road, Haidian District, Beijing, 100088

Patentee after: BEIJING YUNHE INTERACTIVE INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 100039 No.106, 1st floor, building 14, yard B, Yongding Road, Haidian District, Beijing

Patentee before: BEIJING SHIZHEN INTELLIGENT TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right