CN106874898A - 基于深度卷积神经网络模型的大规模人脸识别方法 - Google Patents

基于深度卷积神经网络模型的大规模人脸识别方法 Download PDF

Info

Publication number
CN106874898A
CN106874898A CN201710226292.4A CN201710226292A CN106874898A CN 106874898 A CN106874898 A CN 106874898A CN 201710226292 A CN201710226292 A CN 201710226292A CN 106874898 A CN106874898 A CN 106874898A
Authority
CN
China
Prior art keywords
layer
residual error
face
model
neural networks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710226292.4A
Other languages
English (en)
Other versions
CN106874898B (zh
Inventor
王展雄
邵蔚元
冯瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN201710226292.4A priority Critical patent/CN106874898B/zh
Publication of CN106874898A publication Critical patent/CN106874898A/zh
Application granted granted Critical
Publication of CN106874898B publication Critical patent/CN106874898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Abstract

本发明属于计算机视觉、人工智能技术领域,具体为一种基于深度卷积神经网络模型的大规模人脸识别方法。本发明首先提出面向大规模人脸识别的残差学习深度网络模型,该模型由卷积层、下采样层、残差层以及全连接层组成,其中残差层由两路数据(一路是若干个卷积层级联的数据和一路原始数据)相加求和构成,并且模型中每一个卷积层之后都做批量归一化操作。本发明利用深度卷积神经网络学习能力强和残差学习收敛好的特性,在网络模型层数方面,把模型的层数增加;在残差层结构方面,本发明提出一个高效的残差层结构。在面向大规模人脸识别领域,本发明较之基线模型在准确率方面得到了极大提升,在百万级人脸数据库中人脸检索的准确率达到了74.25%。

Description

基于深度卷积神经网络模型的大规模人脸识别方法
技术领域
本发明属于计算机视觉、人工智能技术领域,具体涉及大规模人脸识别方法。
背景技术
在当前机器学习技术及计算机硬件性能高速提升的情况下,近年来计算机视觉、自然语言处理和语音识别等应用领域取得了突破性进展。人脸识别作为计算机视觉领域一项基础的任务,其精度也得到了大幅提升。
在过去的几年当中,许多大型科技公司以及著名的研究机构提出了许多高效的人脸识别的方法,在行业内最著名的人脸评测集LFW上的准确率超过了99%。这样显著的成绩主要归功与两个方面:深度学习和海量数据。深度学习解决了人脸识别当中的特征表达的问题,相比传统的方法,能够更加全面地学习人脸的特征。海量的训练数据直接提升了人脸识别的精度。
在实际运用场景中,当需要识别的对象在百万量级的数据库当中,LFW评测集上表现接近完美的模型性能也大打折扣。MegaFace评测集是第一个百万级别的人脸评测数据集,更加接近现实生活。
目前提升人脸识别性能的方法主要有三种:
(1)增加训练数据;
(2)通过多任务学习的方式训练模型;
(3)利用度量学习找到更加合适的学习方法。
通过海量的数据训练能够提升人脸识别模型的性能,然而收集大量的人脸数据是一件极其困难的工作;训练多个模型,然后进行模型混合的方法会让人脸识别的过程变得过于复杂,不利于实际场景中的运用;度量学习对训练模型的技巧要求太高,而且模型的泛化能力不强。因此通过一种高效的深度卷积神经网络模型来提升人脸识别精度成为了一种新的有效的途径。
发明内容
本发明的目的在于提供一种基于深度卷积神经网络模型的大规模人脸识别方法,来提升人脸识别精度,以解决当前实际运用场景下大规模人脸识别困难的问题。
本发明首先提出一个全新的基于残差学习的深度卷积神经网络模型,此模型能够学习到更多的特征,更好地进行特征表达,更加适合大规模的人脸识别任务。
本发明提出的大规模人脸识别方法,采用上述基于残差学习的深度卷积神经网络模型,实现的硬件平台需要一张NVIDIA TITANX显卡。本发明首先对数据集图片进行预处理,然后训练深度卷积神经网络模型,最后通过深度卷积神经网络模型提取特征,利用特征向量计算相似度,实现人脸识别。具体包括3个过程:预处理图片、训练深度卷积神经网络模型、面向大规模人脸识别:
步骤1、预处理图片
(1)检测图片中的人脸;
(2)检测人脸中的5个关键点(两眼、鼻尖、两边嘴角);
(3)进行人脸对齐操作;
(4)将人脸图片大小归一化,例如把人脸图片大小归一化至112×96。
步骤2、训练深度卷积神经网络模型
(1)搭建基于残差学习的深度卷积神经网络模型;
(2)前向传播计算损失误差(SoftMax Loss);
(3)反向传播损失误差(SoftMax Loss)更新模型参数;
(4)获得训练好的深度卷积神经网络模型。
步骤3、大规模人脸识别
(1)测试图片通过深度卷积神经网络模型;
(2)提取特征向量;
(3)利用特征向量进行相似度计算;
(4)输出识别结果。
步骤2训练深度卷积神经网络模型,具体介绍如下:
(1)搭建本发明提出的基于残差学习的深度卷积神经网络模型:
本发明提出的模型由卷积层、下采样层、残差层以及全连接层组成,其中残差层由两路数据(一路是若干个卷积层级联的数据和一路原始数据)相加求和构成,并且网络结构中每一个卷积层之后都做批量归一化(Batch Normalization)操作;
具体的网络模型从输入层I开始,依次经过卷积层C1,卷积层C2,下采样层P1,残差层R1_1,残差层R1_2,残差层R1_3,卷积层C3,下采样层P2,残差层R2_1,残差层R2_2,残差层R2_3,残差层R2_4,卷积层C4,下采样层P3,残差层R3_1,残差层R3_2,残差层R3_3,残差层R3_4,残差层R3_5,残差层R3_6,卷积层C5,下采样层P4,残差层R4_1,残差层R4_2,残差层R4_3,最后到全连接层F1;
(2)用10575个人的49万张图片作为训练数据,分批次输入搭建好的网络模型;
(3)训练集图片通过模型,前向传播用全连接层参数计算损失误差(SoftMax Loss);
(4)将损失误差(SoftMax Loss)反向传播更新模型参数;
(5)获得训练好的深度卷积神经网络模型。
步骤3面向大规模人脸识别,具体介绍如下:
(1)将一百万张人脸图片作为测试数据,依次输入训练好的网络模型;
(2)取网络模型中全连接层的1024个参数作为人脸图片的特征向量;
(3)利用特征向量进行相似度计算;
(4)输出识别结果。
本发明方法的主要特点有:
(1)利用此模型在百万级别的人脸识别任务中取得了极好的效果;
(2)模型训练数据量少,仅使用不到50万张人脸图片作为训练数据;
(3)模型结构简单,不需要使用模型混合、多任务训练以及度量学习等方法。
本发明方法利用了深度卷积神经网络学习能力强和残差学习收敛好的特性,在百万级人脸数据库中检索人脸这项高难度的任务中取得很高的准确率。相比于传统的计算机视觉方法,本发明方法利用深度卷积神经网络结构,充分学习输入图片特征,更加完整地进行图片特征表达,大幅提升了人脸识别的精度,尤其是在百万级人脸识别任务中取得了优秀的成绩。并且不同于目前广泛运用的度量学习、模型混合和多任务学习的方法,本发明方法提出的深度卷积神经网络模型简单高效,有效解决了百万级人脸识别任务中准确率不高以及模型搭建复杂的问题。
在面向大规模人脸识别领域,本发明较之基线模型在准确率方面得到了极大提升,在百万级人脸数据库中人脸检索的准确率达到了74.25%。
附图说明
图1一种面向大规模人脸识别的残差学习深度网络模型流程图。
图2本发明提出的基于残差学习的深度卷积神经网络模型结构图。
图3残差层网络结构图。
具体实施方式
以下结合附图解释运用了本发明,基于残差学习的深度卷积神经网络模型在百万级别的人脸识别任务中的具体实施,实现的具体运算步骤如附图1所示。
1、预处理图片
首先利用图片处理工具MTCNN[19]检测图片中的人脸,然后利用MTCNN检测人脸中的5个关键点(两眼、鼻尖、两边嘴角),然后人脸对齐方法[20]进行人脸对齐操作,最后将处理过的图片大小归一化至112×96。
2、搭建本发明提出的基于残差学习的深度卷积神经网络模型
利用深度学习框架Caffe,搭建本发明提出的基于残差学习的深度卷积神经网络模型,如附图2所示。此模型由卷积层,下采样层,残差层以及全连接层组成,其中残差层由两路数据(一路是若干个卷积层级联的数据和一路原始数据)相加求和构成,如附图3所示,并且网络结构中每一个卷积层之后都做批量归一化(Batch Normalization)操作;
其中,输入层I大小为112×96×3,卷积层C1(卷积核大小为3×3,滑动步长为1,填充为0,输出为32),卷积层C2(卷积核大小为3×3,滑动步长为1,填充为0,输出为64),下采样层P1(最大池化,大小为2×2,滑动步长为2,输出为64),残差层R1_1(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为64)级联的数据和一路原始数据相加),残差层R1_2(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为64)级联的数据和一路原始数据相加),残差层R1_3(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为64)级联的数据和一路原始数据相加),卷积层C3(卷积核大小为3×3,滑动步长为1,填充为0,输出为128),下采样层P2(最大池化,大小为2×2,滑动步长为2,输出为128),残差层R2_1(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为128)级联的数据和一路原始数据相加),残差层R2_2(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为128)级联的数据和一路原始数据相加),残差层R2_3(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为128)级联的数据和一路原始数据相加),残差层R2_4(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为128)级联的数据和一路原始数据相加),卷积层C4(卷积核大小为3×3,滑动步长为1,填充为0,输出为256),下采样层P3(最大池化,大小为2×2,滑动步长为2,输出为256),残差层R3_1(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为256)级联的数据和一路原始数据相加),残差层R3_2(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为256)级联的数据和一路原始数据相加),残差层R3_3(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为256)级联的数据和一路原始数据相加),残差层R3_4(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为256)级联的数据和一路原始数据相加),残差层R3_5(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为256)级联的数据和一路原始数据相加),残差层R3_6(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为256)级联的数据和一路原始数据相加),卷积层C5(卷积核大小为3×3,滑动步长为1,填充为0,输出为512),下采样层P4(最大池化,大小为2×2,滑动步长为2,输出为512),残差层R4_1(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为512)级联的数据和一路原始数据相加),残差层R4_2(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为512)级联的数据和一路原始数据相加),残差层R4_3(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为512)级联的数据和一路原始数据相加),最后,全连接层F1(维度为1024)。
3、把训练数据输入搭建好的网络模型
用人脸数据集CASIA-WebFace作为训练数据,该数据集来自10575位名人的49万张图片。将训练集图片做水平翻转操作,以实现数据增强。训练数据分批次进入网络模型进行训练,每次进入网络模型的训练图片批次大小为64,一共迭代训练7万次。
4、训练集图片通过模型,用全连接层参数计算损失误差(SoftMax Loss)。
5、将计算得到的损失误差(SoftMax Loss)反向传播更新模型参数。
6、获得面向大规模人脸识别的残差学习深度网络模型。
7、在百万级人脸识别评测集MegaFace上进行测试。
利用MegaFace团队提供的测试代码,将一百万张人脸图片作为测试数据,依次输入训练好的基于残差学习的深度神经卷积网络模型,取模型中全连接层的1024个参数作为特征向量。对输入图片的特征向量计算余弦距离,把余弦距离按照大小排序,通过余弦距离的大小输出人脸识别结果。人脸识别首位准确率(Rank 1 Face Identificationaccuracy)为74.25%,处于当前国际领先水平,如下表1所示。
表1、本发明方法在MegaFace评测集上,人脸识别首位准确率与业内先进方法对比
参考文献
[1] Florian Schroff, Dmitry Kalenichenko, and JamesPhilbin, “Facenet: Aunified embedding for face recognition and clustering,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2015, pp. 815–823.
[2] Omkar M Parkhi, Andrea Vedaldi, and Andrew Zisserman, “Deep facerecognition,” in British Machine Vision Conference, 2015, vol. 1, p. 6.
[3] Yi Sun, Xiaogang Wang, and Xiaoou Tang, “Deeplearning facerepresentation by joint identificationverification,” arXiv preprint arXiv: 1406.4773, 2014.
[4] Gary B Huang, Manu Ramesh, Tamara Berg, and ErikLearned-Miller,“Labeled faces in the wild: A database for studying face recognition inunconstrained environments,” Tech. Rep., Technical Report 07-49, UniversityofMassachusetts, Amherst, 2007.
[5] Ira Kemelmacher-Shlizerman, Steven M Seitz, DanielMiller, and EvanBrossard, “The megaface benchmark:1 million faces for recognition at scale,”in Proceedingsof the IEEE Conference on Computer Vision and PatternRecognition, 2016.
[6] Yi Sun, Xiaogang Wang, and Xiaoou Tang, “Deep learning facerepresentation from predicting 10,000 classes,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2014, pp. 1891–1898.
[7] Iacopo Masi, Anh Tuan Tran, Jatuporn Toy Leksut, TalHassner, andGerard Medioni, “Do we really need tocollect millions of faces for effectiveface recognition,”arXiv preprint arXiv:1603.07057, 2016.
[8] Yandong Wen, Kaipeng Zhang, Zhifeng Li, andYu Qiao, “A discriminativefeature learning approachfor deep face recognition,” in European Conference onComputer Vision. Springer, 2016, pp. 499–515.
[9] Dong Yi, Zhen Lei, Shengcai Liao, and Stan Z Li,“Learning facerepresentation from scratch,” arXivpreprintarXiv:1411.7923, 2014.
[10] Dong Chen, Xudong Cao, Liwei Wang, Fang Wen, andJian Sun, “Bayesianface revisited: A joint formulation,”in European Conference on Computer Vision. Springer,2012, pp. 566–579.
[11] Brendan F Klare, Ben Klein, Emma Taborsky, AustinBlanton, JordanCheney, Kristen Allen, Patrick Grother,Alan Mah, Mark Burge, and Anil K Jain,“Pushing thefrontiers of unconstrained face detection and recognition: Iarpajanusbenchmark a,” in 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2015, pp. 1931–1939.
[12] Yandong Guo, Lei Zhang, Yuxiao Hu, Xiaodong He,and Jianfeng Gao,“Ms-celeb-1m: A dataset and benchmark forlarge-scale face recognition,” inEuropeanConference on Computer Vision. Springer, 2016, pp.87–102.
[13] Vinod Nair and Geoffrey E Hinton, “Rectified linearunits improverestricted boltzmann machines,” in Proceedings of the 27th International Conference on Machine Learning (ICML-10), 2010, pp. 807–814.
[14] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and JianSun, “Delving deepinto rectifiers: Surpassing humanlevel performance on imagenetclassification,” in Proceedings of the IEEE International Conference on Computer Vision, 2015, pp. 1026–1034.
[15] Sergey Ioffe and Christian Szegedy, “Batch normalization:Accelerating deep network training by reducing internal covariate shift,”arXiv preprint arXiv:1502.03167, 2015.
[16] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and JianSun, “Deep residuallearning for image recognition,”arXiv preprint arXiv:1512.03385, 2015.
[17] Bart Thomee, David A Shamma, Gerald Friedland, Benjamin Elizalde,Karl Ni, Douglas Poland, Damian Borth, and Li-Jia Li, “The new data and newchallenges in multimedia research,” arXiv preprint arXiv:1503.01817, vol. 1, no. 8, 2015.
[18] Hao Ye, Weiyuan Shao, Hong Wang, Jianqi Ma,Li Wang, Yingbin Zheng,and Xiangyang Xue, “Facerecognition via active annotation and learning,” inProceedings of the 2016 ACM on Multimedia Conference.ACM, 2016, pp. 1058–1062.
[19] Kaipeng Zhang, Zhanpeng Zhang, Zhifeng Li, andYu Qiao, “Joint facedetection and alignment usingmultitask cascaded convolutional networks,” IEEE Signal Processing Letters, vol. 23, no. 10, pp. 1499–1503,2016.
[20] Xiang Wu, Ran He, and Zhenan Sun, “A lightened cnnfor deep facerepresentation,” in 2015 IEEE Conference on IEEE Computer Vision and Pattern Recognition(CVPR), 2015.
[21] Yangqing Jia, Evan Shelhamer, Jeff Donahue, SergeyKarayev, JonathanLong, Ross Girshick, Sergio Guadarrama, and Trevor Darrell, “Caffe:Convolutional architecture for fast feature embedding,” in Proceedings ofthe 22nd ACM international conference on Multimedia.ACM, 2014, pp. 675–678.。

Claims (3)

1. 基于深度卷积神经网络模型的大规模人脸识别方法,其特征在于,采用基于残差学习的深度卷积神经网络模型,具体包括3个步骤:预处理图片、训练深度卷积神经网络模型、面向大规模人脸识别:
步骤1、预处理图片
(1)检测图片中的人脸;
(2)检测人脸中的5个关键点:两眼、鼻尖、两边嘴角;
(3)进行人脸对齐操作;
(4)将人脸图片大小归一化;
步骤2、训练深度卷积神经网络模型
(1)搭建基于残差学习的深度卷积神经网络模型;
(2)前向传播计算损失误差;
(3)反向传播损失误差更新模型参数;
(4)获得训练好的深度卷积神经网络模型;
步骤3、大规模人脸识别
(1)测试图片通过深度卷积神经网络模型;
(2)提取特征向量;
(3)利用特征向量进行相似度计算;
(4)输出识别结果。
2.根据权利要求1所述的大规模人脸识别方法,其特征在于,步骤2中所述基于残差学习的深度卷积神经网络模型,具体如下:
模型由卷积层、下采样层、残差层以及全连接层组成,其中,残差层由两路数据:一路是若干个卷积层级联的数据和一路原始数据相加求和构成;并且网络结构中每一个卷积层之后都做批量归一化操作;
具体的网络模型从输入层I开始,依次经过卷积层C1,卷积层C2,下采样层P1,残差层R1_1,残差层R1_2,残差层R1_3,卷积层C3,下采样层P2,残差层R2_1,残差层R2_2,残差层R2_3,残差层R2_4,卷积层C4,下采样层P3,残差层R3_1,残差层R3_2,残差层R3_3,残差层R3_4,残差层R3_5,残差层R3_6,卷积层C5,下采样层P4,残差层R4_1,残差层R4_2,残差层R4_3,最后到全连接层F1;
然后用10575个人的49万张图片作为训练数据,分批次输入搭建好的网络模型。
3.根据权利要求1或2所述的大规模人脸识别方法,其特征在于,步骤3所述面大规模人脸识别,具体操作如下:
(1)将一百万张人脸图片作为测试数据,依次输入训练好的网络模型;
(2)取网络模型中全连接层的1024个参数作为人脸图片的特征向量;
(3)利用特征向量进行相似度计算;
(4)输出识别结果。
CN201710226292.4A 2017-04-08 2017-04-08 基于深度卷积神经网络模型的大规模人脸识别方法 Active CN106874898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710226292.4A CN106874898B (zh) 2017-04-08 2017-04-08 基于深度卷积神经网络模型的大规模人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710226292.4A CN106874898B (zh) 2017-04-08 2017-04-08 基于深度卷积神经网络模型的大规模人脸识别方法

Publications (2)

Publication Number Publication Date
CN106874898A true CN106874898A (zh) 2017-06-20
CN106874898B CN106874898B (zh) 2021-03-30

Family

ID=59161045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710226292.4A Active CN106874898B (zh) 2017-04-08 2017-04-08 基于深度卷积神经网络模型的大规模人脸识别方法

Country Status (1)

Country Link
CN (1) CN106874898B (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247947A (zh) * 2017-07-07 2017-10-13 北京智慧眼科技股份有限公司 人脸属性识别方法及装置
CN107273864A (zh) * 2017-06-22 2017-10-20 星际(重庆)智能装备技术研究院有限公司 一种基于深度学习的人脸检测方法
CN107341518A (zh) * 2017-07-07 2017-11-10 东华理工大学 一种基于卷积神经网络的图像分类方法
CN107679451A (zh) * 2017-08-25 2018-02-09 百度在线网络技术(北京)有限公司 建立人脸识别模型的方法、装置、设备和计算机存储介质
CN107798381A (zh) * 2017-11-13 2018-03-13 河海大学 一种基于卷积神经网络的图像识别方法
CN107832700A (zh) * 2017-11-03 2018-03-23 全悉科技(北京)有限公司 一种人脸识别方法与系统
CN107895160A (zh) * 2017-12-21 2018-04-10 曙光信息产业(北京)有限公司 人脸检测与识别装置及方法
CN107944551A (zh) * 2017-12-15 2018-04-20 福州大学 一种用于电润湿显示屏缺陷识别方法
CN108038456A (zh) * 2017-12-19 2018-05-15 中科视拓(北京)科技有限公司 一种人脸识别系统中的防欺骗方法
CN108108499A (zh) * 2018-02-07 2018-06-01 腾讯科技(深圳)有限公司 人脸检索方法、装置、存储介质及设备
CN108229435A (zh) * 2018-02-01 2018-06-29 北方工业大学 一种用于行人识别的方法
CN108399373A (zh) * 2018-02-06 2018-08-14 北京达佳互联信息技术有限公司 人脸关键点的模型训练及其检测方法和装置
CN108805814A (zh) * 2018-06-07 2018-11-13 西安电子科技大学 基于多频段深度卷积神经网络的图像超分辨重建方法
CN109086765A (zh) * 2018-08-01 2018-12-25 北京嘀嘀无限科技发展有限公司 车牌识别方法、装置、介质、服务器和行车记录仪
CN109165675A (zh) * 2018-07-26 2019-01-08 西安电子科技大学 基于周期性局部连接卷积神经网络的图像分类方法
CN109241321A (zh) * 2018-07-19 2019-01-18 杭州电子科技大学 基于深度领域适应的图像和模型联合分析方法
CN109447254A (zh) * 2018-11-01 2019-03-08 济南浪潮高新科技投资发展有限公司 一种卷积神经网络推理硬件加速方法及其装置
CN109472240A (zh) * 2018-11-12 2019-03-15 北京影谱科技股份有限公司 人脸识别多模型自适应特征融合增强方法和装置
CN109635686A (zh) * 2018-11-29 2019-04-16 上海交通大学 结合人脸与外观的两阶段行人搜索方法
CN109903226A (zh) * 2019-01-30 2019-06-18 天津城建大学 基于对称残差卷积神经网络的图像超分辨率重建方法
CN109993109A (zh) * 2019-03-29 2019-07-09 成都信息工程大学 图像文字识别方法
CN110188713A (zh) * 2019-06-03 2019-08-30 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN110866487A (zh) * 2019-11-12 2020-03-06 复旦大学 大规模行人检测与重识别样本集构建方法及装置
CN111295884A (zh) * 2017-11-08 2020-06-16 松下电器(美国)知识产权公司 图像处理装置及图像处理方法
CN111401155A (zh) * 2020-02-28 2020-07-10 北京大学 基于隐式欧拉跳跃连接的残差神经网络的图像识别方法
CN111860542A (zh) * 2020-07-22 2020-10-30 海尔优家智能科技(北京)有限公司 用于识别物品类别的方法及装置、电子设备
WO2021072998A1 (zh) * 2019-10-15 2021-04-22 华南理工大学 一种亚洲人脸数据自动收集及清理的方法和系统
US11361191B2 (en) 2018-05-22 2022-06-14 Ebay Inc. Adversarial learning for finegrained image search

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150139485A1 (en) * 2013-11-15 2015-05-21 Facebook, Inc. Pose-aligned networks for deep attribute modeling
CN104866810A (zh) * 2015-04-10 2015-08-26 北京工业大学 一种深度卷积神经网络的人脸识别方法
CN106021990A (zh) * 2016-06-07 2016-10-12 广州麦仑信息科技有限公司 一种将生物基因以特定的性状进行分类与自我识别的方法
CN106295682A (zh) * 2016-08-02 2017-01-04 厦门美图之家科技有限公司 一种判断图片质量因子的方法、装置和计算设备
CN106408037A (zh) * 2015-07-30 2017-02-15 阿里巴巴集团控股有限公司 图像识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150139485A1 (en) * 2013-11-15 2015-05-21 Facebook, Inc. Pose-aligned networks for deep attribute modeling
CN104866810A (zh) * 2015-04-10 2015-08-26 北京工业大学 一种深度卷积神经网络的人脸识别方法
CN106408037A (zh) * 2015-07-30 2017-02-15 阿里巴巴集团控股有限公司 图像识别方法及装置
CN106021990A (zh) * 2016-06-07 2016-10-12 广州麦仑信息科技有限公司 一种将生物基因以特定的性状进行分类与自我识别的方法
CN106295682A (zh) * 2016-08-02 2017-01-04 厦门美图之家科技有限公司 一种判断图片质量因子的方法、装置和计算设备

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273864A (zh) * 2017-06-22 2017-10-20 星际(重庆)智能装备技术研究院有限公司 一种基于深度学习的人脸检测方法
CN107273864B (zh) * 2017-06-22 2020-05-22 星际(重庆)智能装备技术研究院有限公司 一种基于深度学习的人脸检测方法
CN107247947A (zh) * 2017-07-07 2017-10-13 北京智慧眼科技股份有限公司 人脸属性识别方法及装置
CN107341518A (zh) * 2017-07-07 2017-11-10 东华理工大学 一种基于卷积神经网络的图像分类方法
CN107247947B (zh) * 2017-07-07 2021-02-09 智慧眼科技股份有限公司 人脸属性识别方法及装置
CN107679451A (zh) * 2017-08-25 2018-02-09 百度在线网络技术(北京)有限公司 建立人脸识别模型的方法、装置、设备和计算机存储介质
CN107832700A (zh) * 2017-11-03 2018-03-23 全悉科技(北京)有限公司 一种人脸识别方法与系统
CN111295884A (zh) * 2017-11-08 2020-06-16 松下电器(美国)知识产权公司 图像处理装置及图像处理方法
CN107798381A (zh) * 2017-11-13 2018-03-13 河海大学 一种基于卷积神经网络的图像识别方法
CN107944551A (zh) * 2017-12-15 2018-04-20 福州大学 一种用于电润湿显示屏缺陷识别方法
CN108038456B (zh) * 2017-12-19 2024-01-26 中科视拓(北京)科技有限公司 一种人脸识别系统中的防欺骗方法
CN108038456A (zh) * 2017-12-19 2018-05-15 中科视拓(北京)科技有限公司 一种人脸识别系统中的防欺骗方法
CN107895160A (zh) * 2017-12-21 2018-04-10 曙光信息产业(北京)有限公司 人脸检测与识别装置及方法
CN108229435A (zh) * 2018-02-01 2018-06-29 北方工业大学 一种用于行人识别的方法
CN108399373A (zh) * 2018-02-06 2018-08-14 北京达佳互联信息技术有限公司 人脸关键点的模型训练及其检测方法和装置
CN108399373B (zh) * 2018-02-06 2019-05-10 北京达佳互联信息技术有限公司 人脸关键点的模型训练及其检测方法和装置
CN108108499A (zh) * 2018-02-07 2018-06-01 腾讯科技(深圳)有限公司 人脸检索方法、装置、存储介质及设备
CN108108499B (zh) * 2018-02-07 2023-05-26 腾讯科技(深圳)有限公司 人脸检索方法、装置、存储介质及设备
US11361191B2 (en) 2018-05-22 2022-06-14 Ebay Inc. Adversarial learning for finegrained image search
CN108805814A (zh) * 2018-06-07 2018-11-13 西安电子科技大学 基于多频段深度卷积神经网络的图像超分辨重建方法
CN108805814B (zh) * 2018-06-07 2020-05-19 西安电子科技大学 基于多频段深度卷积神经网络的图像超分辨重建方法
CN109241321A (zh) * 2018-07-19 2019-01-18 杭州电子科技大学 基于深度领域适应的图像和模型联合分析方法
CN109165675A (zh) * 2018-07-26 2019-01-08 西安电子科技大学 基于周期性局部连接卷积神经网络的图像分类方法
CN109086765A (zh) * 2018-08-01 2018-12-25 北京嘀嘀无限科技发展有限公司 车牌识别方法、装置、介质、服务器和行车记录仪
WO2020087991A1 (zh) * 2018-11-01 2020-05-07 山东浪潮人工智能研究院有限公司 一种卷积神经网络推理硬件加速方法及其装置
CN109447254A (zh) * 2018-11-01 2019-03-08 济南浪潮高新科技投资发展有限公司 一种卷积神经网络推理硬件加速方法及其装置
CN109447254B (zh) * 2018-11-01 2021-03-16 浪潮集团有限公司 一种卷积神经网络推理硬件加速方法及其装置
CN109472240A (zh) * 2018-11-12 2019-03-15 北京影谱科技股份有限公司 人脸识别多模型自适应特征融合增强方法和装置
CN109635686A (zh) * 2018-11-29 2019-04-16 上海交通大学 结合人脸与外观的两阶段行人搜索方法
CN109635686B (zh) * 2018-11-29 2021-04-23 上海交通大学 结合人脸与外观的两阶段行人搜索方法
CN109903226A (zh) * 2019-01-30 2019-06-18 天津城建大学 基于对称残差卷积神经网络的图像超分辨率重建方法
CN109903226B (zh) * 2019-01-30 2023-08-15 天津城建大学 基于对称残差卷积神经网络的图像超分辨率重建方法
CN109993109A (zh) * 2019-03-29 2019-07-09 成都信息工程大学 图像文字识别方法
CN110188713A (zh) * 2019-06-03 2019-08-30 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
WO2021072998A1 (zh) * 2019-10-15 2021-04-22 华南理工大学 一种亚洲人脸数据自动收集及清理的方法和系统
CN110866487A (zh) * 2019-11-12 2020-03-06 复旦大学 大规模行人检测与重识别样本集构建方法及装置
CN110866487B (zh) * 2019-11-12 2023-01-17 复旦大学 大规模行人检测与重识别样本集构建方法及装置
CN111401155A (zh) * 2020-02-28 2020-07-10 北京大学 基于隐式欧拉跳跃连接的残差神经网络的图像识别方法
CN111401155B (zh) * 2020-02-28 2022-05-20 北京大学 基于隐式欧拉跳跃连接的残差神经网络的图像识别方法
CN111860542A (zh) * 2020-07-22 2020-10-30 海尔优家智能科技(北京)有限公司 用于识别物品类别的方法及装置、电子设备

Also Published As

Publication number Publication date
CN106874898B (zh) 2021-03-30

Similar Documents

Publication Publication Date Title
CN106874898A (zh) 基于深度卷积神经网络模型的大规模人脸识别方法
Hu et al. Learning supervised scoring ensemble for emotion recognition in the wild
CN106650789A (zh) 一种基于深度lstm网络的图像描述生成方法
CN112183435A (zh) 一种两阶段的手部目标检测方法
CN112084373B (zh) 一种基于图嵌入的多源异构网络用户对齐方法
CN109446333A (zh) 一种实现中文文本分类的方法及相关设备
CN103294832B (zh) 一种基于反馈学习的运动捕获数据检索方法
CN110135460A (zh) 基于vlad卷积模块的图像信息强化方法
CN107133640A (zh) 基于局部图像块描述子和费舍尔向量的图像分类方法
CN110457503A (zh) 一种快速优化深度哈希图像编码方法及目标图像检索方法
CN103617609A (zh) 基于图论的k-means非线性流形聚类与代表点选取方法
CN113901831A (zh) 基于预训练语言模型及双向交互注意力的平行句对抽取方法
Li et al. BViT: Broad attention-based vision transformer
CN116681645A (zh) 一种裂缝缺陷的检测模型及其实现方法
Yang et al. CLIP-KD: An Empirical Study of Distilling CLIP Models
Li et al. Hrnext: High-resolution context network for crowd pose estimation
Ni et al. Enhanced knowledge distillation for face recognition
Wu et al. Towards pen‐holding hand pose recognition: A new benchmark and a coarse‐to‐fine PHHP recognition network
Wang et al. Multi-scale convolutional features network for semantic segmentation in indoor scenes
Zhou et al. Training convolutional neural network for sketch recognition on large-scale dataset.
CN113887501A (zh) 行为识别方法、装置、存储介质及电子设备
Li et al. Dynamic gesture recognition based on YOLOv4 and deep-sort methodological research
Xue et al. An efficient method of casting defects detection based on deep learning
Dai et al. Attention‐based hierarchical pyramid feature fusion structure for efficient face recognition
Wang et al. A Longitudinal Dense Feature Pyramid Network for Object Detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant