CN112000621A - 一种不同人脸识别的样本库的合并方法 - Google Patents

一种不同人脸识别的样本库的合并方法 Download PDF

Info

Publication number
CN112000621A
CN112000621A CN201910445458.0A CN201910445458A CN112000621A CN 112000621 A CN112000621 A CN 112000621A CN 201910445458 A CN201910445458 A CN 201910445458A CN 112000621 A CN112000621 A CN 112000621A
Authority
CN
China
Prior art keywords
face
picture
person
path
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910445458.0A
Other languages
English (en)
Inventor
于晓静
田凤彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ingenic Semiconductor Co Ltd
Original Assignee
Beijing Ingenic Semiconductor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ingenic Semiconductor Co Ltd filed Critical Beijing Ingenic Semiconductor Co Ltd
Priority to CN201910445458.0A priority Critical patent/CN112000621A/zh
Publication of CN112000621A publication Critical patent/CN112000621A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Processing Or Creating Images (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明提供了一种不同人脸识别的样本库的合并方法,所述的方法包括以下步骤:S1,设定样本存放规则;S2,在存放同一人的图片文件夹中,获得该人人脸图片中最正面人脸的图片;S3,根据步骤S2的结果,提取不同人脸识别库中每个人的最正面人脸的特征值,每个特征值与该人文件夹路径关联,比较两个不同的人脸识别库中的特征值;S3.1,若两个特征值的空间距离小于第一阈值的视为同一人,将小于第一阈值的人的所有图片进行合并;S3.2,若空间距离大于第二阈值的视为不同人,不合并;S3.3,将空间距离大于或等于第一阈值且小于或等于第二阈值的人的文件夹进行合并。

Description

一种不同人脸识别的样本库的合并方法
技术领域
本发明涉及人脸图像识别技术领域,特别涉及人脸识别中一种不同人脸识别的样本库的合并方法。
背景技术
随着科技的不断发展,特别是计算机视觉技术的发展,人脸识别技术广泛应用于信息安全、电子认证等各个领域,图像特征提取方法具有良好的识别性能。人脸识别是指基于已知的人脸样本库,利用图像处理和/或模式识别技术从静态或者动态场景中,识别一个或多个人脸的技术。但是目前的人脸识别上技术具有提取处理较差、计算耗时的问题,特别是人脸识别中合并人脸识别库的方法仍存在合并效率较低的问题。
发明内容
为了解决上述现有技术中存在的问题,本发明的目的在于:在人脸识别中实现更好的合并样本库。
本发明提供一种不同人脸识别的样本库的合并方法,所述的方法包括以下步骤:
S1,设定样本存放规则;
S2,在存放同一人的图片文件夹中,获得该人人脸图片中最正面人脸的图片;
S3,根据步骤S2的结果,提取不同人脸识别库中每个人的最正面人脸的特征值,每个特征值与该人文件夹路径关联,比较两个不同的人脸识别库中的特征值;
S3.1,若两个特征值的空间距离小于第一阈值的视为同一人,将小于第一阈值的人的所有图片进行合并;
S3.2,若空间距离大于第二阈值的视为不同人,不合并;
S3.3,将空间距离大于或等于第一阈值且小于或等于第二阈值的人的文件夹进行合并。
所述的步骤S1的设定样本存放规则为,一张图片只有一个人脸,同一人的图片放到同一个文件夹中,一个文件夹代表一个人,该文件夹命名为person。
所述的步骤S2进一步包括:
S2.1,根据人脸眼睛中心的距离与人脸检测框的宽度,进行求得比值;
S2.2,在存放同一人的图片文件夹中,找到距离与高度比值最大的一个张图,这个图就是一个所有该人人脸中最接近正面人脸的图;
S2.3,将步骤S2.2中最接近正面人脸的图作为该人的最正面人脸图片。
所述的步骤S2.3中合并的文件夹中的图片进一步进行人工筛选处理。
所述步骤S2.1-S2.3进一步包括:
[1]初始化,设置参数tmp=0,图片路径path_img=0;
[2]提取一张图片并记录该图片路径为path_img,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形的高度height,计算两只眼睛距离与人脸外接矩形高度height的比值为tmp;
[3]提取下一张图片并记录该图片路径path_img1,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形,计算两只眼睛距离与人脸外接矩形高度的比值tmp1;
[4]比较tmp1与tmp的大小,如果tmp1>tmp并且height>80,那么tmp=tmp1,path_img=path_img1;
[5]重复[3][4]过程,直到该person所有图片被提取完,记录图片路径path_img和该人person的路径。
所述步骤S3进一步包括:
[1]提取不同人脸识库中每个人的最正面人脸的特征值,每个特征值与该人文件名路径关联,初始化i=1;
[2]读取第一个人脸识别库最正人脸的特征值的第i个人脸的特征值eval1,该人路径为path_person1,初始化j=1;
[3]读取第二个人脸识别库最正人脸的特征值的第j个人脸的特征值eval2,该人路径为path_person2,比较eval1与eval2的二范数或称为空间距离dist;
[4]如果空间距离dist小于第一阈值,那么将path_person2的所有人脸图片拷贝到path_person1中,将path_person2的文件夹及其内部图片删除;
如果空间距离dist大于第二阈值,读取下一个人脸特征值数据;
如果空间距离dist大于或等于第一阈值且小于或等于第二阈值,那么将path_person1拷贝到文件夹tmp_file中,将path_person2拷贝到文件夹tmp_file中的path_person1路径所在人的文件目录中,将path_person2的文件夹及其内部图片删除;
[5]j=j+1,重复[3]、[4]过程,直到第二个人脸库中的最正面人脸的特征值与第i个人脸的特征值eval1比较完毕;
[6]进入第一个人脸库,i=i+1,重复[2]、[3]、[4]、[5],直到第一个人脸库中的最正面人脸的特征值全部读取完毕;
[7]两个人脸库进行合并,即两个库中每个人的文件夹名没有重名。
所述的初始化要求每人至少三张图片。
所述的第一阈值命名为th1;所述的第二阈值命名为th2。
所述的步骤进一步包括人工处理文件夹tmp_file中的文件,筛选是否存在重复,如果存在,重复的进行合并;如果不存在重复,将处理后的结果,放入到处理后的第一个人脸库中。
本申请的优势在于提高了人脸识别中合并人脸识别库的效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。
图1是本发明的方法的框图示意图。
图2是本发明的方法步骤S2.1-S2.3的流程示意图。
图3是本发明的方法步骤S3的流程示意图。
具体实施方式
目前人脸识别技术领域的术语包括:
1、人脸检测:将一张图片输入到一个检测器中,将人脸的眼睛、鼻子、嘴和人脸外接矩形的坐标信息提取出来,如果没有人脸,不会输出任何信息。
2、人脸识别库:是用来训练人脸识别模型的一种样本库。在不会产生混淆的情况下,可以简称为样本库。
3、人脸识别模型:通过使用人脸识别库来训练,可以得到人脸识别模型。使用人脸识别模型,可以对人脸提取人脸的特征值。
4、人脸的特征值:是一张人脸图片,通过人脸识别模型处理后生成的一维数据,这个数据称为该人脸的特征值。同一人的不同人脸图片,特征值间的空间距离很小。
本申请涉及的实施方案包括:
1)、使用现有或已有样本库进行训练出人脸识别模型。
2)、使用人脸检测检测出两个眼睛的位置和人脸的外接矩形的位置。
3)、通过随机抽取一张图片或是将每人的所有图片进行比较,进行合并不同的样本库。
本申请的实施方案具体包括:
1、样本存放规则说明
一张图片只有一个人脸,同一人的图片放到同一个文件夹中,一个文件夹代表一个人,该文件夹命名为person,person中的图片命名为image。将这些不同人的文件夹放到一个总的文件夹下,这个总的文件夹命名为train_data。这种存放和命名方式,便于处理和下面算法的表达。例如train_data_1={person_1,person_2,person_3,person_4,…},其中person_i={image1,image2,image3,…},i=1,2,…n
2、不同样本库的合并
1)提取每个人person的最正面人脸图片。如图1所示,根据人脸眼睛中心的距离与人脸检测框的宽度,进行求得比值,在同一人person中,找到距离与高度比值最大的一个张图,这个图就是所有该人人脸中最接近正面人脸的一个图,命名为image_max。将该图image_max作为该人的最正面人脸图片。按照这种处理方法,将不同人脸识别库提取出所有人的正人脸图片。
如图2所示,提取每个人最正面人脸图片的具体方法:
[1]初始化tmp0=0,图片路径path_img0=0。
[2]提取一张图片和记录该图片路径为path_img0,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形的高度height,计算两只眼睛距离与人脸外接矩形高度height的比值为tmp0。
[3]提取下一张图片并记录该图片路径path_img1,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形,计算两只眼睛距离与人脸外接矩形高度的比值tmp1。
[4]比较tmp1与tmp的大小,如果tmp1>tmp并且height>80,那么tmp=tmp1,path_img=path_img1.
[5]重复[3][4]过程,直到该person所有图片被提取完。记录图片路径path_img0和该人person的路径。
2)使用遍历比较的方法,合并两个人脸识别库。将人脸库中的人脸的特征值进行比较,距离小于阈值1的视为同一人,距离大于另一个阈值2的视为不同人,将小于阈值2的人的所有图片进行合并。将大于或等于阈值1且小于或等于阈值2的人的文件夹进行合并,这部分进行人工筛选处理。
如图3所示,遍历处理的具体方法如下:
[1]提取两个人脸识库中每个人的最正面人脸。提取最正面人脸的特征值,每个特征值与该人文件名路径关联。初始化i=1。
[2]读取第一个人脸识别库最正人脸的特征值的第i个人脸的特征值eval1,该人路径为path_person1。初始化j=1。
[3]读取第二个人脸识别库最正人脸的特征值的第j个人脸的特征值eval2,该人路径为path_person2。比较eval1与eval2的二范数(或称为空间距离)dist。
[4]如果dist小于阈值1(命名为th1),那么将path_person2的所有人脸图片拷贝到path_person1中,将path_person2的文件夹及其内部图片删除。如果dist大于阈值2(命名为th2,th1<th2),读取下一个人脸特征值数据。如果dist大于或等于th1且小于或等于th2,那么将path_person1拷贝到tmp_file中,将path_person2拷贝到tmp_file中的path_person1路径所在人的文件目录中,将path_person2的文件夹及其内部图片删除。
[5]j=j+1,重复[3]、[4]过程,直到第二个人脸库中的最正面人脸的特征值与第i个人脸的特征值eval1比较完毕。
[6]进入第一个人脸识别库,i=i+1,重复[2]、[3]、[4]、[5]。直到第一个人脸库中的最正面人脸的特征值全部读取完毕。
[7]两个人脸识别库进行合并(两个库中每个人的文件夹名没有重名)。
[8]人工处理tmp_file中的文件,筛选是否存在重复,如果存在,进行合并,如果不存在重复,那么就将其分开。将处理后的结果,放入到处理后的第一个人脸识别库中。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种不同人脸识别的样本库的合并方法,其特征在于,所述的方法包括以下步骤:
S1,设定样本存放规则;
S2,在存放同一人的图片文件夹中,获得该人人脸图片中最正面人脸的图片;
S3,根据步骤S2的结果,提取不同人脸识别库中每个人的最正面人脸的特征值,每个特征值与该人文件夹路径关联,比较两个不同的人脸识别库中的特征值;
S3.1,若两个特征值的空间距离小于第一阈值的视为同一人,将小于第一阈值的人的所有图片进行合并;
S3.2,若空间距离大于第二阈值的视为不同人,不合并;
S3.3,将空间距离大于或等于第一阈值且小于或等于第二阈值的人的文件夹进行合并。
2.根据权利要求1或2所述的一种不同人脸识别的样本库的合并方法,其特征在于,所述的步骤S1的设定样本存放规则为,一张图片只有一个人脸,同一人的图片放到同一个文件夹中,一个文件夹代表一个人,该文件夹命名为person。
3.根据权利要求1或2所述的一种不同人脸识别的样本库的合并方法,其特征在于,所述的步骤S2进一步包括:
S2.1,根据人脸眼睛中心的距离与人脸检测框的宽度,进行求得比值;
S2.2,在存放同一人的图片文件夹中,找到距离与高度比值最大的一个张图,这个图就是一个所有该人人脸中最接近正面人脸的图;
S2.3,将步骤S2.2中最接近正面人脸的图作为该人的最正面人脸图片。
4.根据权利要求1所述的一种不同人脸识别的样本库的合并方法,其特征在于,所述的步骤S2.3中合并的文件夹中的图片进一步进行人工筛选处理。
5.根据权利要求3所述的一种人脸识别中提取正面人脸的方法,其特征在于,所述步骤S2.1-S2.3进一步包括:
[1]初始化,设置参数tmp=0,图片路径path_img=0;
[2]提取一张图片并记录该图片路径为path_img,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形的高度height,计算两只眼睛距离与人脸外接矩形高度height的比值为tmp;
[3]提取下一张图片并记录该图片路径path_img1,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形,计算两只眼睛距离与人脸外接矩形高度的比值tmp1;
[4]比较tmp1与tmp的大小,如果tmp1>tmp并且height>80,那么tmp=tmp1,path_img=path_img1;
[5]重复[3][4]过程,直到该person所有图片被提取完,记录图片路径path_img和该人person的路径。
6.根据权利要求5所述的一种不同人脸识别的样本库的合并方法,其特征在于,所述的初始化要求每人至少三张图片。
7.根据权利要求1所述的一种通过遍历比较合并人脸识别库的方法,其特征在于,所述的第一阈值命名为th1;所述的第二阈值命名为th2;比较第一人脸识别库中的人脸特征值和第二人脸识别库中的人脸特征值的二范数或成为空间距离dist。
8.根据权利要求6所述的一种不同人脸识别的样本库的合并方法,其特征在于,所述的步骤进一步包括人工处理文件夹tmp_file中的文件,筛选是否存在重复,如果存在,重复的进行合并;如果不存在重复,将处理后的结果,放入到处理后的第一个人脸库中。
CN201910445458.0A 2019-05-27 2019-05-27 一种不同人脸识别的样本库的合并方法 Pending CN112000621A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910445458.0A CN112000621A (zh) 2019-05-27 2019-05-27 一种不同人脸识别的样本库的合并方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910445458.0A CN112000621A (zh) 2019-05-27 2019-05-27 一种不同人脸识别的样本库的合并方法

Publications (1)

Publication Number Publication Date
CN112000621A true CN112000621A (zh) 2020-11-27

Family

ID=73461612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910445458.0A Pending CN112000621A (zh) 2019-05-27 2019-05-27 一种不同人脸识别的样本库的合并方法

Country Status (1)

Country Link
CN (1) CN112000621A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115408564A (zh) * 2022-08-31 2022-11-29 杭州网易云音乐科技有限公司 人脸特征库构建方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615241A (zh) * 2008-06-24 2009-12-30 上海银晨智能识别科技有限公司 一种证件照片的筛选方法
CN107633209A (zh) * 2017-08-17 2018-01-26 平安科技(深圳)有限公司 电子装置、动态视频人脸识别的方法及存储介质
CN108932343A (zh) * 2018-07-24 2018-12-04 南京甄视智能科技有限公司 人脸图像数据库的数据集清洗方法与系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615241A (zh) * 2008-06-24 2009-12-30 上海银晨智能识别科技有限公司 一种证件照片的筛选方法
CN107633209A (zh) * 2017-08-17 2018-01-26 平安科技(深圳)有限公司 电子装置、动态视频人脸识别的方法及存储介质
CN108932343A (zh) * 2018-07-24 2018-12-04 南京甄视智能科技有限公司 人脸图像数据库的数据集清洗方法与系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115408564A (zh) * 2022-08-31 2022-11-29 杭州网易云音乐科技有限公司 人脸特征库构建方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
WO2019134327A1 (zh) 一种基于边缘检测与sift的人脸表情识别特征提取方法
US9613258B2 (en) Image quality assessment
US8548256B2 (en) Method for fast scene matching
Mazaheri et al. A Skip Connection Architecture for Localization of Image Manipulations.
US20070286497A1 (en) System and Method for Comparing Images using an Edit Distance
Saboia et al. Eye specular highlights telltales for digital forensics: A machine learning approach
Chowdhary 3D object recognition system based on local shape descriptors and depth data analysis
CN103971122B (zh) 基于深度图像的三维人脸描述方法
CN106815824A (zh) 一种提高大规模三维重建效率的图像近邻优化方法
CN108229493A (zh) 对象验证方法、装置和电子设备
JP2006338313A (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
Wu et al. Privacy leakage of SIFT features via deep generative model based image reconstruction
Li et al. Design and learn distinctive features from pore-scale facial keypoints
KR101129386B1 (ko) 영상의 음영(shading)제거 방법 및 장치
CN110321935B (zh) 业务事件关系确定方法及装置、计算机可读存储介质
CN111666976A (zh) 基于属性信息的特征融合方法、装置和存储介质
CN110969101A (zh) 一种基于hog和特征描述子的人脸检测与跟踪方法
CN112000621A (zh) 一种不同人脸识别的样本库的合并方法
CN112001203A (zh) 一种人脸识别库中提取正面人脸的方法
Boukamcha et al. 3D face landmark auto detection
CN107480628A (zh) 一种人脸识别方法及装置
CN112001206B (zh) 一种通过遍历比较合并人脸识别库的方法
Gál et al. Multiple kernel learning based modality classification for medical images
CN112001207B (zh) 一种人脸识别样本库的优化方法
Böckeler et al. An efficient 3D facial landmark detection algorithm with haar-like features and anthropometric constraints

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201127