CN110210414A - 海量人脸数据库的快速交叉识别技术 - Google Patents
海量人脸数据库的快速交叉识别技术 Download PDFInfo
- Publication number
- CN110210414A CN110210414A CN201910484181.2A CN201910484181A CN110210414A CN 110210414 A CN110210414 A CN 110210414A CN 201910484181 A CN201910484181 A CN 201910484181A CN 110210414 A CN110210414 A CN 110210414A
- Authority
- CN
- China
- Prior art keywords
- face
- information
- owner
- vector
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明属于人脸识别的技术领域,尤其涉及一种基于聚类分析的海量人脸数据库的快速交叉识别技术。海量人脸数据库的快速交叉识别技术采用如下的技术手段:通过基站获取的手机IMEI信息,检索到基站覆盖区域范围内的所有机主的身份证信息,通过基站检索获取的身份证信息,比对本地人脸数据库,将目标人脸识别范围缩小到基站内机主的人脸子集,提高人脸识别速度。通过机主的身份证信息,检索国家人口信息系统,通过检索国家人口信息系统,获取系统中机主的人脸信息,和摄像头获取的人脸信息以及本地人脸数据库的信息进行交叉对比识别,提高识别精度。
Description
技术领域
本发明属于人脸识别的技术领域,尤其涉及一种基于聚类分析的海量人脸数据库的快速交叉识别技术
背景技术
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。
聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。
聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
聚类分析具有以下要求:
可伸缩性
许多聚类算法在小于200个数据对象的小数据集合上工作得很好;但是,一个大规模数据库可能包含几百万个对象,在这样的大数据集合样本上进行聚类可能会导致有偏的结果。我们需要具有高度可伸缩性的聚类算法。
不同属性
许多算法被设计用来聚类数值类型的数据。但是,应用可能要求聚类其他类型的数据,如二元类型(binary),分类/标称类型(categorical/nominal),序数型(ordinal)数据,或者这些数据类型的混合。
任意形状
许多聚类算法基于欧几里得或者曼哈顿距离度量来决定聚类。基于这样的距离度量的算法趋向于发现具有相近尺度和密度的球状簇。但是,一个簇可能是任意形状的。提出能发现任意形状簇的算法是很重要的。
领域最小化
许多聚类算法在聚类分析中要求用户输入一定的参数,例如希望产生的簇的数目。聚类结果对于输入参数十分敏感。参数通常很难确定,特别是对于包含高维对象的数据集来说。这样不仅加重了用户的负担,也使得聚类的质量难以控制。
处理“噪声”
绝大多数现实中的数据库都包含了孤立点,缺失,或者错误的数据。一些聚类算法对于这样的数据敏感,可能导致低质量的聚类结果。
记录顺序
一些聚类算法对于输入数据的顺序是敏感的。例如,同一个数据集合,当以不同的顺序交给同一个算法时,可能生成差别很大的聚类结果。开发对数据输入顺序不敏感的算法具有重要的意义。
高维度(high dimensionality)
一个数据库或者数据仓库可能包含若干维或者属性。许多聚类算法擅长处理低维的数据,可能只涉及两到三维。人类的眼睛在最多三维的情况下能够很好地判断聚类的质量。在高维空间中聚类数据对象是非常有挑战性的,特别是考虑到这样的数据可能分布非常稀疏,而且高度偏斜。
基于约束
现实世界的应用可能需要在各种约束条件下进行聚类。假设你的工作是在一个城市中为给定数目的自动提款机选择安放位置,为了作出决定,你可以对住宅区进行聚类,同时考虑如城市的河流和公路网,每个地区的客户要求等情况。要找到既满足特定的约束,又具有良好聚类特性的数据分组是一项具有挑战性的任务。
解释性-可用性
用户希望聚类结果是可解释的,可理解的,和可用的。也就是说,聚类可能需要和特定的语义解释和应用相联系。
目前还没有切实有效的技术能满足在海量人脸数据库下快速、精确识别人脸的技术要求。
发明内容
本发明的目的在于通过识别区域范围内人群的手机信息,缩减人脸数据库识别目标范围,提高人脸识别速度以及精度。
为达到上述目的,本发明海量人脸数据库的快速交叉识别技术采用如下的技术手段:
通过基站获取的手机IMEI信息,检索到基站覆盖区域范围内的所有机主的身份证信息,通过基站检索获取的身份证信息,比对本地人脸数据库,将目标人脸识别范围缩小到基站内机主的人脸子集,提高人脸识别速度。
通过机主的身份证信息,检索国家人口信息系统,通过检索国家人口信息系统,获取系统中机主的人脸信息,和摄像头获取的人脸信息以及本地人脸数据库的信息进行交叉对比识别,提高识别精度。
海量人脸数据库的快速交叉识别技术具体包括以下步骤:
第一步:根据手机IMEI信息检索机主身份证信息,形成检索目标人群子集。一部手机IMEI信息对应唯一的机主身份证信息,基站覆盖范围内所有IMEI信息对应的所有机主身份证信息形成目标人群子集S1。
第二部:根据机主身份证信息,检索本地数据库,和S1进行与运算形成包含M张人脸图像的集合S。每张图像可以转换成一个N维的向量,然后把这M个向量放到一个集合S里。
第三步:在获取到人脸向量集合S后,计算得到平均图像Ψ。把集合S里面的向量遍历一遍进行累加,然后取平均值。
第四步:计算每张图像和平均图像的差值Ф,就是用S集合里的每个元素减去步骤二中的平均值。
第五步:找到M个正交的单位向量UM,这些单位向量其实是用来描述Ф(步骤三中的差值)分布的。UM里面的第k(k=1,2,3...M)个向量Uk是通过下式计算的,
当这个λk取最小的值时,Uk基本就确定了。这M个向量是相互正交而且是单位长度的,Uk为单位正交向量。
如果训练图像的数量小于图像的维数比如(M<N2),那么起作用的特征向量只有M-1个而不是N2个(因为其他的特征向量对应的特征值为0),所以求解特征向量我们只需要求解一个NxN的矩阵。
第六步:识别人脸。上面几步是为了对人脸进行降维找到表征人脸的合适向量的。首先考虑一张新的人脸,我们可以用特征脸对其进行标示:Ω代表要判别的人脸,Ωk代表训练集内的某个人脸,两者都是通过特征脸的权重来表示的。对两者求欧式距离,当距离小于阈值时说明要判别的脸和训练集内的第k个脸是同一个人的。当遍历所有训练集都大于阈值时,根据距离值的大小又可分为是新的人脸或者不是人脸的两种情况。根据训练集的不同,阈值设定并不是固定的。
本发明的有益效果在于:本发明海量人脸数据库的快速交叉识别技术通过通过获取机主手机IMEI信息,引入身份证信息作为人脸库检索参数,缩小人脸库检索范围,提高人脸识别速度;通过对接国家人口信息系统,引入国家人口信息系统中的人脸数据,与本地人脸数据及摄像头获取的人脸数据进行交叉比对,提高人脸识别准确率。
附图说明
图1各种性能与类内数据量关系;
图2检索时间及准确率与检索节点数的关系。
具体实施方式
下面结合附图对本发明的实施例进行说明。
本发明海量人脸数据库的快速交叉识别技术通过基站获取的手机IMEI信息,检索到基站覆盖区域范围内的所有机主的身份证信息,通过基站检索获取的身份证信息,比对本地人脸数据库,将目标人脸识别范围缩小到基站内机主的人脸子集,提高人脸识别速度。通过机主的身份证信息,检索国家人口信息系统,通过检索国家人口信息系统,获取系统中机主的人脸信息,和摄像头获取的人脸信息以及本地人脸数据库的信息进行交叉对比识别,提高识别精度。
海量人脸数据库的快速交叉识别技术具体包括以下步骤:
第一步:根据手机IMEI信息检索机主身份证信息,形成检索目标人群子集。一部手机IMEI信息对应唯一的机主身份证信息,基站覆盖范围内所有IMEI信息对应的所有机主身份证信息形成目标人群子集S1。
第二部:根据机主身份证信息,检索本地数据库,和S1进行与运算形成包含M张人脸图像的集合S。每张图像可以转换成一个N维的向量,然后把这M个向量放到一个集合S里。
第三步:在获取到人脸向量集合S后,计算得到平均图像Ψ。把集合S里面的向量遍历一遍进行累加,然后取平均值。
第四步:计算每张图像和平均图像的差值Ф,就是用S集合里的每个元素减去步骤二中的平均值。
第五步:找到M个正交的单位向量UM,这些单位向量其实是用来描述Ф(步骤三中的差值)分布的。当这个λk取最小的值时,Uk基本就确定了。这M个向量是相互正交而且是单位长度的,Uk为单位正交向量。
如果训练图像的数量小于图像的维数比如(M<N2),那么起作用的特征向量只有M-1个而不是N2个(因为其他的特征向量对应的特征值为0),所以求解特征向量我们只需要求解一个NxN的矩阵。
第六步:识别人脸。上面几步是为了对人脸进行降维找到表征人脸的合适向量的。首先考虑一张新的人脸,我们可以用特征脸对其进行标示:Ω代表要判别的人脸,Ωk代表训练集内的某个人脸,两者都是通过特征脸的权重来表示的。对两者求欧式距离,当距离小于阈值时说明要判别的脸和训练集内的第k个脸是同一个人的。当遍历所有训练集都大于阈值时,根据距离值的大小又可分为是新的人脸或者不是人脸的两种情况。根据训练集的不同,阈值设定并不是固定的。
以上所述的仅为本发明的优选实施例,所应理解的是,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想,并不用于限定本发明的保护范围,凡在本发明的思想和原则之内所做的任何修改、等同替换等等,均应包含在本发明的保护范围之内。
Claims (1)
1.海量人脸数据库的快速交叉识别技术,其特征在于海量人脸数据库的快速交叉识别技术通过基站获取的手机IMEI信息,检索到基站覆盖区域范围内的所有机主的身份证信息,通过基站检索获取的身份证信息,比对本地人脸数据库,将目标人脸识别范围缩小到基站内机主的人脸子集,提高人脸识别速度;通过机主的身份证信息,检索国家人口信息系统,通过检索国家人口信息系统,获取系统中机主的人脸信息,和摄像头获取的人脸信息以及本地人脸数据库的信息进行交叉对比识别,提高识别精度;海量人脸数据库的快速交叉识别技术具体包括以下步骤:
第一步:根据手机IMEI信息检索机主身份证信息,形成检索目标人群子集。一部手机IMEI信息对应唯一的机主身份证信息,基站覆盖范围内所有IMEI信息对应的所有机主身份证信息形成目标人群子集S1。
第二部:根据机主身份证信息,检索本地数据库,和S1进行与运算形成包含M张人脸图像的集合S。每张图像可以转换成一个N维的向量,然后把这M个向量放到一个集合S里。
第三步:在获取到人脸向量集合S后,计算得到平均图像Ψ。把集合S里面的向量遍历一遍进行累加,然后取平均值。
第四步:计算每张图像和平均图像的差值Φ,就是用S集合里的每个元素减去步骤二中的平均值。
第五步:找到M个正交的单位向量UM,这些单位向量其实是用来描述Φ(步骤三中的差值)分布的。M个向量是相互正交而且是单位长度的,Uk为单位正交向量。如果训练图像的数量小于图像的维数比如(M<N2),那么起作用的特征向量只有M-1个而不是N2个(因为其他的特征向量对应的特征值为0),所以求解特征向量我们只需要求解一个NxN的矩阵。
第六步:识别人脸。上面几步是为了对人脸进行降维找到表征人脸的合适向量的。首先考虑一张新的人脸,我们可以用特征脸对其进行标示:Ω代表要判别的人脸,Ωk代表训练集内的某个人脸,两者都是通过特征脸的权重来表示的。对两者求欧式距离,当距离小于阈值时说明要判别的脸和训练集内的第k个脸是同一个人的。当遍历所有训练集都大于阈值时,根据距离值的大小又可分为是新的人脸或者不是人脸的两种情况。根据训练集的不同,阈值设定并不是固定的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910484181.2A CN110210414A (zh) | 2019-06-05 | 2019-06-05 | 海量人脸数据库的快速交叉识别技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910484181.2A CN110210414A (zh) | 2019-06-05 | 2019-06-05 | 海量人脸数据库的快速交叉识别技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110210414A true CN110210414A (zh) | 2019-09-06 |
Family
ID=67790794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910484181.2A Pending CN110210414A (zh) | 2019-06-05 | 2019-06-05 | 海量人脸数据库的快速交叉识别技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110210414A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112651335A (zh) * | 2020-12-25 | 2021-04-13 | 深圳集智数字科技有限公司 | 一种同行人识别方法、系统、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739546A (zh) * | 2008-11-05 | 2010-06-16 | 沈阳工业大学 | 基于图像交叉重建的单样本注册图像人脸识别方法 |
CN104765768A (zh) * | 2015-03-09 | 2015-07-08 | 深圳云天励飞技术有限公司 | 海量人脸库的快速准确检索方法 |
US20160182506A1 (en) * | 2013-05-13 | 2016-06-23 | Hoyos Labs Ip Ltd. | System and method for generating a biometric identifier |
CN106529414A (zh) * | 2016-10-14 | 2017-03-22 | 国政通科技股份有限公司 | 一种通过图像比对实现结果认证的方法 |
CN107273796A (zh) * | 2017-05-05 | 2017-10-20 | 珠海数字动力科技股份有限公司 | 一种基于人脸特征的快速人脸识别搜索方法 |
CN206601735U (zh) * | 2016-09-29 | 2017-10-31 | 成都优势互动科技有限公司 | 基于多种身份认证的便民服务终端 |
CN107729847A (zh) * | 2017-10-20 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 一种证件验证、身份验证方法和装置 |
CN108875398A (zh) * | 2018-09-06 | 2018-11-23 | 山西特信环宇信息技术有限公司 | 基于证件链技术的加解密系统及其使用方法 |
CN109522881A (zh) * | 2018-12-25 | 2019-03-26 | 华南理工大学 | 一种基于人脸识别的考生信息核对方法 |
-
2019
- 2019-06-05 CN CN201910484181.2A patent/CN110210414A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739546A (zh) * | 2008-11-05 | 2010-06-16 | 沈阳工业大学 | 基于图像交叉重建的单样本注册图像人脸识别方法 |
US20160182506A1 (en) * | 2013-05-13 | 2016-06-23 | Hoyos Labs Ip Ltd. | System and method for generating a biometric identifier |
CN104765768A (zh) * | 2015-03-09 | 2015-07-08 | 深圳云天励飞技术有限公司 | 海量人脸库的快速准确检索方法 |
CN206601735U (zh) * | 2016-09-29 | 2017-10-31 | 成都优势互动科技有限公司 | 基于多种身份认证的便民服务终端 |
CN106529414A (zh) * | 2016-10-14 | 2017-03-22 | 国政通科技股份有限公司 | 一种通过图像比对实现结果认证的方法 |
CN107273796A (zh) * | 2017-05-05 | 2017-10-20 | 珠海数字动力科技股份有限公司 | 一种基于人脸特征的快速人脸识别搜索方法 |
CN107729847A (zh) * | 2017-10-20 | 2018-02-23 | 阿里巴巴集团控股有限公司 | 一种证件验证、身份验证方法和装置 |
CN108875398A (zh) * | 2018-09-06 | 2018-11-23 | 山西特信环宇信息技术有限公司 | 基于证件链技术的加解密系统及其使用方法 |
CN109522881A (zh) * | 2018-12-25 | 2019-03-26 | 华南理工大学 | 一种基于人脸识别的考生信息核对方法 |
Non-Patent Citations (1)
Title |
---|
刘恒臣 等: "《通信网络与信息技术2009》", 30 September 2009, 辽宁科学技术出版社 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112651335A (zh) * | 2020-12-25 | 2021-04-13 | 深圳集智数字科技有限公司 | 一种同行人识别方法、系统、设备及存储介质 |
CN112651335B (zh) * | 2020-12-25 | 2024-05-07 | 深圳集智数字科技有限公司 | 一种同行人识别方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111523621B (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN108132968B (zh) | 网络文本与图像中关联语义基元的弱监督学习方法 | |
Jiao et al. | SAR images retrieval based on semantic classification and region-based similarity measure for earth observation | |
CN105718960B (zh) | 基于卷积神经网络和空间金字塔匹配的图像排序模型 | |
CN107256017B (zh) | 路线规划方法及系统 | |
CN106557728B (zh) | 查询图像处理和图像检索方法和装置以及监视系统 | |
CN105117407A (zh) | 一种基于聚类的距离方向直方图的图像检索方法 | |
CN109934258A (zh) | 特征加权和区域整合的图像检索方法 | |
CN103778206A (zh) | 一种网络服务资源的提供方法 | |
Jenni et al. | Pre-processing image database for efficient Content Based Image Retrieval | |
WO2018006631A1 (zh) | 一种用户等级自动划分方法及系统 | |
Riaz et al. | Multipath deep shallow convolutional networks for large scale plant species identification in wild image | |
Guo | Research on sports video retrieval algorithm based on semantic feature extraction | |
CN110210414A (zh) | 海量人脸数据库的快速交叉识别技术 | |
JP6017277B2 (ja) | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 | |
CN114708449B (zh) | 相似视频的确定方法、实例表征模型的训练方法及设备 | |
Huang et al. | A method for object-based color image retrieval | |
Zhang et al. | Reidentification of Persons Using Clothing Features in Real‐Life Video | |
CN112015937A (zh) | 一种图片地理定位方法及系统 | |
Champ et al. | Floristic participation at lifeclef 2016 plant identification task | |
Kim et al. | Natural/man-made object classification based on gabor characteristics | |
Arivalagan et al. | Face recognition based on a hybrid meta-heuristic feature selection algorithm | |
Elhady et al. | Weighted feature voting technique for content-based image retrieval | |
Kuncheva et al. | On the evaluation of video keyframe summaries using user ground truth | |
Fernández-Robles et al. | Evaluation of clustering configurations for object retrieval using sift features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190906 |
|
WD01 | Invention patent application deemed withdrawn after publication |