CN108921065A - 建立特征数据库的方法和装置 - Google Patents

建立特征数据库的方法和装置 Download PDF

Info

Publication number
CN108921065A
CN108921065A CN201810645951.2A CN201810645951A CN108921065A CN 108921065 A CN108921065 A CN 108921065A CN 201810645951 A CN201810645951 A CN 201810645951A CN 108921065 A CN108921065 A CN 108921065A
Authority
CN
China
Prior art keywords
characteristic element
fisrt feature
feature
data base
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810645951.2A
Other languages
English (en)
Inventor
孙海涌
张默
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Moshanghua Technology Co Ltd
Original Assignee
Beijing Moshanghua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Moshanghua Technology Co Ltd filed Critical Beijing Moshanghua Technology Co Ltd
Priority to CN201810645951.2A priority Critical patent/CN108921065A/zh
Publication of CN108921065A publication Critical patent/CN108921065A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Abstract

本申请公开了一种建立特征数据库的方法。该方法包括初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。另外,本申请还提供了一种建立特征数据库的装置。本申请解决了百万量级人脸识别特征库的特征查找效率低的技术问题。

Description

建立特征数据库的方法和装置
技术领域
本申请涉及通信领域,具体而言,涉及一种建立特征数据库的方法。
背景技术
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别技术的核心部分则为人脸图像特征提取以及匹配与识别。一般而言,提取的人脸特征为归一化后的N维向量(N通常为128、512等)。通过对人脸库中的图像逐一提取人脸特征,可以建立一个人脸特征库。在相关技术中,当需要查找可疑人脸时,采用人脸识别算法提取可疑人脸的特征数据,然后与人脸特征库中的每一个特征进行对比,找出最相近的特征作为查找结果。
人脸识别主要用于身份识别,近年来已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。随着需求的不断提升,用于比对的人脸库可达百万、千万乃至亿级别,相关技术中的提取人脸特征后的查找过程计算量因此线性放大,使得人脸图像特征提取、匹配与识别的过程效率低下。
针对相关技术中在百万级以上人脸特征库中特征提取、匹配与识别效率低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种建立特征数据库的方法,以解决上述问题。
为了实现上述目的,根据本申请的一个方面,提供了一种建立特征数据库的方法,包括:
初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。
进一步的,如前述的方法,所述将原始数据库中的特征元素按照第一预设规则添加到所述特征数据库中,包括:S21.从所述原始数据库中获取欲添加到所述特征数据库中的特征元素;S22.判断所述第一特征集是否为空;S23.若所述第一特征集为空,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;S24.若所述第一特征集不为空,计算所述特征元素与所述第一特征集中各个特征元素的距离,比较各个所述距离,得到与所述特征元素的距离最小的所述第一特征集中的最近特征元素;所述最近特征元素与所述特征元素之间的距离为最近距离;S25.判断所述最近距离是否大于预设阈值;S26.若所述最近距离大于所述预设阈值,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;S27.若所述最近距离不大于所述预设阈值,则将所述最近特征元素替换为所述最近特征元素和所述特征元素的均值,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集中的对应目录元素中;S28.重复S21至S27,直至所述原始数据库中所有特征元素的身份信息都添加到所述目录集中。
进一步的,如前述的方法,所述特征元素为向量;所述S24中计算所述特征元素与所述第一特征集中各个特征元素的距离,包括计算所述特征元素与所述第一特征集中各个特征元素的点积。
进一步的,如前述的方法,所述将所述第一特征集中的特征元素按照第二预设规则添加到所述第二特征集中,包括:S31.通过Sigmoid函数将所述第一特征集中的各个特征元素的各个值都投影为在0和1之间;S32.将所述所有值在0和1之间的各个特征元素按照第三预设规则投影为各个特征元素的各个值为0或1;S33.将所述各个值为0或1的各个特征元素添加到所述第二特征集中。
进一步的,如前述的方法,所述S32,包括:S321.获取欲投影的元素的值;S322.判断所述值是否大于0.5;S323.若所述值大于0.5,则将所述值投影为1;S324.若所述值不大于0.5,则将所述值投影为0;S325.重复S321至S324,直至将所述所有值在0和1之间的各个特征元素投影为各个特征元素的每个值为0或1。
为了实现上述目的,根据本申请的另一方面,提供了一种建立特征数据库的装置,包括:初始化单元、压缩单元和转换单元;所述初始化单元,用于初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;所述压缩单元,用于将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;所述转换单元,用于将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。
进一步的,如前述的装置,所述压缩单元,包括第一获取单元、第一判断单元、第一处理单元和第一计算单元;所述第一获取单元,用于从所述原始数据库中获取欲添加到所述特征数据库中的特征元素;所述第一判断单元,用于判断所述第一特征集是否为空;所述第一处理单元,用于在所述第一特征集为空时,将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;所述第一计算单元,用于在所述第一特征集不为空时,计算所述特征元素与所述第一特征集中各个特征元素的距离,比较各个所述距离,得到与所述特征元素的距离最小的所述第一特征集中的最近特征元素;所述最近特征元素与所述特征元素之间的距离为最近距离;所述第一判断单元,还用于判断所述最近距离是否大于预设阈值;所述第一处理单元,还用于在所述最近距离大于所述预设阈值时,将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;所述第一计算单元,还用于在所述最近距离不大于所述预设阈值时,计算所述最近特征元素和所述特征元素的均值;所述第一处理单元,还用于在所述最近距离不大于所述预设阈值时,将所述最近特征元素替换为所述均值,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集中的对应目录元素中。
进一步的,如前述的装置,所述特征元素为向量;所述第一计算单元用于计算所述特征元素与所述第一特征集中各个特征元素的距离,包括用于计算所述特征元素与所述第一特征集中各个特征元素的点积。
进一步的,如前述的装置,所述转换单元,包括投影单元和第二处理单元;所述投影单元,用于通过Sigmoid函数将所述第一特征集中的各个特征元素的各个值都投影为在0和1之间;所述投影单元,还用于将所述所有值在0和1之间的各个特征元素按照第三预设规则投影为各个特征元素的各个值为0或1;所述第二处理单元,还用于将所述各个值为0或1的各个特征元素添加到所述第二特征集中。
进一步的,如前述的装置,所述投影单元,包括第二获取单元、第二判断单元和第二计算单元;所述第二获取单元,用于获取欲投影的元素的值;所述第二判断单元,用于判断所述值是否大于0.5;所述第二计算单元,用于在所述值大于0.5时,将所述值投影为1;所述第二计算单元,还用于在所述值不大于0.5,则将所述值投影为0。
在本申请实施例中,采用将大规模人脸特征库对应为特征库和目录库的方式,通过将特征库大幅度压缩,达到了在特征库中高效查找人脸特征的目的,从而实现了提高人脸特征查找效率的技术效果,进而解决了百万量级人脸识别特征库的特征查找效率低的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请一个实施例提供的一种建立特征数据库的方法的流程示意图;
图2是本申请一个实施例提供的将原始数据库中的特征元素添加到特征数据库的流程示意图;
图3是本申请一个实施例提供的将第一特征集中的特征元素添加到第二特征集的流程示意图;
图4是本申请一个实施例提供的将值在0和1之间的特征元素投影为值为0或1的流程示意图;以及
图5是本申请一个实施例提供的一种建立特征数据库的装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1所示,该方法包括如下的步骤S1至步骤S3:
S1.初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;
S2.将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;
进一步地,如图2所示,所述S2包括:
S21.从所述原始数据库中获取欲添加到所述特征数据库中的特征元素;
S22.判断所述第一特征集是否为空;
S23.若所述第一特征集为空,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;
S24.若所述第一特征集不为空,计算所述特征元素与所述第一特征集中各个特征元素的距离,比较各个所述距离,得到与所述特征元素的距离最小的所述第一特征集中的最近特征元素;所述最近特征元素与所述特征元素之间的距离为最近距离;
更进一步地,如前述的方法,所述特征元素为向量;所述S24中计算所述特征元素与所述第一特征集中各个特征元素的距离,包括计算所述特征元素与所述第一特征集中各个特征元素的点积。
S25.判断所述最近距离是否大于预设阈值;
S26.若所述最近距离大于所述预设阈值,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;
S27.若所述最近距离不大于所述预设阈值,则将所述最近特征元素替换为所述最近特征元素和所述特征元素的均值,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集中的对应目录元素中;
S28.重复S21至S27,直至所述原始数据库中所有特征元素的身份信息都添加到所述目录集中。
具体地,例如,原人脸特征数据库包含M个人脸特征,其中M为100万,每个人脸特征为一个长度为N的一维向量(N通常为128、512等),则原数据库O为矩阵(M,N);
获取第一个人脸特征a1(0,2,3)(为简化处理,此处用N取3来举例),此时第一特征集K为空,则将a1(0,2,3)添加到第一特征集中,并将a1(0,2,3)在矩阵O(M,N)中的身份信息O_a1添加到目录集C的对应目录元素A中,此时第一特征集更新为K(a1),目录集更新为C(A),目录元素A更新为A(O_a1);
获取第二个人脸特征b1(0,5,8),此时第一特征集K已不为空,计算b1(0,5,8)与a1(0,2,3)的点积d=a1·b1=0·0+2·5+3·8=34,由于目前K中只有a1一个特征元素,所以a1为最近特征元素,44为最近距离;
预设阈值Th为30,判断34大于预设阈值Th,则将b1(0,5,8)添加到第一特征集中,并将b1(0,5,8)在矩阵O(M,N)中的身份信息O_b1添加到目录集C的对应目录元素B中,此时第一特征集更新为K(a1,b1),目录集更新为C(A,B),目录元素B更新为B(O_b1);
获取第三个人脸特征a2(0,2,4),此时第一特征集K已不为空,计算a2(0,2,4)与a1(0,2,3)的点积d1=a1·a2=0·0+2·2+3·4=16,计算a2(0,2,4)与b1(0,5,8)的点积d1=b1·a2=0·0+5·2+8·4=42,比较16<42,所以a1为最近特征元素,16为最近距离;
判断16小于预设阈值Th=30,则将K中的a1替换为a1’=(a1+a2)/2=(0,2,7/2),并将a2在矩阵O(M,N)中的身份信息O_a2添加到目录集C的对应目录元素A中,此时第一特征集更新为K(a1’,b1),目录集更新为C(A’,B),目录元素A更新为A’(O_a1,O_a2);目录元素B为B(O_b1);
重复以上步骤,直至矩阵O(M,N)中所有特征元素的身份信息都添加到目录集C中;通过调节预设阈值Th的大小,可以控制第一特征集K中元素的多少,即控制了第一特征集K的稀疏。
S3.将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。
进一步地,如图3所示,所述S3包括:
S31.通过Sigmoid函数将所述第一特征集中的各个特征元素的各个值都投影为在0和1之间;
S32.将所述所有值在0和1之间的各个特征元素按照第三预设规则投影为各个特征元素的各个值为0或1;
更进一步地,如图4所示,所述S32包括:
S321.获取欲投影的元素的值;
S322.判断所述值是否大于0.5;
S323.若所述值大于0.5,则将所述值投影为1;
S324.若所述值不大于0.5,则将所述值投影为0;
S325.重复S321至S324,直至将所述所有值在0和1之间的各个特征元素投影为各个特征元素的每个值为0或1。
S33.将所述各个值为0或1的各个特征元素添加到所述第二特征集中。
具体地,例如,取第一特征集K中的特征元素a1’(0,2,7/2);将a1’进行Sigmoid转换,Sigmoid函数的表达式为
因此S(a1’)=(1/2,1/(1+1/e2),1/(1+1/e7/2));再将S(a1’)进行二进制转换,即若值大于0.5,则将所述值投影为1,若值不大于0.5,则将所述值投影为0,因此bin_S(a1’)=(0,1,1);然后将bin_S(a1’)添加到第二特征集B_K中,则第二特征集B_K中的特征元素的值为0或1。
从以上的描述中,可以看出,本发明实现了如下技术效果:采用将大规模人脸特征库大幅度压缩为特征库和目录库的方式,通过调节压缩预设阈值来控制特征库的稀疏性,再进一步将特征库简化为二进制特征库,达到了在特征库中高效查找人脸特征的目的,从而实现了提高人脸特征查找效率的技术效果,进而解决了百万量级人脸识别特征库的特征查找效率低的技术问题。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述建立特征数据库的方法的装置,如图5所示,该装置包括初始化单元、压缩单元和转换单元;
所述初始化单元,用于初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;
所述压缩单元,用于将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;
进一步地,所述压缩单元,包括第一获取单元、第一判断单元、第一处理单元和第一计算单元;
所述第一获取单元,用于从所述原始数据库中获取欲添加到所述特征数据库中的特征元素;
所述第一判断单元,用于判断所述第一特征集是否为空;
所述第一处理单元,用于在所述第一特征集为空时,将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;
所述第一计算单元,用于在所述第一特征集不为空时,计算所述特征元素与所述第一特征集中各个特征元素的距离,比较各个所述距离,得到与所述特征元素的距离最小的所述第一特征集中的最近特征元素;所述最近特征元素与所述特征元素之间的距离为最近距离;
更进一步地,所述特征元素为向量;所述第一计算单元用于计算所述特征元素与所述第一特征集中各个特征元素的距离,包括用于计算所述特征元素与所述第一特征集中各个特征元素的点积。
所述第一判断单元,还用于判断所述最近距离是否大于预设阈值;
所述第一处理单元,还用于在所述最近距离大于所述预设阈值时,将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;
所述第一计算单元,还用于在所述最近距离不大于所述预设阈值时,计算所述最近特征元素和所述特征元素的均值;
所述第一处理单元,还用于在所述最近距离不大于所述预设阈值时,将所述最近特征元素替换为所述均值,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集中的对应目录元素中。
具体地,例如,原人脸特征数据库包含M个人脸特征,其中M为100万,每个人脸特征为一个长度为N的一维向量(N通常为128、512等),则原数据库O为矩阵(M,N);
第一获取单元获取第一个人脸特征a1(0,2,3)(为简化处理,此处用N取3来举例),此时第一判断单元判断第一特征集K为空,则第一处理单元将a1(0,2,3)添加到第一特征集中,并将a1(0,2,3)在矩阵O(M,N)中的身份信息O_a1添加到目录集C的对应目录元素A中,此时第一特征集更新为K(a1),目录集更新为C(A),目录元素A更新为A(O_a1);
第一获取单元获取第二个人脸特征b1(0,5,8),此时第一判断单元判断第一特征集K已不为空,第一计算单元计算b1(0,5,8)与a1(0,2,3)的点积d=a1·b1=0·0+2·5+3·8=34,由于目前K中只有a1一个特征元素,所以a1为最近特征元素,44为最近距离;
预设阈值Th为30,第一判断单元判断34大于预设阈值Th,则第一处理单元将b1(0,5,8)添加到第一特征集中,并将b1(0,5,8)在矩阵O(M,N)中的身份信息O_b1添加到目录集C的对应目录元素B中,此时第一特征集更新为K(a1,b1),目录集更新为C(A,B),目录元素B更新为B(O_b1);
第一获取单元获取第三个人脸特征a2(0,2,4),此时第一特征集K已不为空,第一计算单元计算a2(0,2,4)与a1(0,2,3)的点积d1=a1·a2=0·0+2·2+3·4=16,计算a2(0,2,4)与b1(0,5,8)的点积d1=b1·a2=0·0+5·2+8·4=42,比较16<42,所以a1为最近特征元素,16为最近距离;
第一判断单元判断16小于预设阈值Th=30,则第一处理单元将K中的a1替换为第一计算单元计算的a1’=(a1+a2)/2=(0,2,7/2),并将a2在矩阵O(M,N)中的身份信息O_a2添加到目录集C的对应目录元素A中,此时第一特征集更新为K(a1’,b1),目录集更新为C(A’,B),目录元素A更新为A’(O_a1,O_a2);目录元素B为B(O_b1);
重复以上步骤,直至矩阵O(M,N)中所有特征元素的身份信息都添加到目录集C中;通过调节预设阈值Th的大小,可以控制第一特征集K中元素的多少,即控制了第一特征集K的稀疏。
所述转换单元,用于将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。
进一步地,所述转换单元,包括投影单元和第二处理单元;
所述投影单元,用于通过Sigmoid函数将所述第一特征集中的各个特征元素的各个值都投影为在0和1之间;
所述投影单元,还用于将所述所有值在0和1之间的各个特征元素按照第三预设规则投影为各个特征元素的各个值为0或1;
更进一步地,所述投影单元,包括第二获取单元、第二判断单元和第二计算单元;
所述第二获取单元,用于获取欲投影的元素的值;
所述第二判断单元,用于判断所述值是否大于0.5;
所述第二计算单元,用于在所述值大于0.5时,将所述值投影为1;
所述第二计算单元,还用于在所述值不大于0.5,则将所述值投影为0。
所述第二处理单元,还用于将所述各个值为0或1的各个特征元素添加到所述第二特征集中。
具体地,例如,第二获取单元取第一特征集K中的特征元素a1’(0,2,7/2);投影单元将a1’进行Sigmoid转换,Sigmoid函数的表达式为
因此S(a1’)=(1/2,1/(1+1/e2),1/(1+1/e7/2));投影单元再将S(a1’)进行二进制转换,即若值大于0.5,则将所述值投影为1,若值不大于0.5,则将所述值投影为0,因此bin_S(a1’)=(0,1,1);然后第二处理单元将bin_S(a1’)添加到第二特征集B_K中,则第二特征集B_K中的特征元素的值为0或1。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种建立特征数据库的方法,其特征在于,包括:
初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;
将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;
将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。
2.根据权利要求1所述的方法,其特征在于,所述将原始数据库中的特征元素按照第一预设规则添加到所述特征数据库中,包括:
S21.从所述原始数据库中获取欲添加到所述特征数据库中的特征元素;
S22.判断所述第一特征集是否为空;
S23.若所述第一特征集为空,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;
S24.若所述第一特征集不为空,计算所述特征元素与所述第一特征集中各个特征元素的距离,比较各个所述距离,得到与所述特征元素的距离最小的所述第一特征集中的最近特征元素;所述最近特征元素与所述特征元素之间的距离为最近距离;
S25.判断所述最近距离是否大于预设阈值;
S26.若所述最近距离大于所述预设阈值,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;
S27.若所述最近距离不大于所述预设阈值,则将所述最近特征元素替换为所述最近特征元素和所述特征元素的均值,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集中的对应目录元素中;
S28.重复S21至S27,直至所述原始数据库中所有特征元素的身份信息都添加到所述目录集中。
3.根据权利要求2所述的方法,其特征在于,所述特征元素为向量;所述S24中计算所述特征元素与所述第一特征集中各个特征元素的距离,包括计算所述特征元素与所述第一特征集中各个特征元素的点积。
4.根据权利要求1或3所述的方法,其特征在于,所述将所述第一特征集中的特征元素按照第二预设规则添加到所述第二特征集中,包括:
S31.通过Sigmoid函数将所述第一特征集中的各个特征元素的各个值都投影为在0和1之间;
S32.将所述所有值在0和1之间的各个特征元素按照第三预设规则投影为各个特征元素的各个值为0或1;
S33.将所述各个值为0或1的各个特征元素添加到所述第二特征集中。
5.根据权利要求4所述的方法,其特征在于,所述S32,包括:
S321.获取欲投影的元素的值;
S322.判断所述值是否大于0.5;
S323.若所述值大于0.5,则将所述值投影为1;
S324.若所述值不大于0.5,则将所述值投影为0;
S325.重复S321至S324,直至将所述所有值在0和1之间的各个特征元素投影为各个特征元素的每个值为0或1。
6.一种建立特征数据库的装置,其特征在于,包括初始化单元、压缩单元和转换单元;
所述初始化单元,用于初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;
所述压缩单元,用于将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;
所述转换单元,用于将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。
7.根据权利要求6所述的装置,其特征在于,所述压缩单元,包括第一获取单元、第一判断单元、第一处理单元和第一计算单元;
所述第一获取单元,用于从所述原始数据库中获取欲添加到所述特征数据库中的特征元素;
所述第一判断单元,用于判断所述第一特征集是否为空;
所述第一处理单元,用于在所述第一特征集为空时,将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;
所述第一计算单元,用于在所述第一特征集不为空时,计算所述特征元素与所述第一特征集中各个特征元素的距离,比较各个所述距离,得到与所述特征元素的距离最小的所述第一特征集中的最近特征元素;所述最近特征元素与所述特征元素之间的距离为最近距离;
所述第一判断单元,还用于判断所述最近距离是否大于预设阈值;
所述第一处理单元,还用于在所述最近距离大于所述预设阈值时,将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;
所述第一计算单元,还用于在所述最近距离不大于所述预设阈值时,计算所述最近特征元素和所述特征元素的均值;
所述第一处理单元,还用于在所述最近距离不大于所述预设阈值时,将所述最近特征元素替换为所述均值,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集中的对应目录元素中。
8.根据权利要求7所述的装置,其特征在于,所述特征元素为向量;所述第一计算单元用于计算所述特征元素与所述第一特征集中各个特征元素的距离,包括用于计算所述特征元素与所述第一特征集中各个特征元素的点积。
9.根据权利要求6或8所述的装置,其特征在于,所述转换单元,包括投影单元和第二处理单元;
所述投影单元,用于通过Sigmoid函数将所述第一特征集中的各个特征元素的各个值都投影为在0和1之间;
所述投影单元,还用于将所述所有值在0和1之间的各个特征元素按照第三预设规则投影为各个特征元素的各个值为0或1;
所述第二处理单元,还用于将所述各个值为0或1的各个特征元素添加到所述第二特征集中。
10.根据权利要求9所述的装置,其特征在于,所述投影单元,包括第二获取单元、第二判断单元和第二计算单元;
所述第二获取单元,用于获取欲投影的元素的值;
所述第二判断单元,用于判断所述值是否大于0.5;
所述第二计算单元,用于在所述值大于0.5时,将所述值投影为1;
所述第二计算单元,还用于在所述值不大于0.5,则将所述值投影为0。
CN201810645951.2A 2018-06-21 2018-06-21 建立特征数据库的方法和装置 Pending CN108921065A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810645951.2A CN108921065A (zh) 2018-06-21 2018-06-21 建立特征数据库的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810645951.2A CN108921065A (zh) 2018-06-21 2018-06-21 建立特征数据库的方法和装置

Publications (1)

Publication Number Publication Date
CN108921065A true CN108921065A (zh) 2018-11-30

Family

ID=64421215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810645951.2A Pending CN108921065A (zh) 2018-06-21 2018-06-21 建立特征数据库的方法和装置

Country Status (1)

Country Link
CN (1) CN108921065A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982165A (zh) * 2012-12-10 2013-03-20 南京大学 一种大规模人脸图像检索方法
CN103927387A (zh) * 2014-04-30 2014-07-16 成都理想境界科技有限公司 图像检索系统及其相关方法和装置
CN105808709A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸识别快速检索方法及装置
CN106445939A (zh) * 2015-08-06 2017-02-22 阿里巴巴集团控股有限公司 图像检索、获取图像信息及图像识别方法、装置及系统
CN106909595A (zh) * 2016-06-20 2017-06-30 阿里巴巴集团控股有限公司 一种数据迁移方法及装置
CN107436912A (zh) * 2016-05-27 2017-12-05 三星Sds株式会社 数据迁移装置及其方法
CN107577990A (zh) * 2017-08-09 2018-01-12 武汉世纪金桥安全技术有限公司 一种基于gpu加速检索的大规模人脸识别方法
US20180075351A1 (en) * 2016-09-15 2018-03-15 Fujitsu Limited Efficient updating of a model used for data learning

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982165A (zh) * 2012-12-10 2013-03-20 南京大学 一种大规模人脸图像检索方法
CN103927387A (zh) * 2014-04-30 2014-07-16 成都理想境界科技有限公司 图像检索系统及其相关方法和装置
CN106445939A (zh) * 2015-08-06 2017-02-22 阿里巴巴集团控股有限公司 图像检索、获取图像信息及图像识别方法、装置及系统
CN105808709A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸识别快速检索方法及装置
CN107436912A (zh) * 2016-05-27 2017-12-05 三星Sds株式会社 数据迁移装置及其方法
CN106909595A (zh) * 2016-06-20 2017-06-30 阿里巴巴集团控股有限公司 一种数据迁移方法及装置
US20180075351A1 (en) * 2016-09-15 2018-03-15 Fujitsu Limited Efficient updating of a model used for data learning
CN107577990A (zh) * 2017-08-09 2018-01-12 武汉世纪金桥安全技术有限公司 一种基于gpu加速检索的大规模人脸识别方法

Similar Documents

Publication Publication Date Title
CN111639544B (zh) 基于多分支跨连接卷积神经网络的表情识别方法
Kang et al. A weight-incorporated similarity-based clustering ensemble method based on swarm intelligence
CN109711228B (zh) 一种实现图像识别的图像处理方法及装置、电子设备
Niculescu-Mizil et al. Label filters for large scale multilabel classification
Rahaman et al. Bangla language modeling algorithm for automatic recognition of hand-sign-spelled Bangla sign language
CN113435509B (zh) 基于元学习的小样本场景分类识别方法及系统
CN110929848A (zh) 基于多挑战感知学习模型的训练、跟踪方法
Alsanad et al. YOLO-V3 based real-time drone detection algorithm
Hu et al. Real-time Target Tracking Based on PCANet-CSK Algorithm
Ma et al. CapsuleRRT: Relationships-aware regression tracking via capsules
Han et al. Weakly supervised person search with region siamese networks
CN114693624A (zh) 一种图像检测方法、装置、设备及可读存储介质
Lu et al. An efficient communication intrusion detection scheme in AMI combining feature dimensionality reduction and improved LSTM
Joodi et al. Increasing validation accuracy of a face mask detection by new deep learning model-based classification
CN108921065A (zh) 建立特征数据库的方法和装置
Zheng et al. Visual cognition–inspired multi-view vehicle re-identification via Laplacian-regularized correlative sparse ranking
CN116051924A (zh) 一种图像对抗样本的分治防御方法
Liu et al. Flexi-compression: a flexible model compression method for autonomous driving
Li et al. Multi-scale traffic sign detection algorithm based on improved YOLO_V4
Lee et al. Capturing long-range dependencies in video captioning
CN113743251B (zh) 一种基于弱监督场景的目标搜索方法及装置
CN116229112A (zh) 一种基于多重注意力的孪生网络目标跟踪方法
Li Recognizing multiple overlapping objects in image: an optimal formulation
CN113392868A (zh) 一种模型训练的方法、相关装置、设备及存储介质
CN113627237A (zh) 基于局部最大对齐的后期融合人脸图像聚类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20181130

Assignee: Apple R&D (Beijing) Co.,Ltd.

Assignor: BEIJING MOSHANGHUA TECHNOLOGY Co.,Ltd.

Contract record no.: 2019990000055

Denomination of invention: Feature database establishing method and device

License type: Common License

Record date: 20190211

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181130