CN115733616B - 一种生物特征认证方法和系统 - Google Patents
一种生物特征认证方法和系统 Download PDFInfo
- Publication number
- CN115733616B CN115733616B CN202211343949.2A CN202211343949A CN115733616B CN 115733616 B CN115733616 B CN 115733616B CN 202211343949 A CN202211343949 A CN 202211343949A CN 115733616 B CN115733616 B CN 115733616B
- Authority
- CN
- China
- Prior art keywords
- biometric
- vector
- standard
- authenticated
- plaintext
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 95
- 239000013598 vector Substances 0.000 claims abstract description 318
- 238000012545 processing Methods 0.000 claims description 14
- 238000013139 quantization Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000013175 transesophageal echocardiography Methods 0.000 description 54
- 230000006870 function Effects 0.000 description 16
- 239000000523 sample Substances 0.000 description 9
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 3
- OTZZZISTDGMMMX-UHFFFAOYSA-N 2-(3,5-dimethylpyrazol-1-yl)-n,n-bis[2-(3,5-dimethylpyrazol-1-yl)ethyl]ethanamine Chemical compound N1=C(C)C=C(C)N1CCN(CCN1C(=CC(C)=N1)C)CCN1C(C)=CC(C)=N1 OTZZZISTDGMMMX-UHFFFAOYSA-N 0.000 description 2
- 241001441724 Tetraodontidae Species 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- KJONHKAYOJNZEC-UHFFFAOYSA-N nitrazepam Chemical compound C12=CC([N+](=O)[O-])=CC=C2NC(=O)CN=C1C1=CC=CC=C1 KJONHKAYOJNZEC-UHFFFAOYSA-N 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Collating Specific Patterns (AREA)
Abstract
本发明涉及一种生物特征认证方法和系统,方法包括步骤:从待认证信息中提取待认证生物特征向量;将待认证生物特征向量输入TEE中,并进行向量索引,得到待认证生物特征索引,然后在TEE中将待认证生物特征索引与预存的标准生物特征索引库进行向量相似度匹配,返回最接近的N个标准生物特征索引;根据返回的N个标准生物特征索引,检索出对应的明文的标准生物特征向量;将待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量进行对比,获取认证结果。本发明的生物特征认证方法和系统,对明文的标准生物特征向量进行了加密,并通过TEE保护了密钥,具有更好的隐私安全性。
Description
技术领域
本发明涉及生物特征认证技术领域,更具体地涉及一种隐私保护的大规模的生物特征认证方法和系统。
背景技术
随着人工智能技术的快速发展,尤其是深度学习在生物特征认证(例如人脸认证、指纹认证等)领域的长足进步,生物特征认证技术被广泛使用在实名认证、刷脸闸机通行、在线支付等领域。
在早期的生物特征认证中,厂商需要将包含人脸或指纹等原始数据上传到云端服务器进行比对,这样容易造成严重的个人隐私隐患甚至违法。后来一些厂商开始在人脸闸机等设备侧把采集的人脸图片等生物特征直接提取成特征向量,然后再与本地的生物特征库进行对比。虽然这种方式相对于云模式提升了隐私保护强度,但是保存在设备本地的生物特征库一旦泄露,攻击者就可以还原出原始生物特征,造成严重的信息泄露。
因此,亟需一种更安全的认证方式。
发明内容
本发明的目的之一在于提供一种生物特征认证方法,在TEE中对各标准生物特征向量进行了加密,并保存加密的密钥,相比于明文保存生物特征向量的方法,具有更好的隐私安全性。
基于上述目的,本发明提供了一种生物特征认证方法,其包括步骤:从待认证信息中提取待认证生物特征向量;
将待认证生物特征向量输入TEE中,并进行向量索引,得到待认证生物特征索引,然后在TEE中将待认证生物特征索引与预存的标准生物特征索引库进行向量相似度匹配,返回最接近的N个标准生物特征索引;
根据返回的N个标准生物特征索引,检索出对应的明文的标准生物特征向量;
将待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量进行对比,获取认证结果。
进一步地,在一些实施方式中,所述待认证信息包括人脸图片、指纹和声纹。
更进一步地,在一些实施方式中,采用Facenet模型、Fisherfaces模型或Eigenfaces模型从所述人脸图片中提取待认证生物特征向量。
进一步地,在一些实施方式中,预存的标准生物特征索引库的获得方法包括:
对明文的各标准生物特征向量进行向量索引,形成标准生物特征索引库并保存在TEE中;
在TEE中对明文的各标准生物特征向量进行加密,生成加密后的各标准生物特征向量并保存在本地的存储设备中,加密的密钥保存在TEE中。
更进一步地,在一些实施方式中,所述标准生物特征向量包括人脸特征向量、指纹特征向量和声纹特征向量。
更进一步地,在一些实施方式中,对明文的标准生物特征向量进行加密的方法包括对称加密方法。
进一步地,在一些实施方式中,根据返回的N个标准生物特征索引,检索出对应的标准生物特征向量进一步包括:
根据返回的N个标准生物特征索引,在本地检索出对应的加密后的人脸特征向量;
将N个标准生物特征索引对应的加密后的人脸特征向量输入TEE,在TEE中解密成对应的明文的标准生物特征向量。
进一步地,在一些实施方式中,将待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量进行对比并获取认证结果进一步包括:
对比待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量之间的距离,选取距离最小的明文的标准生物特征向量作为认证结果。
更进一步地,在一些实施方式中,所述距离为欧式距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离或马氏距离。
进一步地,在一些实施方式中,向量索引的方法包括局部敏感哈希方法、基于近邻图的方法和基于乘积量化的方法。
本发明的另一目的在于提供一种生物特征认证系统,在TEE中对各标准生物特征向量进行了加密,并保存加密的密钥,相比于明文保存生物特征向量的系统,具有更好的隐私安全性。
基于上述目的,本发明提供一种生物特征认证系统,包括依次通信连接的:
特征提取模块,设置为从待认证信息中提取待认证生物特征向量;
第一处理模块,设置为将待认证生物特征向量输入TEE中,并进行向量索引,得到待认证生物特征索引,然后在TEE中将待认证生物特征索引与预存的标准生物特征索引库进行向量相似度匹配,返回最接近的N个标准生物特征索引;
第二处理模块,设置为根据返回的N个标准生物特征索引,检索出对应的明文的标准生物特征向量;
对比模块,设置为将待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量进行对比,获取认证结果。
进一步地,在一些实施方式中,所述待认证信息包括人脸图片、指纹和声纹。
更进一步地,在一些实施方式中,所述特征提取模块采用Facenet模型、Fisherfaces模型或Eigenfaces模型从所述人脸图片中提取待认证生物特征向量。
进一步地,在一些实施方式中,预存的标准生物特征索引库的获得方法包括:
对明文的各标准生物特征向量进行向量索引,形成标准生物特征索引库并保存在TEE中;
在TEE中对明文的各标准生物特征向量进行加密,生成加密后的各标准生物特征向量并保存在本地的存储设备中,加密的密钥保存在TEE中。
更进一步地,在一些实施方式中,所述标准生物特征向量包括人脸特征向量、指纹特征向量和声纹特征向量。
更进一步地,在一些实施方式中,对明文的标准生物特征向量进行加密的方法包括对称加密方法。
更进一步地,在一些实施方式中,所述第二处理模块包括相互通信连接的:
检索单元,设置为根据返回的N个标准生物特征索引,在本地检索出对应的加密后的人脸特征向量;
解密单元,设置为将N个标准生物特征索引对应的加密后的人脸特征向量输入TEE,在TEE中解密成对应的明文的标准生物特征向量。
进一步地,在一些实施方式中,所述对比模块进一步设置为:
对比待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量之间的距离,选取距离最小的明文的标准生物特征向量作为认证结果。
进一步地,在一些实施方式中,所述距离为欧式距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离或马氏距离。
进一步地,在一些实施方式中,所述第一处理模块采用局部敏感哈希方法、基于近邻图的方法或基于乘积量化的方法进行向量索引。本发明还提供了一种可读存储介质,其上存储有计算机程序,当计算机程序在计算机中执行时,令计算机执行如上所述的生物特征认证方法的步骤。
本发明也提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,当所述处理器执行所述可执行代码时,其执行如上所述的生物特征认证方法的步骤。
本发明的生物特征认证方法及系统,对明文的各标准生物特征向量进行了加密,并通过TEE保护了密钥,相对于明文保存标准生物特征向量的方法,具有更好的隐私安全性;同时在仅在内存非常有限的TEE中保存了标准生物特征索引库和密钥,相对于直接将生物特征向量加载到TEE的方法,压缩比超过200倍以上,因此可以支持数量更大规模的生物特征对比认证。
附图说明
图1为根据本发明一实施例的生物特征认证方法的流程图;
图2为根据本发明另一实施例的生物特征认证系统的结构框图。
具体实施方式
下面结合附图,给出本发明的较佳实施例,并予以详细描述。
如图1所示,本发明一实施例提供一种生物特征认证方法,包括步骤:
100:从待认证信息中提取待认证生物特征向量。
在一些实施例中,待认证信息可以包括人脸图片、指纹、声纹或其他生物特征,相应地,待认证生物特征向量包括人脸特征向量(也可称人脸为Embedding向量)、指纹特征向量、声纹特征向量或其他生物特征向量。待认证信息通常是由需要进行生物特征认证的设备(例如,摄像设备、指纹采集设备等)进行采集。采集后,再采用现有的算法或模型从其中提取待认证生物特征向量。例如,对于人脸特征向量,可采用Facenet、Fisherfaces、Eigenfaces等算法实现。
200:将待认证生物特征向量输入TEE中,并进行向量索引,得到待认证生物特征索引,然后在TEE中将待认证生物特征索引与预存的标准生物特征索引库进行向量相似度匹配,返回最接近的N个标准生物特征索引。
向量索引是指通过某种数学量化模型,对向量构建一种时间和空间都比较高效的数据索引结构,使得能够实时地获取跟查询向量尽可能最相近的K个向量。向量索引也叫近似最近邻搜索(Approximate Nearest Search,ANNS),通过牺牲精度换取时间和空间的方式,从海量的样本中实时获取跟查询最近似的样本。向量索引对应于一个或多个原始向量,通过其可以查询到该一个或多个原始向量。由于向量索引的过程会对原始向量进行压缩,因此得到的向量索引的大小相比于原始向量会变小,从而占用更小的内存。
在一个具体的实施例中,向量索引方法可以采用局部敏感哈希(Local SensitiveHashing,LSH)方法。哈希,顾名思义,就是将连续的实值散列化为0、1的离散值。在散列化过程中,对散列化函数(也就是哈希函数)有一定要求。当一个函数(或者更准确的说,哈希函数家族)具有如下属性的时候,可以认为哈希函数是局部敏感的:相近的样本点对比相远的样本点更容易发生碰撞。对于LSH,涉及到的主要的参数有三个:K,每一个哈希表的哈希函数(空间划分)数目;L,哈希表(每一个哈希表有K个哈希函数)的数目;T,近邻哈希筒的数目,即the number of probes。这三个参数可以按如下顺序进行:首先,根据可使用的内存大小选取L,然后在K和T之间做出折中:哈希函数数目K越大,相应地,近邻哈希桶的数目T也应该设置得比较大,反之K越小,L也可以相应减小。获取K和L最优值的方式可以按照如下方式进行:对于每个固定的K,如果在查询样本集上获得了想要的精度,则此时T的值即为合理的值。在对T进行调参的时候,无需重新构建哈希表,甚至还可以采用二分搜索的方式来加快T参数的选取过程。LSH可采用LSH开源工具库来实现,例如LSHash和FALCONN等。
在一些其他的实施例中,向量索引的方法还可以包括但不限于基于近邻图的最近邻搜索方法和基于乘积量化的最近邻搜索方法。
可信执行环境(Trusted Execution Environment,TEE)是在Arm Trustzone技术建立起来的,通过硬件和软件隔离,为操作系统提供安全服务,例如指纹的录入对比、支付校验认证等操作。通过TEE对明文进行加密,可得到密文和密钥,密钥保存在TEE中并由其保护,这样,即使攻击者得到密文,由于没有密钥,也无法得到明文,因此可以保护明文的安全,从而保护隐私。
标准生物特征索引库是预先存储在TEE中的,其包括各标准生物特征向量的索引,每个索引均指向一个或多个标准生物特征向量,通过索引可得到各标准生物特征向量。在一些实施例中,标准生物特征索引库可通过下述方法获得:
S1:对明文的各标准生物特征向量进行向量索引,形成标准生物特征索引库并保存在TEE中;
S2:在TEE中对明文的各标准生物特征向量进行加密,生成加密后的各标准生物特征向量并保存在本地的存储设备中,加密的密钥保存在TEE中。
各标准生物特征向量是预先采集的,用于后续生物认证时进行对比。在本实施例中,本地存储的是加密后的各标准生物特征向量,而不是明文的各标准生物特征向量,加密的密钥保存在TEE中,只有通过密钥,才能由加密后的各标准生物特征向量得到明文的各标准生物特征向量。由于密钥被TEE保护,因此即使本地的加密后的各标准生物特征向量泄漏,攻击者也无法得到明文的各标准生物特征向量,安全性更高。
在一些实施例中,标准生物特征向量可以为人脸特征向量、指纹特征向量、声纹特征向量或其他生物特征向量,从而实现人脸认证、指纹认证、声纹认证或其他生物特征的认证。
在本实施例中,标准生物特征索引库是由明文的各标准生物特征向量进行向量索引后得到,其对应的是明文的各标准生物特征向量,而加密后的各标准生物特征向量与明文的各标准生物特征向量是一一对应的(即密文和明文是一一对应的),因此,明文的各标准生物特征向量的标准生物特征索引库也可以作为密文的索引,即通过标准生物特征向量索引库可得到加密后的各标准生物特征向量。
由于通过向量索引对各标准生物特征向量进行了压缩,这样即可以实现快速查询,又可以大幅缩减其内存占用。加密后的标准生物特征向量保存在本地的存储设备中,TEE中仅保存标准生物特征索引库和密钥,既可以增加安全性,又可以减少对TEE内存的占用,从而支持数量更大规模的生物特征对比认证。
步骤S1中,对明文的各标准生物特征向量进行向量索引的方法与对待认证生物特征进行向量索引的方法相同,因此,待认证生物特征索引的格式与标准生物特征索引库的格式相同,可以进行向量相似度对比,从而得到与待认证生物特征索引相似的标准生物特征索引。
在一些实施例中,步骤S2中的加密方法包括但不限于对称加密方法。在对称加密方法中,数据发信方将明文(原始数据)和加密密钥一起经过特殊加密算法处理后,使其变成复杂的加密密文发送出去。收信方收到密文后,若想解读原文,则需要使用加密用过的密钥及相同算法的逆算法对密文进行解密,才可使其恢复成可读明文。对称加密方法中,使用的密钥只有一个,发信方和收信方都使用这个密钥对数据进行加密和解密。对称加密方法具有计算量小、加密速度快和加密效率高等特点。常用的对称加密方法包括DES算法、3DES算法、TDEA算法、Blowfish算法、RC5算法和IDEA算法等等。
在一个更具体的实施例中,DES算法把64位的明文输入块变为数据长度为64位的密文块输出,其中8位为奇偶校验位,另外56位作为密码的长度。首先,DES把输入的64位数据块按位重新组合,并把输出分为L0、R0两部分,每部分各长32位,并进行前后置换,最终由L0输出左32位,R0输出右32位,根据这个法则经过16次迭代运算后,得到L16、R16,将此作为输入,进行与初始置换相反的逆置换,即得到密文输出。
在一些实施例中,向量相似度匹配方法可通过计算向量间的距离(例如欧式距离、曼哈顿距离等)来进行匹配。向量间的距离表示向量间的相似度,两个向量间的距离越小,可认为两个向量越相似。
在一个更具体的实施例中,可通过计算欧式距离来进行向量相似度匹配。欧式距离可以理解为连接两个点的线段的长度,例如,对于向量x和y来说,两者间的距离公式如下:
其中,D(x,y)为向量x和y之间的距离,n为向量中的元素的个数,xi和yi分别为向量x和y中的第i个元素。
在一些其他实施例中,向量相似度匹配还可以采用余弦相似度、皮尔森相关系数等来进行匹配。
进行向量相似度匹配后,可以从标准生物特征索引库中返回与待认证生物特征向量最接近的Top N索引(即与待认证生物特征向量最接近的N个标准生物特征索引),其表示这N个标准生物特征索引对应的标准生物特征向量与待认证生物特征向量最接近(或相似),这样即可以将对比范围从各标准生物特征向量缩小至N个标准生物特征索引对应的标准生物特征向量。
由于经过向量索引压缩后,各标准生物特征向量会产生损失,因此,在步骤200中,返回最接近的N个标准生物特征索引,然后在后续步骤中从这N个标准生物特征索引对应的标准生物特征向量中找出最接近的,避免因有损压缩而导致认证结果不准确。
在一些实施例中,N的数值可以根据需要进行选择,例如为5个、10个或更多个。可以理解的是,N的数值越大,其选择的近似索引也就越多,结果也会越精确,但是相应的,其计算时间也会越长。
300:根据返回的N个标准生物特征索引,检索出对应的明文的标准生物特征向量。
步骤300进一步包括步骤:
S11:根据返回的N个标准生物特征索引,在本地检索出对应的加密后的人脸特征向量;
S12:将N个标准生物特征索引对应的加密后的人脸特征向量输入TEE,在TEE中解密成对应的明文的标准生物特征向量。
由于在本实施例中,本地的存储设备中只保存有加密后的标准生物特征向量,而没有明文的标准生物特征向量,因此需要先得到加密后的标准生物特征向量,然后再解密成对应的明文。如前所述,明文的各标准生物特征向量与加密后的各标准生物特征向量是一一对应的,因此,可根据N个标准生物特征索引检索得到N个加密后的标准生物特征向量,然后在本地REE中检索得到对应的加密后的标准生物特征向量,最后在TEE中解密成对应的明文的生物特征向量。
400:将待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量进行对比,获取认证结果。
在一些实施例中,可通过对比待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量间的距离来得到认证结果。距离代表两特征向量之间的相似程度,距离越近,说明两者越相似,因此通过选取距离最小值,可找到与待认证生物特征向量最接近的标准生物特征向量,从而完成认证。
在一个具体的实施例中,步骤S400进一步包括:
计算待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量间的距离,然后对比各个距离,以距离最小的明文的标准生物特征向量作为认证结果。
在一些实施例中,距离可以采用包括但不限于以下几种:欧式距离(EuclideanDistance)、曼哈顿距离(Manhattan Distance)、切比雪夫距离(Chebyshev Distance)、闵可夫斯基距离(Minkowski Distance)和马氏距离(Mahalanobis Distance)。
本发明实施例的生物特征认证方法,对明文的各标准生物特征向量进行了加密,并通过TEE保护了密钥,相对于明文保存标准生物特征向量的方法,具有更好的隐私安全性;同时在仅在内存非常有限的TEE中保存了标准生物特征索引库和密钥,相对于直接将生物特征向量加载到TEE的方法,压缩比超过200倍以上,因此可以支持数量更大规模的生物特征对比认证。
如图2所示,本发明另一实施例提供一种生物特征认证系统,包括依次通信连接的特征提取模块10、第一处理模块20、第二处理模块30、对比模块40。
特征提取模块10设置为从待认证信息中提取待认证生物特征向量。
在一些实施例中,待认证信息可以包括人脸图片、指纹、生纹或其他生物特征,相应地,待认证生物特征向量包括人脸特征向量(也可称人脸为Embedding向量)、指纹特征向量、声纹特征向量或其他生物特征向量。待认证信息通常是由需要进行生物特征认证的设备进行采集。采集后,再采用现有的算法或模型从其中提取待认证生物特征向量。例如,对于人脸特征向量,可采用Facenet、Fisherfaces、Eigenfaces等算法实现。
第一处理模块20设置为将待认证生物特征向量输入TEE中,并进行向量索引,得到待认证生物特征索引,然后在TEE中将待认证生物特征索引与预存的标准生物特征索引库进行向量相似度匹配,返回最接近的N个标准生物特征索引。
在一个具体的实施例中,向量索引方法可以采用局部敏感哈希(Local SensitiveHashing,LSH)方法。哈希,顾名思义,就是将连续的实值散列化为0、1的离散值。在散列化过程中,对散列化函数(也就是哈希函数)有一定要求。当一个函数(或者更准确的说,哈希函数家族)具有如下属性的时候,可以认为哈希函数是局部敏感的:相近的样本点对比相远的样本点更容易发生碰撞。对于LSH,涉及到的主要的参数有三个:K,每一个哈希表的哈希函数(空间划分)数目;L,哈希表(每一个哈希表有K个哈希函数)的数目;T,近邻哈希筒的数目,即the number of probes。这三个参数可以按如下顺序进行:首先,根据可使用的内存大小选取L,然后在K和T之间做出折中:哈希函数数目K越大,相应地,近邻哈希桶的数目T也应该设置得比较大,反之K越小,L也可以相应减小。获取K和L最优值的方式可以按照如下方式进行:对于每个固定的K,如果在查询样本集上获得了想要的精度,则此时T的值即为合理的值。在对T进行调参的时候,无需重新构建哈希表,甚至还可以采用二分搜索的方式来加快T参数的选取过程。LSH可采用LSH开源工具库来实现,例如LSHash和FALCONN等。
在一些其他的实施例中,向量索引的方法还可以包括但不限于基于近邻图的最近邻搜索方法和基于乘积量化的最近邻搜索方法。
标准生物特征索引库是预先存储在TEE中的,其包括各标准生物特征向量的索引,每个索引均指向一个或多个标准生物特征向量,通过索引可得到各标准生物特征向量。在一些实施例中,标准生物特征索引库可通过下述方法获得:
S1:对明文的各标准生物特征向量进行向量索引,形成标准生物特征索引库并保存在TEE中;
S2:在TEE中对明文的各标准生物特征向量进行加密,生成加密后的各标准生物特征向量并保存在本地的存储设备中,加密的密钥保存在TEE中。
各标准生物特征向量是预先采集的,用于后续生物认证时进行对比。在本实施例中,本地存储的是加密后的各标准生物特征向量,而不是明文的各标准生物特征向量,加密的密钥保存在TEE中,只有通过密钥,才能由加密后的各标准生物特征向量得到明文的各标准生物特征向量。由于密钥被TEE保护,因此即使本地的加密后的各标准生物特征向量泄漏,攻击者也无法得到明文的各标准生物特征向量,安全性更高。
在一些实施例中,标准生物特征向量可以为人脸特征向量、指纹特征向量、声纹特征向量或其他生物特征向量,从而实现人脸认证、指纹认证、声纹认证或其他生物特征的认证。
在本实施例中,标准生物特征索引库是由明文的各标准生物特征向量进行向量索引后得到,其对应的是明文的各标准生物特征向量,而加密后的各标准生物特征向量与明文的各标准生物特征向量是一一对应的(即密文和明文是一一对应的),因此,明文的各标准生物特征向量的标准生物特征索引库也可以作为密文的索引,即通过标准生物特征向量索引库可得到加密后的各标准生物特征向量。由于通过向量索引对各标准生物特征向量进行了压缩,这样即可以实现快速查询,又可以大幅缩减其内存占用。加密后的标准生物特征向量保存在本地的存储设备中,TEE中仅保存标准生物特征索引库和密钥,既可以增加安全性,又可以减少对TEE内存的占用,从而支持数量更大规模的生物特征对比认证。
步骤S1中,对明文的各标准生物特征向量进行向量索引的方法与对待认证生物特征进行向量索引的方法相同,因此,待认证生物特征索引的格式与标准生物特征索引库的格式相同,可以进行向量相似度对比,从而得到与待认证生物特征索引相似的标准生物特征索引。
在一些实施例中,步骤S2中的加密方法包括但不限于对称加密方法,例如DES算法、3DES算法、TDEA算法、Blowfish算法、RC5算法和IDEA算法等等。
在一些实施例中,向量相似度匹配方法可通过计算向量间的距离(例如欧式距离、曼哈顿距离等)、余弦相似度、皮尔森相关系数等来进行匹配。
进行向量相似度匹配后,可以从标准生物特征索引库中返回与待认证生物特征向量最接近的Top N索引(即与待认证生物特征向量最接近的N个标准生物特征索引),其表示这N个标准生物特征索引对应的标准生物特征向量与待认证生物特征向量最接近(或相似),这样即可以将对比范围从各标准生物特征向量缩小至N个标准生物特征索引对应的标准生物特征向量。
由于经过向量索引压缩后,各标准生物特征向量会产生损失,因此,在第一处理模块20中,返回最接近的N个标准生物特征索引,然后在后续模块中从这N个标准生物特征索引对应的标准生物特征向量中找出最接近的,避免因有损压缩而导致认证结果不准确。
在一些实施例中,N的数值可以根据需要进行选择,例如为5个、10个或更多个。可以理解的是,N的数值越大,其选择的近似索引也就越多,结果也会越精确,但是相应的,其计算时间也会越长。
第二处理模块30设置为根据返回的N个标准生物特征索引,检索出对应的明文的标准生物特征向量。
由于在本实施例中,本地的存储设备中只保存有加密后的标准生物特征向量,而没有明文的标准生物特征向量,因此需要先得到加密后的标准生物特征向量,然后再解密成对应的明文。如前所述,明文的各标准生物特征向量与加密后的各标准生物特征向量是一一对应的,因此,可根据N个标准生物特征索引检索得到N个加密后的标准生物特征向量,然后在本地REE中检索得到对应的加密后的标准生物特征向量,最后在TEE中解密成对应的明文的生物特征向量。
在一个具体的实施例中,第二处理模块30包括检索单元31和与检索单元31数据通信的解密单元32。其中,检索单元31设置为根据返回的N个标准生物特征索引,在本地检索出对应的加密后的人脸特征向量;解密单元32设置为将N个标准生物特征索引对应的加密后的人脸特征向量输入TEE,在TEE中解密成对应的明文的标准生物特征向量。
对比模块40设置为将待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量进行对比,获取认证结果。
在一些实施例中,可通过对比待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量间的距离来得到认证结果。距离代表两特征向量之间的相似程度,距离越近,说明两者越相似,因此通过选取距离最小值,可找到与待认证生物特征向量最接近的标准生物特征向量,从而完成认证。
在一个具体的实施例中,对比模块40进一步设置为:
计算待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量间的距离,然后对比各个距离,以距离最小的明文的标准生物特征向量作为认证结果。
在一些实施例中,距离可以采用包括但不限于以下几种:欧式距离(EuclideanDistance)、曼哈顿距离(Manhattan Distance)、切比雪夫距离(Chebyshev Distance)、闵可夫斯基距离(Minkowski Distance)和马氏距离(Mahalanobis Distance)。
本发明实施例的生物特征认证系统,对明文的各标准生物特征向量进行了加密,并通过TEE保护了密钥,相对于明文保存标准生物特征向量的方法,具有更好的隐私安全性;同时在仅在内存非常有限的TEE中保存了标准生物特征索引库和密钥,相对于直接将生物特征向量加载到TEE的方法,压缩比超过200倍以上,因此可以支持数量更大规模的生物特征对比认证。
本发明的又一实施例提供一种可读存储介质,其上存储有计算机程序,当计算机程序在计算机中执行时,令计算机执行本发明上述实施例中的生物特征认证方法的步骤。
本发明又一实施例提供一种计算设备,其包括存储器和处理器,存储器中存储有可执行代码,当处理器执行可执行代码时,其执行本发明上述实施例中的生物特征认证方法的步骤。
以上所述的,仅为本发明的较佳实施例,并非用以限定本发明的范围,本发明的上述实施例还可以做出各种变化。即凡是依据本发明申请的权利要求书及说明书内容所作的简单、等效变化与修饰,皆落入本发明专利的权利要求保护范围。本发明未详尽描述的均为常规技术内容。
Claims (18)
1.一种生物特征认证方法,包括步骤:
从待认证信息中提取待认证生物特征向量;
将待认证生物特征向量输入TEE中,并进行向量索引,得到待认证生物特征索引,然后在TEE中将待认证生物特征索引与预存的标准生物特征索引库进行向量相似度匹配,返回最接近的N个标准生物特征索引;
根据返回的N个标准生物特征索引,检索出对应的明文的标准生物特征向量;其包括步骤:根据返回的N个标准生物特征索引,在本地检索出对应的加密后的标准生物特征向量;将N个标准生物特征索引对应的加密后的标准生物特征向量输入TEE,在TEE中解密成对应的明文的标准生物特征向量;
将待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量进行对比,获取认证结果。
2.根据权利要求1所述的生物特征认证方法,所述待认证信息包括人脸图片、指纹和声纹。
3.根据权利要求2所述的生物特征认证方法,采用Facenet模型、Fisherfaces模型或Eigenfaces模型从所述人脸图片中提取待认证生物特征向量。
4.根据权利要求1所述的生物特征认证方法,预存的标准生物特征索引库的获得方法包括:
对明文的各标准生物特征向量进行向量索引,形成标准生物特征索引库并保存在TEE中;
在TEE中对明文的各标准生物特征向量进行加密,生成加密后的各标准生物特征向量并保存在本地的存储设备中,加密的密钥保存在TEE中。
5.根据权利要求4所述的生物特征认证方法,所述标准生物特征向量包括人脸特征向量、指纹特征向量和声纹特征向量。
6.根据权利要求4所述的生物特征认证方法,对明文的标准生物特征向量进行加密的方法包括对称加密方法。
7.根据权利要求1所述的生物特征认证方法,将待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量进行对比并获取认证结果进一步包括:
对比待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量之间的距离,选取距离最小的明文的标准生物特征向量作为认证结果。
8.根据权利要求7所述的生物特征认证方法,所述距离为欧式距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离或马氏距离。
9.根据权利要求1所述的生物特征认证方法,向量索引的方法包括局部敏感哈希方法、基于近邻图的方法和基于乘积量化的方法。
10.一种生物特征认证系统,包括依次通信连接的:
特征提取模块,设置为从待认证信息中提取待认证生物特征向量;
第一处理模块,设置为将待认证生物特征向量输入TEE中,并进行向量索引,得到待认证生物特征索引,然后在TEE中将待认证生物特征索引与预存的标准生物特征索引库进行向量相似度匹配,返回最接近的N个标准生物特征索引;
第二处理模块,设置为根据返回的N个标准生物特征索引,检索出对应的明文的标准生物特征向量;所述第二处理模块包括相互通信连接的:检索单元,设置为根据返回的N个标准生物特征索引,在本地检索出对应的加密后的标准生物特征向量;解密单元,设置为将N个标准生物特征索引对应的加密后的标准生物特征向量输入TEE,在TEE中解密成对应的明文的标准生物特征向量;
对比模块,设置为将待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量进行对比,获取认证结果。
11.根据权利要求10所述的生物特征认证系统,所述待认证信息包括人脸图片、指纹和声纹。
12.根据权利要求11所述的生物特征认证系统,所述特征提取模块采用Facenet模型、Fisherfaces模型或Eigenfaces模型从所述人脸图片中提取待认证生物特征向量。
13.根据权利要求10所述的生物特征认证系统,预存的标准生物特征索引库的获得方法包括:
对明文的各标准生物特征向量进行向量索引,形成标准生物特征索引库并保存在TEE中;
在TEE中对明文的各标准生物特征向量进行加密,生成加密后的各标准生物特征向量并保存在本地的存储设备中,加密的密钥保存在TEE中。
14.根据权利要求13所述的生物特征认证系统,所述标准生物特征向量包括人脸特征向量、指纹特征向量和声纹特征向量。
15.根据权利要求13所述的生物特征认证系统,对明文的标准生物特征向量进行加密的方法包括对称加密方法。
16.根据权利要求10所述的生物特征认证系统,所述对比模块进一步设置为:
对比待认证生物特征向量和N个标准生物特征索引对应的明文的标准生物特征向量之间的距离,选取距离最小的明文的标准生物特征向量作为认证结果。
17.根据权利要求16所述的生物特征认证系统,所述距离为欧式距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离或马氏距离。
18.根据权利要求10所述的生物特征认证系统,所述第一处理模块采用局部敏感哈希方法、基于近邻图的方法或基于乘积量化的方法进行向量索引。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211343949.2A CN115733616B (zh) | 2022-10-31 | 2022-10-31 | 一种生物特征认证方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211343949.2A CN115733616B (zh) | 2022-10-31 | 2022-10-31 | 一种生物特征认证方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115733616A CN115733616A (zh) | 2023-03-03 |
CN115733616B true CN115733616B (zh) | 2023-06-09 |
Family
ID=85294126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211343949.2A Active CN115733616B (zh) | 2022-10-31 | 2022-10-31 | 一种生物特征认证方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115733616B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111917799A (zh) * | 2020-08-14 | 2020-11-10 | 支付宝(杭州)信息技术有限公司 | 基于验证信息、基于隐私数据的验证方法、装置及设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3692681B1 (en) * | 2017-10-06 | 2024-03-20 | Btq Ag | A system and method for quantum-safe authentication, encryption and decryption of information |
CN111008620A (zh) * | 2020-03-05 | 2020-04-14 | 支付宝(杭州)信息技术有限公司 | 目标用户识别方法、装置及存储介质、电子设备 |
CN112836222B (zh) * | 2021-01-25 | 2022-12-13 | 北京航空航天大学 | 面向智能推荐场景的安全搜索方法及装置 |
CN112948795B (zh) * | 2021-02-19 | 2022-04-12 | 支付宝(杭州)信息技术有限公司 | 保护隐私的身份认证方法及装置 |
CN113949701A (zh) * | 2021-09-06 | 2022-01-18 | 天翼电子商务有限公司 | 一种基于可信执行环境的密文搜索方法 |
CN113722692B (zh) * | 2021-09-07 | 2022-09-02 | 墨奇科技(北京)有限公司 | 身份识别的装置及其方法 |
-
2022
- 2022-10-31 CN CN202211343949.2A patent/CN115733616B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111917799A (zh) * | 2020-08-14 | 2020-11-10 | 支付宝(杭州)信息技术有限公司 | 基于验证信息、基于隐私数据的验证方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115733616A (zh) | 2023-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107480163B (zh) | 一种云环境下支持隐私保护的高效密文图像检索方法 | |
US10374789B2 (en) | Encrypting and decrypting information | |
Yuan et al. | SEISA: Secure and efficient encrypted image search with access control | |
Yang et al. | A comprehensive survey on secure outsourced computation and its applications | |
CN108959567B (zh) | 一种云环境下适用于大规模图像的安全检索方法 | |
CN108363689B (zh) | 面向混合云的隐私保护多关键词Top-k密文检索方法及系统 | |
CN108959478A (zh) | 一种云环境下的密文图像检索方法及系统 | |
Osorio-Roig et al. | Stable hash generation for efficient privacy-preserving face identification | |
Zhao et al. | Iris template protection based on local ranking | |
Xu et al. | A large-scale secure image retrieval method in cloud environment | |
US9715595B2 (en) | Methods, systems, and devices for securing distributed storage | |
US10083194B2 (en) | Process for obtaining candidate data from a remote storage server for comparison to a data to be identified | |
CN112685753B (zh) | 一种用于加密数据存储的方法及设备 | |
CN116776386A (zh) | 一种云服务数据信息安全管理方法及系统 | |
CN110535630B (zh) | 密钥生成方法、装置及存储介质 | |
CN112860933B (zh) | 密文图像检索方法、装置、终端设备及存储介质 | |
CN115733616B (zh) | 一种生物特征认证方法和系统 | |
Li et al. | Encrypted jpeg image retrieval using histograms of transformed coefficients | |
Jin et al. | Efficient blind face recognition in the cloud | |
US11501580B1 (en) | Methods and systems for implementing secure biometric recognition | |
Mohammed et al. | Secure Content Based Image Retrieval System Using Deep Learning | |
Iida et al. | A content-based image retrieval scheme using compressible encrypted images | |
CN115733617B (zh) | 一种生物特征认证方法和系统 | |
CN115278673A (zh) | 基于联合生物识别的轻量级生物认证方法及系统 | |
Huang et al. | Efficient privacy-preserving content-based image retrieval in the cloud |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |