CN114417294A - 特征向量数据库的更新方法、装置、设备及介质 - Google Patents

特征向量数据库的更新方法、装置、设备及介质 Download PDF

Info

Publication number
CN114417294A
CN114417294A CN202210036515.1A CN202210036515A CN114417294A CN 114417294 A CN114417294 A CN 114417294A CN 202210036515 A CN202210036515 A CN 202210036515A CN 114417294 A CN114417294 A CN 114417294A
Authority
CN
China
Prior art keywords
feature vector
feature
user
database
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210036515.1A
Other languages
English (en)
Inventor
王伟鹏
康家梁
卞凯
冀乃庚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN202210036515.1A priority Critical patent/CN114417294A/zh
Publication of CN114417294A publication Critical patent/CN114417294A/zh
Priority to TW111137394A priority patent/TWI804441B/zh
Priority to PCT/CN2022/123997 priority patent/WO2023134232A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Collating Specific Patterns (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种特征向量数据库的更新方法、装置、设备及介质,属于数据处理领域。该方法包括:获取业务请求中的第一生物特征;根据第一生物特征,通过第一算法模型和第二算法模型,分别得到第一特征向量和第二特征向量,第一特征向量数据库包括基于第一算法模型得到的样本特征向量;根据第一样本特征向量对应的第一用户的关联特征向量,对第二特征向量进行有效性验证;在第二特征向量的有效性验证通过的情况下,基于第二特征向量,得到第一用户的第二样本特征向量,并将第二样本特征向量存储入第二算法模型配置的第二特征向量数据库。根据本申请实施例能够在得到特征向量数据库所需的样本特征向量的过程中避免对用户的隐私数据带来风险。

Description

特征向量数据库的更新方法、装置、设备及介质
技术领域
本申请属于数据处理领域,尤其涉及一种特征向量数据库的更新方法、装置、设备及介质。
背景技术
生物特征识别技术是利用人体所固有的生理特征或行为特征来进行个人身份鉴定的技术。随着生物特征识别技术的发展,生物特征识别技术的应用领域也越来越广泛,例如,生物特征识别技术可应用于支付、通行、考勤等领域。
在生物特征识别技术所依赖的网络结构发生变化或生物特征识别算法需进行优化的情况下,需要对生物特征识别的算法模型进行更新升级。但不同版本的算法模型得到的生物特征的特征向量会有所不同,针对不同版本的算法模型需要生成对应的特征向量的数据库。
现阶段会存储用户注册时的原始生物特征,在需要生成不同版本的算法模型对应的数据库时,利用原始生物特征生成新的特征向量,再利用新的特征向量形成新的数据库。但原始生物特征属于用户的隐私数据,存储用户的原始生物特征的安全风险较大,也就是说,在获取新的数据库所需的特征向量过程中会对用户的隐私数据带来较大的安全风险。
发明内容
本申请实施例提供一种特征向量数据库的更新方法、装置、设备及介质,能够在得到特征向量数据库所需的样本特征向量的过程中避免对用户的隐私数据带来风险。
第一方面,本申请实施例提供一种特征向量数据库的更新方法,包括:获取业务请求中的第一生物特征;根据第一生物特征,通过第一算法模型和第二算法模型,分别得到第一特征向量和第二特征向量,第一算法模型与第二算法模型的版本不同,第一算法模型配置有第一特征向量数据库,第一特征向量数据库包括基于第一算法模型得到的样本特征向量;根据第一样本特征向量对应的第一用户的关联特征向量,对第二特征向量进行有效性验证,第一样本特征向量为第一特征向量数据库中与第一特征向量匹配成功的样本特征向量,关联特征向量包括以下至少部分:第一特征向量、第二特征向量、第一算法模型对应的至少部分历史特征向量;在第二特征向量的有效性验证通过的情况下,基于第二特征向量,得到第一用户的第二样本特征向量,并将第二样本特征向量存储入第二算法模型配置的第二特征向量数据库。
第二方面,本申请实施例提供一种特征向量数据库的更新装置,包括:获取模块,用于获取业务请求中的第一生物特征;计算模块,用于根据第一生物特征,通过第一算法模型和第二算法模型,分别得到第一特征向量和第二特征向量,第一算法模型与第二算法模型的版本不同,第一算法模型配置有第一特征向量数据库,第一特征向量数据库包括基于第一算法模型得到的样本特征向量;有效验证模块,用于根据第一样本特征向量对应的第一用户的关联特征向量,对第二特征向量进行有效性验证,第一样本特征向量为第一特征向量数据库中与第一特征向量匹配成功的样本特征向量,关联特征向量包括以下至少部分:第一特征向量、第二特征向量、第一算法模型对应的至少部分历史特征向量;处理模块,用于在第二特征向量的有效性验证通过的情况下,基于第二特征向量,得到第一用户的第二样本特征向量,并将第二样本特征向量存储入第二算法模型配置的第二特征向量数据库。
第三方面,本申请实施例提供一种特征向量数据库的更新设备,包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面的特征向量数据库的更新方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面的特征向量数据库的更新方法。
本申请实施例提供一种特征向量数据库的更新方法、装置、设备及介质,在两个版本不同的算法模型并行运行的过程中,可根据用户的业务请求中的生物特征,通过第一算法模型实时生成第一特征向量,通过第二算法模型实时生成第二特征向量。可根据第一特征向量、第二特征向量和历史特征向量中的至少部分,对两个算法模型中未完全上线的算法模型即第二算法模型得到的特征向量进行有效性验证,在有效性验证通过的情况下,将该特征向量作为用户的样本特征向量存储入还未完成的特征向量数据库即第二特征向量数据库中。在得到第二特征向量数据库中的样本特征向量的过程中,不需存储用户注册的原始生物特征,从而保证在得到特征向量数据库所需的样本特征向量的过程中不会对用户的隐私数据带来风险,提高用户的隐私数据的安全性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的特征向量数据库的更新方法的应用场景的一示例的示意图;
图2为本申请提供的特征向量数据库的更新方法的一实施例的流程图;
图3为本申请实施例提供的特征向量在高维空间中的夹角的一示例的示意图;
图4为本申请提供的特征向量数据库的更新方法的另一实施例的流程图;
图5为本申请提供的特征向量数据库的更新方法的又一实施例的流程图;
图6为本申请提供的特征向量数据库的更新方法的再一实施例的流程图;
图7为本申请提供的特征向量数据库的更新装置的一实施例的结构示意图;
图8本申请提供的特征向量数据库的更新装置的另一实施例的结构示意图;
图9为本申请提供的特征向量数据库的更新装置的又一实施例的结构示意图;
图10为本申请提供的特征向量数据库的更新装置的再一实施例的结构示意图;
图11为本申请提供的特征向量数据库的更新设备的一实施例的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
生物特征识别技术是利用人体所固有的生理特征或行为特征来进行个人身份鉴定的技术。生物特征识别技术的应用范围非常广,例如,可应用于支付、通行、考勤等领域。在生物特征识别技术所依赖的网络结构发生变化或生物特征识别算法需进行优化的情况下,需要对生物特征识别的算法模型进行更新升级,即从一版本的算法模型迁移至另一版本的算法模型。但不同版本的算法模型得到的生物特征的特征向量会有所不同。针对同一生物特征,一个版本的算法模型得到的特征向量很可能无法在另一个版本的算法模型中使用。为了保证更新升级后的算法模型能够使用,可针对不同版本的算法模型生成对应的特征向量数据库。更新升级后的算法模型对应的特征向量数据库中的特征向量可基于用户注册时的原始生物特征生成。但若要获取到用户注册时的原始生物特征,则需要在用户注册后存储用户的原始生物特征。但原始生物特征属于用户的隐私数据,存储用户的原始生物特征的安全风险较大,也就是说,在获取新的特征向量数据库所需的特征向量过程中会对用户的隐私数据带来较大的安全风险。
为了便于说明,在本申请实施例中将两个版本不同的算法模型称为第一算法模型和第二算法模型。第一算法模型的版本与第二算法模型的版本不同。第一算法模型为原先使用的算法模型,第一算法模型配置有第一特征向量数据库,第一特征向量数据库中包括较为完整的用户的样本特征向量。第一特征向量数据库中的样本特征向量可作为利用第一算法模型进行生物特征识别过程中识别用户的样本。第二算法模型可为迁移后的算法模型。例如,第一算法模型为更新升级前的算法模型,第二算法模型为更新升级后的算法模型。第二算法模型配置有第二特征向量数据库。第二特征向量数据库中的样本特征向量可作为利用第二算法模型进行生物特征识别过程识别用户的样本。第二特征向量数据库中的样本特征向量可利用本申请实施例提供的特征向量数据库的更新方法获取得到。在得到与第二算法模型对应的包括较为完整的用户的样本特征的第二特征向量数据库前,可使用第一算法模型和第一特征向量数据库进行生物特征识别。在得到与第二算法模型对应的包括较为完整的用户的样本特征的第二特征向量数据库后,可使用第二算法模型和第二特征向量数据库进行生物特征识别。
本申请实施例提供的一种特征向量数据库的更新方法,可使生物特征识别技术的两个不同的算法模型并行运行,在此过程中根据用户的业务请求中的生物特征,实时生成特征向量,根据两个不同的算法模型得到的特征向量、历史特征向量中的至少部分,可对还未完全上线的算法模型得到的特征向量进行有效性验证,在有效性验证通过的情况下,将该特征向量作为用户的样本特征向量存储入还未完成的特征向量数据库中。在得到特征向量数据库中的样本特征向量的过程中,不需存储用户注册的原始生物特征,从而保证在得到特征向量数据库所需的样本特征向量的过程中不会对用户的隐私数据带来风险,提高用户的隐私数据的安全性。
本申请实施例提供的特征向量数据库的更新方法可应用于从未更新升级的算法模型到更新升级后的算法模型的迁移过程中。图1为本申请实施例提供的特征向量数据库的更新方法的应用场景的一示例的示意图。如图1所示,本申请实施例提供的特征向量数据库的更新方法可涉及终端设备11和服务器12。
终端设备11为提供生物特征识别业务的前端设备,可采集用户的生物特征。终端设备11可与服务器12交互。在一些示例中,算法模型可设置于终端设备11中,由终端设备11根据用户的生物特征生成特征向量,向服务器12发送特征向量,由服务器12对特征向量进行存储、匹配、识别等操作。在另一些示例中,终端设备11向服务器12发送采集的用户的生物特征,由服务器12生成特征向量,并对特征向量进行存储、匹配、识别等操作。
服务器12为进行生物特征识别的后台设备,可对基于生物特征生成的特征向量进行存储、匹配、识别等操作。在一些示例中,服务器12可接收由终端设备11基于用户的生物特征生成的生物特征向量。在另一些示例中,服务器12可接收由终端设备11发送的用户的生物特征,根据生物特征生成对应的特征向量。
在一些示例中,上述终端设备11和服务器12也可集成为一装置或一系统,共同实现本申请实施例中的特征向量数据库的更新方法。
本申请提供一种特征向量数据库的更新方法,可应用于生物特征识别业务从一版本的算法模型向另一版本的算法模型迁移的场景中。该特征向量数据库的更新方法可由特征向量数据库的更新装置执行,在此并不限定。图2为本申请提供的特征向量数据库的更新方法的一实施例的流程图。如图2所示,该特征向量数据库的更新方法可包括步骤S201至步骤S
在步骤S201中,获取业务请求中的第一生物特征。
在从第一算法模型向第二算法模型迁移的过程中,第一算法模型和第二算法模型并行运行,可正常进行生物特征识别。在迁移还未完成的情况下,可利用第一算法模型和第一特征向量数据库进行用户的生物特征识别。在从第一算法模型向第二算法模型迁移的过程中,获取业务请求中的第一生物特征。业务请求为需要进行生物特征识别的业务的请求,例如,业务请求可包括利用生物特征识别的支付业务请求、利用生物特征识别的通行业务请求、利用生物特征识别的考勤业务请求等等,在此并不限定。
在本申请实施例中,并不限定第一生物特征的类型。例如,第一生物特征可包括人脸、掌纹、指纹、虹膜、声纹等。
在步骤S202中,根据第一生物特征,通过第一算法模型和第二算法模型,分别得到第一特征向量和第二特征向量。
第一算法模型与所述第二算法模型的版本不同,在本申请实施例中,是从第一算法模型迁移至第二算法模型,对应地,第一算法模型为迁移前的算法模型,第二算法模型为迁移后的算法模型。第一特征向量数据库适配于第一算法模型。第一特征向量数据库包括基于第一算法模型得到的样本特征向量。样本特征向量为进行生物特征识别所使用的样本。
将第一生物特征输入第一算法模型,第一算法模型可输出与第一生物特征对应的第一特征向量,即第一特征向量为基于第一算法模型得到的特征向量。同理,将第一生物特征输入第二算法模型,第二算法模型输出与第一生物特征对应的第二特征向量,即第二特征向量为基于第二算法模型得到的特征向量。
在一些实施例中,为了保证用户生物特征识别的安全性,可对业务请求的用户进行活体检测。在一些示例中,可在活体检测通过后,再根据第一生物特征,通过第一算法模型和第二算法模型得到第一特征向量和第二特征向量。在另一些示例中,可在活体检测通过后,再继续进行第二特征向量的有效性验证。
在步骤S203中,根据第一样本特征向量对应的第一用户的关联特征向量,对第二特征向量进行有效性验证。
第一样本特征向量为第一特征向量数据库中与第一特征向量匹配成功的样本特征向量。具体地,在得到第一特征向量后,可在第一特征向量数据库中查找与第一特征向量匹配成功的样本特征向量。两个特征向量匹配成功指,两个特征向量的相似度大于等于预设的判断阈值。判断阈值为用于判定两个特征向量所指示的用户为同一用户的门限值。两个特征向量的相似度大于等于预设的判断阈值即两个特征向量匹配成功,表示两个特征向量所指示的用户为同一用户。第一特征向量数据库中存储有样本特征向量与用户的对应关系,可根据第一样本特征向量,确定与第一样本特征向量对应的第一用户。
第一用户的关联特征向量包括基于第一用户的生物特征得到的特征向量。关联特征向量包括以下至少部分:第一特征向量、第二特征向量、第一算法模型对应的至少部分历史特征向量。第一算法模型对应的至少部分历史特征向量为通过第一算法模型得到的至少部分历史特征向量。对应地,第一用户的关联特征向量包括以下至少部分:第一生物特征对应的第一特征向量、第一生物特征对应的第二特征向量、第一算法模型生成的第一用户的至少部分历史特征向量。
可利用第一用户的关联特征的单独校验或关联校验,来确定第一生物特征对应的第二生物特征向量是否为第一用户的有效的特征向量,即对第二特征向量进行有效性验证。若有效性验证通过,表示第一生物特征对应的第二生物特征向量为第一用户的有效的特征向量。若有效性验证通过,表示第一生物特征对应的第二生物特征向量有可能不是第一用户的有效的特征向量,可进行进一步验证。
在一些示例中,有效性验证可包括以下一项或两项以上:可靠性验证、第一差异验证、第二差异验证。
可靠性验证可为利用根据相同生物特征生成的第一特征向量对第二特征向量的可靠性的验证。第一差异验证可为利用第二算法模型的误差偏移和第一算法模型的误差偏移,对第二特征向量的与第一特征向量的误差差异性的验证。第二差异验证可为利用基于同一用户的多次业务请求得到的多个第二特征向量,对该用户的第二特征向量的自身的误差差异性的验证。
在有效性验证包括可靠性验证、第一差异验证、第二差异验证中的一项的情况下,若这一项验证通过,则认为有效性验证通过。在有效性验证包括可靠性验证,且有效性验证还包括第一差异验证、第二差异验证中的至少一项的情况下,可优先进行可靠性验证,若可靠性验证未通过,但有效性验证包括的第一差异验证、第二差异验证中的至少一项通过,也可认为有效性验证通过。在有效性不包括可靠性验证,且有效性验证还包括第一差异验证、第二差异验证中的至少一项的情况下,若有效性验证验证包括的第一差异验证、第二差异验证通过,才能认为有效性验证通过。
下面对上述可靠性验证、第一差异验证、第二差异验证进行详细说明。
进行可靠性验证,需要的关联特征向量包括第一特征向量和第一算法模型对应的历史特征向量。第一用户的第一算法模型对应的历史特征向量为在本次生成第一用户的第一特征向量之前通过第一算法模型生成的第一用户的特征向量。可靠性验证可包括步骤a1和步骤a2。
步骤a1,分别计算第一特征向量与第一算法模型对应的至少部分历史特征向量的第一相似度。
第一算法模型对应的至少部分历史特征向量可包括根据最近N次获取的业务请求中生物特征通过第一算法模型生成的N个特征向量。N为正整数,N的取值可根据场景、需求、经验等设定,在此并不限定。例如,N可为5。
第一相似度是第一特征向量与历史特征向量的相似度。第一特征向量与至少部分历史特征向量中的每个历史特征向量均可计算得到一个第一相似度。例如,第一算法模型对应的至少部分历史特征向量包括5个历史特征向量A1、历史特征向量A2、历史特征向量A3、历史特征向量A4和历史特征向量A5,则可计算得到第一特征向量与历史特征向量A1的第一相似度、第一特征向量与历史特征向量A2的第一相似度、第一特征向量与历史特征向量A3的第一相似度、第一特征向量与历史特征向量A4的第一相似度和第一特征向量与历史特征向量A5的第一相似度。
步骤a2,若不存在小于第一判定阈值的第一相似度,则确定可靠性验证通过。
第一判定阈值为判定第一特征向量对应的用户与历史特征向量对应的用户为同一用户的门限值,可根据场景、需求、经验等设定,在此并不限定。若第一相似度大于等于第一判定阈值,表示第一特征向量对应的用户与历史特征向量对应的用户为同一用户。若第一相似度小于第一判定阈值,表示第一特征向量对应的用户与历史特征向量对应的用户不是同一用户。在本申请实施例中,在所有第一相似度均大于等于第一判定阈值的情况下,才确定可靠性验证通过。
若存在小于第一判定阈值的第一相似度阈值,则确定可靠性验证未通过。
进行第一差异验证,需要的关联特征向量包括第一特征向量和第二特征向量。第一差异验证可包括步骤b1和步骤b2。
步骤b1,利用基于第一用户的多次业务请求得到的多个第二特征向量,计算得到多个第二特征向量之间的最大夹角。
在每次根据第一用户的业务请求中的生物特征通过第二算法模型得到第二特征向量的情况下,可缓存第二特征向量,在同一用户的第二特征向量的数量达到验证要求数量时,利用达到验证要求数量的第二特征向量,计算每两个第二特征向量之间的夹角,并选取多个夹角中的最大夹角。
图3为本申请实施例提供的特征向量在高维空间中的夹角的一示例的示意图。图3示出了四个特征向量,分别为特征向量1、特征向量2、特征向量3和特征向量4。如图4所示,特征向量1、特征向量2、特征向量3和特征向量4中两两存在夹角,其中多个特征向量之间的最大夹角为特征向量1与特征向量4之间的夹角。
计算两个特征向量之间的夹角,可先计算两个特征向量的夹角余弦,然后再根据夹角余弦算出夹角。例如,两个特征向量的夹角余弦可根据以下关系式(1)计算:
Figure BDA0003468581950000101
其中,
Figure BDA0003468581950000102
为一个特征向量;
Figure BDA0003468581950000103
为另一个特征向量;
Figure BDA0003468581950000104
为特征向量
Figure BDA0003468581950000105
和特征向量
Figure BDA0003468581950000106
的夹角余弦;
Figure BDA0003468581950000107
为特征向量
Figure BDA0003468581950000108
的模;
Figure BDA0003468581950000109
为特征向量
Figure BDA00034685819500001010
的模。
步骤b2,利用基于第一用户的多次业务请求得到的多个第一特征向量,计算得到多个第一特征向量之间的最大夹角。
在每次根据第一用户的业务请求中的生物特征通过第一算法模型得到第一特征向量的情况下,可缓存第一特征向量,在同一用户的第一特征向量的数量达到验证要求数量时,利用达到验证要求数量的第一特征向量,计算每两个第一特征向量之间的夹角,并选取多个夹角中的最大夹角。
第一特征向量之间的夹角的计算可参见上述特征向量之间的夹角以及夹角余弦计算的相关内容,在此不再赘述。
步骤b3,若多个第二特征向量之间的最大夹角小于多个第一特征向量之间的最大夹角,则确定第一差异验证通过。
由于第二算法模型为迁移后的算法模型,即第二算法模型的版本高于第一算法模型的版本,因此,第二算法模型得到的同一用户的第二特征向量之间的差异波动应小于第一算法模型得到的同一用户的第一特征向量之间的差异波动,以将第二算法模型的误差控制在第一算法模型的误差之内。不同特征向量之间的夹角可体现不同特征向量之间的差异波动,可通过第二特征向量之间的最大夹角和第一特征向量之间的最大夹角的对比,来判断第二算法模型的误差是否在第一算法模型的误差内。若第二特征向量之间的最大夹角小于第一特征向量之间的最大夹角,表示第二算法模型的误差在第一算法模型的误差内,认为通过了第一差异验证。若第二特征向量之间的最大夹角大于第一特征向量之间的最大夹角,表示第二算法模型的误差超出了第一算法模型的误差,认为未通过第一差异验证。
进行第二差异验证,需要的关联特征向量包括第二特征向量。第二差异验证可包括步骤c1至步骤c3。
步骤c1,获取基于第一用户的多次业务请求得到的多个第二特征向量。
在每次根据第一用户的业务请求中的生物特征通过第二算法模型得到第二特征向量的情况下,可缓存第二特征向量,从而得到第一用户对应的多个第二特征向量。
步骤c2,分别计算多个第二特征向量中每两个第二特征向量的第二相似度。
在获取的第一用户对应的第二特征向量的数量达到一定数量的情况下,计算达到一定数量的第二特征向量中两两第二特征向量的相似度。第二相似度为多个第二特征向量中每两个第二特征向量的相似度。例如,若多个第二特征向量包括第二特征向量B1、第二特征向量B2和第二特征向量B3,则可计算得到第二特征向量B1与第二特征向量B2的相似度、第二特征向量B1与第二特征向量B3的相似度以及第二特征向量B2与第二特征向量B3的相似度。
步骤c3,若不存在小于第二判定阈值的第二相似度,则确定第二差异验证通过。
第二判定阈值为判定多个第二特征向量之间的差异是否在可接受范围内的门限值,可根据场景、需求、经验等设定,在此并不限定。若两第二特征向量的第二相似度大于等于第二判定阈值,表示这两个第二特征向量之间的差异在可接受范围内。若两第二特征向量的第二相似度小于第二判定阈值,表示这两个第二特征向量之间的差异较大,不在可接受范围内,可能是采集的生物特征出现问题或第二算法模型出现波动。在本申请实施例中,在所有第二相似度均大于等于第二判定阈值的情况下,才确定第二差异验证通过。
在步骤S204中,在第二特征向量的有效性验证通过的情况下,基于第二特征向量,得到第一用户的第二样本特征向量,并将第二样本特征向量存储入第二算法模型配置的第二特征向量数据库。
第二特征向量的有效性验证通过,表示第二特征向量有效,可根据第二特征向量得到第二样本特征向量。第二样本特征向量可作为第一用户在第二特征向量数据库中的样本特征向量存储入第二特征向量数据库中。
在一些示例中,可直接将第二特征向量确定为第二样本特征向量。例如,有效性验证包括可靠性验证,在可靠性验证通过的情况下,即可将与第一特征向量对应的第二特征向量直接作为第一用户的第二样本特征向量。
在一些示例中,可计算基于第一用户的多次业务请求得到的多个第二特征向量的均值向量,将均值向量确定为第二样本特征向量。多个第二特征向量的均值向量的计算与多个特征向量的均值向量计算相同,特征向量的均值向量可根据以下关系式(2)至(4)计算:
Xi=(xi1,xi2,…,xip)T,i=1,2,…,N (2)
Figure BDA0003468581950000121
Figure BDA0003468581950000122
其中,Xi为第i个特征向量;xi1为第i个特征向量中的第1个元素;xip为第i个特征向量中的第p个元素;
Figure BDA0003468581950000123
为均值向量;
Figure BDA0003468581950000124
为均值向量中的第j个元素。
例如,在有效性验证包括第一差异验证和/或第二差异验证的情况下,在有效性验证通过的情况下,可将基于第一用户的多次业务请求得到的多个第二特征向量的均值向量作为第一用户的第二样本特征向量。
在又一些示例中,可将第一用户的多次业务请求得到的多个第二特征向量中最近一次获取到的第二特征向量,确定为第二样本特征向量。例如,在有效性验证包括第一差异验证和/或第二差异验证的情况下,在有效性验证通过的情况下,可将基于第一用户的多次业务请求得到的多个第二特征向量中最近一次得到的第二特征向量作为第一用户的第二样本特征向量。
可重复上述步骤S201至步骤S204,直至第二特征向量数据库中样本特征向量对应的用户齐全或趋于齐全,即特征向量数据库的更新完成,从第一特征向量数据库迁移至第二特征向量数据库。
在本申请实施例中,在两个版本不同的算法模型并行运行的过程中,可根据用户的业务请求中的生物特征,通过第一算法模型实时生成第一特征向量,通过第二算法模型实时生成第二特征向量。可根据第一特征向量、第二特征向量和历史特征向量中的至少部分,对两个算法模型中未完全上线的算法模型即第二算法模型得到的特征向量进行有效性验证,在有效性验证通过的情况下,将该特征向量作为用户的样本特征向量存储入还未完成的特征向量数据库即第二特征向量数据库中。在得到第二特征向量数据库中的样本特征向量的过程中,不需存储用户注册的原始生物特征,从而保证在得到特征向量数据库所需的样本特征向量的过程中不会对用户的隐私数据带来风险,提高用户的隐私数据的安全性。
在上述过程中,用户对于特征向量数据库的更新是无感知的,可在不打扰用户、不增加用户操作的情况下完成特征向量数据库的更新,实现样本特征向量的迁移,提高了用户体验。
通过有效性验证,如可靠性验证、第一差异验证、第二差异验证等,可保证更新得到的特征向量数据库即第二特征向量数据库中样本特征向量的精确性。
而且,由于随着时间的推移,用户的某些生物特征可能会发生变化。在存储用户注册的原始生物特征,根据原始生物特征得到用于进行生物特征识别的样本特征向量的相关技术中,可能会存在误识别。例如,用户进行生物特征识别所采用的是人脸特征,但用户为青少年,由于青少年的发育变化,可能会导致青少年的人脸特征与注册所用的原始人脸特征相差较大,从而导致生物特征识别出现问题。在本申请实施例中,根据用户的业务请求中的生物特征的特征向量得到用于生物特征识别的特征向量数据库中的样本特征向量,用户业务请求为最近发生的业务请求,从而避免了用于生物特征识别的特征向量数据库中数据过于老旧导致的误识别,从而提高了生物特征识别的精确度。
在一些实施例中,业务请求除了用户为未知用户,需要进行1:N的生物特征识别的业务请求以外,还有可能为用户为已知用户,需要进行1:1的生物特征识别的业务请求,如注册业务请求、登录业务请求等。在业务请求的用户为已知用户的情况下,若第一特征向量与第一特征向量数据库中已知用户的样本特征向量匹配成功,将第二特征向量存储入第二特征向量数据库,以作为已知用户在第二特征向量数据库中的样本特征向量。
由于进行1:1的生物特征识别的业务请求的用户为已知用户,所以业务请求中的生物特征可视为可靠有效的生物特征,同理,该情况下基于业务请求中的生物特征得到的第一特征向量匹配成功,即可保证基于业务请求中的生物特征得到的第二特征向量可靠有效,能够直接加入第二特征向量数据库作为该已知用户的样本特征向量。
在一些示例中,为了进一步保证已知用户的生物特征识别的安全性,可对已知用户进行活体检测,在活体检测通过且第一特征向量与第一特征向量数据库中已知用户的样本特征向量匹配成功的情况下,再将第二特征向量存储入第二特征向量数据库。
在一些示例中,若上述有效性验证未通过,可通过辅助操作以确定是否可采用第二样本特征向量作为第二特征向量数据库中的样本特征向量。图4为本申请提供的特征向量数据库的更新方法的另一实施例的流程图。图4与图2的不同之处在于,图4所示的特征向量数据库的更新方法还可包括步骤S205至步骤S208。
在步骤S205中,在第二特征向量的有效性验证未通过的情况下,发起第一辅助验证请求。
第一辅助验证请求可用于提示用户输入辅助信息。
在步骤S206中,接收响应于第一辅助验证请求输入的辅助信息。
辅助信息可用于辅助确定第二特征向量的有效性。辅助信息具体可包括能够进行身份验证的信息。在一些示例中,所述辅助信息包括以下一项或两项以上:短信验证码、用户终端令牌、用户身份信息、第二生物特征。
用户终端令牌为动态口令,用于进行身份验证。用户身份信息可包括用户手机号、用户邮箱地址等,在此并不限定。第二生物特征的类型与第一生物特征的类型不同。例如,第一生物特征为人脸,第二生物特征为掌纹。又例如,第一生物特征为人脸,第二生物特征为声纹。
在步骤S207中,利用辅助信息进行身份验证,得到身份验证结果。
身份验证结果可表征辅助信息指示的用户是否为第一用户。
例如,辅助信息包括短信验证码和/或用户终端令牌,可根据接收的短信验证码和/或用户终端令牌与发送给第一用户的短信验证码和/或用户终端令牌是否一致,生成身份验证结果。若一致,则身份验证结果表征辅助信息指示的用户为第一用户;若不一致,则身份验证结果表征辅助信息指示的用户不是第一用户。
又例如,辅助信息包括用户身份信息,可根据用户身份信息与第一用户的注册信息是否一致,生成身份验证结果。若一致,则身份验证结果表征辅助信息指示的用户为第一用户;若不一致,则身份验证结果表征辅助信息指示的用户不是第一用户。
再例如,辅助信息包括第二生物特征,可根据利用第二生物特征进行身份验证得到的用户是否为第一用户,生成身份验证结果。若利用第二生物特征进行身份验证得到的用户为第一用户,则身份验证结果表征辅助信息指示的用户为第一用户;若利用第二生物特征进行身份验证得到的用户不是第一用户,则身份验证结果表征辅助信息指示的用户不是第一用户。
在步骤S208中,若身份验证结果表征辅助信息指示的用户为第一用户,则基于第二特征向量,得到第一用户的第二样本特征向量,并将第二样本特征向量存储入第二算法模型配置的第二特征向量数据库。
身份验证结果表征辅助信息指示的用户为第一用户,表示第二特征向量具有有效性,基于第二特征向量可得到存储入第二特征向量数据库作为第一用户的样本特征向量的特性向量。
在一些实施例中,在基于第二特征向量得到的第二样本特征向量存储入第二特征向量数据库后,还可在后续获取到业务请求的情况下进一步验证第二样本特征向量的有效性并及时进行更新。图5为本申请提供的特征向量数据库的更新方法的又一实施例的流程图。图5与图2的不同之处在于,图5所示的特征向量数据库的更新方法还可包括步骤S209至步骤S214。
在步骤S209中,获取新接收的业务请求中的第三生物特征。
第三生物特征为新接收的业务请求中的生物特征。第三生物特征的类型与第一生物特征的类型相同。
在步骤S210中,根据第三生物特征,通过第一算法模型和第二算法模型,分别得到与第三生物特征对应的第一特征向量和第二特征向量。
根据第三生物特征,通过第一算法模型得到的是与第三生物特征对应的第一特征向量。根据第三生物特征,通过第二算法模型得到的是与第三生物特征对应的第二特征向量。
在步骤S211中,在第一特征向量数据库中查找与第三生物特征对应的第一特征向量匹配的第三样本特征向量,并确定第三样本特征向量对应的第二用户。
第三样本特征向量与第三生物特征对应的第一特征向量的相似度大于预设的判定阈值。根据第三生物特征对应的第一特征向量,利用第一特征向量数据库进行生物特征识别,第二用户为在第一特征向量数据库进行生物特征识别识别到的用户。
在步骤S212中,在第二特征向量数据库存在第二用户的样本特征向量的情况下,利用第三生物特征对应的第二特征向量在第二特征向量数据库中进行匹配。
若第二特征向量数据库存在第二用户的样本特征向量,可在第二特征向量数据库中,利用第三生物特征对应的第二特征向量进行1:N的生物特征识别,即利用第三生物特征对应的第二特征向量在第二特征向量数据库中进行匹配,以验证已经存储入第二特征向量数据库中的第二用户的样本特征向量的有效性。
在步骤S213中,若第二特征向量数据库中与第三生物特征对应的第二特征向量匹配成功的为第二用户的样本特征向量,则确定第二用户的样本特征向量有效。
第二特征向量数据库中与第三生物特征对应的第二特征向量匹配成功的为第二用户的样本特征向量,表示利用第三生物特征对应的第二特征向量进行的1:N的生物特征识别成功且正确,可确定第二特征向量数据库中第二用户的样本特征向量有效。
在步骤S214中,若第二特征向量数据库中无与第三生物特征对应的第二特征向量匹配成功的样本特征向量,或,第二特征向量数据库中与第三生物特征对应的第二特征向量匹配成功不是第二用户的样本特征向量,将第二用户的样本特征向量从第二特征向量数据库中删除,继续获取包括第二用户的生物特征的业务请求,以再次得到存储入第二特征向量数据库的第二用户的样本特征向量。
第二特征向量数据库中无与第三生物特征对应的第二特征向量匹配成功的样本特征向量,表示利用第三生物特征对应的第二特征向量进行的1:N的生物特征识别失败,可确定第二特征向量数据库中第二用户的样本特征向量无效。
第二特征向量数据库中与第三生物特征对应的第二特征向量匹配成功不是第二用户的样本特征向量,表示利用第三生物特征对应的第二特征向量进行的1:N的生物特征识别错误,可确定第二特征向量数据库中第二用户的样本特征向量无效。
在第二特征向量数据库中第二用户的样本特征向量无效的情况下,将第二用户的样本特征向量从第二特征向量数据库中删除,可再次执行上述实施例中步骤S201至步骤S208中的相关步骤,以得到存储入第二特征向量数据库的第二用户的新的样本特征向量。
在一些实施例中,可根据第二特征向量数据库中样本特征向量的用户的数量,确定是否完全上线第二算法模型,结束从第一算法模型到第二算法模型的迁移。图6为本申请提供的特征向量数据库的更新方法的再一实施例的流程图。图6与图2的不同之处在于,图6所示的特征向量数据库的更新方法还可包括步骤S215至步骤S217。
在步骤S215中,在第二特征向量数据库中存在样本特征向量的用户占第一特征向量数据库中存在样本特征向量的用户的比例小于预设完成覆盖率的情况下,利用第一算法模型和第一特征向量数据库进行业务请求的生物特征识别。
预设完成覆盖率为判定第一特征向量数据库对应的用户是否已基本迁移至第二特征向量数据库的门限值,可根据场景、需求、经验等设定,在此并不限定。
第二特征向量数据库中存在样本特征向量的用户占第一特征向量数据库中存在样本特征向量的用户的比例为实时覆盖率。实时覆盖率小于预设完成覆盖率,表示以第二特征向量数据库中存在样本特征向量的用户的数量,还不足以支持生物特征识别的业务。在该情况下,业务请求的生物特征识别仍然利用第一算法模型和第一特征向量数据库进行。
在一些示例中,在上述实施例中需要根据多个第二特征向量进行有效性的情况下,若第二特征向量的数量未达到验证要求数量,可保留第一特征向量数据库中第二特征向量对应的第三用户的样本特征向量。在第三用户发起业务请求的情况下,利用第一算法模型和第一特征向量数据库进行业务请求的生物特征识别,以避免第三用户的样本特征向量还未存储入第二特征向量时无法对第三用户的业务请求进行生物特征识别的情况。
在步骤S216中,在第二特征向量数据库中存在样本特征向量的用户占第一特征向量数据库中存在样本特征向量的用户的比例大于等于预设完成覆盖率的情况下,利用第二算法模型和第二特征向量数据库进行业务请求的生物特征识别。
实时覆盖率大于等于预设完成覆盖率,表示以第二特征向量数据库中存在样本特征向量的用户的数量,已经足以支持生物特征识别的业务。在该情况下,业务请求的生物特征识别可利用第二算法模型和第二特征向量数据库进行。
例如,预设完成覆盖率为98%,在实时覆盖率小于98%时,接收到用户的业务请求,仍然采用第一算法模型和第一特征向量数据库进行生物特征识别;在实时覆盖率大于等于98%时,可采用第二算法模型和第二特征向量数据库进行生物特征识别。
在步骤S217中,若在第二特征向量数据库中未查找到与基于业务请求中的第四生物特征对应的第二特征向量匹配的样本特征向量,根据第四生物特征,利用第一算法模型和第一特征向量数据库进行业务请求的生物特征识别。
第四生物特征为业务请求中的生物特征,第四生物特征的类型与第一生物特征的类型相同。
在采用第二算法模型和第二特征向量数据库进行生物特征识别的过程中,也可能出现未识别到匹配的样本特征向量的情况,这有可能是业务低频用户发起的业务请求,由于该业务低频用户的活动频率较低,导致在特征向量库迁移的过程中,未得到该业务低频用户的第二样本特征向量,即在第二特征向量数据库中还未存储该业务低频用户的样本特征向量。在此情况下,为了能够实现业务低频用户的生物特征识别,可利用第一算法模型和第一特征向量数据库对该业务低频用户进行业务请求的生物特征识别,以保证生物特征识别的全面性。
在一些示例中,若在第二特征向量数据库中未查找到与基于业务请求中的第四生物特征对应的第二特征向量匹配的样本特征向量,可发起第二辅助验证请求。接收响应于第二辅助验证请求输入的辅助信息,利用辅助信息进行根据第四生物特征进行生物特征识别得到的第三用户的身份验证,得到身份验证结果。若身份验证结果表征辅助信息指示的用户为第三用户,将基于第四生物特征对应的第二特征向量得到的第三样本特征向量存储入第二特征向量数据库,以作为第三用户的在第二特征向量数据库中的样本特征向量。
第二辅助验证请求可用于提示用户输入辅助信息。辅助信息、身份验证、身份验证结果等的具体内容可参见上述实施例中的相关说明,在此不再赘述。
身份验证结果表征辅助信息指示的用户为第三用户,表示第四生物特征对应的第二特征向量具有有效性,基于第四生物特征对应的第二特征向量可得到存储入第二特征向量数据库作为第三用户的样本特征向量的特性向量。
本申请还提供一种特征向量数据库的更新装置,该特征向量数据库的更新装置可实现为服务器和/或前端设备,在此并不限定。图7为本申请提供的特征向量数据库的更新装置的一实施例的结构示意图。如图7所示,该特征向量数据库的更新装置300可包括获取模块301、计算模块302、有效验证模块303和处理模块304。
获取模块301可用于获取业务请求中的第一生物特征。
计算模块302可用于根据第一生物特征,通过第一算法模型和第二算法模型,分别得到第一特征向量和第二特征向量。
第一算法模型与第二算法模型的版本不同。第一算法模型配置有第一特征向量数据库。第一特征向量数据库包括基于第一算法模型得到的样本特征向量。
有效验证模块303可用于根据第一样本特征向量对应的第一用户的关联特征向量,对第二特征向量进行有效性验证。
第一样本特征向量为第一特征向量数据库中与第一特征向量匹配成功的样本特征向量。关联特征向量包括以下至少部分:第一特征向量、第二特征向量、第一算法模型对应的至少部分历史特征向量。
在一些实施例中,有效性验证可包括以下一项或两项以上:可靠性验证、第一差异验证、第二差异验证。
有效性验证包括可靠性验证,对应地,关联特征向量包括第一特征向量和第一算法模型对应的历史特征向量。
有效验证模块303可进行可靠性验证。具体地,有效验证模块303可用于:分别计算第一特征向量与第一算法模型对应的至少部分历史特征向量的第一相似度;若不存在小于第一判定阈值的第一相似度,则确定可靠性验证通过。
有效性验证包括第一差异验证,对应地,关联特征向量包括第一特征向量和第二特征向量。
有效验证模块303可进行第一差异验证。具体地,有效验证模块303可用于:利用基于第一用户的多次业务请求得到的多个第二特征向量,计算得到多个第二特征向量之间的最大夹角;利用基于第一用户的多次业务请求得到的多个第一特征向量,计算得到多个第一特征向量之间的最大夹角;若多个第二特征向量之间的最大夹角小于多个第一特征向量之间的最大夹角,则确定第一差异验证通过。
有效性验证包括第二差异验证,对应地,关联特征向量包括第二特征向量。
有效验证模块303可进行第二差异验证。具体地,有效验证模块303可用于:获取基于第一用户的多次业务请求得到的多个第二特征向量;分别计算多个第二特征向量中每两个第二特征向量的第二相似度;若不存在小于第二判定阈值的第二相似度,则确定第二差异验证通过。
处理模块304可用于在第二特征向量的有效性验证通过的情况下,基于第二特征向量,得到第一用户的第二样本特征向量,并将第二样本特征向量存储入第二算法模型配置的第二特征向量数据库。
具体地,处理模块304可用于将第二特征向量确定为第二样本特征向量,或者,计算基于第一用户的多次业务请求得到的多个第二特征向量的均值向量,将均值向量确定为第二样本特征向量,或者,将第一用户的多次业务请求得到的多个第二特征向量中最近一次获取到的第二特征向量,确定为第二样本特征向量。
在本申请实施例中,在两个版本不同的算法模型并行运行的过程中,可根据用户的业务请求中的生物特征,通过第一算法模型实时生成第一特征向量,通过第二算法模型实时生成第二特征向量。可根据第一特征向量、第二特征向量和历史特征向量中的至少部分,对两个算法模型中未完全上线的算法模型即第二算法模型得到的特征向量进行有效性验证,在有效性验证通过的情况下,将该特征向量作为用户的样本特征向量存储入还未完成的特征向量数据库即第二特征向量数据库中。在得到第二特征向量数据库中的样本特征向量的过程中,不需存储用户注册的原始生物特征,从而保证在得到特征向量数据库所需的样本特征向量的过程中不会对用户的隐私数据带来风险,提高用户的隐私数据的安全性。
在上述过程中,用户对于特征向量数据库的更新是无感知的,可在不打扰用户、不增加用户操作的情况下完成特征向量数据库的更新,实现样本特征向量的迁移,提高了用户体验。
通过有效性验证,如可靠性验证、第一差异验证、第二差异验证等,可保证更新得到的特征向量数据库即第二特征向量数据库中样本特征向量的精确性。
而且,由于随着时间的推移,用户的某些生物特征可能会发生变化。在存储用户注册的原始生物特征,根据原始生物特征得到用于进行生物特征识别的样本特征向量的相关技术中,可能会存在误识别。例如,用户进行生物特征识别所采用的是人脸特征,但用户为青少年,由于青少年的发育变化,可能会导致青少年的人脸特征与注册所用的原始人脸特征相差较大,从而导致生物特征识别出现问题。在本申请实施例中,根据用户的业务请求中的生物特征的特征向量得到用于生物特征识别的特征向量数据库中的样本特征向量,用户业务请求为最近发生的业务请求,从而避免了用于生物特征识别的特征向量数据库中数据过于老旧导致的误识别,从而提高了生物特征识别的精确度。
在一些实施例中,在业务请求的用户为已知用户的情况下,若第一特征向量与第一特征向量数据库中已知用户的样本特征向量匹配成功,将第二特征向量存储入第二特征向量数据库,以作为已知用户在第二特征向量数据库中的样本特征向量。
在一些实施例中,在有效性验证未通过的情况下,还可利用辅助信息还协同确认第二特征向量的有效性。图8本申请提供的特征向量数据库的更新装置的另一实施例的结构示意图。图8与图7的不同之处在于,图8所示的特征向量数据库的更新装置300还可包括请求发起模块305、接收模块306和身份验证模块307。
请求发起模块305可用于在第二特征向量的有效性验证未通过的情况下,发起第一辅助验证请求。
接收模块306可用于接收响应于第一辅助验证请求输入的辅助信息。
在一些示例中,辅助信息包括以下一项或两项以上:短信验证码、用户终端令牌、用户身份信息、第二生物特征。
其中,第二生物特征的类型与第一生物特征的类型不同。
身份验证模块307可用于利用辅助信息进行身份验证,得到身份验证结果。
处理模块308还可用于若身份验证结果表征辅助信息指示的用户为第一用户,则基于第二特征向量,得到第一用户的第二样本特征向量,并将第二样本特征向量存储入第二算法模型配置的第二特征向量数据库。
在一些实施例中,在基于第二特征向量得到的第二样本特征向量存储入第二特征向量数据库后,还可在后续获取到业务请求的情况下进一步验证第二样本特征向量的有效性并及时进行更新。图9为本申请提供的特征向量数据库的更新装置的又一实施例的结构示意图。图9与图7的不同之处在于,图9所示的特征向量数据库的更新装置300还可包括识别模块309。
上述获取模块301还可用于获取新接收的业务请求中的第三生物特征。
上述计算模块302还可用于根据第三生物特征,通过第一算法模型和第二算法模型,分别得到与第三生物特征对应的第一特征向量和第二特征向量。
识别模块309还可用于在第一特征向量数据库中查找与第三生物特征对应的第一特征向量匹配的第三样本特征向量,并确定第三样本特征向量对应的第二用户;以及,还用于在第二特征向量数据库存在第二用户的样本特征向量的情况下,利用第三生物特征对应的第二特征向量在第二特征向量数据库中进行匹配。
上述处理模块304还可用于若第二特征向量数据库中与第三生物特征对应的第二特征向量匹配成功的为第二用户的样本特征向量,则确定第二用户的样本特征向量有效;以及,还用于若第二特征向量数据库中无与第三生物特征对应的第二特征向量匹配成功的样本特征向量,或,第二特征向量数据库中与第三生物特征对应的第二特征向量匹配成功不是第二用户的样本特征向量,将第二用户的样本特征向量从第二特征向量数据库中删除,继续获取包括第二用户的生物特征的业务请求,以再次得到存储入第二特征向量数据库的第二用户的样本特征向量。
在一些实施例中,上述识别模块309还可用于:在第二特征向量数据库中存在样本特征向量的用户占第一特征向量数据库中存在样本特征向量的用户的比例小于预设完成覆盖率的情况下,利用第一算法模型和第一特征向量数据库进行业务请求的生物特征识别;在第二特征向量数据库中存在样本特征向量的用户占第一特征向量数据库中存在样本特征向量的用户的比例大于等于预设完成覆盖率的情况下,利用第二算法模型和第二特征向量数据库进行业务请求的生物特征识别。
在一些示例中,上述处理模块304还可用于:若第二特征向量的数量未达到验证要求数量,保留第一特征向量数据库中第二特征向量对应的第三用户的样本特征向量。
上述识别模块309还可用于:在第三用户发起业务请求的情况下,利用第一算法模型和第一特征向量数据库进行业务请求的生物特征识别。
在一些示例中,上述识别模块309还用于若在第二特征向量数据库中未查找到与基于业务请求中的第四生物特征对应的第二特征向量匹配的样本特征向量,根据第四生物特征,利用第一算法模型和第一特征向量数据库进行业务请求的生物特征识别。
在一些实施例中,图9所示的特征向量数据库的更新装置300的结构可与图8所示的特征向量数据库的更新装置300的结构相结合,在第二特征向量数据库中未查找到与基于业务请求中的第四生物特征对应的第二特征向量匹配的样本特征向量的情况下,利用辅助信息,得到用户的样本特征向量,并存储入第二特征向量数据库。图10为本申请提供的特征向量数据库的更新装置的再一实施例的结构示意图。图10与图9的不同之处在于,图10所示的特征向量数据库的更新装置300还可包括图8中的请求发起模块305、接收模块306和身份验证模块307。
请求发起模块305还可用于若在所述第二特征向量数据库中未查找到与基于业务请求中的第四生物特征对应的所述第二特征向量匹配的样本特征向量,发起第二辅助验证请求。
接收模块306还可用于接收响应于第二辅助验证请求输入的辅助信息。
身份验证模块307还可用于利用辅助信息进行根据第四生物特征进行生物特征识别得到的第三用户的身份验证,得到身份验证结果。
上述处理模块304还可用于若身份验证结果表征辅助信息指示的用户为第三用户,将基于第四生物特征对应的第二特征向量得到的第三样本特征向量存储入第二特征向量数据库,以作为第三用户的在第二特征向量数据库中的样本特征向量。
本申请提供一种特征向量数据库的更新设备。图11为本申请提供的特征向量数据库的更新设备的一实施例的结构示意图。如图11所示,特征向量数据库的更新设备400包括存储器401、处理器402及存储在存储器401上并可在处理器402上运行的计算机程序。
在一个示例中,上述处理器402可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器401可包括只读存储器(Read-Only Memory,ROM),随机存取存储器(RandomAccess Memory,RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本申请实施例中特征向量数据库的更新方法所描述的操作。
处理器402通过读取存储器401中存储的可执行程序代码来运行与可执行程序代码对应的计算机程序,以用于实现上述实施例中的特征向量数据库的更新方法。
在一个示例中,特征向量数据库的更新设备400还可包括通信接口403和总线404。其中,如图11所示,存储器401、处理器402、通信接口403通过总线404连接并完成相互间的通信。
通信接口403,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。也可通过通信接口403接入输入设备和/或输出设备。
总线404包括硬件、软件或两者,将特征向量数据库的更新设备400的部件彼此耦接在一起。举例来说而非限制,总线404可包括加速图形端口(Accelerated GraphicsPort,AGP)或其他图形总线、增强工业标准架构(Enhanced Industry StandardArchitecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industry Standard Architecture,ISA)总线、无限带宽互连、低引脚数(Low pin count,LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,MCA)总线、外围组件互连(Peripheral Component Interconnect,PCI)总线、PCI-Express(PCI-E)总线、串行高级技术附件(Serial Advanced TechnologyAttachment,SATA)总线、视频电子标准协会局部(Video Electronics StandardsAssociation Local Bus,VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线404可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,该计算机程序指令被处理器执行时可实现上述实施例中的特征向量数据库的更新方法,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,上述计算机可读存储介质可包括非暂态计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等,在此并不限定。
需要明确的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。对于装置实施例、设备实施例、计算机可读存储介质实施例而言,相关之处可以参见方法实施例的说明部分。本申请并不局限于上文所描述并在图中示出的特定步骤和结构。本领域的技术人员可以在领会本申请的精神之后,作出各种改变、修改和添加,或者改变步骤之间的顺序。并且,为了简明起见,这里省略对已知方法技术的详细描述。
上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
本领域技术人员应能理解,上述实施例均是示例性而非限制性的。在不同实施例中出现的不同技术特征可以进行组合,以取得有益效果。本领域技术人员在研究附图、说明书及权利要求书的基础上,应能理解并实现所揭示的实施例的其他变化的实施例。在权利要求书中,术语“包括”并不排除其他装置或步骤;数量词“一个”不排除多个;术语“第一”、“第二”用于标示名称而非用于表示任何特定的顺序。权利要求中的任何附图标记均不应被理解为对保护范围的限制。权利要求中出现的多个部分的功能可以由一个单独的硬件或软件模块来实现。某些技术特征出现在不同的从属权利要求中并不意味着不能将这些技术特征进行组合以取得有益效果。

Claims (17)

1.一种特征向量数据库的更新方法,其特征在于,包括:
获取业务请求中的第一生物特征;
根据所述第一生物特征,通过第一算法模型和第二算法模型,分别得到第一特征向量和第二特征向量,所述第一算法模型与所述第二算法模型的版本不同,所述第一算法模型配置有第一特征向量数据库,所述第一特征向量数据库包括基于所述第一算法模型得到的样本特征向量;
根据第一样本特征向量对应的第一用户的关联特征向量,对所述第二特征向量进行有效性验证,所述第一样本特征向量为所述第一特征向量数据库中与所述第一特征向量匹配成功的样本特征向量,所述关联特征向量包括以下至少部分:所述第一特征向量、所述第二特征向量、所述第一算法模型对应的至少部分历史特征向量;
在所述第二特征向量的有效性验证通过的情况下,基于所述第二特征向量,得到所述第一用户的第二样本特征向量,并将所述第二样本特征向量存储入所述第二算法模型配置的第二特征向量数据库。
2.根据权利要求1所述的方法,其特征在于,所述有效性验证包括以下一项或两项以上:
可靠性验证、第一差异验证、第二差异验证。
3.根据权利要求1所述的方法,其特征在于,所述关联特征向量包括所述第一特征向量和所述第一算法模型对应的历史特征向量;
所述可靠性验证包括:
分别计算所述第一特征向量与所述第一算法模型对应的至少部分历史特征向量的第一相似度;
若不存在小于第一判定阈值的所述第一相似度,则确定所述可靠性验证通过。
4.根据权利要求2所述的方法,其特征在于,所述关联特征向量包括所述第一特征向量和所述第二特征向量;
所述第一差异验证包括:
利用基于所述第一用户的多次业务请求得到的多个所述第二特征向量,计算得到多个所述第二特征向量之间的最大夹角;
利用基于所述第一用户的所述多次业务请求得到的多个所述第一特征向量,计算得到多个所述第一特征向量之间的最大夹角;
若多个所述第二特征向量之间的最大夹角小于多个所述第一特征向量之间的最大夹角,则确定所述第一差异验证通过。
5.根据权利要求2所述的方法,其特征在于,所述关联特征向量包括所述第二特征向量;
所述第二差异验证包括:
获取基于所述第一用户的多次业务请求得到的多个所述第二特征向量;
分别计算多个所述第二特征向量中每两个所述第二特征向量的第二相似度;
若不存在小于第二判定阈值的所述第二相似度,则确定所述第二差异验证通过。
6.根据权利要求1所述的方法,其特征在于,还包括:
在所述第二特征向量的有效性验证未通过的情况下,发起第一辅助验证请求;
接收响应于所述第一辅助验证请求输入的辅助信息;
利用所述辅助信息进行身份验证,得到身份验证结果;
若身份验证结果表征所述辅助信息指示的用户为所述第一用户,则基于所述第二特征向量,得到所述第一用户的第二样本特征向量,并将所述第二样本特征向量存储入所述第二算法模型配置的第二特征向量数据库。
7.根据权利要求6所述的方法,其特征在于,所述辅助信息包括以下一项或两项以上:
短信验证码、用户终端令牌、用户身份信息、第二生物特征;
所述第二生物特征的类型与所述第一生物特征的类型不同。
8.根据权利要求1或6所述的方法,其特征在于,所述基于所述第二特征向量,得到所述第一用户的第二样本特征向量,包括:
将所述第二特征向量确定为所述第二样本特征向量;
或者,
计算基于所述第一用户的多次业务请求得到的多个所述第二特征向量的均值向量,将所述均值向量确定为所述第二样本特征向量;
或者,
将所述第一用户的多次业务请求得到的多个所述第二特征向量中最近一次获取到的所述第二特征向量,确定为所述第二样本特征向量。
9.根据权利要求1所述的方法,其特征在于,在所述根据所述第一生物特征,通过第一算法模型和第二算法模型,分别得到第一特征向量和第二特征向量之后,还包括:
在业务请求的用户为已知用户的情况下,若所述第一特征向量与所述第一特征向量数据库中所述已知用户的样本特征向量匹配成功,将所述第二特征向量存储入所述第二特征向量数据库,以作为所述已知用户在所述第二特征向量数据库中的样本特征向量。
10.根据权利要求1所述的方法,其特征在于,在所述将所述第二样本特征向量存储入所述第二算法模型配置的第二特征向量数据库之后,还包括:
获取新接收的业务请求中的第三生物特征;
根据所述第三生物特征,通过第一算法模型和第二算法模型,分别得到与所述第三生物特征对应的所述第一特征向量和所述第二特征向量;
在所述第一特征向量数据库中查找与所述第三生物特征对应的所述第一特征向量匹配的第三样本特征向量,并确定所述第三样本特征向量对应的第二用户;
在所述第二特征向量数据库存在所述第二用户的样本特征向量的情况下,利用所述第三生物特征对应的所述第二特征向量在所述第二特征向量数据库中进行匹配;
若所述第二特征向量数据库中与所述第三生物特征对应的所述第二特征向量匹配成功的为所述第二用户的样本特征向量,则确定所述第二用户的样本特征向量有效;
若所述第二特征向量数据库中无与所述第三生物特征对应的所述第二特征向量匹配成功的样本特征向量,或,所述第二特征向量数据库中与所述第三生物特征对应的所述第二特征向量匹配成功不是所述第二用户的样本特征向量,将所述第二用户的样本特征向量从所述第二特征向量数据库中删除,继续获取包括所述第二用户的生物特征的业务请求,以再次得到存储入所述第二特征向量数据库的所述第二用户的样本特征向量。
11.根据权利要求1所述的方法,其特征在于,还包括:
在所述第二特征向量数据库中存在样本特征向量的用户占所述第一特征向量数据库中存在样本特征向量的用户的比例小于预设完成覆盖率的情况下,利用所述第一算法模型和所述第一特征向量数据库进行业务请求的生物特征识别;
在所述第二特征向量数据库中存在样本特征向量的用户占所述第一特征向量数据库中存在样本特征向量的用户的比例大于等于所述预设完成覆盖率的情况下,利用所述第二算法模型和所述第二特征向量数据库进行业务请求的生物特征识别。
12.根据权利要求11所述的方法,其特征在于,还包括:
若所述第二特征向量的数量未达到验证要求数量,保留第一特征向量数据库中所述第二特征向量对应的第三用户的样本特征向量;
在所述第三用户发起业务请求的情况下,利用所述第一算法模型和所述第一特征向量数据库进行业务请求的生物特征识别。
13.根据权利要求11所述的方法,其特征在于,还包括:
若在所述第二特征向量数据库中未查找到与基于业务请求中的第四生物特征对应的所述第二特征向量匹配的样本特征向量,根据所述第四生物特征,利用所述第一算法模型和所述第一特征向量数据库进行业务请求的生物特征识别。
14.根据权利要求13所述的方法,其特征在于,在所述根据所述第四生物特征,利用所述第一算法模型和所述第一特征向量数据库进行业务请求的生物特征识别之后,还包括:
发起第二辅助验证请求;
接收响应于所述第二辅助验证请求输入的辅助信息;
利用所述辅助信息进行根据所述第四生物特征进行生物特征识别得到的第三用户的身份验证,得到身份验证结果;
若所述身份验证结果表征所述辅助信息指示的用户为所述第三用户,将基于所述第四生物特征对应的所述第二特征向量得到的第三样本特征向量存储入所述第二特征向量数据库,以作为所述第三用户的在所述第二特征向量数据库中的样本特征向量。
15.一种特征向量数据库的更新装置,其特征在于,包括:
获取模块,用于获取业务请求中的第一生物特征;
计算模块,用于根据所述第一生物特征,通过第一算法模型和第二算法模型,分别得到第一特征向量和第二特征向量,所述第一算法模型与所述第二算法模型的版本不同,所述第一算法模型配置有第一特征向量数据库,所述第一特征向量数据库包括基于所述第一算法模型得到的样本特征向量;
有效验证模块,用于根据第一样本特征向量对应的第一用户的关联特征向量,对所述第二特征向量进行有效性验证,所述第一样本特征向量为所述第一特征向量数据库中与所述第一特征向量匹配成功的样本特征向量,所述关联特征向量包括以下至少部分:所述第一特征向量、所述第二特征向量、所述第一算法模型对应的至少部分历史特征向量;
处理模块,用于在所述第二特征向量的有效性验证通过的情况下,基于所述第二特征向量,得到所述第一用户的第二样本特征向量,并将所述第二样本特征向量存储入所述第二算法模型配置的第二特征向量数据库。
16.一种特征向量数据库的更新设备,其特征在于,包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1至14中任意一项所述的特征向量数据库的更新方法。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1至14中任意一项所述的特征向量数据库的更新方法。
CN202210036515.1A 2022-01-13 2022-01-13 特征向量数据库的更新方法、装置、设备及介质 Pending CN114417294A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202210036515.1A CN114417294A (zh) 2022-01-13 2022-01-13 特征向量数据库的更新方法、装置、设备及介质
TW111137394A TWI804441B (zh) 2022-01-13 2022-09-30 特徵向量資料庫的更新方法、裝置、設備及介質
PCT/CN2022/123997 WO2023134232A1 (zh) 2022-01-13 2022-10-09 特征向量数据库的更新方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210036515.1A CN114417294A (zh) 2022-01-13 2022-01-13 特征向量数据库的更新方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114417294A true CN114417294A (zh) 2022-04-29

Family

ID=81274274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210036515.1A Pending CN114417294A (zh) 2022-01-13 2022-01-13 特征向量数据库的更新方法、装置、设备及介质

Country Status (3)

Country Link
CN (1) CN114417294A (zh)
TW (1) TWI804441B (zh)
WO (1) WO2023134232A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023134232A1 (zh) * 2022-01-13 2023-07-20 中国银联股份有限公司 特征向量数据库的更新方法、装置、设备及介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10769255B2 (en) * 2015-11-11 2020-09-08 Samsung Electronics Co., Ltd. Methods and apparatuses for adaptively updating enrollment database for user authentication
CN107610709B (zh) * 2017-08-01 2021-03-19 百度在线网络技术(北京)有限公司 一种训练声纹识别模型的方法及系统
CN108573038A (zh) * 2018-04-04 2018-09-25 北京市商汤科技开发有限公司 图像处理、身份验证方法、装置、电子设备和存储介质
CN110598840B (zh) * 2018-06-13 2023-04-18 富士通株式会社 知识迁移方法、信息处理设备以及存储介质
CN111125390B (zh) * 2018-11-01 2024-05-17 北京市商汤科技开发有限公司 数据库更新方法和装置、电子设备、计算机存储介质
CN111460893A (zh) * 2020-03-02 2020-07-28 平安科技(深圳)有限公司 人脸特征向量动态调整方法及相关设备
CN112148908A (zh) * 2020-10-23 2020-12-29 北京百度网讯科技有限公司 图像数据库的更新方法、装置、电子设备和介质
CN113870865A (zh) * 2021-10-12 2021-12-31 杭州海康威视数字技术股份有限公司 一种声纹特征更新方法、装置、电子设备及存储介质
CN114417294A (zh) * 2022-01-13 2022-04-29 中国银联股份有限公司 特征向量数据库的更新方法、装置、设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023134232A1 (zh) * 2022-01-13 2023-07-20 中国银联股份有限公司 特征向量数据库的更新方法、装置、设备及介质

Also Published As

Publication number Publication date
TW202328950A (zh) 2023-07-16
WO2023134232A1 (zh) 2023-07-20
TWI804441B (zh) 2023-06-01

Similar Documents

Publication Publication Date Title
US10853676B1 (en) Validating identity and/or location from video and/or audio
US11055395B2 (en) Step-up authentication
JP6636922B2 (ja) 人の生体特徴を利用した本人認証
WO2019179029A1 (zh) 电子装置、身份验证方法和计算机可读存储介质
WO2020077885A1 (zh) 身份验证方法、装置、计算机设备和存储介质
US11244146B2 (en) Systems and methods for secure user logins with facial recognition and blockchain
US20210125617A1 (en) Method and apparatus with registration for speaker recognition
CN111883140A (zh) 基于知识图谱和声纹识别的认证方法、装置、设备及介质
WO2017079166A1 (en) High speed reference point independent database filtering for fingerprint identification
TWI804441B (zh) 特徵向量資料庫的更新方法、裝置、設備及介質
CN112287320A (zh) 一种基于生物特征的身份验证方法、装置及客户端
US20190130084A1 (en) Authentication method, electronic device, and computer-readable program medium
CN113707157B (zh) 基于声纹识别的身份验证方法、装置、电子设备及介质
CN112822676B (zh) 一种访问应用的方法及装置
CN111914769B (zh) 用户合法性判定方法、装置、计算机可读存储介质及设备
CN106098070B (zh) 一种身份认证方法、及网络系统
KR101006861B1 (ko) 지문인증 장치의 인증방법
KR20010019772A (ko) 음성비밀단어를 이용한 사용자 인증 시스템 및 방법
CN113569839A (zh) 证件识别方法、系统、设备及介质
CN108876386B (zh) 对象认证方法和装置、基于对象认证的交易方法和装置
CN112784990A (zh) 一种成员推断模型的训练方法
CN111784352A (zh) 认证风险识别方法、装置和电子设备
CN110851808A (zh) 身份认证方法、装置、电子设备及计算机可读存储介质
US20240054195A1 (en) Authorization of Action by Voice Identification
KR20240054801A (ko) 성문 식별 및 키워드 식별을 이용한 사용자 인증 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40069219

Country of ref document: HK