WO2021068616A1

WO2021068616A1 - 身份验证方法、装置、计算机设备和存储介质

Info

Publication number: WO2021068616A1
Application number: PCT/CN2020/106238
Authority: WO
Inventors: 余龙龙
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-10-12
Filing date: 2020-07-31
Publication date: 2021-04-15
Also published as: CN110955874A

Abstract

一种身份验证方法，包括：对待检测对象进行人脸检测，获得人脸检测结果（S202），根据人脸检测结果生成随机展示码序列（S204）；对待检测对象的嘴唇动作特征进行提取，利用唇语识别模型对嘴唇动作特征进行特征解析，获得嘴唇动作特征展示码（S206）；提取待检测对象的解读音频，转换成语音文本展示码（S208）；将嘴唇动作特征展示码和语音文本展示码与随机展示码序列进行比对，当两者均符合随机展示码序列时，对待检测对象进行活体检测（S210）；当通过活体检测时，将待检测对象的脸部图像文件与人脸检测结果进行比对，得到身份认证结果（S212）。

Description

身份验证方法、装置、计算机设备和存储介质

相关申请的交叉引用

本申请要求于2019年10月12日提交中国专利局，申请号为2019109698312，申请名称为“身份验证方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，特别是涉及一种身份验证方法、装置、计算机设备和存储介质。

背景技术

随着信息技术的日益发展，人们的生活方式也在不断发生变化，而在移动支付和身份验证等领域，如何快速而有效地确认用户的个人身份，并保护用户的个人信息安全，变得尤为重要。

传统的身份认证方案，包括利用密码或者口令来确定个人身份，比如用户使用某一应用程序时，应用程序后台可根据用户输入的登录密码，或者用户忘记密码时输入短信验证码来确认用户身份，还包括利用人脸识别技术来对确认用户身份，通过提取用户的人脸特征，并将预先存储的人脸特征和进行验证时提取的人脸特征进行比对，确认用户身份。

然而，发明人意识到，传统的身份认证方案中，还存在密码或者口令被盗用的问题，以及人脸识别技术中，也存在提前录制包括用户的脸部视频，非法获得用户的头部、眼部以及嘴部运动等，对人脸识别系统进行攻击，导致身份认证安全性太低的问题。

发明内容

根据本申请公开的各种实施例，提供一种身份验证方法、装置、计算机设备和存储介质。

一种身份验证方法，包括：

当检测到待检测对象的登录操作时，触发人脸检测指令，根据所述人脸检测指令对所述待检测对象进行人脸检测，获得人脸检测结果；

根据所述人脸检测结果生成随机展示码序列；所述随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成；

对所述待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对所述嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码；

提取所述待检测对象的解读音频，并对所述解读音频进行语音识别，将所述解读音频转换成语音文本展示码；

将所述嘴唇动作特征展示码和所述语音文本展示码，与所述随机展示码序列进行比对，当所述嘴唇动作特征展示码和所述语音文本展示码均符合所述随机展示码序列时，对所述待检测对象进行活体检测；及

当确认所述待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与所述人脸检测结果进行比对，进行身份认证，得到身份认证结果。

一种身份验证装置，包括：

人脸检测模块，用于当检测到待检测对象的登录操作时，触发人脸检测指令，根据所述人脸检测指令对所述待检测对象进行人脸检测，获得人脸检测结果；

随机展示码序列生成模块，用于根据所述人脸检测结果生成随机展示码序列；所述随机展示码序列根据随机数字、随机字母或随机汉字中任意两种形式或两种以上的形式组成；

嘴唇动作特征提取模块，用于对所述待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对所述嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码；

语音识别模块，用于提取所述待检测对象的解读音频，并对所述解读音频进行语音识别，将所述解读音频转换成语音文本展示码；

比对模块，用于将所述嘴唇动作特征展示码和所述语音文本展示码，与所述随机展示码序列进行比对，当所述嘴唇动作特征展示码和所述语音文本展示码均符合所述随机展示码序列时，对所述待检测对象进行活体检测；及

身份认证模块，用于当确认所述待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与所述人脸检测结果进行比对，进行身份认证，得到身份认证结果。

一种计算机设备，包括存储器和一个或多个处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述一个或多个处理器执行以下步骤：

一个或多个存储有计算机可读指令的计算机可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：

上述身份验证方法、装置、计算机设备和存储介质，当检测到待检测对象的登录操作时，对待检测对象进行人脸检测，获得人脸检测结果，并根据人脸检测结果生成随机展示码序列，随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成。由于利用随机生成的数字、字母及汉字序列作为标识，难以被提前录制音频文件和视频文件，可降低被攻击的风险。通过对待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码。同时提取待检测对象的解读音频，并对解读音频进行语音识别，将解读音频转换成语音文本展示码，进而将嘴唇动作特征展示码和语音文本展示码，与随机展示码序列进行比对，当嘴唇动作特征展示码和语音文本展示码均符合随机展示码序列时，对待检测对象进行活体检测，当确认待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与人脸检测结果进行比对，进行身份认证，得到身份认证结果。由于同时结合了人脸识别、唇语识别以及语音识别，可互相补充和完善，进一步增强了身份认证的可靠性和安全性。

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为根据一个或多个实施例中身份验证方法的应用场景图；

图2为根据一个或多个实施例中身份验证方法的流程示意图；

图3为根据一个或多个实施例中身份验证装置的框图；

图4为根据一个或多个实施例中计算机设备的框图。

具体实施方式

为了使本申请的技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的身份验证方法，可以应用于如图1所示的应用环境中。其中，终端102与服务器104通过网络进行通信。当服务器104在终端102检测到待检测对象的登录操作时，触发人脸检测指令，根据人脸检测指令对待检测对象进行人脸检测，获得人脸检测结果，并根据人脸检测结果生成随机展示码序列，其中，随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成。服务器104通过对待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码。在身份验证过程中，同时提取待检测对象的解读音频，并对解读音频进行语音识别，将解读音频转换成语音文本展示码，并将嘴唇动作特征展示码和语音文本展示码，与随机展示码序列进行比对，当嘴唇动作特征展示码和语音文本展示码均符合随机展示码序列时，对待检测对象进行活体检测。当确认待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与人脸检测结果进行比对，进行身份认证，得到身份认证结果。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在其中一个实施例中，如图2所示，提供了一种身份验证方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤S202，当检测到待检测对象的登录操作时，触发人脸检测指令，根据人脸检测指令对待检测对象进行人脸检测，获得人脸检测结果。

具体地，当检测到待检测对象的登录操作时，获取待检测对象的登录状态，其中，登录状态包括登录成功和登录失败。当确定待检测对象的登录状态为登陆成功时，触发人脸检测指令，并根据人脸检测指令打开相机程序，利用相机程序对待检测对象进行人脸检测，当检测到待检测对象的人脸部分时，生成人脸检测结果。

其中，待检测对象在应用程序的登录操作包括待检测对象输入账号密码进行登录，或者以输入账号获取实时验证码并登录的登录操作。针对待检测对象输入账号密码进行登录的操作，在登录成功即账号密码均无错误时，触发人脸检测指令。针对待检测对象输入账号并输入实时获取的验证码进行登录的操作，在待检测对象输入的验证码符合实时获取到的验证码，登录成功时，同样触发人脸检测指令。

进一步地，人脸检测指令用于检测当前执行登录操作的待检测对象的人脸部分，可根据人脸检测指令打开终端上的相机程序，利用相机对人脸进行检测，判断是否检测到待检测对象的人脸部分，得到人脸检测结果。当未检测到人脸时，界面发出“请对准相机”的提示，直到相机检测到待检测对象的人脸部分。

步骤S204，根据人脸检测结果生成随机展示码序列；随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成。

具体地，通过获取当前应用场景下的随机展示码序列的预设要求，其中，预设要求包括随机展示码序列长度，以及随机展示码序列组成，且当根据人脸检测结果，确定检测到待检测对象的人脸部分时，根据随机展示码序列的预设要求，随机生成随机展示码序列。

其中，随机展示码序列可以由随机数字、随机字母以及随机汉字中的至少一种形式等组成，其中，随机数字序列是根据0至9包括的数字生成，包括的数字个数大于等于6位，包括但不限于6位、8位以及10位等。比如6位的随机数字序列可以是156871、589624以及896547等，8位的随机数字序列可以是85412369以及78452369等，数字序列生成不遵循某种规律，随机生成，不同于提前存储数字序列，在需要时进行调用的情况，可避免数字序列被盗用的问题。

同样地，随机字母序列是根据26个英文字母生成，序列位数也不进行限定，大于6位，包括但不限于6位、8位以及10位等。比如，6位的随机字母序列可以是oputrd、ruighd以及swertg等，8位和10位的随机字母序列也是相同情况。

进一步地，在安全级别要求较高的场景，比如办理银行业务等情况下，生成的随机序列长度比较长，并且序列种类多，其中，可将随机序列长度设置成8位或者10位，序列种类可以设置同时包括数字、字母及汉字中的两种或两种以上。比如，同时包括数字和字母的8位随机展示码序列可以是soer5648、9867ogsi、ru98yt03、75un09eg、wr8750jt以及36thfb68等多种形式。同样地，同时包括数字、字母以及汉字的10位随机展示码序列可以是：“49pr如果06et”、“ty开始73rb05”以及“更新34wh96rs”等多种形式。

步骤S206，对待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码。

具体地，通过对待检测对象的嘴唇动作特征进行提取，并将嘴唇动作特征输入预先训练的唇语识别模型，并利用唇语识别模型对嘴唇动作特征进行特征解析，将嘴唇动作特征与预设的嘴唇动作特征样本进行比对。当嘴唇动作特征符合嘴唇动作特征样本一致时，将嘴唇动作特征样本对应的展示码，作为嘴唇动作特征展示码。

进一步地，服务器在待检测对象的解读过程中，实时对待检测对象的嘴唇动作特征进行提取，可通过利用相机拍摄整个解读过程中待检测对象的唇形图片。利用预先训练好的唇语识别模型，对待检测对象的唇形图片进行识别和解析，得到与唇形对应的嘴唇动作特征展示码。比如，当随机生成的展示码序列为6位的随机数字序列569841，利用相机拍摄到多个唇形图片，当利用训练好的唇语识别模型，对每一张唇形图片进行识别解析时，可分别解析得到对应的嘴唇动作特征数字，可以是8、9、5、6、1以及4，按照唇形图片的生成时间，对与唇形图片对应的嘴唇动作特征数字进行排序，得到嘴唇动作特征数字序列。

同样地，针对随机生成的展示码序列为8位的数字字母组合序列9852tyrd时，利用相机拍摄到的多个唇形图，当利用训练好的唇语识别模型，对每一张唇形图片进行识别解析时，可分别解析得到对应得嘴唇动作特征数字和字母，包括9、8、5、2、t、y、r以及d，并按照唇形图片的生成时间，与唇形图片对应的嘴唇动作特征数字/字母进行排序，得到嘴唇动作特征数字/字母序列。

步骤S208，提取待检测对象的解读音频，并对解读音频进行语音识别，将解读音频转换成语音文本展示码。

步骤S210，将嘴唇动作特征展示码和语音文本展示码，与随机展示码序列进行比对，当嘴唇动作特征展示码和语音文本展示码均符合随机展示码序列时，对待检测对象进行活体检测。

具体地，通过将嘴唇动作特征展示码和语音文本展示码，分别与随机展示码序列进行比对。且只有当嘴唇动作特征展示码以及语音文本展示码，均符合随机展示码序列时，才进行下一步的活体检测，仅语音文本展示码符合随机展示码序列，或仅嘴唇动作特征展示码符合随机展示码序列时，需要返回对应步骤进行重新检测。比如，当嘴唇动作特征展示码，或语音文本展示码不符合随机展示码序列时，服务器需要重新生成随机展示码序列，待检测对象需要再次进行解读，重复执行嘴唇动作特征展示码和语音文本展示码的获取，并再次比对，直到嘴唇动作特征展示码和语音文本展示码，均符合相应的随机展示码序列。

其中，活体检测是通过眨眼、张嘴、摇头、点头等组合动作，使用人脸关键点定位和人脸追踪等技术，验证待检测对象是否为真实活体本人操作。比如，通过指示待检测对象进行眨眼、摇头以及张嘴的操作，判断待检测对象是否能执行对应的指示操作，如出现错误，则需要待检测对象重新按照指示执行相应的操作，如重复出现3次以上的错误，则表示该待检测对象无法执行指示操作，不能通过活体检测。

步骤S212，当确认待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与人脸检测结果进行比对，进行身份认证，得到身份认证结果。

具体地，当待检测对象通过活体检测时，表示当前在终端的应用程序进行登录操作的待检测对象，为活体，可进行下一步的身份认证，通过将解读过程中存储的待检测对象的待检测人脸图像，与数据库中预存的待检测对象的脸部图像文件进行比对，两者符合时，则表示身份认证成功。如两者不相符合，则发出需要重新进行身份认证的提示。

上述身份验证方法中，当检测到待检测对象的登录操作时，对待检测对象进行人脸检测，获得人脸检测结果，并根据人脸检测结果生成随机展示码序列；随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成。由于利用随机生成的数字、字母及汉字序列作为标识，难以被提前录制音频文件和视频文件，可降低被攻击的风险。通过对待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码。同时提取待检测对象的解读音频，并对解读音频进行语音识别，将解读音频转换成语音文本展示码，进而将嘴唇动作特征展示码和语音文本展示码，与随机展示码序列进行比对，当嘴唇动作特征展示码和语音文本展示码均符合随机展示码序列时，对待检测对象进行活体检测，当确认待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与人脸检测结果进行比对，进行身份认证，得到身份认证结果。由于同时结合了人脸识别、唇语识别以及语音识别，可互相补充和完善，进一步增强了身份认证的可靠性和安全性。

在其中一个实施例中，在对待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码之前，还包括：根据样本数据对深度学习模型进行训练，获得训练后的唇语识别模型。

具体地，根据样本数据对深度学习模型进行训练，获得训练后的唇语识别模型的具体过程，包括：收集各数字以及各字母对应的唇形图片，从数据库中提取超出预设使用频率的多个汉字，并收集多个汉字对应的唇形图片，提取各唇形图片上的嘴唇动作特征，生成样本数据，并利用样本数据，对卷积神经网络模型进行训练，得到对应的唇语识别模型。

其中，通过收集数字0至9对应的唇形图片，以及26个英文字母对应的唇形图片，从数据库中收集超过预设使用频率的多个汉字，比如以一天作为周期，获取一天内使用频率超过预设频率的多个汉字，并获取该些汉字对应的唇形图片。其中，需要收集的唇形图片需要涉及不同类型的待检测对象，包括不同年龄阶段以及不同地区的待检测对象的唇形图片。

进一步地，通过提取所收集的各唇形图片上的嘴唇动作特征，生成样本数据，并利用样本数据对卷积神经网络模型进行训练，得到对应的唇语识别模型。其中，在本实施例中，可基于Tensorflow平台，利用所收集的各数字的唇形图片，对卷积神经网络模型进行训练，得到对应的唇语识别模型，Tensorflow是一种计算图模型，即用图的形式来表示运算过程的一种模型，而Tensorflow程序一般分为图的构建和图的执行两个阶段，图的构建阶段也称为图的定义阶段，该过程会在图模型中定义所需的运算，每次运算的结果以及原始的输入数据都可称为一个节点。

上述步骤中，通过收集各数字以及各字母对应的唇形图片，从数据库中提取超出预设使用频率的多个汉字，并收集多个汉字对应的唇形图片，提取各唇形图片上的嘴唇动作特征，生成样本数据，并利用样本数据，对卷积神经网络模型进行训练，得到对应的唇语识别模型，可将得到的唇语识别模型应用于对待检测对象的嘴唇动作特征进行识别，提高身份认证的安全系数。

在其中一个实施例中，在当确认待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与人脸检测结果进行比对，进行身份认证，得到身份认证结果之后，还包括：

获取待检测对象的基本信息和行为记录；行为记录包括浏览记录、收藏记录以及购买记录；

将待检测对象的基本信息和预先存储的用户信息进行比对，当待检测对象的基本信息符合预先存储的用户信息时，对待检测对象的行为记录进行验证；

当待检测对象的行为记录通过验证时，表示身份认证成功。

具体地，在活体检测通过后进行的身份认证，除需对待检测人脸图像进行验证，还需获取用户的基本个人信息以及在该应用程序上的行为习惯，包括浏览记录，收藏记录以及购买记录等，分别设置相应的验证环节。比如，针对银行业务的办理，用户需要进行查询业务，比如查询个人账号余额，则需要对用户的个人信息进行确认，用户需要在验证界面填写个人真实姓名以及账号名等。如用户需要进行转账业务，则在进行用户姓名以及账号确认后的基础上，还需对用户身份证号和手机号码进行验证，均通过之后才可进行转账业务。另一种情况下，如用户需要进行基金购买等业务，则需要对用户在该应用程序上的收藏记录以及购买记录等进行确认，将包括用户在应用程序上的收藏记录或购买记录在内的多个不同产品进行展示，供当前进行购买操作的用户进行选择，以判断进行购买业务的用户是否为本人，当选择无误时，则表示通过验证，用户可进行对基金等产品的购买操作。

上述步骤中，通过将待检测对象的基本信息和预先存储的用户信息进行比对，当待检测对象的基本信息符合预先存储的用户信息时，对待检测对象的行为记录进行验证，当待检测对象的行为记录通过验证时，表示身份认证成功，进一步保证了身份认证的安全系数。

应该理解的是，虽然图2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在其中一个实施例中，如图3所示，提供了一种身份验证装置，包括：人脸检测模块302、随机展示码序列生成模块304、嘴唇动作特征提取模块306、语音识别模块308、比对模块310以及身份认证模块312，其中：

人脸检测模块302，用于当检测到待检测对象的登录操作时，触发人脸检测指令，根据人脸检测指令对待检测对象进行人脸检测，获得人脸检测结果。

随机展示码序列生成模块304，用于根据人脸检测结果生成随机展示码序列；随机展示码序列根据随机数字、随机字母或随机汉字中任意两种形式或两种以上的形式组成。

嘴唇动作特征提取模块306，用于对待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码。

语音识别模块308，用于提取待检测对象的解读音频，并对解读音频进行语音识别，将解读音频转换成语音文本展示码。

比对模块310，用于将嘴唇动作特征展示码和语音文本展示码，与随机展示码序列进行比对，当嘴唇动作特征展示码和语音文本展示码均符合随机展示码序列时，对待检测对象进行活体检测.

身份认证模块312，用于当确认待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与人脸检测结果进行比对，进行身份认证，得到身份认证结果。

上述身份验证装置，当检测到待检测对象的登录操作时，对待检测对象进行人脸检测，获得人脸检测结果，并根据人脸检测结果生成随机展示码序列，随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成。由于利用随机生成的数字、字母及汉字序列作为标识，难以被提前录制音频文件和视频文件，可降低被攻击的风险。通过对待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码。同时提取待检测对象的解读音频，并对解读音频进行语音识别，将解读音频转换成语音文本展示码，进而将嘴唇动作特征展示码和语音文本展示码，与随机展示码序列进行比对，当嘴唇动作特征展示码和语音文本展示码均符合随机展示码序列时，对待检测对象进行活体检测，当确认待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与人脸检测结果进行比对，进行身份认证，得到身份认证结果。由于同时结合了人脸识别、唇语识别以及语音识别，可互相补充和完善，进一步增强了身份认证的可靠性和安全性。

在其中一个实施例中，人脸检测模块还用于：

当检测到待检测对象的登录操作时，获取待检测对象的登录状态；登录状态包括登录成功和登录失败；当确定待检测对象的登录状态为登陆成功时，触发人脸检测指令；根据人脸检测指令打开相机程序，利用相机程序对待检测对象进行人脸检测，当检测到待检测对象的人脸部分时，生成人脸检测结果。

上述人脸检测模块，可通过对待检测对象的登录操作进行识别以及登录状态的判断，来确定是否触发人脸识别指令，当检测到待检测对象的人脸部分时，生成相应的人脸识别结果，提高了身份验证的效率。

在其中一个实施例中，随机展示码序列生成模块还用于：

获取当前应用场景下的随机展示码序列的预设要求；预设要求包括随机展示码序列长度，以及随机展示码序列组成；当根据人脸检测结果，确定检测到待检测对象的人脸部分时，根据随机展示码序列的预设要求，随机生成随机展示码序列。

上述随机展示码序列生成模块，根据不同应用场景设置对应的随机序列码，可供待检测对象进行读取，避免出现被提前录制音频文件和视频文件的情况，可降低被攻击的风险，进一步提高身份验证的安全性和可靠性。

在其中一个实施例中，提供了一种身份验证装置，还包括唇语识别模型训练模块，用于：

收集各数字以及各字母对应的唇形图片；从数据库中提取超出预设使用频率的多个汉字，并收集多个汉字对应的唇形图片；提取各唇形图片上的嘴唇动作特征，生成样本数据；利用样本数据，对卷积神经网络模型进行训练，得到对应的唇语识别模型。

上述身份验证装置，通过收集各数字以及各字母对应的唇形图片，从数据库中提取超出预设使用频率的多个汉字，并收集多个汉字对应的唇形图片，提取各唇形图片上的嘴唇动作特征，生成样本数据，并利用样本数据，对卷积神经网络模型进行训练，得到对应的唇语识别模型，可将得到的唇语识别模型应用于对待检测对象的嘴唇动作特征进行识别，提高身份认证的安全系数。

在其中一个实施例中，嘴唇动作特征提取模块还用于：

对待检测对象的嘴唇动作特征进行提取，并将嘴唇动作特征输入预先训练的唇语识别模型；利用唇语识别模型对嘴唇动作特征进行特征解析，将嘴唇动作特征与预设的嘴唇动作特征样本进行比对；当嘴唇动作特征符合嘴唇动作特征样本时，将嘴唇动作特征样本对应的展示码，作为嘴唇动作特征展示码。

上述嘴唇动作特征提取模块，通过利用唇语识别模型对嘴唇动作特征进行特征解析，当确定嘴唇动作特征符合嘴唇动作特征样本时，将唇动作特征样本对应的展示码，作为嘴唇动作特征展示码，提高唇语识别的有效性，进一步提高身份验证的效率。

在其中一个实施例中，提供了一种身份验证装置，还包括二次认证模块，用于：

获取待检测对象的基本信息和行为记录；行为记录包括浏览记录、收藏记录以及购买记录将待检测对象的基本信息和预先存储的用户信息进行比对，当待检测对象的基本信息符合预先存储的用户信息时，对待检测对象的行为记录进行验证；当待检测对象的行为记录通过验证时，表示身份认证成功。

上述身份验证装置，通过将待检测对象的基本信息和预先存储的用户信息进行比对，当待检测对象的基本信息符合预先存储的用户信息时，对待检测对象的行为记录进行验证，当待检测对象的行为记录通过验证时，表示身份认证成功，进一步保证了身份认证的安全系数。

关于身份验证装置的具体限定可以参见上文中对于身份验证方法的限定，在此不再赘述。上述身份验证装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性或易失性存储介质、内存储器。该非易失性或易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储待检测对象相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种身份验证方法。

本领域技术人员可以理解，图4中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

一种计算机设备，包括存储器和一个或多个处理器，存储器中储存有计算机可读指令，计算机可读指令被处理器执行时，使得一个或多个处理器执行以下步骤：

当检测到待检测对象的登录操作时，触发人脸检测指令，根据人脸检测指令对待检测对象进行人脸检测，获得人脸检测结果；

根据人脸检测结果生成随机展示码序列；随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成；

对待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码；

提取待检测对象的解读音频，并对解读音频进行语音识别，将解读音频转换成语音文本展示码；

将嘴唇动作特征展示码和语音文本展示码，与随机展示码序列进行比对，当嘴唇动作特征展示码和语音文本展示码均符合随机展示码序列时，对待检测对象进行活体检测；及

当确认待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与人脸检测结果进行比对，进行身份认证，得到身份认证结果。

在一个实施例中，处理器执行计算机可读指令时还实现以下步骤：

当检测到待检测对象的登录操作时，获取待检测对象的登录状态；登录状态包括登录成功和登录失败；

当确定待检测对象的登录状态为登陆成功时，触发人脸检测指令；及

根据人脸检测指令打开相机程序，利用相机程序对待检测对象进行人脸检测，当检测到待检测对象的人脸部分时，生成人脸检测结果。

获取当前应用场景下的随机展示码序列的预设要求；预设要求包括随机展示码序列长度，以及随机展示码序列组成；及

当根据人脸检测结果，确定检测到待检测对象的人脸部分时，根据随机展示码序列的预设要求，随机生成随机展示码序列。

根据样本数据对深度学习模型进行训练，获得训练后的唇语识别模型。

收集各数字以及各字母对应的唇形图片；

从数据库中提取超出预设使用频率的多个汉字，并收集多个汉字对应的唇形图片；

提取各唇形图片上的嘴唇动作特征，生成样本数据；及

利用样本数据，对卷积神经网络模型进行训练，得到对应的唇语识别模型。

对待检测对象的嘴唇动作特征进行提取，并将嘴唇动作特征输入预先训练的唇语识别模型；

利用唇语识别模型对嘴唇动作特征进行特征解析，将嘴唇动作特征与预设的嘴唇动作特征样本进行比对；及

当嘴唇动作特征符合嘴唇动作特征样本时，将嘴唇动作特征样本对应的展示码，作为嘴唇动作特征展示码。

将待检测对象的基本信息和预先存储的用户信息进行比对，当待检测对象的基本信息符合预先存储的用户信息时，对待检测对象的行为记录进行验证；及

当待检测对象的行为记录通过验证时，表示身份认证成功。

其中，该计算机可读存储介质可以是非易失性，也可以是易失性的。

在一个实施例中，计算机可读指令被处理器执行时还实现以下步骤：

收集各数字以及各字母对应的唇形图片；

提取各唇形图片上的嘴唇动作特征，生成样本数据；及

当待检测对象的行为记录通过验证时，表示身份认证成功。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种身份验证方法，包括：

当检测到待检测对象的登录操作时，触发人脸检测指令，根据所述人脸检测指令对所述待检测对象进行人脸检测，获得人脸检测结果；

根据所述人脸检测结果生成随机展示码序列；所述随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成；

对所述待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对所述嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码；

提取所述待检测对象的解读音频，并对所述解读音频进行语音识别，将所述解读音频转换成语音文本展示码；

将所述嘴唇动作特征展示码和所述语音文本展示码，与所述随机展示码序列进行比对，当所述嘴唇动作特征展示码和所述语音文本展示码均符合所述随机展示码序列时，对所述待检测对象进行活体检测；及

当确认所述待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与所述人脸检测结果进行比对，进行身份认证，得到身份认证结果。
根据权利要求1所述的方法，其中，所述当检测到待检测对象的登录操作时，触发人脸检测指令，根据所述人脸检测指令对所述待检测对象进行人脸检测，获得人脸检测结果，包括：

当检测到所述待检测对象的登录操作时，获取所述待检测对象的登录状态；所述登录状态包括登录成功和登录失败；

当确定所述待检测对象的登录状态为登陆成功时，触发人脸检测指令；及

根据所述人脸检测指令打开相机程序，利用所述相机程序对所述待检测对象进行人脸检测，当检测到所述待检测对象的人脸部分时，生成人脸检测结果。
根据权利要求1所述的方法，其中，所述根据所述人脸检测结果生成随机展示码序列，包括：

获取当前应用场景下的所述随机展示码序列的预设要求；所述预设要求包括所述随机展示码序列长度，以及所述随机展示码序列组成；及

当根据所述人脸检测结果，确定检测到所述待检测对象的人脸部分时，根据所述随机展示码序列的预设要求，随机生成所述随机展示码序列。
根据权利要求1所述的方法，其中，在所述对所述待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对所述嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码之前，还包括：根据样本数据对深度学习模型进行训练，获得训练后的唇语识别模型。
根据权利要求4所述的方法，其中，所述根据样本数据对深度学习模型进行训练，获得训练后的唇语识别模型，包括；

收集各数字以及各字母对应的唇形图片；

从数据库中提取超出预设使用频率的多个汉字，并收集多个所述汉字对应的唇形图片；

提取各所述唇形图片上的嘴唇动作特征，生成样本数据；及

利用所述样本数据，对卷积神经网络模型进行训练，得到对应的唇语识别模型。
根据权利要求5所述的方法，其中，所述对所述待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对所述嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码，包括：

对所述待检测对象的嘴唇动作特征进行提取，并将所述嘴唇动作特征输入所述预先训练的唇语识别模型；

利用所述唇语识别模型对所述嘴唇动作特征进行特征解析，将所述嘴唇动作特征与预设的嘴唇动作特征样本进行比对；及

当所述嘴唇动作特征符合所述嘴唇动作特征样本时，将所述嘴唇动作特征样本对应的展示码，作为所述嘴唇动作特征展示码。
根据权利要求1所述的方法，其中，在所述当确认所述待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与所述人脸检测结果进行比对，进行身份认证，得到身份认证结果之后，还包括：

获取所述待检测对象的基本信息和行为记录；所述行为记录包括浏览记录、收藏记录以及购买记录；

将所述待检测对象的基本信息和预先存储的用户信息进行比对，当所述待检测对象的基本信息符合所述预先存储的用户信息时，对所述待检测对象的行为记录进行验证；及

当所述待检测对象的行为记录通过验证时，表示所述身份认证成功。
一种身份验证装置，包括：

人脸检测模块，用于当检测到待检测对象的登录操作时，触发人脸检测指令，根据所述人脸检测指令对所述待检测对象进行人脸检测，获得人脸检测结果；

随机展示码序列生成模块，用于根据所述人脸检测结果生成随机展示码序列；所述随机展示码序列根据随机数字、随机字母或随机汉字中任意两种形式或两种以上的形式组成；

嘴唇动作特征提取模块，用于对所述待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对所述嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码；

语音识别模块，用于提取所述待检测对象的解读音频，并对所述解读音频进行语音识别，将所述解读音频转换成语音文本展示码；

比对模块，用于将所述嘴唇动作特征展示码和所述语音文本展示码，与所述随机展示码序列进行比对，当所述嘴唇动作特征展示码和所述语音文本展示码均符合所述随机展示码序列时，对所述待检测对象进行活体检测；及

身份认证模块，用于当确认所述待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与所述人脸检测结果进行比对，进行身份认证，得到身份认证结果。
一种计算机设备，包括存储器及一个或多个处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

当检测到待检测对象的登录操作时，触发人脸检测指令，根据所述人脸检测指令对所述待检测对象进行人脸检测，获得人脸检测结果；

根据所述人脸检测结果生成随机展示码序列；所述随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成；

对所述待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对所述嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码；

提取所述待检测对象的解读音频，并对所述解读音频进行语音识别，将所述解读音频转换成语音文本展示码；

将所述嘴唇动作特征展示码和所述语音文本展示码，与所述随机展示码序列进行比对，当所述嘴唇动作特征展示码和所述语音文本展示码均符合所述随机展示码序列时，对所述待检测对象进行活体检测；及

当确认所述待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与所述人脸检测结果进行比对，进行身份认证，得到身份认证结果。
根据权利要求9所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤：

当检测到所述待检测对象的登录操作时，获取所述待检测对象的登录状态；所述登录状态包括登录成功和登录失败；

当确定所述待检测对象的登录状态为登陆成功时，触发人脸检测指令；及

根据所述人脸检测指令打开相机程序，利用所述相机程序对所述待检测对象进行人脸检测，当检测到所述待检测对象的人脸部分时，生成人脸检测结果。
根据权利要求9所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤：

获取当前应用场景下的所述随机展示码序列的预设要求；所述预设要求包括所述随机展示码序列长度，以及所述随机展示码序列组成；及

当根据所述人脸检测结果，确定检测到所述待检测对象的人脸部分时，根据所述随机展示码序列的预设要求，随机生成所述随机展示码序列。
根据权利要求9所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤；

根据样本数据对深度学习模型进行训练，获得训练后的唇语识别模型。
根据权利要求12所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤：

收集各数字以及各字母对应的唇形图片；

从数据库中提取超出预设使用频率的多个汉字，并收集多个所述汉字对应的唇形图片；

提取各所述唇形图片上的嘴唇动作特征，生成样本数据；及

利用所述样本数据，对卷积神经网络模型进行训练，得到对应的唇语识别模型。
根据权利要求13所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤：

对所述待检测对象的嘴唇动作特征进行提取，并将所述嘴唇动作特征输入所述预先训练的唇语识别模型；

利用所述唇语识别模型对所述嘴唇动作特征进行特征解析，将所述嘴唇动作特征与预设的嘴唇动作特征样本进行比对；及

当所述嘴唇动作特征符合所述嘴唇动作特征样本时，将所述嘴唇动作特征样本对应的展示码，作为所述嘴唇动作特征展示码。
一个或多个存储有计算机可读指令的计算机可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

当检测到待检测对象的登录操作时，触发人脸检测指令，根据所述人脸检测指令对所述待检测对象进行人脸检测，获得人脸检测结果；

根据所述人脸检测结果生成随机展示码序列；所述随机展示码序列根据随机数字、随机字母或随机汉字中至少一种形式组成；

对所述待检测对象的嘴唇动作特征进行提取，并利用预先训练的唇语识别模型对所述嘴唇动作特征进行特征解析，获得对应的嘴唇动作特征展示码；

提取所述待检测对象的解读音频，并对所述解读音频进行语音识别，将所述解读音频转换成语音文本展示码；

将所述嘴唇动作特征展示码和所述语音文本展示码，与所述随机展示码序列进行比对，当所述嘴唇动作特征展示码和所述语音文本展示码均符合所述随机展示码序列时，对所述待检测对象进行活体检测；及

当确认所述待检测对象为活体对象时，调用数据库中预存的待检测对象的脸部图像文件，与所述人脸检测结果进行比对，进行身份认证，得到身份认证结果。
根据权利要求15所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

当检测到所述待检测对象的登录操作时，获取所述待检测对象的登录状态；所述登录状态包括登录成功和登录失败；

当确定所述待检测对象的登录状态为登陆成功时，触发人脸检测指令；及

根据所述人脸检测指令打开相机程序，利用所述相机程序对所述待检测对象进行人脸检测，当检测到所述待检测对象的人脸部分时，生成人脸检测结果。
根据权利要求15所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

获取当前应用场景下的所述随机展示码序列的预设要求；所述预设要求包括所述随机展示码序列长度，以及所述随机展示码序列组成；及

当根据所述人脸检测结果，确定检测到所述待检测对象的人脸部分时，根据所述随机展示码序列的预设要求，随机生成所述随机展示码序列。
根据权利要求15所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

根据样本数据对深度学习模型进行训练，获得训练后的唇语识别模型。
根据权利要求18所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

收集各数字以及各字母对应的唇形图片；

从数据库中提取超出预设使用频率的多个汉字，并收集多个所述汉字对应的唇形图片；

提取各所述唇形图片上的嘴唇动作特征，生成样本数据；及

利用所述样本数据，对卷积神经网络模型进行训练，得到对应的唇语识别模型。
根据权利要求19所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

对所述待检测对象的嘴唇动作特征进行提取，并将所述嘴唇动作特征输入所述预先训练的唇语识别模型；

利用所述唇语识别模型对所述嘴唇动作特征进行特征解析，将所述嘴唇动作特征与预设的嘴唇动作特征样本进行比对；及

当所述嘴唇动作特征符合所述嘴唇动作特征样本时，将所述嘴唇动作特征样本对应的展示码，作为所述嘴唇动作特征展示码。