WO2016058540A1

WO2016058540A1 - 身份验证方法、装置和存储介质

Info

Publication number: WO2016058540A1
Application number: PCT/CN2015/091975
Authority: WO
Inventors: 陈敏浩; 涂杰; 王玉叶; 陈辉; 陈荣; 郑兴
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2014-10-15
Filing date: 2015-10-15
Publication date: 2016-04-21

Abstract

本发明实施例提供了一种身份验证方法、装置和存储介质。其中，该方法包括：验证设备向验证对象提供验证提示信息；所述验证设备获取身份验证信息，所述身份验证信息由所述验证对象根据所述验证提示信息生成；所述验证设备将所述身份验证信息与所述验证提示信息的信息样本进行比较；当所述身份验证信息与所述验证提示信息的信息样本之间的匹配度满足预设值，则所述验证对象通过验证。

Description

身份验证方法、装置和存储介质

本申请要求于2014年10月15日提交中国专利局、申请号为201410545593.X、发明名称为“一种身份验证方法、装置和系统”，于2014年11月14日提交中国专利局、申请号为201410647776.2、发明名称为“活体鉴别方法及装置”，于2014年12月16日提交中国专利局、申请号为201410779600.2、发明名称为“一种切换工作状态的方法和装置”，的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及通信技术领域，具体涉及一种身份验证方法、装置和存储介质。

背景技术

随着互联网技术的发展，信息安全也越来越受到各方的关注。为了保证信息安全，现有技术提出了很多身份验证方案，比如基于密码的身份验证方案、基于指纹的身份验证方案或基于手机绑定的身份验证方案，等等。在现有的这些身份验证方案中，一般都需要事先保存用户输入的密码或指纹等作为样本数据，然后在身份验证阶段，获取用户输入的密码或指纹等，并将用户输入的密码或指纹等和事先录入的密码或指纹样本数据进行匹配，若能匹配，则确定用户的身份合法，验证通过，否则，如果不匹配则表示用户的身份不合法，验证不通过。

但是现有方案的安全性并不高，比如，一旦密码或指纹数据被非法侵入者窃取，则非法入侵者很容易就可以盗取其账户中的信息数据，信息安全性无法受到保障，身份验证的效果不佳。

发明内容

本发明实施例提供了一种身份验证方法、装置和存储介质，以解决现有技术中信息安全无法保证的问题。

本发明实施例所提供的身份验证方法包括：验证设备向验证对象提供验证提示信息；验证设备获取身份验证信息，身份验证信息由验证对象根据验证提示信息生成；验证设备将身份验证信息与验证提示信息的信息样本进行比较；当身份验证信息与验证提示信息的信息样本之间的匹配度满足预设值，则验证对象通过验证。

本发明实施例所提供的身份验证装置包括：一个或多个处理器和存储有操作指令的存储介质，当运行存储介质中的操作指令时，处理器执行：向验证对象提供验证提示信息；获取身份验证信息，身份验证信息由验证对象根据验证提示信息生成；将身份验证信息与验证提示信息的信息样本进行比较；当身份验证信息与验证提示信息的信息样本之间的匹配度满足预设值，则验证对象通过验证

本发明实施例所提供的一种非瞬时性的计算机可读存储介质，其上存储有计算机可执行指令，当计算机中运行这些可执行指令时，执行：向验证对象提供验证提示信息；获取身份验证信息，身份验证信息由验证对象根据验证提示信息生成；将身份验证信息与验证提示信息的信息样本进行比较；当身份验证信息与验证提示信息的信息样本之间的匹配度满足预设值，则验证对象通过验证。

附图说明

图1为本发明实施例提供的一种身份验证方法流程示意图；

图2为本发明实施例提供的一种身份验证方法流程示意图；

图3为本发明实施例中身份验证信息的获取场景示意图；

图4为本发明实施例提供的身份验证方法的网络框架图；

图5为本发明实施例提供的身份验证方法的场景示意图；

图6为本发明实施例提供的一种身份验证方法流程示意图；

图7为本发明实施例提供的一种身份验证方法流程示意图；

图8为本发明实施例提供的一种身份验证装置的结构示意图；

图9为本发明实施例提供的一种身份验证装置的结构示意图；

图10为本发明实施例提供的一种身份验证方法流程示意图；

图11为本发明实施例提供的设置基准音频数据和基准文本数据的方法流程示意图；

图12为本发明实施例提供的一种身份验证方法流程示意图；

图13为本发明实施例提供的身份验证方法所涉及的一界面示意图；

图14为本发明实施例提供的身份验证方法所涉及的另一界面示意图；

图15为本发明实施例提供的身份验证方法所涉及的模型点的示意图；

图16为本发明实施例提供的身份验证方法所涉及的概率计算方法的方法流程图；

图17为本发明实施例提供的身份验证方法所涉及的匹配计算示意图；

图18为本发明实施例提供的身份验证方法流程示意图；

图19为本发明实施例提供的身份验证方法流程示意图；

图20为本发明实施例提供的身份验证方法流程示意图；

图21为本发明实施例提供的身份验证装置的结构示意图；

图22是本发明实施例提供的身份验证装置的结构示意图；

图23是本发明实施例提供的身份验证装置的结构示意图；

图24是本发明实施例提供的身份验证装置的结构示意图；以及

图25是本发明实施例提供的身份验证装置的结构示意图。

具体实施方式

图1为本发明实施例所提供的一种身份验证方法流程示意图，该方法可以应用于终端或服务器等设备。其中，终端可以为手机、平板电脑或个人计算机等设备。如图1所示，该方法可以包括步骤101至步骤103。

在步骤101中，验证设备向验证对象提供验证提示信息。

在步骤102中，验证设备获取身份验证信息，身份验证信息由验证对象根据验证提示信息生成。

在步骤103中，验证设备将身份验证信息与验证提示信息的信息样本进行比较；当身份验证信息与验证提示信息的信息样本之间的匹配度满足预设值，则验证对象通过验证。

本实施例将从身份验证装置的角度进行描述，该身份验证装置具体可以为终端或服务器等设备，其中，终端具体可以为手机、平板电脑或个人计算机等设备。

一种身份验证方法，包括：获取数据处理请求；根据所述数据处理请求获取身份验证信息，所述身份验证信息包括图像信息、声音信息、以及所述图像信息和声音信息的关联信息；判断所述身份验证信息与预置的信息样本是否匹配；若是，则通过所述数据处理请求；若否，则拒绝所述数据处理请求。

如图2所示，该身份验证方法的具体流程可以包括步骤201至步骤203。

在步骤201中，获取数据处理请求。

例如，如果该身份验证装置为服务器，则具体可以接收终端发送的数据处理请求。

又例如，如果该身份验证装置为终端，则具体可以接收用户触发的数据处理请求，等等。

其中，该数据处理请求具体可以为虚拟资源转移请求，比如转账请求、付款请求或还款请求，等等，或者，该数据处理请求也可以使其他的文件处理请求或业务请求等，该数据处理请求中还可以携带用户的身份标识等信息，在此不再赘述。

在步骤202中，根据接收到的数据处理请求获取身份验证信息，其中，该身份验证信息包括图像信息、声音信息、以及该图像信息和声音信息的关联信息等信息。

其中，图像信息和声音信息的关联信息指的是图像信息中的图像与声音信息中的声音之间的位置关系和/或时间关系，比如，某一帧图像和某一时刻的声音之间的时间间隔，等等。

其中，根据执行主体的不同，获取该身份验证信息的方式也有所不同。如果该身份验证装置为服务器，则此时，具体可以根据该数据处理请求向终端发送身份信息获取请求，然后接收终端根据该身份信息获取请求返回的身份验证信息。如果该身份验证装置为终端，则此时，具体可以根据该数据处理请求接收用户输入的身份验证信息。

其中，该身份验证信息可以通过多种信息格式来承载，比如，可以是视频信息，也可以是独立的图像信息和声音信息，即步骤“根据接收到的数据处理请求获取身份验证信息”可以包括如下两种方式。

方式一

根据该数据处理请求获取视频信息，从该视频信息中提取相应的图像信息、声音信息、以及该图像信息和声音信息的关联信息。

例如，如果该身份验证装置为服务器，则此时，具体可以根据该数据处理请求向终端发送身份信息获取请求，然后接收终端根据该身份信息获取请求返回的视频信息，从该视频信息中提取相应的图像信息、声音信息、以及该图像信息和声音信息的关联信息。

又例如，如果该身份验证装置为终端，则此时，具体可以根据该数据处理请求接收用户输入的视频信息，从该视频信息中提取相应的图像信息、声音信息、以及该图像信息和声音信息的关联信息。

方式二

根据该数据处理请求分别获取图像信息和声音信息，根据该图像信息和声音信息确定所述图像信息和声音信息的关联信息。

例如，如果该身份验证装置为服务器，则此时，具体可以根据该数据处理请求向终端发送身份信息获取请求，然后接收终端根据该身份信息获取请求返回的图像信息和声音信息，根据该图像信息和声音信息确定所述图像信息和声音信息的关联信息。

又例如，如果该身份验证装置为终端，则此时，具体可以根据该数据处理请求接收用户分别输入的图像信息和声音信息，根据该图像信息和声音信息确定所述图像信息和声音信息的关联信息。

需说明的是，在获取声音信息时，可以由用户直接输入，也可以显示文字供用户朗读，其中，该显示的文字为预置的信息样本中的语音内容相应的文字，即步骤“获取声音信息”具体可以包括：

根据该数据处理请求获取该信息样本中的语音内容，将该语音内容以文字的形式进行显示，并提示用户朗读该文字，收录用户朗读该文字时的声音，得到声音信息。

在步骤203中，判断该身份验证信息与预置的信息样本是否匹配，若匹配，则通过该数据处理请求；否则，若不匹配，则拒绝该数据处理请求。

其中，信息样本可以包括图像特征样本、声纹特征样本、以及图像信息和声音信息的关联信息样本等，则步骤“判断该身份验证信息与预置的信息样本是否匹配”具体可以如下：

分别从该图像信息中提取图像特征，以及从该声音信息中提取声纹特征，分别确定该图像特征、声纹特征和该关联信息与预置的图像特征样本、声纹特征样本、以及关联信息样本是否匹配(即确定该图像特征与预置的图像特征样本是否匹配，确定声纹特征与预置的声纹特征样本是否匹配，以及确定该关联信息与预置的关联信息样本是否匹配)；若其中匹配的项数超过预置阈值，则确定所述身份验证信息与预置的信息样本匹配；若其中匹配的项数未超过预置阈值，则确定该身份验证信息与预置的信息样本不匹配。

其中，该预置阈值可以根据实际应用的需求进行设置，该阈值大于等于2。

例如，以该阈值设置为2为例，则如果“图像特征和图像特征样本匹配，且声纹特征和声纹特征样本匹配”，或，“图像特征和图像特征样本匹配，且关联信息与关联信息样本匹配”，或，“声纹特征和声纹特征样本匹配，且关联信息与关联信息样本匹配”，则确定该身份验证信息与预置的信息样本匹配，否则，则确定该身份验证信息与预置的信息样本不匹配。

又例如，以该阈值设置为大于等于2为例，则如果“图像特征和图像特征样本匹配，且声纹特征和声纹特征样本匹配”，或，“图像特征和图像特征样本匹配，且关联信息与关联信息样本匹配”，或，“声纹特征和声纹特征样本匹配，且关联信息与关联信息样本匹配”，或，“图像特征和图像特征样本匹配，且声纹特征和声纹特征样本匹配，且关联信息与关联信息样本匹配”，则确定该身份验证信息与预置的信息样本匹配，否则，则确定该身份验证信息与预置的信息样本不匹配。

又例如，还可以将该阈值设置为3，即要全部都匹配，才确定该身份验证信息与预置的信息样本匹配，否则，若其中有任意一项不匹配，则确定该身份验证信息与预置的信息样本不匹配，以此类推，在此不再赘述。

可选的，为了进一步提高信息的安全性，还可以对语音内容也进行验证，即该信息样本还可以包括语音内容样本，则此时，步骤“判断该身份验证信息与预置的信息样本是否匹配”可以包括：

分别从该图像信息中提取图像特征，以及从该声音信息中提取声纹特征和语音内容，分别确定该图像特征、声纹特征、语音内容和该关联信息是否与预置的图像特征样本、声纹特征样本、语音内容样本以及关联信息样本匹配(即确定该图像特征与预置的图像特征样本是否匹配，确定声纹特征与预置的声纹特征样本是否匹配，语音内容与预置的语音内容样本是否匹配，以及确定该关联信息与预置的关联信息样本是否匹配)；若其中匹配的项数超过预置阈值，则确定所述身份验证信息与预置的信息样本匹配；若其中匹配的项数未超过预置阈值，则确定所述身份验证信息与预置的信息样本不匹配。

其中，该预置阈值可以根据实际应用的需求进行设置，该阈值大于等于2，比如，可以设置为2、3或4，也可以设置一定的范围，比如大于等于2，大于等于3，等等，参见前面的描述，在此不再赘述。

其中，该信息样本可以根据实际应用的需求或用户的喜好进行设置，即在获取数据处理请求之前，该身份验证还可以包括获取并保存信息样本。

在本实施例中，可以通过如下两种方式获取并保存信息样本。

方式一

获取用户的视频信息样本，从该视频信息样本中提取相应的图像信息样本、声音信息样本、以及所述图像信息和声音信息的关联信息样本，从该图像信息样本中提取图像特征样本、以及从该声音信息样本中提取声纹特征样本，保存该图像特征样本、声纹特征样本、以及所述图像信息和声音信息的关联信息样本。

当然，如果该信息样本还包括语音内容，则还可以从声音信息样本中提取语音内容样本，并保存该语音内容样本。

方式二

分别获取用户的图像信息样本和声音信息样本，根据该图像信息样本和声音信息样本确定该图像信息样本和声音信息样本的关联关系，得到关联信息样本，从该图像信息样本中提取图像特征样本、以及从该声音信息样本中提取声纹特征样本，保存该图像特征样本、声纹特征样本、以及所述图像信息和声音信息的关联信息样本。

其中，在获取声音信息样本时，可以由用户直接输入，也可以显示文字供用户朗读，即步骤“获取声音信息样本”可以包括：

按照预置策略生成文字，显示这些文字，并提示用户朗读这些文字，收录用户朗读这些文字时的声音，得到声音信息样本。

例如，参见图3，终端可以拍摄用户“打响指”的动作，并显示“芝麻开门”这四个字，录制用户朗读这四个字时的声音信息，然后将这些信息提供给服务器，由服务器从这些信息中提取出图像特征、声纹特征、语音内容、以及图像信息和声音信息的关联关系，比如，该关联关系可以是“打响指”这个动作的拍摄时间与用户朗读“芝麻开门”这四个字时的时间间隔，等等，然后将提取到的这些信息作为信息样本进行保存，以作为身份验证的密码，比如可以作为用户的支付密码、转账密码或其他业务的密码，等等。

还需说明的是，在通过用户的数据处理请求后，后续还可以根据该数据处理请求进行数据处理，比如，进行转账、付款或打开文件夹等等操作，在此不再赘述。

由上可知，本实施例采用获取数据处理请求，根据该数据处理请求获取身份验证信息，其中，该身份验证信息包括图像信息、声音信息、以及所述图像信息和声音信息的关联信息；判断该身份验证信息与预置的信息样本是否匹配，若匹配，则通过所述数据处理请求，否则，如果不匹配，则拒绝所述数据处理请求；由于在该方案中，可以将图像信息和声音信息结合起来作为身份验证信息，使得该身份验证信息不仅可以包括图像信息和声音信息，而且还可以包括该图像信息和声音信息的关联信息，因此，相对于现有技术中只采用单一的密码或指纹等信息而言，增加了验证信息的复杂度，提高了非法入侵者盗取该身份验证信息的难度，所以，相对于现有技术而言，可以加强身份验证的效果，提高信息的安全性。

本发明实施例提供了另一种身份认证方法，在本实施例中，将以该身份验证装置具体为服务器为例进行说明。

参见图4，该身份验证方法所应用的通信系统可以包括服务器和终端。

终端，用于发送数据处理请求给服务器，以及在接收到服务器发送的身份信息获取请求后，获取身份验证信息，将该身份验证信息发送给服务器。

其中，该身份验证信息包括图像信息、声音信息、以及该图像信息和声音信息的关联信息等信息。

服务器，用于接收终端发送的数据处理请求，根据该数据处理请求向终端发送身份信息获取请求，然后接收终端根据该身份信息获取请求返回的身份验证信息，判断该身份验证信息与预置的信息样本是否匹配；若是，则通过该数据处理请求；若否，则拒绝该数据处理请求。

其中，该预置的信息样本可以保存在该服务器中，也可以保留在其他设备中，该信息样本中的各个信息可以保存在同一个实体中，也可以分别保存在不同的实体中，比如，参见图5，该服务器可以包括移动支付服务器、图像特征服务器、声纹特征服务器和语音内容服务器等，则可以将图像特征样本保存在图像特征服务器中，并由图像特征服务器来验证图像特征是否与图像特征样本匹配；可以将声纹特征样本保存在声纹特征服务器，并由声纹特征服务器来验证声纹特征是否与声纹特征样本匹配；可以将语音内容样本保存在语音内容服务器，并由语音内容服务器来验证语音内容是否与语音内容样本匹配；将图像信息和声音信息的关联信息样本保存在移动支付服务器中，由移动支付服务器来验证关联信息是否与关联信息样本匹配，等等，在此不再列举。为了描述方便，在本实施例中，将以这些信息样本均保存在同一个服务器中为例进行说明。

基于该通信系统的结构，以下将对其身份验证方法的流程进行详细说明。为了描述方便，以支付请求作为数据处理请求进行说明。

如图6所示，本实施所提供的一种身份认证方法可以包括步骤601至步骤608。

在步骤601中，终端发送支付请求给服务器，比如，可以指示将某个金额的钱转入某个账户。

其中，该支付请求可以携带用户的身份标识，比如该用户的身份标识具体可以包括用户的银行账号、邮箱账号、用户名和/或用户昵称等标识。

在步骤602中，服务器接收到该支付请求后，根据该支付请求向终端发送身份信息获取请求。

在步骤603中，终端接收到服务器发送的身份信息获取请求后，根据该身份信息获取请求获取用户的身份验证信息，并将该身份验证信息发送给服务器。

其中，身份验证信息包括图像信息、声音信息、以及该图像信息和声音信息的关联信息等信息。

例如，具体可以根据该身份信息获取请求生成提示信息，其中，该提示信息指示用户拍摄一段视频，或分别拍摄一系列图片以及录制一段声音，并接收用户根据该提示信息的指示录制的视频、或者图片和信息作为身份验证信息提供给服务器。

在步骤604中，服务器接收到该身份验证信息后，从该身份验证信息中提取出图像信息、声音信息、以及该图像信息和声音信息的关联信息等信息。

例如，如果接收到的是验证信息是一段视频信息，则从该视频信息中提取相应的图像信息、声音信息、以及该图像信息和声音信息的关联信息，比如在某一帧图像时相应地存在有声音，等等。

又例如，如果接收到的身份验证信息是图像信息和声音信息，则可以根据该图像信息和声音信息确定该图像信息和声音信息的关联信息，比如确定获取该图像信息和声音信息时的时间间隔，例如，如果用户是拍摄某张相片后，间隔1秒再录一段声音的话，则此时可以确定该时间间隔为1s，等等，在此不再赘述。

在步骤605中，服务器分别从该图像信息中提取图像特征，以及从该声音信息中提取声纹特征。

可选，如果该信息样本还可以包括语音内容样本，则此时还可以从该声音信息中提取语音内容。

在步骤606中，服务器根据用户的身份标识获取相应的预置的信息样本，分别确定该图像特征、声纹特征和该关联信息是否与该信息样本匹配，若其中匹配的项数超过预置阈值，则确定该身份验证信息与预置的信息样本匹配，表示验证通过，于是执行步骤607，若其中匹配的项数超过预置阈值，则确定该身份验证信息与预置的信息样本不匹配，表示验证不通过，于是执行步骤608。

其中，该信息样本可以包括图像特征样本、声纹特征样本以及关联信息样本，还可以包括语音内容样本，具体可以如下：

分别确定该图像特征、声纹特征和该关联信息是否与预置的图像特征样本、声纹特征样本以及关联信息样本匹配，即确定该图像特征与预置的图像特征样本是否匹配，确定声纹特征与预置的声纹特征样本是否匹配，以及确定该关联信息与预置的关联信息样本是否匹配，当然，如果还需对语音内容进行验证的话，则此时还需确定该语音内容与预置的语音内容样本是否匹配，若上述几项中匹配的项数超过预置阈值，则表示所述身份验证信息与预置的信息样本匹配，于是执行步骤607，若其中匹配的项数未超过预置阈值，则表示该身份验证信息与预置的信息样本不匹配，于是执行步骤608。

其中，该预置阈值可以根据实际应用的需求进行设置，该阈值大于等于2，具体可参见前面的实施例，在此不再赘述。

其中，该信息样本可以根据实际应用的需求或用户的喜好进行设置，具体的设置方法可参见图2所示实施例，在此不再赘述。

在步骤607中，服务器通过该支付请求的验证，此时可以返回验证通过的响应给终端。

此后，服务器可以根据该支付请求进行支付处理，比如可以将某个金额的钱转入某个账户，等等，后续还可以将处理结果通知给终端，在此不再赘述。

在步骤608中，服务器拒绝该支付请求的验证，此时可以返回验证失败的响应给终端。

在本实施例中，将以该身份验证装置具体为终端，且数据处理请求具体为终端应用启动请求为例进行说明。

如图7所示，本实施例所提供的一种身份认证方法可以包括步骤701至步骤707。

在步骤701中，终端接收到用户触发的终端应用启动请求，比如，可以指示打开某个终端应用，比如相册或个人文档，等等。

在步骤702中，终端接收到该终端应用启动请求后，根据该终端应用启动请求生成并显示提示信息，其中，该提示信息指示用户拍摄一段视频，或分别拍摄一系列图片以及录制一段声音，并接收用户根据该提示信息的指示录制的视频、或者图片和信息，得到身份验证信息。

在步骤703中，终端从该身份验证信息中提取出图像信息、声音信息、以及该图像信息和声音信息的关联信息等信息。

在步骤704中，终端分别从该图像信息中提取图像特征，以及从该声音信息中提取声纹特征。

在步骤705中，终端获取相应的预置的信息样本，分别确定该图像特征、声纹特征和该关联信息是否与该信息样本匹配，若这几项中匹配的项数超过预置阈值，则确定该身份验证信息与预置的信息样本匹配，于是执行步骤706，若其中匹配的项数未超过预置阈值，则确定该身份验证信息与预置的信息样本不匹配，于是执行步骤707。

分别确定该图像特征、声纹特征和该关联信息是否与预置的图像特征样本、声纹特征样本以及关联信息样本匹配，即确定该图像特征与预置的图像特征样本是否匹配，确定声纹特征与预置的声纹特征样本是否匹配，以及确定该关联信息与预置的关联信息样本是否匹配，当然，如果还需对语音内容进行验证的话，则此时还需确定该语音内容与预置的语音内容样本是否匹配，若上述几项中匹配的项数超过预置阈值，则表示所述身份验证信息与预置的信息样本匹配，于是执行步骤706，若其中匹配的项目未超过预置阈值，则表示该身份验证信息与预置的信息样本不匹配，于是执行步骤707。

其中，该信息样本可以根据实际应用的需求或用户的喜好进行设置，具体的设置方法可参见图6所示实施例，在此不再赘述。

在步骤706中，终端通过该终端应用启动请求，此时可以显示验证通过的通知给用户。

此后，终端可以根据该终端应用启动请求启动相应的终端应用，比如打开相册或个人文档，等等。

在步骤707中，终端拒绝该终端应用启动请求，此时可以显示验证失败的通知给用户。

本发明实施例还提供一种身份验证装置，如图8所示，该身份验证装置包括请求获取单元801、信息获取单元802和验证单元803，如下：

请求获取单元801，用于获取数据处理请求。

例如，如果该身份验证装置为服务器，则请求获取单元801具体可以接收终端发送的数据处理请求。

又例如，如果该身份验证装置为终端，则请求获取单元801具体可以接收用户触发的数据处理请求，等等。

信息获取单元802，用于根据该数据处理请求获取身份验证信息，其中，该身份验证信息包括图像信息、声音信息、以及所述图像信息和声音信息的关联信息等信息。

验证单元803，用于判断所述身份验证信息与预置的信息样本是否匹配，若是，则通过所述数据处理请求，若否，则拒绝所述数据处理请求。

其中，根据执行主体的不同，获取该身份验证信息的方式也有所不同，例如，可以如下：

如果该身份验证装置为服务器，则此时，信息获取单元802具体可以根据该数据处理请求向终端发送身份信息获取请求，然后接收终端根据该身份信息获取请求返回的身份验证信息。

如果该身份验证装置为终端，则此时，信息获取单元802具体可以根据该数据处理请求接收用户输入的身份验证信息。

其中，该身份验证信息可以通过多种信息格式来承载，比如，可以是视频信息，也可以是独立的图像信息和声音信息，即信息获取单元802可通过两种方式获取身份验证信息，具体可参见方法实施例。此处不做赘述。

需说明的是，在获取声音信息时，可以由用户直接输入，也可以显示文字供用户朗读，其中，该显示的文字为预置的信息样本中的语音内容相应的文字，即操作“获取声音信息”具体可以为：

信息获取单元802，具体可以用于根据该数据处理请求获取该信息样本中的语音内容，将该语音内容以文字的形式进行显示，并提示用户朗读该文字，收录用户朗读该文字时的声音，得到声音信息。

其中，信息样本可以包括图像特征样本、声纹特征样本、以及图像信息和声音信息的关联信息样本等，则：

验证单元803，具体可以用于：分别从该图像信息中提取图像特征，以及从该声音信息中提取声纹特征，分别确定该图像特征、声纹特征和该关联信息与预置的图像特征样本、声纹特征样本、以及关联信息样本是否匹配(即确定该图像特征与预置的图像特征样本是否匹配，确定声纹特征与预置的声纹特征样本是否匹配，以及确定该关联信息与预置的关联信息样本是否匹配)；若其中匹配的项数超过预置阈值，则确定所述身份验证信息与预置的信息样本匹配；若其中匹配的项数未超过预置阈值，则确定该身份验证信息与预置的信息样本不匹配。

可选的，为了进一步提高信息的安全性，还可以对语音内容也进行验证，即该信息样本还可以包括语音内容样本，则此时：

验证单元803，具体可以用于分别从该图像信息中提取图像特征，以及从该声音信息中提取声纹特征和语音内容，分别确定该图像特征、声纹特征、语音内容和该关联信息是否与预置的图像特征样本、声纹特征样本、语音内容样本以及关联信息样本匹配(即确定该图像特征与预置的图像特征样本是否匹配，确定声纹特征与预置的声纹特征样本是否匹配，语音内容与预置的语音内容样本是否匹配，以及确定该关联信息与预置的关联信息样本是否匹配)；若其中匹配的项数超过预置阈值，则确定所述身份验证信息与预置的信息样本匹配；若其中匹配的项数未超过预置阈值，则确定所述身份验证信息与预置的信息样本不匹配。

其中，该信息样本可以根据实际应用的需求或用户的喜好进行设置，即如图9所示，该身份验证装置还可以包括样本获取单元804，如下：

样本获取单元804，用于获取并保存信息样本。例如，具体可以采用另种方式获取并保存信息样本，具体可参见方法实施例，此处不做赘述。

其中，在获取声音信息样本时，可以由用户直接输入，也可以显示文字供用户朗读，即：

样本获取单元804，具体可以用于按照预置策略生成文字，显示这些文字，并提示用户朗读这些文字，收录用户朗读这些文字时的声音，得到声音信息样本。

例如，以该身份验证装置具体为服务器为例，参见图3，样本获取单元804可以拍摄用户“打响指”的动作，并显示“芝麻开门”这四个字，录制用户朗读这四个字时的声音信息，然后将这些信息提供给服务器，由服务器从这些信息中提取出图像特征、声纹特征、语音内容、以及图像信息和声音信息的关联关系，比如，该关联关系可以是“打响指”这个动作的拍摄时间与用户朗读“芝麻开门”这四个字时的时间间隔，等等，然后将提取到的这些信息作为信息样本进行保存，以作为身份验证的密码，比如可以作为用户的支付密码、转账密码或其他业务的密码，等等。

还需说明的是，在通过用户的数据处理请求后，后续还可以根据该数据处理请求进行数据处理，比如，进行转账、付款或打开文件夹等等操作，即该身份验证装置还可以包括数据处理单元，如下：

数据处理单元，用于在通过用户的数据处理请求后，根据该数据处理请求进行数据处理。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可以参见前面的实施例，在此不再赘述。

该身份验证装置具体可以为终端，也可以为服务器，其中，该终端具体可以为手机、平板电脑或PC等设备。

由于在该方案中，可以将图像信息和声音信息结合起来作为身份验证信息，使得该身份验证信息不仅可以包括图像信息和声音信息，而且还可以包括该图像信息和声音信息的关联信息，因此，相对于现有技术中只采用单一的密码或指纹等信息而言，增加了验证信息的复杂度，提高了非法入侵者盗取该身份验证信息的难度，所以，相对于现有技术而言，可以加强身份验证的效果，提高信息的安全性。

相应的，本发明实施例还提供一种身份验证系统，可以包括本发明实施例提供的任一种身份验证装置，该身份验证装置即可以为终端，也可以为服务器，以下将以该身份验证装置分别为终端和服务器为例，进行简略说明。

(1)身份验证装置作为服务器时；

该通信系统除了可以包括服务器之外，还可以包括终端，如下：

其中，该预置的信息样本可以保存在该服务器中，也可以保留在其他设备中，该信息样本中的各个信息可以保存在同一个实体中，也可以分别保存在不同的实体中。

(2)身份验证装置作为终端时；

该通信系统至少可以包括终端，如下：

终端，用于接收用户触发的数据处理请求，根据该数据处理请求向终端发送身份信息获取请求，然后接收终端根据该身份信息获取请求返回的身份验证信息，判断该身份验证信息与预置的信息样本是否匹配；若是，则通过该数据处理请求；若否，则拒绝该数据处理请求。

以上各个设备的具体操作可参见前面的实施例，在此不再赘述。

由于该通信系统可以包括本发明实施例提供的任一种身份验证装置，因此同样可以实现本发明实施例提供的任一种身份验证装置所能实现的有益效果，详见前面的实施例，在此不再赘述。

本发明实施例提供了一种身份验证的方法，该方法的执行主体可以为终端或服务器等。其中，终端可以是手机、平板电脑、计算机等。通过该身份验证，可以进行后续数据处理，例如虚拟资源转移，还可以进行工作状态的切换等，如锁屏状态和屏幕解锁状态等。本实施例中，以工作状态由锁屏状态切换到屏幕解锁状态为例，并以终端为手机为例进行方案的详细说明，其他终端的情况与之类似，本实施例不再累述。

如图10所示，本发明所提供的身份验证方法包括步骤1001至步骤1003。

在步骤1001中，获取通过音频采集设备采集的第一音频数据。

在实施中，在执行屏幕解锁的流程之前，可以预先设置并存储基准音频数据和基准文本数据，设置过程可以是由用户对音频采集设备(如麦克风)输入一段语音，然后终端获取此段语音的音频数据，并将音频数据转换为文本数据，作为基准音频数据和基准文本数据，此设置过程在后面内容中会由详细阐述。

对于执行主体为终端的情况，用户这时可以对着音频采集设备输入语音，语音的内容可以与自己设置基准音频数据时输入语音的内容相同，例如，用于对麦克风说“芝麻开门”。这时，音频采集设备则会采集到用户输入的音频数据(即第一音频数据)，终端则可以获取到该音频数据。当然，此过程中也可以不显示锁屏界面，保持屏幕关闭状态，进行音频数据获取。

对于执行主体为服务器的情况，终端在获取到用户输入的音频数据后，可以生成解锁请求，在解锁请求中携带该音频数据，还可以携带终端的标识，如IMEI，将解锁请求发送给服务器，服务器可以从解锁请求中获取上述通过音频采集设备采集的音频数据。

在步骤1002中，对第一音频数据进行文本转换，得到对应的第一文本数据。

在实施中，终端或服务器可以预先存储音频文本转换数据库，存储了每个字符对应的音频特征，基于第一音频数据的音频特征，可以在音频文本转换数据库查找到对应的字符，将这些字符按顺序组合在一起，从而可以将音频数据转换为第一文本数据。

在步骤1003中，如果第一文本数据与预先存储的基准文本数据相同，且第一音频数据与预先存储的基准音频数据满足预设的近似度条件，则将第一工作状态切换为第二工作状态。

其中，第一工作状态和第二工作状态可以是设置好的任意工作状态，本实施例不做限制。

在实施中，对于执行主体为终端的情况，终端在将获取的音频数据转换为文本数据后，可以将转换得到的文本数据与存储的基准文本数据进行比较，判断它们是否相同，同时，将该音频数据与存储的基准音频数据进行近似度比较，判定它们之间是否满足预设的近似度条件，此近似度条件可以根据需求任意设置，例如，该近似度条件可以是两个音频数据的频率曲线满足一定的近似度，如两个频率曲线在各个点的差值绝对值的总和小于预设阈值。如果第一文本数据与基准文本数据相同，且第一音频数据与基准音频数据满足近似度条件，则触发工作状态切换，否则，不触发工作状态切换。这样，通过语音触发进行解锁等操作，相对于滑动操作的方式，可以有效的提高终端的安全性。

对于执行主体为服务器的情况，服务器可以预先存储每个终端对应的基准文本数据和基准音频数据，具体可以建立终端的标识与基准文本数据、基准音频数据的对应关系。服务器可以从上述解锁请求中获取终端的标识，然后在上述对应关系中查找该终端的标识对应的基准文本数据、基准音频数据，再进行上述比较判断的处理。当确定触发工作状态切换时，服务器可以向终端发送切换通知，以使终端将第一工作状态切换为第二工作状态。

可选的，可以存储多组基准文本数据和基准音频数据，第一音频数据和第一文本数据只要能与其中一组匹配，就可以触发工作模式切换，相应的，步骤1003可以包括步骤10031至步骤10032。

在步骤10031中，如果在预先存储的基准文本数据与基准音频数据的对应关系中存在第一基准文本数据与第一文本数据相同，则根据基准文本数据与基准音频数据的对应关系，确定第一基准文本数据对应的第一基准音频数据。

在实施中，以执行主体为终端为例(服务器的处理与之类似，不再累述)，用户可以设置多组基准文本数据和基准音频数据，终端则可以存储基准文本数据与基准音频数据的对应关系。终端在将获取的音频数据(即第一音频数据)转换为文本数据(即第一文本数据)后，可以在基准文本数据与基准音频数据的对应关系中，查找该文本数据，如果存在某基准文本数据(即第一基准音频数据)与该文本数据相同，则可以进一步查找该基准文本数据对应的基准音频数据(即第一基准音频数据)。

在步骤10032中，如果第一音频数据与所述第一基准音频数据满足预设的近似度条件，则将第一工作状态切换为第二工作状态。

在实施中，终端在确定第一基准音频数据后，可以按照上述类似的方式，将第一音频数据与第一基准音频数据进行近似度比较，以决定是否触发工作状态切换。

可选的，基于设置的不同，将第一工作状态切换为第二工作状态的处理可以存在多种多样的情况，以下给出了几种可行的情况：情况一，将锁屏状态切换为屏幕解锁状态；情况二，将应用程序锁定状态切换为应用程序解锁状态。

在实施中，对于情况二，上述步骤1001可以在启动应用程序的时候触发执行。

本发明实施例，还提供了设置基准音频数据和基准文本数据的方法，处理流程可以如图11所示，包括步骤1101至步骤1103。

在步骤1101中，接收设置指令，获取通过音频采集设备采集的第二音频数据。

在实施中，用户可以操作终端开启音频锁设置页面，在此界面中可以设置输入语音的选项，用户点击该选项，终端则会接收到设置指令，可以激活终端的音频采集设备，开始进行音频数据的采集，用户这时可以对着音频采集设备输入语音，如“芝麻开门”，这时，音频采集设备则会采集到用户输入的音频数据(即第二音频数据)，终端则可以获取到该音频数据。

在步骤1102中，对第二音频数据进行文本转换，得到对应的第二文本数据。

该处理过程与步骤1102类似，可以参考相应的内容，此处不再累述。

可选的，在文本转换得到第二文本数据后，可以进行以下处理：显示第二文本数据。

在步骤1103中，将第二音频数据和第二文本数据分别存储为基准音频数据和基准文本数据。

可选的，基于上述对第二文本数据的显示，可以让用户对第二文本数据进行确认，相应的，步骤1103的处理可以如下：如果接收到确认指令，则将第二音频数据和第二文本数据分别存储为基准音频数据和基准文本数据。

在实施中，终端获取第二文本数据后，可以显示确认框，在确认框中显示第二文本数据，如“芝麻开门”，并显示确认按键和重新输入按键。用户确认显示的第二文本数据确实是自己输入的语音匹配时，可以点击确认按键，这时，终端会接收到确认指令，进而终端可以将第二音频数据和第二文本数据分别存储为基准音频数据和基准文本数据。用户如果发现显示的第二文本数据与自己输入的语音不匹配时，可以点击重新输入按键，则会触发转至重新执行步骤1101。

本发明实施例中，获取通过音频采集设备采集的第一音频数据，对第一音频数据进行文本转换，得到对应的第一文本数据，如果第一文本数据与预先存储的基准文本数据相同，且第一音频数据与预先存储的基准音频数据满足预设的近似度条件，则将第一工作状态切换为第二工作状态，这样，无需在屏幕上进行多次点击操作，即可触发工作状态切换，从而，可以提高工作状态切换的效率。

本实施例将对上述实施例中语音识别的过程和声纹分析的过程进行详细说明。

终端或服务器中可以预先建立有音频文本转换数据库，在音频文本转换数据库可以存储每个字符对应的音频特征(如频率等)。当接收到用户输入的语音数据(即第一音频数据)的时候，可以根据语音数据的音频特征的变化，将该语音数据按字划分为多个音节，例如，用户输入“芝麻开门”的语音数据，可以将其划分为“芝”、“麻”、“开”、“门”的音频数据。然后，对于划分出的每个音频数据，可以将语音数据与音频文本转换数据库中的音频特征进行匹配判定，如果查找到相匹配的音频特征，则可以进一步获取该音频特征对应的字符，这样就可以得到每个音节的音频数据对应的字符，例如，对于上面的“芝”、“麻”、“开”、“门”的语音数据，在音频文本转换数据库中进行音频特征的匹配，分别可以查找到“芝”、“麻”、“开”、“门”的字符。再后，可以按照对应的音频数据的顺序，对各字符进行排序组合得到最终的文本数据(即上述第一文本数据)，例如，基于上述“芝”、“麻”、“开”、“门”的字符，可以得到“芝麻开门”字符串。

声纹分析的方式可以多种多样，以下给出了一种可行的处理方式。

终端或服务器获取用户输入的语音数据(即第一音频数据)与预先存储的基准音频数据，对于语音数据和基准音频数据，分别根据它们各自音频特征的变化，将它们按字划分为多个音节，例如，用户输入“芝麻开门”的语音数据，可以将其划分为“芝”、“麻”、“开”、“门”的音频数据，基准音频数据的划分也与之类似。然后，比较它们划分的音节数目是否相同，如果不同，则语音数据与基准音频数据匹配失败，如果相同，则可以继续按照各音节的顺序，将语音数据与基准音频数据中相对应的音节进行比较。在对任意两个音节进行具体比较时，可以在两个音节的时长上均匀选取预设数目(如3、15或30等)的时间点，计算两个音节中所有相对应的时间点的频率差的绝对值，再将这些频率差的绝对值相加的和作为误差度。在确定误差度之后，可以将误差度与预设的误差度阈值进行比较，如果误差度大于误差度阈值，则可以判定匹配失败，否则，可以判定匹配成功，如果语音数据与基准音频数据的音节两两匹配都成功，则可以判定语音数据与基准音频数据满足预设的近似度条件。

例如，语音数据中第一个音节为音节a，基准音频数据中第一个音节为音节b，分别在音节a和音节b的时长上均匀的选取3个时间点，计算音节a中第一个时间点和音节b中第一个时间点的频率差的绝对值，音节a中第二个时间点和音节b中第二个时间点的频率差的绝对值，音节a中第三个时间点和音节b中第三个时间点的频率差的绝对值，再将这三个频率差的绝对值相加作为误差度，然后基于误差度进行后续判断。

本发明实施例中，通过语音识别和声纹分析进行双重判断，触发终端解锁等操作，可以有效的提高终端的安全性。

请参考图12，其示出了本发明实施例提供的一种身份验证方法的方法流程图。本实施例以该身份验证方法应用于终端中来举例说明。该方法可以包括步骤1201至步骤1206。

在步骤1201中，向验证对象提供唇语提示信息。

首先，终端生成唇语提示信息。比如，在终端中存在一个唇语提示信息库，当需要进行身份验证时，终端从该唇语提示信息库中随机抽取一个唇语提示信息作为终端生成的唇语提示信息。

或者，服务器生成唇语提示信息。比如，在服务器中存在一个唇语提示信息库，当需要进行身份验证时，服务器从该唇语提示信息库中随机抽取一个唇语提示信息作为服务器生成的唇语提示信息。服务器将该唇语提示信息发送给终端。对应地，终端接收该唇语提示信息。

也即，该唇语提示信息可以是随机生成的提示信息；或，该唇语提示信息在相邻的验证过程中是不同的提示信息。

然后，终端向验证对象提供该唇语提示信息。本发明实施例中可以通过以下四种方式中的任意一种向验证对象提供唇语提示信息。

第一种可能的实现方式，终端显示文本形式的该唇语提示信息；

请参考图13，其示出了终端显示文本形式的该唇语提示信息的界面示意图。在终端的显示界面20上显示一个文本形式的唇语提示信息21，该唇语提示信息21提示被验证对象读出“我想要解锁”。

第二种可能的实现方式，终端显示图像形式的该唇语提示信息；

请参考图14，其示出了终端显示图像形式的该唇语提示信息的界面示意图。在终端的显示界面20上显示一个图像形式的唇语提示信息22，该唇语提示信息22提示被验证对象读出图片中的水果的名称“西瓜”。

第三种可能的实现方式，终端显示视频形式的该唇语提示信息；

在终端的显示界面上显示一个视频形式的唇语提示信息，该唇语提示信息提示验证对象回答出视频中提出的问题的答案。

第四种可能的实现方式，终端播放音频形式的该唇语提示信息。

终端播放一段音频形式的该唇语提示信息，该唇语提示信息提示验证对象读出与该音频中一致的该唇语提示信息。

在步骤1202中，采集验证对象的至少一帧图像。

终端采集验证对象的至少一帧图像。

当终端具有前置摄像头时，终端可以通过拍摄照片的方式采集到验证对象的至少一帧图像。终端还可以通过拍摄视频的方式采集到验证对象的至少一帧图像。

在步骤1203中，在至少一帧图像中包括唇部变化时，提取至少一帧图像中的唇部图像序列，该唇部图像序列用于表征验证对象的唇部变化。

在采集到的至少一帧图像中包括唇部变化时，终端检测唇部变化与唇语提示信息是否匹配。

终端通过人脸识别技术，可以确定采集到的至少一帧图像中是否存在人脸。当该至少一帧图像中存在人脸时，可以通过唇部颜色与肤色的区别确定人脸中的唇部的位置。当获取到唇部的位置时，可以采用模型点的方法确定该图像中的验证对象是否存在唇部变化。

模型点是指位于唇部边缘曲线上的角点，请参考图15，一种可能的实施方式中，唇部的上边缘可以包括5个模型点222，唇部的下边缘也可以包括5个模型点222。

终端可以采用模型点的方法确定唇部各点的位置，构成某一时刻的唇部图像的一个状态。按照时间顺序，终端提取每一帧图像中的唇部图像，构成一个唇部图像序列。该唇部图像序列用于表征被验证对象的唇部变化。

在步骤1204中，计算唇部图像序列与唇语提示信息所对应的字符串匹配的概率值。

终端计算唇部图像序列与唇语提示信息所对应的字符串匹配的概率值。

每个唇语提示信息对应一个字符串，终端根据提取到的唇部图像序列和唇语提示信息对应的字符串计算两者匹配的概率值。

该步骤1204可以包括但不限于如步骤1204a至步骤1204c，请参考图16。

在步骤1204a中，根据与唇语提示信息对应的字符串中的字符排列，在预设的隐马尔科夫模型中选择与该字符串所对应的预测模型序列，隐马尔科夫模型包括n个预测模型，每个预测模型与一个字符对应，n≥1。

终端将与唇语提示信息对应的字符串输入隐马尔科夫模型，该隐马尔科夫模型包括与不同字符对应的预测模型。

比如，与唇语提示信息对应的字符串为“215”，包含三个字符。终端根据字符串“215”在隐马尔科夫模型中，选择与字符“2”对应的预测模型、与字符“1”对应的预测模型和与字符“5”对应的预测模型，得到一个预测模型序列。

在步骤1204b中，识别唇部图像序列与预测模型序列的匹配度。

终端识别唇部图像序列与预测模型序列的匹配度。

比如，如图17所示，终端将唇部图像23输入字符“2”的预测模型24后，可以计算得到匹配度1为90％；将唇部图像25输入字符“1”的预测模型26后，可以计算得到匹配度2为95％；将唇部图像27输入字符“5”的预测模型28后，可以计算得到匹配度3为98％。

在步骤1204c中，根据匹配度计算唇部图像序列与字符串匹配的概率值。

终端根据匹配度计算唇部图像序列与字符串匹配的概率值。

比如，唇部图像序列和与字符串中三个字符对应的预测模型的匹配度分别为90％、95％和98％，则终端根据匹配度计算唇部图像序列与该字符串匹配的概率值为90％*95％*98％＝84％。

在步骤1205中，检测概率值是否大于预设阈值。

终端检测概率值是否大于预设阈值。

比如，预设阈值为80％，84％>80％，故该概率值大于预设阈值，即唇部变化与该唇语提示信息匹配。

在步骤1206中，若唇部变化与唇语提示信息匹配，则确定验证对象通过验证。

若唇部变化与唇语提示信息匹配，则终端确定验证对象通过身份验证；若唇部变化与唇语提示信息不匹配，则终端确定验证对象未通过身份验证。

综上所述，本实施例提供的身份验证方法，通过向被验证对象提供唇语提示信息；采集验证对象的至少一帧图像；在至少一帧图像中包括唇部变化时，检测唇部变化与唇语提示信息是否匹配；若唇部变化与唇语提示信息匹配，则确定验证对象通过身份验证。解决了若非法用户将合法用户的照片放在自身面部前方，仍然能够通过身份认证，导致出现安全隐患的问题。

而且由于唇语提示信息可以是随机生成的提示信息，其具有与验证码验证机制同等的安全级别。

本实施例提供的身份验证方法，还通过提取至少一帧图像中的唇部图像序列，该唇部图像序列用于表征验证对象的唇部变化；计算唇部图像序列与唇语提示信息所对应的字符串匹配的概率值；检测概率值是否大于预设阈值；达到了更可靠检测唇部变化与唇语提示信息是否匹配的效果。

还需要说明的是，在步骤1204之前，该方法还可以包括：

预先建立预测模型，也即隐马尔科夫模型，该预测模型包括每个字符对应的唇部变化的预测模型。

该方法可以包括但不限于子步骤a)至步骤c)。

在步骤a)中，获取n个被鉴别对象反馈的不同字符对应的唇部变化的至少一帧图像，n≥1。

n个验证对象根据唇语提示信息反馈不同字符对应的唇部变化，终端获取对应该唇部变化的至少一帧图像。每个验证对象对应的至少一帧图像，可以称为一个样本。终端可以通过获取大量样本，进行统计。

在步骤b)中，提取至少一帧图像中每个字符对应的唇部图像序列。

对于每个样本，终端按照时间顺序，提取每一帧图像中的唇部图像，构成一个唇部图像序列。该唇部图像序列用于表征验证对象的唇部变化。

在步骤c)中，根据每个字符对应的唇部图像序列，统计得到每个字符对应的唇部变化的预测模型。

请参考图18，其示出了本发明又一个实施例提供的活体鉴别方法的方法流程图。本实施例以该活体鉴别方法应用于服务器中来举例说明。该方法，包括步骤1802至步骤1808。

在步骤1802中，接收终端发送的至少一帧图像。

在步骤1804中，获取终端向被鉴别对象提供的唇语提示信息。

在步骤1806中，在至少一帧图像中包括唇部变化时，检测唇部变化与唇语提示信息是否匹配。

在步骤1808中，向终端反馈检测结果。

综上所述，本实施例提供的身份验证方法，通过接收终端发送的至少一帧图像；获取终端向验证对象提供的唇语提示信息；在至少一帧图像中包括唇部变化时，检测唇部变化与唇语提示信息是否匹配；向终端反馈检测结果；解决了若非法用户将合法用户的照片放在自身面部前方，仍然能够通过身份认证，导致出现安全隐患的问题。

请参考图19，其示出了本发明还一个实施例提供的活体鉴别方法的方法流程图。本实施例以该活体鉴别方法应用于终端和服务器中来举例说明。该方法，包括步骤1901至步骤1909。

在步骤1901中，服务器生成唇语提示信息。

服务器生成唇语提示信息。

该唇语提示信息可以是随机生成的提示信息。比如，在服务器中存在一个唇语提示信息库，当需要进行身份时，服务器从该唇语提示信息库中随机抽取一个唇语提示信息作为服务器生成的唇语提示信息。

唇语提示信息可以是文字、图片或者视频，每个唇语提示信息对应一个字符串。

在步骤1902中，服务器向终端发送该唇语提示信息。

在唇语提示信息是服务器生成的信息时，服务器向终端发送该唇语提示信息。

在步骤1903中，终端向被鉴别对象提供唇语提示信息。

终端向验证对象提供唇语提示信息。本发明实施例中可以通过以下四种方式中的任意一种向验证对象提供唇语提示信息。

在终端的显示界面上显示一个文本形式的唇语提示信息，该唇语提示信息提示验证对象读出该文本中的文字。

在终端的显示界面上显示一个图像形式的唇语提示信息，该唇语提示信息提示验证对象读出图片中的物体的名称。

在步骤1904，终端采集验证对象的至少一帧图像。

终端采集验证对象的至少一帧图像。当终端具有前置摄像头时，终端可以通过拍摄照片的方式采集到验证对象的至少一帧图像。当终端具有前置摄像头时，终端可以通过拍摄视频的方式采集到验证对象的至少一帧图像。

在步骤1905中，终端将该至少一帧图像发送给服务器。

在步骤1906中，服务器接收终端发送的该至少一帧图像。

在步骤1907中，在至少一帧图像中包括唇部变化时，服务器检测唇部变化与唇语提示信息是否匹配。

通过人脸识别技术，可以确定至少一帧图像中是否存在人脸。当该至少一帧图像中存在人脸时，可以通过唇部颜色与肤色的区别确定人脸中的唇部的位置。当获取到唇部的位置时，可以采用模型点的方法确定该图像中的验证对象是否存在唇部变化。

该步骤1907可以包括但不限于如下子步骤：

步骤一，服务器提取至少一帧图像中的唇部图像序列，该唇部图像序列用于表征验证对象的唇部变化；

服务器通过人脸识别技术，可以确定采集到的至少一帧图像中是否存在人脸。当该至少一帧图像中存在人脸时，可以通过唇部颜色与肤色的区别确定人脸中的唇部的位置。当获取到唇部的位置时，可以采用模型点的方法确定该图像中的验证对象是否存在唇部变化。

模型点是指位于唇部边缘曲线上的角点。服务器可以采用模型点的方法确定唇部各点的位置，构成某一时刻的唇部图像的一个状态。按照时间顺序，终端提取每一帧图像中的唇部图像，构成一个唇部图像序列。该唇部图像序列用于表征验证对象的唇部变化。

步骤二，服务器计算唇部图像序列与唇语提示信息所对应的字符串匹配的概率值；

唇语提示信息对应一个字符串，服务器根据提取到的唇部图像序列和唇语提示信息对应的字符串计算两者匹配的概率值。

该步骤二可以包括但不限于如下子步骤：

1，服务器根据与唇语提示信息对应的字符串中的字符排列，在预设的隐马尔科夫模型中选择与该字符串所对应的预测模型序列，隐马尔科夫模型包括n个预测模型，每个预测模型与一个字符对应，n≥1；

比如，字符串为“WORD”，包含四个字符。服务器选择与“W”、“O”、“R”、“D”四个字符分别对应的预测模型。

2，服务器识别唇部图像序列与预测模型序列的匹配度；

比如，服务器识别唇部图像序列中与“W”字符对应的预测模型的匹配度为90％，服务器识别唇部图像序列中与“O”字符对应的预测模型的匹配度为95％，服务器识别唇部图像序列中与“R”字符对应的预测模型的匹配度为98％；服务器识别唇部图像序列中与“R”字符对应的预测模型的匹配度为90％。

3，服务器根据匹配度计算唇部图像序列与字符串匹配的概率值；

比如，唇部图像序列和与字符串中四个字符对应的预测模型的匹配度分别为90％、95％、98％和90％，则服务器根据匹配度计算唇部图像序列与该字符串匹配的概率值为90％*95％*98％*90％＝75％。

步骤三，服务器检测概率值是否大于预设阈值。

比如，预设阈值为80％，75％<80％，故该概率值小于预设阈值，即唇部变化与该唇语提示信息不匹配。

步骤1908，服务器向终端反馈检测结果。

该检测结果可以是唇部变化与该唇语提示信息匹配，也可以是唇部变化与该唇语提示信息不匹配。

步骤1909，若唇部变化与唇语提示信息匹配，则终端确定验证对象通过身份验证。

若唇部变化与唇语提示信息匹配，则终端确定验证对象通过身份验证；若唇部变化与唇语提示信息不匹配，则终端确定验证对象为通过身份验证。

综上所述，本实施例提供的身份验证方法，通过向验证对象提供唇语提示信息；采集验证对象的至少一帧图像；在至少一帧图像中包括唇部变化时，检测唇部变化与唇语提示信息是否匹配；若唇部变化与唇语提示信息匹配，则确定验证对象通过身份验证；解决了若非法用户将合法用户的照片放在自身面部前方，仍然能够通过身份认证，导致出现安全隐患的问题。

本实施例提供的身份验证方法，还通过提取至少一帧图像中的唇部图像序列，该唇部图像序列用于表征验证对象的唇部变化；计算唇部图像序列与唇语提示信息所对应的字符串匹配的概率值；检测概率值是否大于预设阈值；达到了更可靠地检测唇部变化与唇语提示信息是否匹配的效果。

请参考图20，其示出了本发明一个实施例提供的身份验证方法的方法流程图。本实施例以该身份验证别方法应用于终端和服务器中来举例说明。该方法包括步骤2001至步骤2010。

在步骤2001中，终端生成唇语提示信息。

终端生成唇语提示信息。

该唇语提示信息可以是随机生成的提示信息。比如，在终端中存在一个唇语提示信息库，当需要进行身份验证时，终端从该唇语提示信息库中随机抽取一个唇语提示信息作为终端生成的唇语提示信息。

在步骤2002，终端向被鉴别对象提供唇语提示信息。

终端向验证对象提供唇语提示信息。本实施例中可以通过四种方式中的任意一种向被鉴别对象提供唇语提示信息，此处可参见如图19所示实施例，再次不做赘述。

在步骤2003中，终端向服务器发送该唇语提示信息。

在唇语提示信息是终端生成的信息时，向服务器发送该唇语提示信息。

在步骤2004中，服务器接收终端发送的该唇语提示信息。

在步骤2005中，终端采集验证对象的至少一帧图像。

终端采集验证对象的至少一帧图像。当终端具有前置摄像头时，终端可以通过前置摄像头采集到验证对象的至少一帧图像。

在步骤2006中，终端将该至少一帧图像发送给服务器。

在步骤2007中，服务器接收终端发送的该至少一帧图像。

需要说明的是，在其它实施例中，终端可以将唇语提示信息和至少一帧图像同时发送给服务器。

在步骤2008，在至少一帧图像中包括唇部变化时，服务器检测唇部变化与唇语提示信息是否匹配。

该步骤2008可以包括但不限于如下子步骤2008A至步骤2008C。

在步骤2008A中，服务器提取至少一帧图像中的唇部图像序列，该唇部图像序列用于表征验证对象的唇部变化。

服务器提取至少一帧图像中的唇部图像序列，该唇部图像序列用于表征验证对象的唇部变化。服务器采用模型点的方法确定唇部各点的位置，构成某一时刻的唇部图像的一个状态。按照时间顺序，服务器提取每一帧图像中的唇部图像，构成一个唇部图像序列。该唇部图像序列用于表征验证对象的唇部变化。

在步骤2008B中，服务器计算唇部图像序列与唇语提示信息所对应的字符串匹配的概率值。

该步骤2008B可以包括但不限于如下子步骤：

步骤508B-1，服务器根据与唇语提示信息对应的字符串中的字符排列，在预设的隐马尔科夫模型中选择与该字符串所对应的预测模型序列，隐马尔科夫模型包括n个预测模型，每个预测模型与一个字符对应，n≥1；

步骤508B-2，服务器识别唇部图像序列与预测模型序列的匹配度；

步骤508B-3，服务器根据匹配度计算唇部图像序列与字符串匹配的概率值；

在步骤2008C中，服务器检测概率值是否大于预设阈值。

在步骤2009中，服务器向终端反馈检测结果。

在步骤2010，若唇部变化与唇语提示信息匹配，则终端确定验证对象通过身份验证。。

请参考图21，其示出了本发明实施例提供的身份验证装置的结构方框图。本实施例以该身份验证装置应用于终端中来举例说明。该身份验证装置可以通过软件、硬件或者两者的结合实现成为终端的全部或者一部分，该装置，包括：

信息提供模块2120，用于向验证对象提供唇语提示信息；

图像采集模块2140，用于采集验证对象的至少一帧图像；

第一检测模块2160，在至少一帧图像中包括唇部变化时，检测唇部变化与唇语提示信息是否匹配；

确定模块2180，用于若唇部变化与唇语提示信息匹配，则确定验证对象通过身份验证。

综上所述，本实施例提供的身份验证装置，通过向验证对象提供唇语提示信息；采集验证对象的至少一帧图像；在至少一帧图像中包括唇部变化时，检测唇部变化与唇语提示信息是否匹配；若唇部变化与唇语提示信息匹配，则确定验证对象通过身份验证；解决了若非法用户将合法用户的照片放在自身面部前方，仍然能够通过身份认证，导致出现安全隐患的问题。

请参考图22，其示出了本发明另实施例提供的身份验证装置的结构方框图。本实施例以身份验证装置应用于终端中来举例说明。该身份验证装置可以通过软件、硬件或者两者的结合实现成为终端的全部或者一部分，该装置，包括：

信息提供模块2220，用于向验证对象提供唇语提示信息；

图像采集模块2240，用于采集验证对象的至少一帧图像；

第一检测模块2260，在至少一帧图像中包括唇部变化时，检测所述唇部变化与所述唇语提示信息是否匹配；

确定模块2280，用于若所述唇部变化与所述唇语提示信息匹配，则确定验证对象通过身份验证。

可选地，所述第一检测模块2260，包括：

第一提取单元2262，用于提取所述至少一帧图像中的唇部图像序列，所述唇部图像序列用于表征验证对象的唇部变化；

第一计算单元2264，用于计算所述唇部图像序列与所述唇语提示信息所对应的字符串匹配的概率值；

第三检测单元2266，用于检测所述概率值是否大于预设阈值。

可选地，所述第一计算单元2264，包括：

第一选择子单元22642，用于根据与所述唇语提示信息对应的字符串中的字符排列，在预设的隐马尔科夫模型中选择与所述字符串所对应的预测模型序列，所述隐马尔科夫模型包括n个预测模型，每个预测模型与一个字符对应，n≥1；

第一识别子单元22644，用于识别所述唇部图像序列与所述预测模型序列的匹配度；

第三计算子单元22646，用于根据所述匹配度计算所述唇部图像序列与所述字符串匹配的概率值。

可选地，所述第一检测模块2260，包括：

第一检测单元2267，用于在所述唇语提示信息是终端生成的信息时，将所述至少一帧图像和所述唇语提示信息发送给服务器，所述服务器用于在所述至少一帧图像中包括唇部变化时，检测所述唇部变化与所述唇语提示信息是否匹配；

或，

第二检测单元2268，用于在所述唇语提示信息是从服务器获取的信息时，将所述至少一帧图像发送给所述服务器，所述服务器用于在所述至少一帧图像中包括唇部变化时，检测所述唇部变化与所述唇语提示信息是否匹配。

可选地，所述信息提供模块2220，包括：

第一提供单元2222，用于显示文本形式的所述唇语提示信息；

和/或，

第二提供单元2224，用于显示图像形式的所述唇语提示信息；

和/或，

第三提供单元2226，用于显示视频形式的所述唇语提示信息；

和/或，

第四提供单元2228，用于播放音频形式的所述唇语提示信息。

请参考图23，其示出了本发明实施例提供的身份验证装置的结构方框图。本实施例以该身份验证装置应用于服务器中来举例说明。该身份验证装置可以通过软件、硬件或者两者的结合实现成为服务器的全部或者一部分，该装置，包括：

图像接收模块2320，用于接收终端发送的至少一帧图像；

信息获取模块2340，用于获取所述终端向验证对象提供的唇语提示信息；

第二检测模块2360，用于在所述至少一帧图像中包括唇部变化时，检测所述唇部变化与所述唇语提示信息是否匹配；

结果反馈模块2380，用于向所述终端反馈检测结果。

综上所述，本实施例提供的身份验证装置，通过接收终端发送的至少一帧图像；获取所述终端向验证对象提供的唇语提示信息；在所述至少一帧图像中包括唇部变化时，检测所述唇部变化与所述唇语提示信息是否匹配；向所述终端反馈检测结果；解决了若非法用户将合法用户的照片放在自身面部前方，仍然能够通过身份认证，导致出现安全隐患的问题。

请参考图24，其示出了本发明实施例提供的身份验证装置的结构方框图。本实施例以该身份验证装置应用于服务器中来举例说明。该身份验证装置可以通过软件、硬件或者两者的结合实现成为服务器的全部或者一部分，该装置，包括：

图像接收模块2420，用于接收终端发送的至少一帧图像；

信息获取模块2440，用于获取所述终端向验证对象提供的唇语提示信息；

第二检测模块2460，用于在所述至少一帧图像中包括唇部变化时，检测所述唇部变化与所述唇语提示信息是否匹配；

结果反馈模块2480，用于向所述终端反馈检测结果。

可选地，所述第二检测模块960，包括：

第二提取单元2462，用于提取所述至少一帧图像中的唇部图像序列，所述唇部图像序列用于表征所述验证对象的唇部变化；

第二计算单元2464，用于计算所述唇部图像序列与所述唇语提示信息所对应的字符串匹配的概率值；

第四检测单元2466，用于检测所述概率值是否大于预设阈值。

可选地，所述第二计算单元2464，包括：

第二选择子单元24642，用于根据与所述唇语提示信息对应的字符串中的字符排列，在预设的隐马尔科夫模型中选择与所述字符串所对应的预测模型序列，所述隐马尔科夫模型包括n个预测模型，每个预测模型与一个字符对应，n≥1；

第二识别子单元24644，用于识别所述唇部图像序列与所述预测模型序列的匹配度；

第四计算子单元24646，用于根据所述匹配度计算所述唇部图像序列与所述字符串匹配的概率值。

可选地，所述信息获取模块2440，包括：

第一获取单元2442，用于在所述唇语提示信息是所述终端生成的信息时，接收所述终端发送的所述唇语提示信息；

第二获取单元2444，用于在所述唇语提示信息是服务器生成并发送给所述终端的信息时，读取存储在所述服务器的所述唇语提示信息。

综上所述，本实施例提供的身份验证装置，通过接收终端发送的至少一帧图像；获取所述终端验证对象提供的唇语提示信息；在所述至少一帧图像中包括唇部变化时，检测所述唇部变化与所述唇语提示信息是否匹配；向所述终端反馈检测结果；解决了若非法用户将合法用户的照片放在自身面部前方，仍然能够通过身份认证，导致出现安全隐患的问题。

本发明实施例还提供了一种身份验证装置，如图25所示，该装置可以包括一个或多个处理器2501和存储有操作指令的存储介质2502，当运行存储介质2502中的操作指令时，处理器2501执行如下步骤：

向验证对象提供验证提示信息；

获取身份验证信息，身份验证信息由验证对象根据所述验证提示信息生成；

将身份验证信息与验证提示信息的信息样本进行比较；

当身份验证信息与验证提示信息的信息样本之间的匹配度满足预设值，则验证对象通过验证。

进一步的，处理器2501获取身份验证信息时，执行：

获取验证对象根据所述验证提示信息产生的视频信息；

从视频信息中提取图像信息、声音信息、以及图像信息和声音信息的关联信息。

进一步的，处理器2501将身份验证信息与验证提示信息的信息样本进行比较时，执行：

从图像信息中提取图像特征，从声音信息中提取声纹特征；

分别将图像特征、声纹特征以及关联信息与所述信息样本的图像样本、声纹样本以及关联信息样本进行比较；

图像特征、声纹特征以及关联信息与图像样本、声纹样本以及关联信息样本的匹配项数大于或等于预设阈值时，验证对象通过验证。

进一步的，处理器2501还执行：

从声音信息中提取语音内容；

将语音内容与信息样本的语音内容样本进行比较；

当图像特征、声纹特征、语音内容以及关联信息与所述图像样本、声纹样本、语音内容样本以及关联信息样本的匹配项数大于或等于预设阈值时，验证对象通过验证。

进一步的，处理器2501获取身份验证信息时，执行：

获取验证对象根据验证提示信息所产生的音频数据。

进一步的，处理器2501将所述身份验证信息与所述验证提示信息的信息样本进行比较时，执行：

将音频数据进行文本转换，得到文本数据；

将文本数据与信息样本的基准文本数据进行比较，将音频数据与信息样本的基准音频数据进行比较；

当文本数据与信息样本的基准文本数据相同，且所述音频数据与所述信息样本的基准音频数据满足预设的近似度条件时，验证对象通过验证。

进一步的，处理器2501获取身份验证信息时，执行：

获取验证对象的至少一帧图像，图像包括所述验证对象根据所述验证提示信息所产生的唇部变化。

将唇部变化与验证提示信息的基准唇部变化进行比较。

进一步的，处理器2501将唇部变化与验证提示信息的基准唇部变化进行比较时，执行：

提取所述图像中的唇部图像序列，唇部图像序列用于表征验证对象的唇部变化；

计算唇部图像序列与验证提示信息的基准唇部变化所对应的字符串匹配的概率值；

当概率值大于预设阈值时，验证对象通过验证。

Claims

一种身份验证方法，包括：

验证设备向验证对象提供验证提示信息；

所述验证设备获取身份验证信息，所述身份验证信息由所述验证对象根据所述验证提示信息生成；

所述验证设备将所述身份验证信息与所述验证提示信息的信息样本进行比较；

当所述身份验证信息与所述验证提示信息的信息样本之间的匹配度满足预设值，则所述验证对象通过验证。
根据权利要求1所述的方法，所述验证设备获取身份验证信息包括：

所述验证设备获取所述验证对象根据所述验证提示信息产生的视频信息；

所述验证设备从所述视频信息中提取图像信息、声音信息、以及所述图像信息和声音信息的关联信息。
根据权利要求2所述的方法，所述验证设备将所述身份验证信息与所述验证提示信息的信息样本进行比较，包括：

所述验证设备从所述图像信息中提取图像特征，从所述声音信息中提取声纹特征；

所述验证对象分别将所述图像特征、声纹特征以及所述关联信息与所述信息样本的图像样本、声纹样本以及关联信息样本进行比较；

当所述图像特征、声纹特征以及关联信息与所述图像样本、声纹样本以及关联信息样本的匹配项数大于或等于预设阈值时，所述验证对象通过验证。
根据权利要求3所述的方法，还包括：

所述验证设备从所述声音信息中提取语音内容；

所述验证设备将所述语音内容与所述信息样本的语音内容样本进行比较；

当所述图像特征、声纹特征、语音内容以及关联信息与所述图像样本、声纹样本、语音内容样本以及关联信息样本的匹配项数大于或等于预设阈值时，所述验证对象通过验证。
根据权利要求1所述的方法，所述验证设备获取身份验证信息，包括：

所述验证设备获取所述验证对象根据所述验证提示信息所产生的音频数据。
根据权利要求5所述的方法，所述验证设备将所述身份验证信息与所述验证提示信息的信息样本进行比较，包括：

所述验证设备将所述音频数据进行文本转换，得到文本数据；

所述验证设备将所述文本数据与所述信息样本的基准文本数据进行比较，将所述音频数据与所述信息样本的基准音频数据进行比较。
根据权利要求8所述的方法，当所述文本数据与所述信息样本的基准文本数据相同，且所述音频数据与所述信息样本的基准音频数据满足预设的近似度条件时，所述验证对象通过验证。
根据权利要求1所述的方法，所述验证设备获取身份验证信息，包括：

所述验证设备获取所述验证对象的至少一帧图像，所述图像包括所述验证对象根据所述验证提示信息所产生的唇部变化。
根据权利要求8所述的方法，所述验证设备将所述身份验证信息与所述验证提示信息的信息样本进行比较，包括：

所述验证设备将所述唇部变化与所述验证提示信息的基准唇部变化进行比较。
根据权利要求9所述的方法，所述验证设备将所述唇部变化与所述验证提示信息的基准唇部变化进行比较，包括：

所述验证设备提取所述图像中的唇部图像序列，所述唇部图像序列用于表征所述验证对象的唇部变化；

所述验证设备计算所述唇部图像序列与所述验证提示信息的基准唇部变化所对应的字符串匹配的概率值；

当所述概率值大于预设阈值时，所述验证对象通过验证。
一种身份验证装置，包括一个或多个处理器和存储有操作指令的存储介质，当运行所述存储介质中的操作指令时，所述处理器执行如下步骤：

向验证对象提供验证提示信息；

获取身份验证信息，所述身份验证信息由所述验证对象根据所述验证提示信息生成；

将所述身份验证信息与所述验证提示信息的信息样本进行比较；

当所述身份验证信息与所述验证提示信息的信息样本之间的匹配度满足预设值，则所述验证对象通过验证。
根据权利要求11所述的装置，所述处理器获取身份验证信息时，执行：

获取所述验证对象根据所述验证提示信息产生的视频信息；

从所述视频信息中提取图像信息、声音信息、以及所述图像信息和声音信息的关联信息。
根据权利要求12所述的装置，所述处理器将所述身份验证信息与所述验证提示信息的信息样本进行比较时，执行：

从所述图像信息中提取图像特征，从所述声音信息中提取声纹特征；

分别将所述图像特征、声纹特征以及所述关联信息与所述信息样本的图像样本、声纹样本以及关联信息样本进行比较；

所述图像特征、声纹特征以及关联信息与所述图像样本、声纹样本以及关联信息样本的匹配项数大于或等于预设阈值时，所述验证对象通过验证。
根据权利要求13所述的装置，所处处理器还执行：

从所述声音信息中提取语音内容；

将所述语音内容与所述信息样本的语音内容样本进行比较；

当所述图像特征、声纹特征、语音内容以及关联信息与所述图像样本、声纹样本、语音内容样本以及关联信息样本的匹配项数大于或等于预设阈值时，所述验证对象通过验证。
根据权利要求11所述的装置，所述处理器获取身份验证信息时，执行：

获取所述验证对象根据所述验证提示信息所产生的音频数据。
根据权利要求15所述的装置，所述处理器将所述身份验证信息与所述验证提示信息的信息样本进行比较时，执行：

将所述音频数据进行文本转换，得到文本数据；

将所述文本数据与所述信息样本的基准文本数据进行比较，将所述音频数据与所述信息样本的基准音频数据进行比较；

当所述文本数据与所述信息样本的基准文本数据相同，且所述音频数据与所述信息样本的基准音频数据满足预设的近似度条件时，所述验证对象通过验证。
根据权利要求11所述的装置，所述处理器获取身份验证信息时，执行：

获取所述验证对象的至少一帧图像，所述图像包括所述验证对象根据所述验证提示信息所产生的唇部变化。
根据权利要求17所述的装置，所述处理器将所述身份验证信息与所述验证提示信息的信息样本进行比较时，执行：

将所述唇部变化与所述验证提示信息的基准唇部变化进行比较。
根据权利要求18所述的装置，所述处理器将所述唇部变化与所述验证提示信息的基准唇部变化进行比较时，执行：

提取所述图像中的唇部图像序列，所述唇部图像序列用于表征所述验证对象的唇部变化；

计算所述唇部图像序列与所述验证提示信息的基准唇部变化所对应的字符串匹配的概率值；

当所述概率值大于预设阈值时，所述验证对象通过验证。
一种非瞬时性的计算机可读存储介质，其上存储有计算机可执行指令，当计算机中运行这些可执行指令时，执行如下步骤：

向验证对象提供验证提示信息；

获取身份验证信息，所述身份验证信息由所述验证对象根据所述验证提示信息生成；

将所述身份验证信息与所述验证提示信息的信息样本进行比较；

当所述身份验证信息与所述验证提示信息的信息样本之间的匹配度满足预设值，则所述验证对象通过验证。