CN112948788B

CN112948788B - 语音验证方法、装置、计算设备以及介质

Info

Publication number: CN112948788B
Application number: CN202110394933.3A
Authority: CN
Inventors: 王松; 周森; 朱浩齐; 杜彬彬; 余佩佩; 涂圣红; 张潆心; 李雨珂; 丁勇; 宫克
Original assignee: Hangzhou Netease Zhiqi Technology Co Ltd
Current assignee: Hangzhou Netease Zhiqi Technology Co Ltd
Priority date: 2021-04-13
Filing date: 2021-04-13
Publication date: 2024-05-31
Anticipated expiration: 2041-04-13
Also published as: CN112948788A

Abstract

本公开实施例提供了一种语音验证方法、装置、计算设备以及介质。该方法包括：响应于语音验证请求，触发语音验证页面的播放控件，以播放对应的验证文案；接收反馈结果，并基于反馈结果对待验证用户进行验证。根据本公开实施例的技术方案，能够避免繁琐的操作步骤，方便视障人士使用。

Description

语音验证方法、装置、计算设备以及介质

技术领域

本公开的实施方式涉及计算机技术领域，更具体地，本公开的实施方式涉及语音验证方法、语音验证装置、计算设备以及介质。

背景技术

本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

随着计算机技术的发展，越来越多的用户通过智能设备上网，如何对用户上网的身份或权限进行验证成为了关注的焦点。

在相关技术方案中，用户访问应用程序的应用页面时，应用页面上显示行为式验证码例如滑块拼图，用户按照行为式验证码的视觉提示要求完成相应操作，如拖动滑块到指定位置等，之后应用程序根据用户的操作结果给出最终的验证结果。

发明内容

但是，上述技术方案中，行为式验证码需要视觉信息作为输入，导致视障人士难以使用。

为此，非常需要一种改进的语音验证方法、装置、计算设备以及介质。

在本公开实施例的第一方面，提供了一种语音验证方法，包括：响应于语音验证请求，触发语音验证页面的播放控件，以播放对应的验证文案；接收反馈结果，并基于所述反馈结果对待验证用户进行验证。

根据第一方面，在一些示例实施例中，所述验证文案为问答式验证文案，所述问答式验证文案包括：根据所述待验证用户的用户信息生成的文案；和/或，根据预设时间段内的热点信息生成的文案。

根据第一方面，在一些示例实施例中，所述问答式验证文案为根据所述待验证用户的用户信息和热点信息生成的文案，所述方法还包括：根据所述待验证用户的用户信息确定所述待验证用户的兴趣偏好；基于所述待验证用户的兴趣偏好以及所述热点信息，生成所述问答式验证文案。

根据第一方面，在一些示例实施例中，所述方法还包括：若所述问答式验证文案为根据所述待验证用户的用户信息生成的文案，则获取所述待验证用户的用户信息，所述用户信息包括用户注册信息和/或用户历史行为信息；根据所述用户信息生成与所述待验证用户对应的所述问答式验证文案，若所述问答式验证文案为根据预设时间段内的热点信息生成的文案，则获取预设时间段内的热点信息；根据所述热点信息生成所述问答式验证文案；其中，所述热点信息是基于热度统计分析对来自预设信息渠道中的信息进行筛选而获得的，所述信息渠道至少包括以下之一：应用程序、资讯平台、搜索引擎以及门户网站。

根据第一方面，在一些示例实施例中，所述验证文案还包括文案输入规则，所述方法还包括：获取与所述验证文案对应的文案输入规则，播放所述文案输入规则，所述文案输入规则包括以下规则中的一种：指示所述待验证用户按照所给定的顺序依次输入所述验证文案中的各个字符；指示所述待验证用户按照所给定的位置序号输入所述验证文案中对应于所述位置序号的字符；指示所述待验证用户按照所给定的类型输入所述验证文案中对应于所述类型的字符。

根据第一方面，在一些示例实施例中，所述验证文案为行为式验证文案，所述行为式验证文案指示所述待验证用户需作出的目标行为动作，所述方法还包括：通过动作传感器检测所述目标行为动作以确定所述反馈结果。

根据第一方面，在一些示例实施例中，所述验证文案为语音验证码，所述方法还包括：在播放所述语音验证码之前，确定与所述语音验证码中各个字符对应的第一语音增强参数，所述第一语音增强参数包括播放速度参数、停顿参数、音色参数、音量参数以及信噪比中的一种或多种；基于所述第一语音增强参数播放对应的所述语音验证码。

根据第一方面，在一些示例实施例中，所述播放速度参数包括播放所述语音验证码时对应字符的播放时长；所述停顿参数包括所述语音验证码的对应字符播放完毕后的停顿时长；所述音色参数包括性别参数和/或年龄参数；所述音量参数为播放所述语音验证码时对应字符的音量大小；所述信噪比为播放所述语音验证码时对应字符的信号功率与噪音功率之间的比值。

根据第一方面，在一些示例实施例中，所述基于所述第一语音增强参数播放对应的所述语音验证码，包括：基于所述第一语音增强参数生成与所述语音验证码中各个字符对应的音频片段；对各个字符对应的音频片段进行拼接处理，生成对应的语音验证码；播放所述语音验证码。

根据第一方面，在一些示例实施例中，所述确定与所述语音验证码中各个字符对应的第一语音增强参数，包括：将所述语音验证码输入到预先训练的机器学习分类模型；通过所述机器学习分类模型确定所述语音验证码中各个字符对应的第一语音增强参数的参数目标值。

根据第一方面，在一些示例实施例中，所述方法还包括：获取多个样本数据，所述样本数据包括样本验证码以及与所述样本验证码对应的第二语音增强参数；基于语音识别模型确定所述多个样本数据中的正样本验证码和负样本验证码，所述正样本验证码为未能被所述语音识别模型成功识别的样本验证码，所述负样本验证码为能够被所述语音识别模型成功识别的样本验证码；通过所述样本验证码以及所述第二语音增强参数训练获得所述机器学习分类模型。

根据第一方面，在一些示例实施例中，所述语音验证页面包括验证控件，所述方法还包括：在验证结束时，触发所述语音验证页面中的提示控件，以播放对应的验证结果文案。

根据第一方面，在一些示例实施例中，所述方法还包括：若验证结果为验证失败，则在预定时间后刷新所述验证文案；播放刷新后的所述验证文案。

根据第一方面，在一些示例实施例中，所述方法还包括：基于所述待验证用户当前所使用的终端设备的设备指纹，确定所述待验证用户的合法性；和/或，基于所述待验证用户当前所使用的网络地址，确定所述待验证用户的合法性。

在本公开实施例的第二方面，提供了一种语音验证装置，包括：语音播放模块，用于响应于语音验证请求，触发语音验证页面的播放控件，以播放对应的验证文案；验证模块，用于接收反馈结果，并基于所述反馈结果对待验证用户进行验证。

根据第二方面，在一些示例实施例中，所述验证文案为问答式验证文案，所述问答式验证文案包括：根据所述待验证用户的用户信息生成的文案；和/或，根据预设时间段内的热点信息生成的文案。

根据第二方面，在一些示例实施例中，所述问答式验证文案为根据所述待验证用户的用户信息和热点信息生成的文案，所述装置还包括：偏好确定模块，用于根据所述待验证用户的用户信息确定所述待验证用户的兴趣偏好；第一文案生成模块，用于基于所述待验证用户的兴趣偏好以及所述热点信息，生成所述问答式验证文案。

根据第二方面，在一些示例实施例中，所述装置还包括：第二文案生成模块，用于若所述问答式验证文案为根据所述待验证用户的用户信息生成的文案，则获取所述待验证用户的用户信息，所述用户信息包括用户注册信息和/或用户历史行为信息；根据所述用户信息生成与所述待验证用户对应的所述问答式验证文案，第三文案生成模块，用于若所述问答式验证文案为根据预设时间段内的热点信息生成的文案，则获取预设时间段内的热点信息；根据所述热点信息生成所述问答式验证文案；其中，所述热点信息是基于热度统计分析对来自预设信息渠道中的信息进行筛选而获得的，所述信息渠道至少包括以下之一：应用程序、资讯平台、搜索引擎以及门户网站。

根据第二方面，在一些示例实施例中，所述验证文案还包括文案输入规则，所述装置还包括：输入规则处理模块，用于获取与所述验证文案对应的文案输入规则，播放所述文案输入规则，所述文案输入规则包括以下规则中的一种：指示所述待验证用户按照所给定的顺序依次输入所述验证文案中的各个字符；指示所述待验证用户按照所给定的位置序号输入所述验证文案中对应于所述位置序号的字符；指示所述待验证用户按照所给定的类型输入所述验证文案中对应于所述类型的字符。

根据第二方面，在一些示例实施例中，所述验证文案为行为式验证文案，所述行为式验证文案指示所述待验证用户需作出的目标行为动作，所述装置还包括：行为反馈确定模块，用于通过动作传感器检测所述目标行为动作以确定所述反馈结果。

根据第二方面，在一些示例实施例中，所述验证文案为语音验证码，所述装置还包括：参数确定模块，用于在播放所述语音验证码之前，确定与所述语音验证码中各个字符对应的第一语音增强参数，所述第一语音增强参数包括播放速度参数、停顿参数、音色参数、音量参数以及信噪比中的一种或多种；验证码播放模块，用于基于所述第一语音增强参数播放对应的所述语音验证码。

根据第二方面，在一些示例实施例中，所述播放速度参数包括播放所述语音验证码时对应字符的播放时长；所述停顿参数包括所述语音验证码的对应字符播放完毕后的停顿时长；所述音色参数包括性别参数和/或年龄参数；所述音量参数为播放所述语音验证码时对应字符的音量大小；所述信噪比为播放所述语音验证码时对应字符的信号功率与噪音功率之间的比值。

根据第二方面，在一些示例实施例中，所述验证码播放模块还用于：基于所述第一语音增强参数生成与所述语音验证码中各个字符对应的音频片段；对各个字符对应的音频片段进行拼接处理，生成对应的语音验证码；播放所述语音验证码。

根据第二方面，在一些示例实施例中，所述参数确定模块还用于：将所述语音验证码输入到预先训练的机器学习分类模型；通过所述机器学习分类模型确定所述语音验证码中各个字符对应的第一语音增强参数的参数目标值。

根据第二方面，在一些示例实施例中，所述装置还包括：样本获取模块，用于获取多个样本数据，所述样本数据包括样本验证码以及与所述样本验证码对应的第二语音增强参数；样本筛选模块，用于基于语音识别模型确定所述多个样本数据中的正样本验证码和负样本验证码，所述正样本验证码为未能被所述语音识别模型成功识别的样本验证码，所述负样本验证码为能够被所述语音识别模型成功识别的样本验证码；训练模块，用于通过所述样本验证码以及所述第二语音增强参数训练获得所述机器学习分类模型。

根据第二方面，在一些示例实施例中，所述语音验证页面包括验证控件，所述装置还包括：验证结果处理模块，用于在验证结束时，触发所述语音验证页面中的提示控件，以播放对应的验证结果文案。

根据第二方面，在一些示例实施例中，所述装置还包括：刷新模块，用于若验证结果为验证失败，则在预定时间后刷新所述验证文案；重新播放模块，用于播放刷新后的所述验证文案。

根据第二方面，在一些示例实施例中，所述装置还包括：合法性确定模块，用于基于所述待验证用户当前所使用的终端设备的设备指纹，确定所述待验证用户的合法性；和/或，基于所述待验证用户当前所使用的网络地址，确定所述待验证用户的合法性。

在本公开实施例的第三方面中，提供了一种计算设备，包括：处理器和存储器，所述存储器存储有可执行指令，所述处理器用于调用所述存储器存储的可执行指令执行如上述第一方面中任一项所述的方法。

在本公开实施例的第四方面中，提供了一种介质，其上存储有程序，该程序被处理器执行时实现如上述第一方面中任一项所述的方法。

根据本公开实施例的技术方案，根据本公开实施例的技术方案，通过在语音验证页面设置播放控件，响应于语音验证请求播放对应的验证文案，能够通过语音方式方便高效地提示用户进行验证，避免了繁琐的操作步骤；另一方面，由于采用语音方式播放验证文案，避免了行为式验证码需要视觉信息作为输入，导致视障人士难以使用的问题。

附图说明

通过参考附图阅读下文的详细描述，本公开示例性实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本公开的若干实施方式，其中：

图1示意性地示出了根据本公开实施例的语音验证方法的应用场景的框图；

图2示意性地示出了根据本公开的一些实施例的语音验证方法的流程图；

图3示意性地示出了根据本公开的另一些实施例的语音验证方法的流程图；

图4示意性地示出了根据本公开的一些实施例的登录页面的页面示意图；

图5示意性地示出了根据本公开的一些实施例的语音验证页面的页面示意图；

图6示意性地示出了根据本公开的一些实施例的另一语音验证页面的页面示意图；

图7示意性地示出了根据本公开的一些实施例的又一语音验证页面的页面示意图；

图8示意性地示出了根据本公开的一些实施例的反作弊拦截系统的系统架构图；

图9示意性地示出了根据本公开的一些实施例的生成语音验证码的流程示意图；

图10示意性地示出了根据本公开的另一些实施例的生成语音验证码的流程示意图；

图11示意性地示出了根据本公开的一些实施例的计算机可读存储介质的示意图；

图12示意性地示出了根据本公开的一些实施例的语音验证装置的结构示意图；

图13示意性示出了根据本公开的一些实施例的计算设备的结构示意图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施例来描述本公开的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开，而并非以任何方式限制本公开的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本公开的实施方式，提出了一种语音验证方法、装置、计算设备和介质。

在本文中，需要理解的是，所涉及的术语：

行为式验证码：主要包括验证码展示、采集用户行为、分析用户行为等步骤，采用行为式验证码，用户只需要产生指定的行为轨迹，不需要通过键盘手动输入即可完成人机校验。行为式验证码可以包括：滑块拼图、文字点选、图标点选、语序点选、二维拼图、空间推理等。

视障人士：视觉功能受到一定程度的损害，以致无法达到正常视力，日常生活因此受到不同程度影响的群体。

黑灰产：指对互联网产品进行虚假账号注册认证，并进行非法交易、木马植入、敲诈勒索、盗号等非法行为而牟取利益的群体团伙。

验证文案：用于提示视障人士进行语音验证的文案，验证文案与语音验证页面的播放控件播放的音频对应，验证文案可以包括：问答式验证文案、行为式验证文案等。此外，验证文案还可以包括文案输入规则。

ASR(Automatic Speech Recognition，自动语音识别)：将语音转换成文本的算法技术。

此外，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本公开的若干代表性实施方式，详细阐释本公开的原理和精神。

发明概述

本发明人发现，为了解决行为式验证码需要视觉信息作为输入，导致视障人士难以使用的问题，在一种技术方案中，在打开应用程序的验证页面时，通过对视障人士触摸到的验证页面上的元素进行语音朗读，提示视障人士进行相应操作。然而，在这种技术方案中，在验证页面的元素较多时，视障人士必须一一触碰才能知道如何操作，导致验证的操作比较繁琐。

基于上述内容，本公开的基本思想在于：在进行验证时，响应于语音验证请求，触发语音验证页面的播放控件，播放对应的验证文案，基于反馈结果对待验证用户进行验证。根据本公开实施例的技术方案，通过在语音验证页面设置播放控件，响应于语音验证请求播放对应的验证文案，能够通过语音方式方便高效地提示用户进行验证，避免了繁琐的操作步骤；另一方面，由于采用语音方式播放验证文案，避免了行为式验证码需要视觉信息作为输入，导致视障人士难以使用的问题。

在介绍了本公开的基本原理之后，下面具体介绍本公开的各种非限制性实施方式。

应用场景总览

需要注意的是，下述应用场景仅是为了便于理解本公开的精神和原理而示出，本公开的实施方式在此方面不受任何限制。相反，本公开的实施方式可以应用于适用的任何场景。

图1示意性地示出了根据本公开实施例的语音验证方法的应用场景的框图。

参照图1所示，该应用场景可以包括：至少一个客户端110以及服务器120，其中，客户端110安装有多种应用程序，例如购物应用程序、音乐播放应用程序等。客户端110与服务器120之间通过网络130进行通信。以登录应用场景为例，待验证用户登录音乐播放应用程序时，客户端110向服务器120发送登录请求，服务器120响应于登录请求，向客户端110发送对应的验证文案，客户端110响应于语音验证请求，触发语音验证页面的播放控件播放对应的验证文案，例如“请输入验证码123456”，客户端110接收待验证用户的反馈结果例如待验证用户输入的验证码，并基于反馈结果对待验证用户进行验证。

需要说明的是，虽然以登录应用场景为例进行说明，但是本公开实施例还可以应用于其他适当的场景例如下载音乐的场景或播放音视频的场景，这同样在本公开的保护范围内。

进一步地，客户端110可以为手机、平板电脑、台式计算机、便携笔记本式计算机或车载式终端等。服务器120可以为包含独立主机的物理服务器，或者为主机集群承载的虚拟服务器，或者为云服务器。网络130可以为有线网络或无线网络，例如，网络130可以为PSTN(Public Switched Telephone Network，公共交换电话网络)或因特网。

示例性方法

下面结合上述的应用场景，参考图2来描述根据本公开示例性实施例的语音验证方法。该语音验证方法可以应用于图1的客户端110。需要注意的是，上述应用场景仅是为了便于理解本公开的精神和原理而示出，本公开的实施例在此方面不受任何限制。相反，本公开的实施例可以应用于适用的任何场景。

参照图2所示，在步骤S210中，响应于语音验证请求，触发语音验证页面的播放控件，以播放对应的验证文案。

在示例实施例中，在语音验证页面设置播放控件，该播放控件用于播放验证文案对应的音频，客户端110响应于待验证用户在语音验证页面发起的语音验证请求，触发语音验证页面的播放控件，播放对应的验证文案。以登录场景为例，可以在登录页面即语音验证页面设置播放控件，例如，在登录页面，待验证用户可以通过触摸播放控件来发起语音验证请求，客户端110响应于该语音验证请求，触发语音验证页面的播放控件，播放对应的验证文案，例如播放以下验证文案“请输入验证码123456”。

需要说明的是，虽然以验证码为例进行说明，但是本公开实施例中的验证文案不限于此，例如，验证文案还可以为问答式验证文案或行为式验证文案等，这同样在本公开的保护范围内。此外，验证文案还可以包括其他适当的信息例如文案输入规则等。下面，结合几个示例实施例对验证文案进行详细的说明。

实施例一：

在实施例一中，验证文案为问答式验证文案，问答式文案可以包括：根据待验证用户的用户信息生成的文案；和/或，根据预设时间段内的热点信息生成的文案。下面，结合具体示例对这三种情况进行详细的说明。

若问答式验证文案为根据待验证用户的用户信息生成的文案，则获取待验证用户的用户信息，用户信息包括用户注册信息和/或用户历史行为信息；根据用户信息生成与待验证用户对应的问答式验证文案。举例而言，可以获取待验证用户注册的手机号码，基于手机号码生成待验证用户对应的问答式验证文案，例如问答式验证文案可以为“您注册手机号码的后4位是什么”。

若问答式验证文案为根据预设时间段内的热点信息生成的文案，则获取预设时间段内的热点信息；根据热点信息生成问答式验证文案；其中，热点信息是基于热度统计分析对来自预设信息渠道中的信息进行筛选而获得的，信息渠道至少包括以下之一：应用程序、资讯平台、搜索引擎以及门户网站。例如，获取搜索引擎或资讯平台的热榜信息，根据热榜信息中排名第一的热点信息生成验证文案。

若问答式验证文案为根据待验证用户的用户信息和热点信息生成的文案，则根据待验证用户的用户信息确定待验证用户的兴趣偏好；基于待验证用户的兴趣偏好以及热点信息，生成问答式验证文案。举例而言，根据待验证用户的用户信息确定待验证用户的兴趣偏好为电影，则根据该兴趣偏好以及最近上映的热门电影，生成问答式验证文案，例如问答式验证文案可以为“请问最近上映的某某某演的电影叫什么”。

通过基于用户信息和/或热点信息生成的问答式验证文案进行语音验证，使得生成的验证文案更加贴近用户的认知，用户能够准确地回答验证文案的问题，而机器仅能理解文案的字面意思，即能够生成机器不易回答而用户却能回答的问答式验证文案，提高了语音验证的安全性。

实施例二：

在实施例二中，验证文案为行为式验证文案，行为式验证文案指示待验证用户需作出的目标行为动作，例如，行为式验证文案可以包括指示通过按压或点击操作进行验证的文案；指示用户通过滑动操作进行验证的文案；指示通过手写操作进行验证的文案。举例而言，行为式验证文案可以包括请按压音量键、请向上滑动3秒、请在屏幕上手写字母L等。

通过采用行为式验证文案，能够引入人为操作来避免机器的自动识别，防止黑灰产的攻击，提高了语音验证的安全性。

实施例三：

在实施例三中，验证文案包括文案输入规则，文案输入规则包括以下规则中的一种：指示待验证用户按照所给定的顺序依次输入验证文案中的各个字符；指示待验证用户按照所给定的位置序号输入验证文案中对应于位置序号的字符；指示待验证用户按照所给定的类型输入验证文案中对应于类型的字符。举例而言，文案输入规则可以包括：请跟读下面播放的文案、请输入播放文案中的第1、3、5位置处的字符、请输入播放文案中的数字等。下面，结合示例对这几种情况进行详细的说明。

示例一：设验证文案为“今天下雨了”，文案输入规则为“请跟读下面播放的文案”，则每隔2.5秒播放上述验证文案中一个字符，用户需要在2.5秒的时间内跟读播放的字符。

示例二：设验证文案为“今天是3月1日”，文案输入规则为“请输入播放文案中的第1、3、5位置处的字符”，则播放文案后，用户需要输入“今、是、月”三个字符。

示例三：设验证文案为“H3L5L8”，文案输入规则为“请输入播放文案中的数字”，则播放文案后，用户需要输入“3、5、8”三个数字。

通过添加文案输入规则，能够避免播放的验证文案被黑灰产自动识别，防止黑灰产的攻击，提高了语音验证的安全性。

在步骤S220中，接收反馈结果，并基于反馈结果对待验证用户进行验证。

在示例实施例中，接收待验证用户输入的反馈结果，将反馈结果与验证文案对应的标准反馈结果进行对比，基于对比结果对待验证用户的身份或权限进行验证。下面，结合不同类型的验证文案对示例实施例中的验证过程进行详细的说明。

实施例一：

在实施例一中，验证文案为验证码，例如验证码123456，将待验证用户输入的验证码与标准验证码进行对比，若对比结果一致，则确定待验证用户通过验证；若对比结果不一致，则确定待验证用户未通过验证。

实施例二：

在实施例二中，验证文案为问答式验证文案，例如，验证文案为“请求注册手机号的后4位是什么”，将待验证用户回答的答案与标准答案进行对比，若对比结果一致，则确定待验证用户通过验证；若对比结果不一致，则确定待验证用户未通过验证。

实施例三：

在实施例三中，验证文案为行为式验证文案，可以通过动作传感器检测所述目标行为动作以确定所述反馈结果。举例而言，验证文案为“请在屏幕上画一个圆”，确定待验证用户在屏幕上画的图像是否为圆形，若为圆形，则确定待验证用户通过验证；若不为圆形，则确定待验证用户未通过验证。

实施例四：

在实施例四中，验证文案包括输入规则，例如，验证文案包括：“请输入播放文案中的第1、3、5位置的字符”，若播放文案为一串字符例如“S7H8Y6”，则将待验证用户输入的字符与第1、3、5位置的字符即“S、H、Y”进行对比，若对比结果一致，则确定待验证用户通过验证；若对比结果不一致，则确定待验证用户未通过验证。

需要说明的是，可以通过手动方式进行反馈，也可以通过语音方式进行反馈，本公开对此不进行特殊限定。通过语音方式进行反馈时，解析输入音频得到反馈结果，能够实现快速校验的目的，提升视障人士的使用体验。

根据图2的示例实施例的技术方案，通过在语音验证页面设置播放控件，响应于语音验证请求播放对应的验证文案，能够通过语音方式方便高效地提示用户进行验证，避免了繁琐的操作步骤；另一方面，由于采用语音方式播放验证文案，避免了行为式验证码需要视觉信息作为输入，导致视障人士难以使用的问题；再一方面，由于能够设计多种机器不易识别而用户却能识别的验证文案，提高了语音验证的安全性。

图3示意性地示出了根据本公开的另一些实施例的语音验证方法的流程图。

参照图3所示，在步骤S310中，通过语音验证入口进入语音验证页面。

在示例实施例中，可以在验证页面设置语音验证入口例如语音验证入口控件，该语音验证入口通过超链接的方式与语音验证页面链接，待验证用户可以通过语音验证入口进行语音验证页面。举例而言，以登录场景为例，参照图4所示，在登录验证页面的行为式验证码的右上方，设置了语音验证入口控件410即耳机形状的控件，在打开该登录验证页面时，可以通过读屏软件聚焦该语音验证入口控件410，识别并播放对应的说明文案例如“切换至语音验证模式”。通过在行为式验证码的页面设置语音验证入口，能够在不影响正常用户使用的前提下，正确切换至语音验证页面，降低了语音验证方案的实施成本。

进一步地，响应于待验证用户的触摸操作或语音输入操作，通过语音验证入口进入语音验证页面。例如，可以提示待验证用户触摸屏幕的预定位置例如屏幕中央或者屏幕下方，响应于待验证用户的触摸操作来触发语音验证入口，或者，响应于待验证用户的输入语音例如“进行语音验证”来触发语音验证入口，并进入语音验证入口对应的语音验证页面。

在步骤S320中，响应于语音验证请求，触发语音验证页面的播放控件，播放对应的验证文案。

在示例实施例中，进入语音验证页面后，通过读屏软件自动聚焦于语音验证页面的播放控件，待验证用户可以通过触摸播放控件或输入语音例如“播放验证文案”来发起语音验证请求，客户端110响应于该语音验证请求，触发语音验证页面的播放控件，播放对应的验证文案，例如“请输入验证码123456”。举例而言，参照图5所示，可以预先设置语音验证页面的播放控件元素为优先聚焦元素，在进入语音验证页面时，通过读屏软件优先自动聚焦在播放控件上，响应于对播放控件的触摸操作，播放验证文案如“请输入验证码123456”。通过设置播放控件，能够显著减少视障人士的操作步骤，提升使用体验，节约操作时间。

在步骤S330中，接收反馈结果，并基于反馈结果对待验证用户进行验证。

在示例实施例中，接收待验证用户输入的反馈结果，将反馈结果与验证文案对应的标准反馈结果进行对比，基于对比结果对待验证用户的身份或权限进行验证。举例而言，设验证文案为验证码例如验证码123456，将待验证用户输入的验证码与标准验证码进行对比，若对比结果一致，则确定待验证用户通过验证；若对比结果不一致，则确定待验证用户未通过验证。

在步骤S340中，在验证结束时，触发语音验证页面中的提示控件，以播放对应的验证结果文案。

在示例实施例中，在语音验证页面设置提示控件，通过提示控件展示和播放对应的验证结果。举例而言，参照图5、图6和图7所示，语音验证页面的验证控件为提示控件，客户端110接收到输入的验证码后，若验证失败，则在验证控件处展示“验证失败，请重试”的文案，读屏软件自动聚焦读出验证控件上的验证失败的文案；若验证成功，在验证控件处展示“验证成功”的文案，读屏软件自动聚焦读出验证控件上的验证成功的文案。

此外，在示例实施例中，在语音验证页面设置有刷新控件例如图6中的刷新验证码控件，该刷新控件用于刷新播放控件对应的验证文案。举例而言，若验证结果为验证失败，则在预定时间后刷新验证文案；播放刷新后的验证文案，例如，若验证结果为验证失败，在等待0.5S后，自动刷新播放控件对应的验证文案例如验证码，读屏软件自动聚焦播放刷新后的验证文案。通过在语音验证页面设置刷新控件，能够帮助视障人士在无法判断该段语音文案的情况下换一个语音进行识别。

进一步地，为了对验证过程进行反作弊拦截，在示例实施例中，基于待验证用户当前所使用的终端设备的设备指纹，确定待验证用户的合法性；和/或，基于待验证用户当前所使用的网络地址，确定待验证用户的合法性。举例而言，可以基于当前设备的设备指纹对非法访问设备的账号进行识别；或者通过统计同一网络地址的请求次数和/或请求频率，对撞库攻击行为进行检测；或者基于非法访问设备的网络地址库，对非法访问设备的网络地址进行识别，非法访问设备的网络地址库为根据历史风控数据中非法访问设备的网络地址生成的地址库。

图8示意性地示出了根据本公开的一些实施例的反作弊拦截系统的系统架构图。

参照图8所示，该反作弊拦截系统800包括应用程序810、业务系统820以及风险检测平台830，应用程序810为客户端上的应用程序，例如可以为音乐播放应用程序；业务系统820为与应用程序810对应的业务系统，用于对应用程序810的业务进行处理；风险检测平台830用于对应用程序810与业务系统820之间的业务处理的风险进行检测。风险检测平台830包括设备指纹生成单元832、风险判断单元834以及数据输出单元836。其中，设备指纹生成单元832用于生成客户端的设备指纹；风险判断单元834用于对验证过程的风险情况进行判断；数据输出单元836用于对风险判断的结果进行输出。风险检测平台830通过风险画像以及设备指纹技术，对多种异常设备进行环境检测，对黑灰产设备的账号进行识别拦截；利用指标计算方法进行高频统计，对撞库攻击进行防御。一方面，由于不同的黑灰产团队的IP(Internet Protocol，网际互连协议)地址常常有限且单一，通过业务系统820与风险检测平台830积累组建黑灰产IP地址库，对非法IP进行有效识别拦截。另一方面，由于黑灰产的攻击操作与正常用户行为有较大差距，风险检测平台830对客户端的生物行为轨迹、按压力度、移动速度等用户使用特征进行大数据行为分析，对异常行为进行拦截识别；使用关联图谱，挖掘黑灰产团伙特征，能够进一步防止漏判。下面，结合附图对反作弊拦截系统800的各个模块的交互进行详细的说明。

在步骤(1)中，应用程序810向风险检测平台830提交采集信息，例如采集信息包括客户端的设备信息。

在步骤(2)中，风险检测平台830向应用程序810返回令牌。

在示例实施例中，在第一次登录应用程序810时，风险检测平台830生成一个令牌Token，将此Token返回给客户端，以后客户端只需带上这个Token进行业务请求即可，无需再次带上用户名和密码。

在步骤(3)中，向业务系统820发送业务请求，业务请求中携带令牌。

在步骤(4)中，业务系统820向风险检测平台830提交业务信息，进行风险查询。

在步骤(5)中，风险检测平台830向业务系统820返回风险检测结果。

在步骤(6)中，业务系统820向应用程序810返回业务处理结果。

根据图8的示例实施例中的技术方案，通过进行反作弊拦截处理，能够提高语音验证过程的安全性。

图9示意性地示出了根据本公开的一些实施例的生成语音验证码的流程示意图。

参照图9所示，在步骤S910中，在播放语音验证码之前，确定与语音验证码中各个字符对应的第一语音增强参数。

在示例实施例中，第一语音增强参数包括播放速度参数、停顿参数、音色参数、音量参数以及信噪比中的一种或多种。播放速度参数包括播放语音验证码时对应字符的播放时长；停顿参数包括语音验证码的对应字符播放完毕后的停顿时长；音色参数包括性别参数和/或年龄参数；音量参数为播放语音验证码时对应字符的音量大小；信噪比为播放语音验证码时对应字符的信号功率与噪音功率之间的比值。举例而言，设语音增强参数包括播放速度参数、停顿参数、音色参数、音量参数以及信噪比，验证码为四个数字，播放速度参数为播放语音验证码时对应字符的播放时长，四个字符共有四个播放时长time1-time4；停顿参数包括语音验证码的对应字符播放完毕后的停顿时长(gap)，四个字符共有三个停顿时长：gap_0，gap_1，gap_2，每个停顿时长的取值在一定范围例如3s内；音色参数则以性别(gender)、年龄(age)为参数，四个字符共八个参数；音量参数即为四个字符各自的音量(vol)，以分贝为单位，共四个参数；信噪比为播放语音验证码时对应字符的信号功率与噪音功率之间的比值(snr)，共四个参数。因此，每条语音验证码对应23个参数。

进一步地，在示例实施例中，确定与语音验证码中各个字符对应的第一语音增强参数，包括：将语音验证码输入到预先训练的机器学习分类模型；通过机器学习分类模型例如决策树模型确定语音验证码中各个字符对应的第一语音增强参数的参数目标值。

在步骤S920中，基于第一语音增强参数播放对应的语音验证码。

在示例实施例中，基于第一语音增强参数生成与语音验证码中各个字符对应的音频片段；对各个字符对应的音频片段进行拼接处理，生成对应的语音验证码；播放生成的语音验证码。

进一步地，在示例实施例中，获取多个样本数据，样本数据包括样本验证码以及与样本验证码对应的第二语音增强参数；基于语音识别模型确定多个样本数据中的正样本验证码和负样本验证码，正样本验证码为未能被语音识别模型成功识别的样本验证码，负样本验证码为能够被语音识别模型成功识别的样本验证码；通过样本验证码以及第二语音增强参数训练获得所述机器学习分类模型。

根据图9的示例实施例中的技术方案，一方面，通过训练分类器筛选语音增强参数，能够筛选出机器不易识别，人却能分辨的语音增强参数的目标值；另一方面，通过分类器筛选得到的语音增强参数的目标值对语音验证码进行语音增强处理，能够生成机器不易识别人却能分辨的验证文案即语音验证码，在防止黑产恶意攻击的同时保障了用户体验；再一方面，由于视障人士对语音的细节把握强于常人，通过语音增强处理提高语音复杂度，提升了机器破解识别的难度，同时控制在视障人士可识别的范围内，防止黑灰产利用成熟的语音识别系统破解语音验证码，进一步提高语音验证的安全性。

图10示意性地示出了根据本公开的另一些实施例的生成语音验证码的流程示意图。

参照图10所示，在步骤S1010中，进行语音生成处理。

在示例实施例中，生成与语音验证码中各个字符对应的音频片段；对各个字符对应的音频片段进行拼接处理，生成对应的语音验证码。举例而言，搜集一批0-9字符对应的相关数字语音，生成多位数字语音验证码时挑选每位数字对应的读音，然后将多段语音拼接在一起，生成对应的语音验证码。

在步骤S1020中，进行语音增强处理。

语音增强处理主要是为了防止机器破解而对语音增加一些变化，提升机器的识别难度。在示例实施例中，语音增强主要针对语音增强参数例如播放速度参数、停顿参数、音色参数、音量参数以及信噪比中的一种或多种进行调整。考虑增加连续语音中单个字符的变化会提升机器的识别难度，因此，对每个字符的特性进行单独处理，例如，针对播放速度参数，增加了字符间的间隔变化，以防止黑产发现规律后逐字切分；针对音色参数，使用多人录制加机器合成的方式丰富语音多样性，每个字符的语音挑选不同音色特性对应的语音段；针对音量参数，针对每一个字符设置一定程度的变化；针对信噪比，通过引进噪声信号，以一定的信噪比叠加在每个字符语音上。

进一步地，可以通过机器学习分类模型例如决策树筛选语音增强参数。举例而言，将语音验证码输入到预先训练的机器学习分类模型；通过机器学习分类模型例如决策树模型确定语音验证码中各个字符对应的第一语音增强参数的参数目标值。

在步骤S1030中，进行样本筛选处理。

在确定了完成语音增强过程的设计处理后，如何生成机器难识别人却能识别的语音增强参数的关键问题。在示例实施例中，使用分类器选择语音验证码的各个字符的语音增强参数。举例而言，设语音增强参数包括播放速度参数、停顿参数、音色参数、音量参数以及信噪比，验证码为四个数字，播放速度参数为播放语音验证码时对应字符的播放时长，四个字符共有四个播放时长time1-time4；停顿参数包括语音验证码的对应字符播放完毕后的停顿时长(gap)，四个字符共有三个停顿时长：gap_0，gap_1，gap_2，每个停顿时长的取值在一定范围例如3s内；音色参数则以性别(gender)、年龄(age)为参数，四个字符共八个参数；音量参数即为四个字符各自的音量(vol)，以分贝为单位，共四个参数；信噪比为播放语音验证码时对应字符的信号功率与噪音功率之间的比值(snr)，共四个参数。因此，每条语音验证码对应23个参数。

在通过机器学习分类模型进行参数选择时，需要通过样本对机器学习分类模型进行训练。因此，需要筛选出相关的样本，选取机器难识别而人能识别的为正样本，机器易识别或人难识别的为负样本。机器识别的难易程度使用ASR系统进行筛选，对应识别准确度高的语音验证码被认为是机器容易识别出的语音验证码，归入负样本。人的识别难易程度可以由视障人士来完成筛选，该步骤中人能识别出的语音验证码则归为机器难识别人易识别的正样本，人识别不出的语音验证码归为负样本。

在经过ASR机器系统和视障人士的人工筛选后，语音验证码被打上各自的标签，正样本的标签为1，负样本的标签为0。每一条语音验证码则对应一个23维的语音增强参数向量，分类器的训练数据则准备完成。分类器可以选择CART决策树模型完成，训练的目的是得到能够进行语音增强参数选择的机器学习分类模型。通过训练完成后的分类器决策树模型能够得到机器不易识别，人却能分辨的语音增强参数的目标值。

在步骤S1040中，进行参数调整处理。

在示例实施例中，使用训练好的分类器例如决策树模型筛选出语音验证码对应的语音增强参数，在语音增强处理时，通过语音增强参数完成对播放速度参数、停顿参数、音色参数、音量参数以及信噪比等参数的调整，输出安全并且视障人士能够识别的语音验证码。

根据图10的示例实施例中的技术方案，一方面，通过训练分类器筛选语音增强参数，能够筛选出机器不易识别，人却能分辨的语音增强参数；另一方面，通过分类器筛选得到的语音增强参数对语音验证码进行语音增强处理，能够生成机器不易识别人却能分辨的语音验证码，在防止黑产恶意攻击的同时保障了用户体验；再一方面，由于视障人士对语音的细节把握强于常人，通过语音增强处理提高语音复杂度，提升了机器破解识别的难度，同时控制在视障人士可识别的范围内，防止黑灰产利用成熟的语音识别系统破解语音验证码，进一步提高语音验证的安全性。

示例性介质

在介绍了本公开示例性实施例的方法之后，接下来，对本公开示例性实施例的介质进行说明。

在一些可能的实施例中，本公开的各个方面还可以实现为一种介质，其上存储有程序代码，当所述程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的语音验证方法中的步骤。

在一些可能的实施例中，所述设备的处理器执行所述程序代码时用于实现如下步骤：步骤S210，响应于语音验证请求，触发语音验证页面的播放控件，以播放对应的验证文案；步骤S220，接收反馈结果，并基于反馈结果对待验证用户进行验证。

参考图11所示，描述了根据本公开的实施例的用于实现上述语音验证方法的程序产品1100，其可以采用便携式紧凑盘只读存储器并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此。

需要说明的是：上述的介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于：电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器、只读存储器、可擦式可编程只读存储器、光纤、便携式紧凑盘只读存储器、光存储器件、磁存储器件、或者上述的任意合适的组合。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于：电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线、光缆、射频信号等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网或广域网—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

示例性装置

在介绍了本公开示例性实施例的介质之后，接下来，参考图12对本公开示例性实施例的语音验证装置进行说明。

参照图12所示，语音验证装置1200包括：语音播放模块1210，用于响应于语音验证请求，触发语音验证页面的播放控件，以播放对应的验证文案；验证模块1220，用于接收反馈结果，并基于所述反馈结果对待验证用户进行验证。

根据图12的示例实施例的技术方案，通过在语音验证页面设置播放控件，响应于语音验证请求播放对应的验证文案，能够通过语音方式方便高效地提示用户进行验证，避免了繁琐的操作步骤；另一方面，由于采用语音方式播放验证文案，避免了行为式验证码需要视觉信息作为输入，导致视障人士难以使用的问题；再一方面，由于能够设计多种机器不易识别而用户却能识别的验证文案，提高了语音验证的安全性。

在一些示例实施例中，所述验证文案为问答式验证文案，所述问答式验证文案包括：根据所述待验证用户的用户信息生成的文案；和/或，根据预设时间段内的热点信息生成的文案。

在一些示例实施例中，所述问答式验证文案为根据所述待验证用户的用户信息和热点信息生成的文案，所述装置1200还包括：偏好确定模块，用于根据所述待验证用户的用户信息确定所述待验证用户的兴趣偏好；第一文案生成模块，用于基于所述待验证用户的兴趣偏好以及所述热点信息，生成所述问答式验证文案。

在一些示例实施例中，所述装置1200还包括：第二文案生成模块，用于若所述问答式验证文案为根据所述待验证用户的用户信息生成的文案，则获取所述待验证用户的用户信息，所述用户信息包括用户注册信息和/或用户历史行为信息；根据所述用户信息生成与所述待验证用户对应的所述问答式验证文案，第三文案生成模块，用于若所述问答式验证文案为根据预设时间段内的热点信息生成的文案，则获取预设时间段内的热点信息；根据所述热点信息生成所述问答式验证文案；其中，所述热点信息是基于热度统计分析对来自预设信息渠道中的信息进行筛选而获得的，所述信息渠道至少包括以下之一：应用程序、资讯平台、搜索引擎以及门户网站。

在一些示例实施例中，所述验证文案还包括文案输入规则，所述装置1200还包括：输入规则处理模块，用于获取与所述验证文案对应的文案输入规则，播放所述文案输入规则，所述文案输入规则包括以下规则中的一种：指示所述待验证用户按照所给定的顺序依次输入所述验证文案中的各个字符；指示所述待验证用户按照所给定的位置序号输入所述验证文案中对应于所述位置序号的字符；指示所述待验证用户按照所给定的类型输入所述验证文案中对应于所述类型的字符。

在一些示例实施例中，所述验证文案为行为式验证文案，所述行为式验证文案指示所述待验证用户需作出的目标行为动作，所述装置1200还包括：行为反馈确定模块，用于通过动作传感器检测所述目标行为动作以确定所述反馈结果。

在一些示例实施例中，所述验证文案为语音验证码，所述装置1200还包括：参数确定模块，用于在播放所述语音验证码之前，确定与所述语音验证码中各个字符对应的第一语音增强参数，所述第一语音增强参数包括播放速度参数、停顿参数、音色参数、音量参数以及信噪比中的一种或多种；验证码播放模块，用于基于所述第一语音增强参数播放对应的所述语音验证码。

在一些示例实施例中，所述播放速度参数包括播放所述语音验证码时对应字符的播放时长；所述停顿参数包括所述语音验证码的对应字符播放完毕后的停顿时长；所述音色参数包括性别参数和/或年龄参数；所述音量参数为播放所述语音验证码时对应字符的音量大小；所述信噪比为播放所述语音验证码时对应字符的信号功率与噪音功率之间的比值。

在一些示例实施例中，所述验证码播放模块还用于：基于所述第一语音增强参数生成与所述语音验证码中各个字符对应的音频片段；对各个字符对应的音频片段进行拼接处理，生成对应的语音验证码；播放所述语音验证码。

在一些示例实施例中，所述参数确定模块还用于：将所述语音验证码输入到预先训练的机器学习分类模型；通过所述机器学习分类模型确定所述语音验证码中各个字符对应的第一语音增强参数的参数目标值。

在一些示例实施例中，所述装置还包括：样本获取模块，用于获取多个样本数据，所述样本数据包括样本验证码以及与所述样本验证码对应的第二语音增强参数；样本筛选模块，用于基于语音识别模型确定所述多个样本数据中的正样本验证码和负样本验证码，所述正样本验证码为未能被所述语音识别模型成功识别的样本验证码，所述负样本验证码为能够被所述语音识别模型成功识别的样本验证码；训练模块，用于通过所述样本验证码以及所述第二语音增强参数训练获得所述机器学习分类模型。

在一些示例实施例中，所述语音验证页面包括验证控件，所述装置1200还包括：验证结果处理模块，用于在验证结束时，触发所述语音验证页面中的提示控件，以播放对应的验证结果文案。

在一些示例实施例中，所述装置1200还包括：刷新模块，用于若验证结果为验证失败，则在预定时间后刷新所述验证文案；重新播放模块，用于播放刷新后的所述验证文案。

在一些示例实施例中，所述装置1200还包括：合法性确定模块，用于基于所述待验证用户当前所使用的终端设备的设备指纹，确定所述待验证用户的合法性；和/或，基于所述待验证用户当前所使用的网络地址，确定所述待验证用户的合法性。

由于图12的示例实施例的语音验证装置的各个功能模块与上述语音验证方法的示例实施例的步骤对应，因此对于本公开装置实施例中未披露的细节，请参照本公开上述的语音验证方法的实施例。

示例性计算设备

在介绍了本公开示例性实施例的方法、介质和装置之后，接下来，介绍根据本公开的另一示例性实施例的计算设备。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施例中，根据本公开实施例的计算设备可以至少包括至少一个处理器、以及至少一个存储器。其中，所述存储器存储有程序代码，当所述程序代码被所述处理器执行时，使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的语音验证方法中的步骤。例如，所述处理器可以执行如图2中所示的步骤：步骤S210，响应于语音验证请求，触发语音验证页面的播放控件，以播放对应的验证文案；步骤S220，接收反馈结果，并基于反馈结果对待验证用户进行验证

又如，所述处理器也可以执行如图3中所示的步骤。

下面参照图13来描述根据本公开的示例实施例的电子设备1300。图13所示的电子设备1300仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图13所示，电子设备1300以通用计算设备的形式表现。电子设备1300的组件可以包括但不限于：上述至少一个处理单元1310、上述至少一个存储单元1320、连接不同系统组件(包括存储单元1320和处理单元1310)的总线1330。

总线1330表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储单元1320可以包括易失性存储器形式的可读介质，例如RAM(Random AccessMemory，随机存取存储器)1321和/或高速缓存存储器1322，还可以进一步包括ROM(Read-Only Memory，只读存储器)1323。

存储单元1320还可以包括具有一组(至少一个)程序模块1324的程序/实用工具1325，这样的程序模块1324包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

电子设备1300也可以与一个或多个外部设备1340(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与电子设备1300交互的设备通信，和/或与使得电子设备1300能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1350进行。并且，电子设备1300还可以通过网络适配器1360与一个或者多个网络(例如局域网，广域网和/或公共网络，例如因特网)通信。如图所示，网络适配器1360通过总线1330与电子设备1300的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备1300使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID(Redundant Arrays ofIndependent Disks，独立冗余磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。

应当注意，尽管在上文详细描述中提及了语音验证装置的若干单元或子单元，但是这种划分仅仅是示例性的，并非是强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或单元的特征和功能可以在一个模块或单元中具体化。反之，上文描述的一个模块或单元的特征和功能可以进一步划分为由多个模块或单元来具体化。

此外，尽管在附图中以特定顺序描述了本公开方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本公开的精神和原理，但是应该理解，本公开并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种语音验证方法，其特征在于，包括：

在打开登录验证页面时，通过所述登录验证页面中的语音验证入口进入语音验证页面，所述登录验证页面至少包括以视觉信息为输入的行为式验证码以及所述语音验证入口；

通过读屏软件聚焦于所述语音验证页面中的播放控件，响应于针对所述语音验证页面的播放控件的触摸操作发起的语音验证请求，触发所述语音验证页面的播放控件，以播放对应的验证文案，所述验证文案是用于提示语音验证，且与所述语音验证页面的所述播放控件播放的音频对应的文案；

接收反馈结果，并基于所述反馈结果对待验证用户进行验证；

在验证结束时，触发语音验证页面中的提示控件，以播放对应的验证结果文案；

其中，所述验证文案为语音验证码，所述方法还包括：在播放所述语音验证码之前，确定与所述语音验证码中各个字符对应的第一语音增强参数，所述第一语音增强参数包括播放速度参数、停顿参数、音色参数、音量参数以及信噪比中的一种或多种；基于所述第一语音增强参数播放对应的所述语音验证码，所述第一语音增强参数使播放的所述语音验证码未能被语音识别模型成功识别且能被所述待验证用户进行成功识别；

其中，所述确定与所述语音验证码中各个字符对应的第一语音增强参数的步骤，包括：将所述语音验证码输入到预先训练的机器学习分类模型；通过所述机器学习分类模型确定所述语音验证码中各个字符对应的第一语音增强参数的参数目标值；

所述方法还包括：获取多个样本数据，所述样本数据包括样本验证码以及与所述样本验证码对应的第二语音增强参数；基于语音识别模型确定所述多个样本数据中的正样本验证码和负样本验证码，所述正样本验证码为未能被所述语音识别模型成功识别的样本验证码，所述负样本验证码为能够被所述语音识别模型成功识别的样本验证码；通过所述样本验证码以及所述第二语音增强参数训练获得所述机器学习分类模型。

2.根据权利要求1所述的方法，其特征在于，所述验证文案为问答式验证文案，所述问答式验证文案包括：

根据所述待验证用户的用户信息生成的文案；和/或，

根据预设时间段内的热点信息生成的文案。

3.根据权利要求2所述的方法，其特征在于，所述问答式验证文案为根据所述待验证用户的用户信息和热点信息生成的文案，所述方法还包括：

根据所述待验证用户的用户信息确定所述待验证用户的兴趣偏好；

基于所述待验证用户的兴趣偏好以及所述热点信息，生成所述问答式验证文案。

4.根据权利要求2所述的方法，其特征在于，所述方法还包括：

若所述问答式验证文案为根据所述待验证用户的用户信息生成的文案，则获取所述待验证用户的用户信息，所述用户信息包括用户注册信息和/或用户历史行为信息；根据所述用户信息生成与所述待验证用户对应的所述问答式验证文案，

若所述问答式验证文案为根据预设时间段内的热点信息生成的文案，则获取预设时间段内的热点信息；根据所述热点信息生成所述问答式验证文案；其中，所述热点信息是基于热度统计分析对来自预设信息渠道中的信息进行筛选而获得的，所述信息渠道至少包括以下之一：应用程序、资讯平台、搜索引擎以及门户网站。

5.根据权利要求1所述的方法，其特征在于，所述验证文案还包括文案输入规则，所述方法还包括：

获取与所述验证文案对应的文案输入规则，播放所述文案输入规则，

所述文案输入规则包括以下规则中的一种：

指示所述待验证用户按照所给定的顺序依次输入所述验证文案中的各个字符；

指示所述待验证用户按照所给定的位置序号输入所述验证文案中对应于所述位置序号的字符；

指示所述待验证用户按照所给定的类型输入所述验证文案中对应于所述类型的字符。

6.根据权利要求1所述的方法，其特征在于，所述验证文案为行为式验证文案，所述行为式验证文案指示所述待验证用户需作出的目标行为动作，所述方法还包括：

通过动作传感器检测所述目标行为动作以确定所述反馈结果。

7.根据权利要求1所述的方法，其特征在于，所述播放速度参数包括播放所述语音验证码时对应字符的播放时长；所述停顿参数包括所述语音验证码的对应字符播放完毕后的停顿时长；所述音色参数包括性别参数和/或年龄参数；所述音量参数为播放所述语音验证码时对应字符的音量大小；所述信噪比为播放所述语音验证码时对应字符的信号功率与噪音功率之间的比值。

8.根据权利要求1或7所述的方法，其特征在于，所述基于所述第一语音增强参数播放对应的所述语音验证码，包括：

基于所述第一语音增强参数生成与所述语音验证码中各个字符对应的音频片段；

对各个字符对应的音频片段进行拼接处理，生成对应的语音验证码；

播放所述语音验证码。

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若验证结果为验证失败，则在预定时间后刷新所述验证文案；

播放刷新后的所述验证文案。

10.根据权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：

基于所述待验证用户当前所使用的终端设备的设备指纹，确定所述待验证用户的合法性；和/或，

基于所述待验证用户当前所使用的网络地址，确定所述待验证用户的合法性。

11.一种语音验证装置，其特征在于，包括：

语音播放模块，用于通过读屏软件聚焦于所述语音验证页面中的播放控件，响应于针对所述语音验证页面的播放控件的触摸操作发起的语音验证请求，触发语音验证页面的播放控件，以播放对应的验证文案，所述验证文案是用于提示语音验证，且与所述语音验证页面的所述播放控件播放的音频对应的文案；

验证模块，用于接收反馈结果，并基于所述反馈结果对待验证用户进行验证；

验证结果处理模块，用于在验证结束时，触发所述语音验证页面中的提示控件，以播放对应的验证结果文案；

其中，所述验证文案为语音验证码，所述装置还包括：参数确定模块，用于在播放所述语音验证码之前，确定与所述语音验证码中各个字符对应的第一语音增强参数，所述第一语音增强参数包括播放速度参数、停顿参数、音色参数、音量参数以及信噪比中的一种或多种；验证码播放模块，用于基于所述第一语音增强参数播放对应的所述语音验证码，所述第一语音增强参数使播放的所述语音验证码未能被语音识别模型成功识别且能被所述待验证用户进行成功识别；

参数确定模块还用于：将所述语音验证码输入到预先训练的机器学习分类模型；通过所述机器学习分类模型确定所述语音验证码中各个字符对应的第一语音增强参数的参数目标值；

所述装置还包括：样本获取模块，用于获取多个样本数据，所述样本数据包括样本验证码以及与所述样本验证码对应的第二语音增强参数；样本筛选模块，用于基于语音识别模型确定所述多个样本数据中的正样本验证码和负样本验证码，所述正样本验证码为未能被所述语音识别模型成功识别的样本验证码，所述负样本验证码为能够被所述语音识别模型成功识别的样本验证码；训练模块，用于通过所述样本验证码以及所述第二语音增强参数训练获得所述机器学习分类模型。

12.根据权利要求11所述的装置，其特征在于，所述验证文案为问答式验证文案，所述问答式验证文案包括：

根据所述待验证用户的用户信息生成的文案；和/或，

根据预设时间段内的热点信息生成的文案。

13.根据权利要求12所述的装置，其特征在于，所述问答式验证文案为根据所述待验证用户的用户信息和热点信息生成的文案，所述装置还包括：

偏好确定模块，用于根据所述待验证用户的用户信息确定所述待验证用户的兴趣偏好；

第一文案生成模块，用于基于所述待验证用户的兴趣偏好以及所述热点信息，生成所述问答式验证文案。

14.根据权利要求12所述的装置，其特征在于，所述装置还包括：

第二文案生成模块，用于若所述问答式验证文案为根据所述待验证用户的用户信息生成的文案，则获取所述待验证用户的用户信息，所述用户信息包括用户注册信息和/或用户历史行为信息；根据所述用户信息生成与所述待验证用户对应的所述问答式验证文案，

第三文案生成模块，用于若所述问答式验证文案为根据预设时间段内的热点信息生成的文案，则获取预设时间段内的热点信息；根据所述热点信息生成所述问答式验证文案；其中，所述热点信息是基于热度统计分析对来自预设信息渠道中的信息进行筛选而获得的，所述信息渠道至少包括以下之一：应用程序、资讯平台、搜索引擎以及门户网站。

15.根据权利要求11所述的装置，其特征在于，所述验证文案还包括文案输入规则，所述装置还包括：

输入规则处理模块，用于获取与所述验证文案对应的文案输入规则，播放所述文案输入规则，

所述文案输入规则包括以下规则中的一种：

16.根据权利要求11所述的装置，其特征在于，所述验证文案为行为式验证文案，所述行为式验证文案指示所述待验证用户需作出的目标行为动作，所述装置还包括：

行为反馈确定模块，用于通过动作传感器检测所述目标行为动作以确定所述反馈结果。

17.根据权利要求11所述的装置，其特征在于，所述播放速度参数包括播放所述语音验证码时对应字符的播放时长；所述停顿参数包括所述语音验证码的对应字符播放完毕后的停顿时长；所述音色参数包括性别参数和/或年龄参数；所述音量参数为播放所述语音验证码时对应字符的音量大小；所述信噪比为播放所述语音验证码时对应字符的信号功率与噪音功率之间的比值。

18.根据权利要求11或17所述的装置，其特征在于，所述验证码播放模块还用于：

播放所述语音验证码。

19.根据权利要求11所述的装置，其特征在于，所述装置还包括：

刷新模块，用于若验证结果为验证失败，则在预定时间后刷新所述验证文案；

重新播放模块，用于播放刷新后的所述验证文案。

20.根据权利要求11至17中任一项所述的装置，其特征在于，所述装置还包括：

合法性确定模块，用于基于所述待验证用户当前所使用的终端设备的设备指纹，确定所述待验证用户的合法性；和/或，

21.一种计算设备，其特征在于，包括：处理器和存储器，所述存储器存储有可执行指令，所述处理器用于调用所述存储器存储的可执行指令执行如权利要求1至10中任一项所述的方法。

22.一种介质，其上存储有程序，其特征在于，所述程序被处理器执行时实现如权利要求1至10中任一项所述的方法。