CN109146450A

CN109146450A - 支付方法、客户端、电子设备、存储介质和服务器

Info

Publication number: CN109146450A
Application number: CN201710457967.6A
Authority: CN
Inventors: 刘刚; 赵情恩; 刘广兴
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2017-06-16
Filing date: 2017-06-16
Publication date: 2019-01-04
Also published as: US20230127314A1; TW201905789A; WO2018232135A1; US20180365695A1; US11551219B2

Abstract

本申请实施方式公开了一种支付方法、客户端、电子设备、存储介质和服务器。所述方法包括：接收用户的支付指令；根据用户的语音输入的音频信息，生成所述音频信息的语音特征向量；将所述语音特征向量与用户特征向量进行匹配；在匹配成功的情况下，将所述用户特征向量关联的个人信息发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。所述方法可以给消费者购物带来便利。

Description

支付方法、客户端、电子设备、存储介质和服务器

技术领域

本申请涉及计算机技术领域，特别涉及一种支付方法、客户端、电子设备、存储介质和服务器。

背景技术

现实生活中，人们越来越习惯于网络购物，这种足不出户的购物方式，给人们生活带来了便利。

目前，人们可以使用电脑、手机等进行网络购物。比如，搜索感兴趣的商品，浏览商家推荐的商品等。如果确定要购买时，会进入支付页面，用户输入支付的密码，以对用户的身份进行验证，验证通过后发生付款。

现有技术中，用户网络购物支付操作时，多数情况下需要用户手动输入用户名和密码，这种方式较为繁琐，用户体验较差。

发明内容

本申请实施方式的目的是提供一种支付方法、客户端、电子设备、存储介质和服务器。能够提供给用户一种安全便捷的支付方式。

为实现上述目的，本申请实施方式提供一种支付方法，所述方法包括：接收用户的支付指令；根据用户的语音输入的音频信息，生成所述音频信息的语音特征向量；将所述语音特征向量与用户特征向量进行匹配；在匹配成功的情况下，将所述用户特征向量关联的个人信息发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

本申请实施方式还提供一种客户端，包括：接收模块，用于接收用户的支付指令；生成模块，用于根据用户的语音输入的音频信息，生成所述音频信息的语音特征向量；匹配模块，用于将所述语音特征向量与用户特征向量进行匹配；发送模块，用于在匹配成功的情况下，将所述用户特征向量关联的个人信息，发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

本申请实施方式提供一种计算机存储介质，其存储有程序指令，在所述程序指令被执行时实现：支付对象信息接收用户的支付指令；根据用户的语音输入的音频信息，生成所述音频信息的语音特征向量；将所述语音特征向量与用户特征向量进行匹配；在匹配成功的情况下，将支付对象信息所述用户特征向量关联的个人信息，发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

本申请实施方式提供一种支付方法，所述方法包括：支付对象信息接收用户的支付指令；将录制的用户语音的音频信息、根据所述音频信息生成的特征矩阵或者根据所述音频信息生成的语音特征向量中至少之一，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

本申请实施方式提供一种客户端，包括：接收模块，用于接收用户的支付指令；发送模块，用于将录制的用户语音的音频信息、根据所述音频信息生成的特征矩阵或者根据所述音频信息生成的语音特征向量中至少之一，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

本申请实施方式提供一种计算机存储介质，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现：接收用户的支付指令；将录制的用户语音的音频信息、根据所述音频信息生成的特征矩阵或者根据所述音频信息生成的语音特征向量中至少之一，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

本申请实施方式提供一种支付方法，应用于服务器，所述方法包括：接收客户端发出的音频信息和支付对象信息；其中，所述音频信息为录制的用户的语音；根据所述音频信息生成语音特征向量；将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种服务器，包括：接收模块，用于接收客户端发出的音频信息和支付对象信息；其中，所述音频信息为录制的用户的语音；生成模块，用于根据所述音频信息生成语音特征向量；匹配模块，用于将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；处理模块，用于根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种电子设备，包括网络通信单元、存储器和处理器；所述网络通信单元，用于接收客户端发出的音频信息和支付对象信息，其中，所述音频信息为录制的用户的语音；所述存储器，用于存储用户特征向量；所述用户特征向量与个人信息关联；所述处理器，用于根据所述音频信息生成语音特征向量；将所述语音特征向量与所述存储器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种计算机存储介质，所述计算机存储介质中存储有计算机程序指令，所述计算机程序指令被执行时实现：接收客户端发出的音频信息和支付对象信息，其中，所述音频信息为录制的用户的语音；根据所述音频信息生成语音特征向量；将所述语音特征向量与用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种支付方法，应用于服务器，所述方法包括：接收客户端发出的语音特征向量和支付对象信息；其中，所述语音特征量是根据用户的语音的音频信息生成；将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种服务器，其包括：接收模块，用于接收客户端发出的语音特征向量和支付对象信息；其中，所述语音特征量是根据用户的语音的音频信息生成；匹配模块，用于将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；处理模块，用于根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种电子设备，其包括：网络通信单元、存储器和处理器；所述网络通信单元，用于接收客户端发出的语音特征向量和支付对象信息；其中，所述语音特征量是根据用户的语音的音频信息生成；所述存储器，用于存储用户特征向量；所述用户特征向量与个人信息关联；所述处理器，用于将所述语音特征向量与所述存储器中的用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种计算机存储介质，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现：接收客户端发出的语音特征向量和支付对象信息，其中，所述语音特征量是根据用户的语音的音频信息生成；将所述语音特征向量与用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种支付方法，所述方法包括：录制用户的语音的音频信息；将所述音频信息发送给服务器，以用于所述服务器识别音频信息表达的支付对象信息，以及根据音频信息确定用户的个人信息，以根据所述个人信息关联的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种支付方法，应用于服务器，所述服务器接收客户端提供的音频信息；所述音频信息是录制用户的语音生成；所述方法包括：根据音频信息确定支付对象信息，以及根据音频信息生成语音特征向量；将所述语音特征向量与所述服务器中的用户特征向量进行匹配；与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种服务器，所述服务器包括：接收模块，用于接收客户端发出的音频信息，其中，所述音频信息是录制用户的语音生成；确定模块，用于根据音频信息确定支付对象信息；生成模块，用于根据音频信息生成语音特征向量；匹配模块，用于将所述语音特征向量与所述服务器中的用户特征向量进行匹配；与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量；处理模块，用于根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种电子设备，包括：网络通信单元、存储器和处理器；所述网络通信单元，用于接收客户端提供的音频信息，所述音频信息是录制用户的语音生成；所述存储器，用于存储用户特征向量；所述用户特征向量与个人信息关联；所述处理器，用于根据音频信息确定支付对象信息，以及根据音频信息生成语音特征向量；将所述语音特征向量与所述存储器中的用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种计算机存储介质，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现：接收客户端提供的音频信息，所述音频信息是录制用户的语音生成；根据音频信息确定支付对象信息，以及根据音频信息生成语音特征向量；将所述语音特征向量与所述服务器中的用户特征向量进行匹配，与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种支付方法，所述方法包括：显示包括支付对象信息的第一界面；接收用户的支付请求；所述支付请求表示用户希望向所述支付对象信息进行支付操作；显示具有指定信息的第二界面；录制用户依照所述指定信息的语音的音频信息；以用于根据所述音频信息确定所述用户的个人信息，以用于根据所述个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式提供一种电子设备，包括：麦克风单元和网络通信单元；所述麦克风单元用于录制用户语音的音频信息；所述网络通信单元用于将所述音频信息发送给服务器，以用于所述服务器根据所述音频信息确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

本申请实施方式提供一种电子设备，包括：麦克风单元、网络通信单元和处理器；所述麦克风单元用于录制用户语音的音频信息；所述处理器用于根据所述音频信息生成特征矩阵；所述特征矩阵用于表征所述音频信息；所述网络通信单元用于将所述特征矩阵发送给服务器，以用于所述服务器根据所述特征矩阵确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

本申请实施方式提供一种电子设备，包括：麦克风单元、网络通信单元和处理器；所述麦克风单元用于录制用户语音的音频信息；所述处理器用于根据所述音频信息生成特征矩阵，所述特征矩阵用于表征所述音频信息；针对所述特征矩阵进行端点检测处理，以减少非语音部分的数据；所述网络通信单元用于将所述处理后的特征矩阵发送给服务器，以用于所述服务器根据所述特征矩阵确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

本申请实施方式提供一种电子设备，包括：麦克风单元、网络通信单元和处理器；所述麦克风单元用于录制用户语音的音频信息；所述处理器用于根据所述音频信息生成特征矩阵；根据所述特征矩阵生成语音特征向量，其中，所述语音特征向量用于表征所述音频信息；所述网络通信单元用于将所述语音特征向量发送给服务器，以用于所述服务器根据所述语音特征向量确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

本申请实施方式提供一种电子设备，包括：麦克风单元、网络通信单元和处理器；所述麦克风单元用于录制用户语音的音频信息；所述处理器用于根据所述音频信息生成特征矩阵；根据所述特征矩阵生成语音特征向量，其中，所述语音特征向量用于表征所述音频信息；将所述语音特征向量与存储的用户特征向量进行匹配，得到与所述语音特征向量匹配的目标特征向量；所述网络通信单元用于将所述目标特征向量关联的个人信息发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

本申请实施方式还提供一种支付方法，所述方法包括：接收用户的支付指令；根据用户的语音输入的音频信息，生成所述音频信息的语音特征；将所述语音特征与用户特征进行匹配；在匹配成功的情况下，将所述用户特征所关联的个人信息发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

由以上本申请实施方式提供的技术方案可见，本申请实施方式通过采用语音特征向量和用户特征向量匹配的方式，对用户进行身份验证，简化了用户支付的流程，提升了用户的使用体验。再者，由于每个用户具有自身的语音特质，使得通过声音的特征，对用户进行身份验证，可以具有较高的可靠性。利用声音对用户进行身份验证，可以解放用户的双手，以及对所在环境的光线情况等要求较低，使得本实施方式提供的技术方案具有较为广泛的场景适应性。

附图说明

为了更清楚地说明本申请实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施方式提供的一种语音特征向量的生成方法的流程示意图；

图2为本申请实施方式提供的一种语音识别方法的流程图；

图3为本申请实施方式提供的一种支付方法的应用场景示意图；

图4为本申请实施方式提供的一种支付方法的流程示意图；

图5为本申请实施方式提供的一种支付方法的流程示意图；

图6为本申请实施方式提供的一种支付方法的流程示意图；

图7为本申请实施方式提供的一种支付方法的流程示意图；

图8为本申请实施方式提供的一种支付方法的流程示意图；

图9为本申请实施方式提供的一种支付方法的流程示意图；

图10为本申请实施方式提供的一种客户端的模块示意图；

图11为本申请实施方式提供的一种电子设备的架构示意图；

图12为本申请实施方式提供的一种支付方法的流程示意图；

图13为本申请实施方式提供的一种支付方法的流程示意图；

图14为本申请实施方式提供的一种支付方法的流程示意图；

图15为本申请实施方式提供的一种客户端的模块示意图；

图16为本申请实施方式提供的一种电子设备的架构示意图；

图17为本申请实施方式提供的一种支付方法的流程示意图；

图18为本申请实施方式提供的一种支付方法的流程示意图；

图19为本申请实施方式提供的一种支付方法的流程示意图；

图20为本申请实施方式提供的一种服务器的模块示意图；

图21为本申请实施方式提供的一种电子设备的架构示意图；

图22为本申请实施方式提供的一种支付方法的流程示意图；

图23为本申请实施方式提供的一种支付方法的流程示意图；

图24为本申请实施方式提供的一种服务器的模块示意图；

图25为本申请实施方式提供的一种电子设备的架构示意图；

图26为本申请实施方式提供的一种支付方法的流程示意图；

图27为本申请实施方式提供的一种支付方法的流程示意图；

图28为本申请实施方式提供的一种支付方法的流程示意图；

图29为本申请实施方式提供的一种支付方法的流程示意图；

图30为本申请实施方式提供的一种支付方法的流程示意图；

图31为本申请实施方式提供的一种支付方法的流程示意图；

图32为本申请实施方式提供的一种支付方法的流程示意图；

图33为本申请实施方式提供的一种服务器的模块示意图；

图34为本申请实施方式提供的一种电子设备的架构示意图；

图35为本申请实施方式提供的一种支付方法的流程示意图；

图36为本申请实施方式提供的一种客户端展示第一界面的示意图；

图37为本申请实施方式提供的一种客户端展示第二界面的示意图；

图38为本申请实施方式提供的一种支付方法的应用场景示意图；

图39为本申请实施方式提供的一种支付方法的应用场景示意图；

图40为本申请实施方式提供的一种支付方法的应用场景示意图；

图41为本申请实施方式提供的一种支付方法的应用场景示意图；

图42为本申请实施方式提供的一种支付方法的应用场景示意图；

图43为本申请实施方式提供的一种支付方法的应用场景示意图；

图44为本申请实施方式提供的一种支付方法的流程示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施方式中的附图，对本申请实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式仅仅是本申请一部分实施方式，而不是全部的实施方式。基于本申请中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都应当属于本申请保护的范围。

本申请实施方式提供一种语音特征向量的生成方法。该生成方法可以从音频信息中提取特征，生成可以表征音频信息的语音特征向量。

在本实施方式中，音频信息可以是录音设备录制的具有一定时长的音频数据。音频信息可以是对对用户说话语音的录音。请参阅图1。所述生成方法可以包括以下步骤。

步骤S45：根据所述音频信息生成特征矩阵。

在本实施方式中，可以根据预设算法，从音频信息中采集数据，输出包括所述音频信息的音频数据的特征的特征矩阵。用户的声音会有用户自身的特征，比如音色、语调、语速等等。录制成音频信息时，可以从音频数据中的频率、振幅等角度，体现每个用户自身的声音特征。使得将音频信息按照预设算法生成的特征矩阵，会包括音频信息中音频数据的特征。进而，基于特征矩阵生成的语音特征向量，可以用于表征该音频信息和音频数据。所述预设算法可以是MFCC(Mel Frequency Cepstrum Coefficient)、MFSC(Mel FrequencySpectral Coefficient)、FMFCC(Fractional Mel Frequency Cepstrum Coefficient)、DMFCC(Discriminative)、LPCC(Linear Prediction Cepstrum Coefficient)等。当然，所属领域技术人员在本申请技术精髓启示下，还可能采用其它算法实现生成音频信息的特征矩阵，但只要其实现的功能和效果与本申请方式相同或相似，均应涵盖于本申请保护范围内。

步骤S47：将所述特征矩阵按照多个特征维度进行降维处理，得到多个用于表征特征维度的维度值，所述多个维度值形成所述语音特征向量。

在本实施方式中，可以对所述特征矩阵按照不同的特征维度进行降维处理，得到可以表征每个特征维度的维度值。进一步的，将维度值按照指定顺序排列便可以形成音频信息的语音表征向量。具体的，可以通过卷积或者映射的算法对特征矩阵进行降维处理。在一个具体的示例中，可以采用DNN(Deep Neural Network)、CNN(Convolutional NeuralNetwork)和RNN(Recurrent Neural Network)、深度学习或者上述算法的结合等，从特征矩阵中按照不同维度进行降维。

在一个实施方式中，为了进一步区分出音频信息中用户语音的音频数据和非用户语音的音频数据。语音特征向量的生成方法中，还可以包括端点检测处理。进而，可以在特征矩阵中减少将非用户语音的音频数据对应的数据，如此，可以在一定程度上提升生成的语音特征向量与用户之间的关联程度。端点检测处理的方法可以包括但不限于基于能量的端点检测、基于倒谱特征的端点检测、基于信息熵的端点检测、基于自身相关相似距离的端点检测等，在此不再列举。

本申请实施方式提供一种用户的音频信息采集方法。可以通过客户端采集用户的音频信息。

在本实施方式中，客户端可以是具有录音功能的电子设备。具体的，例如，客户端可以是台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备、导购终端、电视机、智能音箱、麦克风等。其中，智能可穿戴设备包括但不限于智能手环、智能手表、智能眼镜、智能头盔、智能项链等。或者，客户端也可以为能够运行于上述电子设备中的软件。例如，电子设备中提供录音功能，软件可以通过调用该录音功能录制音频信息。

在本实施方式中，客户端可以在用户操作启动录音功能时，开始启动进行录取用户的语音，生成音频信息。客户端也可以自动启动录音功能，比如给客户端设置指定条件，当该条件达成时，启动录音功能。具体的，例如，指定一个时间，到达该时间时启动录音；或者，指定一个地点，到达该地点时启动录音；或者，设置一个环境音量，当环境音量符合设定的条件时，开始录音。在本实施方式中，生成音频信息的数量，可以是一个，也可以是多个。具体的，客户端在一次录音过程中，可以持续的将该次录音过程中的全部内容作为一个音频信息。也可以为，客户端在一次录音过程中，划分多个音频信息。比如，按照录音的时长划分音频信息。例如，每录制五分钟，形成一个音频信息。或者，按照数据量进行划分音频信息。例如，每个音频信息最多5MB。

请参与图2。本申请实施方式提供一种语音识别方法。所述语音识别方法可以从音频数据中识别出用户表达的内容，从而提供给用户一种输入方法。所述语音识别方法可以包括以下步骤。

步骤S51：获取音频信息。

步骤S53：按照预设识别算法，识别音频信息的内容。

在本实施方式中，可以预先定义有用户指令集，在用户指令集中包括至少一个用户指令。用户指令可以指向一个特定的功能。当从用户的音频数据中识别出用户指令时，可以表示要执行该用户指令指向的功能。也可以为，仅仅通过预设识别算法得出用户说话表达的内容。具体的，预设识别算法可以采用隐式马尔科夫算法或神经网络算法等，对音频信息进行语音识别。

本申请实施方式提供一种用户注册方法。所述用户注册方法可以将该用户的语音特征与所述用户的身份信息相关联。

在本实施方式中，可以采用音频信息采集方法获得用户的音频信息。其中，音频信息中的音频数据可以是用户的说话声音的录音。如此，根据音频信息生成的语音表征向量，可以对应表征的音频信息，也可以表征用户的一部分声音特质。由于每个用户生长发育过程，是各部不相同的，使得用户说话的声音，都具有一定的声音特质。进而，可以通过每个用户的声音特质分不同的用户。如此，语音表征向量可以通过表征用户的一部分声音特质，而可以用于标识用户。

在本实施方式中，针对用户采集的音频信息可以是一个或多个，可以对应每个音频信息采用音频信息处理方法生成对应的语音特征向量。当然，在一些情况下，也可以将一个以上音频信息同时进行按照音频信息处理方法进行运算处理，得到语音特征向量。此时，该语音特征向量可以对应该一个以上音频信息。

在本实施方式中，根据得到的语音特征向量，确定可以用于标识用户的用户特征向量。具体的，例如，若仅生成了一个语音特征向量，则可以将该语音特征向量作为用户的用户特征向量；若生成了多个语音特征向量，可以将在该多个语音特征向量中，选择一个相对表达用户的声音特质较多的语音特征向量，作为用户的用户特征向量；若生成了多个语音特征向量，还可以为将该多个语音特征向量中的部分或全部，进行进一步运算处理输出用户的用户特征向量。该运算处理可以包括但不限于针对该多个语音特征向量进行相应维度求和之后，再进一步计算均值。当然，还可以有其它算法，比如，运算处理时对多个语音特征向量的加权求和。

在本实施方式中，将用户的用户特征向量与用户的个人信息进行关联，如此实现完成用户的注册。用户的个人信息可以用于表示一个用户。用户的个人信息可以包括但不限于：用户名、昵称、真实姓名、性别、联系电话、通信地址等等。将用户特征向量与用户的个人信息相关联，可以实现采集一个用户说话的音频信息后，可以通过音频信息的语音特征向量与用户特征向量的关联性，确定该用户的个人信息。

本申请实施方式还提供一种身份识别方法。所述身份识别方法可以根据用户的语音的音频信息，识别用户的身份。

在本实施方式中，用户可以先通过用户注册方法进行注册，进而得到用户的用户特征向量。该用户特征向量可以存储在客户端中，也可以存储在服务器中。相应的，用户特征向量与该用户的个人信息相关联。

在本实施方式中，当需要对用户的身份进行识别时，可以录制用户的语音的音频信息。比如，用户对着麦克风说一句话。此时客户端得到用户语音输入的音频信息。根据前述语音特征向量的生成方法，根据该音频信息生成语音特征向量。

在本实施方式中，将语音特征向量与用户特征向量进行匹配，在匹配成功时，将所述用户特征向量关联的个人信息作为所述用户的身份信息。具体的，将语音特征向量与用户特征向量进行匹配的方式，可以为根据二者进行运算，在二者之间符合某种关系时，可以认为匹配成功。具体的，例如，将二者做差后求和，将得到的数值作为匹配值，将该匹配值与一个设定阈值比较，在所述匹配值小于或等于设定阈值的情况下认为所述语音特征向量与所述用户特征向量匹配成功。或者，也可以将所述语音特征向量与所述用户特征向量直接求和，将得到的数值作为匹配值，在所述匹配值大于或等于设定阈值的情况下认为所述语音特征向量与所述用户特征向量匹配成功。

本申请实施方式还提供一种网络交互系统。所述虚拟资源处理系统包括客户端和服务器。

在本实施方式中，客户端可以是具有录音功能的电子设备。根据客户端数据处理能力的不同，可以被划分成以下类别。

表1

在本实施方式中，初级网络设备的硬件设备较为简单，可以进行通过麦克风进行录音，生成音频信息。并将生成的音频信息通过网路通信模块发送给服务器。初级网络设备可以包括麦克风、网络通信单元、传感器和扬声器。初级网络设备可以基本上不需要对数据进行加工处理。初级网络设备还可以设置有其它的传感器，用于采集初级网络设备的工作参数。具体的，例如，初级网络设备可以是物联网设备、边缘节点设备等。

在本实施方式中，简单网络设备可以主要包括：麦克风、网络通信单元、处理器、存储器、扬声器等。简单网络设备相较于初级网络设备增强了数据处理的能力。简单网络设备可以具有一个能处理简单逻辑运算的处理器，使得简单网络设备在采集到数据之后，可以对数据进行初步的预处理，比如可以根据音频信息生成特征矩阵。简单网络设备可以具有一个具有简单显示功能的显示模块，可以用于向用户反馈信息。具体的，例如，简单网络设备可以是智能可穿戴设备、POS(point of sale)机等。例如，智能手环、较初级的智能手表、智能眼镜，或是线下购物场所内的结算设备(例如，POS机)、移动式结算设备(例如，手持式POS机、附加在手持设备上的结算模块)等。

在本实施方式中，中级网络设备可以主要包括麦克风、网络通信单元、处理器、存储器显示器、扬声器等。中级网络设备的处理器的主频通常小于2.0GHz，内存容量通常少于2GB，存储器的容量通常少于128GB。中级网络设备可以对录制的音频信息进行一定程度的处理，比如生成特征矩阵，对特征矩阵进行端点检测处理、降噪处理、语音识别等。具体的，例如，中级网络设备可以包括：智能家居中的智能家用电器、智能家庭终端、智能音箱、较高级的智能手表、较为初级的智能手机(比如，价位在1000元左右)、车载智能终端。

在本实施方式中，智能网络设备可以主要包括麦克风、网络通信单元、处理器、存储器、显示器、扬声器等硬件。智能网络设备可以具有较强的数据处理能力。智能网络设备的处理器的主频通常大于2.0GHz，内存的容量通常小于12GB，存储器的容量通常小于1TB。可以对音频信息生成特征矩阵之后，可以进行端点检测处理、降噪处理、语音识别等。进一步的，智能网络设备还可以根据音频信息生成语音特征向量。在一些情况下，可以将语音特征向量与用户特征向量进行匹配，识别用户的身份。但这种匹配限于有限个数的用户特征向量，比如一个家庭中的各个家庭成员的用户特征向量。具体的，例如，智能网络设备可以包括：性能较好的智能手机、平板电脑、台式电脑、笔记本电脑等。

在本实施方式中，高性能设备可以主要包括麦克风、网络通信单元、处理器、存储器、显示器、扬声器等硬件。高性能设备可以具有大规模的数据运算处理能力，还可以提供强大的数据存储能力。高性能设备的处理器主频通常在3.0GHz以上，内存的容量通常大于12GB，存储器容量可以在1TB以上。高性能设备可以对音频信息生成特征矩阵、端点检测处理、降噪处理、语音识别、生成语音特征向量，以及将语音特征向量与存储的大量的用户特征向量进行匹配。具体的，例如，高性能设备可以是工作站、配置很高的台式电脑、Kiosk智能电话亭、自助服务机等。

当然，上述只是示例的方式列举了一些客户端。随着科学技术进步，硬件设备的性能可能会有提升，使得上述目前数据处理能力较弱的电子设备，也可能具备较强的处理能力。所以下文中实施方式引用上述表1中的内容，也仅作为示例参考，并不构成限定。

在本实施方式中，服务器可以是具有一定运算处理能力的电子设备。其可以具有网络通信端子、处理器和存储器等。当然，上述服务器也可以是指运行于所述电子设备中的软体。上述服务器还可以为分布式服务器，可以是具有多个处理器、存储器、网络通信模块等协同运作的系统。或者，服务器还可以为若干服务器形成的服务器集群。在本实施方式中，服务器中可以用于管理用户特征向量。用户完成注册之后，用户的用户特征向量可以存储于服务器中。

本申请实施方式提供一种电子设备。所述电子设备可以包括：麦克风单元和网络通信单元。

所述麦克风单元可以录制用户语音的音频信息。

所述网络通信单元可以将所述音频信息发送给服务器，以用于所述服务器根据所述音频信息确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

在本实施方式中，电子设备可以录制音频信息，并将音频信息发送给服务器。电子设备可以不对生成的音频信息进行处理，直接将音频信息发送给服务器。

在本实施方式中，服务器可以根据音频信息生成语音特征向量，将语音特征向量与用户特征向量进行匹配，以验证用户的身份。将与语音特征向量匹配成功的用户特征向量关联的个人信息作为所述用户的身份。

在本实施方式中，个人信息关联的资源账户可以是个人信息中包括的账户信息，或者与个人信息绑定的账户信息。通过数据库设定存储结构，在确定个人信息时，便可以确定对应的资源账户。

在本实施方式中，支付操作可以是用户需要从资源账户对外支付虚拟资源，以实现购买商品或者服务。具体的，例如，用户使用网络购物软件手机京东购买洗衣机，用户的支付操作为从用户的银行卡账户支付价款给销售方或者处于中间交易担保的第三方。

在本实施方式中，电子设备可以为表1中任一个类别中的设备。

本申请实施方式提供一种电子设备。所述电子设备可以包括：麦克风单元、网络通信单元和处理器。

所述麦克风单元可以根据用户语音输入生成音频信息。

所述处理器可以根据所述音频信息生成特征矩阵；所述特征矩阵用于表征所述音频信息。

所述网络通信单元可以将所述特征矩阵发送给服务器，以用于所述服务器根据所述特征矩阵确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

在本实施方式中，用户的语音输入生成音频信息可以是客户端通过麦克风单元将用户语音录制成音频文件。

在本实施方式中，电子设备可以在录制的音频信息基础上，根据音频信息生成特征矩阵。将特征矩阵发送给服务器。如此，可以使得减少网络传输的数据量，提升整体的处理速度。再者，减少了服务器的运算量，降低了服务器的工作负荷。

在本实施方式中，电子设备可以为表1中类别编号2至5中任一个类别的设备。

本申请实施方式还提供一种电子设备。所述电子设备包括：麦克风单元、网络通信单元和处理器。

所述麦克风单元用于根据用户语音输入生成音频信息。

所述处理器用于根据所述音频信息生成特征矩阵，所述特征矩阵用于表征所述音频信息；针对所述特征矩阵进行端点检测处理，以减少非语音部分的数据。

所述网络通信单元用于将所述处理后的特征矩阵发送给服务器，以用于所述服务器根据所述特征矩阵确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

在本实施方式中，通过端点检测处理可以使得根据特征矩阵生成的语音特征向量，更加准确的表达用户语音的特征，降低非用户语音的干扰。再者，可以进一步减少了特征矩阵的数据量，从而降低了网络传输和服务器的负荷。

在本实施方式中，电子设备可以为表1中类别编号3至5中任一个类别的设备。也可以为第2类中硬件配置和性能较为出色的设备。

本申请实施方式还提供一种电子设备。所述电子设备可以包括：麦克风单元、网络通信单元和处理器。

所述麦克风单元可以根据用户语音输入生成音频信息。

所述处理器可以根据所述音频信息生成特征矩阵；根据所述特征矩阵生成语音特征向量，其中，所述语音特征向量用于表征所述音频信息。

所述网络通信单元可以将所述语音特征向量发送给服务器，以用于所述服务器根据所述语音特征向量确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

在本实施方式中，电子设备在根据音频信息生成特征矩阵的基础上，基于特征矩阵生成了可以表征音频信息的语音特征向量。进一步减少了需要进行网络传输的数据量，以及减少了服务器的运算负荷。

在本实施方式中，服务器接收到语音特征向量之后，可以将该语音特征向量与用户特征向量进行匹配，得到与语音特征向量匹配的用户特征向量。可以将该匹配得到的用户特征向量关联的个人信息作为用户的身份。

在本实施方式中，电子设备可以为表1中类别编号4和5中任一个类别的设备。也可以为第3类中硬件配置和性能较为出色的设备。

所述麦克风单元可以根据用户语音输入生成音频信息。

所述处理器可以根据所述音频信息生成特征矩阵；根据所述特征矩阵生成语音特征向量，其中，所述语音特征向量用于表征所述音频信息；将所述语音特征向量与存储的用户特征向量进行匹配，得到与所述语音特征向量匹配的目标特征向量。

所述网络通信单元可以将所述目标特征向量关联的个人信息发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

在本实施方式中，电子设备可以在生成所述语音特征向量之后，将语音特征向量与用户特征向量进行匹配。电子设备中可以存储有用户特征向量。用户特征向量表征的用户可以是一个家庭的成员，也可以是任意在该电子设备进行用户注册的人员。

在本实施方式中，电子设备可以为表1中类别编号5中的设备。也可以为第4类中硬件配置和性能较为出色的设备。

请一并参阅图3和图4。在一个场景示例中，客户端可以是具有一定程度上的运算能力的家用智能设备。例如，可以是上表1中的类别3型设备。在一个家用场景下，客户端可以被制造为智能音箱。智能音箱可以具有麦克风、扬声器、Wifi模块、存储器、处理器等等。智能音箱可以实现普通的音频播放功能，并且配备有处理设备和网络设备以通过与用户对话以及与服务器数据交互，实现购物功能。

在本场景示例中，智能音箱可以通过识别唤醒词启动进一步的功能，在智能音箱识别到用户说出唤醒词之前，可以处于一种待机的状态。用户需要使用智能音箱时，可以说“你好，音箱”。智能音箱会录制该用户说的语音，并识别得出用户说话的内容为唤醒词。此时，智能音箱可以通过扬声器发生回答用户，“您好，您需要帮忙么？”。

在本场景示例中，用户想要购买空气净化器。用户可能会说：“我想买一台空气净化器，你有什么推荐么？”。智能音箱通过麦克风录音生成音频信息后，识别到上述商品描述信息。并在存储器中的商品信息集中，查询空气净化器的商品信息，得到二个推荐结果，通过扬声器播放语音：“我有两个推荐，第一个是小米空气净化器2代，第二个是美的KJ210G-C46空气净化器”。用户可能会说：“我要购买小米空气净化器2代”。智能音箱通过录制音频信息并识别之后，确定要购买的商品信息是小米空气净化器2代。当然，智能音箱也可以将商品描述信息发送给服务器，并接收服务器提供的推荐结果。

在本场景示例中，智能音箱可以询问用户“您现在就要支付购买么？”，用户可能答复说“是的”。智能音箱可以根据预设的随机算法生成一段文字，并告知用户“请您跟读一遍这段数字，57463”。智能音箱可以识别用户说的内容是不是指定的数字，以判断用户是不是具有真实的支付意愿。如果用户说的是：“算了，不买了”，那么智能音箱便可以结束本次购买流程。用户可能说：“57463”。此时，智能音箱发现识别得到的用户说的内容与指定的数字相同，认为用户确实具有购买的意愿。

在本场景示例中，智能音箱可以根据用户跟读数字的音频信息生成语音特征向量。并将该语音特征向量与智能音箱存储器中存储的用户特征向量进行匹配。用户特征向量可以是用户预先在智能音箱进行了注册，使得智能音箱具有用户的用户特征向量。当然，如果之前没有注册，也可以立即开始注册的流程。

在本场景示例中，智能音箱可以在存储的用户特征向量中与语音特征向量匹配成功，此时智能音箱完成了对用户的身份验证，可以将用户的个人信息和要购买的商品信息发送给服务器，以使服务器从用户的金融账户中支付商品信息中的价款给该商品的卖家。

请参阅图38。在一个场景示例中，智能音箱可以主动预测用户关注的商品或服务。

在本场景示例中，智能音箱可以位于用户家庭的客厅。用户在看电视过程中，智能音箱可以通过对电视声音的录音，得到音频信息，进而识别得到频道编码。或者，智能音箱可以通过识别电视节目的内容，与服务器进行交互，由服务器反馈相应的电视频道。

在本场景示例中，智能音箱可以存储有电视频道的节目清单。或者，也可以从服务器拉去电视频道的节目清单。在用户观看电视的过程中，可能对某一个广告的商品感兴趣，要进行购买。此时，用户可以说：“你好，音箱”，“我要购买这个广告中的商品”。智能音箱可以根据用户说话的时间点，和节目清单中给出的时间，确定用户要购买的商品信息。进一步的，智能音箱可以根据用户的语音的音频信息生成语音特征文件进行匹配，验证用户的身份。在验证成功时，将用户的个人信息和商品信息发送给服务器，以使服务器从用户的金融账户中支付商品信息中的价款给该商品的卖家。

请一并参阅图4和图39。在一个场景示例中，客户端可以是具有显示器的电子设备。例如，可以是上表1中的类别4型设备。具体的，例如，客户端可以是智能手机。

在本场景示例中，用户可能想要购买一款耳麦。用户可以使用购物软件，例如，手机京东、当当、亚马逊购物等等，操作浏览商品信息。

在本场景示例中，用户可以完成了商品信息的浏览，要针对一款价值150元的耳麦进行支付时，可以将手机停留在该商品信息的界面，对着手机说：“我要付款”。此时，手机可以录制该语音的音频信息并识别得到该用户的指令后，手机可以向用户提供付款界面。或者，用户点击了要付款的按钮，手机提供付款界面。在付款界面上用户可以直接说出预先设定的支付关键词。比如，用户说：“声纹支付方式给生活带来便捷”，手机进行录音生成音频信息，可以根据该音频信息生成语音特征向量。将该语音特征向量与手机中存储的用户特征向量进行匹配，以验证用户的身份。在匹配成功时，手机可以将用户的个人信息和商品信息发送给服务器，以用于服务器从用户的金融账户中支付商品信息中的价款给该商品的卖家。

请一并参阅图12和图40。在一个具体的场景示例中，客户端可以是车载终端。该车载终端可以通过与用户的对话，并进一步处理确认用户要购买的是一种服务兑换券，比如售价为50元的汽车维修工时券。车载终端可以将录制的用户的语音文件和该汽车维修工时券的信息，一并发送给服务器。有服务器进行身份验证的过程。

在本场景示例中，车载终端向服务器提供的音频信息，可以是用户发出购买指令的录音。比如，用户说：“我要购买百骏维修厂的汽车维修工时券”，车载终端将该句话的音频信息发送给服务器。

在本场景示例中，服务器接收到音频信息和服务信息后，可以根据音频信息生成语音特征向量。将语音特征向量在服务器中的用户特征向量中匹配，以验证用户的身份。比如，验证成功，根据匹配成功的用户特征向量，得到用户的个人信息，进而可以实现个人信息的金融账户对百骏维修厂付款购买汽车维修工时券。

在本场景示例中，车载终端也可以录制音频信息之后，生成音频信息的特征矩阵，并将特征矩阵和服务信息发送给服务器。进而便于服务器根据特征矩阵生成语音特征向量进行验证用户身份的工作。

请参阅图12和图41。在一个具体的场景示例中，客户端可以是线下场地的收银台的电子终端。例如，电子终端可以是上表1中类别2型设备。具体的，例如，该电子终端可以是POS机。电子终端可以设置有麦克风，以录制消费者的语音的音频信息。

在本场景示例中，消费者可以在线下场地挑选商品。比如，购买衣服。消费者去收银台付款时，工作人员可以向电子终端中输入价格信息。并让消费者对着麦克风说一句话，以录制消费者的音频信息。电子终端可以将该音频信息和商品信息发送给服务器。

在本场景示例中，电子终端的显示器，可以用于显示信息。当需要支付时，显示器可以显示指定信息，比如，“请朗读以下文字‘线下声音付很方便’”。麦克风可录制用户朗读的语音形成音频信息。电子终端可以根据所述音频信息生成特征矩阵，并将所述特征矩阵发送给服务器。

在本场景示例中，服务器接收到音频信息的特征矩阵和商品信息之后。根据特征矩阵生成语音特征向量。将语音特征向量在服务器中的用户特征向量中匹配，以验证用户的身份。比如，验证成功，根据匹配成功的用户特征向量，得到用户的个人信息，进而可以实现个人信息的金融账户对线下场地付款购买衣服。服务器在将对消费者的账户完成扣款之后，以及款项进入线下场地的金融账户后，可以通知线下场地支付成功。

请参阅图42。在一个场景示例中，客户端可以是具有数据采集能力的家用物联网设备。例如，可以是上表1中的类别1型设备。在一个家用场景下，客户端可以被制造为洗衣机。洗衣机除了自身实现洗衣服所具有的功能之外，还具有传感器、Wifi模块、麦克风和扬声器等等。洗衣机的传感器可以是温度传感器，用于感测洗衣机的环境温度，或者转速传感器，用于感测洗衣机波轮或者滚筒的转速。麦克风可以录制音频数据，扬声器可以播放服务器提供的音频数据。

在本场景示例中，麦克风录制音频数据，通过Wifi模块与家庭网络互连，将音频数据发送给服务器。服务器可以反馈音频数据给所述洗衣机，通过所述扬声器播放。

在本场景示例中，用户家中缺少洗衣液，需要进行购买。用户可以对洗衣机说：“你好，洗衣机”。麦克风会将该语音录制成音频信息通过Wifi发送给服务器。服务器接收到音频信息之后，通过语音识别发现是唤醒词。并向洗衣机发送音频信息通过扬声器播放：“您好，您需要我帮您做什么？”。用户可能说：“我需要购买洗衣液，你有品牌推荐么？”，服务器接收到音频信息后，进行语音识别和语义分析，得到向用户推荐的品牌，通过发送音频信息答复用户：“目前XX品牌洗衣液正在打折促销，2L洗衣液仅花费10元，您需要购买么？”。用户可能回答：“好的，我购买这个打折促销的2L洗衣液”。服务器接收到音频信息之后，通过语音识别和语义分析得出用户同意购买该推荐的商品。根据与该用户对话过程中的一个用户的音频文件生成语音特征向量，将该语音特征向量在服务器中的用户特征向量中匹配，以验证用户的身份。比如，验证成功，根据匹配成功的用户特征向量，得到用户的个人信息，进而可以实现个人信息的金融账户对洗衣液进行支付操作。

请参阅图43。在一个场景示例中，客户端可以是具有很强数据处理能力的公共服务设备。例如，可以是上表1中的类别5型设备。在一个家用场景下，客户端可以被制造为自助服务机。

在本场景示例中，自助服务机可以提供缴纳的水电费、上网费、订阅报刊杂志等功能。用户可以在自助服务机进行注册。用户注册成功之后，自助服务机中存储用户的用户特征向量和用户录入的个人信息，以用户再次操作时根据用户特征向量验证用户的身份。

在本场景示例中，已经完成注册的用户操作自助服务机订阅报纸。用户可以对自助服务机说：“你好，我要订阅报纸。”。自助服务机录制音频信息，并进行语音识别和语音分析之后，确认用户表达的内容。并根据音频信息生成语音特征向量，将该语音特征向量与本地存储的用户特征向量进行匹配，得到与该音频特征向量对应的用户特征向量，如此确定了用户的个人信息。自助服务机可以回答：“你好XX先生，您需要订阅的报纸名称是什么？”。用户说：“我要订阅下个季度的姑苏晚报”。自助服务机答复：“您要订阅7月至9月的姑苏晚报，确认支付请说出您注册时设置的支付关键词”。用户说出在注册时设置的支付关键词：“科技推动社会进步”。

在本场景示例中，自助服务机进一步识别该支付关键词是否与设定的支付关键词相同。在与设置的支付关键词相符合时，将用户的个人信息和订阅的报纸信息发送给服务器，以用于所述服务器根据个人信息关联的金融账户对销售报纸的商家进行支付操作。

请参阅图5。本申请实施方式提供一种支付方法。所述支付方法可以应用于客户端。所述支付方法可以包括以下步骤。

步骤S52：接收用户的支付指令。

在本实施方式中，当用户需要从其资源账户对外支付虚拟资源时，可以向客户端发出支付指令。客户端接收支付指令的方式可以包括但不限于：识别用户的说话语音，用户的说话语音中具有要进行支付的意思表示，通过语义分析得出用户要进行支付；识别用户的说话的语音，用户的说话语音中具有设定的指令词，即用户可以预先设定指令词，当用户说出该指令词时，表示用户需要进行支付；或者，用户点击了客户端的表示进行支付购买商品或者服务的按钮；或者，用户点击客户端中表示向另一个用户转账的按钮。

在本实施方式中，支付指令本身可以是一个预先设置的输入。在客户端接收到的用户输入为该预先设置的输入时，便可以认为接收到了支付指令。支付指令可以是用户要购买商品或者服务，需要对商家进行支付费用。支付指令也可以是用户要进行转账，即将虚拟资源从所述用户的资源账户，转移至另一个用户的资源账户，而并没有发生购买事项。

步骤S54：根据用户的语音输入的音频信息，生成所述音频信息的语音特征向量。

在本实施方式中，根据音频信息生成语音特征向量，该语音特征向量可以用于确定用户的身份。

在本实施方式中，可以约束用户语音输入的表达内容。比如，提供给用户一段文字让用户朗读。或者，询问用户问题，让用户回答。当然，也可以不约束用户表达的内容，而随机录制用户说的一句话或者一段话。

在本实施方式中，客户端可以在接收到用户的指示之后，生成语音特征向量。具体的，例如，用户可以根据其意志控制客户端，了解商品或者服务的信息。用户可以通过与客户端对话的方式，了解不同商品或者服务的细节参数等。在用户想要购买时，才启动生成用户的语音特征向量，进而验证用户的身份。进一步示例，客户端是智能音箱的场景下，可以为用户对智能音箱说“我要支付”，智能音箱通过语音识别出用户表达的内容之后，才进一步的生成用户的语音特征向量。在客户端是智能手机或者类似具有屏幕显示功能的电子设备的场景下，用户可以操作给客户端指示要进行付款，此时客户端可以启动录制用户语音的音频信息，进而生成语音特征向量，用于对用户的身份进行验证。

步骤S56：将所述语音特征向量与用户特征向量进行匹配。

步骤S58：在匹配成功的情况下，将所述用户特征向量关联的个人信息，发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

在本实施方式中，客户端中可以预先按照用户注册方法设置有用户的用户特征向量。如此，可以通过将语音特征向量与用户特征向量进行匹配，实现对用户的身份进行验证。

在本实施方式中，将语音特征向量与用户特征向量进行匹配的方式，可以为根据二者进行运算，在二者之间符合某种关系时，可以认为匹配成功。具体的，例如，将二者做差后求和，将得到的数值作为匹配值，将该匹配值与一个设定阈值比较，在所述匹配值小于或等于设定阈值的情况下认为所述语音特征向量与所述用户特征向量匹配成功。或者，也可以将所述语音特征向量与所述用户特征向量求和，将得到的数值作为匹配值，在所述匹配值大于或等于设定阈值的情况下认为所述语音特征向量与所述用户特征向量匹配成功。

在本实施方式中，客户端对用户的身份进行验证之后，已经确定了用户的身份。在匹配成功的情况下，客户端可以将个人信息发送给服务器，此时服务器可以无需再对个人信息进行进一步的身份验证。当然，在一些情况下，客户端发给服务器的个人信息中，还可以包括有用户的用户名和密码，服务器可以再次根据用户名和密码进行验证。

在本实施方式中，个人信息关联的资源账户可以包括但不限于金融账户、游戏账户、股票账户、证券账户、积分账户等等。

在本实施方式中，支付操作可以是将资源账户中的一部分或者全部虚拟资源转移所有权的行为。具体的，例如，在购买商品的场景下，支付操作可以是从用户的金融账户中扣除一定的金额，以用于支付给该商品的商家。在一些情况下，在发生购买事件时，用户支付的金额可以先付给第三方，该第三方可以作为担保交易进行的中介，待用户收到商品指示第三方时，第三方将金额转交给商家。

在本实施方式中，虚拟资源可以是被用户之间认可使用，可以进行市场流通和交换的资源。虚拟资源可以包括但不限于是货币，在一些情况下还可以是其它有价证券、积分等。

在本实施方式中，客户端可以是表1中第5类设备。也可以为第4类中硬件配置和性能较为出色的设备。

在本实施方式中，通过采用语音特征向量和用户特征向量匹配的方式，对用户进行身份验证。如此，用户可以仅仅通过语音对话的方式，进行身份验证。减少了用户的操作，提升了用户的使用体验。再者，由于每个用户具有自身的语音特质，使得通过声音的特征，对用户进行身份验证，可以具有较高的可靠性。利用声音对用户进行身份验证，可以解放用户的双手，以及对所在环境的光线情况等要求较低，使得本实施方式提供的技术方案具有较为广泛的场景适应性。

在一个实施方式中，在获取接收用户的支付指令之前，所述支付方法还可以包括：从用户的语音输入的音频信息中识别得到启动指令。

在本实施方式中，客户端可以在得到用户的启动指令之后，才启动所述支付方法。如此，在用户正常工作生活过程种，不会受到客户端的干扰。而在用户需要使用客户端时，可以通过给客户端发出启动指令，开始所述支付方法。

在本实施方式中，客户端可以处于一种待机的状态，录制用户语音的音频信息，以识别用户是否向客户端做出启动指令。具体的，例如，启动指令可以为识别到用户说“你好，XXX”。当客户端识别到用户说“你好，XXX”时，便启动支付方法。

在本实施方式中，执行的主体并不限于客户端，其还可以为服务器。服务器在确定对象信息之前，从录制的用户语音的音频信息中识别得到启动指令。具体的，例如，客户端仅仅负责录制用户的音频信息，然后将该音频信息发送给服务器。由服务器进行识别，用户是否做出了启动指令。

在本实施方式中，启动指令可以是用户的一种输入，其用于表示启动支付方法。启动指令可以是用户通过语言表达的指定内容。当然，对于客户端是具有显示器的智能终端的场景，比如智能手机，启动指令也可以是用户操作智能手机点击的了相应的按钮等。

在本实施方式中，客户端可以是表1中第2类至第5类中任一类设备。也可以为第4类中硬件配置和性能较为出色的设备。

在一个实施方式中，所述支付方法还可以包括步骤：获取支付对象信息。相应的，在将个人信息发送给服务器的步骤中，在匹配成功的情况下，将所述支付对象信息和所述用户特征向量关联的个人信息发送给服务器，以用于所述服务器根据所述个人信息关联的资源账户进行针对所述支付对象信息的支付操作。

在本实施方式中，支付对象信息可以用于表示对象。支付对象信息可以是对象的属性值。具体的，支付对象信息可以包括对象的名称、介绍、数量、领域、构成等等。具体的，例如，对象可以是商品或者服务。支付对象信息可以是商品名称、数量、价格、商品介绍、商品成分等等，或者是服务名称、服务种类、价格、时间等等。在转账的场景下，支付对象信息可以包括接收方的用户名、资源账户的名称等。

在本实施方式中，客户端获取的支付对象信息可以是用户较为关注该支付对象信息标识的对象。具体的，例如，用户想要购买电视机，客户端可以提供电视机的信息给用户，以便于用户了解和选择。或者，也可以是用户需要给另一个用户支付虚拟资源。具体的，例如，用户之间发生借款，或者，一个用户向另一个用户还钱。

在本实施方式中，客户端获取支付对象信息的方式可以包括但不限于：录制用户语音的音频信息，识别出用户表达的支付对象描述信息，进而在本地存储的对象信息集中匹配得到支付对象信息；或者，将支付对象描述信息发送给服务器，接收服务器反馈的支付对象信息。还可以为根据用户的操作，获得支付对象信息之后通过界面展示。具体的，例如，客户端可以是集成了麦克风和扬声器的电子设备，比如智能音箱。用户可以与智能音箱对话的方式，通智能音箱提供的支付对象信息中，确定某一个为被关注或指定的支付对象信息。此外，客户端也可以是类似智能手机的电子设备。用户可以通过操作智能手机，使得智能手机显示支付对象信息，比如提供商品信息或者服务信息，或者用户的账户名称。此外，在线下购物的场景中，可以由销售人员向客户端输入支付对象信息。

在本实施方式中，在匹配成功的情况下，表示已经对用户的身份进行了验证，并且确定了用户的身份。如此，可以进一步的从用户的资源账户中，将虚拟资源支付至支付对象信息对应的资源账户。具体的，例如，用户要购买一个商品，通过智能音箱了解商品信息之后，要向出售该商品的商家支付价款。客户端首先通过用户的语音，验证用户的身份，完成验证之后，从用户的金融账户中向出售该商品的商家支付价款。

请参阅图6。在一个实施方式中，在获取支付对象信息的步骤中可以包括以下步骤。

步骤S60：根据用户的语音输入生成音频信息。

步骤S62：对所述音频信息进行语音识别得到支付对象描述信息。

步骤S64：根据所述支付对象描述信息确定对应的支付对象信息。

在本实施方式中，用户可以通过说话表达的方式，说出其关注或者想要了解的对象。支付对象描述信息可以为用户描述所述对象的内容。具体的，例如，用户可以对着客户端说“我想要了解一下联想T450笔记本”。

在本实施方式中，客户端通过对用户的语音进行录音得到音频信息，进而可以通过语音识别确定用户表达的内容。进而，客户端可以根据用户表达的支付对象描述信息，确定对应的支付对象信息。具体的，例如，客户端录制用户的语音之后，进行语音识别得到用户表达的内容是“我想要了解一下联想笔记本，要有很高的性价比”。客户端便可以从对象信息集中查询联想笔记本都有哪些型号，并可以通过消费者对不同型号的评价，得出拥有较高高性价比的型号。当然，客户端也可以有预先设定的评价规则来评判性价比。进一步的，比如，型号为T450的联想笔记本被确定为具有较高性价比的型号。此时，客户端确定支付对象信息之后，可以将支付对象信息告知用户。当然，本实施方式并不限于客户端查询本地的对象信息集，还可以为客户端将支付对象描述信息发送给服务器，由服务器完成支付对象信息的确认，并可以将支付对象信息反馈给所述客户端。

在本实施方式中，客户端也可以提供给用户多个支付对象信息，以供用户指定。具体的，例如，客户端提供给用户的性价比较高的联想笔记本包括：联想笔记本T450、联想笔记本T440、联想笔记本X260。用户指定其中一款进一步处理。

在本实施方式中，客户端可以是表1中第3类至第5类中任一类设备。

请参阅图7。在一个实施方式中，在确定支付对象信息的步骤中可以包括以下步骤。

步骤S66：将所述支付对象描述信息发送给服务器。

在本实施方式中，客户端中可以不具有对象信息集；或者客户端的对象信息集中没有找到与支付对象描述信息对应的支付对象信息；或者，客户端的对象信息集。此时，客户端可以将支付对象描述信息发送给服务器。

步骤S68：接收所述服务器反馈的至少一个支付对象信息。

在本实施方式中，服务器根据支付对象描述信息，在对象信息集进行查询匹配，得到至少一个支付对象信息。可以将得到的至少一个支付对象信息全部反馈给所述客户端。也可以，按照一定筛选逻辑，在至少一个支付对象信息中挑选一个或多个支付对象信息，反馈给客户端。

步骤S70：将所述至少一个支付对象信息反馈给所述用户。

在本实施方式中，客户端可以通过语音播放的方式将得到的支付对象信息告知用户。在客户端是具有显示器的智能终端的场景下，客户端可以通过显示器向用户展示支付对象信息。

步骤S72：接收用户的确认指令，将所述确认指令指向的支付对象信息作为被确定的支付对象信息。

在本实施方式中，客户端将得到的支付对象信息告知用户之后，在接收到用户的确认指令之后，确定作为后续进一步处理的支付对象信息。

在本实施方式中，确认指令可以是用于向客户端下达进一步处理指示的命令。具体的，客户端接收用户的确认指令的方式可以包括：录制用户语音的音频信息，通过语音识别得到用户表达的指向某一个支付对象信息的确认指令。或者，在客户端具有显示器的场景下，用户通过操作按钮，或者触摸屏幕选择某一个支付对象信息。

请参阅图8。在一个实施方式中，在确定支付对象信息的步骤中可以包括以下步骤。

步骤S74：将所述支付对象描述信息在本地存储的对象信息集中查询，得到至少一个支付对象信息。

步骤S76：将所述至少一个支付对象信息反馈给所述用户。

步骤S78：接收用户的确认指令，将所述确认指令指向的支付对象信息作为被确定的支付对象信息。

在本实施方式中，将支付对象描述信息在客户端中存储的对象信息集中匹配，进一步确定支付对象信息。在查询得到多个支付对象信息时，可以将多个支付对象信息反馈给用户，以便于用户进行指定。本实施方式，可以参照前述实施方式对照解释。

在一个实施方式中，生成所述语音特征向量的方式包括以下至少一种：任意选择一个所述用户的音频信息生成所述语音特征向量；获取所述用户语音输入的包括自定义支付关键词的音频信息，根据所述音频信息生成所述语音特征向量；向所述用户提供指定信息，根据所述用户依照所述指定信息的语音输入生成音频信息，根据所述音频信息生成所述语音特征向量。

在本实施方式中，可以针对不同的支付场景，生成语音特征向量所基于的音频信息不同。针对小金额支付时，可以根据任意一个录制的用户语音的音频信息生成语音特征向量，以达到可以快速支付处理的效果，具体的，例如支付金额少于100元。

在本实施方式中，对于一些相对较大的金额时，可以要求录制用户设定的自定义支付关键词的音频信息。支付关键词可以是预先设定的一段文字、一句话或者模拟发声而无具体的含义。例如，用户将自己的生日作为支付关键词，或者学一段鸟叫的口技作为支付关键词。支付关键词用于表示用户向客户端下达支付命令，即客户端接收到该支付关键词时，表示用户同意进行支付操作。如此，在支付之前可以进行语音特征向量与用户特征向量进行匹配验证身份之外，还可以通过语音识别得到音频信息中用户语音表达的内容，判断其预先自定义的自定义支付关键词是否相同。如此实现进行双重验证，在均验证成功时，才进行支付操作。具体的，例如，支付金额为100以上，并少于300，采用该双重验证。

在本实施方式中，对于一些较大金额支付时，可以向用户提供指定信息，要求用户依照该指定信息的要求发出声音，并录制音频信息。具体的，例如，支付金额为300元以上。指定信息可以是指示用户朗读一段文字，或者回答问题。具体的，例如，可以基于随机算法等，生成一段数字，并通过播放或者屏幕显示的方式提供给用户。或者，选择一个用户预先设定好答案的问题，向用户提问。用户依照所述指定信息的语音，可以为用户按照指定信息的内容，朗读文字或者回答问题。将用户的语音录制成音频信息，如此可以生成语音特征向量，进而用于验证用户的身份。支付之前可以进行语音特征向量与用户特征向量进行匹配验证身份之外，还可以通过语音识别得到音频信息中用户语音表达的内容，是否符合指定信息的内容进行判断。如此实现进行双重验证，在均验证成功时，才进行支付操作。再者，通过指定信息的方式，因为用户要表达语音具有一定的随机性，一定程度上避免了被恶意录音，而冒充用户支付的情况。当然，本申请实施方式并不限于上述列举的组合方式。根据不同场景的需要，可以采用前述三种方式任意组合的方式进行多重验证。

在本实施方式中，客户端可以是表1中第4类或第5类设备。

请参阅图9。在一个实施方式中，所述指定信息为要求用户发出指定的声音。具体的，例如，指定信息为要求用户朗读一段文字，或者回答问题。指定的声音可以为朗读文字的语音，或者回答的内容。在将所述支付对象信息和所述用户特征向量关联的个人信息发送给服务器的步骤中还可以包括以下步骤。

步骤S86：对用于生成所述语音特征向量的音频信息进行语音识别，判断所述用户的语音是否符合所述指定信息。

步骤S88：在符合的情况下，将所述支付对象信息和所述用户特征向量关联的个人信息，发送给服务器。

在本实施方式中，在将个人信息和支付对象信息发送给服务器之前，采用了双重验证。采用语音特征向量验证用户的身份，避免被冒充。通过识别音频信息的内容是否符合指定信息的内容，以确认用户是否存在支付虚拟资源的实际意愿。可以在上述双重验证都成功的情况下，将个人信息和支付对象信息发送给服务器。如此设置，极大的提升了用户的资源账户的安全性。

在本实施方式中，用户的语音符合所述指定信息可以为，音频信息识别的内容与指定信息中提供给用户朗读的文字相一致；或者，音频信息中识别的内容是针对指定信息提供给用户的问题的正确回答。具体的，例如，指定信息为要用户朗读“847579”，识别用户的音频信息得到的内容也是“847579”，认为用户的语音符合指定信息。

在本实施方式中，客户端可以是表1中第4类或第5类设备。

请参阅图10，本申请实施方式还提供一种客户端，包括：接收模块、生成模块、匹配模块和发送模块。

所述接收模块，用于接收支付指令。

所述生成模块，用于根据用户的语音输入的音频信息，生成所述音频信息的语音特征向量。

所述匹配模块，用于将所述语音特征向量与用户特征向量进行匹配。

所述发送模块，用于在匹配成功的情况下，将所述用户特征向量关联的个人信息，发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

本实施方式中提供的客户端，其实现的功能和效果可以参见其它实施方式对照解释。

请参阅图11。本申请实施方式还提供一种电子设备。所述客户端包括：网络通信单元、麦克风单元和处理器。

所述网络通信单元，用于将所述处理器提供的个人信息，发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

所述麦克风单元，用于生成用户语音输入的音频信息。

所述处理器，用于获取支付对象信息；将所述音频信息生成语音特征向量；将所述语音特征向量与用户特征向量进行匹配；在匹配成功的情况下，将所述用户特征向量关联的个人信息提供给所述网络通信单元。

在本实施方式中，所述存储器包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的，用于进行网络连接通信的接口。

在本实施方式中，所述处理器可以按任何适当的方式实现。例如，所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。

在本实施方式中，所述麦克风单元可以将声音转换成电信号形成音频信息。麦克风单元可以采取电阻式麦克风、电感式麦克风、电容式麦克风、铝带式麦克风、动圈式麦克风或驻极体麦克风。

本申请实施方式还提供一种计算机存储介质，其存储有程序指令，在所述程序指令被执行时实现：获取支付对象信息；根据用户的语音输入的音频信息，生成所述音频信息的语音特征向量；将所述语音特征向量与用户特征向量进行匹配；在匹配成功的情况下，将所述支付对象信息和所述用户特征向量关联的个人信息，发送给服务器，以用于所述服务器将所述个人信息关联的资源账户中的虚拟资源转移至所述支付对象信息关联的资源账户。

在本实施方式中，所述计算机存储介质包括但不限于随机存取存储器(RandomAccess Memory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(HardDisk Drive,HDD)或者存储卡(Memory Card)。

本实施方式中提供的计算机存储介质，其程序指令被执行时实现的功能和效果可以参见其它实施方式对照解释。

请参阅图13。本申请实施方式提供一种支付方法。所述支付方法可以包括以下步骤。

步骤S90：接收用户的支付指令。

步骤S92：将用户语音输入的音频信息、根据所述音频信息生成的特征矩阵或者根据所述音频信息生成的语音特征向量中至少之一，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

在本实施方式中，客户端可以不处理用户身份的识别工作，而由服务器进行对用户身份的识别。如此减少客户端的运算负荷。再者，客户端可以无需存储有用户特征向量，有利于保护用户的资源账户安全。

在本实施方式中，客户端可以录制用户语音的音频信息后，将该音频信息发送给服务器。如此服务器可以根据该音频信息生成语音特征向量。并将该语音特征向量与服务器中的用户特征向量进行匹配，得到与该语音特征向量匹配的目标特征向量。通过读取该目标特征向量关联的个人信息，完成对用户身份的识别。具体的，例如，所述客户端可以是表1中第1类至第5类中任一类设备。

在本实施方式中，客户端也可以根据音频信息，生成特征矩阵。将生成的特征矩阵发送给服务器。如此，服务器接收到之后，可以根据该特征矩阵生成语音特征向量。进而使用语音特征向量与存储的用户特征向量进行匹配工作。如此，可以减少服务器的运算负荷。在大数据场景下，当存在许多用户通过客户端与服务器交互时，在客户端完成生成特征矩阵，可以一定程度上降低服务器的运算量。再者，客户端将生成的特征矩阵发送给服务器，由于特征矩阵的数据量少于音频信息，使得传输过程其占用的网络资源较少。具体的，例如，所述客户端可以是表1中第2类至第5类中任一类设备。

在本实施方式中，客户端也可以根据音频信息，生成语音特征向量。将生成的语音特征向量发送给服务器。如此，服务器接收到之后，可以使用该语音特征向量与存储的用户特征向量进行匹配工作。如此，可以减少服务器的运算负荷。在大数据场景下，当存在许多用户通过客户端与服务器交互时，在客户端完成生成语音特征向量，可以很大程度上降低服务器的运算量。再者，客户端将生成的语音特征向量发送给服务器，由于语音特征向量的数据量远远少于音频信息，使得传输过程其占用的网络资源较少。具体的，例如，所述客户端可以是表1中第3类至第5类中任一类设备。

在一个实施方式中，所述方法还包括步骤：获取支付对象信息。相应的，在发送的步骤中，将所述音频信息、所述特征矩阵或所述语音特征向量中至少之一，和所述支付对象信息发送给所述服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以及根据所述个人信息关联的资源账户进行针对所述支付对象信息的支付操作。

在本实施方式中，提供了一种在支付方法中，指定支付对象信息的方式。本实施方式可以参见其它实施方式对照解释，不再赘述。

请参阅图14。在一个实施方式中，所述指定信息为要求用户发出指定的声音。具体的，例如，指定信息为要求用户朗读一段文字，或者回答问题。指定的声音可以为朗读文字的语音，或者回答的内容。在将所述音频信息、所述特征矩阵或者所述语音特征向量中至少之一，发送给所述服务器的步骤中还可以包括以下步骤。

步骤S91：对用于生成所述语音特征向量的音频信息进行语音识别，判断所述用户的语音是否符合所述指定信息。

步骤S93：在符合的情况下，将所述音频信息、所述特征矩阵、所述语音特征向量中至少之一，和所述支付对象信息发送给所述服务器。

在本实施方式中，在将所述音频信息、所述特征矩阵、所述语音特征向量中至少之一，和支付对象信息发送给服务器之前，通过识别音频信息的内容是否符合指定信息的内容，以确认用户是否存在支付虚拟资源的实际意愿。当用户的语音没有符合指定信息时，可以认为用户并没有实际意愿支付。如此设置，提升了用户的资源账户的安全性。

在本实施方式中，用户的语音符合所述指定信息可以为，音频信息识别的内容与指定信息中提供给用户朗读的文字相一致；或者，音频信息中识别的内容是针对指定信息提供给用户的问题的回答。具体的，例如，指定信息为要用户朗读“847579”，识别用户的音频信息得到的内容也是“847579”，认为用户的语音符合指定信息。

在本实施方式中，根据发送的内容不同，客户端可以采用表1中不同的类别的设备。发送音频信息和支付对象信息时，客户端可以采用表1中第2类至第5类中任一类的设备。发送特征矩阵和支付对象信息时，客户端可以采用表1中第2类至第5类中任一类的设备。发送语音特征向量和支付对象信息时，客户端可以采用表1中第4类至第5类的设备。

请参阅图15。本申请实施方式还提供一种客户端。所述客户端包括：接收模块和发送模块。

获取模块，用于接收用户的支付指令。

发送模块，用于将用户语音输入的音频信息、根据所述音频信息生成的特征矩阵或者根据所述音频信息生成的语音特征向量中至少之一，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

请参阅图16。本申请实施方式还提供一种电子设备。所述电子设备可以包括：网络通信单元、麦克风单元和处理器。

所述网络通信单元，用于将所述处理器提供的语音特征向量、特征矩阵或音频信息，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

所述麦克风单元，用于生成用户语音输入的音频信息。

所述处理器，用于获取支付对象信息；能将所述音频信息生成特征矩阵或语音特征向量。

本申请实施方式还提供一种计算机存储介质。所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现：接收用户的支付指令；将用户语音输入的音频信息、根据所述音频信息生成的特征矩阵或者根据所述音频信息生成的语音特征向量中至少之一，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

本实施方式中提供的计算机存储介质，其计算机程序指令被执行时实现的功能和效果可以参见其它实施方式对照解释。

请参阅图17。本申请实施方式提供一种支付方法，应用于服务器，所述方法可以包括以下步骤。

步骤S94：接收客户端发出的音频信息和支付对象信息；其中，所述音频信息为根据用户的语音输入生成。

在本实施方式中，服务器并不限于同时接收到音频信息和支付对象信息。具体的，例如，客户端可以先发出音频信息，再发出支付对象信息，反之亦然。

在本实施方式中，

步骤S96：根据所述音频信息生成语音特征向量。

步骤S98：将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量。

步骤S100：根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

在本实施方式中，服务器可以与客户端之间基于网络通信协议通信。网络通信协议包括但不限于Http、TCP/IP、FTP等。

在本实施方式中，服务器根据客户端提供的音频信息生成语音特征向量，进而可以与服务器中的用户特征向量进行匹配。以确定用户的身份。

在本实施方式中，服务器中可以具有多个用户特征向量。用户可以通过操作客户端进行注册。用户注册之后，会将用户的用户特征向量与个人信息关联。服务器可以用于存储用户注册后的用户特征向量和个人信息。

在本实施方式中，通过服务器统一处理身份验证的工作，使得客户端可以不涉及敏感信息的工作。如此，可以提升用户的资源账户的安全性。

请参阅图18。在一个实施方式中，在接收音频信息的步骤中可以包括以下步骤。

步骤S102：向所述客户端提供指定信息，以使所述客户端根据所述用户依照所述指定信息的语音输入生成音频信息。

在本实施方式中，指定信息可以是指示用户朗读一段文字，或者回答问题。具体的，例如，可以基于随机算法等，生成一段数字，并通过播放或者屏幕显示的方式提供给用户。或者，选择一个用户预先设定好答案的问题，向用户提问。在本实施方式中，服务器生成该指定信息之后发送给客户端。

在本实施方式中，用户依照所述指定信息的语音，可以为用户按照指定信息的内容，朗读文字或者回答问题。将用户的语音录制成音频信息，如此可以生成语音特征向量，进而用于验证用户的身份。

步骤S104：接收所述客户端反馈的所述音频信息。

在本实施方式中，可以通过指定信息来约束用户的语音，进而可以对生成的语音特征向量存在一定的规范作用。如此，有助于提升判断语音特征向量和用户特征向量是否匹配的准确度，即提升了对用户的身份验证的准确度。

请参阅图19。在一个实施方式中，所述指定信息为要求用户发出指定的声音。具体的，例如，指定信息为要求用户朗读一段文字，或者回答问题。指定的声音可以为朗读文字的语音，或者回答的内容。在进行支付操作的步骤中还可以包括以下步骤。

步骤S108：对用于生成所述语音特征向量的音频信息进行语音识别，判断所述用户的语音是否符合所述指定信息。

步骤S110：在符合的情况下，根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

在本实施方式中，服务器在进行支付操作之前，采用了双重验证。采用语音特征向量验证用户的身份，通过识别音频信息的内容是否符合指定信息的内容。可以在上述双重验证都成功的情况下，服务器才进行支付操作。如此设置，提升了用户的资源账户的安全性。

请参阅图20。本申请实施方式提供一种服务器，包括：接收模块、生成模块、匹配模块、处理模块。

所述接收模块，用于接收客户端发出的音频信息和支付对象信息；其中，所述音频信息为根据用户的语音输入生成。

所述生成模块，用于根据所述音频信息生成语音特征向量。

所述匹配模块，用于将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量。

所述处理模块，用于根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本实施方式中提供的服务器，其实现的功能和效果可以参见其它实施方式对照解释。

请参阅图21。本申请实施方式提供一种电子设备。该电子设备可以包括：网络通信单元、存储器和处理器。

所述网络通信单元，用于接收客户端发出的音频信息和支付对象信息，其中，所述音频信息为根据用户的语音输入生成。

所述存储器，用于存储用户特征向量；所述用户特征向量与个人信息关联。

所述处理器，用于根据所述音频信息生成语音特征向量；将所述语音特征向量与所述存储器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本实施方式中提供的电子设备，其实现的功能和效果可以参见其它实施方式对照解释。

本申请实施方式还提供一种计算机存储介质。所述计算机存储介质中存储有计算机程序指令，所述计算机程序指令被执行时实现：接收客户端发出的音频信息和支付对象信息，其中，所述音频信息为根据用户的语音输入生成；根据所述音频信息生成语音特征向量；将所述语音特征向量与用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

请参阅图22。本申请实施方式还提供一种支付方法。所述支付方法应用于服务器。所述方法可以包括以下步骤。

步骤S112：接收客户端发出的语音特征向量和支付对象信息；其中，所述语音特征量是根据用户的语音的音频信息生成。

步骤S114：将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量。

步骤S116：根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

在本实施方式中，服务器直接接收到客户端发出的语音特征向量，使得服务器可以直接将语音特征向量与用户特征向量进行匹配。服务器无需再进行根据音频信息生成语音特征向量的工作。如此，可以减少服务器的运算负荷。在大数据场景下，当存在许多用户通过客户端与服务器交互时，在客户端完成生成语音特征向量，可以很大程度上降低服务器的运算量。再者，客户端将生成的语音特征向量发送给服务器，由于语音特征向量的数据量少于音频信息，使得传输过程其占用的网络资源较少。

请参阅图23。在一个实施方式中，在接收语音特征向量的步骤中可以包括以下步骤。

步骤S118：向所述客户端提供指定信息，以使所述客户端录制所述用户依照所述指定信息的语音的音频信息。

步骤S120：接收所述客户端反馈的根据所述音频信息生成的语音特征向量。

在本实施方式中，服务器可以向客户端发出指定信息，以约束客户端提供的音频信息的内容。如此，可以使得客户端提供的音频信息较为规范，比较便于服务器生成语音特征向量，以及提升语音特征向量与用户特征向量匹配的准确度。

请参阅图24。本申请实施方式提供一种服务器。所述服务器包括：接收模块、匹配模块和处理模块。

所述接收模块用于接收客户端发出的语音特征向量和支付对象信息；其中，所述语音特征量是根据用户的语音输入的音频信息生成。

所述匹配模块用于将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量。

所述处理模块用于根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

请参阅图25。本申请实施方式还提供一种电子设备。所述电子设备可以包括：网络通信单元、存储器和处理器。

所述网络通信单元，用于接收客户端发出的语音特征向量和支付对象信息；其中，所述语音特征量是根据用户的语音输入的音频信息生成。

所述存储器，用于存储用户特征向量；所述用户特征向量与个人信息关联；

所述处理器，用于将所述语音特征向量与所述存储器中的用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式还提供一种计算机存储介质，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现：接收客户端发出的语音特征向量和支付对象信息，其中，所述语音特征量是根据用户的语音的音频信息生成；将所述语音特征向量与用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

请参阅图26和图27。本申请实施方式还提供一种支付方法。所述方法可以包括以下步骤。

步骤S122：根据用户的语音输入生成音频信息。

步骤S124：将所述音频信息发送给服务器，以用于所述服务器识别音频信息表达的支付对象信息，以及根据音频信息确定用户的个人信息，以根据所述个人信息关联的资源账户针对所述支付对象信息进行支付操作。

在本实施方式中，客户端可以仅仅负责录制音频信息。并将录制的音频信息发送给服务器。如此，使得客户端的功能较为简单便于实现。而由服务器完成主要的数据处理等功能，便于管理维护。在一些情况下，对主要数据处理的逻辑进行更新时，对服务器中的程序指令更新即可，给软件管理带来了便利。

请一并参阅图26和图28。本申请实施方式还提供一种支付方法。所述方法应用于服务器。所述服务器接收客户端提供的音频信息；所述音频信息是根据用户的语音输入生成。所述支付方法可以包括以下步骤。

步骤S126：根据音频信息确定支付对象信息，以及根据音频信息生成语音特征向量。

在本实施方式中，服务器可以对音频信息进行语音识别，识别出用户表达的支付对象描述信息，进而在本地存储的对象信息集中匹配得到支付对象信息。

步骤S132：将所述语音特征向量与所述服务器中的用户特征向量进行匹配；与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量。

步骤S134：根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

在本实施方式中，音频信息的数量可以是一个或多个。客户端可以录制一定时长之后，生成一个音频信息，也可以录制达到一定数据量之后生成一个音频信息。客户端还可以具有语音识别功能，在录制用户说完一句话之后生成音频信息。或者，在用户说话过程，出现明显的停顿时，将连续录制的音频数据作为一个音频信息。

在本实施方式中，服务器完成了支付方法的主要运算处理工作。如此，客户端可以仅仅录制用户的语音生成音频信息，并将音频信息发送给服务器，简化了客户端的业务逻辑。再者，服务器统一管理主要运算逻辑，便于进行升级维护。进一步的，客户端除了提供音频信息之外，基本上不参与其它交互。如此，使得服务器中的数据处理可以处于一个相对封闭的运算环境，降低了用户个人信息泄露的风险，提升了整个系统的安全性。

请参阅图29。在一个实施方式中，在确定支付对象信息的步骤中可以包括以下步骤。

步骤S136：对所述音频信息进行语音识别得到支付对象描述信息。

步骤S138：根据所述支付对象描述信息确定对应的支付对象信息。

在本实施方式中，服务器可以通过语音识别确定用户表达的内容。进而，服务器可以根据用户表达的支付对象描述信息，确定对应的支付对象信息。具体的，例如，服务器对音频信息进行语音识别得到用户表达的内容是“我想要了解一下联想笔记本，要有很高的性价比”。服务器便可以从对象信息集中查询联想笔记本都有哪些型号，并可以通过消费者对不同型号的评价，得出拥有较高高性价比的型号。当然，客户端也可以有预先设定的评价规则来评判性价比。进一步的，比如，型号为T450的联想笔记本被确定为具有较高性价比的型号。此时，服务器确定支付对象信息之后，可以将支付对象信息发送给客户端以告知用户。

请参阅图30。在一个实施方式中，在确定支付对象信息的步骤中可以包括以下步骤。

步骤S140：将所述支付对象描述信息在本地存储的对象信息集中查询，得到至少一个支付对象信息。

步骤S142：将所述至少一个支付对象信息反馈给所述客户端，以提供给所述用户。

步骤S144：接收所述客户端发送的用户的确认指令，将所述确认指令指向的支付对象信息作为被确定的支付对象信息。

在本实施方式中，将支付对象描述信息在服务器中存储的对象信息集中查询，进一步确定支付对象信息。在查询得到多个支付对象信息时，可以将多个支付对象信息发送给客户端以反馈给用户，以便于用户进行指定。

在本实施方式中，用户可以操作客户端向服务器发出确认指令。所述确认指令可以是一种电信号，其用于表示用户选择某个支付对象信息。具体的，用户操作客户端发出确认指令的方式可以包括：录制用户表达选择某一支付对象信息的语音的音频信息，将所述音频信息发送给服务器。或者，在客户端具有显示器的场景下，用户通过操作按钮，或者触摸屏幕选择某一个支付对象信息，客户端向服务器发送表示该支付对象信息的消息。

请参阅图31。在一个实施方式中，在生成语音特征向量的步骤中可以包括以下步骤。

步骤S146：向所述客户端发送指定信息，以将所述指定信息提供给所述用户。

在本实施方式中，指定信息可以是指示用户朗读一段文字，或者回答问题。具体的，例如，可以基于随机算法等，生成一段数字，并通过播放或者屏幕显示的方式提供给用户。或者，选择一个用户预先设定好答案的问题，向用户提问。

步骤S148：接收所述客户端反馈的音频信息；所述音频信息是录制所述用户依照所述指定信息的语音而生成。

步骤S150：根据所述音频信息生成所述语音特征向量。

请参阅图32。在一个实施方式中，所述指定信息为要求用户发出指定的声音；具体的，例如，指定信息为要求用户朗读一段文字，或者回答问题。指定的声音可以为朗读文字的语音，或者回答的内容。在进行支付操作的步骤中还可以包括以下步骤。

步骤S152：对用于生成所述语音特征向量的音频信息进行语音识别，判断所述用户的语音是否符合所述指定信息。

步骤S154：在符合的情况下，根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

在本实施方式中，在将用户的虚拟资源转移给支付对象信息对应的资源账户之前，采用了双重验证。采用语音特征向量验证用户的身份，避免被冒充。通过识别音频信息的内容是否符合指定信息的内容，以确认用户是否存在支付虚拟资源的实际意愿。可以在上述双重验证都成功的情况下，将个人信息和支付对象信息发送给服务器。如此设置，极大的提升了用户的资源账户的安全性。

请参阅图33。本申请实施方式还提供一种服务器，所述服务器可以包括以下模块。

接收模块，用于接收客户端发出的音频信息，其中，所述音频信息是根据用户的语音输入生成。

确定模块，用于根据音频信息确定支付对象信息。

生成模块，用于根据音频信息生成语音特征向量。

匹配模块，用于将所述语音特征向量与所述服务器中的用户特征向量进行匹配；与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量。

处理模块，用于根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

请参阅图34。本申请实施方式还提供一种电子设备，包括：网络通信单元、存储器和处理器。

所述网络通信单元，用于接收客户端提供的音频信息，所述音频信息是根据用户的语音输入生成。

所述处理器，用于根据音频信息确定支付对象信息，以及根据音频信息生成语音特征向量；将所述语音特征向量与所述存储器中的用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

本申请实施方式还提供一种计算机存储介质，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现：接收客户端提供的音频信息，所述音频信息是根据用户的语音输入生成；根据音频信息确定支付对象信息，以及根据音频信息生成语音特征向量；将所述语音特征向量与所述服务器中的用户特征向量进行匹配，与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

请参阅图35。本申请实施方式还提供一种支付方法。所述方法可以包括以下步骤。

步骤S156：显示包括支付对象信息的第一界面。

在本实施方式中，客户端展示第一界面，如图36所示，以向用户提供支付对象信息的内容。如此，用户可以较为直观的知道信息。

步骤S158：接收用户的支付请求；所述支付请求表示用户希望支付所述支付对象信息表征的对象。

在本实施方式中，用户可以通过点击“立即支付”按钮等，操作客户端，以实现进一步支付对象信息表示的商品或服务。

步骤S160：显示具有指定信息的第二界面。

在本实施方式中，如图37所示，第二界面可以是用于用户确认支付的界面。该界面中具有指定信息，以指示用户朗读文字或者回答问题。具体的，例如，指定信息为要求用户朗读“736452”。

步骤S162：根据用户依照所述指定信息的语音输入生成的音频信息；以用于根据所述音频信息确定所述用户的个人信息，以用于根据所述个人信息的资源账户针对所述支付对象信息进行支付操作。

在本实施方式中，用户可以通过点击第二界面中的录音按钮，对用户的说话语音进行录制生成音频信息。客户端可以根据音频信息生成语音特征向量，以跟客户端中的用户特征向量进行匹配，验证用户的身份。或者，也可以将音频信息发送给服务器，由服务器生成语音特征向量并与用户特征向量匹配，得到目标特征向量。在确认用户的个人信息之后，便可以进行支付的过程。即用户向出售商品或服务的商家支付价款。

在本实施方式中，电子设备可以采用表1中第2类至第5类中的设备。

请参阅图44。本申请实施方式提供一种支付方法，所述方法可以包括以下步骤。

步骤S164：接收用户的支付指令。

步骤S166：根据用户的语音输入的音频信息，生成所述音频信息的语音特征。

在本实施方式中，根据音频信息可以生成可以表征该音频信息的语音特征。在一个优选的实施方式中，语音特征可以由语音特征向量来表征。当然，本实施方式中，语音特征并不限于以语音特征向量的方式。所属领域技术人员在本申请技术精髓启示下，还可以做出其它变更，但只要其实现的功能和效果与本申请相同或相似，均应涵盖于本申请保护范围内。

步骤S168：将所述语音特征与用户特征进行匹配。

步骤S170：在匹配成功的情况下，将所述用户特征所关联的个人信息发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

在本实施方式中，将语音特征与用户特征进行匹配，实现验证用户的身份。实现用户可以仅仅通过说话，便完成身份验证。

在本实施方式中，用户特征可以是预先注册在客户端中。如此，根据将当前用户的语音特征与用户特征进行匹配，实现验证用户的身份。语音特征和用户特征之间匹配，可以为二者作为一种运算的输入，输出的结果符合设定的要求。

在一个实施方式中，在生成语音特征的步骤中包括以下至少之一：任意选择一个所述用户的音频信息生成所述语音特征；或者，获取所述用户语音输入的包括自定义支付关键词的音频信息，根据所述音频信息生成所述语音特征；或者，向所述用户提供指定信息，根据所述用户依照所述指定信息的语音输入生成音频信息，根据所述音频信息生成所述语音特征。

在一个实施方式中，所述指定信息为要求用户发出指定的声音；在将所述用户特征所关联的个人信息发送给服务器步骤中还包括：对用于生成所述语音特征的音频信息进行语音识别，判断所述用户的语音是否符合所述指定信息；在符合的情况下，将所述支付对象信息和所述用户特征向量关联的个人信息，发送给服务器。

本说明书中的各个实施方式均采用递进的方式描述，各个实施方式之间相同相似的部分互相参见即可，每个实施方式重点说明的都是与其他实施方式的不同之处。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片2。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。

虽然通过实施方式描绘了本申请，本领域普通技术人员知道，本申请有许多变形和变化而不脱离本申请的精神，希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

Claims

1.一种支付方法，其特征在于，所述方法包括：

接收用户的支付指令；

根据所述用户的语音输入的音频信息，生成所述音频信息的语音特征向量；

将所述语音特征向量与用户特征向量进行匹配；

在匹配成功的情况下，将所述用户特征向量关联的个人信息发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

2.根据权利要求1所述的方法，其特征在于，在接收用户的支付指令之前，所述方法还包括：从所述用户语音输入的音频信息中识别得到启动指令。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取支付对象信息；

相应的，在发送的步骤中，

在匹配成功的情况下，将所述支付对象信息和所述用户特征向量关联的个人信息发送给服务器，以用于所述服务器根据所述个人信息关联的资源账户进行针对所述支付对象信息的支付操作。

4.根据权利要求3所述的方法，其特征在于，在获取支付对象信息的步骤中包括：

根据所述用户语音输入生成音频信息；

对所述音频信息进行语音识别得到支付对象描述信息；

根据所述支付对象描述信息确定对应的支付对象信息。

5.根据权利要求4所述的方法，其特征在于，在确定支付对象信息的步骤中包括：

将所述支付对象描述信息发送给服务器；

接收所述服务器反馈的至少一个支付对象信息；

将所述至少一个支付对象信息反馈给所述用户；

接收所述用户的确认指令，将所述确认指令指向的支付对象信息作为被确定的支付对象信息。

6.根据权利要求4所述的方法，其特征在于，在确定支付对象信息的步骤中包括：

将所述支付对象描述信息在本地存储的对象信息集中查询，得到至少一个支付对象信息；

将所述至少一个支付对象信息反馈给所述用户；

7.根据权利要求1所述的方法，其特征在于，在生成语音特征向量的步骤中包括：

根据所述音频信息生成特征矩阵；

将所述特征矩阵按照多个特征维度进行降维处理，得到多个用于表征特征维度的维度值，所述多个维度值形成所述语音特征向量。

8.根据权利要求1所述的方法，其特征在于，在生成语音特征向量的步骤中包括以下至少之一：

任意选择一个所述用户的音频信息生成所述语音特征向量；或者，

获取所述用户语音输入的包括自定义支付关键词的音频信息，根据所述音频信息生成所述语音特征向量；或者，

向所述用户提供指定信息，根据所述用户依照所述指定信息的语音输入生成音频信息，根据所述音频信息生成所述语音特征向量。

9.根据权利要求8所述的方法，其特征在于，所述指定信息为要求用户发出指定的声音；在发送的步骤中还包括：

对用于生成所述语音特征向量的音频信息进行语音识别，判断所述用户的语音是否符合所述指定信息；

在符合的情况下，将所述支付对象信息和所述用户特征向量关联的个人信息，发送给服务器。

10.一种客户端，其特征在于，包括：

接收模块，用于接收用户的支付指令；

生成模块，用于根据所述用户的语音输入的音频信息，生成所述音频信息的语音特征向量；

匹配模块，用于将所述语音特征向量与用户特征向量进行匹配；

发送模块，用于在匹配成功的情况下，将所述用户特征向量关联的个人信息，发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

11.一种计算机存储介质，其特征在于，其存储有程序指令，在所述程序指令被执行时实现：

支付对象信息接收用户的支付指令；

将所述语音特征向量与用户特征向量进行匹配；

在匹配成功的情况下，将支付对象信息所述用户特征向量关联的个人信息，发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

12.一种支付方法，其特征在于，所述方法包括：

接收用户的支付指令；

将用户语音输入的音频信息、根据所述音频信息生成的特征矩阵或者根据所述音频信息生成的语音特征向量中至少之一，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

13.根据权利要求12所述的方法，其特征在于，在接收用户的支付指令之前，所述方法还包括：从用户语音输入的音频信息中识别得到启动指令。

14.根据权利要求12所述的方法，其特征在于，所述方法还包括：获取支付对象信息；

相应的，在发送的步骤中，

将所述音频信息、所述特征矩阵或所述语音特征向量中至少之一，和所述支付对象信息发送给所述服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以及根据所述个人信息关联的资源账户进行针对所述支付对象信息的支付操作。

15.根据权利要求14所述的方法，其特征在于，在获取支付对象信息的步骤中包括：

根据用户的语音输入生成音频信息；

对所述音频信息进行语音识别得到支付对象描述信息；

根据所述支付对象描述信息确定对应的支付对象信息。

16.根据权利要求15所述的方法，其特征在于，在确定支付对象信息的步骤中包括：

将所述支付对象描述信息发送给服务器；

接收所述服务器反馈的至少一个支付对象信息；

将所述至少一个支付对象信息反馈给所述用户；

接收用户的确认指令，将所述确认指令指向的支付对象信息作为被确定的支付对象信息。

17.根据权利要求15所述的方法，其特征在于，在确定支付对象信息的步骤中包括：

将所述支付对象描述信息在本地存储的对象信息集中匹配，得到至少一个支付对象信息；

将所述至少一个支付对象信息反馈给所述用户；

18.根据权利要求12所述的方法，其特征在于，在生成语音特征向量的步骤中包括：

根据所述音频信息生成特征矩阵；

19.根据权利要求12所述的方法，其特征在于，在生成语音特征向量的步骤中包括以下至少之一：

音频信息任意选择一个所述用户的音频信息生成所述语音特征向量；或者，

20.根据权利要求19所述的方法，其特征在于，所述指定信息为要求用户发出指定的声音；在发送的步骤中还包括：

在符合的情况下，将所述音频信息、所述特征矩阵、所述语音特征向量中至少之一，和所述支付对象信息发送给所述服务器。

21.一种客户端，其特征在于，包括：

接收模块，用于接收用户的支付指令；

发送模块，用于将所述用户的语音输入的音频信息、根据所述音频信息生成的特征矩阵或者根据所述音频信息生成的语音特征向量中至少之一，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

22.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现：接收用户的支付指令；将用户语音输入的音频信息、根据所述音频信息生成的特征矩阵或者根据所述音频信息生成的语音特征向量中至少之一，发送给服务器，以用于所述服务器根据所述音频信息、所述特征矩阵或者所述语音特征向量确定所述用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

23.一种支付方法，其特征在于，应用于服务器，所述方法包括：

接收客户端发出的音频信息和支付对象信息；其中，所述音频信息为根据用户的语音输入生成；

根据所述音频信息生成语音特征向量；

将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；

根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

24.根据权利要求23所述的方法，其特征在于，在生成语音特征向量的步骤中包括：

根据所述音频信息生成特征矩阵；

25.根据权利要求23所述的方法，其特征在于，在接收音频信息的步骤中包括：

向所述客户端提供指定信息，以使所述客户端根据所述用户依照所述指定信息的语音输入生成音频信息；

接收所述客户端反馈的所述音频信息。

26.根据权利要求25所述的方法，其特征在于，所述指定信息为要求用户发出指定的声音；在进行支付操作的步骤中还包括：

在符合的情况下，根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

27.一种服务器，其特征在于，包括：

接收模块，用于接收客户端发出的音频信息和支付对象信息；其中，所述音频信息为根据用户的语音输入生成；

生成模块，用于根据所述音频信息生成语音特征向量；

匹配模块，用于将所述语音特征向量与所述服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；

28.一种电子设备，其特征在于，包括网络通信单元、存储器和处理器；

所述网络通信单元，用于接收客户端发出的音频信息和支付对象信息，其中，所述音频信息为录制的用户的语音；

29.一种计算机存储介质，其特征在于，所述计算机存储介质中存储有计算机程序指令，所述计算机程序指令被执行时实现：接收客户端发出的音频信息和支付对象信息，其中，所述音频信息为录制的用户的语音；根据所述音频信息生成语音特征向量；将所述语音特征向量与用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

30.一种支付方法，其特征在于，应用于服务器，所述方法包括：

接收客户端发出的语音特征向量和支付对象信息；其中，所述语音特征量是根据用户的语音输入的音频信息生成；

将所述语音特征向量与服务器中的用户特征向量进行匹配；其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；

31.根据权利要求30所述的方法，其特征在于，在接收语音特征向量的步骤中包括：

向所述客户端提供指定信息，以使所述客户端录制所述用户依照所述指定信息的语音的音频信息；

接收所述客户端反馈的根据所述音频信息生成的语音特征向量。

32.一种服务器，其特征在于，其包括：

接收模块，用于接收客户端发出的语音特征向量和支付对象信息；其中，所述语音特征量是根据用户的语音输入的音频信息生成；

33.一种电子设备，其特征在于，其包括：网络通信单元、存储器和处理器；

所述网络通信单元，用于接收客户端发出的语音特征向量和支付对象信息；其中，所述语音特征量是根据用户的语音输入的音频信息生成；

34.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现：接收客户端发出的语音特征向量和支付对象信息，其中，所述语音特征量是根据用户的语音输入的音频信息生成；将所述语音特征向量与用户特征向量进行匹配，其中，与所述语音特征向量匹配成功的用户特征向量为目标特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

35.一种支付方法，其特征在于，所述方法包括：

根据用户的语音输入生成音频信息；

将所述音频信息发送给服务器，以用于服务器识别音频信息表达的支付对象信息，以及根据音频信息确定用户的个人信息，以根据所述个人信息关联的资源账户针对所述支付对象信息进行支付操作。

36.一种支付方法，其特征在于，应用于服务器，所述服务器接收客户端提供的音频信息；所述音频信息是根据用户的语音输入生成；所述方法包括：

根据音频信息确定支付对象信息，以及根据音频信息生成语音特征向量；

将所述语音特征向量与所述服务器中的用户特征向量进行匹配；与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量；

37.根据权利要求36所述的方法，其特征在于，在确定支付对象信息之前，所述方法还包括：从用户语音输入的音频信息中识别得到启动指令。

38.根据权利要求36所述的方法，其特征在于，在确定支付对象信息的步骤中包括：

对所述音频信息进行语音识别得到支付对象描述信息；

根据所述支付对象描述信息确定对应的支付对象信息。

39.根据权利要求38所述的方法，其特征在于，在确定支付对象信息的步骤中包括：

将所述支付对象描述信息在存储的对象信息集中查询，得到至少一个支付对象信息；

将所述至少一个支付对象信息反馈给所述客户端，以提供给所述用户；

接收所述客户端发送的用户的确认指令，将所述确认指令指向的支付对象信息作为被确定的支付对象信息。

40.根据权利要求36所述的方法，其特征在于，在生成语音特征向量的步骤中包括：

根据所述音频信息生成特征矩阵；

41.根据权利要求36所述的方法，其特征在于，在生成语音特征向量的步骤中包括：

向所述客户端发送指定信息，以将所述指定信息提供给所述用户；

接收所述客户端反馈的音频信息；所述音频信息是录制所述用户依照所述指定信息的语音而生成；

根据所述音频信息生成所述语音特征向量。

42.根据权利要求41所述的方法，其特征在于，所述指定信息为要求用户发出指定的声音；在进行支付操作的步骤中还包括：

在符合的情况下，根据所述目标特征向量关联的个人信息的资源账户所述支付对象信息进行支付操作。

43.一种服务器，其特征在于，所述服务器包括：

接收模块，用于接收客户端发出的音频信息，其中，所述音频信息是根据用户语音输入生成；

确定模块，用于根据音频信息确定支付对象信息；

生成模块，用于根据音频信息生成语音特征向量；

匹配模块，用于将所述语音特征向量与所述服务器中的用户特征向量进行匹配；与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量；

44.一种电子设备，其特征在于，包括：网络通信单元、存储器和处理器；

所述网络通信单元，用于接收客户端提供的音频信息，所述音频信息是根据用户的语音输入生成；

45.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序指令，所述计算机程序指令被执行时实现：接收客户端提供的音频信息，所述音频信息是根据用户的语音输入生成；根据音频信息确定支付对象信息，以及根据音频信息生成语音特征向量；将所述语音特征向量与服务器中的用户特征向量进行匹配，与所述语音特征向量匹配成功的用户特征向量为目标用户特征向量；根据所述目标特征向量关联的个人信息的资源账户针对所述支付对象信息进行支付操作。

46.一种支付方法，其特征在于，所述方法包括：

显示包括支付对象信息的第一界面；

接收用户的支付请求；所述支付请求表示用户希望向所述支付对象信息进行支付操作；

显示具有指定信息的第二界面；

根据所述用户依照所述指定信息的语音输入生成音频信息；以用于根据所述音频信息确定所述用户的个人信息，以用于根据所述个人信息的资源账户针对所述支付对象信息进行支付操作。

47.一种电子设备，其特征在于，包括：麦克风单元和网络通信单元；

所述麦克风单元用于根据用户语音输入生成音频信息；

所述网络通信单元用于将所述音频信息发送给服务器，以用于所述服务器根据所述音频信息确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

48.一种电子设备，其特征在于，包括：麦克风单元、网络通信单元和处理器；

所述麦克风单元用于根据用户语音输入生成音频信息；

所述处理器用于根据所述音频信息生成特征矩阵；所述特征矩阵用于表征所述音频信息；

所述网络通信单元用于将所述特征矩阵发送给服务器，以用于所述服务器根据所述特征矩阵确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

49.一种电子设备，其特征在于，包括：麦克风单元、网络通信单元和处理器；

所述麦克风单元用于根据用户语音输入生成音频信息；

所述处理器用于根据所述音频信息生成特征矩阵，所述特征矩阵用于表征所述音频信息；针对所述特征矩阵进行端点检测处理，以减少非语音部分的数据；

50.一种电子设备，其特征在于，包括：麦克风单元、网络通信单元和处理器；

所述麦克风单元用于根据用户语音输入生成音频信息；

所述处理器用于根据所述音频信息生成特征矩阵；根据所述特征矩阵生成语音特征向量，其中，所述语音特征向量用于表征所述音频信息；

所述网络通信单元用于将所述语音特征向量发送给服务器，以用于所述服务器根据所述语音特征向量确定用户的个人信息，以对所述个人信息关联的资源账户进行支付操作。

51.一种电子设备，其特征在于，包括：麦克风单元、网络通信单元和处理器；

所述麦克风单元用于根据用户语音输入生成音频信息；

所述处理器用于根据所述音频信息生成特征矩阵；根据所述特征矩阵生成语音特征向量，其中，所述语音特征向量用于表征所述音频信息；将所述语音特征向量与存储的用户特征向量进行匹配，得到与所述语音特征向量匹配的目标特征向量；

所述网络通信单元用于将所述目标特征向量关联的个人信息发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

52.一种支付方法，其特征在于，所述方法包括：

接收用户的支付指令；

根据用户的语音输入的音频信息，生成所述音频信息的语音特征；

将所述语音特征与用户特征进行匹配；

在匹配成功的情况下，将所述用户特征所关联的个人信息发送给服务器，以用于所述服务器对所述个人信息关联的资源账户进行支付操作。

53.根据权利要求52所述的方法，其特征在于，在生成语音特征的步骤中包括以下至少之一：

任意选择一个所述用户的音频信息生成所述语音特征；或者，

获取所述用户语音输入的包括自定义支付关键词的音频信息，根据所述音频信息生成所述语音特征；或者，

向所述用户提供指定信息，根据所述用户依照所述指定信息的语音输入生成音频信息，根据所述音频信息生成所述语音特征。

54.根据权利要求53所述的方法，其特征在于，所述指定信息为要求用户发出指定的声音；在发送的步骤中还包括：

对用于生成所述语音特征的音频信息进行语音识别，判断所述用户的语音是否符合所述指定信息；