CN104967622B

CN104967622B - 基于声纹的通讯方法、装置和系统

Info

Publication number: CN104967622B
Application number: CN201510372778.XA
Authority: CN
Inventors: 杜念冬; 李超; 谢延
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2015-06-30
Filing date: 2015-06-30
Publication date: 2017-04-05
Anticipated expiration: 2035-06-30
Also published as: KR101769689B1; KR20170003366A; US20170004832A1; JP2017017669A; CN104967622A; US9865267B2

Abstract

本发明提出一种基于声纹的通讯方法、装置和系统，该基于声纹的通讯方法包括向服务端发送第一信息，并接收所述服务端发送的标识信息，所述标识信息是所述服务端接收到所述第一信息后生成的，所述第一信息是用户账号信息和语音信息中的一种；向所述服务端发送第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。该方法能够提高基于声纹通讯的安全性。

Description

基于声纹的通讯方法、装置和系统

技术领域

本发明涉及通信技术领域，尤其涉及一种基于声纹的通讯方法、装置和系统。

背景技术

传统的验证方式通常是基于密码的验证，但是，基于密码的验证方式容易被盗用。为了提高安全性，出现了基于声纹的验证方式，基于声纹的验证方式利用了使用者的声纹信息，不易被模仿，可以在一定程度上增加安全性。

现有技术中，在基于声纹的验证流程中，通常是客户端将用户账号信息和声纹信息同步发送给服务端，由服务端进行验证。但是，如果恶意攻击者在客户端与服务端的通信链路上抓包分析，也可能出现用户账号信息和声纹信息被泄露的问题。因此，现有技术的通讯方式存在一定的安全隐患。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的一个目的在于提出一种基于声纹的通讯方法，该方法可以提高基于声纹通讯的安全性。

本发明的另一个目的在于提出一种基于声纹的通讯装置。

本发明的另一个目的在于提出一种基于声纹的通讯系统。

为达到上述目的，本发明第一方面实施例提出的基于声纹的通讯方法，包括：向服务端发送第一信息，并接收所述服务端发送的标识信息，所述标识信息是所述服务端接收到所述第一信息后生成的，所述第一信息是用户账号信息和语音信息中的一种；向所述服务端发送第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。

本发明第一方面实施例提出的基于声纹的通讯方法，通过将第一信息和第二信息分两次传输给服务端，可以避免第一信息和第二信息同步传输时引起的问题，可以提高基于声纹通讯的安全性。

为达到上述目的，本发明第二方面实施例提出的基于声纹的通讯方法，包括：接收客户端发送的第一信息，生成标识信息，并将所述标识信息发送给所述客户端，所述第一信息是用户账号信息和语音信息中的一种；接收所述客户端发送的第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。

本发明第二方面实施例提出的基于声纹的通讯方法，通过接收客户端分两次传输的第一信息和第二信息，可以避免第一信息和第二信息同步传输时引起的问题，可以提高基于声纹通讯的安全性。

为达到上述目的，本发明第三方面实施例提出的基于声纹的通讯装置，包括：第一交互模块，用于向服务端发送第一信息，并接收所述服务端发送的标识信息，所述标识信息是所述服务端接收到所述第一信息后生成的，所述第一信息是用户账号信息和语音信息中的一种；第二交互模块，用于向所述服务端发送第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。

本发明第三方面实施例提出的基于声纹的通讯装置，通过将第一信息和第二信息分两次传输给服务端，可以避免第一信息和第二信息同步传输时引起的问题，可以提高基于声纹通讯的安全性。

为达到上述目的，本发明第四方面实施例提出的基于声纹的通讯装置，包括：第一交互模块，用于接收客户端发送的第一信息，生成标识信息，并将所述标识信息发送给所述客户端，所述第一信息是用户账号信息和语音信息中的一种；第二交互模块，用于接收所述客户端发送的第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。

本发明第四方面实施例提出的基于声纹的通讯装置，通过接收客户端分两次传输的第一信息和第二信息，可以避免第一信息和第二信息同步传输时引起的问题，可以提高基于声纹通讯的安全性。

为达到上述目的，本发明第五方面实施例提出的基于声纹的通讯系统，包括：第三方面实施例提出的装置，以及，第四方面实施例提出的装置。

本发明第三方面实施例提出的基于声纹的通讯系统，移动端与服务端分两次传输用户账号信息和语音信息，可以将用户账号信息与用于验证的语音信息分开传输，可以避免同步传输导致的不安全问题，从而可以提高验证的安全性。另外，标识信息是随机生成的，可以进一步提高安全性。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明一实施例提出的基于声纹的通讯方法的流程示意图；

图2是本发明另一实施例提出的基于声纹的通讯方法的流程示意图；

图3是本发明另一实施例提出的基于声纹的通讯方法的流程示意图；

图4是本发明另一实施例提出的基于声纹的通讯方法的流程示意图；

图5是本发明另一实施例提出的基于声纹的通讯装置的结构示意图；

图6是本发明另一实施例提出的基于声纹的通讯装置的结构示意图；

图7是本发明另一实施例提出的基于声纹的通讯装置的结构示意图；

图8是本发明另一实施例提出的基于声纹的通讯装置的结构示意图；

图9是本发明另一实施例提出的基于声纹的通讯系统的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

图1是本发明一实施例提出的基于声纹的通讯方法的流程示意图，本实施例以客户端执行为例，客户端例如位于移动设备上。该方法包括：

S11：向服务端发送第一信息，并接收所述服务端发送的标识信息，所述标识信息是所述服务端接收到所述第一信息后生成的，所述第一信息是用户账号信息和语音信息中的一种。

本实施例中为了避免用户账号信息和语音信息同步传输时存在的问题，可以将用户账号信息和语音信息分两次进行传输，避免被同时抓包。

用户账号信息例如用户名，手机号，邮箱名等。

本实施例的方法可以应用在注册流程，或者，也可以应用在验证流程中，验证流程可以包括登录验证或者支付验证等。

根据应用场景的不同，语音信息也是不同的。例如，当在注册时，所述语音信息是作为训练样本的语音数据，所述训练样本用于声纹训练以得到声纹特征信息。或者，当在验证时，所述语音信息是待验证的语音数据。

具体的，在注册流程中，客户端可以向用户展示注册界面，用户可以在该注册界面上填写用户账号信息，并可以根据客户端的提示信息，朗诵相应的提示内容，从而使得客户端获取待注册的语音信息。

在验证流程中，客户端可以向用户展示验证界面，用户可以在该验证解密上填写用户账号信息，并根据提示或者自发产生一段语音，从而使得客户端获取待验证的语音信息。

S12：向所述服务端发送第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。

其中，标识信息可以是服务端随机生成的，具体可以是信息摘要第五版(MessageDigest5，MD5)码。

客户端在接收到标识信息后，可以将标识信息与第二信息同步发送给服务端，服务端根据标识信息可以关联起第一信息和第二信息，进而可以根据关联的第一信息和第二信息进行注册或者验证。

本实施例中，通过将第一信息和第二信息分两次传输给服务端，可以避免第一信息和第二信息同步传输时引起的问题，可以提高基于声纹通讯的安全性。

图2是本发明另一实施例提出的基于声纹的通讯方法的流程示意图，本实施例的执行主体是服务端。本实施例的方法包括：

S21：接收客户端发送的第一信息，生成标识信息，并将所述标识信息发送给所述客户端，所述第一信息是用户账号信息和语音信息中的一种。

其中，标识信息可以是随机生成的，具体可以是MD5码。

根据应用场景的不同，语音信息也可以是不同的。例如，当在注册时，所述语音信息是作为训练样本的语音数据，所述训练样本用于声纹训练以得到声纹特征信息。或者，当在验证时，所述语音信息是待验证的语音数据。

S22：接收所述客户端发送的第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。

通过标识信息，可以将第一信息和第二信息关联起来，从而可以根据关联的第一信息和第二信息进行注册或者验证。

本实施例中，通过接收客户端分两次传输的第一信息和第二信息，可以避免第一信息和第二信息同步传输时引起的问题，可以提高基于声纹通讯的安全性。

图3是本发明另一实施例提出的基于声纹的通讯方法的流程示意图，该方法以应用在注册流程中为例。本实施例中，以客户端包括移动端，服务端包括声纹训练服务器，缓存和验证服务端为例。参见图3，该方法包括：

S31：移动端向声纹训练服务器发送语音数据。

其中，移动端可以向用户展示提示文本，例如提示文本是多个数字，并提示用户朗诵这些数字，用户朗诵这些数字后，移动端可以获取到用户朗诵的语音数据，之后可以将这些数字对应的语音数据发送给声纹训练服务器。

S32：声纹训练服务器对该语音数据进行训练，得到声纹特征信息，以及，随机生成MD5码。

其中，声纹训练服务器接收到语音数据后，可以先判断接收的语音数据是否与提示文本一致，如果一致，再根据语音数据训练得到声纹特征信息。根据语音数据训练得到声纹特征信息的具体内容可以参见已有技术。

声纹训练服务器在得到声纹特征信息后，可以随机生成MD5码。

S33：声纹服务器将MD5码与声纹特征信息对应存储到缓存(cache)内。

S34：声纹服务器将MD5码发送给移动端。

S33和S34的时序关系不限定。

S35：移动端将MD5码和用户账号信息发送给验证服务器。

其中，在注册时，移动端可以向用户展示注册界面，用户在该注册界面内可以输入用户账号信息，从而移动端可以获取到用户账号信息。

S36：验证服务器验证MD5码的有效性，并在MD5码有效时，根据MD5码在缓存内查找到对应的声纹特征信息。

其中，验证服务器接收到MD5码后，可以先验证该MD5码的有效性，例如，验证服务器在缓存内查找，判断缓存内是否存在接收的MD5码，如果存在，则确定有效，否则确定无效。

当有效后，可以根据MD5码查找到对应的声纹特征信息。

S37：验证服务器将接收的用户账号信息与查找到的声纹特征信息对应存储，得到注册结果。

验证服务器将用户账号信息与声纹特征信息对应存储后，可以得到注册结果。例如，在将用户账号信息与声纹特征信息成功对应存储后，得到注册成功，否则注册失败。

S38：验证服务器向移动端发送注册结果，例如，注册成功或者注册失败。

可以理解的是，本实施例中的声纹训练服务器，缓存，验证服务器可以位于同一个物理设备内，或者位于不同的物理设备内。

本实施例中，当移动端向服务端进行注册时，将用户账号信息与用于注册的语音信息分开传输，可以避免同步传输导致的不安全问题，从而可以提高注册的安全性。另外，标识信息是随机生成的，可以进一步提高安全性。

图4是本发明另一实施例提出的基于声纹的通讯方法的流程示意图，该方法以应用在注册流程中为例。本实施例中，以客户端包括移动端，服务端包括声纹验证服务器，缓存和验证服务端为例。参见图4，该方法包括：

S41：移动端向声纹验证服务器发送语音数据。

其中，移动端可以向用户展示验证界面，用户可以点击该验证界面内的录音按钮后，录入待验证的语音数据，移动端获取到用户朗诵的语音数据后，将该待验证的语音数据发送给声纹验证服务器。其中，用户录入的待验证的语音数据可以是根据提示文本或者在没有提示的情况下朗诵的。

S42：声纹验证服务器接收到待验证的语音数据，随机生成MD5码。

其中，如果该语音数据是根据提示文本获取的，声纹验证服务器接收到语音数据后，可以先判断接收的语音数据是否与提示文本一致，如果一致，再生成MD5码。

S43：声纹服务器将MD5码与待验证的语音数据对应存储到缓存(cache)内。

S44：声纹服务器将MD5码发送给移动端。

S43和S44的时序关系不限定。

S45：移动端将MD5码和用户账号信息发送给验证服务器。

其中，在验证时，移动端可以向用户展示验证界面，用户在该验证界面内可以输入用户账号信息，从而移动端可以获取到用户账号信息。

S46：验证服务器验证MD5码的有效性，并在MD5码有效时，根据MD5码在缓存内查找到对应的待验证的语音数据。

在MD5码有效后，可以查找到对应的待验证的语音数据。

S47：验证服务器根据接收的用户账号信息与查找到的待验证的语音数据，以及注册时得到的用户账号信息与声纹特征信息，得到验证结果。

当MD5码有效后，可以通过MD5码将用户账号信息与待验证的语音数据关联起来，之后，再根据接收的用户账号信息和注册时得到的用户账号信息与声纹特征信息的对应关系，可以查找到与接收的用户账号信息对应的声纹特征信息，之后再比对与接收的用户账号信息关联的待验证的语音数据和查找到的声纹特征信息，从而得到验证结果。例如，计算待验证的语音数据与声纹特征信息之间的相似度数值，当该相似度数值大于阈值时，确定验证成功，否则在验证失败。当然，可以理解的是，根据待验证的语音数据和声纹特征信息得到验证结果可以采用已有技术实现。

S47：验证服务器向移动端发送验证结果，例如，验证成功或者验证失败。

可以理解的是，本实施例中的声纹验证服务器，缓存，验证服务器可以位于同一个物理设备内，或者位于不同的物理设备内。

本实施例中，当移动端向服务端进行验证时，将用户账号信息与用于验证的语音信息分开传输，可以避免同步传输导致的不安全问题，从而可以提高验证的安全性。另外，标识信息是随机生成的，可以进一步提高安全性。

图5是本发明另一实施例提出的基于声纹的通讯装置的结构示意图，该装置位于客户端，例如，位于移动设备上。该装置50包括：

第一交互模块51，用于向服务端发送第一信息，并接收所述服务端发送的标识信息，所述标识信息是所述服务端接收到所述第一信息后生成的，所述第一信息是用户账号信息和语音信息中的一种；

用户账号信息例如用户名，手机号，邮箱名等。

第二交互模块52，用于向所述服务端发送第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。

图6是本发明另一实施例提出的基于声纹的通讯装置的结构示意图，该装置位于服务端。该装置60包括：

第一交互模块61，用于接收客户端发送的第一信息，生成标识信息，并将所述标识信息发送给所述客户端，所述第一信息是用户账号信息和语音信息中的一种；

可选的，所述第一交互模块61用于生成标识信息，包括：

随机生成标识信息。

其中，标识信息可以是随机生成的，具体可以是MD5码。

第二交互模块62，用于接收所述客户端发送的第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。

另一实施例中，参见图7，所述第一信息是语音信息，所述第二信息是用户账号信息，当在注册时，所述语音信息是作为训练样本的语音数据，所述训练样本用于声纹训练以得到声纹特征信息，所述装置60还包括：

训练模块71，用于在接收到所述作为训练样本的语音数据后，对所述作为训练样本的语音数据进行训练，得到声纹特征信息；

其中，接收到语音数据后，可以先判断接收的语音数据是否与提示文本一致，如果一致，再根据语音数据训练得到声纹特征信息。根据语音数据训练得到声纹特征信息的具体内容可以参见已有技术。

标识信息可以是随机生成的MD5码。

存储模块72，用于将所述标识信息与所述声纹特征信息进行对应存储；

例如，存储模块具体是缓存。

注册模块73，用于在接收到所述用户账号信息和所述标识信息后，在预先存储的数据中查找到与接收的标识信息对应的声纹特征信息，并将接收的用户账号信息与查找到的声纹特征信息对应存储，得到注册结果。

接收到MD5码后，可以先验证该MD5码的有效性，例如，注册模块在缓存内查找，判断缓存内是否存在接收的MD5码，如果存在，则确定有效，否则确定无效。

当MD5码有效后，可以将用户账号信息与声纹特征信息对应存储，从而得到注册结果。例如，在将用户账号信息与声纹特征信息成功对应存储后，得到注册成功，否则注册失败。

另一实施例中，参见图8，所述第一信息是语音信息，所述第二信息是用户账号信息，当在验证时，所述语音信息是待验证的语音数据，所述装置60还包括：

存储模块81，用于在接收到所述待验证的语音数据以及生成所述标识信息后，将所述标识信息与所述待验证的语音数据进行对应存储；

存储模块例如为缓存。

验证模块82，用于在接收到所述用户账号信息和所述标识信息后，在预先存储的数据中查找到与接收的标识信息对应的待验证的语音数据，并根据接收的用户账号信息和查找到的待验证的语音数据，以及注册时得到的用户账号信息与声纹特征信息，得到验证结果。

其中，接收到MD5码后，可以先验证该MD5码的有效性，例如，验证模块在缓存内查找，判断缓存内是否存在接收的MD5码，如果存在，则确定有效，否则确定无效。

当MD5码有效后，可以通过MD5码将用户账号信息与待验证的语音数据关联起来，之后，再根据接收的用户账号信息和注册时得到的用户账号信息与声纹特征信息的对应关系，可以查找到与接收的用户账号信息对应的声纹特征信息，之后再比对与接收的用户账号信息关联的待验证的语音数据和查找到的声纹特征信息，从而得到验证结果。例如，计算待验证的语音数据与声纹特征信息之间的相似度数值，当该相似度数值大于阈值时，确定验证成功，否则在验证失败。当然，可以理解的是，根据待验证的语音数据和声纹特征信息得到验证结果可以采用已有技术实现

图9是本发明另一实施例提出的基于声纹的通讯系统的结构示意图，该系统90包括：

客户端设备91和服务端设备92。其中，客户端设备91可以参见图5，服务端设备92可以参见图6-图8。

本实施例中，移动端与服务端分两次传输用户账号信息和语音信息，可以将用户账号信息与用于验证的语音信息分开传输，可以避免同步传输导致的不安全问题，从而可以提高验证的安全性。另外，标识信息是随机生成的，可以进一步提高安全性。

需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于声纹的通讯方法，其特征在于，包括：

向服务端发送第一信息，并接收所述服务端发送的标识信息，所述标识信息是所述服务端接收到所述第一信息后生成的，所述第一信息是用户账号信息和语音信息中的一种；

向所述服务端发送第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种；

所述第一信息是语音信息，所述第二信息是用户账号信息。

2.根据权利要求1所述的方法，其特征在于，所述标识信息是随机生成的。

3.一种基于声纹的通讯方法，其特征在于，包括：

接收客户端发送的第一信息，生成标识信息，并将所述标识信息发送给所述客户端，所述第一信息是用户账号信息和语音信息中的一种；

接收所述客户端发送的第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种；

所述第一信息是语音信息，所述第二信息是用户账号信息。

4.根据权利要求3所述的方法，其特征在于，当在注册时，所述语音信息是作为训练样本的语音数据，所述训练样本用于声纹训练以得到声纹特征信息，所述方法还包括：

在接收到所述作为训练样本的语音数据后，对所述作为训练样本的语音数据进行训练，得到声纹特征信息；

将所述标识信息与所述声纹特征信息进行对应存储；

在接收到所述用户账号信息和所述标识信息后，在预先存储的数据中查找到与接收的标识信息对应的声纹特征信息，并将接收的用户账号信息与查找到的声纹特征信息对应存储，得到注册结果。

5.根据权利要求3所述的方法，其特征在于，当在验证时，所述语音信息是待验证的语音数据，所述方法还包括：

在接收到所述待验证的语音数据以及生成所述标识信息后，将所述标识信息与所述待验证的语音数据进行对应存储；

在接收到所述用户账号信息和所述标识信息后，在预先存储的数据中查找到与接收的标识信息对应的待验证的语音数据，并根据接收的用户账号信息和查找到的待验证的语音数据，以及注册时得到的用户账号信息与声纹特征信息，得到验证结果。

6.根据权利要求3-5任一项所述的方法，其特征在于，所述生成标识信息，包括：

随机生成标识信息。

7.一种基于声纹的通讯装置，其特征在于，包括：

第一交互模块，用于向服务端发送第一信息，并接收所述服务端发送的标识信息，所述标识信息是所述服务端接收到所述第一信息后生成的，所述第一信息是用户账号信息和语音信息中的一种；

第二交互模块，用于向所述服务端发送第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种；

所述第一信息是语音信息，所述第二信息是用户账号信息。

8.一种基于声纹的通讯装置，其特征在于，包括：

第一交互模块，用于接收客户端发送的第一信息，生成标识信息，并将所述标识信息发送给所述客户端，所述第一信息是用户账号信息和语音信息中的一种；

第二交互模块，用于接收所述客户端发送的第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种；

所述第一信息是语音信息，所述第二信息是用户账号信息。

9.根据权利要求8所述的装置，其特征在于，当在注册时，所述语音信息是作为训练样本的语音数据，所述训练样本用于声纹训练以得到声纹特征信息，所述装置还包括：

训练模块，用于在接收到所述作为训练样本的语音数据后，对所述作为训练样本的语音数据进行训练，得到声纹特征信息；

存储模块，用于将所述标识信息与所述声纹特征信息进行对应存储；

注册模块，用于在接收到所述用户账号信息和所述标识信息后，在预先存储的数据中查找到与接收的标识信息对应的声纹特征信息，并将接收的用户账号信息与查找到的声纹特征信息对应存储，得到注册结果。

10.根据权利要求8所述的装置，其特征在于，当在验证时，所述语音信息是待验证的语音数据，所述装置还包括：

存储模块，用于在接收到所述待验证的语音数据以及生成所述标识信息后，将所述标识信息与所述待验证的语音数据进行对应存储；

验证模块，用于在接收到所述用户账号信息和所述标识信息后，在预先存储的数据中查找到与接收的标识信息对应的待验证的语音数据，并根据接收的用户账号信息和查找到的待验证的语音数据，以及注册时得到的用户账号信息与声纹特征信息，得到验证结果。

11.根据权利要求8-10任一项所述的装置，其特征在于，所述第一交互模块用于生成标识信息，包括：

随机生成标识信息。

12.一种基于声纹的通讯系统，其特征在于，包括：

如权利要求7所述的装置；以及，

如权利要求8-11任一项所述的装置。