CN103179090A

CN103179090A - 基于声纹信息识别相邻终端的方法与系统

Info

Publication number: CN103179090A
Application number: CN201110433894XA
Authority: CN
Inventors: 谢晓军; 王爱宝; 陈康; 邓君令; 陶彩霞; 吴旭; 关迎晖; 胡军军
Original assignee: China Telecom Corp Ltd
Current assignee: China Telecom Corp Ltd
Priority date: 2011-12-22
Filing date: 2011-12-22
Publication date: 2013-06-26
Anticipated expiration: 2031-12-22
Also published as: CN103179090B

Abstract

本发明实施例公开了一种基于声纹信息识别相邻终端的方法与系统，其中，方法包括：服务器接收到主客户端发送的识别业务请求时，向所述主客户端返回业务序列号；主客户端与从客户端分别录制预设时长的背景音，并将录制的音频数据与所述业务序列号上传给所述服务器；所述服务器识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内，若多个音频数据声纹信息的相似度在预设范围内，则发送这多个音频数据的客户端所在的终端位置相邻；所述服务器生成识别业务结果消息并分别返回所述主客户端与所述从客户端。本发明实施例可以提高地理位置识别的精度与准确性，且无需在终端中设置RFID芯片，亦不受GPS信号覆盖限制。

Description

基于声纹信息识别相邻终端的方法与系统

技术领域

本发明涉及通信技术，尤其是一种基于声纹信息识别相邻终端的方法与系统。

背景技术

在相邻的终端之间进行通信、数据交换和资源共享是移动互联网应用的一个常见场景，因此，判断两个终端是否相邻是实现上述应用场景的基础。在获知两个终端相邻时，在这个相邻终端之间建立数据通道，再进行后续的数据通信，在两个相邻终端之间实现音频、视频等资源共享。

目前，通常采用近距离无线通信(Near Field Communication，以下简称：NFC)技术或者基于全球定位系统(Global Position System，以下简称：GPS)技术，来判断两个终端是否相邻。其中，NFC技术是一种非接触式识别和互联技术，基于无线射频识别(radio frequencyidentification devices，以下简称：RFID)和互联技术，可以在移动设备、消费类电子产品、个人计算机(Personal Computer，以下简称：PC)和智能控件工具间进行近距离无线通信，从而让消费者简单直观地交换信息、访问内容与服务。但是，NFC技术需要在终端中设置专用的RFID芯片设备，目前无法普及。

基于GPS技术两个终端是否相邻时，需要通过确定终端的地理位置来判断两个终端之间的距离，这就要求被判断的终端都处于室外等GPS卫星可见的场景下，在终端处于室内等GPS卫星不可见的场景中时，终端无法搜索到GPS卫星信号，便无法进行定位，从而无法该终端当前的地理位置。并且，基于GPS技术得到的两个终端的地理位置精度较差，无法准确获知两个终端是否在近距离范围内相邻。

发明内容

本发明实施例所要解决的技术问题是：提供一种基于声纹信息识别相邻终端的方法与系统，以提高地理位置识别的精度与准确性，且无需在终端中设置RFID芯片，亦不受GPS信号覆盖限制。

本发明实施例提供的一种基于声纹信息识别相邻终端的方法，包括：

服务器接收到主客户端发送的识别业务请求时，向所述主客户端返回唯一标识本次识别业务的业务序列号；

主客户端与从客户端分别录制预设时长的背景音，并将录制的音频数据与所述业务序列号上传给所述服务器；

所述服务器识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内，若多个音频数据声纹信息的相似度在预设范围内，则发送这多个音频数据的客户端所在的终端位置相邻；

所述服务器生成识别业务结果消息并分别返回所述主客户端与所述从客户端，所述识别业务结果消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识。

本发明实施例提供的一种基于声纹信息识别相邻终端的系统，包括客户端与服务器，所述客户端设置在终端中，包括发起一次识别业务请求的主客户端与响应并参与该识别业务请求的从客户端：

所述服务器，用于接收到主客户端发送的识别业务请求时，向所述主客户端返回唯一标识本次识别业务的业务序列号；接收主客户端与从客户端上传的音频数据与所述业务序列号，识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内，若多个音频数据声纹信息的相似度在预设范围内，则发送这多个音频数据的客户端所在的终端位置相邻；生成业务请求响应消息并分别返回所述主客户端与所述从客户端，所述业务请求响应消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识；

所述主客户端，用于接收所述服务器返回的所述业务序列号，录制预设时长的背景音，并将录制的音频数据与所述业务序列号上传给所述服务器；以及接收所述服务器返回的识别业务结果消息；

所述从客户端，用于接收用户输入的所述业务序列号，录制预设时长的背景音，并将录制的音频数据与所述业务序列号上传给所述服务器；以及接收所述服务器返回的识别业务结果消息。

基于本发明上述实施例提供的基于声纹信息识别相邻终端的方法与系统，服务器接收到主客户端发送的识别业务请求时，向主客户端返回唯一标识本次识别业务的业务序列号；主客户端与从客户端分别录制预设时长的背景音，并将录制的音频数据与业务序列号上传给服务器；服务器识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内，若两个音频数据声纹信息的相似度在预设范围内，则确认这两个音频数据的客户端所在的终端位置相邻，并分别向主客户端与从客户端返回识别业务结果消息。本发明实施例基于各终端中客户端录制的音频数据声纹信息来确定各终端是否相邻，无需在终端中设置特殊芯片，例如专用的RFID芯片设备，无需对终端进行硬件改造，易于实现，可以在不具备NFC功能的终端上实现；没有室内、室外等各种应用条件限制，例如，不受GPS卫星可见条件、GPS信号覆盖限制，可应用于各种环境下；可以准确获知两个终端是否在近距离范围内相邻，识别的精度与准确性较高。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明基于声纹信息识别相邻终端的方法一个实施例的流程图；

图2为本发明基于声纹信息识别相邻终端的方法另一个实施例的流程图；

图3为本发明基于声纹信息识别相邻终端的系统一个实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明基于声纹信息识别相邻终端的方法一个实施例的流程图。如图1所示，该实施例基于声纹信息识别相邻终端的方法包括：

101，服务器接收到主客户端发送的识别业务请求时，向该主客户端返回唯一标识本次识别业务的业务序列号。

102，主客户端与从客户端分别录制预设时长的背景音，并将录制的音频数据与业务序列号上传给服务器。

本发明实施例中，针对一次识别业务，主客户端具体有一个；从客户端具体可以是一个，也可以是多个，主客户端与每个从客户端分别位于一个终端中。主客户端与从客户端是相对于一次识别业务而言，在一次识别业务中，发起该识别业务请求的客户端称为主客户端，响应并参与该次识别业务的客户端称为从客户端。

103，服务器识别各客户端上传的、同一业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内。若两个音频数据声纹信息的相似度在预设范围内，则发送这两个音频数据的两个客户端所在的两个终端位置相邻。若多个音频数据声纹信息的相似度在预设范围内，则发送这多个音频数据的多个客户端所在的多个终端位置相邻。

104，服务器生成识别业务结果消息并分别返回主客户端与从客户端，该识别业务结果消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识。例如，用户标识138XXXXXXXX、138XXXXXXXY与138XXXXXXZZ对应的终端位置相邻，用户标识138YYYYYYYX对应的终端与其它终端位置不相邻。

基于本发明上述实施例提供的基于声纹信息识别相邻终端的方法，服务器接收到主客户端发送的识别业务请求时，向主客户端返回唯一标识本次识别业务的业务序列号；主客户端与从客户端分别录制预设时长的背景音，并将录制的音频数据与业务序列号上传给服务器；服务器识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内，若两个音频数据声纹信息的相似度在预设范围内，则确认这两个音频数据的客户端所在的终端位置相邻，并分别向主客户端与从客户端返回识别业务结果消息。本发明实施例基于各终端中客户端录制的音频数据声纹信息来确定各终端是否相邻，无需在终端中设置特殊芯片，例如专用的RFID芯片设备，无需对终端进行硬件改造，易于实现，可以在不具备NFC功能的终端上实现；没有室内、室外等各种应用条件限制，例如，不受GPS卫星可见条件、GPS信号覆盖限制，可应用于各种环境下；可以准确获知两个终端是否在近距离范围内相邻，识别的精度与准确性较高。

图2为本发明基于声纹信息识别相邻终端的方法另一个实施例的流程图。如图2所示，该实施例基于声纹信息识别相邻终端的方法包括：

201，主客户端启动后，显示主申请或待确认的交互提示信息。

202，主客户端接收到用户选择主申请交互提示信息发送的业务请求时，生成识别业务请求并发送给服务器，该识别业务请求中包括主客户端所在终端的终端用户标识。

203，服务器接收到主客户端发送的识别业务请求时，为本次识别业务分配唯一标识本次识别业务的业务序列号并返回主客户端。

204，从客户端启动后，显示主申请或待确认交互提示信息。

205，从客户端接收到用户选择待确认交互提示信息发送的业务请求时，显示用于提示用户输入业务序列号的提示信息。

206，从客户端接收到用户输入的业务序列号时生成识别业务确认消息并发送给服务器，该识别业务确认消息中包括从客户端所在终端的终端用户标识以及业务序列号。

示例性地，从客户端所在终端用户可以通过短消息、语音或者其它方式获知主客户端用户通知的业务序列号。

207，服务器接收到从客户端发送的识别业务确认消息后，分别向主客户端与从客户端发送本次识别业务启动的确认提示消息。

208，主客户端与从客户端接收到用户选择该确认提示消息后，分别开始录制预设时长的背景音，并将录制的音频数据与服务器分配的业务序列号上传给服务器。

209，服务器分别识别主客户端与从客户端上传的各音频数据是否有效。响应于各音频数据均有效，执行210的操作。否则，响应于各音频数据中的一个无效，执行207的操作，服务器分别向主客户端与从客户端发送本次识别业务启动的确认提示消息，重新执行207～209的操作。

其中，音频数据有效是指音频数据作为一个完整文件数据，其数据、参数未发生损坏，可以被正确读取、识别。

210，服务器获取主客户端与从客户端上传的、同一业务序列号对应的各音频数据的波型及声纹变化数据。

211，服务器分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。若两个音频数据声纹信息的相似度在预设范围内，则确认发送这两个音频数据的客户端所在的终端位置相邻。若多个音频数据声纹信息的相似度在预设范围内，则发送这多个音频数据的多个客户端所在的多个终端位置相邻。

其中的预设范围可以根据实际情况在服务器内预先设置，允许两个音频数据的波型及声纹变化数据存在一定的误差，即，允许一定的错误率。

示例性地，服务器可以采用包括但不限于概率统计方法、动态时间规整方法、矢量量化方法、或者隐马尔可夫模型方法等各种方法，分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。

采用概率统计方法比较两个音频数据的波型及声纹变化数据的相似度时，允许两个音频数据的波型及声纹变化数据存在一定的偏差，只要该偏差在预设偏差范围内，则认为两个音频数据相似度在预设范围内。

采用动态时间规整方法比较两个音频数据的波型及声纹变化数据的相似度时，允许两个音频数据录制的起始时刻与终止时刻存在一定时差，只要两个音频数据中有一定时段内的波型及声纹变化数据相同或相近，则认为两个音频数据相似度在预设范围内。

矢量量化方法是70年代后期发展起来的一种数据压缩技术，其将若干个标量数据组构成一个矢量，然后在矢量空间给以整体量化。采用矢量量化方法比较两个音频数据的波型及声纹变化数据的相似度时，可以将两个音频数据的波型及声纹变化数据组构成一个矢量，然后在矢量空间给以整体量化，然后比较量化结果。只要两个音频数据对应的量化结果误差在预设范围内，则认为两个音频数据相似度在预设范围内。

隐马尔可夫模型作为一种统计分析模型，创立于20世纪70年代。80年代得到了传播和发展，成为信号处理的一个重要方向，现已成功地用于语音识别，行为识别，文字识别以及故障诊断等领域。隐马尔可夫模型是马尔可夫链的一种，它的状态不能直接观察到，但能通过观测向量序列观察到，每个观测向量都是通过某些概率密度分布表现为各种状态，每一个观测向量是由一个具有相应概率密度分布的状态序列产生。所以，隐马尔可夫模型是一个双重随机过程----具有一定状态数的隐马尔可夫链和显示随机函数集。采用隐马尔可夫模型方法比较两个音频数据的波型及声纹变化数据的相似度时，可以将两个音频数据在各子时间段内的波型及声纹变化数据分别整合为两个观测向量序列，并比较该两个观测向量序列的差异是否位于预设范围内，若两个观测向量序列的差异是否位于预设范围内，则认为两个音频数据相似度在预设范围内。

212，服务器生成识别业务结果消息并分别返回主客户端与从客户端，识别业务结果消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识。

根据本发明基于声纹信息识别相邻终端的方法又一个实施例，图2所示实施例的207～208也可以选择性地替换为以下操作实现：

服务器接收到从客户端发送的识别业务确认消息后，分别向主客户端与从客户端发送本次识别业务启动的触发信令；主客户端与从客户端分别基于该触发信令启动，开始录制预设时长的背景音，并将录制的音频数据与服务器分配的业务序列号上传给服务器。

相应的，图2所示实施例的209中，响应于各音频数据中的一个无效，则返回重新开始执行服务器分别向主客户端与从客户端发送本次识别业务启动的触发信令的操作，以便主客户端与从客户端分别基于该触发信令启动，开始录制预设时长的背景音。

图3为本发明基于声纹信息识别相邻终端的系统一个实施例的结构示意图。该实施例基于声纹信息识别相邻终端的系统可用于实现本发明上述各基于声纹信息识别相邻终端的方法实施例的流程。如图3所示，其包括客户端与服务器，其中，客户端设置在终端中，包括发起一次识别业务请求的主客户端与响应并参与该识别业务请求的从客户端。针对一次识别业务，主客户端具体有一个；从客户端具体可以是一个，也可以是多个。

其中，服务器，用于接收到主客户端发送的识别业务请求时，向主客户端返回唯一标识本次识别业务的业务序列号；接收主客户端与从客户端上传的音频数据与业务序列号，识别同一业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内，若多个音频数据声纹信息的相似度在预设范围内，则发送这多个音频数据的客户端所在的终端位置相邻；生成业务请求响应消息并分别返回主客户端与从客户端，该业务请求响应消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识。

主客户端，用于接收服务器返回的业务序列号，录制预设时长的背景音，并将录制的音频数据与业务序列号上传给服务器；以及接收服务器返回的识别业务结果消息。

从客户端，用于接收用户输入的业务序列号，录制预设时长的背景音，并将录制的音频数据与业务序列号上传给服务器；以及接收服务器返回的识别业务结果消息。

基于本发明上述实施例提供的基于声纹信息识别相邻终端的系统，服务器接收到主客户端发送的识别业务请求时，向主客户端返回唯一标识本次识别业务的业务序列号；主客户端与从客户端分别录制预设时长的背景音，并将录制的音频数据与业务序列号上传给服务器；服务器识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内，若两个音频数据声纹信息的相似度在预设范围内，则确认这两个音频数据的客户端所在的终端位置相邻，并分别向主客户端与从客户端返回识别业务结果消息。本发明实施例基于各终端中客户端录制的音频数据声纹信息来确定各终端是否相邻，无需在终端中设置特殊芯片，例如专用的RFID芯片设备，无需对终端进行硬件改造，易于实现，可以在不具备NFC功能的终端上实现；没有室内、室外等各种应用条件限制，例如，不受GPS卫星可见条件、GPS信号覆盖限制，可应用于各种环境下；可以准确获知两个终端是否在近距离范围内相邻，识别的精度与准确性较高。

根据本发明基于声纹信息识别相邻终端的系统的一个示例而非限制，图3所示的实施例中，主客户端还可用于在启动后，显示主申请或待确认的交互提示信息；接收到用户选择主申请交互提示信息发送的业务请求时，生成识别业务请求并发送给服务器，该识别业务请求中包括主客户端所在终端的终端用户标识。

根据本发明基于声纹信息识别相邻终端的系统的另一个示例而非限制，图3所示的实施例中，从客户端还可用于在启动后，显示主申请或待确认交互提示信息；接收到用户选择待确认交互提示信息发送的业务请求时，显示用于提示用户输入业务序列号的提示信息；接收到用户输入的业务序列号时生成识别业务确认消息并发送给服务器，该识别业务确认消息中包括从客户端所在终端的终端用户标识以及业务序列号。

根据本发明系统的一个示例而非限制，与图2所示方法实施例相应的，服务器还可用于在接收到从客户端发送的识别业务确认消息后，分别向主客户端与从客户端发送本次识别业务启动的确认提示消息。相应的，主客户端与从客户端，具体在接收到用户选择该确认提示消息后，分别开始录制预设时长的背景音。

根据本发明系统的另一个示例而非限制，服务器还可用于在接收到从客户端发送的识别业务确认消息后，分别向主客户端与从客户端发送本次识别业务启动的触发信令。相应的，主客户端与从客户端，具体分别基于该触发信令启动，开始录制预设时长的背景音。

示例性地，本发明上述各实施例的系统中，服务器还可用于在接收主客户端与从客户端上传的音频数据与业务序列号后，分别识别主客户端与从客户端上传的各音频数据是否有效；响应于各音频数据均有效，开始执行识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内的操作。否则，响应于各音频数据中的一个无效，开始执行分别向主客户端与从客户端发送本次识别业务启动的确认提示消息或者触发信令的操作。

进一步示例性地，服务器识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内时，具体可以获取各音频数据的波型及声纹变化数据；并分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例基于各终端中客户端录制的音频数据声纹信息来确定各终端是否相邻，无需在终端中设置特殊芯片，例如专用的RFID芯片设备，无需对终端进行硬件改造，易于实现，可以在不具备NFC功能的终端上实现；没有室内、室外等各种应用条件限制，例如，不受GPS卫星可见条件、GPS信号覆盖限制，可应用于各种环境下；可以准确获知两个终端是否在近距离范围内相邻，识别的精度与准确性较高。

本发明的描述是为了示例和描述起见而给出的，而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用，并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims

1.一种基于声纹信息识别相邻终端的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述从客户端具体为一个或多个，每个从客户端位于一个终端中。

3.根据权利要求2所述的方法，其特征在于，服务器接收到主客户端发送的识别业务请求之前，还包括：

主客户端启动后，显示主申请或待确认的交互提示信息；

主客户端接收到用户选择主申请交互提示信息发送的业务请求时，生成所述识别业务请求并发送给所述服务器，所述识别业务请求中包括所述主客户端所在终端的终端用户标识。

4.根据权利要求2所述的方法，其特征在于，还包括：

从客户端启动后，显示主申请或待确认交互提示信息；

从客户端接收到用户选择待确认交互提示信息发送的业务请求时，显示用于提示用户输入业务序列号的提示信息；

从客户端接收到用户输入的业务序列号时生成所述识别业务确认消息并发送给所述服务器，所述识别业务确认消息中包括所述从客户端所在终端的终端用户标识以及所述业务序列号。

5.根据权利要求4所述的方法，其特征在于，主客户端与从客户端分别录制预设时长的背景音包括：

服务器接收到从客户端发送的识别业务确认消息后，分别向主客户端与从客户端发送本次识别业务启动的确认提示消息；主客户端与从客户端接收到用户选择该确认提示消息后，分别开始录制预设时长的背景音；或者

服务器接收到从客户端发送的识别业务确认消息后，分别向主客户端与从客户端发送本次识别业务启动的触发信令；主客户端与从客户端分别基于该触发信令启动，开始录制预设时长的背景音。

6.根据权利要求1至5任意一项所述的方法，其特征在于，将录制的音频数据与所述业务序列号上传给所述服务器之后，还包括：

所述服务器分别识别主客户端与从客户端上传的各音频数据是否有效；

响应于各音频数据均有效，执行所述服务器识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内的操作；

否则，响应于各音频数据中的一个无效，执行所述分别向主客户端与从客户端发送本次识别业务启动的确认提示消息的操作，或者执行所述分别向主客户端与从客户端发送本次识别业务启动的触发信令的操作。

7.根据权利要求6所述的方法，其特征在于，识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内包括：

获取各音频数据的波型及声纹变化数据；

分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。

8.根据权利要求7所述的方法，其特征在于，分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内包括：

采用概率统计方法、动态时间规整方法、矢量量化方法、或者隐马尔可夫模型方法，分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。

9.一种基于声纹信息识别相邻终端的系统，其特征在于，包括客户端与服务器，所述客户端设置在终端中，包括发起一次识别业务请求的主客户端与响应并参与该识别业务请求的从客户端：

10.根据权利要求9所述的系统，其特征在于，所述从客户端具体为一个或多个，每个从客户端位于一个终端中。

11.根据权利要求10所述的系统，其特征在于，所述主客户端，还用于在启动后，显示主申请或待确认的交互提示信息；接收到用户选择主申请交互提示信息发送的业务请求时，生成所述识别业务请求并发送给所述服务器，所述识别业务请求中包括所述主客户端所在终端的终端用户标识。

12.根据权利要求10所述的系统，其特征在于，所述从客户端，还用于在启动后，显示主申请或待确认交互提示信息；接收到用户选择待确认交互提示信息发送的业务请求时，显示用于提示用户输入业务序列号的提示信息；接收到用户输入的业务序列号时生成所述识别业务确认消息并发送给所述服务器，所述识别业务确认消息中包括所述从客户端所在终端的终端用户标识以及所述业务序列号。

13.根据权利要求12所述的系统，其特征在于，所述服务器，还用于在接收到从客户端发送的识别业务确认消息后，分别向主客户端与从客户端发送本次识别业务启动的确认提示消息；

所述主客户端与从客户端，具体在接收到用户选择该确认提示消息后，分别开始录制预设时长的背景音。

14.根据权利要求12所述的系统，其特征在于，所述服务器，还用于在接收到从客户端发送的识别业务确认消息后，分别向主客户端与从客户端发送本次识别业务启动的触发信令；

所述主客户端与从客户端，具体分别基于该触发信令启动，开始录制预设时长的背景音。

15.根据权利要求13或14所述的系统，其特征在于，所述服务器，还用于在接收主客户端与从客户端上传的音频数据与所述业务序列号后，分别识别主客户端与从客户端上传的各音频数据是否有效；响应于各音频数据均有效，开始执行识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内的操作；

否则，响应于各音频数据中的一个无效，开始执行所述分别向主客户端与从客户端发送本次识别业务启动的确认提示消息或者触发信令的操作。

16.根据权利要求15所述的系统，其特征在于，所述服务器识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内时，具体获取各音频数据的波型及声纹变化数据；并分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。