CN103179090A - 基于声纹信息识别相邻终端的方法与系统 - Google Patents

基于声纹信息识别相邻终端的方法与系统 Download PDF

Info

Publication number
CN103179090A
CN103179090A CN201110433894XA CN201110433894A CN103179090A CN 103179090 A CN103179090 A CN 103179090A CN 201110433894X A CN201110433894X A CN 201110433894XA CN 201110433894 A CN201110433894 A CN 201110433894A CN 103179090 A CN103179090 A CN 103179090A
Authority
CN
China
Prior art keywords
client
identification
voice data
identification services
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110433894XA
Other languages
English (en)
Other versions
CN103179090B (zh
Inventor
谢晓军
王爱宝
陈康
邓君令
陶彩霞
吴旭
关迎晖
胡军军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201110433894.XA priority Critical patent/CN103179090B/zh
Publication of CN103179090A publication Critical patent/CN103179090A/zh
Application granted granted Critical
Publication of CN103179090B publication Critical patent/CN103179090B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种基于声纹信息识别相邻终端的方法与系统,其中,方法包括:服务器接收到主客户端发送的识别业务请求时,向所述主客户端返回业务序列号;主客户端与从客户端分别录制预设时长的背景音,并将录制的音频数据与所述业务序列号上传给所述服务器;所述服务器识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内,若多个音频数据声纹信息的相似度在预设范围内,则发送这多个音频数据的客户端所在的终端位置相邻;所述服务器生成识别业务结果消息并分别返回所述主客户端与所述从客户端。本发明实施例可以提高地理位置识别的精度与准确性,且无需在终端中设置RFID芯片,亦不受GPS信号覆盖限制。

Description

基于声纹信息识别相邻终端的方法与系统
技术领域
本发明涉及通信技术,尤其是一种基于声纹信息识别相邻终端的方法与系统。
背景技术
在相邻的终端之间进行通信、数据交换和资源共享是移动互联网应用的一个常见场景,因此,判断两个终端是否相邻是实现上述应用场景的基础。在获知两个终端相邻时,在这个相邻终端之间建立数据通道,再进行后续的数据通信,在两个相邻终端之间实现音频、视频等资源共享。
目前,通常采用近距离无线通信(Near Field Communication,以下简称:NFC)技术或者基于全球定位系统(Global Position System,以下简称:GPS)技术,来判断两个终端是否相邻。其中,NFC技术是一种非接触式识别和互联技术,基于无线射频识别(radio frequencyidentification devices,以下简称:RFID)和互联技术,可以在移动设备、消费类电子产品、个人计算机(Personal Computer,以下简称:PC)和智能控件工具间进行近距离无线通信,从而让消费者简单直观地交换信息、访问内容与服务。但是,NFC技术需要在终端中设置专用的RFID芯片设备,目前无法普及。
基于GPS技术两个终端是否相邻时,需要通过确定终端的地理位置来判断两个终端之间的距离,这就要求被判断的终端都处于室外等GPS卫星可见的场景下,在终端处于室内等GPS卫星不可见的场景中时,终端无法搜索到GPS卫星信号,便无法进行定位,从而无法该终端当前的地理位置。并且,基于GPS技术得到的两个终端的地理位置精度较差,无法准确获知两个终端是否在近距离范围内相邻。
发明内容
本发明实施例所要解决的技术问题是:提供一种基于声纹信息识别相邻终端的方法与系统,以提高地理位置识别的精度与准确性,且无需在终端中设置RFID芯片,亦不受GPS信号覆盖限制。
本发明实施例提供的一种基于声纹信息识别相邻终端的方法,包括:
服务器接收到主客户端发送的识别业务请求时,向所述主客户端返回唯一标识本次识别业务的业务序列号;
主客户端与从客户端分别录制预设时长的背景音,并将录制的音频数据与所述业务序列号上传给所述服务器;
所述服务器识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内,若多个音频数据声纹信息的相似度在预设范围内,则发送这多个音频数据的客户端所在的终端位置相邻;
所述服务器生成识别业务结果消息并分别返回所述主客户端与所述从客户端,所述识别业务结果消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识。
本发明实施例提供的一种基于声纹信息识别相邻终端的系统,包括客户端与服务器,所述客户端设置在终端中,包括发起一次识别业务请求的主客户端与响应并参与该识别业务请求的从客户端:
所述服务器,用于接收到主客户端发送的识别业务请求时,向所述主客户端返回唯一标识本次识别业务的业务序列号;接收主客户端与从客户端上传的音频数据与所述业务序列号,识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内,若多个音频数据声纹信息的相似度在预设范围内,则发送这多个音频数据的客户端所在的终端位置相邻;生成业务请求响应消息并分别返回所述主客户端与所述从客户端,所述业务请求响应消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识;
所述主客户端,用于接收所述服务器返回的所述业务序列号,录制预设时长的背景音,并将录制的音频数据与所述业务序列号上传给所述服务器;以及接收所述服务器返回的识别业务结果消息;
所述从客户端,用于接收用户输入的所述业务序列号,录制预设时长的背景音,并将录制的音频数据与所述业务序列号上传给所述服务器;以及接收所述服务器返回的识别业务结果消息。
基于本发明上述实施例提供的基于声纹信息识别相邻终端的方法与系统,服务器接收到主客户端发送的识别业务请求时,向主客户端返回唯一标识本次识别业务的业务序列号;主客户端与从客户端分别录制预设时长的背景音,并将录制的音频数据与业务序列号上传给服务器;服务器识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内,若两个音频数据声纹信息的相似度在预设范围内,则确认这两个音频数据的客户端所在的终端位置相邻,并分别向主客户端与从客户端返回识别业务结果消息。本发明实施例基于各终端中客户端录制的音频数据声纹信息来确定各终端是否相邻,无需在终端中设置特殊芯片,例如专用的RFID芯片设备,无需对终端进行硬件改造,易于实现,可以在不具备NFC功能的终端上实现;没有室内、室外等各种应用条件限制,例如,不受GPS卫星可见条件、GPS信号覆盖限制,可应用于各种环境下;可以准确获知两个终端是否在近距离范围内相邻,识别的精度与准确性较高。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于声纹信息识别相邻终端的方法一个实施例的流程图;
图2为本发明基于声纹信息识别相邻终端的方法另一个实施例的流程图;
图3为本发明基于声纹信息识别相邻终端的系统一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明基于声纹信息识别相邻终端的方法一个实施例的流程图。如图1所示,该实施例基于声纹信息识别相邻终端的方法包括:
101,服务器接收到主客户端发送的识别业务请求时,向该主客户端返回唯一标识本次识别业务的业务序列号。
102,主客户端与从客户端分别录制预设时长的背景音,并将录制的音频数据与业务序列号上传给服务器。
本发明实施例中,针对一次识别业务,主客户端具体有一个;从客户端具体可以是一个,也可以是多个,主客户端与每个从客户端分别位于一个终端中。主客户端与从客户端是相对于一次识别业务而言,在一次识别业务中,发起该识别业务请求的客户端称为主客户端,响应并参与该次识别业务的客户端称为从客户端。
103,服务器识别各客户端上传的、同一业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内。若两个音频数据声纹信息的相似度在预设范围内,则发送这两个音频数据的两个客户端所在的两个终端位置相邻。若多个音频数据声纹信息的相似度在预设范围内,则发送这多个音频数据的多个客户端所在的多个终端位置相邻。
104,服务器生成识别业务结果消息并分别返回主客户端与从客户端,该识别业务结果消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识。例如,用户标识138XXXXXXXX、138XXXXXXXY与138XXXXXXZZ对应的终端位置相邻,用户标识138YYYYYYYX对应的终端与其它终端位置不相邻。
基于本发明上述实施例提供的基于声纹信息识别相邻终端的方法,服务器接收到主客户端发送的识别业务请求时,向主客户端返回唯一标识本次识别业务的业务序列号;主客户端与从客户端分别录制预设时长的背景音,并将录制的音频数据与业务序列号上传给服务器;服务器识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内,若两个音频数据声纹信息的相似度在预设范围内,则确认这两个音频数据的客户端所在的终端位置相邻,并分别向主客户端与从客户端返回识别业务结果消息。本发明实施例基于各终端中客户端录制的音频数据声纹信息来确定各终端是否相邻,无需在终端中设置特殊芯片,例如专用的RFID芯片设备,无需对终端进行硬件改造,易于实现,可以在不具备NFC功能的终端上实现;没有室内、室外等各种应用条件限制,例如,不受GPS卫星可见条件、GPS信号覆盖限制,可应用于各种环境下;可以准确获知两个终端是否在近距离范围内相邻,识别的精度与准确性较高。
图2为本发明基于声纹信息识别相邻终端的方法另一个实施例的流程图。如图2所示,该实施例基于声纹信息识别相邻终端的方法包括:
201,主客户端启动后,显示主申请或待确认的交互提示信息。
202,主客户端接收到用户选择主申请交互提示信息发送的业务请求时,生成识别业务请求并发送给服务器,该识别业务请求中包括主客户端所在终端的终端用户标识。
203,服务器接收到主客户端发送的识别业务请求时,为本次识别业务分配唯一标识本次识别业务的业务序列号并返回主客户端。
204,从客户端启动后,显示主申请或待确认交互提示信息。
205,从客户端接收到用户选择待确认交互提示信息发送的业务请求时,显示用于提示用户输入业务序列号的提示信息。
206,从客户端接收到用户输入的业务序列号时生成识别业务确认消息并发送给服务器,该识别业务确认消息中包括从客户端所在终端的终端用户标识以及业务序列号。
示例性地,从客户端所在终端用户可以通过短消息、语音或者其它方式获知主客户端用户通知的业务序列号。
207,服务器接收到从客户端发送的识别业务确认消息后,分别向主客户端与从客户端发送本次识别业务启动的确认提示消息。
208,主客户端与从客户端接收到用户选择该确认提示消息后,分别开始录制预设时长的背景音,并将录制的音频数据与服务器分配的业务序列号上传给服务器。
209,服务器分别识别主客户端与从客户端上传的各音频数据是否有效。响应于各音频数据均有效,执行210的操作。否则,响应于各音频数据中的一个无效,执行207的操作,服务器分别向主客户端与从客户端发送本次识别业务启动的确认提示消息,重新执行207~209的操作。
其中,音频数据有效是指音频数据作为一个完整文件数据,其数据、参数未发生损坏,可以被正确读取、识别。
210,服务器获取主客户端与从客户端上传的、同一业务序列号对应的各音频数据的波型及声纹变化数据。
211,服务器分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。若两个音频数据声纹信息的相似度在预设范围内,则确认发送这两个音频数据的客户端所在的终端位置相邻。若多个音频数据声纹信息的相似度在预设范围内,则发送这多个音频数据的多个客户端所在的多个终端位置相邻。
其中的预设范围可以根据实际情况在服务器内预先设置,允许两个音频数据的波型及声纹变化数据存在一定的误差,即,允许一定的错误率。
示例性地,服务器可以采用包括但不限于概率统计方法、动态时间规整方法、矢量量化方法、或者隐马尔可夫模型方法等各种方法,分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。
采用概率统计方法比较两个音频数据的波型及声纹变化数据的相似度时,允许两个音频数据的波型及声纹变化数据存在一定的偏差,只要该偏差在预设偏差范围内,则认为两个音频数据相似度在预设范围内。
采用动态时间规整方法比较两个音频数据的波型及声纹变化数据的相似度时,允许两个音频数据录制的起始时刻与终止时刻存在一定时差,只要两个音频数据中有一定时段内的波型及声纹变化数据相同或相近,则认为两个音频数据相似度在预设范围内。
矢量量化方法是70年代后期发展起来的一种数据压缩技术,其将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化。采用矢量量化方法比较两个音频数据的波型及声纹变化数据的相似度时,可以将两个音频数据的波型及声纹变化数据组构成一个矢量,然后在矢量空间给以整体量化,然后比较量化结果。只要两个音频数据对应的量化结果误差在预设范围内,则认为两个音频数据相似度在预设范围内。
隐马尔可夫模型作为一种统计分析模型,创立于20世纪70年代。80年代得到了传播和发展,成为信号处理的一个重要方向,现已成功地用于语音识别,行为识别,文字识别以及故障诊断等领域。隐马尔可夫模型是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。所以,隐马尔可夫模型是一个双重随机过程----具有一定状态数的隐马尔可夫链和显示随机函数集。采用隐马尔可夫模型方法比较两个音频数据的波型及声纹变化数据的相似度时,可以将两个音频数据在各子时间段内的波型及声纹变化数据分别整合为两个观测向量序列,并比较该两个观测向量序列的差异是否位于预设范围内,若两个观测向量序列的差异是否位于预设范围内,则认为两个音频数据相似度在预设范围内。
212,服务器生成识别业务结果消息并分别返回主客户端与从客户端,识别业务结果消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识。
根据本发明基于声纹信息识别相邻终端的方法又一个实施例,图2所示实施例的207~208也可以选择性地替换为以下操作实现:
服务器接收到从客户端发送的识别业务确认消息后,分别向主客户端与从客户端发送本次识别业务启动的触发信令;主客户端与从客户端分别基于该触发信令启动,开始录制预设时长的背景音,并将录制的音频数据与服务器分配的业务序列号上传给服务器。
相应的,图2所示实施例的209中,响应于各音频数据中的一个无效,则返回重新开始执行服务器分别向主客户端与从客户端发送本次识别业务启动的触发信令的操作,以便主客户端与从客户端分别基于该触发信令启动,开始录制预设时长的背景音。
图3为本发明基于声纹信息识别相邻终端的系统一个实施例的结构示意图。该实施例基于声纹信息识别相邻终端的系统可用于实现本发明上述各基于声纹信息识别相邻终端的方法实施例的流程。如图3所示,其包括客户端与服务器,其中,客户端设置在终端中,包括发起一次识别业务请求的主客户端与响应并参与该识别业务请求的从客户端。针对一次识别业务,主客户端具体有一个;从客户端具体可以是一个,也可以是多个。
其中,服务器,用于接收到主客户端发送的识别业务请求时,向主客户端返回唯一标识本次识别业务的业务序列号;接收主客户端与从客户端上传的音频数据与业务序列号,识别同一业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内,若多个音频数据声纹信息的相似度在预设范围内,则发送这多个音频数据的客户端所在的终端位置相邻;生成业务请求响应消息并分别返回主客户端与从客户端,该业务请求响应消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识。
主客户端,用于接收服务器返回的业务序列号,录制预设时长的背景音,并将录制的音频数据与业务序列号上传给服务器;以及接收服务器返回的识别业务结果消息。
从客户端,用于接收用户输入的业务序列号,录制预设时长的背景音,并将录制的音频数据与业务序列号上传给服务器;以及接收服务器返回的识别业务结果消息。
基于本发明上述实施例提供的基于声纹信息识别相邻终端的系统,服务器接收到主客户端发送的识别业务请求时,向主客户端返回唯一标识本次识别业务的业务序列号;主客户端与从客户端分别录制预设时长的背景音,并将录制的音频数据与业务序列号上传给服务器;服务器识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内,若两个音频数据声纹信息的相似度在预设范围内,则确认这两个音频数据的客户端所在的终端位置相邻,并分别向主客户端与从客户端返回识别业务结果消息。本发明实施例基于各终端中客户端录制的音频数据声纹信息来确定各终端是否相邻,无需在终端中设置特殊芯片,例如专用的RFID芯片设备,无需对终端进行硬件改造,易于实现,可以在不具备NFC功能的终端上实现;没有室内、室外等各种应用条件限制,例如,不受GPS卫星可见条件、GPS信号覆盖限制,可应用于各种环境下;可以准确获知两个终端是否在近距离范围内相邻,识别的精度与准确性较高。
根据本发明基于声纹信息识别相邻终端的系统的一个示例而非限制,图3所示的实施例中,主客户端还可用于在启动后,显示主申请或待确认的交互提示信息;接收到用户选择主申请交互提示信息发送的业务请求时,生成识别业务请求并发送给服务器,该识别业务请求中包括主客户端所在终端的终端用户标识。
根据本发明基于声纹信息识别相邻终端的系统的另一个示例而非限制,图3所示的实施例中,从客户端还可用于在启动后,显示主申请或待确认交互提示信息;接收到用户选择待确认交互提示信息发送的业务请求时,显示用于提示用户输入业务序列号的提示信息;接收到用户输入的业务序列号时生成识别业务确认消息并发送给服务器,该识别业务确认消息中包括从客户端所在终端的终端用户标识以及业务序列号。
根据本发明系统的一个示例而非限制,与图2所示方法实施例相应的,服务器还可用于在接收到从客户端发送的识别业务确认消息后,分别向主客户端与从客户端发送本次识别业务启动的确认提示消息。相应的,主客户端与从客户端,具体在接收到用户选择该确认提示消息后,分别开始录制预设时长的背景音。
根据本发明系统的另一个示例而非限制,服务器还可用于在接收到从客户端发送的识别业务确认消息后,分别向主客户端与从客户端发送本次识别业务启动的触发信令。相应的,主客户端与从客户端,具体分别基于该触发信令启动,开始录制预设时长的背景音。
示例性地,本发明上述各实施例的系统中,服务器还可用于在接收主客户端与从客户端上传的音频数据与业务序列号后,分别识别主客户端与从客户端上传的各音频数据是否有效;响应于各音频数据均有效,开始执行识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内的操作。否则,响应于各音频数据中的一个无效,开始执行分别向主客户端与从客户端发送本次识别业务启动的确认提示消息或者触发信令的操作。
进一步示例性地,服务器识别业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内时,具体可以获取各音频数据的波型及声纹变化数据;并分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例基于各终端中客户端录制的音频数据声纹信息来确定各终端是否相邻,无需在终端中设置特殊芯片,例如专用的RFID芯片设备,无需对终端进行硬件改造,易于实现,可以在不具备NFC功能的终端上实现;没有室内、室外等各种应用条件限制,例如,不受GPS卫星可见条件、GPS信号覆盖限制,可应用于各种环境下;可以准确获知两个终端是否在近距离范围内相邻,识别的精度与准确性较高。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (16)

1.一种基于声纹信息识别相邻终端的方法,其特征在于,包括:
服务器接收到主客户端发送的识别业务请求时,向所述主客户端返回唯一标识本次识别业务的业务序列号;
主客户端与从客户端分别录制预设时长的背景音,并将录制的音频数据与所述业务序列号上传给所述服务器;
所述服务器识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内,若多个音频数据声纹信息的相似度在预设范围内,则发送这多个音频数据的客户端所在的终端位置相邻;
所述服务器生成识别业务结果消息并分别返回所述主客户端与所述从客户端,所述识别业务结果消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识。
2.根据权利要求1所述的方法,其特征在于,所述从客户端具体为一个或多个,每个从客户端位于一个终端中。
3.根据权利要求2所述的方法,其特征在于,服务器接收到主客户端发送的识别业务请求之前,还包括:
主客户端启动后,显示主申请或待确认的交互提示信息;
主客户端接收到用户选择主申请交互提示信息发送的业务请求时,生成所述识别业务请求并发送给所述服务器,所述识别业务请求中包括所述主客户端所在终端的终端用户标识。
4.根据权利要求2所述的方法,其特征在于,还包括:
从客户端启动后,显示主申请或待确认交互提示信息;
从客户端接收到用户选择待确认交互提示信息发送的业务请求时,显示用于提示用户输入业务序列号的提示信息;
从客户端接收到用户输入的业务序列号时生成所述识别业务确认消息并发送给所述服务器,所述识别业务确认消息中包括所述从客户端所在终端的终端用户标识以及所述业务序列号。
5.根据权利要求4所述的方法,其特征在于,主客户端与从客户端分别录制预设时长的背景音包括:
服务器接收到从客户端发送的识别业务确认消息后,分别向主客户端与从客户端发送本次识别业务启动的确认提示消息;主客户端与从客户端接收到用户选择该确认提示消息后,分别开始录制预设时长的背景音;或者
服务器接收到从客户端发送的识别业务确认消息后,分别向主客户端与从客户端发送本次识别业务启动的触发信令;主客户端与从客户端分别基于该触发信令启动,开始录制预设时长的背景音。
6.根据权利要求1至5任意一项所述的方法,其特征在于,将录制的音频数据与所述业务序列号上传给所述服务器之后,还包括:
所述服务器分别识别主客户端与从客户端上传的各音频数据是否有效;
响应于各音频数据均有效,执行所述服务器识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内的操作;
否则,响应于各音频数据中的一个无效,执行所述分别向主客户端与从客户端发送本次识别业务启动的确认提示消息的操作,或者执行所述分别向主客户端与从客户端发送本次识别业务启动的触发信令的操作。
7.根据权利要求6所述的方法,其特征在于,识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内包括:
获取各音频数据的波型及声纹变化数据;
分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。
8.根据权利要求7所述的方法,其特征在于,分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内包括:
采用概率统计方法、动态时间规整方法、矢量量化方法、或者隐马尔可夫模型方法,分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。
9.一种基于声纹信息识别相邻终端的系统,其特征在于,包括客户端与服务器,所述客户端设置在终端中,包括发起一次识别业务请求的主客户端与响应并参与该识别业务请求的从客户端:
所述服务器,用于接收到主客户端发送的识别业务请求时,向所述主客户端返回唯一标识本次识别业务的业务序列号;接收主客户端与从客户端上传的音频数据与所述业务序列号,识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内,若多个音频数据声纹信息的相似度在预设范围内,则发送这多个音频数据的客户端所在的终端位置相邻;生成业务请求响应消息并分别返回所述主客户端与所述从客户端,所述业务请求响应消息中包括主客户端与从客户端所在的终端位置相邻结果以及各终端用户标识;
所述主客户端,用于接收所述服务器返回的所述业务序列号,录制预设时长的背景音,并将录制的音频数据与所述业务序列号上传给所述服务器;以及接收所述服务器返回的识别业务结果消息;
所述从客户端,用于接收用户输入的所述业务序列号,录制预设时长的背景音,并将录制的音频数据与所述业务序列号上传给所述服务器;以及接收所述服务器返回的识别业务结果消息。
10.根据权利要求9所述的系统,其特征在于,所述从客户端具体为一个或多个,每个从客户端位于一个终端中。
11.根据权利要求10所述的系统,其特征在于,所述主客户端,还用于在启动后,显示主申请或待确认的交互提示信息;接收到用户选择主申请交互提示信息发送的业务请求时,生成所述识别业务请求并发送给所述服务器,所述识别业务请求中包括所述主客户端所在终端的终端用户标识。
12.根据权利要求10所述的系统,其特征在于,所述从客户端,还用于在启动后,显示主申请或待确认交互提示信息;接收到用户选择待确认交互提示信息发送的业务请求时,显示用于提示用户输入业务序列号的提示信息;接收到用户输入的业务序列号时生成所述识别业务确认消息并发送给所述服务器,所述识别业务确认消息中包括所述从客户端所在终端的终端用户标识以及所述业务序列号。
13.根据权利要求12所述的系统,其特征在于,所述服务器,还用于在接收到从客户端发送的识别业务确认消息后,分别向主客户端与从客户端发送本次识别业务启动的确认提示消息;
所述主客户端与从客户端,具体在接收到用户选择该确认提示消息后,分别开始录制预设时长的背景音。
14.根据权利要求12所述的系统,其特征在于,所述服务器,还用于在接收到从客户端发送的识别业务确认消息后,分别向主客户端与从客户端发送本次识别业务启动的触发信令;
所述主客户端与从客户端,具体分别基于该触发信令启动,开始录制预设时长的背景音。
15.根据权利要求13或14所述的系统,其特征在于,所述服务器,还用于在接收主客户端与从客户端上传的音频数据与所述业务序列号后,分别识别主客户端与从客户端上传的各音频数据是否有效;响应于各音频数据均有效,开始执行识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内的操作;
否则,响应于各音频数据中的一个无效,开始执行所述分别向主客户端与从客户端发送本次识别业务启动的确认提示消息或者触发信令的操作。
16.根据权利要求15所述的系统,其特征在于,所述服务器识别所述业务序列号对应的各音频数据声纹信息的相似度是否在预设范围内时,具体获取各音频数据的波型及声纹变化数据;并分别比较各音频数据中任意两个的波型及声纹变化数据的相似度是否在预设范围内。
CN201110433894.XA 2011-12-22 2011-12-22 基于声纹信息识别相邻终端的方法与系统 Active CN103179090B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110433894.XA CN103179090B (zh) 2011-12-22 2011-12-22 基于声纹信息识别相邻终端的方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110433894.XA CN103179090B (zh) 2011-12-22 2011-12-22 基于声纹信息识别相邻终端的方法与系统

Publications (2)

Publication Number Publication Date
CN103179090A true CN103179090A (zh) 2013-06-26
CN103179090B CN103179090B (zh) 2016-03-02

Family

ID=48638716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110433894.XA Active CN103179090B (zh) 2011-12-22 2011-12-22 基于声纹信息识别相邻终端的方法与系统

Country Status (1)

Country Link
CN (1) CN103179090B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104618339A (zh) * 2014-12-31 2015-05-13 上海宵诺网络科技有限公司 一种用户线下配对的方法以及移动终端、服务器
CN104767821A (zh) * 2015-04-20 2015-07-08 郑德豪 一种信息处理方法、云端服务器、电子终端
CN105868620A (zh) * 2016-03-23 2016-08-17 联想(北京)有限公司 一种信息处理方法及电子设备
CN106034026A (zh) * 2015-03-11 2016-10-19 广州杰赛科技股份有限公司 一种交互位置信任鉴权方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1779481A (zh) * 2004-11-26 2006-05-31 国际商业机器公司 位置识别的方法、移动终端和系统
US20090022130A1 (en) * 2005-01-05 2009-01-22 Xui Lan Yu Switching between two communicaiton modes in a WLAN
CN101673544A (zh) * 2009-10-10 2010-03-17 上海电虹软件有限公司 一种基于声纹识别和定位跟踪的交叉监控方法和系统
CN102110137A (zh) * 2011-01-04 2011-06-29 北京大学 一种多尺度矢量地图一致性检测方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1779481A (zh) * 2004-11-26 2006-05-31 国际商业机器公司 位置识别的方法、移动终端和系统
US20090022130A1 (en) * 2005-01-05 2009-01-22 Xui Lan Yu Switching between two communicaiton modes in a WLAN
CN101673544A (zh) * 2009-10-10 2010-03-17 上海电虹软件有限公司 一种基于声纹识别和定位跟踪的交叉监控方法和系统
CN102110137A (zh) * 2011-01-04 2011-06-29 北京大学 一种多尺度矢量地图一致性检测方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104618339A (zh) * 2014-12-31 2015-05-13 上海宵诺网络科技有限公司 一种用户线下配对的方法以及移动终端、服务器
CN106034026A (zh) * 2015-03-11 2016-10-19 广州杰赛科技股份有限公司 一种交互位置信任鉴权方法
CN104767821A (zh) * 2015-04-20 2015-07-08 郑德豪 一种信息处理方法、云端服务器、电子终端
CN104767821B (zh) * 2015-04-20 2018-05-29 郑德豪 一种信息处理方法、云端服务器、电子终端
CN105868620A (zh) * 2016-03-23 2016-08-17 联想(北京)有限公司 一种信息处理方法及电子设备
CN105868620B (zh) * 2016-03-23 2019-02-05 联想(北京)有限公司 一种信息处理方法及电子设备

Also Published As

Publication number Publication date
CN103179090B (zh) 2016-03-02

Similar Documents

Publication Publication Date Title
US11282520B2 (en) Method, apparatus and device for interaction of intelligent voice devices, and storage medium
CN111433843B (zh) 语义音频表示的无监督学习
CN102842306B (zh) 语音控制方法及装置、语音响应方法及装置
US11527251B1 (en) Voice message capturing system
CN103247291A (zh) 一种语音识别设备的更新方法、装置及系统
CN105206261A (zh) 实体名称识别
CN103903611A (zh) 一种语音信息的识别方法和设备
CN105340006A (zh) 用于向语音操作功能分配关键字模型的方法和装置
US20150317998A1 (en) Method and apparatus for recognizing speech, and method and apparatus for generating noise-speech recognition model
CN104038630A (zh) 语音处理方法及装置
CN103179090A (zh) 基于声纹信息识别相邻终端的方法与系统
CN114255609B (zh) 泊车引导方法、电子设备及存储介质
CN102426015A (zh) 一种导航系统兴趣点的搜索方法及位置服务终端
CN107560617A (zh) 一种基于广告机的导航方法、存储介质以及广告机
CN103327021A (zh) 一种多设备互动方法及相关设备、系统
CN103220425B (zh) 一种基于多个移动终端的录音方法及系统
CN112017663B (zh) 一种语音泛化方法、装置及计算机存储介质
CN107396308A (zh) 一种找回移动终端的方法、存储设备及移动终端
CN112562688A (zh) 语音转写方法、装置、录音笔和存储介质
CN105025436A (zh) 一种信息获取方法及移动终端
US20230325486A1 (en) Authentication information transmission device using inaudible sound wave communication
CN101426020A (zh) 上载地图博客的方法、系统及装置
JP6944920B2 (ja) スマートインタラクティブの処理方法、装置、設備及びコンピュータ記憶媒体
CN113407025A (zh) 一种信息显示方法和系统
CN103262495A (zh) 在网络上传送多媒体数据的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant