CN105119953B - App绑定音视频处理终端的方法及装置 - Google Patents
App绑定音视频处理终端的方法及装置 Download PDFInfo
- Publication number
- CN105119953B CN105119953B CN201510398784.2A CN201510398784A CN105119953B CN 105119953 B CN105119953 B CN 105119953B CN 201510398784 A CN201510398784 A CN 201510398784A CN 105119953 B CN105119953 B CN 105119953B
- Authority
- CN
- China
- Prior art keywords
- video processing
- processing terminal
- audio
- target
- mobile terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims abstract description 165
- 230000027455 binding Effects 0.000 title claims abstract description 65
- 238000009739 binding Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000001755 vocal effect Effects 0.000 claims abstract description 49
- 230000011218 segmentation Effects 0.000 claims description 23
- 238000001514 detection method Methods 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000003993 interaction Effects 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 35
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 210000000515 tooth Anatomy 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/52—Network services specially adapted for the location of the user terminal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/09—Mapping addresses
- H04L61/25—Mapping addresses of the same type
- H04L61/2503—Translation of Internet protocol [IP] addresses
- H04L61/255—Maintenance or indexing of mapping tables
- H04L61/2553—Binding renewal aspects, e.g. using keep-alive messages
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了APP绑定音视频处理终端的方法及装置,信息交互领域。本发明提供的APP绑定音视频处理终端的方法,采用基于声纹匹配的绑定方式,其通过在用户使用音视频处理终端中发声时,先通过声纹采集设备采集用户的声纹信息,再依据该声纹信息在数据库中检索目标代码,其中,目标代码和对应的声纹信息是预先存储在数据库中的,如果检索出目标代码,则可以将目标代码所对应的目标移动终端与目标音视频处理终端进行绑定,从而完成了移动终端与音视频处理终端的绑定。在绑定的时候不再需要用户进行复杂的操作,只需要正常说话或者演唱即可,因此,本申请所提供的绑定方法能够提高绑定效率、减少绑定时间。
Description
技术领域
本发明涉及信息交互领域,具体而言,涉及APP绑定音视频处理终端的方法及装置。
背景技术
随着生活水平的提高,人们在休息的时候会在指定的娱乐场所组织大量的娱乐活动,如桌游、打球、K歌等,这也是第三产业蓬勃发展的主要原因。为了满足娱乐活动的需求,娱乐场所的数量也随之增加,并且,越来越多的娱乐场所为了提高服务,或者说提高用户体验,而在娱乐场所中增加了大量的电子设备。
如,娱乐场所便可以通过增加电子设备来提高使用者的感受度。娱乐场所中的电子设备有很多,主要的电子设备便是触屏(能够一定程度上提高用户感受度和操作效率的设备)。触屏能够与音视频处理终端直接连接,用户通过操作触屏,向音视频处理终端下达指令,进而选择相应的歌曲、影视等音视频进行播放或加工处理,并且还可以达到其他的功能,如建立播放序列表、切歌等。使用之前,娱乐场所的所有者会在包房中的指定位置设置一个触屏(触屏是固定在地面上或悬挂在墙面上的),并且将触屏通过固定线缆的方式与音视频处理终端连接上。用户通过触屏向音视频处理终端下达操作指令,以选择将要播放的歌曲等,音视频处理终端在接收到操作指令后则会向后台处理器(软件系统)下达相应的控制指令,最终,后台处理器会根据接收到的控制指令来使用播放系统进行播放。
由于触屏是始终位于娱乐场所中一个固定位置的(娱乐场所的所有者会将触屏固定在地面上或墙面上),用户想操作触屏的时候需要移动到触屏所在的位置才能进行操作,这很不方便。由此,娱乐场所的所有者通过移动终端与音视频处理终端绑定的方式,使得用户可以在移动终端的APP上进行点歌等操作,以使移动终端上的APP替代触屏。但,在使用移动终端对音视频处理终端进行操控前需要对二者(移动终端和音视频处理终端)进行绑定,然而由于绑定的过程很繁琐,耗时长,而导致使用移动终端对音视频处理终端进行操控的不方便。
发明内容
有鉴于此,本发明实施例的目的在于提供APP绑定音视频处理终端的方法,以提高APP与音视频处理终端的绑定的便捷性。
第一方面,本发明实施例提供了APP绑定音视频处理终端的方法,其特征在于,包括:
获取目标音视频处理终端声纹采集设备所采集到的目标声纹信息;
在数据库中检索与目标声纹信息相对应的目标代码;
若检索出目标代码,则将目标音视频处理终端与目标代码所对应的目标移动终端进行绑定。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,还包括:
计算目标移动终端与目标音视频处理终端的第一参考距离;
判断第一参考距离是否大于预设的距离阈值;
若是,则解除绑定。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,检索步骤包括:
若检索到所述目标声纹信息与多个参考代码相对应,则选择参考移动终端的参考代码作为目标代码,所述参考移动终端与所述目标音视频处理终端的距离小于预设的距离阈值。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,选择步骤包括:
选择与目标音视频处理终端距离最近的参考移动终端作为目标终端。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,检索步骤包括:
获取目标音视频处理终端语音采集设备所采集到的目标语音信息;
若检索到所述目标声纹信息与多个代码相对应,则选择参考移动终端的代码作为目标代码,所述参考移动终端与所述目标语音信息相对应。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,绑定步骤包括:
查找第二参考距离所对应的目标权限,第二参考距离是目标移动终端与目标音视频处理终端之间的距离;
按照目标权限,对目标移动终端和目标音视频处理终端进行绑定。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,检索步骤包括:
按照时间先后的顺序,将获取到的目标声纹信息分段,以确定多个子分段;
分别提取每个子分段的声纹特征;
依次使用每个所述子分段的声纹特征在数据库中进行检索,直至检索到首个与当前所述声纹特征相对应的目标代码。
结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方式,其中,还包括:
若未检索出目标代码,则向目标音视频处理终端的声纹采集设备发送再次采集指令。
结合第一方面,本发明实施例提供了第一方面的第八种可能的实施方式,其中,计算步骤包括:
获取目标音视频处理终端信号采集设备所采集到的检测信号,检测信号是目标移动终端发出的;
根据检测信号的强弱,计算第一参考距离。
第二方面,本发明实施例还提供了音视频处理终端的绑定装置,其特征在于,包括:
获取模块,用于获取目标音视频处理终端声纹采集设备所采集到的目标声纹信息;
检索模块,用于在数据库中检索与目标声纹信息相对应的目标代码;
绑定模块,若检索出目标代码,则用于将目标音视频处理终端与目标代码所对应的目标移动终端进行绑定。
本发明实施例提供的APP绑定音视频处理终端的方法,采用基于声纹匹配的绑定方式,与现有技术中的需要使用者使用移动终端扫描指定二维码或在移动终端特定页面输入指定字符绑定码,再进行相应的认证和匹配操作后才能将移动终端与音视频处理终端进行绑定,导致绑定的效率很低相比,其通过在用户使用音视频处理终端中发声时,先通过声纹采集设备采集用户的声纹信息,再依据该声纹信息在数据库中检索目标代码,其中,目标代码和对应的声纹信息是预先存储在数据库中的,如果检索出目标代码,则可以将目标代码所对应的目标移动终端与目标音视频处理终端进行绑定,从而完成了移动终端与音视频处理终端的绑定。在绑定的时候不再需要用户进行复杂的操作,只需要正常说话或者演唱即可,而不再需要使用者操作移动终端进行步骤繁琐的验证操作,因此,本申请所提供的绑定方法能够提高绑定效率、减少绑定时间。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例所提供的APP绑定音视频处理终端的方法的基本流程图;
图2示出了本发明实施例所提供的APP绑定音视频处理终端的装置的模块连接图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着生活水平的逐步提高,娱乐行业也得到了快速的发展,休息的时候,人们会选择到影院、KTV、娱乐城等娱乐场所消费来放松。这些服务场所为了提高用户的体验度,也是在不断更新软硬件,软件如服务人员,硬件如显示设备、音响设备,软硬件的更新和改进都会使得用户得到更好的体验。如娱乐场所,为了使得用户得到更好的体验,从家用式遥控器控制点歌的方式改变为使用触屏(点歌台)来进行点歌,并且随着互联网技术的进一步发展,在娱乐场所中除了提供点歌功能以外,还提供了更多的针对消费者的音视频互动功能(如互动游戏、发送弹幕、录制歌曲或个人MV等),而且操作方式也从使用触屏的方式转变为了使用移动终端进行控制的方式,这进一步使得用户对音视频处理终端的控制更为自由和便捷。
在使用移动终端进行点歌等各类操作前,用户需要将自己使用的移动终端与音视频处理终端进行绑定(此处的绑定可以理解为,使移动终端取得音视频处理终端的信任,以使音视频处理终端能够执行移动终端所发出的指令)。相关技术中的绑定方式是采用移动终端验证的方式进行的。具体步骤为:1,用户使用移动终端扫描音视频处理终端指定的二维码,以获取进行绑定的网站或页面;2,用户使用移动终端在进行绑定的网站上录入手机号,使网站向手机发送验证码;3,用户在网站上输入手机号码所得到的验证码,并进行音视频处理终端编号、和其他验证信息、资料信息的输入;4,系统在对比之后,将用户移动终端和音视频处理终端进行绑定。此种绑定方式,需要用户执行大量的输入操作,虽然通过二维码或者类似的技术能够降低用户输入的繁琐程度,但验证的步骤仍然很多,而且,用户每次到一个新地点唱歌的时候,都需要进行这样的绑定,消耗了用户大量的时间,因而,相关技术中的绑定方式效率较低。
有鉴于此,本申请提供了APP绑定音视频处理终端的方法,如图1所示,包括如下步骤:
S101,获取目标音视频处理终端的声纹采集设备所采集到的目标声纹信息;
S102,在数据库中检索与目标声纹信息相对应的目标代码;
S103,若检索出目标代码,则将目标音视频处理终端与目标代码所对应的目标移动终端进行绑定。
其中,音视频处理终端主要是指各种网络多媒体播放器等终端设备类产品;以及接收各种音视频输出接口信号(如CVBS、S-Video、分量、VGA、HDMI、DsiplayPort、MHL、模拟立体声L/R、S/PDIF等),处理后再输出的设备类产品。并且,本申请所提供的方法也主要是针对娱乐场内的音视频处理终端,其中,娱乐场所是指提供卡拉ok影音设备与视唱空间的场所,即,本申请所提供的APP绑定音视频处理终端的方法,主要是移动终端上的APP与娱乐场所内的音视频处理终端进行绑定的方法。
步骤S101,需要通过音视频处理终端的声纹采集设备来采集声音。具体的,声纹采集设备如话筒和相应的处理装置。实际上,用户并不需要刻意的发声,在用户正常演唱的时候就可以采集到相应的声纹信息。人在发声时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异,也因此,在音视频处理终端中,可以采用声纹识别的方式来确定绑定的对象,并不需要用户按照特定的内容进行说话。将采集到的音频转变为声纹信息已是相关技术中能够实现的技术方案,在此,不再赘述声纹信息的形成过程,采集到的声纹信息也是根据用户所提供的音频信号、声音信号得到的,文中说明采集音频信号、声音信号和采集声纹信息均是相同的。
步骤S102中,根据步骤S101中所得到的声纹信息在数据库中进行检索,以查看是否有相同的声纹信息。在执行此步骤之前,需要提前采集到用户的声纹信息和目标代码(如手机号、APP号码等)并储存在数据库中。也就是在采集目标声纹信息前,需要用户将自己的声纹信息发送给数据库进行储存,同时储存的还有,用户所使用移动终端的号码/app号码(即目标代码),通常,这个移动终端也正是用户最终控制音视频处理终端所使用的移动终端。
如,在用户的移动终端上安装指定的应用(app)之后,可以通过移动终端上的话筒来采集用户的声音信号,并且将该声音信号和手机号码(或app号码,后文中为简化说明,只记载手机号码,但应注意的是,手机号码、app号码等能够将移动终端区别开的号码均是等同的)一起发送给指定的服务器,服务器通过对声音信号进行提取声纹特征,建立声纹模型之后,便可以将声纹模型作为声纹信息储存到相应的数据库中,储存的同时,还要对应的储存手机号码。
步骤S102执行的结果有两种情况,一种情况是,检索到了目标代码,也就是数据库中存储有与目标声纹信息相对应的代码(即储存有指定用户的手机号码和该用户的声纹信息),则将数据库中与目标声纹信息相对应的代码,作为目标代码。另一种情况是没有检索到目标代码,此种情况是由于数据库中并未储存目标声纹信息(如用户并未上传自己的声纹信息和手机号码至服务器,或者由于用户身体的原因,导致用户首次上传给数据库的声纹与音视频处理终端声纹采集设备所采集到的声纹有差别)。
系统可以预先建立如表1的表格,以便于在检索的时候,加快速度。
表1
ID | 声纹信息 | 代码 |
1 | 声纹特征模型A | 13511111111 |
2 | 声纹特征模型B | 13511111112 |
3 | 声纹特征模型C | 13511111113 |
4 | 声纹特征模型D | 13511111114 |
5 | 声纹特征模型E | 13511111115 |
表1中,第一列是系统自动生成的序列号,第二列是声纹的特征编码,第三列是电话号码,当然,电话号码还可以是其他如app号码的形式。进行步骤S102,检索的时候,只要对比目标声纹信息与第二列中的那个声纹特征模型相对应,便能够确定出目标声纹信息所对应的代码(表1中,第三列中指定的代码作为目标代码)了。
当检索到数据库中存在目标代码之后,则执行步骤S103,即将目标音视频处理终端与所述目标代码所对应的目标移动终端进行绑定。具体的,此处的绑定可以是指目标移动终端得到了目标音视频处理终端的认可,通过了音视频处理终端的认证,音视频处理终端会按照目标移动终端所发出的指令进行相应的动作。
需要说明的是,声纹采集设备可以是音视频处理终端演唱设备的话筒,也可以是独立的声音采集装置与处理装置的结合。通常,音视频处理终端的话筒是通过线缆与音视频处理终端连接上的,并且是由演唱者所使用的,但演唱者并不一定的进行点歌动作的人。因此,可以使用与话筒相分离的声音采集装置来进行声音的采集,并最后将采集到的声音转化为声纹信息。考虑到采集环境的特殊性(如采集环境相对嘈杂,可能会采集到其他音视频处理终端的声音),因此可以多次采集目标声纹信息,也就是步骤101,获取目标音视频处理终端声纹采集设备所采集到的目标声纹信息,具体为:间隔预定的时间(如间隔10秒采集10秒的声音信息),通过目标音视频处理终端的声纹采集设备多次采集目标声纹信息;步骤S102具体为:分别使用每个目标声纹信息在数据库中检索相对应的目标代码,并将检索出现次数最多的代码作为目标代码。
在将音视频处理终端与目标移动终端绑定之后,目标移动终端便可以通过向音视频处理终端下达控制指令(如选歌、切歌、发送需要显示的文字和图片、录音、录像等),来控制音视频处理终端。但,这种控制不能够无限期的延长,如用户离开音视频处理终端之后,则应停止控制,否则会造成系统的混乱。即,本申请所提供的绑定方法还包括解除绑定的方法,如在步骤S103之后开始计时,计时达到预定的时间(如音视频处理终端的最少使用时间,2小时)后,则解除绑定,由用户再次执行绑定动作(步骤S101-S103)后,才能继续绑定。还可以是在执行步骤S103之后,可以询问时间管理系统,来获取目标音视频处理终端的使用时间,并且在计时达到使用时间后,解除目标音视频处理终端与目标移动终端的绑定状态。
还可以通过如下步骤来判断是否需要解除绑定:也就是本申请所提供的APP绑定音视频处理终端的方法,还包括:
计算目标移动终端与目标音视频处理终端的第一参考距离;
判断第一参考距离是否大于预设的距离阈值;
若是,则解除绑定。
其中,计算第一参考距离的方法有两种,第一种:也就是步骤计算目标移动终端与目标音视频处理终端的第一参考距离包括:
分别获取目标移动终端和目标音视频处理终端的二维地理坐标(如经纬度坐标);
根据目标移动终端的二维地理坐标和目标音视频处理终端的二维地理坐标(可以指定位于目标音视频处理终端指定的一个点作为目标音视频处理终端的二维地理坐标),计算目标移动终端和目标音视频处理终端水平方向的第一参考距离(此处的第一参考距离即是二维平面坐标系上的直线距离)。
具体的,目标音视频处理终端的二维地理坐标是可以预先获得的,当目标音视频处理终端建立完成之后,便可以通过多种定位方式(如GPS定位、基站定位等)来确定目标音视频处理终端的二维地理坐标,并且目标音视频处理终端的二维地理坐标是不会发生改变的,因此,首次获取之后便不需要再调整。目标移动终端的二维地理坐标可以是通过实时的GPS定位,或数据网络定位,或wifi定位等方式来实现。
在确定了目标移动终端的二维地理坐标(X1,Y1)和目标音视频处理终端的二维地理坐标(X2,Y2)后,便可以使用两点间的距离公式来计算二者之间的距离,并且当计算得出的第一参考距离大于一定的阈值时,则解除绑定。需要说明的是,为了避免出现错误解除的现象,预设的距离阈值可以和目标音视频处理终端所在的房间面积数值呈正相关性,也就是目标音视频处理终端所在房间的面积越大,则此处的距离阈值越大。除了判断第一参考距离是否大于预设的距离阈值外,还可以采用如下判断方式,即判断处于第三参考距离(同样是目标移动终端与所述目标音视频处理终端之间的距离)大于预设的距离阈值状态的时间长度,是否大于预定的时间阈值,若是,则解除绑定。
也就是本发明所提供的APP绑定音视频处理终端的方法,在步骤S103之后,还包括:
实时计算所述目标移动终端与所述目标音视频处理终端的第三参考距离;
累计第三参考距离大于预设的距离阈值的统计时长;
若统计时长大于预设的时间阈值,则解除目标音视频处理终端与目标移动终端的绑定。
计算第一参考距离的方式还有第二种,即,所述计算步骤包括:
获取目标音视频处理终端信号采集设备所采集到的检测信号,检测信号是目标移动终端发出的;
根据检测信号的强弱,计算第一参考距离。
此种方式,需要目标移动终端向目标音视频处理终端中的采集设备发送信号,之后,根据目标信号的强弱程度来换算第一参考距离。
需要说明的是,计算第一参考距离、第二参考距离、第三参考距离和执行检索动作的可以是设置在云端的服务器,也可以是音视频处理终端的后台计算机。执行运算或检索的主体可以是存在于音视频处理终端系统内部的计算机,也可以是音视频处理终端外部的独立计算机。
进一步,步骤S102,即检索步骤包括:
若检索到所述目标声纹信息与多个参考代码相对应,则选择参考移动终端的参考代码作为目标代码,所述参考移动终端与所述目标音视频处理终端的距离小于预设的距离阈值。
也就是当目标声纹信息能够检索出多个参考代码的时候,需要按照距离的远近,选择符合要求的参考代码作为目标代码,也就是将与目标音视频处理终端的距离足够小的参考移动终端的代码作为目标代码。
优选的,选择步骤包括:选择与所述目标音视频处理终端距离最近的参考终端的代码作为目标代码。
除了根据移动终端与目标音视频处理终端的距离,来选择指定参考移动终端的代码作为目标代码。还可以通过缩小采集范围的方式,来确定目标代码。也就是步骤S102,检索步骤还可以是:
按照时间先后的顺序,将获取到的目标声纹信息分段,以确定多个子分段;
分别提取每个子分段的声纹特征;
依次使用每个所述子分段的声纹特征在数据库中进行检索,直至检索到首个与当前所述声纹特征相对应的目标代码。
当获取到的目标声纹信息过长的时候,就可以按照分段的方式逐个比对(检索),否则一次性对比的内容过多,则会造成系统负担加剧。在分段的时候,需要保证每个分段有足够的长度,如每个子分段需要保证8-10秒的时间,之后便可以将每个子分段进行声纹的提取。在进行检索的时候,可以按照时间由前至后的顺序,依次使用每个子分段的声纹特征进行检索,直到检索出第一个符合要求的目标代码。当用户在提供声纹信息的时候,采集设备通常会首先采集到目标用户(提供目标声纹信息的用户)的声纹信息。如用户提供声纹信息的时候,会先打开声音采集设备的开关,打开开关之后,便会正常发声,由此,系统会首先采集到目标用户的声音。因此,在检索的时候,可以按照时间的先后顺序,依次使用每个子分段的声纹特征进行检索。如,采集到的目标声纹信息为0-40S的一端i信息,那么可以分为0-10S,10-20S,20-30S,30-40S这四个子分段,之后,分别提取每个子分段的声纹特征,如依次提取到的声纹特征为特征1(0-10S子分段的声纹特征),特征2(10-20S子分段的声纹特征),特征3(20-30S子分段的声纹特征)和特征4(30-40S子分段的声纹特征),之后,按照特征1-4的顺序,依次进行检索。直到检索出目标代码。
在计算参考移动终端和与目标音视频处理终端的距离时,需要先获取参考移动终端的位置信息(二维地理坐标),如可以通过GPS等方式获取位置信息,如无法获取位置信息,则忽略无法获取位置信息的移动终端。
当检索到多个参考代码的时候,除了通过距离判断的方式,来确定将哪个移动终端与音视频处理终端绑定,还可以通过复合识别的方式来确认。
如步骤S102,检索步骤包括:
获取目标音视频处理终端语音采集设备所采集到的目标语音信息;
若检索到所述目标声纹信息与多个代码相对应,则选择参考终端的代码作为目标代码,所述参考终端与所述目标语音信息相对应。
如可以建立如表2所示的表格,
ID | 声纹信息 | 代码 | 语音信息 |
1 | 声纹特征模型A | 13511111111 | 内容V |
2 | 声纹特征模型B | 13511111112 | 内容W |
3 | 声纹特征模型C | 13511111113 | 内容X |
4 | 声纹特征模型D | 13511111114 | 内容Y |
5 | 声纹特征模型E | 13511111115 | 内容Z |
表2中,根据目标声纹信息,检索出ID为2、4的声纹特征模型(即声纹特征模型B和声纹特征模型D)与目标声纹信息相同,此时代码13511111112和13511111114均是目标代码的备选代码,之后便可以根据采集到的目标语音信息来判断具体哪个代码才是目标代码。如采集到的目标语音信息是内容W,则说明ID号为2的代码(13511111112)是目标代码。当然,语音信息也是用户提前提供给系统的,每个用户的声纹信息、代码和语音信息是一一对应的。
具体的,步骤S103,绑定步骤包括:
查找第二参考距离所对应的目标权限,第二参考距离是目标移动终端与目标音视频处理终端之间的距离;
按照目标权限,对目标移动终端和目标音视频处理终端进行绑定。
也就是,根据目标移动终端和目标音视频处理终端之间的距离,来确定目标权限,进而通过将二者绑定的方式,来赋予目标移动终端不同的权限。
如表3所示,
表3
距离 | 权限 |
0-5m | 权限A+B+C+D |
5-10m | 权限A+B+C |
10-18m | 权限A+B |
18-25m | 权限A |
25m以上 | 无权限 |
表3中,根据第二参考距离的不同,可以确定出不同的目标权限,并将这目标权限赋予目标移动终端。具体在执行的时候,当目标移动终端与目标音视频处理终端的距离为12米的时候,如目标移动终端发出权限C的命令,则音视频处理终端不会响应;如目标移动终端发出权限B的命令,则音视频处理终端会响应该命令。
具体的,APP绑定音视频处理终端的方法,还包括:
若未检索出目标代码,则向目标音视频处理终端的声纹采集设备发送再次采集指令。
也就是,如果检索出目标代码,则说明目标声纹信息之前没有录入到系统中,或者说提供的目标声纹信息是不准确的,因此,需要对方重新提供。
下面,以一个具体的实例来说明本申请所提供的APP绑定音视频处理终端的方法。
首先,用户从网络端下载APP至移动终端,用户首次运行app后,需注册个人信息,并弹出提示文字。用户使用携带有该APP的移动终端的麦克风朗读该段文字(文字内容可以调整)进行用户声纹采集,声纹最小采集时间为10秒左右。完成采集之后,APP自动将采集到的内容上传至云端。云端对采集到的内容(音频)进行初处理(处理的具体内容包括:转换为PCM格式,调整为单声道,采样率16kHz,码率256kbps音频),之后,将初处理后的音频提取人声信号中包含的用户声纹特征,并建立用户声纹数据,声纹数据包括:根据声纹特征所建立的声纹模型,自动生成的ID等用户信息。最后将用户声纹数据自动推送到场所服务器声纹数据库,并实时更新。
之后,当注册成功的APP用户使用与场所内音视频处理终端连接的麦克风进行说话或演唱时,音视频处理终端将自动采集该用户的声音,并通过网络传送至服务器声纹数据库进行身份识别及匹配;服务器数据库内存有本场所的音视频处理终端设备信息(如设备编号、房间号等)。由服务器数据库将采集到的声音和声纹数据库内进行匹配。匹配成功(即根据音视频处理终端采集到的声纹信息查找到对应的移动终端代码)后,将该用户的APP账号(还可以是如手机号等编号)与该用户使用的音视频处理终端进行自动绑定。从而达到免手工绑定的情况下,用户可以通过APP对音视频处理终端进行控制(如录音录像指令,视频加滤镜指令等),以及通过APP与音视频处理终端进行数据交换(APP可向设备发送文字、图片、动画等;音视频处理终端可向APP推送消息、推送录音录像、对视频加滤镜以及对音视频采集处理的结果等)。
并且,用户的APP处于运行状态时,APP可以自动获取用户所在位置(通过GPS或数据网络或wifi)。当音视频处理终端采集到的声音匹配到两个或多个声纹数据库内的声纹时,系统要求APP上传该用户的位置,确定使用app的用户所在位置;之后,再结合音视频处理终端所在的位置,选择匹配到的声纹所对应的代码中,与音视频处理终端距离最近的移动终端的代码作为与该音视频处理终端进行绑定的代码。
最后,APP与音视频处理终端的断开及二次绑定:APP与音视频处理终端第一次绑定成功后,系统默认该APP用户与该音视频处理终端永久绑定,即该APP用户超出该音视频处理终端的网络范围时不予清除该APP用户;直至该音视频处理终端关机或重新启动,音视频处理终端向云端发送请求,清空APP用户列表。
本发明实施例还提供了音视频处理终端的绑定装置,如图2所示,包括如下模块:
获取模块201,用于获取目标音视频处理终端声纹采集设备所采集到的目标声纹信息;
检索模块202,用于在数据库中检索与目标声纹信息相对应的目标代码;
绑定模块203,若检索出目标代码,则用于将目标音视频处理终端与目标代码所对应的目标移动终端进行绑定。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (9)
1.一种APP绑定音视频处理终端的方法,其特征在于,包括:
获取目标音视频处理终端的声纹采集设备所采集到的目标声纹信息;
在数据库中检索与所述目标声纹信息相对应的目标代码;
若检索出所述目标代码,则将所述目标音视频处理终端与所述目标代码所对应的目标移动终端进行绑定;
实时计算所述目标移动终端与所述目标音视频处理终端的第三参考距离;
累计第三参考距离大于预设的距离阈值的统计时长;
若统计时长大于预设的时间阈值,则解除目标音视频处理终端与目标移动终端的绑定。
2.根据权利要求1所述的一种APP绑定音视频处理终端的方法,其特征在于,所述检索步骤包括:
若检索到所述目标声纹信息与多个参考代码相对应,则选择参考移动终端的参考代码作为目标代码,所述参考移动终端与所述目标音视频处理终端的距离小于预设的距离阈值。
3.根据权利要求2所述的一种APP绑定音视频处理终端的方法,其特征在于,所述选择步骤包括:
选择与所述目标音视频处理终端距离最近的参考移动终端的代码作为目标代码。
4.根据权利要求1所述的一种APP绑定音视频处理终端的方法,其特征在于,所述检索步骤包括:
获取目标音视频处理终端语音采集设备所采集到的目标语音信息;
若检索到所述目标声纹信息与多个代码相对应,则选择参考移动终端的代码作为目标代码,所述参考移动终端与所述目标语音信息相对应。
5.根据权利要求1所述的一种APP绑定音视频处理终端的方法,其特征在于,所述绑定步骤包括:
查找第二参考距离所对应的目标权限,所述第二参考距离是目标移动终端与所述目标音视频处理终端之间的距离;
按照所述目标权限,对所述目标移动终端和所述目标音视频处理终端进行绑定。
6.根据权利要求1所述的一种APP绑定音视频处理终端的方法,其特征在于,所述检索步骤包括:
按照时间先后的顺序,将获取到的目标声纹信息分段,以确定多个子分段;
分别提取每个子分段的声纹特征;
依次使用每个所述子分段的声纹特征在数据库中进行检索,直至检索到首个与当前所述声纹特征相对应的目标代码。
7.根据权利要求1所述的一种APP绑定音视频处理终端的方法,其特征在于,还包括:
若未检索出所述目标代码,则向所述目标音视频处理终端的声纹采集设备发送再次采集指令。
8.根据权利要求1所述的一种APP绑定音视频处理终端的方法,其特征在于,所述计算步骤包括:
获取目标音视频处理终端信号采集设备所采集到的检测信号,所述检测信号是所述目标移动终端发出的;
根据所述检测信号的强弱,计算所述第三参考距离。
9.一种APP绑定音视频处理终端的装置,其特征在于,包括:
获取模块,用于获取目标音视频处理终端声纹采集设备所采集到的目标声纹信息;
检索模块,用于在数据库中检索与所述目标声纹信息相对应的目标代码;
绑定模块,若检索出所述目标代码,则用于将所述目标音视频处理终端与所述目标代码所对应的目标移动终端进行绑定;
所述APP绑定音视频处理终端的装置还用于:
实时计算所述目标移动终端与所述目标音视频处理终端的第三参考距离;
累计第三参考距离大于预设的距离阈值的统计时长;
若统计时长大于预设的时间阈值,则解除目标音视频处理终端与目标移动终端的绑定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510398784.2A CN105119953B (zh) | 2015-07-08 | 2015-07-08 | App绑定音视频处理终端的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510398784.2A CN105119953B (zh) | 2015-07-08 | 2015-07-08 | App绑定音视频处理终端的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105119953A CN105119953A (zh) | 2015-12-02 |
CN105119953B true CN105119953B (zh) | 2019-08-27 |
Family
ID=54667839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510398784.2A Expired - Fee Related CN105119953B (zh) | 2015-07-08 | 2015-07-08 | App绑定音视频处理终端的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105119953B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975569A (zh) * | 2016-05-03 | 2016-09-28 | 深圳市金立通信设备有限公司 | 一种语音处理的方法及终端 |
CN110364150A (zh) * | 2019-06-25 | 2019-10-22 | 北京小米移动软件有限公司 | 音箱控制方法及装置 |
CN113965929A (zh) * | 2021-10-21 | 2022-01-21 | 北京雪扬科技有限公司 | 一种硬件绑定方法 |
CN115567309A (zh) * | 2022-10-08 | 2023-01-03 | 重庆长安汽车股份有限公司 | 远程登录智能汽车云平台的方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008216402A (ja) * | 2007-02-28 | 2008-09-18 | Daiichikosho Co Ltd | カラオケシステム |
CN103179460A (zh) * | 2013-03-05 | 2013-06-26 | 福建星网视易信息系统有限公司 | 移动终端对数字视听终端绑定方法、绑定控制方法及系统 |
CN103680545A (zh) * | 2013-12-27 | 2014-03-26 | 深圳市通力科技开发有限公司 | 音频播放系统及其播放控制方法 |
CN104038530A (zh) * | 2014-04-30 | 2014-09-10 | 西南交通大学 | 基于手机和wifi网络的多功能ktv点歌分享系统及方法 |
CN104317404A (zh) * | 2014-10-28 | 2015-01-28 | 上海皓业广播传媒有限公司 | 一种声纹控制音频播放设备、控制系统及方法 |
CN104485110A (zh) * | 2014-11-25 | 2015-04-01 | 科大讯飞股份有限公司 | 点歌系统、方法、服务器及移动终端 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102594988A (zh) * | 2012-02-10 | 2012-07-18 | 深圳市中兴移动通信有限公司 | 一种实现蓝牙耳机语音识别自动配对连接的方法及系统 |
-
2015
- 2015-07-08 CN CN201510398784.2A patent/CN105119953B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008216402A (ja) * | 2007-02-28 | 2008-09-18 | Daiichikosho Co Ltd | カラオケシステム |
CN103179460A (zh) * | 2013-03-05 | 2013-06-26 | 福建星网视易信息系统有限公司 | 移动终端对数字视听终端绑定方法、绑定控制方法及系统 |
CN103680545A (zh) * | 2013-12-27 | 2014-03-26 | 深圳市通力科技开发有限公司 | 音频播放系统及其播放控制方法 |
CN104038530A (zh) * | 2014-04-30 | 2014-09-10 | 西南交通大学 | 基于手机和wifi网络的多功能ktv点歌分享系统及方法 |
CN104317404A (zh) * | 2014-10-28 | 2015-01-28 | 上海皓业广播传媒有限公司 | 一种声纹控制音频播放设备、控制系统及方法 |
CN104485110A (zh) * | 2014-11-25 | 2015-04-01 | 科大讯飞股份有限公司 | 点歌系统、方法、服务器及移动终端 |
Also Published As
Publication number | Publication date |
---|---|
CN105119953A (zh) | 2015-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104205209B (zh) | 回放控制设备、回放控制方法 | |
CN105120304B (zh) | 信息显示方法、装置及系统 | |
CN109117233A (zh) | 用于处理信息的方法和装置 | |
CN106531201B (zh) | 歌曲录制的方法和装置 | |
CN105119953B (zh) | App绑定音视频处理终端的方法及装置 | |
CN105808710A (zh) | 一种远程 k 歌终端、远程k 歌系统及远程k 歌方法 | |
JP2014516189A (ja) | 受信データの比較を実行しその比較に基づいて後続サービスを提供する方法及びシステム | |
KR101968725B1 (ko) | 음성요청에 대응하는 정보 제공을 위한 미디어 선택 | |
CN103699530A (zh) | 根据语音输入信息在目标应用中输入文本的方法与设备 | |
CN109243444A (zh) | 语音交互方法、设备及计算机可读存储介质 | |
CN107767846B (zh) | Ktv联机远程k歌的方法、装置及存储介质 | |
CN104410748A (zh) | 一种根据移动终端位置添加背景音效的方法及移动终端 | |
CN112596694B (zh) | 一种房源信息的处理方法和装置 | |
CN110047497B (zh) | 背景音频信号滤除方法、装置及存储介质 | |
CN102970427A (zh) | 一种手机播放歌曲的方法 | |
KR101924205B1 (ko) | 노래방 시스템 및 그의 관리 방법 | |
CN110246475A (zh) | 移动终端、ktv播放装置及点歌服务器 | |
JP2022020625A (ja) | 音声処理システム、音声処理装置、音声処理方法、及び音声処理プログラム | |
CN115657862B (zh) | 虚拟ktv场景画面自动切换的方法、装置、存储介质及设备 | |
KR102131106B1 (ko) | 이차원 코드를 기반으로 방송 서비스 서버와 접속하여 개인 방송을 가능하게 하는 노래반주기 및 그 동작 방법 | |
KR102227998B1 (ko) | 가상현실 노래방 시스템 및 그것을 이용한 vr 노래방 제공 방법 | |
JP2014092592A (ja) | コラボレーション歌唱映像表示システム | |
JP5550593B2 (ja) | カラオケ装置 | |
CN103986767A (zh) | 歌曲自动识别动漫特效系统 | |
KR101985640B1 (ko) | 증강 현실 기반 선거 유세 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190827 |