CN111048100B - 一种大数据并行化声纹辨认系统和方法 - Google Patents
一种大数据并行化声纹辨认系统和方法 Download PDFInfo
- Publication number
- CN111048100B CN111048100B CN201911146300.XA CN201911146300A CN111048100B CN 111048100 B CN111048100 B CN 111048100B CN 201911146300 A CN201911146300 A CN 201911146300A CN 111048100 B CN111048100 B CN 111048100B
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- server
- recognition
- recognition processing
- voiceprint recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/10—Multimodal systems, i.e. based on the integration of multiple recognition engines or fusion of expert systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种大数据并行化声纹辨认系统和方法。所述系统包括应用模块、多个负载均衡服务器、多个声纹预处理服务器、多个声纹辨认处理服务器和消息中心服务器;每一个所述负载均衡服务器均与所述应用模块通信连接,每一个所述声纹预处理服务器均与多个所述负载均衡服务器和所述消息中心服务器通信连接,每一个所述声纹辨认处理服务器均与所述消息中心服务器通信连接。所述大数据并行化声纹辨认系统和方法均可以能很好解决声纹辨认系统中大容量扩容难,大并发量提升难,识别响应时间长和可靠性不高的四大难题。
Description
技术领域
本发明涉及声纹识别领域,具体涉及一种大数据并行化声纹辨认系统和方法。
背景技术
声纹识别,生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。声纹识别就是把声信号转换成电信号,再用计算机进行识别。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
申请号为CN201010046573.X的中国发明专利公开了一种基于网络动态负载均衡的声纹识别系统,包括用于对用户发出的声音进行采集的声纹客户端,声纹客户端与负载均衡服务器通讯,用于查找最优声纹识别服务器的负载均衡服务器与声纹识别服务器组通讯,声纹识别服务器组由至少两个声纹识别服务器组成,最优声纹识别服务器将识别结果反馈至声纹客户端。在进行语音鉴别(辨认)时,最优声纹识别服务器调用接口模块的鉴别功能,语音处理模块对语音进行预处理,对预处理后的语音按照一定的算法提取特征,将该提取特征与所要鉴别的所有用户的模型进行一一比对,并计算得分排序,若第一名得分高于设定的阈值,则说话人就是第一名的用户,否则,则说明该语音不属于用户中的任何一个人。
上述专利的声纹识别系统问题在于,其在进行语音鉴别时,虽然利用了负载均衡服务器查找最优声纹识别服务器实现自动对流量和声纹识别服务器集群进行动态分配,但是,对声纹进行预处理、提取特征、模型比对、算分排序的过程仍然是通过单个的声纹识别服务器来完成的。导致上述专利的声纹识别系统在对大容量、高并发的声纹辨认(也称鉴别)时还是有可能出现辨认响应时间长的问题。
发明内容
本发明所要解决的技术问题是提供一种大数据并行化声纹辨认系统,其可以能很好解决声纹辨认系统中大容量扩容难,大并发量提升难,识别响应时间长和可靠性不高的四大难题。
本发明所要解决的另一个技术问题是提供一种大数据并行化声纹辨认方法。
为解决上述技术问题,本发明所采用的技术方案是提供一种大数据并行化声纹辨认系统,所述系统包括应用模块、多个负载均衡服务器、多个声纹预处理服务器、多个声纹辨认处理服务器和消息中心服务器;每一个所述负载均衡服务器均与所述应用模块通信连接,每一个所述声纹预处理服务器均与多个所述负载均衡服务器和所述消息中心服务器通信连接,每一个所述声纹辨认处理服务器均与所述消息中心服务器通信连接;其中,
所述应用模块用于供用户采集待辨认声纹语音数据并发起声纹辨认指令;
所述负载均衡服务器用于甄选出最优的所述声纹预处理服务器,并将所述待辨认声纹语音数据和声纹辨认指令转发到所述最优的所述声纹预处理服务器;
最优的所述声纹预处理服务器用于提取出所述待辨认声纹语音数据的声纹特征,将所述声纹特征通过所述消息中心服务器广播到所有的所述声纹辨认处理服务器;
所述声纹辨认处理服务器用于对接收到的所述声纹特征进行辨认,并将辨认结果通过所述消息中心服务器反馈至最优的所述声纹预处理服务器;
最优的所述声纹预处理服务器还用于根据多个所述声纹辨认处理服务器反馈的所述辨认结果得出最终辨认结果,并将所述最终辨认结果通过所述负载均衡服务器反馈至所述应用模块。
在本发明提供的大数据并行化声纹辨认系统中,每一个所述声纹辨认处理服务器均包括存储有多个声纹模型的分片声纹库,不同的所述声纹辨认处理服务器的分片声纹库所存储的声纹模型均不相同。
在本发明提供的大数据并行化声纹辨认系统中,所述辨认结果是:所述声纹辨认处理服务器将所述声纹特征与自有的所述分片声纹库中的所有的声纹模型进行相似度匹配计算后得出的相似度分值最高的一组有序序列结果子集。
在本发明提供的大数据并行化声纹辨认系统中,所述最终辨认结果是:所述最优的所述声纹预处理服务器将各个所述声纹辨认处理服务器的有序序列结果子集按照高分优先序列进行重组,计算每一个相似度分值,再度进行全局排序,得出的最终有序结果子集。
为解决上述另一个技术问题,本发明所采用的技术方案是提供一种大数据并行化声纹辨认方法,所述方法包括如下步骤:
步骤S1,应用模块采集待辨认声纹语音数据并发起声纹辨认指令;
步骤S2,负载均衡服务器甄选出最优的所述声纹预处理服务器,并将所述待辨认声纹语音数据和声纹辨认指令转发到所述最优的所述声纹预处理服务器;
步骤S3,最优的所述声纹预处理服务器提取出所述待辨认声纹语音数据的声纹特征,将所述声纹特征通过所述消息中心服务器广播到所有的所述声纹辨认处理服务器;
步骤S4,声纹辨认处理服务器对接收到的所述声纹特征进行辨认,并将辨认结果通过所述消息中心服务器反馈至最优的所述声纹预处理服务器;
步骤S5,最优的所述声纹预处理服务器根据多个所述声纹辨认处理服务器反馈的所述辨认结果得出最终辨认结果,并将所述最终辨认结果通过所述负载均衡服务器反馈至所述应用模块。
在本发明提供的大数据并行化声纹辨认方法中,每一个所述声纹辨认处理服务器均包括存储有多个声纹模型的分片声纹库,不同的所述声纹辨认处理服务器的分片声纹库所存储的声纹模型均不相同。
在本发明提供的大数据并行化声纹辨认方法中,在所述步骤S4中,所述的“声纹辨认处理服务器对接收到的所述声纹特征进行辨认”的过程是:所述声纹辨认处理服务器将所述声纹特征与自有的所述分片声纹库中的所有的声纹模型进行相似度匹配计算后得出相似度分值最高的一组有序序列结果子集;所述有序序列结果子集即为所述辨认结果。
在本发明提供的大数据并行化声纹辨认方法中,在所述步骤S5中,所述的“最优的所述声纹预处理服务器根据多个所述声纹辨认处理服务器反馈的所述辨认结果得出最终辨认结果”的过程是:所述最优的所述声纹预处理服务器将各个所述声纹辨认处理服务器的有序序列结果子集按照高分优先序列进行重组,计算每一个相似度分值,再度进行全局排序,得出最终有序结果子集;所述最终有序结果子集即为所述最终辨认结果。
实施本发明提供的大数据并行化声纹辨认系统和方法,可以达到以下有益效果:
1、采用负载均衡方案将计算耗时最长的提取待辨认声纹语音数据的声纹特征的环节均匀分布于多个声纹预处理服务器上,能应付应用模块较大的并发量变化。
2、采用消息中心中服务器可以选择成熟的消息中心方案,提高成熟度,降低多个声纹预处理服务器和多个声纹辨认处理服务器之间的耦合度,可以大大简化系统架构的设计难度。
3、采用多个声纹辨认处理服务器形成声纹辨认集群,多个声纹辨认处理服务器的分片声纹库构成一个总声纹库,使得总声纹库的规模数量不再受限于单个声纹辨认处理服务器的资源约束,扩容时只要相应增加声纹辨认处理服务器即可。
总而言之,采用上述的大数据并行化声纹辨认系统和方法能很好解决现有声纹辨认系统中大容量扩容难,大并发量提升难,识别响应时间长和可靠性不高的四大难题。
附图说明
图1为本发明实施例一提供的大数据并行化声纹辨认系统的结构示意图;
图2为本发明实施例二提供的大数据并行化声纹辨认方法的流程示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本实施例提供了一种大数据并行化声纹辨认系统。所述系统包括应用模块、多个负载均衡服务器、多个声纹预处理服务器、多个声纹辨认处理服务器和消息中心服务器;每一个所述负载均衡服务器均与所述应用模块通信连接,每一个所述声纹预处理服务器均与多个所述负载均衡服务器和所述消息中心服务器通信连接,每一个所述声纹辨认处理服务器均与所述消息中心服务器通信连接;每一个所述声纹辨认处理服务器均包括存储有多个声纹模型的分片声纹库,不同的所述声纹辨认处理服务器的分片声纹库所存储的声纹模型均不相同,多个声纹辨认处理服务器的分片声纹库构成一个总声纹库。
本实施例中,所述应用模块用于供用户采集待辨认声纹语音数据并发起声纹辨认指令。具体的,所述应用模块可以是计算机、智能手机等,其可通过实时采集语音或者语音文件回放方式发起声纹辨认处理请求(声纹辨认指令),并将待辨认声纹语音数据和相关参数发往一个所述负载均衡处理服务器。
本实施例中,所述负载均衡服务器用于甄选出最优的所述声纹预处理服务器,并将所述待辨认声纹语音数据和声纹辨认指令转发到所述最优的所述声纹预处理服务器。具体的,所述负载均衡服务器根据最优规则于甄选出最优的所述声纹预处理服务器,最优规则是指从多个所述声纹预处理服务器筛选出最空闲的所述声纹预处理服务器作为最优的所述声纹预处理服务器。
本实施例中,最优的所述声纹预处理服务器用于提取出所述待辨认声纹语音数据的声纹特征,将所述声纹特征通过所述消息中心服务器广播到所有的所述声纹辨认处理服务器。具体的,最优的所述声纹预处理服务器对所述待辨认声纹语音数据进行预处理后,提取出所述待辨认声纹语音数据的声纹特征,将所述待辨认声纹语音数据的声纹特征打包成下一级声纹辨认分片处理指令包,并发往所述消息中心服务器,然后所述消息中心服务器将所述声纹辨认分片处理指令包广播到所有的所述声纹辨认处理服务器。
本实施例中,所述声纹辨认处理服务器用于对接收到的所述声纹特征进行辨认,并将辨认结果通过所述消息中心服务器反馈至最优的所述声纹预处理服务器。具体的,所述声纹辨认处理服务器将所述声纹特征与自有的所述分片声纹库中的所有的声纹模型进行相似度匹配计算后得出相似度分值最高的一组有序序列结果子集,所述有序序列结果子集即为所述辨认结果。
本实施例中,最优的所述声纹预处理服务器还用于根据多个所述声纹辨认处理服务器反馈的所述辨认结果得出最终辨认结果,并将所述最终辨认结果通过所述负载均衡服务器反馈至所述应用模块。具体的,所述最优的所述声纹预处理服务器将各个所述声纹辨认处理服务器的有序序列结果子集按照高分优先序列进行重组,计算每一个相似度分值,再度进行全局排序,得出最终有序结果子集,所述最终有序结果子集即为所述最终辨认结果。
实施例二
本实施例提供了一种大数据并行化声纹辨认方法,所述方法通过实施一提供的系统实施。所述方法包括如下步骤:
步骤S1,应用模块采集待辨认声纹语音数据并发起声纹辨认指令;具体的,所述应用模块可以是计算机、智能手机等,其可通过实时采集语音或者语音文件回放方式发起声纹辨认处理请求(声纹辨认指令),并将待辨认声纹语音数据和相关参数发往一个所述负载均衡处理服务器。
步骤S2,负载均衡服务器甄选出最优的所述声纹预处理服务器,并将所述待辨认声纹语音数据和声纹辨认指令转发到所述最优的所述声纹预处理服务器;具体的,所述负载均衡服务器根据最优规则于甄选出最优的所述声纹预处理服务器,最优规则是指从多个所述声纹预处理服务器筛选出最空闲的所述声纹预处理服务器作为最优的所述声纹预处理服务器。
步骤S3,最优的所述声纹预处理服务器提取出所述待辨认声纹语音数据的声纹特征,将所述声纹特征通过所述消息中心服务器广播到所有的所述声纹辨认处理服务器;具体的,最优的所述声纹预处理服务器对所述待辨认声纹语音数据进行预处理后,提取出所述待辨认声纹语音数据的声纹特征,将所述待辨认声纹语音数据的声纹特征打包成下一级声纹辨认分片处理指令包,并发往所述消息中心服务器,然后所述消息中心服务器将所述声纹辨认分片处理指令包广播到所有的所述声纹辨认处理服务器。
步骤S4,声纹辨认处理服务器对接收到的所述声纹特征进行辨认,并将辨认结果通过所述消息中心服务器反馈至最优的所述声纹预处理服务器;具体的,所述的“声纹辨认处理服务器对接收到的所述声纹特征进行辨认”的过程是:所述声纹辨认处理服务器将所述声纹特征与自有的所述分片声纹库中的所有的声纹模型进行相似度匹配计算后得出相似度分值最高的一组有序序列结果子集;所述有序序列结果子集即为所述辨认结果。
步骤S5,最优的所述声纹预处理服务器根据多个所述声纹辨认处理服务器反馈的所述辨认结果得出最终辨认结果,并将所述最终辨认结果通过所述负载均衡服务器反馈至所述应用模块。具体的,所述的“最优的所述声纹预处理服务器根据多个所述声纹辨认处理服务器反馈的所述辨认结果得出最终辨认结果”的过程是:所述最优的所述声纹预处理服务器将各个所述声纹辨认处理服务器的有序序列结果子集按照高分优先序列进行重组,计算每一个相似度分值,再度进行全局排序,得出最终有序结果子集;所述最终有序结果子集即为所述最终辨认结果。
综上所述,实施本发明提供的大数据并行化声纹辨认系统和方法,可以达到以下有益效果:
1、采用负载均衡方案将计算耗时最长的提取待辨认声纹语音数据的声纹特征的环节均匀分布于多个声纹预处理服务器上,能应付应用模块较大的并发量变化。
2、采用消息中心中服务器可以选择成熟的消息中心方案,提高成熟度,降低多个声纹预处理服务器和多个声纹辨认处理服务器之间的耦合度,可以大大简化系统架构的设计难度。
3、采用多个声纹辨认处理服务器形成声纹辨认集群,多个声纹辨认处理服务器的分片声纹库构成一个总声纹库,使得总声纹库的规模数量不再受限于单个声纹辨认处理服务器的资源约束,扩容时只要相应增加声纹辨认处理服务器即可。
总而言之,采用上述的大数据并行化声纹辨认系统和方法能很好解决现有声纹辨认系统中大容量扩容难,大并发量提升难,识别响应时间长和可靠性不高的四大难题。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (7)
1.一种大数据并行化声纹辨认系统,其特征在于,所述系统包括应用模块、多个负载均衡服务器、多个声纹预处理服务器、多个声纹辨认处理服务器和消息中心服务器;每一个所述负载均衡服务器均与所述应用模块通信连接,每一个所述声纹预处理服务器均与多个所述负载均衡服务器和所述消息中心服务器通信连接,每一个所述声纹辨认处理服务器均与所述消息中心服务器通信连接;其中,
所述应用模块用于供用户采集待辨认声纹语音数据并发起声纹辨认指令;
所述负载均衡服务器用于甄选出最优的所述声纹预处理服务器,并将所述待辨认声纹语音数据和声纹辨认指令转发到所述最优的所述声纹预处理服务器;
最优的所述声纹预处理服务器用于提取出所述待辨认声纹语音数据的声纹特征,将所述声纹特征通过所述消息中心服务器广播到所有的所述声纹辨认处理服务器;
所述声纹辨认处理服务器用于对接收到的所述声纹特征进行辨认,并将辨认结果通过所述消息中心服务器反馈至最优的所述声纹预处理服务器;
最优的所述声纹预处理服务器还用于根据多个所述声纹辨认处理服务器反馈的所述辨认结果得出最终辨认结果,并将所述最终辨认结果通过所述负载均衡服务器反馈至所述应用模块;
每一个所述声纹辨认处理服务器均包括存储有多个声纹模型的分片声纹库,不同的所述声纹辨认处理服务器的分片声纹库所存储的声纹模型均不相同;
采用多个声纹辨认处理服务器形成声纹辨认集群,多个声纹辨认处理服务器的分片声纹库构成一个总声纹库。
2.根据权利要求1所述的大数据并行化声纹辨认系统,其特征在于,所述辨认结果是:所述声纹辨认处理服务器将所述声纹特征与自有的所述分片声纹库中的所有的声纹模型进行相似度匹配计算后得出的相似度分值最高的一组有序序列结果子集。
3.根据权利要求2所述的大数据并行化声纹辨认系统,其特征在于,所述最终辨认结果是:所述最优的所述声纹预处理服务器将各个所述声纹辨认处理服务器的有序序列结果子集按照高分优先序列进行重组,计算每一个相似度分值,再度进行全局排序,得出的最终有序结果子集。
4.一种大数据并行化声纹辨认方法,其特征在于,所述方法通过如权利要求2-3中任一项所述的大数据并行化声纹辨认系统实施,所述方法包括如下步骤:
步骤S1,应用模块采集待辨认声纹语音数据并发起声纹辨认指令;
步骤S2,负载均衡服务器甄选出最优的所述声纹预处理服务器,并将所述待辨认声纹语音数据和声纹辨认指令转发到所述最优的所述声纹预处理服务器;
步骤S3,最优的所述声纹预处理服务器提取出所述待辨认声纹语音数据的声纹特征,将所述声纹特征通过所述消息中心服务器广播到所有的所述声纹辨认处理服务器;
步骤S4,声纹辨认处理服务器对接收到的所述声纹特征进行辨认,并将辨认结果通过所述消息中心服务器反馈至最优的所述声纹预处理服务器;
步骤S5,最优的所述声纹预处理服务器根据多个所述声纹辨认处理服务器反馈的所述辨认结果得出最终辨认结果,并将所述最终辨认结果通过所述负载均衡服务器反馈至所述应用模块。
5.根据权利要求4所述的大数据并行化声纹辨认方法,其特征在于,每一个所述声纹辨认处理服务器均包括存储有多个声纹模型的分片声纹库,不同的所述声纹辨认处理服务器的分片声纹库所存储的声纹模型均不相同。
6.根据权利要求5所述的大数据并行化声纹辨认方法,其特征在于,在所述步骤S4中,所述的“声纹辨认处理服务器对接收到的所述声纹特征进行辨认”的过程是:所述声纹辨认处理服务器将所述声纹特征与自有的所述分片声纹库中的所有的声纹模型进行相似度匹配计算后得出相似度分值最高的一组有序序列结果子集;所述有序序列结果子集即为所述辨认结果。
7.根据权利要求6所述的大数据并行化声纹辨认方法,其特征在于,在所述步骤S5中,所述的“最优的所述声纹预处理服务器根据多个所述声纹辨认处理服务器反馈的所述辨认结果得出最终辨认结果”的过程是:所述最优的所述声纹预处理服务器将各个所述声纹辨认处理服务器的有序序列结果子集按照高分优先序列进行重组,计算每一个相似度分值,再度进行全局排序,得出最终有序结果子集;所述最终有序结果子集即为所述最终辨认结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911146300.XA CN111048100B (zh) | 2019-11-21 | 2019-11-21 | 一种大数据并行化声纹辨认系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911146300.XA CN111048100B (zh) | 2019-11-21 | 2019-11-21 | 一种大数据并行化声纹辨认系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111048100A CN111048100A (zh) | 2020-04-21 |
CN111048100B true CN111048100B (zh) | 2023-09-08 |
Family
ID=70232867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911146300.XA Active CN111048100B (zh) | 2019-11-21 | 2019-11-21 | 一种大数据并行化声纹辨认系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111048100B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1556522A (zh) * | 2004-01-06 | 2004-12-22 | 中国人民解放军保密委员会技术安全研 | 电话信道说话人声纹识别系统 |
JP2007052496A (ja) * | 2005-08-15 | 2007-03-01 | Advanced Media Inc | ユーザ認証システム及びユーザ認証方法 |
CN101447188A (zh) * | 2007-11-27 | 2009-06-03 | 北京金运昭德数字科技有限公司 | 数字声纹鉴定系统及确认和辨认方法 |
CN101740031A (zh) * | 2010-01-21 | 2010-06-16 | 安徽科大讯飞信息科技股份有限公司 | 一种基于网络动态负载均衡的声纹识别系统及其识别方法 |
CN106209786A (zh) * | 2016-06-27 | 2016-12-07 | 四川阿泰因机器人智能装备有限公司 | 一种大数据并行化声纹认证方法 |
WO2017012496A1 (zh) * | 2015-07-23 | 2017-01-26 | 阿里巴巴集团控股有限公司 | 一种用户声纹模型构建方法、装置及系统 |
WO2018149077A1 (zh) * | 2017-02-16 | 2018-08-23 | 平安科技(深圳)有限公司 | 声纹识别方法、装置、存储介质和后台服务器 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6539352B1 (en) * | 1996-11-22 | 2003-03-25 | Manish Sharma | Subword-based speaker verification with multiple-classifier score fusion weight and threshold adaptation |
US8374865B1 (en) * | 2012-04-26 | 2013-02-12 | Google Inc. | Sampling training data for an automatic speech recognition system based on a benchmark classification distribution |
US9542947B2 (en) * | 2013-03-12 | 2017-01-10 | Google Technology Holdings LLC | Method and apparatus including parallell processes for voice recognition |
KR102246900B1 (ko) * | 2014-07-29 | 2021-04-30 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
-
2019
- 2019-11-21 CN CN201911146300.XA patent/CN111048100B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1556522A (zh) * | 2004-01-06 | 2004-12-22 | 中国人民解放军保密委员会技术安全研 | 电话信道说话人声纹识别系统 |
JP2007052496A (ja) * | 2005-08-15 | 2007-03-01 | Advanced Media Inc | ユーザ認証システム及びユーザ認証方法 |
CN101447188A (zh) * | 2007-11-27 | 2009-06-03 | 北京金运昭德数字科技有限公司 | 数字声纹鉴定系统及确认和辨认方法 |
CN101740031A (zh) * | 2010-01-21 | 2010-06-16 | 安徽科大讯飞信息科技股份有限公司 | 一种基于网络动态负载均衡的声纹识别系统及其识别方法 |
WO2017012496A1 (zh) * | 2015-07-23 | 2017-01-26 | 阿里巴巴集团控股有限公司 | 一种用户声纹模型构建方法、装置及系统 |
CN106209786A (zh) * | 2016-06-27 | 2016-12-07 | 四川阿泰因机器人智能装备有限公司 | 一种大数据并行化声纹认证方法 |
WO2018149077A1 (zh) * | 2017-02-16 | 2018-08-23 | 平安科技(深圳)有限公司 | 声纹识别方法、装置、存储介质和后台服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN111048100A (zh) | 2020-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8886635B2 (en) | Apparatus and method for recognizing content using audio signal | |
EP2685450B1 (en) | Device and method for recognizing content using audio signals | |
US8064641B2 (en) | System and method for identifying objects in video | |
CN103440867B (zh) | 语音识别方法及系统 | |
US8315430B2 (en) | Object recognition and database population for video indexing | |
CN106453437B (zh) | 一种设备识别码获取方法及装置 | |
US20130346412A1 (en) | System and method of detecting common patterns within unstructured data elements retrieved from big data sources | |
CN113255694A (zh) | 训练图像特征提取模型和提取图像特征的方法、装置 | |
CN109711298B (zh) | 基于faiss的高效人脸特征值检索的方法和系统 | |
US20190238797A1 (en) | Method, device, and storage medium for processing webcam data | |
CN110889009B (zh) | 一种声纹聚类方法、装置、处理设备以及计算机存储介质 | |
CN113110995A (zh) | 系统迁移的测试方法及装置 | |
CN111368867B (zh) | 档案归类方法及系统、计算机可读存储介质 | |
CN111625342B (zh) | 一种数据溯源方法、装置及服务器 | |
CN111048100B (zh) | 一种大数据并行化声纹辨认系统和方法 | |
CN104166837B (zh) | 采用最相关的兴趣点的各组的选择的视觉语音识别方法 | |
CN111444364A (zh) | 一种图像检测方法和装置 | |
CN103247316A (zh) | 一种音频检索中构建索引的方法及系统 | |
CN115409553A (zh) | 一种基于大数据和位置信息的广告投放系统及其方法 | |
CN111209100B (zh) | 一种业务处理和数据源确定方法 | |
CN114444514A (zh) | 语义匹配模型训练、语义匹配方法及相关装置 | |
CN117076612B (zh) | 一种呼叫中心大数据文本挖掘系统 | |
CN117131256B (zh) | 一种基于aigc的媒体管理系统 | |
CN113593546B (zh) | 终端设备唤醒方法和装置、存储介质及电子装置 | |
CN114093362A (zh) | 一种音频转换的方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |