CN105244031A - 说话人识别方法和装置 - Google Patents
说话人识别方法和装置 Download PDFInfo
- Publication number
- CN105244031A CN105244031A CN201510702800.2A CN201510702800A CN105244031A CN 105244031 A CN105244031 A CN 105244031A CN 201510702800 A CN201510702800 A CN 201510702800A CN 105244031 A CN105244031 A CN 105244031A
- Authority
- CN
- China
- Prior art keywords
- vocal print
- voice
- sample
- voice data
- print sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种说话人识别方法和装置。该方法包括:采集说话人的音频数据;提取所述音频数据的声纹特征;在声纹数据库中搜索具有所述声纹特征的声纹样本,所述声纹数据库保存身份信息和声纹样本的对应关系;根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息。本发明提高了语音监控的效率,为公共安全提供了保障。
Description
技术领域
本发明实施例涉及语音监控技术,尤其涉及一种说话人识别方法和装置。
背景技术
随着信息时代的到来,语音监控已经成为公共安全领域的重要技术手段之一。
现有技术中,主要采取人工侦听的方式来进行语音监控,随着互联网数据量的海量爆发,人工侦听方法存在的在线侦听工作量大、工作效率较低、侦听人员不足的问题日益突出,导致无法提前追踪侦测音频数据中所存在的大量违法犯罪线索信息。特别是对于地域分布广和语种分布多样的案件,熟悉小语种和各种方言的工作人员非常少,导致数据量的积压。因此,现有技术中采用人工侦听方法的语音监控的效率较低。
发明内容
有鉴于此,本发明实施例提供一种说话人识别方法和装置,以提高语音监控的效率。
第一方面,本发明实施例提供了一种说话人识别方法,所述方法包括:
采集说话人的音频数据;
提取所述音频数据的声纹特征;
在声纹数据库中搜索具有所述声纹特征的声纹样本,所述声纹数据库保存身份信息和声纹样本的对应关系;
根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息。
第二方面,本发明实施例还提供了一种说话人识别装置,所述装置包括:
音频数据采集模块,用于采集说话人的音频数据;
声纹特征提取模块,用于提取所述音频数据的声纹特征;
声纹样本搜索模块,用于在声纹数据库中搜索具有所述声纹特征的声纹样本,所述声纹数据库保存身份信息和声纹样本的对应关系;
身份信息确定模块,用于根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息。
本发明实施例通过将采集到的说话人的音频数据的声纹特征,与声纹数据库中的声纹样本的声纹特征进行比对,得到特征接近的声纹样本,根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息,提高了语音监控的效率,为公共安全提供了保障。
附图说明
图1是本发明实施例一提供的一种说话人识别方法的流程图;
图2是本发明实施例提供的说话人识别方法中的说话人识别系统的整体架构图;
图3是本发明实施例提供的说话人识别方法中的麦克风阵列语音增强系统的应用环境的示意图;
图4是本发明实施例提供的说话人识别方法中的录入声纹样本时录入身份信息的界面示意图;
图5是本发明实施例二提供的一种说话人识别方法的流程图;
图6是本发明实施例三提供的一种说话人识别装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
图1是本发明实施例一提供的一种说话人识别方法的流程图,本实施例可适用于识别语音监控中得到的音频数据的说话人身份信息的情况,该方法可以由说话人识别系统来执行,该系统可通过软件和/或硬件的方式实现。
图2是本发明实施例提供的说话人识别方法中的说话人识别系统的整体架构图,如图2所示,该说话人识别系统包括数据应用层、服务层、数据层和声纹采集层。其中,声纹采集层用于采集说话人的音频数据或者采集声纹样本,采集手段包括电信监控(如手机电话)、网络监控(如网络电话、米聊和微信等)、人员注册、出入境采集、路面核查采集、重点人员采集及其他采集手段;数据层用于存储声纹数据和系统数据,由于数据量比较大,主要采取分布式文件存储的方式,同时对存储的数据进行标准管理、质量管理和运行管理,系统数据主要存储声纹比对的结果数据;服务层包括声纹工具集、分析研判工具集、应用开发工具集和数据交换服务,其中,声纹工具集包括声纹比对服务、声纹注册服务和分布式计算服务,分析研判工具集包括语种方言、关键词和内容识别,应用开发工具集包括声纹查询、声纹比对和统计分析,数据交换服务包括交换接口、服务注册和服务管理;数据应用层包括声纹采集装备、路面核查系统、入境声纹比对和语音比对,可以用于采集声纹数据,或者通过调用服务层中的应用开发工具集进行实时的声纹比对,确定嫌疑人。其中,声纹工具集主要用于将采集到声纹样本分布式存储到数据层的数据库中;分析研判工具集主要用于根据关键信息进行人工研判,应用开发工具集主要用于根据说话人的音频数据对说话人进行身份识别;数据交换服务主要用于与音频数据的采集系统、声纹样本的录入系统及其他系统进行数据对接。
由于数据信息安全的需要,在涉及到系统数据对接时,将使用虚拟VPN(VirtualPrivateNetwork,虚拟专用网络)作为数据传输通道。由于在采集音频数据时,会存在与移动端的通信,必须在移动端与语音后台之间使用安全的数据网络,移动端的网络连通性也需要提供有效的保障,满足随时需要进行数据传输的需求,为了降低成本,可以借助于运营商提供的3G或4G网络,通过加密专线的方式接入到语音后台,可以采用VPDN(VirtualPrivateDial-upNetworks,虚拟专用拨号网)的虚拟网络专线,实现移动端与语音后台之间的互联通信。
该方法具体包括如下步骤:
步骤110,采集说话人的音频数据。
通过电信监控、网络监控、路面核查采集、出入境采集、重点人员采集及其他语音采集手段采集说话人的音频数据。其中,重点人员采集是指对重点关注对象的语音采集,主要包括监狱在押犯人等。通过上述监控,当监控到说话人的音频数据可疑时,采集该音频数据。
音频数据的采集来源多样,增加了后续声纹识别的难度。其中,出入境环境下背景噪声严重、说话人远离麦克风,难以有效采集目标人员的语音数据;路面核查环境中,目标对象所在的背景噪声环境和问答式的对话风格,会对声纹识别性能造成较大影响。针对这种难度极大的采集场景,使用麦克风阵列硬件系统采集音频数据,并对采集到的音频数据使用麦克风阵列语音增强系统进行增强。图3是本发明实施例提供的说话人识别方法中的麦克风阵列语音增强系统的应用环境的示意图。如图3所示,麦克风阵列语音增强系统应用的环境比较复杂,对目标源的直达信号造成的干扰包括:干扰源产生的干扰、背景噪声及目标源的反射信号等。
步骤120,提取所述音频数据的声纹特征。
其中,声纹(Voiceprint)是指能唯一识别某人或某物的声音特征,用电声学仪器显示的携带言语信息的声波频谱。声纹具有特定性和相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。基于声纹的这两个特征,侦查人员就可将获取的犯罪分子的声纹和嫌疑人的声纹,通过声纹鉴定技术进行检验对比,迅速认定罪犯,为侦查破案提供可靠的证据。
通过将音频数据输入电声学仪器中,电声学仪器使音频数据中的不同频率的机械振动以频谱图像的形式显示出来,这种频谱图像就是声纹,将该频谱图像记录下来,并记录声纹的特征参数,就提取出了声纹特征。
步骤130,在声纹数据库中搜索具有所述声纹特征的声纹样本,所述声纹数据库保存身份信息和声纹样本的对应关系。
声纹数据库技术是我国继指纹、DNA库后又一个生物特征库技术,为公共安全领域提供一套新的个体识别应用平台。通过建立的关键人声纹数据库和应用基于智能语音技术的语音监控系统能快速确认说话人身份、语种、方言口音以及检测通话中的敏感内容,为诸如案件侦破过程提供新的线索和证据,对于提高音频数据的监控效率,优化音频数据监控方式,提高监控质量将起到积极的推动作用,在维护国家安全、打击违法犯罪工作、打击恐怖主义的公共安全领域中均具有非常重要的意义。
声纹数据库保存了大量的关键人的身份信息、声纹样本及声纹特征等信息。通过以声纹特征为根据,在声纹数据库中搜索具有所述声纹特征的声纹样本,根据声纹样本与身份信息的对应关系即可确定说话人的身份信息。其中,声纹样本为一段语音,根据该语音可以提取出相应的声纹特征。
其中,声纹数据库系统为能够存储海量声纹数据的分布式数据库系统,将声纹数据库根据声纹的来源与特征可以划分为多个字库,包括:关键人对象库、历史查询库、业务数据库和人员信息库等。
其中,关键人对象库中包含通过各种渠道采集的关键人的声纹样本,其中某些数据有明确对应的人员信息,与人员信息库中的数据共同形成声纹档案。该声纹档案可按人员类别、人员属性等多个维度进行组织和存放;历史查询库存放由用户提交的历史查询数据;业务数据库可提供声纹预警,也可以综合利用关键词、语种和内容识别等技术进行分析研判;人员信息库包含声纹档案对应的人员基本信息与社会属性,主要由基础信息、动态信息共同组成,基础信息如姓名、身份证号、违法犯罪记录等。
步骤140,根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息。
根据在声纹数据库中搜索得到的声纹样本,由声纹样本与身份信息的对应关系,可以确定说话人的身份信息。
本实施例通过采集说话人的音频数据,提取所述音频数据的声纹特征,在声纹数据库中搜索具有所述声纹特征的声纹样本,所述声纹数据库保存身份信息和声纹样本的对应关系,根据所述声纹及声纹样本与身份信息的对应关系,确定所述说话人的身份信息,可以为人工侦听提供有效辅助,提高了语音监控的效率,为公共安全提供了保障。
在上述技术方案的基础上,在采集说话人的音频数据之前,还包括:
采集已知身份的说话人的音频数据,提取该音频数据的声纹特征,该音频数据、与该音频数据对应的声纹特征及身份信息形成声纹样本,将该声纹样本保存到声纹数据库中。
通过电信监控、网络监控、人员注册、出入境采集、路面核查采集、重点人员采集等采集手段采集已知身份的说话人的音频数据,该音频数据与对应的声纹特征及身份信息形成声纹样本,保存到数据库中,便于后续采集到未知身份的说话人的音频数据时,与声纹数据库中的声纹样本进行比对,从而确定该未知身份的说话人的身份信息。其中,在出入境采集及路面核查采集等采集环境比较复杂的情况下可以使用麦克风阵列进行采集,使用麦克风阵列语音增强系统对采集到的音频数据进行增强处理,保存处理后的音频数据及对应的声纹特征和身份信息。在将声纹样本保存到声纹数据库中时,可以将一些特殊手段(如人员注册)采集到的声纹样本对应的身份信息录入到声纹数据库中,如图4所示,主要录入姓名、身份证号、户籍所在地等一些基本信息。图4是本发明实施例提供的说话人识别方法中的录入声纹样本时录入身份信息的界面示意图。
实施例二
图5是本发明实施例二提供的一种说话人识别方法的流程图,本实施例以实施例一为基础实施例一进行了优化,增加了对音频数据进行语音识别得到语音文本并提取语音文本中的关键词的操作,进而将在声纹数据库中搜索具有所述声纹特征的声纹样本优化为根据关键词在声纹数据库中搜索具有所述关键词的声纹样本,并计算声纹特征与声纹样本中的声纹特征的相似度,提取相似度超过设定阈值的声纹样本。该方法具体包括如下步骤:
步骤510,采集说话人的音频数据。
步骤520,对所述音频数据进行语音识别,得到语音文本。
语音识别就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。通过对所述音频数据进行语音识别,从而可以得到该音频数据中的语音文本。
步骤530,提取所述语音文本中的关键词。
利用中文分词技术对所述语音文本进行分词,并提取出所述语音文本中的关键词。
步骤540,提取所述音频数据的声纹特征。
上述步骤520和步骤530也可以在步骤540之后,即可以先提取所述音频数据的声纹特征,再对音频数据进行语音识别,得到语音文本,提取所述语音文本中的关键词。
步骤550,根据所述关键词,在声纹数据库中搜索具有所述关键词的声纹样本。
根据提取出的关键词,以该关键词为索引在声纹数据库中搜索具有该关键词的声纹样本,从而在声纹数据库中筛选出符合要求的声纹样本,缩小后续声纹比对的范围,从而加快速度。
优选的,在声纹数据库中搜索具有所述关键词的声纹样本之后,还包括:
在搜索结果中标注所述关键词所出现的时间位置。
显示搜索到的声纹样本,并在搜索结果中标注所述关键词所出现的精确时间为准,时间可以精确到秒。
优选的,该说话人识别方法还包括:
提供声纹数据库搜索入口,供用户通过关键词查询声纹样本。
声纹数据库搜索入口与搜索引擎的搜索入口相似,从而供用户根据关键词查询具有该关键词的声纹样本。在该搜索入口,用户也可根据关键词+声纹对象进行联合检索,即支持输入关键词并选中已有声纹对象进行联合查询的功能,能最大限度的缩小查询结果集的范围,迅速定位声纹对象所说过的包含特定关键词的音频数据,方便监控人员迅速定位语音线索。
步骤560,计算所述声纹特征与所述声纹样本的声纹特征的相似度。
根据相似度计算公式,计算说话人的音频数据的声纹特征与根据关键词搜索到的声纹样本的声纹特征的相似度,并对得到的相似度进行排名(如以相似度从大到小的形式进行排名),并显示各个相似度的排名结果,从而可以供用户进行人工研判。
步骤570,提取相似度超过设定阈值的声纹样本。
根据计算得到的相似度,提取出相似度超过设定阈值的声纹样本。用户也可以根据显示的相似度的排名结果选择相似度最大的声纹样本,从而提取出该相似度最大的声纹样本。
步骤580,根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息。
本实施例通过采集说话人的音频数据,对所述音频数据进行语音识别得到语音文本,并提取语音文本中的关键词,提取音频数据的声纹特征,根据所述关键词在声纹数据库中搜索具有该关键词的声纹样本,计算声纹特征与声纹样本的声纹特征的相似度,提取相似度超过设定阈值的声纹样本,根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息,提高了语音监控的效率,与实施例一相比,并实施例先根据音频数据的语音文本中的关键词在声纹数据库中搜索相关的声纹样本,后续再将声纹样本的声纹特征与声纹特征进行比对,计算相似度,根据相似度超过设定值的声纹样本,可以确定说话人的身份信息,进一步提高了声纹比对的速度,从而进一步提高了语音监控的效率。
实施例三
图6是本发明实施例三提供的一种说话人识别装置的结构示意图。如图6所示,本实施例所述的说话人识别装置包括:音频数据采集模块610、声纹特征提取模块620、声纹样本搜索模块630和身份信息确定模块640。
其中,音频数据采集模块610用于采集说话人的音频数据;
声纹特征提取模块620用于提取所述音频数据的声纹特征;
声纹样本搜索模块630用于在声纹数据库中搜索具有所述声纹特征的声纹样本,所述声纹数据库保存身份信息和声纹样本的对应关系;
身份信息确定模块640用于根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息。
优选的,该说话人识别装置还包括:
语音识别模块,用于在采集说话人的音频数据之后,对所述音频数据进行语音识别,得到语音文本;
关键词提取模块,用于提取所述语音文本中的关键词;
所述声纹样本搜索模块包括:
声纹样本搜索单元,用于根据所述关键词,在声纹数据库中搜索具有所述关键词的声纹样本;
相似度计算单元,用于计算所述声纹特征与所述声纹样本的声纹特征的相似度;
声纹样本提取单元,用于提取相似度超过设定阈值的声纹样本。
优选的,所述声纹样本搜索模块还包括:
时间位置标注单元,用于在声纹数据库中搜索具有所述关键词的声纹样本之后,在搜索结果中标注所述关键词所出现的时间位置。
优选的,该说话人识别装置还包括:
搜索入口提供模块,用于提供声纹数据库搜索入口,供用户通过关键词查询声纹样本。
优选的,该说话人识别装置还包括:
声纹样本采集模块,用于在采集说话人的音频数据之前,采集已知身份的说话人的音频数据,提取该音频数据的声纹特征,该音频数据、与该音频数据对应的声纹样本及身份信息形成声纹样本,将该声纹样本保存到声纹数据库中。
上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种说话人识别方法,其特征在于,所述方法包括:
采集说话人的音频数据;
提取所述音频数据的声纹特征;
在声纹数据库中搜索具有所述声纹特征的声纹样本,所述声纹数据库保存身份信息和声纹样本的对应关系;
根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息。
2.根据权利要求1所述的方法,其特征在于,在采集说话人的音频数据之后,还包括:
对所述音频数据进行语音识别,得到语音文本;
提取所述语音文本中的关键词;
在声纹数据库中搜索具有所述声纹特征的声纹样本,包括:
根据所述关键词,在声纹数据库中搜索具有所述关键词的声纹样本;
计算所述声纹特征与所述声纹样本的声纹特征的相似度;
提取相似度超过设定阈值的声纹样本。
3.根据权利要求2所述的方法,其特征在于,在声纹数据库中搜索具有所述关键词的声纹样本之后,还包括:
在搜索结果中标注所述关键词所出现的时间位置。
4.根据权利要求2所述的方法,其特征在于,还包括:
提供声纹数据库搜索入口,供用户通过关键词查询声纹样本。
5.根据权利要求1-4任一所述的方法,其特征在于,在采集说话人的音频数据之前,还包括:
采集已知身份的说话人的音频数据,提取该音频数据的声纹特征,该音频数据、与该音频数据对应的声纹特征及身份信息形成声纹样本,将该声纹样本保存到声纹数据库中。
6.一种说话人识别装置,其特征在于,所述装置包括:
音频数据采集模块,用于采集说话人的音频数据;
声纹特征提取模块,用于提取所述音频数据的声纹特征;
声纹样本搜索模块,用于在声纹数据库中搜索具有所述声纹特征的声纹样本,所述声纹数据库保存身份信息和声纹样本的对应关系;
身份信息确定模块,用于根据所述声纹样本及声纹样本与身份信息的对应关系,确定所述说话人的身份信息。
7.根据权利要求6所述的装置,其特征在于,还包括:
语音识别模块,用于在采集说话人的音频数据之后,对所述音频数据进行语音识别,得到语音文本;
关键词提取模块,用于提取所述语音文本中的关键词;
所述声纹样本搜索模块包括:
声纹样本搜索单元,用于根据所述关键词,在声纹数据库中搜索具有所述关键词的声纹样本;
相似度计算单元,用于计算所述声纹特征与所述声纹样本的声纹特征的相似度;
声纹样本提取单元,用于提取相似度超过设定阈值的声纹样本。
8.根据权利要求7所述的装置,其特征在于,所述声纹样本搜索模块还包括:
时间位置标注单元,用于在声纹数据库中搜索具有所述关键词的声纹样本之后,在搜索结果中标注所述关键词所出现的时间位置。
9.根据权利要求7所述的装置,其特征在于,还包括:
搜索入口提供模块,用于提供声纹数据库搜索入口,供用户通过关键词查询声纹样本。
10.根据权利要求6-9任一所述的装置,其特征在于,还包括:
声纹样本采集模块,用于在采集说话人的音频数据之前,采集已知身份的说话人的音频数据,提取该音频数据的声纹特征,该音频数据、与该音频数据对应的声纹样本及身份信息形成声纹样本,将该声纹样本保存到声纹数据库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510702800.2A CN105244031A (zh) | 2015-10-26 | 2015-10-26 | 说话人识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510702800.2A CN105244031A (zh) | 2015-10-26 | 2015-10-26 | 说话人识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105244031A true CN105244031A (zh) | 2016-01-13 |
Family
ID=55041653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510702800.2A Pending CN105244031A (zh) | 2015-10-26 | 2015-10-26 | 说话人识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105244031A (zh) |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869644A (zh) * | 2016-05-25 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 基于深度学习的声纹认证方法和装置 |
CN105895101A (zh) * | 2016-06-08 | 2016-08-24 | 国网上海市电力公司 | 用于电力智能辅助服务系统的语音处理设备及处理方法 |
CN106200853A (zh) * | 2016-07-02 | 2016-12-07 | 上海与德通讯技术有限公司 | 一种唤醒电路及唤醒方法 |
CN106373577A (zh) * | 2016-08-18 | 2017-02-01 | 胡伟 | 一种个人语音系统 |
CN106548786A (zh) * | 2015-09-18 | 2017-03-29 | 广州酷狗计算机科技有限公司 | 一种音频数据的检测方法及系统 |
CN106952645A (zh) * | 2017-03-24 | 2017-07-14 | 广东美的制冷设备有限公司 | 语音指令的识别方法、语音指令的识别装置和空调器 |
CN107862060A (zh) * | 2017-11-15 | 2018-03-30 | 吉林大学 | 一种追踪目标人的语义识别装置及识别方法 |
CN107993666A (zh) * | 2017-12-19 | 2018-05-04 | 北京华夏电通科技有限公司 | 语音识别方法、装置、计算机设备及可读存储介质 |
CN108012037A (zh) * | 2017-11-26 | 2018-05-08 | 合肥赛为智能有限公司 | 一种监狱外拨电话管理系统 |
CN108091340A (zh) * | 2016-11-22 | 2018-05-29 | 北京京东尚科信息技术有限公司 | 声纹识别方法和声纹识别系统 |
CN109036434A (zh) * | 2018-08-07 | 2018-12-18 | 广州势必可赢网络科技有限公司 | 一种通过声纹协助案件侦破的方法、装置及设备 |
CN109036436A (zh) * | 2018-09-18 | 2018-12-18 | 广州势必可赢网络科技有限公司 | 一种声纹数据库建立方法、声纹识别方法、装置及系统 |
CN109063165A (zh) * | 2018-08-15 | 2018-12-21 | 深圳市诺信连接科技有限责任公司 | 一种erp文件查询管理系统 |
CN109192213A (zh) * | 2018-08-21 | 2019-01-11 | 平安科技(深圳)有限公司 | 庭审语音实时转写方法、装置、计算机设备及存储介质 |
CN109410956A (zh) * | 2018-12-24 | 2019-03-01 | 科大讯飞股份有限公司 | 一种音频数据的对象识别方法、装置、设备及存储介质 |
CN109816217A (zh) * | 2019-01-04 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 案件处理方法、装置、计算机设备和存储介质 |
CN110021307A (zh) * | 2019-04-04 | 2019-07-16 | Oppo广东移动通信有限公司 | 音频校验方法、装置、存储介质及电子设备 |
WO2019227583A1 (zh) * | 2018-05-29 | 2019-12-05 | 平安科技(深圳)有限公司 | 一种声纹识别方法、装置、终端设备及存储介质 |
CN110671792A (zh) * | 2019-05-08 | 2020-01-10 | 青岛海尔空调器有限总公司 | 用于控制出风风量和出音音量的方法、装置和空调室内机 |
CN110827829A (zh) * | 2019-10-24 | 2020-02-21 | 秒针信息技术有限公司 | 一种基于语音识别的客流分析方法和系统 |
CN110941737A (zh) * | 2019-12-06 | 2020-03-31 | 广州国音智能科技有限公司 | 单机语音存储方法、装置、设备及可读存储介质 |
CN110970035A (zh) * | 2019-12-06 | 2020-04-07 | 广州国音智能科技有限公司 | 单机语音识别方法、装置及计算机可读存储介质 |
CN111028845A (zh) * | 2019-12-06 | 2020-04-17 | 广州国音智能科技有限公司 | 多音频识别方法、装置、设备及可读存储介质 |
CN111201570A (zh) * | 2017-10-13 | 2020-05-26 | 思睿逻辑国际半导体有限公司 | 分析话语信号 |
CN111862933A (zh) * | 2020-07-20 | 2020-10-30 | 北京字节跳动网络技术有限公司 | 用于生成合成语音的方法、装置、设备和介质 |
CN111856399A (zh) * | 2019-04-26 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 基于声音的定位识别方法、装置、电子设备及存储介质 |
CN112231510A (zh) * | 2020-12-17 | 2021-01-15 | 北京远鉴信息技术有限公司 | 声纹存储方法、声纹查询方法、服务器及存储介质 |
US11631402B2 (en) | 2018-07-31 | 2023-04-18 | Cirrus Logic, Inc. | Detection of replay attack |
US11694695B2 (en) | 2018-01-23 | 2023-07-04 | Cirrus Logic, Inc. | Speaker identification |
US11704397B2 (en) | 2017-06-28 | 2023-07-18 | Cirrus Logic, Inc. | Detection of replay attack |
US11705135B2 (en) | 2017-10-13 | 2023-07-18 | Cirrus Logic, Inc. | Detection of liveness |
US11714888B2 (en) | 2017-07-07 | 2023-08-01 | Cirrus Logic Inc. | Methods, apparatus and systems for biometric processes |
US11748462B2 (en) | 2018-08-31 | 2023-09-05 | Cirrus Logic Inc. | Biometric authentication |
US11755701B2 (en) | 2017-07-07 | 2023-09-12 | Cirrus Logic Inc. | Methods, apparatus and systems for authentication |
US11829461B2 (en) | 2017-07-07 | 2023-11-28 | Cirrus Logic Inc. | Methods, apparatus and systems for audio playback |
CN117153163A (zh) * | 2023-10-08 | 2023-12-01 | 桂林航天工业学院 | 基于语音交互的手部康复方法、系统、存储介质及终端 |
WO2024077588A1 (en) * | 2022-10-14 | 2024-04-18 | Qualcomm Incorporated | Voice-based user authentication |
US12026241B2 (en) | 2017-06-27 | 2024-07-02 | Cirrus Logic Inc. | Detection of replay attack |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004094158A (ja) * | 2002-09-04 | 2004-03-25 | Ntt Comware Corp | 母音検索を利用した声紋認証装置 |
CN101447188A (zh) * | 2007-11-27 | 2009-06-03 | 北京金运昭德数字科技有限公司 | 数字声纹鉴定系统及确认和辨认方法 |
CN202261808U (zh) * | 2011-11-03 | 2012-05-30 | 于斐斐 | 一种手机声纹验证系统 |
CN102496366A (zh) * | 2011-12-20 | 2012-06-13 | 上海理工大学 | 一种与文本无关的说话人识别方法 |
CN103915096A (zh) * | 2014-04-15 | 2014-07-09 | 胡上杰 | 警务声纹识别方法 |
-
2015
- 2015-10-26 CN CN201510702800.2A patent/CN105244031A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004094158A (ja) * | 2002-09-04 | 2004-03-25 | Ntt Comware Corp | 母音検索を利用した声紋認証装置 |
CN101447188A (zh) * | 2007-11-27 | 2009-06-03 | 北京金运昭德数字科技有限公司 | 数字声纹鉴定系统及确认和辨认方法 |
CN202261808U (zh) * | 2011-11-03 | 2012-05-30 | 于斐斐 | 一种手机声纹验证系统 |
CN102496366A (zh) * | 2011-12-20 | 2012-06-13 | 上海理工大学 | 一种与文本无关的说话人识别方法 |
CN103915096A (zh) * | 2014-04-15 | 2014-07-09 | 胡上杰 | 警务声纹识别方法 |
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106548786A (zh) * | 2015-09-18 | 2017-03-29 | 广州酷狗计算机科技有限公司 | 一种音频数据的检测方法及系统 |
CN106548786B (zh) * | 2015-09-18 | 2020-06-30 | 广州酷狗计算机科技有限公司 | 一种音频数据的检测方法及系统 |
CN105869644A (zh) * | 2016-05-25 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 基于深度学习的声纹认证方法和装置 |
CN105895101A (zh) * | 2016-06-08 | 2016-08-24 | 国网上海市电力公司 | 用于电力智能辅助服务系统的语音处理设备及处理方法 |
CN106200853A (zh) * | 2016-07-02 | 2016-12-07 | 上海与德通讯技术有限公司 | 一种唤醒电路及唤醒方法 |
CN106373577A (zh) * | 2016-08-18 | 2017-02-01 | 胡伟 | 一种个人语音系统 |
CN108091340B (zh) * | 2016-11-22 | 2020-11-03 | 北京京东尚科信息技术有限公司 | 声纹识别方法、声纹识别系统和计算机可读存储介质 |
CN108091340A (zh) * | 2016-11-22 | 2018-05-29 | 北京京东尚科信息技术有限公司 | 声纹识别方法和声纹识别系统 |
CN106952645A (zh) * | 2017-03-24 | 2017-07-14 | 广东美的制冷设备有限公司 | 语音指令的识别方法、语音指令的识别装置和空调器 |
US12026241B2 (en) | 2017-06-27 | 2024-07-02 | Cirrus Logic Inc. | Detection of replay attack |
US11704397B2 (en) | 2017-06-28 | 2023-07-18 | Cirrus Logic, Inc. | Detection of replay attack |
US11829461B2 (en) | 2017-07-07 | 2023-11-28 | Cirrus Logic Inc. | Methods, apparatus and systems for audio playback |
US11755701B2 (en) | 2017-07-07 | 2023-09-12 | Cirrus Logic Inc. | Methods, apparatus and systems for authentication |
US11714888B2 (en) | 2017-07-07 | 2023-08-01 | Cirrus Logic Inc. | Methods, apparatus and systems for biometric processes |
US11705135B2 (en) | 2017-10-13 | 2023-07-18 | Cirrus Logic, Inc. | Detection of liveness |
CN111201570A (zh) * | 2017-10-13 | 2020-05-26 | 思睿逻辑国际半导体有限公司 | 分析话语信号 |
CN107862060B (zh) * | 2017-11-15 | 2021-03-23 | 吉林大学 | 一种追踪目标人的语义识别装置及识别方法 |
CN107862060A (zh) * | 2017-11-15 | 2018-03-30 | 吉林大学 | 一种追踪目标人的语义识别装置及识别方法 |
CN108012037A (zh) * | 2017-11-26 | 2018-05-08 | 合肥赛为智能有限公司 | 一种监狱外拨电话管理系统 |
CN108012037B (zh) * | 2017-11-26 | 2021-01-01 | 合肥赛为智能有限公司 | 一种监狱外拨电话管理系统 |
CN107993666A (zh) * | 2017-12-19 | 2018-05-04 | 北京华夏电通科技有限公司 | 语音识别方法、装置、计算机设备及可读存储介质 |
US11694695B2 (en) | 2018-01-23 | 2023-07-04 | Cirrus Logic, Inc. | Speaker identification |
WO2019227583A1 (zh) * | 2018-05-29 | 2019-12-05 | 平安科技(深圳)有限公司 | 一种声纹识别方法、装置、终端设备及存储介质 |
US11631402B2 (en) | 2018-07-31 | 2023-04-18 | Cirrus Logic, Inc. | Detection of replay attack |
CN109036434A (zh) * | 2018-08-07 | 2018-12-18 | 广州势必可赢网络科技有限公司 | 一种通过声纹协助案件侦破的方法、装置及设备 |
CN109063165A (zh) * | 2018-08-15 | 2018-12-21 | 深圳市诺信连接科技有限责任公司 | 一种erp文件查询管理系统 |
CN109063165B (zh) * | 2018-08-15 | 2022-04-19 | 深圳市诺信连接科技有限责任公司 | 一种erp文件查询管理系统 |
CN109192213B (zh) * | 2018-08-21 | 2023-10-20 | 平安科技(深圳)有限公司 | 庭审语音实时转写方法、装置、计算机设备及存储介质 |
CN109192213A (zh) * | 2018-08-21 | 2019-01-11 | 平安科技(深圳)有限公司 | 庭审语音实时转写方法、装置、计算机设备及存储介质 |
US11748462B2 (en) | 2018-08-31 | 2023-09-05 | Cirrus Logic Inc. | Biometric authentication |
CN109036436A (zh) * | 2018-09-18 | 2018-12-18 | 广州势必可赢网络科技有限公司 | 一种声纹数据库建立方法、声纹识别方法、装置及系统 |
CN109410956B (zh) * | 2018-12-24 | 2021-10-08 | 科大讯飞股份有限公司 | 一种音频数据的对象识别方法、装置、设备及存储介质 |
CN109410956A (zh) * | 2018-12-24 | 2019-03-01 | 科大讯飞股份有限公司 | 一种音频数据的对象识别方法、装置、设备及存储介质 |
CN109816217A (zh) * | 2019-01-04 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 案件处理方法、装置、计算机设备和存储介质 |
CN110021307A (zh) * | 2019-04-04 | 2019-07-16 | Oppo广东移动通信有限公司 | 音频校验方法、装置、存储介质及电子设备 |
CN111856399A (zh) * | 2019-04-26 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 基于声音的定位识别方法、装置、电子设备及存储介质 |
CN111856399B (zh) * | 2019-04-26 | 2023-06-30 | 北京嘀嘀无限科技发展有限公司 | 基于声音的定位识别方法、装置、电子设备及存储介质 |
CN110671792A (zh) * | 2019-05-08 | 2020-01-10 | 青岛海尔空调器有限总公司 | 用于控制出风风量和出音音量的方法、装置和空调室内机 |
CN110827829A (zh) * | 2019-10-24 | 2020-02-21 | 秒针信息技术有限公司 | 一种基于语音识别的客流分析方法和系统 |
CN111028845A (zh) * | 2019-12-06 | 2020-04-17 | 广州国音智能科技有限公司 | 多音频识别方法、装置、设备及可读存储介质 |
CN110941737B (zh) * | 2019-12-06 | 2023-01-20 | 广州国音智能科技有限公司 | 单机语音存储方法、装置、设备及可读存储介质 |
CN110970035A (zh) * | 2019-12-06 | 2020-04-07 | 广州国音智能科技有限公司 | 单机语音识别方法、装置及计算机可读存储介质 |
CN110941737A (zh) * | 2019-12-06 | 2020-03-31 | 广州国音智能科技有限公司 | 单机语音存储方法、装置、设备及可读存储介质 |
CN111862933A (zh) * | 2020-07-20 | 2020-10-30 | 北京字节跳动网络技术有限公司 | 用于生成合成语音的方法、装置、设备和介质 |
CN112231510A (zh) * | 2020-12-17 | 2021-01-15 | 北京远鉴信息技术有限公司 | 声纹存储方法、声纹查询方法、服务器及存储介质 |
WO2024077588A1 (en) * | 2022-10-14 | 2024-04-18 | Qualcomm Incorporated | Voice-based user authentication |
CN117153163A (zh) * | 2023-10-08 | 2023-12-01 | 桂林航天工业学院 | 基于语音交互的手部康复方法、系统、存储介质及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105244031A (zh) | 说话人识别方法和装置 | |
CN109600752B (zh) | 一种深度聚类诈骗检测的方法和装置 | |
CN110675288B (zh) | 智能辅助审判方法、装置、计算机设备及存储介质 | |
CN106550155B (zh) | 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统 | |
CN112053221A (zh) | 一种基于知识图谱的互联网金融团伙欺诈行为检测方法 | |
CN107577688B (zh) | 基于媒体信息采集的原创文章影响力分析系统 | |
CN109451182B (zh) | 一种诈骗电话的检测方法和装置 | |
WO2020211354A1 (zh) | 基于说话内容的说话者身份识别方法、装置及存储介质 | |
EP2806425B1 (en) | System and method for speaker verification | |
US11503158B2 (en) | Method and system for fraud clustering by content and biometrics analysis | |
CN103258535A (zh) | 基于声纹识别的身份识别方法及系统 | |
CN107293309B (zh) | 一种基于客户情绪分析提升舆情监控效率的方法 | |
CN110781308B (zh) | 一种基于大数据构建知识图谱的反欺诈系统 | |
CN110334241A (zh) | 客服录音的质检方法、装置、设备及计算机可读存储介质 | |
CN101447188B (zh) | 数字声纹鉴定系统及确认和辨认方法 | |
CN103731832A (zh) | 防电话、短信诈骗的系统和方法 | |
CN111741472B (zh) | 一种GoIP诈骗电话识别方法、系统、介质及设备 | |
CN107562760A (zh) | 一种语音数据处理方法及装置 | |
CN112053222A (zh) | 一种基于知识图谱的互联网金融团伙欺诈行为检测方法 | |
CN103207901B (zh) | 一种基于搜索引擎获取ip地址归属地的方法和装置 | |
CN114896305A (zh) | 一种基于大数据技术的智慧互联网安全平台 | |
CN112001170A (zh) | 一种识别经过变形的敏感词的方法和系统 | |
CN107515852A (zh) | 特定类型信息识别方法及装置 | |
CN113015171A (zh) | 一种具有网络舆情监控及分析功能的系统 | |
CN110737677A (zh) | 一种数据搜索系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160113 |