WO2019127897A1

WO2019127897A1 - 一种自学习声纹识别的更新方法和装置

Info

Publication number: WO2019127897A1
Application number: PCT/CN2018/077535
Authority: WO
Inventors: 陈书东
Original assignee: 广州势必可赢网络科技有限公司
Priority date: 2017-12-29
Filing date: 2018-02-28
Publication date: 2019-07-04
Also published as: CN108231082A

Abstract

本发明公开了一种自学习声纹识别的更新方法和装置。本发明中当用户选择验证时，接收待验证语音并提取待验证声纹特征，判断待验证声纹特征与时间最新的融合声纹特征的匹配值符合预置声纹评估标准的要求，声纹验证通过，判断待验证声纹特征符合融合条件后，将待验证声纹特征作为素材声纹特征，确保满足融合条件的素材声纹特征是用户本人发起的验证操作，选取时间最新的素材声纹特征进行融合得到新的融合声纹特征，整个过程中选取时间最新的素材声纹特征得到新的融合声纹特征，同时选取时间最新的融合声纹特征对待验证声纹特征进行验证，解决了当前的声纹识别技术会因为声纹漂移而降低正确率的技术问题。

Description

一种自学习声纹识别的更新方法和装置

本申请要求于2017年12月29号提交中国专利局、申请号为201711477151.6、发明名称为“一种自学习声纹识别的更新方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及声纹识别技术领域，尤其涉及一种自学习声纹识别的更新方法和装置。

背景技术

随着生物特征识别的发展，声纹识别因其较好的便捷性、稳定性和较高的安全性，在银行、智能家居、移动支付等领域有较大的应用前景。声纹识别，用户按照系统预先设定的规则，注册一定量的语音，当用户需要验证时重新录制验证语音提交给系统进行身份识别。

现有的声纹识别技术都是对声纹进行一次性注册长期使用。但是，随着时间的变化人的声音也会有一定的变化，这种现象被称为声纹漂移，声纹漂移会影响身份识别的正确率。

因此，导致了当前的声纹识别技术会因为声纹漂移而降低正确率的技术问题。

发明内容

本发明实施例提供了一种自学习声纹识别的更新方法和装置，解决了当前的声纹识别技术会因为声纹漂移而降低正确率的技术问题。

本发明提供了一种自学习声纹识别的更新方法，包括：

S1、接收验证指令和待验证语音，根据所述验证指令对所述待验证语音进行声纹特征提取得到待验证声纹特征，并将所述待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；

S2、判断所述匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将所述待验证声纹特征加入自学习观察声纹特征库；

S3、判断预置时间内是否接收到对所述验证指令进行撤销或举报的反馈指令，若否，将所述待验证声纹特征作为新的素材声纹特征加入用户声纹库；

S4、选取用户声纹库中时间最新的第一预置融合数量的素材声纹特征进行融合得到新的融合声纹特征。

作为优选，步骤S2具体包括：

判断所述匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将所述待验证声纹特征加入自学习观察声纹特征库，若否，则声纹验证不通过。

作为优选，步骤S3具体包括：

判断预置时间内是否接收到对所述验证指令进行撤销或举报的反馈指令，若否，将所述待验证声纹特征作为新的素材声纹特征加入用户声纹库，若是，将所述自学习观察声纹特征库中的所述待验证声纹特征移除。

作为优选，步骤S1具体包括：

S11、接收验证指令和待验证语音；

S12、检测所述待验证语音是否符合预置语音质量标准的要求，若是，则执行步骤S13，若否，则声纹验证不通过；

S13、对所述待验证语音进行声纹特征提取得到待验证声纹特征，并将所述待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值。

作为优选，步骤S11之前还包括：

S01、接收注册指令；

S02、接收注册语音；

S03、检测所述注册语音是否满足预置语音质量标准，若是，则执行步骤S04，若否，则提示用户继续输入注册语音并返回步骤S02；

S04、提取所述注册语音的注册声纹特征，并将所述注册声纹特征加入用户声纹库；

S05、判断所述用户声纹库中注册声纹特征的数量是否等于第二预置融合数量，若是，则执行步骤S06，若否，则提示用户继续输入注册语音并返回步骤S02；

S06、选取第二预置融合数量的所述注册声纹特征进行融合得到预置融合声纹特征。

本发明提供了一种自学习声纹识别的更新装置，包括：

第一对比单元，用于接收验证指令和待验证语音，根据所述验证指令对所述待验证语音进行声纹特征提取得到待验证声纹特征，并将所述待验证声纹特征与用户声纹库的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；

第一判断单元，用于判断所述匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将所述待验证声纹特征加入自学习观察声纹特征库；

第二判断单元，用于判断预置时间内是否接收到对所述验证指令进行撤销或举报的反馈指令，若否，将所述待验证声纹特征作为新的素材声纹特征加入用户声纹库；

第一融合单元，用于选取用户声纹库中时间最新的第二预置数量的素材声纹特征进行融合得到新的融合声纹特征。

作为优选，第一判断单元具体包括：

用于判断第一预置对比数量的匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将所述待验证声纹特征加入自学习观察声纹特征库，若否，则声纹验证不通过。

作为优选，第二判断单元具体包括：

用于判断预置时间内是否接收到对所述验证指令进行撤销或举报的反馈指令，若否，将所述待验证声纹特征作为新的素材声纹特征加入用户声纹库，若是，将所述自学习观察声纹特征库中的所述待验证声纹特征移除。

作为优选，第一对比单元具体包括：

第一接收子单元，用于接收验证指令和待验证语音；

第一检测子单元，用于检测所述待验证语音是否符合预置语音质量标准的要求，若是，则触发第一对比子单元，若否，则声纹验证不通过；

第一对比子单元，用于对所述待验证语音进行声纹特征提取得到待验证声纹特征，并将所述待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值。

作为优选，还包括语音注册单元；

第二接收子单元，用于接收注册指令；

第三接收子单元，用于接收注册语音；

第二检测子单元，用于检测所述注册语音是否满足预置语音质量标准，若是，则触发第一提取子单元，若否，则提示用户重新输入注册语音并触发第三接收子单元；

第一提取子单元，用于提取所述注册语音的注册声纹特征，并将所述注册声纹特征加入用户声纹库；

第三判断子单元，用于判断所述用户声纹库中注册声纹特征的数量是否等于第二预置融合数量，若是，则触发第二融合子单元，若否，则提示用户继续输入注册语音并触发第三接收子单元；

第二融合子单元，用于选取第二预置融合数量的所述注册声纹特征进行融合得到预置融合声纹特征。

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明提供了一种自学习声纹识别的更新方法，包括：S1：接收验证指令和待验证语音，根据所述验证指令对所述待验证语音进行声纹特征提取得到待验证声纹特征，并将所述待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；S2：判断所述匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将所述待验证声纹特征加入自学习观察声纹特征库；S3：判断预置时间内是否接收到对所述验证指令进行撤销或举报的反馈指令，若否，将所述待验证声纹特征作为新的素材声纹特征加入用户声纹库；S4：选取用户声纹库中时间最新的第一预置融合数量的声纹特征进行融合得到新的融合声纹特征。

本发明中当用户选择验证时，接收待验证语音并提取待验证声纹特征，判断待验证声纹特征与时间最新的融合声纹特征的匹配值符合预置声纹评估标准的要求时，声纹验证通过，将待验证声纹特征加入自学习观察声纹特征库，判断预置时间内未接收到对验证指令进行撤销或举报的反馈指令后，将待验证声纹特征加入用户声纹库，确保满足融合条件的素材声纹特征是用户本人发起的验证操作，选取用户声纹库中时间最新的素材声纹特征进行融合得到新的融合声纹特征，整个过程中选取时间最新的素材声纹特征得到新的融合声纹特征，同时选取时间最新的融合声纹特征对待验证声纹特征进行验证，实现融合声纹特征的更新使得融合声纹特征始终与用户声音匹配，解决了当前的声纹识别技术会因为声纹漂移而降低正确率的技术问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的一种自学习声纹识别的更新方法的一个实施例的流程示意图；

图2为本发明实施例提供的一种自学习声纹识别的更新方法的另一个实施例的流程示意图；

图3为本发明实施例提供的一种自学习声纹识别的更新装置的一个实施例的结构示意图。

具体实施方式

本发明实施例提供了一种自学习声纹识别的更新方法和装置，解决了声纹漂移影响身份识别正确率的技术问题。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1，本发明实施例提供的一种自学习声纹识别的更新方法的一个实施例，包括：

步骤101：接收验证指令和待验证语音，根据验证指令对待验证语音进行声纹特征提取得到待验证声纹特征，并将待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；

需要说明的是，用户需要验证时点击验证选项，接收到验证指令和待验证语音后，根据验证指令对待验证语音进行声纹特征提取得到待验证声纹特征，利用相似度算法将待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；

特征提取算法包括：MFCC算法、FBank算法和D-vector算法等；

相似度算法包括：SVM算法、Cosine Distance(CDS)算法、LDA算法和PLDA算法等；

实际应用过程中根据需要选择合适的声纹特征和相似度算法进行融合和计算。

步骤102：判断第一预置对比数量的匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将待验证声纹特征加入自学习观察声纹特征库；

需要说明的是，判断第一预置对比数量的匹配值是否符合预置声纹评估标准的要求，若是，则说明待验证声纹对应的验证语音是用户的声音，声纹验证通过并将待验证声纹特征加入自学习观察声纹特征库；

预置声纹评估标准包括：第一预置对比数量的匹配值的平均值大于预置阈值、90％的第一预置数量的匹配值大于预置阈值或最大的匹配值大于预置阈值；

实际应用过程中可以根据需要选择不同的预置声纹评估标准进行评估验证。

步骤103：判断预置时间内是否接收到对验证指令进行撤销或举报的反馈指令，若否，将待验证声纹特征作为新的素材声纹特征加入用户声纹库；

需要说明的是，待验证声纹特征加入自学习观察声纹特征库之后，对待验证声纹特征进行观察，判断预置时间内是否接收到对验证指令进行撤销或举报的反馈指令，若否，则说明满足学习条件的声纹特征对应的验证操作是用户本人发起的验证操作，将待验证声纹特征作为新的素材声纹特征加入用户声纹库；

对满足学习条件的待验证声纹特征观察确保是用户本人发起的验证操作，保证了素材声纹特征的安全性与可靠性，如其他人通过某种手段获取用户的声纹特征，然后成功通过了用户手机的验证，用户发现后及时对此次验证进行了举报的操作，确保了用户声纹库的安全性与可靠性。

步骤104：选取用户声纹库中时间最新的第一预置融合数量的素材声纹特征进行融合得到新的融合声纹特征。

需要说明的是，待验证声纹特征作为新的素材声纹特征加入用户声纹库之后，选取时间上最新的第一预置融合数量的声纹特征进行融合得到新的融合声纹特征，实现融合声纹特征与用户声音的高匹配性；

声纹特征融合算法包括：gmm-ubm算法、DNN i-vector算法和JFA算法等；

实际应用过程中根据不同的需要和声纹特征可以选择不同的声纹特征融合算法。

本实施例中，当用户选择验证时，接收待验证语音并提取待验证声纹特征，判断待验证声纹特征与时间最新的融合声纹特征的匹配值符合预置声纹评估标准的要求时，声纹验证通过，将待验证声纹特征加入自学习观察声纹特征库，判断预置时间内未接收到对验证指令进行撤销或举报的反馈指令后，将待验证声纹特征加入用户声纹库，确保满足融合条件的素材声纹特征是用户本人发起的验证操作，选取用户声纹库中时间最新的素材声纹特征进行融合得到新的融合声纹特征，整个过程中选取时间最新的素材声纹特征得到新的融合声纹特征，同时选取时间最新的融合声纹特征对待验证声纹特征进行验证，实现融合声纹特征的更新使得融合声纹特征始终与用户声音匹配，解决了当前的声纹识别技术会因为声纹漂移而降低正确率的技术问题。

以上为本发明实施例提供的一种自学习声纹识别的更新方法的一个实施例，以下为本发明实施例提供的一种自学习声纹识别的更新方法的另一个实施例。

请参阅图2，本发明实施例提供的一种自学习声纹识别的更新方法的另一个实施例，包括：

步骤201：接收注册指令；

需要说明的是，用户需要注册时，点击注册选项，接收到注册指令接收到注册指令进入注册流程。

步骤202：接收注册语音；

需要说明的是，注册语音可以是通过麦克风等录音设备现场录制，也可以是一段已经录制好的语音音频。

步骤203：检测注册语音是否满足预置语音质量标准，若是，则执行步骤204，若否，则执行步骤205；

需要说明的是，检测注册语音是否满足预置语音质量标准，若是，则执行步骤204，若否，则执行步骤205；

预置语音质量标准包括：预置信噪比标准、预置音量标准和预置有效时长标准等；

步骤204：提取注册语音的注册声纹特征，并将注册声纹特征加入用户声纹库；

需要说明的是，检测注册语音满足预置语音质量标准后，提取注册语音的注册声纹特征，将注册声纹特征加入用户声纹库；

特征提取算法包括：MFCC算法、FBank算法和D-vector算法等。

步骤205：提示用户继续输入注册语音并返回步骤202；

需要说明的是，检测注册语音不满足预置语音质量标准时，提示用户继续输入注册语音并返回步骤202继续进行注册操作。

步骤206：判断用户声纹库中注册声纹特征的数量是否等于第二预置融合数量，若是，则执行步骤207，若否，则执行步骤205；

需要说明的是，判断用户声纹库中注册声纹特征的数量是否满足第二预置融合数量，若是，则说明注册声纹特征的数量已满足第二预置融合数量，执行步骤207，若否，则执行步骤205。

步骤207：选取第二预置融合数量的注册声纹特征进行融合得到预置融合声纹特征；

需要说明的是，选取第二预置融合数量的注册声纹特征融合得到预置融合声纹特征；

步骤208：接收验证指令和待验证语音；

需要说明的是，用户需要验证时点击验证选项后，接收到验证指令和待验证语音；

验证语音可以是通过麦克风等录音设备现场录制，也可以是一段已经录制好的语音音频。

步骤209：根据验证指令检测待验证语音是否符合预置语音质量标准的要求，若是，则执行步骤210，若否，则执行步骤211；

需要说明的是，根据验证指令检测待验证语音是否符合预置语音质量标准的要求，若是，则执行步骤210，若否，则执行步骤211；

预置语音质量标准包括：预置信噪比标准、预置音量标准和预置有效时长标准；

步骤210：对待验证语音进行声纹特征提取得到待验证声纹特征，并将待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；

需要说明的是，根据验证指令检测待验证语音符合预置语音质量标准的要求，对待验证语音进行声纹特征提取得到待验证声纹特征后，利用相似度算法将待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；

特征提取算法包括：MFCC算法、FBank算法和D-vector算法等；

步骤211：提示用户声纹验证不通过；

需要说明的是，根据验证指令检测待验证语音不符合预置语音质量标准的要求时，提示用户声纹验证不通过。

步骤212：判断第一预置对比数量的匹配值是否符合预置声纹评估标准的要求，若是，则执行步骤213，若否，则执行步骤211；

需要说明的是，需要说明的是，判断第一预置对比数量的匹配值是否符合预置声纹评估标准的要求，若是，则说明待验证声纹对应的验证语音是用户的声音，执行步骤213，若否，则说明待验证语音有可能不是用户的声音，声纹验证不通过；

步骤213：声纹验证通过并将待验证声纹特征加入自学习观察声纹特征库；

需要说明的是，声纹验证通过的同时会将待验证声纹特征加入自学习观察声纹特征库。

步骤214：判断预置时间内是否接收到对验证指令进行撤销或举报的反馈指令，若否，则执行步骤215，若是，则执行步骤216；

需要说明的是，判断预置时间内是否接收到对验证指令进行撤销或举报的反馈指令，若否，则执行步骤215，若是，则执行步骤216。

步骤215：将待验证声纹特征作为新的素材声纹特征加入用户声纹库；

需要说明的是，判断预置时间内未接收到对验证指令进行撤销或举报的反馈指令后，说明满足学习条件的声纹特征对应的验证操作是用户本人发起的验证操作，将待验证声纹特征作为新的素材声纹特征加入用户声纹库。

步骤216：将自学习观察声纹特征库中的待验证声纹特征移除；

需要说明的是，判断预置时间内接收到了对验证指令进行撤销或举报的反馈指令后，说明满足学习条件的声纹特征对应的验证操作不是用户本人发起的验证操作，将自学习观察声纹特征库中的待验证声纹特征移除；

对满足学习条件的待验证声纹特征观察确保是用户本人发起的验证操作，保证了素材声纹特征的安全性与可靠性。

步骤217：选取用户声纹库中时间最新的第一预置融合数量的素材声纹特征进行融合得到新的融合声纹特征。

本实施例中，当用户选择验证时，接收待验证语音并提取待验证声纹特征，判断待验证声纹特征与时间最新的融合声纹特征的匹配值符合预置声纹评估标准的要求时，声纹验证通过，将待验证声纹特征加入自学习观察声纹特征库，判断预置时间内未接收到对验证指令进行撤销或举报的反馈指令后，将待验证声纹特征加入用户声纹库，确保满足融合条件的素材声纹特征是用户本人发起的验证操作，选取用户声纹库中时间最新的素材声纹特征进行融合得到新的融合声纹特征，整个过程中选取时间最新的素材声纹特征得到新的融合声纹特征，同时选取时间最新的融合声纹特征对待验证声纹特征进行验证，解决了当前的声纹识别技术会因为声纹漂移而降低正确率的技术问题。

以上为本发明实施例提供的一种自学习声纹识别的更新方法的另一个实施例，以下为本发明实施例提供的一种自学习声纹识别的更新装置的一个实施例。

第一对比单元301，用于接收验证指令和待验证语音，根据验证指令对待验证语音进行声纹特征提取得到待验证声纹特征，并将待验证声纹特征与用户声纹库的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；

第一判断单元302，用于判断第一预置对比数量的匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将待验证声纹特征加入自学习观察声纹特征库；

第二判断单元303，用于判断预置时间内是否接收到对验证指令进行撤销或举报的反馈指令，若否，将待验证声纹特征作为新的素材声纹特征加入用户声纹库；

第一融合单元304，用于选取用户声纹库中时间最新的第二预置数量的素材声纹特征进行融合得到新的融合声纹特征。

进一步地，第一判断单元302具体包括：

用于判断第一预置对比数量的匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将待验证声纹特征加入自学习观察声纹特征库，若否，则声纹验证不通过。

进一步地，第二判断单元303具体包括：

用于判断预置时间内是否接收到对验证指令进行撤销或举报的反馈指令，若否，将待验证声纹特征作为新的素材声纹特征加入用户声纹库，若是，将自学习观察声纹特征库中的待验证声纹特征移除。

进一步地，第一对比301单元具体包括：

第一接收子单元3011，用于接收验证指令和待验证语音；

第一检测子单元3012，用于检测待验证语音是否符合预置语音质量标准的要求，若是，则触发第一对比子单元3013，若否，则声纹验证不通过；

第一对比子单元3013，用于对待验证语音进行声纹特征提取得到待验证声纹特征，并将待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值。

进一步地，还包括语音注册单元300；

第二接收子单元3001，用于接收注册指令；

第三接收子单元3002，用于接收注册语音；

第二检测子单元3003，用于检测注册语音是否满足预置语音质量标准，若是，则触发第一提取子单元，若否，则提示用户重新输入注册语音并触发第三接收子单元3002；

第一提取子单元3004，用于提取注册语音的注册声纹特征，并将注册声纹特征加入用户声纹库；

第三判断子单元3005，用于判断用户声纹库中注册声纹特征的数量是否等于第二预置融合数量，若是，则触发第二融合子单元，若否，则提示用户重新输入注册语音并触发第三接收子单元3002；

第二融合子单元3006，用于选取第二预置融合数量的注册声纹特征融合得到预置融合声纹特征。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

一种自学习声纹识别的更新方法，其特征在于，包括：

S1、接收验证指令和待验证语音，根据所述验证指令对所述待验证语音进行声纹特征提取得到待验证声纹特征，并将所述待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；

S2、判断所述匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将所述待验证声纹特征加入自学习观察声纹特征库；

S3、判断预置时间内是否接收到对所述验证指令进行撤销或举报的反馈指令，若否，将所述待验证声纹特征作为新的素材声纹特征加入用户声纹库；

S4、选取用户声纹库中时间最新的第一预置融合数量的素材声纹特征进行融合得到新的融合声纹特征。
根据权利要求1所述的一种自学习声纹识别的更新方法，其特征在于，步骤S2具体包括：

判断所述匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将所述待验证声纹特征加入自学习观察声纹特征库，若否，则声纹验证不通过。
根据权利要求1所述的一种自学习声纹识别的更新方法，其特征在于，步骤S3具体包括：

判断预置时间内是否接收到对所述验证指令进行撤销或举报的反馈指令，若否，将所述待验证声纹特征作为新的素材声纹特征加入用户声纹库，若是，将所述自学习观察声纹特征库中的所述待验证声纹特征移除。
根据权利要求1所述的一种自学习声纹识别的更新方法，其特征在于，步骤S1具体包括：

S11、接收验证指令和待验证语音；

S12、检测所述待验证语音是否符合预置语音质量标准的要求，若是，则执行步骤S13，若否，则声纹验证不通过；

S13、对所述待验证语音进行声纹特征提取得到待验证声纹特征，并将所述待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值。
根据权利要求4所述的一种自学习声纹识别的更新方法，其特征在于，步骤S11之前还包括：

S01、接收注册指令；

S02、接收注册语音；

S03、检测所述注册语音是否满足预置语音质量标准，若是，则执行步骤S04，若否，则提示用户继续输入注册语音并返回步骤S02；

S04、提取所述注册语音的注册声纹特征，并将所述注册声纹特征加入用户声纹库；

S05、判断所述用户声纹库中注册声纹特征的数量是否等于第二预置融合数量，若是，则执行步骤S06，若否，则提示用户继续输入注册语音并返回步骤S02；

S06、选取第二预置融合数量的所述注册声纹特征进行融合得到预置融合声纹特征。
一种自学习声纹识别的更新装置，其特征在于，包括：

第一对比单元，用于接收验证指令和待验证语音，根据所述验证指令对所述待验证语音进行声纹特征提取得到待验证声纹特征，并将所述待验证声纹特征与用户声纹库的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值；

第一判断单元，用于判断第所述匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将所述待验证声纹特征加入自学习观察声纹特征库；

第二判断单元，用于判断预置时间内是否接收到对所述验证指令进行撤销或举报的反馈指令，若否，将所述待验证声纹特征作为新的素材声纹特征加入用户声纹库；

第一融合单元，用于选取用户声纹库中时间最新的第一预置融合数量的素材声纹特征进行融合得到新的融合声纹特征。
根据权利要求6所述的一种自学习声纹识别的更新装置，其特征在于，第一判断单元具体包括：

用于判断所述匹配值是否符合预置声纹评估标准的要求，若是，则声纹验证通过并将所述待验证声纹特征加入自学习观察声纹特征库，若否，则声纹验证不通过。
根据权利要求6所述的一种自学习声纹识别的更新装置，其特征在于，第二判断单元具体包括：

用于判断预置时间内是否接收到对所述验证指令进行撤销或举报的反馈指令，若否，将所述待验证声纹特征作为新的素材声纹特征加入用户声纹库，若是，将所述自学习观察声纹特征库中的所述待验证声纹特征移除。
根据权利要求6所述的一种自学习声纹识别的更新装置，其特征在于，第一对比单元具体包括：

第一接收子单元，用于接收验证指令和待验证语音；

第一检测子单元，用于检测所述待验证语音是否符合预置语音质量标准的要求，若是，则触发第一对比子单元，若否，则声纹验证不通过；

第一对比子单元，用于对所述待验证语音进行声纹特征提取得到待验证声纹特征，并将所述待验证声纹特征与用户声纹库中时间最新的第一预置对比数量的融合声纹特征进行相似度比对得到第一预置对比数量的匹配值。
根据权利要求6所述的一种自学习声纹识别的更新装置，其特征在于，还包括语音注册单元：

第二接收子单元，用于接收注册指令；

第三接收子单元，用于接收注册语音；

第二检测子单元，用于检测所述注册语音是否满足预置语音质量标准，若是，则触发第一提取子单元，若否，则提示用户重新输入注册语音并触发第三接收子单元；

第一提取子单元，用于提取所述注册语音的注册声纹特征，并将所述注册声纹特征加入用户声纹库；

第三判断子单元，用于判断所述用户声纹库中注册声纹特征的数量是否等于第二预置融合数量，若是，则触发第二融合子单元，若否，则提示用户继续输入注册语音并触发第三接收子单元；

第二融合子单元，用于选取第二预置融合数量的所述注册声纹特征进行融合得到预置融合声纹特征。