CN108882242A

CN108882242A - 基于声纹识别和意图理解技术的反诈骗系统的自学习方法

Info

Publication number: CN108882242A
Application number: CN201810589825.XA
Authority: CN
Inventors: 张震; 李鹏; 黄远; 高圣翔; 谭昶; 柳林; 倪江帆; 杜裕琴; 罗雅赛
Original assignee: Xun Feizhi Metamessage Science And Technology Ltd; National Computer Network and Information Security Management Center
Current assignee: Xun Feizhi Metamessage Science And Technology Ltd; National Computer Network and Information Security Management Center
Priority date: 2018-06-08
Filing date: 2018-06-08
Publication date: 2018-11-23

Abstract

本发明公开了基于声纹识别和意图理解技术的反诈骗系统的自学习方法，其特征在于，具体包括如下步骤：步骤SS1：建立诈骗人声纹模型库和诈骗人意图模型库；步骤SS2：诈骗人声纹模型库更新步骤；步骤SS3：诈骗人意图模型库更新步骤。本发明利用声纹预警数据自动为意图理解模型积累训练用诈骗文本；利用意图理解预警数据自动添加诈骗人声纹模型库，两种技术手段互相补充，有效解决数据积累期间新诈骗人的漏警和意图理解模型训练文本人工积累的问题。

Description

基于声纹识别和意图理解技术的反诈骗系统的自学习方法

技术领域

本发明涉及基于声纹识别和意图理解技术的反诈骗系统的自学习方法，属于通讯安全技术领域。

背景技术

随着诈骗分子的不断涌现，电话诈骗在国内产生了严重的影响，为了有效的打击电话诈骗，目前国内已有很多不同的诈骗电话检出方法，主要为基于电信运营商信令数据进行实时分析以及基于诈骗录音比对两条技术路线。

其中基于信令的诈骗电话检出方法主要基于诈骗通话明显的通话特征，对于通话特征不明显的诈骗电话无法有效检出。而基于诈骗录音比对的诈骗电话检出方法依赖于预先建立的诈骗录音库，通过音频比对的技术检出诈骗听话，该方法主要针对录音型电话，对于自然人诈骗电话无能为力。

利用智能语音处理方案预警时，随着诈骗分子的不断涌现，诈骗手段的持续更新，预先积累的诈骗人声纹库需要持续不断的更新，针对诈骗剧本的意图理解模型也要不断的优化，以适应不断变化的诈骗手段，因此我们需要建立学习系统，旨在通过对预警数据的分析，通过语音处理和意图模型训练的流程，向平台不断输入新的诈骗人声纹模型及优化后的意图理解模型，不断优化系统效果。

现有的学习系统是基于对预警数据进行人工听音标注，由优化人员定期对预警数据进行处理分析，提取出符合系统注册标准的诈骗人声纹模型，并在已积累的诈骗剧本的基础上，更新线上意图理解模型。该方式有效地对线上的声纹及意图模型进行更新及优化，但该方案中声纹和意图是互相独立的模块，声纹模型处理流程是在积累了一定的数据量后，批量对其进行处理并注册上线，时效性不高，尤其对新的诈骗人声纹模型，无法及时对新发现的诈骗人声纹模型进行注册上线。意图模型处理流程同样需要积累大量的诈骗文本后方可训练优化模型，通过固定的引流策略引入通话数据，人工复听这些通话数据发现新诈骗文本实现大量训练文本的积累，这种积累方式引起引流策略相对盲目导致人工工作量太大，训练数据积累耗时很长且往往效果不佳。

发明内容

针对上述不足，提出了基于声纹识别和意图理解技术的反诈骗系统的自学习方法，该方案通过声纹识别和意图理解技术实现。声纹识别技术基于预先积累的诈骗人声纹库，通过计算声纹模型之间的相似度对诈骗电话进行检出。意图理解技术则通过积累的诈骗文本训练意图理解模型，实时对输入的通话进行意图判断，并进行预警处置。

本发明采用如下技术方案：基于声纹识别和意图理解技术的反诈骗系统的自学习方法，其特征在于，具体包括如下步骤：

步骤SS1：建立诈骗人声纹模型库和诈骗人意图模型库；

步骤SS2：诈骗人声纹模型库更新步骤；

步骤SS3：诈骗人意图模型库更新步骤。

作为一种较佳的实施例，所述步骤SS2中的所述诈骗人声纹模型库更新步骤具体包括：预警数据输入诈骗人意图模型库中，并与诈骗人意图模型库中的意图预警门限值进行比对，若超出预警门限值则自动提取诈骗人语音数据并传输到诈骗人语音库，然后传输到诈骗人声纹模型库中实现扩充诈骗人声纹模型库的更新。

作为一种较佳的实施例，所述步骤SS3中的所述诈骗人意图模型库更新步骤具体包括：预警数据输入诈骗人声纹模型库中，并与诈骗人声纹模型库中的声纹预警门限值进行比对，若超出预警门限值则自动提炼新诈骗剧本数据并传输到意图素材库，然后传输到诈骗人意图模型库中实现扩充诈骗人意图模型库的更新。

本发明所达到的有益效果：本发明利用声纹预警数据自动为意图理解模型积累训练用诈骗文本；利用意图理解预警数据自动添加诈骗人声纹模型库，两种技术手段互相补充，有效解决数据积累期间新诈骗人的漏警和意图理解模型训练文本人工积累的问题。

附图说明

图1是本发明的基于声纹识别和意图理解技术的反诈骗系统的自学习方法的流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

如图1所示的是本发明的基于声纹识别和意图理解技术的反诈骗系统的自学习方法的流程图。本发明提出的声纹加意图的自学习方法，其特征在于，具体包括如下步骤：

步骤SS1：建立诈骗人声纹模型库和诈骗人意图模型库；

步骤SS2：诈骗人声纹模型库更新步骤；

步骤SS3：诈骗人意图模型库更新步骤。

本发明的技术方案通过调整声纹及意图预警的门限值，对于声纹高门限单独预警的诈骗文本和意图理解高门限预警的诈骗人声纹进行系统的自动处理。

需要说明的是，本发明具体对于声纹高门限单独预警的通话，定义其声纹为系统中已存在诈骗人员声纹模型，但其诈骗套路为新诈骗剧本，通过该种方式可以有效为意图理解模型收集新训练资源，补充意图理解模型无法发现自动新诈骗剧本的劣势。而对于意图理解高门限单独预警的通话数据，定义为意图理解模型中存在该种诈骗剧本的模型，但是未获取到该通通话的诈骗人声纹，通过系统自动的判别诈骗人员声纹，并对其进行声纹的去燥等处理，注册为诈骗人声纹模型，在声纹入库时，需将其与现有声纹库中已有的声纹模型进行声纹碰撞，再次判断是否为新增声纹，弥补声纹模型训练数据积累期间无法发现新诈骗通话的不足。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.基于声纹识别和意图理解技术的反诈骗系统的自学习方法，其特征在于，具体包括如下步骤：

步骤SS1：建立诈骗人声纹模型库和诈骗人意图模型库；

步骤SS2：诈骗人声纹模型库更新步骤；

步骤SS3：诈骗人意图模型库更新步骤。

2.根据权利要求1所述的基于声纹识别和意图理解技术的反诈骗系统的自学习方法，其特征在于，所述步骤SS2中的所述诈骗人声纹模型库更新步骤具体包括：预警数据输入诈骗人意图模型库中，并与诈骗人意图模型库中的意图预警门限值进行比对，若超出预警门限值则自动提取诈骗人语音数据并传输到诈骗人语音库，然后传输到诈骗人声纹模型库中实现扩充诈骗人声纹模型库的更新。

3.根据权利要求1所述的基于声纹识别和意图理解技术的反诈骗系统的自学习方法，其特征在于，所述步骤SS3中的所述诈骗人意图模型库更新步骤具体包括：预警数据输入诈骗人声纹模型库中，并与诈骗人声纹模型库中的声纹预警门限值进行比对，若超出预警门限值则自动提炼新诈骗剧本数据并传输到意图素材库，然后传输到诈骗人意图模型库中实现扩充诈骗人意图模型库的更新。