CN108882242A - 基于声纹识别和意图理解技术的反诈骗系统的自学习方法 - Google Patents
基于声纹识别和意图理解技术的反诈骗系统的自学习方法 Download PDFInfo
- Publication number
- CN108882242A CN108882242A CN201810589825.XA CN201810589825A CN108882242A CN 108882242 A CN108882242 A CN 108882242A CN 201810589825 A CN201810589825 A CN 201810589825A CN 108882242 A CN108882242 A CN 108882242A
- Authority
- CN
- China
- Prior art keywords
- swindle
- model library
- people
- voice line
- intended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000005516 engineering process Methods 0.000 title claims abstract description 17
- 230000001755 vocal effect Effects 0.000 claims abstract description 19
- 239000000463 material Substances 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims 1
- 238000009825 accumulation Methods 0.000 abstract description 7
- 230000000295 complement effect Effects 0.000 abstract 1
- 238000005457 optimization Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 206010013032 Diplacusis Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,具体包括如下步骤:步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;步骤SS2:诈骗人声纹模型库更新步骤;步骤SS3:诈骗人意图模型库更新步骤。本发明利用声纹预警数据自动为意图理解模型积累训练用诈骗文本;利用意图理解预警数据自动添加诈骗人声纹模型库,两种技术手段互相补充,有效解决数据积累期间新诈骗人的漏警和意图理解模型训练文本人工积累的问题。
Description
技术领域
本发明涉及基于声纹识别和意图理解技术的反诈骗系统的自学习方法,属于通讯安全技术领域。
背景技术
随着诈骗分子的不断涌现,电话诈骗在国内产生了严重的影响,为了有效的打击电话诈骗,目前国内已有很多不同的诈骗电话检出方法,主要为基于电信运营商信令数据进行实时分析以及基于诈骗录音比对两条技术路线。
其中基于信令的诈骗电话检出方法主要基于诈骗通话明显的通话特征,对于通话特征不明显的诈骗电话无法有效检出。而基于诈骗录音比对的诈骗电话检出方法依赖于预先建立的诈骗录音库,通过音频比对的技术检出诈骗听话,该方法主要针对录音型电话,对于自然人诈骗电话无能为力。
利用智能语音处理方案预警时,随着诈骗分子的不断涌现,诈骗手段的持续更新,预先积累的诈骗人声纹库需要持续不断的更新,针对诈骗剧本的意图理解模型也要不断的优化,以适应不断变化的诈骗手段,因此我们需要建立学习系统,旨在通过对预警数据的分析,通过语音处理和意图模型训练的流程,向平台不断输入新的诈骗人声纹模型及优化后的意图理解模型,不断优化系统效果。
现有的学习系统是基于对预警数据进行人工听音标注,由优化人员定期对预警数据进行处理分析,提取出符合系统注册标准的诈骗人声纹模型,并在已积累的诈骗剧本的基础上,更新线上意图理解模型。该方式有效地对线上的声纹及意图模型进行更新及优化,但该方案中声纹和意图是互相独立的模块,声纹模型处理流程是在积累了一定的数据量后,批量对其进行处理并注册上线,时效性不高,尤其对新的诈骗人声纹模型,无法及时对新发现的诈骗人声纹模型进行注册上线。意图模型处理流程同样需要积累大量的诈骗文本后方可训练优化模型,通过固定的引流策略引入通话数据,人工复听这些通话数据发现新诈骗文本实现大量训练文本的积累,这种积累方式引起引流策略相对盲目导致人工工作量太大,训练数据积累耗时很长且往往效果不佳。
发明内容
针对上述不足,提出了基于声纹识别和意图理解技术的反诈骗系统的自学习方法,该方案通过声纹识别和意图理解技术实现。声纹识别技术基于预先积累的诈骗人声纹库,通过计算声纹模型之间的相似度对诈骗电话进行检出。意图理解技术则通过积累的诈骗文本训练意图理解模型,实时对输入的通话进行意图判断,并进行预警处置。
本发明采用如下技术方案:基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,具体包括如下步骤:
步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;
步骤SS2:诈骗人声纹模型库更新步骤;
步骤SS3:诈骗人意图模型库更新步骤。
作为一种较佳的实施例,所述步骤SS2中的所述诈骗人声纹模型库更新步骤具体包括:预警数据输入诈骗人意图模型库中,并与诈骗人意图模型库中的意图预警门限值进行比对,若超出预警门限值则自动提取诈骗人语音数据并传输到诈骗人语音库,然后传输到诈骗人声纹模型库中实现扩充诈骗人声纹模型库的更新。
作为一种较佳的实施例,所述步骤SS3中的所述诈骗人意图模型库更新步骤具体包括:预警数据输入诈骗人声纹模型库中,并与诈骗人声纹模型库中的声纹预警门限值进行比对,若超出预警门限值则自动提炼新诈骗剧本数据并传输到意图素材库,然后传输到诈骗人意图模型库中实现扩充诈骗人意图模型库的更新。
本发明所达到的有益效果:本发明利用声纹预警数据自动为意图理解模型积累训练用诈骗文本;利用意图理解预警数据自动添加诈骗人声纹模型库,两种技术手段互相补充,有效解决数据积累期间新诈骗人的漏警和意图理解模型训练文本人工积累的问题。
附图说明
图1是本发明的基于声纹识别和意图理解技术的反诈骗系统的自学习方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示的是本发明的基于声纹识别和意图理解技术的反诈骗系统的自学习方法的流程图。本发明提出的声纹加意图的自学习方法,其特征在于,具体包括如下步骤:
步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;
步骤SS2:诈骗人声纹模型库更新步骤;
步骤SS3:诈骗人意图模型库更新步骤。
作为一种较佳的实施例,所述步骤SS2中的所述诈骗人声纹模型库更新步骤具体包括:预警数据输入诈骗人意图模型库中,并与诈骗人意图模型库中的意图预警门限值进行比对,若超出预警门限值则自动提取诈骗人语音数据并传输到诈骗人语音库,然后传输到诈骗人声纹模型库中实现扩充诈骗人声纹模型库的更新。
作为一种较佳的实施例,所述步骤SS3中的所述诈骗人意图模型库更新步骤具体包括:预警数据输入诈骗人声纹模型库中,并与诈骗人声纹模型库中的声纹预警门限值进行比对,若超出预警门限值则自动提炼新诈骗剧本数据并传输到意图素材库,然后传输到诈骗人意图模型库中实现扩充诈骗人意图模型库的更新。
本发明的技术方案通过调整声纹及意图预警的门限值,对于声纹高门限单独预警的诈骗文本和意图理解高门限预警的诈骗人声纹进行系统的自动处理。
需要说明的是,本发明具体对于声纹高门限单独预警的通话,定义其声纹为系统中已存在诈骗人员声纹模型,但其诈骗套路为新诈骗剧本,通过该种方式可以有效为意图理解模型收集新训练资源,补充意图理解模型无法发现自动新诈骗剧本的劣势。而对于意图理解高门限单独预警的通话数据,定义为意图理解模型中存在该种诈骗剧本的模型,但是未获取到该通通话的诈骗人声纹,通过系统自动的判别诈骗人员声纹,并对其进行声纹的去燥等处理,注册为诈骗人声纹模型,在声纹入库时,需将其与现有声纹库中已有的声纹模型进行声纹碰撞,再次判断是否为新增声纹,弥补声纹模型训练数据积累期间无法发现新诈骗通话的不足。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (3)
1.基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,具体包括如下步骤:
步骤SS1:建立诈骗人声纹模型库和诈骗人意图模型库;
步骤SS2:诈骗人声纹模型库更新步骤;
步骤SS3:诈骗人意图模型库更新步骤。
2.根据权利要求1所述的基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,所述步骤SS2中的所述诈骗人声纹模型库更新步骤具体包括:预警数据输入诈骗人意图模型库中,并与诈骗人意图模型库中的意图预警门限值进行比对,若超出预警门限值则自动提取诈骗人语音数据并传输到诈骗人语音库,然后传输到诈骗人声纹模型库中实现扩充诈骗人声纹模型库的更新。
3.根据权利要求1所述的基于声纹识别和意图理解技术的反诈骗系统的自学习方法,其特征在于,所述步骤SS3中的所述诈骗人意图模型库更新步骤具体包括:预警数据输入诈骗人声纹模型库中,并与诈骗人声纹模型库中的声纹预警门限值进行比对,若超出预警门限值则自动提炼新诈骗剧本数据并传输到意图素材库,然后传输到诈骗人意图模型库中实现扩充诈骗人意图模型库的更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810589825.XA CN108882242A (zh) | 2018-06-08 | 2018-06-08 | 基于声纹识别和意图理解技术的反诈骗系统的自学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810589825.XA CN108882242A (zh) | 2018-06-08 | 2018-06-08 | 基于声纹识别和意图理解技术的反诈骗系统的自学习方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108882242A true CN108882242A (zh) | 2018-11-23 |
Family
ID=64337712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810589825.XA Pending CN108882242A (zh) | 2018-06-08 | 2018-06-08 | 基于声纹识别和意图理解技术的反诈骗系统的自学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108882242A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109600752A (zh) * | 2018-11-28 | 2019-04-09 | 国家计算机网络与信息安全管理中心 | 一种深度聚类诈骗检测的方法和装置 |
WO2020107756A1 (zh) * | 2018-11-27 | 2020-06-04 | 深圳前海微众银行股份有限公司 | 信贷反欺诈方法、系统、设备及计算机可读存储介质 |
CN112863523A (zh) * | 2019-11-27 | 2021-05-28 | 华为技术有限公司 | 语音防伪方法、装置、终端设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103458412A (zh) * | 2012-06-04 | 2013-12-18 | 百度在线网络技术(北京)有限公司 | 防止电话诈骗的系统、方法及移动终端、云端分析服务器 |
CN103731832A (zh) * | 2013-12-26 | 2014-04-16 | 黄伟 | 防电话、短信诈骗的系统和方法 |
CN105872185A (zh) * | 2016-04-20 | 2016-08-17 | 乐视控股(北京)有限公司 | 信息提示方法、装置及系统 |
CN107395905A (zh) * | 2017-07-03 | 2017-11-24 | 珠海高凌信息科技股份有限公司 | 一种信令串接媒体重定向的防诈骗电话接入系统及方法 |
-
2018
- 2018-06-08 CN CN201810589825.XA patent/CN108882242A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103458412A (zh) * | 2012-06-04 | 2013-12-18 | 百度在线网络技术(北京)有限公司 | 防止电话诈骗的系统、方法及移动终端、云端分析服务器 |
CN103731832A (zh) * | 2013-12-26 | 2014-04-16 | 黄伟 | 防电话、短信诈骗的系统和方法 |
CN105872185A (zh) * | 2016-04-20 | 2016-08-17 | 乐视控股(北京)有限公司 | 信息提示方法、装置及系统 |
CN107395905A (zh) * | 2017-07-03 | 2017-11-24 | 珠海高凌信息科技股份有限公司 | 一种信令串接媒体重定向的防诈骗电话接入系统及方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020107756A1 (zh) * | 2018-11-27 | 2020-06-04 | 深圳前海微众银行股份有限公司 | 信贷反欺诈方法、系统、设备及计算机可读存储介质 |
CN109600752A (zh) * | 2018-11-28 | 2019-04-09 | 国家计算机网络与信息安全管理中心 | 一种深度聚类诈骗检测的方法和装置 |
CN112863523A (zh) * | 2019-11-27 | 2021-05-28 | 华为技术有限公司 | 语音防伪方法、装置、终端设备及存储介质 |
WO2021103913A1 (zh) * | 2019-11-27 | 2021-06-03 | 华为技术有限公司 | 语音防伪方法、装置、终端设备及存储介质 |
CN112863523B (zh) * | 2019-11-27 | 2023-05-16 | 华为技术有限公司 | 语音防伪方法、装置、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107222865B (zh) | 基于可疑行为识别的通讯诈骗实时检测方法和系统 | |
US11276407B2 (en) | Metadata-based diarization of teleconferences | |
CN109600752B (zh) | 一种深度聚类诈骗检测的方法和装置 | |
CN104469025B (zh) | 一种基于聚类算法的实时拦截诈骗电话的方法和系统 | |
CN108882242A (zh) | 基于声纹识别和意图理解技术的反诈骗系统的自学习方法 | |
CN103258535A (zh) | 基于声纹识别的身份识别方法及系统 | |
CN109615116A (zh) | 一种电信诈骗事件检测方法和检测系统 | |
CN108924333A (zh) | 诈骗电话识别方法、装置和系统 | |
CN102881125B (zh) | 基于多信息融合集中处理平台的报警监控系统 | |
CN108074576A (zh) | 审讯场景下的说话人角色分离方法及系统 | |
CN106550155A (zh) | 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统 | |
CN108288470A (zh) | 基于声纹的身份验证方法和装置 | |
CN106328166A (zh) | 人机对话异常检测系统及方法 | |
CN107306306A (zh) | 通信号码处理方法及装置 | |
CN106649825A (zh) | 语音交互系统及其创建方法和装置 | |
CN106157135A (zh) | 基于声纹识别性别年龄的防欺诈系统及方法 | |
CN109243492A (zh) | 一种语音情感识别系统及识别方法 | |
CN109493882A (zh) | 一种诈骗电话语音自动标注系统及方法 | |
CN106531195B (zh) | 一种对话冲突检测方法及装置 | |
CN109034140A (zh) | 基于深度学习结构的工业控制网络信号异常检测方法 | |
CN105845141A (zh) | 基于信道鲁棒的说话人确认模型及说话人确认方法和装置 | |
CN111862951A (zh) | 语音端点检测方法及装置、存储介质、电子设备 | |
CN108804669A (zh) | 一种基于意图理解技术的诈骗电话检出方法 | |
US20220157322A1 (en) | Metadata-based diarization of teleconferences | |
CN116996325A (zh) | 一种基于云计算的网络安全检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |