CN113992797B

CN113992797B - 一种欺诈防控平台及方法

Info

Publication number: CN113992797B
Application number: CN202110934852.8A
Authority: CN
Inventors: 锺一磊
Original assignee: Zhejiang Xiaoyi Information Technology Co ltd
Current assignee: Zhejiang Xiaoyi Information Technology Co ltd
Priority date: 2021-08-16
Filing date: 2021-08-16
Publication date: 2022-08-23
Anticipated expiration: 2041-08-16
Also published as: CN113992797A

Abstract

本发明公开了一种欺诈防控平台及方法，已有欺诈事件，将当前通讯请求的呼叫号码、当前通讯业务的声音信号与存储有已有欺诈事件发起端号码的号码识别库、存储有已有欺诈事件音频信息的音频识别库进行对比，判断当前通讯请求的呼叫号码、当前通讯业务的声音信号是否疑似欺诈；根据已有欺诈事件中出现的敏感词句的相关性，筛选出权重高的敏感词句进行可能欺诈句式的随机组合，通过将通话内容与可能的欺诈句式的比对，判断当前通话内容是否涉及欺诈内容。本申请有效利用了以往事件的经验教训，避免同样的欺诈手段在不同对象上的反复利用，对于欺诈事件的识别和制止起到了重要的防范预警作用。

Description

一种欺诈防控平台及方法

技术领域

本发明涉及防欺诈领域，尤其指一种欺诈防控平台及方法。

背景技术

随着网络技术的发展速度越来越快，欺诈事件的发生也越来越频频繁。某些动机不纯人员通过技术手段盗取用户的个人信息，拨打电话骗取用户的财产，给个人、社会造成巨大损失，在“成功”实施之后，从用户意识自己被骗，到向有关部门报警、立案、调查取证，再到结果反馈，这一系列的时间节点跨度大(月度计量)，取证困难，有效追查效率低，且最终调查结果不理想。从服务商侧来看，目前通话录音普遍在若干小时后同步质检平台，从机器拦截到人工复检使得质检效率不足，无法在事中拦截风险，仅能在事后追回损失。

发明内容

本发明目的在于利用已有欺诈事件，通过分析已有欺诈事件的关联性，预判当前通话是否涉嫌欺诈，从而提前做出欺诈预判的一种欺诈防控平台及方法。

一种欺诈防控方法，包括：

采用报备机制，建立报备信息库，所述报备信息库用于存储通讯端报备信息；

S10，接收到通讯请求时，提取通讯业务的呼叫号码，识别所述呼叫号码是否疑似欺诈，若是，则转入S60，否则转入下一步；

S20，提取通讯业务的声音信号，判断所述声音信号是否疑似欺诈，若是，则转入S60，否则转入下一步；

S30，提取通讯业务的通话内容，判断所述通话内容是否涉及欺诈内容，若是，则转入下一步，否则作为正常通话处理；

S60，在信令保持的同时接入人工监听，若确定通话涉及欺诈则联动报警，并判断外呼请求的发出方是否位于报备信息库内，若所述外呼请求的发出方位于报备信息库内，则根据所述报备信息确定对应通讯端；否则，锁定所述呼叫号码，并根据所述通话内容，实施第二预警操作。

进一步地，所述判断通话是否涉及欺诈，包括：建立已有欺诈事件库A, A＝{A₁,A₂,...,A_n}，每个欺诈事件A_m包括通话发起端号码A_m1、音频信息A_m2以及通话内容A_m3，提取所述欺诈事件A_m中每次通话的通话发起端号码加入号码识别库；将所述音频信息A_m2，加入音频识别库；根据所述通话内容A_m3建立欺诈语句检测模型。

进一步地，所述判断所述呼叫号码是否疑似欺诈的方法为：判断所述呼叫号码是否存在于号码识别库中，若存在，则判断该呼叫号码疑似欺诈；

判断所述声音信号是否疑似欺诈的方法为：提取所述声音信号中的音色信号、振幅信号以及频率信号与音频识别库中的音色信号、振幅信号以及频率信号进行对比，如出现任意两种信号对比相同的情况，则判断所述声音信号疑似欺诈；

判断所述通话内容是否涉及欺诈内容的方法为：进行实时语音识别，提取音频信号转成文字信号输入欺诈语句检测模型进行欺诈识别，若欺诈检测模型输出的检测结果为疑似欺诈。

进一步地，所述欺诈语句检测模型的建立包括：

计算欺诈事件A_m和欺诈事件A_p之间的第一相关性指标

其中m、p∈[1,n]，

大于 1且

从所述欺诈事件A_m中的通话内容A_m3，从通话内容A_m3中提取i个敏感词句，标记为敏感词句α_m，α_m＝[α_m1,...,α_mi]；

计算各个所述敏感词句α_mj之间的第二相关性指标γ_mjk；其中γ_mjk表示α_mj和α_mk之间的第二相关性，其中k∈[1,i]，γ_mjk≤1且γ_mjk＝γ_mkj；

当欺诈事件A_m中的某两个敏感词句同时出现在同一欺诈事件A_p中时，更新该两个敏感词句的第二相关性：

当欺诈事件A_m中的某两个敏感词句同时出现在多个欺诈事件A_x、A_y、A_z、……中时，更新该两个敏感词句的第二相关性：

筛选出已有欺诈事件库A中的某个敏感词句作为标定对象；

以所述标定对象为基准，对所述已有欺诈事件库A中的所有敏感词句进行相关性标定，以每个敏感词句与所述标定对象的第二相关性为每个敏感词句赋予相应的权重μ_o，组成权重矩阵μ＝[μ₁,μ₂,...,μ_r]，其中o∈[1,r]；

将所述权重μ_o超过设定阈值的敏感词句放入第一库存；

对所述第一库存中的敏感词句进行组合，生成可能的欺诈句式；

将所述欺诈句式加入欺诈语句检测模型。

进一步地，根据所述欺诈事件对应的欺诈号码、声音信号以及敏感词句的重合率，计算欺诈事件A_m和欺诈事件A_p之间的第一相关性指标

其中κ₁、κ₂、κ₃分别对应敏感词句的重合率、欺诈号码的相关性、声音信号的相似性，且κ₁、 κ₂、κ₃均小于1，λ₁、λ₂、λ₃分别对应所述敏感词句的重合率、欺诈号码的相关性、声音信号的相似性对于欺诈相关性的影响因子，且λ₁+λ₂+λ₃＝1。

进一步地，计算各个所述敏感词句α_mj之间的第二相关性指标γ_mjk：将已有欺诈事件库A 中出现的敏感词句进行同语义归类，生成多个词句库；当敏感词句α_mj和α_mk属于同一词句库时，则γ_mjk＝1；当敏感词句α_mj和α_mk不属于同一词句库时，则对敏感词句α_mj对应的词句库和敏感词句α_mk对应的词句库进行语义逻辑判断，根据语义逻辑的相关性得到α_mj和α_mk的第二相关性指标γ_mjk。

进一步地，述标定对象为已有欺诈事件库A中出现频次最高的敏感词句。

本申请还提供了一种欺诈防控平台，包括：

报备信息库，用于存储通讯端报备信息；所述报备信息包括实名认证、业务登记和节点报备；

通讯信息提取单元，用于提取通讯业务中的通讯信息，所述通讯信息包括呼叫号码、声音信号以及通话内容；

通讯信息识别单元，用于判断所述通讯信息是否涉及欺诈；

监听系统，用于对当前通话内容进行监听，当确认所述通话信息涉及欺诈时联动报警；

报警系统，用于接收到报警信号时，判断外呼请求的发出方是否位于报备信息库内，若所述外呼请求的发出方位于所述报备信息库内，则根据所述报备信息确定对应通讯端，实施第一预警操作；若否，则锁定所述呼叫号码，并根据所述通话内容，实施第二预警操作。

进一步地，所述通讯信息识别单元包括号码识别库，音频识别库以及欺诈语句检测模型。

进一步地，所述判断所述通讯信息是否涉及欺诈包括：判断所述呼叫号码是否疑似欺诈：判断所述呼叫号码是否存在于号码识别库中，若存在，则判断该呼叫号码疑似欺诈；判断所述声音信号是否疑似欺诈：提取所述声音信号中的音色信号、振幅信号以及频率信号与音频识别库中音频信息的音色信号、振幅信号以及频率信号进行对比，如出现任意两种信号对比相同的情况，则判断所述声音信号疑似欺诈；判断所述通话内容是否涉及欺诈内容：进行实时语音识别，提取音频信号转成文字信号输入欺诈语句检测模型进行欺诈识别，若欺诈检测模型输出的检测结果为疑似欺诈。

与现有技术相比，本申请的有益效果为：本申请结合已有欺诈事件，将当前通讯请求的呼叫号码、当前通讯业务的声音信号与存储有已有欺诈事件发起端号码的号码识别库、存储有已有欺诈事件音频信息的音频识别库进行对比，判断当前通讯请求的呼叫号码、当前通讯业务的声音信号是否疑似欺诈；根据已有欺诈事件中出现的敏感词句的相关性，筛选出权重高的敏感词句进行可能欺诈句式的随机组合，通过将通话内容与可能的欺诈句式的比对，判断当前通话内容是否涉及欺诈内容；对于疑似欺诈或涉及欺诈内容的通话接入人工监听，再次确认通话是否涉及欺诈，并采取相应操作。本申请将通讯欺诈(或电信欺诈)通话过程的每一步与已有欺诈事件的相应信息进行对比，有效利用了以往事件的经验教训，避免同样的欺诈手段在不同对象上的反复利用，对于欺诈事件的识别和制止起到了重要的防范预警作用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为欺诈防控平台示意图；

图2为欺诈防控方法流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明实施例进行详细描述。

一种欺诈防控平台，如图1所示，包括：

报备信息库100，用于存储通讯端报备信息，报备信息包括实名认证、业务登记和节点报备；

通讯信息提取单元200，用于提取通讯业务中的通讯信息，通讯信息包括呼叫号码、声音信号以及通话内容；

通讯信息识别单元300，用于判断通讯信息是否涉及欺诈；通讯信息识别单元300包括号码识别库310，音频识别库320以及欺诈语句检测模型330。

监听系统400，用于对当前通话内容进行监听，当确认通话信息涉及欺诈时联动报警；

报警系统500，用于接收到报警信号时，判断外呼请求的发出方是否位于报备信息库内，若外呼请求的发出方位于报备信息库内，则根据报备信息确定对应通讯端，实施第一预警操作；若否，则锁定呼叫号码，并根据通话内容，实施第二预警操作。

判断通讯信息是否涉及欺诈包括：判断呼叫号码是否疑似欺诈：判断呼叫号码是否存在于号码识别库中，若存在，则判断该呼叫号码疑似欺诈；判断声音信号是否疑似欺诈：提取声音信号中的音色信号、振幅信号以及频率信号与音频识别库中的音色信号、振幅信号以及频率信号进行对比，如出现任意两种信号对比相同的情况，则判断声音信号疑似欺诈；判断通话内容是否涉及欺诈内容：进行实时语音识别，提取音频信号转成文字信号输入欺诈语句检测模型进行欺诈识别，若欺诈检测模型输出的检测结果为疑似欺诈。

基于上述欺诈防控平台的欺诈防控方法，包括：

首先，采用报备机制，建立报备信息库，报备信息库用于存储通讯端报备信息。报备信息包括实名认证、业务登记和节点报备。对企业、法人、经办人的业务资格进行实名核验，保证风险发生时有责可追。分析接入用户的业务安全性，剔除或加大对高风险业务的监控，保证通讯环境的安全性。对用户来源节点、网关节点的信息收录，每个节点进行实名认证，落实责任。

其次，建立已有欺诈事件库A,A＝{A₁,A₂,...,A_n}，每个欺诈事件A_m包括通话发起端号码A_m1、音频信息A_m2以及通话内容A_m3，提取所述欺诈事件A_m中每次通话的通话发起端号码加入号码识别库；将所述音频信息A_m2，加入音频识别库；根据所述通话内容A_m3建立欺诈语句检测模型。有时一个欺诈事件的发生往往包括环环相扣的多次通话，每次通话的发起端不尽相同，通话人和通信内容也不近相同，为了防止同一个发起端多次发起欺诈通话，侵害更多人的利益，有必要将欺诈事件中每次通话的发起端号码进行汇总，加入到号码识别库中。同样的，考虑到每个人的声音都具有差异性，而实施欺诈通话的人员有限，必然是一个人要进行多次欺诈通话，同类型的通话内容也具有一定的相似性，因此，对欺诈事件中通话录音中的音频信息进行分析，提取音频信息中的音色信号、振幅信号以及频率信号，加入音频识别库，对通话内容中的敏感词句进行拆解再组合，建立欺诈语句检测模型。

实施欺诈防控的步骤包括：

判断呼叫号码是否疑似欺诈的方法为：判断呼叫号码是否存在于号码识别库中，若存在，则判断该呼叫号码疑似欺诈；

判断声音信号是否疑似欺诈的方法为：提取声音信号中的音色信号、振幅信号以及频率信号与音频识别库中音频信号的音色信号、振幅信号以及频率信号进行对比，如出现任意两种信号对比相同的情况，则判断该声音信号疑似欺诈。由于人的声音是由喉部的肌肉收缩引起声带震动，再经过口腔、鼻腔的共鸣后发出。每个人的声带及其共鸣器官的结构特征不一样，震动时发出的音色(声谱)就像人的指纹一样，相同的概率是非常低的。因此，通过声音信号可以识别出发出呼叫的人员是否曾参与过欺诈。

S30，提取通讯业务的通话内容，判断所述通话内容是否涉及欺诈内容，若是，则转入下一步，否则作为正常通话处理，作为正常通话处理不排除对于通话进行其他方式的监控和处理。

判断通话内容是否涉及欺诈内容的方法为：进行实时语音识别，提取音频信号转成文字信号输入欺诈语句检测模型进行欺诈识别，若欺诈检测模型输出的检测结果为疑似欺诈。

欺诈语句检测模型的建立是根据同一欺诈事件中出现的敏感词句的关联性以及不同欺诈事件的关联性，得出存在相关性的多组敏感词句及其用相关性指标表示的相关度，选择一敏感词句作为标定对象，按照每个敏感词句与该标定对象的相关性，对所有敏感对象的相关性指标进行归一化处理后，得到相应的权重，设定权重阈值，将超过该阈值的敏感词句筛选出来，进行逻辑组合，生成可能的欺诈句式，由所有可能的欺诈句式生成欺诈语句检测模型。具体包括：

计算欺诈事件A_m和欺诈事件A_p之间的第一相关性指标

其中m、p∈[1,n]，

大于1且

两个欺诈事件的第一相关性指标越大，表示这两个欺诈事件属于同类欺诈的可能性越高，两个欺诈事件中涉及到的敏感词句的重合性越高，当然这里的重合性是根据敏感词句的语义特征来判断的。

从欺诈事件A_m中的通话内容A_m3，从通话内容A_m3中提取i个敏感词句，标记为敏感词句α_m，α_m＝[α_m1,...,α_mi]。

计算各个敏感词句α_mj之间的第二相关性指标γ_mjk；其中γ_mjk表示α_mj和α_mk之间的第二相关性，其中k∈[1,i]，γ_mjk≤1且γ_mjk＝γ_mkj；各个敏感词句之间是存在相关性的，比如“出车祸”与“急需用钱”在电信欺诈中语义逻辑的相关性非常高，“借钱”与“借点钱”就是属于同语义词句。

当不同欺诈事件中同时都出现某两个敏感词句时，说明这两个敏感词句的相关性相对于只出现在一个欺诈事件的其他敏感词句的相关性更高，不仅要考虑两个敏感词句的相关性还要考虑不同欺诈事件之间的相关性。

筛选出已有欺诈事件库A中的某个敏感词句作为标定对象，其中标定对象可选择已有欺诈事件库A中出现频次最高的敏感词句；以标定对象为基准，对已有欺诈事件库A中的所有敏感词句进行相关性标定，以每个敏感词句与标定对象的第二相关性为每个敏感词句赋予相应的权重μ_o，组成权重矩阵μ＝[μ₁,μ₂,...,μ_r]，其中o∈[1,r]。这一步是对对所有敏感对象的相关性指标进行归一化处理后，目的是便于在同一基准下对所有敏感词句进行权重排序，从而选择出与欺诈事件相关性更高的敏感词句。

将权重μ_o超过设定阈值的敏感词句放入第一库存；对第一库存中的敏感词句进行组合，生成可能的欺诈句式；将欺诈句式加入欺诈语句检测模型。

其中，根据欺诈事件对应的欺诈号码、声音信号以及敏感词句的重合率，计算欺诈事件A_m和欺诈事件A_p之间的第一相关性指标

其中κ₁、κ₂、κ₃分别对应敏感词句的重合率、欺诈号码的相关性、声音信号的相似性，且κ₁、κ₂、κ₃均小于1，λ₁、λ₂、λ₃分别对应敏感词句的重合率、欺诈号码的相关性、声音信号的相似性对于欺诈相关性的影响因子，且λ₁+λ₂+λ₃＝1。

其中，计算各个敏感词句α_mj之间的第二相关性指标γ_mjk：将已有欺诈事件库A中出现的敏感词句进行同语义归类，生成多个词句库；当敏感词句α_mj和α_mk属于同一词句库时，则γ_mjk＝1；当敏感词句α_mj和α_mk不属于同一词句库时，则对敏感词句α_mj对应的词句库和敏感词句α_mk对应的词句库进行语义逻辑判断，根据语义逻辑的相关性得到α_mj和α_mk的第二相关性指标γ_mjk。

S60，在信令保持的同时接入人工监听，若确定通话涉及欺诈则联动报警，并判断外呼请求的发出方是否位于报备信息库内，若外呼请求的发出方位于报备信息库内，则根据报备信息确定对应通讯端；否则，锁定呼叫号码，并根据通话内容，实施第二预警操作。具体的第一预警操作、第二预警操作内容具有多样性，本申请不予限制。

应该理解的是，本发明所公开的实施例不限于这里所公开的特定结构、处理步骤，而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是，在此使用的术语仅用于描述特定实施例的目的，而并不意味着限制。

虽然本发明所公开的实施方式如上，但的内容只是为了便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属技术领域内的技术人员，在不脱离本发明所公开的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种欺诈防控方法，其特征在于，包括：

S60，在信令保持的同时接入人工监听，若确定通话涉及欺诈则联动报警，并判断外呼请求的发出方是否位于报备信息库内，若所述外呼请求的发出方位于报备信息库内，则根据所述报备信息确定对应通讯端；否则，锁定所述呼叫号码，并根据所述通话内容，实施第二预警操作；

所述判断通话是否涉及欺诈，包括：

建立已有欺诈事件库A,A＝{A₁,A₂,...,A_n}，每个欺诈事件A_m包括通话发起端号码A_m1、音频信息A_m2以及通话内容A_m3，提取所述欺诈事件A_m中每次通话的通话发起端号码加入号码识别库；将所述音频信息A_m2，加入音频识别库；根据所述通话内容A_m3建立欺诈语句检测模型；

所述判断所述呼叫号码是否疑似欺诈的方法为：判断所述呼叫号码是否存在于号码识别库中，若存在，则判断该呼叫号码疑似欺诈；

判断所述声音信号是否疑似欺诈的方法为：提取所述声音信号中的音色信号、振幅信号以及频率信号与音频识别库中音频信息的音色信号、振幅信号以及频率信号进行对比，如出现任意两种信号对比相同的情况，则判断所述声音信号疑似欺诈；

判断所述通话内容是否涉及欺诈内容的方法为：进行实时语音识别，提取音频信号转成文字信号输入欺诈语句检测模型进行欺诈识别，若欺诈检测模型输出的检测结果为疑似欺诈；

所述欺诈语句检测模型的建立包括：

计算欺诈事件A_m和欺诈事件A_p之间的第一相关性指标

其中m、p∈[1,n]，

大于1且

筛选出已有欺诈事件库A中的某个敏感词句作为标定对象；

将所述权重μ_o超过设定阈值的敏感词句放入第一库存；

将所述欺诈句式加入欺诈语句检测模型。

2.根据权利要求1所述的一种欺诈防控方法，其特征在于，根据所述欺诈事件对应的欺诈号码、声音信号以及敏感词句的重合率，计算欺诈事件A_m和欺诈事件A_p之间的第一相关性指标

其中κ₁、κ₂、κ₃分别对应敏感词句的重合率、欺诈号码的相关性、声音信号的相似性，且κ₁、κ₂、κ₃均小于1，λ₁、λ₂、λ₃分别对应所述敏感词句的重合率、欺诈号码的相关性、声音信号的相似性对于欺诈相关性的影响因子，且λ₁+λ₂+λ₃＝1。

3.根据权利要求1所述的一种欺诈防控方法，其特征在于，计算各个所述敏感词句α_mj之间的第二相关性指标γ_mjk：

将已有欺诈事件库A中出现的敏感词句进行同语义归类，生成多个词句库；

当敏感词句α_mj和α_mk属于同一词句库时，则γ_mjk＝1；

当敏感词句α_mj和α_mk不属于同一词句库时，则对敏感词句α_mj对应的词句库和敏感词句α_mk对应的词句库进行语义逻辑判断，根据语义逻辑的相关性得到α_mj和α_mk的第二相关性指标γ_mjk。

4.根据权利要求3所述的一种欺诈防控方法，其特征在于，所述标定对象为已有欺诈事件库A中出现频次最高的敏感词句。