CN111131626B

CN111131626B - 基于流数据图谱的群组有害呼叫检测方法、装置及可读介质

Info

Publication number: CN111131626B
Application number: CN201911323548.9A
Authority: CN
Inventors: 刘立峰; 赵旭霞; 王麟东; 吴翔; 杨鹏飞; 金潇康; 刘树新
Original assignee: Zhuhai Comleader Information Technology Co Ltd
Current assignee: Zhuhai Comleader Information Technology Co Ltd; Henan Xinda Wangyu Technology Co Ltd
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2022-01-14
Anticipated expiration: 2039-12-20
Also published as: CN111131626A

Abstract

本发明提供了基于流数据图谱的群组有害呼叫检测方法、装置及可读介质，包括：采集多个用户的CDR数据，将CDR数据进行分解得到通讯数据并存入图形数据库，得到通讯图谱；对通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征；设置相关属性和表征的阈值，通过呼叫深度图谱的Top‑k排序算法对获取可疑个人呼叫名单；根据可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组。本发明的有益效果为实时性及准确性上具有较大程度提升，并能实时查看呼叫当前及结合历史的图谱特征及记录溯源，重复听取通话的方式进行认为确认，增加可以群组通话的分析成功率。

Description

基于流数据图谱的群组有害呼叫检测方法、装置及可读介质

技术领域

本发明属于网络科学及电信网数据分析，具体涉及了一种基于流数据图谱的群组有害呼叫检测方法、装置及可读介质。

背景技术

随着无线通讯技术的普及，手机已成为人们进行远程通话的必备方式，给生活带来极大便捷。然而任何事物都具有两面性，无线通讯技术在为生活提供便利的同时，也容易被不法分子利用进行犯罪。电信诈骗便是一种由移动通信的普及衍生而来的新型诈骗方式。诈骗方式对生活与经济造成了巨大损失，如何有效进行有害呼叫检测迫在眉睫。

目前广泛采用的有害呼叫检测技术多通过分析主叫用户行为发现潜在的电信诈骗趋势。其中包括通过诈骗黑名单对主叫号码进行分析，确定主叫过往是否存在诈骗行为；通过对通话双方的语音进行录音保存，并在通话结束后对其通话内容进行分析确定是否存在诈骗行为；将已确定的有害号码加入到诈骗黑名单中，通过对黑名单中号码间的通联关系进行分析定位诈骗团伙。然而上述方式均依赖后处理分析，对电信诈骗的防范虽具有一定作用，但无法达到预期效果。除此之外，现有方法对诈骗团伙发现的准确性不高，无法从海量数据中及时、准确地分析出诈骗团伙及其成员所在位置。

发明内容

本发明的目的在于至少解决现有技术中存在的技术问题之一，提供了基于流数据图谱的群组有害呼叫检测方法、装置及可读介质，比于传统有害呼叫检测技术在分析的实时性及准确性上具有较大程度提升，并能实时查看呼叫当前及结合历史的图谱特征及记录溯源。

本发明的技术方案包括一种基于流数据图谱的群组有害呼叫检测方法，其特征在于，该方法包括以下步骤：S100，采集多个用户的CDR数据，将所述CDR数据进行分解得到通讯数据并存入图形数据库，得到通讯图谱；S200，对所述通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征；S300，设置相关属性和表征的阈值，通过呼叫深度图谱的Top-k排序算法对获取可疑个人呼叫名单；S400，根据所述可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组。

根据所述的基于流数据图谱的群组有害呼叫检测方法，其中相关属性和表征包括连接度、群组人数、直径、三角形、位置排名及紧密度。

根据所述的基于流数据图谱的群组有害呼叫检测方法，其中：所述连接度为位于群组中的主叫在群组中的活跃程度，判断主叫处于群组的重要性；所述团伙人数为用于可疑群组中的活跃人数；所述直径为判断可疑群组中完成一次诈骗所需要的人数及所需的通话次数；所述三角形用于判断群组内所有的主叫是否为非可疑号码；所述位置排名用于判断主叫在所有通连关系的重要性，具体地，当每个电话的发起人为某主叫时，表明该主叫在每次通话中的重要性；所述紧密度用于通过判断通连关系时，某主叫呼出的被叫号码的次数与该次数相对于其他主叫呼出次数的对比。

根据所述的基于流数据图谱的群组有害呼叫检测方法，其中基于固定时间窗口的深度图谱分析算法包括以下步骤：S210，开始时间戳，设置滑动窗口尺寸和时间增量；S220，对所述通讯图谱的数据行通过滑动窗口对符合设定的相关属性和表征进行提取，得到对应的多个可疑呼叫个人名单并显示于所述滑动窗口。

根据所述的基于流数据图谱的群组有害呼叫检测方法，其中呼叫深度图谱的Top-k排序算法具体包括：S310，开始时间戳，设置k参数、滑动窗口尺寸及时间增量；S320，设置所述相关属性和表征的阈值，对疑似有害呼叫的群组进行排序，将符合阈值的可疑有害呼叫个人名单。

根据所述的基于流数据图谱的群组有害呼叫检测方法，其中该方法还包括：对可疑有害呼叫个人名单进行录音验证，得到准确率与覆盖率的判断，变更所述相关属性和表征的阈值，录音验证，直到得到有害呼叫群组的名单。

根据所述的基于流数据图谱的群组有害呼叫检测方法，其中该方法还包括：对可疑有害呼叫个人名单的当前及结合历史的图谱特征进行记录溯源，同时确认群组内的成员及其成员关系。

本发明的技术方案还包括一种基于流数据图谱的群组有害呼叫检测的装置，该装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述任一所述的方法步骤。

本发明的技术方案一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7任一所述的方法步骤。

本发明的有益效果为：比于传统有害呼叫检测技术在分析的实时性及准确性上具有较大程度提升，并能实时查看呼叫当前及结合历史的图谱特征及记录溯源。同时，也可以做到重复听取通话的方式进行认为确认，增加分析成功率。

附图说明

下面结合附图和实施例对本发明进一步地说明；

图1所示为根据本发明实施方式的总体流程图；

图2所示为根据本发明的基于滑动时间窗口的深度图谱分析流程图；

图3所示为根据本发明的基于滑动时间窗口的呼叫深度图谱的Top-k排序算法流程图；

图4所示为根据本发明实施方式的诈骗群组识别流程；

图5所示为根据本发明实施方式的装置示意图。

具体实施方式

本部分将详细描述本发明的具体实施例，本发明之较佳实施例在附图中示出，附图的作用在于用图形补充说明书文字部分的描述，使人能够直观地、形象地理解本发明的每个技术特征和整体技术方案，但其不能理解为对本发明保护范围的限制。

在本发明的描述中，若干的含义是一个或者多个，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

本发明的描述中，除非另有明确的限定，设置等词语应做广义理解，所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。

图1所示为根据本发明实施方式的总体流程图。具体包括以下步骤：S100，采集多个用户的CDR数据，将CDR数据进行分解得到通讯数据并存入图形数据库，得到通讯图谱；S200，对通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征；S300，设置相关属性和表征的阈值，通过呼叫深度图谱的Top-k排序算法对获取可疑个人呼叫名单；S400，根据可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组。

图2所示为根据本发明的基于滑动时间窗口的深度图谱分析流程图。该流程包括：S210，开始时间戳，设置滑动窗口尺寸和时间增量；S220，对通讯图谱的数据行通过滑动窗口对符合设定的相关属性和表征进行提取，得到对应的多个可疑呼叫个人名单并显示于滑动窗口。

基于图2的流程图，本发明的技术方案还开了具体实施方案，具体如下伪代码：

图3所示为根据本发明的基于滑动时间窗口的呼叫深度图谱的Top-k排序算法流程图。该流程包括：S310，开始时间戳，设置k参数、滑动窗口尺寸及时间增量；S320，设置相关属性和表征的阈值，对疑似有害呼叫的群组进行排序，将符合阈值的可疑有害呼叫个人名单。

基于图3的流程图，本发明的技术方案还开了具体实施方案，具体如下伪代码：

图4所示为根据本发明实施方式的团伙诈骗识别流程。

S410，将CDR分解后存入图数据库，对通讯图谱进行子图分析。

S420，利用基于滑动窗口的深度图谱分析算法(流程见图2)提取通信节点统计及子图的相关属性和表征。所需提取的相关属性和表征具体包括：连接度：表明位于某个社团中的某个主叫在社团中的活跃程度，用来进一步判断该电话在团伙中所处的地位。团伙人数：用于诈骗团伙中的发现，判断该团伙的活跃人数。直径：用于判断诈骗团伙中，完成一次诈骗所需要的人数及所需的通话次数。三角形：由于判断社团内所有的主叫是否为非诈骗号码。当由通话所代表的通连关系构成稳定三角形的形式时，表明该通话所处的社团为正常的社团，即该社团内的所有号码为正常主叫而非诈骗号码。位置排名：用于判断某主叫在所有通连关系的重要性。当每个电话的发起人为某主叫时，表明该主叫在每次通话中的重要性。紧密度：通过判断通连关系中，某主叫呼出的被叫号码的次数与该次数相对于其他主叫呼出次数的对比。

S430，设置各项属性的阈值，采用呼叫深度图谱的Top-k排序算法(流程见图3)获取疑似诈骗人的名单。

S440，对疑似诈骗人进行录音验证，得到准确率与覆盖率的判断。

S450，变更阈值，重复S440，直到得到固定名单。

图5所示为根据本发明实施方式的装置示意图。

装置包括存储器100及处理器200，其中处理器200存储有计算机程序，计算机程序用于执行：采集多个用户的CDR数据，将CDR数据进行分解得到通讯数据并存入图形数据库，得到通讯图谱；对通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征；设置相关属性和表征的阈值，通过呼叫深度图谱的Top-k排序算法对获取可疑个人呼叫名单；根据可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组。

上面结合附图对本发明实施例作了详细说明，但是本发明不限于上述实施例，在技术领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims

1.一种基于流数据图谱的群组有害呼叫检测方法，其特征在于，该方法包括以下步骤：

S100，采集多个用户的CDR数据，将所述CDR数据进行分解得到通讯数据并存入图形数据库，得到通讯图谱；

S200，对所述通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征；

S300，设置相关属性和表征的阈值，通过呼叫深度图谱的Top-k排序算法来获取可疑个人呼叫名单；

S400，根据所述可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组；

所述基于固定时间窗口的深度图谱分析算法包括以下步骤：

S210，开始时间戳，设置滑动窗口尺寸和时间增量；

S220，对所述通讯图谱的数据行通过滑动窗口对符合设定的相关属性和表征进行提取，得到对应的多个可疑呼叫个人名单并显示于所述滑动窗口；

所述呼叫深度图谱的Top-k排序算法具体包括：

S310，开始时间戳，设置k参数、滑动窗口尺寸及时间增量；

S320，设置所述相关属性和表征的阈值，对疑似有害呼叫的群组进行排序，确定符合阈值条件的可疑有害呼叫个人名单。

2.根据权利要求1所述的基于流数据图谱的群组有害呼叫检测方法，其特征在于，所述相关属性和表征包括连接度、团伙人数、群组人数、直径、三角形、位置排名及紧密度。

3.根据权利要求2所述的基于流数据图谱的群组有害呼叫检测方法，其特征在于：

所述连接度为位于群组中的主叫在群组中的活跃程度，判断主叫处于群组的重要性；

所述团伙人数为用于可疑群组中的活跃人数；

所述直径为判断可疑群组中完成一次诈骗所需要的人数及所需的通话次数；

所述三角形用于判断群组内所有的主叫是否为非可疑号码；

所述位置排名用于判断主叫在所有通连关系的重要性，具体地，当每个电话的发起人为某主叫时，表明该主叫在每次通话中的重要性；

所述紧密度用于通过判断通连关系时，某主叫呼出的被叫号码的次数与该次数相对于其他主叫呼出次数的对比。

4.根据权利要求1所述的基于流数据图谱的群组有害呼叫检测方法，其特征在于，该方法还包括：

对可疑有害呼叫个人名单进行录音验证，得到准确率与覆盖率的判断，变更所述相关属性和表征的阈值，录音验证，直到得到有害呼叫群组的名单。

5.根据权利要求1所述的基于流数据图谱的群组有害呼叫检测方法，其特征在于，该方法还包括：

对可疑有害呼叫个人名单的当前及结合历史的图谱特征进行记录溯源，同时确认群组内的成员及其成员关系。

6.一种基于流数据图谱的群组有害呼叫检测的装置，该装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1-5任一所述的方法步骤。

7.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-5任一所述的方法步骤。