CN111131626B - 基于流数据图谱的群组有害呼叫检测方法、装置及可读介质 - Google Patents

基于流数据图谱的群组有害呼叫检测方法、装置及可读介质 Download PDF

Info

Publication number
CN111131626B
CN111131626B CN201911323548.9A CN201911323548A CN111131626B CN 111131626 B CN111131626 B CN 111131626B CN 201911323548 A CN201911323548 A CN 201911323548A CN 111131626 B CN111131626 B CN 111131626B
Authority
CN
China
Prior art keywords
calling
group
harmful
communication
suspicious
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911323548.9A
Other languages
English (en)
Other versions
CN111131626A (zh
Inventor
刘立峰
赵旭霞
王麟东
吴翔
杨鹏飞
金潇康
刘树新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Comleader Information Technology Co Ltd
Henan Xinda Wangyu Technology Co Ltd
Original Assignee
Zhuhai Comleader Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Comleader Information Technology Co Ltd filed Critical Zhuhai Comleader Information Technology Co Ltd
Priority to CN201911323548.9A priority Critical patent/CN111131626B/zh
Publication of CN111131626A publication Critical patent/CN111131626A/zh
Application granted granted Critical
Publication of CN111131626B publication Critical patent/CN111131626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2218Call detail recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
    • H04M3/4365Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it based on information specified by the calling party, e.g. priority or subject
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • H04W12/128Anti-malware arrangements, e.g. protection against SMS fraud or mobile malware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6027Fraud preventions

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Technology Law (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了基于流数据图谱的群组有害呼叫检测方法、装置及可读介质,包括:采集多个用户的CDR数据,将CDR数据进行分解得到通讯数据并存入图形数据库,得到通讯图谱;对通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征;设置相关属性和表征的阈值,通过呼叫深度图谱的Top‑k排序算法对获取可疑个人呼叫名单;根据可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组。本发明的有益效果为实时性及准确性上具有较大程度提升,并能实时查看呼叫当前及结合历史的图谱特征及记录溯源,重复听取通话的方式进行认为确认,增加可以群组通话的分析成功率。

Description

基于流数据图谱的群组有害呼叫检测方法、装置及可读介质
技术领域
本发明属于网络科学及电信网数据分析,具体涉及了一种基于流数据图谱的群组有害呼叫检测方法、装置及可读介质。
背景技术
随着无线通讯技术的普及,手机已成为人们进行远程通话的必备方式,给生活带来极大便捷。然而任何事物都具有两面性,无线通讯技术在为生活提供便利的同时,也容易被不法分子利用进行犯罪。电信诈骗便是一种由移动通信的普及衍生而来的新型诈骗方式。诈骗方式对生活与经济造成了巨大损失,如何有效进行有害呼叫检测迫在眉睫。
目前广泛采用的有害呼叫检测技术多通过分析主叫用户行为发现潜在的电信诈骗趋势。其中包括通过诈骗黑名单对主叫号码进行分析,确定主叫过往是否存在诈骗行为;通过对通话双方的语音进行录音保存,并在通话结束后对其通话内容进行分析确定是否存在诈骗行为;将已确定的有害号码加入到诈骗黑名单中,通过对黑名单中号码间的通联关系进行分析定位诈骗团伙。然而上述方式均依赖后处理分析,对电信诈骗的防范虽具有一定作用,但无法达到预期效果。除此之外,现有方法对诈骗团伙发现的准确性不高,无法从海量数据中及时、准确地分析出诈骗团伙及其成员所在位置。
发明内容
本发明的目的在于至少解决现有技术中存在的技术问题之一,提供了基于流数据图谱的群组有害呼叫检测方法、装置及可读介质,比于传统有害呼叫检测技术在分析的实时性及准确性上具有较大程度提升,并能实时查看呼叫当前及结合历史的图谱特征及记录溯源。
本发明的技术方案包括一种基于流数据图谱的群组有害呼叫检测方法,其特征在于,该方法包括以下步骤:S100,采集多个用户的CDR数据,将所述CDR数据进行分解得到通讯数据并存入图形数据库,得到通讯图谱;S200,对所述通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征;S300,设置相关属性和表征的阈值,通过呼叫深度图谱的Top-k排序算法对获取可疑个人呼叫名单;S400,根据所述可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组。
根据所述的基于流数据图谱的群组有害呼叫检测方法,其中相关属性和表征包括连接度、群组人数、直径、三角形、位置排名及紧密度。
根据所述的基于流数据图谱的群组有害呼叫检测方法,其中:所述连接度为位于群组中的主叫在群组中的活跃程度,判断主叫处于群组的重要性;所述团伙人数为用于可疑群组中的活跃人数;所述直径为判断可疑群组中完成一次诈骗所需要的人数及所需的通话次数;所述三角形用于判断群组内所有的主叫是否为非可疑号码;所述位置排名用于判断主叫在所有通连关系的重要性,具体地,当每个电话的发起人为某主叫时,表明该主叫在每次通话中的重要性;所述紧密度用于通过判断通连关系时,某主叫呼出的被叫号码的次数与该次数相对于其他主叫呼出次数的对比。
根据所述的基于流数据图谱的群组有害呼叫检测方法,其中基于固定时间窗口的深度图谱分析算法包括以下步骤:S210,开始时间戳,设置滑动窗口尺寸和时间增量;S220,对所述通讯图谱的数据行通过滑动窗口对符合设定的相关属性和表征进行提取,得到对应的多个可疑呼叫个人名单并显示于所述滑动窗口。
根据所述的基于流数据图谱的群组有害呼叫检测方法,其中呼叫深度图谱的Top-k排序算法具体包括:S310,开始时间戳,设置k参数、滑动窗口尺寸及时间增量;S320,设置所述相关属性和表征的阈值,对疑似有害呼叫的群组进行排序,将符合阈值的可疑有害呼叫个人名单。
根据所述的基于流数据图谱的群组有害呼叫检测方法,其中该方法还包括:对可疑有害呼叫个人名单进行录音验证,得到准确率与覆盖率的判断,变更所述相关属性和表征的阈值,录音验证,直到得到有害呼叫群组的名单。
根据所述的基于流数据图谱的群组有害呼叫检测方法,其中该方法还包括:对可疑有害呼叫个人名单的当前及结合历史的图谱特征进行记录溯源,同时确认群组内的成员及其成员关系。
本发明的技术方案还包括一种基于流数据图谱的群组有害呼叫检测的装置,该装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任一所述的方法步骤。
本发明的技术方案一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一所述的方法步骤。
本发明的有益效果为:比于传统有害呼叫检测技术在分析的实时性及准确性上具有较大程度提升,并能实时查看呼叫当前及结合历史的图谱特征及记录溯源。同时,也可以做到重复听取通话的方式进行认为确认,增加分析成功率。
附图说明
下面结合附图和实施例对本发明进一步地说明;
图1所示为根据本发明实施方式的总体流程图;
图2所示为根据本发明的基于滑动时间窗口的深度图谱分析流程图;
图3所示为根据本发明的基于滑动时间窗口的呼叫深度图谱的Top-k排序算法流程图;
图4所示为根据本发明实施方式的诈骗群组识别流程;
图5所示为根据本发明实施方式的装置示意图。
具体实施方式
本部分将详细描述本发明的具体实施例,本发明之较佳实施例在附图中示出,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本发明的每个技术特征和整体技术方案,但其不能理解为对本发明保护范围的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
图1所示为根据本发明实施方式的总体流程图。具体包括以下步骤:S100,采集多个用户的CDR数据,将CDR数据进行分解得到通讯数据并存入图形数据库,得到通讯图谱;S200,对通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征;S300,设置相关属性和表征的阈值,通过呼叫深度图谱的Top-k排序算法对获取可疑个人呼叫名单;S400,根据可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组。
图2所示为根据本发明的基于滑动时间窗口的深度图谱分析流程图。该流程包括:S210,开始时间戳,设置滑动窗口尺寸和时间增量;S220,对通讯图谱的数据行通过滑动窗口对符合设定的相关属性和表征进行提取,得到对应的多个可疑呼叫个人名单并显示于滑动窗口。
基于图2的流程图,本发明的技术方案还开了具体实施方案,具体如下伪代码:
Figure GDA0002899999570000041
Figure GDA0002899999570000051
图3所示为根据本发明的基于滑动时间窗口的呼叫深度图谱的Top-k排序算法流程图。该流程包括:S310,开始时间戳,设置k参数、滑动窗口尺寸及时间增量;S320,设置相关属性和表征的阈值,对疑似有害呼叫的群组进行排序,将符合阈值的可疑有害呼叫个人名单。
基于图3的流程图,本发明的技术方案还开了具体实施方案,具体如下伪代码:
Figure GDA0002899999570000052
Figure GDA0002899999570000061
图4所示为根据本发明实施方式的团伙诈骗识别流程。
S410,将CDR分解后存入图数据库,对通讯图谱进行子图分析。
S420,利用基于滑动窗口的深度图谱分析算法(流程见图2)提取通信节点统计及子图的相关属性和表征。所需提取的相关属性和表征具体包括:连接度:表明位于某个社团中的某个主叫在社团中的活跃程度,用来进一步判断该电话在团伙中所处的地位。团伙人数:用于诈骗团伙中的发现,判断该团伙的活跃人数。直径:用于判断诈骗团伙中,完成一次诈骗所需要的人数及所需的通话次数。三角形:由于判断社团内所有的主叫是否为非诈骗号码。当由通话所代表的通连关系构成稳定三角形的形式时,表明该通话所处的社团为正常的社团,即该社团内的所有号码为正常主叫而非诈骗号码。位置排名:用于判断某主叫在所有通连关系的重要性。当每个电话的发起人为某主叫时,表明该主叫在每次通话中的重要性。紧密度:通过判断通连关系中,某主叫呼出的被叫号码的次数与该次数相对于其他主叫呼出次数的对比。
S430,设置各项属性的阈值,采用呼叫深度图谱的Top-k排序算法(流程见图3)获取疑似诈骗人的名单。
S440,对疑似诈骗人进行录音验证,得到准确率与覆盖率的判断。
S450,变更阈值,重复S440,直到得到固定名单。
图5所示为根据本发明实施方式的装置示意图。
装置包括存储器100及处理器200,其中处理器200存储有计算机程序,计算机程序用于执行:采集多个用户的CDR数据,将CDR数据进行分解得到通讯数据并存入图形数据库,得到通讯图谱;对通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征;设置相关属性和表征的阈值,通过呼叫深度图谱的Top-k排序算法对获取可疑个人呼叫名单;根据可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (7)

1.一种基于流数据图谱的群组有害呼叫检测方法,其特征在于,该方法包括以下步骤:
S100,采集多个用户的CDR数据,将所述CDR数据进行分解得到通讯数据并存入图形数据库,得到通讯图谱;
S200,对所述通讯图谱基于滑动窗口的深度图谱提取通信节点统计及子图的相关属性和表征;
S300,设置相关属性和表征的阈值,通过呼叫深度图谱的Top-k排序算法来获取可疑个人呼叫名单;
S400,根据所述可疑个人呼叫件的联系紧密度确认对应的有害呼叫群组;
所述基于固定时间窗口的深度图谱分析算法包括以下步骤:
S210,开始时间戳,设置滑动窗口尺寸和时间增量;
S220,对所述通讯图谱的数据行通过滑动窗口对符合设定的相关属性和表征进行提取,得到对应的多个可疑呼叫个人名单并显示于所述滑动窗口;
所述呼叫深度图谱的Top-k排序算法具体包括:
S310,开始时间戳,设置k参数、滑动窗口尺寸及时间增量;
S320,设置所述相关属性和表征的阈值,对疑似有害呼叫的群组进行排序,确定符合阈值条件的可疑有害呼叫个人名单。
2.根据权利要求1所述的基于流数据图谱的群组有害呼叫检测方法,其特征在于,所述相关属性和表征包括连接度、团伙人数、群组人数、直径、三角形、位置排名及紧密度。
3.根据权利要求2所述的基于流数据图谱的群组有害呼叫检测方法,其特征在于:
所述连接度为位于群组中的主叫在群组中的活跃程度,判断主叫处于群组的重要性;
所述团伙人数为用于可疑群组中的活跃人数;
所述直径为判断可疑群组中完成一次诈骗所需要的人数及所需的通话次数;
所述三角形用于判断群组内所有的主叫是否为非可疑号码;
所述位置排名用于判断主叫在所有通连关系的重要性,具体地,当每个电话的发起人为某主叫时,表明该主叫在每次通话中的重要性;
所述紧密度用于通过判断通连关系时,某主叫呼出的被叫号码的次数与该次数相对于其他主叫呼出次数的对比。
4.根据权利要求1所述的基于流数据图谱的群组有害呼叫检测方法,其特征在于,该方法还包括:
对可疑有害呼叫个人名单进行录音验证,得到准确率与覆盖率的判断,变更所述相关属性和表征的阈值,录音验证,直到得到有害呼叫群组的名单。
5.根据权利要求1所述的基于流数据图谱的群组有害呼叫检测方法,其特征在于,该方法还包括:
对可疑有害呼叫个人名单的当前及结合历史的图谱特征进行记录溯源,同时确认群组内的成员及其成员关系。
6.一种基于流数据图谱的群组有害呼叫检测的装置,该装置包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-5任一所述的方法步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5任一所述的方法步骤。
CN201911323548.9A 2019-12-20 2019-12-20 基于流数据图谱的群组有害呼叫检测方法、装置及可读介质 Active CN111131626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911323548.9A CN111131626B (zh) 2019-12-20 2019-12-20 基于流数据图谱的群组有害呼叫检测方法、装置及可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911323548.9A CN111131626B (zh) 2019-12-20 2019-12-20 基于流数据图谱的群组有害呼叫检测方法、装置及可读介质

Publications (2)

Publication Number Publication Date
CN111131626A CN111131626A (zh) 2020-05-08
CN111131626B true CN111131626B (zh) 2022-01-14

Family

ID=70500954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911323548.9A Active CN111131626B (zh) 2019-12-20 2019-12-20 基于流数据图谱的群组有害呼叫检测方法、装置及可读介质

Country Status (1)

Country Link
CN (1) CN111131626B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107222865A (zh) * 2017-04-28 2017-09-29 北京大学 基于可疑行为识别的通讯诈骗实时检测方法和系统
CN107451192A (zh) * 2017-06-28 2017-12-08 国家计算机网络与信息安全管理中心 一种基于分解聚合的电信诈骗电话的分类检测方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7822605B2 (en) * 2006-10-19 2010-10-26 Nice Systems Ltd. Method and apparatus for large population speaker identification in telephone interactions
JP5810946B2 (ja) * 2012-01-31 2015-11-11 富士通株式会社 特定通話検出装置、特定通話検出方法及び特定通話検出用コンピュータプログラム
CN106302942A (zh) * 2016-08-26 2017-01-04 朱书勤 一种智能拦截骚扰电话的方法
CN108133061A (zh) * 2018-02-01 2018-06-08 天津市国瑞数码安全系统股份有限公司 一种诈骗群体识别系统
CN110381218B (zh) * 2018-04-12 2021-03-23 中国移动通信集团广东有限公司 一种识别电话诈骗团伙的方法及装置
CN110233938B (zh) * 2019-05-14 2020-12-22 中国科学院信息工程研究所 一种基于可疑性度量的团伙诈骗电话识别方法
CN110188805B (zh) * 2019-05-17 2021-02-26 国家计算机网络与信息安全管理中心 一种诈骗群体的识别方法
CN110223168B (zh) * 2019-06-24 2022-06-28 浪潮卓数大数据产业发展有限公司 一种基于企业关系图谱的标签传播反欺诈检测方法及系统
CN110415107B (zh) * 2019-07-26 2021-10-01 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107222865A (zh) * 2017-04-28 2017-09-29 北京大学 基于可疑行为识别的通讯诈骗实时检测方法和系统
CN107451192A (zh) * 2017-06-28 2017-12-08 国家计算机网络与信息安全管理中心 一种基于分解聚合的电信诈骗电话的分类检测方法

Also Published As

Publication number Publication date
CN111131626A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN109600752B (zh) 一种深度聚类诈骗检测的方法和装置
CN108924333B (zh) 诈骗电话识别方法、装置和系统
WO2016197675A1 (zh) 骚扰电话的识别方法及装置
CN110337059B (zh) 一种用户家庭关系的分析算法、服务器及网络系统
CN101686444B (zh) 垃圾短信发送号码实时检测系统及方法
CN104038648A (zh) 骚扰电话的识别方法和装置
CN106936997B (zh) 一种基于社交关系图谱的垃圾语音识别方法和系统
CN105869035A (zh) 一种移动用户信用评估方法及装置
CN107231494A (zh) 一种用户通信特征的获取方法、存储介质及电子设备
CN110647561A (zh) 用于涉毒人员的通信轨迹分析方法
CN111131627B (zh) 基于流数据图谱的个人有害呼叫检测方法、装置及可读介质
CN112351429B (zh) 基于深度学习的有害信息检测方法及系统
CN110493476B (zh) 一种检测方法、装置、服务器及存储介质
CN108198086B (zh) 用于依据通信行为特征来识别骚扰源的方法和装置
CN114169438A (zh) 一种电信网络诈骗识别方法、装置、设备及存储介质
CN110167030B (zh) 识别骚扰电话的方法、装置、电子设备和存储介质
CN111131626B (zh) 基于流数据图谱的群组有害呼叫检测方法、装置及可读介质
WO2015189380A1 (en) Method and apparatus for detecting and filtering undesirable phone calls
CN111901790A (zh) 电信诈骗的识别方法、装置、电子装置和存储介质
CN109587357B (zh) 一种骚扰电话的识别方法
CN108696626B (zh) 非法信息的处理方法和装置
CN113596260B (zh) 异常电话号码检测方法和电子设备
CN106875276A (zh) 一种通信用户社交圈生成方法及系统
CN114205462A (zh) 一种诈骗电话识别方法、装置、系统及计算机存储介质
CN112307075B (zh) 用户关系识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231227

Address after: 519060 No.1, Pingdong 1st Road, Nanping Science and Technology Industrial Park, Zhuhai City, Guangdong Province

Patentee after: ZHUHAI COMLEADER INFORMATION TECHNOLOGY Co.,Ltd.

Patentee after: HENAN XINDA WANGYU TECHNOLOGY Co.,Ltd.

Address before: 519060 No.1, Pingdong 1st Road, Nanping Science and Technology Industrial Park, Zhuhai City, Guangdong Province

Patentee before: ZHUHAI COMLEADER INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right