CN110211014A - 一种运营商反欺诈检测方法 - Google Patents

一种运营商反欺诈检测方法 Download PDF

Info

Publication number
CN110211014A
CN110211014A CN201910471856.XA CN201910471856A CN110211014A CN 110211014 A CN110211014 A CN 110211014A CN 201910471856 A CN201910471856 A CN 201910471856A CN 110211014 A CN110211014 A CN 110211014A
Authority
CN
China
Prior art keywords
user
data
cdr
fraud detection
detection method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910471856.XA
Other languages
English (en)
Inventor
魏国富
陈一根
刘胜
梁淑云
殷钱安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information and Data Security Solutions Co Ltd
Original Assignee
Information and Data Security Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information and Data Security Solutions Co Ltd filed Critical Information and Data Security Solutions Co Ltd
Priority to CN201910471856.XA priority Critical patent/CN110211014A/zh
Publication of CN110211014A publication Critical patent/CN110211014A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Technology Law (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种运营商反欺诈检测方法,包含以下步骤:A、处理通话数据;B、建立人工智能算法模型;对数据进行分析,定位诈骗用户位置;C、可疑诈骗用户反向溯源、追踪分析,本发明的有益效果是:1)提取运营商中条件属性和决策属性检测出欺诈用户,对欺诈用户进行反向溯源跟踪,有效提高用户的信任度和人身财产安全。2)利用诈骗团伙位置分布算法对可疑的诈骗用户进行近似识别和位置分布定位。3)利用粗糙集理论从运营商通话数据中检测出可疑用户:分割数据集,用粗糙集提取规则,然后找出具有规则的可疑欺诈用户。

Description

一种运营商反欺诈检测方法
技术领域
本发明涉及一种检测方法,具体是一种运营商反欺诈检测方法。
背景技术
诈骗在现代社会中非常流行,并且存在各种形式欺诈,例如信用卡欺诈,网络交易欺 诈和保险欺诈等。电信运营商也是遭受着同样的问题,曾经损失数十亿美金,电信运营商 采用的反诈骗方法通常是分析用户使用呼叫详细记录数据(CDR),最常用的方法是使用反欺诈检测规则进行数据分类。
1、基于一种基于规则的欺诈检测方法,根据包括本地呼叫每周平均次数,平均呼叫 持续时间等数据特征对CDR数据进行划分,并建立概率模型来描述用户动作,模型参数通过最大似然估计进行估计,还给出了用于识别正常用户和异常用户的每个数据组的阀值。设计了规则、异常用户的特征值高于阈值,普通用户低于阈值。对于异常用户,检测 系统向管理者发出警告信号,以便于进一步监控以防止更大的危害。
2、基于人工神经网络的反欺诈检测方法,该方法利用电信运营商中的用户(CDR)数据建立训练子集,并从原始训练样本集中随机选择样本,实际上是样本的空间划分。每个子集用于训练ANN分类器,多分类器被适当的用于组合在一起构成强分类器,组合的 强分类器的错误分类概率小于单个ANN分类器,并且该方法获得了良好的反欺诈检测结 果,实验中使用4个不同的训练子集来训练4个分类器,预测的结果是4个ANN输出的 平均值比单个ANN分类器效果更好。
基于一种基于规则的欺诈检测方法,根据包括本地呼叫每周平均次数,平均呼叫持续 时间等数据特征对CDR数据进行划分,并建立概率模型来描述用户动作,模型参数通过 最大似然估计进行估计,还给出了用于识别正常用户和异常用户的每个数据组的阈值,异 常用户的特征值高于阈值,普通用户低于阈值,这种方法在设计上就以阈值进行划分,忽 略了数据集中属性的相互关联性,简单使用本地呼叫每周次数和平均呼叫持续时间数据特 征来进行进行概率阈值划分欺诈用户存在极大的误报率和容错率。
基于人工神经网络的反欺诈检测方法,该方法利用电信运营商中的用户(CDR)数据 建立训练子集,并从原始训练样本集中随机选择样本,实际上是样本的空间划分。每个子 集用于训练ANN分类器,多分类器被适当的用于组合在一起构成强分类器,虽然这种方法组合的强分类器的错误分类概率小于单个ANN分类器,但是涉及的神经网络参数过多,同时也无法观察中间结果,学习过程比较长,还有可能陷入局部最优化。
上述方法通过各种数据方法和模型研究了电信业的反欺诈检测问题,这些方法在一定 程度上取得了良好的效果。但现在有的欺诈检测方法,仍有很多问题需要解决,未来欺诈 的类型和形式未知。现在所有的欺诈检测方法,对使用可用数据来模拟欺诈行为的欺诈检 测,然后用模型来预测潜在的欺诈行为。本发明为了解决现有技术存在的误报率、高复杂 度,提出了一种基于粗糙集的运营商反欺诈检测方法,可以有效的降低在检测过程中的误 报率、容错率以及降低计算复杂度。
发明内容
本发明的目的在于提供一种运营商反欺诈检测方法,以解决所述背景技术中提出的问 题。
为实现所述目的,本发明提供如下技术方案:
一种运营商反欺诈检测方法,包含以下步骤:
A、处理通话数据;
B、建立人工智能算法模型;对数据进行分析,定位诈骗用户位置;
C、可疑诈骗用户反向溯源、追踪分析。
作为本发明再进一步的方案:所述步骤A具体是:从正常CDR数据库中选择正常CDR数据的N个样本和来自异常CDR数据库的异常CDR数据的N个样本;设计的特征属性 有:1)大型欠费记录;2)月消费率与平均每月消费量;3)每月消费增长率;4)呼叫时 间与平均时间的比率;5)每月呼叫时间的增长率。
作为本发明再进一步的方案:决策属性表示为DM,DM=0表示CDR数据正常,DM=1表示疑似遗产的CDR数据。
作为本发明再进一步的方案:设置三个级别的阈值,每个属性值都分布在三个级别范 围中。
作为本发明再进一步的方案:所述步骤B具体是:用阈值离散CDR数据,合并重复记录并重构决策矩阵;从数据库和预处理中随机选择10000个异常和10000个正常CDR,这 里三个级别表示为0,1和2;删除重复记录并构建CDR决策表。
作为本发明再进一步的方案:所述步骤C具体是:人工智能的粗糙集算法模型检测到 的诈骗用户号码、特殊号码等数据,构建失信欺诈用户库,包含欺诈用户的位置分布、号码、机构名称、响一声次数,利用莱温斯坦距离算法计算出失信用户中的位置分布与当前可疑位置分布之间的相似程度,从而识别出欺诈用户团伙的位置分布,从而进行反向溯源,然后利用短信、闪信等方式告知受害者,最后对受害者进行回访。
与现有技术相比,本发明的有益效果是:1)提取运营商中条件属性和决策属性检测出 欺诈用户,对欺诈用户进行反向溯源跟踪,有效提高用户的信任度和人身财产安全。2)利 用诈骗团伙位置分布算法对可疑的诈骗用户进行近似识别和位置分布定位。3)利用粗糙集 理论从运营商通话数据中检测出可疑用户:分割数据集,用粗糙集提取规则,然后找出具 有规则的可疑欺诈用户。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地 描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本 发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实 施例,都属于本发明保护的范围。
实施例1:请参阅图1,一种运营商反欺诈检测方法,包含以下步骤:
A、处理通话数据:
从正常CDR数据库中选择正常CDR数据的N个样本和来自异常CDR数据库的异常CDR数据的N个样本;设计的特征属性有:1)大型欠费记录;2)月消费率与平均每月消费量; 3)每月消费增长率;4)呼叫时间与平均时间的比率;5)每月呼叫时间的增长率。这个5 个属性分别用a,b,c,d,e来表示。
·决策属性表示为DM,DM=0表示CDR数据正常,DM=1表示疑似遗产的CDR数据。
设置三个级别的阈值,即每个属性值都分布在三个级别范围中。
B、第一步:用阈值离散CDR数据,合并重复记录并重构决策矩阵;
从数据库和预处理中随机选择10,000个异常和10,000个正常CDR,这里三个级别表示 为0,1和2;删除重复记录并构建CDR决策表,如表1所示。
决策表中属性含义与上述的相同,ID表示CDR记录,表示为xi
表1 CDR决策表:
ID a b c d e DM
x<sub>1</sub> 1 1 2 2 2 1
x<sub>2</sub> 2 2 2 2 2 1
x<sub>3</sub> 0 1 1 2 1 0
x<sub>4</sub> 1 0 0 0 1 0
x<sub>5</sub> 2 0 0 0 0 0
x<sub>6</sub> 0 2 2 1 1 0
x<sub>7</sub> 1 1 2 2 1 1
x<sub>8</sub> 1 2 2 1 0 1
第二步:通过公式构造判别矩阵如下:
第三步:根据粗糙集理论构造判定函数,写出判别函数 fA(D)=(a∨c∨e)∧(b∨c∨d∨e)∧(a∨b∨c∨d∨e)∧(a∨b∨d∨e)∧
(a∨b∨c∨e)∧(a∨b∨c∨d∨e)∧(b∨c∨d∨e)∧(a∨d∨d∨e)∧
(a∨c)∧(a∨b∨c∨d∨e)∧
(b∨c∨d)∧(b∨c∨d)∧
(a∨b∨c∨d∨e)∧(a∨b∨c∨d)∧
(a∨b∨d)∧(a∨e) 第四步:简化判别矩阵和获得简化项目,获得结果如下:
fA(D)=ae∨ac∨abd∨bcd;
第五步:通过简化的项目和决策表提取决策规则,根据决策表1导出决策结果:
IF a=1and b=1and d=2,then SF
IF a=2and b=2and d=2,then SF
TF a=1and b=2and d=1,then SF
IF a=0and b=1and d=1,then SF
这里sF表示疑似欺诈记录,其他检测规则也可以以相同的方式获得。
在检测规则的应用中,具有少量属性的规则应优先用于快速扫描记录找出可疑记录, 然后应用具有更多属性的规则进一步检测,如果记录符合欺诈记录,则给出进一步报警和 验证。
C、可疑诈骗用户反向溯源、追踪分析。人工智能的粗糙集算法模型检测到的诈骗用 户号码、特殊号码等数据,构建失信欺诈用户库,包含欺诈用户的位置分布、号码、机构名称、响一声次数,利用莱温斯坦距离算法计算出失信用户中的位置分布与当前可疑位置分布之间的相似程度,从而识别出欺诈用户团伙的位置分布,从而进行反向溯源,然后利用短信、闪信等方式告知受害者,最后对受害者进行回访。
实施例2,在实施例1的基础上,距离算法描述:
1)经纬度转换为弧度
三角函数中使用弧度值进行计算,还需要将经纬度转换为弧度。转换公式为N*PI/180, 如将点A的纬度值39.5427转换为弧度39.5427*PI/180(PI为圆周率)。A/B两点的经/纬 度转为弧度后分别用λA、λB。
2)计算边a和边b的弦度
利用纬度差,我们可得到边a的弧度Δa;利用经度差,我们可得到边b的弧度Δb(计 算时注意取绝对值)。
3)计算边两点间的正弦值和余弦值
计算出以上一系列变量后,计算出半正矢值a,其计算公式为
4)计算边正切值
c=2*atan2(√a,√(1-a))
5)实际距离
d=R*c(R表示地球半径)。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背 离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从 哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权 利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有 变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含 一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将 说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可 以理解的其他实施方式。

Claims (6)

1.一种运营商反欺诈检测方法,其特征在于:包含以下步骤:
A、处理通话数据;
B、建立人工智能算法模型;对数据进行分析,定位诈骗用户位置;
C、可疑诈骗用户反向溯源、追踪分析。
2.根据权利要求1所述的一种运营商反欺诈检测方法,其特征在于,所述步骤A具体是:从正常CDR数据库中选择正常CDR数据的N个样本和来自异常CDR数据库的异常CDR数据的N个样本;设计的特征属性有:1)大型欠费记录;2)月消费率与平均每月消费量;3)每月消费增长率;4)呼叫时间与平均时间的比率;5)每月呼叫时间的增长率。
3.根据权利要求2所述的一种运营商反欺诈检测方法,其特征在于,决策属性表示为DM,DM=0表示CDR数据正常,DM=1表示疑似遗产的CDR数据。
4.根据权利要求3所述的一种运营商反欺诈检测方法,其特征在于,设置三个级别的阈值,每个属性值都分布在三个级别范围中。
5.根据权利要求1所述的一种运营商反欺诈检测方法,其特征在于,所述步骤B具体是:用阈值离散CDR数据,合并重复记录并重构决策矩阵;从数据库和预处理中随机选择10000个异常和10000个正常CDR,这里三个级别表示为0,1和2;删除重复记录并构建CDR决策表。
6.根据权利要求1所述的一种运营商反欺诈检测方法,其特征在于,所述步骤C具体是:人工智能的粗糙集算法模型检测到的诈骗用户号码、特殊号码等数据,构建失信欺诈用户库,包含欺诈用户的位置分布、号码、机构名称、响一声次数,利用莱温斯坦距离算法计算出失信用户中的位置分布与当前可疑位置分布之间的相似程度,从而识别出欺诈用户团伙的位置分布,从而进行反向溯源,然后利用短信、闪信等方式告知受害者,最后对受害者进行回访。
CN201910471856.XA 2019-05-31 2019-05-31 一种运营商反欺诈检测方法 Pending CN110211014A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910471856.XA CN110211014A (zh) 2019-05-31 2019-05-31 一种运营商反欺诈检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910471856.XA CN110211014A (zh) 2019-05-31 2019-05-31 一种运营商反欺诈检测方法

Publications (1)

Publication Number Publication Date
CN110211014A true CN110211014A (zh) 2019-09-06

Family

ID=67790125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910471856.XA Pending CN110211014A (zh) 2019-05-31 2019-05-31 一种运营商反欺诈检测方法

Country Status (1)

Country Link
CN (1) CN110211014A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111131627A (zh) * 2019-12-20 2020-05-08 珠海高凌信息科技股份有限公司 基于流数据图谱的个人有害呼叫检测方法、装置及可读介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933444A (zh) * 2015-06-26 2015-09-23 南京邮电大学 一种面向多维属性数据的多层聚类融合机制的设计方法
US20160277934A1 (en) * 2015-03-16 2016-09-22 Yaana Technologies, LLC Method and System for Defending a Mobile Network from a Fraud
CN106791220A (zh) * 2016-11-04 2017-05-31 国家计算机网络与信息安全管理中心 防止电话诈骗的方法及系统
CN106851633A (zh) * 2017-02-15 2017-06-13 上海交通大学 基于用户隐私保护的电信欺诈检测系统及方法
CN107070704A (zh) * 2017-03-22 2017-08-18 东南大学 一种基于QoS的可信Web服务组合优化方法
CN107342987A (zh) * 2017-06-20 2017-11-10 深圳安巽科技有限公司 一种网络反电信诈骗系统
CN108133061A (zh) * 2018-02-01 2018-06-08 天津市国瑞数码安全系统股份有限公司 一种诈骗群体识别系统
CN108156335A (zh) * 2018-02-02 2018-06-12 天津市国瑞数码安全系统股份有限公司 一种诈骗信息码谱分析系统
CN108199899A (zh) * 2018-01-18 2018-06-22 山东英才学院 一种无线传感器网络故障检测方法、装置及系统
CN108616890A (zh) * 2018-04-16 2018-10-02 中山易美信息技术有限公司 一种诈骗话单分析系统
CN109325691A (zh) * 2018-09-27 2019-02-12 上海观安信息技术股份有限公司 异常行为分析方法、电子设备及计算机程序产品
CN109600752A (zh) * 2018-11-28 2019-04-09 国家计算机网络与信息安全管理中心 一种深度聚类诈骗检测的方法和装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160277934A1 (en) * 2015-03-16 2016-09-22 Yaana Technologies, LLC Method and System for Defending a Mobile Network from a Fraud
CN104933444A (zh) * 2015-06-26 2015-09-23 南京邮电大学 一种面向多维属性数据的多层聚类融合机制的设计方法
CN106791220A (zh) * 2016-11-04 2017-05-31 国家计算机网络与信息安全管理中心 防止电话诈骗的方法及系统
CN106851633A (zh) * 2017-02-15 2017-06-13 上海交通大学 基于用户隐私保护的电信欺诈检测系统及方法
CN107070704A (zh) * 2017-03-22 2017-08-18 东南大学 一种基于QoS的可信Web服务组合优化方法
CN107342987A (zh) * 2017-06-20 2017-11-10 深圳安巽科技有限公司 一种网络反电信诈骗系统
CN108199899A (zh) * 2018-01-18 2018-06-22 山东英才学院 一种无线传感器网络故障检测方法、装置及系统
CN108133061A (zh) * 2018-02-01 2018-06-08 天津市国瑞数码安全系统股份有限公司 一种诈骗群体识别系统
CN108156335A (zh) * 2018-02-02 2018-06-12 天津市国瑞数码安全系统股份有限公司 一种诈骗信息码谱分析系统
CN108616890A (zh) * 2018-04-16 2018-10-02 中山易美信息技术有限公司 一种诈骗话单分析系统
CN109325691A (zh) * 2018-09-27 2019-02-12 上海观安信息技术股份有限公司 异常行为分析方法、电子设备及计算机程序产品
CN109600752A (zh) * 2018-11-28 2019-04-09 国家计算机网络与信息安全管理中心 一种深度聚类诈骗检测的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王静 等: "布尔决策表的属性约简新方法:应用于欺诈识别", 《计算机工程与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111131627A (zh) * 2019-12-20 2020-05-08 珠海高凌信息科技股份有限公司 基于流数据图谱的个人有害呼叫检测方法、装置及可读介质
CN111131627B (zh) * 2019-12-20 2021-12-07 珠海高凌信息科技股份有限公司 基于流数据图谱的个人有害呼叫检测方法、装置及可读介质

Similar Documents

Publication Publication Date Title
US20190259033A1 (en) System and method for using a data genome to identify suspicious financial transactions
CN111950937B (zh) 一种基于融合时空轨迹的重点人员风险评估方法
US11699160B2 (en) Method, use thereof, computer program product and system for fraud detection
Tripathi et al. Survey on credit card fraud detection methods
CN106227863A (zh) 在案件串并和嫌疑人排查中的数据挖掘方法
CN105404890A (zh) 一种顾及轨迹时空语义的犯罪团伙判别方法
CN110348528A (zh) 基于多维数据挖掘的用户信用确定方法
Pekar et al. Early detection of heterogeneous disaster events using social media
CN102572744B (zh) 识别特征库获取方法、装置及短消息识别方法、装置
CN110781308A (zh) 一种基于大数据构建知识图谱的反欺诈系统
KR102259838B1 (ko) 암호화폐 블랙리스트 구축 장치 및 방법
Savage et al. Detection of money laundering groups: Supervised learning on small networks
Singh et al. An empirical study of AML approach for credit card fraud detection—financial transactions
CN106851633A (zh) 基于用户隐私保护的电信欺诈检测系统及方法
CN112199480B (zh) 一种基于bert模型的在线对话日志违规检测方法及系统
CN111695019A (zh) 一种识别关联账号的方法及装置
Zhu et al. Spatio-temporal point processes with attention for traffic congestion event modeling
CN110347669A (zh) 基于流式大数据分析的风险防范方法
Das et al. Crime analysis against women from online newspaper reports and an approach to apply it in dynamic environment
CN110211014A (zh) 一种运营商反欺诈检测方法
CN112966728A (zh) 一种交易监测的方法及装置
Hamdy et al. Criminal act detection and identification model
Devaki et al. Credit card fraud detection using time series analysis
Eshghi et al. Introducing a method for combining supervised and semi-supervised methods in fraud detection
Vulandari et al. Application of k-means clustering in mapping of Central Java crime area

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190906