CN111754337A - 一种信用卡养卡套现团体识别的方法及系统 - Google Patents
一种信用卡养卡套现团体识别的方法及系统 Download PDFInfo
- Publication number
- CN111754337A CN111754337A CN202010610974.7A CN202010610974A CN111754337A CN 111754337 A CN111754337 A CN 111754337A CN 202010610974 A CN202010610974 A CN 202010610974A CN 111754337 A CN111754337 A CN 111754337A
- Authority
- CN
- China
- Prior art keywords
- data
- credit card
- card
- transaction
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012423 maintenance Methods 0.000 title claims description 34
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 75
- 238000005065 mining Methods 0.000 claims abstract description 27
- 230000008520 organization Effects 0.000 claims abstract description 6
- 238000000605 extraction Methods 0.000 claims description 32
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 11
- 238000007621 cluster analysis Methods 0.000 claims description 6
- 210000000056 organ Anatomy 0.000 claims description 3
- 238000009412 basement excavation Methods 0.000 claims description 2
- 238000004138 cluster model Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 9
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000011161 development Methods 0.000 abstract description 2
- 238000011835 investigation Methods 0.000 abstract description 2
- 238000004900 laundering Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 10
- 238000012549 training Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种信用卡养卡套现团体识别方法及系统,本发明依托于完善的银行、运营商及公安机关数据,使用均值移动聚类算法(MSC)识别出存在信用卡养卡套现的用户及作案人员,并通过知识图谱强大的特征挖掘能力找出与其关联的关键成员、重要成员,从而挖掘出犯罪团伙。本发明为银行及公安部门进行信用卡养卡套现犯罪活动的侦查提供了一个具有指导性和实践性的方案,为打击犯罪活动提供了有力的线索和证据,有利于信用卡行业的健康发展,并能在一定程度上遏制“洗钱”等不法行为的来源。
Description
技术领域
本发明涉及金融诈骗识别技术领域,具体为一种信用卡养卡套现团体识别的方法及系统。
背景技术
所谓信用卡套现,一般是经过与商家建立联系,通过进行虚假消费将信用卡的额度提现至对应的银行卡内。而所谓养卡,即通过使用自己信用卡额度的一部分,在账单日之后提现剩下的额度并用来还款,从而可以实现无限期的贷款,只需要付出比较低的手续费即可。另外,用户也可以办理多张信用卡来实现养卡的目的。
信用卡养卡套现属于金融欺诈行为,其一旦被认定为套现,个人信用将会被蒙上污点,影响持卡人生活的方方面面。另外,持卡人一旦被养卡套现团伙盯上,个人隐私信息还可能被泄露,甚至会陷入危害更大的电信诈骗、套路贷等犯罪活动。
传统的反信用卡养卡套现的手段主要是通过基于规则和模型的方法,且侧重点在于对个体用户的识别和防控。如申请号为201911162068.9公开了一种训练养卡识别模型、识别养卡行为的方法及装置,其采用机器学习方法对训练样本进行有监督训练,可以得到覆盖率和准确率较高的养卡识别模型,针对单个养卡用户进行识别。
然而现在的信用卡欺诈不仅手段多样、复杂多变,而且已向团伙作案的趋势发展,传统反信用卡养卡套现手段在实际应用中存在以下问题:
1、难以识别出养卡套现团伙:传统的基于规则或单模型的方法,主要是对单个用户或账户进行分析识别,对诈骗团伙中的其他非直接接触成员无法进行有效的识别;
2、时效性差:由于针对单用户的反养卡套现手段需要用户有一定时间范围内的交易记录,而等到能够确认风险时,用户往往已经进行了多笔交易。
3、无法精准识别出团伙中的重要人物、必要人物及隐藏人物等角色:传统的手段是基于账户的交易行为进行分析,而在诈骗团伙中,组织人物是不会直接参与到诈骗实施中的,单纯的通过交易行为是无法识别出这些关键成员的。
发明内容
本发明所要解决的技术问题在于提供一种信用卡养卡套现团体识别的方法。
本发明通过以下技术手段实现解决上述技术问题的:
一种信用卡养卡套现团体识别方法,包括以下步骤:
S1.疑似养卡套现数据获取,至少获取运营商通话及银行流水数据,作为待聚类数据;
S2.特征提取,针对待聚类数据进行特征构造,得到基本特征、通话特征及交易特征;
S3.聚类分析,采用均值漂移聚类算法对基本特征、通话特征及交易特征进行分析,得到均值漂移聚类模型及聚类结果;
S4.类别确定,获取带有标签的养卡套现用户清单数据,并对清单数据进行特征提取,然后将提取的特征输入均值漂移聚类模型进行聚类,根据标签与聚类结果对应关系,确定疑似养卡套现数据中用户所处的类别,进而得到疑似养卡套现用户对象清单;
S5.知识抽取,针对疑似养卡套现数据进行实体抽取、关系抽取,属性抽取;
S6.知识图谱构建,将抽取的实体数据、关系数据,属性数据导入neo4j数据库中,得到知识图谱;
S7.特征挖掘,基于构建好的知识图谱,通过知识图谱的深层遍历及相关图挖掘算法,进而识别出特定人员之间的关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系特征;
S8.群体识别,通过步骤S7,从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。
本发明依托于完善的银行、运营商及公安机关数据,使用均值移动聚类算法(MSC)识别出存在信用卡养卡套现的用户及作案人员,并通过知识图谱强大的特征挖掘能力找出与其关联的关键成员、重要成员,从而挖掘出犯罪团伙。
进一步的,所述步骤S1中的样例数据至少包括信用卡持卡人基本信息、POS机持机人基本信息、通话数据、信用卡交易数据;其中信用卡持卡人基本信息至少包括信用卡卡号、持卡人手机号及信用;POS机持机人基本信息至少包括POS机序列号、商户号、手机号及身份信息。
进一步的,所述步骤S2中具体为,以用户的手机号为分析对象,以近三个月为时间周期,取用户的信用卡交易数据、通话数据进行特征构建,得到基本特征、通话特征及交易特征。
进一步的,所述步骤S3中采用引入核函数后的均值漂移聚类算法进行聚类计算:
其中,x为中心点,xi为滑动窗口内的数据,h为滑动窗口带宽,g(x)为对核函数的导数求负。
进一步的,所述步骤S4中带有标签的养卡套现用户清单数据来自于公安或银行已经确定的信用卡养卡套现用户数据。
进一步的,所述步骤S7中的相关图挖掘计算过程具体为:
现采用最短路径算法计算知识图谱中两点之间的最短距离,然后利用介中心度算法计算出经过某个点的最短路径数,最后用PageRank算法计算节点的重要程度。
本发明还提供一种信用卡养卡套现团体识别系统,:应用于上述的方法,包括
疑似养卡套现数据获取模块,至少获取运营商通话及银行流水数据,作为待聚类数据;
特征提取模块,针对待聚类数据进行特征构造,得到基本特征、通话特征及交易特征;
聚类分析模块,采用均值漂移聚类算法对基本特征、通话特征及交易特征进行分析,得到均值漂移聚类模型及聚类结果;
类别确定模块,获取带有标签的养卡套现用户清单数据,并对清单数据进行特征提取,然后将提取的特征输入均值漂移聚类模型进行聚类,根据标签与聚类结果对应关系,确定疑似养卡套现数据中用户所处的类别,进而得到疑似养卡套现用户对象清单;
知识抽取模块,针对疑似养卡套现数据进行实体抽取、关系抽取,属性抽取;
知识图谱构建模块,将抽取的实体数据、关系数据,属性数据导入neo4j数据库中,得到知识图谱;
特征挖掘模块,基于构建好的知识图谱,通过知识图谱的深层遍历及相关图挖掘算法,进而识别出特定人员之间的关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系特征;
群体识别模块,通过特征挖掘,从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。
进一步的,所述疑似养卡套现数据至少包括信用卡持卡人基本信息、POS机持机人基本信息、通话数据、信用卡交易数据;其中信用卡持卡人基本信息至少包括信用卡卡号、持卡人手机号及信用;POS机持机人基本信息至少包括POS机序列号、商户号、手机号及身份信息。
进一步的,所述特征提取具体执行过程为,以疑似养卡套现用户的手机号为分析对象,以近三个月为时间周期,取用户的信用卡交易数据、通话数据进行特征构建,得到基本特征、通话特征及交易特征。
进一步的,所述聚类分析模块中采用引入核函数后的均值漂移聚类算法进行聚类计算:
其中,x为中心点,xi为滑动窗口内的数据,h为滑动窗口带宽,g(x)为对核函数的导数求负。
进一步的,特征挖掘模块中相关图挖掘计算过程具体为:
采用最短路径算法计算知识图谱中两点之间的最短距离,然后利用介中心度算法计算出经过某个点的最短路径数,最后用PageRank算法计算节点的重要程度。
本发明的优点在于:本发明所提供的一种信用卡养卡套现团体的发现方法,依托于完善的银行、运营商及公安机关数据,使用均值移动聚类算法(MSC)识别出存在信用卡养卡套现的用户及作案人员,并通过知识图谱强大的特征挖掘能力找出与其关联的关键成员、重要成员,从而挖掘出犯罪团伙。本发明为银行及公安部门进行信用卡养卡套现犯罪活动的侦查提供了一个具有指导性和实践性的方案,为打击犯罪活动提供了有力的线索和证据,有利于信用卡行业的健康发展,并能在一定程度上遏制“洗钱”等不法行为的来源。
附图说明
图1为本发明实施例中信用卡养卡套现团体的发现方法的流程框图;
图2为本发明实施例中均值漂移聚类算法计算过程展示图;
图3为本发明实施例中构建的知识图谱的部分关联图;
图4为本发明实施例中最短路径算法结果展示图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本实施例提供一种信用卡养卡套现团体识别方法,包括
步骤S1,疑似养卡套现数据获取。
获取运营商通话及银行交易流水等数据,包含但不限于以下内容:
1、信用卡持卡人基本信息,包含信用卡卡号、持卡人手机号及信用等相关数据,格式如下:
表1:信用卡持卡人基本信息
2、POS机持机人基本信息,包含POS机序列号(唯一编码)、商户号、手机号及身份信息等,格式如下:
表2:POS机持机人基本信息
字段名 | 字段描述 | 样例数据 |
pos_sn | POS机序列号 | LBBJ****5017 |
pos_no | 商户号 | 30515004511**** |
pos_phone | 关联手机号 | 17754350670 |
p_user_card_no | 关联身份证号 | 140105********5390 |
... |
3、通话数据,运营商提供通话数据应至少包含以下内容:
表3:通话数据
字段名 | 字段描述 | 样例数据 |
phone1 | 用户手机号 | 158****5236 |
phone2 | 联系人手机号 | 135****2334 |
begin_time | 通话开始时间 | 2020/4/21 23:01:03 |
end_time | 通话结束时间 | 2020/4/21 23:03:09 |
... |
4、信用卡交易数据,包含基本信息如信用卡卡号、商户号,以及交易明细,如交易时间、金额、账单日、还款日、信用卡剩余额度等等;
表4:信用卡交易数据
字段名 | 字段描述 | 样例数据 |
card_no | 信用卡号 | 6228*******9719 |
pos_no | 商户号 | 3051*******4897 |
bussiness_time | 交易时间 | 2020/5/2 21:03:47 |
bussiness_sum | 交易金额 | 22.5 |
bill_date | 账单日 | 2020/5/15 |
pay_date | 还款日 | 2020/5/31 |
... |
此外,数据源可增加运营商的用户画像数据、交往圈数据、基站数据、短信通信数据等,并进行有关特征构造,可提升模型效果。
步骤S2,特征工程。
S21,基于以上数据,以手机号为分析对象,以近三个月为时间周期,取用户的信用卡交易数据、通话数据等进行特征构建,并形成如下数据,记为T1:
表5:样例数据
字段名 | 字段描述 | 样例数据1 | 样例数据2 |
phone_1 | 手机号码 | 199****1278 | 173****1322 |
call_phone_no | 呼出持机人手机号码数 | 1 | 0 |
call_no | 呼出持机人次数 | 2 | 0 |
called_phone_no | 呼入持机人手机号码数 | 4 | 1 |
called_no | 呼入持机人次数 | 5 | 1 |
call_dur_avg | 平均呼出时长(秒) | 47.6 | 0 |
called_dur_avg | 平均呼入时长 | 14.2 | 8 |
card_sum_no | 信用卡数 | 8 | 2 |
card_limit | 信用卡平均额度 | 9375 | 15000 |
credit_score | 信用评分 | 8.1 | 9 |
ability_score | 还款能力评分 | 8.3 | 8 |
user_income | 月收入 | 7492.65 | 4345.1 |
consume_no | 消费笔数 | 47 | 11 |
consume_pos_no | 消费商户数 | 6 | 3 |
bill_consume_ratio | 账单日消费额度占比 | 0.455 | 0.015 |
pay_consume_ratio | 还款日消费额度占比 | 0.518 | 0.002 |
consume_sum_ratio | 消费总额度占比 | 0.974 | 0.017 |
... |
该部分主要是从信用卡基础信息、运营商通话数据及信用卡交易数据构造出基本特征、通话特征及交易特征。其中,card_sum_no为统计该持卡人身份证下所有信用卡的个数,bill_consume_ratio为信用卡在统计时间段内的账单日之前的消费额度占总额度的比值,pay_consume_ratio为信用卡在统计时间段内的账单日至还款日期间的消费额度占总额度的比值。
S22,根据已确认的信用卡养卡套现用户数据,基于以上分析,对其进行特征构造,获得数据T2。
步骤S3,使用均值漂移聚类(MSC)算法,对以上特征数据进行聚类分析。
均值漂移聚类算法(MSC)是基于滑动窗口的算法,其目标是试图找到数据点的密集区域。算法过程如下:
1、随机选择点c为中心,r为半径的圆形滑动窗口;
2、在每次迭代过程中,计算该滑动窗口内所有数据点的均值,并将圆心c移动到该位置;
3、继续按照更新后的均值移动滑动窗口,直到窗口内的密度不再增加(即窗口中的点数不再发生变化),自然地,通过向窗口内点的均值移动,该窗口会逐渐移向点密度更高的区域。
偏移均值的计算如下:
其中,Sh为以x为中心点,h为半径的圆形滑动窗口,xi为圆形滑动窗口中的数据点,k为该窗口数据点的个数。
中心点移动到偏移均值位置的计算方式如下:
xt+1=xt+Mt
其中,xt为t状态下的中心,Mt为t状态下求的的偏移均值。
由于在高维球区域内,每个样本点对求解的结果的贡献不一样,均值漂移算法还引入了核函数,用来求出每个数据点的贡献值。如以下提供了引入核函数后的均值漂移聚类算法公式:
其中,x为中心点,xi为滑动窗口内的数据,h为滑动窗口带宽(bandwidth),g(x)为对核函数的导数求负。
均值漂移算法相较于K-Means等聚类算法,最大的优势是不需要指定簇的数量,只需指定滑动窗口大小即可。
训练样本在200万左右,本实施例使用sklearn.cluster模块下的均值漂移算法MeanShift,以及estimate_bandwidth来生成滑动窗口的尺寸。
estimate_bandwidth参数选择如下,参数n_samples选择50000,表示从样本中随机选择50000个样本并计算每一对样本的距离,quantile选择0.2,表示选取这些距离的0.2分位数作为返回值,以此计算窗口大小,记为r。
均值漂移算法会以随机选择的样本所在的位置作为圆心,r为半径,并计算该范围内的所有点的以圆心为起点的半径形成的向量相加的结果就是Mean Shift向量。
该算法是一个迭代的过程,每一次迭代都会先计算出当前点的偏移均值,并将圆心移动到该位置,然后以此为新的起点,继续移动,直到收敛。
如图2所示,图2展示了在二维数据下均值漂移聚类算法的计算过程。
步骤S4,获得养卡套现用户清单,来自于公安或者银行所掌握的信用卡养卡套现用户数据。获得训练后的均值漂移聚类模型M1,对已有信用卡养卡套现用户数据T2进行聚类分析,并通过统计T2的标签在聚类结果中的分布,可确定疑似养卡套现用户所处的类别,进而得到疑似养卡套现用户对象清单,清单中至少包含用户手机号码和信用卡卡号,以便于进行下一步的分析。
步骤S5,知识抽取。知识抽取是从不同来源、不同结构的数据中进行知识提取,形成结构化的知识数据存入到知识图谱中。本发明所需数据源只涉及结构化数据,通过D2R转换将数据库数据转化为RDF数据模型,包含实体提取、关系提取、属性提取。抽取出电话、信用卡、POS机等实体及相关属性,以及电话间的通话关系、电话与POS机的关联关系、电话与信用卡的关联关系、POS机与信用卡的交易关系等。
实体数据如表6所示,关系数据如表7所示。
表6:实体数据样例
index:ID | name | :LABEL |
PH10000001 | 158****8463 | Phone |
PH10000002 | 156****5696 | Phone |
PH10000003 | 134****0734 | Phone |
PH10000004 | 150****0612 | Phone |
PH10000005 | 177****4460 | Phone |
PH10000006 | 177****6077 | Phone |
表7:关系数据样例
:START_ID | :END_ID | relation | :TYPE |
PH10000001 | PH10000003 | CALL | 通话 |
PH10000001 | PH10077023 | CALL | 通话 |
PH10000001 | PH10052291 | CALL | 通话 |
PH10000001 | PH10002008 | CALL | 通话 |
PH10000002 | PH10000024 | CALL | 通话 |
步骤S6,数据导入。将以上数据保存为csv文件,并导入到neo4j数据库中。如图3展示了部分关联图。
步骤S7,特征挖掘。基于构建好的知识图谱,通过图的深层遍历及相关图挖掘算法,进而识别出特定人员之间的通话、交易关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系等特征。
本发明中所用到的相关图挖掘算法及描述如下:
1、最短路径算法。
本发明采用的是经典的Dijkstra(迪杰斯特拉)算法,用于计算两个节点之间的最短距离,该路径是连接两个点的所有路径中边数最少的那个。在基于上述数据所构造的关联网络中,通过Dijkstra算法可以找出两个没有通话关系的用户但涉及到同一个养卡套现团伙的,其隐藏在两个用户之间的其他用户,为挖掘出团伙中的其他关键成员提供线索和证据。
以下代码用于找出号码“150****0612”与“189****8746”之间的联系链路中所包含的其他成员。
match(p1:Phone{id:"150****0612"}),(p2:Phone{id:"188****2232"}),
p=allshortestPaths((p1)-[*..10]-(p2))
return p
返回结果如图4所示,用户“1580551****”与用户“1560559****”之间的最短路径包含了6个用户,并且可以发现,用户之间的联系较为紧密,这6个用户可能是团伙中的隐藏成员。
2、介中心度算法。
Between Centrality算法用于计算出经过某个节点的最短路径数,其定义如下:
1)其中,CB(v)表示通过节点v的所有最短路径数,gst(v)表示经过节点v的从s到t的最短路径数,gst表示从s到t的所有最短路径数。
通过介中心度算法计算得到的值代表该节点在关联网络中的必要程度,可挖掘出关联网络中的重要人物。
对图3中的关联网络,通过调用以下代码,可以计算出每个节点的介中心度。
call algo.closeness.stream('Phone','Call_Up')
yield nodeId,centrality
return algo.getNodeById(nodeId).id as name,centrality
order by centrality desc
得到结果如表8:
表8:计算节点介中心度
可以发现,用户“1717705**”,“1595525**”,“1393905**”,“1889959**”的介中心度更高,他们在关联网络中的重要性也更高。
3、PageRank算法。
PageRank是谷歌的著名的网页排序算法,用于计算节点的重要程度。
其核心思想是两个重要的假设:
1)数量假设:如果一个网页被很多其他网页链接的话,则这个网页很重要,即PageRank的值相对较高;
2)质量假设:如果一个PageRank值很高的网页链接到另一个网页,则所链接的网页的PageRank值也相对较高。
在本发明中,使用PageRank来计算图中每个节点的重要程度,从而挖掘出关联网络中的核心人物。其计算公式如下:
其中,参数d是阻尼因子,取值区间为[0,1],本实验中取值为0.85,Mpi是所有指向网页pi网页的数目,L(pj)是网页pj所指向的网页数目,N是网页总数。
调用以下代码,计算出关联网络中PageRank值最高的前10个节点:
call
algo.PageRank.stream('Phone','Call_Up',{iterations:20,dampingFactor:0.85})
yield nodeId,score
return algo.getNodeById(nodeId).name as page,score
order by score desc
limit 10;
计算结果如表9:
表9:计算节点的PageRank值
通过PageRank算法,可以挖掘出关联网络中的重要节点,其PageRank值最高的节点在网络中一定是较为核心的成员,是对团伙进行侦查的关键成员。
步骤S8,群体识别。
通过步骤S7,可以从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员等,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。
疑似养卡套现数据获取模块。
获取运营商通话及银行交易流水等数据,包含但不限于以下内容:
1、信用卡持卡人基本信息,包含信用卡卡号、持卡人手机号及信用等相关数据,格式如下:
表1:信用卡持卡人基本信息
4、POS机持机人基本信息,包含POS机序列号(唯一编码)、商户号、手机号及身份信息等,格式如下:
表2:POS机持机人基本信息
字段名 | 字段描述 | 样例数据 |
pos_sn | POS机序列号 | LBBJ****5017 |
pos_no | 商户号 | 30515004511**** |
pos_phone | 关联手机号 | 17754350670 |
p_user_card_no | 关联身份证号 | 140105********5390 |
... |
5、通话数据,运营商提供通话数据应至少包含以下内容:
表3:通话数据
字段名 | 字段描述 | 样例数据 |
phone1 | 用户手机号 | 158****5236 |
phone2 | 联系人手机号 | 135****2334 |
begin_time | 通话开始时间 | 2020/4/21 23:01:03 |
end_time | 通话结束时间 | 2020/4/21 23:03:09 |
... |
4、信用卡交易数据,包含基本信息如信用卡卡号、商户号,以及交易明细,如交易时间、金额、账单日、还款日、信用卡剩余额度等等;
表4:信用卡交易数据
字段名 | 字段描述 | 样例数据 |
card_no | 信用卡号 | 6228*******9719 |
pos_no | 商户号 | 3051*******4897 |
bussiness_time | 交易时间 | 2020/5/2 21:03:47 |
bussiness_sum | 交易金额 | 22.5 |
bill_date | 账单日 | 2020/5/15 |
pay_date | 还款日 | 2020/5/31 |
... |
此外,数据源可增加运营商的用户画像数据、交往圈数据、基站数据、短信通信数据等,并进行有关特征构造,可提升模型效果。
特征工程模块。
S21,基于以上数据,以手机号为分析对象,以近三个月为时间周期,取用户的信用卡交易数据、通话数据等进行特征构建,并形成如下数据,记为T1:
表5:样例数据
该部分主要是从信用卡基础信息、运营商通话数据及信用卡交易数据构造出基本特征、通话特征及交易特征。其中,card_sum_no为统计该持卡人身份证下所有信用卡的个数,bill_consume_ratio为信用卡在统计时间段内的账单日之前的消费额度占总额度的比值,pay_consume_ratio为信用卡在统计时间段内的账单日至还款日期间的消费额度占总额度的比值。
S22,根据已确认的信用卡养卡套现用户数据,基于以上分析,对其进行特征构造,获得数据T2。
聚类分析模块,使用均值漂移聚类(MSC)算法,对以上特征数据进行聚类分析。
均值漂移聚类算法(MSC)是基于滑动窗口的算法,其目标是试图找到数据点的密集区域。算法过程如下:
4、随机选择点c为中心,r为半径的圆形滑动窗口;
5、在每次迭代过程中,计算该滑动窗口内所有数据点的均值,并将圆心c移动到该位置;
6、继续按照更新后的均值移动滑动窗口,直到窗口内的密度不再增加(即窗口中的点数不再发生变化),自然地,通过向窗口内点的均值移动,该窗口会逐渐移向点密度更高的区域。
偏移均值的计算如下:
其中,Sh为以x为中心点,h为半径的圆形滑动窗口,xi为圆形滑动窗口中的数据点,k为该窗口数据点的个数。
中心点移动到偏移均值位置的计算方式如下:
xt+1=xt+Mt
其中,xt为t状态下的中心,Mt为t状态下求的的偏移均值。
由于在高维球区域内,每个样本点对求解的结果的贡献不一样,均值漂移算法还引入了核函数,用来求出每个数据点的贡献值。如以下提供了引入核函数后的均值漂移聚类算法公式:
其中,x为中心点,xi为滑动窗口内的数据,h为滑动窗口带宽(bandwidth),g(x)为对核函数的导数求负。
均值漂移算法相较于K-Means等聚类算法,最大的优势是不需要指定簇的数量,只需指定滑动窗口大小即可。
训练样本在200万左右,本实施例使用sklearn.cluster模块下的均值漂移算法MeanShift,以及estimate_bandwidth来生成滑动窗口的尺寸。
estimate_bandwidth参数选择如下,参数n_samples选择50000,表示从样本中随机选择50000个样本并计算每一对样本的距离,quantile选择0.2,表示选取这些距离的0.2分位数作为返回值,以此计算窗口大小,记为r。
均值漂移算法会以随机选择的样本所在的位置作为圆心,r为半径,并计算该范围内的所有点的以圆心为起点的半径形成的向量相加的结果就是Mean Shift向量。
该算法是一个迭代的过程,每一次迭代都会先计算出当前点的偏移均值,并将圆心移动到该位置,然后以此为新的起点,继续移动,直到收敛。
如图2所示,图2展示了在二维数据下均值漂移聚类算法的计算过程。
类别确定模块,获得养卡套现用户清单,来自于公安或者银行所掌握的信用卡养卡套现用户数据。获得训练后的均值漂移聚类模型M1,对已有信用卡养卡套现用户数据T2进行聚类分析,并通过统计T2的标签在聚类结果中的分布,可确定疑似养卡套现用户所处的类别,进而得到疑似养卡套现用户对象清单,清单中至少包含用户手机号码和信用卡卡号,以便于进行下一步的分析。
知识抽取模块。知识抽取是从不同来源、不同结构的数据中进行知识提取,形成结构化的知识数据存入到知识图谱中。本发明所需数据源只涉及结构化数据,通过D2R转换将数据库数据转化为RDF数据模型,包含实体提取、关系提取、属性提取。抽取出电话、信用卡、POS机等实体及相关属性,以及电话间的通话关系、电话与POS机的关联关系、电话与信用卡的关联关系、POS机与信用卡的交易关系等。
实体数据如表6所示,关系数据如表7所示。
表6:实体数据样例
表7:关系数据样例
:START_ID | :END_ID | relation | :TYPE |
PH10000001 | PH10000003 | CALL | 通话 |
PH10000001 | PH10077023 | CALL | 通话 |
PH10000001 | PH10052291 | CALL | 通话 |
PH10000001 | PH10002008 | CALL | 通话 |
PH10000002 | PH10000024 | CALL | 通话 |
数据导入模块。将以上数据保存为csv文件,并导入到neo4j数据库中。如图3展示了部分关联图。
特征挖掘模块。基于构建好的知识图谱,通过图的深层遍历及相关图挖掘算法,进而识别出特定人员之间的通话、交易关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系等特征。
本发明中所用到的相关图挖掘算法及描述如下:
1.最短路径算法。
本发明采用的是经典的Dijkstra(迪杰斯特拉)算法,用于计算两个节点之间的最短距离,该路径是连接两个点的所有路径中边数最少的那个。在基于上述数据所构造的关联网络中,通过Dijkstra算法可以找出两个没有通话关系的用户但涉及到同一个养卡套现团伙的,其隐藏在两个用户之间的其他用户,为挖掘出团伙中的其他关键成员提供线索和证据。
以下代码用于找出号码”150****0612”与”189****8746”之间的联系链路中所包含的其他成员。
match(p1:Phone{id:"150****0612"}),(p2:Phone{id:"188****2232"}),
p=allshortestPaths((p1)-[*..10]-(p2))
return p
通过调用以下代码,可以计算出节点间的最短路径:
call algo.allShortestPaths.stream('Phone',{nodeQuery:'通话',defaultValue:1.0,graph:'huge'})
yield sourceNodeId,targetNodeId,distance
return sourceNodeId,targetNodeId,distance
order by distance desc
返回结果如图4所示,通过最短路径算法结果可知,用户“1580551****”与用户“1560559****”之间的最短路径包含了6个用户,并且可以发现,用户之间的联系较为紧密,这6个用户可能是团伙中的隐藏成员。
2.介中心度算法。
Between Centrality算法用于计算出经过某个节点的最短路径数,其定义如下:
2)其中,CB(v)表示通过节点v的所有最短路径数,gst(v)表示经过节点v的从s到t的最短路径数,gst表示从s到t的所有最短路径数。
通过介中心度算法计算得到的值代表该节点在关联网络中的必要程度,可挖掘出关联网络中的重要人物。
对图4中的关联网络,通过调用以下代码,可以计算出每个节点的介中心度。
call algo.closeness.stream('Phone','通话')
yield nodeId,centrality
return algo.getNodeById(nodeId).id as name,centrality
order by centrality desc
得到结果如表8:
表8:计算节点介中心度
可以发现,用户”1717705**”,”1595525**”,”1393905**”,”1889959**”的介中心度更高,他们在关联网络中的重要性也更高。
3.PageRank算法。
PageRank是谷歌的著名的网页排序算法,用于计算节点的重要程度。
其核心思想是两个重要的假设:
1)数量假设:如果一个网页被很多其他网页链接的话,则这个网页很重要,即PageRank的值相对较高;
2)质量假设:如果一个PageRank值很高的网页链接到另一个网页,则所链接的网页的PageRank值也相对较高。
在本发明中,使用PageRank来计算图中每个节点的重要程度,从而挖掘出关联网络中的核心人物。其计算公式如下:
调用以下代码,计算出PageRank值最高的前10个节点:
call
algo.PageRank.stream('Phone','Call_Up',{iterations:20,dampingFactor:0.85})
yield nodeId,score
return algo.getNodeById(nodeId).name as page,score
order by score desc
limit 10;
计算结果如表9:
表9:计算节点的PageRank值
通过PageRank算法,可以挖掘出关联网络中的重要节点,其PageRank值最高的节点在网络中一定是较为核心的成员,是对团伙进行侦查的关键成员。
群体识别模块。
基于特征挖掘模块,可以从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员等,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种信用卡养卡套现团体识别方法,其特征在于:包括以下步骤:
S1.疑似养卡套现数据获取,至少获取运营商通话及银行流水数据,作为待聚类数据;
S2.特征提取,针对待聚类数据进行特征构造,得到基本特征、通话特征及交易特征;
S3.聚类分析,采用均值漂移聚类算法对基本特征、通话特征及交易特征进行分析,得到均值漂移聚类模型及聚类结果;
S4.类别确定,获取带有标签的养卡套现用户清单数据,并对清单数据进行特征提取,然后将提取的特征输入均值漂移聚类模型进行聚类,根据标签与聚类结果对应关系,确定疑似养卡套现数据中用户所处的类别,进而得到疑似养卡套现用户对象清单;
S5.知识抽取,针对疑似养卡套现数据进行实体抽取、关系抽取,属性抽取;
S6.知识图谱构建,将抽取的实体数据、关系数据,属性数据导入neo4j数据库中,得到知识图谱;
S7.特征挖掘,基于构建好的知识图谱,通过知识图谱的深层遍历及相关图挖掘算法,进而识别出特定人员之间的关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系特征;
S8.群体识别,通过步骤S7,从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。
2.根据权利要求1所述的一种信用卡养卡套现团体识别方法,其特征在于:所述步骤S1中的疑似养卡套现数据至少包括信用卡持卡人基本信息、POS机持机人基本信息、通话数据、信用卡交易数据;其中信用卡持卡人基本信息至少包括信用卡卡号、持卡人手机号及信用;POS机持机人基本信息至少包括POS机序列号、商户号、手机号及身份信息。
3.根据权利要求2所述的一种信用卡养卡套现团体识别方法,其特征在于:所述步骤S2中具体为,以疑似养卡套现用户的手机号为分析对象,以近三个月为时间周期,取用户的信用卡交易数据、通话数据进行特征构建,得到基本特征、通话特征及交易特征。
5.根据权利要求1所述的一种信用卡养卡套现团体识别方法,其特征在于:所述步骤S4中带有标签的养卡套现用户清单数据来自于公安或银行已经确定的信用卡养卡套现用户数据。
6.根据权利要求1所述的一种信用卡养卡套现团体识别方法,其特征在于:所述步骤S7中的相关图挖掘计算过程具体为:
现采用最短路径算法计算知识图谱中两点之间的最短距离,然后利用介中心度算法计算出经过某个点的最短路径数,最后用PageRank算法计算节点的重要程度。
7.一种信用卡养卡套现团体识别系统,其特征在于:应用于上述权利要求1至6任一所述的方法,包括
疑似养卡套现数据获取模块,至少获取运营商通话及银行流水数据,作为待聚类数据;
特征提取模块,针对待聚类数据进行特征构造,得到基本特征、通话特征及交易特征;
聚类分析模块,采用均值漂移聚类算法对基本特征、通话特征及交易特征进行分析,得到均值漂移聚类模型及聚类结果;
类别确定模块,获取带有标签的养卡套现用户清单数据,并对清单数据进行特征提取,然后将提取的特征输入均值漂移聚类模型进行聚类,根据标签与聚类结果对应关系,确定疑似养卡套现数据中用户所处的类别,进而得到疑似养卡套现用户对象清单;
知识抽取模块,针对疑似养卡套现数据进行实体抽取、关系抽取,属性抽取;
知识图谱构建模块,将抽取的实体数据、关系数据,属性数据导入neo4j数据库中,得到知识图谱;
特征挖掘模块,基于构建好的知识图谱,通过知识图谱的深层遍历及相关图挖掘算法,进而识别出特定人员之间的关系,从而挖掘出关联网络中的隐藏节点、关键节点及其社会关系特征;
群体识别模块,通过特征挖掘,从存在信用卡养卡套现行为的用户的社交网络,挖掘出其网络中的关键成员、重要成员,并结合公安机关、银行及运营商已有的养卡套现团伙成员的相关数据,进行特征匹配,从而进一步确定养卡套现团伙的成员。
8.根据权利要求7所述的一种信用卡养卡套现团体识别系统,其特征在于:所述疑似养卡套现数据至少包括信用卡持卡人基本信息、POS机持机人基本信息、通话数据、信用卡交易数据;其中信用卡持卡人基本信息至少包括信用卡卡号、持卡人手机号及信用;POS机持机人基本信息至少包括POS机序列号、商户号、手机号及身份信息。
10.根据权利要求7所述的一种信用卡养卡套现团体识别系统,其特征在于:特征挖掘模块中相关图挖掘计算过程具体为:
采用最短路径算法计算知识图谱中两点之间的最短距离,然后利用介中心度算法计算出经过某个点的最短路径数,最后用PageRank算法计算节点的重要程度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010610974.7A CN111754337B (zh) | 2020-06-30 | 2020-06-30 | 一种信用卡养卡套现团体识别的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010610974.7A CN111754337B (zh) | 2020-06-30 | 2020-06-30 | 一种信用卡养卡套现团体识别的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111754337A true CN111754337A (zh) | 2020-10-09 |
CN111754337B CN111754337B (zh) | 2024-02-23 |
Family
ID=72678180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010610974.7A Active CN111754337B (zh) | 2020-06-30 | 2020-06-30 | 一种信用卡养卡套现团体识别的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111754337B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112465637A (zh) * | 2020-11-05 | 2021-03-09 | 中国人民大学 | 反洗钱智能自动导侦的方法、计算机可读存储介质 |
CN112785320A (zh) * | 2021-02-01 | 2021-05-11 | 北京互金新融科技有限公司 | 信用风险的确定方法及装置、存储介质和电子设备 |
CN112925920A (zh) * | 2021-03-23 | 2021-06-08 | 西安电子科技大学昆山创新研究院 | 一种智慧社区大数据知识图谱网络社团检测方法 |
CN113422836A (zh) * | 2021-07-01 | 2021-09-21 | 中国联合网络通信集团有限公司 | 养卡用户识别方法、装置、设备以及存储介质 |
CN113506113A (zh) * | 2021-06-02 | 2021-10-15 | 北京顶象技术有限公司 | 一种基于关联网络的信用卡套现团伙挖掘方法及系统 |
CN113641827A (zh) * | 2021-06-29 | 2021-11-12 | 武汉众智数字技术有限公司 | 一种基于知识图谱的网络诈骗识别方法及系统 |
CN113837303A (zh) * | 2021-09-29 | 2021-12-24 | 中国联合网络通信集团有限公司 | 一种黑产用户识别方法、tee节点及计算机可读存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106469181A (zh) * | 2015-08-21 | 2017-03-01 | 方正国际软件(北京)有限公司 | 一种用户行为模式分析方法及装置 |
WO2017032056A1 (zh) * | 2015-08-26 | 2017-03-02 | 中兴通讯股份有限公司 | 基于销售终端套现的确定方法及装置 |
CN109166030A (zh) * | 2018-08-01 | 2019-01-08 | 深圳微言科技有限责任公司 | 一种反欺诈解决方法及系统 |
CN110110094A (zh) * | 2019-04-22 | 2019-08-09 | 华侨大学 | 基于社交网络知识图谱的跨网络人物关联方法 |
AU2019101158A4 (en) * | 2019-09-30 | 2019-10-31 | Li, Zijun MR | A method of analyzing customer churn of credit cards by using logistics regression |
CN110751231A (zh) * | 2019-10-30 | 2020-02-04 | 上海观安信息技术股份有限公司 | 一种基于无监督算法的养卡号码检测方法及系统 |
CN110766091A (zh) * | 2019-10-31 | 2020-02-07 | 上海观安信息技术股份有限公司 | 一种套路贷团伙的识别方法及系统 |
CN110781308A (zh) * | 2019-06-25 | 2020-02-11 | 广微数据科技(苏州)有限公司 | 一种基于大数据构建知识图谱的反欺诈系统 |
CN110796394A (zh) * | 2019-11-13 | 2020-02-14 | 北京顶象技术有限公司 | 待标定节点标记方法及装置 |
CN110895758A (zh) * | 2019-12-02 | 2020-03-20 | 中国银行股份有限公司 | 存在作弊交易的信用卡账户的筛选方法、装置及系统 |
CN110991650A (zh) * | 2019-11-25 | 2020-04-10 | 第四范式(北京)技术有限公司 | 训练养卡识别模型、识别养卡行为的方法及装置 |
CN111104521A (zh) * | 2019-12-18 | 2020-05-05 | 上海观安信息技术股份有限公司 | 一种基于图分析的反欺诈检测方法及检测系统 |
CN111159418A (zh) * | 2018-11-08 | 2020-05-15 | 北京航天长峰科技工业集团有限公司 | 一种公安专题知识图谱系统的构建方法 |
CN111160401A (zh) * | 2019-12-09 | 2020-05-15 | 国网辽宁省电力有限公司电力科学研究院 | 一种基于均值漂移和XGBoost的异常用电判别方法 |
-
2020
- 2020-06-30 CN CN202010610974.7A patent/CN111754337B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106469181A (zh) * | 2015-08-21 | 2017-03-01 | 方正国际软件(北京)有限公司 | 一种用户行为模式分析方法及装置 |
WO2017032056A1 (zh) * | 2015-08-26 | 2017-03-02 | 中兴通讯股份有限公司 | 基于销售终端套现的确定方法及装置 |
CN109166030A (zh) * | 2018-08-01 | 2019-01-08 | 深圳微言科技有限责任公司 | 一种反欺诈解决方法及系统 |
CN111159418A (zh) * | 2018-11-08 | 2020-05-15 | 北京航天长峰科技工业集团有限公司 | 一种公安专题知识图谱系统的构建方法 |
CN110110094A (zh) * | 2019-04-22 | 2019-08-09 | 华侨大学 | 基于社交网络知识图谱的跨网络人物关联方法 |
CN110781308A (zh) * | 2019-06-25 | 2020-02-11 | 广微数据科技(苏州)有限公司 | 一种基于大数据构建知识图谱的反欺诈系统 |
AU2019101158A4 (en) * | 2019-09-30 | 2019-10-31 | Li, Zijun MR | A method of analyzing customer churn of credit cards by using logistics regression |
CN110751231A (zh) * | 2019-10-30 | 2020-02-04 | 上海观安信息技术股份有限公司 | 一种基于无监督算法的养卡号码检测方法及系统 |
CN110766091A (zh) * | 2019-10-31 | 2020-02-07 | 上海观安信息技术股份有限公司 | 一种套路贷团伙的识别方法及系统 |
CN110796394A (zh) * | 2019-11-13 | 2020-02-14 | 北京顶象技术有限公司 | 待标定节点标记方法及装置 |
CN110991650A (zh) * | 2019-11-25 | 2020-04-10 | 第四范式(北京)技术有限公司 | 训练养卡识别模型、识别养卡行为的方法及装置 |
CN110895758A (zh) * | 2019-12-02 | 2020-03-20 | 中国银行股份有限公司 | 存在作弊交易的信用卡账户的筛选方法、装置及系统 |
CN111160401A (zh) * | 2019-12-09 | 2020-05-15 | 国网辽宁省电力有限公司电力科学研究院 | 一种基于均值漂移和XGBoost的异常用电判别方法 |
CN111104521A (zh) * | 2019-12-18 | 2020-05-05 | 上海观安信息技术股份有限公司 | 一种基于图分析的反欺诈检测方法及检测系统 |
Non-Patent Citations (14)
Title |
---|
OMAR ALONSO: "Social Knowledge Graph Explorer", 《PROCEEDINGS OF PROCEEDINGS OF THE 42ND INTERNATIONAL》 * |
OMAR ALONSO: "Social Knowledge Graph Explorer", 《PROCEEDINGS OF PROCEEDINGS OF THE 42ND INTERNATIONAL》, 18 July 2019 (2019-07-18), pages 1317 - 1320, XP058708214, DOI: 10.1145/3331184.3331410 * |
RUTU SHUKLA等: "A Survey Paper on Mean Shift Algorithm to", 《SECOND INTERNATIONAL CONFERENCE ON SMART SYSTEMS AND INVENTIVE TECHNOLOGY (ICSSIT 2019)》 * |
RUTU SHUKLA等: "A Survey Paper on Mean Shift Algorithm to", 《SECOND INTERNATIONAL CONFERENCE ON SMART SYSTEMS AND INVENTIVE TECHNOLOGY (ICSSIT 2019)》, 10 February 2020 (2020-02-10), pages 343 - 348 * |
凡友荣等: "基于知识图谱的电信欺诈通联特征挖掘方法", 《计算机应用与软件》 * |
凡友荣等: "基于知识图谱的电信欺诈通联特征挖掘方法", 《计算机应用与软件》, vol. 36, no. 11, 30 November 2019 (2019-11-30), pages 182 - 187 * |
张芸芸等: "基于Neo4j图谱的信用卡欺诈检测", 《信息与电脑(理论版)》 * |
张芸芸等: "基于Neo4j图谱的信用卡欺诈检测", 《信息与电脑(理论版)》, no. 21, 15 November 2018 (2018-11-15) * |
杨阳: "基于知识图谱的涉众型经济犯罪知识建模与情报分析", 《中国人民公安大学学报(自然科学版)》 * |
杨阳: "基于知识图谱的涉众型经济犯罪知识建模与情报分析", 《中国人民公安大学学报(自然科学版)》, no. 02, 15 May 2020 (2020-05-15) * |
杨静等: "基于聚类分析检索团伙多起犯罪的迭代算法", 《计算机与现代化》 * |
杨静等: "基于聚类分析检索团伙多起犯罪的迭代算法", 《计算机与现代化》, no. 01, 15 January 2013 (2013-01-15) * |
赵永强等: "《成像偏振光谱遥感及应用》", 31 October 2011, pages: 212 - 216 * |
郝茜茜等: "基于半监督核均值漂移聚类的地震相识别研究", 《河北工业大学学报》, no. 06 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112465637A (zh) * | 2020-11-05 | 2021-03-09 | 中国人民大学 | 反洗钱智能自动导侦的方法、计算机可读存储介质 |
CN112785320A (zh) * | 2021-02-01 | 2021-05-11 | 北京互金新融科技有限公司 | 信用风险的确定方法及装置、存储介质和电子设备 |
CN112785320B (zh) * | 2021-02-01 | 2023-09-19 | 北京互金新融科技有限公司 | 信用风险的确定方法及装置、存储介质和电子设备 |
CN112925920A (zh) * | 2021-03-23 | 2021-06-08 | 西安电子科技大学昆山创新研究院 | 一种智慧社区大数据知识图谱网络社团检测方法 |
CN113506113A (zh) * | 2021-06-02 | 2021-10-15 | 北京顶象技术有限公司 | 一种基于关联网络的信用卡套现团伙挖掘方法及系统 |
CN113506113B (zh) * | 2021-06-02 | 2022-02-11 | 北京顶象技术有限公司 | 一种基于关联网络的信用卡套现团伙挖掘方法及系统 |
CN113641827A (zh) * | 2021-06-29 | 2021-11-12 | 武汉众智数字技术有限公司 | 一种基于知识图谱的网络诈骗识别方法及系统 |
CN113422836A (zh) * | 2021-07-01 | 2021-09-21 | 中国联合网络通信集团有限公司 | 养卡用户识别方法、装置、设备以及存储介质 |
CN113837303A (zh) * | 2021-09-29 | 2021-12-24 | 中国联合网络通信集团有限公司 | 一种黑产用户识别方法、tee节点及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111754337B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111754337A (zh) | 一种信用卡养卡套现团体识别的方法及系统 | |
Hung et al. | Applying data mining to telecom churn management | |
CN111476662A (zh) | 反洗钱识别方法及装置 | |
CN106709800A (zh) | 一种基于特征匹配网络的社团划分方法和装置 | |
CN108921686A (zh) | 一种个人用户的信用评分方法和装置 | |
Islam | Mobile banking: An emerging issue in Bangladesh | |
CN111932268B (zh) | 企业风险识别方法及装置 | |
CN109741173A (zh) | 可疑洗钱团伙的识别方法、装置、设备及计算机存储介质 | |
CN113011888B (zh) | 一种针对数字货币的异常交易行为检测方法、装置、设备及介质 | |
CN112668614B (zh) | 一种反洗钱研判方法 | |
CN109345372A (zh) | 信用评分方法、系统及计算机可读存储介质 | |
US20090327036A1 (en) | Decision support systems using multi-scale customer and transaction clustering and visualization | |
CN107025558A (zh) | 一种交易系统及交易处理方法 | |
CN111428092B (zh) | 基于图模型的银行精准营销方法 | |
CN110675263B (zh) | 交易数据的风险识别方法以及装置 | |
CN112866486A (zh) | 一种基于多源特征的诈骗电话识别方法、系统及设备 | |
CN115879548B (zh) | 一种用于客户身份识别的知识图谱构建方法和系统 | |
Alraouji et al. | International call fraud detection systems and techniques | |
CN113159778B (zh) | 一种金融欺诈的检测方法及装置 | |
CN110347566A (zh) | 用于对注册风控模型进行效能评估的方法及装置 | |
Shermukhamedov et al. | Innovations in banking: digital banking | |
Cámara et al. | Peru model for financial inclusion: E-money potential adopters | |
CN113052594A (zh) | 基于区块链的多卡协同支付方法及装置 | |
Nyandoro et al. | A SWOT analysis of mobile electronic banking: The Zimbabwe case | |
CN116882998B (zh) | 虚拟货币资金分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |