CN113469696A - 一种用户异常度评估方法、装置及计算机可读存储介质 - Google Patents
一种用户异常度评估方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113469696A CN113469696A CN202110725534.0A CN202110725534A CN113469696A CN 113469696 A CN113469696 A CN 113469696A CN 202110725534 A CN202110725534 A CN 202110725534A CN 113469696 A CN113469696 A CN 113469696A
- Authority
- CN
- China
- Prior art keywords
- user
- node
- nodes
- initial
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005856 abnormality Effects 0.000 title claims abstract description 40
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 238000011156 evaluation Methods 0.000 title claims description 25
- 238000000034 method Methods 0.000 claims abstract description 59
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000006399 behavior Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 230000035772 mutation Effects 0.000 claims description 3
- 230000002547 anomalous effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000005065 mining Methods 0.000 description 5
- 230000008520 organization Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种用户异常度评估方法、装置、系统及计算机可读存储介质,该方法包括:确定多个用户的用户初始评分和用户初始类别;构建多维图谱网络,多维图谱网络包括用户节点和非用户节点;基于用户初始评分,确定多维图谱网络的用户节点和非用户节点的值;将多维图谱网络拆分为多个连通子图,基于用户初始类别对连通子图的各节点进行类别迭代传导,形成多个同类别连通子图:根据同类别连通子图中各节点的值和边权重计算子图评分,并根据子图评分和用户初始评分确定用户异常度。利用上述方法,能够更准确地评估用户异常度。
Description
技术领域
本发明属于风险评估领域,具体涉及一种用户异常度评估方法、装置及计算机可读存储介质。
背景技术
随着移动支付的发展,人们的生活变得更加方便,但同时各类支付风险仍然存在,且呈现规模化、组织化趋势。针对这些风险场景,传统方法是采用专家规则引擎,通过历史的风险用户标签或业务场景归纳规则,以进行风险用户识别,该方法过于依赖专家,且多针对特定场景,方法可扩展性较差,新场景下需重新进行用户打标和规则归纳,严重影响侦测效率。现阶段,基于用户个体特征的机器学习侦测方法也被应用到各类异常交易的侦测中,但这些方法对数据质量要求较高,对于含有较多噪声的数据及非均衡数据集的侦测效果不佳。同时,基于用户社交网络的子图挖掘方法也越来越多的被应用到风险组织侦测中,但其主要利用于特定目标欺诈组织的挖掘与研究,对海量的多维度、多组织、多噪声数据复杂网络下的异常交易挖掘及发现存在明显不足。
因此,如何更可靠地评估用户异常度风险是一个亟待解决的问题。
发明内容
针对上述现有技术中存在的问题,提出了一种用户异常度评估方法、装置及计算机可读存储介质,利用这种方法、装置及计算机可读存储介质,能够解决上述问题。
本发明提供了以下方案。
第一方面,提供一种用户异常度评估方法,包括:确定多个用户的用户初始评分和用户初始类别;构建多维图谱网络,所述多维图谱网络包括用户节点和非用户节点;基于所述用户初始评分,确定所述多维图谱网络的所述用户节点和所述非用户节点的值;将所述多维图谱网络拆分为多个连通子图,基于所述用户初始类别对所述连通子图的各节点进行类别迭代传导,形成多个同类别连通子图:根据所述同类别连通子图中各节点的值和边权重计算子图评分,并根据所述子图评分和所述用户初始评分确定用户异常度。
在一种可能的实施方式中,确定用户的初始评分和初始类别,还包括:根据用户的异常交易行为确定所述用户初始评分;根据用户的交易信息和设备指纹信息提取用户特征,对所述用户特征进行聚类得到所述用户初始类别。
在一种可能的实施方式中,所述异常交易行为包括以下中的一种或多种:高频交易、异地交易、夜间交易、位置突变、优惠交易占比过高。
在一种可能的实施方式中,根据所述交易信息提取的所述用户特征包括:消费强度、消费时间、消费行业、优惠情况、转账规模中的一种或多种;根据所述设备指纹信息提取的所述用户特征包括:IP、GPS、是否获取根权限、仰角、加速度、设备型号中的一种或多种。
在一种可能的实施方式中,所述聚类采用基于密度的聚类方法。
在一种可能的实施方式中,构建多维图谱网络,包括:定义关联图谱节点,所述图谱节点包括交易实体节点和类别节点,所述交易实体节点至少包括所述用户节点;根据所述交易实体节点之间的交易关系进行连边,并设置边权重;根据所述交易实体节点和所述类别节点之间的聚类关系进行连边,并设置边权重。
在一种可能的实施方式中,所述方法还包括:根据所述用户特征进行聚类,并根据得到的聚类中心作为所述类别节点;根据所述用户到所述聚类中心的距离设置所述用户节点和所述类别节点之间的边权重。
在一种可能的实施方式中,所述类别节点包括GPS类节点,所述方法还包括:根据所述用户的GPS的经纬度信息进行聚类,并根据聚类中心作为所述GPS类节点。
在一种可能的实施方式中,根据所述多维图谱网络和所述用户初始评分确定各个节点的值,包括:对于用户节点,根据对应的所述用户初始评分确定所述用户节点的值;对于非用户节点,根据相连的所述用户节点的值和二者之间的边权重确定所述非用户节点的值。
在一种可能的实施方式中,将所述多维图谱网络拆分为多个连通子图,包括:对边权重小于预设阈值的边进行剔除,形成多个连通子图。
在一种可能的实施方式中,基于所述用户初始类别对所述连通子图的各节点进行类别迭代传导,形成多个同类别连通子图,包括:对于每个所述连通子图,所述用户节点的初始类别根据所述用户初始类别确定,各个所述非用户节点的初始类别根据与其相连的所述用户节点的边权重占比最大的类别确定;每一次迭代中,各节点均根据相连节点的边权重占比最大的类别更新自身类别,直至收敛或达到最大迭代次数。
在一种可能的实施方式中,根据所述同类别连通子图中各节点的值和边权重计算子图评分,包括:利用以下公式确定所述子图评分:其中,所述所述wij为节点i和节点j连接的边权重,所述W为根据所述wij计算得到的所述同类别连通子图的邻接矩阵。
在一种可能的实施方式中,所述非用户节点包括以下中的一种或多种:商户节点、银行节点、手机号节点、IP地址节点、分类节点。
第二方面,提供一种用户异常度评估装置,被配置为用于执行如第一方面的方法,装置包括:确定模块,用于确定多个用户的用户初始评分和用户初始类别;构建模块,用于构建多维图谱网络,所述多维图谱网络包括用户节点和非用户节点;赋值模块,用于基于所述用户初始评分,确定所述多维图谱网络的所述用户节点和所述非用户节点的值;迭代模块,用于将所述多维图谱网络拆分为多个连通子图,基于所述用户初始类别对所述连通子图的各节点进行类别迭代传导,形成多个同类别连通子图:评估模块,用于根据所述同类别连通子图中各节点的值和边权重计算子图评分,并根据所述子图评分和所述用户初始评分确定用户异常度。
第三方面,提供一种用户异常度评估装置,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如第一方面的方法。
第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被多核处理器执行时,使得所述多核处理器执行如第一方面的方法。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:能够更准确地评估用户的异常度。
应当理解,上述说明仅是本发明技术方案的概述,以便能够更清楚地了解本发明的技术手段,从而可依照说明书的内容予以实施。为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举例说明本发明的具体实施方式。
附图说明
通过阅读下文的示例性实施例的详细描述,本领域普通技术人员将明白本文所述的优点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的标号表示相同的部件。在附图中:
图1为根据本发明一实施例的用户异常度评估方法的流程示意图;
图2为根据本发明一实施例的多维图谱网络的示意图;
图3为根据本发明又一实施例的多维图谱网络的结构示意图。
图4为根据本发明一实施例的多维图谱网络的裁剪示意图。
图5为根据本发明一实施例的连通子图的迭代示意图。
图6为根据本发明一实施例的同类别连通子图的示意图;
图7为根据本发明一实施例的用户异常度评估装置的结构示意图;
图8为根据本发明一实施例的用户异常度评估装置的结构示意图;
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在本申请实施例的描述中,应理解,诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不旨在排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。
除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
图1为根据本申请一实施例的用户异常度评估方法的流程示意图,用于确定用户是否存在交易风险,在该流程中,从设备角度而言,执行主体可以是一个或者多个电子设备;从程序角度而言,执行主体相应地可以是搭载于这些电子设备上的程序。
如图1所示,本实施例提供的方法可以包括以下步骤:
步骤101、确定多个用户的用户初始评分和用户初始类别;
用户初始评分用于表征用户自身的个体异常情况,可以根据用户的异常交易行为而确定。用户初始类别用于表征用户所属的类别,比如可以依据用户的IP地址进行分类、消费行业、消费时间等维度进行分类。
在一些可能的实施方式中,步骤101中,为了确定用户初始评分,还包括:根据用户的异常交易行为确定用户初始评分。可以理解,上述用户初始评分可以归一化为0至1之间,如果存在黑名单机制,也可以将黑名单用户的用户初始评分设置为0分。为了确定用户初始类别,可以根据用户的交易信息和设备指纹信息提取用户特征,对用户特征进行聚类,从而将多个用户划分为多个不同的类别,得到每个用户的用户初始类别。
在一些可能的实施方式中,聚类采用基于密度的聚类方法(DBSCAN)。
在一些可能的实施方式中,异常交易行为可以包括以下中的一种或多种:高频交易、异地交易、夜间交易、位置突变、优惠交易占比过高。还可以包括其他可能的异常交易行为,本申请对此不做具体限制。可选地,可根据业务管控要求设置不同异常交易行为的权重。
在一些可能的实施方式中,根据交易信息提取的用户特征包括:消费强度、消费时间、消费行业、优惠情况、转账规模中的一种或多种。根据设备指纹信息提取的用户特征包括: IP、GPS、是否获取根权限(root)、仰角、加速度、设备型号中的一种或多种。也可以是其他可以用于将用户分类的用户特征,发明实施例对此不作具体限定。
步骤102、构建多维图谱网络,多维图谱网络包括用户节点和非用户节点;
在一些可能的实施方式中,步骤102的构建多维图谱网络,包括:定义关联图谱节点,图谱节点包括交易实体节点和类别节点,交易实体节点至少包括用户节点;根据交易实体节点之间的交易关系进行连边,并设置边权重;根据交易实体节点和类别节点之间的聚类关系进行连边,并设置边权重。
一个示例中,参考图2,示出了一种多维图谱网络,其中示出了GPS类节点、用户节点和商户节点三种图谱节点。当然还可以包括其他类型节点,比如银行卡节点等,本申请对此不做具体限制。其中用户节点和商户节点属于交易实体节点,可以从交易信息中获取二者之间的交易关系,并基于交易关系的发生数量设置边权重,比如,用户1向用户2转账,用户1在商户1处消费,用户1和用户2、用户1和商户1即可因为具有交易关系连边,并可以基于交易笔数进行归一化之后确定边权重。
类别节点是指可以对某一种或多种交易实体节点进行分类的节点,某一种或多种交易实体节点可以与该类别节点具有所属关系,比如类别节点可以是多个商户区域类别节点,不同商户节点可以基于所属关系与对应的商户区域类别节点连边,诸如此类。
在一些可能的实施方式中,为了得到该类别节点,方法还包括:根据用户特征进行聚类,并根据得到的聚类中心作为类别节点;根据用户到聚类中心的距离设置用户节点和类别节点之间的边权重。具体来说,类别节点可以包括GPS类节点,如自动化脚本刷单的黄牛用户多呈现GPS聚集特点,所以可以根据用户的GPS的经纬度信息进行聚类,并根据聚类中心作为 GPS类节点。用户与GPS类节点间通过所属关系连接,设用户与聚类中心的距离归一化后为 d,则边的权重可以设为(1-d)。
本实施例中,通过基于聚集性的图谱构建方法,可根据交易场景特点直观展示异常用户关系,并基于关联强弱进行用户类别传播及评分,具有较高的准确性和可解释性。
步骤103、基于用户初始评分,确定多维图谱网络的用户节点和非用户节点的值;
在一些可能的实施方式中,步骤103可以具体包括:
对于用户节点,根据对应的用户初始评分确定用户节点的值;
对于非用户节点,根据相连的用户节点的值和二者之间的边权重确定非用户节点的值。
一个示例中,设某节点连接三个用户节点,评分和边权重如图3所示,则该节点的值可计算为:
步骤104、将多维图谱网络拆分为多个连通子图,基于用户初始类别对连通子图的各节点进行类别迭代传导,形成多个同类别连通子图;
在一些可能的实施方式中,步骤104的将多维图谱网络拆分为多个连通子图,可以包括:对边权重小于预设阈值的边进行剔除,形成多个连通子图。一个示例中,针对商户和用户之间的连边,可以设置一预设边权重阈值,边权重低于该预设边权重阈值则剔除该连边。以此类推,针对用户和用户之间的连边,用户和GPS类之间的连边,可以另外设置对应的预设边权重阈值。由此,可以剔除弱关联关系,形成多个连通子图。如图4所示,其中虚线部分表示为弱关联关系,可以剔除。
在一些可能的实施方式中,步骤104的基于用户初始类别对连通子图的各节点进行类别迭代传导,形成多个同类别连通子图,包括:对于每个连通子图,用户节点的初始类别根据用户初始类别确定,各个非用户节点的初始类别根据与其相连的用户节点的边权重占比最大的类别确定;每一次迭代中,各节点均根据相连节点的边权重占比最大的类别更新自身类别,直至收敛或达到最大迭代次数。
一个示例中,如图5所示,假设初步的连通子图划分后,各颜色代表用户初始类别,黑节点为非用户节点,无初始类别。白色节点、灰色节点以及半黑色节点都分别表示一种类别的用户节点,经过几轮迭代传导后,可形成右图,也即将该连通子图再次划分形成两个同类别连通子图,该同类别连通子图可定义为组织或社区,并进行社区评分。
更为具体地,首先根据用户初始类别确定用户节点的初始类别,然后各个非用户节点根据与其相连的用户节点的边权重占比最大的类别确定初始类别,比如,某个用户节点相连的三个用户节点,一个为白色,边权重为0.8,第二个为半黑色,边权重为0.7,第三个也为半黑色,边权重为0.5,由于0.7+0.5>0.8,因此该用户节点的类别更新为半黑色。之后,进行多次迭代,在每一次迭代中,各节点均根据相连节点的边权重占比最大的类别更新自身类别,由此在多次迭代之后可以将连通子图中占比非常小的类别消除,形成为一个或多个同类别连接子图。
步骤105、根据同类别连通子图中各节点的值和边权重计算子图评分,并根据子图评分和用户初始评分确定用户异常度。
一个示例中,假设步骤104之后得到的同类别连接子图如图6所示,可以根据同类别连通子图中各节点的值和边权重计算子图评分,具体计算过程列举如下:
利用以下公式确定同类别连通子图的邻接矩阵W:
同类别连通子图中共N个节点,矩阵为对称阵,其中wij为节点i和节点j连接边的权重,如果不存在边则wij=0,主对角线上的元素wii=0。
利用以下公式确定同类别连通子图的值矩阵S,N个节点的值分别为S1~SN:
利用以下公式确定子图评分:
上述方法保证边权重越大的节点对社区评分贡献越高。同类别连通子图可作为用户所属组织,社区评分值可作为组织异常度评分。最后综合用户初始评分及社区评分得到最终用户异常度评分。
本实施例提供的用户异常度评估方法结合了基于用户自身属性而确定的用户初始评分,以及由多维图谱网络的同类别连通子图得到用户社区评分(也即子图评分),综合得出最终用户异常度评分,对于用户异常度的评估情况更为准确,可靠性更高。本实施例提供的根据用户关联关系迭代更新用户类别,基于同类别连通子图得到用户社区评分,可实现风险组织的挖掘和评分,并能够根据用户所处的子图情况更新用户个体评分。
本实施例提出一种基于特征工程、用户聚类和图关联网络相结合的用户异常度评估方法。首先通过特征工程得到用户初始异常度评分,通过聚类方法得到用户的初始类别,然后根据用户的交易关联或某种聚集性(如GPS)构建用户关联网络,并对弱关联的边进行裁剪,最后根据关联网络进行用户类别传导,形成多个同类别连通子图,结合子图特征最终得到用户异常风险评估,评估可靠性更高。
在本说明书的描述中,参考术语“一些可能的实施方式”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
关于本申请实施例的方法流程图,将某些操作描述为以一定顺序执行的不同的步骤。这样的流程图属于说明性的而非限制性的。可以将在本文中所描述的某些步骤分组在一起并且在单个操作中执行、可以将某些步骤分割成多个子步骤、并且可以以不同于在本文中所示出的顺序来执行某些步骤。可以由任何电路结构和/或有形机制(例如,由在计算机设备上运行的软件、硬件(例如,处理器或芯片实现的逻辑功能)等、和/或其任何组合)以任何方式来实现在流程图中所示出的各个步骤。
基于相同的技术构思,本发明实施例还提供一种用户异常度评估装置,用于执行上述任一实施例所提供的用户异常度评估方法。图7为本发明实施例提供的一种用户异常度评估装置结构示意图。
如图7所示,装置700包括:
确定模块701,用于确定多个用户的用户初始评分和用户初始类别;
构建模块702,用于构建多维图谱网络,多维图谱网络包括用户节点和非用户节点;
赋值模块703,用于基于用户初始评分,确定多维图谱网络的用户节点和非用户节点的值;
迭代模块704,用于将多维图谱网络拆分为多个连通子图,基于用户初始类别对连通子图的各节点进行类别迭代传导,形成多个同类别连通子图:
评估模块705,用于根据同类别连通子图中各节点的值和边权重计算子图评分,并根据子图评分和用户初始评分确定用户异常度。
需要说明的是,本申请实施例中的用户异常度评估装置可以实现前述用户异常度评估方法的实施例的各个过程,并达到相同的效果和功能,这里不再赘述。
图8为根据本申请一实施例的用户异常度评估装置,用于执行图1所示出的用户异常度评估方法,该装置包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例所述的方法。
根据本申请的一些实施例,提供了用户异常度评估方法的非易失性计算机存储介质,其上存储有计算机可执行指令,该计算机可执行指令设置为在由处理器运行时执行:上述实施例所述的方法。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以其描述进行了简化,相关之处可参见方法实施例的部分说明即可。
本申请实施例提供的装置、设备和计算机可读存储介质与方法是一一对应的,因此,装置、设备和计算机可读存储介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置、设备和计算机可读存储介质的有益技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和 /或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和 /或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (17)
1.一种用户异常度评估方法,其特征在于,包括:
确定多个用户的用户初始评分和用户初始类别;
构建多维图谱网络,所述多维图谱网络包括用户节点和非用户节点;
基于所述用户初始评分,确定所述多维图谱网络的所述用户节点和所述非用户节点的值;
将所述多维图谱网络拆分为多个连通子图,基于所述用户初始类别对所述连通子图的各节点进行类别迭代传导,形成多个同类别连通子图:
根据所述同类别连通子图中各节点的值和边权重计算子图评分,并根据所述子图评分和所述用户初始评分确定用户异常度。
2.根据权利要求1所述的方法,其特征在于,确定用户的初始评分和初始类别,还包括:
根据用户的异常交易行为确定所述用户初始评分;
根据用户的交易信息和设备指纹信息提取用户特征,对所述用户特征进行聚类得到所述用户初始类别。
3.根据权利要求2所述的方法,其特征在于,所述异常交易行为包括以下中的一种或多种:高频交易、异地交易、夜间交易、位置突变、优惠交易占比过高。
4.根据权利要求2所述的方法,其特征在于,
根据所述交易信息提取的所述用户特征包括:消费强度、消费时间、消费行业、优惠情况、转账规模中的一种或多种;
根据所述设备指纹信息提取的所述用户特征包括:IP、GPS、是否获取根权限、仰角、加速度、设备型号中的一种或多种。
5.根据权利要求2所述的方法,其特征在于,所述聚类采用基于密度的聚类方法。
6.根据权利要求2所述的方法,其特征在于,构建多维图谱网络,包括:
定义关联图谱节点,所述图谱节点包括交易实体节点和类别节点,所述交易实体节点至少包括所述用户节点;
根据所述交易实体节点之间的交易关系进行连边,并设置边权重;
根据所述交易实体节点和所述类别节点之间的聚类关系进行连边,并设置边权重。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
根据所述用户特征进行聚类,并根据得到的聚类中心作为所述类别节点;
根据所述用户到所述聚类中心的距离设置所述用户节点和所述类别节点之间的边权重。
8.根据权利要求7所述的方法,其特征在于,所述类别节点包括GPS类节点,所述方法还包括:
根据所述用户的GPS的经纬度信息进行聚类,并根据聚类中心作为所述GPS类节点。
9.根据权利要求1所述的方法,其特征在于,根据所述多维图谱网络和所述用户初始评分确定各个节点的值,包括:
对于用户节点,根据对应的所述用户初始评分确定所述用户节点的值;
对于非用户节点,根据相连的所述用户节点的值和二者之间的边权重确定所述非用户节点的值。
11.根据权利要求1所述的方法,其特征在于,将所述多维图谱网络拆分为多个连通子图,包括:
对边权重小于预设阈值的边进行剔除,形成多个连通子图。
12.根据权利要求1所述的方法,其特征在于,基于所述用户初始类别对所述连通子图的各节点进行类别迭代传导,形成多个同类别连通子图,包括:
对于每个所述连通子图,所述用户节点的初始类别根据所述用户初始类别确定,各个所述非用户节点的初始类别根据与其相连的所述用户节点的边权重占比最大的类别确定;
每一次迭代中,各节点均根据相连节点的边权重占比最大的类别更新自身类别,直至收敛或达到最大迭代次数。
14.根据权利要求1所述的方法,其特征在于,所述非用户节点包括以下中的一种或多种:商户节点、银行节点、手机号节点、IP地址节点、分类节点。
15.一种用户异常度评估装置,其特征在于,被配置为用于执行如权利要求1-14中任一项所述的方法,所述装置包括:
确定模块,用于确定多个用户的用户初始评分和用户初始类别;
构建模块,用于构建多维图谱网络,所述多维图谱网络包括用户节点和非用户节点;
赋值模块,用于基于所述用户初始评分,确定所述多维图谱网络的所述用户节点和所述非用户节点的值;
迭代模块,用于将所述多维图谱网络拆分为多个连通子图,基于所述用户初始类别对所述连通子图的各节点进行类别迭代传导,形成多个同类别连通子图:
评估模块,用于根据所述同类别连通子图中各节点的值和边权重计算子图评分,并根据所述子图评分和所述用户初始评分确定用户异常度。
16.一种用户异常度评估装置,其特征在于,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如权利要求1-14中任一项所述的方法。
17.一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被多核处理器执行时,使得所述多核处理器执行如权利要求1-14中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110725534.0A CN113469696B (zh) | 2021-06-29 | 2021-06-29 | 一种用户异常度评估方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110725534.0A CN113469696B (zh) | 2021-06-29 | 2021-06-29 | 一种用户异常度评估方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113469696A true CN113469696A (zh) | 2021-10-01 |
CN113469696B CN113469696B (zh) | 2024-08-13 |
Family
ID=77873850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110725534.0A Active CN113469696B (zh) | 2021-06-29 | 2021-06-29 | 一种用户异常度评估方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469696B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114760113A (zh) * | 2022-03-30 | 2022-07-15 | 深信服科技股份有限公司 | 一种异常告警检测方法、装置及电子设备和存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133766A (zh) * | 2014-07-11 | 2014-11-05 | 西安交通大学 | 基于多目标社团发现的软件系统可维护性评估与提升方法 |
CN109063966A (zh) * | 2018-07-03 | 2018-12-21 | 阿里巴巴集团控股有限公司 | 风险账户的识别方法和装置 |
CN109784636A (zh) * | 2018-12-13 | 2019-05-21 | 中国平安财产保险股份有限公司 | 欺诈用户识别方法、装置、计算机设备及存储介质 |
CN109859054A (zh) * | 2018-12-13 | 2019-06-07 | 平安科技(深圳)有限公司 | 网络社团挖掘方法、装置、计算机设备及存储介质 |
CN110111113A (zh) * | 2019-04-30 | 2019-08-09 | 中国银联股份有限公司 | 一种异常交易节点的检测方法及装置 |
US20190311367A1 (en) * | 2015-06-20 | 2019-10-10 | Quantiply Corporation | System and method for using a data genome to identify suspicious financial transactions |
CN110738388A (zh) * | 2019-09-02 | 2020-01-31 | 深圳壹账通智能科技有限公司 | 关联图谱评估风险传导的方法、装置、设备和存储介质 |
CN110941664A (zh) * | 2019-12-11 | 2020-03-31 | 北京百度网讯科技有限公司 | 知识图谱的构建方法、检测方法、装置、设备及存储介质 |
CN111008338A (zh) * | 2019-11-11 | 2020-04-14 | 重庆邮电大学 | 一种基于层次聚类的社交网络多尺度结构挖掘方法及介质 |
CN111612041A (zh) * | 2020-04-24 | 2020-09-01 | 平安直通咨询有限公司上海分公司 | 异常用户识别方法及装置、存储介质、电子设备 |
CN111814064A (zh) * | 2020-06-24 | 2020-10-23 | 平安科技(深圳)有限公司 | 基于Neo4j的异常用户处理方法、装置、计算机设备和介质 |
CN112463983A (zh) * | 2020-12-01 | 2021-03-09 | 天翼电子商务有限公司 | 一种基于社群划分和图卷积的反洗钱类罪识别方法 |
US20210117978A1 (en) * | 2019-10-18 | 2021-04-22 | Feedzai - Consultadoria e Inovação Tecnólogica, S.A. | Graph decomposition for fraudulent transaction analysis |
CN112861967A (zh) * | 2021-02-07 | 2021-05-28 | 中国电子科技集团公司电子科学研究院 | 基于异构图神经网络的社交网络异常用户检测方法及设备 |
CN112966165A (zh) * | 2021-02-03 | 2021-06-15 | 北京大学 | 基于图神经网络的交互式社区搜索方法及装置 |
-
2021
- 2021-06-29 CN CN202110725534.0A patent/CN113469696B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133766A (zh) * | 2014-07-11 | 2014-11-05 | 西安交通大学 | 基于多目标社团发现的软件系统可维护性评估与提升方法 |
US20190311367A1 (en) * | 2015-06-20 | 2019-10-10 | Quantiply Corporation | System and method for using a data genome to identify suspicious financial transactions |
CN109063966A (zh) * | 2018-07-03 | 2018-12-21 | 阿里巴巴集团控股有限公司 | 风险账户的识别方法和装置 |
CN109784636A (zh) * | 2018-12-13 | 2019-05-21 | 中国平安财产保险股份有限公司 | 欺诈用户识别方法、装置、计算机设备及存储介质 |
CN109859054A (zh) * | 2018-12-13 | 2019-06-07 | 平安科技(深圳)有限公司 | 网络社团挖掘方法、装置、计算机设备及存储介质 |
CN110111113A (zh) * | 2019-04-30 | 2019-08-09 | 中国银联股份有限公司 | 一种异常交易节点的检测方法及装置 |
CN110738388A (zh) * | 2019-09-02 | 2020-01-31 | 深圳壹账通智能科技有限公司 | 关联图谱评估风险传导的方法、装置、设备和存储介质 |
US20210117978A1 (en) * | 2019-10-18 | 2021-04-22 | Feedzai - Consultadoria e Inovação Tecnólogica, S.A. | Graph decomposition for fraudulent transaction analysis |
CN111008338A (zh) * | 2019-11-11 | 2020-04-14 | 重庆邮电大学 | 一种基于层次聚类的社交网络多尺度结构挖掘方法及介质 |
CN110941664A (zh) * | 2019-12-11 | 2020-03-31 | 北京百度网讯科技有限公司 | 知识图谱的构建方法、检测方法、装置、设备及存储介质 |
CN111612041A (zh) * | 2020-04-24 | 2020-09-01 | 平安直通咨询有限公司上海分公司 | 异常用户识别方法及装置、存储介质、电子设备 |
CN111814064A (zh) * | 2020-06-24 | 2020-10-23 | 平安科技(深圳)有限公司 | 基于Neo4j的异常用户处理方法、装置、计算机设备和介质 |
CN112463983A (zh) * | 2020-12-01 | 2021-03-09 | 天翼电子商务有限公司 | 一种基于社群划分和图卷积的反洗钱类罪识别方法 |
CN112966165A (zh) * | 2021-02-03 | 2021-06-15 | 北京大学 | 基于图神经网络的交互式社区搜索方法及装置 |
CN112861967A (zh) * | 2021-02-07 | 2021-05-28 | 中国电子科技集团公司电子科学研究院 | 基于异构图神经网络的社交网络异常用户检测方法及设备 |
Non-Patent Citations (2)
Title |
---|
辛玉红;孙延明;: "风险传导下的供应链鲁棒性分析与仿真研究", 科技管理研究, no. 14, 20 July 2017 (2017-07-20) * |
黄晓斌, 马晓岩, 陈松, 秦江敏: "一种基于类别融合的模糊最小最大聚类算法", 计算机工程与设计, no. 11, 28 November 2002 (2002-11-28) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114760113A (zh) * | 2022-03-30 | 2022-07-15 | 深信服科技股份有限公司 | 一种异常告警检测方法、装置及电子设备和存储介质 |
CN114760113B (zh) * | 2022-03-30 | 2024-02-23 | 深信服科技股份有限公司 | 一种异常告警检测方法、装置及电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113469696B (zh) | 2024-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI712981B (zh) | 風險辨識模型訓練方法、裝置及伺服器 | |
US20160371792A1 (en) | Method and Apparatus for Mining Social Relationship Based on Financial Data | |
CN109949154B (zh) | 客户信息分类方法、装置、计算机设备和存储介质 | |
CN110111113B (zh) | 一种异常交易节点的检测方法及装置 | |
US10496999B2 (en) | Method and apparatus of controlling network payment | |
CN112015909B (zh) | 知识图谱的构建方法及装置、电子设备、存储介质 | |
CN111090780A (zh) | 可疑交易信息的确定方法及装置、存储介质、电子设备 | |
CN113362157A (zh) | 异常节点识别方法、模型的训练方法、装置及存储介质 | |
US20220229854A1 (en) | Constructing ground truth when classifying data | |
CN112818162A (zh) | 图像检索方法、装置、存储介质和电子设备 | |
CN110334936B (zh) | 一种信贷资质评分模型的构建方法、装置和设备 | |
US11810001B1 (en) | Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis | |
CN113469696B (zh) | 一种用户异常度评估方法、装置及计算机可读存储介质 | |
WO2019095569A1 (zh) | 基于微博财经事件的金融分析方法、应用服务器及计算机可读存储介质 | |
CN110929285B (zh) | 一种隐私数据的处理方法及装置 | |
CN106874286B (zh) | 一种筛选用户特征的方法及装置 | |
CN113988878B (zh) | 一种基于图数据库技术的反欺诈方法及系统 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN114529399A (zh) | 用户数据处理方法、装置、计算机设备和存储介质 | |
CN108229572B (zh) | 一种参数寻优方法及计算设备 | |
CN113052512A (zh) | 风险预测方法、装置和电子设备 | |
CN112364181A (zh) | 一种保险产品匹配度确定方法及装置 | |
CN113723522B (zh) | 异常用户的识别方法、装置、电子设备以及存储介质 | |
RU2769084C2 (ru) | Способ и система нахождения схожих мошеннических групп по графовым моделям | |
US20220261666A1 (en) | Leveraging big data, statistical computation and artificial intelligence to determine a likelihood of object renunciation prior to a resource event |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |