CN115147117A - 资源使用异常的账户群组识别方法、装置及设备 - Google Patents

资源使用异常的账户群组识别方法、装置及设备 Download PDF

Info

Publication number
CN115147117A
CN115147117A CN202110345222.7A CN202110345222A CN115147117A CN 115147117 A CN115147117 A CN 115147117A CN 202110345222 A CN202110345222 A CN 202110345222A CN 115147117 A CN115147117 A CN 115147117A
Authority
CN
China
Prior art keywords
account
group
resource
resource usage
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110345222.7A
Other languages
English (en)
Inventor
范梦迪
汤胜龙
靳胜鹏
张观侣
蓝利君
李超
王翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110345222.7A priority Critical patent/CN115147117A/zh
Publication of CN115147117A publication Critical patent/CN115147117A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/405Establishing or using transaction specific rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及计算机技术领域,特别涉及电子金融技术领域,提供了一种资源使用异常的账户群组识别方法、装置及设备,以解决无法识别资源使用异常的账户群组的问题,该方法包括:获得各个账户各自对应的历史资源使用数据集合,基于各个历史资源使用数据集合,生成账户关联信息;基于账户关联信息,识别出至少一个候选账户群组;基于至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从至少一个候选账户群组中,筛选出目标账户群组;其中,每个账户属性特征集合包含一个账户的自身属性特征,以及该账户在交互过程中的交互属性特征,每个目标账户群组中包含至少一个行为异常的账户,提高了识别准确率。

Description

资源使用异常的账户群组识别方法、装置及设备
技术领域
本申请涉及计算机技术领域,特别涉及电子金融技术领域,提供了一种资源使用异常的账户群组识别方法、装置及设备。
背景技术
近年来,随着互联网金融业务的普及,为人们日常生活提供了很多便利,但也为犯罪分子提供了违法渠道(如,开设多个账户洗钱的违法行为)。
在相关技术中,通常采用基于模块度的社区划分算法挖掘金融关系网络中的聚集信息,确定金融关系网络中各个账户归属的账户群组,但使用该算法无法筛选出资源使用异常的账户群组。
有鉴于此,本申请实施例提供了一种新的资源使用异常的账户群组识别方法、装置及设备。
发明内容
本申请实施例提供一种资源使用异常的账户群组识别方法、装置及设备,以解决无法识别资源使用异常的账户群组的问题。
第一方面,本申请实施例提供了一种资源使用异常的账户群组识别方法,包括:
从资源使用机构中获取多个账户,获得各个账户各自对应的历史资源使用数据集合,其中,每个历史资源使用数据至少包括:一个账户与至少一个其他账户之间,在资源使用过程中的交互行为;
对各个历史资源使用数据集合进行数据关联处理,生成账户关联信息;
对所述账户关联信息进行群组分类处理,识别出至少一个候选账户群组,其中,每个候选账户群组中包含:在资源使用过程中具有相同行为的账户;
基于所述至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从所述至少一个候选账户群组中,筛选出目标账户群组;其中,每个账户属性特征集合包含一个账户的自身属性特征,以及所述一个账户在交互过程中的交互属性特征,每个目标账户群组中包含至少一个行为异常的账户。
可选的,所述获得各个账户各自对应的历史资源使用数据集合,包括:
获得所述各个账户各自对应的原始资源使用数据集合;
分别在获得的各个原始资源使用数据集合中,剔除冗余的原始资源使用数据、以及剔除基于账户与非账户之间交互行为生成的原始资源使用数据,获得对应的历史资源使用数据集合。
可选的,所述对所述历史资源使用数据集合进行数据关联处理,生成账户关联信息,包括:
分别确定每个历史资源使用数据集合中,各个历史资源使用数据的资源流入节点和资源流出节点,每个资源流入节点表征转入资源的一个账户,每个资源流出节点表征转出资源的一个账户;
分别将各个资源流入节点与对应的资源流出节点连接,构成所述账户关联信息。
可选的,所述对所述账户关联信息进行群组分类处理,识别出至少一个候选账户群组,包括:
针对所述账户关联信息包含的各个账户,采用循环迭代的方式执行以下操作,直至满足迭代停止条件时,输出所述至少一个候选账户群组:
获得所述各个账户当前对应的多个账户聚类集合;
针对所述多个账户聚类集合,分别执行以下操作:获得所述多个账户聚类集合中的一个账户聚类集合,与至少一个关联账户聚类集合之间的聚类评估值,其中,每个关联账户集合为:在所述多个账户聚类集合中,与所述一个账户聚类集合之间,在资源使用过程中存在交互行为的账户聚类集合;
基于获得的所述多个账户聚类集合各自对应的至少一个聚类评估值,对所述多个账户聚类集合重新进行聚类,获得新的多个账户聚类集合。
可选的,在生成账户关联信息之前,还包括:
针对所述各个历史资源使用数据集合,分别执行以下操作:
对一个历史资源使用数据集合中的各个历史资源使用数据,进行数据分割或数据解析,获得至少一个账户属性集合,每个账户属性集合中包含:来自所述各个历史资源使用数据的,针对同一账户属性的属性值;
对所述至少一个账户属性集合进行特征提取处理,生成所述一个历史资源使用数据集合对应账户的账户属性特征集合。
可选的,所述基于所述至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从所述至少一个候选账户群组中,筛选出目标账户群组,包括:
针对所述至少一个候选账户群组中的各个候选账户群组,分别执行以下操作:
获取所述各个候选账户群组中,一个候选账户群组包含的各个账户各自对应的账户属性特征集合;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的账户属性特征集合中,超过设定数量的账户属性特征符合所述筛选规则,则判定所述一个账户为行为异常的账户;
将包含至少一个行为异常的账户的候选账户群组,作为所述目标账户群组。
可选的,在确定所述目标账户群组之后,还包括:
获取所述目标账户群组中各个账户的账户属性特征集合;
将各个账户属性特征集合输入预设的账户群组分类模型中进行二次识别,获得所述各个账户各自对应的异常行为概率;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的异常行为概率超过设定阈值,则判定所述一个账户为行为异常的账户;
若行为异常的账户的总数量达到设定阈值,则将所述目标账户群组判定为行为异常的群组。
第二方面,本申请实施例还提供了一种资源使用异常的账户群组识别装置,包括:
采集单元,用于从资源使用机构中获取多个账户,获得各个账户各自对应的历史资源使用数据集合,其中,每个历史资源使用数据至少包括:一个账户与至少一个其他账户之间,在资源使用过程中的交互行为;
处理单元,用于对各个历史资源使用数据集合进行数据关联处理,生成账户关联信息;
对所述账户关联信息进行群组分类处理,识别出至少一个候选账户群组,其中,每个候选账户群组中包含:在资源使用过程中具有相同行为的账户;
筛选单元用于基于所述至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从所述至少一个候选账户群组中,筛选出目标账户群组;其中,每个账户属性特征集合包含一个账户的自身属性特征,以及所述一个账户在交互过程中的交互属性特征,每个目标账户群组中包含至少一个行为异常的账户。
可选的,所述采集单元用于:
获得所述各个账户各自对应的原始资源使用数据集合;
分别在获得的各个原始资源使用数据集合中,剔除冗余的原始资源使用数据、以及剔除基于账户与非账户之间交互行为生成的原始资源使用数据,获得对应的历史资源使用数据集合。
可选的,所述处理单元用于:
分别确定每个历史资源使用数据集合中,各个历史资源使用数据的资源流入节点和资源流出节点,每个资源流入节点表征转入资源的一个账户,每个资源流出节点表征转出资源的一个账户;
分别将各个资源流入节点与对应的资源流出节点连接,构成所述账户关联信息。
可选的,所述处理单元用于:
针对所述账户关联信息包含的各个账户,采用循环迭代的方式执行以下操作,直至满足迭代停止条件时,输出所述至少一个候选账户群组:
获得所述各个账户当前对应的多个账户聚类集合;
针对所述多个账户聚类集合,分别执行以下操作:获得所述多个账户聚类集合中的一个账户聚类集合,与至少一个关联账户聚类集合之间的聚类评估值,其中,每个关联账户集合为:在所述多个账户聚类集合中,与所述一个账户聚类集合之间,在资源使用过程中存在交互行为的账户聚类集合;
基于获得的所述多个账户聚类集合各自对应的至少一个聚类评估值,对所述多个账户聚类集合重新进行聚类,获得新的多个账户聚类集合。
可选的,在生成账户关联信息之前,所述处理单元还用于:
针对所述各个历史资源使用数据集合,分别执行以下操作:
对一个历史资源使用数据集合中的各个历史资源使用数据,进行数据分割或数据解析,获得至少一个账户属性集合,每个账户属性集合中包含:来自所述各个历史资源使用数据的,针对同一账户属性的属性值;
对所述至少一个账户属性集合进行特征提取处理,生成所述一个历史资源使用数据集合对应账户的账户属性特征集合。
可选的,所述筛选单元用于:
针对所述至少一个候选账户群组中的各个候选账户群组,分别执行以下操作:
获取所述各个候选账户群组中,一个候选账户群组包含的各个账户各自对应的账户属性特征集合;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的账户属性特征集合中,超过设定数量的账户属性特征符合所述筛选规则,则判定所述一个账户为行为异常的账户;
将包含至少一个行为异常的账户的候选账户群组,作为所述目标账户群组。
可选的,在确定所述目标账户群组之后,所述筛选单元还用于:
获取所述目标账户群组中各个账户的账户属性特征集合;
将各个账户属性特征集合输入预设的账户群组分类模型中进行二次识别,获得所述各个账户各自对应的异常行为概率;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的异常行为概率超过设定阈值,则判定所述一个账户为行为异常的账户;
若行为异常的账户的总数量达到设定阈值,则将所述目标账户群组判定为行为异常的群组。
第三方面,本申请实施例还提供了一种计算机设备,包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行上述任意一种资源使用异常的账户群组识别方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其包括程序代码,当程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行上述任意一种资源使用异常的账户群组识别方法的步骤。
本申请有益效果如下:
本申请实施例提供的一种资源使用异常的账户群组识别方法、装置及设备,该方法包括:从资源使用机构中获取多个账户,获得各个账户各自对应的历史资源使用数据集合,其中,每个历史资源使用数据至少包括:一个账户与至少一个其他账户之间,在资源使用过程中的交互行为;对各个历史资源使用数据集合进行数据关联处理,生成账户关联信息;对账户关联信息进行群组分类处理,识别出至少一个候选账户群组,其中,每个候选账户群组中包含:在资源使用过程中具有相同行为的账户;基于至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从至少一个候选账户群组中,筛选出目标账户群组;其中,每个账户属性特征集合包含一个账户的自身属性特征,以及该账户在交互过程中的交互属性特征,每个目标账户群组中包含至少一个行为异常的账户。相较于相关技术而言,本申请实施例提出的资源使用异常的账户群组识别方法,不仅考虑了账户与账户之间的拓扑结构信息,还引入了每个账户的自身属性特征,和每个账户在交互过程中的交互属性特征,以便从账户关联信息中识别出具有行为异常账户的候选账户群组。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中一种应用场景的一个可选的示意图;
图2a为本申请实施例中识别资源使用异常的账户群组的流程示意图;
图2b为本申请实施例中账户关联信息的示意图;
图2c为本申请实施例中识别候选账户群组的流程示意图;
图2d为本申请实施例中引入边的权重的账户关联信息的示意图;
图2e为本申请实施例中多个候选账户群组的示意图;
图2f为本申请实施例中含有多个洗钱账户的候选账户群组的示意图;
图3a为本申请实施例中识别金融诈骗群组的流程示意图;
图3b为本申请实施例中识别金融诈骗群组的逻辑示意图;
图4为本申请实施例中一种资源使用异常的账户群组识别装置的结构示意图;
图5为本申请实施例中一种计算机设备的结构示意图;
图6为本申请实施例中的一个计算装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
对本申请实施例中的部分用语进行解释说明,利于本领域技术人员理解本申请。
1、账户:以个人用户为开户主体,在第三方支付机构或银行中开设的账户。
2、非账户:以个体经营者或企业为开户主体,在第三方支付机构或银行中开设的账户。
3、资源使用:指的是账户以转出资源或者转入资源的方式,完成与其他账户或者其他非账户之间的交易。如,账户于2021年3月21日13:48登录设备a,向商户支付5元,用于购买一斤苹果;又如,账户于2021年3月21日21:58登录设备b,收到其他账户的10元转账。其中,设备a、设备b均为用户使用的电子设备,电子设备可以是个人计算机、手机、平板电脑、笔记本、电子书阅读器、智能家居等具备一定计算能力、且支持电子支付的计算机设备。
4、资源使用异常行为:指的是账户短时间内频繁地转入大量资源的行为,或账户短时间内频繁地转出大量资源的行为,或账户短时间内频繁地转入大量资源、再转出大量资源的行为。如,开设多个账户洗钱的违法行为。
5、基于模块度的社区划分算法(Louvain算法):
模块度是一种常用的衡量网络社区分组质量的算法。模块度越接近1,说明划分好的网络社区越符合“网络社区内部连接紧密、网络社区外部连接相对稀疏”的特点,分组质量越好。因此,可以通过最大化模块度,来获得最优的网络社区的划分。
Louvain算法将网络中的每个结点看成一个个独立的网络社区,将所有相连的网络社区两两合并,分别计算每种合并方式带来的模块度增益,将模块度增益最大的两个网络社区合并为一个网络社区。如此循环迭代,直至模块度增益不再变化为止,获得划分好的一个或多个网络社区。
下面对本申请实施例的设计思想进行简要介绍。
近年来,随着互联网金融业务的普及,为人们日常生活提供了很多便利,但也为犯罪分子提供了违法渠道。在相关技术中,通常采用Louvain算法挖掘金融关系网络中的聚集信息,确定网络中各个账户归属的账户群组,但使用该算法无法从多个账户群组中,识别出资源使用异常的账户群组。有鉴于此,本申请实施例提供了一种新的资源使用异常的账户群组识别方法、装置及设备。
该方法包括:从资源使用机构中获取多个账户,获得各个账户各自对应的历史资源使用数据集合,其中,每个历史资源使用数据至少包括:一个账户与至少一个其他账户之间,在资源使用过程中的交互行为;对各个历史资源使用数据集合进行数据关联处理,生成账户关联信息;对账户关联信息进行群组分类处理,识别出至少一个候选账户群组,其中,每个候选账户群组中包含:在资源使用过程中具有相同行为的账户;基于至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从至少一个候选账户群组中,筛选出目标账户群组;其中,每个账户属性特征集合包含一个账户的自身属性特征,以及该账户在交互过程中的交互属性特征,每个目标账户群组中包含至少一个行为异常的账户。
参阅图1示出的应用场景示意图,在该应用场景中包括第一终端设备110、第二终端设备130和服务器140。
第一终端设备110、第二终端设备130使用通信网络与服务器140进行通信,用户通过第一终端设备110登录应用操作界面120,向服务器140上部署的第三方支付机构的业务系统或银行的业务系统发送支付请求,使得服务器140将支付请求中规定金额的数字货币转入对应账户中,完成用户与其他用户之间的在线交易。同样地,其他用户也可通过第二终端设备130登录应用操作界面120,向服务器140发送转账请求,使得服务器140将转账请求中规定金额的数字货币转入对应账户中,实现在线交易。
在一种可选的实施方式中,通信网络为有线网络或无线网络中的任意一种,因此,第一终端设备110可直接通过有线网络与服务器140建立通信连接,或通过无线网络间接地与服务器140建立通信连接,本申请在此不做限制。同理,第二终端设备130也可以直接通过有线网络服务器140建立通信连接,或通过无线网络间接地与服务器140建立通信连接,本申请在此也不做限制。
具体地,本申请实施例中的第一终端设备110、第二终端设备130均为用户使用的电子设备,电子设备可以是个人计算机、手机、平板电脑、笔记本、电子书阅读器、智能家居等具备一定计算能力、且支持电子支付的计算机设备。
本申请实施例中的服务器140,可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,本申请在此不做限制。如本申请所公开的资源使用异常的账户群组识别方法,其中多个服务器可组成为一区块链,而服务器为区块链上的节点。
参阅图2a示出的流程示意图,识别资源使用异常的账户群组的过程如下。
S201:从资源使用机构中获取多个账户,获得各个账户各自对应的历史资源使用数据集合,其中,每个历史资源使用数据至少包括:一个账户与至少一个其他账户之间,在资源使用过程中的交互行为。
资源使用机构指的是,提供资源使用服务的机构,如银行、第三方支付机构等。具体地,可从同一个资源使用机构中获取多个账户,也可以从不同的资源使用机构中获取多个账户,本申请在此不做限定。
每个账号对应一个历史资源使用数据集合,每个历史资源使用数据至少包括一个账户与至少一个其他账户之间,在资源使用过程中的交互行为。可选的,获得各个账户各自对应的历史资源使用数据集合的过程如下:
获得各个账户各自对应的原始资源使用数据集合,分别在获得的各个原始资源使用数据集合中,剔除冗余的原始资源使用数据、以及剔除基于账户与非账户之间交互行为生成的原始资源使用数据,获得对应的历史资源使用数据集合。
一个原始资源使用数据中不仅包括一个账户与至少一个其他账户之间,在资源使用过程中的交互行为,还包括该账户发生交互行为的场所、产生该交互行为的事由等冗余数据。如,若一个原始资源使用数据为“账户于2021年3月21日13:48登录设备a,向商户支付5元,用于购买一斤苹果”,则将“账户于2021年3月21日13:48登录设备a,向商户支付5元”作为交互行为,将“购买一斤苹果”作为产生转账行为的事由。
若保留原始资源使用数据中的冗余数据,会增加历史资源使用数据的数据总量,增加了在处理历史资源使用数据,生成账户关联信息时所花费的时间,降低账户关联信息的生成准确率,进而降低了候选账户群组的识别准确率,因此,在本申请实施例中采用了数据清洗的方式,剔除原始资源使用数据中的冗余数据。
本申请实施例中规定的资源使用异常行为,指的是账户短时间内频繁地转入大量资源的行为,或账户短时间内频繁地转出大量资源的行为,或账户短时间内频繁地转入大量资源、再转出大量资源的行为。而基于账户与非账户之间交互行为生成的原始资源使用数据,恰好具备构成上述资源使用异常行为的特征,为了避免将非账户误识别为行为异常的账户,影响最终输出的候选账户群组的划分结果,在执行步骤201之前,需要剔除基于账户与非账户之间交互行为生成的原始资源使用数据。
S202:对各个历史资源使用数据集合进行数据关联处理,生成账户关联信息。
在执行步骤202之前,还包括基于各个账户各自对应的历史资源使用数据集合,生成对应账户的账户属性特征集合。具体地,针对各个历史资源使用数据集合,分别执行以下操作:
对一个历史资源使用数据集合中的各个历史资源使用数据,进行数据分割或数据解析,获得至少一个账户属性集合,每个账户属性集合中包含:来自各个历史资源使用数据的,针对同一账户属性的属性值;再对至少一个账户属性集合进行特征提取处理,生成该历史资源使用数据集合对应账户的账户属性特征集合。
传统的Louvain算法仅考虑了账户之间的拓扑结构信息,但在本申请实施例提出的资源使用异常场景中,候选账户群组不仅呈现聚集这一个特性,候选账户群组中每个账户的自身属性特征(如,登录该账户的设备总数),和每个账户在交互过程中的交互属性特征(如,一个账户的每月入款总额、该账户的每月出款总额、该账户的每月出入金额比例等),也可作为识别候选账户群组的依据之一。因此,本申请实施例中的账户属性特征集合,至少包括以下账户属性特征:
(1)一个账户的每月入款总额;
(2)该账户的每月出款总额;
(3)该账户的每月入款笔数;
(4)该账户的每月出款笔数;
(5)登录该账户的设备总数;
(6)该账户的每月夜间交易比例;
(7)该账户的每月出入金额比例;
(8)该账户的每月出入款笔数比例;
(9)该账户的每月快进快出笔数比例。
其中,将每天00:00~6:00、22:00~24:00两个时间段内的交易,规定为夜间交易;若账户针对同一笔款项的转入、转出的时间间隔小于15分钟,则账户针对该笔款项的转入、转出操作,视为快进快出交易操作。
例如,表1示出了账户A在2021年2月1日~2021年2月28日的账单集合,通过对表1的账单集合进行数据分割或数据解析,获得如表2所示的账户A的账户属性特征集合。表1中的数字仅为示意性表述,并非是精准数据,后续举例均采用相同方式,将不再赘删除该内容。
表1
账户A的2021年2月账单集合
账户A于2021年2月1日10:00登录设备a,收到账户B转来的10元
账户A于2021年2月9日13:27登录设备a,向账户C转账5元
账户A于2021年2月10日9:27登录设备a,向账户E支付200元
账户A于2021年2月12日9:27登录设备a',向账户E支付2000
账户A于2021年2月13日13:00登录设备a',收到账户B转来的1500元
账户A与2021年2月20日10:00登录设备a,向账户F转账19元
账户A于2021年2月28日9:27登录设备a',向账户E支付2000元
表2
账户A的账户属性特征 账户A的账户属性特征值
账户A的每月入款总额 1510元
账户A的每月出款总额 4224
账户A的没有入款笔数 2笔
账户A的每月出款笔数 5笔
登录账户A的设备总数 2台
账户A的每月夜间交易比例 0
账户A的每月出入金额比例 2.8%
账户A的每月出入款笔数比例 5/2
账户A的每月快进快出笔数比例 0
可选的,在介绍完各个账户属性特征集合的生成过程之后,再对生成账户关联信息的过程介绍如下:
分别确定每个历史资源使用数据集合中,各个历史资源使用数据的资源流入节点和资源流出节点,每个资源流入节点表征转入资源的一个账户,每个资源流出节点表征转出资源的一个账户;
分别将各个资源流入节点与对应的资源流出节点连接,构成账户关联信息。
例如,表3示出了多个账户各自的2021年2月账单集合,以及每笔账单中的资源流入节点、资源流出节点,基于表3所示的多个2021年2月账单集合,生成如图2b所示的账户关联信息的示意图。
表3
Figure BDA0003000473820000141
Figure BDA0003000473820000151
S203:对账户关联信息进行群组分类处理,识别出至少一个候选账户群组,其中,每个候选账户群组中包含:在资源使用过程中具有相同行为的账户。
采用Louvain算法,从账户关联信息中识别出至少一个候选账户群组。可选的,参阅图2c示出的流程示意图,对候选账户群组的识别过程介绍如下。
S2031:获得各个账户当前对应的多个账户聚类集合。
S2032:针对多个账户聚类集合,分别执行以下操作:获得多个账户聚类集合中的一个账户聚类集合,与至少一个关联账户聚类集合之间的聚类评估值,其中,每个关联账户集合为:在多个账户聚类集合中,与该账户聚类集合之间,在资源使用过程中存在交互行为的账户聚类集合。
在本申请实施例中,使用如公式(1)所示的模块度增益公式,获得多个账户聚类集合各自对应的至少一个聚类评估值。
其中,公式(1)中的ΔQ表示账户聚类集合i与一个关联账户聚类集合j之间的聚类评估值;m为账户关联信息中所有边的权重之和;ki,in表征在账户聚类集合i与关联账户聚类集合j之间的边的权重之和,∑tot ki表征第一权重之和与第二权重之和的乘积,第一权重之和表征:与账户聚类集合i相连的所有关联账户聚类集合的边的权重之和;第二权重之和表征:与关联账户聚类集合j相连的所有关联账户聚类集合的边的权重之和。
Figure BDA0003000473820000152
每条边的权重可设为默认权重1,也可以基于两个账户之间的转账金额、转账频次等灵活地设置,如,账户A向账户B转账5元,则账户A、账户B之间的边的权重设为5。由于Louvain算法是针对无向图的挖掘算法,若账户A向账户B转账5元,同时账户B向账户A转账10元,则账户A、账户B之间的边的权重应设为15(即两次转账金额总和)。
以图2d示出的账户关联信息的示意图为例,计算账户聚类集合A在第一轮中的聚类评估值。
Figure BDA0003000473820000161
S2033:基于获得的多个账户聚类集合各自对应的至少一个聚类评估值,对多个账户聚类集合重新进行聚类,获得新的多个账户聚类集合。
若聚类评估值为正数,则聚类评估值越大,表明对生成该聚类评估值的账户聚类集合和关联账户聚类集合进行聚合,所形成的新的账户聚类集合的分组质量越优。因此,若一个账户聚类集合对应至少一个为正数的聚类评估值,则将生成聚类评估最大值的账户聚类集合和关联账户聚类集合重新聚合,形成新的账户聚类集合。
若聚类评估值为负数,则表明对生成该聚类评估值的账户聚类集合和关联账户聚类集合进行聚合,所形成的新的账户聚类集合的分组质量较差。因此,若该账户聚类集合对应的聚类评估值均为负数,则该账户聚类集合与自身重新聚合为新的账户聚类集合。
S2034:判断所有账户当前对应的多个账户聚类集合是否不再变化,若是,执行步骤2035;否则,返回步骤2031。
S2035:将新的多个账户聚类集合,作为多个候选账户群组输出。
为了便于理解,对图2d所示的账户关联信息采用Louvain算法,获得如图2e所示的候选账户群组示意图。
具体地,(1)每个账户作为第一轮的账户聚类集合,分别计算每个账户聚类集合,与至少一个关联账户聚类集合之间的聚类评估值。
Figure BDA0003000473820000162
经过第一轮的计算,对于账户A归属的账户聚类集合来说,为聚类评估最大值,则将账户A归属的账户聚类集合与账户B归属的账户聚类集合重新聚类,获得新的账户聚类集合;对于账户B归属的账户聚类集合来说,为聚类评估最大值,则将账户B归属的账户聚类集合与账户A归属的账户聚类集合重新聚类,获得新的账户聚类集合。对于其他账户归属的账户聚类集合来说,也执行上述步骤,则第一轮结束后,输出的新的账户聚类集合为3个,分别是(A,B)、(C,D)、(E,F)。
(2)将(A,B)、(C,D)和(E,F)作为第二轮的账户聚类集合,分别计算每个账户聚类集合,与至少一个关联账户聚类集合之间的聚类评估值。
Figure BDA0003000473820000171
经过第二轮的计算,每个账户聚类集合的聚类评估值均为负数,各个账户聚类集合中包含的账户保持不变,最终将(A,B)、(C,D)和(E,F)作为候选账户群组输出。
S204:基于至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从至少一个候选账户群组中,筛选出目标账户群组;其中,每个账户属性特征集合包含一个账户的自身属性特征,以及该账户在交互过程中的交互属性特征,每个目标账户群组中包含至少一个行为异常的账户。
可选的,针对至少一个候选账户群组中的各个候选账户群组,分别执行以下操作:
获取各个候选账户群组中,一个候选账户群组包含的各个账户各自对应的账户属性特征集合;
针对各个账户,分别执行以下操作:若各个账户中的一个账户的账户属性特征集合中,超过设定数量的账户属性特征符合筛选规则,则判定该账户为行为异常的账户;
将包含至少一个行为异常的账户的候选账户群组,作为目标账户群组。
本申请实施例中规定的资源使用异常行为,指的是账户短时间内频繁地转入大量资源的行为,或账户短时间内频繁地转出大量资源的行为,或账户短时间内频繁地转入大量资源、再转出大量资源的行为。
而本申请实施例中的筛选规则,至少包括以下规则:
(1)一个账户的每月入款总额大于月入款总额阈值;
(2)该账户的每月出款总额大于月出款总额阈值;
(3)该账户的每月入款笔数大于月入款笔数阈值;
(4)该账户的每月出款笔数大于月出款笔数阈值;
(5)登录该账户的设备总数大于总设备阈值;
(6)该账户的每月夜间交易比例大于月夜间交易比例阈值;
(7)该账户的每月出入金额比例大于月出入金额比例;
(8)该账户的每月出入款笔数比例大于月出入款笔数比例;
(9)该账户的每月快进快出笔数比例大于月快进快出笔数比例阈值。
因此,若一个账户的账户属性特征集合中,超过设定数量的账户属性特征符合筛选规则,则判定该账户为行为异常的账户。
例如,在反洗钱场景中,若账户超过80%的账户属性特征符合筛选规则,则判定该账户为洗钱账户,进而该账户归属的候选账户群组,可能被判定为疑似洗钱群组。
又例如,在反洗钱场景中,如图2f所示的候选账户群组中含有4个账户,其中三个账户被判定为洗钱账户,且三个洗钱账户均向该群组中的未分类账户,转入了多笔大额款项,因此,基于未分类账户与该群组中其他账户之间的交互行为,可判定分类知账户为洗钱账户。
由于资源使用异常场景的目标账户群组具备聚集特性,因此,将包含至少一个行为异常的账户的候选账户群组,作为目标账户群组。相较于相关技术而言,本申请实施例提出的资源使用异常的账户群组识别方法,不仅考虑了账户与账户之间的拓扑结构信息,还引入了每个账户的自身属性特征,和每个账户在交互过程中的交互属性特征,以便从账户关联信息中准确地识别出具有行为异常账户的候选账户群组。
由于第一次筛选的粒度较粗,可能筛选出多个目标账户群组,为了进一步提高识别准确率,本申请实施例还提供了粒度较细的二次筛选。具体地,在确定目标账户群组之后,还可以获取目标账户群组中各个账户的账户属性特征集合,将各个账户属性特征集合输入预设的账户群组分类模型中进行二次识别,获得各个账户各自对应的异常行为概率;
再针对各个账户,分别执行以下操作:若各个账户中的一个账户的异常行为概率超过设定阈值,则判定该账户为行为异常的账户;
若行为异常的账户的总数量达到设定阈值,则将目标账户群组判定为行为异常的群组。
例如,在反洗钱场景中,假设疑似洗钱群组中含有10个账户,则获取10个账户各自对应的账户属性特征集合,将每个账户属性特征集合输入账户群组分类模型中进行二次识别,若10个账户中的8个账户被识别为洗钱账户,则疑似洗钱群组被判定为洗钱群组;若10个账户中的2个账户被识别为洗钱账户,则疑似洗钱群组被判定为正常群组。
账户群组分类模型是二分类模型,使用大量样本数据训练账户群组分类模型,在模型未训练完毕的阶段,采用人工审核的方式进行二次筛选,当模型训练完毕以后,再使用模型进行二次筛选。在本申请实施例中,账户群组分类模型可实现端到端的自动识别行为异常的群组的功能,简化行为异常的群组的识别流程,节省识别时间,提高工作效率和识别准确率。
其中,在模型冷启动时期,将人工审核的账户群组的数据作为负样本数据,将未经人工审核的账户群组的数据作为正样本数据;当模型训练完成以后,可将模型判定为行为异常的群组的数据作为负样本数据,将模型判定为正常群组的数据作为正样本数据,每隔一段时间,重新训练模型中的参数。
无论是正样本数据,亦或是负样本数据,均包含以下两部分内容,第一部分是账户群组中各个账户各自对应的账户属性特征集合,第二部分是账户群组在第一轮筛选中,是否被标记为目标账户群组。
本申请实施例还可应用于反金融诈骗场景中,参阅图3a示出的流程示意图和图3b示出的逻辑示意图,对识别金融诈骗群组的过程进行介绍。
S301:获得10个账户各自对应的2020年第三季度账单集合;
S302:基于各个2020年第三季度账单集合,生成账户关联信息;
S303:采用Louvain算法,确定账户关联信息中每个账户归属的账户群组,获得4个候选账户群组;
S304:基于每个候选账户群组中各个账户各自对应的账户属性特征集合,结合筛选规则,1个候选账户群组被识别为正常群组,另外3个候选账户群组被识别为疑似金融诈骗群组;
S305:使用训练完毕的账户群组分类模型对3个疑似金融诈骗群组进行二次筛选,前两个疑似金融诈骗群组被识别为正常群组,最后一个中疑似金融诈骗群组被识别为金融诈骗群组。
参阅图4示出的结构示意图,在资源使用异常的账户群组识别装置400中包括采集单元401、处理单元402和筛选单元403,其中,
采集单元401,用于从资源使用机构中获取多个账户,获得各个账户各自对应的历史资源使用数据集合,其中,每个历史资源使用数据至少包括:一个账户与至少一个其他账户之间,在资源使用过程中的交互行为;
处理单元402,用于对各个历史资源使用数据集合进行数据关联处理,生成账户关联信息;
对所述账户关联信息进行群组分类处理,识别出至少一个候选账户群组,其中,每个候选账户群组中包含:在资源使用过程中具有相同行为的账户;
筛选单元403,用于基于所述至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从所述至少一个候选账户群组中,筛选出目标账户群组;其中,每个账户属性特征集合包含一个账户的自身属性特征,以及所述一个账户在交互过程中的交互属性特征,每个目标账户群组中包含至少一个行为异常的账户。
可选的,所述采集单元401用于:
获得所述各个账户各自对应的原始资源使用数据集合;
分别在获得的各个原始资源使用数据集合中,剔除冗余的原始资源使用数据、以及剔除基于账户与非账户之间交互行为生成的原始资源使用数据,获得对应的历史资源使用数据集合。
可选的,所述处理单元402用于:
分别确定每个历史资源使用数据集合中,各个历史资源使用数据的资源流入节点和资源流出节点,每个资源流入节点表征转入资源的一个账户,每个资源流出节点表征转出资源的一个账户;
分别将各个资源流入节点与对应的资源流出节点连接,构成所述账户关联信息。
可选的,所述处理单元402用于:
针对所述账户关联信息包含的各个账户,采用循环迭代的方式执行以下操作,直至满足迭代停止条件时,输出所述至少一个候选账户群组:
获得所述各个账户当前对应的多个账户聚类集合;
针对所述多个账户聚类集合,分别执行以下操作:获得所述多个账户聚类集合中的一个账户聚类集合,与至少一个关联账户聚类集合之间的聚类评估值,其中,每个关联账户集合为:在所述多个账户聚类集合中,与所述一个账户聚类集合之间,在资源使用过程中存在交互行为的账户聚类集合;
基于获得的所述多个账户聚类集合各自对应的至少一个聚类评估值,对所述多个账户聚类集合重新进行聚类,获得新的多个账户聚类集合。
可选的,在生成账户关联信息之前,所述处理单元402还用于:
针对所述各个历史资源使用数据集合,分别执行以下操作:
对一个历史资源使用数据集合中的各个历史资源使用数据,进行数据分割或数据解析,获得至少一个账户属性集合,每个账户属性集合中包含:来自所述各个历史资源使用数据的,针对同一账户属性的属性值;
对所述至少一个账户属性集合进行特征提取处理,生成所述一个历史资源使用数据集合对应账户的账户属性特征集合。
可选的,所述筛选单元403用于:
针对所述至少一个候选账户群组中的各个候选账户群组,分别执行以下操作:
获取所述各个候选账户群组中,一个候选账户群组包含的各个账户各自对应的账户属性特征集合;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的账户属性特征集合中,超过设定数量的账户属性特征符合所述筛选规则,则判定所述一个账户为行为异常的账户;
将包含至少一个行为异常的账户的候选账户群组,作为所述目标账户群组。
可选的,在确定所述目标账户群组之后,所述筛选单元403还用于:
获取所述目标账户群组中各个账户的账户属性特征集合;
将各个账户属性特征集合输入预设的账户群组分类模型中进行二次识别,获得所述各个账户各自对应的异常行为概率;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的异常行为概率超过设定阈值,则判定所述一个账户为行为异常的账户;
若行为异常的账户的总数量达到设定阈值,则将所述目标账户群组判定为行为异常的群组。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本申请示例性实施方式的资源使用异常的账户群组识别方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的计算机设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种计算机设备,参阅图5所示,计算机设备500可以至少包括处理器501、以及存储器502。其中,所述存储器502存储有程序代码,当所述程序代码被所述处理器501执行时,使得所述处理器501执行上述任意一种资源使用异常的账户群组识别方法的步骤。
在一些可能的实施方式中,根据本申请的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的资源使用异常的账户群组识别方法中的步骤。例如,处理器可以执行如图2a中所示的步骤。
下面参照图6来描述根据本申请的这种实施方式的计算装置600。图6的计算装置600仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算装置500以通用计算装置的形式表现。计算装置600的组件可以包括但不限于:上述至少一个处理单元601、上述至少一个存储单元602、连接不同系统组件(包括存储单元602和处理单元601)的总线603。
总线603表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元602可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)6021和/或高速缓存存储单元6022,还可以进一步包括只读存储器(ROM)6023。
存储单元602还可以包括具有一组(至少一个)程序模块6024的程序/实用工具6025,这样的程序模块6024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置600也可以与一个或多个外部设备604(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算装置600交互的设备通信,和/或与使得该计算装置600能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口605进行。并且,计算装置600还可以通过网络适配器606与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器606通过总线603与用于计算装置600的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
与上述方法实施例基于同一发明构思,本申请提供的资源使用异常的账户群组识别方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的资源使用异常的账户群组识别方法中的步骤,例如,电子设备可以执行如图2a中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (16)

1.一种资源使用异常的账户群组识别方法,其特征在于,包括:
从资源使用机构中获取多个账户,获得各个账户各自对应的历史资源使用数据集合,其中,每个历史资源使用数据至少包括:一个账户与至少一个其他账户之间,在资源使用过程中的交互行为;
对各个历史资源使用数据集合进行数据关联处理,生成账户关联信息;
对所述账户关联信息进行群组分类处理,识别出至少一个候选账户群组,其中,每个候选账户群组中包含:在资源使用过程中具有相同行为的账户;
基于所述至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从所述至少一个候选账户群组中,筛选出目标账户群组;其中,每个账户属性特征集合包含一个账户的自身属性特征,以及所述一个账户在交互过程中的交互属性特征,每个目标账户群组中包含至少一个行为异常的账户。
2.如权利要求1所述的方法,其特征在于,所述获得各个账户各自对应的历史资源使用数据集合,包括:
获得所述各个账户各自对应的原始资源使用数据集合;
分别在获得的各个原始资源使用数据集合中,剔除冗余的原始资源使用数据、以及剔除基于账户与非账户之间交互行为生成的原始资源使用数据,获得对应的历史资源使用数据集合。
3.如权利要求1所述的方法,其特征在于,所述对所述历史资源使用数据集合进行数据关联处理,生成账户关联信息,包括:
分别确定每个历史资源使用数据集合中,各个历史资源使用数据的资源流入节点和资源流出节点,每个资源流入节点表征转入资源的一个账户,每个资源流出节点表征转出资源的一个账户;
分别将各个资源流入节点与对应的资源流出节点连接,构成所述账户关联信息。
4.如权利要求1所述的方法,其特征在于,所述对所述账户关联信息进行群组分类处理,识别出至少一个候选账户群组,包括:
针对所述账户关联信息包含的各个账户,采用循环迭代的方式执行以下操作,直至满足迭代停止条件时,输出所述至少一个候选账户群组:
获得所述各个账户当前对应的多个账户聚类集合;
针对所述多个账户聚类集合,分别执行以下操作:获得所述多个账户聚类集合中的一个账户聚类集合,与至少一个关联账户聚类集合之间的聚类评估值,其中,每个关联账户集合为:在所述多个账户聚类集合中,与所述一个账户聚类集合之间,在资源使用过程中存在交互行为的账户聚类集合;
基于获得的所述多个账户聚类集合各自对应的至少一个聚类评估值,对所述多个账户聚类集合重新进行聚类,获得新的多个账户聚类集合。
5.如权利要求1所述的方法,其特征在于,在生成账户关联信息之前,还包括:
针对所述各个历史资源使用数据集合,分别执行以下操作:
对一个历史资源使用数据集合中的各个历史资源使用数据,进行数据分割或数据解析,获得至少一个账户属性集合,每个账户属性集合中包含:来自所述各个历史资源使用数据的,针对同一账户属性的属性值;
对所述至少一个账户属性集合进行特征提取处理,生成所述一个历史资源使用数据集合对应账户的账户属性特征集合。
6.如权利要求1所述的方法,其特征在于,所述基于所述至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从所述至少一个候选账户群组中,筛选出目标账户群组,包括:
针对所述至少一个候选账户群组中的各个候选账户群组,分别执行以下操作:
获取所述各个候选账户群组中,一个候选账户群组包含的各个账户各自对应的账户属性特征集合;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的账户属性特征集合中,超过设定数量的账户属性特征符合所述筛选规则,则判定所述一个账户为行为异常的账户;
将包含至少一个行为异常的账户的候选账户群组,作为所述目标账户群组。
7.如权利要求1-6任一项所述的方法,其特征在于,在确定所述目标账户群组之后,还包括:
获取所述目标账户群组中各个账户的账户属性特征集合;
将各个账户属性特征集合输入预设的账户群组分类模型中进行二次识别,获得所述各个账户各自对应的异常行为概率;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的异常行为概率超过设定阈值,则判定所述一个账户为行为异常的账户;
若行为异常的账户的总数量达到设定阈值,则将所述目标账户群组判定为行为异常的群组。
8.一种资源使用异常的账户群组识别装置,其特征在于,包括:
采集单元,用于从资源使用机构中获取多个账户,获得各个账户各自对应的历史资源使用数据集合,其中,每个历史资源使用数据至少包括:一个账户与至少一个其他账户之间,在资源使用过程中的交互行为;
处理单元,用于对各个历史资源使用数据集合进行数据关联处理,生成账户关联信息;
对所述账户关联信息进行群组分类处理,识别出至少一个候选账户群组,其中,每个候选账户群组中包含:在资源使用过程中具有相同行为的账户;
筛选单元用于基于所述至少一个候选账户群组包含的各个账户各自对应的账户属性特征集合,结合预设的筛选规则,从所述至少一个候选账户群组中,筛选出目标账户群组;其中,每个账户属性特征集合包含一个账户的自身属性特征,以及所述一个账户在交互过程中的交互属性特征,每个目标账户群组中包含至少一个行为异常的账户。
9.如权利要求8所述的装置,其特征在于,所述采集单元用于:
获得所述各个账户各自对应的原始资源使用数据集合;
分别在获得的各个原始资源使用数据集合中,剔除冗余的原始资源使用数据、以及剔除基于账户与非账户之间交互行为生成的原始资源使用数据,获得对应的历史资源使用数据集合。
10.如权利要求8所述的装置,其特征在于,所述处理单元用于:
分别确定每个历史资源使用数据集合中,各个历史资源使用数据的资源流入节点和资源流出节点,每个资源流入节点表征转入资源的一个账户,每个资源流出节点表征转出资源的一个账户;
分别将各个资源流入节点与对应的资源流出节点连接,构成所述账户关联信息。
11.如权利要求8所述的装置,其特征在于,所述处理单元用于:
针对所述账户关联信息包含的各个账户,采用循环迭代的方式执行以下操作,直至满足迭代停止条件时,输出所述至少一个候选账户群组:
获得所述各个账户当前对应的多个账户聚类集合;
针对所述多个账户聚类集合,分别执行以下操作:获得所述多个账户聚类集合中的一个账户聚类集合,与至少一个关联账户聚类集合之间的聚类评估值,其中,每个关联账户集合为:在所述多个账户聚类集合中,与所述一个账户聚类集合之间,在资源使用过程中存在交互行为的账户聚类集合;
基于获得的所述多个账户聚类集合各自对应的至少一个聚类评估值,对所述多个账户聚类集合重新进行聚类,获得新的多个账户聚类集合。
12.如权利要求8所述的装置,其特征在于,在生成账户关联信息之前,所述处理单元还用于:
针对所述各个历史资源使用数据集合,分别执行以下操作:
对一个历史资源使用数据集合中的各个历史资源使用数据,进行数据分割或数据解析,获得至少一个账户属性集合,每个账户属性集合中包含:来自所述各个历史资源使用数据的,针对同一账户属性的属性值;
对所述至少一个账户属性集合进行特征提取处理,生成所述一个历史资源使用数据集合对应账户的账户属性特征集合。
13.如权利要求8所述的装置,其特征在于,所述筛选单元用于:
针对所述至少一个候选账户群组中的各个候选账户群组,分别执行以下操作:
获取所述各个候选账户群组中,一个候选账户群组包含的各个账户各自对应的账户属性特征集合;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的账户属性特征集合中,超过设定数量的账户属性特征符合所述筛选规则,则判定所述一个账户为行为异常的账户;
将包含至少一个行为异常的账户的候选账户群组,作为所述目标账户群组。
14.权利要求8-13任一项所述的装置,其特征在于,在确定所述目标账户群组之后,所述筛选单元还用于:
获取所述目标账户群组中各个账户的账户属性特征集合;
将各个账户属性特征集合输入预设的账户群组分类模型中进行二次识别,获得所述各个账户各自对应的异常行为概率;
针对所述各个账户,分别执行以下操作:若所述各个账户中的一个账户的异常行为概率超过设定阈值,则判定所述一个账户为行为异常的账户;
若行为异常的账户的总数量达到设定阈值,则将所述目标账户群组判定为行为异常的群组。
15.一种计算机设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行权利要求1~7中任一项所述方法的步骤。
16.一种计算机可读存储介质,其特征在于,其包括程序代码,当程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行权利要求1~7中任一项所述方法的步骤。
CN202110345222.7A 2021-03-31 2021-03-31 资源使用异常的账户群组识别方法、装置及设备 Pending CN115147117A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110345222.7A CN115147117A (zh) 2021-03-31 2021-03-31 资源使用异常的账户群组识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110345222.7A CN115147117A (zh) 2021-03-31 2021-03-31 资源使用异常的账户群组识别方法、装置及设备

Publications (1)

Publication Number Publication Date
CN115147117A true CN115147117A (zh) 2022-10-04

Family

ID=83403314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110345222.7A Pending CN115147117A (zh) 2021-03-31 2021-03-31 资源使用异常的账户群组识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN115147117A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115456788A (zh) * 2022-11-07 2022-12-09 支付宝(杭州)信息技术有限公司 一种风险群组的检测方法、装置及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115456788A (zh) * 2022-11-07 2022-12-09 支付宝(杭州)信息技术有限公司 一种风险群组的检测方法、装置及设备

Similar Documents

Publication Publication Date Title
Ahmed et al. A survey of anomaly detection techniques in financial domain
CN109063966B (zh) 风险账户的识别方法和装置
US7716135B2 (en) Incremental compliance environment, an enterprise-wide system for detecting fraud
CN109035003A (zh) 基于机器学习的反欺诈模型建模方法和反欺诈监控方法
CN110119948B (zh) 基于时变权重动态组合的电力用户信用评价方法及系统
CN111428092B (zh) 基于图模型的银行精准营销方法
CN112668614A (zh) 一种反洗钱研判方法
CN111709826A (zh) 目标信息确定方法和装置
CN109308615A (zh) 基于统计序列特征的实时欺诈交易检测方法、系统、存储介质及电子终端
CN115238815A (zh) 异常交易数据获取方法、装置、设备、介质和程序产品
CN109600724A (zh) 一种短信发送的方法和装置
CN107563588A (zh) 一种个人信用的获取方法和获取系统
CN113240259B (zh) 规则策略组的生成方法、系统及电子设备
CN112950359B (zh) 一种用户识别方法和装置
CN115147117A (zh) 资源使用异常的账户群组识别方法、装置及设备
CN113837512B (zh) 异常用户的识别方法及装置
CN203414995U (zh) 一种土地使用税缴纳排查管理系统
CN111832661A (zh) 分类模型构建方法、装置、计算机设备及可读存储介质
CN116739605A (zh) 交易数据检测方法、装置、设备及存储介质
CN113870021B (zh) 一种数据的分析方法、装置、存储介质和电子设备
CN113849731B (zh) 基于自然语言处理的信息推送方法、装置、设备及介质
WO2023121848A1 (en) Deduplication of accounts using account data collision detected by machine learning models
CN114331665A (zh) 用于预定申请人的信用判定模型的训练方法、装置和电子设备
CN111429257A (zh) 一种交易监控方法和装置
CN114155038B (zh) 受疫情影响用户识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination