CN116776259A - 集群识别方法和装置、计算设备、存储介质及程序产品 - Google Patents

集群识别方法和装置、计算设备、存储介质及程序产品 Download PDF

Info

Publication number
CN116776259A
CN116776259A CN202210215971.2A CN202210215971A CN116776259A CN 116776259 A CN116776259 A CN 116776259A CN 202210215971 A CN202210215971 A CN 202210215971A CN 116776259 A CN116776259 A CN 116776259A
Authority
CN
China
Prior art keywords
resource
candidate
node
resource transfer
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210215971.2A
Other languages
English (en)
Inventor
张密
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210215971.2A priority Critical patent/CN116776259A/zh
Publication of CN116776259A publication Critical patent/CN116776259A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种集群识别方法,包括:获取第一资源系统中多个主体的资源转移数据,其中资源转移数据包括多个主体中的每个主体的资源接收数据和资源支出数据;基于多个主体的资源转移数据,从多个主体中确定候选主体,候选主体的资源接收数据与不同于第一资源系统的第二资源系统相关,并且候选主体的资源支出数据与不同于第一资源系统的第三资源系统相关,其中第二资源系统用于向第一资源系统中的候选主体支出资源,第三资源系统用于从第一资源系统中的候选主体接收资源;根据候选主体的资源接收数据和资源支出数据,确定候选主体中每个主体的资源转移水平;至少根据候选主体中每个主体的资源转移水平,从候选主体中识别目标集群,目标集群包括从第二资源系统经由第一资源系统到第三资源系统的资源转移过程所涉及的至少一个候选主体。

Description

集群识别方法和装置、计算设备、存储介质及程序产品
技术领域
本申请涉及互联网技术领域,特别涉及一种集群识别方法和装置、计算设备、计算机可读存储介质及计算机程序产品。
背景技术
互联网技术的迅速发展为资源的转移和流通提供了新的方式。日常的资源交易中,有可能夹杂着非正常或异常资源转移活动,而参与异常资源转移活动的往往是多个主体的构成的集群,可以被称为异常集群,其中单个主体可以称为异常主体。在相关技术中,识别异常集群的方法包括预先确定从事异常资源转移活动的单个主体的交易特征,根据这些交易特征开发识别模型或者训练机器学习模型,以便利用上述模型确定待识别资源转移主体是否为从事异常资源转移活动的可疑主体;另外还包括使用现有算法或模型来对主体进行分类或分群,从而确定可疑主体集群。
相关技术的异常集群识别方法往往以单个主体的交易特征为核心,而忽略了参与异常资源转移活动的集群中各个主体的相互关联以及不同资源系统之间的资源转移过程,这导致集群识别的思路存在片面性和局限性,无法准确地挖掘潜在的异常集群,漏判率和/或误判率较大。
发明内容
鉴于此,本申请提供了一种集群识别方法和装置、计算设备、计算机可读存储介质及计算机程序产品,期望缓解或克服上面提到的部分或全部缺陷以及其他可能的缺陷。
根据本申请的一个方面,提供了一种集群识别方法,该方法包括:获取第一资源系统中多个主体的资源转移数据,其中所述资源转移数据包括所述多个主体中的每个主体的资源接收数据和资源支出数据;基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,所述候选主体的资源接收数据与不同于所述第一资源系统的第二资源系统相关,并且所述候选主体的资源支出数据与不同于所述第一资源系统的第三资源系统相关,其中所述第二资源系统用于向所述第一资源系统中的所述候选主体支出资源,所述第三资源系统用于从所述第一资源系统中的所述候选主体接收资源;根据所述候选主体的资源接收数据和资源支出数据,确定所述候选主体中每个主体的资源转移水平;至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,所述目标集群包括从所述第二资源系统经由所述第一资源系统到所述第三资源系统的资源转移过程所涉及的至少一个候选主体。
在根据本申请的一些实施例的集群识别方法中,至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,包括:以所述候选主体中的各个主体为节点,基于各节点之间的资源转移关系定义不同节点之间的有向边,并根据所述节点和所述节点之间的有向边建立资源转移多分有向图,所述资源转移多分有向图包括多个分图,同一分图中的节点具有相同的层级,所述节点的层级指示该节点与所述第二资源系统或所述第三资源系统的相关程度;至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述资源转移多分有向图中每个节点的属性值,其中所述每个节点的属性值指示该节点属于目标集群的可能性;基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群。
在根据本申请的一些实施例的集群识别方法中,每个节点的资源转移水平包括每个节点的资源转移留存值,所述每个节点的资源转移留存值表示该节点的资源支出总量和资源接收总量之差的绝对值。
在根据本申请的一些实施例的集群识别方法中,每个节点的资源转移水平进一步包括每个节点的资源收支最小值,所述每个节点的资源收支最小值表示该节点的资源支出总量和资源接收总量中的较小者。
在根据本申请的一些实施例的集群识别方法中,节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且资源转移多分有向图中的每个节点的属性值满足下述条件中至少一个:与所述节点的资源转移留存值成负相关;与所述节点的第一类型层级和第二类型层级中的较小者成负相关;以及与所述节点的资源收支最小值成正相关。
在根据本申请的一些实施例的集群识别方法中,节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述资源转移多分有向图中每个节点的属性值,包括:对于所述资源转移多分有向图中的每个节点,使用下述公式确定所述节点的属性值:
其中表示资源转移多分有向图S中节点i的属性值,/>表示节点i的资源支出总量和资源接收总量中的较小者,/>表示节点i的资源支出总量和资源接收总量中的较大者,/>表示节点i的第一类型层级和第二类型层级中的较小者,a为大于或等于0且小于1的预设参数。
在根据本申请的一些实施例的集群识别方法中,基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群,包括:
将所述资源转移多分有向图中的各个节点的集合作为当前候选集群,通过迭代方式依次执行下述步骤,以获取候选集群集合:迭代结束判定步骤:响应于当前候选集群对应的资源转移多分有向图中存在节点为空的分图,结束迭代;集群特征值计算步骤:基于当前候选集群中各个节点的属性值,计算当前候选集群的集群特征值,并将当前候选集群作为候选集群集合中的一个候选集群;当前候选集群更新步骤:从当前候选集群中移除属性值最低的节点并更新所移除的节点的相邻节点的属性值,以更新当前候选集群,并转到迭代结束判定步骤,以及基于候选集群集合中各候选集群的集群特征值,从候选集群集合中识别目标集群。
在根据本申请的一些实施例的集群识别方法中,获取第一资源系统中多个主体的资源转移数据包括:获取预设时间段内多个主体的资源转移数据。
在根据本申请的一些实施例的集群识别方法中,预设时间段的长度大于或等于3个小时。
在根据本申请的一些实施例的集群识别方法中,基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,包括:基于所述多个主体的资源接收数据,从所述多个主体中筛选与所述第二资源系统存在资源转移关系的第一主体集合;基于所述多个主体的资源支出收数据,从所述多个主体中筛选与所述第三资源系统存在资源转移关系的第二主体集合;根据第一主体集合和第二主体集合的交集确定候选主体。
在根据本申请的一些实施例的集群识别方法中,基于所述多个主体的资源接收数据,从所述多个主体中筛选与所述第二资源系统存在资源转移关系的第一主体集合,包括:基于所述多个主体的资源接收数据,从所述多个主体中提取与所述第二资源系统存在直接资源转移关系的直接接收主体;根据直接接收主体的资源接收数据,从所述多个主体中提取与所述第二资源系统存在间接资源转移关系的间接接收主体;基于直接接收主体和间接接收主体,确定第一主体集合,并且/或者基于所述多个主体的资源支出收数据,从所述多个主体中筛选与所述第三资源系统存在资源转移关系的第二主体集合,包括:基于所述多个主体的资源支出数据,从所述多个主体中提取与所述第三资源系统存在直接资源转移关系的直接支出主体;根据直接支出主体的资源支出数据,从所述多个主体中提取与所述第三资源系统存在间接资源转移关系的间接支出主体;基于直接支出主体和间接支出主体,确定第二主体集合。
在根据本申请的一些实施例的集群识别方法中,至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,包括:基于所述候选主体的资源接收数据和资源支出数据,计算候选主体中存在直接资源转移关系的主体对之间的资源转移总量;响应于所述主体对之间的资源转移总量小于资源转移阈值,从所述候选主体中删除所述主体对,以得到更新的候选主体;至少根据所述更新的候选主体中每个主体的资源转移水平,从所述更新的候选主体中识别目标集群。
根据本申请的另一方面,提供了一种集群识别装置,该装置包括:获取模块,配置为获取第一资源系统中多个主体的资源转移数据,其中所述资源转移数据包括所述多个主体中的每个主体的资源接收数据和资源支出数据;第一确定模块,配置为基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,所述候选主体的资源接收数据与不同于所述第一资源系统的第二资源系统相关并且所述候选主体的资源支出数据与不同于所述第一资源系统的第三资源系统相关,其中所述第二资源系统用于向所述第一资源系统中的所述候选主体支出资源,所述第三资源系统用于从所述第一资源系统中的所述候选主体接收资源;第二确定模块,配置为根据所述候选主体的资源接收数据和资源支出数据,确定所述候选主体中每个主体的资源转移水平;识别模块,配置为至少根据所述候选主体的中每个主体的资源转移水平,从所述候选主体中识别目标集群,所述目标集群包括从所述第二资源系统经由所述第一资源系统到所述第三资源系统的资源转移过程所涉及的至少一个候选主体。
根据本申请的又一方面,提供了一种计算设备,包括存储器和处理器,其中所述存储器中存储有计算机程序,所述计算机程序在被所述处理器执行时促使所述处理器执行根据本申请一些实施例的集群方法的步骤。
根据本申请的另外又一方面,提供了一种计算机可读存储介质,其其上存储计算机可读指令,所述计算机可读指令在被执行时实现根据本申请一些实施例的集群识别方法。
根据本申请的另一方面,提供了一种计算机程序产品,包括计算机指令,计算机指令在被处理器执行时实现根据本申请一些实施例的集群识别方法的步骤。
在根据本申请一些实施例的集群识别方法和装置中,从第一资源系统中的多个主体中,利用各个主体的资源接收数据和资源支出数据识别参与异常资源转移过程(即,从另一资源系统(即第二资源系统)中接收的资源经过第一资源系统流动或支出到又一资源系统(即第三资源系统)的资源转移过程)的主体集群,作为目标集群(即异常集群),从而考虑了异常资源(例如来自第二资源系统经由第一资源系统转入第三资源系统的某些资源)在第一资源系统中完整的资源转移过程或资源流向;不仅如此,还基于该完整的资源转移过程分别计算每个主体的资源转移水平,将每个主体的资源转移水平作为识别目标集群的识别依据。这样的识别方法既考虑了各个主体自身的交易特征,又兼顾了不同主体之间的资源转移关系和资源流动特征,克服了相关技术的片面性和局限性;同时这种识别方法由于仅涉及参与第一资源系统中完整的资源转移过程的主体集群,因此可以有效排除无关主体(例如从事正常资源转移活动的正常主体)的干扰或正常资源转移过程的干扰,从而显著提高识别集群的准确率。
根据下文描述的实施例,本申请的这些和其它优点将变得清楚,并且参考下文描述的实施例来阐明本申请的这些和其它优点。
附图说明
现在将更详细并且参考附图来描述本申请的实施例,其中:
图1示出了根据本申请的一些实施例的集群识别方法的示例性应用场景;
图2示出了根据本申请的一些实施例的集群识别方法的示例性流程图;
图3示出了根据本申请的一些实施例的从多个主体中确定候选主体的示意性原理图;
图4示出了根据本申请的一些实施例的集群识别方法的示例性流程图;
图5A示出了根据本申请的一些实施例的建立资源转移多分有向图的示意图;
图5B-5H示出了根据本申请的一些实施例的基于资源转移多分有向图确定的目标集群的示意图;
图6示出了根据本申请的一些实施例的集群识别装置的示例性结构框图;以及
图7示出了一个示例系统,其包括代表可以实现本文描述的各种方法的一个或多个系统和/或设备的示例计算设备。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本申请将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组件、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本申请概念的教示。如本文中所使用,术语“和/或”及类似术语包括相关联的列出项目中的任一个、多个和全部的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本申请所必须的,因此不能用于限制本申请的保护范围。
在详细介绍本申请的实施例之前,为了清楚起见,首先对一些相关的概念进行解释。
多分图:也称为多部图,是图论中的一种特殊模型。设G=(V,E)是一个无向图,如果顶点V可以分割为n个互不相交的子集(A1,A2,……,An),n为大于1的正整数,并且图中的每条边(i,j)所关联的两个顶点i和j分别属于这n个不同的顶点集(A1,A2,……,An)中的两个顶点集,则称图G为一个多分图,其中A1、A2、…、An被称为多分图G的分图。多分有向图是边具有方向的多分图。
资源:本文提到的资源包括能够通过网络在不同主体之间发生转移的电子资产,包括但不限于资金、用于网络交易的货币资产、理财账户(含银行账户)中现金资产、理财产品资源(如基金、股票、债券、期货)等资产。
主体:本文提到的主体是指以提供某种服务或商品为目的或从事某种运营活动或无任何商业目的的机构、组织或个人进行资源转移所使用的机器设备,包括但不限于商户、个人和企业的计算机、服务器或诸如手机之类的移动设备。
集群:本文提到的集群指的是一个或多个主体的集合。
目标集群:本文提到的目标集群指的是参与或从事异常资源转移活动的主体(也称异常主体)的集合,也称异常集群。
图1示出了根据本申请的一些实施例的集群识别方法的示例性应用场景100。应用场景100中可以包括数据库101、服务器102、网络103和终端设备104,服务器102通过网络103与终端设备104通信地耦合在一起。
在该实施例中,数据库101可以存储有多个主体的资源转移数据,该多个主体的资源转移数据包括多个主体中的每个主体的资源接收数据和资源支出数据。数据库101可以根据服务器102的要求,将该多个主体的资源转移数据以有线或无线方式传输给服务器102。可选地,数据库101还可以存储有该多个主体的每个主体的每一条资源接收数据的接收时间和每一条资源支出数据的支出时间。
服务器102从数据库101获取第一资源系统中多个主体的资源转移数据,其中资源转移数据包括该多个主体中的每个主体的资源接收数据和资源支出数据。
然后服务器102基于多个主体的资源转移数据,从多个主体中确定候选主体,候选主体的资源接收数据与不同于第一资源系统的第二资源系统相关,并且候选主体的资源支出数据与不同于第一资源系统的第三资源系统相关,其中第二资源系统用于向第一资源系统中的候选主体支出资源,第三资源系统用于从第一资源系统中的候选主体接收资源。
接下来服务器102根据候选主体的资源接收数据和资源支出数据,确定候选主体中每个主体的资源转移水平。
最后,服务器102至少根据候选主体中每个主体的资源转移水平,从候选主体中识别目标集群,目标集群包括从第二资源系统经由第一资源系统到第三资源系统的资源转移过程所涉及的至少一个候选主体。在得到目标集群后,服务器102可以将该目标集群发送给终端设备104进行呈现,供操作人员使用。
附加地,操作人员可以从终端设备104处发起识别集群的请求,例如点击发起识别集群的按钮或输入发起识别集群的指令。该请求可以经由网络103传输给服务器102,或者直接通过服务器102的输入设备输入到服务器102。网络103例如可以是广域网(WAN)、局域网(LAN)、无线网络、公用电话网、内联网以及本领域的技术人员熟知的任何其它类型的网络。
应当指出,数据库101可以是能够持久存储信息的介质和/或设备,和/或有形的存储装置。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或以适用于存储信息(诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据)的方法或技术实现的存储设备之类的硬件。本领域普通技术人员所理解的,服务器102的实例可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。终端设备104可以从服务器102接收目标集群并将该集群中的主体一一呈现给用户。
终端设备104可以是任何类型的移动计算设备,包括移动计算机(例如,个人数字助理(PDA)、膝上型计算机、笔记本计算机、平板计算机、上网本等)、移动电话(例如,蜂窝电话、智能手机等)、可穿戴式计算设备(例如智能手表、头戴式设备,包括智能眼镜等)或其他类型的移动设备。在一些实施例中,终端设备104也可以是固定式计算设备,例如台式计算机、游戏机、智能电视等。此外,应用场景100包括多个终端设备104的情况下,该多个终端设备104可以是相同或不同类型的计算设备。
如图1所示,终端设备104可以包括显示屏以及可以经由显示屏与终端用户交互的终端应用。终端应用可以为本地应用程序、网页(Web)应用程序或者作为轻量化应用的小程序(Little App,例如手机小程序、微信小程序)。在终端应用为需要安装的本地应用程序的情况下,可以将终端应用安装在终端设备104中。在终端应用为Web应用程序的情况下,可以通过浏览器访问终端应用。在终端应用为小程序的情况下,可以通过搜索终端应用的相关信息(如终端应用的名称等)、扫描终端应用的图形码(如条形码、二维码等)等方式来在用户终端104上直接打开终端应用,而无需安装终端应用。
图2示出了根据本申请的一些实施例的集群识别方法的示例性流程图。所示方法200可以在服务器侧(例如可以在图1所示的服务器102)实施。可替换地,在一些实施例中,在终端设备104具备充分的计算资源和计算能力的情况下,可以直接在终端设备104上执行根据本申请的资源管理方法。在另一些实施例中,也可以根据本申请的资源管理方法由服务器和终端设备相组合地执行。如图2所示,根据本申请一些实施例的集群识别方法可以包括步骤S201-S204。
在步骤S201中,获取第一资源系统中多个主体的资源转移数据,其中资源转移数据包括该多个主体中的每个主体的资源接收数据和资源支出数据。
根据本申请的构思,要想基于完整的资源转移过程来识别参与异常资源转移活动的主体所构成的集群,首先必须获取可能参与异常资源转移活动的多个主体的数据及其资源转移数据。主体的资源接收数据包括该主体的标识、该主体所接收的该资源的数量和支出该资源的另一主体的标识。主体的资源支出数据包括该主体的标识、该主体所支出的资源的数量和接收该资源的另一主体的标识。第一资源系统是该多个主体的资源转移活动所发生的系统,例如是微信支付系统。
由于异常资源的转移活动通常在两小时内完成,因此该多个主体的资源转移数据所覆盖的时间段具有重要影响。过短的时间段大多反映即时的交易行为,导致资源转移数据也不具有识别价值。例如,过去10分钟内的多个主体的资源转移数据大多反映了正常的交易行为。因此,操作人员可以根据需要预先设定该多个主体的资源转移数据所发生的时间段。在一些实施例中,获取第一资源系统中多个主体的资源转移数据包括:获取预设时间段内多个主体的资源转移数据。可选地,在一些实施例中,该预设时间段的长度大于或等于3个小时。大于或等于3个小时的时间段一般可以覆盖大多数异常资源的完整转移过程,可以有效地提高识别目标集群的准确率。
在步骤S202中,基于该多个主体的资源转移数据,从该多个主体中确定候选主体,候选主体的资源接收数据与不同于第一资源系统的第二资源系统相关,并且候选主体的资源支出数据与不同于第一资源系统的第三资源系统相关,其中第二资源系统用于向第一资源系统中的候选主体支出资源,第三资源系统用于从第一资源系统中的候选主体接收资源。
根据本申请的构思,在获得多个主体的资源转移数据后,即可对集群进行识别。为了提高识别集群的准确率,可以首先进行初步的识别,剔除例如从事正常资源转移活动的正常主体,保留较可能参与异常资源转移活动的主体,即候选主体,同时确保在第一资源系统中完整的资源转移过程或资源流向。第二资源系统是与第一资源转移的资源系统不同的资源系统,例如第二资源系统是银行卡系统,第一资源系统是微信支付系统。第三资源系统也是与第一资源转移的资源系统不同的资源系统,例如第三资源系统是银行卡系统、其他网络支付系统等资源系统。应当注意,第二资源系统与第三资源系统可以相同,也可以不同。
候选主体的资源接收数据与第二资源系统相关,这种相关既包括直接相关,也包括间接相关。候选主体的资源接收数据与第二资源系统直接相关指,候选主体从第二资源系统接收资源,如微信用户A通过微信充值的方式从银行卡1接收货币资源过程中,微信用户A的资源接收数据与银行卡1直接相关。候选主体的资源接收数据与第二资源系统间接相关指,该候选主体经过至少一个中间主体从第二资源系统接收资源。类似地,候选主体的资源支出数据与第三资源系统相关,这种相关既包括直接相关,也包括间接相关。候选主体的资源支出数据与第三资源系统直接相关指,候选主体向第三资源系统支出资源,如微信用户A通过微信提现的方式从银行卡2提现货币资源过程中,微信用户A的资源支出数据与银行卡2直接相关。候选主体的资源支出数据与第三资源系统间接相关指,该候选主体经过至少一个中间主体向第三资源系统支出资源。通过确定候选主体,可以将后续识别方法应用在完整资源转移过程中,而不是仅发生于第一资源系统的合法资源转移过程,这提高了识别准确率。那些与第二资源系统不相关的主体和与第三资源系统不相关的主体也不会干扰目标集群的识别,这也提高了识别准确率。
通常情况下,参与异常资源转移活动的主体将货币资源从异常银行卡通过网络支付系统(如微信支付系统)转移到合法银行卡,实现货币资源的合法化。本申请的集群识别方法可以用于识别参与上述异常资源转移活动的主体的目标集群。
图3示出了根据本申请的一些实施例的从多个主体中确定候选主体的示意性原理图。如图3所示,所获得的主体A、B、C、D的资源转移数据为:主体A从第二资源系统接收(例如通过微信充值的方式)了90000元,主体A向主体B支出了90000元,相应地,主体B从主体A接收了90000元,进一步地,主体B向第三资源系统支出了(例如通过微信提现的方式)90000元;不仅如此,主体A还向主体C支出了10000元,相应地,主体C从主体A接收了10000元;主体C进而向主体D支出了6000元,相应地,主体D从主体C接收了6000元;主体D没有资源支出数据,或资源支出数据为零。
对于主体A,主体A从第二资源系统接收资源,因此主体A的资源接收数据与第二资源系统直接相关;主体A分别向主体B和主体C支出资源,而主体B向第三资源系统支出资源,因此主体A的资源支出数据与第三资源系统间接相关。至此主体A为候选主体。
对于主体B,主体B向第三资源系统支出资源,因此主体B的资源支出收数据与第三资源系统直接相关;主体B仅从主体A接收数据,而主体A从第二资源系统接收资源,因此主体B的资源接收数据与第二资源系统间接相关。至此主体B为候选主体。
对于主体C,主体C从主体A接收资源,而主体A从第二资源系统接收资源,因此主体C的资源接收数据与第二资源系统间接相关;主体C向主体D支出资源,主体D的资源支出数据为零,因此主体C的资源支出数据与第三资源系统无关,因此C不是候选主体。
对于主体D,主体D的资源支出数据为零,因此主体D的资源支出数据与第三资源系统无关,因此D不是候选主体。
经过前述确定候选主体的方法,主体A和主体B为候选主体,主体C和D均不是候选主体。
在步骤S203中,根据候选主体的资源接收数据和资源支出数据,确定候选主体中每个主体的资源转移水平。主体的资源转移水平是根据主体的资源接收数据和资源支出数据计算得到的结果,其反映该主体参与或从事异常资源转移活动的可能性。参与或从事异常资源转移活动的主体为了实现异常资源的快速转移,往往具备很高的资源转移水平,因此主体的资源转移水平可以作为确定主体参与或从事异常资源转移活动的可能性的重要识别依据。
使用候选主体的资源接收数据和资源支出数据来计算候选主体的资源转移水平的方式有多种,本申请对此不做限定。作为示例,根据一个候选主体的资源接收数据确定该候选主体的资源接收总量为f,根据该候选主体的资源支出数据确定该候选主体的资源支出总量为q,可以根据公式f-a*q来计算该候选主体的资源转移水平,这里a是任一常数,候选主体的资源接收总量f为候选主体的资源接收数据的数值表示,候选主体的资源支出总量q为候选主体的资源支出数据的数值表示。例如还可以根据公式f-q*q来计算该候选主体的资源转移水平。在后续实施例中将给出更为详细和具体的确定候选主体中每个主体的资源转移水平的方式。
根据本申请的构思,由于主体的资源转移水平对异常资源转移过程的判断具有重要作用,为了发挥主体的资源转移水平的作用,应当分别计算每个主体的资源转移水平,将每个主体的资源转移水平作为识别目标集群的识别依据,从而显著提高识别集群的准确率。
在步骤S204中,至少根据候选主体中每个主体的资源转移水平,从候选主体中识别目标集群,目标集群包括从第二资源系统经由第一资源系统到第三资源系统的资源转移过程所涉及的至少一个候选主体。
根据本申请的构思,在完成初步识别,并计算得到了各个候选主体的资源转移水平后,应利用该识别依据从候选主体中识别出目标集群,即可能参与异常资源转移活动的主体的集群。通常参与异常资源转移活动是一个或多个主体,因此最后的识别结果应当是包括至少一个候选主体的集群。在该步骤S204中,各个候选主体之间的资源转移数据既反映了各个主体自身的交易特征,又反映了不同主体之间的资源转移关系和资源流动特征,克服了相关技术的片面性和局限性,并且由于目标集群包括从第二资源系统经由第一资源系统到第三资源系统的资源转移过程所涉及的至少一个候选主体,因此确保了目标集群涉及第一资源系统中完整的资源转移过程或资源流向,另外采用了主体的资源转移水平在确定参与或从事异常资源转移活动的可能性的作用,从而显著提高识别集群的准确率。
在根据本申请一些实施例的集群识别方法中,从第一资源系统中的多个主体中,利用各个主体的资源接收数据和资源支出数据识别参与异常资源转移过程(即,从另一资源系统(即第二资源系统)中接收的资源经过第一资源系统流动或支出到又一资源系统(即第三资源系统)的资源转移过程)的主体集群,作为目标集群(即异常集群),从而考虑了异常资源(例如来自第二资源系统经由第一资源系统转入第三资源系统的某些资源)在第一资源系统中完整的资源转移过程或资源流向;不仅如此,还基于该完整的资源转移过程分别计算每个主体的资源转移水平,将每个主体的资源转移水平作为识别目标集群的识别依据。这样的识别方法既考虑了各个主体自身的交易特征,又兼顾了不同主体之间的资源转移关系和资源流动特征,克服了相关技术的片面性和局限性;同时这种识别方法由于仅涉及参与第一资源系统中完整的资源转移过程的主体集群,因此可以有效排除无关主体(例如从事正常资源转移活动的正常主体)的干扰或正常资源转移过程的干扰,从而显著提高识别集群的准确率;另外,本方法采用了主体的资源转移水平在确定参与或从事异常资源转移活动的可能性的作用,从而显著提高识别集群的准确率。
在步骤S204中,从候选主体中识别目标集群的过程包括多种实现方案。图4示出了根据本申请的一些实施例的集群识别方法的示例性流程图。图4所示的步骤S401-S403是图2的步骤S204的扩展,步骤S401-S403建立在获取多个主体的资源转移数据并从该多个主体中确定了候选主体的前提下。
在步骤S401中,以候选主体中的各个主体为节点,基于各节点之间的资源转移关系定义不同节点之间的有向边,并根据节点和节点之间的有向边建立资源转移多分有向图,资源转移多分有向图包括多个分图,同一分图中的节点具有相同的层级,节点的层级指示该节点与第二资源系统或第三资源系统的相关程度。资源转移关系既包括资源支出关系也包括资源接收关系,所转移的资源的数量为该资源转移关系的数量。例如节点1向节点2支出资源10000元,则表明节点1和节点2之间存在资源转移关系,资源转移关系的方向为从节点1到节点2,资源转移关系的数量为10000。对于节点的层级,节点的层级越小,表明节点与第二资源系统或第三资源系统的相关程度越大。在该实施例中,将所获得的候选主体的资源转移数据映射为资源转移多分有向图,基于该资源转移多分有向图来确定每个主体的资源转移水平以及识别目标集群。在后面的实施例中,指示节点与第二资源系统的相关程度的层级为第一类型层级,指示节点与第三资源系统的相关程度的层级为第二类型层级。
图5A示出了根据本申请的一些实施例的建立资源转移多分有向图S1的示意图。在图5A所示的实施例中,“资源”为货币资源,所确定的候选主体的资源转移数据如下。
候选主体P1,1从第二资源系统中的账户C1接收了40万元,从第二资源系统中的账户C2接收了10万元,向候选主体P2,1支出了10万元,向候选主体P2,2支出了20万元,向候选主体P2,3支出了18万元。
候选主体P1,2从第二资源系统中的账户C1接收了20万元,从第二资源系统中的账户C2接收了30万元,向候选主体P2,3支出了30万元,向候选主体P2,4支出了19万元。
候选主体P2,1向候选主体P3,1支出了8万元,候选主体P2,1的资源接收数据不再重述。
候选主体P2,2向候选主体P3,1支出了2万元,候选主体P2,2的资源接收数据不再重述。
候选主体P2,3向候选主体P3,3支出了48万元,候选主体P2,3的资源接收数据不再重述。
候选主体P2,4向候选主体P3,2支出了19万元,候选主体P2,4的资源接收数据不再重述。
候选主体P3,1向第三资源系统的账户D3支出了5万元,候选主体P3,1的资源接收数据不再重述。
候选主体P3,2向第三资源系统的账户D4支出了18万元,候选主体P3,2的资源接收数据不再重述。
候选主体P3,3向第三资源系统的账户D4支出了48万元,候选主体P3,3的资源接收数据不再重述。
如图5A所示,各个候选主体被映射为节点,根据各个节点之间的资源转移关系定义不同节点之间的有向边。例如,节点P2,1向节点P3,1支出了8万元可以被确定为起点为节点P2,1,终点为节点P3,1的边,边的大小为8万。然后根据上述节点和有向边建立资源转移多分有向图S1,资源转移多分有向图S1包括三个分图,第一分图包括节点P1,1和P1,2,这两个节点的第一类型层级为1,第二类型层级为3,第二分图包括节点P2,1、P2,2、P2,3和P2,4,这四个节点的第一类型层级为2,第二类型层级为2,第三分图包括节点P3,1、P3,23,3,这三个节点的第一类型层级为3,第二类型层级为1。
值得注意的是,第二资源系统的账户C1、C2和第三资源系统的账户D3、D4均不包括在该资源转移多分有向图S1中,该资源转移多分有向图仅包括虚线501和虚线502之间的节点和有向边,图5B-5H也是如此。
在步骤S402中,至少根据资源转移多分有向图中各个节点的资源转移水平和层级,确定资源转移多分有向图中每个节点的属性值,其中每个节点的属性值指示该节点属于目标集群的可能性。在获得资源转移多分有向图后,可以容易地计算各个节点的资源转移水平和层级,这两个参数有助于准确地确定节点属于目标集群的可能性。具体而言,具有较大资源转移水平的节点所对应的主体参与异常资源转移的可能性更大,具有较小资源转移水平的节点所对应的主体参与异常资源转移的可能性更小;具有较小层级的节点所对应的主体与第二或第三资源系统的相关程度越大,也越可能参与异常资源转移,具有较大层级的节点所对应的主体与第二或第三资源系统的相关程度越小,也越不太可能参与异常资源转移。因此根据这两个参数来确定节点的属性值,使得节点的属性值可以准确地表示节点所对应的主体是参与异常资源转移的主体的可能性,节点的属性值越大,说明该节点所对应的主体越可能参与异常资源转移活动,节点的属性值越小,说明该节点所对应的主体越不太可能参与异常资源转移活动。
在步骤S403中,基于资源转移多分有向图中的每个节点的属性值,从资源转移多分有向图的节点中识别目标集群。在该实施例中,通过逐一计算候选主体中每个主体参与异常资源转移活动的可能性,来识别参与异常资源转移活动的目标集群。具体识别方式可以包括多种实施方式,在此不作限定。例如,可以预设节点的属性值阈值,在该资源转移多分有向图中,将属性值大于属性值阈值的节点认定为属于目标集群的节点。再例如,可以将属性值最大的10%的节点认定为属于目标集群的节点。
在一些实施例中,至少根据候选主体中每个主体的资源转移水平,从候选主体中识别目标集群,包括:基于候选主体的资源接收数据和资源支出数据,计算候选主体中存在直接资源转移关系的主体对之间的资源转移总量;响应于主体对之间的资源转移总量小于资源转移阈值,从候选主体中删除主体对,以得到更新的候选主体;至少根据更新的候选主体中每个主体的资源转移水平,从更新的候选主体中识别目标集群。资源转移总量指示对应主体对之间的接收/支出资源总额。实际上,主体的资源转移总量小于资源转移阈值,说明该主体与第二资源系统或第三资源系统没有足够强度的相关性,可以认定为该主体与第二资源系统或第三资源系统无关,不属于候选主体。因此删除资源转移总量小于资源转移阈值的主体对,可以有效排除无关主体(例如从事正常资源转移活动的正常主体)的干扰或正常资源转移过程的干扰,从而显著提高识别集群的准确率。该资源转移阈值例如可以根据经验设置为1000元或2000元。
下面,通过其他实施例详细说明计算节点的属性值的方式。
在一些实施例中,每个节点的资源转移水平包括每个节点的资源转移留存值,每个节点的资源转移留存值表示该节点的资源支出总量和资源接收总量之差的绝对值。
在参与异常资源转移活动的主体中,为了实现资源转移的目的,往往主体的资源转移留存值很小,这些主体充当资源转移媒介的功能,具有很强的资源转移水平,因此节点的资源转移留存值可以用于确定节点参与异常资源转移活动的可能性。以图5A中的资源转移多分有向图S1为例,节点P2,1的资源转移留存值为2万元(10万-8万=2万元)。在该实施例中,至少根据节点的资源转移水平中的资源转移留存值和层级计算节点的属性值的方式有多种,在此不做限定。例如节点的属性值可以等于节点的资源转移留存值与节点的层级之积的倒数。
在一些实施例中,每个节点的资源转移水平进一步包括每个节点的资源收支最小值,每个节点的资源收支最小值表示该节点的资源支出总量和资源接收总量中的较小者。在参与异常资源转移活动的主体中,为了实现资源转移的目的,往往主体的资源收支最小值很大,从而实现快速转移资源的目的,因此节点的资源收支最小值也可以用于确定节点参与异常资源转移活动的可能性。在该实施例中,根据节点的资源转移水平中的资源转移留存值和资源收支最小值以及根据层级确定节点的属性值的方式有多种,在此不做限定。例如,可以将节点的资源收支最小值/(节点的资源转移留存值*节点的层级)的结果作为节点的属性值。
在一些实施例中,节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且资源转移多分有向图中的每个节点的属性值满足下述条件中至少一个:(1)与所述节点的资源转移留存值成负相关;(2)与所述节点的第一类型层级和第二类型层级中的较小者成负相关;以及(3)与所述节点的资源收支最小值成正相关。节点的第一类型层级越小,意味着该节点与第二资源系统的相关程度越强,如图3所示,节点A的第一类型层级为1,意味着该节点A与第二资源系统直接相关。节点的第一类型层级越大,意味着该节点与第二资源系统的相关程度越弱,如图3所示,节点B的第一类型层级为2,意味着该节点B与第二资源系统间隔了一个中间节点A,相关程度较弱。节点的第二类型层级越小,意味着该节点与第三资源系统的相关程度越强,如图3所示,节点B的第二类型层级为1,意味着该节点B与第三资源系统直接相关。节点的第二类型层级越大,意味着该节点与第三资源系统的相关程度越弱,如图3所示,节点A的第二类型层级为2,意味着该节点A与第三资源系统间隔了一个中间节点B,相关程度较弱。
如上所述,对于条件(1),如前所述,在参与异常资源转移活动的主体中,为了实现资源转移的目的,往往主体的资源转移留存值很小,这些主体充当资源转移媒介的功能,具有很强的资源转移水平,因此,将节点的属性值的计算方式设计为与节点的资源转移留存值成负相关,可以准确地识别参与异常资源转移活动的主体。例如在节点的属性值等于节点的资源转移留存值的倒数的实施例中,节点P2,1的属性值为2万分之一,节点P2,2的属性值为18万分之一,这意味着节点P2,1比节点P2,2更有可能参与异常资源转移活动。对于条件(2),节点的第一类型层级和第二类型层级体现了节点在资源转移过程中的位置,由于在异常资源转移活动中,靠近资源转移过程的第一层级和最后层级较容易出现参与异常资源转移活动的主体,处于中间层级的主体则存在较多的参与正常资源转移活动的主体,因此节点的属性值与该节点的第一类型层级和第二类型层级中的较小者成负相关有助于准确地识别参与异常资源转移活动的主体。对于条件(3),在参与异常资源转移活动的主体中,为了实现资源转移的目的,往往主体的资源收支最小值很大,从而实现快速转移资源的目的,因此将节点的属性值设计为与节点的资源收支最小值成正相关,可以准确地识别参与异常资源转移活动的主体。以图5A中的资源转移多分有向图S1为例,当节点的属性值w等于节点的资源收支最小值的万分之一时,节点P2,1的属性值为8,节点P2,2的属性值为2,这意味着节点P2,1比节点P2,2更有可能参与异常资源转移活动。综上所述,满足上述条件(1)-(3)中的任一个有助于提高识别准确率。
在一些更具体的实施例中,节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且至少根据资源转移多分有向图中各个节点的资源转移水平和层级,确定资源转移多分有向图中每个节点的属性值,包括:对于资源转移多分有向图中的每个节点,使用公式(1)确定节点的属性值:
公式(1)
其中表示资源转移多分有向图S中节点i的属性值,/>表示节点i的资源支出总量和资源接收总量中的较小者,/>表示节点i的资源支出总量和资源接收总量中的较大者,/>表示节点i的第一类型层级和与第二类型层级中的较小者,a为大于或等于0且小于1的预设参数。这里预设参数a充当调和参数,当a越大时,节点的资源转移留存值对节点的属性值的影响越大,节点的最小资源转移量对节点的属性值的影响越小,反之,当a越小时,节点的资源转移留存值对节点的属性值的影响越小,节点的最小资源转移量对节点的属性值的影响越大。如前所述,由于在异常资源转移活动中,靠近资源转移过程的第一层级和最后层级较容易出现参与异常资源转移活动的主体,处于中间层级的主体则存在较多的参与正常资源转移活动的主体,因此节点的属性值与该节点的第一类型层级和第二类型层级中的较小者成负相关有助于准确地识别参与异常资源转移活动的主体。
公式(1)结合了前述实施例中的条件(1)-(3),wi(S)与节点i的资源转移留存值成负相关,与节点i的第一类型层级和第二类型层级中的较小者成负相关,与节点i的最小资源转移量成正相关。因此,使用该公式来计算节点的属性值可以显著提高识别节点的准确率。其中预设参数a可以根据经验值进行设定。
以图5A中的资源转移多分有向图S1为例,假设参数a被预设为0.5,节点P1,1的fP1,1(S1)为48万,qP1,1(S1)为50万,dP1,1(S1)为1,相关度wP1,1(S1)为(48-50*0.5)万/1=23万。类似地,其他节点的属性值分别为wP1,2(S1)=24万、wP2,1(S1)=1.5万、wP2,2(S1)=-4万、wP2,3(S1)=12万、wP2,4(S1)=4.75万、wP3,1(S1)=0万、wP3,2(S1)=8.5万、wP3,3(S1)=24万。由此可见节点P2,2不太可能是参与异常资源转移活动的主体,节点P1,2和节点P3,3较可能是参与异常资源转移活动的主体。
除了步骤S402,还可以对步骤S403进行扩展。在一些实施例中,基于资源转移多分有向图中的每个节点的属性值,从资源转移多分有向图的节点中识别目标集群,包括:将资源转移多分有向图中的各个节点的集合作为当前候选集群,通过迭代方式依次执行下述步骤,以获取候选集群集合:迭代结束判定步骤:响应于当前候选集群对应的资源转移多分有向图中存在节点为空的分图,结束迭代;集群特征值计算步骤:基于当前候选集群中各个节点的属性值,计算当前候选集群的集群特征值,并将当前候选集群作为候选集群集合中的一个候选集群,当前候选集群更新步骤:从当前候选集群中移除属性值最低的节点并更新所移除的节点的相邻节点的属性值,以更新当前候选集群,并转到迭代结束判定步骤,基于候选集群集合中各候选集群的集群特征值,从候选集群集合中识别目标集群。集群特征值表示对应集群是目标集群的可能性。作为示例,可以使用公式(2)来确定当前候选集群的集群特征值:
公式(2)
其中表示资源转移多分有向图S的对应的当前候选集群的集群特征值,N为资源转移多分有向图S中的节点的数量,/>表示资源转移多分有向图S中节点i的属性值。
公式(2)表示将当前候选集群中各个节点的属性值的平均值作为当前候选集群的集群特征值。在另外一个示例中,可以对各个节点的属性值进行加权求和来计算当前候选集群的集群特征值。
以图5A的资源转移多分有向图S1为例,图5B-5H示出了根据该实施例的基于资源转移多分有向图确定的目标集群的示意图。该实施例中资源为货币资源,节点的属性值的计算方式采取公式(1)所记载的方式,并使用公式(2)来确定当前候选集群的集群特征值。在步骤S402后,根据该实施例的识别集群的过程如下。
假设参数a被设置0.5,该资源转移多分有向图S1中的各个节点的集合作为当前候选集群S1。首先在迭代结束判定步骤,当前候选集群S1对应的资源转移多分有向图中不存在节点为空的分图,可以执行后续步骤。
然后执行集群特征值计算步骤,计算当前候选集群S1的集群特征值。各个节点的属性值为wP1,1(S1)=23万、wP1,2(S1)=24万、wP2,1(S1)=1.5万、wP2,2(S1)=-4万、wP2,3(S1)=12万、wP2,4(S1)=4.75万、wP3,1(S1)=0万、wP3,2(S1)=8.5万、wP3,3(S1)=24万。因此当前候选集群S1的集群特征值为(23+24+1.5-4+12+4.75+0+8.5+24)/9≈10.42万。为便于说明,此处保留两位小数点,但这并不对本申请构成限制。将当前候选集群S1作为候选集群集合中的一个候选集群。
接着执行当前候选集群更新步骤,从当前候选集群S1中移除属性值最低的节点P2,2。移除节点P2,2前,其相邻节点为节点P1,1和节点P3,1。移除节点P2,2,如图5B所示,以更新当前候选集群S2。
转到迭代结束判定步骤,当前候选集群S2对应的资源转移多分有向图中不存在节点为空的分图,可以继续迭代。
在新一轮迭代中,先执行集群特征值计算步骤,计算当前候选集群S2的集群特征值。节点P1,1资源接收数据不变,资源支出数据从48万减少到28万,wP1,1(S2)=(28-50*0.5)/1=3万。类似地,wP3,1(S2)=(5-8*0.5)/1=1万。其他节点的属性值不变。因此当前候选集群S2的集群特征值为(3+24+1.5+12+4.75+1+8.5+24)/8≈9.84万。将当前候选集群S2作为候选集群集合中的一个候选集群。
接着执行当前候选集群更新步骤,从当前候选集群S2中移除属性值最低的节点P3,1。移除节点P3,1,如图5C所示,以更新当前候选集群S3。
转到迭代结束判定步骤,当前候选集群S3对应的资源转移多分有向图中不存在节点为空的分图,可以继续迭代。
在新一轮迭代中,先执行集群特征值计算步骤,计算当前候选集群S3的集群特征值。各个节点的属性值为wP1,1(S3)=3万、wP1,2(S3)=24万、wP2,1(S3)=-2.5万、wP2,3(S3)=12万、wP2,4(S3)=4.75万、wP3,2(S3)=8.5万、wP3,3(S3)=24万。因此当前候选集群S3的集群特征值为(3+24-2.5+12+4.75+8.5+24)/7≈10.54万。将当前候选集群S3作为候选集群集合中的一个候选集群。
接着执行当前候选集群更新步骤,从当前候选集群S3中移除属性值最低的节点P2,1。移除节点P2,1,如图5D所示,以更新当前候选集群S4。
转到迭代结束判定步骤,当前候选集群S4对应的资源转移多分有向图中不存在节点为空的分图,可以继续迭代。
在新一轮迭代中,先执行集群特征值计算步骤,计算当前候选集群S4的集群特征值。各个节点的属性值为wP1,1(S4)=-7万、wP1,2(S4)=24万、wP2,3(S4)=12万、wP2,4(S4)=4.75万、wP3,2(S4)=8.5万、wP3,3(S4)=24万。因此当前候选集群S4的集群特征值为(-7+24+12+4.75+8.5+24)/6≈11.04万。将当前候选集群S4作为候选集群集合中的一个候选集群。
接着执行当前候选集群更新步骤,从当前候选集群S4中移除属性值最低的节点P1,1。移除节点P1,1,如图5E所示,以更新当前候选集群S5。
转到迭代结束判定步骤,当前候选集群S5对应的资源转移多分有向图中不存在节点为空的分图,可以继续迭代。
在新一轮迭代中,先执行集群特征值计算步骤,计算当前候选集群S5的集群特征值。各个节点的属性值为wP1,2(S5)=24万、wP2,3(S5)=3万、wP2,4(S5)=4.75万、wP3,2(S5)=8.5万、wP3,3(S5)=24万。因此当前候选集群S5的集群特征值为(24+3+4.75+8.5+24)/5=12.85万。将当前候选集群S5作为候选集群集合中的一个候选集群。
接着执行当前候选集群更新步骤,从当前候选集群S5中移除属性值最低的节点P2,3。移除节点P2,3,如图5F所示,以更新当前候选集群S6。
转到迭代结束判定步骤,当前候选集群S6对应的资源转移多分有向图中不存在节点为空的分图,可以继续迭代。
在新一轮迭代中,先执行集群特征值计算步骤,计算当前候选集群S6的集群特征值。各个节点的属性值为wP1,2(S6)=-6万、wP2,4(S6)=4.75万、wP3,2(S6)=8.5万、wP3,3(S6)=-24万。因此当前候选集群S6的集群特征值为(-6+4.75+8.5-24)/4≈-4.19万。将当前候选集群S6作为候选集群集合中的一个候选集群。
接着执行当前候选集群更新步骤,从当前候选集群S6中移除属性值最低的节点P3,3。移除节点P3,3,如图5G所示,以更新当前候选集群S7。
转到迭代结束判定步骤,当前候选集群S7对应的资源转移多分有向图中不存在节点为空的分图,可以继续迭代。
在新一轮迭代中,先执行集群特征值计算步骤,计算当前候选集群S7的集群特征值。各个节点的属性值为wP1,2(S7)=-6万、wP2,4(S7)=4.75万、wP3,2(S7)=8.5万。因此当前候选集群S7的集群特征值为(-6+4.75+8.5)/3≈2.42万。将当前候选集群S7作为候选集群集合中的一个候选集群。
接着执行当前候选集群更新步骤,从当前候选集群S6中移除属性值最低的节点P1,2。移除节点P1,2,如图5H所示,以更新当前候选集群S8。
转到迭代结束判定步骤,当前候选集群S8对应的资源转移多分有向图中存在节点为空的分图,判定迭代结束。
比较候选集群集合中的候选集群S1-S7,其中候选集群S5的集群特征值最大,因此候选集群S5被识别为目标集群,其包括节点P1,2、P2,3、P2,4、P3,2、P3,3
本申请还将给出确定候选主体的具体实施例。
在一些实施例中基于多个主体的资源转移数据,从多个主体中确定候选主体,包括:基于多个主体的资源接收数据,从多个主体中筛选与第二资源系统存在资源转移关系的第一主体集合;基于多个主体的资源支出收数据,从多个主体中筛选与第三资源系统存在资源转移关系的第二主体集合;根据第一主体集合和第二主体集合的交集,确定候选主体。由于候选主体的特点是既与第二资源系统相关,又与第三资源系统相关,因此在具体实现中,可以分别从第二资源系统和第三资源系统获取存在资源转移关系的主体,然后取两者的交集而得到候选主体。
特别地,在一些实施例中,基于多个主体的资源接收数据,从多个主体中筛选与第二资源系统存在资源转移关系的第一主体集合,包括:基于多个主体的资源接收数据,从多个主体中提取与第二资源系统存在直接资源转移关系的直接接收主体;根据直接接收主体的资源接收数据,从多个主体中提取与第二资源系统存在间接资源转移关系的间接接收主体;基于直接接收主体和间接接收主体,确定第一主体集合,并且/或者基于多个主体的资源支出收数据,从多个主体中筛选与第三资源系统存在资源转移关系的第二主体集合,包括:基于多个主体的资源支出数据,从多个主体中提取与第三资源系统存在直接资源转移关系的直接支出主体;根据直接支出主体的资源支出数据,从多个主体中提取与第三资源系统存在间接资源转移关系的间接支出主体;基于直接支出主体和间接支出主体,确定第二主体集合。该实施例给出了确定候选主体的更详细的技术细节。在获取第一主体集合的过程中,首先获得从第二资源系统直接接收资源的直接接收主体,然后按照资源接收数据中的标识,逐步导出间接接收主体,从而得到与第二资源系统相关的第一主体集合。对于第二主体集合,也是类似的道理。两个集合的交集自然就是候选主体,这样可以容易地、精确地实现候选主体的确定,有助于排除无关主体(例如从事正常资源转移活动的正常主体)的干扰或正常资源转移过程的干扰,提高识别目标集群的效率。
图6示出了根据本申请的一些实施例的集群识别装置600的示例性结构框图。该装置600包括:获取模块601、第一确定模块602、第二确定模块603、识别模块604。获取模块601被配置为获取第一资源系统中多个主体的资源转移数据,其中所述资源转移数据包括所述多个主体中的每个主体的资源接收数据和资源支出数据。第一确定模块602被配置为基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,所述候选主体的资源接收数据与不同于所述第一资源系统的第二资源系统相关,并且所述候选主体的资源支出数据与不同于所述第一资源系统的第三资源系统相关,其中所述第二资源系统用于向所述第一资源系统中的所述候选主体支出资源,所述第三资源系统用于从所述第一资源系统中的所述候选主体接收资源。第二确定模块603被配置为根据所述候选主体的资源接收数据和资源支出数据,确定所述候选主体中每个主体的资源转移水平。识别模块604被配置为至少根据所述候选主体的中每个主体的资源转移水平,从所述候选主体中识别目标集群,所述目标集群包括从所述第二资源系统经由所述第一资源系统到所述第三资源系统的资源转移过程所涉及的至少一个候选主体。
应注意,上述各种模块可以以软件或硬件或两者的组合来实现。多个不同模块可以在同一软件或硬件结构中实现,或者一个模块可以由多个不同的软件或硬件结构实现。
在根据本申请一些实施例的集群识别装置中,从第一资源系统中的多个主体中,利用各个主体的资源接收数据和资源支出数据识别参与异常资源转移过程(即,从另一资源系统(即第二资源系统)中接收的资源经过第一资源系统流动或支出到又一资源系统(即第三资源系统)的资源转移过程)的主体集群,作为目标集群(即异常集群),从而考虑了异常资源(例如来自第二资源系统经由第一资源系统转入第三资源系统的某些资源)在第一资源系统中完整的资源转移过程或资源流向;不仅如此,还基于该完整的资源转移过程分别计算每个主体的资源转移水平,将每个主体的资源转移水平作为识别目标集群的识别依据。这样的识别装置既考虑了各个主体自身的交易特征,又兼顾了不同主体之间的资源转移关系和资源流动特征,克服了相关技术的片面性和局限性;同时这种识别装置由于仅涉及参与第一资源系统中完整的资源转移过程的主体集群,因此可以有效排除无关主体(例如从事正常资源转移活动的正常主体)的干扰或正常资源转移过程的干扰,从而显著提高识别集群的准确率。
图7图示了示例系统700,其包括代表可以实现本文描述的各种方法的一个或多个系统和/或设备的示例计算设备710。计算设备710可以是例如服务提供商的服务器、与服务器相关联的设备、片上系统、和/或任何其它合适的计算设备或计算系统。上面参照图6描述的集群识别装置600可以采取计算设备710的形式。替换地,集群识别装置600可以以应用716的形式被实现为计算机程序。
如图示的示例计算设备710包括彼此通信耦合的处理系统711、一个或多个计算机可读介质712以及一个或多个I/O接口713。尽管未示出,但是计算设备710还可以包括系统总线或其他数据和命令传送系统,其将各种组件彼此耦合。系统总线可以包括不同总线结构的任何一个或组合,总线结构诸如存储器总线或存储器控制器、外围总线、通用串行总线、和/或利用各种总线架构中的任何一种的处理器或局部总线。还构思了各种其他示例,诸如控制和数据线。
处理系统711代表使用硬件执行一个或多个操作的功能。因此,处理系统711被图示为包括可被配置成处理器、功能块等的硬件元件714。这可以包括在硬件中实现为专用集成电路或使用一个或多个半导体形成的其它逻辑器件。硬件元件714不受其形成的材料或其中采用的处理机构的限制。例如,处理器可以由(多个)半导体和/或晶体管(例如,电子集成电路(IC))组成。在这样的上下文中,处理器可执行指令可以是电子可执行指令。
计算机可读介质712被图示为包括存储器/存储装置715。存储器/存储装置715表示与一个或多个计算机可读介质相关联的存储器/存储容量。存储器/存储装置715可以包括易失性介质(诸如随机存取存储器(RAM))和/或非易失性介质(诸如只读存储器(ROM)、闪存、光盘、磁盘等)。存储器/存储装置715可以包括固定介质(例如,RAM、ROM、固定硬盘驱动器等)以及可移动介质(例如,闪存、可移动硬盘驱动器、光盘等)。计算机可读介质712可以以下面进一步描述的各种其他方式进行配置。
一个或多个I/O接口713代表允许用户使用各种输入设备向计算设备710输入命令和信息并且可选地还允许使用各种输出设备将信息呈现给用户和/或其他组件或设备的功能。输入设备的示例包括键盘、光标控制设备(例如,鼠标)、麦克风(例如,用于语音输入)、扫描仪、触摸功能(例如,被配置成检测物理触摸的容性或其他传感器)、相机(例如,可以采用可见或不可见的波长(诸如红外频率)将不涉及触摸的运动检测为手势)等等。输出设备的示例包括显示设备、扬声器、打印机、网卡、触觉响应设备等。因此,计算设备1610可以以下面进一步描述的各种方式进行配置以支持用户交互。
计算设备710还包括应用716。应用716可以例如是集群识别装置600的软件实例,并且与计算设备710中的其他元件相组合地实现本文描述的技术。
本申请提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算设备执行上述各种可选实现方式中提供的集群识别方法。
本文可以在软件硬件元件或程序模块的一般上下文中描述各种技术。一般地,这些模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元素、组件、数据结构等。本文所使用的术语“模块”,“功能”和“组件”一般表示软件、固件、硬件或其组合。本文描述的技术的特征是与平台无关的,意味着这些技术可以在具有各种处理器的各种计算平台上实现。
所描述的模块和技术的实现可以存储在某种形式的计算机可读介质上或者跨某种形式的计算机可读介质传输。计算机可读介质可以包括可由计算设备710访问的各种介质。作为示例而非限制,计算机可读介质可以包括“计算机可读存储介质”和“计算机可读信号介质”。
与单纯的信号传输、载波或信号本身相反,“计算机可读存储介质”是指能够持久存储信息的介质和/或设备,和/或有形的存储装置。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或以适用于存储信息(诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据)的方法或技术实现的存储设备之类的硬件。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字通用盘(DVD)或其他光学存储装置、硬盘、盒式磁带、磁带,磁盘存储装置或其他磁存储设备,或其他存储设备、有形介质或适于存储期望信息并可以由计算机访问的制品。
“计算机可读信号介质”是指被配置成诸如经由网络将指令发送到计算设备710的硬件的信号承载介质。信号介质典型地可以将计算机可读指令、数据结构、程序模块或其他数据体现在诸如载波、数据信号或其它传输机制的调制数据信号中。信号介质还包括任何信息传递介质。术语“调制数据信号”是指这样的信号,该信号的特征中的一个或多个被设置或改变,从而将信息编码到该信号中。作为示例而非限制,通信介质包括诸如有线网络或直接连线的有线介质以及诸如声、RF、红外和其它无线介质的无线介质。
如前,硬件元件714和计算机可读介质712代表以硬件形式实现的指令、模块、可编程器件逻辑和/或固定器件逻辑,其在一些实施例中可以用于实现本文描述的技术的至少一些方面。硬件元件可以包括集成电路或片上系统、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)以及硅中的其它实现或其他硬件设备的组件。在这种上下文中,硬件元件可以作为执行由硬件元件所体现的指令、模块和/或逻辑所定义的程序任务的处理设备,以及用于存储用于执行的指令的硬件设备,例如,先前描述的计算机可读存储介质。
前述的组合也可以用于实现本文的各种技术和模块。因此,可以将软件、硬件或程序模块和其它程序模块实现为在某种形式的计算机可读存储介质上和/或由一个或多个硬件元件714体现的一个或多个指令和/或逻辑。计算设备710可以被配置成实现与软件和/或硬件模块相对应的特定指令和/或功能。因此,例如通过使用处理系统的计算机可读存储介质和/或硬件元件714,可以至少部分地以硬件来实现将模块实现为可由计算设备710作为软件执行的模块。指令和/或功能可以由一个或多个制品(例如,一个或多个计算设备710和/或处理系统711)可执行/可操作以实现本文所述的技术、模块和示例。
在各种实施方式中,计算设备710可以采用各种不同的配置。例如,计算设备710可以被实现为包括个人计算机、台式计算机、多屏幕计算机、膝上型计算机、上网本等的计算机类设备。计算设备710还可以被实现为包括诸如移动电话、便携式音乐播放器、便携式游戏设备、平板计算机、多屏幕计算机等移动设备的移动装置类设备。计算设备710还可以实现为电视类设备,其包括具有或连接到休闲观看环境中的一般地较大屏幕的设备。这些设备包括电视、机顶盒、游戏机等。
本文描述的技术可以由计算设备710的这些各种配置来支持,并且不限于本文所描述的技术的具体示例。功能还可以通过使用分布式系统、诸如通过如下所述的平台722而在“云”720上全部或部分地实现。
云720包括和/或代表用于资源724的平台722。平台722抽象云720的硬件(例如,服务器)和软件资源的底层功能。资源724可以包括在远离计算设备710的服务器上执行计算机处理时可以使用的应用和/或数据。资源724还可以包括通过因特网和/或通过诸如蜂窝或Wi-Fi网络的订户网络提供的服务。
平台722可以抽象资源和功能以将计算设备710与其他计算设备连接。平台1622还可以用于抽象资源的分级以提供遇到的对于经由平台722实现的资源724的需求的相应水平的分级。因此,在互连设备实施例中,本文描述的功能的实现可以分布在整个系统700内。例如,功能可以部分地在计算设备710上以及通过抽象云720的功能的平台722来实现。
应当理解,为清楚起见,参考不同的功能单元对本申请的实施例进行了描述。然而,将明显的是,在不偏离本申请的情况下,每个功能单元的功能性可以被实施在单个单元中、实施在多个单元中或作为其它功能单元的一部分被实施。例如,被说明成由单个单元执行的功能性可以由多个不同的单元来执行。因此,对特定功能单元的参考仅被视为对用于提供所描述的功能性的适当单元的参考,而不是表明严格的逻辑或物理结构或组织。因此,本申请可以被实施在单个单元中,或者可以在物理上和功能上被分布在不同的单元和电路之间。
尽管已经结合一些实施例描述了本申请,但是其不旨在被限于在本文中所阐述的特定形式。相反,本申请的范围仅由所附权利要求来限制。附加地,尽管单独的特征可以被包括在不同的权利要求中,但是这些可以可能地被有利地组合,并且包括在不同权利要求中不暗示特征的组合不是可行的和/或有利的。特征在权利要求中的次序不暗示特征必须以其工作的任何特定次序。此外,在权利要求中,词“包括”不排除其它元件,并且术语“一”或“一个”不排除多个。权利要求中的附图标记仅作为明确的例子被提供,不应该被解释为以任何方式限制权利要求的范围。
可以理解的是,在本申请的具体实施方式中,涉及到主体的资源转移数据(例如包括资源接收数据和资源支出数据)等。当本申请以上涉及这样的数据的实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

Claims (16)

1.一种集群识别方法,包括:
获取第一资源系统中多个主体的资源转移数据,其中所述资源转移数据包括所述多个主体中的每个主体的资源接收数据和资源支出数据;
基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,所述候选主体的资源接收数据与不同于所述第一资源系统的第二资源系统相关,并且所述候选主体的资源支出数据与不同于所述第一资源系统的第三资源系统相关,其中所述第二资源系统用于向所述第一资源系统中的所述候选主体支出资源,所述第三资源系统用于从所述第一资源系统中的所述候选主体接收资源;
根据所述候选主体的资源接收数据和资源支出数据,确定所述候选主体中每个主体的资源转移水平;
至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,所述目标集群包括从所述第二资源系统经由所述第一资源系统到所述第三资源系统的资源转移过程所涉及的至少一个候选主体。
2.根据权利要求1所述的方法,其中,所述至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,包括:
以所述候选主体中的各个主体为节点,基于各节点之间的资源转移关系定义不同节点之间的有向边,并根据所述节点和所述节点之间的有向边建立资源转移多分有向图,所述资源转移多分有向图包括多个分图,同一分图中的节点具有相同的层级,所述节点的层级指示该节点与所述第二资源系统或所述第三资源系统的相关程度;
至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述资源转移多分有向图中每个节点的属性值,其中所述每个节点的属性值指示该节点属于目标集群的可能性;
基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群。
3.根据权利要求2所述的方法,其中所述每个节点的资源转移水平包括每个节点的资源转移留存值,所述每个节点的资源转移留存值表示该节点的资源支出总量和资源接收总量之差的绝对值。
4. 根据权利要求3所述的方法,所述每个节点的资源转移水平进一步包括每个节点的资源收支最小值,所述每个节点的资源收支最小值表示该节点的资源支出总量和资源接收总量中的较小者。
5.根据权利要求4所述的方法,其中所述节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且
所述资源转移多分有向图中的每个节点的属性值满足下述条件中至少一个:
与所述节点的资源转移留存值成负相关;
与所述节点的第一类型层级和第二类型层级中的较小者成负相关;以及
与所述节点的资源收支最小值成正相关。
6.根据权利要求2所述的方法,其中所述节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且
所述至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述资源转移多分有向图中每个节点的属性值,包括:
对于所述资源转移多分有向图中的每个节点,使用下述公式确定所述节点的属性值:
其中表示资源转移多分有向图S中节点i的属性值,/>表示节点i的资源支出总量和资源接收总量中的较小者,/>表示节点i的资源支出总量和资源接收总量中的较大者,/>表示节点i的第一类型层级和第二类型层级中的较小者,a为大于或等于0且小于1的预设参数。
7.根据权利要求2所述的方法,其中所述基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群,包括:
将所述资源转移多分有向图中的各个节点的集合作为当前候选集群,
通过迭代方式依次执行下述步骤,以获取候选集群集合:
迭代结束判定步骤:响应于当前候选集群对应的资源转移多分有向图中存在节点为空的分图,结束迭代;
集群特征值计算步骤:基于当前候选集群中各个节点的属性值,计算当前候选集群的集群特征值,并将当前候选集群作为候选集群集合中的一个候选集群;
当前候选集群更新步骤:从当前候选集群中移除属性值最低的节点并更新所移除的节点的相邻节点的属性值,以更新当前候选集群,并转到迭代结束判定步骤,
基于候选集群集合中各候选集群的集群特征值,从候选集群集合中识别目标集群。
8.根据权利要求1所述的方法,其中所述获取第一资源系统中多个主体的资源转移数据包括:
获取预设时间段内多个主体的资源转移数据。
9.根据权利要求8所述的方法,其中所述预设时间段的长度大于或等于3个小时。
10.根据权利要求1所述的方法,其中,所述基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,包括:
基于所述多个主体的资源接收数据,从所述多个主体中筛选与所述第二资源系统存在资源转移关系的第一主体集合;
基于所述多个主体的资源支出收数据,从所述多个主体中筛选与所述第三资源系统存在资源转移关系的第二主体集合;
根据第一主体集合和第二主体集合的交集,确定候选主体。
11.根据权利要求10所述的方法,其中基于所述多个主体的资源接收数据,从所述多个主体中筛选与所述第二资源系统存在资源转移关系的第一主体集合,包括:
基于所述多个主体的资源接收数据,从所述多个主体中提取与第二资源系统存在直接资源转移关系的直接接收主体;
根据直接接收主体的资源接收数据,从所述多个主体中提取与第二资源系统存在间接资源转移关系的间接接收主体;
基于直接接收主体和间接接收主体,确定第一主体集合,并且/或者
所述基于所述多个主体的资源支出收数据,从所述多个主体中筛选与所述第三资源系统存在资源转移关系的第二主体集合,包括:
基于所述多个主体的资源支出数据,从所述多个主体中提取与第三资源系统存在直接资源转移关系的直接支出主体;
根据直接支出主体的资源支出数据,从所述多个主体中提取与第三资源系统存在间接资源转移关系的间接支出主体;
基于直接支出主体和间接支出主体,确定第二主体集合。
12.根据权利要求1所述的方法,其中所述至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,包括:
基于所述候选主体的资源接收数据和资源支出数据,计算候选主体中存在直接资源转移关系的主体对之间的资源转移总量;
响应于所述主体对之间的资源转移总量小于资源转移阈值,从所述候选主体中删除所述主体对,以得到更新的候选主体;
至少根据所述更新的候选主体中每个主体的资源转移水平,从所述更新的候选主体中识别目标集群。
13.一种集群识别装置,包括:
获取模块,配置为获取第一资源系统中多个主体的资源转移数据,其中所述资源转移数据包括所述多个主体中的每个主体的资源接收数据和资源支出数据;
第一确定模块,配置为基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,所述候选主体的资源接收数据与不同于所述第一资源系统的第二资源系统相关,并且所述候选主体的资源支出数据与不同于所述第一资源系统的第三资源系统相关,其中所述第二资源系统用于向所述第一资源系统中的所述候选主体支出资源,所述第三资源系统用于从所述第一资源系统中的所述候选主体接收资源;
第二确定模块,配置为根据所述候选主体的资源接收数据和资源支出数据,确定所述候选主体中每个主体的资源转移水平;
识别模块,配置为至少根据所述候选主体的中每个主体的资源转移水平,从所述候选主体中识别目标集群,所述目标集群包括从所述第二资源系统经由所述第一资源系统到所述第三资源系统的资源转移过程所涉及的至少一个候选主体。
14.一种计算设备,包括:
存储器和处理器,
其中所述存储器中存储有计算机程序,所述计算机程序在被所述处理器执行时促使所述处理器执行权利要求1-12中任一项所述的方法的步骤。
15.一种计算机可读存储介质,其上存储计算机可读指令,所述计算机可读指令在被执行时实现权利要求1-12中任一项所述的方法。
16.一种计算机程序产品,包括计算机指令,计算机指令在被处理器执行时实现根据权利要求1至12中任一项的方法的步骤。
CN202210215971.2A 2022-03-07 2022-03-07 集群识别方法和装置、计算设备、存储介质及程序产品 Pending CN116776259A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210215971.2A CN116776259A (zh) 2022-03-07 2022-03-07 集群识别方法和装置、计算设备、存储介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210215971.2A CN116776259A (zh) 2022-03-07 2022-03-07 集群识别方法和装置、计算设备、存储介质及程序产品

Publications (1)

Publication Number Publication Date
CN116776259A true CN116776259A (zh) 2023-09-19

Family

ID=88012091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210215971.2A Pending CN116776259A (zh) 2022-03-07 2022-03-07 集群识别方法和装置、计算设备、存储介质及程序产品

Country Status (1)

Country Link
CN (1) CN116776259A (zh)

Similar Documents

Publication Publication Date Title
US20230102337A1 (en) Method and apparatus for training recommendation model, computer device, and storage medium
US11682093B2 (en) Document term recognition and analytics
US20200175403A1 (en) Systems and methods for expediting rule-based data processing
CN111783039B (zh) 风险确定方法、装置、计算机系统和存储介质
US20210272195A1 (en) Instant Lending Decisions
US20210192496A1 (en) Digital wallet reward optimization using reverse-engineering
US20170330231A1 (en) Method and system to display targeted ads based on ranking output of transactions
CN111427971A (zh) 用于计算机系统的业务建模方法、装置、系统和介质
US20230004979A1 (en) Abnormal behavior detection method and apparatus, electronic device, and computer-readable storage medium
CN115374094B (zh) 多源数据融合方法、智能终端以及存储介质
CN110942392A (zh) 一种业务数据处理方法、装置、设备和介质
US20230342797A1 (en) Object processing method based on time and value factors
CN113034046A (zh) 一种数据风险计量方法、装置、电子设备及存储介质
CN117033765A (zh) 业务推荐方法、装置、计算机设备和存储介质
CN116662546A (zh) 投诉文本标注方法、装置、设备和介质
CN112446777A (zh) 一种信用评估方法、装置、设备及存储介质
CN115564450A (zh) 一种风控方法、装置、存储介质及设备
CN115827994A (zh) 一种数据处理方法、装置、设备、存储介质
CN116776259A (zh) 集群识别方法和装置、计算设备、存储介质及程序产品
CN113849731A (zh) 基于自然语言处理的信息推送方法、装置、设备及介质
CN113436001A (zh) 信用卡的推送方法、装置、设备、存储介质和程序产品
CN114547448B (zh) 数据处理、模型训练方法、装置、设备、存储介质及程序
CN113240472B (zh) 理财产品推荐方法、电子设备及存储介质
CN117132343A (zh) 产品推荐方法、装置、电子设备、介质和计算机程序产品
CN117312660A (zh) 项目推送方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination