CN115271939A

CN115271939A - 资金链团伙识别方法及装置、计算设备、介质

Info

Publication number: CN115271939A
Application number: CN202210696589.8A
Authority: CN
Inventors: 黄耀波; 张天翼; 王睿祺; 刘智欣; 黄涛
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2022-06-20
Filing date: 2022-06-20
Publication date: 2022-11-01

Abstract

本说明书实施例提供了一种资金链团伙识别方法及装置、计算设备、介质。方法包括：获取预先确定的黑种子；所述黑种子为经过审理认定为有洗钱风险的客户；根据全域交易数据，确定所述黑种子关联的交易链；根据所述黑种子关联的交易链，确定第一资金链；所述第一资金链为所述黑种子关联的资金链；确定所述第一资金链中每一笔交易的风险度，并将所述第一资金链中风险度低于预设风险度的交易剔除，得到第二资金链；根据所述第二资金链，确定所述黑种子所在的资金链团伙。本发明可以提高资金链团伙的识别准确性。

Description

资金链团伙识别方法及装置、计算设备、介质

技术领域

本说明书一个或多个实施例涉及反洗钱技术领域，尤其涉及一种资金链团伙识别方法及装置、计算设备、计算机可读存储介质。

背景技术

常见的可疑交易洗钱行为有多种形式，洗钱者在收到赃款之后，会通过种种资金流转手段来混淆资金来源，使得这些非法所得的款项变成可用状态，这就是我们常说的洗钱行为。上述洗钱类罪有着明确的组织分工，不同角色的客户协作进行非法交易活动，具有影响范围大、危害程度高的特点。

在反洗钱领域，可疑交易发现是风险防控中的重要组成部分。洗钱行为的核心环节是资金的异常流转，如何识别异常交易并得到清晰资金流向的团伙是反洗钱业务的重要诉求。

发明内容

本说明书一个或多个实施例描述了一种资金链团伙识别方法及装置、计算设备、计算机可读存储介质，能够提高资金链团伙的识别准确性。

根据第一方面，提供了一种资金链团伙识别方法，包括：

获取预先确定的黑种子；所述黑种子为经过审理认定为有洗钱风险的客户；

根据全域交易数据，确定所述黑种子关联的交易链；

根据所述黑种子关联的交易链，确定第一资金链；所述第一资金链为所述黑种子关联的资金链；

确定所述第一资金链中每一笔交易的风险度，并将所述第一资金链中风险度低于预设风险度的交易剔除，得到第二资金链；

根据所述第二资金链，确定所述黑种子所在的资金链团伙。

根据第二方面，提供了一种资金链团伙识别装置，包括：

第一获取模块，用于获取预先确定的黑种子；所述黑种子为经过审理认定为有洗钱风险的客户；

第一确定模块，用于根据全域交易数据，确定所述黑种子关联的交易链；

第二确定模块，用于根据所述黑种子关联的交易链，确定第一资金链；所述第一资金链为所述黑种子关联的资金链；

第三确定模块，用于确定所述第一资金链中每一笔交易的风险度，并将所述第一资金链中风险度低于预设风险度的交易剔除，得到第二资金链；

第四确定模块，用于根据所述第二资金链，确定所述黑种子所在的资金链团伙。

根据第三方面，提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面提供的所述的方法。

根据第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面提供的方法。

本说明书实施例提供的资金链团伙识别方法及装置、计算设备、计算机可读存储介质，首先获取经过审理认定为有洗钱风险的黑种子，然后从全域交易数据中确定黑种子关联的交易链，基于黑种子关联的交易链确定第一资金链，去掉第一资金链中风险度较低的交易，得到第二资金链，然后基于第二资金链确定黑种子所在的资金链团伙。可见，本发明实施例提供的方法从黑种子出发，寻找有关的交易链，然后通过该交易链确定对应的资金链，基于黑种子关联的资金链确定黑种子所在的资金链团伙，这种方式几乎不需要运营人力成本。而且在得到的资金链团伙中可以看到清晰的资金流向，即具有较强的资金流向解释能力。针对每一个黑种子都可以识别出对应的资金链团伙，避免资金链团伙的遗漏，具有覆盖全面的优点。由于本发明实施例提供的方法几乎不依赖人工，可以提高识别的准确性，同时，也可以快速的识别出资金链团伙。可见，本发明实施例提供的方法具有节约人力成本、覆盖全面、准确度高、资金流向解释性强、时效高的优点。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本说明书一个实施例中资金链团伙识别方法的流程示意图；

图2是本说明书一个实施例中步骤S400的一种实现方式的流程示意图；

图3是本说明书一个实施例中S800中确定所述第一资金链中每一笔交易的风险度的一种实现方式的流程示意图；

图4是本说明书一个实施例中S820中每一次迭代过程的流程示意图；

图5是本说明书一个实施例中S1000的一种实现方式的流程示意图；

图6是本说明书一个实施例中各条第二资金链的示意图；

图7是本说明书一个实施例中S1040中确定该目标状态对应的各条第二资金链中的最佳资金链的一种实现方式的流程示意图；

图8是本说明书一个实施例中回报矩阵的举例示意图；

图9是本说明书一个实施例中初始的Q矩阵的示意图；

图10是本说明书一个实施例中资金链团伙识别装置的结构框图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

洗钱行为的核心环节是资金的异常流转。如何识别异常交易，并得到具有清晰资金流向的团伙是反洗钱业务的重要诉求。在此之前探索了多种识别资金链团伙的方案，例如，Louvain等团伙发现算法识别类罪团伙。这些方案虽然在国内站点起到了一定的效果，但是识别准确率较低。目前，反洗钱风险的水位控制已经进入攻坚阶段，如何准确、快速的发现风险是非常重要的。

为此，根据第一方面，本说明书实施例提供了一种资金链团伙识别方法，首先，获取预先确定的黑种子；所述黑种子为经过审理认定为有洗钱风险的客户；然后，根据全域交易数据，确定所述黑种子关联的交易链；接着，根据所述黑种子关联的交易链，确定第一资金链；所述第一资金链为所述黑种子关联的资金链；接着，确定所述第一资金链中每一笔交易的风险度，并将所述第一资金链中风险度低于预设风险度的交易剔除，得到第二资金链；最后，根据所述第二资金链，确定所述黑种子所在的资金链团伙。

下面描述以上构思的具体实现方式。

图1是本发明一个实施例中资金链团伙识别方法的流程示意图。可以理解，该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。参见图1，资金链团伙识别方法包括如下步骤S200～S1000：

S200、获取预先确定的黑种子；所述黑种子为经过审理认定为有洗钱风险的客户；

S400、根据全域交易数据，确定所述黑种子关联的交易链；

S600、根据所述黑种子关联的交易链，确定第一资金链；所述第一资金链为所述黑种子关联的资金链；

S800、确定所述第一资金链中每一笔交易的风险度，并将所述第一资金链中风险度低于预设风险度的交易剔除，得到第二资金链；

S1000、根据所述第二资金链，确定所述黑种子所在的资金链团伙。

在图1示出的资金链团伙识别方法，首先获取经过审理认定为有洗钱风险的黑种子，然后从全域交易数据中确定黑种子关联的交易链，基于黑种子关联的交易链确定第一资金链，去掉第一资金链中风险度较低的交易，得到第二资金链，然后基于第二资金链确定黑种子所在的资金链团伙。可见，本发明实施例提供的方法从黑种子出发，寻找有关的交易链，然后通过该交易链确定对应的资金链，基于黑种子关联的资金链确定黑种子所在的资金链团伙，这种方式几乎不需要运营人力成本。而且在得到的资金链团伙中可以看到清晰的资金流向，即具有较强的资金流向解释能力。针对每一个黑种子都可以识别出对应的资金链团伙，避免资金链团伙的遗漏，具有覆盖全面的优点。由于本发明实施例提供的方法几乎不依赖人工，可以提高识别的准确性，同时，也可以快速的识别出资金链团伙。可见，本发明实施例提供的方法具有节约人力成本、覆盖全面、准确度高、资金流向解释性强、时效高的优点。

下面描述图1中各个步骤的执行方式。

可理解的是，所谓的黑种子是经过人工审理或平台审理得到的具有洗钱风险的客户。洗钱行为有多种形式，这些非法交易行为也可以称之为类罪，即类罪是指具有洗钱性质的非法交易行为。

其中，交易平台一般都会通过平台程序或者人工对交易客户进行监督、审理，经过一段时间的监督、审理工作后发现某些客户具有洗钱风险，因此将这些客户进行相关的审理标记，例如，某个客户进行了非法集资交易，则为这个客户打上非法集资的审理标记。在S200中，可以从交易平台中获取具有相关审理标记的客户作为黑种子。

S400、根据全域交易数据，确定所述黑种子关联的交易链；

其中，全域交易数据是指所有的交易数据，从所有的交易数据中获取黑种子关联的交易链，可以避免遗漏。当然由于全域交易数据非常庞大，因此可以选择一段时间内的交易数据。

其中，黑种子关联的交易链是指与黑种子具有上下游交易关系的一笔或者多笔交易形成的链条。

在具体实施时，参见图2，上述S400可以包括如下步骤S420～S460：

S420、从所述全域交易数据中提取出最近预设时间段内的交易数据；

举例来说，可以全域交易数据中提取出最近一个月内的交易数据、最近 90天内的交易数据。

其中，全域交易数据为国内站点的所有交易数据。交易数据存储在数据库中，因此可以从数据库所存储的所有交易数据中提取出最近预设时间段内的交易数据。

S440、将所述最近预设时间段内的交易数据转化为对应的交易图谱；其中，所述交易图谱中的节点为客户，节点之间的边为具有交易关系的客户之间的交易信息，所述交易信息中包括交易金额；

其中，各条交易数据是以表格的形式存在，为了更加直观、方便的进行后续的操作，将表格转化为交易图谱。在交易图谱中包含很多的节点和边，节点表示客户，而两个客户之间的边表示两个客户之间的交易信息，例如，交易时间、交易金额，而且边是有方向的，该方向是依据资金的流向而决定的，例如，在一笔交易中，交易金额是从客户A到客户B，则边的方向是从客户A对应的节点指向客户B对应的节点。

S460、对所述交易图谱中与所述黑种子有关的交易资金的流转进行追踪，得到所述黑种子关联的交易链。

具体的，可以从交易图谱中找到黑种子对应的节点，然后根据黑种子对应的节点与其它节点之间的交易关系，确定与黑种子的上、下游节点，上游节点的上游节点、下游节点的下游节点，直到到达最后的下游节点和最开始的上游节点。黑种子以及各个上下游节点形成了黑种子关联的交易链。

在具体实施时，在执行S460之前，方法还可以包括：根据预设筛选策略从所述交易图谱中筛选出具有洗钱风险的交易链；所述预设筛选策略为根据洗钱行为的交易特征所确定。对应的，S460可以具体包括：对具有洗钱风险的交易链中与所述黑种子有关的交易资金的流转进行追踪，得到所述黑种子关联的交易链。

基于反洗钱运营总结出的审理经验，发现具有洗钱风险的交易一般都具有以下三个交易特征：①流转金额高：单个客户的平均每笔的交易金额较大，并且在相对较短的时间内流入流出金额接近。②流转速度快：因资金具有时间成本，多数的洗钱交易的流入流出时间间隔在3小时以内，资金停留在账户的时间很短。③流转模式异常：洗钱交易的资金链路大多在两跳以上，且为多个客户之间的资金交互。

基于以上三个交易特征可以确定出预设筛选策略：流转金额高于一定金额、流入流出时间间隔在一定时间以内以及资金链路在两跳以上。基于这样的预设筛选策略从所述交易图谱中筛选出具有洗钱风险的交易链。然后在步骤S460中可以对具有洗钱风险的交易链中与所述黑种子有关的交易资金的流转进行追踪，得到所述黑种子关联的交易链，这样可以进一步精准确定与黑种子有关的异常交易链。

通过上述步骤S420～S460可以方便、快速的找到黑种子关联的交易链。

其中，在交易链中可能存在多笔交易的双方客户相同的情况，因为黑种子关联的交易链是根据一段时间的交易数据确定的，在这段时间内客户双方可能进行了多次交易，这样就产生了多笔交易。例如，在某天的交易数据中的一笔交易的客户双方分别是A和B，客户A向客户B转账200万人民币。在另一天的交易数据中也有一笔交易的客户双方分别是A和B，客户B向客户A转账300万人民币。此时可以将这两笔交易汇总为一笔交易，因为交易方向不同，汇总资金为100万人民币，交易方向为客户B指向客户A。即，将两笔交易的资金汇总，汇总后交易的方向由汇总后的资金流向决定。

在具体实施时，S600可以具体包括：在所述黑种子关联的交易链中，将交易双方的客户均相同的各笔交易的交易资金进行汇总，得到所述第一资金链。

举例来说，针对3天内的交易链分别为：

第一天：黑种子A关联的交易链为A-B-C-D；

第二天：黑种子A关联的交易链为A-B-C；

第三天：黑种子A关联的交易链为A-B；

将第一天、第二天、第三天中的交易A-B的资金进行汇总，得到客户双方为A和B的汇总资金；将第一天、第二天中的交易B-C的资金进行汇总，得到客户双方为B和C的汇总资金。在汇总完成后，得到资金链A-B-C-D，在该资金链中，A和B之间的资金为第一天、第二天、第三天中的交易A-B 的资金的汇总；资金链中的B和C之间的资金为第一天、第二天中的交易 B-C的资金的汇总。

可见，通过以上方式可以得到上述第一资金链。

在该步骤中，将第一资金链中风险度较低的交易剔除，仅保留风险度较高的交易，便得到第二资金链。在第二资金链中，因为低风险的交易已经剔除，因此资金链团伙的范围进一步缩小。

在具体实施时，可以采用多种方式确定第一资金链中各笔交易的风险度，这里提供一种可选的方式：采用有向边注意力的双表征模型确定所述第一资金链中每一笔交易的风险度；所述有向边注意力的双表征模型为基于邻域节点信息和邻域边信息对节点产生的影响而进行机器学习所得到的网络模型。

即，有向边注意力的双表征模型考虑到了邻域节点和邻域边对节点的影响，并通过机器学习的方式进行训练得到的一个神经网络模型。

可理解的是，在风控场景中，交易之间往往存在一定的联系，比如传递关系网络、设备关系网络、区域关系网络等，如果可以利用这些图拓扑信息来生成特征表示数据，这会给风控场景带来额外的好处。而且，通过学习图结构表示的方式自动生成这些特征，可以避免人工设计的繁琐，可以挖掘出比人工更高级的数据隐藏层信息。目前为止，不论是基于随机游走的图表征模型还是以图卷积网络和图形神经网络为代表的图神经网络，大多都是对无向图进行建模分析，或者简单地把无向图的方法搬运到有向图上，这样会损失方向性的信息。然而实际生活中大部分图都是有向图，比如社交网络的关注关系、论文的引用关系等，尤其在风控场景中，方向性显得尤为重要，例如受害者向诈骗分子转账这条边，我们会标记为欺诈交易，而反向的转账则不属于欺诈交易，如诈骗分子的日常生活向商户转账等。另一方面，风控平台所面对的通常都是亿级/十亿级/百亿级边数量的安全风控场景。在这些场景中，按有向图方式组织数据比按无向图方式组织数据可减少50％的数据量，对于加快复杂图特征的提取表征和模型打分都具有不可忽视的工程价值。

因此，在资金链团伙的识别方案中，以复杂图上的有向性作为切入口，研究针对有向图的注意力机制，阐述在实际应用中图的方向性的重要性，进而提出了本发明实施例中的有向边注意力的双表征模型，可以简称为 DADEdge模型。

其中，有向边注意力的双表征模型旨在通过独立计算进出两部分领域节点信息和进出两部分领域边信息来刻画由不同方向性所带来的信息差异。即涉及到两方面的信息：一部分是领域节点信息汇聚的双表征信息，另一部分是领域边信息汇聚的双表征信息。

针对第一资金链中的节点，可能只是源节点，也可能只是目标节点，也可能既是源节点也是目标节点。即，针对第一资金链中的每一个节点，可能在一个或多个分支中作为目标节点，同时也可能在另一个或多个分支中作为源节点。为了更好的区分两个方向上的表征向量，采用双表征的方式来表示一个节点。例如，节点i作为源节点时表征向量为si，节点i作为目标节点时表征向量为ti。当节点i作为目标节点时，节点i的目标表征向量ti为来自各个邻域节点的源表征向量sj的邻域聚合。当节点i作为源节点时，节点i的源表征向量si为来自各个邻域节点的目标表征tj的邻域聚合。最后经过邻域聚合更新后的两部分表征向量组成节点新的双表征向量。

参见图3，对S800中确定所述第一资金链中每一笔交易的风险度的过程可以包括如下步骤S820～S840：

S820、根据邻域节点信息和邻域边信息，确定所述第一资金链中每一个目标节点和每一个源节点的表征向量；在所述第一资金链的一笔交易中，交易方向为从源节点指向目标节点；

S840、根据各个目标节点和各个源节点的表征向量，确定所述黑种子关联的交易链中每一笔交易的风险度。

在上述步骤S820中，一个节点的邻域节点是指与该节点具有交易关系的节点，例如，节点A与节点B、节点C、节点D具有交易关系，因此节点 B、节点C、节点D均为节点A的邻域节点。而节点A和节点B之间的边、节点A和节点C之间的边、节点A和节点C之间的边、节点A和节点D之间的边均为节点A的邻域边。可见一个节点的邻域节点信息是指与该节点具有交易关系的节点的相关信息，例如，节点的表征向量。一个节点的邻域边信息是指该节点与各个邻域节点之间的边的相关信息，例如，边的表征向量。

在S820中，基于一个节点的邻域节点信息和邻域边信息，对这个节点进行表征。当这个节点仅是一个源节点时，该节点的表征向量为源节点表征向量。当一个节点仅是一个目标节点时，该节点的表征向量为目标节点向量。当一个节点既是一个源节点，也是一个目标节点时，当该节点作为源节点时具有一个对应的源表征向量，当该节点作为目标节点时具有一个对应的目标节点表征向量，即该节点的表征向量包括源节点表征向量和目标节点表征向量，在此情况下为双表征。

可理解的是，在本发明实施例中，在一笔交易中，交易的方向是从源节点指向目标节点，以此来区分目标节点和源节点。

可理解的是，通过步骤S820可以实现对每一个节点的表征，即得到每一个节点的表征向量，进而根据第一资金链中各个节点的表征向量确定各笔交易的风险度。具体可以将各个节点的表征向量作为神经网络模型的输入信息，即在将各个节点的表征向量输入到神经网络模型中后，便可以得到各笔交易的风险度。在该过程中，神经网络模型利用各个节点的表征向量实现了风险度的多分类，例如，将风险度分为了11类：0、0.1、0.2、0.3、0.4、0.5、 0.6、0.7、0.8、0.9、1.0。

可见，有向边注意力的双表征模型分为两部分结构：一部分结构用于对各个节点进行向量表征，另一部分结构用于根据各个节点的表征向量输出各笔交易的风险度，即上文中的神经网络模型。

其中，用于输出风险度的神经网络模型可以提前利用具有风险标签的交易样本中的各个节点转化为表征向量之后进行模型训练得到，所述风险标签包括类罪审理标签和/或处罚标签。处罚标签，例如，资产冻结标签等，不同的标签对应不同的风险度。

在具体实施时，S820可以包括：采用多次迭代过程对每一个目标节点和每一个源节点的表征向量进行更新。经过多次迭代之后，得到了每一个目标节点和每一个源节点最终的表征向量，进而将这些表征向量输入到上文中的神经网络模型中，便可以得到第一资金链中各笔交易的风险度。

其中，参见图4，每一次迭代过程包括如下步骤S822～S836：

S822、确定每一个目标节点和每一个源节点在本次迭代过程中的初始表征向量；

在第一次迭代过程中，可以根据一个节点自身的特征信息来确定该节点的初始表征信息。例如，客户名称、交易时间、交易进出的金额等。将这些特征信息转化为初始表征向量，实现对一个节点的初始表征。例如，针对一个目标节点，将这个目标节点的名称、进入该节点的交易金额、涉及到的交易时间等。

在非第一次迭代过程中，目标节点的初始表征向量为这个目标节点在上一次迭代过程中的最终表征向量，源节点的初始表征向量为这个源节点上一次迭代过程中的最终表征向量。

当然，在执行如下步骤S824之前，还可以对初始表征向量进行线性变换，例如，设置目标表征向量对应的线性变换矩阵为W，源表征向量对应的线性变换矩阵为U，利用线性变换矩阵对表征向量进行线性变换处理。其中，线性变换矩阵可以为全连接层矩阵。下文中的U^(l)、W^(l)为在第l次迭代过程中的变换矩阵。

例如，在第l次迭代过程中，针对源节点：

针对目标节点：

其中，

为对初始表征向量

进行线性变换后的表征向量。

为对初始表征向量

进行线性变换后的表征向量，i、j为节点的编号，l为迭代次数。

可理解的是，通过线性变换的方式，可以挖掘出向量中隐藏的信息，使得表征向量更好的对节点进行表征。若对初始表征向量进行线性变换的话，在执行S824和S826时采用的是对初始表征向量进行线性变换之后的表征向量。

S824、针对每一个目标节点，根据该目标节点关联的各个源节点的初始表征向量和该目标节点的初始表征向量，计算邻域节点对该目标节点的注意力矩阵；

这里，将每一个目标节点作为一个中心节点来分析，中心节点需要进出两部分的邻域节点信息来分别更新节点的目标表征向量和源表征向量。

当中心节点作为目标节点时，可以根据该目标节点关联的各个源节点的初始表征向量和该目标节点的初始表征向量，计算注意力矩阵。

当然，也可以根据该目标节点关联的各个源节点经过线性变换后的表征向量和该目标节点经过线性变换后的表征向量，计算注意力矩阵

例如，

可以采用如下方式表示：

其中，τ(i)表示目标节点i关联的各个源节点形成的集合，

为注意力参数，W^(l)为在第l次迭代过程中的一个变换矩阵，

为目标节点i在第l次迭代过程中的初始表征向量，U^(l)为在第l次迭代过程中的另一个变换矩阵，

行线性变换后的表征向量。

S826、针对每一个源节点，根据该源节点关联的各个目标节点的初始表征向量和该源节点的初始表征向量，计算邻域节点对该源节点的注意力矩阵；

当中心节点作为源节点时，可以根据源节点关联的各个目标节点的初始表征向量和该源节点对应的初始表征向量，来计算注意力矩阵。

当然，也可以根据该源节点关联的各个目标节点经过线性变换后的表征向量和该源节点经过线性变换后的表征向量，来计算注意力矩阵

例如， f_i ^(l)可以采用如下方式表示：

其中，S(i)表示源节点i关联的各个目标节点形成的集合，

为注意力参数，W^(l)为在第l次迭代过程中的一个变换矩阵，U^(l)为在第l次迭代过程中的另一个变换矩阵，

为在第l次迭代过程中源节点i的初始表征向量，

为源节点i关联的目标节点j在第l次迭代过程中的初始表征向量，

为对初始表征向量

进行线性变换后的表征向量，

为对初始表征向量

进行线性变换后的表征向量。

在实际中，在两个分支上得到注意力矩阵后，还可以利用softmax函数对两个分支的注意力矩阵分别进行归一化处理，得到归一化的注意力矩阵：

可理解的是，以上注意力矩阵考虑了邻域节点信息，即注意力矩阵体现了邻域节点对中心节点的影响。

S828、确定所述目标节点连接的每一个边的初始表征向量和每一个源节点连接的每一个边的初始表征向量；

可理解的是，边注意力机制的主要思想是将与中心节点相连的边也看成相对中心节点的一个信息来源，通过注意力机制计算中心节点对邻域边的注意力，最后加权聚合到中心节点上。在有向图上，每个中心节点的入边和出边分别在两个分支上计算注意力。这一点也是比较符合实际物理意义的，比如客户A向客户B转账，这条交易的特征对源节点A和目标节点B的影响是不同的。在欺诈场景中，若这条交易标记为欺诈，则收款方B很容易通过这条交易的异常信息被识别为诈骗分子，而如果交易的异常信息同样作用到A上，则受害者A会被误分类，因此需要分方向进行边注意力的计算。

可理解的是，边的初始表征向量可以根据这个边的双方客户、交易时间、交易金额等信息转化为表征向量，实现对一个边的初始表征。由于初始边属性只在一个空间，我们通过两个不同变换将其映射到两个空间，一个空间中的边表征向量用来更新中心节点的目标表征向量，另一个空间中的边表征向量用来更新中心节点的源表征向量。例如，针对节点i和节点j之间的边作用在源节点上时对应的初始表征向量表示为

该初始表征向量也可以称为源节点连接的边的初始表征向量。节点i和节点j之间的边作用在目标节点上时对应的初始表征向量表示为

该初始表征向量也可以称为目标节点连接的边的初始表征向量。

当然，在执行下文中的步骤之前，还可以线性变换，具体可以利用线性变换矩阵来实现线性变换。例如，在第l次迭代过程中，对边的初始表征向量进行线性变换。针对作用在源节点上的边的初始表征向量的线性变换表示为：

变换矩阵。

S830、针对每一个目标节点，根据该目标节点连接的各个边的初始表征向量和该目标节点的初始表征向量，计算邻域边对该目标节点的注意力矩阵；

当一个节点作为目标节点时，可以利用目标节点连接的各个边的初始表征向量和该目标节点的初始表征向量，计算注意力矩阵。

当然，也可以利用目标节点连接的各个边经过线性变换后的表征向量和该目标节点经过线性变换后的表征向量，计算注意力矩阵r_i ^(l)。注意力矩阵 r_i ^(l)可以表示为：

其中，

为节点i和节点j之间的注意力向量，

为注意力参数，W^(l)为在第l次迭代过程中的一个变换矩阵，T为倒置符号，

为目标节点i在第l次迭代过程中的初始表征向量，P^(l)为第l次迭代过程中的一个变换矩阵，

为在第l次迭代过程中节点i和节点j之间的边作用在目标节点上时对应的初始表征向量，

为对对应的初始表征向量t^(l)进行线性变换后的表征向量，

为对节点i和j之间的边的初始表征向量进行线性变换的表征向量。

S832、针对每一个源节点，根据该源节点连接的各个边的初始表征向量和该源节点的初始表征向量，计算邻域边对该源节点的注意力矩阵；

当一个节点作为源节点时，可以利用源节点连接的各个边的初始表征向量和该源节点的初始表征向量，计算注意力矩阵。

当然，也可以利用源节点连接的各个边经过线性变换后的表征向量和该源节点经过线性变换后的表征向量，计算注意力矩阵

注意力矩阵

中节点i和节点j之间的注意力向量

可以表示为：

其中，

为注意力参数，U^(l)为在第l次迭代过程中的一个变换矩阵，

为在第l次迭代过程中源节点i的初始表征向量，Q^(l)为第l次迭代过程中的一

行线性变换后的表征向量。

可理解的是，边注意力和节点注意力采用不同参数是因为边特征虽然已经映射到和节点特征的维度一致，但实际向量空间中边表征和节点表征可能相距甚远，故对边用独立的注意力参数。

在实际中，在计算得到两个分支上的注意力矩阵之后，还可以利用 softmax函数对两个分支的注意力矩阵分别进行归一化处理，得到归一化的注意力矩阵：

可理解的是，这两个注意力矩阵考虑了邻域边信息，即注意力矩阵体现了邻域边对中心节点的影响。

S834、针对每一个目标节点，根据邻域节点对该目标节点的注意力矩阵和邻域边对该目标节点的注意力矩阵，确定该目标节点在本次迭代过程中的最终表征向量；

可理解的是，针对一个目标节点，通过上述步骤计算得到领域节点和邻域边分别对该目标节点的注意力矩阵后，便可以利用这两个注意力矩阵计算该目标节点在本次迭代过程中的最终表征向量。考虑邻域节点信息聚合和邻域边信息聚合的目标节点的表征向量更新为：

其中，

实际上是注意力矩阵

和注意力矩阵r_i ^(l)的和，

即上文中的注意力参数

即上文中的

σ为函数为激活函数。

S836、针对每一个源节点，根据邻域节点对该源节点的注意力矩阵和邻域边对该源节点的注意力矩阵，确定该源节点在本次迭代过程中的最终表征向量。

可理解的是，针对一个源节点，通过上述步骤计算得到领域节点和邻域边分别对该源节点的注意力矩阵后，便可以利用这两个注意力矩阵计算该源节点在本次迭代过程中的最终表征向量。考虑邻域节点信息聚合和邻域边信息聚合的源节点的表征向量更新为：

其中，

实际上是注意力矩阵

和注意力矩阵

的和，

即上文中的注意力参数

即上文中的

σ 为函数为激活函数。

在得到每一个节点在本次迭代过程中的最终表征向量后，如果还需要进行下一次迭代过程，则将节点在本次迭代过程中的最终表征向量作为下一个迭代过程中该节点的初始表征向量。如果本次迭代过程为最后一次迭代过程，则经过本次迭代过程得到的最终表征向量为整个迭代过程中的最终迭代向量。

可理解的是，经过预设次数的迭代过程后，便可以得到每一个目标节点对应的目标表征向量和每一个源节点对应的源表征向量，然后将各个节点对应的目标表征向量、源表征向量输入到神经网络模型中，便可以得到第一资金链中各笔交易的风险度。

具体的，可以设定一个预设风险度作为阈值，将风险度高于该阈值的交易保留下来，将风险度低于该阈值的交易剔除掉，从而得到第二资金链。

可理解的是，在剔除低风险交易时，有可能会出现一个节点与黑种子之间断开连接的情况，此时可以将断开连接的这个节点舍弃，在后续过程中不再考虑这个节点。

也就是说，本发明实施例提供的方法还包括：在将第一资金链中风险度低于预设风险度的交易剔除之后，判断是否存在断开关联的节点，若存在，则将断开关联的节点舍弃。

针对上述第二资金链进行进一步的筛选，得到最终的资金链团伙。在资金链团伙中包括客户、客户之间汇总的交易金额、交易的汇总方向等信息。

在具体实施时，可以采用强化学习算法确定黑种子所在的资金链团伙。具体的，参见图5，S1000具体可以包括如下步骤：

S1020、针对每一个目标状态，判断该目标状态对应的第二资金链的条数是否大于1；各条所述第二资金链的初始状态均为所述黑种子，所述目标状态为各条所述第二资金链中未与所述黑种子相邻连接的节点；

S1040、若是，则确定该目标状态对应的各条第二资金链中的最佳资金链，并保留所述最佳资金链；

S1060、否则，保留该目标状态对应的第二资金链；

S1080、根据针对各个目标状态所保留的第二资金链，确定所述黑种子所在的资金链团伙。

在图6展示的资金链中，节点R为黑种子，以节点R为起点，有5条资金链，分别是：R->A->D->F、R->B->D->F、R->B->E->F、R->E->F、R->C。其中的节点D、E、F未与黑种子直接相连，因此节点D、E、F为目标节点。

针对每一个目标状态，判断该目标状态对应的第二资金链是否大于1。例如，针对节点D，第二资金链为R->A->D、R->B->D，可见具有两条第二资金链，需要从这2条第二资金链中选择出一条作为从节点R到节点D的最佳资金链，所谓的最佳资金链是指总体风险最大的资金链，针对目标状态D，将最佳资金链保留下来，其它的第二资金链剔除。同样针对节点E也有两条对应的第二资金链：R->B->E、R->E，也需要从这两条中筛选出最佳资金链。针对目标状态E，将最佳资金链保留下来，将其它的第二资金链剔除。针对节点F，一共有四条第二资金链：R->A->D->F、R->B->D->F、R->B->E->F、 R->E->F，也需要从这四条中筛选出一条最佳资金链。针对目标状态F，将最佳资金链保留下来，将其它的第二资金链剔除。最后，将针对各个目标状态所保留下来的第二资金链形成黑种子所在的资金链团伙。

在实际上也可能存在仅有两个节点的资金链，例如图6中的R->C，虽然这条第二资金链比较短，但是这条第二资金链的交易风险度是比较高的，因为经过了上文中将低风险的交易进行剔除的步骤，保留下来的都是风险比较高的交易，对于这样的比较短的第二资金链也是不能忽视的。

基于以上考虑，上述S1080可以具体包括如下步骤：

判断各条第二资金链中是否存在仅由两个节点形成的第二资金链；所述两个节点中包括所述黑种子；若是，则根据针对各个目标状态所保留的第二资金链和仅由两个节点形成的第二资金链，确定所述黑种子所在的资金链团伙；否则，根据针对各个目标状态所保留的第二资金链，确定所述黑种子所在的资金链团伙。

也就是说，如果不存在仅有两个节点组成的第二资金链，例如图6中的 R->C，则直接将针对各个目标状态所保留下来的第二资金链形成黑种子所在的资金链团伙。而如果存在仅有两个节点组成的第二资金链，则将针对各个目标状态所保留下来的第二资金链以及仅由两个节点形成的第二资金链形成黑种子所在的资金链团伙。通过这种方式，可以避免资金链的遗漏。

在具体实施时，可以采用Q-Learning强化学习的算法进行最佳资金链的选择。参见图7，S1040中确定该目标状态对应的各条第二资金链中的最佳资金链的过程可以具体包括如下步骤S1042～S1046：

S1042、根据各条所述第二资金链中各笔交易的风险度，构建回报矩阵；

其中，各笔交易的风险度可以从上文的步骤S800中得到。基于这些风险度可以构建如图8示出的回报矩阵，回报矩阵也可以称为Reward矩阵，简称为R矩阵。在图8示出的R矩阵的状态STATE表示当前的节点，ACTION 表示下一步动作的节点。针对图6示出的5条资金链以及5条资金链中各笔交易的风险度，形成了图8示出的R矩阵。如果两个节点之间没有关联，则相应位置用-1填充。例如，在图8中，当前状态对应的一个节点为节点R，下一个动作对应的节点为节点C，从节点R到节点C的交易的风险度为0.9，因此在状态STATE为R且下一步动作ACTION为C的相应位置用0.9填充。

也就是说，R矩阵中，行名表示当前的状态STATE，列名表示当前状态下可用的动作ACTION，具体到资金链路R->A->D->F，风险度分别为0.6、 0.7、0.8。对于不存在的交易，R矩阵的元素统一标记为-1。

S1044、针对该目标状态，构建初始的Q矩阵，并根据所述回报矩阵对所述Q矩阵进行迭代更新，直到所述Q矩阵满足收敛条件；

在本步骤中构建初始的Q矩阵，用来表从经验中学到的知识，Q矩阵可以理解为知识矩阵。矩阵Q与R矩阵同阶，其行表示状态，列表示动作。在刚开始时代理对外界一无所知，因此Q矩阵初始化为零矩阵。例如，参见图 9示出的初始Q矩阵。

针对图6中示出的目标状态D，有两条第二资金链：R->A->D、R->B->D。利用这两条第二资金链中各笔交易的风险度对目标状态D对应的Q矩阵进行更新。由于这两条第二资金链中的各笔交易的风险度已经体现在上述回报矩阵中，因此也可以理解为依据上述回报矩阵对Q矩阵进行更新。

具体的，采用如下规则对Q矩阵进行迭代更新：

Q(s,a)＝R(s,a)+γmax{Q(s′,a′)}

其中s、a表示当前的状态和动作，s′,a′表示下一个状态和动作，折扣系数γ∈[0,1]。Q(s,a)为当前的状态s和动作a对应的Q值。R(s,a)为当前的状态s和动作a对应的R值，即风险度，可以从回报矩阵中查找到。

首先，令折扣系数γ＝0.8，初始状态为R，目标状态为D，初始的Q矩阵为全零矩阵。观察矩阵R的第1行，对应节点R，下一步的状态有4个可能的动作：节点A、B、C或E。

针对第二资金链R->A->D，下一步动作为A，R(R,A)为0.6，节点A的下一步动作为D，R(A,D)为0.7。Q(A,D)＝R(A,D)＝0.7，Q(R,A)＝R(R,A)+ 0.8×max{Q(A,D)}＝0.6+0.8×0.7＝1.16，至此完成Q矩阵的一次更新。同样，针对第二资金链：R->B->D，也采用上述方式进行一次更新。可理解的是，在针对一个目标状态对应的Q矩阵，依据该目标状态对应的所有第二资金链完成对Q矩阵的一次更新，即一次迭代。通过这种方式进行多次迭代，直到Q矩阵在前后两个迭代过程之间的变化很小，符合收敛条件，则停止迭代。

S1046、在满足所述收敛条件的Q矩阵中选择出最大值，并将所述最大值所对应的第二资金链作为该目标状态对应的各条第二资金链中的最佳资金链。

在对一个目标状态对应的Q矩阵，在停止迭代之后，便可以从中选择出最佳资金链，具体的选择方式是：从一个目标状态的Q矩阵的各个元素中选择出最大值，将该最大值元素所在的第二资金链作为该目标状态对应的最佳资金链。

可理解的是，本发明实施例提供的方法的识别准确率高达90％以上，且具有较高的时效性和可解释性，能够加强反洗钱风险防控的能力，提升运营审理上报的时效，具有重大的业务价值，能够节省运营审理人力，对于反洗钱智审提效具有重大意义。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

根据第二方面，本发明实施例提供一种资金链团伙识别装置。参见图10，该装置包括：

第一获取模块200，用于获取预先确定的黑种子；所述黑种子为经过审理认定为有洗钱风险的客户；

第一确定模块400，用于根据全域交易数据，确定所述黑种子关联的交易链；

第二确定模块600，用于根据所述黑种子关联的交易链，确定第一资金链；所述第一资金链为所述黑种子关联的资金链；

第三确定模块800，用于确定所述第一资金链中每一笔交易的风险度，并将所述第一资金链中风险度低于预设风险度的交易剔除，得到第二资金链；

第四确定模块1000，用于根据所述第二资金链，确定所述黑种子所在的资金链团伙。

在一个实施例中，第一确定模块包括：

第一提取单元，用于从所述全域交易数据中提取出最近预设时间段内的交易数据；

数据转化单元，用于将所述最近预设时间段内的交易数据转化为对应的交易图谱；其中，所述交易图谱中的节点为客户，节点之间的边为具有交易关系的客户之间的交易信息，所述交易信息中包括交易金额；

交易追踪单元，用于对所述交易图谱中与所述黑种子有关的交易资金的流转进行追踪，得到所述黑种子关联的交易链。

在一个实施例中，第二确定模块具体用于：在所述黑种子关联的交易链中，将交易双方的客户均相同的各笔交易的交易资金进行汇总，得到所述第一资金链。

在一个实施例中，第三确定模块具体用于：采用有向边注意力的双表征模型确定所述第一资金链中每一笔交易的风险度；所述有向边注意力的双表征模型为基于邻域节点信息和邻域边信息对节点产生的影响而进行机器学习所得到的网络模型。

进一步的，第三确定模块包括：

节点表征单元，用于根据邻域节点信息和邻域边信息，确定所述第一资金链中每一个目标节点和每一个源节点的表征向量；在所述第一资金链的一笔交易中，交易方向为从源节点指向目标节点；

风险确定单元，用于根据各个目标节点和各个源节点的表征向量，确定所述黑种子关联的交易链中每一笔交易的风险度。

更进一步的，节点表征单元具体用于：采用多次迭代过程对每一个目标节点和每一个源节点的表征向量进行更新，每一次迭代过程包括：确定每一个目标节点和每一个源节点在本次迭代过程中的初始表征向量；针对每一个目标节点，根据该目标节点关联的各个源节点的初始表征向量和该目标节点的初始表征向量，计算邻域节点对该目标节点的注意力矩阵；针对每一个源节点，根据该源节点关联的各个目标节点的初始表征向量和该源节点的初始表征向量，计算邻域节点对该源节点的注意力矩阵；确定所述目标节点连接的每一个边的初始表征向量和每一个源节点连接的每一个边的初始表征向量；针对每一个目标节点，根据该目标节点连接的各个边的初始表征向量和该目标节点的初始表征向量，计算邻域边对该目标节点的注意力矩阵；针对每一个源节点，根据该源节点连接的各个边的初始表征向量和该源节点的初始表征向量，计算邻域边对该源节点的注意力矩阵；针对每一个目标节点，根据邻域节点对该目标节点的注意力矩阵和邻域边对该目标节点的注意力矩阵，确定该目标节点在本次迭代过程中的最终表征向量；针对每一个源节点，根据邻域节点对该源节点的注意力矩阵和邻域边对该源节点的注意力矩阵，确定该源节点在本次迭代过程中的最终表征向量。

在一个实施例中，第四确定模块包括：

第一判断单元，用于：针对每一个目标状态，判断该目标状态对应的第二资金链的条数是否大于1；各条所述第二资金链的初始状态均为所述黑种子，所述目标状态为各条所述第二资金链中未与所述黑种子相邻连接的节点；

第一保留单元，用于若该目标状态对应的第二资金链的条数大于1，则确定该目标状态对应的各条第二资金链中的最佳资金链，并保留所述最佳资金链；

第二保留单元，用于若该目标状态对应的第二资金链的条数等于1，则保留该目标状态对应的第二资金链；

团伙确定单元，用于根据针对各个目标状态所保留的第二资金链，确定所述黑种子所在的资金链团伙。

进一步的，团伙确定单元包括：

第一判断子单元，用于：判断各条第二资金链中是否存在仅由两个节点形成的第二资金链；所述两个节点中包括所述黑种子；

第一确定子单元，用于：若存在仅由两个节点形成的第二资金链，则根据针对各个目标状态所保留的第二资金链和仅由两个节点形成的第二资金链，确定所述黑种子所在的资金链团伙；

第二确定子单元，用于：若不存在仅由两个节点形成的第二资金链，则根据针对各个目标状态所保留的第二资金链，确定所述黑种子所在的资金链团伙。

进一步的，第一保留单元包括：

矩阵构建子单元，用于：根据各条所述第二资金链中各笔交易的风险度，构建回报矩阵；

矩阵更新子单元，用于：针对该目标状态，构建初始的Q矩阵，并根据所述回报矩阵对所述Q矩阵进行迭代更新，直到所述Q矩阵满足收敛条件；

资金链筛选子单元，用于在满足所述收敛条件的Q矩阵中选择出最大值，并将所述最大值所对应的第二资金链作为该目标状态对应的各条第二资金链中的最佳资金链。

根据第三方面，本说明书一个实施例提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行说明书中任一个实施例中的方法。

根据第四方面，本说明书一个实施例提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现执行说明书中任一个实施例中的方法。

可以理解的是，本说明书实施例示意的结构并不构成对本说明书实施例的装置的具体限定。在说明书的另一些实施例中，上述装置可以包括比图示更多或者更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。

上述装置、系统内的各模块之间的信息交互、执行过程等内容，由于与本说明书方法实施例基于同一构思，具体内容可参见本说明书方法实施例中的叙述，此处不再赘述。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、挂件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种资金链团伙识别方法，包括：

根据全域交易数据，确定所述黑种子关联的交易链；

根据所述第二资金链，确定所述黑种子所在的资金链团伙。

2.根据权利要求1所述的方法，其中，所述根据全域交易数据，确定所述黑种子关联的交易链，包括：

从所述全域交易数据中提取出最近预设时间段内的交易数据；

将所述最近预设时间段内的交易数据转化为对应的交易图谱；其中，所述交易图谱中的节点为客户，节点之间的边为具有交易关系的客户之间的交易信息，所述交易信息中包括交易金额；

对所述交易图谱中与所述黑种子有关的交易资金的流转进行追踪，得到所述黑种子关联的交易链。

3.根据权利要求1所述的方法，其中，所述根据所述黑种子关联的交易链，确定第一资金链，包括：

在所述黑种子关联的交易链中，将交易双方的客户均相同的各笔交易的交易资金进行汇总，得到所述第一资金链。

4.根据权利要求1所述的方法，其中，所述确定所述第一资金链中每一笔交易的风险度，包括：

采用有向边注意力的双表征模型确定所述第一资金链中每一笔交易的风险度；所述有向边注意力的双表征模型为基于邻域节点信息和邻域边信息对节点产生的影响而进行机器学习所得到的网络模型。

5.根据权利要求4所述的方法，其中，所述采用有向边注意力的双表征模型确定所述第一资金链中每一笔交易的风险度，包括：

根据邻域节点信息和邻域边信息，确定所述第一资金链中每一个目标节点和每一个源节点的表征向量；在所述第一资金链的一笔交易中，交易方向为从源节点指向目标节点；

根据各个目标节点和各个源节点的表征向量，确定所述黑种子关联的交易链中每一笔交易的风险度。

6.根据权利要求5所述的方法，其中，所述根据邻域节点信息和邻域边信息，确定所述第一资金链中每一个目标节点和每一个源节点的表征向量，包括：采用多次迭代过程对每一个目标节点和每一个源节点的表征向量进行更新，每一次迭代过程包括：

确定每一个目标节点和每一个源节点在本次迭代过程中的初始表征向量；

针对每一个目标节点，根据该目标节点关联的各个源节点的初始表征向量和该目标节点的初始表征向量，计算邻域节点对该目标节点的注意力矩阵；

针对每一个源节点，根据该源节点关联的各个目标节点的初始表征向量和该源节点的初始表征向量，计算邻域节点对该源节点的注意力矩阵；

确定所述目标节点连接的每一个边的初始表征向量和每一个源节点连接的每一个边的初始表征向量；

针对每一个目标节点，根据该目标节点连接的各个边的初始表征向量和该目标节点的初始表征向量，计算邻域边对该目标节点的注意力矩阵；

针对每一个源节点，根据该源节点连接的各个边的初始表征向量和该源节点的初始表征向量，计算邻域边对该源节点的注意力矩阵；

针对每一个目标节点，根据邻域节点对该目标节点的注意力矩阵和邻域边对该目标节点的注意力矩阵，确定该目标节点在本次迭代过程中的最终表征向量；

针对每一个源节点，根据邻域节点对该源节点的注意力矩阵和邻域边对该源节点的注意力矩阵，确定该源节点在本次迭代过程中的最终表征向量。

7.根据权利要求1所述的方法，其中，所述根据所述第二资金链，确定所述黑种子所在的资金链团伙，包括：

针对每一个目标状态，判断该目标状态对应的第二资金链的条数是否大于1；各条所述第二资金链的初始状态均为所述黑种子，所述目标状态为各条所述第二资金链中未与所述黑种子相邻连接的节点；

若是，则确定该目标状态对应的各条第二资金链中的最佳资金链，并保留所述最佳资金链；

否则，保留该目标状态对应的第二资金链；

根据针对各个目标状态所保留的第二资金链，确定所述黑种子所在的资金链团伙。

8.根据权利要求7所述的方法，其中，所述根据针对各个目标状态所保留的第二资金链，确定所述黑种子所在的资金链团伙，包括：

判断各条第二资金链中是否存在仅由两个节点形成的第二资金链；所述两个节点中包括所述黑种子；

若是，则根据针对各个目标状态所保留的第二资金链和仅由两个节点形成的第二资金链，确定所述黑种子所在的资金链团伙；

否则，根据针对各个目标状态所保留的第二资金链，确定所述黑种子所在的资金链团伙。

9.根据权利要求7所述的方法，其特征在于，所述确定该目标状态对应的各条第二资金链中的最佳资金链，包括：

根据各条所述第二资金链中各笔交易的风险度，构建回报矩阵；

针对该目标状态，构建初始的Q矩阵，并根据所述回报矩阵对所述Q矩阵进行迭代更新，直到所述Q矩阵满足收敛条件；

在满足所述收敛条件的Q矩阵中选择出最大值，并将所述最大值所对应的第二资金链作为该目标状态对应的各条第二资金链中的最佳资金链。

10.一种资金链团伙识别装置，包括：

11.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-9中任一项所述的方法。

12.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-9中任一项所述的方法。