CN115271939A - 资金链团伙识别方法及装置、计算设备、介质 - Google Patents

资金链团伙识别方法及装置、计算设备、介质 Download PDF

Info

Publication number
CN115271939A
CN115271939A CN202210696589.8A CN202210696589A CN115271939A CN 115271939 A CN115271939 A CN 115271939A CN 202210696589 A CN202210696589 A CN 202210696589A CN 115271939 A CN115271939 A CN 115271939A
Authority
CN
China
Prior art keywords
chain
fund
node
transaction
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210696589.8A
Other languages
English (en)
Inventor
黄耀波
张天翼
王睿祺
刘智欣
黄涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202210696589.8A priority Critical patent/CN115271939A/zh
Publication of CN115271939A publication Critical patent/CN115271939A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供了一种资金链团伙识别方法及装置、计算设备、介质。方法包括:获取预先确定的黑种子;所述黑种子为经过审理认定为有洗钱风险的客户;根据全域交易数据,确定所述黑种子关联的交易链;根据所述黑种子关联的交易链,确定第一资金链;所述第一资金链为所述黑种子关联的资金链;确定所述第一资金链中每一笔交易的风险度,并将所述第一资金链中风险度低于预设风险度的交易剔除,得到第二资金链;根据所述第二资金链,确定所述黑种子所在的资金链团伙。本发明可以提高资金链团伙的识别准确性。

Description

资金链团伙识别方法及装置、计算设备、介质
技术领域
本说明书一个或多个实施例涉及反洗钱技术领域,尤其涉及一种资金链团 伙识别方法及装置、计算设备、计算机可读存储介质。
背景技术
常见的可疑交易洗钱行为有多种形式,洗钱者在收到赃款之后,会通过种 种资金流转手段来混淆资金来源,使得这些非法所得的款项变成可用状态,这 就是我们常说的洗钱行为。上述洗钱类罪有着明确的组织分工,不同角色的客 户协作进行非法交易活动,具有影响范围大、危害程度高的特点。
在反洗钱领域,可疑交易发现是风险防控中的重要组成部分。洗钱行为的 核心环节是资金的异常流转,如何识别异常交易并得到清晰资金流向的团伙是 反洗钱业务的重要诉求。
发明内容
本说明书一个或多个实施例描述了一种资金链团伙识别方法及装置、计 算设备、计算机可读存储介质,能够提高资金链团伙的识别准确性。
根据第一方面,提供了一种资金链团伙识别方法,包括:
获取预先确定的黑种子;所述黑种子为经过审理认定为有洗钱风险的客 户;
根据全域交易数据,确定所述黑种子关联的交易链;
根据所述黑种子关联的交易链,确定第一资金链;所述第一资金链为所 述黑种子关联的资金链;
确定所述第一资金链中每一笔交易的风险度,并将所述第一资金链中风 险度低于预设风险度的交易剔除,得到第二资金链;
根据所述第二资金链,确定所述黑种子所在的资金链团伙。
根据第二方面,提供了一种资金链团伙识别装置,包括:
第一获取模块,用于获取预先确定的黑种子;所述黑种子为经过审理认 定为有洗钱风险的客户;
第一确定模块,用于根据全域交易数据,确定所述黑种子关联的交易链;
第二确定模块,用于根据所述黑种子关联的交易链,确定第一资金链; 所述第一资金链为所述黑种子关联的资金链;
第三确定模块,用于确定所述第一资金链中每一笔交易的风险度,并将 所述第一资金链中风险度低于预设风险度的交易剔除,得到第二资金链;
第四确定模块,用于根据所述第二资金链,确定所述黑种子所在的资金 链团伙。
根据第三方面,提供了一种计算设备,包括存储器和处理器,所述存储器 中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面提供 的所述的方法。
根据第四方面,提供了一种计算机可读存储介质,其上存储有计算机程 序,当所述计算机程序在计算机中执行时,令计算机执行第一方面提供的方 法。
本说明书实施例提供的资金链团伙识别方法及装置、计算设备、计算机 可读存储介质,首先获取经过审理认定为有洗钱风险的黑种子,然后从全域 交易数据中确定黑种子关联的交易链,基于黑种子关联的交易链确定第一资 金链,去掉第一资金链中风险度较低的交易,得到第二资金链,然后基于第 二资金链确定黑种子所在的资金链团伙。可见,本发明实施例提供的方法从 黑种子出发,寻找有关的交易链,然后通过该交易链确定对应的资金链,基 于黑种子关联的资金链确定黑种子所在的资金链团伙,这种方式几乎不需要 运营人力成本。而且在得到的资金链团伙中可以看到清晰的资金流向,即具 有较强的资金流向解释能力。针对每一个黑种子都可以识别出对应的资金链 团伙,避免资金链团伙的遗漏,具有覆盖全面的优点。由于本发明实施例提 供的方法几乎不依赖人工,可以提高识别的准确性,同时,也可以快速的识 别出资金链团伙。可见,本发明实施例提供的方法具有节约人力成本、覆盖 全面、准确度高、资金流向解释性强、时效高的优点。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对 实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下 面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书一个实施例中资金链团伙识别方法的流程示意图;
图2是本说明书一个实施例中步骤S400的一种实现方式的流程示意图;
图3是本说明书一个实施例中S800中确定所述第一资金链中每一笔交 易的风险度的一种实现方式的流程示意图;
图4是本说明书一个实施例中S820中每一次迭代过程的流程示意图;
图5是本说明书一个实施例中S1000的一种实现方式的流程示意图;
图6是本说明书一个实施例中各条第二资金链的示意图;
图7是本说明书一个实施例中S1040中确定该目标状态对应的各条第二 资金链中的最佳资金链的一种实现方式的流程示意图;
图8是本说明书一个实施例中回报矩阵的举例示意图;
图9是本说明书一个实施例中初始的Q矩阵的示意图;
图10是本说明书一个实施例中资金链团伙识别装置的结构框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
洗钱行为的核心环节是资金的异常流转。如何识别异常交易,并得到具 有清晰资金流向的团伙是反洗钱业务的重要诉求。在此之前探索了多种识别 资金链团伙的方案,例如,Louvain等团伙发现算法识别类罪团伙。这些方 案虽然在国内站点起到了一定的效果,但是识别准确率较低。目前,反洗钱 风险的水位控制已经进入攻坚阶段,如何准确、快速的发现风险是非常重要 的。
为此,根据第一方面,本说明书实施例提供了一种资金链团伙识别方法, 首先,获取预先确定的黑种子;所述黑种子为经过审理认定为有洗钱风险的 客户;然后,根据全域交易数据,确定所述黑种子关联的交易链;接着,根 据所述黑种子关联的交易链,确定第一资金链;所述第一资金链为所述黑种 子关联的资金链;接着,确定所述第一资金链中每一笔交易的风险度,并将 所述第一资金链中风险度低于预设风险度的交易剔除,得到第二资金链;最 后,根据所述第二资金链,确定所述黑种子所在的资金链团伙。
下面描述以上构思的具体实现方式。
图1是本发明一个实施例中资金链团伙识别方法的流程示意图。可以理 解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集 群来执行。参见图1,资金链团伙识别方法包括如下步骤S200~S1000:
S200、获取预先确定的黑种子;所述黑种子为经过审理认定为有洗钱风 险的客户;
S400、根据全域交易数据,确定所述黑种子关联的交易链;
S600、根据所述黑种子关联的交易链,确定第一资金链;所述第一资金 链为所述黑种子关联的资金链;
S800、确定所述第一资金链中每一笔交易的风险度,并将所述第一资金 链中风险度低于预设风险度的交易剔除,得到第二资金链;
S1000、根据所述第二资金链,确定所述黑种子所在的资金链团伙。
在图1示出的资金链团伙识别方法,首先获取经过审理认定为有洗钱风 险的黑种子,然后从全域交易数据中确定黑种子关联的交易链,基于黑种子 关联的交易链确定第一资金链,去掉第一资金链中风险度较低的交易,得到 第二资金链,然后基于第二资金链确定黑种子所在的资金链团伙。可见,本 发明实施例提供的方法从黑种子出发,寻找有关的交易链,然后通过该交易 链确定对应的资金链,基于黑种子关联的资金链确定黑种子所在的资金链团 伙,这种方式几乎不需要运营人力成本。而且在得到的资金链团伙中可以看到清晰的资金流向,即具有较强的资金流向解释能力。针对每一个黑种子都 可以识别出对应的资金链团伙,避免资金链团伙的遗漏,具有覆盖全面的优 点。由于本发明实施例提供的方法几乎不依赖人工,可以提高识别的准确性, 同时,也可以快速的识别出资金链团伙。可见,本发明实施例提供的方法具 有节约人力成本、覆盖全面、准确度高、资金流向解释性强、时效高的优点。
下面描述图1中各个步骤的执行方式。
S200、获取预先确定的黑种子;所述黑种子为经过审理认定为有洗钱风 险的客户;
可理解的是,所谓的黑种子是经过人工审理或平台审理得到的具有洗钱 风险的客户。洗钱行为有多种形式,这些非法交易行为也可以称之为类罪, 即类罪是指具有洗钱性质的非法交易行为。
其中,交易平台一般都会通过平台程序或者人工对交易客户进行监督、 审理,经过一段时间的监督、审理工作后发现某些客户具有洗钱风险,因此 将这些客户进行相关的审理标记,例如,某个客户进行了非法集资交易,则 为这个客户打上非法集资的审理标记。在S200中,可以从交易平台中获取 具有相关审理标记的客户作为黑种子。
S400、根据全域交易数据,确定所述黑种子关联的交易链;
其中,全域交易数据是指所有的交易数据,从所有的交易数据中获取黑 种子关联的交易链,可以避免遗漏。当然由于全域交易数据非常庞大,因此 可以选择一段时间内的交易数据。
其中,黑种子关联的交易链是指与黑种子具有上下游交易关系的一笔或 者多笔交易形成的链条。
在具体实施时,参见图2,上述S400可以包括如下步骤S420~S460:
S420、从所述全域交易数据中提取出最近预设时间段内的交易数据;
举例来说,可以全域交易数据中提取出最近一个月内的交易数据、最近 90天内的交易数据。
其中,全域交易数据为国内站点的所有交易数据。交易数据存储在数据 库中,因此可以从数据库所存储的所有交易数据中提取出最近预设时间段内 的交易数据。
S440、将所述最近预设时间段内的交易数据转化为对应的交易图谱;其 中,所述交易图谱中的节点为客户,节点之间的边为具有交易关系的客户之 间的交易信息,所述交易信息中包括交易金额;
其中,各条交易数据是以表格的形式存在,为了更加直观、方便的进行 后续的操作,将表格转化为交易图谱。在交易图谱中包含很多的节点和边, 节点表示客户,而两个客户之间的边表示两个客户之间的交易信息,例如, 交易时间、交易金额,而且边是有方向的,该方向是依据资金的流向而决定 的,例如,在一笔交易中,交易金额是从客户A到客户B,则边的方向是从 客户A对应的节点指向客户B对应的节点。
S460、对所述交易图谱中与所述黑种子有关的交易资金的流转进行追踪, 得到所述黑种子关联的交易链。
具体的,可以从交易图谱中找到黑种子对应的节点,然后根据黑种子对 应的节点与其它节点之间的交易关系,确定与黑种子的上、下游节点,上游 节点的上游节点、下游节点的下游节点,直到到达最后的下游节点和最开始 的上游节点。黑种子以及各个上下游节点形成了黑种子关联的交易链。
在具体实施时,在执行S460之前,方法还可以包括:根据预设筛选策 略从所述交易图谱中筛选出具有洗钱风险的交易链;所述预设筛选策略为根 据洗钱行为的交易特征所确定。对应的,S460可以具体包括:对具有洗钱风 险的交易链中与所述黑种子有关的交易资金的流转进行追踪,得到所述黑种 子关联的交易链。
基于反洗钱运营总结出的审理经验,发现具有洗钱风险的交易一般都具 有以下三个交易特征:①流转金额高:单个客户的平均每笔的交易金额较大, 并且在相对较短的时间内流入流出金额接近。②流转速度快:因资金具有时 间成本,多数的洗钱交易的流入流出时间间隔在3小时以内,资金停留在账 户的时间很短。③流转模式异常:洗钱交易的资金链路大多在两跳以上,且 为多个客户之间的资金交互。
基于以上三个交易特征可以确定出预设筛选策略:流转金额高于一定金 额、流入流出时间间隔在一定时间以内以及资金链路在两跳以上。基于这样 的预设筛选策略从所述交易图谱中筛选出具有洗钱风险的交易链。然后在步 骤S460中可以对具有洗钱风险的交易链中与所述黑种子有关的交易资金的 流转进行追踪,得到所述黑种子关联的交易链,这样可以进一步精准确定与 黑种子有关的异常交易链。
通过上述步骤S420~S460可以方便、快速的找到黑种子关联的交易链。
S600、根据所述黑种子关联的交易链,确定第一资金链;所述第一资金 链为所述黑种子关联的资金链;
其中,在交易链中可能存在多笔交易的双方客户相同的情况,因为黑种 子关联的交易链是根据一段时间的交易数据确定的,在这段时间内客户双方 可能进行了多次交易,这样就产生了多笔交易。例如,在某天的交易数据中 的一笔交易的客户双方分别是A和B,客户A向客户B转账200万人民币。 在另一天的交易数据中也有一笔交易的客户双方分别是A和B,客户B向客 户A转账300万人民币。此时可以将这两笔交易汇总为一笔交易,因为交易方向不同,汇总资金为100万人民币,交易方向为客户B指向客户A。即, 将两笔交易的资金汇总,汇总后交易的方向由汇总后的资金流向决定。
在具体实施时,S600可以具体包括:在所述黑种子关联的交易链中,将 交易双方的客户均相同的各笔交易的交易资金进行汇总,得到所述第一资金 链。
举例来说,针对3天内的交易链分别为:
第一天:黑种子A关联的交易链为A-B-C-D;
第二天:黑种子A关联的交易链为A-B-C;
第三天:黑种子A关联的交易链为A-B;
将第一天、第二天、第三天中的交易A-B的资金进行汇总,得到客户双 方为A和B的汇总资金;将第一天、第二天中的交易B-C的资金进行汇总, 得到客户双方为B和C的汇总资金。在汇总完成后,得到资金链A-B-C-D, 在该资金链中,A和B之间的资金为第一天、第二天、第三天中的交易A-B 的资金的汇总;资金链中的B和C之间的资金为第一天、第二天中的交易 B-C的资金的汇总。
可见,通过以上方式可以得到上述第一资金链。
S800、确定所述第一资金链中每一笔交易的风险度,并将所述第一资金 链中风险度低于预设风险度的交易剔除,得到第二资金链;
在该步骤中,将第一资金链中风险度较低的交易剔除,仅保留风险度较 高的交易,便得到第二资金链。在第二资金链中,因为低风险的交易已经剔 除,因此资金链团伙的范围进一步缩小。
在具体实施时,可以采用多种方式确定第一资金链中各笔交易的风险度, 这里提供一种可选的方式:采用有向边注意力的双表征模型确定所述第一资 金链中每一笔交易的风险度;所述有向边注意力的双表征模型为基于邻域节 点信息和邻域边信息对节点产生的影响而进行机器学习所得到的网络模型。
即,有向边注意力的双表征模型考虑到了邻域节点和邻域边对节点的影 响,并通过机器学习的方式进行训练得到的一个神经网络模型。
可理解的是,在风控场景中,交易之间往往存在一定的联系,比如传递 关系网络、设备关系网络、区域关系网络等,如果可以利用这些图拓扑信息 来生成特征表示数据,这会给风控场景带来额外的好处。而且,通过学习图 结构表示的方式自动生成这些特征,可以避免人工设计的繁琐,可以挖掘出 比人工更高级的数据隐藏层信息。目前为止,不论是基于随机游走的图表征 模型还是以图卷积网络和图形神经网络为代表的图神经网络,大多都是对无 向图进行建模分析,或者简单地把无向图的方法搬运到有向图上,这样会损失方向性的信息。然而实际生活中大部分图都是有向图,比如社交网络的关 注关系、论文的引用关系等,尤其在风控场景中,方向性显得尤为重要,例 如受害者向诈骗分子转账这条边,我们会标记为欺诈交易,而反向的转账则 不属于欺诈交易,如诈骗分子的日常生活向商户转账等。另一方面,风控平 台所面对的通常都是亿级/十亿级/百亿级边数量的安全风控场景。在这些场 景中,按有向图方式组织数据比按无向图方式组织数据可减少50%的数据量, 对于加快复杂图特征的提取表征和模型打分都具有不可忽视的工程价值。
因此,在资金链团伙的识别方案中,以复杂图上的有向性作为切入口, 研究针对有向图的注意力机制,阐述在实际应用中图的方向性的重要性,进 而提出了本发明实施例中的有向边注意力的双表征模型,可以简称为 DADEdge模型。
其中,有向边注意力的双表征模型旨在通过独立计算进出两部分领域节 点信息和进出两部分领域边信息来刻画由不同方向性所带来的信息差异。即 涉及到两方面的信息:一部分是领域节点信息汇聚的双表征信息,另一部分 是领域边信息汇聚的双表征信息。
针对第一资金链中的节点,可能只是源节点,也可能只是目标节点,也 可能既是源节点也是目标节点。即,针对第一资金链中的每一个节点,可能 在一个或多个分支中作为目标节点,同时也可能在另一个或多个分支中作为 源节点。为了更好的区分两个方向上的表征向量,采用双表征的方式来表示 一个节点。例如,节点i作为源节点时表征向量为si,节点i作为目标节点时 表征向量为ti。当节点i作为目标节点时,节点i的目标表征向量ti为来自各 个邻域节点的源表征向量sj的邻域聚合。当节点i作为源节点时,节点i的 源表征向量si为来自各个邻域节点的目标表征tj的邻域聚合。最后经过邻域 聚合更新后的两部分表征向量组成节点新的双表征向量。
参见图3,对S800中确定所述第一资金链中每一笔交易的风险度的过程 可以包括如下步骤S820~S840:
S820、根据邻域节点信息和邻域边信息,确定所述第一资金链中每一个 目标节点和每一个源节点的表征向量;在所述第一资金链的一笔交易中,交 易方向为从源节点指向目标节点;
S840、根据各个目标节点和各个源节点的表征向量,确定所述黑种子关 联的交易链中每一笔交易的风险度。
在上述步骤S820中,一个节点的邻域节点是指与该节点具有交易关系 的节点,例如,节点A与节点B、节点C、节点D具有交易关系,因此节点 B、节点C、节点D均为节点A的邻域节点。而节点A和节点B之间的边、 节点A和节点C之间的边、节点A和节点C之间的边、节点A和节点D之 间的边均为节点A的邻域边。可见一个节点的邻域节点信息是指与该节点具 有交易关系的节点的相关信息,例如,节点的表征向量。一个节点的邻域边 信息是指该节点与各个邻域节点之间的边的相关信息,例如,边的表征向量。
在S820中,基于一个节点的邻域节点信息和邻域边信息,对这个节点 进行表征。当这个节点仅是一个源节点时,该节点的表征向量为源节点表征 向量。当一个节点仅是一个目标节点时,该节点的表征向量为目标节点向量。 当一个节点既是一个源节点,也是一个目标节点时,当该节点作为源节点时 具有一个对应的源表征向量,当该节点作为目标节点时具有一个对应的目标 节点表征向量,即该节点的表征向量包括源节点表征向量和目标节点表征向 量,在此情况下为双表征。
可理解的是,在本发明实施例中,在一笔交易中,交易的方向是从源节 点指向目标节点,以此来区分目标节点和源节点。
可理解的是,通过步骤S820可以实现对每一个节点的表征,即得到每 一个节点的表征向量,进而根据第一资金链中各个节点的表征向量确定各笔 交易的风险度。具体可以将各个节点的表征向量作为神经网络模型的输入信 息,即在将各个节点的表征向量输入到神经网络模型中后,便可以得到各笔 交易的风险度。在该过程中,神经网络模型利用各个节点的表征向量实现了 风险度的多分类,例如,将风险度分为了11类:0、0.1、0.2、0.3、0.4、0.5、 0.6、0.7、0.8、0.9、1.0。
可见,有向边注意力的双表征模型分为两部分结构:一部分结构用于对 各个节点进行向量表征,另一部分结构用于根据各个节点的表征向量输出各 笔交易的风险度,即上文中的神经网络模型。
其中,用于输出风险度的神经网络模型可以提前利用具有风险标签的交 易样本中的各个节点转化为表征向量之后进行模型训练得到,所述风险标签 包括类罪审理标签和/或处罚标签。处罚标签,例如,资产冻结标签等,不同 的标签对应不同的风险度。
在具体实施时,S820可以包括:采用多次迭代过程对每一个目标节点和 每一个源节点的表征向量进行更新。经过多次迭代之后,得到了每一个目标 节点和每一个源节点最终的表征向量,进而将这些表征向量输入到上文中的 神经网络模型中,便可以得到第一资金链中各笔交易的风险度。
其中,参见图4,每一次迭代过程包括如下步骤S822~S836:
S822、确定每一个目标节点和每一个源节点在本次迭代过程中的初始表 征向量;
在第一次迭代过程中,可以根据一个节点自身的特征信息来确定该节点 的初始表征信息。例如,客户名称、交易时间、交易进出的金额等。将这些 特征信息转化为初始表征向量,实现对一个节点的初始表征。例如,针对一 个目标节点,将这个目标节点的名称、进入该节点的交易金额、涉及到的交 易时间等。
在非第一次迭代过程中,目标节点的初始表征向量为这个目标节点在上 一次迭代过程中的最终表征向量,源节点的初始表征向量为这个源节点上一 次迭代过程中的最终表征向量。
当然,在执行如下步骤S824之前,还可以对初始表征向量进行线性变 换,例如,设置目标表征向量对应的线性变换矩阵为W,源表征向量对应的 线性变换矩阵为U,利用线性变换矩阵对表征向量进行线性变换处理。其中, 线性变换矩阵可以为全连接层矩阵。下文中的U(l)、W(l)为在第l次迭代过程 中的变换矩阵。
例如,在第l次迭代过程中,针对源节点:
Figure BDA0003702844150000091
针对目标节点:
Figure BDA0003702844150000092
其中,
Figure BDA0003702844150000093
为对初始表征向量
Figure BDA0003702844150000094
进行线性变换后的表征向量。
Figure BDA0003702844150000095
为对初始表征向量
Figure BDA0003702844150000096
进行线性变换后的表征向量,i、j为节点的编号,l为 迭代次数。
可理解的是,通过线性变换的方式,可以挖掘出向量中隐藏的信息,使 得表征向量更好的对节点进行表征。若对初始表征向量进行线性变换的话, 在执行S824和S826时采用的是对初始表征向量进行线性变换之后的表征向 量。
S824、针对每一个目标节点,根据该目标节点关联的各个源节点的初始 表征向量和该目标节点的初始表征向量,计算邻域节点对该目标节点的注意 力矩阵;
这里,将每一个目标节点作为一个中心节点来分析,中心节点需要进出 两部分的邻域节点信息来分别更新节点的目标表征向量和源表征向量。
当中心节点作为目标节点时,可以根据该目标节点关联的各个源节点的 初始表征向量和该目标节点的初始表征向量,计算注意力矩阵。
当然,也可以根据该目标节点关联的各个源节点经过线性变换后的表征 向量和该目标节点经过线性变换后的表征向量,计算注意力矩阵
Figure BDA0003702844150000097
例如,
Figure BDA0003702844150000098
可以采用如下方式表示:
Figure BDA0003702844150000099
其中,τ(i)表示目标节点i关联的各个源节点形成的集合,
Figure BDA0003702844150000101
为注意力 参数,W(l)为在第l次迭代过程中的一个变换矩阵,
Figure BDA0003702844150000102
为目标节点i在第l次 迭代过程中的初始表征向量,U(l)为在第l次迭代过程中的另一个变换矩阵,
Figure BDA0003702844150000103
行线性变换后的表征向量。
S826、针对每一个源节点,根据该源节点关联的各个目标节点的初始表 征向量和该源节点的初始表征向量,计算邻域节点对该源节点的注意力矩阵;
当中心节点作为源节点时,可以根据源节点关联的各个目标节点的初始 表征向量和该源节点对应的初始表征向量,来计算注意力矩阵。
当然,也可以根据该源节点关联的各个目标节点经过线性变换后的表征 向量和该源节点经过线性变换后的表征向量,来计算注意力矩阵
Figure BDA0003702844150000104
例如, fi (l)可以采用如下方式表示:
Figure BDA0003702844150000105
其中,S(i)表示源节点i关联的各个目标节点形成的集合,
Figure BDA0003702844150000106
为注意力参 数,W(l)为在第l次迭代过程中的一个变换矩阵,U(l)为在第l次迭代过程中的 另一个变换矩阵,
Figure BDA0003702844150000107
为在第l次迭代过程中源节点i的初始表征向量,
Figure BDA0003702844150000108
为 源节点i关联的目标节点j在第l次迭代过程中的初始表征向量,
Figure BDA0003702844150000109
为对初始 表征向量
Figure BDA00037028441500001010
进行线性变换后的表征向量,
Figure BDA00037028441500001011
为对初始表征向量
Figure BDA00037028441500001012
进行线性 变换后的表征向量。
在实际中,在两个分支上得到注意力矩阵后,还可以利用softmax函数 对两个分支的注意力矩阵分别进行归一化处理,得到归一化的注意力矩阵:
Figure BDA00037028441500001013
可理解的是,以上注意力矩阵考虑了邻域节点信息,即注意力矩阵体现 了邻域节点对中心节点的影响。
S828、确定所述目标节点连接的每一个边的初始表征向量和每一个源节 点连接的每一个边的初始表征向量;
可理解的是,边注意力机制的主要思想是将与中心节点相连的边也看成 相对中心节点的一个信息来源,通过注意力机制计算中心节点对邻域边的注 意力,最后加权聚合到中心节点上。在有向图上,每个中心节点的入边和出 边分别在两个分支上计算注意力。这一点也是比较符合实际物理意义的,比 如客户A向客户B转账,这条交易的特征对源节点A和目标节点B的影响 是不同的。在欺诈场景中,若这条交易标记为欺诈,则收款方B很容易通过 这条交易的异常信息被识别为诈骗分子,而如果交易的异常信息同样作用到A上,则受害者A会被误分类,因此需要分方向进行边注意力的计算。
可理解的是,边的初始表征向量可以根据这个边的双方客户、交易时间、 交易金额等信息转化为表征向量,实现对一个边的初始表征。由于初始边属 性只在一个空间,我们通过两个不同变换将其映射到两个空间,一个空间中 的边表征向量用来更新中心节点的目标表征向量,另一个空间中的边表征向 量用来更新中心节点的源表征向量。例如,针对节点i和节点j之间的边作 用在源节点上时对应的初始表征向量表示为
Figure BDA0003702844150000111
该初始表征向量也可以称为 源节点连接的边的初始表征向量。节点i和节点j之间的边作用在目标节点 上时对应的初始表征向量表示为
Figure BDA0003702844150000112
该初始表征向量也可以称为目标节点连 接的边的初始表征向量。
当然,在执行下文中的步骤之前,还可以线性变换,具体可以利用线性 变换矩阵来实现线性变换。例如,在第l次迭代过程中,对边的初始表征向量 进行线性变换。针对作用在源节点上的边的初始表征向量的线性变换表示为:
Figure BDA0003702844150000113
变换矩阵。
S830、针对每一个目标节点,根据该目标节点连接的各个边的初始表征 向量和该目标节点的初始表征向量,计算邻域边对该目标节点的注意力矩阵;
当一个节点作为目标节点时,可以利用目标节点连接的各个边的初始表 征向量和该目标节点的初始表征向量,计算注意力矩阵。
当然,也可以利用目标节点连接的各个边经过线性变换后的表征向量和 该目标节点经过线性变换后的表征向量,计算注意力矩阵ri (l)。注意力矩阵 ri (l)可以表示为:
Figure BDA0003702844150000114
其中,
Figure BDA0003702844150000115
为节点i和节点j之间的注意力向量,
Figure BDA0003702844150000116
为注意力参数,W(l)为 在第l次迭代过程中的一个变换矩阵,T为倒置符号,
Figure BDA0003702844150000117
为目标节点i在第l次 迭代过程中的初始表征向量,P(l)为第l次迭代过程中的一个变换矩阵,
Figure BDA0003702844150000118
为 在第l次迭代过程中节点i和节点j之间的边作用在目标节点上时对应的初始 表征向量,
Figure BDA0003702844150000119
为对对应的初始表征向量t(l)进行线性变换后的表征向量,
Figure BDA00037028441500001110
为对节点i和j之间的边的初始表征向量进行线性变换的表征向量。
S832、针对每一个源节点,根据该源节点连接的各个边的初始表征向量 和该源节点的初始表征向量,计算邻域边对该源节点的注意力矩阵;
当一个节点作为源节点时,可以利用源节点连接的各个边的初始表征向 量和该源节点的初始表征向量,计算注意力矩阵。
当然,也可以利用源节点连接的各个边经过线性变换后的表征向量和该 源节点经过线性变换后的表征向量,计算注意力矩阵
Figure BDA0003702844150000121
注意力矩阵
Figure BDA0003702844150000122
中 节点i和节点j之间的注意力向量
Figure BDA0003702844150000123
可以表示为:
Figure BDA0003702844150000124
其中,
Figure BDA0003702844150000125
为注意力参数,U(l)为在第l次迭代过程中的一个变换矩阵,
Figure BDA0003702844150000126
为在第l次迭代过程中源节点i的初始表征向量,Q(l)为第l次迭代过程中的一
Figure BDA00037028441500001220
行线性变换后的表征向量。
可理解的是,边注意力和节点注意力采用不同参数是因为边特征虽然已 经映射到和节点特征的维度一致,但实际向量空间中边表征和节点表征可能 相距甚远,故对边用独立的注意力参数。
在实际中,在计算得到两个分支上的注意力矩阵之后,还可以利用 softmax函数对两个分支的注意力矩阵分别进行归一化处理,得到归一化的注 意力矩阵:
Figure BDA00037028441500001212
可理解的是,这两个注意力矩阵考虑了邻域边信息,即注意力矩阵体现 了邻域边对中心节点的影响。
S834、针对每一个目标节点,根据邻域节点对该目标节点的注意力矩阵 和邻域边对该目标节点的注意力矩阵,确定该目标节点在本次迭代过程中的 最终表征向量;
可理解的是,针对一个目标节点,通过上述步骤计算得到领域节点和邻 域边分别对该目标节点的注意力矩阵后,便可以利用这两个注意力矩阵计算 该目标节点在本次迭代过程中的最终表征向量。考虑邻域节点信息聚合和邻 域边信息聚合的目标节点的表征向量更新为:
Figure BDA00037028441500001213
其中,
Figure BDA00037028441500001214
实际上是注意力矩阵
Figure BDA00037028441500001215
和注意力矩阵ri (l)的和,
Figure BDA00037028441500001216
即上文中的注意力参数
Figure BDA00037028441500001217
Figure BDA00037028441500001218
即上文中的
Figure BDA00037028441500001219
σ为函数为激活函数。
S836、针对每一个源节点,根据邻域节点对该源节点的注意力矩阵和邻 域边对该源节点的注意力矩阵,确定该源节点在本次迭代过程中的最终表征 向量。
可理解的是,针对一个源节点,通过上述步骤计算得到领域节点和邻域 边分别对该源节点的注意力矩阵后,便可以利用这两个注意力矩阵计算该源 节点在本次迭代过程中的最终表征向量。考虑邻域节点信息聚合和邻域边信 息聚合的源节点的表征向量更新为:
Figure BDA0003702844150000131
其中,
Figure BDA0003702844150000132
实际上是注意力矩阵
Figure BDA0003702844150000133
和注意力矩阵
Figure BDA0003702844150000134
的和,
Figure BDA0003702844150000135
即上文中的注意力参数
Figure BDA0003702844150000136
Figure BDA0003702844150000137
即上文中的
Figure BDA0003702844150000138
σ 为函数为激活函数。
在得到每一个节点在本次迭代过程中的最终表征向量后,如果还需要进 行下一次迭代过程,则将节点在本次迭代过程中的最终表征向量作为下一个 迭代过程中该节点的初始表征向量。如果本次迭代过程为最后一次迭代过程, 则经过本次迭代过程得到的最终表征向量为整个迭代过程中的最终迭代向量。
可理解的是,经过预设次数的迭代过程后,便可以得到每一个目标节点 对应的目标表征向量和每一个源节点对应的源表征向量,然后将各个节点对 应的目标表征向量、源表征向量输入到神经网络模型中,便可以得到第一资 金链中各笔交易的风险度。
具体的,可以设定一个预设风险度作为阈值,将风险度高于该阈值的交 易保留下来,将风险度低于该阈值的交易剔除掉,从而得到第二资金链。
可理解的是,在剔除低风险交易时,有可能会出现一个节点与黑种子之 间断开连接的情况,此时可以将断开连接的这个节点舍弃,在后续过程中不 再考虑这个节点。
也就是说,本发明实施例提供的方法还包括:在将第一资金链中风险度 低于预设风险度的交易剔除之后,判断是否存在断开关联的节点,若存在, 则将断开关联的节点舍弃。
S1000、根据所述第二资金链,确定所述黑种子所在的资金链团伙。
针对上述第二资金链进行进一步的筛选,得到最终的资金链团伙。在资 金链团伙中包括客户、客户之间汇总的交易金额、交易的汇总方向等信息。
在具体实施时,可以采用强化学习算法确定黑种子所在的资金链团伙。 具体的,参见图5,S1000具体可以包括如下步骤:
S1020、针对每一个目标状态,判断该目标状态对应的第二资金链的条 数是否大于1;各条所述第二资金链的初始状态均为所述黑种子,所述目标 状态为各条所述第二资金链中未与所述黑种子相邻连接的节点;
S1040、若是,则确定该目标状态对应的各条第二资金链中的最佳资金 链,并保留所述最佳资金链;
S1060、否则,保留该目标状态对应的第二资金链;
S1080、根据针对各个目标状态所保留的第二资金链,确定所述黑种子 所在的资金链团伙。
在图6展示的资金链中,节点R为黑种子,以节点R为起点,有5条资 金链,分别是:R->A->D->F、R->B->D->F、R->B->E->F、R->E->F、R->C。 其中的节点D、E、F未与黑种子直接相连,因此节点D、E、F为目标节点。
针对每一个目标状态,判断该目标状态对应的第二资金链是否大于1。 例如,针对节点D,第二资金链为R->A->D、R->B->D,可见具有两条第二 资金链,需要从这2条第二资金链中选择出一条作为从节点R到节点D的最 佳资金链,所谓的最佳资金链是指总体风险最大的资金链,针对目标状态D, 将最佳资金链保留下来,其它的第二资金链剔除。同样针对节点E也有两条 对应的第二资金链:R->B->E、R->E,也需要从这两条中筛选出最佳资金链。针对目标状态E,将最佳资金链保留下来,将其它的第二资金链剔除。针对 节点F,一共有四条第二资金链:R->A->D->F、R->B->D->F、R->B->E->F、 R->E->F,也需要从这四条中筛选出一条最佳资金链。针对目标状态F,将最 佳资金链保留下来,将其它的第二资金链剔除。最后,将针对各个目标状态 所保留下来的第二资金链形成黑种子所在的资金链团伙。
在实际上也可能存在仅有两个节点的资金链,例如图6中的R->C,虽然 这条第二资金链比较短,但是这条第二资金链的交易风险度是比较高的,因 为经过了上文中将低风险的交易进行剔除的步骤,保留下来的都是风险比较 高的交易,对于这样的比较短的第二资金链也是不能忽视的。
基于以上考虑,上述S1080可以具体包括如下步骤:
判断各条第二资金链中是否存在仅由两个节点形成的第二资金链;所述 两个节点中包括所述黑种子;若是,则根据针对各个目标状态所保留的第二 资金链和仅由两个节点形成的第二资金链,确定所述黑种子所在的资金链团 伙;否则,根据针对各个目标状态所保留的第二资金链,确定所述黑种子所 在的资金链团伙。
也就是说,如果不存在仅有两个节点组成的第二资金链,例如图6中的 R->C,则直接将针对各个目标状态所保留下来的第二资金链形成黑种子所在 的资金链团伙。而如果存在仅有两个节点组成的第二资金链,则将针对各个 目标状态所保留下来的第二资金链以及仅由两个节点形成的第二资金链形成 黑种子所在的资金链团伙。通过这种方式,可以避免资金链的遗漏。
在具体实施时,可以采用Q-Learning强化学习的算法进行最佳资金链的 选择。参见图7,S1040中确定该目标状态对应的各条第二资金链中的最佳 资金链的过程可以具体包括如下步骤S1042~S1046:
S1042、根据各条所述第二资金链中各笔交易的风险度,构建回报矩阵;
其中,各笔交易的风险度可以从上文的步骤S800中得到。基于这些风 险度可以构建如图8示出的回报矩阵,回报矩阵也可以称为Reward矩阵, 简称为R矩阵。在图8示出的R矩阵的状态STATE表示当前的节点,ACTION 表示下一步动作的节点。针对图6示出的5条资金链以及5条资金链中各笔 交易的风险度,形成了图8示出的R矩阵。如果两个节点之间没有关联,则 相应位置用-1填充。例如,在图8中,当前状态对应的一个节点为节点R, 下一个动作对应的节点为节点C,从节点R到节点C的交易的风险度为0.9, 因此在状态STATE为R且下一步动作ACTION为C的相应位置用0.9填充。
也就是说,R矩阵中,行名表示当前的状态STATE,列名表示当前状态 下可用的动作ACTION,具体到资金链路R->A->D->F,风险度分别为0.6、 0.7、0.8。对于不存在的交易,R矩阵的元素统一标记为-1。
S1044、针对该目标状态,构建初始的Q矩阵,并根据所述回报矩阵对 所述Q矩阵进行迭代更新,直到所述Q矩阵满足收敛条件;
在本步骤中构建初始的Q矩阵,用来表从经验中学到的知识,Q矩阵可 以理解为知识矩阵。矩阵Q与R矩阵同阶,其行表示状态,列表示动作。在 刚开始时代理对外界一无所知,因此Q矩阵初始化为零矩阵。例如,参见图 9示出的初始Q矩阵。
针对图6中示出的目标状态D,有两条第二资金链:R->A->D、R->B->D。 利用这两条第二资金链中各笔交易的风险度对目标状态D对应的Q矩阵进行 更新。由于这两条第二资金链中的各笔交易的风险度已经体现在上述回报矩 阵中,因此也可以理解为依据上述回报矩阵对Q矩阵进行更新。
具体的,采用如下规则对Q矩阵进行迭代更新:
Q(s,a)=R(s,a)+γmax{Q(s′,a′)}
其中s、a表示当前的状态和动作,s′,a′表示下一个状态和动作,折 扣系数γ∈[0,1]。Q(s,a)为当前的状态s和动作a对应的Q值。R(s,a)为当前 的状态s和动作a对应的R值,即风险度,可以从回报矩阵中查找到。
首先,令折扣系数γ=0.8,初始状态为R,目标状态为D,初始的Q矩 阵为全零矩阵。观察矩阵R的第1行,对应节点R,下一步的状态有4个可 能的动作:节点A、B、C或E。
针对第二资金链R->A->D,下一步动作为A,R(R,A)为0.6,节点A的 下一步动作为D,R(A,D)为0.7。Q(A,D)=R(A,D)=0.7,Q(R,A)=R(R,A)+ 0.8×max{Q(A,D)}=0.6+0.8×0.7=1.16,至此完成Q矩阵的一次更新。同 样,针对第二资金链:R->B->D,也采用上述方式进行一次更新。可理解的 是,在针对一个目标状态对应的Q矩阵,依据该目标状态对应的所有第二资 金链完成对Q矩阵的一次更新,即一次迭代。通过这种方式进行多次迭代, 直到Q矩阵在前后两个迭代过程之间的变化很小,符合收敛条件,则停止迭 代。
S1046、在满足所述收敛条件的Q矩阵中选择出最大值,并将所述最大 值所对应的第二资金链作为该目标状态对应的各条第二资金链中的最佳资金 链。
在对一个目标状态对应的Q矩阵,在停止迭代之后,便可以从中选择出 最佳资金链,具体的选择方式是:从一个目标状态的Q矩阵的各个元素中选 择出最大值,将该最大值元素所在的第二资金链作为该目标状态对应的最佳 资金链。
可理解的是,本发明实施例提供的方法的识别准确率高达90%以上,且 具有较高的时效性和可解释性,能够加强反洗钱风险防控的能力,提升运营 审理上报的时效,具有重大的业务价值,能够节省运营审理人力,对于反洗 钱智审提效具有重大意义。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书 的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同 于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描 绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在 某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
根据第二方面,本发明实施例提供一种资金链团伙识别装置。参见图10, 该装置包括:
第一获取模块200,用于获取预先确定的黑种子;所述黑种子为经过审 理认定为有洗钱风险的客户;
第一确定模块400,用于根据全域交易数据,确定所述黑种子关联的交 易链;
第二确定模块600,用于根据所述黑种子关联的交易链,确定第一资金 链;所述第一资金链为所述黑种子关联的资金链;
第三确定模块800,用于确定所述第一资金链中每一笔交易的风险度, 并将所述第一资金链中风险度低于预设风险度的交易剔除,得到第二资金链;
第四确定模块1000,用于根据所述第二资金链,确定所述黑种子所在的 资金链团伙。
在一个实施例中,第一确定模块包括:
第一提取单元,用于从所述全域交易数据中提取出最近预设时间段内的 交易数据;
数据转化单元,用于将所述最近预设时间段内的交易数据转化为对应的 交易图谱;其中,所述交易图谱中的节点为客户,节点之间的边为具有交易 关系的客户之间的交易信息,所述交易信息中包括交易金额;
交易追踪单元,用于对所述交易图谱中与所述黑种子有关的交易资金的 流转进行追踪,得到所述黑种子关联的交易链。
在一个实施例中,第二确定模块具体用于:在所述黑种子关联的交易链 中,将交易双方的客户均相同的各笔交易的交易资金进行汇总,得到所述第 一资金链。
在一个实施例中,第三确定模块具体用于:采用有向边注意力的双表征 模型确定所述第一资金链中每一笔交易的风险度;所述有向边注意力的双表 征模型为基于邻域节点信息和邻域边信息对节点产生的影响而进行机器学习 所得到的网络模型。
进一步的,第三确定模块包括:
节点表征单元,用于根据邻域节点信息和邻域边信息,确定所述第一资 金链中每一个目标节点和每一个源节点的表征向量;在所述第一资金链的一 笔交易中,交易方向为从源节点指向目标节点;
风险确定单元,用于根据各个目标节点和各个源节点的表征向量,确定 所述黑种子关联的交易链中每一笔交易的风险度。
更进一步的,节点表征单元具体用于:采用多次迭代过程对每一个目标 节点和每一个源节点的表征向量进行更新,每一次迭代过程包括:确定每一 个目标节点和每一个源节点在本次迭代过程中的初始表征向量;针对每一个 目标节点,根据该目标节点关联的各个源节点的初始表征向量和该目标节点 的初始表征向量,计算邻域节点对该目标节点的注意力矩阵;针对每一个源 节点,根据该源节点关联的各个目标节点的初始表征向量和该源节点的初始 表征向量,计算邻域节点对该源节点的注意力矩阵;确定所述目标节点连接的每一个边的初始表征向量和每一个源节点连接的每一个边的初始表征向量; 针对每一个目标节点,根据该目标节点连接的各个边的初始表征向量和该目 标节点的初始表征向量,计算邻域边对该目标节点的注意力矩阵;针对每一 个源节点,根据该源节点连接的各个边的初始表征向量和该源节点的初始表 征向量,计算邻域边对该源节点的注意力矩阵;针对每一个目标节点,根据 邻域节点对该目标节点的注意力矩阵和邻域边对该目标节点的注意力矩阵, 确定该目标节点在本次迭代过程中的最终表征向量;针对每一个源节点,根 据邻域节点对该源节点的注意力矩阵和邻域边对该源节点的注意力矩阵,确 定该源节点在本次迭代过程中的最终表征向量。
在一个实施例中,第四确定模块包括:
第一判断单元,用于:针对每一个目标状态,判断该目标状态对应的第 二资金链的条数是否大于1;各条所述第二资金链的初始状态均为所述黑种 子,所述目标状态为各条所述第二资金链中未与所述黑种子相邻连接的节点;
第一保留单元,用于若该目标状态对应的第二资金链的条数大于1,则 确定该目标状态对应的各条第二资金链中的最佳资金链,并保留所述最佳资 金链;
第二保留单元,用于若该目标状态对应的第二资金链的条数等于1,则 保留该目标状态对应的第二资金链;
团伙确定单元,用于根据针对各个目标状态所保留的第二资金链,确定 所述黑种子所在的资金链团伙。
进一步的,团伙确定单元包括:
第一判断子单元,用于:判断各条第二资金链中是否存在仅由两个节点 形成的第二资金链;所述两个节点中包括所述黑种子;
第一确定子单元,用于:若存在仅由两个节点形成的第二资金链,则根 据针对各个目标状态所保留的第二资金链和仅由两个节点形成的第二资金链, 确定所述黑种子所在的资金链团伙;
第二确定子单元,用于:若不存在仅由两个节点形成的第二资金链,则 根据针对各个目标状态所保留的第二资金链,确定所述黑种子所在的资金链 团伙。
进一步的,第一保留单元包括:
矩阵构建子单元,用于:根据各条所述第二资金链中各笔交易的风险度, 构建回报矩阵;
矩阵更新子单元,用于:针对该目标状态,构建初始的Q矩阵,并根据 所述回报矩阵对所述Q矩阵进行迭代更新,直到所述Q矩阵满足收敛条件;
资金链筛选子单元,用于在满足所述收敛条件的Q矩阵中选择出最大值, 并将所述最大值所对应的第二资金链作为该目标状态对应的各条第二资金链 中的最佳资金链。
根据第三方面,本说明书一个实施例提供了一种计算机可读存储介质, 其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执 行说明书中任一个实施例中的方法。
根据第四方面,本说明书一个实施例提供了一种计算设备,包括存储器 和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代 码时,实现执行说明书中任一个实施例中的方法。
可以理解的是,本说明书实施例示意的结构并不构成对本说明书实施例 的装置的具体限定。在说明书的另一些实施例中,上述装置可以包括比图示 更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的 部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
上述装置、系统内的各模块之间的信息交互、执行过程等内容,由于与 本说明书方法实施例基于同一构思,具体内容可参见本说明书方法实施例中 的叙述,此处不再赘述。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相 似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。 尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较 简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所 描述的功能可以用硬件、软件、挂件或它们的任意组合来实现。当使用软件 实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质 上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行 了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而 已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上, 所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (12)

1.一种资金链团伙识别方法,包括:
获取预先确定的黑种子;所述黑种子为经过审理认定为有洗钱风险的客户;
根据全域交易数据,确定所述黑种子关联的交易链;
根据所述黑种子关联的交易链,确定第一资金链;所述第一资金链为所述黑种子关联的资金链;
确定所述第一资金链中每一笔交易的风险度,并将所述第一资金链中风险度低于预设风险度的交易剔除,得到第二资金链;
根据所述第二资金链,确定所述黑种子所在的资金链团伙。
2.根据权利要求1所述的方法,其中,所述根据全域交易数据,确定所述黑种子关联的交易链,包括:
从所述全域交易数据中提取出最近预设时间段内的交易数据;
将所述最近预设时间段内的交易数据转化为对应的交易图谱;其中,所述交易图谱中的节点为客户,节点之间的边为具有交易关系的客户之间的交易信息,所述交易信息中包括交易金额;
对所述交易图谱中与所述黑种子有关的交易资金的流转进行追踪,得到所述黑种子关联的交易链。
3.根据权利要求1所述的方法,其中,所述根据所述黑种子关联的交易链,确定第一资金链,包括:
在所述黑种子关联的交易链中,将交易双方的客户均相同的各笔交易的交易资金进行汇总,得到所述第一资金链。
4.根据权利要求1所述的方法,其中,所述确定所述第一资金链中每一笔交易的风险度,包括:
采用有向边注意力的双表征模型确定所述第一资金链中每一笔交易的风险度;所述有向边注意力的双表征模型为基于邻域节点信息和邻域边信息对节点产生的影响而进行机器学习所得到的网络模型。
5.根据权利要求4所述的方法,其中,所述采用有向边注意力的双表征模型确定所述第一资金链中每一笔交易的风险度,包括:
根据邻域节点信息和邻域边信息,确定所述第一资金链中每一个目标节点和每一个源节点的表征向量;在所述第一资金链的一笔交易中,交易方向为从源节点指向目标节点;
根据各个目标节点和各个源节点的表征向量,确定所述黑种子关联的交易链中每一笔交易的风险度。
6.根据权利要求5所述的方法,其中,所述根据邻域节点信息和邻域边信息,确定所述第一资金链中每一个目标节点和每一个源节点的表征向量,包括:采用多次迭代过程对每一个目标节点和每一个源节点的表征向量进行更新,每一次迭代过程包括:
确定每一个目标节点和每一个源节点在本次迭代过程中的初始表征向量;
针对每一个目标节点,根据该目标节点关联的各个源节点的初始表征向量和该目标节点的初始表征向量,计算邻域节点对该目标节点的注意力矩阵;
针对每一个源节点,根据该源节点关联的各个目标节点的初始表征向量和该源节点的初始表征向量,计算邻域节点对该源节点的注意力矩阵;
确定所述目标节点连接的每一个边的初始表征向量和每一个源节点连接的每一个边的初始表征向量;
针对每一个目标节点,根据该目标节点连接的各个边的初始表征向量和该目标节点的初始表征向量,计算邻域边对该目标节点的注意力矩阵;
针对每一个源节点,根据该源节点连接的各个边的初始表征向量和该源节点的初始表征向量,计算邻域边对该源节点的注意力矩阵;
针对每一个目标节点,根据邻域节点对该目标节点的注意力矩阵和邻域边对该目标节点的注意力矩阵,确定该目标节点在本次迭代过程中的最终表征向量;
针对每一个源节点,根据邻域节点对该源节点的注意力矩阵和邻域边对该源节点的注意力矩阵,确定该源节点在本次迭代过程中的最终表征向量。
7.根据权利要求1所述的方法,其中,所述根据所述第二资金链,确定所述黑种子所在的资金链团伙,包括:
针对每一个目标状态,判断该目标状态对应的第二资金链的条数是否大于1;各条所述第二资金链的初始状态均为所述黑种子,所述目标状态为各条所述第二资金链中未与所述黑种子相邻连接的节点;
若是,则确定该目标状态对应的各条第二资金链中的最佳资金链,并保留所述最佳资金链;
否则,保留该目标状态对应的第二资金链;
根据针对各个目标状态所保留的第二资金链,确定所述黑种子所在的资金链团伙。
8.根据权利要求7所述的方法,其中,所述根据针对各个目标状态所保留的第二资金链,确定所述黑种子所在的资金链团伙,包括:
判断各条第二资金链中是否存在仅由两个节点形成的第二资金链;所述两个节点中包括所述黑种子;
若是,则根据针对各个目标状态所保留的第二资金链和仅由两个节点形成的第二资金链,确定所述黑种子所在的资金链团伙;
否则,根据针对各个目标状态所保留的第二资金链,确定所述黑种子所在的资金链团伙。
9.根据权利要求7所述的方法,其特征在于,所述确定该目标状态对应的各条第二资金链中的最佳资金链,包括:
根据各条所述第二资金链中各笔交易的风险度,构建回报矩阵;
针对该目标状态,构建初始的Q矩阵,并根据所述回报矩阵对所述Q矩阵进行迭代更新,直到所述Q矩阵满足收敛条件;
在满足所述收敛条件的Q矩阵中选择出最大值,并将所述最大值所对应的第二资金链作为该目标状态对应的各条第二资金链中的最佳资金链。
10.一种资金链团伙识别装置,包括:
第一获取模块,用于获取预先确定的黑种子;所述黑种子为经过审理认定为有洗钱风险的客户;
第一确定模块,用于根据全域交易数据,确定所述黑种子关联的交易链;
第二确定模块,用于根据所述黑种子关联的交易链,确定第一资金链;所述第一资金链为所述黑种子关联的资金链;
第三确定模块,用于确定所述第一资金链中每一笔交易的风险度,并将所述第一资金链中风险度低于预设风险度的交易剔除,得到第二资金链;
第四确定模块,用于根据所述第二资金链,确定所述黑种子所在的资金链团伙。
11.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项所述的方法。
CN202210696589.8A 2022-06-20 2022-06-20 资金链团伙识别方法及装置、计算设备、介质 Pending CN115271939A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210696589.8A CN115271939A (zh) 2022-06-20 2022-06-20 资金链团伙识别方法及装置、计算设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210696589.8A CN115271939A (zh) 2022-06-20 2022-06-20 资金链团伙识别方法及装置、计算设备、介质

Publications (1)

Publication Number Publication Date
CN115271939A true CN115271939A (zh) 2022-11-01

Family

ID=83762308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210696589.8A Pending CN115271939A (zh) 2022-06-20 2022-06-20 资金链团伙识别方法及装置、计算设备、介质

Country Status (1)

Country Link
CN (1) CN115271939A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117236721A (zh) * 2023-11-09 2023-12-15 湖南财信数字科技有限公司 企业异常行为的监控方法、系统、计算机设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117236721A (zh) * 2023-11-09 2023-12-15 湖南财信数字科技有限公司 企业异常行为的监控方法、系统、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN110009093B (zh) 用于分析关系网络图的神经网络系统和方法
TWI759562B (zh) 用於識別異常交易社團的方法和裝置
CN109102393B (zh) 训练和使用关系网络嵌入模型的方法及装置
CN110782044A (zh) 多方联合训练图神经网络的方法及装置
Ye et al. Crowd trust: A context-aware trust model for worker selection in crowdsourcing environments
CN112785157B (zh) 风险识别系统的更新方法及装置、风险识别方法及装置
CN112580952A (zh) 用户行为风险预测方法、装置、电子设备及存储介质
CN111291229B (zh) 一种稠密多部子图的检测方法及系统
CN111967565B (zh) 用于进行风险评估的神经网络系统、方法及装置
CN111860865B (zh) 模型构建和分析的方法、装置、电子设备和介质
CN108564469A (zh) 区块链节点的画像数据获取方法、装置及计算设备
CN113361962A (zh) 基于区块链网络识别企业风险性的方法及装置
CN113240505B (zh) 图数据的处理方法、装置、设备、存储介质及程序产品
CN114626890A (zh) 一种基于图结构学习的异常用户检测方法
CN114187112A (zh) 账户风险模型的训练方法和风险用户群体的确定方法
CN113111930A (zh) 一种端到端的以太坊钓鱼账户检测方法和系统
CN115271939A (zh) 资金链团伙识别方法及装置、计算设备、介质
CN113537960A (zh) 一种异常资源转移链路的确定方法、装置和设备
CN114240659A (zh) 一种基于动态图卷积神经网络的区块链异常节点识别方法
CN113821827B (zh) 保护多方数据隐私的联合建模方法及装置
CN111260372B (zh) 资源转移用户群确定方法、装置、计算机设备和存储介质
CN111340102B (zh) 评估模型解释工具的方法和装置
CN117540376A (zh) 一种支持抗投毒和推理攻击的联邦学习方法及系统
CN112435034A (zh) 一种基于多网络图聚合的营销套利黑产的识别方法
CN114912927A (zh) 一种区块链反诈骗分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination