CN111126828A - 一种基于知识图谱的多层资金异常流向监控方法 - Google Patents
一种基于知识图谱的多层资金异常流向监控方法 Download PDFInfo
- Publication number
- CN111126828A CN111126828A CN201911321034.XA CN201911321034A CN111126828A CN 111126828 A CN111126828 A CN 111126828A CN 201911321034 A CN201911321034 A CN 201911321034A CN 111126828 A CN111126828 A CN 111126828A
- Authority
- CN
- China
- Prior art keywords
- account
- transaction
- fund
- graph
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于知识图谱的多层资金异常流向监控方法。首先对一段时间内的交易流水数据进行预处理;然后提取交易流水中涉及的账户集合,对集合中的账户打上不同标签,并对交易流水数据进行聚合处理,展示主账户与交易对手账户在一段时间内的累计交易金额和累计交易次数,不仅大大提高知识图谱运行性能,还清晰展示了账户主体在一段时间内的资金流向;最后将处理好的数据导入知识图谱,通过图规则识别账户多层资金流转情况,从而找到可疑账户集合;同时通过知识图谱可视化功能展示可疑账户资金流向。本发明首次将知识图谱规则用于银行案防领域多层资金异常流向监控,能够有效识别多层资金异常流向的可疑账户并利用可视化技术协助验证与核查。
Description
技术领域
本发明属于资金流向分析领域,尤其涉及一种基于知识图谱的多层资金异常流向监控方法。
背景技术
近年来,我国金融操作风险案件呈现多发、高发态势,多家银行相继曝出涉案金额巨大的运营风险案件,有关银行在业务操作方面的案件屡屡发生,且运营操作风险方面的案情日趋复杂,作案手法隐秘。运营操作风险案件频发,造成了巨大的经济损失和社会影响,给银行业稳健运营带来全新挑战。如何针对银行业不同场景的案件进行有效防控,已经成为了一个迫切需要解决的问题。针对金融操作风险案件,银行一般结合业务经验和银行工作流程对案件特征进行剖析,利用交易数据来分析资金的流向。银行传统的资金流向分析是通过SQL加工的规则来描述账户间的资金往来情况,加工流程漫长,加工逻辑复杂,而且加工出来的规则无法精准刻画资金往来的特点,其存在一系列问题,比如1)开发效率低,尤其是识别复杂资金往来关系的规则实现相当复杂;2)精准度低,SQL规则细粒度不足,账户的资金流向关系无法精准识别;3)识别不全,由于资金流向的不确定性,无法完整刻画账户的多层资金流向。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于知识图谱的多层资金异常流向监控方法,充分发挥知识图谱的优势,通过知识图谱规则对账户进行资金流向关系分析,能更精准、全面的识别出账户的异常资金往来情况。
本发明是通过以下方案来实现的:一种基于知识图谱的多层资金异常流向监控方法,该方法包括以下步骤:
步骤1、对一段时间T1内的交易流水数据进行预处理,剔除脏数据;
步骤2、梳理交易流水数据中资金交易流向,统一交易主体;
步骤3、提取梳理后的交易流水中涉及的账户集合,对集合中的账户打上不同标签,作为知识图谱的节点;将进行过资金往来的节点按照资金流向形成知识图谱的有向边;
步骤4、对知识图谱的节点与边进行筛选处理,并进行知识图谱的构建;
步骤5、通过步骤4构建的知识图谱,利用图规则对所有账户进行多层资金流向分析,筛选出涉及可疑资金交易的账户集合;
步骤6、通过构建的知识图谱可视化展示功能,基于步骤5中筛选的可疑账户集合,对可疑账户的多层交易资金流向进行可视化展示。
进一步地,所述步骤1中,所述交易流水数据中包括交易流水号、主账户代号、交易对手账户代号、借贷标识、交易时间、交易金额等;所述预处理包括缺失值处理、异常值处理、数据逻辑错误处理、数据标准化处理、数据格式内容处理、去重处理中的一种或多种。
进一步地,所述步骤2中,所述梳理资金交易流向,即获得主账户到对手账户的资金流向,将带有借贷标识的原始交易流水表转换为包含借方账户和贷方账户的交易流水表;所述统一交易主体,即以账户维度作为多层资金流向的主体。
进一步地,所述步骤3中,对交易流水数据进行聚合处理,将借方账户与贷方账户在一段时间内的累计交易金额和累计交易次数作为知识图谱的边属性。
进一步地,所述步骤3中,所述账户标签即账户的属性,账户属性包括账户类型;可以根据业务代号判断账户类型,也可以利用账户集合表分别关联账户表获得账户属性;一个账户可以同时包含多个属性。
进一步地,所述步骤3中,所述账户标签即账户的属性,账户属性包括账户的固有属性和账户的外部属性,所述固有属性包括账户类型、账户开户地区、开户日期等,所述外部属性包括是否可疑非法集资账户、是否过渡资金账户等;其中账户的固有属性一般可以从原数据中获取,如账户类型可以根据业务代号判断,也可以利用账户集合表分别关联账户表获得;而账户的外部属性则需要结合账户的历史交易行为进行分析,判断账户是否具有该类外部属性。一般地,一个账户可以同时包含多个属性。
进一步地,所述步骤4中,所述筛选处理包括对节点的处理以及对边的处理;对节点的处理包括去重处理、剔除带有资金池属性的账户处理;对边的处理包括根据边属性剔除小额、低频的无风险交易。
进一步地,所述步骤4中,将处理好的节点数据和边数据导入知识图谱中,导入方式包括在线导入和离线导入;所述在线导入即在知识图谱服务在线的情况下通过LOAD CSV的方式导入数据;所述离线导入即在知识图谱服务离线的情况下通过IMPORT CSV的方式导入数据。
进一步地,所述步骤5中,所述图规则即基于知识图谱中资金往来链路设定的规则,包括主体账户、过渡账户、目标账户以及资金链路层数;所述主体账户即知识图谱资金链路的起点;所述目标账户即知识图谱资金链路的终点;所述过渡账户即知识图谱资金链路中主体账户与目标账户之间的账户;所述资金链路层数即主体账户与目标账户之间边的条数。
进一步地,对主体账户先进行规则筛选,对剩余的主体账户利用图规则进行多层资金流向分析,从而减少主体账户集合的数量,提升知识图谱资金流向分析的速度;所述规则筛选即通过数据分析和业务分析,利用规则将大部分无风险的主体账户剔除,保留少量可疑主体账户的过程。
进一步地,设置时间T2作为知识图谱边聚合的时间窗口,且T2时间窗口在不需重新构建知识图谱的前提下能够支持随时切换,做到在线更新知识图谱;所述知识图谱能够支持在线数据导入以及流式数据切片计算功能,能够根据选取的T2时间窗口实时计算T2时间段内账户之间的累计交易金额、累计交易次数等属性,并将计算完成的结果用于构建T2时间窗口的知识图谱。
本发明的有益效果:本发明首次将知识图谱规则应用于多层资金异常流向场景的监控,利用知识图谱规则及可视化的功能,找到资金流向异常的可疑账户并进行验证和落实。充分发挥知识图谱对于资金流向关系描述的全面性与灵活性,能更精准、全面的把可疑账户识别出来。其特点包括:
1)通过知识图谱识别存在异常交易资金往来的可疑账户,灵活性更高,能够遍历所有账户所有可能的风险交易;
2)通过知识图谱可视化展示功能,将账户间的可疑资金往来展示出来,便于核查与验证。在涉及多层资金流向的场景中,该方法具有极大的研究意义和使用价值。
附图说明
图1是本发明之较佳实施例中异常资金往来示意图;
图2是本发明之较佳实施例中规则筛选及知识图谱规则匹配示意图;
图3是本发明之较佳实施例中设置知识图谱边聚合时间窗口示意图;
图4是本发明之较佳实施例中异常资金往来的知识图谱可视化展示图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述,以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明提出的一种基于知识图谱的多层资金异常流向监控方法,该方法包括以下步骤:
步骤1、对一段时间T1内的交易流水数据进行预处理,剔除脏数据。
所述T1时间范围一般为1年,可选地,还可以为6个月,3个月,1个月等;
所述交易流水数据中包括交易流水号、主账户代号、交易对手账户代号、借贷标识、交易时间、交易金额等,可选地,还可以包括交易渠道、交易代码、交易描述、主账户客户代号等信息;
所述预处理具体包括缺失值处理、异常值处理、数据逻辑错误处理、数据标准化处理等,可选地,还可以包括数据格式内容处理、去重处理等。
步骤2、梳理交易流水数据中资金交易流向,统一交易主体。
所述梳理资金交易流向,即获得主账户到对手账户的资金流向,将带有借贷标识的原始交易流水表转换为包含借方账户和贷方账户的交易流水表。梳理后的交易流水表中借方账户表示资金转出方,贷方账户表示资金接收方。
所述原始交易流水表主要包括交易流水号、主账户代号、交易对手账户代号、借贷标识、交易时间、交易金额等信息,具体结构如下表所示:
交易流水号 | 主账户代号 | 对手账户代号 | 借贷标识 | 交易时间 | 交易金额 |
1 | A | B | 借 | *** | *** |
2 | A | C | 贷 | *** | *** |
3 | D | A | 贷 | *** | *** |
梳理后的交易流水表如下表所示:
交易流水号 | 借方账户代号 | 贷方账户代号 | 交易时间 | 交易金额 |
1 | A | B | *** | *** |
2 | C | A | *** | *** |
3 | A | D | *** | *** |
所述统一交易主体,即以账户维度作为多层资金流向的主体,可选地,交易主体还有客户维度、银行卡维度等。一般地,一个客户可以拥有多张银行卡,一张银行卡可以拥有多个账户,账户是体现一个交易主体的最低维度,而且交易流水表中一般以账户作为区分交易往来双方的身份,因此以账户维度作为交易主体更便于多层资金流向的分析。
步骤3、提取梳理后的交易流水中涉及的账户集合,对集合中的账户打上不同标签,作为知识图谱的节点;将进行过资金往来的节点按照资金流向形成知识图谱的有向边。
优选地,对交易流水数据进行聚合处理,将借方账户与贷方账户在一段时间T1内的累计交易金额和累计交易次数作为知识图谱的边属性。
所述账户标签即账户的属性,账户属性包括账户的固有属性和账户的外部属性;
所述固有属性包括账户类型、账户开户地区、开户日期等,所述账户类型包括对公活期账户、对公定期账户、个人活期账户、个人定期账户、内部账户、行外账户等,账户的固有属性一般可以从原数据中获取,如账户代号中包含了开户地区、开户机构、业务代号等信息,我们可以根据业务代号判断账户所属的类型;可选地,我们还可以利用账户集合表分别关联对公活期账户、对公定期账户等账户表获得账户的属性。
所述外部属性包括是否可疑非法集资账户、是否过渡资金账户等,账户的外部属性需要结合账户的历史交易行为进行分析,判断账户是否具有该类外部属性。
当然,一个账户还可以同时包含多个属性,如:账户类型、账户开户机构、是否股票账户、是否p2p员工账户、是否资金充足账户、是否过渡账户等等。这些属性我们可以根据账户的户名、科目代号、账户历史交易行为等信息加工而来。加工完成后的节点表和边表分别如下所示:
节点表
边表
所述知识图谱节点和边是知识图谱的主要组成部分,知识图谱节点是资金流向研究的主体,是所有图规则筛选后的最终产物;知识图谱边是节点与节点之间的关系描述,代表着节点之间的资金往来关系。通过节点与边的组合,实现对所有交易资金的来源及去向的描述,并能够可视化地展示出来。
步骤4、对知识图谱的节点与边进行筛选处理,并将筛选之后的节点与边用于知识图谱的构建。
所述筛选处理包括对节点的处理以及对边的处理;对节点的处理包括去重处理、剔除带有资金池属性的账户处理;所述带有资金池属性的账户即当资金流入该账户之后,我们无法通过交易明细、交易摘要、交易用途等信息判断资金最终走向的账户,这类账户包括支付宝、财付通、微信支付、备付金、银行内部账户等,这一类账户不仅严重影响知识图谱的运算性能,而且还会影响知识图谱规则的准确性,因此建议剔除;对边的处理包括根据累计交易金额、累计交易次数等边属性剔除小额、低频的无风险交易,这样可以大大减少知识图谱计算的数据量,提升计算效率。
数据筛选完成之后即可将数据以特定格式导入知识图谱之中,所述特定格式的节点表和边表如下所示:
特定格式节点表
特定格式边表
:START_ID | :END_ID | TRADE_CNT | TRADE_AMT | … | :TYPE |
********** | ********** | 10 | 1000000 | … | TRADE |
********** | ********** | 2 | 2000000 | … | TRADE |
********** | ********** | 15 | 1400000 | … | TRADE |
所述知识图谱的构建即将处理好的节点数据和边数据导入知识图谱之中,目前导入方式主要分为在线导入和离线导入两种,所述在线导入即在知识图谱服务在线的情况下通过LOAD CSV的方式导入数据,其优点在于稳定性高,不需停止知识图谱服务,操作简单,但缺点在于导入速度慢;所述离线导入即在知识图谱服务离线的情况下通过IMPORT CSV的方式导入数据,其优点在于导入速度快,但其缺点在于操作复杂,涉及知识图谱服务启停操作,具有一定风险。一般地,在大数据量情况下,建议离线导入方式,小数据量情况下在线导入即可。
步骤5、通过步骤4构建的知识图谱,利用图规则对所有账户进行多层资金流向分析,筛选出涉及可疑资金交易的账户集合。
所述图规则即基于知识图谱中资金往来链路设定的规则,该类规则主要用于刻画涉及多层交易资金流向的情况,能够精准识别存在风险的多层资金往来链路;
在本发明基于知识图谱的多层资金异常流向监控方法中,图规则一般包括主体账户、过渡账户、目标账户以及资金链路层数,可选地,还可以包括知识图谱的边,通过对知识图谱边属性的阈值进行调整,能够有效减少多层资金流向分析中涉及的资金链路数量;
所述主体账户即知识图谱资金链路的起点,它是我们进行多层资金异常流向分析的主要研究对象,一旦主体账户触发了图规则,将被视为可疑账户交予核查人员审核;
所述目标账户即知识图谱资金链路的终点,所有的资金流向目标账户时即停止扩散;
所述过渡账户即知识图谱资金链路中主体账户与目标账户之间的账户,该类账户是资金转移的桥梁;
所述资金链路的层数即主体账户与目标账户之间边的条数,当边的条数大于1时即为多层资金交易往来链路。
图1所示即为图规则具体的匹配模式,图中B即为主体账户,C1-C5以及D1-D5即为过渡账户,D6即为目标账户,主体账户与目标账户之间的边即为资金链路的层数,过渡账户之间的虚线表示中间有N层链路(N>=0)。在上图中,当N=0时,主体账户B可以通过C1过渡账户转移资金给目标账户,也可以通过D1过渡账户转移资金给目标账户;当N=1时,主体账户B可以通过C1过渡账户到C2过渡账户再将资金转移给目标账户,主体账户B还可以通过D1过渡账户到D2过渡账户再将资金转移给目标账户;更一般地,当中间有N层交易关系时,主体账户B有非常多的方式将资金转移给目标账户,而在实际生产中的交易资金往来关系远远比上图所示复杂。资金流向分析传统的做法是利用SQL加工的规则去尝试追溯资金的来源及去向,但是由于资金交易流向的不确定性,当涉及到多层资金流向分析的场景时,通过SQL加工的规则往往难以刻画完整的资金路径;而知识图谱的优势在于其囊括了所有的资金往来情况,我们只需要定义好主体账户、过渡账户、目标账户以及资金链路的层数,即可精准地筛选出有风险的多层资金交易链路。
步骤6、通过构建的知识图谱可视化展示功能,基于步骤5中筛选的可疑账户集合,对可疑账户的多层交易资金流向进行可视化展示,协助核查人员验证交易流水是否正常。
进一步地,对主体账户先进行规则筛选,对剩余的主体账户利用图规则进行多层资金流向分析,能够有效提升知识图谱规则运行性能。如在非法集资场景中,主体账户首先需要归集资金,然后再将归集的资金进行转移。主体账户归集资金的过程具有非常明显的特征,如:主体账户近X时间贷方交易为个人的交易对手数量非常多,且主账户近X时间贷方交易对手所属地区分散不一,且主账户近X时间与个人的累计交易金额较大,且交易频繁等。通过规则筛选可以大大降低主体账户的数量,那么在利用图规则进行多层资金流向分析时消耗的资源就会更低,运算的速度就会更快。
如图2所示,规则筛选中A1-A5即为被归集账户,B即为主体账户,知识图谱规则匹配部分与权利要求1所述相同。所述规则筛选即通过数据分析和业务分析,利用规则将大部分无风险的主体账户剔除,保留少量可疑主体账户的过程。在将主体账户放入知识图谱进行多层资金异常流向分析之前,先通过规则筛选出具有可疑归集资金的账户集合,能够减少主体账户集合的数量,从而提升知识图谱资金流向分析的速度。
进一步地,时间T1一般为1年,可选地,还可以为6个月,3个月,1个月等。但是时间T1在进行知识图谱构建时必须确定一个具体的数值,如T1取为1年,则在构建关联图谱时不能更改,当需要更改知识图谱边T1时,只能重新构建关联图谱。当T1的跨度选取过大或者过小时,都会导致知识图谱无法结合场景特征进行灵活的资金流向分析。所述场景特征即在发生资金往来过程中存在的模式,如:洗钱过程中参与资金转移的过渡账户,其在接收到资金之后,可能1天内就将资金转移走,也有可能3天内将资金转移走,更一般地,过渡账户可能在N天内将资金转移。此时,当关联图谱的T1选取太小,我们可能无法查看到过渡账户转移资金的交易,当关联图谱的T1选取过大,我们通过知识图谱查看到的过渡账户转移资金的行为缺乏时效性和准确性。为此设置T2时间作为知识图谱边聚合的时间窗口,且T2时间窗口在不需重新构建知识图谱的前提下能够支持随时切换,做到在线更新知识图谱,其示意图如图3所示。
图3所示的主体账户、过渡账户和目标账户之间的边聚合时间窗口T2能够在不需重新构建知识图谱的前提下支持随时切换,这就需要知识图谱能够支持在线数据导入以及流式数据切片计算的功能,能够根据选取的T2时间窗口实时计算T2时间段内账户之间的累计交易金额、累计交易次数等属性,并将计算完成的结果用于构建T2时间窗口的知识图谱。
在满足时间窗口随时切换的功能之后,当我们在分析洗钱过程中的转移账户转移资金的情况时,我们就可以通过切换T2时间窗口来获取过渡账户的资金转移对象,从而准确定位异常的资金流向链路。
假设我们有一个如附图1所示的异常资金往来场景,该场景描述的是一个主体账户将大额的资金通过过渡账户转移至目标账户,从而实现洗钱的目的。由于资金转移过程中经过了多层过渡账户,其资金链路很难通过利用SQL加工的传统规则进行完整刻画,因此需要借助知识图谱的技术来分析该场景的资金流向,其具体实施步骤如下:
步骤1、数据准备:对一段时间内的交易流水数据进行预处理,剔除脏数据,梳理资金交易流向,统一交易主体;提取交易流水中涉及的账户集合,对集合中的账户打上不同标签,作为知识图谱的节点;对交易流水数据进行聚合处理,展示主账户与交易对手账户在一段时间内的累计交易金额和累计交易次数,作为知识图谱的边;
步骤2、数据导入:以交易流水涉及账户为节点,累计交易为边,对节点与边进行去重处理,并通过离线的方式将准备好的数据导入知识图谱,完成图谱的构建;
步骤3、图规则匹配:利用图规则对交易流水涉及的所有账户进行异常资金流向检测,筛选可疑账户集合;
步骤5、路径分析:通过构建的知识图谱可视化展示功能,对可疑账户的异常交易资金流向进行分析,协助核查人员验证交易流水是否正常。
可疑账户可视化实例如图4所示,该场景是一个主体账户(B)在归集了众多个人账户(C)的资金之后,将大额的资金转移到另外一个个人账户用于炒股(D为股票账户)。通过可视化图谱与历史交易流水数据相结合的方式,确定最终有问题的归集账户。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员在不脱离本发明的精神和范围的情况下,还可以作出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (10)
1.一种基于知识图谱的多层资金异常流向监控方法,其特征在于,该方法包括以下步骤:
步骤1、对一段时间T1内的交易流水数据进行预处理,剔除脏数据;
步骤2、梳理交易流水数据中资金交易流向,统一交易主体。
步骤3、提取梳理后的交易流水中涉及的账户集合,对集合中的账户打上不同标签,作为知识图谱的节点;将进行过资金往来的节点按照资金流向形成知识图谱的有向边;
步骤4、对知识图谱的节点与边进行筛选处理,并进行知识图谱的构建。
步骤5、通过步骤4构建的知识图谱,利用图规则对所有账户进行多层资金流向分析,筛选出涉及可疑资金交易的账户集合。
步骤6、通过构建的知识图谱可视化展示功能,基于步骤5中筛选的可疑账户集合,对可疑账户的多层交易资金流向进行可视化展示。
2.根据权利要求1所述的在一种基于知识图谱的多层资金异常流向监控方法,其特征在于,所述步骤1中,所述交易流水数据中包括交易流水号、主账户代号、交易对手账户代号、借贷标识、交易时间、交易金额等;所述预处理包括缺失值处理、异常值处理、数据逻辑错误处理、数据标准化处理、数据格式内容处理、去重处理中的一种或多种。
3.根据权利要求1所述的在一种基于知识图谱的多层资金异常流向监控方法,其特征在于,所述步骤2中,所述梳理资金交易流向,即获得主账户到对手账户的资金流向,将带有借贷标识的原始交易流水表转换为包含借方账户和贷方账户的交易流水表;所述统一交易主体,即以账户维度作为多层资金流向的主体。
4.根据权利要求1所述的在一种基于知识图谱的多层资金异常流向监控方法,其特征在于,所述步骤3中,对交易流水数据进行聚合处理,将借方账户与贷方账户在一段时间内的累计交易金额和累计交易次数作为知识图谱的边属性。
5.根据权利要求1所述的在一种基于知识图谱的多层资金异常流向监控方法,其特征在于,所述步骤3中,所述账户标签即账户的属性,账户属性包括账户的固有属性和账户的外部属性,所述固有属性包括账户类型、账户开户地区、开户日期等,所述外部属性包括是否可疑非法集资账户、是否过渡资金账户等;一个账户可以同时包含多个属性。
6.根据权利要求1所述的在一种基于知识图谱的多层资金异常流向监控方法,其特征在于,所述步骤4中,所述筛选处理包括对节点的处理以及对边的处理;对节点的处理包括去重处理、剔除带有资金池属性的账户处理;对边的处理包括根据边属性剔除小额、低频的无风险交易。
7.根据权利要求1所述的在一种基于知识图谱的多层资金异常流向监控方法,其特征在于,所述步骤4中,将处理好的节点数据和边数据导入知识图谱中,导入方式包括在线导入和离线导入;所述在线导入即在知识图谱服务在线的情况下通过LOAD CSV的方式导入数据;所述离线导入即在知识图谱服务离线的情况下通过IMPORT CSV的方式导入数据。
8.根据权利要求1所述的在一种基于知识图谱的多层资金异常流向监控方法,其特征在于,所述步骤5中,所述图规则即基于知识图谱中资金往来链路设定的规则,包括主体账户、过渡账户、目标账户以及资金链路层数;所述主体账户即知识图谱资金链路的起点;所述目标账户即知识图谱资金链路的终点;所述过渡账户即知识图谱资金链路中主体账户与目标账户之间的账户;所述资金链路层数即主体账户与目标账户之间边的条数。
9.根据权利要求1所述的在一种基于知识图谱的多层资金异常流向监控方法,其特征在于,对主体账户先进行规则筛选,对剩余的主体账户利用图规则进行多层资金流向分析,从而减少主体账户集合的数量,提升知识图谱资金流向分析的速度;所述规则筛选即通过数据分析和业务分析,利用规则将大部分无风险的主体账户剔除,保留少量可疑主体账户的过程。
10.根据权利要求1所述的一种基于知识图谱的多层资金异常流向监控方法,其特征在于,设置时间T2作为知识图谱边聚合的时间窗口,且T2时间窗口在不需重新构建知识图谱的前提下能够支持随时切换,做到在线更新知识图谱;所述知识图谱能够支持在线数据导入以及流式数据切片计算功能,能够根据选取的T2时间窗口实时计算T2时间段内账户之间的累计交易金额、累计交易次数等属性,并将计算完成的结果用于构建T2时间窗口的知识图谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911321034.XA CN111126828A (zh) | 2019-12-19 | 2019-12-19 | 一种基于知识图谱的多层资金异常流向监控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911321034.XA CN111126828A (zh) | 2019-12-19 | 2019-12-19 | 一种基于知识图谱的多层资金异常流向监控方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111126828A true CN111126828A (zh) | 2020-05-08 |
Family
ID=70500353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911321034.XA Pending CN111126828A (zh) | 2019-12-19 | 2019-12-19 | 一种基于知识图谱的多层资金异常流向监控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111126828A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111652718A (zh) * | 2020-07-09 | 2020-09-11 | 平安银行股份有限公司 | 基于关系网络图的价值流向监控方法、装置、设备和介质 |
CN111784495A (zh) * | 2020-06-04 | 2020-10-16 | 江苏常熟农村商业银行股份有限公司 | 担保圈识别方法、装置、计算机设备和存储介质 |
CN112199414A (zh) * | 2020-09-25 | 2021-01-08 | 桦蓥(上海)信息科技有限责任公司 | 一种金融交易数据的综合分析方法 |
CN112308565A (zh) * | 2020-08-14 | 2021-02-02 | 中国工商银行股份有限公司 | 基于知识图谱的多对多跨境资金风控方法及系统 |
CN112463893A (zh) * | 2020-11-13 | 2021-03-09 | 中科金审(北京)科技有限公司 | 一种网络资金的智能分析系统及方法 |
CN112465638A (zh) * | 2020-11-16 | 2021-03-09 | 中科金审(北京)科技有限公司 | 一种资金交易拆分组合的链路追踪的方法 |
CN112487208A (zh) * | 2020-12-14 | 2021-03-12 | 杭州安恒信息技术股份有限公司 | 一种网络安全数据关联分析方法、装置、设备及存储介质 |
CN112561698A (zh) * | 2020-12-10 | 2021-03-26 | 中信银行股份有限公司 | 交易链的确定方法、装置、电子设备及可读存储介质 |
CN112559771A (zh) * | 2020-12-23 | 2021-03-26 | 信雅达科技股份有限公司 | 基于知识图谱的资金交易智能监测方法及监测系统 |
CN112581270A (zh) * | 2020-12-15 | 2021-03-30 | 中国建设银行股份有限公司 | 风险账户的识别方法、装置、电子设备和存储介质 |
CN112598428A (zh) * | 2020-12-25 | 2021-04-02 | 北京知因智慧科技有限公司 | 交易数据的处理方法、装置、计算机设备及存储介质 |
CN112613867A (zh) * | 2020-12-25 | 2021-04-06 | 厦门市美亚柏科信息股份有限公司 | 一种基于账单交易记录的异常资金分析方法和系统 |
CN112669146A (zh) * | 2020-12-17 | 2021-04-16 | 南京森林警察学院 | 交易数据的分析及展示方法 |
CN112884478A (zh) * | 2021-01-26 | 2021-06-01 | 支付宝(杭州)信息技术有限公司 | 一种数据处理方法、装置及设备 |
CN113204585A (zh) * | 2021-04-27 | 2021-08-03 | 中电通途(北京)科技有限公司 | 使用资金块映射表示资金流向的方法、装置以及存储介质 |
CN113379540A (zh) * | 2020-11-09 | 2021-09-10 | 中科金审(北京)科技有限公司 | 资金数据分析系统 |
CN113537960A (zh) * | 2021-07-19 | 2021-10-22 | 中国工商银行股份有限公司 | 一种异常资源转移链路的确定方法、装置和设备 |
CN113538137A (zh) * | 2021-07-29 | 2021-10-22 | 中国工商银行股份有限公司 | 一种基于双图谱融合计算的资金流监控方法及装置 |
TWI767765B (zh) * | 2021-06-24 | 2022-06-11 | 中國信託商業銀行股份有限公司 | 可疑金流偵測系統 |
WO2023065870A1 (zh) * | 2021-10-20 | 2023-04-27 | 腾讯科技(深圳)有限公司 | 资源转移信息检测方法、装置、设备和存储介质 |
CN116167852A (zh) * | 2023-04-19 | 2023-05-26 | 苏州傲林科技有限公司 | 资金流向数据处理方法及装置 |
WO2024093960A1 (zh) * | 2022-11-01 | 2024-05-10 | 马上消费金融股份有限公司 | 异常交易应对策略的验证方法和验证装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543096A (zh) * | 2018-10-15 | 2019-03-29 | 平安科技(深圳)有限公司 | 数据查询方法、装置、计算机设备和存储介质 |
CN110033279A (zh) * | 2019-04-04 | 2019-07-19 | 银清科技(北京)有限公司 | 基于知识图谱技术的可疑账户交易确认方法及装置 |
-
2019
- 2019-12-19 CN CN201911321034.XA patent/CN111126828A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543096A (zh) * | 2018-10-15 | 2019-03-29 | 平安科技(深圳)有限公司 | 数据查询方法、装置、计算机设备和存储介质 |
CN110033279A (zh) * | 2019-04-04 | 2019-07-19 | 银清科技(北京)有限公司 | 基于知识图谱技术的可疑账户交易确认方法及装置 |
Non-Patent Citations (3)
Title |
---|
秦学志;李静一;: "基于大数据样本的银行异常账户监测方法", no. 04 * |
糖猫~~: "2:"通过例子详细介绍windows 下如何往neo4j 中导入数据(Load_csv、import)"", pages 1 - 2, Retrieved from the Internet <URL:https://blog.csdn.net/weixin_43986252/article/details/92829827> * |
糖猫~~: "通过例子详细介绍windows下如何往neo4j中导入数据(Load_csv、import)", pages 1 - 2 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784495A (zh) * | 2020-06-04 | 2020-10-16 | 江苏常熟农村商业银行股份有限公司 | 担保圈识别方法、装置、计算机设备和存储介质 |
CN111784495B (zh) * | 2020-06-04 | 2021-05-04 | 江苏常熟农村商业银行股份有限公司 | 担保圈识别方法、装置、计算机设备和存储介质 |
CN111652718A (zh) * | 2020-07-09 | 2020-09-11 | 平安银行股份有限公司 | 基于关系网络图的价值流向监控方法、装置、设备和介质 |
CN112308565A (zh) * | 2020-08-14 | 2021-02-02 | 中国工商银行股份有限公司 | 基于知识图谱的多对多跨境资金风控方法及系统 |
CN112199414A (zh) * | 2020-09-25 | 2021-01-08 | 桦蓥(上海)信息科技有限责任公司 | 一种金融交易数据的综合分析方法 |
CN112199414B (zh) * | 2020-09-25 | 2023-03-21 | 桦蓥(上海)信息科技有限责任公司 | 一种金融交易数据的综合分析方法 |
CN113379540A (zh) * | 2020-11-09 | 2021-09-10 | 中科金审(北京)科技有限公司 | 资金数据分析系统 |
CN112463893A (zh) * | 2020-11-13 | 2021-03-09 | 中科金审(北京)科技有限公司 | 一种网络资金的智能分析系统及方法 |
CN112465638A (zh) * | 2020-11-16 | 2021-03-09 | 中科金审(北京)科技有限公司 | 一种资金交易拆分组合的链路追踪的方法 |
CN112561698A (zh) * | 2020-12-10 | 2021-03-26 | 中信银行股份有限公司 | 交易链的确定方法、装置、电子设备及可读存储介质 |
CN112487208A (zh) * | 2020-12-14 | 2021-03-12 | 杭州安恒信息技术股份有限公司 | 一种网络安全数据关联分析方法、装置、设备及存储介质 |
CN112581270A (zh) * | 2020-12-15 | 2021-03-30 | 中国建设银行股份有限公司 | 风险账户的识别方法、装置、电子设备和存储介质 |
CN112669146A (zh) * | 2020-12-17 | 2021-04-16 | 南京森林警察学院 | 交易数据的分析及展示方法 |
CN112559771A (zh) * | 2020-12-23 | 2021-03-26 | 信雅达科技股份有限公司 | 基于知识图谱的资金交易智能监测方法及监测系统 |
CN112613867A (zh) * | 2020-12-25 | 2021-04-06 | 厦门市美亚柏科信息股份有限公司 | 一种基于账单交易记录的异常资金分析方法和系统 |
CN112598428A (zh) * | 2020-12-25 | 2021-04-02 | 北京知因智慧科技有限公司 | 交易数据的处理方法、装置、计算机设备及存储介质 |
CN112613867B (zh) * | 2020-12-25 | 2022-08-19 | 厦门市美亚柏科信息股份有限公司 | 一种基于账单交易记录的异常资金分析方法和系统 |
CN112884478A (zh) * | 2021-01-26 | 2021-06-01 | 支付宝(杭州)信息技术有限公司 | 一种数据处理方法、装置及设备 |
CN113204585A (zh) * | 2021-04-27 | 2021-08-03 | 中电通途(北京)科技有限公司 | 使用资金块映射表示资金流向的方法、装置以及存储介质 |
TWI767765B (zh) * | 2021-06-24 | 2022-06-11 | 中國信託商業銀行股份有限公司 | 可疑金流偵測系統 |
CN113537960A (zh) * | 2021-07-19 | 2021-10-22 | 中国工商银行股份有限公司 | 一种异常资源转移链路的确定方法、装置和设备 |
CN113538137A (zh) * | 2021-07-29 | 2021-10-22 | 中国工商银行股份有限公司 | 一种基于双图谱融合计算的资金流监控方法及装置 |
WO2023065870A1 (zh) * | 2021-10-20 | 2023-04-27 | 腾讯科技(深圳)有限公司 | 资源转移信息检测方法、装置、设备和存储介质 |
WO2024093960A1 (zh) * | 2022-11-01 | 2024-05-10 | 马上消费金融股份有限公司 | 异常交易应对策略的验证方法和验证装置 |
CN116167852A (zh) * | 2023-04-19 | 2023-05-26 | 苏州傲林科技有限公司 | 资金流向数据处理方法及装置 |
CN116167852B (zh) * | 2023-04-19 | 2023-07-04 | 苏州傲林科技有限公司 | 资金流向数据处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126828A (zh) | 一种基于知识图谱的多层资金异常流向监控方法 | |
CN111476660B (zh) | 一种基于数据分析的智能风控系统及方法 | |
CN105528447B (zh) | 一种对特定数据逐层边剔除边汇总的方法 | |
CN104915879A (zh) | 基于金融数据的社会关系挖掘的方法及装置 | |
CN103413242A (zh) | 一种非面对面交易中小企业信誉及融资信用标准系统 | |
CN102081781A (zh) | 基于信息自循环的金融建模优化方法 | |
CN112541817A (zh) | 一种个人消费贷款潜在客户的营销响应处理方法及系统 | |
CN106447490A (zh) | 一种基于用户画像的征信应用方法 | |
CN111833182A (zh) | 识别风险对象的方法和装置 | |
CN115526700A (zh) | 风险的预测方法、装置及电子设备 | |
Cheng et al. | Analysis of the application of big data in banking sector | |
Zarutska | Structural-functional analysis of the Ukraine banking system | |
CN112365352A (zh) | 一种基于图神经网络的反套现方法及装置 | |
CN112581271A (zh) | 一种商户交易风险监测方法、装置、设备及存储介质 | |
Wang et al. | Stock return prediction based on Bagging-decision tree | |
Mozumder et al. | An Examination of Bangladesh’s Current Situation with Regard to Non-Performing Loans (NPLs) and Its Effect on the Banking Sector | |
CN112767121A (zh) | 一种风险等级数据的处理方法和装置 | |
CN112634048A (zh) | 一种反洗钱模型的训练方法及装置 | |
CN112199360A (zh) | 一种数据的处理方法、装置、设备和介质 | |
CN112884259A (zh) | 跨企业信用评等及风险评估方法与系统 | |
CN109949145A (zh) | 一种基于复试记账法的每日账簿算法 | |
CN114240610B (zh) | 资金自动归集方法、装置、计算机设备和存储介质 | |
Chen et al. | Interest rate liberalization and firm leverage in China: Effects and channels | |
CN113837874B (zh) | 一种数据的识别方法、装置、存储介质及电子设备 | |
Chen et al. | Using rough set theory and decision trees to diagnose enterprise distress–consideration of corporate governance variables |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room ABCD, 17th floor, building D, Paradise Software Park, No.3 xidoumen Road, Xihu District, Hangzhou City, Zhejiang Province, 310012 Applicant after: Zhejiang Bangsheng Technology Co.,Ltd. Address before: Room ABCD, 17th floor, building D, Paradise Software Park, No.3 xidoumen Road, Xihu District, Hangzhou City, Zhejiang Province, 310012 Applicant before: ZHEJIANG BANGSUN TECHNOLOGY Co.,Ltd. |