CN110597871B - 数据处理方法、装置、计算机设备和计算机可读存储介质 - Google Patents
数据处理方法、装置、计算机设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN110597871B CN110597871B CN201910726924.2A CN201910726924A CN110597871B CN 110597871 B CN110597871 B CN 110597871B CN 201910726924 A CN201910726924 A CN 201910726924A CN 110597871 B CN110597871 B CN 110597871B
- Authority
- CN
- China
- Prior art keywords
- node
- account
- hop
- importance
- accounts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Abstract
本公开提供了一种数据处理方法、装置、计算机设备和计算机可读存储介质,属于计算机技术领域。所述方法包括:通过在资金流水图谱上,获取目标节点对应的账户的二跳子图,并根据二跳子图中各个节点之间的连线,获取该各个节点的有效出金,进而确定该各个节点的重要度并在可视化界面中对各个节点的重要度进行显示。该二跳子图中包括与目标节点有连线的节点以及与这些节点有连线的节点,也即是,该二跳子图包括了待分析账户的局部上下文,这样避免了单流水分析时信息不完全的问题,而重要度的可视化展示可以让使得使用者直观地看到资金流水情况,从而结合其专业知识,来对资金流水进行分析,减小了分析误差,保证了分析效果。
Description
技术领域
本公开涉及计算机技术领域,特别涉及一种数据处理方法、装置、计算机设备和计算机可读存储介质。
背景技术
近年来,随着经济的飞速发展,银行卡、自动取款机(automatic teller machine,ATM)、销售点情报管理系统(point of sales,POS)、网上银行、网络支付等现代化支付手段越来越普及,对资金流水进行分析成为一个重点研究项目。通过资金流水分析,来监测并处理交易数据,可以及时发现可疑资金流动情况。因此,亟需一种数据处理方法来进行资金流水分析。
发明内容
本公开实施例提供了一种数据处理方法、装置、计算机设备和计算机可读存储介质,可以解决相关技术中资金流水分析信息不完全的问题。所述技术方案如下:
第一方面,提供了一种数据处理方法,所述方法包括:
基于待分析的账户,从资金流水图谱中确定目标节点,该资金流水图谱中的每个节点代表一个账户,节点之间的连线代表账户之间的流水信息,该目标节点代表该账户;
在该资金流水图谱上,获取该目标节点对应的二跳子图;
根据该二跳子图中各个节点之间的连线,获取该各个节点的有效出金;
根据该各个节点的有效出金,确定该各个节点的重要度;
在可视化界面中,显示该各个节点的重要度。
资金流水是指在一段时间内,客户在银行、第三方支付账户中的存取款、转账、结息等业务交易清单明细,是对一定时期内资金进出和结余情况的综合反映,根据账户性质一般又分为对公流水和对私流水。
资金流水分析指对银行或第三方支付的资金流水数据进行进出分析,如流水真伪、交易频率、交易金额、交易对象、总交易量、日均余额、消费行为、提现位置和互联网地址等;可以用于个人和企事业单位的个人企业画像、征信分析、洗钱分析、内幕交易行为、企业经营状况分析等;在检察、海关、公安、银行、证券、第三方支付、小额贷款公司等得到广泛应用。资金流水分析在分析策略上,可以分为批量分析和分步分析;前者主要是拿到批量数据,一次性地分析得到分析结果;后者是分批次对数据进行分析,最终得到整体汇总分析结果。根据分析的自动化程度不同,可以分为全自动资金流水分析、半自动资金流水分析和全人工资金流水分析。全自动资金流水分析总体不需要人工参与,数据输入后,算法自动分析出结果,并进行可视化展现;半自动资金流水分析需要人工参与,算法与人工研判搭配,共同分析得出结果;全人工资金流水分析全程采用人工分析方法来分析数据,如采用目视解读流水数据,采用绘图软件手工画图实现分析研判,来得出分析结果。
子图是资金流水图谱的一部分,可以通过从资金流水图谱中删去一些点,或删去一些线,或既删去一些点又删去一些线来得到子图。
入金就是将资金转入当前账户中的过程,该资金可以用于日后进行交易;出金就是将当前账户中的资金转出到其他账户中的过程。
可视化界面是指监督机关,例如工作人员可以直接看到的界面,通过该界面工作人员可以结合自有知识分析资金流水情况,判断是否存在可以的资金流水。
通过在资金流水图谱上,获取目标节点对应的账户的二跳子图,并根据二跳子图中各个节点之间的连线,获取该各个节点的有效出金,进而确定该各个节点的重要度并在可视化界面中对各个节点的重要度进行显示。该二跳子图中包括与目标节点有连线的节点以及与这些节点有连线的节点,也即是,该二跳子图包括了待分析账户的局部上下文,这样避免了单流水分析时信息不完全的问题,而重要度的可视化展示可以让使得使用者直观地看到资金流水情况,从而结合其专业知识,来对资金流水进行分析,减小了分析误差,保证了分析效果。
在第一方面的第一种可能实现方式中,所述基于待分析的账户,从资金流水图谱中确定目标节点之前,所述方法还包括:
提取该多个账户,将每个账户映射为图谱中的一个节点;
根据该各个账户之间的流水信息,确定具有流水关系的账户对应的节点,按照账户之间的流水信息,将该具有流水关系的账户对应的节点之间进行连线,在连线上标注流水量和流水发生时间。
本公开实施例提供了一种具体将账户数据映射为图谱的方法,使得能够将复杂的账户之间的流通转换为图谱上节点和节点之间的连接等来表示,大大降低了分析难度,能够有效应用图分析的技术来实现后续的分析过程,提高分析的效率。
在第一方面的第二种可能实现方式中,所述在该资金流水图谱上,获取该目标节点对应的二跳子图包括:
在该资金流水图谱上,根据该目标节点的流水信息,查询该目标节点的祖父节点;
当该目标节点具有祖父节点时,从该资金流水图谱中,提取该目标节点到该祖父节点之间的子图,作为该二跳子图。
通过在该资金流水图谱上,获取该目标节点到该祖父节点之间的二跳子图,可以在保证分析的流水数据的完整性的同时,还能获取到与待分析账户相关度最高的信息,在降低数据处理量的同时,还提高了分析的准确性,保证了分析效果。
在第一方面的第三种可能实现方式中,所述基于待分析的账户,从资金流水图谱中确定目标节点之后,所述方法还包括:
当在该资金流水图谱上未获取到该目标节点对应的二跳子图时,获取该目标节点对应的一跳子图来执行重要度确定和显示的过程。
当该资金流水图谱上没有该目标节点对应的二跳子图时,通过获取该目标节点对应的一跳子图,仍然可以实现后续分析过程,完成重要度的确定,实现对资金流水的分析。
在第一方面的第四种可能实现方式中,所述根据该二跳子图中各个节点之间的连线,获取该各个节点的有效出金之后,所述方法还包括:
当该二跳子图中任一节点有指向该节点的上级节点的连线时,基于该连线所代表的流水信息,对该各个节点的有效出金进行调整,得到调整后的有效出金。
当该二跳子图中任一节点有指向该节点的上级节点的连线时,通过调整各个节点的有效出金,得到调整后的有效出金,可以更加准确地确定各个节点的重要度情况,减小分析误差。
在第一方面的第五种可能实现方式中,所述根据该各个节点的有效出金,确定该各个节点的重要度包括:
根据该各个节点的有效出金和流水发生时间,确定该各个节点的重要度。
通过根据各个节点的有效出金和流水发生时间,确定该各个节点的重要度,可以较为直接地判断各个节点的资金流水情况,进而确定资金流水存在可疑的节点对应的账户。
在第一方面的第六种可能实现方式中,所述在可视化界面中,显示该各个节点的重要度之后,所述方法还包括:
当检测到对该可视化界面中的任一节点的分析指令时,从该资金流水图谱中获取该节点对应账户的二跳子图。
通过监督机构工作人员在可视化界面继续选择需要分析的节点,再提取该节点对应账户的二跳子图,可以进一步监测可疑账户的资金流动情况。
第二方面,提供了一种数据处理装置,所述装置包括:
节点确定模块,用于基于待分析的账户,从资金流水图谱中确定目标节点;
子图获取模块,用于在该资金流水图谱上,获取该目标节点对应的二跳子图;
有效出金获取模块,用于根据该二跳子图中各个节点之间的连线,获取该各个节点的有效出金;
重要度确定模块,用于根据该各个节点的有效出金,确定该各个节点的重要度;
显示模块,用于在可视化界面中,显示该各个节点的重要度。
在第二方面的第一种可能实现方式中,所述装置还包括:
第一提取模块,用于提取该多个账户;
映射模块,用于将每个账户映射为图谱中的一个节点;
该节点确定模块,还用于根据该各个账户之间的流水信息,确定具有流水关系的账户对应的节点;
连线模块,用于按照账户之间的流水信息,将该具有流水关系的账户对应的节点之间进行连线;
标注模块,用于在连线上标注流水量和流水发生时间。
在第二方面的第二种可能实现方式中,所述装置还包括:
查询模块,用于在该资金流水图谱上,根据该目标节点的流水信息,查询该目标节点的祖父节点;
第二提取模块,用于当该目标节点具有祖父节点时,从该资金流水图谱中,提取该目标节点到该祖父节点之间的子图,作为该二跳子图。
在第二方面的第三种可能实现方式中,该子图获取模块,还用于当在该资金流水图谱上未获取到该目标节点对应的二跳子图时,获取该目标节点对应的一跳子图来执行重要度确定和显示的过程。
在第二方面的第四种可能实现方式中,所述装置还包括:
调整模块,用于当该二跳子图中任一节点有指向该节点的上级节点的连线时,基于该连线所代表的流水信息,对该各个节点的有效出金进行调整。
在第二方面的第五种可能实现方式中,该重要度确定模块,还用于根据该各个节点的有效出金和流水发生时间,确定该各个节点的重要度。
在第二方面的第六种可能实现方式中,该子图获取模块,还用于当检测到对该可视化界面中的任一节点的分析指令时,从该资金流水图谱中获取该节点对应账户的二跳子图。
通过该装置,可以在资金流水图谱上,获取目标节点对应的账户的二跳子图,并根据二跳子图中各个节点之间的连线,获取该各个节点的有效出金,进而确定该各个节点的重要度并在可视化界面中对各个节点的重要度进行显示。该二跳子图中包括与目标节点有连线的节点以及与这些节点有连线的节点,也即是,该二跳子图包括了待分析账户的局部上下文,这样避免了单流水分析时信息不完全的问题,而重要度的可视化展示可以让使得使用者直观地看到资金流水情况,从而结合其专业知识,来对资金流水进行分析,减小了分析误差,保证了分析效果。
第三方面,提供了一种计算机设备,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现上述数据处理方法所执行的操作。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述程序代码由处理器加载并执行以实现如上述数据处理方法所执行的操作。
本公开实施例提供的技术方案带来的有益效果是:
通过在资金流水图谱上,获取目标节点对应的账户的二跳子图,并根据二跳子图中各个节点之间的连线,获取该各个节点的有效出金,进而确定该各个节点的重要度并在可视化界面中对各个节点的重要度进行显示。该二跳子图中包括与目标节点有连线的节点以及与这些节点有连线的节点,也即是,该二跳子图包括了待分析账户的局部上下文,这样避免了单流水分析时信息不完全的问题,而重要度的可视化展示可以让使得使用者直观地看到资金流水情况,从而结合其专业知识,来对资金流水进行分析,减小了分析误差,保证了分析效果。
附图说明
图1是本公开实施例提供的一种数据处理方法的具体实施环境示意图;
图2是根据一示例性实施例示出的一种计算机设备200的框图;
图3是本公开实施例提供的一种数据处理方法的流程图;
图4是本公开实施例提供的一种数据处理系统架构示意图;
图5是根据一示例性实施例示出的一种资金流水图谱示意图;
图6是图5中所示出的资金流水图谱中的一个二跳子图示意图;
图7是本公开实施例提供的一种数据处理及可视化展示的方法示意图;
图8是本公开实施例提供的一种数据处理装置图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
图1是本公开实施例提供的一种数据处理方法的具体实施环境示意图,参见图1,该数据处理方法的具体实施环境包括:金融机构服务器101以及计算机设备102。
金融机构服务器101,可以为一台服务器、多台服务器、云计算平台或虚拟化中心中的任意一种。金融机构服务器用于提供计算机设备102需要的资金流水数据,计算机设备102可以通过与金融机构服务器建立通信连接,进而进行资金可流水数据的传输,金融机构服务器可以为一台或多台,本公开实施例对此不加以限定。
计算机设备102通过无线网络或有线网络与金融机构服务器101相连。计算机设备102可以是台式计算机、平板电脑、电子书阅读器、和膝上型便携计算机等中的至少一种。计算机设备102可以对资金流水数据进行分析,示意性的,计算机设备102是监督机关的工作人员使用的设备,工作人员可以使用该设备对资金流水进行分析,监测资金流动情况。
图2是根据一示例性实施例示出的一种计算机设备200的框图。例如,计算机设备200可以被提供为一服务器。参照图2,计算机设备200包括处理组件201,其进一步包括一个或多个处理器,以及由存储器202所代表的存储器资源,用于存储可由处理组件201的执行的程序代码,例如应用程序。存储器202中存储的应用程序可以包括一个或一个以上的每一个对应于一组程序代码的模块。此外,处理组件202被配置为执行程序代码,以执行上述数据处理方法。
计算机设备200还可以包括一个电源组件203被配置为执行计算机设备200的电源管理,一个有线或无线网络接口204被配置为将计算机设备200连接到网络,和一个输入输出(I/O)接口205。计算机设备200可以操作基于存储在存储器202的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
图3是本公开实施例提供的一种数据处理方法的流程图。参见图3,该方法包括:
301、计算机设备导入账户数据,该账户数据包括账户信息和账户之间的流水信息。
其中,账户信息即用于对账户进行区分的信息,可以为账户名、账户编号等,流水信息主要包括流水量、流水发生时间等,该账户数据的格式主要包括文本文件,一般可以选择电子表格(excel),本公开实施例对具体的数据格式不做限定。
在一种可能的实现方式中,数据文件可以单个导入,在另一种可能的实现方式中,数据文件可以多个一次性导入,本公开实施例对具体的数据导入方式不做限定。
图4是本公开实施例提供的一种数据处理系统架构示意图,参见图4,该账户数据可以为银行流水、第三方支付流水、证券账户流水和其他资金流水等,具体的数据导入过程可以为,在有进行资金流水分析的需求时,由监督机关工作人员,通过计算机设备与金融机构服务器的通信连接,将账户数据导入到计算机设备中。
302、计算机设备对该账户数据进行处理。
其中,在该处理过程中,可以包括对数据的映射过程,该映射过程具体可以为:将数据与数据库中所定义的字段进行映射,将符合字段定义的数据提取出来,使得映射后的数据符合数据库的存储格式,达到数据格式一致的目的。可选地,将数据与数据库中所定义的字段进行映射时,可以采用自动映射与手工调整相结合的方式,该自动映射方式可以根据字段名和字段值内容自动识别并进行映射。本公开实施例对进行数据映射时具体采用的映射方法不做限定。参见图4,图4中所示的数据映射及数据校验模块即可完成上述过程。
在该处理过程中,还可以包括对数据的校验过程,该校验过程具体可以为对数据的合法性校验,也即是,校验数据是否合法,还可以为对数据的完整性校验,也即是,校验数据是否缺失某个字段,当校验通过时,将数据写入数据库,而当校验未通过时,则将数据丢弃,上述的校验过程,可以保证出问题的数据将不能进入数据库,以免写入脏数据。本公开实施例对进行数据校验时具体采用的校验方法不做限定。
需要说明的是,在计算机设备对账户数据处理完成后,可以将账户数据存储至数据库中,以便为后续的分析过程提供数据来源。
303、该计算机设备根据处理后的账户数据生成资金流水图谱,该资金流水图谱中每个节点代表一个账户,节点之间的连线代表账户之间的流水信息。
在一种可能的实现方式中,该计算机设备提取多个账户,将每个账户映射为图谱中的一个节点,然后根据该各个账户之间的流水信息,确定具有流水关系的账户对应的节点,按照账户之间的流水信息,将该具有流水关系的账户对应的节点之间进行连线,在连线上标注流水量和流水发生时间。
需要说明的是,在根据处理后的账户数据生成资金流水图谱之前,计算机设备可以先基于该账户数据,通过图谱管理工具进行图谱定义,将数据库中账户名字段的信息定义为节点,将数据库中资金流水关系字段的信息定义为节点之间的关系,可以将数据库中账户的其他信息定义为属性,从而实现图片抽取模块的定制。然后,通过定制化的图片抽取模块对该账户数据进行图谱的实体、关系和属性抽取,即提取多个账户的账户信息、账户间的资金流水关系及流水信息等,如账户名、流水走向、流水量、流水时间等,根据上述信息确定节点间的连线,生成资金流水图谱。
需要说明的是,在完成图谱的实体、关系和属性抽取后,可以将抽取后的实体、关系和属性存入图谱数据库中,常用的图谱数据库有可扩展的图数据库(janusgraph)等,本公开实施例对具体采用的图谱数据库类型不做限定。
参见图4,图4中所示的图谱构建模块即可完成上述过程,该图谱构建模块包括图谱定义模块、图谱抽取模块和图谱存储模块,用于分别执行上述对应的定义、抽取和存储过程。
其中,实体是图谱中最基本的元素,实体抽取可以从原始数据中自从识别出实体,属性抽取可以在识别出实体的基础上,为每个实体构造属性列表,而关系抽取则可以解决实体之间的链接问题,关系的基本信息包括参数类型、满足此关系的模式等。
304、计算机设备基于待分析的账户,从资金流水图谱中确定目标节点,该目标节点代表该待分析的账户。
在一种可能的实现方式中,监督机关工作人员可以在计算机设备中输入待分析的账户名,计算机设备接收到该待分析的账户名后,根据该账户名,在该资金流水图谱中查询包括该账户名的节点,即目标节点,该目标节点即可代表该待分析的账户。
在另一种可能的实现方式中,监督机关的工作人员在可视化界面上直接选择待分析的账户对应的节点,即目标节点,以触发对该账户的分析流程,参见图4,可以通过图4中所示的可视化界面选择目标节点。
图5是根据一示例性实施例示出的一种资金流水图谱示意图,参见图5,该图即可以显示在可视化界面中,以便监督机关工作人员直接选择目标节点,图5即为选择账户E作为目标节点的部分资金流水图谱。
305、计算机设备在该资金流水图谱上查询该目标节点是否具有祖父节点,当该目标节点具有祖父节点时,执行步骤306,当该目标节点没有祖父节点时,执行步骤307。
需要说明的是,该祖父节点可以为按照节点之间的连线指向通过两跳即可达到目标节点的节点。参见图5,在图5所示的资金流水图谱中,节点A有指向节点C的连线,节点C又有指向节点E的关系,则节点A即为节点E的祖父节点。
306、计算机设备获取该目标节点对应的二跳子图,继续执行步骤309。
在一种可能的实现方式中,当该目标节点具有祖父节点时,从该资金流水图谱中,提取该目标节点到该祖父节点之间的子图,作为该二跳子图。
需要说明的是,该二跳子图可以包括该目标节点到该祖父节点之间的节点、与这些节点间具有连线的节点以及节点之间的连线和连线上的标注。图6是图5中所示出的资金流水图谱中的一个二跳子图示意图。
307、计算机设备在该资金流水图谱上查询该目标节点是否具有父节点,当该目标节点具有父节点时,执行步骤308,当该目标节点没有父节点时,执行步骤314。
需要说明的是,该父节点可以为按照节点之间的连线指向通过一跳即可达到目标节点的节点,参见图5,在图5所示的资金流水图谱中,节点A有指向节点C的连线,则节点A即为节点C的父节点,节点C有指向节点E的连线,则节点C即为节点E的父节点。
308、计算机设备获取该目标节点对应的一跳子图。
在一种可能的实现方式中,当该目标节点具有父节点时,从该资金流水图谱中,提取该目标节点到该父节点之间的子图,作为该一跳子图。
需要说明的是,该一跳子图可以包括该目标节点到该父节点之间的节点、与这些节点间具有连线的节点以及节点之间的连线和连线上的标注,参见图5,图5中账户C的一跳子图中包括账户A、账户B、账户C、账户D以及上述四个账户之间的连线和连线上的标注。
309、计算机设备获取该各个节点的有效出金。
需要说明的是,该有效出金即为该获取到的子图中各节点之间的流水量,即该获取到的子图中各节点对应的账户之间的资金流水金额。在一种可能的实现方式中,根据连线上标注的流水信息,可以确定各个的账户的入金和出金,再结合流水发生时间,可以获取到各个节点对应的账户的有效出金,并将获取到的有效出金显示在可视化界面上。参见图5,图5中账户O在10:00给账户A转账10万,账户A在10:01给账户B转账3万,在10:01给账户C转账5万,在10:02给账户D转账5万,则此时账户B的有效流水为3万,账户C的有效流水为5万,账户D的有效流水为2万。
310、计算机设备查询该获取到的子图中任一节点是否有指向该节点的上级节点的连线,如果有,执行步骤311,如果没有,执行步骤312。
需要说明的是,若该子图中任一节点有指向该节点的上级节点的连线,则表示该子图中任一节点代表的账户有返回其上级账户的资金,该上级节点可以包括该节点的父节点及与该节点的父节点同级的节点、该节点的祖父节点及与该节点的祖父节点同级的节点等。参见图5,账户F的上级节点包括,账户O、账户A、账户B、账户C、账户D。
需要说明的是,步骤305、307和310中的查询操作均通过图谱数据库访问接口实现,该查询请求可以遵循接口协议,该接口协议可以是图遍历语言(gremlin)接口协议等,本公开实施例对具体采用的接口协议不做限定。
311、基于该连线所代表的流水信息,计算机设备对该各个节点的有效出金进行调整,得到调整后的有效出金。
需要说明的是,若该子图中任一节点有指向该节点的上级节点的连线,则表示该子图中任一节点代表的账户有返回其上级账户的资金,则会对该获取到的子图内其他节点对应的账户的有效出金产生影响,则需对有效出金进行调整,可以根据该连线上标注的流水量和流水发生时间,来调整有效出金,并将该子图中的有效出金更新为该调整后的有效出金,该过程可以称为资金流水回退分析。参见图5,图5中账户F对应的节点有指向账户A对应的节点的连线,可以确定账户F在10:01有出金回到账户A,此时可以判断在账户A的出金中,账户C只贡献了2万的有效流水,进而可以得出账户A相对于账户B、C、D的有效出金分别为3万、2万、5万。
312、计算机设备根据有效出金,确定该各个节点的重要度。
在一种可能的实现方式中,基于获得的该调整后的有效出金,结合流水发生时间,通过重要度计算算法,确定该各个节点的重要度,该过程可以称为资金流水前向分析。
需要说明的是,有效出金金额越大,流水发生时间越早,则账户重要度越高。其中,有效出金额可以为首要影响因素。参见图6,图6中账户A相对于账户B、C、D的有效出金分别为3万、2万、5万,对应的流水发生时间分别为10:01、10:01、10:02,则可以确定账户D的重要度最高,账户B次之,账户C的重要度最低。
313、计算机设备在可视化界面中,显示该各个节点的重要度。
其中,在该可视化界面中,工作人员可以直观地查看各个节点的重要度,再结合自有知识,对各个节点进行分析,可以实现对可疑资金流水和可疑账户的判断,可以实现计算机设备与研判人员的交互,共同完成资金流水分析。
通过在资金流水图谱上,对各个节点的重要度进行显示,监督机关的工作人员可以结合自身的专业知识,来对资金流水进行分析,从而可以减小分析误差,保证分析效果。
图7是本公开实施例提供的一种数据处理及可视化展示的方法示意图,参见图7,该图可以直观地展示步骤301至步骤313的方法。
314、当计算机设备检测到对该可视化界面中的任一节点的分析指令时,继续执行步骤305至313。
在一种可能的实现方式中,监督机关的工作人员根据可视化界面中显示的各个节点的重要度,结合自有知识,可以判断哪些节点对应的账户的资金流水可能存在异常,进而获取这些节点对应账户的二跳子图或一跳子图,以便对这些存在异常的账户进行进一步分析监测。
上述方案通过在资金流水图谱上,获取目标节点对应的账户的二跳子图,并根据二跳子图中各个节点之间的连线,获取该各个节点的有效出金,进而确定该各个节点的重要度并在可视化界面中对各个节点的重要度进行显示。该二跳子图中包括与目标节点有连线的节点以及与这些节点有连线的节点,也即是,该二跳子图包括了待分析账户的局部上下文,这样避免了单流水分析时信息不完全的问题,而重要度的可视化展示可以让使得使用者直观地看到资金流水情况,从而结合其专业知识,来对资金流水进行分析,减小了分析误差,保证了分析效果。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图8是本公开实施例提供的一种数据处理装置图。参见图8,该装置包括:
节点确定模块801,用于执行步骤304;
子图获取模块802,用于执行步骤306中获取二跳子图的过程;
有效出金获取模块803,用于执行步骤309;
重要度确定模块804,用于执行步骤312;
显示模块805,用于执行步骤313。
在一种可能的实现方式中,该装置还包括:
第一提取模块,用于执行步骤303中提取多个账户的过程;
映射模块,用于执行步骤303中将每个账户映射为图谱中的一个节点的过程;
该节点确定模块,还用于执行步骤303中确定具有流水关系的账户对应的节点的过程;
连线模块,用于执行步骤303中将该具有流水关系的账户对应的节点之间进行连线的过程;
标注模块,用于执行步骤303中在连线上标注流水量和流水发生时间的过程。
在一种可能的实现方式中,该装置还包括:
查询模块,用于执行步骤305;
第二提取模块,用于执行步骤306中提取该目标节点到该祖父节点之间的子图的过程。
在一种可能的实现方式中,该子图获取模块,还用于执行步骤308。
在一种可能的实现方式中,该装置还包括:
调整模块,用于执行步骤311中对该各个节点的有效出金进行调整的过程;
该有效出金获取模块,还用于执行步骤311中得到调整后的有效出金的过程。
在一种可能的实现方式中,该重要度确定模块,还用于执行步骤312。
在一种可能的实现方式中,该子图获取模块,还用于执行步骤314。
上述装置通过在资金流水图谱上,获取目标节点对应的账户的二跳子图,并根据二跳子图中各个节点之间的连线,获取该各个节点的有效出金,进而确定该各个节点的重要度并在可视化界面中对各个节点的重要度进行显示。该二跳子图中包括与目标节点有连线的节点以及与这些节点有连线的节点,也即是,该二跳子图包括了待分析账户的局部上下文,这样避免了单流水分析时信息不完全的问题,而重要度的可视化展示可以让使得使用者直观地看到资金流水情况,从而结合其专业知识,来对资金流水进行分析,减小了分析误差,保证了分析效果。
需要说明的是:上述实施例提供的数据处理装置在进行数据处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的数据处理装置与数据处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括程序代码的存储器,上述程序代码可由处理器执行以完成上述实施例中的数据处理方法。例如,该计算机可读存储介质可以是只读存储器(read-only memory,ROM)、随机存取存储器(randomaccess memory,RAM)、只读光盘(compact disc read-only memory,CD-ROM)、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本公开的可选实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (14)
1.一种数据处理方法,其特征在于,所述方法包括:
基于待分析的账户,从资金流水图谱中确定目标节点,所述资金流水图谱中的每个节点代表一个账户,节点之间的连线代表账户之间的流水信息,所述目标节点代表所述账户;
在所述资金流水图谱上,根据所述目标节点的流水信息,查询所述目标节点的祖父节点,当所述目标节点具有祖父节点时,从所述资金流水图谱中,提取所述目标节点到所述祖父节点之间的子图,作为二跳子图;
根据所述二跳子图中各个节点之间的连线,获取所述各个节点的有效出金,所述有效出金为所述二跳子图中各个节点对应的账户之间的资金流水金额;
根据所述各个节点的有效出金,确定所述各个节点的重要度;
在可视化界面中,显示所述各个节点的重要度。
2.根据权利要求1所述的方法,其特征在于,所述基于待分析的账户,从资金流水图谱中确定目标节点之前,所述方法还包括:
提取多个账户,将每个账户映射为图谱中的一个节点;
根据各个账户之间的流水信息,确定具有流水关系的账户对应的节点,按照账户之间的流水信息,将所述具有流水关系的账户对应的节点之间进行连线,在连线上标注流水量和流水发生时间。
3.根据权利要求1所述的方法,其特征在于,所述基于待分析的账户,从资金流水图谱中确定目标节点之后,所述方法还包括:
当在所述资金流水图谱上未获取到所述目标节点对应的二跳子图时,获取所述目标节点对应的一跳子图来执行重要度确定和显示的过程。
4.根据权利要求1所述的方法,其特征在于,所述根据所述二跳子图中各个节点之间的连线,获取所述各个节点的有效出金之后,所述方法还包括:
当所述二跳子图中任一节点有指向所述节点的上级节点的连线时,基于所述连线所代表的流水信息,对所述各个节点的有效出金进行调整,得到调整后的有效出金。
5.根据权利要求1所述的方法,其特征在于,所述根据所述各个节点的有效出金,确定所述各个节点的重要度包括:
根据所述各个节点的有效出金和流水发生时间,确定所述各个节点的重要度。
6.根据权利要求1所述的方法,其特征在于,所述在可视化界面中,显示所述各个节点的重要度之后,所述方法还包括:
当检测到对所述可视化界面中的任一节点的分析指令时,从所述资金流水图谱中获取所述节点对应账户的二跳子图。
7.一种数据处理装置,其特征在于,所述装置包括:
节点确定模块,用于基于待分析的账户,从资金流水图谱中确定目标节点;
子图获取模块,用于在所述资金流水图谱上,根据所述目标节点的流水信息,查询所述目标节点的祖父节点,当所述目标节点具有祖父节点时,从所述资金流水图谱中,提取所述目标节点到所述祖父节点之间的子图,作为二跳子图;
有效出金获取模块,用于根据所述二跳子图中各个节点之间的连线,获取所述各个节点的有效出金,所述有效出金为所述二跳子图中各个节点对应的账户之间的资金流水金额;
重要度确定模块,用于根据所述各个节点的有效出金,确定所述各个节点的重要度;
显示模块,用于在可视化界面中,显示所述各个节点的重要度。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一提取模块,用于提取多个账户;
映射模块,用于将每个账户映射为图谱中的一个节点;
所述节点确定模块,还用于根据各个账户之间的流水信息,确定具有流水关系的账户对应的节点;
连线模块,用于按照账户之间的流水信息,将所述具有流水关系的账户对应的节点之间进行连线;
标注模块,用于在连线上标注流水量和流水发生时间。
9.根据权利要求7所述的装置,其特征在于,所述子图获取模块,还用于当在所述资金流水图谱上未获取到所述目标节点对应的二跳子图时,获取所述目标节点对应的一跳子图来执行重要度确定和显示的过程。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
调整模块,用于当所述二跳子图中任一节点有指向所述节点的上级节点的连线时,基于所述连线所代表的流水信息,对所述各个节点的有效出金进行调整。
11.根据权利要求7所述的装置,其特征在于,所述重要度确定模块,还用于根据所述各个节点的有效出金和流水发生时间,确定所述各个节点的重要度。
12.根据权利要求7所述的装置,其特征在于,所述子图获取模块,还用于当检测到对所述可视化界面中的任一节点的分析指令时,从所述资金流水图谱中获取所述节点对应账户的二跳子图。
13.一种计算机设备,其特征在于,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现权利要求1至6的任一项的数据处理方法所执行的操作。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述程序代码由处理器加载并执行以实现如权利要求1至权利要求6任一项所述的数据处理方法所执行的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910726924.2A CN110597871B (zh) | 2019-08-07 | 2019-08-07 | 数据处理方法、装置、计算机设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910726924.2A CN110597871B (zh) | 2019-08-07 | 2019-08-07 | 数据处理方法、装置、计算机设备和计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110597871A CN110597871A (zh) | 2019-12-20 |
CN110597871B true CN110597871B (zh) | 2021-12-21 |
Family
ID=68853726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910726924.2A Active CN110597871B (zh) | 2019-08-07 | 2019-08-07 | 数据处理方法、装置、计算机设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110597871B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446988A (zh) * | 2017-08-21 | 2018-08-24 | 深圳萨摩耶互联网金融服务有限公司 | 基于关系网络的用户识别方法和系统 |
CN109508388A (zh) * | 2018-11-28 | 2019-03-22 | 交通银行股份有限公司 | 一种关系网络可视化图谱的方法和装置 |
CN109558951A (zh) * | 2018-11-23 | 2019-04-02 | 北京知道创宇信息技术有限公司 | 一种欺诈账号检测方法、装置及其存储介质 |
CN109872234A (zh) * | 2019-01-24 | 2019-06-11 | 平安科技(深圳)有限公司 | 交易行为监控方法、装置、计算机设备和介质 |
CN110033279A (zh) * | 2019-04-04 | 2019-07-19 | 银清科技(北京)有限公司 | 基于知识图谱技术的可疑账户交易确认方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150188941A1 (en) * | 2013-12-26 | 2015-07-02 | Telefonica Digital Espana, S.L.U. | Method and system for predicting victim users and detecting fake user accounts in online social networks |
-
2019
- 2019-08-07 CN CN201910726924.2A patent/CN110597871B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446988A (zh) * | 2017-08-21 | 2018-08-24 | 深圳萨摩耶互联网金融服务有限公司 | 基于关系网络的用户识别方法和系统 |
CN109558951A (zh) * | 2018-11-23 | 2019-04-02 | 北京知道创宇信息技术有限公司 | 一种欺诈账号检测方法、装置及其存储介质 |
CN109508388A (zh) * | 2018-11-28 | 2019-03-22 | 交通银行股份有限公司 | 一种关系网络可视化图谱的方法和装置 |
CN109872234A (zh) * | 2019-01-24 | 2019-06-11 | 平安科技(深圳)有限公司 | 交易行为监控方法、装置、计算机设备和介质 |
CN110033279A (zh) * | 2019-04-04 | 2019-07-19 | 银清科技(北京)有限公司 | 基于知识图谱技术的可疑账户交易确认方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110597871A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111427971B (zh) | 用于计算机系统的业务建模方法、装置、系统和介质 | |
CN113093958B (zh) | 数据处理方法、装置和服务器 | |
CN112182250A (zh) | 勾稽关系知识图谱的构建方法、财务报表核查方法及装置 | |
JP2022120150A (ja) | 口座管理システム、口座管理方法、およびプログラム | |
WO2017132072A1 (en) | Methods, systems and computer program products for calculating an estimated result of a tax return | |
CN110472895B (zh) | 财务系统风控方法、装置、计算机设备和存储介质 | |
US20210056618A1 (en) | Transferring transactions between financial institutions | |
WO2019095569A1 (zh) | 基于微博财经事件的金融分析方法、应用服务器及计算机可读存储介质 | |
CN110597871B (zh) | 数据处理方法、装置、计算机设备和计算机可读存储介质 | |
CN117033431A (zh) | 工单处理方法、装置、电子设备和介质 | |
CN117094764A (zh) | 银行积分处理方法及装置 | |
CN111429257B (zh) | 一种交易监控方法和装置 | |
US10475131B1 (en) | Methods, systems and computer program products for calculating an estimated result of a tax return | |
KR20090063805A (ko) | 불법 금융 거래 정보를 관리하고 혐의 거래의 확인과보고서 작성 및 등록을 통합적으로 수행하는 방법 및시스템 | |
JP4448469B2 (ja) | 投資信託模擬購入システム | |
CN114880369A (zh) | 一种基于弱数据技术的风险授信方法和系统 | |
EP1501057A1 (en) | Method and sofware application and system for automated bill processing | |
CN111723129A (zh) | 报表生成方法、报表生成装置和电子设备 | |
CN111932368B (zh) | 一种信用卡发卡系统及其构建方法、装置 | |
RU2766156C1 (ru) | Способ и устройство определения населенного пункта, в котором установлен терминал | |
US20230107703A1 (en) | Systems and methods for automated fraud detection | |
JP7228663B2 (ja) | 口座管理システムおよび口座管理方法 | |
US20240104599A1 (en) | Systems and methods for allocating blockchain incentives | |
US20230073719A1 (en) | Target factory | |
CN115630960A (zh) | 信息展示方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |