CN117788132A - 基于知识图谱的银行反洗钱股权追溯方法和装置 - Google Patents
基于知识图谱的银行反洗钱股权追溯方法和装置 Download PDFInfo
- Publication number
- CN117788132A CN117788132A CN202410217253.8A CN202410217253A CN117788132A CN 117788132 A CN117788132 A CN 117788132A CN 202410217253 A CN202410217253 A CN 202410217253A CN 117788132 A CN117788132 A CN 117788132A
- Authority
- CN
- China
- Prior art keywords
- node
- traceability
- map
- stock right
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000004900 laundering Methods 0.000 title claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000009877 rendering Methods 0.000 claims abstract description 17
- 230000015654 memory Effects 0.000 claims description 16
- 230000000149 penetrating effect Effects 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 abstract description 4
- 239000010410 layer Substances 0.000 description 93
- 230000000875 corresponding effect Effects 0.000 description 31
- 238000007726 management method Methods 0.000 description 25
- 230000035515 penetration Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000008901 benefit Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000008520 organization Effects 0.000 description 8
- 125000004122 cyclic group Chemical group 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000013515 script Methods 0.000 description 6
- 230000008014 freezing Effects 0.000 description 5
- 238000007710 freezing Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 230000005856 abnormality Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000011001 backwashing Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000002356 single layer Substances 0.000 description 3
- 238000013075 data extraction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000009469 supplementation Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 241000251323 Matthiola oxyceras Species 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002079 cooperative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于知识图谱的银行反洗钱股权追溯方法和装置,属于数据处理的技术领域,包括:根据股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据;从目标企业出发,对基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建预设层级的多叉树,得到股权追溯图谱;对股权追溯图谱进行精简化处理,得到精简股权追溯图谱;根据股权追溯图谱计算图谱信息,并从基础数据中提取目标数据;对精简股权追溯图谱、目标数据和图谱信息进行渲染,得到目标企业的股权追溯报告。本发明的方法中,是由股权追溯工具自动完成目标企业的股权追溯报告的生成的,提高了股权追溯工作效率,并提高了股权追溯的准确性和规范性。
Description
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种基于知识图谱的银行反洗钱股权追溯方法和装置。
背景技术
目前,在对银行的公司客户进行客户风险等级评定中,需要进行企业股权追溯工作,此工作主要依赖“国家企业信用信息公示系统”,公示系统相关数据信息由企业自主选择是否公示。部分企业未公示股权追溯所需的股权信息、变更信息、高管信息等,需借助第三方企业查询程序进行辅助查询,影响分行及相关作业中心的工作效率,识别保存资料较为混乱。此外,股权追溯工作对经办人员业务素质要求较高,对于存在多层嵌套、交叉持股、关联交易、循环出资、家族控制等复杂股权或者控制权结构的非自然人客户,需逐层穿透识别实际受益人并加权计算股权比例。
在现有的方案中,各机构普遍存在受益所有人识别错误、持股比例计算不准确、股权穿透相关信息(股权信息、变更信息、高管信息、关联方机构等信息)缺失,且股权追溯工作需要耗费经办人员大量人力,人工处理效率低,经办人员手工编写股权追溯结果报告存在填报规则不统一、误填、错填等问题。
综上,如何提高股权追溯的工作效率、准确性和规范性成为目前亟需解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于知识图谱的银行反洗钱股权追溯方法、装置、电子设备和计算机存储介质,以缓解现有的股权追溯的方法效率低、准确性差、规范性不好的技术问题。
第一方面,本发明实施例提供了一种基于知识图谱的银行反洗钱股权追溯方法,应用于股权追溯工具,包括:
获取携带有目标企业的股权追溯报告生成请求,并根据所述股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据;
从所述目标企业出发,对所述基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建所述预设层级的多叉树,进而得到股权追溯图谱,其中,所述多叉树中,包含从最上层节点到所述目标企业的节点的多条股权链路的路径,每条路径上的每个节点表示控股企业或控股人员,且每条路径上设定有相应的股权信息;
对所述股权追溯图谱进行精简化处理,得到精简股权追溯图谱;
根据所述股权追溯图谱计算图谱信息,并根据预设报告模板从所述基础数据中提取目标数据,其中,所述图谱信息包括:中间层数量的信息和注册地数量的信息;
对所述精简股权追溯图谱、所述目标数据和所述图谱信息进行渲染,进而得到目标企业的股权追溯报告。
在本发明实施例中,提供了一种基于知识图谱的银行反洗钱股权追溯方法,应用于股权追溯工具,包括:获取携带有目标企业的股权追溯报告生成请求,并根据股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据;从目标企业出发,对基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建预设层级的多叉树,进而得到股权追溯图谱,其中,多叉树中,包含从最上层节点到目标企业的节点的多条股权链路的路径,每条路径上的每个节点表示控股企业或控股人员,且每条路径上设定有相应的股权信息;对股权追溯图谱进行精简化处理,得到精简股权追溯图谱;根据股权追溯图谱计算图谱信息,并根据预设报告模板从基础数据中提取目标数据,其中,图谱信息包括:中间层数量的信息和注册地数量的信息;对精简股权追溯图谱、目标数据和图谱信息进行渲染,进而得到目标企业的股权追溯报告。通过上述描述可知,本发明的基于知识图谱的银行反洗钱股权追溯方法中,是由股权追溯工具自动完成目标企业的股权追溯报告的生成的,大大提高了股权追溯工作效率,并且提高了股权追溯的准确性和规范性,缓解了现有的股权追溯的方法效率低、准确性差、规范性不好的技术问题。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于知识图谱的银行反洗钱股权追溯方法的流程图;
图2为本发明实施例提供的股权追溯工具的示意图;
图3为本发明实施例提供的构建图谱的架构流程图;
图4为本发明实施例提供的一种基于知识图谱的银行反洗钱股权追溯装置的示意图;
图5为本发明实施例提供的一种电子设备的示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的股权追溯的方法效率低、准确性差、规范性不好。
基于此,本发明的基于知识图谱的银行反洗钱股权追溯方法中,是由股权追溯工具自动完成目标企业的股权追溯报告的生成的,大大提高了股权追溯工作效率,并且提高了股权追溯的准确性和规范性。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于知识图谱的银行反洗钱股权追溯方法进行详细介绍。
实施例一:
根据本发明实施例,提供了一种基于知识图谱的银行反洗钱股权追溯方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种基于知识图谱的银行反洗钱股权追溯方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取携带有目标企业的股权追溯报告生成请求,并根据股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据;
在本发明实施例中,上述基于知识图谱的银行反洗钱股权追溯方法应用于股权追溯工具。
如图2所示,股权追溯工具包含:数据服务模块、报告服务模块、基础服务模块、接口管理模块、服务管理模块。
1)数据服务模块,包含定制库数据同步和实时数据同步。
a)定制库数据同步,主要用于将服务端(第三方数据供应商)收集的企业工商等数据进行同步到客户端,并存储本地供股权追溯报告加工使用;
b)实时数据同步,对于本地定制库中未即时完成同步的数据,可通过接口请求服务端进行即时计算,客户端会将即时计算结果下载到本地(入临时库),并依赖此数据生成报告。
2)报告服务模块,该模块作为股权追溯的核心环节,由异步任务调度,主要由数据类、业务类、调度类脚本组成:
a)数据类脚本主要负责:
1. 数据检查:是否包含在本地数据,若否,则转入数据服务流程,去请求临时数据包;
2. 数据提取:针对股权追溯报告所需内容,从定制库或临时库里提取相关企业工商基本信息、股东信息、年报信息、关联企业等相关原始信息(即上述基础数据)。
3. 数据加工:将上述提取的信息进行业务加工,比如生成建议实益拥有人清单所需数据、生成完整图/精简图所需数据、生成年报比对数据等,并将加工后的结果封装为系统内部统一流转的json格式,便于后需流程进行数据提取和复用,以下该结构化数据简称为“数据体”。
b)业务类脚本主要负责:
1.精简图/完整图生成:使用数据体中已经计算好的图谱数据(生成完整图/精简图所需数据),利用selenium+chrome方式进行png/svg生成,并将结果信息填入数据体中,供后续主报告生成使用(针对节点过多,png无法截取时,也将给出提示信息,方便主报告中提示信息的标注判断)。
2.子报告生成:使用数据体中关联企业列表,逐一生成子报告,子报告所需数据适时查询,并将子报告信息填入数据体中,供后续主报告生成使用;
3.主报告生成:使用数据体中的数据,结合截图、子报告原始文件,生成主报告;
4.报告管理:将主报告、子报告、完整图等相关文件,按规定的目录及名称要求,整合后,生成zip包;
5.将最终zip包推送到行内指定的目录下。
6.注意:子报告和主报告生成时,技术上采用的方案是:
a.使用数据体中数据,通过Jinja2 + Vue相关语法渲染并生成封面和报告体的html文件。
b.若报告体较大(数据多+样式多),程序会在某个阈值(默认500)进行特殊处理,超过该阈值,程序将会把报告内部分数据改为图片截取并嵌入到报告中的方式(主要是为了提升渲染效率);
c.基于上步中的html文件,使用wkhtmltopdf工具生成对应的pdf文件。
c)调度类脚本主要负责:
该模块依托基础服务、数据服务等模块的部分脚本,实现报告中相应子步骤的生命周期管理,并适时接入异常处理,保证任务处理流程准确有序运行。
3)基础服务模块,实现应用底层通用基础功能,方便多模块共享。
本模块为应用自行处理,无需人工操作,主要实现了数据检查、数据查重、数据入库、基础函数管理等功能。比如涉及加密工具、全角半角工具、通用工具、zip管理、请求管理、浏览器管理、pdf管理等底层业务模块。
4)接口管理模块,提供外部系统调用接入,采用restful风格进行接口的开发及管理。
5)服务管理模块,负责系统各模块状态监控、任务调度、异常处理、运维管理等。
系统按功能划分为基础模块和报告模块两个内部应用,基础模块用于通用工具类的封装、报告模块用于报告生成相关的任务管理、调度等。
因报告任务拆分了n个子任务,每个子任务均有单独协程、进程进行管理,充分解耦,另外,系统内置异常处理脚本,会不定时扫描异常任务,并推送到合适的状态继续处理,任务队列借助redis实现多端任务争抢功能,方便大量任务时,可快速横向扩展。
步骤S104,从目标企业出发,对基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建预设层级的多叉树,进而得到股权追溯图谱,其中,多叉树中,包含从最上层节点到目标企业的节点的多条股权链路的路径,每条路径上的每个节点表示控股企业或控股人员,且每条路径上设定有相应的股权信息;
步骤S106,对股权追溯图谱进行精简化处理,得到精简股权追溯图谱;
步骤S108,根据股权追溯图谱计算图谱信息,并根据预设报告模板从基础数据中提取目标数据,其中,图谱信息包括:中间层数量的信息和注册地数量的信息;
步骤S110,对精简股权追溯图谱、目标数据和图谱信息进行渲染,进而得到目标企业的股权追溯报告。
下面结合图3所示的架构流程图对股权追溯图谱的生成过程进行简要介绍:
101、接口管理服务调用图谱服务请求获取图谱渲染数据;
102、图谱服务创建图谱任务;
103、图谱任务首先查询内部数据源获取图谱相关企业信息;
104、如果图谱任务内部数据源获取的企业信息有残缺,则会调用外部数据源查询相关企业信息;
105、图谱任务整合内外部数据源。从目标企业出发,执行广度优先搜索,根据业务规则设定,遍历到K层的数据并收集起来。根据收集到的数据制作层级为K的多叉树,并为每个路径设定相应的股权信息,为各节点设定企业或者人员信息;
106、根据加工好的数据和给定好的图谱渲染模板,使用模板引擎渲染数据到模板上,并保存到本地;
107和108、将渲染后的模板通过接口管理传输至对应的客户端。
定时同步:每天通过数据同步组件定时同步外部数据源的增量数据到内部数据库,对已有的信息更新或者新增。
在本发明实施例中,提供了一种基于知识图谱的银行反洗钱股权追溯方法,应用于股权追溯工具,包括:获取携带有目标企业的股权追溯报告生成请求,并根据股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据;从目标企业出发,对基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建预设层级的多叉树,进而得到股权追溯图谱,其中,多叉树中,包含从最上层节点到目标企业的节点的多条股权链路的路径,每条路径上的每个节点表示控股企业或控股人员,且每条路径上设定有相应的股权信息;对股权追溯图谱进行精简化处理,得到精简股权追溯图谱;根据股权追溯图谱计算图谱信息,并根据预设报告模板从基础数据中提取目标数据,其中,图谱信息包括:中间层数量的信息和注册地数量的信息;对精简股权追溯图谱、目标数据和图谱信息进行渲染,进而得到目标企业的股权追溯报告。通过上述描述可知,本发明的基于知识图谱的银行反洗钱股权追溯方法中,是由股权追溯工具自动完成目标企业的股权追溯报告的生成的,大大提高了股权追溯工作效率,并且提高了股权追溯的准确性和规范性,缓解了现有的股权追溯的方法效率低、准确性差、规范性不好的技术问题。
上述内容对本发明的基于知识图谱的银行反洗钱股权追溯方法进行了简要介绍,下面对其中涉及到的具体内容进行详细描述。
在本发明的一个可选实施例中,根据股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据,具体包括如下步骤:
(1)根据股权追溯报告生成请求确定本地数据库中是否包含用于生成对应的股权追溯报告的基础数据;
(2)如果包含,则从本地数据库中获取用于生成对应的股权追溯报告的基础数据;
(3)如果不包含,则从第三方数据供应商侧实时同步用于生成对应的股权追溯报告的基础数据。
在本发明的一个可选实施例中,从目标企业出发,对基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建预设层级的多叉树,具体包括如下步骤:
(1)获取目标企业的节点,逐层向上穿透获取各节点的股东数据,直至达到预设层级,并计算各节点的层级;
具体的,图谱中股东数据取自大数据平台neo4j图数据库,取单层股东节点(整个图谱的构建是自下而上逐层通过数据加工计算生成的,每一层中的每个节点可以算作单层股东节点),最下层的节点为目标企业的节点,获取股东名、股东id、股东类型及出资比例,逐层向上穿透获取各节点的股东数据(通过节点名称和唯一ID,从底层数据源中可查询到对应的股东数据(持股比例、持股关系等)),并计算当前节点层级(在一个链路分支中,每一个节点算作一层,以此类推,最高会向上寻找有持股关系的节点,最多找到11层),上限为11层(考虑图谱加工的性能及时效性,针对绝大多数场景11层数据节点可以满足其股权关系的识别)。
下面对neo4j图数据库进行介绍:
结构特点:
Neo4j图数据库的特点:图数据库特别适用于寻找数据之间的关系,图模型最接近于该业务模型,节点之间的物理连接完美替代关联表,节点的属性就是一行数据,图的遍历也比复杂的表连接高效的多。
Neo4j的概念:
Label(标签):标签通过形容一种角色或者给节点加上一种类型,一个节点可以有多个类型,通过类型区分一类节点,这样在查询时候可以更加方便和高效,除此之外标签在给属性建立索引或者约束时候也会使用。
Property(属性) :一个节点就是一行数据,一个关系也是一行数据,里面的属性就是数据库里面的row里面的字段。
RelationShip(关系):关系的功能就是组织和连接节点,一个关系连接两个节点,一个开始节点和一个结束节点。当所有的点被连接起来,就形成了一张图谱。通过关系可以组织节点形成任意的结构,关系拥有进和出两个方向。
Traversal(遍历): 查询时候通常是遍历图谱然后找到路径,在遍历时通常会有一个开始节点,然后根据查询语句,遍历相关路径上的节点和关系,从而得到最终的结果。
Paths: 路径是一个或多个节点通过关系连接起来的产物,例如得到图谱查询或者遍历的结果。
Indexes:
遍历图通过需要大量的随机读写,如果没有索引,则可能意味着每次都是全图扫描,这样效率非常低下,为了获得更好的性能,我们可以在字段属性上构建索引。
Constraints:
约束可以定义在某个字段上,限制字段值唯一,创建约束会自动创建索引。类似于唯一索引。
Neo4j存储原理:
相比于传统OLTP关系型数据库采用B+树的叶子节点来存储行数据,OLAP按列来存储数据,Neo4j在磁盘上存储有着独特的方式,neo4j号称自己实现了原生图存储,他的优势在于能够应用很多图算法来处理和研究数据。比如最短路径,最小生成树,求节点的度,这些在知识图谱上都有实际应用。
Neo4j将节点,关系,属性分别存储在不同的文件上,且每个节点、关系、属性都有自己唯一的ID,每个节点,关系,属性占用文件大小相同。相比于B+树的O(LogN)的时间复杂度,Neo4j 这种存储方式根据元素固定大小存储,根据ID访问就相当于是根据数组下标访问一样快速O(1)。
在图谱的应用:
股权穿透图谱基于图数据库的查询实现,关系层次超过一定层级后,使用传统的关系型数据库的表连接查询导致生成的笛卡尔积无限大,会有严重的性能问题,而图数据库的数据与数据之间天生就是物理连接而不是逻辑上的外键关联。所以图谱应用采用图数据库。
(2)根据各节点的股东数据和各节点的层级构建多叉树,进而得到股权追溯图谱。
具体包括如下步骤:
(21)根据各节点的层级将各个节点通过箭头进行连接,进而绘制得到初始多叉树;
(22)根据各节点的股东数据通过累乘的方式计算当前节点在该路径上对目标企业的节点的持股比例,并在初始多叉树中标记;
具体的计算公式为:该当前节点在该路径上对目标节点(目标企业的节点)的持股比例等于父节点在该路径上对目标节点的持股比例与该节点对父节点的持股比例的乘积。
针对每个单层股东节点通过该节点机构名称信息,从底层数据源中查询到其上层持股股东数据,以此通过图谱向上补充完善股权穿透链路节点数据,以此类推将各层的股东对上层节点的持股关系通过箭头标记的链路层级进行绘画,同时展示出其对上层节点的持股比例。
(23)当存在循环持股路径,在循环持股路径中第一次出现重复节点时,在重复节点处截断,不再向上穿透,并将循环持股路径上所有节点进行标签标记,其中,循环持股路径为在单一一条路径上重复出现同一个节点;
具体的,遇到循环持股路径(在单一一条股权链路上重复出现同一家企业(大于等于2次),则认定为该条链路存在循环持股,算作循环持股路径),在路径中第一次出现重复节点时,在该节点处截断,在该节点处不再向上穿透,并将循环路径上所有节点加上“循环持股”标签。
另外,计算对目标企业的持股比例时,如在单一股权追溯的链路上重复出现了两次及以上同一家企业名称,则可以认定该条链路上存在循环持股,这种情况下,会在第一次出现重复显示的节点处停止,不会继续向上寻找其他对下层有持股关系的企业及其持股比例。该条链路上计算对目标企业的持股比例也计算到截断的节点处。
(24)将相同节点对目标企业在不同路径上的持股比例进行累加,得到相同节点对目标企业的综合持股比例;
具体的,11层树状股东图谱数据查询完成后,将相同节点对目标企业在不同路径上的持股比例进行累加,计算企业或个人对目标企业的综合持股比例。
在股权追溯图谱的各条链路中,会出现同一家企业或机构的名称,如A,在计算A对目标企业(最下层节点)的持股比例时,需要考虑将其在多条链路中的持股比例进行累加,以此得出精确的持股比例数据。
(25)对各个节点进行相关信息标记,得到多叉树,进而得到股权追溯图谱。
具体的,之后对前10层所有节点进行数据补充,包括企业统一社会信用代码、企业类型、股东类型、认缴额、持股数、国籍。并通过规则对节点分别加上重点关注机构标签、注册地标签、实益拥有人标签、上市企业股票代码标签(具体为通过节点的ID以及名称等可以识别唯一性的标识,去数据库中将已经从外部获取到的底层数据信息,如:企业统一社会信用代码、企业类型、股东类型、认缴额、持股数、国籍,进行整合,通过程序按照固定模板添加在节点的相应位置)。数据补充完成后,对各节点根据精简股权追溯图谱规则赋予精简图谱节点标识。将计算完成的股权追溯图谱数据写入db_df_relation库的t_equity_relationship表中,并每天定量更新表中的图谱数据。
完整图谱(即股权追溯图谱)
单独展示完整图谱,使用svg图。展示目标企业向上无限穿透的图谱。基于企业最优股比数据、工商公示股东信息表中获取股东名称、出资比例和国家,展示在页面上。当完整图谱无法展示在报告中时,在报告中给出相关备注。
其中,股比的计算首先基于底层数据源可知上层节点对下一层的持股比例,然后通过多单链路下的持股比例累乘,多链路下对目标节点持股比例的累加,以此得到对目标企业的最终持股比例。
图谱备注信息:
逻辑如下:
1、将大于等于25%股比的自然人认定为受益人的情况(至少有一个受益人股比>=25%,则进入1a或1b)。
a.计算每条链路上最上层的自然人对目标企业的最终持股比例,并将这些自然人比例相加,相加后的持股比例小于95%(比例可配置)时,提示(当前“A”对目标企业最终持股26%,“B”对目标企业最终持股15.7%,当前穿透10层仍有大于5%股比未识别,已停止穿透,请人工核实)。
首先必须展示>=25%的自然人持股比例;
对于小于25%的自然人,需要计算15.7%+(1-26%)=89.7%,89.7>=25%,此时B的持股比例需展示,如计算后B的持股比例<25%,则不用展示;
未识别股比的情况:穿透到十层,在链路最上层为机构、重点关注机构、境外企业等非自然人的链路;假设穿透到第三层,存在重点关注机构或境外企业等机构,此链路也是无法穿透完整的路径;
b.计算每条链路上最上层的自然人对目标企业的最终持股比例,并将这些自然人比例相加,相加后的持股比例大于等于95%(比例可配置)时,提示(当前“A”对目标企业最终持股55%,“B”对目标企业最终持股43%,C对目标企业最终持股1%,当前穿透10层剩余小于等于5%股比未识别,已停止穿透,请人工核实)。
首先必须展示>=25%的自然人持股比例,A、B需展示;
对于小于25%的自然人,需要计算1%+(1-55%-43%)=3%,3<25%,此时C的持股比例无需展示,如计算后C的持股比例>=25%,则展示;
2、将高管认定为受益人情况(所有受益人股比均<25%或没有股比即是高管的情况,进入2a,2b)。
a.图谱存在自然人的情况,计算每条链路上最上层的自然人对目标企业的最终持股比例,理论上都小于25%,此时给出备注(当前“A”对目标企业最终持股22%,当前“B”对目标企业最终持股22%,系统已穿透到10层,无直接或间接持股大于等于25%股比的自然人,剩余未识别股比为56%,系统已停止穿透,请人工核实)。
首先计算链路最上层中所有自然人的持股比例即A+B=22%+22%=44%;
计算未识别出来的比例=1-44%=56%;
再分别计算A+56%=22%+56%=78%>=25%,故A展示,如<25%则A无需展示;
再分别计算B+56%=22%+56%=78%>=25%,故B展示,如<25%则B无需展示;
b.10层内图谱无自然人股东,且受益人为高管的情况,需要提示:系统已穿透到10层,未识别到自然人股东,无直接或间接持股大于等于25%股比的自然人,系统已停止穿透,请人工核实。
在本发明的一个可选实施例中,对股权追溯图谱进行精简化处理,具体包括如下步骤:
(1)在股权追溯图谱中筛选得到精简图谱节点,其中,精简图谱节点包括:节点层级为1的节点、节点层级大于1且综合持股比例大于等于25%的节点、具有目标标签的节点、目标企业到节点层级为1的节点、节点层级大于1且综合持股比例大于等于25%的节点、具有目标标签的节点的路径上的节点;
上述目标标签可以为实益拥有人标签、有境外地区或重点关注机构标签,对于有境外地区或重点关注机构标签的节点来讲,且同时满足上层无法穿透。
(2)将所有精简图谱节点构成的股权追溯图谱作为精简股权追溯图谱。
具体的,在报告中,默认展示10层,基于企业最优股比数据、工商公示股东信息表中获取股东名称、出资比例和国家,展示在页面上。
展示规则:
a)穿透出完整图谱后,计算出所有受益所有人及持股达到25%及以上中间层机构(包含交叉持股);
b)保留所有一层直接股东;
c)保留有间接持股大于等于25%的企业所在的路径(大于等于25%股比的企业的下方的路径全部保留,上方的路径不用保留);
d)保留上层包含无法穿透节点(境外(使用精确注册地)、事业编制单位)路径,并给与标识;
e)删除其他路径;
f)上市企业标识上市代码等上市信息;
g)境外(使用精确注册地)企业标注机构注册地。
根据上述精简图展示规则再次对股权追溯图谱的数据进行加工,以此生成符合要求的图片,精简图作为目标企业的股权追溯报告的一部分,在PDF文档(目标企业的股权追溯报告为PDF文档)中展示。
报告中还包括:股权穿透信息-详情
以股权穿透图谱-精简版为准,详细介绍每一层的股东持股信息。基于企业最优股比数据、企业基本信息表,获取其每一层的企业名称,企业类型,投资路径、股东名称、股东类型、认缴出资额(万元)、出资类型、持股比例。
在本发明的一个可选实施例中,根据股权追溯图谱计算图谱信息,具体包括如下步骤:
(1)根据预设路径保留策略对股权追溯图谱进行路径保留,得到待统计股权追溯图谱;
预设路径保留策略如下:
1、保留路径类型(层层递进判断)
a、中间层涉及上市公司,将此上市企业上面的路径过滤掉,即停止穿透;另外,上市企业所在路径下面的节点保留;(上市企业节点保留情况:是直接股东或间接股东时保留,否则不保留);
b、保留受益人到目标公司中间的所有节点,包含受益人和目标公司;(基于1a的前提下做判断,受益所有人包括两类:≥25%的自然人、没有≥25%的自然人时将高管定义为受益人,其中≥25%的自然人指综合持股);
c、计算所有包含直接或间接股东所在的链路(综合持股>=25%),判断最顶层是否是直接或间接股东,如果是,则保留该路径,不是,则不保留该路径(基于1a的前提下做判断,b、c为同级判定)。
解释:
直接或间接股东:综合持股≥25%,并在受益人清单中的企业。
最顶层指:在10层内企业或机构无法向上继续穿透。(无法穿透指:该节点后再无其他节点,比如对于某个企业或机构,其上层无任何企业、机构、自然人,即认定为无法穿透的节点)。
层指股权关系向上层穿透的各个节点,按照股权链路划分,层:同一链路每个节点算作一层,路径:箭头指向的一个链路算作路径,所有链路层级的确定均是基于底层数据(即基础数据),可以知道当前节点的企业有哪些上级企业对其进行了持股,持股比例为多少,基于这些数据绘画构建了股权关系图。
(2)统计待统计股权追溯图谱中位于目标企业到最上层节点之间的中间层数量;
(3)统计待统计股权追溯图谱中目标企业、最上层节点和中间层节点的注册地数量。
实际上,本发明中,是要进行3层及以上中间层或3个注册地判断:根据以下规则基于图谱进行判断,当有三层及以上的中间层时,写是,否则写:否。 当有三个注册地时,写是,否则写:否。
判断三层及以上和三个注册地:
a、对于3层及以上中间层判断逻辑:从查询主体(记为第一层,也就是目标企业),到最上层(最高层级识别到收益所有人、持股25%及以上的公司、包括交叉持股累计比例达到25%及以上)层级,除去这两层,中间层级大于等于3层,即可认定满足“3层及以上中间层”的定义。
b、3个注册地判断逻辑:从查询主体(记为第一层),到最上层(最高层级识别到收益所有人、持股25%及以上的公司、包括交叉持股累计比例达到25%及以上)层级,将第一层(查询主体企业)、中间层及最上层的注册地合计3个及以上,即认定满足“3个注册地”的定义。
备注及风险提示项:
根据以下判断规则,展示相关注释和风险提示项。
判断规则:
A、当图谱中出现第一重点关注机构,展示“注1:股权穿透至最上层的实体XXX属于中国境内具体重点关注机构中的一类,无需识别其受益所有人,因此未体现在此表格中;”
某具体重点关注机构的判断规则如下:
(1)机关类型—按照组织信用代码判断,机关的开头两个数字是11;
(2)关键词/标签判断(只能通过名称匹配);
1、名字包含第一预设固定词汇;
2、或者名字包含第二预设固定词汇但不含招待所;
3、或者名字去除中英文括号及括号内的字符后以第三预设固定词汇结尾;
B、当图谱中有第二重点关注部门,展示“注2:中间层或最上层实体为XXX属于具体第二重点关注部门中的一类,无法识别到受益所有人,因此未体现在此表格中,请通过其他渠道获取相关信息;”
C、当将企业高管认定为受益人的时候,展示“注3:未识别出直接或间接拥有超过25%公司股权或表决权的自然人,请考虑通过人事、财务等方式对公司进行控制的自然人判定为受益所有人;如不存在通过人事、财务等方式对公司进行控制的自然人,应考虑将公司的高级管理人员判定为受益所有人。“
D、风险提示项:前四条针对目标企业,第五条针对图谱中所有的企业,最后一条针对目标企业的直接控股、间接控股超过25%的企业
注意事项:当前股权穿透中所有的节点,只要涉及到境外企业均需要有展示风险提示项。
在本发明的一个可选实施例中,目标数据包括:建议实益拥有人信息、股东信息、工商基本信息和年报信息。
其中,第一、建议实益拥有人清单:
1)建议实益拥有人(持股25%以上最终实际受益的自然人)计算规则:
a)直接或间接拥有超过25%公司股权或者表决权的自然人认定为公司的受益所有人;
b)无直接或间接拥有超过25%公司股权或者表决权的自然人,顺次认定公司的高级管理人员为受益所有人;
c)对于个体工商户、个人独资企业及经营农林渔牧产业的非公司制农民专业合作组织,可以将其法定代表人或直接/间接拥有超过25%公司股权或者表决权的自然人视为受益所有人;
d)无直接或间接拥有超过25%公司股权或者表决权的自然人,系统内无人事、财务等其他方式对公司进行控制的自然人数据,顺次认定公司的高级管理人员为受益所有人;
e)无直接或间接拥有超过25%公司股权或者表决权的自然人,顺次认定公司的疑似实控人为受益所有人。
2)持股25%以上股东及中间层(包含直接股东、间接股东):
直接股东:即从目标企业向上穿透一层且持股大于等于25%的股东(包含人和企业)。基于企业最优股比数据、企业主要人员、企业基本信息表,当满足以下规则时,获取其股东名称、股东出资比例、职位、国籍字段,并将股东名称、股东出资比例展示在页面上。涉及国外企业,如果有英文名,需要展示中英文名称。
计算规则:
a)直接控股的股东,持股比例需大于等于25%。另外企业股东和人员股东需展示持股比例。
b)建议实益拥有人的持股比例也需要放在这里,并写明持股比例;
c)当没有直接或间接持股大于25%的自然人,且不能使用人事财务方法判定受益人时,需要将企业法人高管设为受益所有人,这种情况下,需要将受益人的职位写入持股比例;
d)英文名称从数据库中直接取值。
间接股东:基于企业最优股比表,图谱向上穿透到顶层,计算间接持股大于等于25%的股东(包含人和企业)信息,获取其股东名称和股东出资比例展示在页面。其中,企业股东需要展示企业的统一社会信用代码;涉及国外企业,如果有英文名,需要展示中英文名称。
间接股东计算规则:
a)无限穿透后计算每个节点对目标企业的持股比例;
b)计算每层每个节点的持股比例;
c)计算是否存在多条路径有同样的企业或人员,如果有,则需要计算总股比;
d)筛选出大于25%的节点及链路。
主要人员
从主要人员工商公示表中匹配,如果目标企业设立董事会,需将董事长、董事信息放在报告中,展示其职位和名称字段。
第二、工商基本信息:
展示目标企业的工商公示的基础信息。
1.照面信息是基于企业基本信息表和企业地址工商公示表,获取其统一社会信用代码、地址、企业名称、法定代表人、登记机关等字段进行展示。
2.股东及出资信息是基于工商公示股东信息表获取其股东名称、股东类型、证件类型、企业证照号进行展示。
3.主要人员信息章节,是基于主要人员工商公示表,获取其序号、职位、名称字段进行展示。
分支机构信息章节,是基于分支机构表、企业基本信息表,获取其名称、登记机关、统一社会信用代码进行展示。
4.清算信息章节,是基于清算组信息成员表,获取其清算组负责人、清算组成员进行展示。
行政许可信息章节,是基于行政许可工商公示表,获取其许可文件编号、许可文件名称、有限期自、有限期至、许可机关、许可内容进行展示。
5.行政处罚信息章节,是基于行政处罚多源综合表,获取其处罚编号、违法类型、处罚内容、罚款金额、处罚机关、处罚决定日期/处罚生效期进行展示。
6.经营异常信息章节,是基于经营异常工商公示表,获取其列入日期、做出决定机关、列入经营异常名录原因、移出日期、做出决定机关、移出经营异常名录原因进行展示。
7.严重违法信息章节,是基于严重违法工商公示表,获取其违法类别、列入严重违法失信企业名单原因、列入日期、做出决定机关、移出严重违法失信企业名单原因、移出日期、做出决定机关进行展示。
8.抽查检查信息章节,是基于抽查检查工商公示表,获取其检查实施机关、类型、日期、结果进行展示。
9.司法协助信息章节,是基于股权冻结工商公示表,获取其被执行人、标的方、股权数额、冻结详情中的冻结开始时间、冻结详情中的冻结结束时间、执行通知书文号、状态进行展示。
10.动产抵押登记信息章节,是基于动产抵押工商公示表,获取其登记编号、登记机关、抵押物、被担保债权概况-种类、被担保债权概况-数额、状态、登记日期、债务人履行债务的期限进行展示。
11.股权出质登记信息章节,是基于股权出质工商公示表,获取其股权出质设立登记日期、登记编号、出质人、质权人、状态进行展示。
第三、年报信息:
展示近一年的年报内容,包含基本信息、网站或网店信息、股东(发起人)及出资信息、对外投资信息、股权变更信息、社保信息、对外提供保证担保信息、修改记录。
1.基本信息章节,是基于企业年报(工商公示)表,获取其企业名称、社会信用代码、公司电话、从业人数、是否有网站或网店、企业是否有投资信息或购买其他公司股权、邮政编码、地址、公司电子邮箱、企业经营状态、是否提供对外担保、是否发生股东股权转让进行展示。
2.网站或网店信息章节,是基于企业年报(工商公示)表,获取其网站字段,进行展示。
股东(发起人)及出资信息章节,是基于企业年报(工商公示)表,获取其年报股东信息进行展示。
3.对外投资信息章节,是基于企业年报(工商公示)表,获取其年报投资信息进行展示。
4.股权变更信息章节,是基于企业年报(工商公示)表,获取其年报股东变更信息,进行展示。
5.社保信息章节,是基于工商公示社保信息表,获取其城镇职工基本养老保险人数、失业保险人数、职工基本医疗保险人数、工商保险人数、生育保险人数进行展示。
6.对外提供保证担保信息章节,是基于企业年报(工商公示)表,获取其年报对外担保信息,进行展示。
7.修改记录章节,是基于企业年报(工商公示)表,获取其年报修改记录信息,进行展示。
8.数据比对章节,对比年报与工商数据之间的数据差异部分,比对的数据项包含以下:
基本信息:企业名称、统一社会信用代码/注册号、企业通信地址、企业经营状态;
网站或网店信息:无;
股东(发起人)及出资信息:股东;
对外投资信息:对外投资企业;
股权变更信息:对应工商信息中的变更信息,主要排查股权变更;
社保信息:无。
本发明为达成提升股权追溯工作效率,简化手工作业流程的业务目标,运用智能化手段创建大数据股权追溯工具,赋能股权追溯业务,由大数据自动生成股权追溯报告,辅助人工作业流程。是以国家企业信用信息公示系统内的数据为主体,辅助相关网站提取的官方数据作为内容补充进行大数据加工生成股权追溯报告,辅助人工作业,提升了工作效率。
实施例二:
本发明实施例还提供了一种基于知识图谱的银行反洗钱股权追溯装置,该基于知识图谱的银行反洗钱股权追溯装置主要用于执行本发明实施例一中所提供的基于知识图谱的银行反洗钱股权追溯方法,以下对本发明实施例提供的基于知识图谱的银行反洗钱股权追溯装置做具体介绍。
图4是根据本发明实施例的一种基于知识图谱的银行反洗钱股权追溯装置的示意图,如图4所示,该装置主要包括:获取单元10、图谱构建单元20、精简化处理单元30、计算单元40、渲染单元50,其中:
获取单元,用于获取携带有目标企业的股权追溯报告生成请求,并根据股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据;
图谱构建单元,用于从目标企业出发,对基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建预设层级的多叉树,进而得到股权追溯图谱,其中,多叉树中,包含从最上层节点到目标企业的节点的多条股权链路的路径,每条路径上的每个节点表示控股企业或控股人员,且每条路径上设定有相应的股权信息;
精简化处理单元,用于对股权追溯图谱进行精简化处理,得到精简股权追溯图谱;
计算单元,用于根据股权追溯图谱计算图谱信息,并根据预设报告模板从基础数据中提取目标数据,其中,图谱信息包括:中间层数量的信息和注册地数量的信息;
渲染单元,用于对精简股权追溯图谱、目标数据和图谱信息进行渲染,进而得到目标企业的股权追溯报告。
在本发明实施例中,提供了一种基于知识图谱的银行反洗钱股权追溯装置,应用于股权追溯工具,包括:获取携带有目标企业的股权追溯报告生成请求,并根据股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据;从目标企业出发,对基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建预设层级的多叉树,进而得到股权追溯图谱,其中,多叉树中,包含从最上层节点到目标企业的节点的多条股权链路的路径,每条路径上的每个节点表示控股企业或控股人员,且每条路径上设定有相应的股权信息;对股权追溯图谱进行精简化处理,得到精简股权追溯图谱;根据股权追溯图谱计算图谱信息,并根据预设报告模板从基础数据中提取目标数据,其中,图谱信息包括:中间层数量的信息和注册地数量的信息;对精简股权追溯图谱、目标数据和图谱信息进行渲染,进而得到目标企业的股权追溯报告。通过上述描述可知,本发明的基于知识图谱的银行反洗钱股权追溯装置中,是由股权追溯工具自动完成目标企业的股权追溯报告的生成的,大大提高了股权追溯工作效率,并且提高了股权追溯的准确性和规范性,缓解了现有的股权追溯的方法效率低、准确性差、规范性不好的技术问题。
可选地,获取单元还用于:根据股权追溯报告生成请求确定本地数据库中是否包含用于生成对应的股权追溯报告的基础数据;如果包含,则从本地数据库中获取用于生成对应的股权追溯报告的基础数据;如果不包含,则从第三方数据供应商侧实时同步用于生成对应的股权追溯报告的基础数据。
可选地,图谱构建单元还用于:获取目标企业的节点,逐层向上穿透获取各节点的股东数据,直至达到预设层级,并计算各节点的层级;根据各节点的股东数据和各节点的层级构建多叉树,进而得到股权追溯图谱。
可选地,图谱构建单元还用于:根据各节点的层级将各个节点通过箭头进行连接,进而绘制得到初始多叉树;根据各节点的股东数据通过累乘的方式计算当前节点在该路径上对目标企业的节点的持股比例,并在初始多叉树中标记;当存在循环持股路径,在循环持股路径中第一次出现重复节点时,在重复节点处截断,不再向上穿透,并将循环持股路径上所有节点进行标签标记,其中,循环持股路径为在单一一条路径上重复出现同一个节点;将相同节点对目标企业在不同路径上的持股比例进行累加,得到相同节点对目标企业的综合持股比例;对各个节点进行相关信息标记,得到多叉树,进而得到股权追溯图谱。
可选地,精简化处理单元还用于:在股权追溯图谱中筛选得到精简图谱节点,其中,精简图谱节点包括:节点层级为1的节点、节点层级大于1且综合持股比例大于等于25%的节点、具有目标标签的节点、目标企业到节点层级为1的节点、节点层级大于1且综合持股比例大于等于25%的节点、具有目标标签的节点的路径上的节点;将所有精简图谱节点构成的股权追溯图谱作为精简股权追溯图谱。
可选地,计算单元还用于:根据预设路径保留策略对股权追溯图谱进行路径保留,得到待统计股权追溯图谱;统计待统计股权追溯图谱中位于目标企业到最上层节点之间的中间层数量;统计待统计股权追溯图谱中目标企业、最上层节点和中间层节点的注册地数量。
可选地,目标数据包括:建议实益拥有人信息、股东信息、工商基本信息和年报信息。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
如图5所示,本申请实施例提供的一种电子设备600,包括:处理器601、存储器602和总线,所述存储器602存储有所述处理器601可执行的机器可读指令,当电子设备运行时,所述处理器601与所述存储器602之间通过总线通信,所述处理器601执行所述机器可读指令,以执行如上述基于知识图谱的银行反洗钱股权追溯方法的步骤。
具体地,上述存储器602和处理器601能够为通用的存储器和处理器,这里不做具体限定,当处理器601运行存储器602存储的计算机程序时,能够执行上述基于知识图谱的银行反洗钱股权追溯方法。
处理器601可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器601可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器602,处理器601读取存储器602中的信息,结合其硬件完成上述方法的步骤。
对应于上述基于知识图谱的银行反洗钱股权追溯方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述基于知识图谱的银行反洗钱股权追溯方法的步骤。
本申请实施例所提供的基于知识图谱的银行反洗钱股权追溯装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
再例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述基于知识图谱的银行反洗钱股权追溯方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于知识图谱的银行反洗钱股权追溯方法,其特征在于,应用于股权追溯工具,包括:
获取携带有目标企业的股权追溯报告生成请求,并根据所述股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据;
从所述目标企业出发,对所述基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建所述预设层级的多叉树,进而得到股权追溯图谱,其中,所述多叉树中,包含从最上层节点到所述目标企业的节点的多条股权链路的路径,每条路径上的每个节点表示控股企业或控股人员,且每条路径上设定有相应的股权信息;
对所述股权追溯图谱进行精简化处理,得到精简股权追溯图谱;
根据所述股权追溯图谱计算图谱信息,并根据预设报告模板从所述基础数据中提取目标数据,其中,所述图谱信息包括:中间层数量的信息和注册地数量的信息;
对所述精简股权追溯图谱、所述目标数据和所述图谱信息进行渲染,进而得到目标企业的股权追溯报告。
2.根据权利要求1所述的方法,其特征在于,根据所述股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据,包括:
根据所述股权追溯报告生成请求确定本地数据库中是否包含用于生成对应的股权追溯报告的基础数据;
如果包含,则从所述本地数据库中获取用于生成对应的股权追溯报告的基础数据;
如果不包含,则从第三方数据供应商侧实时同步用于生成对应的股权追溯报告的基础数据。
3.根据权利要求1所述的方法,其特征在于,从所述目标企业出发,对所述基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建所述预设层级的多叉树,包括:
获取所述目标企业的节点,逐层向上穿透获取各节点的股东数据,直至达到所述预设层级,并计算各节点的层级;
根据所述各节点的股东数据和各节点的层级构建所述多叉树,进而得到所述股权追溯图谱。
4.根据权利要求3所述的方法,其特征在于,根据所述各节点的股东数据和各节点的层级构建所述多叉树,包括:
根据各节点的层级将各个节点通过箭头进行连接,进而绘制得到初始多叉树;
根据所述各节点的股东数据通过累乘的方式计算当前节点在该路径上对所述目标企业的节点的持股比例,并在所述初始多叉树中标记;
当存在循环持股路径,在所述循环持股路径中第一次出现重复节点时,在所述重复节点处截断,不再向上穿透,并将所述循环持股路径上所有节点进行标签标记,其中,所述循环持股路径为在单一一条路径上重复出现同一个节点;
将相同节点对所述目标企业在不同路径上的持股比例进行累加,得到相同节点对目标企业的综合持股比例;
对各个节点进行相关信息标记,得到所述多叉树,进而得到所述股权追溯图谱。
5.根据权利要求1所述的方法,其特征在于,对所述股权追溯图谱进行精简化处理,包括:
在所述股权追溯图谱中筛选得到精简图谱节点,其中,所述精简图谱节点包括:节点层级为1的节点、节点层级大于1且综合持股比例大于等于25%的节点、具有目标标签的节点、所述目标企业到所述节点层级为1的节点、所述节点层级大于1且综合持股比例大于等于25%的节点、所述具有目标标签的节点的路径上的节点;
将所有所述精简图谱节点构成的股权追溯图谱作为所述精简股权追溯图谱。
6.根据权利要求1所述的方法,其特征在于,根据所述股权追溯图谱计算图谱信息,包括:
根据预设路径保留策略对所述股权追溯图谱进行路径保留,得到待统计股权追溯图谱;
统计所述待统计股权追溯图谱中位于所述目标企业到最上层节点之间的中间层数量;
统计所述待统计股权追溯图谱中所述目标企业、最上层节点和中间层节点的注册地数量。
7.根据权利要求1所述的方法,其特征在于,所述目标数据包括:建议实益拥有人信息、股东信息、工商基本信息和年报信息。
8.一种基于知识图谱的银行反洗钱股权追溯装置,其特征在于,应用于股权追溯工具,包括:
获取单元,用于获取携带有目标企业的股权追溯报告生成请求,并根据所述股权追溯报告生成请求获取用于生成对应的股权追溯报告的基础数据;
图谱构建单元,用于从所述目标企业出发,对所述基础数据执行预设层级的广度优先搜索,并根据搜索到的目标基础数据构建所述预设层级的多叉树,进而得到股权追溯图谱,其中,所述多叉树中,包含从最上层节点到所述目标企业的节点的多条股权链路的路径,每条路径上的每个节点表示控股企业或控股人员,且每条路径上设定有相应的股权信息;
精简化处理单元,用于对所述股权追溯图谱进行精简化处理,得到精简股权追溯图谱;
计算单元,用于根据所述股权追溯图谱计算图谱信息,并根据预设报告模板从所述基础数据中提取目标数据,其中,所述图谱信息包括:中间层数量的信息和注册地数量的信息;
渲染单元,用于对所述精简股权追溯图谱、所述目标数据和所述图谱信息进行渲染,进而得到目标企业的股权追溯报告。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述机器可运行指令在被处理器调用和运行时,所述机器可运行指令促使所述处理器运行上述权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410217253.8A CN117788132B (zh) | 2024-02-28 | 2024-02-28 | 基于知识图谱的银行反洗钱股权追溯方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410217253.8A CN117788132B (zh) | 2024-02-28 | 2024-02-28 | 基于知识图谱的银行反洗钱股权追溯方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117788132A true CN117788132A (zh) | 2024-03-29 |
CN117788132B CN117788132B (zh) | 2024-05-31 |
Family
ID=90383784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410217253.8A Active CN117788132B (zh) | 2024-02-28 | 2024-02-28 | 基于知识图谱的银行反洗钱股权追溯方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117788132B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060265258A1 (en) * | 2005-04-18 | 2006-11-23 | Craig Powell | Apparatus and methods for an application process and data analysis |
US20080148239A1 (en) * | 2003-12-30 | 2008-06-19 | Petrov Miroslav R | System and method for integrated logging and tracing functions in an enterprise network |
US20110131067A1 (en) * | 2009-11-30 | 2011-06-02 | Butcher Iii George H | Method, software program, and system for structuring risk in a financial transaction |
CN111553786A (zh) * | 2020-04-24 | 2020-08-18 | 中金汇安(北京)科技有限公司 | 基于图形数据库的银行股东贷款关联交易挖掘方法和系统 |
WO2020253370A1 (zh) * | 2019-06-17 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 关联图谱展示方法、装置、计算机设备和存储介质 |
CN112651760A (zh) * | 2021-01-07 | 2021-04-13 | 量子数聚(北京)科技有限公司 | 企业关系展示方法及装置 |
CN112966099A (zh) * | 2021-02-26 | 2021-06-15 | 北京金堤征信服务有限公司 | 关系图谱展示方法、装置及计算机可读存储介质 |
CN114708000A (zh) * | 2022-03-08 | 2022-07-05 | 中央财经大学 | 企业信用分类系统构建方法、装置、电子设备及存储介质 |
CN115129879A (zh) * | 2021-03-24 | 2022-09-30 | 北京智数天下科技有限公司 | 一种基于知识图谱的企业关系知识库构建的方法 |
US20220327624A1 (en) * | 2021-04-07 | 2022-10-13 | Kingscrowd, Inc. | System and method for rating equity crowdfunding capital raises |
CN115481308A (zh) * | 2022-10-19 | 2022-12-16 | 浪潮卓数大数据产业发展有限公司 | 一种股权结构信息自动采集方法 |
CN115630195A (zh) * | 2022-10-12 | 2023-01-20 | 安徽继远软件有限公司 | 一种基于工商数据管理的工商通用服务建设平台 |
CN116069987A (zh) * | 2023-04-06 | 2023-05-05 | 浙江浙商金控有限公司 | 一种企业关联关系识别方法 |
CN116719591A (zh) * | 2023-05-12 | 2023-09-08 | 河南天眼查科技有限公司 | 股权图谱的展示方法、装置、存储系统和电子设备 |
CN117273954A (zh) * | 2023-11-21 | 2023-12-22 | 中证数智科技(深圳)有限公司 | 基于大规模关系图谱的股权关系穿透方法、装置及设备 |
CN117495315A (zh) * | 2024-01-02 | 2024-02-02 | 东亚银行(中国)有限公司 | 一种基于pipeline流程的业务管理方法及装置 |
-
2024
- 2024-02-28 CN CN202410217253.8A patent/CN117788132B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080148239A1 (en) * | 2003-12-30 | 2008-06-19 | Petrov Miroslav R | System and method for integrated logging and tracing functions in an enterprise network |
US20060265258A1 (en) * | 2005-04-18 | 2006-11-23 | Craig Powell | Apparatus and methods for an application process and data analysis |
US20110131067A1 (en) * | 2009-11-30 | 2011-06-02 | Butcher Iii George H | Method, software program, and system for structuring risk in a financial transaction |
WO2020253370A1 (zh) * | 2019-06-17 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 关联图谱展示方法、装置、计算机设备和存储介质 |
CN111553786A (zh) * | 2020-04-24 | 2020-08-18 | 中金汇安(北京)科技有限公司 | 基于图形数据库的银行股东贷款关联交易挖掘方法和系统 |
CN112651760A (zh) * | 2021-01-07 | 2021-04-13 | 量子数聚(北京)科技有限公司 | 企业关系展示方法及装置 |
CN112966099A (zh) * | 2021-02-26 | 2021-06-15 | 北京金堤征信服务有限公司 | 关系图谱展示方法、装置及计算机可读存储介质 |
CN115129879A (zh) * | 2021-03-24 | 2022-09-30 | 北京智数天下科技有限公司 | 一种基于知识图谱的企业关系知识库构建的方法 |
US20220327624A1 (en) * | 2021-04-07 | 2022-10-13 | Kingscrowd, Inc. | System and method for rating equity crowdfunding capital raises |
CN114708000A (zh) * | 2022-03-08 | 2022-07-05 | 中央财经大学 | 企业信用分类系统构建方法、装置、电子设备及存储介质 |
CN115630195A (zh) * | 2022-10-12 | 2023-01-20 | 安徽继远软件有限公司 | 一种基于工商数据管理的工商通用服务建设平台 |
CN115481308A (zh) * | 2022-10-19 | 2022-12-16 | 浪潮卓数大数据产业发展有限公司 | 一种股权结构信息自动采集方法 |
CN116069987A (zh) * | 2023-04-06 | 2023-05-05 | 浙江浙商金控有限公司 | 一种企业关联关系识别方法 |
CN116719591A (zh) * | 2023-05-12 | 2023-09-08 | 河南天眼查科技有限公司 | 股权图谱的展示方法、装置、存储系统和电子设备 |
CN117273954A (zh) * | 2023-11-21 | 2023-12-22 | 中证数智科技(深圳)有限公司 | 基于大规模关系图谱的股权关系穿透方法、装置及设备 |
CN117495315A (zh) * | 2024-01-02 | 2024-02-02 | 东亚银行(中国)有限公司 | 一种基于pipeline流程的业务管理方法及装置 |
Non-Patent Citations (4)
Title |
---|
吕华揆;洪亮;马费成;: "金融股权知识图谱构建与应用", 数据分析与知识发现, no. 05, 25 May 2020 (2020-05-25) * |
吴运兵;杨帆;赖国华;林开标;: "知识图谱学习和推理研究进展", 小型微型计算机系统, no. 09, 15 September 2016 (2016-09-15) * |
李巍;何晓蕾;: "提高审计数据分析的质量的对策", 管理工程师, no. 06, 26 December 2013 (2013-12-26) * |
许家芝;: "中国企业会计研究可视化分析(2008-2017)", 合肥工业大学学报(社会科学版), no. 02, 15 April 2019 (2019-04-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN117788132B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9299108B2 (en) | Insurance claims processing | |
Phillips et al. | Industry classification schemes: An analysis and review | |
US7593892B2 (en) | Financial institution portal system and method | |
WO2019200752A1 (zh) | 基于语义理解的兴趣点查询方法、装置和计算机设备 | |
Barth | Global comparability in financial reporting: What, why, how, and when? | |
Chen et al. | Financing constraints, ownership control, and cross‐border M&As: evidence from Nine East Asian economies | |
US20090164387A1 (en) | Systems and methods for providing semantically enhanced financial information | |
Baker et al. | Fifty years of The Financial Review: A bibliometric overview | |
US20090204517A1 (en) | Intercompany accounting data analytics | |
US10140660B2 (en) | Systems and methods for enforcing fiduciary compliance | |
CN110929969A (zh) | 一种供应商的评价方法及装置 | |
US10600117B2 (en) | Financial data entry system | |
US20100312602A1 (en) | Investor Relations Systems and Methods | |
US11042563B1 (en) | Database interface system | |
KR100974342B1 (ko) | 전문단체의 추천을 이용한 기업신용평가 시스템 및 그 방법 | |
CN112633889A (zh) | 一种企业基因测序系统及方法 | |
Sullivan | Recognition of customary land in the Solomon Islands: status, issues and options | |
US20050210040A1 (en) | Document organization and formatting for display | |
CN117788132B (zh) | 基于知识图谱的银行反洗钱股权追溯方法和装置 | |
Mansour et al. | XBRL Standards–mean of improving capital market information process | |
Tijjani et al. | Research productivity of International Financial Reporting Standards (IFRS) from 2003 to 2020 | |
TWM569465U (zh) | 利於稽核之合規處理裝置 | |
CN112966024A (zh) | 一种基于大数据的金融风控数据分析系统 | |
US20100257109A1 (en) | System and Method for Associating Documents in a Transaction with Transaction Data | |
Lopes et al. | The influence of internal audit departments on external municipal audit reports |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40103744 Country of ref document: HK |