CN114154905A - 获取企业关联关系的方法及系统 - Google Patents

获取企业关联关系的方法及系统 Download PDF

Info

Publication number
CN114154905A
CN114154905A CN202111503209.6A CN202111503209A CN114154905A CN 114154905 A CN114154905 A CN 114154905A CN 202111503209 A CN202111503209 A CN 202111503209A CN 114154905 A CN114154905 A CN 114154905A
Authority
CN
China
Prior art keywords
enterprise
data
relation
association
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111503209.6A
Other languages
English (en)
Inventor
金明哲
金钰
汪文波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Bank Co Ltd
Original Assignee
Industrial Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial Bank Co Ltd filed Critical Industrial Bank Co Ltd
Priority to CN202111503209.6A priority Critical patent/CN114154905A/zh
Publication of CN114154905A publication Critical patent/CN114154905A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Technology Law (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种获取企业关联关系的方法及系统,包括:主机系统前端模块:根据维度配置关联参数,根据企业关联关系指标配置关联关系阀值;提交企业名录,实时向外部数据源获取企业关系信息数据包;提供展示和下载功能;主机系统后端模块:对企业信息关系数据包中的数据按规则解析并存储至数据库中,得到结构化数据;对结构化数据进行预处理,对于正常数据按照设定的关联参数维度,得出企业之间的关联关系值;进行数据分类;数据库模块:存储分类后的数据。本发明能够根据企业识别信息对单一企业实现风险识别,还能够对多个企业之间的股权、法人等关联信息的识别与数据分析实现关联企业风险识别及实现企业间关联关系的强弱性自动化审查与识别。

Description

获取企业关联关系的方法及系统
技术领域
本发明涉及数据处理领域,具体地,涉及一种获取企业关联关系的方法及系统。
背景技术
互联网快速发展,互联网中公开大量的数据,其中也包括大量企业的相关数据。关于企业的数据可以包括企业官网数据、关联企业数据、企业APP数据以及企业招聘数据等大量的不同类型的数据。获取和识别企业关联关系对于公司之间及公司和客户之间的合作尤为重要,如果不知道所合作对象的企业关联关系,则会使得工作很被动,容易出现投资风险、合作风险。企业风险涉及到企业的经营管理、资产配置、资金运用、利润分配、信息披露等方方面面,企业如果存在大的风险,会给企业、投资者、求职者、国家和集体造成重大损失。因此,根据互联网公开的数据获取企业关联关系显得尤为重要。为顺应互联网金融时代商业银行的业务运营变化,强化业务运营风险的实质有效控制,如商业银行等金融机构需要通过建立自动风险识别方式,来替代对法人用户风险信息的传统识别模式,提升风险识别的精准性。
专利文献CN113435762A(申请号:CN202110757269.4)公开了一种企业风险识别方法、装置及设备,方案包括:获取标准化后的招聘数据,采用招聘主体企业识别模型识招聘数据对应的招聘主体企业,根据所述招聘数据生成招聘主体企业的第一企业招聘信息画像;然后根据获取的招聘主体企业的注册数据确定招聘主体企业的类比企业的第二企业招聘信息画像;计算第一企业招聘信息画像与第二企业招聘信息画像之间的差异值;当差异值大于第一预设阈值时,确定招聘主体企业存在风险。
目前,各行业的风控部门在开展风险排查和评估检查工作时,主要通过上述专利文献的查询方式频繁地从工商信息网或者第三方网站查询目标企业的信息,从而评价其风险。上述专利文献仅能根据目标企业自身的信息与类比企业的信息,判断目标企业是否存在风险,当目标企业正常而其关联企业存在风险时无法及时识别。对于金融行业等风险控制严格的行业来说,关联企业对目标企业的风险也至关重要,仅查看目标企业的信息是不够的。
因此,通常还需要通过人工查询的方式,查询目标企业的股东、关联企业的信息,对于关联企业,还要进一步查询其股东及关联信息,直至查询完成所有关联企业,梳理所有关联企业间的关系,以便于后续能够全面评估企业的风险。这种人工查询企业关联关系的方式非常费时,且极易出错。此外,由于企业的关联关系经常发生变更,即使是同一目标企业,每过一段时间也要及时进行再次查询,以免信息未及时更新,重复劳动量大。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种。
根据本发明提供的一种获取企业关联关系的系统,包括:
主机系统前端模块:根据维度配置关联参数,根据企业关联关系指标配置关联关系阀值;提交企业名录,实时向外部数据源获取企业关系信息数据包;提供展示和下载功能;
主机系统后端模块:对企业信息关系数据包中的数据按规则解析并存储至数据库中,得到结构化数据;对结构化数据进行预处理,对于正常数据按照设定的关联参数维度,得出企业之间的关联关系值;进行数据分类;
数据库模块:存储分类后的数据。
优选地,在所述主机系统前端模块中:
根据维度配置关联参数,维度包括股权关系、高管关系、企业征信、企业工商处罚,以HTTP请求的向行内的外部数据集成平台获取数据,外部数据集成平台聚合了来源包括中国人民银行、法院、公安、通信运营商、各地公积金数据、FICO、百融、北京中数智汇的合法数据源信息;
根据企业关联关系指标配置强、中、弱关联关系阀值;此处设置阀值主要是用来作为关联公司强弱关系的判定条件;
提供展示功能,包括企业关系动态族谱图、结果表格,并提供图、表格的下载功能。
优选地,在所述主机系统后端模块中:
获取数据包后,对数据进行按规则解析并存储至数据库中,得到结构化数据;外部数据集成平台提供的接口中数据以HTTP响应报文的形式返回,报文中包含报文头信息及报文体数据,其中报文体中为企业关联性的数据信息,包含一个节点数组、一个关系数组,其中,节点数组中包含有节点ID、节点名称、是否输入节点、节点类型、注册资本、名称、成立时间、注册币种;
对结构化数据进行预处理,对于错误节点数据使用错误标记进行标记,对于无关联关系数据使用无关联关系标记,对于正常数据不做标记处理,通过错误标记进行标记、无关联关系标记对任意两个企业之间的关联关系进行标记,从而通过系统的前端页面筛选出无关联关系、有关联关系的企业组;
对于正常数据,依次遍历数据图中的关系组,获取企业数据中的高管、股权量化值,按照设定的参数维度,分析得出企业之间的关联关系值;因获取到的数据以节点数组、关系数组的形式返回,关系数组中的源节点id、目标节点id标识了两个企业节点关系的有向性,根据源节点id、目标节点id的关联方向以及关系类型、出资比例得出两个企业之间持股比例。
优选地,在所述数据库模块中:
所有企业间的关系数据分析后,按照企业名称A、企业名称B、强弱关系、关联类别、指标值、时间维度进行数据的分类存储至数据库中。
根据本发明提供的一种获取企业关联关系的方法,采用识别企业关联关系的系统,执行包括:
步骤S1:根据维度配置关联参数,根据企业关联关系指标配置关联关系阀值;
步骤S2:提交企业名录,实时向外部数据源获取企业关系信息数据包;
步骤S3:对企业信息关系数据包中的数据按规则解析并存储至数据库中,得到结构化数据;
步骤S4:对结构化数据进行预处理,对于正常数据按照设定的关联参数维度,得出企业之间的关联关系值;
步骤S5:进行数据分类,存储至数据库中;
步骤S6:将企业关系进行展示。
优选地,在所述步骤S1中:
在主机系统前端,进行参数配置:
通过参数配置页面,配置判断维度参数,涉及参数包括股权关系、高管关系、企业征信、企业工商处罚。
在主机系统前端,通过参数配置页面,配置企业关联关系阈值参数,涉及弱关系阈值、中关系阈值、强关系阈值;
在主机系统前端,通过参数配置页面,配置存量企业定时批量处理定时任务时间参数。
优选地,在所述步骤S2中:
在主机系统前端,批量导入企业信息:
在主机系统前端,在企业关系信息查询页面的企业信息导入模块,按照数据模板格式批量上传所需分析的企业名单,数据模板包括企业名称、企业统一信用代码两个字段;
上传提交完毕后,通过企业关系信息查询页面查看当前批量上传的企业信息以及当前操作人员的相关信息,字段信息包括操作员、时间、企业集合、分析进度、分析结果;
在系统后端,系统以两种方式向外部获取企业相关数据
第一种方式为定时触发方式,系统后端通过配置的定时任务,自动对当前的所有企业集合向外部数据集成平台发起数据查询请求;
第二种方式为实时触发方式,操作员通过页面上的实时查询按钮通知系统后端向外部数据集成平台发起数据查询请求指令。
优选地,在所述步骤S3中:
发起请求后,系统后端获得外部数据集成平台的响应数据报文,系统根据接口规范解析数据,并将数据存储至数据库中;
其中,响应报文包含报文头及报文体两个部分,报文体包含节点数组和关系数组,节点数组中含信息包括节点id、节点名称、节点类型、企业状态、是否输入节点、注册资本、统一社会信用代码、名称、注册号,关系数组含信息包括节点id、源节点id、目标节点id、关系类型、出资比例、控制路径关系、职务、是否法人、认缴出资额。
优选地,在所述步骤S4中:
系统后端对结构化数据进行分析处理:
系统后端对存储在数据库中的数据根据节点数组进行遍历处理,依次遍历节点数组中的节点id,根据节点id找出与之关联的关系数组信息,通过关系数组中的源节点id找出与当前企业有关联的所有企业目标节点id,构建出源节点id企业与目标节点id企业之间的股权关系、法人关系;
系统后端基于遍历处理方法,依次构建出以每个企业作为源节点id的企业与所有目标企业之间的股权关系、法人关系,并将该关系信息以企业ID作为索引的方式存储至数据库中。
若操作员上传的企业集合内的企业不是以源节点id的企业的目标节点id企业,则对这两个企业之间的关系标记为无关联关系,其他有关联的企业之间的关系标记为有关联关系;
后端系统对有关联关系的企业计算关系强弱性:
标记为有关联关系的企业,对每个企业的有关联关系企业进行遍历,得出两个企业间关联关系的强弱,企业直接持股按加法运算,间接持股按乘法计算;
计算出的企业持股实际比例与参数阈值进行比较,较企业间的关系分类为弱关联、中关联、强关联企业,并将关联结果存入数据库中。
优选地,在所述步骤S6中:
在前端进行数据结果展示:
前端系统提供企业关联数据的展示页面,通过条件包括企业名称、操作员、时间进行筛选查看企业关系结果,信息包括关联关系强弱、持股比例、法人关系;
前端系统提供报表下载功能,对操作员检索的结果进行下载导出,导出格式为加密的excel格式文件;
前端系统提供企业间关联关系的关系图展示,通过节点图的形式展示与主企业有关的所有有关联企业,节点间使用带箭头的有向线形式展示关系的有向性,线上携带企业的具体关联关系,包括法人、持股。
与现有技术相比,本发明具有如下的有益效果:
本发明基于数据根据节点数组进行遍历处理的方法,依次构建出以每个企业与所有目标企业之间的股权关系、法人关系,以此对多个企业的关联关系进行获取。能够对多个企业之间的股权、法人等关联信息的识别与数据分析实现关联企业风险识别及实现企业间关联关系的强弱性自动化审查与识别。
本发明动态跟踪企业关联信息,当企业之间的关联关系发生变化时,将指标窗口内超出预警阀值的企业信息进行详细记录,提供给风险部门进行事后处理。
本发明通过改进对多个企业之间的股权、法人等关联信息的识别,在以下场景中具有优势:快速识别已知风险企业的所有关联企业及其关联性的强弱性;在项目招标、企业审查等场景中识别已知企业间的所有关联性强弱关系;对于风险企业及企业关联性强弱变化的快速预警。
本发明获取数据包后,对数据进行按规则解析并存储得到结构化数据,并对结构化数据进行标记,对于错误节点数据使用错误标记进行标记,对于无关联关系数据使用无关联关系标记,对于正常数据不做标记处理,从而能够快速筛选出两个企业之间有无关联关系的情况,解决了快速查询风险企业的所有关联企业及其关联性的强弱项性的问题,也解决了快速查询目标企业是否存在有风险的关联企业及其关联性强弱的问题。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明系统模块图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1:
根据本发明提供的一种获取企业关联关系的系统,如图1所示,包括:
主机系统前端模块:根据维度配置关联参数,根据企业关联关系指标配置关联关系阀值;提交企业名录,实时向外部数据源获取企业关系信息数据包;提供展示和下载功能;
主机系统后端模块:对企业信息关系数据包中的数据按规则解析并存储至数据库中,得到结构化数据;对结构化数据进行预处理,对于正常数据按照设定的关联参数维度,得出企业之间的关联关系值;进行数据分类;
数据库模块:存储分类后的数据。
具体地,在所述主机系统前端模块中:
根据维度配置关联参数,维度包括股权关系、高管关系、企业征信、企业工商处罚,以HTTP请求的向行内的外部数据集成平台获取数据,外部数据集成平台聚合了来源包括中国人民银行、法院、公安、通信运营商、各地公积金数据、FICO、百融、北京中数智汇的合法数据源信息;
根据企业关联关系指标配置强、中、弱关联关系阀值;此处设置阀值主要是用来作为关联公司强弱关系的判定条件;
提供展示功能,包括企业关系动态族谱图、结果表格,并提供图、表格的下载功能。
具体地,在所述主机系统后端模块中:
获取数据包后,对数据进行按规则解析并存储至数据库中,得到结构化数据;外部数据集成平台提供的接口中数据以HTTP响应报文的形式返回,报文中包含报文头信息及报文体数据,其中报文体中为企业关联性的数据信息,包含一个节点数组、一个关系数组,其中,节点数组中包含有节点ID、节点名称、是否输入节点、节点类型、注册资本、名称、成立时间、注册币种;
对结构化数据进行预处理,对于错误节点数据使用错误标记进行标记,对于无关联关系数据使用无关联关系标记,对于正常数据不做标记处理,通过错误标记进行标记、无关联关系标记对任意两个企业之间的关联关系进行标记,从而通过系统的前端页面筛选出无关联关系、有关联关系的企业组;
对于正常数据,依次遍历数据图中的关系组,获取企业数据中的高管、股权量化值,按照设定的参数维度,分析得出企业之间的关联关系值;因获取到的数据以节点数组、关系数组的形式返回,关系数组中的源节点id、目标节点id标识了两个企业节点关系的有向性,根据源节点id、目标节点id的关联方向以及关系类型、出资比例得出两个企业之间持股比例。
具体地,在所述数据库模块中:
所有企业间的关系数据分析后,按照企业名称A、企业名称B、强弱关系、关联类别、指标值、时间维度进行数据的分类存储至数据库中。
实施例2:
实施例2为实施例1的优选例,以更为具体地对本发明进行说明。
本领域技术人员可以将本发明提供的一种获取企业关联关系方法,理解为获取企业关联关系系统的具体实施方式,即所述获取企业关联关系系统可以通过执行所述获取企业关联关系方法的步骤流程予以实现。
根据本发明提供的一种获取企业关联关系的方法,采用识别企业关联关系的系统,执行包括:
步骤S1:根据维度配置关联参数,根据企业关联关系指标配置关联关系阀值;
步骤S2:提交企业名录,实时向外部数据源获取企业关系信息数据包;
步骤S3:对企业信息关系数据包中的数据按规则解析并存储至数据库中,得到结构化数据;
步骤S4:对结构化数据进行预处理,对于正常数据按照设定的关联参数维度,得出企业之间的关联关系值;
步骤S5:进行数据分类,存储至数据库中;
步骤S6:将企业关系进行展示。
具体地,在所述步骤S1中:
在主机系统前端,进行参数配置:
通过参数配置页面,配置判断维度参数,涉及参数包括股权关系、高管关系、企业征信、企业工商处罚。
在主机系统前端,通过参数配置页面,配置企业关联关系阈值参数,涉及弱关系阈值、中关系阈值、强关系阈值;
在主机系统前端,通过参数配置页面,配置存量企业定时批量处理定时任务时间参数。
具体地,在所述步骤S2中:
在主机系统前端,批量导入企业信息:
在主机系统前端,在企业关系信息查询页面的企业信息导入模块,按照数据模板格式批量上传所需分析的企业名单,数据模板包括企业名称、企业统一信用代码两个字段;
上传提交完毕后,通过企业关系信息查询页面查看当前批量上传的企业信息以及当前操作人员的相关信息,字段信息包括操作员、时间、企业集合、分析进度、分析结果;
在系统后端,系统以两种方式向外部获取企业相关数据
第一种方式为定时触发方式,系统后端通过配置的定时任务,自动对当前的所有企业集合向外部数据集成平台发起数据查询请求;
第二种方式为实时触发方式,操作员通过页面上的实时查询按钮通知系统后端向外部数据集成平台发起数据查询请求指令。
具体地,在所述步骤S3中:
发起请求后,系统后端获得外部数据集成平台的响应数据报文,系统根据接口规范解析数据,并将数据存储至数据库中;
其中,响应报文包含报文头及报文体两个部分,报文体包含节点数组和关系数组,节点数组中含信息包括节点id、节点名称、节点类型、企业状态、是否输入节点、注册资本、统一社会信用代码、名称、注册号,关系数组含信息包括节点id、源节点id、目标节点id、关系类型、出资比例、控制路径关系、职务、是否法人、认缴出资额。
具体地,在所述步骤S4中:
系统后端对结构化数据进行分析处理:
系统后端对存储在数据库中的数据根据节点数组进行遍历处理,依次遍历节点数组中的节点id,根据节点id找出与之关联的关系数组信息,通过关系数组中的源节点id找出与当前企业有关联的所有企业目标节点id,构建出源节点id企业与目标节点id企业之间的股权关系、法人关系;
系统后端基于遍历处理方法,依次构建出以每个企业作为源节点id的企业与所有目标企业之间的股权关系、法人关系,并将该关系信息以企业ID作为索引的方式存储至数据库中。
若操作员上传的企业集合内的企业不是以源节点id的企业的目标节点id企业,则对这两个企业之间的关系标记为无关联关系,其他有关联的企业之间的关系标记为有关联关系;
后端系统对有关联关系的企业计算关系强弱性:
标记为有关联关系的企业,对每个企业的有关联关系企业进行遍历,得出两个企业间关联关系的强弱,企业直接持股按加法运算,间接持股按乘法计算;
计算出的企业持股实际比例与参数阈值进行比较,较企业间的关系分类为弱关联、中关联、强关联企业,并将关联结果存入数据库中。
具体地,在所述步骤S6中:
在前端进行数据结果展示:
前端系统提供企业关联数据的展示页面,通过条件包括企业名称、操作员、时间进行筛选查看企业关系结果,信息包括关联关系强弱、持股比例、法人关系;
前端系统提供报表下载功能,对操作员检索的结果进行下载导出,导出格式为加密的excel格式文件;
前端系统提供企业间关联关系的关系图展示,通过节点图的形式展示与主企业有关的所有有关联企业,节点间使用带箭头的有向线形式展示关系的有向性,线上携带企业的具体关联关系,包括法人、持股。
实施例3:
实施例3为实施例1的优选例,以更为具体地对本发明进行说明。
一种快速识别企业关联关系的方案,通过以下几个步骤实现:
步骤1:在主机系统前端,根据股权关系、高管关系、企业征信、企业工商处罚等维度配置关联参数,以HTTP请求的向行内的外部数据集成平台获取数据,外部数据集成平台聚合了来源为中国人民银行、法院、公安、通信运营商、各地公积金数据、FICO、百融、北京中数智汇等合法数据源信息。
同时,根据企业关联关系指标配置强、中、弱关联关系阀值;《中华人民共和国公司法》对于企业的关联关系有明确条款说明,比如A公司持有B公司股份超过25%,即为AB公司为关联公司。此处设置阀值主要是用来作为关联公司强弱关系的判定条件,比如设定股份持有关系阀值为25%,则当A持有B公司股份小于25%时为弱关联关系,大于等于25%时为强关联关系。
步骤2:在主机系统前端,提交需要动态跟踪的所有企业名录,实时向外部数据源获取企业关系信息数据包;
步骤3:系统后端获取数据包后,对数据进行按规则解析并存储至数据库中,得到结构化数据;外部数据集成平台提供的接口中数据以HTTP响应报文的形式返回,报文中包含报文头信息及报文体数据,其中报文体中为企业关联性的数据信息,包含一个节点数组(nodes)、一个关系数组(links),其中,节点数组中包含有节点ID、节点名称、是否输入节点、节点类型、注册资本、名称、成立时间、注册币种;
步骤4:系统后端对结构化数据进行预处理,对于错误节点数据使用ErrMks(ErrorMarks,错误标记)进行标记,对于无关联关系数据使用NoRelationMks(No RelationMarks,无关联关系标记),对于正常数据不做标记处理,通过ErrMks、NoRelationMks任意两个企业之间的关联关系进行标记,从而通过系统的前端页面就能快速筛选出“无关联关系”、“有关联关系”的企业组;
步骤5:系统后端对于正常数据,依次遍历数据图中的links关系组,根据From-To的有向性获取企业数据中的高管、股权量化值,按照步骤1中设定的参数维度,分析得出企业之间的关联关系值;因获取到的数据以节点数组(nodes)、关系数组(links)的形式返回,关系数组中的源节点id(LINK_FROM)、目标节点id(LINK_TO)标识了两个企业节点关系的有向性,根据LINK_FROM、LINK_TO的关联方向以及关系类型(LINK_TYPE)、出资比例(CONPROP)即可得出两个企业之间持股比例。
步骤6:系统后端所有企业间的关系数据分析后,按照企业名称A、企业名称B、强弱关系、关联类别、指标值、时间维度进行数据的分类存储至数据库中;
步骤7:系统前端提供企业关系动态族谱图、结果表格等展示功能,并提供图、表格的下载功能;
实施例4:
实施例4为实施例1的优选例,以更为具体地对本发明进行说明。
步骤1:在主机系统前端,进行参数配置。
1.1在主机系统前端,通过参数配置页面,配置判断维度参数,涉及股权关系、高管关系、企业征信、企业工商处罚等参数。
1.2在主机系统前端,通过参数配置页面,配置企业关联关系阈值参数,涉及弱关系阈值、中关系阈值、强关系阈值。
1.3在主机系统前端,通过参数配置页面,配置存量企业定时批量处理定时任务时间参数。
步骤2:在主机系统前端,批量导入企业信息。
2.1在主机系统前端,在企业关系信息查询页面的企业信息导入模块,按照数据模板格式批量上传所需分析的企业名单,数据模板包括“企业名称”、“企业统一信用代码”两个字段。
2.2上传提交完毕后,可通过企业关系信息查询页面查看当前批量上传的企业信息以及当前操作人员的相关信息,包括“操作员”、“时间”、“企业集合”、“分析进度”、“分析结果”等字段信息。
步骤3:在系统后端,系统以两种方式向外部获取企业相关数据。
3.1第一种方式为定时触发方式,系统后端通过步骤1.3中配置的定时任务,自动对当前的所有企业集合向外部数据集成平台发起数据查询请求
3.2第二种方式为实时触发方式,操作员通过页面上的“实时查询”按钮通知系统后端向外部数据集成平台发起数据查询请求指令。
3.3根据3.1或3.2发起请求后,系统后端获得外部数据集成平台的响应数据报文,系统根据接口规范解析数据,并将数据存储至数据库中。其中,响应报文包含报文头及报文体两个部分,报文体包含节点数组(nodes)和关系数组(links),节点数组中含节点id、节点名称、节点类型、企业状态、是否输入节点、注册资本、统一社会信用代码、名称、注册号等信息,关系数组含节点id、源节点id、目标节点id、关系类型、出资比例、控制路径关系、职务、是否法人、认缴出资额等信息。
步骤4:系统后端对结构化数据进行分析处理。
4.1系统后端对存储在数据库中的数据根据节点数组(nodes)进行遍历处理,依次遍历节点数组中的节点id,根据节点id找出与之关联的关系数组(links)信息,通过关系数组(links)中的源节点id找出与当前企业有关联的所有企业(目标节点id),构建出源节点id企业与目标节点id企业之间的股权关系、法人关系。
4.2系统后端基于4.1的遍历处理方法,依次构建出以每个企业作为源节点id的企业与所有目标企业之间的股权关系、法人关系,并将该关系信息以企业ID作为索引的方式存储至数据库中。
4.3经过,若操作员上传的企业集合内的企业不是以源节点id的企业的目标节点id企业,则对这两个企业之间的关系标记为“无关联关系(NoRelationMks)”,其他有关联的企业之间的关系标记为“有关联关系(RelatrionMks)”。
步骤5:后端系统对有关联关系的企业计算关系强弱性。
5.1根据4.3中标记为有关联关系的企业,对每个企业的有关联关系企业进行遍历,得出两个企业间关联关系的强弱,企业直接持股按加法运算,间接持股按乘法计算。以股权关系计算为例,假设企业A分别对企业B、企业C、企业D持股20%且企业B对企业C持股50%,则企业A对企业B的实际持股比例为20%,企业A对企业C的实际持股比例为20%+20%*50%=30%,企业A对企业D的实际持股比例为20%。
5.2根据5.1中计算出的企业持股实际比例与1.2中的参数阈值进行比较,较企业间的关系分类为弱关联、中关联、强关联企业,并将关联结果存入数据库中。
步骤6:在前端进行数据结果展示。
6.1前端系统提供企业关联数据的展示页面,通过企业名称、操作员、时间等条件可以进行筛选查看企业关系结果,包括关联关系强弱、持股比例、法人关系等信息。
6.2前端系统提供报表下载功能,对操作员检索的结果进行下载导出,导出格式为加密的excel格式文件。
6.3前端系统提供企业间关联关系的关系图展示,通过节点图的形式展示与主企业有关的所有有关联企业,节点间使用带箭头的有向线形式展示关系的有向性,线上携带企业的具体关联关系,如法人、持股等。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种获取企业关联关系的系统,其特征在于,包括:
主机系统前端模块:根据维度配置关联参数,根据企业关联关系指标配置关联关系阀值;提交企业名录,实时向外部数据源获取企业关系信息数据包;提供展示和下载功能;
主机系统后端模块:对企业信息关系数据包中的数据按规则解析并存储至数据库中,得到结构化数据;对结构化数据进行预处理,对于正常数据按照设定的关联参数维度,得出企业之间的关联关系值;进行数据分类;
数据库模块:存储分类后的数据。
2.根据权利要求1所述的获取企业关联关系的系统,其特征在于,在所述主机系统前端模块中:
根据维度配置关联参数,维度包括股权关系、高管关系、企业征信、企业工商处罚,以HTTP请求的向行内的外部数据集成平台获取数据,外部数据集成平台聚合了来源包括中国人民银行、法院、公安、通信运营商、各地公积金数据、FICO、百融、北京中数智汇的合法数据源信息;
根据企业关联关系指标配置强、中、弱关联关系阀值;此处设置阀值主要是用来作为关联公司强弱关系的判定条件;
提供展示功能,包括企业关系动态族谱图、结果表格,并提供图、表格的下载功能。
3.根据权利要求1所述的获取企业关联关系的系统,其特征在于,在所述主机系统后端模块中:
获取数据包后,对数据进行按规则解析并存储至数据库中,得到结构化数据;外部数据集成平台提供的接口中数据以HTTP响应报文的形式返回,报文中包含报文头信息及报文体数据,其中报文体中为企业关联性的数据信息,包含一个节点数组、一个关系数组,其中,节点数组中包含有节点ID、节点名称、是否输入节点、节点类型、注册资本、名称、成立时间、注册币种;
对结构化数据进行预处理,对于错误节点数据使用错误标记进行标记,对于无关联关系数据使用无关联关系标记,对于正常数据不做标记处理,通过错误标记进行标记、无关联关系标记对任意两个企业之间的关联关系进行标记,从而通过系统的前端页面筛选出无关联关系、有关联关系的企业组;
对于正常数据,依次遍历数据图中的关系组,获取企业数据中的高管、股权量化值,按照设定的参数维度,分析得出企业之间的关联关系值;因获取到的数据以节点数组、关系数组的形式返回,关系数组中的源节点id、目标节点id标识了两个企业节点关系的有向性,根据源节点id、目标节点id的关联方向以及关系类型、出资比例得出两个企业之间持股比例。
4.根据权利要求1所述的获取企业关联关系的系统,其特征在于,在所述数据库模块中:
所有企业间的关系数据分析后,按照企业名称A、企业名称B、强弱关系、关联类别、指标值、时间维度进行数据的分类存储至数据库中。
5.一种获取企业关联关系的方法,其特征在于,采用权利要求1所述的识别企业关联关系的系统,执行包括:
步骤S1:根据维度配置关联参数,根据企业关联关系指标配置关联关系阀值;
步骤S2:提交企业名录,实时向外部数据源获取企业关系信息数据包;
步骤S3:对企业信息关系数据包中的数据按规则解析并存储至数据库中,得到结构化数据;
步骤S4:对结构化数据进行预处理,对于正常数据按照设定的关联参数维度,得出企业之间的关联关系值;
步骤S5:进行数据分类,存储至数据库中;
步骤S6:将企业关系进行展示。
6.根据权利要求5所述的获取企业关联关系的方法,其特征在于,在所述步骤S1中:
在主机系统前端,进行参数配置:
通过参数配置页面,配置判断维度参数,涉及参数包括股权关系、高管关系、企业征信、企业工商处罚。
在主机系统前端,通过参数配置页面,配置企业关联关系阈值参数,涉及弱关系阈值、中关系阈值、强关系阈值;
在主机系统前端,通过参数配置页面,配置存量企业定时批量处理定时任务时间参数。
7.根据权利要求5所述的获取企业关联关系的方法,其特征在于,在所述步骤S2中:
在主机系统前端,批量导入企业信息:
在主机系统前端,在企业关系信息查询页面的企业信息导入模块,按照数据模板格式批量上传所需分析的企业名单,数据模板包括企业名称、企业统一信用代码两个字段;
上传提交完毕后,通过企业关系信息查询页面查看当前批量上传的企业信息以及当前操作人员的相关信息,字段信息包括操作员、时间、企业集合、分析进度、分析结果;
在系统后端,系统以两种方式向外部获取企业相关数据
第一种方式为定时触发方式,系统后端通过配置的定时任务,自动对当前的所有企业集合向外部数据集成平台发起数据查询请求;
第二种方式为实时触发方式,操作员通过页面上的实时查询按钮通知系统后端向外部数据集成平台发起数据查询请求指令。
8.根据权利要求5所述的获取企业关联关系的方法,其特征在于,在所述步骤S3中:
发起请求后,系统后端获得外部数据集成平台的响应数据报文,系统根据接口规范解析数据,并将数据存储至数据库中;
其中,响应报文包含报文头及报文体两个部分,报文体包含节点数组和关系数组,节点数组中含信息包括节点id、节点名称、节点类型、企业状态、是否输入节点、注册资本、统一社会信用代码、名称、注册号,关系数组含信息包括节点id、源节点id、目标节点id、关系类型、出资比例、控制路径关系、职务、是否法人、认缴出资额。
9.根据权利要求5所述的获取企业关联关系的方法,其特征在于,在所述步骤S4中:
系统后端对结构化数据进行分析处理:
系统后端对存储在数据库中的数据根据节点数组进行遍历处理,依次遍历节点数组中的节点id,根据节点id找出与之关联的关系数组信息,通过关系数组中的源节点id找出与当前企业有关联的所有企业目标节点id,构建出源节点id企业与目标节点id企业之间的股权关系、法人关系;
系统后端基于遍历处理方法,依次构建出以每个企业作为源节点id的企业与所有目标企业之间的股权关系、法人关系,并将该关系信息以企业ID作为索引的方式存储至数据库中。
若操作员上传的企业集合内的企业不是以源节点id的企业的目标节点id企业,则对这两个企业之间的关系标记为无关联关系,其他有关联的企业之间的关系标记为有关联关系;
后端系统对有关联关系的企业计算关系强弱性:
标记为有关联关系的企业,对每个企业的有关联关系企业进行遍历,得出两个企业间关联关系的强弱,企业直接持股按加法运算,间接持股按乘法计算;
计算出的企业持股实际比例与参数阈值进行比较,较企业间的关系分类为弱关联、中关联、强关联企业,并将关联结果存入数据库中。
10.根据权利要求5所述的获取企业关联关系的方法,其特征在于,在所述步骤S6中:
在前端进行数据结果展示:
前端系统提供企业关联数据的展示页面,通过条件包括企业名称、操作员、时间进行筛选查看企业关系结果,信息包括关联关系强弱、持股比例、法人关系;
前端系统提供报表下载功能,对操作员检索的结果进行下载导出,导出格式为加密的excel格式文件;
前端系统提供企业间关联关系的关系图展示,通过节点图的形式展示与主企业有关的所有有关联企业,节点间使用带箭头的有向线形式展示关系的有向性,线上携带企业的具体关联关系,包括法人、持股。
CN202111503209.6A 2021-12-09 2021-12-09 获取企业关联关系的方法及系统 Pending CN114154905A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111503209.6A CN114154905A (zh) 2021-12-09 2021-12-09 获取企业关联关系的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111503209.6A CN114154905A (zh) 2021-12-09 2021-12-09 获取企业关联关系的方法及系统

Publications (1)

Publication Number Publication Date
CN114154905A true CN114154905A (zh) 2022-03-08

Family

ID=80453871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111503209.6A Pending CN114154905A (zh) 2021-12-09 2021-12-09 获取企业关联关系的方法及系统

Country Status (1)

Country Link
CN (1) CN114154905A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114880323A (zh) * 2022-04-26 2022-08-09 深圳市未来鼠信息技术有限公司 数据管理方法、装置、设备及存储介质
CN116069987A (zh) * 2023-04-06 2023-05-05 浙江浙商金控有限公司 一种企业关联关系识别方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114880323A (zh) * 2022-04-26 2022-08-09 深圳市未来鼠信息技术有限公司 数据管理方法、装置、设备及存储介质
WO2023208246A1 (zh) * 2022-04-26 2023-11-02 深圳市未来鼠信息技术有限公司 数据管理方法、装置、设备及存储介质
CN114880323B (zh) * 2022-04-26 2023-12-12 深圳市未来鼠信息技术有限公司 数据管理方法、装置、设备及存储介质
CN116069987A (zh) * 2023-04-06 2023-05-05 浙江浙商金控有限公司 一种企业关联关系识别方法
CN116069987B (zh) * 2023-04-06 2023-07-25 浙江浙商金控有限公司 一种企业关联关系识别方法

Similar Documents

Publication Publication Date Title
CN107993143A (zh) 一种信贷风险评估方法及系统
US20090204517A1 (en) Intercompany accounting data analytics
CN114154905A (zh) 获取企业关联关系的方法及系统
CN111383101A (zh) 贷后风险监控方法、装置、设备及计算机可读存储介质
CN112668859A (zh) 基于大数据的客户风险评级方法、装置、设备及存储介质
CN109635007B (zh) 一种行为评估方法、装置及相关设备
CN108460689B (zh) 一种保单分析方法、装置、终端设备及存储介质
US10579651B1 (en) Method, system, and program for evaluating intellectual property right
Wong et al. Financial accounting fraud detection using business intelligence
Svabova et al. Prediction model of firms financial distress
CN105809269A (zh) 专利价值的评估方法
CN110544023A (zh) 一种企业区域性贡献力的数据化评估系统及其评估方法
CN111126844A (zh) 涉众型风险企业的评估方法、装置、设备及存储介质
Kulkarni et al. Network-based anomaly detection for insider trading
CN111798246A (zh) 一种金融风险等级评估方法和装置
CN115952186A (zh) 一种问题数据及其链路追溯方法及装置
KR101960863B1 (ko) 기술가치 평가 시스템
CN115952216A (zh) 一种养老保险数据挖掘方法、装置、存储介质及电子设备
CN112053217B (zh) 财务估值报表的生成方法及装置
CN114331728A (zh) 一种证券分析管理系统
CN113435697A (zh) 一种智能匹配系统的构建方法
CN112905589A (zh) 科技人才数据加工方法、系统、存储介质及终端
CN109543096B (zh) 数据查询方法、装置、计算机设备和存储介质
TWI782832B (zh) 輔助稽核人員稽核跟單交易的系統及方法
CN116228433B (zh) 债券组合业绩的回测方法、装置、设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination