CN112115278A - 基于知识图谱的实际控制人关系挖掘方法及装置 - Google Patents
基于知识图谱的实际控制人关系挖掘方法及装置 Download PDFInfo
- Publication number
- CN112115278A CN112115278A CN202011045131.3A CN202011045131A CN112115278A CN 112115278 A CN112115278 A CN 112115278A CN 202011045131 A CN202011045131 A CN 202011045131A CN 112115278 A CN112115278 A CN 112115278A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- entity
- entities
- relationship
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005065 mining Methods 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004458 analytical method Methods 0.000 claims abstract description 28
- 238000012216 screening Methods 0.000 claims abstract description 23
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 230000006399 behavior Effects 0.000 claims description 42
- 238000007499 fusion processing Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 11
- 230000004927 fusion Effects 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 3
- 241000282412 Homo Species 0.000 claims 1
- 238000007726 management method Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241001330002 Bambuseae Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000002153 concerted effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于知识图谱的实际控制人关系挖掘方法及装置,所述方法包含:根据预定客户数据和预定企业数据,通过筛选抽取获得自然人实体数据和企业实体数据,并通过所述自然人实体数据和所述企业实体数据采集对应描述的属性数据;根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系;利用所述控制关系、所述身份关系数据和所述行为关系将所述企业实体数据中各企业实体与所述自然人实体数据中各自然人实体相关联,构建控制人关系图谱;通过所述控制人关系图谱分析获得所述企业实体的控制人。
Description
技术领域
本发明涉及大数据领域,尤指一种基于知识图谱的实际控制人关系挖掘方法及装置。
背景技术
近几年,国家不断出台支持小企业发展的各项政策,小企业信贷业务也如雨后春笋般得到蓬勃发展,但是随着宏观经济形势越来越复杂,企业经营恶化的风潮逐渐从沿海蔓延到内地、从大都会波及到中小城市。部分小企业或其实际控制人涉及诉讼案件,导致银行账户或资产被查封,经营遭受重大影响,少数企业陷入停产、破产、资不抵债等状态,波及银行信贷资产安全。
实际控制人,一般是指通过投资关系、协议或者其他安排,能够实际支配公司行为的自然人、法人或其他经济组织。目前小企业的实际控制人基本上都是自然人,因此,我们这里也仅谈自然人的实际控制人。小企业实际控制人通常是小企业的灵魂人物,完全能够通过个人行为影响企业行为,或者关键时刻做出决定性结论。实际控制人对小企业发展有绝对影响力,挖掘实际控制人信息在银行对小企业的信贷管理上非常重要。
为此,业内亟需一种快速定位企业实际控制人的方法予以为后续企业提供有效参考,降低相关风险。
发明内容
本发明目的在于提供一种基于知识图谱的实际控制人关系挖掘方法及装置,从大数据中挖掘实际控制人关系,为后续企业提供有效参考。
为达上述目的,本发明所提供的基于知识图谱的实际控制人关系挖掘方法,所述方法包含:根据预定客户数据和预定企业数据,通过筛选抽取获得自然人实体数据和企业实体数据,并通过所述自然人实体数据和所述企业实体数据采集对应描述的属性数据;根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系;利用所述控制关系、所述身份关系数据和所述行为关系将所述企业实体数据中各企业实体与所述自然人实体数据中各自然人实体相关联,构建控制人关系图谱;通过所述控制人关系图谱分析获得所述企业实体的控制人。
在上述基于知识图谱的实际控制人关系挖掘方法中,优选的,通过所述控制人关系图谱分析获得所述企业实体的控制人包含:获取所述企业实体的企业类型;当所述企业实体的企业类型为非上市公司且非个体工商户时,通过所述控制人关系图谱中所述企业实体关联的自然人实体之间的身份关系、控制关系和行为关系对自然人实体进行融合处理;根据融合处理后的自然人实体筛选获得所述企业实体的对应控制人。
在上述基于知识图谱的实际控制人关系挖掘方法中,优选的,通过所述控制人关系图谱分析获得所述企业实体的控制人包含:当所述企业实体的企业类型为上市公司时,根据所述控制人关系图谱中所述企业实体对应的属性数据内企业年报获得所述企业实体的控制人;当所述企业实体的企业类型为个体工商户时,根据所述控制人关系图谱中所述企业实体对应的属性数据内法人信息获得所述企业实体的控制人。
在上述基于知识图谱的实际控制人关系挖掘方法中,优选的,通过所述控制人关系图谱中所述企业实体关联的自然人实体之间的身份关系、控制关系和行为关系对自然人实体进行融合处理包含:通过所述控制人关系图谱获得多个所述自然人实体对所述企业实体的控股值;根据所述控制关系、所述身份关系和所述行为关系按预设合并次数依次对所述自然人实体进行融合,并统计自然人实体融合后的控股值;当所述控股值大于预设阈值时,自然人实体的融合处理完成。
在上述基于知识图谱的实际控制人关系挖掘方法中,优选的,根据所述控制关系、所述身份关系和所述行为关系按预设合并次数依次对所述自然人实体进行融合,并统计自然人实体融合后的控股值还包含:当通过预设合并次数对所述自然人实体进行融合后,且自然人实体融合后的控股值小于预设阈值时,企业实体无实际控制人。
在上述基于知识图谱的实际控制人关系挖掘方法中,优选的,根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系包含:根据所述企业实体对应的企业信息标识,将预定客户数据和预定企业数据中采集获得的所述企业实体对应的属性数据关联;根据关联后的所述属性数据分析获得企业实体内所述自然人实体之间的高管信息、企业实体与企业实体之间的控股信息和企业实体对外投资信息;根据所述高管信息获得所述自然人实体之间的身份关系;通过所述控股信息获得所述企业实体之间的控制关系;根据所述对外投资信息获得所述企业实体之间或所述自然人实体之间的行为关系。
在上述基于知识图谱的实际控制人关系挖掘方法中,优选的,根据所述高管信息获得所述自然人实体之间的身份关系还包含:通过预定认证机构获得所述自然人实体之间的亲属信息;根据所述亲属信息比对所述高管信息,筛选获得所述自然人实体之间的身份关系。
本发明还提供一种基于知识图谱的实际控制人关系挖掘装置,所述装置包含:数据采集模块、挖掘模块、图谱构建模块和分析模块;所述数据采集模块用于根据预定客户数据和预定企业数据,通过筛选抽取获得自然人实体数据和企业实体数据,并通过所述自然人实体数据和所述企业实体数据采集对应描述的属性数据;所述挖掘模块用于根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系;所述图谱构建模块用于利用所述控制关系、所述身份关系数据和所述行为关系将所述企业实体数据中各企业实体与所述自然人实体数据中各自然人实体相关联,构建控制人关系图谱;所述分析模块用于通过所述控制人关系图谱分析获得所述企业实体的控制人。
在上述基于知识图谱的实际控制人关系挖掘装置中,优选的,所述分析模块包含:获取所述企业实体的企业类型;当所述企业实体的企业类型为非上市公司且非个体工商户时,通过所述控制人关系图谱中所述企业实体关联的自然人实体之间的身份关系、控制关系和行为关系对自然人实体进行融合处理;根据融合处理后的自然人实体筛选获得所述企业实体的对应控制人。
在上述基于知识图谱的实际控制人关系挖掘装置中,优选的,所述处理单元还包含:当所述企业实体的企业类型为上市公司时,根据所述控制人关系图谱中所述企业实体对应的属性数据内企业年报获得所述企业实体的控制人;当所述企业实体的企业类型为个体工商户时,根据所述控制人关系图谱中所述企业实体对应的属性数据内法人信息获得所述企业实体的控制人。
在上述基于知识图谱的实际控制人关系挖掘装置中,优选的,所述分析模块还包含融合单元,所述融合单元用于通过所述控制人关系图谱获得多个所述自然人实体对所述企业实体的控股值;根据所述控制关系、所述身份关系和所述行为关系按预设合并次数依次对所述自然人实体进行融合,并统计自然人实体融合后的控股值;当所述控股值大于预设阈值时,自然人实体的融合处理完成。
在上述基于知识图谱的实际控制人关系挖掘装置中,优选的,所述融合单元还包含:当通过预设合并次数对所述自然人实体进行融合后,且自然人实体融合后的控股值小于预设阈值时,企业实体无实际控制人。
在上述基于知识图谱的实际控制人关系挖掘装置中,优选的,所述挖掘模块包含:根据所述企业实体对应的企业信息标识,将预定客户数据和预定企业数据中采集获得的所述企业实体对应的属性数据关联;根据关联后的所述属性数据分析获得企业实体内所述自然人实体之间的高管信息、企业实体与企业实体之间的控股信息和企业实体对外投资信息;根据所述高管信息获得所述自然人实体之间的身份关系;通过所述控股信息获得所述企业实体之间的控制关系;根据所述对外投资信息获得所述企业实体之间或所述自然人实体之间的行为关系。
在上述基于知识图谱的实际控制人关系挖掘装置中,优选的,所述挖掘模块还包含筛选单元,所述筛选单元用于通过预定认证机构获得所述自然人实体之间的亲属信息;根据所述亲属信息比对所述高管信息,筛选获得所述自然人实体之间的身份关系。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
本发明的有益技术效果在于:通过有效挖掘大数据中企业与自然人之间特定关系,基于该关系予以构建知识图谱,能够有效帮助后续确定企业的实际控制人,以此提高相关企业的风险管控。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
图1为本发明一实施例所提供的基于知识图谱的实际控制人关系挖掘方法的流程示意图;
图2为本发明一实施例所提供的控制人分析的流程示意图;
图3为本发明一实施例所提供的自然人实体的融合流程示意图;
图4为本发明一实施例所提供的实体关系挖掘的流程示意图;
图5为本发明一实施例所提供的基于知识图谱的实际控制人关系挖掘装置的结构示意图;
图6为本发明一实施例所提供的电子设备的结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
请参考图1所示,本发明所提供的基于知识图谱的实际控制人关系挖掘方法,具体包含:
S101根据预定客户数据和预定企业数据,通过筛选抽取获得自然人实体数据和企业实体数据,并通过所述自然人实体数据和所述企业实体数据采集对应描述的属性数据;
S102根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系;
S103利用所述控制关系、所述身份关系数据和所述行为关系将所述企业实体数据中各企业实体与所述自然人实体数据中各自然人实体相关联,构建控制人关系图谱;
S104通过所述控制人关系图谱分析获得所述企业实体的控制人。
在实际工作中,上述企业实体和自然人实体的抽取方法及属性获取方法可如下实施:从银行客户数据中、工商企业数据中抽取识别形成了企业、自然人两类实体。其中银行客户数据中抽取对公客户实体;从工商企业数据中抽取工商企业实体、以及与工商企业相关的高管等自然人实体。根据已识别出的实体采集实体的属性信息,例如企业的工商注册信息、企业规模、经营情况、存贷款余额等,个人的年龄、性别等信息,将其抽取出来行成对实体的描述属性信息。当然,因实际需求和针对的客户数据与企业数据选取不同,具体实施方式也不同,本领域相关技术人员可根据实际需要选择对应的抽取方式,该抽取方式可利用现有技术实现,本发明在此就不再一一详述。
因企业实体的性质不同,为此针对不同企业性质也存在不同实际控制人的识别方式,请参考图2所示,在本发明一实施例中,通过所述控制人关系图谱分析获得所述企业实体的控制人包含:
S201获取所述企业实体的企业类型;
S202当所述企业实体的企业类型为非上市公司且非个体工商户时,通过所述控制人关系图谱中所述企业实体关联的自然人实体之间的身份关系、控制关系和行为关系对自然人实体进行融合处理;
S203根据融合处理后的自然人实体筛选获得所述企业实体的对应控制人。
当所述企业实体的企业类型为上市公司或个体工商户时,进一步的,通过所述控制人关系图谱分析获得所述企业实体的控制人包含:当所述企业实体的企业类型为上市公司时,根据所述控制人关系图谱中所述企业实体对应的属性数据内企业年报获得所述企业实体的控制人;当所述企业实体的企业类型为个体工商户时,根据所述控制人关系图谱中所述企业实体对应的属性数据内法人信息获得所述企业实体的控制人。
请参考图3所示,在上述实施例中,通过所述控制人关系图谱中所述企业实体关联的自然人实体之间的身份关系、控制关系和行为关系对自然人实体进行融合处理包含:
S301通过所述控制人关系图谱获得多个所述自然人实体对所述企业实体的控股值;
S302根据所述控制关系、所述身份关系和所述行为关系按预设合并次数依次对所述自然人实体进行融合,并统计自然人实体融合后的控股值;
S303当所述控股值大于预设阈值时,自然人实体的融合处理完成。
其中,根据所述控制关系、所述身份关系和所述行为关系按预设合并次数依次对所述自然人实体进行融合,并统计自然人实体融合后的控股值还包含:当通过预设合并次数对所述自然人实体进行融合后,且自然人实体融合后的控股值小于预设阈值时,企业实体无实际控制人。
在实际工作中,上述融合过程可如下实施:
对于上市公司,实际控制人可能会在年报中披露,这部分通过人工校注的方式完成。对于非上市公司,采取以下方法来判定:
如果企业类型是个体工商户,选企业的法定代表人作为实际控制人;如果企业存在控股股东且控股股东为一名股东,则实际控制人为该股东;如果企业类型是非上市公司且非个体,设定一个追溯层数为3层,从1开始,一直追溯到第3层,按照投资关系展开,每追溯1层:按亲属关系、一致行动关系对所有实体进行合并、股份相加。只要统计出有持股超过50%的实体/实体组合则可退出当前查找,选该实体/实体组合作为实际控制人。当到达设定的追溯层数3时,如果还没有出现持股超过50%的实体/实体组合,则无实际控制人。
请参考图4所示,在本发明一实施例中,根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系包含:
S401根据所述企业实体对应的企业信息标识,将预定客户数据和预定企业数据中采集获得的所述企业实体对应的属性数据关联;
S402根据关联后的所述属性数据分析获得企业实体内所述自然人实体之间的高管信息、企业实体与企业实体之间的控股信息和企业实体对外投资信息;
S403根据所述高管信息获得所述自然人实体之间的身份关系;通过所述控股信息获得所述企业实体之间的控制关系;根据所述对外投资信息获得所述企业实体之间或所述自然人实体之间的行为关系。
在上述实施例中,根据所述高管信息获得所述自然人实体之间的身份关系还包含:通过预定认证机构获得所述自然人实体之间的亲属信息;根据所述亲属信息比对所述高管信息,筛选获得所述自然人实体之间的身份关系。
在实际工作中,上述关系的抽取方式可根据现有已识别出的实体,将实体之间的关联关系抽取出来。具体的,在实施中可主要针对直接关系,包括投资、高管、亲属、一致行动、控股类关系可以从现有数据源中直观的分析取得,例如客户之间存在A客户是B客户的高管,那么AB客户之间是高管关系,这类的关系抽取方式就是直接获取关系。其中,高管指代公司管理层中担任重要职务、负责公司经营管理、掌握公司重要信息的人员,主要包括经理、副经理、财务负责人,上市公司董事会秘书和公司章程规定的其他人员。投资指代国家或企业以及个人,为了特定目的,与对方签订协议,促进社会发展,实现互惠互利,输送资金的过程;亲属指代和自己有直接血缘关系或婚姻关系的人,即直系血亲和直系姻亲,如指配偶、父母、子女、祖父母(外祖父母)、孙子女(外孙子女);一致行动指代一起积极合作以取得或巩固对该公司“控制权”的行为;控股指代掌握一定数量的股份,以控制公司的业务。在该实施例中,高管信息可直接从工商数据抽取高管关系,通过企业信息标识和企业名称将行内企业和工商企业进行关联。控股信息可直接从工商数据抽取控股关系,通过企业信息标识和企业名称将行内企业和工商企业进行关联。投资信息可直接从工商数据抽取企业对外投资关系,通过企业信息标识和企业名称将行内企业和工商企业进行关联。亲属信息可由指定的认证机构确认获取,例如户籍管理机构;最后控股信息即可利用上述关系和工商数据予以确定。由此,基于上述高管信息和亲属关系获得所述自然人实体之间的身份关系;通过所述控股信息和投资信息获得所述企业实体之间的控制关系;根据所述对外的投资信息和一致行动获得所述企业实体之间或所述自然人实体之间的行为关系。
请参考图5所示,本发明还提供一种基于知识图谱的实际控制人关系挖掘装置,所述装置包含:数据采集模块、挖掘模块、图谱构建模块和分析模块;所述数据采集模块用于根据预定客户数据和预定企业数据,通过筛选抽取获得自然人实体数据和企业实体数据,并通过所述自然人实体数据和所述企业实体数据采集对应描述的属性数据;所述挖掘模块用于根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系;所述图谱构建模块用于利用所述控制关系、所述身份关系数据和所述行为关系将所述企业实体数据中各企业实体与所述自然人实体数据中各自然人实体相关联,构建控制人关系图谱;所述分析模块用于通过所述控制人关系图谱分析获得所述企业实体的控制人。其中,所述分析模块可包含:获取所述企业实体的企业类型;当所述企业实体的企业类型为非上市公司且非个体工商户时,通过所述控制人关系图谱中所述企业实体关联的自然人实体之间的身份关系、控制关系和行为关系对自然人实体进行融合处理;根据融合处理后的自然人实体筛选获得所述企业实体的对应控制人。
在本发明一实施例中,所述处理单元还包含:当所述企业实体的企业类型为上市公司时,根据所述控制人关系图谱中所述企业实体对应的属性数据内企业年报获得所述企业实体的控制人;当所述企业实体的企业类型为个体工商户时,根据所述控制人关系图谱中所述企业实体对应的属性数据内法人信息获得所述企业实体的控制人。在另一实施例中,所述分析模块还包含融合单元,所述融合单元用于通过所述控制人关系图谱获得多个所述自然人实体对所述企业实体的控股值;根据所述控制关系、所述身份关系和所述行为关系按预设合并次数依次对所述自然人实体进行融合,并统计自然人实体融合后的控股值;当所述控股值大于预设阈值时,自然人实体的融合处理完成。进一步的,所述融合单元还包含:当通过预设合并次数对所述自然人实体进行融合后,且自然人实体融合后的控股值小于预设阈值时,企业实体无实际控制人。
在本发明一实施例中,所述挖掘模块包含:根据所述企业实体对应的企业信息标识,将预定客户数据和预定企业数据中采集获得的所述企业实体对应的属性数据关联;根据关联后的所述属性数据分析获得企业实体内所述自然人实体之间的高管信息、企业实体与企业实体之间的控股信息和企业实体对外投资信息;根据所述高管信息获得所述自然人实体之间的身份关系;通过所述控股信息获得所述企业实体之间的控制关系;根据所述对外投资信息获得所述企业实体之间或所述自然人实体之间的行为关系。进一步的,所述挖掘模块还包含筛选单元,所述筛选单元用于通过预定认证机构获得所述自然人实体之间的亲属信息;根据所述亲属信息比对所述高管信息,筛选获得所述自然人实体之间的身份关系。
上述基于知识图谱的实际控制人关系挖掘装置及各组件的具体实现方式已在前述实施例中详细说明,在此就不再一一详述。
本发明的有益技术效果在于:通过有效挖掘大数据中企业与自然人之间特定关系,基于该关系予以构建知识图谱,能够有效帮助后续确定企业的实际控制人,以此提高相关企业的风险管控。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
如图6所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图6中所示的所有部件;此外,电子设备600还可以包括图6中没有示出的部件,可以参考现有技术。
如图6所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (16)
1.一种基于知识图谱的实际控制人关系挖掘方法,其特征在于,所述方法包含:
根据预定客户数据和预定企业数据,通过筛选抽取获得自然人实体数据和企业实体数据,并通过所述自然人实体数据和所述企业实体数据采集对应描述的属性数据;
根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系;
利用所述控制关系、所述身份关系数据和所述行为关系将所述企业实体数据中各企业实体与所述自然人实体数据中各自然人实体相关联,构建控制人关系图谱;
通过所述控制人关系图谱分析获得所述企业实体的控制人。
2.根据权利要求1所述的基于知识图谱的实际控制人关系挖掘方法,其特征在于,通过所述控制人关系图谱分析获得所述企业实体的控制人包含:
获取所述企业实体的企业类型;
当所述企业实体的企业类型为非上市公司且非个体工商户时,通过所述控制人关系图谱中所述企业实体关联的自然人实体之间的身份关系、控制关系和行为关系对自然人实体进行融合处理;
根据融合处理后的自然人实体筛选获得所述企业实体的对应控制人。
3.根据权利要求2所述的基于知识图谱的实际控制人关系挖掘方法,其特征在于,通过所述控制人关系图谱分析获得所述企业实体的控制人包含:
当所述企业实体的企业类型为上市公司时,根据所述控制人关系图谱中所述企业实体对应的属性数据内企业年报获得所述企业实体的控制人;
当所述企业实体的企业类型为个体工商户时,根据所述控制人关系图谱中所述企业实体对应的属性数据内法人信息获得所述企业实体的控制人。
4.根据权利要求2所述的基于知识图谱的实际控制人关系挖掘方法,其特征在于,通过所述控制人关系图谱中所述企业实体关联的自然人实体之间的身份关系、控制关系和行为关系对自然人实体进行融合处理包含:
通过所述控制人关系图谱获得多个所述自然人实体对所述企业实体的控股值;
根据所述控制关系、所述身份关系和所述行为关系按预设合并次数依次对所述自然人实体进行融合,并统计自然人实体融合后的控股值;
当所述控股值大于预设阈值时,自然人实体的融合处理完成。
5.根据权利要求1所述的基于知识图谱的实际控制人关系挖掘方法,其特征在于,根据所述控制关系、所述身份关系和所述行为关系按预设合并次数依次对所述自然人实体进行融合,并统计自然人实体融合后的控股值还包含:
当通过预设合并次数对所述自然人实体进行融合后,且自然人实体融合后的控股值小于预设阈值时,企业实体无实际控制人。
6.根据权利要求1所述的基于知识图谱的实际控制人关系挖掘方法,其特征在于,根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系包含:
根据所述企业实体对应的企业信息标识,将预定客户数据和预定企业数据中采集获得的所述企业实体对应的属性数据关联;
根据关联后的所述属性数据分析获得企业实体内所述自然人实体之间的高管信息、企业实体与企业实体之间的控股信息和企业实体对外投资信息;
根据所述高管信息获得所述自然人实体之间的身份关系;
通过所述控股信息获得所述企业实体之间的控制关系;
根据所述对外投资信息获得所述企业实体之间或所述自然人实体之间的行为关系。
7.根据权利要求6所述的基于知识图谱的实际控制人关系挖掘方法,其特征在于,根据所述高管信息获得所述自然人实体之间的身份关系还包含:
通过预定认证机构获得所述自然人实体之间的亲属信息;
根据所述亲属信息比对所述高管信息,筛选获得所述自然人实体之间的身份关系。
8.一种基于知识图谱的实际控制人关系挖掘装置,其特征在于,所述装置包含:数据采集模块、挖掘模块、图谱构建模块和分析模块;
所述数据采集模块用于根据预定客户数据和预定企业数据,通过筛选抽取获得自然人实体数据和企业实体数据,并通过所述自然人实体数据和所述企业实体数据采集对应描述的属性数据;
所述挖掘模块用于根据所述属性数据分析获得各实体之间的身份关系、控制关系和行为关系;
所述图谱构建模块用于利用所述控制关系、所述身份关系数据和所述行为关系将所述企业实体数据中各企业实体与所述自然人实体数据中各自然人实体相关联,构建控制人关系图谱;
所述分析模块用于通过所述控制人关系图谱分析获得所述企业实体的控制人。
9.根据权利要求8所述的基于知识图谱的实际控制人关系挖掘装置,其特征在于,所述分析模块包含:获取所述企业实体的企业类型;当所述企业实体的企业类型为非上市公司且非个体工商户时,通过所述控制人关系图谱中所述企业实体关联的自然人实体之间的身份关系、控制关系和行为关系对自然人实体进行融合处理;根据融合处理后的自然人实体筛选获得所述企业实体的对应控制人。
10.根据权利要求9所述的基于知识图谱的实际控制人关系挖掘装置,其特征在于,所述处理单元还包含:
当所述企业实体的企业类型为上市公司时,根据所述控制人关系图谱中所述企业实体对应的属性数据内企业年报获得所述企业实体的控制人;
当所述企业实体的企业类型为个体工商户时,根据所述控制人关系图谱中所述企业实体对应的属性数据内法人信息获得所述企业实体的控制人。
11.根据权利要求9所述的基于知识图谱的实际控制人关系挖掘装置,其特征在于,所述分析模块还包含融合单元,所述融合单元用于通过所述控制人关系图谱获得多个所述自然人实体对所述企业实体的控股值;根据所述控制关系、所述身份关系和所述行为关系按预设合并次数依次对所述自然人实体进行融合,并统计自然人实体融合后的控股值;当所述控股值大于预设阈值时,自然人实体的融合处理完成。
12.根据权利要求11所述的基于知识图谱的实际控制人关系挖掘装置,其特征在于,所述融合单元还包含:
当通过预设合并次数对所述自然人实体进行融合后,且自然人实体融合后的控股值小于预设阈值时,企业实体无实际控制人。
13.根据权利要求8所述的基于知识图谱的实际控制人关系挖掘装置,其特征在于,所述挖掘模块包含:
根据所述企业实体对应的企业信息标识,将预定客户数据和预定企业数据中采集获得的所述企业实体对应的属性数据关联;
根据关联后的所述属性数据分析获得企业实体内所述自然人实体之间的高管信息、企业实体与企业实体之间的控股信息和企业实体对外投资信息;
根据所述高管信息获得所述自然人实体之间的身份关系;
通过所述控股信息获得所述企业实体之间的控制关系;
根据所述对外投资信息获得所述企业实体之间或所述自然人实体之间的行为关系。
14.根据权利要求13所述的基于知识图谱的实际控制人关系挖掘装置,其特征在于,所述挖掘模块还包含筛选单元,所述筛选单元用于通过预定认证机构获得所述自然人实体之间的亲属信息;根据所述亲属信息比对所述高管信息,筛选获得所述自然人实体之间的身份关系。
15.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一所述方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至7任一所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011045131.3A CN112115278A (zh) | 2020-09-28 | 2020-09-28 | 基于知识图谱的实际控制人关系挖掘方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011045131.3A CN112115278A (zh) | 2020-09-28 | 2020-09-28 | 基于知识图谱的实际控制人关系挖掘方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112115278A true CN112115278A (zh) | 2020-12-22 |
Family
ID=73797937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011045131.3A Pending CN112115278A (zh) | 2020-09-28 | 2020-09-28 | 基于知识图谱的实际控制人关系挖掘方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112115278A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779273A (zh) * | 2021-09-16 | 2021-12-10 | 平安国际智慧城市科技股份有限公司 | 基于知识图谱的企业信息挖掘方法、装置、计算机及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140351261A1 (en) * | 2013-05-24 | 2014-11-27 | Sap Ag | Representing enterprise data in a knowledge graph |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
CN110781246A (zh) * | 2019-09-18 | 2020-02-11 | 上海生腾数据科技有限公司 | 一种企业关联关系构建方法及系统 |
CN111046192A (zh) * | 2019-12-25 | 2020-04-21 | 中国建设银行股份有限公司 | 银行涉案账户的识别方法及装置 |
CN111325355A (zh) * | 2020-03-19 | 2020-06-23 | 中国建设银行股份有限公司 | 企业实际控制人的确定方法、装置、计算机设备及介质 |
CN111382956A (zh) * | 2020-03-27 | 2020-07-07 | 中国建设银行股份有限公司 | 企业集团关系的挖掘方法和装置 |
-
2020
- 2020-09-28 CN CN202011045131.3A patent/CN112115278A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140351261A1 (en) * | 2013-05-24 | 2014-11-27 | Sap Ag | Representing enterprise data in a knowledge graph |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
CN110781246A (zh) * | 2019-09-18 | 2020-02-11 | 上海生腾数据科技有限公司 | 一种企业关联关系构建方法及系统 |
CN111046192A (zh) * | 2019-12-25 | 2020-04-21 | 中国建设银行股份有限公司 | 银行涉案账户的识别方法及装置 |
CN111325355A (zh) * | 2020-03-19 | 2020-06-23 | 中国建设银行股份有限公司 | 企业实际控制人的确定方法、装置、计算机设备及介质 |
CN111382956A (zh) * | 2020-03-27 | 2020-07-07 | 中国建设银行股份有限公司 | 企业集团关系的挖掘方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779273A (zh) * | 2021-09-16 | 2021-12-10 | 平安国际智慧城市科技股份有限公司 | 基于知识图谱的企业信息挖掘方法、装置、计算机及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107230008B (zh) | 一种风险信息输出、风险信息构建方法及装置 | |
CN109146638B (zh) | 异常金融交易群体的识别方法及装置 | |
US10572685B1 (en) | Protecting sensitive data | |
CN110807697A (zh) | 股份公司的实际控制人的确定方法、装置及设备 | |
CN104618416A (zh) | 信用账户创建方法、装置及系统 | |
CN112116454B (zh) | 信用评估方法及装置 | |
US20160217404A1 (en) | Determining a quality score for internal quality analysis | |
CN111897890A (zh) | 金融业务处理方法及装置 | |
CN111797099A (zh) | 一种基于科目与辅助属性的数据处理方法及装置 | |
CN111222869A (zh) | 交易数据处理方法、装置、计算机设备及介质 | |
CN113159923A (zh) | 风险筛查方法及装置 | |
CN112579773A (zh) | 风险事件分级方法及装置 | |
CN112115278A (zh) | 基于知识图谱的实际控制人关系挖掘方法及装置 | |
US9646065B2 (en) | Identification of load utility | |
CN111048115A (zh) | 语音识别方法及装置 | |
CN116664227A (zh) | 金融产品智能推荐方法及装置 | |
CN111951011B (zh) | 监控系统阈值确定方法及装置 | |
CN110046233A (zh) | 问题派发方法及装置 | |
CN108399192B (zh) | 一种小区信息匹配方法及装置 | |
CN113392091A (zh) | 分布式集群数据迁移方法及装置 | |
CN112101950A (zh) | 可疑交易监测模型特征提取方法及装置 | |
US10019449B2 (en) | Automation of MLOAD and TPUMP conversion | |
CN110675248A (zh) | 一种账户评估方法、装置及设备 | |
Bernholz | Wiring a new social economy: reflections on philanthropy in the digital age | |
US20120131489A1 (en) | Evaluating and comparing the requirements of a task with the capabilities of an entity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |