CN115170271A - 风险关联企业的聚类方法、装置、设备及存储介质 - Google Patents

风险关联企业的聚类方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115170271A
CN115170271A CN202211098554.0A CN202211098554A CN115170271A CN 115170271 A CN115170271 A CN 115170271A CN 202211098554 A CN202211098554 A CN 202211098554A CN 115170271 A CN115170271 A CN 115170271A
Authority
CN
China
Prior art keywords
control
enterprise
target
determining
enterprises
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211098554.0A
Other languages
English (en)
Other versions
CN115170271B (zh
Inventor
黄佳
胡新
郑虎
童灵馨
马园园
陈锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Csi Digital Technology Shenzhen Co ltd
Original Assignee
Csi Digital Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Csi Digital Technology Shenzhen Co ltd filed Critical Csi Digital Technology Shenzhen Co ltd
Priority to CN202211098554.0A priority Critical patent/CN115170271B/zh
Publication of CN115170271A publication Critical patent/CN115170271A/zh
Application granted granted Critical
Publication of CN115170271B publication Critical patent/CN115170271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种风险关联企业的聚类方法、装置、设备及存储介质,其中,所述方法包括:获取目标企业的控制节点集合;采用股权穿透的方式计算每一个控制节点的表决权比例,根据表决权比例确定目标实控节点;基于目标企业的控制节点集合,构建与控制节点集合中包含的所有控制节点对应的第一控制路径图谱;根据第一控制路径图谱确定多条控制路径,控制路径包含了被控制企业和与被控制企业对应的实控节点,基于控制路径确定第二控制路径图谱;根据第二控制路径图谱,确定至少一个初步关联企业分组;根据至少一个初步关联企业分组,按照预设的群组划分方式,确定一个或多个目标关联企业分组。采用本发明,可有效识别企业之间的关联风险。

Description

风险关联企业的聚类方法、装置、设备及存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种风险关联企业的聚类方法、装置、计算机设备及计算机可读存储介质。
背景技术
近年来,随着金融市场的进一步发展,信用资产的违约逐渐常态化,并显现出极强的关联性和传染性,如何从控制权、经营依赖性的角度判断企业风险相关性的问题成为市场的需求焦点。
发明内容
基于此,有必要针对上述问题,提出了一种风险关联企业的聚类方法、装置、计算机设备及计算机可读存储介质。
在本发明的第一部分,提供了一种风险关联企业的聚类方法,所述方法包括:
获取目标企业的控制节点集合,所述控制节点集合包括与所述目标企业对应的持股链路集合;
采用股权穿透的方式,计算每一个控制节点对所述目标企业的表决权比例,根据表决权比例确定所述目标企业的目标实控节点;
基于所述目标企业的控制节点集合,构建与所述控制节点集合中包含的所有控制节点对应的第一控制路径图谱;
根据所述第一控制路径图谱确定多条控制路径,所述控制路径包含了被控制企业和与所述被控制企业对应的实控节点,基于确定的控制路径确定第二控制路径图谱;
根据所述第二控制路径图谱,对所述第二控制路径图谱中的顶点进行穿透和遍历处理,以确定至少一个初步关联企业分组;
根据所述至少一个初步关联企业分组,按照预设的群组划分方式,确定一个或多个目标关联企业分组。
可选的,所述采用股权穿透的方式,计算每一个控制节点对所述目标企业的表决权比例,根据表决权比例确定所述目标企业的目标实控节点的步骤,还包括:
通过目标企业的持股链路集合,确定所述目标企业的所有直接股东节点的持股比例;若存在直接股东节点的持股比例超过预设的第一阈值的情况下,将该直接股东节点作为目标实控节点;
若不存在直接股东节点的持股比例超过预设的第一阈值的情况下,根据持股链路集合确定所述目标企业的所有间接股东节点,针对间接股东节点,按照股权穿透的方式,采用累乘方式,计算间接股东节点的表决权比例;
根据表决权比例确定目标企业的目标实控节点。
可选的,所述对间接股东节点,按照股权穿透的方式,采用累乘方式,计算间接股东节点的表决权比例的步骤,还包括:
假设目标企业向上穿透到间接股东节点共有n层,则间接股东节点对目标企业的累计表决权比例可以通过如下公式进行计算,
Figure 324688DEST_PATH_IMAGE001
其中,
Figure 694358DEST_PATH_IMAGE002
为间接股东节点对目标企业的累计表决权比例;
Figure 146200DEST_PATH_IMAGE003
为第n层到第n-1层的表决权比例。
可选的,所述根据所述第一控制路径图谱确定多条控制路径的步骤,还包括:
在第一控制路径图谱中,保留包含了被控制企业和与所述被控制企业对应的实控节点的控制路径,并删除企业路径,以确定所述第二控制路径图谱。
可选的,所述根据所述第二控制路径图谱,对所述第二控制路径图谱中的顶点进行穿透和遍历处理,以确定至少一个初步关联企业分组的步骤,还包括:
根据预设的实控节点的筛选要求,在所述第二控制路径图谱中确定至少一个顶点;
基于确定的至少一个顶点在所述第二控制路径图谱中进行穿透和遍历处理,以确定与该顶点对应的控制节点,其中,确定的控制节点包括企业和股东;
根据顶点以及其对应的控制节点确定初步关联企业分组。
可选的,所述根据顶点以及其对应的控制节点确定初步关联企业分组的步骤,还包括:
对所述至少一个初步关联企业分组进行去重合并处理。
可选的,所述根据所述至少一个初步关联企业分组,按照预设的群组划分方式,确定一个或多个目标关联企业分组的步骤,还包括:
确定关联企业划分的分组参数;
对于目标企业,基于第二控制路径图谱对一个或多个目标关联企业分组根据分组参数进行穿透处理,以获取与目标企业对应的目标关联企业分组。
在本发明的第二部分,提供了一种风险关联企业的聚类装置,所述装置包括:
控制节点集合确定模块,用于获取目标企业的控制节点集合,所述控制节点集合包括与所述目标企业对应的持股链路集合;
实控人确定模块,用于采用股权穿透的方式,计算每一个控制节点对所述目标企业的表决权比例,根据表决权比例确定所述目标企业的目标实控节点;
控制路径图谱确定模块,用于基于所述目标企业的控制节点集合,构建与所述控制节点集合中包含的所有控制节点对应的第一控制路径图谱;根据所述第一控制路径图谱确定多条控制路径,所述控制路径包含了被控制企业和与所述被控制企业对应的实控节点,基于确定的控制路径确定第二控制路径图谱;
第一企业聚类模块,用于根据所述第二控制路径图谱,对所述第二控制路径图谱中的顶点进行穿透和遍历处理,以确定至少一个初步关联企业分组;
第二企业聚类模块,用于根据所述至少一个初步关联企业分组,按照预设的群组划分方式,确定一个或多个目标关联企业分组。
在本发明的第三部分,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本发明的第一部分所述的方法的步骤。
在本发明的第二部分,提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器有可执行代码,当所述可执行代码在所述处理器上运行以实现如本发明的第一部分所述的方法。
采用本发明实施例,具有如下有益效果:
采用了上述风险关联企业的聚类方法、装置、计算机设备及计算机可读存储介质之后,在需要对金融市场中企业之间的关联风险进行识别的情况下,通过股权关系构建企业图谱数据,然后通过股权穿透计算企业的实际控制人,然后基于实际控制人来计算企业的控制路径并构建企业的控制路径图谱,然后基于控制路径图谱进行遍历和穿透处理来进行关联企业分组,并且基于企业之间的经营数据进行进一步的群组划分,以得到最终的目标关联企业分组并输出。也就是说,采用本发明实施例,可以从控制权、经营依赖性的角度判断企业风险相关性,提供企业之间的关联风险识别的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中一种风险关联企业的聚类方法的流程示意图;
图2为一个实施例中企业A的持股链路集合示意图;
图3为一个实施例中企业A实控人计算路径示意图;
图4为一个实施例中企业循环持股实控人计算路径示意图;
图5为一个实施例中企业循环持股实控人计算路径示意图;
图6a为一个实施例中企业A的第二控制路径图谱示意图;
图6b为一个实施例中企业A的第二控制路径图谱示意图;
图7a为一个实施例中企业A的关联企业分组确定示意图;
图7b为一个实施例中企业A的关联企业分组确定示意图;
图7c为一个实施例中企业A的关联企业分组确定示意图;
图8为一个实施例中一种风险关联企业的聚类装置的结构示意图;
图9为一个实施例中运行上述风险关联企业的聚类方法的计算机的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本实施例中,提供了一种风险关联企业的聚类方法,可以基于企业股权关系确定股东对企业的表决权比例,从而确定企业的实控人,并且,基于实控人来对关联企业进行聚类,并且基于企业之间的关联关系对聚类进行重新划分,从而对企业之间的关联关系进行分组,以对企业之间的关联风险进行识别。
具体的,请参见图1,图1给出了上述基于风险关联企业的聚类方法的流程示意图,包括如图1所示的步骤:
步骤S101:获取目标企业的控制节点集合,所述控制节点集合包括与所述目标企业对应的持股链路集合;
步骤S102:采用股权穿透的方式,计算每一个控制节点对所述目标企业的表决权比例,根据表决权比例确定所述目标企业的目标实控节点。
步骤S101-S102对应的企业的实际控制人(实控人)的确定的相关步骤。
实控控制人可以分为以下几类:
(1)公示实控人:企业公告中披露的实控人
(2)自建实控人:通过尽调或经验判断出的实控人,通过系统自定义添加的实控人。
(3)疑似实控人:企业未披露实控人,通过股权、任职等关系数据,利用特定的算法计算出的实控人。
对于三类实控人在应用中的优先顺序,可以根据实际需求进行确定。例如,自建实控人>公示实控人>疑似实控人。
对于目标企业A,需要计算A的疑似实控人。具体执行如下步骤:
步骤(1):判断是否存在已确定的疑似实控人B,若存在,直接获取疑似实控人B,若不执行,执行步骤(2)。
步骤(2):获取目标企业A的所有直接股东,若直接股东中存在直接持股比例超过50%以上的节点B,代表节点B拥有对A的绝对表决权,即使其他节点联合表决也无法超出该节点,则只保留该节点,忽略其他股东节点,然后进一步的确定节点B的疑似实控人。
步骤(3):对A的直接股东集合{C}依次向上穿透到顶,获取所有间接股东并加入到节点集合{C}。
步骤(4):针对{C}中所有节点进行表决权比例的计算,采用累乘法进行计算,假设A向上穿透到C共有n层,则C对A的累计表决权比例为:
Figure 72567DEST_PATH_IMAGE001
其中,
Figure 152519DEST_PATH_IMAGE002
为C到A的累计表决权比例;
Figure 630773DEST_PATH_IMAGE003
为第n层到第n-1层的表决权比例。当
Figure 428965DEST_PATH_IMAGE003
大于50%时,将
Figure 299969DEST_PATH_IMAGE003
替换为100%,其他兄弟股东的表决权比例替换为0%。
步骤(5):在股东表中找出表决权比例最大的节点集合{D}(通常为1个节点,也有可能会出现多个节点表决权比例相同且最大)。如果该节点是国资委、财政厅、中央汇金等国有特殊持股机构,考虑到业务实践,如果第二大股东与第一大股东的累计持股比例之差在设定的阈值范围内(默认5%),则将除了特殊机构外的第二大表决权比例的股东也加入到集合{D}。
步骤(6):检查{D}中每一个节点D是否已经有计算好的疑似实控人,记为{E},如果有,则{E}已经是穿透到顶层的疑似实控人,如果没有,则对{D}重新计算步骤(1),找到{D}的疑似实控人{E}。
下面给出一个目标企业A的目标实控节点(疑似实控人)的计算例子。
具体请参见图2,图2给出了目标企业A的控制节点集合,其中,包含了目标企业A的持股链路集合对应的有向图,根据该图进行计算。
具体的,获取A的所有直接股东,得到B、C、D。由于没有超过50%的节点,故都保留计算。对B、C、D进行股权穿透到顶,得到A所有股东(调整后的直接股东加间接股东):B、C、D、E、F、G、H、I、J、K、L。
然后计算得到的所有节点对A的累计表决权比例,具体请参见表1:
表1
Figure 234427DEST_PATH_IMAGE004
计算得出,D和H的累计持股比例最大,且D和H可以继续上穿计算疑似实控人,则进一步的确定D和H的疑似实控人。
确定D的疑似实控人的步骤如下:
(1)获取D的直接股东:H、I。但由于H的持股比例大于50%,故保留H,忽略I,继续对H递归调用寻找H的疑似实控人。
获取H的直接股东:J、K、L。对J、K、L穿透到顶,得到H的所有股东:J、K、L。计算所有节点对H的累计表决权比例(具体请参见表2),得到J的累计表决权比例最大。
表2
Figure 883583DEST_PATH_IMAGE005
需要进一步的确定J的疑似实控人。由于J无其他股东,故J的疑似实控人为自身。返回J为J的疑似实控人。
从而确定返回J为H的疑似实控人,并进一步的确定J为D的疑似实控人。
(2)确定H的疑似实控人的步骤如下:
在计算D的疑似实控人的过程中,H的疑似实控人已经算出,为J。直接返回J为H的疑似实控人。得到D的疑似实控人为J,H的疑似实控人也为J,去重后,返回J。
(3)最终经递归计算,得到A的疑似实控人为J。
也就是说,通过计算,确定了目标企业A的疑似实控人为J,其整体的实控人计算路径如图3所示。
进一步的,在本实施例中,在实控人的计算过程中,还需要进行特例的调整和修正。
例如,自然人股东重名:部分自然人股东为公告中披露的股东,可能没有ID信息确定唯一性,只有姓名信息,因此只能通过近似算法进行处理。在获取所有直接和间接股东后,如果有自然人股东重名,且没有唯一ID信息,根据业务实践,大概率判断这两个自然人为同一个人,因此进行合并计算。
再例如,股权分散结构的企业:如果最大直接持股股东的比例小于X(可由用户设置,默认为10%),则认为该企业属于股权分散类的企业。在这种情况下,企业自身、第一大直接持股股东、董事长、法人代表都有可能是疑似实控人,建议疑似实控人可以取多个或由用户选择,默认以企业自身、董事长、第一大直接持股股东的优先顺序作为疑似实控人。
再例如,存在GP结构的企业:若股东中的企业,名称中带有“有限合伙”字样,一般为股权投资、持股平台型的GP结构的公司。对于这种类型的公司,一般持股平台的持股比例会小于其他财务投资型股东的持股比例。建议疑似实控人可以取多个或由用户选取:第一大累计表决权股东、董事长或GP。
再例如,批露一致行动人的企业:对于批露一致行动人的企业,在上述算法中计算累计表决权比例的时候,可以将一致行动人组合并为一个主体进行累计计算。计算合并后的累计表决权比例,需要剔除一致行动人组之间的股权关系,否则会重复计算。如果合并后的一致行动人组的累计表决权比例最大,则选择一致行动人组中累计表决权比例最大的成员继续进行穿透,计算出最终的疑似实控人。如果一致行动人组中的成员的累计表决权比例相同,则对所有成员继续进行穿透,计算最终的疑似实控人,此时疑似实控人可能会有多个。
再例如,对于循环持股的企业通过上述算法计算疑似实控人时,可能会出现两种情况:
(1)正常情况:如果某几家企业循环持股,但是它们之间并不互为最大股东,则按照原算法进行计算。如图4的举例,计算A的疑似实控人:A、B、C循环持股,但是C的最大股东不是B,因此按照上述算法计算,最终得到E是A的疑似实控人。
(2)死循环状况:如果某几家企业循环持股,并且互为最大股东,则按上述算法进行计算后,会进入死循环,则按照以下优先级在它们之间选择疑似实控人:
持股比例最大的节点>注册资本最大的节点>名称排序最先的节点。
如图5给出的举例,计算A的疑似实控人:A、B、C循环持股,且A实控B,B实控C,C实控A。则按照上述算法计算A的疑似实控人,会得A的最大累计持股股东为C;计算C的疑似实控人,会得到C的最大累计持股股东为B;再计算B的疑似实控人,会得到B的最大累计持股股东为A。此时停止计算,在A、B、C中按照持股比例最大、注册资本最大、名称排序最先的顺序选择一个节点返回,否则会陷入死循环。
步骤S103:基于所述目标企业的控制节点集合,构建与所述控制节点集合中包含的所有控制节点对应的第一控制路径图谱;
步骤S104:根据所述第一控制路径图谱确定多条控制路径,所述控制路径包含了被控制企业和与所述被控制企业对应的实控节点,基于确定的控制路径确定第二控制路径图谱;
步骤S105:根据所述第二控制路径图谱,对所述第二控制路径图谱中的顶点进行穿透和遍历处理,以确定至少一个初步关联企业分组。
步骤S103-S105对应的是关联企业聚类的相关步骤。在这里,可以对集团派系包含的企业进行聚类。
具体的,首先需要确定相关企业的所有控制节点集合,也就是说,确定包含了多个节点的第控制路径图谱。然后,根据前述的步骤S101-S102中给出实控人的计算方式,确定所有节点的实控人(这里可以指疑似实控人)。然后,确定实控人到被控制企业之间的控制路径(如果存在多个实控人,则获取多条控制路径)。最后仅保留这些包含了实控人和被控制企业的控制路径,构建第二控制路径图谱。
具体的,请参见图2,对于图2中给出的各个节点,确定其对应的实控人以及对应的控制路径,结果如表3:
表3
Figure 169071DEST_PATH_IMAGE006
从而,可以确定疑似实控人、被控制企业之间的控制路径,形成图6a所示的第二控制路径图谱(其中,虚线部分为不保留的路径),并最终形成图6b中的最终的第二控制路径图谱。
在构建出第二控制路径图谱之后,就可以进一步的进行企业的聚类,形成对应的派系结果(这里为初步关联企业分组的结果)。
具体的,基于全量工商企业库,先寻找所有符合要求的主体作为集团顶点,然后从顶点出发向下做遍历(广度优先或深度优先),找出顶点控制的所有成员,作为该顶点的集团成员。
具体算法如下:
(1)遍历工商主体库,找到所有符合要求的主体作为顶点,顶点要求如下:
a)该主体向上无其他股东,并且不是国资委、中央汇金、香港汇金等特殊机构。
b)该主体的疑似/公示/自建实控人为国资委、中央汇金、香港汇金等特殊机构。
c)该主体为公开企业,如上市公司、发债企业等。
d)该主体为自然人且为某企业的疑似/公示/自建实控人。
(2)在生成的第二控制路径图谱中,从顶点出发,向下穿透到底形成的树,即为以这个顶点出发的集团派系。
以图2给出的例子进一步的进行说明,假设H和G是公开企业,则可得:
(1)找到所有无其他股东的顶点:J、K、L、E、F、I,由于H、G是公开企业,则也作为顶点。
(2)对所有顶点,向下遍历穿透到底,形成如表4所示的初步关联企业分组结果:
表4
Figure 312608DEST_PATH_IMAGE007
进一步的,在进行初步关联企业分组的过程中,还需要进行分组结果的调整。
例如,需要对个人股东进行合并处理。
对于个人股东而言容易出现重名的问题。大部分个人股东在工商注册信息中会提供身份证号码作为唯一标识,我们可以利用身份证号码加密后的沙盒程序判断其唯一性,但是对于上市公司而言,上市后进入的个人股东,不需要在工商总局报备信息,故无法通过公开数据判断重名的个人股东是否为同一个人。在疑似实控人计算的过程中,对于在同一个企业股权图谱中的重名自然人股东,已经通过合并算法做了近似处理。但是对于不在同一个股权图谱中的重名自然人,无法判断其是否有资本联结的关系,则无法进行自动化处理,需要手工合并。
例如,在图7a所示的实施例中,在计算A的疑似实控人时,枚举A的所有股东,发现有两个张三,但是都没有ID信息,根据经验,大概率两个张三为同一个张三,则进行合并处理,最终计算得到A的疑似实控人为张三,E的实控人也为张三,且两个张三为同一个节点,合并后如图7b所示。则以张三为顶点的集团派系包括成员C、E、A。如果不进行合并处理,则会得到两个集团派系:{张三、C、A}和{张三、E}。
但如果两个张三的企业没有任何股权联结关系,如图7c所示,则无法确定两个张三是否为同一个人,得到的集团派系为{张三、C、A},{张三、E}。
在另一个实施例中,因为前述考虑的实控人均为根据股权关系穿透计算得到的疑似实控人,还需要考虑公示实控人和自建实控人对目标企业A的实控人的影响。因此,在本实施例中,还需要对实控人进行进一步的调整。
具体的,假设企业A的疑似实控人为B,公示/自建实控人为C:
按照前述方法生成第二控制路径图谱以及至少一个初步关联企业分组。并进一步的判断公示或自建实控人是否在控制路径上:获得A的第二控制路径图谱,从A出发,沿控制路径进行穿透到顶点,以确定C是否在控制路径上:如果在控制路径上,则C和A一定在同一个生成的初步关联企业分组中,不需要额外处理;如果不在控制路径上,则将A以及A向下实控的所有节点添加到C所在的初步关联企业分组中。需要说明的是,在比对C是否在A的控制路径中时,如果C是自然人,可能只有姓名信息,则比对控制路径中节点自然人的名称是否相同即可。
步骤S106:根据所述至少一个初步关联企业分组,按照预设的群组划分方式,确定一个或多个目标关联企业分组。
步骤S106是最终的目标关联企业分组的构建,即为企业关联风险的最终聚类结果的呈现。
其中,需要根据企业或股东之间的关联数据,例如,从以下多个方面考虑企业、股东之间的关系:
(1)股权关系:从控股角度考虑共同控制;
(2)任职关系:从任职角度考虑共同控制;
(3)亲属关系:从亲属关系角度考虑共同控制;
(4)合并报表:从合并报表角度考虑共同控制;
(5)供应商及客户:从供应商和客户的角度考虑同源风险;
(6)担保及保证:从担保和保证的角度考虑同源风险;
(7)融资方:从融资方的角度考虑同源风险;
(8)账户及交易:从内部账户及交易行为的相关性上考虑同源风险。
然后,上述企业、股东之间的关系数据,除了账户及交易信息来自于客户内部数据,其他数据主要来自于外部资讯数据。其中,股权数据较为全面,其他数据的获取取决于企业的信披程度,一般发债、上市企业会较为全面,但其他中小企业一般性没有批露。其中,关系数据的考虑主要采用股权逻辑判断为主,其他关系数据判断为辅的方式。从而根据这些关系数据,可以尽可能全面的对关联企业之间的分组进行划定,提高风险关联企业聚类的准确性。
也就是说,在本步骤中,结合企业、股东之间的经营依赖对应的关系数据,以及金融机构的风险管理实务、风险偏好等特征,对风险相关企业进行重新的聚类和划分,以得到进一步的一个或多个目标关联企业分组作为最终的结果输出,这里,是按照预设的群组划分方式,确定一个或多个目标关联企业分组。
具体的,从信用风险角度出发,客户的风险同源性判断,主要从股权控制角度出发,辅以其他关系为判断。例如企业发生信用风险事件,是否具备偿债能力,或者是否会波及其他企业,主要从股权控制路径出发寻找相关股东、子公司等,其次关注担保、现金流、供应商、客户等关系。所以目标关联企业分组的顶点可以以集团派系顶点为锚,作为目标关联企业分组的标识要素。
由于目标关联企业分组是基于金融机构风险偏好以及风险管理办法的偏主观的认定方法,因此可以对以下参数进行自定义的配置。
具体的,参数包括:
(1)穿透层数:以客户为起点,沿股权路径穿透的层数。层数越大,目标关联企业分组越大,准确度越高,管理成本也越高,反之越小。
(2)穿透方式:以某主体出发沿关系路径穿透的方式,通常有如下穿透方式:
a)向上穿透n层
b)向下穿透n层
c)向上+向下穿透n层
(3)关系类型:除了股权关系外,可以让用户选择需要考虑的关系类型,包括:
a)外部关系:包括机构、个人、产品等各类关系。
b)内部关系:包括根据交易和账户信息形成的内部关系。
(4)节点筛选:可预设相关主体属性的筛选条件,对穿透出的主体进行条件筛选,如企业性质、注册资本、是否上市、是否发债、行业、区域等。
目标关联企业分组的划分和识别,是按照设定的参数,进行识别和划分。
具体的,其划分的步骤如下:
(1)确定客户范围{A}:通常以直接客户和间接客户作为初始客户范围集合{A}。直接客户是指在金融机构有过开户的客户,间接客户是指虽然没有开户但是跟金融机构有相关的交易往来并会产生风险敞口的主体(在风控应用场景下的定义),如交易对手,担保方,融资方等。
(2)获得{A}的目标关联企业分组:遍历{A},对于{A}中的每一个主体A,依次执行以下步骤:
a)在第二控制路径图谱G上,以节点A为起点,按照设定的穿透方式,进行穿透遍历,形成遍历的节点集合{B},并以A的实控人C为该分组的顶点。
b)对节点集合{B}中的每个成员B,分别添加用户定义的其他关系类型成员(如担保、客户、融资方等)。
c)若该分组顶点C已经是其他所生成的目标关联企业分组的顶点,则对这两个分组进行去重合并。
进一步的,请参见图6b给出的第二控制路径图谱,假设其中A、B、C、D为客户,穿透层数为2层,穿透方式为向上穿透,则对A、B、C、D进行目标关联企业分组可以得到如表5所示的结果。
表5
Figure 367151DEST_PATH_IMAGE008
其中,由于A、C、D的顶点(实控人)都为J,则对A、C、D的目标关联企业分组进行去重合并。最终,形成两个目标关联企业分组:
顶点J的关联客户组:J、A、D、H、C、G;
顶点F的关联客户组:F、B。
进一步的,请参见图8,本实施例还提供了一种风险关联企业的聚类装置,包括:
控制节点集合确定模块101,用于获取目标企业的控制节点集合,所述控制节点集合包括与所述目标企业对应的持股链路集合;
实控人确定模块102,用于采用股权穿透的方式,计算每一个控制节点对所述目标企业的表决权比例,根据表决权比例确定所述目标企业的目标实控节点;
控制路径图谱确定模块103,用于基于所述目标企业的控制节点集合,构建与所述控制节点集合中包含的所有控制节点对应的第一控制路径图谱;根据所述第一控制路径图谱确定多条控制路径,所述控制路径包含了被控制企业和与所述被控制企业对应的实控节点,基于确定的控制路径确定第二控制路径图谱;
第一企业聚类模块104,用于根据所述第二控制路径图谱,对所述第二控制路径图谱中的顶点进行穿透和遍历处理,以确定至少一个初步关联企业分组;
第二企业聚类模块105,用于根据所述至少一个初步关联企业分组,按照预设的群组划分方式,确定一个或多个目标关联企业分组。
在一个可选的实施例中,实控人确定模块102还用于通过目标企业的持股链路集合,确定所述目标企业的所有直接股东节点的持股比例;若存在直接股东节点的持股比例超过预设的第一阈值的情况下,将该直接股东节点作为目标实控节点;若不存在直接股东节点的持股比例超过预设的第一阈值的情况下,根据持股链路集合确定所述目标企业的所有间接股东节点,针对间接股东节点,按照股权穿透的方式,采用累乘方式,计算间接股东节点的表决权比例;
根据表决权比例确定目标企业的目标实控节点。
在一个可选的实施例中,实控人确定模块102还用于假设目标企业向上穿透到间接股东节点共有n层,则间接股东节点对目标企业的累计表决权比例可以通过如下公式进行计算,
Figure 452788DEST_PATH_IMAGE001
其中,
Figure 959992DEST_PATH_IMAGE002
为间接股东节点对目标企业的累计表决权比例;
Figure 641641DEST_PATH_IMAGE003
为第n层到第n-1层的表决权比例。
在一个可选的实施例中,控制路径图谱确定模块103还用于在第一控制路径图谱中,保留包含了被控制企业和与所述被控制企业对应的实控节点的控制路径,并删除企业路径,以确定所述第二控制路径图谱。
在一个可选的实施例中,第一企业聚类模块104还用于根据预设的实控节点的筛选要求,在所述第二控制路径图谱中确定至少一个顶点;基于确定的至少一个顶点在所述第二控制路径图谱中进行穿透和遍历处理,以确定与该顶点对应的控制节点,其中,确定的控制节点包括企业和股东;根据顶点以及其对应的控制节点确定初步关联企业分组。
在一个可选的实施例中,第一企业聚类模块104还用于对所述至少一个初步关联企业分组进行去重合并处理。
在一个可选的实施例中,第二企业聚类模块105还用于确定关联企业划分的分组参数;
对于目标企业,基于第二控制路径图谱对一个或多个目标关联企业分组根据分组参数进行穿透处理,以获取与目标企业对应的目标关联企业分组。
采用了上述风险关联企业的聚类方法、装置、计算机设备及计算机可读存储介质之后,在需要对金融市场中企业之间的关联风险进行识别的情况下,通过股权关系构建企业图谱数据,然后通过股权穿透计算企业的实际控制人,然后基于实际控制人来计算企业的控制路径并构建企业的控制路径图谱,然后基于控制路径图谱进行遍历和穿透处理来进行关联企业分组,并且基于企业之间的经营数据进行进一步的群组划分,以得到最终的目标关联企业分组并输出。也就是说,采用本发明实施例,可以从控制权、经营依赖性的角度判断企业风险相关性,提供企业之间的关联风险识别的准确性。
图9示出了一个实施例中实现上述风险关联企业的聚类方法的计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图9所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现上述方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行上述方法。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种风险关联企业的聚类方法,其特征在于,所述方法包括:
获取目标企业的控制节点集合,所述控制节点集合包括与所述目标企业对应的持股链路集合;
采用股权穿透的方式,计算每一个控制节点对所述目标企业的表决权比例,根据表决权比例确定所述目标企业的目标实控节点;
基于所述目标企业的控制节点集合,构建与所述控制节点集合中包含的所有控制节点对应的第一控制路径图谱;
根据所述第一控制路径图谱确定多条控制路径,所述控制路径包含了被控制企业和与所述被控制企业对应的实控节点,基于确定的控制路径确定第二控制路径图谱;
根据所述第二控制路径图谱,对所述第二控制路径图谱中的顶点进行穿透和遍历处理,以确定至少一个初步关联企业分组;
根据所述至少一个初步关联企业分组,按照预设的群组划分方式,确定一个或多个目标关联企业分组。
2.根据权利要求1所述的风险关联企业的聚类方法,其特征在于,所述采用股权穿透的方式,计算每一个控制节点对所述目标企业的表决权比例,根据表决权比例确定所述目标企业的目标实控节点的步骤,还包括:
通过目标企业的持股链路集合,确定所述目标企业的所有直接股东节点的持股比例;若存在直接股东节点的持股比例超过预设的第一阈值的情况下,将该直接股东节点作为目标实控节点;
若不存在直接股东节点的持股比例超过预设的第一阈值的情况下,根据持股链路集合确定所述目标企业的所有间接股东节点,针对间接股东节点,按照股权穿透的方式,采用累乘方式,计算间接股东节点的表决权比例;
根据表决权比例确定目标企业的目标实控节点。
3.根据权利要求2所述的风险关联企业的聚类方法,其特征在于,所述对间接股东节点,按照股权穿透的方式,采用累乘方式,计算间接股东节点的表决权比例的步骤,还包括:
假设目标企业向上穿透到间接股东节点共有n层,则间接股东节点对目标企业的累计表决权比例可以通过如下公式进行计算,
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
为间接股东节点对目标企业的累计表决权比例;
Figure DEST_PATH_IMAGE006
为第n层到第n-1层的表决权比例。
4.根据权利要求1所述的风险关联企业的聚类方法,其特征在于,所述根据所述第一控制路径图谱确定多条控制路径的步骤,还包括:
在第一控制路径图谱中,保留包含了被控制企业和与所述被控制企业对应的实控节点的控制路径,并删除企业路径,以确定所述第二控制路径图谱。
5.根据权利要求4所述的风险关联企业的聚类方法,其特征在于,所述根据所述第二控制路径图谱,对所述第二控制路径图谱中的顶点进行穿透和遍历处理,以确定至少一个初步关联企业分组的步骤,还包括:
根据预设的实控节点的筛选要求,在所述第二控制路径图谱中确定至少一个顶点;
基于确定的至少一个顶点在所述第二控制路径图谱中进行穿透和遍历处理,以确定与该顶点对应的控制节点,其中,确定的控制节点包括企业和股东;
根据顶点以及其对应的控制节点确定初步关联企业分组。
6.根据权利要求5所述的风险关联企业的聚类方法,其特征在于,所述根据顶点以及其对应的控制节点确定初步关联企业分组的步骤,还包括:
对所述至少一个初步关联企业分组进行去重合并处理。
7.根据权利要求5所述的风险关联企业的聚类方法,其特征在于,所述根据所述至少一个初步关联企业分组,按照预设的群组划分方式,确定一个或多个目标关联企业分组的步骤,还包括:
确定关联企业划分的分组参数;
对于目标企业,基于第二控制路径图谱对一个或多个目标关联企业分组根据分组参数进行穿透处理,以获取与目标企业对应的目标关联企业分组。
8.一种风险关联企业的聚类装置,其特征在于,所述装置包括:
控制节点集合确定模块,用于获取目标企业的控制节点集合,所述控制节点集合包括与所述目标企业对应的持股链路集合;
实控人确定模块,用于采用股权穿透的方式,计算每一个控制节点对所述目标企业的表决权比例,根据表决权比例确定所述目标企业的目标实控节点;
控制路径图谱确定模块,用于基于所述目标企业的控制节点集合,构建与所述控制节点集合中包含的所有控制节点对应的第一控制路径图谱;根据所述第一控制路径图谱确定多条控制路径,所述控制路径包含了被控制企业和与所述被控制企业对应的实控节点,基于确定的控制路径确定第二控制路径图谱;
第一企业聚类模块,用于根据所述第二控制路径图谱,对所述第二控制路径图谱中的顶点进行穿透和遍历处理,以确定至少一个初步关联企业分组;
第二企业聚类模块,用于根据所述至少一个初步关联企业分组,按照预设的群组划分方式,确定一个或多个目标关联企业分组。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器有可执行代码,当所述可执行代码在所述处理器上运行以实现如权利要求1至7任一所述的方法。
CN202211098554.0A 2022-09-09 2022-09-09 风险关联企业的聚类方法、装置、设备及存储介质 Active CN115170271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211098554.0A CN115170271B (zh) 2022-09-09 2022-09-09 风险关联企业的聚类方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211098554.0A CN115170271B (zh) 2022-09-09 2022-09-09 风险关联企业的聚类方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115170271A true CN115170271A (zh) 2022-10-11
CN115170271B CN115170271B (zh) 2023-05-12

Family

ID=83482398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211098554.0A Active CN115170271B (zh) 2022-09-09 2022-09-09 风险关联企业的聚类方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115170271B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117273954A (zh) * 2023-11-21 2023-12-22 中证数智科技(深圳)有限公司 基于大规模关系图谱的股权关系穿透方法、装置及设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292509A (zh) * 2017-06-16 2017-10-24 兴业数字金融服务(上海)股份有限公司 一种企业信贷风险预警监测方法
CN109685355A (zh) * 2018-12-19 2019-04-26 重庆百行智能数据科技研究院有限公司 企业风险识别方法、装置和计算机可读存储介质
CN110909986A (zh) * 2019-11-04 2020-03-24 苏宁金融科技(南京)有限公司 基于知识图谱的疑似实际控制人的风险识别方法及系统
CN111382181A (zh) * 2020-03-16 2020-07-07 中科天玑数据科技股份有限公司 一种基于股权穿透的指定企业派系归属分析方法及系统
CN111861120A (zh) * 2020-06-17 2020-10-30 国家计算机网络与信息安全管理中心 企业关联图谱的构建方法、装置、设备及计算机可读介质
CN112232754A (zh) * 2020-09-14 2021-01-15 苏宁金融科技(南京)有限公司 一种企业数据挖掘方法、装置、设备
CN112991063A (zh) * 2021-04-01 2021-06-18 执立信息科技(上海)有限公司 企业股权穿透方法
CN113641878A (zh) * 2021-08-09 2021-11-12 平安科技(深圳)有限公司 适用于有向环路的实控人识别方法、装置、设备及介质
US20210374585A1 (en) * 2020-05-28 2021-12-02 Wells Fargo Bank, N.A. Systems and methods for quantum based optimization of a personalized portfolio

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292509A (zh) * 2017-06-16 2017-10-24 兴业数字金融服务(上海)股份有限公司 一种企业信贷风险预警监测方法
CN109685355A (zh) * 2018-12-19 2019-04-26 重庆百行智能数据科技研究院有限公司 企业风险识别方法、装置和计算机可读存储介质
CN110909986A (zh) * 2019-11-04 2020-03-24 苏宁金融科技(南京)有限公司 基于知识图谱的疑似实际控制人的风险识别方法及系统
CN111382181A (zh) * 2020-03-16 2020-07-07 中科天玑数据科技股份有限公司 一种基于股权穿透的指定企业派系归属分析方法及系统
US20210374585A1 (en) * 2020-05-28 2021-12-02 Wells Fargo Bank, N.A. Systems and methods for quantum based optimization of a personalized portfolio
CN111861120A (zh) * 2020-06-17 2020-10-30 国家计算机网络与信息安全管理中心 企业关联图谱的构建方法、装置、设备及计算机可读介质
CN112232754A (zh) * 2020-09-14 2021-01-15 苏宁金融科技(南京)有限公司 一种企业数据挖掘方法、装置、设备
CN112991063A (zh) * 2021-04-01 2021-06-18 执立信息科技(上海)有限公司 企业股权穿透方法
CN113641878A (zh) * 2021-08-09 2021-11-12 平安科技(深圳)有限公司 适用于有向环路的实控人识别方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵可;鲍新中;: "考虑集团化经营特征的企业财务困境风险预警研究", 数学的实践与认识 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117273954A (zh) * 2023-11-21 2023-12-22 中证数智科技(深圳)有限公司 基于大规模关系图谱的股权关系穿透方法、装置及设备
CN117273954B (zh) * 2023-11-21 2024-03-12 中证数智科技(深圳)有限公司 基于大规模关系图谱的股权关系穿透方法、装置及设备

Also Published As

Publication number Publication date
CN115170271B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
Inekwe FDI, employment and economic growth in Nigeria
CN108876133A (zh) 基于业务信息的风险评估处理方法、装置、服务器和介质
CN110929879A (zh) 基于决策引擎和模型平台的业务决策逻辑更新方法
CN109785117A (zh) 基于神经网络的风控方法、计算机可读存储介质及服务器
CN109949154A (zh) 客户信息分类方法、装置、计算机设备和存储介质
Oyedokun et al. Ownership structure and firm value of quoted consumers goods firms in Nigeria
CN115170271A (zh) 风险关联企业的聚类方法、装置、设备及存储介质
CN113327164A (zh) 期货交易的风险控制方法、装置及计算机设备
Peña et al. A fuzzy credibility model to estimate the Operational Value at Risk using internal and external data of risk events
Jackson et al. Comparing the pre-settlement risk implications of alternative clearing arrangements
US20160232376A1 (en) Privacy fractal mirroring of transaction data
CN117217743A (zh) 智能支付通道路由方法、装置、计算机设备和存储介质
CN112766637A (zh) 股东支持企业的评分方法、装置和电子设备
Chow Marginal conditional stochastic dominance, statistical inference, and measuring portfolio performance
CN116416072A (zh) 风险评估方法、装置、计算机设备和存储介质
CN114881761A (zh) 相似样本的确定方法与授信额度的确定方法
CN111339373B (zh) 一种图谱特征的提取方法、系统、计算机设备和存储介质
US10460116B2 (en) Access control method, system and storage medium
US20210256611A1 (en) Apparatus and method for generating and validating customized investment portfolios
CN114170000A (zh) 信用卡用户风险类别识别方法、装置、计算机设备和介质
Bazhenova et al. Optimal acquisition of input data for decision taking in business processes
Kerosi et al. The relationship between capital structure and profitability of firms listed at the Nairobi Securities Exchange
Malelak et al. The effect of corporate governance on firm performance: empirical evidence from Indonesia
Aderemi et al. What Drives Foreign Direct Investment Inflows in China? ARDL Bound Tests and ECM Approach
Abdulhakeem et al. Modelling Nigeria Naria Exchange Rate against Some Selected Country’s Currencies Volatility: Application of GARCH Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant