CN114254207B - 企业同名高管识别方法、装置、电子设备及存储介质 - Google Patents

企业同名高管识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114254207B
CN114254207B CN202210195402.6A CN202210195402A CN114254207B CN 114254207 B CN114254207 B CN 114254207B CN 202210195402 A CN202210195402 A CN 202210195402A CN 114254207 B CN114254207 B CN 114254207B
Authority
CN
China
Prior art keywords
enterprise
identified
determining
management
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210195402.6A
Other languages
English (en)
Other versions
CN114254207A (zh
Inventor
范晓忻
曹鸿强
赵鹏
冷巍
王俊
凌艳
闫萌
何大伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
3golden Beijing Information Technology Co ltd
Original Assignee
3golden Beijing Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 3golden Beijing Information Technology Co ltd filed Critical 3golden Beijing Information Technology Co ltd
Priority to CN202210195402.6A priority Critical patent/CN114254207B/zh
Publication of CN114254207A publication Critical patent/CN114254207A/zh
Application granted granted Critical
Publication of CN114254207B publication Critical patent/CN114254207B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及信息处理技术领域,提供一种企业同名高管识别方法、装置、电子设备及存储介质,该方法包括:获取各企业的工商基本信息;根据各企业的工商基本信息确定企业关系图集,企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,节点包括企业节点和自然人节点,自然人节点对应高管名称;确定待识别高管名称,根据企业关系图集确定对待识别高管名称的识别结果,通过从企业的工商基本信息中分析出以高管名称和企业为节点的多个企业关系子图,并基于子图间及子图自身中的节点关联,做出对待识别高管名称的识别结果,达到丰富企业评价中的高管数据特征,有助于提高企业评价的准确度。

Description

企业同名高管识别方法、装置、电子设备及存储介质
技术领域
本发明涉及信息处理技术领域,尤其涉及一种企业同名高管识别方法、装置、电子设备及存储介质。
背景技术
在基于大数据的企业评价过程中,企业高管信息是企业评价的重要依据。但是,在企业高管公开信息披露中,高管的身份证号和手机号属于个人隐私不允许披露,导致高管缺少唯一标识。无法识别同一企业或不同企业中同名高管是否为同一人,使企业评价中高管信息不可用。
发明内容
针对现有技术存在的问题,本发明提供一种企业同名高管识别方法、装置、电子设备及存储介质。
第一方面,本发明提供一种企业同名高管识别方法,其中:
获取各企业的工商基本信息,其中,所述工商基本信息中含有股东对企业的投资信息和企业中高管的名称;
根据各企业的工商基本信息确定企业关系图集,其中,所述企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,所述节点包括企业节点和自然人节点,所述自然人节点对应高管名称;
确定待识别高管名称,根据所述企业关系图集确定对所述待识别高管名称的识别结果。
在一个实施例中,所述根据所述企业关系图集确定对所述待识别高管名称的识别结果,包括:
确定所述企业关系图中含有所述待识别高管名称的次数至少为2时,确定来源于不同企业关系子图中的待识别高管名称对应的高管不属于同一人;确定来源于相同企业关系子网中的待识别高管名称对应的高管属于同一人,并确定置信度。
在一个实施例中,所述确定置信度,包括:
确定所述企业关系图集中最小子图的节点数和最大子图的节点数;
任选含有所述待识别高管名称的次数至少为2的企业关系子网为待识别子网,确定所述待识别子网的节点数及节点关系条数;
根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度。
在一个实施例中,所述根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度,包括:
根据所述节点数和所述节点关系条数采用以下置信度计算公式确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度;
Figure 267009DEST_PATH_IMAGE001
其中,
Figure 438227DEST_PATH_IMAGE002
为所述企业关系图集中最小子图的节点数,
Figure 3201DEST_PATH_IMAGE003
为所述企业关系图 集中最大子图的节点数,
Figure 918067DEST_PATH_IMAGE004
为所述待识别子网的节点数,
Figure 252097DEST_PATH_IMAGE005
为所述待识别子网的节点关系 条数,
Figure 859795DEST_PATH_IMAGE006
Figure 646486DEST_PATH_IMAGE007
为调节系数。
第二方面,本发明提供一种企业同名高管识别装置,包括:
获取模块,用于获取各企业的工商基本信息,其中,所述工商基本信息中含有股东对企业的投资信息和企业中高管的名称;
构建模块,用于根据各企业的工商基本信息确定企业关系图集,其中,所述企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,所述节点包括企业节点和自然人节点,所述自然人节点对应高管名称;
识别模块,用于确定待识别高管名称,根据所述企业关系图集确定对所述待识别高管名称的识别结果。
在一个实施例中,所述识别模块具体用于:
确定所述企业关系图中含有所述待识别高管名称的次数至少为2时,确定来源于不同企业关系子图中的待识别高管名称对应的高管不属于同一人;确定来源于相同企业关系子网中的待识别高管名称对应的高管属于同一人,并确定置信度。
在一个实施例中,所述识别模块在确定置信度的处理过程中,具体用于:
确定所述企业关系图集中最小子图的节点数和最大子图的节点数;
任选含有所述待识别高管名称的次数至少为2的企业关系子网为待识别子网,确定所述待识别子网的节点数及节点关系条数;
根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度。
在一个实施例中,所述识别模块在根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度的处理过程中,具体用于:
根据所述节点数和所述节点关系条数采用以下置信度计算公式确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度;
Figure 365043DEST_PATH_IMAGE008
其中,
Figure 819158DEST_PATH_IMAGE002
为所述企业关系图集中最小子图的节点数,
Figure 597758DEST_PATH_IMAGE003
为所述企业关系图 集中最大子图的节点数,
Figure 134394DEST_PATH_IMAGE004
为所述待识别子网的节点数,
Figure 391063DEST_PATH_IMAGE005
为所述待识别子网的节点关系 条数,
Figure 699685DEST_PATH_IMAGE006
Figure 649186DEST_PATH_IMAGE007
为调节系数。
第三方面,本发明提供一种电子设备,包括存储器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述企业同名高管识别方法的步骤。
第四方面,本发明提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行第一方面所述企业同名高管识别方法的步骤。
本发明提供的企业同名高管识别方法、装置、电子设备及存储介质,通过从企业的工商基本信息中分析出以高管名称和企业为节点的多个企业关系子图,并基于子图间及子图自身中的节点关联,做出对待识别高管名称的识别结果,达到丰富企业评价中的高管数据特征,有助于提高企业评价的准确度。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的企业同名高管识别方法的流程示意图;
图2是本发明提供的企业关系图集的示意图;
图3是本发明提供的企业同名高管识别装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图4描述本发明的企业同名高管识别方法、装置、电子设备及存储介质。
图1示出了本发明一种企业同名高管识别方法的流程示意图,参见图1,该方法包括:
11、获取各企业的工商基本信息,其中,工商基本信息中含有股东对企业的投资信息和企业中高管的名称;
12、根据各企业的工商基本信息确定企业关系图集,其中,企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,节点包括企业节点和自然人节点,自然人节点对应高管名称;
13、确定待识别高管名称,根据企业关系图集确定对待识别高管名称的识别结果。
针对步骤11~步骤13,需要说明的是,在本发明中,可以从工商数据中获知到各企业的工商基本信息。如下表1展示企业A的工商基本信息(各类信息未体现全部),下表2展示企业B的工商基本信息(各类信息未体现全部),下表3展示企业C的工商基本信息,下表4展示企业D的工商基本信息,下表5展示企业E的工商基本信息,下表6展示企业F的工商基本信息。
表1是企业A的工商基本信息
Figure 410469DEST_PATH_IMAGE009
参见表1,工商基本信息会含有股东对企业的投资信息(股东包括企业股东X和个人股东a和b)。个人股东可在企业中担任高管职务,也可不在企业中担任高管职务。股东a和b在企业A中担任高管职务,还包括其他高管c。企业A还向外投资企业B和C。
表2是企业B的工商基本信息
Figure 470829DEST_PATH_IMAGE010
参见表2,工商基本信息会含有股东对企业的投资情况(企业股东A和个人股东a、e和f)。个人股东可在企业中担任高管职务,也可不在企业中担任高管职务。股东a和e在企业A中担任高管职务。
表3是企业C的工商基本信息
Figure 633957DEST_PATH_IMAGE011
参见表3,企业C仅由企业A投资,不存在个人股东。企业C的高管包括b、m和n。
表4是企业D的工商基本信息
Figure 754360DEST_PATH_IMAGE012
参见表4,工商基本信息会含有股东对企业的投资信息(个人股东a、k和t)。个人股东可在企业中担任高管职务,也可不在企业中担任高管职务。股东a和t在企业D中担任高管职务。企业D还向外投资企业E。
表5是企业E的工商基本信息
Figure 268518DEST_PATH_IMAGE013
参见表5,工商基本信息会含有股东对企业的投资信息(公司股东D和个人股东a、o和p)。个人股东可在企业中担任高管职务,也可不在企业中担任高管职务。股东a、o和p在企业E中担任高管职务。
表6是企业F的工商基本信息
Figure 132569DEST_PATH_IMAGE014
参见表6,工商基本信息会含有股东对企业的投资信息(公司股东H和I,以及个人股东a)。个人股东可在企业中担任高管职务,也可不在企业中担任高管职务。股东a在企业F中担任高管职务。
在本发明中,获取到各企业的工商基本信息之后,需要结合所有工商基本信息确定企业关系图集。该企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,节点包括企业节点和自然人节点,自然人节点对应高管名称,也可以对应个人股东,或者同时对应高管名称和个人股东。如图2示出了企业关系图集的展示图,从图2中可以看出,将相互关联的企业以节点的方式进行连接,形成不同的企业关系子网。需要说明的是,图2的展示是基于上述表1-表6的信息进行展示。
在本发明中,用户计划要查询的高管名称作为待识别高管名称,然后结合企业关系图集,能够将待识别高管名称在各企业关系子网之间非关联性,以及每个企业关系子网中各企业节点和自然人节点之间的关联性上,对待识别高管在企业中是否所属于同一人进行评估,得到具有参考意义的识别结果。
参见图2,三个企业关系子图中均含有高管名称a。针对图2中的“企业关系子图一”来说,该子图中的各节点存在关联,为此,可以认为该子图中的多个高管名称a所属于同一人,并给出对应的置信度。针对图2中的“企业关系子图二”和“企业关系子图三”来说,各子图中的高管名称a对应的节点之间不存在关系,为此,可以认为“企业关系子图二”中的高管名称a与“企业关系子图三”中的高管名称a不属于同一人。
本发明提供的企业同名高管识别方法,通过从企业的工商基本信息中分析出以高管名称和企业为节点的多个企业关系子图,并基于子图间及子图自身中的节点关联,做出对待识别高管名称的识别结果,达到丰富企业评价中的高管数据特征,有助于提高企业评价的准确度。
在上述方法的进一步方法中,主要是对根据企业关系图集确定对待识别高管名称的识别结果的处理过程进行解释说明,具体如下:
确定企业关系图中含有待识别高管名称的次数至少为2时,确定来源于不同企业关系子图中的待识别高管名称对应的高管不属于同一人;确定来源于相同企业关系子网中的待识别高管名称对应的高管属于同一人,并确定置信度。
对此,需要说明的是,在本发明中,根据各企业之间是否存在关系,从而使得以所有已注册的企业的工商基本信息形成的企业关系图实际上划分出若干个企业关系子图。
当企业关系图中含有待识别高管名称的次数至少为2时,则表明高管出现了重名现象,此时,要确定企业中的待识别高管名称对应的高管是否属于同一人。
确定来源于不同企业关系子图中的待识别高管名称对应的高管不属于同一人。例如:针对图2中的“企业关系子图二”和“企业关系子图三”来说,各子图中的高管名称a对应的节点之间不存在关系,为此,可以认为“企业关系子图二”中的高管名称a与“企业关系子图三”中的高管名称a不属于同一人。
确定来源于相同企业关系子网中的待识别高管名称对应的高管属于同一人,并确定置信度。例如:针对图2中的“企业关系子图一”来说,该子图中的各节点存在关联,为此,可以认为该子图中的多个高管名称a所属于同一人,并给出对应的置信度。
在本发明中,置信度的计算原理为:企业关系子图的规模越大,此子图中同名高管为同一人的置信度就越小。例如企业关系子网中各企业的员工加一起成千上万,此时,企业中的重名现象会更多,导致同名高管为同一人的置信度就越小。
企业关系子图中各节点关系越多,此子图中同名高管为同一人的置信度就越大。
本发明进一步的方法,通过确定待识别高管名称的来源,对待识别高管名称对应的高管是否属于同一人进行识别,并确定置信度,达到丰富企业评价中的高管数据特征,有助于提高企业评价的准确度。
在上述方法的进一步方法中,主要是对确定置信度的处理过程进行解释说明,具体如下:
确定企业关系图集中最小子图的节点数和最大子图的节点数;
任选含有待识别高管名称的次数至少为2的企业关系子网为待识别子网,确定待识别子网的节点数及节点关系条数;
根据节点数和节点关系条数确定待识别子网中待识别高管名称对应的高管属于同一人的置信度。
对此,需要说明的是,在本发明中,置信度的计算原理为:企业关系子图的规模越大,此子图中同名高管为同一人的置信度就越小。企业关系子图中各节点关系越多,此子图中同名高管为同一人的置信度就越大。
为此,需要从整个企业关系网集进行考虑,所需企业关系图集中最小子图的节点数和最大子图的节点数,相应地,对于计划识别高管是否属于同一人的企业关系子网,需要确定节点数及节点关系条数,从而依据得到的各节点数和节点关系条数采用预设的计算公式确定置信度。
进一步地,置信度计算公式如下:
Figure 884624DEST_PATH_IMAGE001
其中,
Figure 441507DEST_PATH_IMAGE002
为所述企业关系图集中最小子图的节点数,
Figure 177382DEST_PATH_IMAGE003
为所述企业关系图 集中最大子图的节点数,
Figure 845124DEST_PATH_IMAGE004
为所述待识别子网的节点数,
Figure 717265DEST_PATH_IMAGE005
为所述待识别子网的节点关系 条数,
Figure 182400DEST_PATH_IMAGE006
Figure 405571DEST_PATH_IMAGE007
为调节系数。
本发明提供的企业同名高管识别方法,通过从企业关系图集中所有子网进行考虑,基于节点数和节点关系条数对待识别子网中的高管是否属于同一人进行识别,达到丰富企业评价中的高管数据特征,有助于提高企业评价的准确度。
下面对本发明提供的企业同名高管识别装置进行描述,下文描述的企业同名高管识别装置与上文描述的企业同名高管识别方法可相互对应参照。
图3示出了本发明提供的一种企业同名高管识别装置的结构示意图,参见图3,该装置包括获取模块31、构建模块32和识别模块33,其中
获取模块31,用于获取各企业的工商基本信息,其中,工商基本信息中含有股东对企业的投资信息和企业中高管的名称;
构建模块32,用于根据各企业的工商基本信息确定企业关系图集,其中,企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,节点包括企业节点和自然人节点,自然人节点对应高管名称;
识别模块33,用于确定待识别高管名称,根据企业关系图集确定对待识别高管名称的识别结果。
在上述装置的进一步装置中,识别模块具体用于:
确定所述企业关系图中含有所述待识别高管名称的次数至少为2时,确定来源于不同企业关系子图中的待识别高管名称对应的高管不属于同一人;确定来源于相同企业关系子网中的待识别高管名称对应的高管属于同一人,并确定置信度。
在上述装置的进一步装置中,识别模块在确定置信度的处理过程中,具体用于:
确定所述企业关系图集中最小子图的节点数和最大子图的节点数;
任选含有所述待识别高管名称的次数至少为2的企业关系子网为待识别子网,确定所述待识别子网的节点数及节点关系条数;
根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度。
在上述装置的进一步装置中,识别模块在根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度的处理过程中,具体用于:
根据所述节点数和所述节点关系条数采用以下置信度计算公式确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度;
Figure 345845DEST_PATH_IMAGE008
其中,
Figure 338072DEST_PATH_IMAGE002
为所述企业关系图集中最小子图的节点数,
Figure 236758DEST_PATH_IMAGE003
为所述企业关系图 集中最大子图的节点数,
Figure 416066DEST_PATH_IMAGE004
为所述待识别子网的节点数,
Figure 425611DEST_PATH_IMAGE005
为所述待识别子网的节点关系 条数,
Figure 537923DEST_PATH_IMAGE006
Figure 341931DEST_PATH_IMAGE007
为调节系数。
由于本发明实施例所述装置与上述实施例所述方法的原理相同,对于更加详细的解释内容在此不再赘述。
需要说明的是,本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模。
本发明提供的企业同名高管识别装置,通过从企业的工商基本信息中分析出以高管名称和企业为节点的多个企业关系子图,并基于子图间及子图自身中的节点关联,做出对待识别高管名称的识别结果,达到丰富企业评价中的高管数据特征,有助于提高企业评价的准确度。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)41、通信接口(Communication Interface)42、存储器(memory)43和通信总线44,其中,处理器41,通信接口42,存储器43通过通信总线44完成相互间的通信。处理器41可以调用存储器43中的计算机程序,以执行企业同名高管识别方法的步骤,例如包括:获取各企业的工商基本信息,其中,工商基本信息中含有股东对企业的投资信息和企业中高管的名称;根据各企业的工商基本信息确定企业关系图集,其中,企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,节点包括企业节点和自然人节点,自然人节点对应高管名称;确定待识别高管名称,根据企业关系图集确定对待识别高管名称的识别结果。
此外,上述的存储器43中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的企业同名高管识别方法,该方法包括:获取各企业的工商基本信息,其中,工商基本信息中含有股东对企业的投资信息和企业中高管的名称;根据各企业的工商基本信息确定企业关系图集,其中,企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,节点包括企业节点和自然人节点,自然人节点对应高管名称;确定待识别高管名称,根据企业关系图集确定对待识别高管名称的识别结果。
另一方面,本申请实施例还提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行上述各实施例提供的企业同名高管识别方法,例如包括:获取各企业的工商基本信息,其中,工商基本信息中含有股东对企业的投资信息和企业中高管的名称;根据各企业的工商基本信息确定企业关系图集,其中,企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,节点包括企业节点和自然人节点,自然人节点对应高管名称;确定待识别高管名称,根据企业关系图集确定对待识别高管名称的识别结果。
所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (4)

1.一种企业同名高管识别方法,其特征在于,包括:
获取各企业的工商基本信息,其中,所述工商基本信息中含有股东对企业的投资信息和企业中高管的名称;
根据各企业的工商基本信息确定企业关系图集,其中,所述企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,所述节点包括企业节点和自然人节点,所述自然人节点对应高管名称;
确定待识别高管名称,确定所述企业关系图中含有所述待识别高管名称的次数至少为2时,确定来源于不同企业关系子图中的待识别高管名称对应的高管不属于同一人;确定来源于相同企业关系子网中的待识别高管名称对应的高管属于同一人,并确定置信度;
其中,确定置信度,包括:
确定所述企业关系图集中最小子图的节点数和最大子图的节点数;
任选含有所述待识别高管名称的次数至少为2的企业关系子网为待识别子网,确定所述待识别子网的节点数及节点关系条数;
根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度;
其中,所述根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度,包括:
根据所述节点数和所述节点关系条数采用以下置信度计算公式确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度;
Figure 92318DEST_PATH_IMAGE001
其中,
Figure 358083DEST_PATH_IMAGE002
为所述企业关系图集中最小子图的节点数,
Figure 793744DEST_PATH_IMAGE003
为所述企业关系图集中 最大子图的节点数,
Figure 992423DEST_PATH_IMAGE004
为所述待识别子网的节点数,
Figure 67695DEST_PATH_IMAGE005
为所述待识别子网的节点关系条 数,
Figure 137151DEST_PATH_IMAGE006
Figure 630581DEST_PATH_IMAGE007
为调节系数。
2.一种企业同名高管识别装置,其特征在于,包括:
获取模块,用于获取各企业的工商基本信息,其中,所述工商基本信息中含有股东对企业的投资信息和企业中高管的名称;
构建模块,用于根据各企业的工商基本信息确定企业关系图集,其中,所述企业关系图集包括多个企业关系子图,每个企业关系子图包括节点和节点关系,所述节点包括企业节点和自然人节点,所述自然人节点对应高管名称;
识别模块,用于确定待识别高管名称,确定所述企业关系图中含有所述待识别高管名称的次数至少为2时,确定来源于不同企业关系子图中的待识别高管名称对应的高管不属于同一人;确定来源于相同企业关系子网中的待识别高管名称对应的高管属于同一人,并确定置信度;
其中,所述识别模块在确定置信度的过程中,具体用于:
确定所述企业关系图集中最小子图的节点数和最大子图的节点数;
任选含有所述待识别高管名称的次数至少为2的企业关系子网为待识别子网,确定所述待识别子网的节点数及节点关系条数;
根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度;
其中,所述识别模块在根据所述节点数和所述节点关系条数确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度的处理过程中,具体用于:
根据所述节点数和所述节点关系条数采用以下置信度计算公式确定所述待识别子网中待识别高管名称对应的高管属于同一人的置信度;
Figure 760080DEST_PATH_IMAGE008
其中,
Figure 135697DEST_PATH_IMAGE002
为所述企业关系图集中最小子图的节点数,
Figure 746195DEST_PATH_IMAGE003
为所述企业关系图集中 最大子图的节点数,
Figure 156447DEST_PATH_IMAGE004
为所述待识别子网的节点数,
Figure 925689DEST_PATH_IMAGE005
为所述待识别子网的节点关系条 数,
Figure 37870DEST_PATH_IMAGE006
Figure 199862DEST_PATH_IMAGE007
为调节系数。
3.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1所述企业同名高管识别方法的步骤。
4.一种处理器可读存储介质,其特征在于,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行权利要求1所述企业同名高管识别方法的步骤。
CN202210195402.6A 2022-03-02 2022-03-02 企业同名高管识别方法、装置、电子设备及存储介质 Active CN114254207B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210195402.6A CN114254207B (zh) 2022-03-02 2022-03-02 企业同名高管识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210195402.6A CN114254207B (zh) 2022-03-02 2022-03-02 企业同名高管识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114254207A CN114254207A (zh) 2022-03-29
CN114254207B true CN114254207B (zh) 2022-06-21

Family

ID=80797289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210195402.6A Active CN114254207B (zh) 2022-03-02 2022-03-02 企业同名高管识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114254207B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020433B (zh) * 2019-04-01 2023-04-18 中科天玑数据科技股份有限公司 一种基于企业关联关系的工商高管人名消歧方法
US11575563B2 (en) * 2019-05-31 2023-02-07 Varmour Networks, Inc. Cloud security management
CN113269244A (zh) * 2021-05-18 2021-08-17 上海睿翎法律咨询服务有限公司 针对工商登记信息中跨企业人员重名实现消歧处理方法、系统、装置、处理器及其存储介质
CN113326377B (zh) * 2021-06-02 2023-10-13 上海生腾数据科技有限公司 一种基于企业关联关系的人名消歧方法及系统

Also Published As

Publication number Publication date
CN114254207A (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
US11710131B2 (en) Method and apparatus of identifying a transaction risk
CN109271321B (zh) 一种贡献代码数统计方法及装置
CN110908997A (zh) 数据血缘构建方法、装置、服务器及可读存储介质
CN104298588B (zh) 一种持续集成的实现方法及装置
CN109740129B (zh) 基于区块链的报表生成方法、装置、设备及可读存储介质
CN112634056A (zh) 快速计算、更新企业股权结构的方法、设备和存储介质
CN110134663B (zh) 组织结构数据处理方法、装置、电子设备
CN106294128B (zh) 一种导出报表数据的自动化测试方法及装置
CN106484699A (zh) 数据库查询字段的生成方法及装置
CN116126843A (zh) 一种数据质量评估方法、装置、电子设备和存储介质
CN114254207B (zh) 企业同名高管识别方法、装置、电子设备及存储介质
CN109684033A (zh) 云平台裸机管理方法、存储介质、电子设备及系统
CN110175047B (zh) 处理器指令编码的自动生成方法及装置
CN112287039A (zh) 一种团伙识别方法及相关装置
CN116389049A (zh) 一种针对单数据流的数据安全分析方法及装置
CN109919762A (zh) 客户信息的报备方法、装置、设备及存储介质
CN115982177A (zh) 一种基于树形维度的数据归集的方法、装置、设备及介质
CN115438024A (zh) 数据导入中台的方法、装置、系统、电子设备、存储介质
CN114066331A (zh) 股东投资信息获取方法、装置、电子设备及存储介质
CN111026705B (zh) 建筑工程文件管理方法、系统及终端设备
CN110517010A (zh) 一种数据处理方法、系统及存储介质
CN113342647A (zh) 一种测试数据的生成方法及装置
CN109582806B (zh) 一种基于图计算的个人信息处理方法及系统
CN111127065A (zh) 用户职住地的获取方法和装置
CN116610762B (zh) 一种企业数据资产的管理方法、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant