CN115292556A - 一种企业关系图谱构建方法及系统 - Google Patents
一种企业关系图谱构建方法及系统 Download PDFInfo
- Publication number
- CN115292556A CN115292556A CN202210873341.4A CN202210873341A CN115292556A CN 115292556 A CN115292556 A CN 115292556A CN 202210873341 A CN202210873341 A CN 202210873341A CN 115292556 A CN115292556 A CN 115292556A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- association
- weight value
- transaction
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种企业关系图谱构建方法及系统,涉及大数据处理领域;其方法包括:确定待处理企业的基础维度数据和经营数据,基础维度包括企业的注册地址、企业法定代表人、企业董事、企业监事、股东和其他登记高管姓名,经营数据包括企业接受的投资公司名称及对应的交易次数、交易金额和交易时间,与企业发生合同关系的其他市场主体名称及对应的交易次数、交易金额和交易时间;匹配基础维度数据和经营数据,获得企业关联关系;存储企业关联关系至图数据库,获得企业关系图谱。本发明在关联工商信息基础上,对企业间市场交易行为量化,挖掘企业间更深层次的关联关系,从多维角度提供更完整的企业关系图谱。
Description
技术领域
本发明涉及大数据处理技术领域,具体涉及一种企业关系图谱构建方法及系统。
背景技术
目前常见的企业关系图谱都是基于工商登记的融资、投资形成关联关系,无法深入基于公司的法人、高管的经营行为构建出更广泛的企业关系图谱,导致查询出来企业的关系比较单一,无法全面更深入了解一个企业的整体概况。
现有技术中为更全面深入了解企业概况,也有方案提出基于公司法人查询的企业关系图谱,但是由于当前工商登记中不会披露法人身份信息,使得公司之间通过法人构建出来的关系图谱不准确,误差大。
发明内容
本发明目的在于提供一种企业关系图谱构建方法及系统,解决当前只采用简单工商关系获得的企业关系图谱无法深入了解企业整体概况的问题,方案在工商基础的关联上,通过将企业间市场交易行为量化,推理挖掘出企业间更深层次的关系;为评判一个企业的经营状态,企业整体状况提供一个更加丰富,多维的关系图谱。
为达成上述目的,本发明提出如下技术方案:一种企业关系图谱构建方法,包括:
确定待处理企业的基础维度数据,所述基础维度包括企业的注册地址、企业法定代表人、企业董事、企业监事、股东和其他登记高管姓名;
确定待处理企业的经营数据,所述经营数据为企业运营过程中与其发生过工商行为的上、下游市场主体及交易行为,包括企业接受的投资公司名称及对应的交易次数、交易金额和交易时间,与企业发生合同关系的其他市场主体名称及对应的交易次数、交易金额和交易时间;
匹配所述基础维度数据和所述经营数据,根据待处理企业与关联市场主体的关联程度,获得企业关联关系;
存储所述企业关联关系至图数据库,获得企业关系图谱。
进一步的,所述匹配所述基础维度数据和所述经营数据的过程包括:获取所有与待处理企业关联的关联市场主体,确定关联市场主体与待处理企业的企业关联类型;
所述企业关联类型包括企业参股关系、企业市场行为关系和企业密切关系;其中,所述企业参股关系为根据所述基础维度数据,基于工商登记信息中的参股信息,匹配获得的企业关联关系;所述企业市场行为关系为根据所述经营数据中市场主体,基于市场公开的企业经营数据,匹配获得的企业关联关系;所述企业密切关系为获取的所述基础维度数据中企业的高管作为市场主体在企业经营行为和交易行为中关联的各个市场主体的关系。
进一步的,在所述匹配所述基础维度数据和所述经营数据前,还包括数据预处理;
所述数据预处理为对所述基础维度数据和所述经营数据进行清洗和归一化,包括将所述企业的注册地址标准化为省-市-区三级、统一交易金额为以万为单位和统一交易时间的格式为YYYY。
进一步的,所述获得企业关联关系的具体过程为:
对所述待处理企业构建企业关系网,确定直接关联权重值和间接关联权重值的分量;
分别计算根据所述基础维度数据和所述经营数据匹配的各关联市场主体与该企业的直接关联权重值、间接关联权重值和最终权重值;
判断最终权重值所属预设各关联关系对应的各权重阈值范围,确定企业关联关系。
进一步的,定义直接关联权重值的分量为X1、间接关联权重值的分量为X2,X1+X2=1,则企业与其任一关联市场主体的直接关联权重值、间接关联权重值和最终权重值的计算公式分别为:
直接关联权重值=Sum((交易次数+交易金额)*(1-(当前年限-交易年限)/N));
间接关联权重值=关联市场主体的直接关联权重值*(N-Z)/N+nN;
最终权重值=直接关联权重值*X1+间接关联权重值*X2;
其中,N为企业关系图谱统计的年限,Z为采用最短路径法确定的企业及其关联市场主体的关联层级,n为同时任职于企业及其关联市场主体的高管人数。
进一步的,所述方法还包括:
根据所述企业关系图谱,获得企业名称及企业关联关系id;
存储所述企业名称及企业关联关系id至ES索引中,提供一企业名称快速查询窗口;
采用所述企业名称快速查询窗口接收搜索命令,查询搜索命令对应的企业关联关系id,获得对应查询的企业关系图谱。
本发明另一技术方案在于提供一种企业关系图谱构建系统,该系统包括:
第一确定模块,用于确定待处理企业的基础维度数据,所述基础维度包括企业的注册地址、企业法定代表人、企业董事、企业监事、股东和其他登记高管姓名;
第二确定模块,用于确定待处理企业的经营数据,所述经营数据为企业运营过程中与其发生过工商行为的上、下游市场主体及交易行为,包括企业接受的投资公司名称及对应的交易次数、交易金额和交易时间,与企业发生合同关系的其他市场主体名称及对应的交易次数、交易金额和交易时间;
匹配模块,用于匹配所述基础维度数据和所述经营数据,根据关联市场主体与待处理企业的关联程度,获得企业关联关系;
第一存储模块,用于存储所述企业关联关系至图数据库,获得企业关系图谱。
进一步的,所述匹配模块获得企业关联关系的过程由如下执行单元执行,包括:
构建单元,用于对所述待处理企业构建企业关系网,确定直接关联权重值和间接关联权重值的分量;
计算单元,用于分别计算根据所述基础维度数据和所述经营数据匹配的各关联市场主体与该企业的直接关联权重值、间接关联权重值和最终权重值;
判断确定单元,用于判断最终权重值所属预设各关联关系对应的各权重阈值范围,确定企业关联关系。
进一步的,所述计算单元计算所述待处理企业与其任一关联市场主体的直接关联权重值、间接关联权重值和最终权重值的公式分别为:
定义直接关联权重值的分量为X1,所述间接关联权重值的分量为X2,X1+X2=1,则:
直接关联权重值=Sum((交易次数+交易金额)*(1-(当前年限-交易年限)/N));
间接关联权重值=关联市场主体的直接关联权重值*(N-Z)/N+nN;
最终权重值=直接关联权重值*X1+间接关联权重值*X2;
其中,N为企业关系图谱统计的年限,Z为采用最短路径法确定的企业及其关联市场主体的关联层级,n为同时任职于该企业及其关联市场主体的高管人数。
本发明还提供一种企业关系图谱构建装置,该装置包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现上述的企业关系图谱构建方法。
由以上技术方案可知,本发明的技术方案获得了如下有益效果:
本发明公开的企业关系图谱构建方法及系统,其方法包括:确定待处理企业的基础维度数据和经营数据,基础维度包括企业的注册地址、企业法定代表人、企业董事、企业监事、股东和其他登记高管姓名,经营数据包括企业接受的投资公司名称及对应的交易次数、交易金额和交易时间,与企业发生合同关系的其他市场主体名称及对应的交易次数、交易金额和交易时间;匹配所述基础维度数据和所述经营数据,根据关联市场主体与待处理企业的关联程度,获得企业关联关系;存储所述企业关联关系至图数据库,获得企业关系图谱。本发明在关联工商信息基础上,对企业间市场交易行为量化,挖掘企业间更深层次的关联关系,从多维角度提供更完整的企业关系图谱。
本发明的方法及系统实施时企业关联关系的确定通过计算企业及其关联市场主体间的直接关联权重值、间接关联权重值和的最终权重值获得,通过权重值衡量关联市场主体与企业的关联紧密度,进而在企业关系图谱中能够清楚的展示;当用户采用该企业关系图谱了解企业时,能够通过该丰富且多维的关系图谱充分了解企业的整体状况和经营状态,为衡量企业的发展提供更准确且直观的数据支持。
应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。
结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。
附图说明
附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:
图1为本发明构建企业关系图谱的结构框图;
图2为本发明企业关系图谱构建方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。除非另作定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
本发明专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,除非上下文清楚地指明其它情况,否则单数形式的“一个”“一”或者“该”等类似词语也不表示数量限制,而是表示存在至少一个。“包括”或者“包含”等类似的词语意指出现在“包括”或者“包含”前面的元件或者物件涵盖出现在“包括”或者“包含”后面列举的特征、整体、步骤、操作、元素和/或组件,并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。“上”“下”“左”“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
基于现有技术中采用基础工商登记的融资、投资形成的企业关系图谱较为简单,其对于企业的高层管理人员的经营行为无法获知,因此无法深入了解公司的整体概况;而现有的采用公司法人获得的企业关系图谱,由于不能获得真实的法人身份信息,导致图谱数据具有较大的误差,也不能用于全面了解企业的概况。本发明旨在于提出一种企业关系图谱构建方法及系统,通过多维度获取企业与其关联的市场主体的市场交易行为并进行量化,推理挖掘企业间更深层次的关系,对企业提供全面且详细的企业关系图谱,了解企业整体概况。
下面结合附图所示的实施例,对本发明公开的企业关系图谱构建方法及系统做进一步具体介绍。
结合图1所示,本发明公开的构建企业关系图谱的过程包括四个方面,获取企业基础维度数据、企业经营数据、企业关联关系研判和最终生成企业关系图谱的四个步骤,然后提供一应用方式,即将生成的企业关系图谱应用于企业关系检索,获得任意两个或多个企业间的关联关系。
具体的,本发明公开的企业关系图谱构建方法,如图2所示,包括如下步骤:
步骤S102,确定待处理企业的基础维度数据,所述基础维度包括企业的注册地址、企业法定代表人、企业董事、企业监事、股东和其他登记高管姓名;
通过获取和企业相关的基础维度数据,结合工商登记的信息,能够深入挖掘间接和企业产生关联的市场主体,挖掘这些市场主体过程一方面能够扩大企业关系图谱涉及的范围,另一方面能够了解企业发展布局和人才引进情况,获悉企业发展规划。
步骤S104,确定待处理企业的经营数据,所述经营数据为企业运营过程中与其发生过工商行为的上、下游市场主体及交易行为,包括企业接受的投资公司名称及对应的交易次数、交易金额和交易时间,与企业发生合同关系的其他市场主体名称及对应的交易次数、交易金额和交易时间;
本步骤旨在于收集企业经营过程交易行为产生的交易数据,其展示在企业关系图谱中能够全面展示企业的业务对象、业务范围和业务涉及行业,能够推测企业后续发展的方向和发展目标。实施时,企业经营数据的确定主要是从企业申报信息中整理企业关系图谱统计年份的与各个市场主体之间的交易行为,归纳出企业间进行的交易时间、交易次数和交易金额,以便后续计算关联程度使用。
作为一可选的实施例,在所述待处理企业的基础维度数据和经营数据确定后,需要先进行数据预处理。本方案中数据预处理的过程主要是对确定的数据进行数据治理,例如,对所述基础维度数据和所述经营数据进行清洗和归一化,包括将确定的企业的注册地址标准化为省-市-区三级、统一交易金额为以万为单位和统一交易时间的格式为YYYY。
步骤S106,匹配所述基础维度数据和所述经营数据,根据待处理企业与关联市场主体的关联程度,获得企业关联关系;
其中,匹配所述基础维度数据和所述经营数据的过程旨在于罗列所有与待处理企业具有关联的市场主体,这类市场主体均记为关联市场主体。本步骤即实现上述的企业关联关系研判过程,基于企业自身的基础维度数据信息,综合企业经营数据的市场行为,先通过不同维度匹配划分关联市场主体与待处理企业为不同的关联类型,再通过关联类型进一步获得关联市场主体与待处理企业的关联程度,不同的关联程度即对应不同的关联关系。
例如,将企业关联类型包括企业参股关系、企业市场行为关系和企业密切关系;其中,所述企业参股关系为根据所述基础维度数据,基于工商登记信息中的参股信息,匹配获得的企业关联关系;所述企业市场行为关系为根据所述经营数据中市场主体,基于市场公开的企业经营数据,匹配获得的企业关联关系;所述企业密切关系为获取的所述基础维度数据中企业的高管作为市场主体在企业经营行为和交易行为中关联的各个市场主体的关系。
步骤S108,存储所述企业关联关系至图数据库,获得企业关系图谱。
通过企业关系图谱能够从企业基础维度、企业关联类型和企业关联关系的多个角度展示企业的整体概况,了解企业经营轨迹,数据不仅准确且全面。
作为一可选的实施例,获得企业关联关系的具体过程为:对所述待处理企业构建企业关系网,确定直接关联权重值和间接关联权重值的分量;分别计算根据所述基础维度数据和所述经营数据匹配的各关联市场主体与该企业的直接关联权重值、间接关联权重值和最终权重值;判断最终权重值所属预设各关联关系对应的各权重阈值范围,确定企业关联关系。
实施时,采用量化企业间的交易行为的方式表征两者间的直接关联关系,即只有当两企业间发生了交易行为才具有产生直接关联,否则两企业间记为间接关联。
基于此,实施例一种衡量两个企业间的关联程度的关联算法模型,该模型使用如下:
定义直接关联权重值的分量为X1、间接关联权重值的分量为X2,X1+X2=1,则企业与其任一关联市场主体的直接关联权重值、间接关联权重值和最终权重值的计算公式分别为:
直接关联权重值=Sum((交易次数+交易金额)*(1-(当前年限-交易年限)/N));
间接关联权重值=关联市场主体的直接关联权重值*(N-Z)/N+nN;
最终权重值=直接关联权重值*X1+间接关联权重值*X2;
其中,N为企业关系图谱统计的年限,Z为采用最短路径法确定的企业及其关联市场主体的关联层级,n为同时任职于企业及其关联市场主体的高管人数;直接关联权重值的求和公式内为企业与关联市场主体每一年的交易权重,进而直接关联权重值为统计年限内的总权重。
例如,当直接关联权重值的分量为X1取值为60、间接关联权重值的分量为X2取值为40,企业关系图谱统计的年份为10年,则对企业与其任一关联市场主体,直接关联权重值=Sum(交易次数+交易金额)*(1-(当前年限-交易年限)/10),间接关联权重值=直接关联权重值*(10-关联层级)/10+10n,最终权重值=直接关联权重值*0.6+间接关联权重值*0.4。
又例如,可设定与企业存在高度密切关联关系的权重阈值范围为不小于80、与企业存在密切关联关系的权重阈值范围为[60,80)、与企业存在关联关系的权重阈值范围为[40,60)、与企业存在微弱关联关系的权重阈值范围为[0,40),当计算的最终权重值大于80,则判定企业与该关联主体间存在高度密切关联关系,属于[60,80)区间范围则判定企业与该关联主体间存在密切关系,属于[40,60)区间范围判定企业与该关联主体间存在关联关系。
表1提供了一实施例,企业关系图谱统计的数据为企业A在2012年至2022年间发生交易行为的关联主体,企业B为企业A的一关联企业,企业B与企业A在2018年、2020年至2022年有交易行为数据,采用最短路径法确定的企业A及企业B的关联层级为2,同时任职于企业A及企业B的高管人数为3人;根据如下数据及上述关联关系的权重划分,计算两企业间的关联关系过程如下:
表1企业A与企业B从2018年至2022年间交易行为数据
年度 | 2022 | 2021 | 2020 | 2018 |
交易次数 | 7 | 9 | 4 | 1 |
交易金额(万元) | 16 | 18 | 7 | 5 |
则:
直接关联权重值=Sum((交易次数+交易金额)*(1-(当前年限-交易年限)/N))=((7+16)*(1-(2022-2022)/10)+(9+18)*(1-(2022-2021)/10)+(4+7)*(1-(2022-2020)/10)+(1+5)*(1-(2022-2018)/10))=59.7;
间接关联权重值=关联市场主体的直接关联权重值*(N-Z)/N+nN=59.7*(10-2)/10+30=77.76;
最终权重值=直接关联权重值*X1+间接关联权重值*X2=69.7*0.6+77.76*0.4=66.924
由于60<最终权重值<80,故而判断企业A及企业B间存在密切关联关系,在企业关系图谱中可标记为密切关系。
对于一检索平台,获得企业关系图谱后,可提供检索服务,即实现上述企业关系图谱应用过程;即,企业关系图谱构建方法还包括:根据所述企业关系图谱,获得企业名称及企业关联关系id;存储所述企业名称及企业关联关系id至ES索引中,提供一企业名称快速查询窗口;采用所述企业名称快速查询窗口接收搜索命令,查询搜索命令对应的企业关联关系id,获得对应查询的企业关系图谱。实施时,企业名称对应的企业关联关系id具有唯一性,对应于该企业关联关系id的企业关系图谱也是唯一对应的;用户根据检索到的企业关联关系id即可获得对应的企业关系图谱。可选的,还包括:展示所述企业关系图谱在平台的显示屏幕上,以便用户查看。
本发明先从不同维度获得所有与企业相关的市场主体,然后根据市场主体与企业间发生的交易行为的量化衡量市场主体与企业的关联程度,进而得出任一与企业关联的市场主体和企业间存在的关联关系;通过从多维角度挖掘企业间更深层次的关联关系,弥补了现有技术只能提供关系单一的企业关系图谱的不足,让查询人员能全面更深入的了解一个企业的整体概况。
在本发明的实施例中,还提供一种电子装置,该电子装置包括处理器和存储器,存储器中存储有计算机程序,当计算机程序由所述处理器加载并执行时实现上述的企业关系图谱构建方法。
上述程序可以运行在处理器中,或者也可以存储在存储器中(或称为计算机可读介质),计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
这些计算机程序也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤,对应与不同的步骤可以通过不同的模块来实现。
本实施例就提供了这样的一种电子装置或系统,该装置被称为一种企业关系图谱构建装置,该系统被称为一种文本智能显示系统,该系统包括:第一确定模块,用于确定待处理企业的基础维度数据,所述基础维度包括企业的注册地址、企业法定代表人、企业董事、企业监事、股东和其他登记高管姓名;第二确定模块,用于确定待处理企业的经营数据,所述经营数据为企业运营过程中与其发生过工商行为的上、下游市场主体及交易行为,包括企业接受的投资公司名称及对应的交易次数、交易金额和交易时间,与企业发生合同关系的其他市场主体名称及对应的交易次数、交易金额和交易时间;匹配模块,用于匹配所述基础维度数据和所述经营数据,根据关联市场主体与待处理企业的关联程度,获得企业关联关系;第一存储模块,用于存储所述企业关联关系至图数据库,获得企业关系图谱。
该系统用于实现上述的实施例中的企业关系图谱构建方法的功能,该系统或中的每个模块与方法中的每个步骤相对应,已经在方法中进行过说明的,在此不再赘述。
例如,匹配模块获得企业关联关系的过程由如下执行单元执行,包括:构建单元,用于对所述待处理企业构建企业关系网,确定直接关联权重值和间接关联权重值的分量;计算单元,用于分别计算根据所述基础维度数据和所述经营数据匹配的各关联市场主体与该企业的直接关联权重值、间接关联权重值和最终权重值;判断确定单元,用于判断最终权重值所属预设各关联关系对应的各权重阈值范围,确定企业关联关系。
又例如,所述计算单元计算所述待处理企业与其任一关联市场主体的直接关联权重值、间接关联权重值和最终权重值的公式分别为:直接关联权重值=(交易次数+交易金额)*(1-(当前年限-交易年限)/N);间接关联权重值=关联市场主体的直接关联权重值*(N-Z)/N+nN;最终权重值=直接关联权重值*X1+间接关联权重值*X2;其中,N为企业关系图谱统计的年限,Z为采用最短路径法确定的企业及其关联市场主体的关联层级,n为同时任职于该企业及其关联市场主体的高管人数。
本发明构建的企业关系图谱不只是基于简单工商关系的直接关联,而是在工商基础的关联上,通过企业间市场交易行为量化,推理挖掘出企业间更深层次的关系;该企业关系图谱应用于了解企业的整体状况、评判企业的经营状态时,能提供更加丰富且具有多维角度的分析结果,还为衡量企业的发展提供更准确且直观的数据支持。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。
Claims (10)
1.一种企业关系图谱构建方法,其特征在于,包括:
确定待处理企业的基础维度数据,所述基础维度包括企业的注册地址、企业法定代表人、企业董事、企业监事、股东和其他登记高管姓名;
确定待处理企业的经营数据,所述经营数据为企业运营过程中与其发生过工商行为的上、下游市场主体及交易行为,包括企业接受的投资公司名称及对应的交易次数、交易金额和交易时间,与企业发生合同关系的其他市场主体名称及对应的交易次数、交易金额和交易时间;
匹配所述基础维度数据和所述经营数据,根据待处理企业与关联市场主体的关联程度,获得企业关联关系;
存储所述企业关联关系至图数据库,获得企业关系图谱。
2.根据权利要求1所述的企业关系图谱构建方法,其特征在于,所述匹配所述基础维度数据和所述经营数据的过程包括:
获取所有与待处理企业关联的关联市场主体,确定关联市场主体与待处理企业的企业关联类型;
所述企业关联类型包括企业参股关系、企业市场行为关系和企业密切关系;其中,所述企业参股关系为根据所述基础维度数据,基于工商登记信息中的参股信息,匹配获得的企业关联关系;所述企业市场行为关系为根据所述经营数据中市场主体,基于市场公开的企业经营数据,匹配获得的企业关联关系;所述企业密切关系为获取的所述基础维度数据中企业的高管作为市场主体在企业经营行为和交易行为中关联的各个市场主体的关系。
3.根据权利要求1所述的企业关系图谱构建方法,其特征在于,在所述匹配所述基础维度数据和所述经营数据前,还包括数据预处理;
所述数据预处理为对所述基础维度数据和所述经营数据进行清洗和归一化,包括将所述企业的注册地址标准化为省-市-区三级、统一交易金额为以万为单位和统一交易时间的格式为YYYY。
4.根据权利要求2所述的企业关系图谱构建方法,其特征在于,所述获得企业关联关系的具体过程为:
对所述待处理企业构建企业关系网,确定直接关联权重值和间接关联权重值的分量;
分别计算根据所述基础维度数据和所述经营数据匹配的各关联市场主体与该企业的直接关联权重值、间接关联权重值和最终权重值;
判断最终权重值所属预设各关联关系对应的各权重阈值范围,确定企业关联关系。
5.根据权利要求4所述的企业关系图谱构建方法,其特征在于,定义直接关联权重值的分量为X1、间接关联权重值的分量为X2,X1+X2=1,则企业与其任一关联市场主体的直接关联权重值、间接关联权重值和最终权重值的计算公式分别为:
直接关联权重值=Sum((交易次数+交易金额)*(1-(当前年限-交易年限)/N));
间接关联权重值=关联市场主体的直接关联权重值*(N-Z)/N+nN;
最终权重值=直接关联权重值*X1+间接关联权重值*X2;
其中,N为企业关系图谱统计的年限,Z为采用最短路径法确定的企业及其关联市场主体的关联层级,n为同时任职于企业及其关联市场主体的高管人数。
6.根据权利要求1所述的企业关系图谱构建方法,其特征在于,所述方法还包括:
根据所述企业关系图谱,获得企业名称及企业关联关系id;
存储所述企业名称及企业关联关系id至ES索引中,提供一企业名称快速查询窗口;
采用所述企业名称快速查询窗口接收搜索命令,查询搜索命令对应的企业关联关系id,获得对应查询的企业关系图谱。
7.一种企业关系图谱构建系统,其特征在于,包括:
第一确定模块,用于确定待处理企业的基础维度数据,所述基础维度包括企业的注册地址、企业法定代表人、企业董事、企业监事、股东和其他登记高管姓名;
第二确定模块,用于确定待处理企业的经营数据,所述经营数据为企业运营过程中与其发生过工商行为的上、下游市场主体及交易行为,包括企业接受的投资公司名称及对应的交易次数、交易金额和交易时间,与企业发生合同关系的其他市场主体名称及对应的交易次数、交易金额和交易时间;
匹配模块,用于匹配所述基础维度数据和所述经营数据,根据关联市场主体与待处理企业的关联程度,获得企业关联关系;
第一存储模块,用于存储所述企业关联关系至图数据库,获得企业关系图谱。
8.根据权利要求7所述的企业关系图谱构建系统,其特征在于,所述匹配模块获得企业关联关系的过程由如下执行单元执行,包括:
构建单元,用于对所述待处理企业构建企业关系网,确定直接关联权重值和间接关联权重值的分量;
计算单元,用于分别计算根据所述基础维度数据和所述经营数据匹配的各关联市场主体与该企业的直接关联权重值、间接关联权重值和最终权重值;
判断确定单元,用于判断最终权重值所属预设各关联关系对应的各权重阈值范围,确定企业关联关系。
9.根据权利要求8所述的企业关系图谱构建系统,其特征在于,所述计算单元计算所述待处理企业与其任一关联市场主体的直接关联权重值、间接关联权重值和最终权重值的公式分别为:
定义直接关联权重值的分量为X1,所述间接关联权重值的分量为X2,X1+X2=1,则:
直接关联权重值=Sum((交易次数+交易金额)*(1-(当前年限-交易年限)/N));
间接关联权重值=关联市场主体的直接关联权重值*(N-Z)/N+nN;
最终权重值=直接关联权重值*X1+间接关联权重值*X2;
其中,N为企业关系图谱统计的年限,Z为采用最短路径法确定的企业及其关联市场主体的关联层级,n为同时任职于该企业及其关联市场主体的高管人数。
10.一种企业关系图谱构建装置,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至6任一所述的企业关系图谱构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210873341.4A CN115292556A (zh) | 2022-07-22 | 2022-07-22 | 一种企业关系图谱构建方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210873341.4A CN115292556A (zh) | 2022-07-22 | 2022-07-22 | 一种企业关系图谱构建方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115292556A true CN115292556A (zh) | 2022-11-04 |
Family
ID=83824413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210873341.4A Pending CN115292556A (zh) | 2022-07-22 | 2022-07-22 | 一种企业关系图谱构建方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115292556A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115858712A (zh) * | 2023-02-01 | 2023-03-28 | 广州探迹科技有限公司 | 基于改进nlp算法的地址信息映射方法、系统以及介质 |
CN116028867A (zh) * | 2023-01-16 | 2023-04-28 | 中海石油(中国)有限公司 | 一种勘探开发主数据关系表示方法、设备及存储介质 |
-
2022
- 2022-07-22 CN CN202210873341.4A patent/CN115292556A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116028867A (zh) * | 2023-01-16 | 2023-04-28 | 中海石油(中国)有限公司 | 一种勘探开发主数据关系表示方法、设备及存储介质 |
CN116028867B (zh) * | 2023-01-16 | 2023-12-26 | 中海石油(中国)有限公司 | 一种勘探开发主数据关系表示方法、设备及存储介质 |
CN115858712A (zh) * | 2023-02-01 | 2023-03-28 | 广州探迹科技有限公司 | 基于改进nlp算法的地址信息映射方法、系统以及介质 |
CN115858712B (zh) * | 2023-02-01 | 2023-05-30 | 广州探迹科技有限公司 | 基于改进nlp算法的地址信息映射方法、系统以及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115292556A (zh) | 一种企业关系图谱构建方法及系统 | |
US8386295B2 (en) | Checking the correctness of GIS data | |
Chavez-Demoulin et al. | Quantitative models for operational risk: extremes, dependence and aggregation | |
CN107993143A (zh) | 一种信贷风险评估方法及系统 | |
CN107133289B (zh) | 一种确定商圈的方法和装置 | |
Clements et al. | Modelling methodology and forecast failure | |
Daouia et al. | Measuring firm performance using nonparametric quantile-type distances | |
WO2003096237A2 (en) | Electronic data processing system and method of using an electronic data processing system for automatically determining a risk indicator value | |
US7711709B2 (en) | Efficient storing and querying of snapshot measures | |
US11170050B1 (en) | Method and device for graph data quality verification | |
CN112148760B (zh) | 大数据的筛选方法及装置 | |
Ballou et al. | Sample-based quality estimation of query results in relational database environments | |
Alrabei et al. | The Moderating Effect of Information Technology on the Relationship between Audit Quality and the Quality of Accounting Information.“Jordanian Auditors’ Perception | |
CN117455709B (zh) | 供水管网的漏损监测方法、装置、电子设备以及存储介质 | |
CN110825817A (zh) | 一种企业疑似关联关系判定方法及系统 | |
Yasir et al. | The role of financial flexibility in facing the financial failure caused by the corona pandemic: an analytical study of a sample of companies listed on the iraqi stock exchange | |
CN114387085A (zh) | 流水数据处理方法、装置、计算机设备和存储介质 | |
CN113792961A (zh) | 基于审计大数据的任中经济责任审计决策方法及设备 | |
CN109086309B (zh) | 一种指标维度关系定义方法、服务器及存储介质 | |
Arneson | Construction Capacity: How Regional Construction Supply Chains Respond to Disruptions | |
CN107730304A (zh) | 一种基于优选参考样本集合的房地产估价方法和系统 | |
TW201913542A (zh) | 房價地理資訊評估系統 | |
US11861748B1 (en) | Valuation of homes using geographic regions of varying granularity | |
TWI550531B (zh) | 企業資源規劃績效評估系統及方法 | |
Wahyudi et al. | The Influence Of Company Size, Company Activities, Profitability And Leverage On Sustainability Report Disclosures With Managerial Ownership As A Moderation Variable |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |