CN117217634B - 一种基于复杂网络的企业合作社区发现方法 - Google Patents
一种基于复杂网络的企业合作社区发现方法 Download PDFInfo
- Publication number
- CN117217634B CN117217634B CN202311464747.8A CN202311464747A CN117217634B CN 117217634 B CN117217634 B CN 117217634B CN 202311464747 A CN202311464747 A CN 202311464747A CN 117217634 B CN117217634 B CN 117217634B
- Authority
- CN
- China
- Prior art keywords
- enterprise
- cooperation
- community
- enterprises
- influence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000011160 research Methods 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 238000011835 investigation Methods 0.000 claims abstract description 13
- 238000010276 construction Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 4
- 238000012827 research and development Methods 0.000 claims description 3
- 238000013077 scoring method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 2
- 238000012216 screening Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理技术领域,具体是一种基于复杂网络的企业合作社区发现方法,包括以下步骤:获取企业合作原始数据;抽取企业合作原始数据中的企业实体和企业合作关系,根据企业合作关系构建企业合作复杂网络;利用企业合作复杂网络中的网络特征指标、科研成果指标、经营性指标和征信指标构建企业影响力模型,并通过企业影响力模型计算企业的影响力;基于企业合作复杂网络和企业影响力模型构建企业合作社区图谱;本发明通过构建覆盖多个方面的企业影响力模型,提高企业影响力的计算精度,进而提高发现企业合作关系的准确性。
Description
技术领域
本发明涉及数据处理技术领域,具体是一种基于复杂网络的企业合作社区发现方法。
背景技术
企业合作社区是指由合作关系紧密的企业组成的小群体,通过企业之间各种合作关系而构建的企业合作复杂网络。在企业合作社区的构建过程中通常会根据科研人员进行构建,基于科研人员合作关系网络及科研人员的影响力,生成科研人员合作社区。在专利CN111428056A中公开了一种科研人员合作社区的构建方法及装置,用以解决现有社区发现方法用于技术领域合作社区的构建中计算量大、生成的社区图谱可读性差以及图谱中合作社区的信息存在偏差影响用户体验的问题。
在上述现有技术的使用过程中存在以下问题:
1、在合作关系发现时,只考虑了结构化数据,没有考虑非结构化数据,导致很多合作关系的数据丢失,社区构建也就不全,最后对应的产业链也就会出现缺少和断层。
2、网络节点的影响力评分模型中只考虑了科研成果数据,没有考虑到各网络节点在复杂网络中的特征信息,导致影响力评分计算不够客观,从而使在数据筛选阶段会过滤掉一些虽然影响力评分低,但是在网络中起到重要作用的高影响力网络节点。
3、通过影响力对网络节点进行筛选,只留下了影响力高的网络节点,而将影响力低的网络节点去除;这样的网络节点筛选方式并不能展示网络的全貌,会因为某些节点的缺失,导致一些合作链路中断,从而使企业合作社区不能被挖掘出来。
4、在可视化方面只通过灰度展示了一个社区,并不能直观的区分不同的合作社区,且没有展示合作社区中网络节点以及边的相关特征信息。
由此可见,上述现有技术在社区发现方面还有很大的进步空间。
发明内容
为了避免和克服现有技术中存在的技术问题,本发明提供了一种基于复杂网络的企业合作社区发现方法。本发明通过构建覆盖多个方面的企业影响力模型,提高企业影响力的计算精度,进而提高发现企业合作关系的准确性。
为实现上述目的,本发明提供如下技术方案:
一种基于复杂网络的企业合作社区发现方法,包括以下操作步骤:
S1、获取企业合作原始数据;
S2、抽取企业合作原始数据中的企业实体和企业合作关系,根据企业合作关系构建企业合作复杂网络;
S3、利用企业合作复杂网络中的网络特征指标、科研成果指标、经营性指标和征信指标构建企业影响力模型,并通过企业影响力模型计算企业的影响力;
S4、基于企业合作复杂网络和企业影响力模型构建企业合作社区图谱。
作为本发明再进一步的方案:企业影响力模型的计算表达式如下:
其中,P n 表示第n个企业的综合影响力;
A n 表示第n个企业的总经营影响力;θ n 表示A n 的权重;I表示A n 分量的总数,即第n个企业的经营指标的总数;a ni 表示A n 的第i个分量,即第n个企业的经营指标中第i种指标的值;w ni 表示a ni 的权重;
B n 表示第n个企业的总科研成果影响力;β n 表示B n 的权重;J表示B n 分量的总数,即第n个企业的科研成果指标的总数;b nj 表示B n 的第j个分量,即第n个企业的科研成果指标中第j种指标的值;u nj 表示b nj 的权重;
C n 表示第n个企业的在企业合作复杂网络中的总网络影响力;γ n 表示C n 的权重;K表示C n 分量的总数,即第n个企业的网络特征指标的总数;c nk 表示C n 的第k个分量,即第n个企业的网络特征指标中第k种指标的值;v nk 表示c nk 的权重;
D n 表示第n个企业的总征信影响力;δ n 表示D n 的权重;L表示D n 分量的总数,即第n个企业的征信指标的总数;d nl 表示D n 的第l个分量,即第n个企业的征信特征指标中第l种指标的值;m nl 表示d nl 的权重。
作为本发明再进一步的方案:企业合作原始数据的获取步骤如下:
S11、首先获取有关目标合作企业的网页新闻、合同公告、招投标数据、合作项目以及科研成果,科研成果包括专利、论文、著作和标准;
S12、将网页新闻和合同公告中的非结构化文本数据输入BERT模型中,从中获取各个企业之间对应的合作关系;进行各个企业之间合作次数的统计,将统计的结果作为企业合作原始数据存入数据库中;
S13、分析招投标数据中的招标企业和中标企业,从而获取各个企业对应的合作关系;进行各个企业之间合作次数的统计,将统计的结果作为企业合作原始数据存入数据库中;
S14、通过分析专利、论文、著作和标准的发表企业,以及合作项目中的共同研发企业,从中获取各个企业之间的合作关系;进行各个企业之间合作次数的统计,将统计的结果作为企业合作原始数据存入数据库中。
作为本发明再进一步的方案:步骤S2的具体步骤如下:
S21、从企业合作原始数据中获取各个企业实体,以及各个企业实体之间对应的企业合作关系;
S22、以企业实体为节点,企业实体之间的合作关系为连线,构建表征企业合作关系的企业合作复杂网络。
作为本发明再进一步的方案:步骤S3的具体步骤如下:
S31、获取企业的网络特征指标,网络特征指标包括度中心性、接近中心性和中介中心性;
S32、获取企业的科研成果指标,科研成果指标包括论文、专利、标准和著作的数量,以及论文、专利、标准和著作的被引用量;
S33、获取企业的经营性指标,经营性指标包括企业规模和企业年利润;
S34、获取企业的征信指标,征信指标包括信用认证、企业信用记录、商业履约、费用解缴和招投标信用记录;
S35、通过专家打分法、层次分析法和博弈-DEA法确定各种指标的值,并将值输入到企业影响力模型的计算公式中,通过梯度迭代更新各个权重的值,进而完成企业影响力模型的训练;
S36、最后将需要计算影响力的企业对应的数据输入到训练完成的企业影响力模型中,计算该企业的影响力。
作为本发明再进一步的方案:步骤S4的具体步骤如下:
S41、使用企业影响力模型计算各个企业的影响力;
S42、统计各个企业之间的合作次数,并以合作次数表征合作强度;
S43、在企业合作复杂网络的基础之上,结合各个企业的影响力,采用社区发现算法构建企业合作社区图谱;以企业复杂网络中的随机网络节点为起始点,不断迭代遍历企业复杂网络中的网络节点,并计算企业合作社区划分的模块度,直到企业合作社区划分的模块度不再变大,此时一个社区划分完成;重复进行,直到企业复杂网络中所有的网络节点都被划分到对应的企业合作社区中,此时,企业合作社区图谱构建完成;
企业合作社区图谱中的节点表示企业,节点间的边表示企业之间存在合作;使用企业影响力表征节点的大小,使用企业之间的合作强度表征连线的粗细。
作为本发明再进一步的方案:度中心性的计算公式如下:
DC n 表示企业合作社区图谱中第n个节点的度中心性,M n 表示企业合作社区图谱中与第n个节点相连的边的数量;N表示企业合作社区图谱中与第n个节点相连的节点的数量;
接近中心性的计算公式如下:
其中,CC n 表示企业合作社区图谱中第n个节点的接近中心性,t nf 表示企业合作社区图谱中第n个节点和第f个节点之间的距离;
中介中心性的计算公式如下:
其中,BC n 表示企业合作社区图谱中第n个节点的中介中心性,g sz 表示企业合作社区图谱中连接第s个节点和第z个节点的最短路径的数量;表示g sz 中经过第n个节点的最短路径的数量。
作为本发明再进一步的方案:所述社区发现算法采用louvain算法,louvain算法评估企业合作社区划分的标准模块的计算公式如下:
其中,Q表示企业合作社区划分的模块度;e表示企业合作社区图谱中总边数;Tn,j表示企业合作社区图谱中第n个节点和第j个节点之间边的权重;rn,j表示企业合作社区图谱中第n个节点和第j个节点之间边的数量;Pn,norm表示第n个企业影响力的归一化值;Pj,norm表示第j个企业影响力的归一化值;xn表示企业合作社区图谱中第n个节点度中心性、接近中心性和中介中心性求和之后的平均值;xj表示企业合作社区图谱中第j个节点度中心性、接近中心性和中介中心性求和之后的平均值;yn表示企业合作社区图谱中第n个节点所属的企业合作社区;yj表示企业合作社区图谱中第j个节点所属的企业合作社区;η(yn,yj)表示yn和yj是否属于同一企业合作社区;当两则属于同一企业合作社区时,η(yn,yj)取值为1,反之为0。
作为本发明再进一步的方案:在企业社区合作图谱构建完成后,通过Bert模型为合作社区标注产业主题标签。
与现有技术相比,本发明的有益效果是:
1、本发明使用Bert模型从非结构化数据中发现企业合作关系,增加了企业合作网络的数据维度,使企业合作复杂网络更加全面。
2、本发明首次在影响力模型中加入了网络特征指标,使企业影响力评价模型更加客观,同时使用大量的网络节点用于社区发现,并将企业影响力引入到社区发现算法中,使企业合作社区的发现结果更加可信。
3、本发明使用预训练大模型为社区添加产业链主题标签,增加了企业合作社区图谱的可读性,同时对企业合作社区进行分类,为产业链治理提供支持。
附图说明
图1为本发明的主要操作步骤流程图。
图2为本发明中企业复杂网络图。
图3为本发明中指标构成示意图。
图4为本发明实施例中的企业合作社区图谱。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,一种基于复杂网络的企业合作社区发现方法,包括以下操作步骤:
S1、获取企业合作原始数据。
企业合作原始数据的获取步骤如下:
S11、首先获取有关目标合作企业的网页新闻、合同公告、招投标数据、合作项目以及科研成果,科研成果包括专利、论文、著作和标准。
S12、将网页新闻和合同公告中的非结构化文本数据输入BERT模型中,从而获取各个企业之间对应的合作关系;进行各个企业之间合作次数的统计,将统计的结果作为企业合作原始数据存入数据库中。
S13、分析招投标数据中的招标企业和中标企业,从而获取各个企业对应合作关系;进行各个企业之间合作次数的统计,将统计的结果作为企业合作原始数据存入数据库中。
S14、通过分析专利、论文、著作和标准的发表企业,以及合作项目中的共同研发企业,从而获取各个企业之间的合作关系;进行各个企业之间合作次数的统计,将统计的结果作为企业合作原始数据存入数据库中。
S2、抽取企业合作原始数据中的企业实体和企业合作关系,根据企业合作关系构建企业合作复杂网络。
步骤S2的具体步骤如下:
S21、从企业合作原始数据中获取各个企业实体,以及各个企业实体之间对应的企业合作关系。
S22、以企业实体为节点,企业实体之间的合作关系为连线,构建表征企业合作关系的企业合作复杂网络,如图2所示。
S3、利用企业合作复杂网络中的网络特征指标、科研成果指标、经营性指标和征信指标构建企业影响力模型,并通过企业影响力模型计算企业的影响力。各种指标如图3所示。
步骤S3的具体步骤如下:
S31、获取企业的网络特征指标,网络特征指标包括度中心性、接近中心性和中介中心性。
S32、获取企业的科研成果指标,科研成果指标包括论文、专利、标准和著作的数量,以及论文、专利、标准和著作的被引用量。
S33、获取企业的经营性指标,经营性指标包括企业规模和企业年利润;
S34、获取企业的征信指标,征信指标包括信用认证、企业信用记录、商业履约、费用解缴和招投标信用记录。
S35、通过专家打分法、层次分析法和博弈-DEA法确定各种指标的值,并将值输入到企业影响力模型的计算公式中,通过梯度迭代更新各个权重的值,进而完成企业影响力模型的训练。
S36、最后将需要计算影响力的企业对应的数据输入到训练完成的企业影响力模型中,计算该企业的影响力。
S4、基于企业合作复杂网络和企业影响力模型构建企业合作社区图谱。
步骤S4的具体步骤如下:
S41、使用企业影响力模型计算各个企业的影响力。
S42、统计各个企业之间的合作次数,并以合作次数表征合作强度。
S43、在企业合作复杂网络的基础之上,结合各个企业的影响力,采用社区发现算法构建企业合作社区图谱;以企业复杂网络中的随机网络节点为起始点,不断迭代遍历企业复杂网络中的网络节点,并计算企业合作社区划分的模块度,直到企业合作社区划分的模块度不再变大,此时一个社区划分完成;重复进行,直到企业复杂网络所有的网络节点都被划分到对应的企业合作社区中;此时,企业合作社区图谱构建完成;企业合作社区图谱中的节点表示企业,节点间的边表示企业之间存在合作;使用企业影响力表征节点的大小,使用企业之间的合作强度表征连线的粗细。在企业社区合作图谱构建完成后,通过Bert模型为合作社区标注产业主题标签。使用了Bert模型从非结构化数据中抽取企业实体和合作关系,提高了企业间合作关系发现的覆盖面,使产业链更加完善。
企业影响力模型的计算表达式如下:
其中,P n 表示第n个企业的综合影响力。
A n 表示第n个企业的总经营影响力;θ n 表示A n 的权重;I表示A n 分量的总数,即第n个企业的经营指标的总数;a ni 表示A n 的第i个分量,即第n个企业的经营指标中第i种指标的值;w ni 表示a ni 的权重。
B n 表示第n个企业的总科研成果影响力;β n 表示B n 的权重;J表示B n 分量的总数,即第n个企业的科研成果指标的总数;b nj 表示B n 的第j个分量,即第n个企业的科研成果指标中第j种指标的值;u nj 表示b nj 的权重。
C n 表示第n个企业的在企业合作复杂网络中的总网络影响力;γ n 表示C n 的权重;K表示C n 分量的总数,即第n个企业的网络特征指标的总数;c nk 表示C n 的第k个分量,即第n个企业的网络特征指标中第k种指标的值;v nk 表示c nk 的权重。
D n 表示第n个企业的总征信影响力;δ n 表示D n 的权重;L表示D n 分量的总数,即第n个企业的征信指标的总数;d nl 表示D n 的第l个分量,即第n个企业的征信特征指标中第l种指标的值;m nl 表示d nl 的权重。
度中心性的计算公式如下:
DC n 表示企业合作社区图谱中第n个节点的度中心性,M n 表示企业合作社区图谱中与第n个节点相连的边的数量;N表示企业合作社区图谱中与第n个节点相连的节点的数量。
接近中心性的计算公式如下:
其中,CC n 表示企业合作社区图谱中第n个节点的接近中心性,t nf 表示企业合作社区图谱中第n个节点和第f个节点之间的距离。
中介中心性的计算公式如下:
其中,BC n 表示企业合作社区图谱中第n个节点的中介中心性,g sz 表示企业合作社区图谱中连接第s个节点和第z个节点的最短路径的数量;表示g sz 中经过第n个节点的最短路径的数量。
所述社区发现算法采用louvain算法,louvain算法评估企业合作社区划分的标准模块的计算公式如下:
其中,Q表示企业合作社区划分的模块度;e表示企业合作社区图谱中总边数;Tn,j表示企业合作社区图谱中第n个节点和第j个节点之间边的权重;rn,j表示企业合作社区图谱中第n个节点和第j个节点之间边的数量;Pn,norm表示第n个企业影响力的归一化值;Pj,norm表示第j个企业影响力的归一化值;xn表示企业合作社区图谱中第n个节点度中心性、接近中心性和中介中心性求和之后的平均值;xj表示企业合作社区图谱中第j个节点度中心性、接近中心性和中介中心性求和之后的平均值;yn表示企业合作社区图谱中第n个节点所属的企业合作社区;yj表示企业合作社区图谱中第j个节点所属的企业合作社区;η(yn,yj)表示yn和yj是否属于同一企业合作社区;当两则属于同一企业合作社区时,η(yn,yj)取值为1,反之为0。
对离子注入机领域进行研究,共检索到10家企业,对其中四家企业的数据进行分析。首先通过NLP技术从检索到的10家企业所有的数据中抽取合作关系,发现企业一与企业二、企业三以及企业四均有合作,但是企业二、企业三和企业四之间没有合作关系。因此,这四家企业就构成了以企业一为中心节点的企业合作复杂网络。
根据相关指标的计算方法得到这四家企业的指标值如表1所示。
表1 企业各项指标值
通过求解的各个指标的权重,进而计算各个企业的影响力。此处设定各个企业的各个指标的权重值均采用同一套计算值,其计算结果如表2所示,其中超大型取值为1,中型取值为0.6,小型取值为0.3,未公示取值为0。
表2 企业影响力计算结果
按照上述方式计算剩余6家企业之间的合作关系和对应的企业影响力,并构建如图4所示的企业合作社区图谱。其中节点的大小代表企业影响力强弱,边的粗细代表合作的强度,不同形状的节点代表不同的社区。图4清晰的显示了这10家企业之间的合作关系,其中,企业一、企业二、企业三和企业四构成第一个企业合作复杂网络;企业五、企业六、企业八、企业九和企业十构成第二个企业合作复杂网络;企业七没有合作的企业,近似的可以看成第三个企业合作复杂网络。这三个企业合作复杂网络构成了离子注入机领域中完整的企业合作社区图谱。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种基于复杂网络的企业合作社区发现方法,其特征在于,包括以下操作步骤:
S1、获取企业合作原始数据;
S2、抽取企业合作原始数据中的企业实体和企业合作关系,根据企业合作关系构建企业合作复杂网络;
S3、利用企业合作复杂网络中的网络特征指标、科研成果指标、经营性指标和征信指标构建企业影响力模型,并通过企业影响力模型计算企业的影响力;
S4、基于企业合作复杂网络和企业影响力模型构建企业合作社区图谱;
企业影响力模型的计算表达式如下:
其中,P n 表示第n个企业的综合影响力;A n 表示第n个企业的总经营影响力;θ n 表示A n 的权重;I表示A n 分量的总数,即第n个企业的经营指标的总数;a ni 表示A n 的第i个分量,即第n个企业的经营指标中第i种指标的值;w ni 表示a ni 的权重;
B n 表示第n个企业的总科研成果影响力;β n 表示B n 的权重;J表示B n 分量的总数,即第n个企业的科研成果指标的总数;b nj 表示B n 的第j个分量,即第n个企业的科研成果指标中第j种指标的值;u nj 表示b nj 的权重;
C n 表示第n个企业的在企业合作复杂网络中的总网络影响力;γ n 表示C n 的权重;K表示C n 分量的总数,即第n个企业的网络特征指标的总数;c nk 表示C n 的第k个分量,即第n个企业的网络特征指标中第k种指标的值;v nk 表示c nk 的权重;
D n 表示第n个企业的总征信影响力;δ n 表示D n 的权重;L表示D n 分量的总数,即第n个企业的征信指标的总数;d nl 表示D n 的第l个分量,即第n个企业的征信特征指标中第l种指标的值;m nl 表示d nl 的权重。
2.根据权利要求1所述的一种基于复杂网络的企业合作社区发现方法,其特征在于,企业合作原始数据的获取步骤如下:
S11、首先获取有关目标合作企业的网页新闻、合同公告、招投标数据、合作项目以及科研成果,科研成果包括专利、论文、著作和标准;
S12、将网页新闻和合同公告中的非结构化文本数据输入BERT模型中,从中获取各个企业之间对应的合作关系;进行各个企业之间合作次数的统计,将统计的结果作为企业合作原始数据存入数据库中;
S13、分析招投标数据中的招标企业和中标企业,从而获取各个企业对应的合作关系;进行各个企业之间合作次数的统计,将统计的结果作为企业合作原始数据存入数据库中;
S14、通过分析专利、论文、著作和标准的发表企业,以及合作项目中的共同研发企业,从中获取各个企业之间的合作关系;进行各个企业之间合作次数的统计,将统计的结果作为企业合作原始数据存入数据库中。
3.根据权利要求2所述的一种基于复杂网络的企业合作社区发现方法,其特征在于,步骤S2的具体步骤如下:
S21、从企业合作原始数据中获取各个企业实体,以及各个企业实体之间对应的企业合作关系;
S22、以企业实体为节点,企业实体之间的合作关系为连线,构建表征企业合作关系的企业合作复杂网络。
4.根据权利要求3所述的一种基于复杂网络的企业合作社区发现方法,其特征在于,步骤S3的具体步骤如下:
S31、获取企业的网络特征指标,网络特征指标包括度中心性、接近中心性和中介中心性;
S32、获取企业的科研成果指标,科研成果指标包括论文、专利、标准和著作的数量,以及论文、专利、标准和著作的被引用量;
S33、获取企业的经营性指标,经营性指标包括企业规模和企业年利润;
S34、获取企业的征信指标,征信指标包括信用认证、企业信用记录、商业履约、费用解缴和招投标信用记录;
S35、通过专家打分法、层次分析法和博弈-DEA法确定各种指标的值,并将值输入到企业影响力模型的计算公式中,通过梯度迭代更新各个权重的值,进而完成企业影响力模型的训练;
S36、最后将需要计算影响力的企业对应的数据输入到训练完成的企业影响力模型中,计算该企业的影响力。
5.根据权利要求4所述的一种基于复杂网络的企业合作社区发现方法,其特征在于,步骤S4的具体步骤如下:
S41、使用企业影响力模型计算各个企业的影响力;
S42、统计各个企业之间的合作次数,并以合作次数表征合作强度;
S43、在企业合作复杂网络的基础之上,结合各个企业的影响力,采用社区发现算法构建企业合作社区图谱;以企业复杂网络中的随机网络节点为起始点,不断迭代遍历企业复杂网络中的网络节点,并计算企业合作社区划分的模块度,直到企业合作社区划分的模块度不再变大,此时一个社区划分完成;重复进行,直到企业复杂网络中所有的网络节点都被划分到对应的企业合作社区中,此时,企业合作社区图谱构建完成;
企业合作社区图谱中的节点表示企业,节点间的边表示企业之间存在合作;使用企业影响力表征节点的大小,使用企业之间的合作强度表征连线的粗细。
6.根据权利要求5所述的一种基于复杂网络的企业合作社区发现方法,其特征在于,度中心性的计算公式如下:
其中,DC n 表示企业合作社区图谱中第n个节点的度中心性,M n 表示企业合作社区图谱中与第n个节点相连的边的数量;N表示企业合作社区图谱中与第n个节点相连的节点的数量;
接近中心性的计算公式如下:
其中,CC n 表示企业合作社区图谱中第n个节点的接近中心性,t nf 表示企业合作社区图谱中第n个节点和第f个节点之间的距离;
中介中心性的计算公式如下:
其中,BC n 表示企业合作社区图谱中第n个节点的中介中心性,g sz 表示企业合作社区图谱中连接第s个节点和第z个节点的最短路径的数量;/>表示g sz 中经过第n个节点的最短路径的数量。
7.根据权利要求6所述的一种基于复杂网络的企业合作社区发现方法,其特征在于,所述社区发现算法采用louvain算法,louvain算法评估企业合作社区划分的标准模块的计算公式如下:
其中,Q表示企业合作社区划分的模块度;e表示企业合作社区图谱中总边数;Tnj表示企业合作社区图谱中第n个节点和第j个节点之间边的权重;rnj表示企业合作社区图谱中第n个节点和第j个节点之间边的数量;Pn,norm表示第n个企业影响力的归一化值;Pj,norm表示第j个企业影响力的归一化值;xn表示企业合作社区图谱中第n个节点度中心性、接近中心性和中介中心性求和之后的平均值;xj表示企业合作社区图谱中第j个节点度中心性、接近中心性和中介中心性求和之后的平均值;yn表示企业合作社区图谱中第n个节点所属的企业合作社区;yj表示企业合作社区图谱中第j个节点所属的企业合作社区;η(yn,yj)表示yn和yj是否属于同一企业合作社区,当两者属于同一企业合作社区时,η(yn,yj)取值为1,反之为0。
8.根据权利要求7所述的一种基于复杂网络的企业合作社区发现方法,其特征在于,在企业社区合作图谱构建完成后,通过Bert模型为合作社区标注产业主题标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311464747.8A CN117217634B (zh) | 2023-11-07 | 2023-11-07 | 一种基于复杂网络的企业合作社区发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311464747.8A CN117217634B (zh) | 2023-11-07 | 2023-11-07 | 一种基于复杂网络的企业合作社区发现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117217634A CN117217634A (zh) | 2023-12-12 |
CN117217634B true CN117217634B (zh) | 2024-02-02 |
Family
ID=89041209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311464747.8A Active CN117217634B (zh) | 2023-11-07 | 2023-11-07 | 一种基于复杂网络的企业合作社区发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117217634B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117591676B (zh) * | 2024-01-19 | 2024-04-05 | 数据空间研究院 | 一种Coarse-to-fine的产业链链上企业识别方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109087019A (zh) * | 2018-08-18 | 2018-12-25 | 北京企信云信息科技有限公司 | 一种中小企业征信方法及装置 |
CN111428056A (zh) * | 2020-04-26 | 2020-07-17 | 中国烟草总公司郑州烟草研究院 | 一种科研人员合作社区的构建方法及装置 |
CN111428152A (zh) * | 2020-04-26 | 2020-07-17 | 中国烟草总公司郑州烟草研究院 | 一种科研人员相似社区的构建方法及装置 |
CN112446776A (zh) * | 2019-08-27 | 2021-03-05 | 北京宸信征信有限公司 | 基于多源对接融合数据的中小企业信用评价系统及方法 |
CN109255054B (zh) * | 2017-07-14 | 2021-12-10 | 元素征信有限责任公司 | 一种基于关系权重的企业图谱中的社区发现方法 |
CN113987210A (zh) * | 2021-11-09 | 2022-01-28 | 江苏科技大学 | 一种船舶产业知识图谱构建与分析方法 |
CN116307724A (zh) * | 2023-03-22 | 2023-06-23 | 江苏风云科技服务有限公司 | 一种基于复杂网络的产业链风险传播方法和系统 |
CN116562992A (zh) * | 2023-07-11 | 2023-08-08 | 数据空间研究院 | 一种建模用户新兴趣不确定性的物品推荐方法、装置及介质 |
CN116664012A (zh) * | 2023-07-19 | 2023-08-29 | 深圳市爱为物联科技有限公司 | 一种基于大数据分析的企业信用评估方法及系统 |
CN116741397A (zh) * | 2023-08-15 | 2023-09-12 | 数据空间研究院 | 基于多组学数据融合的癌症分型方法、系统及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2011201127A1 (en) * | 2011-03-14 | 2012-10-04 | Moxy Studios Pty Ltd | Collaborative Knowledge Management |
US20200160442A1 (en) * | 2018-11-16 | 2020-05-21 | Vishvesh Pathak | Corporate credit ratings based on the overall organisational performance |
-
2023
- 2023-11-07 CN CN202311464747.8A patent/CN117217634B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255054B (zh) * | 2017-07-14 | 2021-12-10 | 元素征信有限责任公司 | 一种基于关系权重的企业图谱中的社区发现方法 |
CN109087019A (zh) * | 2018-08-18 | 2018-12-25 | 北京企信云信息科技有限公司 | 一种中小企业征信方法及装置 |
CN112446776A (zh) * | 2019-08-27 | 2021-03-05 | 北京宸信征信有限公司 | 基于多源对接融合数据的中小企业信用评价系统及方法 |
CN111428056A (zh) * | 2020-04-26 | 2020-07-17 | 中国烟草总公司郑州烟草研究院 | 一种科研人员合作社区的构建方法及装置 |
CN111428152A (zh) * | 2020-04-26 | 2020-07-17 | 中国烟草总公司郑州烟草研究院 | 一种科研人员相似社区的构建方法及装置 |
CN113987210A (zh) * | 2021-11-09 | 2022-01-28 | 江苏科技大学 | 一种船舶产业知识图谱构建与分析方法 |
CN116307724A (zh) * | 2023-03-22 | 2023-06-23 | 江苏风云科技服务有限公司 | 一种基于复杂网络的产业链风险传播方法和系统 |
CN116562992A (zh) * | 2023-07-11 | 2023-08-08 | 数据空间研究院 | 一种建模用户新兴趣不确定性的物品推荐方法、装置及介质 |
CN116664012A (zh) * | 2023-07-19 | 2023-08-29 | 深圳市爱为物联科技有限公司 | 一种基于大数据分析的企业信用评估方法及系统 |
CN116741397A (zh) * | 2023-08-15 | 2023-09-12 | 数据空间研究院 | 基于多组学数据融合的癌症分型方法、系统及存储介质 |
Non-Patent Citations (1)
Title |
---|
社交网络用户影响力的发展动态及知识图谱研究;邹文武;;情报科学(09);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117217634A (zh) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111612549B (zh) | 一种平台运营服务系统的构建方法 | |
Samoilenko et al. | Using Data Envelopment Analysis (DEA) for monitoring efficiency-based performance of productivity-driven organizations: Design and implementation of a decision support system | |
CN117217634B (zh) | 一种基于复杂网络的企业合作社区发现方法 | |
Amin et al. | Implementation of decision tree using C4. 5 algorithm in decision making of loan application by debtor (Case study: Bank pasar of Yogyakarta Special Region) | |
Arqawi et al. | Predicting Employee Attrition and Performance Using Deep Learning | |
CN109711424B (zh) | 一种基于决策树的行为规则获取方法、装置及设备 | |
CN112561598A (zh) | 基于客户画像的客户流失预测及挽回方法和系统 | |
CN112700319A (zh) | 基于政务数据的企业授信额度确定方法及装置 | |
CN108846691A (zh) | 区域性粮油市场价格监测分析预测系统及监测方法 | |
CN110942242A (zh) | 一种科技企业孵化器运营绩效评价方法 | |
CN112419030B (zh) | 财务舞弊风险评估的方法、系统及设备 | |
Yılmaz et al. | Assessment of sustainability performances of banks by TOPSIS method and balanced scorecard approach | |
CN116307841A (zh) | 一种集成多指标的高校评价系统的构建方法 | |
CN115456745A (zh) | 小微企业画像构建方法及装置 | |
Balcı et al. | Hierarchies in communities of UK stock market from the perspective of Brexit | |
CN114154866A (zh) | 一种上市企业财务风险预警方法和系统 | |
CN103559585A (zh) | 图书馆综合绩效评价的实现方法及系统 | |
CN107844874A (zh) | 企业营运问题分析系统及其方法 | |
CN115796585A (zh) | 一种企业经营风险评估方法及系统 | |
CN114493172A (zh) | 一种应急产能调配预案推演方法及系统 | |
Larrosa | Thematic Networks in the Argentine Economics Main Annual Meeting | |
CN108052560A (zh) | 一种基于高校数据的数据分析处理方法及就业趋势数据的数据分析处理方法 | |
CN117291603B (zh) | 一种大数据比对应收账款确权的风险评估系统 | |
CN112580992B (zh) | 类金融企业的非法集资风险监测系统 | |
CN113837886B (zh) | 一种基于知识图谱的车险理赔欺诈风险识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |