CN117236698A - 基于图神经网络的产业链风险评估模型、方法及介质 - Google Patents
基于图神经网络的产业链风险评估模型、方法及介质 Download PDFInfo
- Publication number
- CN117236698A CN117236698A CN202311350736.7A CN202311350736A CN117236698A CN 117236698 A CN117236698 A CN 117236698A CN 202311350736 A CN202311350736 A CN 202311350736A CN 117236698 A CN117236698 A CN 117236698A
- Authority
- CN
- China
- Prior art keywords
- company
- node
- risk
- nodes
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012502 risk assessment Methods 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 37
- 230000007246 mechanism Effects 0.000 claims abstract description 47
- 238000005070 sampling Methods 0.000 claims abstract description 43
- 238000010276 construction Methods 0.000 claims abstract description 13
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 72
- 238000010586 diagram Methods 0.000 claims description 68
- 230000002776 aggregation Effects 0.000 claims description 35
- 238000004220 aggregation Methods 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 20
- 238000004519 manufacturing process Methods 0.000 claims description 18
- 239000013604 expression vector Substances 0.000 claims description 13
- 238000011002 quantification Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 239000013070 direct material Substances 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012854 evaluation process Methods 0.000 claims description 2
- 238000012546 transfer Methods 0.000 abstract description 3
- 230000009466 transformation Effects 0.000 abstract description 3
- 238000002474 experimental method Methods 0.000 description 19
- 238000011156 evaluation Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000002679 ablation Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- WLKSPGHQGFFKGE-UHFFFAOYSA-N 1-chloropropan-2-yl n-(3-chlorophenyl)carbamate Chemical compound ClCC(C)OC(=O)NC1=CC=CC(Cl)=C1 WLKSPGHQGFFKGE-UHFFFAOYSA-N 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于图神经网络的产业链风险评估模型和方法,包括异质图构建模块、公司图生成模块、节点风险评估模块和产业链风险评估模块,其中异质图构建模块用于构建产业链异质图,将产业链风险评估转化为图及图中节点的风险评估问题,实现了对风险传递关系的刻画;公司图生成模块基于上下游供应、竞争和公司投融资关系,对公司节点之间的多种关系进行高效学习,构建了基于多种关联关系的产业链公司节点关联组图,节点风险评估模块基于邻域采样和注意力机制实现了节点级的风险评估,产业链风险评估模块依据节点风险状况与节点的位置特征对产业链进行了高效的风险评估。本发明实现了对产业链风险问题的高效转化和准确评估。
Description
技术领域
本发明涉及产业链图数据挖掘技术领域,具体地讲,是涉及一种基于图神经网络的产业链风险评估模型、方法及介质。
背景技术
产业链作为企业之间基于一定的技术经济关联,并依据特定的逻辑关系和时空布局关系形成的链条式关联关系形态,反映了产品生产的社会分工。作为上下游衔接紧密的企业链条,产业链具有相互影响、风险传递的特性,当产业链中任一环节发生风险,都将会直接影响到整条产业链的韧性和稳定性,因此及时地识别和应对风险是确保经济可持续性和稳健性的关键因素。产业链风险评估作为一项关键性的战略工具和经济社会发展的重要组成部分,通过及时、准确的风险评估,识别发生风险的源头与各节点的风险状况,有助于提高经济的韧性、可持续性和稳定性,保障社会福祉。
现有的风险评估方法如专家评价法、决策树方法和深度神经网络方法,主要面向供应链的风险评估,根据评估方式可分为定性方法和定量方法两类。其中定性方法主要用于对风险的识别,依据评估人员的知识与经验对风险状况进行分析和判断。定量评估方法通过将对应的风险要素进行量化,结合风险发生的可能性以及后果,得到风险值。伴随着人工智能理论的发展,通过机器学习方法构建风险评估模型,提高了供应链风险评估的准确性。而产业链相较于供应链更为复杂,包含多种节点,节点与节点之间存在多样化的关联关系,因而简单的使用供应链的风险评估方法来量化评估产业链的风险,则会出现关系缺失和特征提取较差等问题。另外,风险具有传播性,产业链中节点发生风险,与其相关联的节点往往也会受到一定的影响。而现有的风险评估方法忽略了对产业链上下游内部结构的刻画,导致缺乏对内部风险传递及影响程度的评估。此外,现有的评估方法往往依赖于大量的数据和信息来评估风险,然而,现实中获取完整和准确的产业链数据非常困难,由此产生的数据的不完整和内部节点联系的缺失,可能导致评估结果的偏差和不准确性。上述局限性使得现有方法难以较好的应用于产业链的风险评估与预警。
此外,由于目前产业链中供应关系、竞争关系等缺乏,公司节点之间无法直接建立联系,而在对产业链进行风险评估的任务中,需要根据公司节点之间的关联关系以及自身的特征对节点风险进行评估。因此,如何基于建立的异质图对公司节点进行关联,通过何种方法提取产业链节点的风险特征以及如何根据所提取的风险特征对风险状况进行评估,是解决产业链中节点以及整条产业链风险评估的核心问题。
发明内容
针对上述现有技术存在的问题,本发明提供一种基于图神经网络的产业链风险评估模型,通过“公司-产品-产品-公司”和“公司-产品-公司”的连接结构生成产业链公司节点的关系图,并引入公司投融资关系得到基于不同连接关系的公司关联图组,结合节点邻域采样和图注意力机制进行各节点风险评估,根据节点风险状况及节点的结构特征,实现产业链异质图的风险等级评估。
为了实现上述目的,本发明采用的技术方案如下:
一种基于图神经网络的产业链风险评估模型,包括异质图构建模块、公司图生成模块、节点风险评估模块和产业链风险评估模块,其中:
异质图构建模块,用于通过收集的产业链数据,利用产业链产品上下游关联关系和公司对产品的生产关系以及公司财务属性构建产业链异质图,其中包含产品节点和公司节点,产品节点之间根据直接的物料关系建立关联,公司节点通过公司对产品的生产关系来与产品节点进行关联,公司财务属性作为公司节点的嵌入信息;
公司图生成模块,用于将产业链异质图转化为反映公司节点之间的供应关系的公司节点供应同构图和反映生产同种产品之间的竞争关系的公司节点产品竞争同构图,并结合产业链内公司节点之间的投融资关系生成公司节点投融资同构图,构成产业链公司节点关联组图;
节点风险评估模块,用于通过邻域采样机制对产业链公司节点关联组图的不同图的节点邻域进行采样和特征自适应聚合,并通过关系级的注意力机制将邻域采样聚合的节点嵌入向量进行二元风险等级分类,实现对各公司节点的风险状况评估,并生成节点级的风险等级嵌入向量;
产业链风险评估模块,用于将节点风险评估模块输出的风险等级嵌入向量与公司节点的结构特征融合后,通过结合注意力机制的产业链风险评估算法对产业链风险进行三元风险等级量化,实现产业链的多级风险评估。
具体地,所述产业链异质图表示为G(Vi,Ei,K,δ),
其中,Vi为节点集合,Ei为边集合,K为公司节点的风险标签集合,δ为产业链的风险等级标签;节点集合Vi中包含产品节点和公司节点两种节点类型,Vp表示产品节点集合,Vc表示公司节点集合;边集合Ei中包含三种边类型Γe={Ecp,Epp,Epc},Ecp表示公司节点与产品节点的连接边集合,Epp表示产品节点与产品节点的连接边集合,Epc表示产品节点与公司节点的连接边集合;公司节点集合Vc中每个公司节点v(i)包含财务特征向量mv(i)和结构特征pv(i);风险标签集合K={0,1}包含两个标签分别代表安全Safe和危险Risk,每个公司节点v(i)与节点风险标签yv(i)∈K相关联;产业链的风险等级标签δ={0,1,2},包含三个等级的风险标签,分别代表低风险、中风险和高风险。
具体地,所述公司节点选用产业链中的上市公司,并从上市公司的财务报表中提取财务属性作为公司节点的嵌入财务特征向量。
具体地,所述公司图生成模块将产业链异质图转化为反映公司节点之间的供应关系的公司节点供应同构图和反映生产同种产品之间的竞争关系的公司节点产品竞争同构图,并结合产业链内公司节点之间的投融资关系生成公司节点投融资同构图的过程为:
设定“公司-产品-公司”的元路径,对产业链异质图进行转换,生成仅包含公司节点以及公司节点连接关系的公司节点供应同构图G1;
设定“公司-产品-产品-公司”的元路径,对产业链异质图进行转换,生成仅包含公司节点以及公司节点连接关系的公司节点产品竞争同构图G2;
根据产业链数据中包含的链内上市公司和投资人以及非链内其他公司三种节点类型的关系,配置产业链内公司节点之间的投融资关系,包括不同公司节点具备相同投资人或非链内其他公司投资的投融资关系,不同公司节点投资同一公司的投融资关系,以及一公司节点对另一公司节点投资的投融资关系;
根据配置的产业链内公司节点之间的投融资关系对产业链内公司节点之间的关系进行获取,生成仅包含公司节点以及公司节点连接关系的公司节点投融资同构图G3。
具体地,所述产业链公司节点关联组图表示为Gj,j={1,2,3}。
具体地,所述节点风险评估模块通过邻域采样机制对产业链公司节点关联组图的不同图的节点邻域进行采样和特征自适应聚合,并通过关系级的注意力机制将邻域采样聚合的节点嵌入向量进行二元风险等级分类的过程为:
基于公司节点v(i)的财务特征向量mv(i)配置采样邻域,对公司节点v(i)的邻居节点的特征信息进行采样;
采用均值聚合方式获取公司节点v(i)在第k层聚合过邻居节点信息的特征向量,通过对第k-1层邻居节点嵌入的聚合得到第k层邻居节点的聚合特征;
将第k层邻居节点的聚合特征与公司节点v(i)的第k-1层的特征信息嵌入拼接,得到公司节点v(i)在第k层的特征信息,并通过归一化和层层聚合得到公司节点v(i)在产业链公司节点关联组图的相应图下的节点嵌入向量
为产业链公司节点关联组图的三种同构图配置注意力系数,将不同图下获得的节点嵌入向量作为输入,通过关系级的注意力机制进行训练学习,得到相应图下的注意力系数;
根据获得的注意力系数以及各同构图下的节点嵌入向量计算获得公司节点v(i)的综合特征向量Zv(i);
将公司节点v(i)的综合特征向量Zv(i)输入分类器进行二元风险等级分类,根据分类结果完成对公司节点的风险状况评估,其中分类器表示为
risk(v(i))=σ(wZv(i)+b)
上式中,risk表示风险二分类输出结果,σ表示激活函数,w为权重系数,b为偏置系数;
其中对公司节点的风险状况评估过程中采用的损失函数LNRE表示为:
上式中,yv(i)表示公司节点的标签值,y'v(i)表示公司节点的预测值。
具体地,对所述二元风险等级分类的结果进行编码,生成公司节点的风险等级嵌入向量rEmb(v(i))。
具体地,所述产业链风险评估模块将节点风险评估模块输出的风险等级嵌入向量与公司节点的结构特征融合后,通过结合注意力机制的产业链风险评估算法对产业链风险进行三元风险等级量化的过程为:
根据公司节点在产业链公司节点关联组图中的位置提取公司节点v(i)的结构特征,通过公司节点v(i)的节点度degi,将其转化为嵌入层可学习的结构嵌入向量pv(i)=Position_layer(degi),并编码得到公司节点v(i)的结构嵌入向量sEmb(v(i))=Emb_Ecd(Wppv(i)),其中Wp表示节点结构的权重系数;
将结构嵌入向量与风险等级嵌入向量进行拼接,并对其进行降维,得到公司节点v(i)的特征表示向量S(v(i))=MLP([sEmb(v(i))||rEmb(v(i))]);
将特征表示向量嵌入图中获得产业链公司节点关联组图Gj的特征表示向量其中N为一个同构图中的公司节点的总数;
将各同构图的特征表示向量进行均值化聚合后,输入到具有softmax激活函数的全连接神经网络中进行三元风险等级量化,输出产业链的多级风险评估结果
上式中,Wg和bg分别表示全连接神经网络的权重系数和偏置系数;全连接神经网络采用的损失函数LICRE表示为:
LICRE=Loss(f(Gj;y'v(i));δ)
上式中,y'v(i)表示公司节点的预测值,δ表示产业链的风险等级标签,f表示产业链风险评估的预测函数。
进一步地,本发明还提供了一种基于图神经网络的产业链风险评估方法,包括以下步骤:
S10、收集产业链数据,通过产业链产品上下游关联关系和公司对产品的生产关系以及公司财务属性构建产业链异质图,其中包含产品节点和公司节点,产品节点之间根据直接的物料关系建立关联,公司节点通过公司对产品的生产关系来与产品节点进行关联,公司财务属性作为公司节点的嵌入信息;
S20、将产业链异质图转化为反映公司节点之间的供应关系的公司节点供应同构图和反映生产同种产品之间的竞争关系的公司节点产品竞争同构图,并结合产业链内公司节点之间的投融资关系生成公司节点投融资同构图,构成产业链公司节点关联组图;
S30、通过邻域采样机制对产业链公司节点关联组图的不同图的节点邻域进行采样和特征自适应聚合,并通过关系级的注意力机制将邻域采样聚合的节点嵌入向量进行二元风险等级分类,实现对各公司节点的风险状况评估,并生成节点级的风险等级嵌入向量;
S40、将节点风险评估模块输出的风险等级嵌入向量与公司节点的结构特征融合后,通过结合注意力机制的产业链风险评估算法对产业链风险进行三元风险等级量化,实现产业链的多级风险评估。
更进一步地,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于图神经网络的产业链风险评估方法的步骤。
与现有技术相比,本发明具有以下有益效果:
本发明通过异质图构建模块、公司图生成模块、基于邻域采样和注意力机制的节点风险评估模块以及对产业链整体风险评估的产业链风险评估模块,实现了对产业链风险问题的高效转化和准确评估。其中巧妙利用“产品-公司”的关联关系和公司财务等信息构建了产业链异质图,将产业链风险评估转化为图及图中节点的风险评估问题,实现了对风险传递关系的刻画;同时设计了基于上下游供应、竞争和公司投融资关系的公司图生成模块,利用图中异质节点的连接关系,对公司节点之间的多种关系进行高效学习,构建了基于多种关联关系的产业链公司节点关联组图;并提出了基于邻域采样和注意力机制的节点风险评估模块,对节点邻域特征进行采样聚合,并对不同图关系下的节点特征进行自适应聚合,根据节点风险特征实现了节点级风险评估,最后设计对产业链整体风险评估的产业链风险评估模块依据节点风险状况与节点的位置特征对产业链进行了高效的风险评估。最终通过对真实世界数据集的实验证明了本发明的GANS模型在产业链风险评估的任务中效果显著。
附图说明
图1为本发明-实施例的模型结构示意图。
图2为本发明-实施例中构建产业链异质图的示意图。
图3为本发明-实施例中公司图生成模块基于元路径的流程示意图。
图4为本发明-实施例中公司图生成模块基于投融资关系的流程示意图。
图5为本发明-实施例的方法流程示意图。
图6为本发明-实施例中测试实验的准确率对比图。
图7为本发明-实施例中测试实验的AUC分数折线对比图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明,本发明的实施方式包括但不限于下列实施例。
实施例
如图1至图4所示,该基于图神经网络的产业链风险评估模型,包括异质图构建模块、公司图生成模块、节点风险评估模块和产业链风险评估模块,其中:
异质图构建模块,用于通过收集的产业链数据,利用产业链产品上下游关联关系和公司对产品的生产关系以及公司财务属性构建产业链异质图,其中包含产品节点和公司节点,产品节点之间根据直接的物料关系建立关联,公司节点通过公司对产品的生产关系来与产品节点进行关联,公司财务属性作为公司节点的嵌入信息;
公司图生成模块,用于将产业链异质图转化为反映公司节点之间的供应关系的公司节点供应同构图和反映生产同种产品之间的竞争关系的公司节点产品竞争同构图,并结合产业链内公司节点之间的投融资关系生成公司节点投融资同构图,构成产业链公司节点关联组图;
节点风险评估模块,用于通过邻域采样机制对产业链公司节点关联组图的不同图的节点邻域进行采样和特征自适应聚合,并通过关系级的注意力机制将邻域采样聚合的节点嵌入向量进行二元风险等级分类,实现对各公司节点的风险状况评估,并生成节点级的风险等级嵌入向量;
产业链风险评估模块,用于将节点风险评估模块输出的风险等级嵌入向量与公司节点的结构特征融合后,通过结合注意力机制的产业链风险评估算法对产业链风险进行三元风险等级量化,实现产业链的多级风险评估。
相关知识应用说明:
图神经网络,能通过对图结构数据的学习,提取并发掘数据的特征,并将其应用到分类、预测等任务之中。目前图神经网络可大致分为两类:谱方法和非谱方法。其中,谱方法专注于图的谱表示,被广泛应用于节点的分类任务中,较为典型的有GCN通过限制滤波器在每个节点周围的1步邻域中学习节点的表示。而非谱方法则直接在图上定义卷积,如GraphSAGE在图中相连邻居中进行操作,通过神经网络聚合器聚合指定步长的邻域特征。上述方法大多只能作用于同质网络,无法处理有多种点、边类型的异质网络。在面向异质图的处理方法中,许多研究都采用元路径对图进行网络建模,基于特定任务设置元路径,学习基于元路径的邻居节点的特征,但其元路径的选择将直接影响风险评估的效果。上述研究方法大多只关注节点的数据属性,缺少对节点位置属性的考虑,而在产业链风险评估中,位置属性则会对风险评估的结果产生重要的影响。
注意力机制,是一种基于每个元素的重要性得分对序列数据进行编码的简单方法,通过引入注意力机制,可以在众多信息中聚焦对当前任务更为关键的信息,解决信息过载问题,并提高任务处理的效率和准确性。在图注意力机制的研究方面,GAT将注意力机制引入图卷积网络中,在图结构数据上利用隐藏的自注意力层,隐式地为不同的邻居节点指定不同的权重,学习得到节点的特征。在面向异质图的注意力网络中,HAN等基于异质图引入分层注意力机制,将其划分为节点级注意力和语义级注意力,分别为基于元路径不同的邻居节点以及不同的元路径分配注意力权重,并基于不同的权重聚合得到节点特征。上述研究只考虑在单个图中引入注意力机制,且主要集中于节点邻域注意力的应用,但在面对产业链复杂关系的情况下,需要对多种关系图进行处理,根据多图关系下节点特征进行特征聚合和风险评估的情况下,则缺乏相应的策略。
产业链,是由原材料供应商、制造商、分销商等不同环节组成的复杂网络,具有相互依存、相互关联的特点,而上述特点与异质图之间存在一定的关联。异质图作为一种图数据结构,存在多类型的节点和边,允许每个节点具有不同的属性和特征,通过异质图可以进行复杂关系的建模和复杂网络分析。对应在产业链中,不同的企业、产品等可以被看作是不同类型的节点,且产业链中各节点可以表示不同的企业或组织,它们具备各自的特性,节点与节点之间也存在各种不同类型的关系,如供应关系、生产关系等。因此,通过产业链异质图的构建,能够将节点属性、节点之间的复杂关系更好的融入产业链风险评估中,实现更全面、精确地分析和建模产业链中的复杂关系和多样性,从而更高效地实现产业链的风险评估。
针对现有技术存在的问题,为了更有效地评估产业链风险,本发明设计了异质图构建模块,通过收集产业链数据,面向具体应用产业(如后续实验中提到的集成电路产业)构建产业链异质图,其包含产品节点和公司节点两种节点类型,并通过产业链产品上下游关联关系和公司对产品的生产关系以及公司财务属性建立节点之间的联系,进而实现对节点之间风险传递情况的刻画,由此将产业链的风险评估问题转化为图及图中节点的风险评估问题。
具体到异质图构建中,异质图由产品和公司两种节点组成,当产品之间有直接的物料关系则建立关联。公司节点则通过公司与产品的生产关系,与产品节点进行关联。其中公司节点为产品的主要生产商,且由于非上市公司属性的缺失,我们选择了产业链中的上市公司作为产品的公司节点,并从上市公司的财务报表中提取属性作为公司节点的嵌入,由此构建出产业链异质图,如图2所示。
对于产业链这个庞大的异质图,它的风险问题就是对产业链异质图的各节点以及产业链整体进行风险评估问题。
通过参数定义,将产业链异质图表示为G(Vi,Ei,K,δ),其中,Vi为节点集合,Ei为边集合,K为公司节点的风险标签集合,δ为产业链的风险等级标签;节点集合Vi中包含产品节点和公司节点两种节点类型,Vp表示产品节点集合,Vc表示公司节点集合;边集合Ei中包含三种边类型Γe={Ecp,Epp,Epc},Ecp表示公司节点与产品节点的连接边集合,Epp表示产品节点与产品节点的连接边集合,Epc表示产品节点与公司节点的连接边集合;公司节点集合Vc中每个公司节点v(i)包含财务特征向量mv(i)和结构特征pv(i);风险标签集合K={0,1}包含两个标签分别代表安全Safe和危险Risk,每个公司节点v(i)与节点风险标签yv(i)∈K相关联;产业链的风险等级标签δ={0,1,2},包含三个等级的风险标签,分别代表低风险、中风险和高风险。
产业链风险评估通过产业链内部各个模块的风险程度以及重要程度进行综合评估,而我们建立产业链异质图,能够有效反映产业链内部节点的风险要素以及体现产业链中的风险传递,有助于补全缺失的节点关系,反映公司节点之间关联性,从而提高节点风险评估的准确率。随后根据转换后的关系图,抽取节点的结构特征,并通过对二者的综合考量最终得到整条产业链的风险程度,提高了风险评估的可信度。
相应地,对于产业链风险评估的优化目标可以设定为:对产业链内部的公司节点进行二元风险评估,然后根据节点风险评估的结果,对产业链整体风险进行三元风险等级量化。因此本发明的GANS模型优化目标可以表示为以下两种:
(1)节点风险评估
上式中,LNRE表示节点风险评估的损失函数,yv(i)表示节点的标签值,y'v(i)表示节点的预测值;
(2)产业链风险评估
LICRE=Loss(f(Gj;y'v(i));δ)
上式中,LICRE表示产业链整体风险评估的损失函数,y'v(i)表示节点的预测值,δ表示产业链的风险等级标签,f表示产业链风险评估的预测函数。
关于公司图生成模块,通过设计用于解决产业链异质图中缺乏公司节点之间的直接关系而难以准确提取节点特征的问题,其可以实现基于关联元路径和公司投融资关系的公司节点图生成方法。
首先基于构建的产业链异质图G的特点和产业链风险评估的要求,选取“公司-产品-公司”和“公司-产品-产品-公司”的元路径;根据选取的元路径,对产业链异质图进行转化,生成仅包含公司节点以及公司节点连接关系的公司节点供应同构图G1和公司节点产品竞争同构图G2,如图3所示。
元路径p可通过产业链异质图G中的异质边相互连接得到,即其中tl∈Γe表示元路径的第l个边类型。基于节点通过边的关联关系可在节点v1和节点vl+1之间定义复合关系/>若给定复合关系R或者边类型的序列{t1,t2,...,tl},则元路径p的邻接矩阵Ap可通过邻接矩阵的乘法来表示
在进行风险评估的过程中,产品节点作为关联节点但不具备多种风险因素和风险属性,且在实际中公司与公司之间直接供应关系和竞争关系往往是缺乏的,因此我们借助“公司-产品-产品-公司”以及“公司-产品-公司”的元路径,将异质图转化为两个只包含公司节点的同构图,且分别从侧面刻画了产业链中公司节点之间的供应关系,以及生产同种产品之间的竞争关系。
最终得到两种关系下的邻接矩阵ACPC和ACPPC:
此外,产业链中公司节点的关系往往是复杂多样的,公司之间还会通过其他方面的因素建立关联关系。因此,本发明的公司图生成模块在供应关系和竞争关系的基础上,还增加了投融资关系。
根据产业链数据整理所得的上市公司的投资与股权数据,分析获得其中包含产业链内上市公司、投资人以及非链内其他公司三种节点类型,根据以上三种节点的关系,配置产业链内公司节点之间的投融资关系,包括不同公司节点具备相同投资人或非链内其他公司投资的投融资关系,不同公司节点投资同一公司的投融资关系,以及一公司节点对另一公司节点投资的投融资关系;然后根据配置的产业链内公司节点之间的投融资关系对产业链内公司节点之间的关系进行获取,生成仅包含公司节点以及公司节点连接关系的公司节点投融资同构图G3,如图4所示。
由此得到产业链公司节点关联组图,表示为Gj,j={1,2,3},分别表示在供应、竞争和投资关系下得到的公司关系图。
关于节点风险评估模块,用于根据上述得到的产业链公司节点关联组图Gj对产业链内部公司节点的风险进行评估,本发明提出了结合节点邻域采样和注意力机制的节点风险评估方法。
首先对邻居节点的特征信息进行采样。基于公司节点v(i)的财务特征向量mv(i),归一化得到节点v(i)的特征参数xv(i),通过参数K定义采样深度,并定义节点v(i)的采样邻域为N(i),表示为N(i)=NeighborSample(v(i))。
随后对节点特征进行聚合,采样均值聚合的方式获取节点在第k层聚合过的邻居节点信息的特征向量表示为/>其中/>为节点v(j)在第k-1层通过邻域采样聚合得到的特征向量。通过对第k-1层邻域节点嵌入的聚合得到第k层邻居的聚合特征/>随后将/>与节点v(i)第k-1层的特征向量嵌入拼接,表示为:
上式中,σ表示非线性变换函数,Wk表示第k层的权重。
拼接得到节点v(i)在第k层的特征向量并通过归一化和层层聚合最终得到节点v(i)在该关系图下的特征嵌入/>
通过上述邻域采样能够很好的解决单一关系图下的节点存在较多连接边而导致的特征学习效率低的问题。然而面对通过多种语义信息而提取到的多种公司关联图,语义特定的节点嵌入只能从一个方面反映节点,为了学习更全面的节点嵌入,我们需要融合多种语义信息。针对这个问题,我们基于建立的三种公司节点关系图,设计了一种关系级的注意力机制,通过为每种关系生成的关系图分配注意力系数,从而学习不同关系图的重要性,将不同关系图下邻域采样聚合得到的节点嵌入作为输入,结合注意力机制得到不同关系图下的注意力系数。
其中,attengraph为针对三种不同关系图生成对应注意力系数
为了获取三种不同关系图对应的注意力系数,我们首先将不同关系下的节点嵌入向量进行非线性变换。随后,通过激活函数并与可学习的转换参数r相乘得到节点在关系图Gj下的一个标量,随后对图中所有的节点标量进行加权求和并进行平均化,得到关系图Gj的权重/>
其中,W和b表示对应的权重和偏置。
在获得每个关系的重要性后,通过softmax函数对它们进行归一化,得到不同关系图Gj的注意力系数
将学习到的注意力系数以及多种关系下节点的特征嵌入向量作为输入,通过加权求和,计算获得公司节点v(i)的综合特征向量Zv(i);
根据节点的综合特征向量,作为分类器的输入,经过加权求和,添加偏置单元通过激活函数后得到最终输出的值。
risk(v(i))=σ(wZv(i)+b)
上式中,risk表示风险二分类输出结果,σ表示激活函数,w为权重系数,b为偏置系数;
通过最终层的输出值,对产业链的公司节点进行二元风险等级分类,并对分类的结果进行编码,作为节点的风险等级嵌入向量rEmb(v(i))。
关于产业链风险评估模块,用于基于节点风险评估模块的评估结果和公司节点的结构特征,对产业链整体进行风险评估。本发明提出一种结合注意力机制的产业链整体风险评估方法。
首先根据公司节点在产业链公司节点关联组图中的位置提取公司节点v(i)的结构特征属性,将节点的结构特征属性转化为可学习的嵌入向量。每个节点v(i)的节点度,用degi表示,通过节点的度,将其转化为嵌入层可学习的结构嵌入向量pv(i)=Position_layer(degi),并编码得到公司节点v(i)的结构嵌入向量sEmb(v(i))=Emb_Ecd(Wppv(i)),其中Wp表示节点结构的权重系数。
随后,将得到的结构嵌入向量与风险等级嵌入向量进行拼接,并对其进行降维,得到公司节点v(i)的特征表示向量S(v(i))=MLP([sEmb(v(i))||rEmb(v(i))])。
根据公司节点v(i)的特征表示向量,对其进行加权求和,得到产业链公司节点关联组图Gj的特征表示向量表示为:
其中N为一个同构图中的公司节点的总数。
将各同构图的特征表示向量进行均值化聚合后,输入到具有softmax激活函数的全连接神经网络中进行三元风险等级量化,输出产业链的多级风险评估结果
上式中,Wg和bg分别表示全连接神经网络的权重系数和偏置系数。
由此实现对产业链整体的风险评估。
在另一实施例中,如图5所示,还提供了一种基于图神经网络的产业链风险评估方法,包括以下步骤:
S10、收集产业链数据,通过产业链产品上下游关联关系和公司对产品的生产关系以及公司财务属性构建产业链异质图,其中包含产品节点和公司节点,产品节点之间根据直接的物料关系建立关联,公司节点通过公司对产品的生产关系来与产品节点进行关联,公司财务属性作为公司节点的嵌入信息;
S20、将产业链异质图转化为反映公司节点之间的供应关系的公司节点供应同构图和反映生产同种产品之间的竞争关系的公司节点产品竞争同构图,并结合产业链内公司节点之间的投融资关系生成公司节点投融资同构图,构成产业链公司节点关联组图;
S30、通过邻域采样机制对产业链公司节点关联组图的不同图的节点邻域进行采样和特征自适应聚合,并通过关系级的注意力机制将邻域采样聚合的节点嵌入向量进行二元风险等级分类,实现对各公司节点的风险状况评估,并生成节点级的风险等级嵌入向量;
S40、将节点风险评估模块输出的风险等级嵌入向量与公司节点的结构特征融合后,通过结合注意力机制的产业链风险评估算法对产业链风险进行三元风险等级量化,实现产业链的多级风险评估。
在另一实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于图神经网络的产业链风险评估方法的步骤。
上述计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存FLASH)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
以下以具体的实验来介绍该基于图神经网络的产业链风险评估模型及方法。
一、数据集
本实验使用的产业链数据来自2018-2023年中国1732家上市公司的真实数据,即上市公司的财务报表、产业链产品关联图谱、产品主要生产企业表格以及上市公司评分表,包含公司节点1732个、产品节点430个、风险因素18项、公司风险评分36372条,产业链整体风险事件跨度为21季。其中财务报表、产业链产品关联图谱以及产品主要生产企业表格由Wind(中国权威财经数据库)提供。根据产品关联表和产品公司关联表,在经过预处理后,生成关联邻接矩阵表。上市公司风险评分表由通达信(权威证券信息平台)提供,上市公司风险评分表以财务类指标为主要评分依据,对公司的风险状况进行评分。根据风险评分和专家意见,对上市公司的风险情况进行二分类,其中评分在[80,100]的公司认为公司是安全的,编码为0;评分在[0,79]的公司认为是有风险的,编码为1。同时,根据公司节点风险标签,将集成电路产业链整体风险划分为[0,0.6],[0.6,0.8],[0.8,1]三个范围,分别对应产业链低风险、中风险和高风险。
二、实验参数设置
本实验基于真实产业链数据集,并在实验中设计了不同的实验配置。我们设计了不同的训练比率(训练集中节点的百分比)的实验,范围从20%到60%。对于每个训练比率,我们对数据集进行三种不同的随机分区以及应用十个随机种子进行模型参数的随机初始化,每个模型进行30次试验。对于我们所使用的数据集的财务特征属性,我们将对其中的缺失值采用平均插值法进行填充。为了公平起见,我们对所有模型执行超参数搜索,每个模型的搜索空间是相同的。我们从{200,400,600}中选取训练阶段的轮数,对所有实验使用Adam优化器,并且在{1e-2,1e-3,1e-4}中选择学习率,在{1e-4,1e-3,5e-4}中选择权重衰减系数。我们使用的所有模型的所有训练与验证过程均在NVIDIA GeForce RTX 3090(24GB)GPU上进行。
三、基线方法
本发明的GANS模型和三个基线图神经网络模型(GCN,GAT,GraphSAGE)以及一个适用于异质图的GNN模型(HAN)进行对比。
GCN:是一种半监督图卷积网络,设计用于同构图,我们在通过公司节点图生成模块得到的公司节点关系组图的基础上,将公司间的邻接关系作为模型的输入,对公司节点进行风险评估任务,并记录最佳性能。GAT:是一个考虑了齐次图上注意力机制的半监督神经网络,我们在通过公司节点图生成模块得到的公司节点关系组图的基础上,将公司间的邻接关系作为模型的输入,对公司节点进行风险评估任务,并记录最佳性能。GraphSAGE:是一个考虑了齐次图上对邻居节点进行采样的半监督神经网络,我们在通过公司节点图生成模块得到的公司节点关系组图的基础上,将公司间的邻接关系作为模型的输入,对公司节点进行风险评估任务,并记录最佳性能。HAN:是一个应用在异质图上,采用多层注意力机制的半监督图神经网络。通过设置不同的元路径,将异质图转换为不同的同构图,并通过节点级注意力和语义级注意力对节点进行信息嵌入。我们将产业链异质图作为模型的输入,对公司节点进行风险评估任务,并记录最佳性能。
四、实验分析
基于不同比例的训练集对模型进行训练,将每个模型分别进行200、400、600轮试验,并根据基线方法的特性将实验分为两组,得到以下实验结果,如表1所示。
表1五种模型对比实验结果
通过上述实验,在集成电路产业链数据集上,(1)GANS在三种训练比率的情况下,各项评价指标均优于其它模型,它的预测准确率比其他GNN模型高至少4%。此外,在F1分数方面,GANS模型比其他GNN模型高出至少6%。同时在AUC分数的表现上,GANS比其他GNN模型至少高出3%。(2)如图6和图7所示,在测试集折线图中,测试集准确率和AUC分数的表现GANS比现有方法表现更好。上述结果证明了本发明的GANS模型在评估产业链中公司节点的风险状况时的准确性、有效性均优于现有的GNN模型。
根据GANS节点级风险评估的结果和基于节点的结构特征得到公司节点的风险权重,将公司节点的风险标签标签值进行加权求和,最终得到对应季度产业链整体的风险评分及标签,此外由于产业链整体风险数据量的缺失,我们选择了准确率指标对实验效果进行评价。结果如表2所示。
Method | Accuracy |
GCN | 76.2% |
GraphSAGE | 80.9% |
GAT | 80.9% |
HAN | 90.5% |
GANS | 95.3% |
表2产业链整体风险评估对比
上述实验结果显示,GANS模型在21个季度关于集成电路产业链对应风险的评估准确率达到95.3%,比其他GNN模型高出至少5%。由此,本发明的GANS模型能够从产业链内部节点的风险出发,依据产业链内部公司节点的风险情况和结构特征,实现了对产业链整体性风险的准确评估。
五、消融实验
根据本发明模型的诸多模块,设计了GANS的4种变体进行消融实验。GANS\metapath表示从GANS中去除基于元路径的公司节点图生成模块;GANS\stock表示从GANS中去除基于公司投融关系的公司节点图生成模块;GANS\sample表示从GANS中去除节点邻域采样模块,仅使用传统图卷积对节点的邻居信息进行聚合。GANS\attention则表示从GANS中去除基于注意力机制的多图关系下节点特征融合模块,仅对节点特征进行平均聚合,并使用全连接层进行节点分类。在我们的实验中,我们同样选择准确率、F1分数以及AUC分数三个指标作为性能测量。然后,通过进行消融实验,以证明我们的模型中的每个组件的有效性。结果如表3所示。
表3消融实验结果表
通过上述实验,所有变体在准确率、二元F1分数和AUC分数上有一定程度上恶化。由此得到如下结论:(1)在分别去除基于元路径的公司图节点生成模块和基于投资关系的图节点生成模块后,模型在三个指标表现上均出现下降,证明了我们通过公司图生成模块得到的公司之间的关联对于准确评估产业链中公司节点的风险是有效的。(2)在去除邻域节点采样后,模型在三项指标的下降最为明显,由此证明了在进行产业链节点风险评估时,通过邻域采样能够有效对公司节点之间的有效连接进行捕捉,从而实现高效的风险特征学习。(3)在去除基于注意力机制的节点特征融合模块后,模型在评价指标的分数上有较为明显的下降,这证明了注意力机制在多图关系下进行节点风险特征融合的有效性。总体而言,与所有变体相比,整个GANS实现了最佳结果。
综上所述,本发明提出的基于图神经网络的产业链风险评估模型GANS,通过异质图构建模块、公司图生成模块、基于邻域采样和注意力机制的节点风险评估模块以及产业链风险评估模块,实现了对产业链风险问题的高效转化和准确评估。基于真实世界收集整理的集成电路产业链数据集的实验表明,本发明的GANS模型在产业链风险评估的任务中效果显著。
上述实施例仅为本发明的优选实施例,并非对本发明保护范围的限制,但凡采用本发明的设计原理,以及在此基础上进行非创造性劳动而做出的变化,均应属于本发明的保护范围之内。
Claims (10)
1.一种基于图神经网络的产业链风险评估模型,其特征在于,包括异质图构建模块、公司图生成模块、节点风险评估模块和产业链风险评估模块,其中:
异质图构建模块,用于通过收集的产业链数据,利用产业链产品上下游关联关系和公司对产品的生产关系以及公司财务属性构建产业链异质图,其中包含产品节点和公司节点,产品节点之间根据直接的物料关系建立关联,公司节点通过公司对产品的生产关系来与产品节点进行关联,公司财务属性作为公司节点的嵌入信息;
公司图生成模块,用于将产业链异质图转化为反映公司节点之间的供应关系的公司节点供应同构图和反映生产同种产品之间的竞争关系的公司节点产品竞争同构图,并结合产业链内公司节点之间的投融资关系生成公司节点投融资同构图,构成产业链公司节点关联组图;
节点风险评估模块,用于通过邻域采样机制对产业链公司节点关联组图的不同图的节点邻域进行采样和特征自适应聚合,并通过关系级的注意力机制将邻域采样聚合的节点嵌入向量进行二元风险等级分类,实现对各公司节点的风险状况评估,并生成节点级的风险等级嵌入向量;
产业链风险评估模块,用于将节点风险评估模块输出的风险等级嵌入向量与公司节点的结构特征融合后,通过结合注意力机制的产业链风险评估算法对产业链风险进行三元风险等级量化,实现产业链的多级风险评估。
2.根据权利要求1所述的基于图神经网络的产业链风险评估模型,其特征在于,所述产业链异质图表示为G(Vi,Ei,K,δ),
其中,Vi为节点集合,Ei为边集合,K为公司节点的风险标签集合,δ为产业链的风险等级标签;节点集合Vi中包含产品节点和公司节点两种节点类型,Vp表示产品节点集合,Vc表示公司节点集合;边集合Ei中包含三种边类型Γe={Ecp,Epp,Epc},Ecp表示公司节点与产品节点的连接边集合,Epp表示产品节点与产品节点的连接边集合,Epc表示产品节点与公司节点的连接边集合;公司节点集合Vc中每个公司节点v(i)包含财务特征向量mv(i)和结构特征pv(i);风险标签集合K={0,1}包含两个标签分别代表安全Safe和危险Risk,每个公司节点v(i)与节点风险标签yv(i)∈K相关联;产业链的风险等级标签δ={0,1,2},包含三个等级的风险标签,分别代表低风险、中风险和高风险。
3.根据权利要求2所述的基于图神经网络的产业链风险评估模型,其特征在于,所述公司节点选用产业链中的上市公司,并从上市公司的财务报表中提取财务属性作为公司节点的嵌入财务特征向量。
4.根据权利要求1所述的基于图神经网络的产业链风险评估模型,其特征在于,所述公司图生成模块将产业链异质图转化为反映公司节点之间的供应关系的公司节点供应同构图和反映生产同种产品之间的竞争关系的公司节点产品竞争同构图,并结合产业链内公司节点之间的投融资关系生成公司节点投融资同构图的过程为:
设定“公司-产品-公司”的元路径,对产业链异质图进行转换,生成仅包含公司节点以及公司节点连接关系的公司节点供应同构图G1;
设定“公司-产品-产品-公司”的元路径,对产业链异质图进行转换,生成仅包含公司节点以及公司节点连接关系的公司节点产品竞争同构图G2;
根据产业链数据中包含的链内上市公司和投资人以及非链内其他公司三种节点类型的关系,配置产业链内公司节点之间的投融资关系,包括不同公司节点具备相同投资人或非链内其他公司投资的投融资关系,不同公司节点投资同一公司的投融资关系,以及一公司节点对另一公司节点投资的投融资关系;
根据配置的产业链内公司节点之间的投融资关系对产业链内公司节点之间的关系进行获取,生成仅包含公司节点以及公司节点连接关系的公司节点投融资同构图G3。
5.根据权利要求4所述的基于图神经网络的产业链风险评估模型,其特征在于,所述产业链公司节点关联组图表示为Gj,j={1,2,3}。
6.根据权利要求5所述的基于图神经网络的产业链风险评估模型,其特征在于,所述节点风险评估模块通过邻域采样机制对产业链公司节点关联组图的不同图的节点邻域进行采样和特征自适应聚合,并通过关系级的注意力机制将邻域采样聚合的节点嵌入向量进行二元风险等级分类的过程为:
基于公司节点v(i)的财务特征向量mv(i)配置采样邻域,对公司节点v(i)的邻居节点的特征信息进行采样;
采用均值聚合方式获取公司节点v(i)在第k层聚合过邻居节点信息的特征向量,通过对第k-1层邻居节点嵌入的聚合得到第k层邻居节点的聚合特征;
将第k层邻居节点的聚合特征与公司节点v(i)的第k-1层的特征信息嵌入拼接,得到公司节点v(i)在第k层的特征信息,并通过归一化和层层聚合得到公司节点v(i)在产业链公司节点关联组图的相应图下的节点嵌入向量
为产业链公司节点关联组图的三种同构图配置注意力系数,将不同图下获得的节点嵌入向量作为输入,通过关系级的注意力机制进行训练学习,得到相应图下的注意力系数;
根据获得的注意力系数以及各同构图下的节点嵌入向量计算获得公司节点v(i)的综合特征向量Zv(i);
将公司节点v(i)的综合特征向量Zv(i)输入分类器进行二元风险等级分类,根据分类结果完成对公司节点的风险状况评估,其中分类器表示为
risk(v(i))=σ(wZv(i)+b)
上式中,risk表示风险二分类输出结果,σ表示激活函数,w为权重系数,b为偏置系数;
其中对公司节点的风险状况评估过程中采用的损失函数LNRE表示为:
上式中,yv(i)表示公司节点的标签值,y’v(i)表示公司节点的预测值。
7.根据权利要求6所述的基于图神经网络的产业链风险评估模型,其特征在于,对所述二元风险等级分类的结果进行编码,生成公司节点的风险等级嵌入向量rEmb(v(i))。
8.根据权利要求7所述的基于图神经网络的产业链风险评估模型,其特征在于,所述产业链风险评估模块将节点风险评估模块输出的风险等级嵌入向量与公司节点的结构特征融合后,通过结合注意力机制的产业链风险评估算法对产业链风险进行三元风险等级量化的过程为:
根据公司节点在产业链公司节点关联组图中的位置提取公司节点v(i)的结构特征,通过公司节点v(i)的节点度degi,将其转化为嵌入层可学习的结构嵌入向量pv(i)=Position_layer(degi),并编码得到公司节点v(i)的结构嵌入向量sEmb(v(i))=Emb_Ecd(Wppv(i)),其中Wp表示节点结构的权重系数;
将结构嵌入向量与风险等级嵌入向量进行拼接,并对其进行降维,得到公司节点v(i)的特征表示向量S(v(i))=MLP([sEmb(v(i))||rEmb(v(i))]);
将特征表示向量嵌入图中获得产业链公司节点关联组图Gj的特征表示向量其中N为一个同构图中的公司节点的总数;
将各同构图的特征表示向量进行均值化聚合后,输入到具有softmax激活函数的全连接神经网络中进行三元风险等级量化,输出产业链的多级风险评估结果
上式中,Wg和bg分别表示全连接神经网络的权重系数和偏置系数;全连接神经网络采用的损失函数LICRE表示为:
LICRE=Loss(f(Gj;y'v(i));δ)
上式中,y’v(i)表示公司节点的预测值,δ表示产业链的风险等级标签,f表示产业链风险评估的预测函数。
9.一种基于图神经网络的产业链风险评估方法,其特征在于,包括以下步骤:
S10、收集产业链数据,通过产业链产品上下游关联关系和公司对产品的生产关系以及公司财务属性构建产业链异质图,其中包含产品节点和公司节点,产品节点之间根据直接的物料关系建立关联,公司节点通过公司对产品的生产关系来与产品节点进行关联,公司财务属性作为公司节点的嵌入信息;
S20、将产业链异质图转化为反映公司节点之间的供应关系的公司节点供应同构图和反映生产同种产品之间的竞争关系的公司节点产品竞争同构图,并结合产业链内公司节点之间的投融资关系生成公司节点投融资同构图,构成产业链公司节点关联组图;
S30、通过邻域采样机制对产业链公司节点关联组图的不同图的节点邻域进行采样和特征自适应聚合,并通过关系级的注意力机制将邻域采样聚合的节点嵌入向量进行二元风险等级分类,实现对各公司节点的风险状况评估,并生成节点级的风险等级嵌入向量;
S40、将节点风险评估模块输出的风险等级嵌入向量与公司节点的结构特征融合后,通过结合注意力机制的产业链风险评估算法对产业链风险进行三元风险等级量化,实现产业链的多级风险评估。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求9所述的基于图神经网络的产业链风险评估方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311350736.7A CN117236698A (zh) | 2023-10-18 | 2023-10-18 | 基于图神经网络的产业链风险评估模型、方法及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311350736.7A CN117236698A (zh) | 2023-10-18 | 2023-10-18 | 基于图神经网络的产业链风险评估模型、方法及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117236698A true CN117236698A (zh) | 2023-12-15 |
Family
ID=89082639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311350736.7A Pending CN117236698A (zh) | 2023-10-18 | 2023-10-18 | 基于图神经网络的产业链风险评估模型、方法及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117236698A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556224A (zh) * | 2024-01-12 | 2024-02-13 | 国网四川省电力公司电力科学研究院 | 一种电网设施抗震风险评估系统、方法及存储介质 |
-
2023
- 2023-10-18 CN CN202311350736.7A patent/CN117236698A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556224A (zh) * | 2024-01-12 | 2024-02-13 | 国网四川省电力公司电力科学研究院 | 一种电网设施抗震风险评估系统、方法及存储介质 |
CN117556224B (zh) * | 2024-01-12 | 2024-03-22 | 国网四川省电力公司电力科学研究院 | 一种电网设施抗震风险评估系统、方法及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106067094A (zh) | 一种动态评估方法及系统 | |
CN117236698A (zh) | 基于图神经网络的产业链风险评估模型、方法及介质 | |
Jeong et al. | A systemic approach to exploring an essential patent linking standard and patent maps: Application of generative topographic mapping (GTM) | |
CN114676435A (zh) | 一种基于知识图谱的软件漏洞可利用性预测方法 | |
Dabab et al. | A decision model for data mining techniques | |
CN111597229A (zh) | 一种基于高维点过程的金融时间序列的因果关系学习方法 | |
CN117540035B (zh) | 一种基于实体类型信息融合的rpa知识图谱构建方法 | |
Ding | Enterprise intelligent audit model by using deep learning approach | |
Wang et al. | Multiview Graph Learning for Small‐and Medium‐Sized Enterprises’ Credit Risk Assessment in Supply Chain Finance | |
CN117422181A (zh) | 一种基于模糊标签的代发客户流失预警方法及系统 | |
Song et al. | Enhancing Enterprise Credit Risk Assessment with Cascaded Multi-level Graph Representation Learning | |
CN113379211A (zh) | 基于区块链的物流信息平台违约风险管控系统及方法 | |
CN114529063A (zh) | 一种基于机器学习的金融领域数据预测方法、设备及介质 | |
Mingyu et al. | Study of Forecasting and Estimation Methodology of Oilfield Development Cost Based on Machine Learning | |
Terzi et al. | Comparison of financial distress prediction models: Evidence from turkey | |
Liu et al. | A comparison of machine learning algorithms for prediction of past due service in commercial credit | |
CN117951457B (zh) | 基于生物炭的负碳产品碳减排量核算方法及系统 | |
Durica et al. | Modeling the financial distress of Slovak companies using various decision trees | |
Wu et al. | Evaluation and selection of insurance marketing schemes driven by multisource big data | |
Chen et al. | Research on Extraction Method of Credit Risk Analysis of Corporate Bonds Based on Convolutional Neural Network | |
Zhang et al. | Enterprise Event Risk Detection Based on Supply Chain Contagion | |
CN117422311A (zh) | 企业风险评级模型构建方法、系统及存储介质 | |
Hu | Software Engineering Classification Model and Algorithm Based on Big Data Technology | |
CN116308809A (zh) | 一种基于事件域交互的分析师观点质量评估方法及模型 | |
CN113379212A (zh) | 基于区块链的物流信息平台违约风险评估方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |