CN112241920A - 基于图神经网络的投融资机构评估方法、系统及设备 - Google Patents

基于图神经网络的投融资机构评估方法、系统及设备 Download PDF

Info

Publication number
CN112241920A
CN112241920A CN202011024535.4A CN202011024535A CN112241920A CN 112241920 A CN112241920 A CN 112241920A CN 202011024535 A CN202011024535 A CN 202011024535A CN 112241920 A CN112241920 A CN 112241920A
Authority
CN
China
Prior art keywords
investment
initial
enterprise
network
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011024535.4A
Other languages
English (en)
Inventor
徐佳慧
裴乐琪
季书帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202011024535.4A priority Critical patent/CN112241920A/zh
Publication of CN112241920A publication Critical patent/CN112241920A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于图神经网络的投融资机构评估方法、系统及设备,通过训练深度学习模型可快速预测并评估出初创企业的发展指标,并可通过不同时期的发展排序,帮助分析师快速获取到发展势头迅猛的初创企业;结合初创企业所属行业领域、历史投资轮次状况以及从社会媒体投融资新闻文本中预训练的初创机构语义信息等相关信息,为投融资领域机构发展的评估提供了有力的度量信息;从初创企业的属性信息、历史信息,并通过本发明设计的图卷积网络去获取共被投初创企业的邻域聚合策略,获得投资的高阶隐藏特征,通过所设计的基于图神经网络的投融资领域机构发展趋势评估的深度学习模型,可有效的获取到初创企业的发展评估值。

Description

基于图神经网络的投融资机构评估方法、系统及设备
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于图神经网络的投融资机构评估方法、系统及设备。
背景技术
目前,正处在大众创新创业的浪潮下,各领域诸多初创企业如雨后春笋般涌现,其中不乏存在新颖创新的潜力企业,在这种大环境下同时衍生出对风险投资的大量需求。如果需要将成果转成市场上的产品进行快速推广,风险投资将会对初创企业融资事宜起到决定性的作用。而对于投资机构需要选择符合自身条件的潜力初创公司,提升投资回报率。
然而,对风投分析师而言,需收集大量公开资料对各初创机构进行研究生成意见报告,以往耗时费力,对于竞争激烈的投资行业,需要能够快速评估发展热门的筛选工具。目前,利用深度学习参与风投研究的工作相对较少,且对于投融资机构关联的挖掘、预测评估应用也相对较少。
随着深度学习在各领域的成功应用,其卓越效果引起各行各业从事人员的关注。对于传统的卷积神经网络仅对处理欧式空间的数据效果显著,而现实生活中存在大量的图结构这种非欧空间结构的数据,而专注处理图数据的高效模型图卷积网络,其卷积操作结合了图结构中的节点特征、以及边的结构信息,使其可以学习到更加丰富的隐层信息。
综上,亟需一种基于图神经网络的投融资机构评估技术方案,以衡量初创企业发展评估值,来帮助风投分析师掌握初创公司的发展趋势,进而推动投资决策的实施。
发明内容
为此,本发明提供一种基于图神经网络的投融资机构评估方法、系统及设备,通过投资关系形成初创企业之间的共被投网络图,并结合相关投融资新闻文本信息,通过所建立的投融资机构发展趋势评估模型评估当前时间的热门程度,帮助风投数据分析师获得不同时期初创公司的发展趋势,作为评判的指标,辅助制定投资决策。
为了实现上述目的,本发明提供如下技术方案:第一方面,一种基于图神经网络的投融资机构评估方法,包括以下步骤:
步骤1、截取给定时刻Tcurr之前的投资事件,构建初创企业的共被投网络图Gc
步骤2、设定NG个时间段的初创企业共被投网络图,以Tinte为固定时间间隔,构建上一时刻Tcurr-Tinte的初创企业共被投网络图Gc-1i,依次类推构建剩余NG-1个初创企业共被投网络图,获得NG个初创企业共被投网络图;
步骤3、构建基于图神经网络的投融资机构发展趋势评估模型;
步骤4、对所述评估模型进行训练学习,获得最终用于评估的投融资机构发展趋势模型;
步骤5、对NG个所述初创企业共被投网络图训练对应时间段的NG个面向投融资机构发展趋势评估模型,并使用所述发展趋势评估模型评估出各节点的发展评估值,根据所述发展评估值的大小对NG个时间段的初创企业发展进行排序。
作为基于图神经网络的投融资机构评估方法的优选方案,所述步骤1包括以下步骤:
步骤1.1、对所述共被投网络图Gc中初创企业的所属行业,通过One-Hot编码生成节点所属行业特征矩阵
Figure BDA0002701743530000021
步骤1.2、对所述共被投网络图Gc中初创企业的历史投资轮次,通过One-Hot编码生成节点投资轮次特征矩阵
Figure BDA0002701743530000022
步骤1.3、获取初创企业的成立时间差特征
Figure BDA0002701743530000023
并对所述成立时间差特征
Figure BDA0002701743530000031
进行Z-score标准化处理,处理公式为:
Figure BDA0002701743530000032
Figure BDA0002701743530000033
其中,T为当前年份与初创企业成立时间差,
Figure BDA0002701743530000037
为时间差系数;x为所有样本数据的原始值,μ为所有样本数据的均值,σ为所有样本数据的标准差,x*为所有样本数据归一化后的数值;
步骤1.4、获取初创企业在所述给定时刻Tcurr之前的投融资新闻文本,设置词向量长度为Nnews,采用训练模式为Skip-gram的Word2Vec算法对投融资新闻文本进行训练,获得各初创企业节点的新闻特征矩阵
Figure BDA0002701743530000034
步骤1.5、将步骤1.1至步骤1.4获得的节点特征进行拼接组合,获得初创企业共被投网络图Gc的节点特征矩阵Xnode
步骤1.6、将所述给定时刻Tcurr之前的所有投资事件中被同一投资机构所投资过的初创企业构建网络图中的边,获得边索引矩阵Xedges
步骤1.7、为所述给定时刻Tcurr之前的所有投资事件中的节点进行标注,选定时间间隔Tinte,对于时间间隔Tinte时间段内发生过投资的初创企业设置标签为1,未发生投资的初创企业设置标签为0,获得初创企业共被投网络图Gc的节点标签矩阵Ynode
作为基于图神经网络的投融资机构评估方法的优选方案,所述步骤1.4中,对于共被投网络图Gc中没有获得新闻特征矩阵的初创企业,以各初创企业节点的新闻特征平均值,作为没有获得新闻特征矩阵的初创企业节点的新闻特征。
作为基于图神经网络的投融资机构评估方法的优选方案,所述步骤3包括以下步骤:
步骤3.1、首先构建发展趋势评估模型的输入层,具体子步骤如下:
步骤3.1.1、将初创企业的共被投网络图Gc中初创企业节点的所属行业特征矩阵
Figure BDA0002701743530000035
进行数据压缩,转换成行业特征稠密向量
Figure BDA0002701743530000036
设定其神经元数量为Nindustry的行业特征嵌入层;
步骤3.1.2、将初创企业的共被投网络图Gc中初创企业节点的投资轮次特征矩阵
Figure BDA0002701743530000041
进行数据压缩,转换成投资轮次特征稠密向量
Figure BDA0002701743530000042
设定其神经元数量为Nrounds的行业特征嵌入层;
步骤3.1.3、将所述行业特征稠密向量
Figure BDA0002701743530000043
投资轮次特征稠密向量
Figure BDA0002701743530000044
输入的初创机构节点的新闻特征矩阵
Figure BDA0002701743530000045
和初创机构节点成立时间差特征
Figure BDA0002701743530000046
进行横向拼接,记为整个模型的输入层Xinput
步骤3.2、将初创企业的共被投网络图Gc的节点特征矩阵Xnode和所述输入层XinPut组合成图结构输入特征,传输到所构建的图卷积层,具体子步骤如下:
步骤3.2.1:构建堆叠两层的近似神经预测的个性化传播图神经网络层,其中设定迭代K次、影响节点邻域的传递概率α,处理公式如下:
X(0)=X,
Figure BDA0002701743530000047
其中,X是输入特征,X(0)为初始输入特征,
Figure BDA0002701743530000048
是包含自循环图的邻接矩阵,
Figure BDA0002701743530000049
是包含自循环图的度对角矩阵;
同时每层近似神经预测的个性化传播图神经网络层之后均添加一层对神经元剔除概率为pdropout的舍弃层,设置舍弃层的参数为β,激活函数为LeakyRelu函数,处理公式如下:
r(l)~Bernoulli(pdropout),
Figure BDA00027017435300000410
Figure BDA00027017435300000411
Figure BDA00027017435300000412
其中,l表示当前神经网络层的第l层,Bernoulli函数生成第l层保留神经元数量的概率r(l),y(l)表示第l层的神经元向量,
Figure BDA00027017435300000413
表示其中第l层的保留的神经元向量,
Figure BDA00027017435300000414
表示神经元di从第l层传递到第l+1层之间的各参数权重,
Figure BDA00027017435300000415
为对应的偏置,FLeakyRelu为激活函数,xi表示神经元i数值,β为负值输入斜率;
步骤3.2.2、构建一层简易图卷积网络,其中设定跳频数为K,节点隐藏维度输出大小为Nv-g,处理公式如下:
Figure BDA0002701743530000051
其中,X是输入特征,W为所训练参数,
Figure BDA0002701743530000052
是包含自循环图的邻接矩阵,
Figure BDA0002701743530000053
是包含自循环图的度对角矩阵;
步骤3.3、最后构建模型的输出层,具体子步骤如下:
步骤3.3.1、构建最后一层简易图卷积网络,其中设定跳频数为K,节点隐藏维度输出大小为2,生成初创企业的共被投网络图Gc中各节点向量
Figure BDA0002701743530000054
步骤3.3.2:通过Sigmoid激活函数生成最终的预测值向量Voutput,处理公式如下所示:
Figure BDA0002701743530000055
Figure BDA0002701743530000056
其中Sigmoid(·)表示Sigmoid激活函数,W表示深度输出层各参数权重,b表示对应的偏置。
作为基于图神经网络的投融资机构评估方法的优选方案,所述步骤4包括以下步骤:
步骤4.1、获取步骤1中预处理后的的初创企业的共被投网络图Gc
步骤4.2、设定损失函数为交叉熵损失函数,并添加L2正则化项;
步骤4.3、设置优化器算法optimizer;
步骤4.4、设定对初创企业的共被投网络图训练迭代的次数为Nepoch,迭代更新模型;
步骤4.5、每轮更新采用小批量梯度下降法进行参数更新,其中每轮epoch迭代用于更新模型参数所使用的样本量为Nbatch
步骤4.6、循环执行步骤4.5,直至达到设定的Nepoch截止,此时即训练好所述发展趋势评估模型。
第二方面,本发明提供一种基于图神经网络的投融资机构评估系统,采用第一方面或其任意可能的实现方式中的基于图神经网络的投融资机构评估方法,包括:
共被投网络图构建单元:用于截取给定时刻Tcurr之前的投资事件,构建初创企业的共被投网络图Gc
共被投网络图加工单元:用于设定NG个时间段的初创企业共被投网络图,以Tinte为固定时间间隔,构建上一时刻Tcurr-Tinte的初创企业共被投网络图Gc-1i,依次类推构建剩余NG-1个初创企业共被投网络图,获得NG个初创企业共被投网络图;
评估模型构建单元:用于构建基于图神经网络的投融资机构发展趋势评估模型;
评估模型训练单元:用于对所述评估模型进行训练学习,获得最终用于评估的投融资机构发展趋势模型;
投融资机构发展评估单元:用于对NG个所述初创企业共被投网络图训练对应时间段的NG个面向投融资机构发展趋势评估模型,并使用所述发展趋势评估模型评估出各节点的发展评估值,根据所述发展评估值的大小对NG个时间段的初创企业发展进行排序。
第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质中存储用于基于图神经网络的投融资机构评估的程序代码,所述程序代码包括用于执行第一方面或其任意可能的实现方式中的基于图神经网络的投融资机构评估方法的指令。
第四方面,提供一种电子设备,所述电子设备包括处理器,所述处理器与存储介质耦合,当所述处理器执行存储介质中的指令时,使得所述电子设备执行第一方面或其任意可能的实现方式中的基于图神经网络的投融资机构评估方法。
本发明通过训练深度学习模型可快速预测并评估出初创企业的发展指标,并可通过不同时期的发展排序,帮助分析师快速获取到发展势头迅猛的初创企业;本发明结合初创企业所属行业领域、历史投资轮次状况以及从社会媒体投融资新闻文本中预训练的初创机构语义信息等相关信息,为投融资领域机构发展的评估提供了有力的度量信息;本发明从初创企业的属性信息、历史信息,并通过本发明设计的图卷积网络去获取共被投初创企业的邻域聚合策略,获得投资的高阶隐藏特征,通过所设计的基于图神经网络的投融资领域机构发展趋势评估的深度学习模型,可有效的获取到初创企业的发展评估值;本发明方法在测试数据上的效果符合需求,排序效果能够满足用户准确的掌握初创企业特定时期内的发展趋势。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例中提供的基于图神经网络的投融资机构评估方法流程图;
图2为本发明实施例中提供的基于图神经网络的投融资机构评估方法中构建初创企业的共被投网络图流程图;
图3为本发明实施例中提供的构建基于图神经网络的投融资机构发展趋势评估模型的流程图;
图4为本发明实施例中提供的评估模型训练学习流程图;
图5为本发明实施例中提供的基于图神经网络的投融资机构评估系统示意图;
图6为用于实施根据本发明实施方式的方法和系统的计算机的示意性框图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参见图1,提供一种基于图神经网络的投融资机构评估方法,包括以下步骤:
S1、截取给定时刻Tcurr之前的投资事件,构建初创企业的共被投网络图Gc
S2、设定NG个时间段的初创企业共被投网络图,以Tinte为固定时间间隔,构建上一时刻Tcurr-Tinte的初创企业共被投网络图Gc-1i,依次类推构建剩余NG-1个初创企业共被投网络图,获得NG个初创企业共被投网络图;
S3、构建基于图神经网络的投融资机构发展趋势评估模型;
S4、对所述评估模型进行训练学习,获得最终用于评估的投融资机构发展趋势模型;
S5、对NG个所述初创企业共被投网络图训练对应时间段的NG个面向投融资机构发展趋势评估模型,并使用所述发展趋势评估模型评估出各节点的发展评估值,根据所述发展评估值的大小对NG个时间段的初创企业发展进行排序。
具体的,参见图2,S1包括以下步骤:
S11、对所述共被投网络图Gc中初创企业的所属行业,通过One-Hot编码生成节点所属行业特征矩阵
Figure BDA0002701743530000081
S12、对所述共被投网络图Gc中初创企业的历史投资轮次,通过One-Hot编码生成节点投资轮次特征矩阵
Figure BDA0002701743530000082
S13、获取初创企业的成立时间差特征
Figure BDA0002701743530000083
并对所述成立时间差特征
Figure BDA0002701743530000084
进行Z-score标准化处理,处理公式为:
Figure BDA0002701743530000085
Figure BDA0002701743530000086
其中,T为当前年份与初创企业成立时间差,
Figure BDA0002701743530000087
为时间差系数,
Figure BDA0002701743530000088
优选为0.1;x为所有样本数据的原始值,μ为所有样本数据的均值,σ为所有样本数据的标准差,x*为所有样本数据归一化后的数值;
S14、获取初创企业在所述给定时刻Tcurr之前的投融资新闻文本,设置词向量长度为Nnews,采用训练模式为Skip-gram的Word2Vec算法对投融资新闻文本进行训练,获得各初创企业节点的新闻特征矩阵
Figure BDA0002701743530000091
S15、将S11至S14获得的节点特征进行拼接组合,获得初创企业共被投网络图Gc的节点特征矩阵Xnode
S16、将所述给定时刻Tcurr之前的所有投资事件中被同一投资机构所投资过的初创企业构建网络图中的边,获得边索引矩阵Xedges
S17、为所述给定时刻Tcurr之前的所有投资事件中的节点进行标注,选定时间间隔Tinte,对于时间间隔Tinte时间段内发生过投资的初创企业设置标签为1,未发生投资的初创企业设置标签为0,获得初创企业共被投网络图Gc的节点标签矩阵Ynode
具体的,S14中,对于共被投网络图Gc中没有获得新闻特征矩阵的初创企业,以各初创企业节点的新闻特征平均值,作为没有获得新闻特征矩阵的初创企业节点的新闻特征。其中,词向量长度为Nnews为200。
具体的,参见图3,S3包括以下步骤:
S31、首先构建发展趋势评估模型的输入层,具体子步骤如下:
S311、将初创企业的共被投网络图Gc中初创企业节点的所属行业特征矩阵
Figure BDA0002701743530000092
进行数据压缩,转换成行业特征稠密向量
Figure BDA0002701743530000093
设定其神经元数量为Nindustry的行业特征嵌入层;
S312、将初创企业的共被投网络图Gc中初创企业节点的投资轮次特征矩阵
Figure BDA0002701743530000094
进行数据压缩,转换成投资轮次特征稠密向量
Figure BDA0002701743530000095
设定其神经元数量为Nrounds的行业特征嵌入层;
S313、将所述行业特征稠密向量
Figure BDA0002701743530000096
投资轮次特征稠密向量
Figure BDA0002701743530000097
输入的初创机构节点的新闻特征矩阵
Figure BDA0002701743530000098
和初创机构节点成立时间差特征
Figure BDA0002701743530000099
进行横向拼接,记为整个模型的输入层Xinput
其中,S311中神经元数量Nindustry优选为300,S312中神经元数量Nrounds优选为3;
S32、将初创企业的共被投网络图Gc的节点特征矩阵Xnode和所述输入层Xinput组合成图结构输入特征,传输到所构建的图卷积层,具体子步骤如下:
S321:构建堆叠两层的近似神经预测的个性化传播图神经网络层,其中设定迭代K次、影响节点邻域的传递概率α,处理公式如下:
X(0)=X,
Figure BDA0002701743530000101
其中,X是输入特征,X(0)为初始输入特征,
Figure BDA0002701743530000102
是包含自循环图的邻接矩阵,
Figure BDA0002701743530000103
是包含自循环图的度对角矩阵;
同时每层近似神经预测的个性化传播图神经网络层之后均添加一层对神经元剔除概率为pdropout的舍弃层,设置舍弃层的参数为β,激活函数为LeakyRelu函数,处理公式如下:
r(l)~Bernoulli(pdropout),
Figure BDA0002701743530000104
Figure BDA0002701743530000105
Figure BDA0002701743530000106
其中,l表示当前神经网络层的第l层,Bernoulli函数生成第l层保留神经元数量的概率r(l),y(l)表示第l层的神经元向量,
Figure BDA0002701743530000107
表示其中第l层的保留的神经元向量,
Figure BDA0002701743530000108
表示神经元di从第l层传递到第l+1层之间的各参数权重,
Figure BDA0002701743530000109
为对应的偏置,FLeakyRelu为激活函数,xi表示神经元i数值,β为负值输入斜率;
S322、构建一层简易图卷积网络,其中设定跳频数为K,节点隐藏维度输出大小为Nv-g,处理公式如下:
Figure BDA00027017435300001010
其中,X是输入特征,W为所训练参数,
Figure BDA00027017435300001011
是包含自循环图的邻接矩阵,
Figure BDA00027017435300001012
是包含自循环图的度对角矩阵;
其中,S321中设定迭代K为2次、影响节点邻域的传递概率α为0.1;S322中跳频数为K=2,节点隐藏维度输出大小为Nv-g=200。
S33、最后构建模型的输出层,具体子步骤如下:
S331、构建最后一层简易图卷积网络,其中设定跳频数为K,节点隐藏维度输出大小为2,生成初创企业的共被投网络图Gc中各节点向量
Figure BDA0002701743530000111
S332:通过Sigmoid激活函数生成最终的预测值向量Voutput,处理公式如下所示:
Figure BDA0002701743530000112
Figure BDA0002701743530000113
其中Sigmoid(·)表示Sigmoid激活函数,W表示深度输出层各参数权重,b表示对应的偏置。
具体的,参见图4,S4包括以下步骤:
S41、获取S1中预处理后的的初创企业的共被投网络图Gc
S42、设定损失函数为交叉熵损失函数,并添加L2正则化项;
S43、设置优化器算法optimizer;
优化器算法optimizer为Adam优化算法,其中设置学习率为0.01,衰减率为0.01;
S44、设定对初创企业的共被投网络图训练迭代的次数为Nepoch,迭代更新模型;
其中设置整个训练数据集中的训练次数Nepoch设置为300;
S45、每轮更新采用小批量梯度下降法进行参数更新,其中每轮epoch迭代用于更新模型参数所使用的样本量为Nbatch
其中设置模型迭代所使用的样本量设置为64。
S46、循环执行步骤S45,直至达到设定的Nepoch截止,此时即训练好所述发展趋势评估模型。
本发明实施例1通过投资关系形成初创公司之间的共被投网络图,并结合相关投融资新闻文本信息,通过所建立的投融资机构发展趋势模型评估当前时间的热门程度,帮助风投数据分析师获得不同时期初创公司的发展趋势,作为评判的指标,辅助制定投资决策。本发明通过训练深度学习模型可快速预测并评估出初创企业的发展指标,并可通过不同时期的发展排序,帮助分析师快速获取到发展势头迅猛的初创企业;本发明结合初创企业所属行业领域、历史投资轮次状况以及从社会媒体投融资新闻文本中预训练的初创机构语义信息等相关信息,为投融资领域机构发展的评估提供了有力的度量信息;本发明从初创企业的属性信息、历史信息,并通过本发明设计的图卷积网络去获取共被投初创企业的邻域聚合策略,获得投资的高阶隐藏特征,通过所设计的基于图神经网络的投融资领域机构发展趋势评估的深度学习模型,可有效的获取到初创企业的发展评估值;试验表明,本发明方法在测试数据上的效果符合需求,排序效果已基本满足用户准确的掌握初创企业特定时期内的发展趋势。
实施例2
参见图5,本发明提供一种基于图神经网络的投融资机构评估系统,采用第一方面或其任意可能的实现方式中的基于图神经网络的投融资机构评估方法,包括:
共被投网络图构建单元1:用于截取给定时刻Tcurr之前的投资事件,构建初创企业的共被投网络图Gc
共被投网络图加工单元2:用于设定NG个时间段的初创企业共被投网络图,以Tinte为固定时间间隔,构建上一时刻Tcurr-Tinte的初创企业共被投网络图Gc-1i,依次类推构建剩余NG-1个初创企业共被投网络图,获得NG个初创企业共被投网络图;
评估模型构建单元3:用于构建基于图神经网络的投融资机构发展趋势评估模型;
评估模型训练单元4:用于对所述评估模型进行训练学习,获得最终用于评估的投融资机构发展趋势模型;
投融资机构发展评估单元5:用于对NG个所述初创企业共被投网络图训练对应时间段的NG个面向投融资机构发展趋势评估模型,并使用所述发展趋势评估模型评估出各节点的发展评估值,根据所述发展评估值的大小对NG个时间段的初创企业发展进行排序。
需要说明的是,上述系统各单元之间的信息交互、执行过程等内容,由于与本申请实施例中的方法实施例1基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述。
实施例3
第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质中存储用于基于图神经网络的投融资机构评估的程序代码,所述程序代码包括用于执行实施例1或其任意可能的实现方式中的基于图神经网络的投融资机构评估方法的指令。
计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(SolidStateDisk、SSD))等。
实施例4
参见图6,提供一种电子设备,所述电子设备包括处理器,所述处理器与存储介质耦合,当所述处理器执行存储介质中的指令时,使得所述电子设备执行实施例1或其任意可能的实现方式中的基于图神经网络的投融资机构评估方法。
具体的,处理器可以通过硬件来实现也可以通过软件来实现,当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于所述处理器之外,独立存在。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机600程序产品的形式实现。所述计算机600程序产品包括一个或多个计算机600指令。在计算机600上加载和执行所述计算机600程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机600可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机600指令可以存储在计算机600可读存储介质中,或者从一个计算机600可读存储介质向另一个计算机600可读存储介质传输,例如,所述计算机600指令可以从一个网站站点、计算机600、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机600、服务器或数据中心进行传输。
具体的,参见图5,示出了可用于实施根据本发明实施方式的方法和系统的计算机的示意性框图,在图5中,中央处理单元(CPU)601根据只读存储器(ROM)602中存储的程序或从存储部分608加载到随机存取存储器(RAM)603的程序执行各种处理。在RAM 603中,还根据需要存储当CPU 601执行各种处理等等时所需的数据。CPU 601、ROM 602和RAM 603经由总线604彼此连接。输入/输出接口605也连接到总线604。
下述部件连接到输入/输出接口605:输入部分606(包括键盘、鼠标等等)、输出部分607(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分608(包括硬盘等)、通信部分609(包括网络接口卡比如LAN卡、调制解调器等)。通信部分609经由网络比如因特网执行通信处理。根据需要,驱动器610也可连接到输入/输出接口605。可拆卸介质611比如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器610上,使得从中读出的计算机程序根据需要被安装到存储部分608中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质611安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图5所示的其中存储有程序的、与设备相分离地分发以向用户提供程序的可拆卸介质611。可拆卸介质611的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 602、存储部分608中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (8)

1.基于图神经网络的投融资机构评估方法,其特征在于,包括以下步骤:
步骤1、截取给定时刻Tcurr之前的投资事件,构建初创企业的共被投网络图Gc
步骤2、设定NG个时间段的初创企业共被投网络图,以Tinte为固定时间间隔,构建上一时刻Tcurr-Tinte的初创企业共被投网络图Gc-1i,依次类推构建剩余NG-1个初创企业共被投网络图,获得NG个初创企业共被投网络图;
步骤3、构建基于图神经网络的投融资机构发展趋势评估模型;
步骤4、对所述评估模型进行训练学习,获得最终用于评估的投融资机构发展趋势模型;
步骤5、对NG个所述初创企业共被投网络图训练对应时间段的NG个面向投融资机构发展趋势评估模型,并使用所述发展趋势评估模型评估出各节点的发展评估值,根据所述发展评估值的大小对NG个时间段的初创企业发展进行排序。
2.根据权利要求1所述的基于图神经网络的投融资机构评估方法,其特征在于,所述步骤1包括以下步骤:
步骤1.1、对所述共被投网络图Gc中初创企业的所属行业,通过One-Hot编码生成节点所属行业特征矩阵
Figure FDA0002701743520000011
步骤1.2、对所述共被投网络图Gc中初创企业的历史投资轮次,通过One-Hot编码生成节点投资轮次特征矩阵
Figure FDA0002701743520000012
步骤1.3、获取初创企业的成立时间差特征
Figure FDA0002701743520000013
并对所述成立时间差特征
Figure FDA0002701743520000014
进行Z-score标准化处理,处理公式为:
Figure FDA0002701743520000015
Figure FDA0002701743520000016
其中,T为当前年份与初创企业成立时间差,
Figure FDA0002701743520000017
为时间差系数;x为所有样本数据的原始值,μ为所有样本数据的均值,σ为所有样本数据的标准差,x*为所有样本数据归一化后的数值;
步骤1.4、获取初创企业在所述给定时刻Tcurr之前的投融资新闻文本,设置词向量长度为Nnews,采用训练模式为Skip-gram的Word2Vec算法对投融资新闻文本进行训练,获得各初创企业节点的新闻特征矩阵
Figure FDA0002701743520000021
步骤1.5、将步骤1.1至步骤1.4获得的节点特征进行拼接组合,获得初创企业共被投网络图Gc的节点特征矩阵Xnode
步骤1.6、将所述给定时刻Tcurr之前的所有投资事件中被同一投资机构所投资过的初创企业构建网络图中的边,获得边索引矩阵Xedges
步骤1.7、为所述给定时刻Tcurr之前的所有投资事件中的节点进行标注,选定时间间隔Tinte,对于时间间隔Tinte时间段内发生过投资的初创企业设置标签为1,未发生投资的初创企业设置标签为0,获得初创企业共被投网络图Gc的节点标签矩阵Ynode
3.根据权利要求2所述的基于图神经网络的投融资机构评估方法,其特征在于,所述步骤1.4中,对于共被投网络图Gc中没有获得新闻特征矩阵的初创企业,以各初创企业节点的新闻特征平均值,作为没有获得新闻特征矩阵的初创企业节点的新闻特征。
4.根据权利要求2所述的基于图神经网络的投融资机构评估方法,其特征在于,所述步骤3包括以下步骤:
步骤3.1、首先构建发展趋势评估模型的输入层,具体子步骤如下:
步骤3.1.1、将初创企业的共被投网络图Gc中初创企业节点的所属行业特征矩阵
Figure FDA0002701743520000022
进行数据压缩,转换成行业特征稠密向量
Figure FDA0002701743520000023
设定其神经元数量为Nindustry的行业特征嵌入层;
步骤3.1.2、将初创企业的共被投网络图Gc中初创企业节点的投资轮次特征矩阵
Figure FDA0002701743520000024
进行数据压缩,转换成投资轮次特征稠密向量
Figure FDA0002701743520000025
设定其神经元数量为Nrounds的行业特征嵌入层;
步骤3.1.3、将所述行业特征稠密向量
Figure FDA0002701743520000026
投资轮次特征稠密向量
Figure FDA0002701743520000027
输入的初创机构节点的新闻特征矩阵
Figure FDA0002701743520000028
和初创机构节点成立时间差特征
Figure FDA0002701743520000029
进行横向拼接,记为整个模型的输入层Xinput
步骤3.2、将初创企业的共被投网络图Gc的节点特征矩阵Xnode和所述输入层Xinput组合成图结构输入特征,传输到所构建的图卷积层,具体子步骤如下:
步骤3.2.1:构建堆叠两层的近似神经预测的个性化传播图神经网络层,其中设定迭代K次、影响节点邻域的传递概率α,处理公式如下:
X(0)=X,
Figure FDA0002701743520000031
其中,X是输入特征,X(0)为初始输入特征,
Figure FDA0002701743520000032
是包含自循环图的邻接矩阵,
Figure FDA0002701743520000033
是包含自循环图的度对角矩阵;
同时每层近似神经预测的个性化传播图神经网络层之后均添加一层对神经元剔除概率为pdropout的舍弃层,设置舍弃层的参数为β,激活函数为LeakyRelu函数,处理公式如下:
r(l)~Bernoulli(pdropout),
Figure FDA0002701743520000034
Figure FDA0002701743520000035
Figure FDA0002701743520000036
其中,l表示当前神经网络层的第l层,Bernoulli函数生成第l层保留神经元数量的概率r(l),y(l)表示第l层的神经元向量,
Figure FDA0002701743520000037
表示其中第l层的保留的神经元向量,
Figure FDA0002701743520000038
表示神经元di从第l层传递到第l+1层之间的各参数权重,
Figure FDA0002701743520000039
为对应的偏置,FLeakyRelu为激活函数,xi表示神经元i数值,β为负值输入斜率;
步骤3.2.2、构建一层简易图卷积网络,其中设定跳频数为K,节点隐藏维度输出大小为Nv-g,处理公式如下:
Figure FDA00027017435200000310
其中,X是输入特征,W为所训练参数,
Figure FDA00027017435200000311
是包含自循环图的邻接矩阵,
Figure FDA00027017435200000312
是包含自循环图的度对角矩阵;
步骤3.3、最后构建模型的输出层,具体子步骤如下:
步骤3.3.1、构建最后一层简易图卷积网络,其中设定跳频数为K,节点隐藏维度输出大小为2,生成初创企业的共被投网络图Gc中各节点向量
Figure FDA00027017435200000313
步骤3.3.2:通过Sigmoid激活函数生成最终的预测值向量Voutput,处理公式如下所示:
Figure FDA0002701743520000041
Figure FDA0002701743520000042
其中Sigmoid(·)表示Sigmoid激活函数,W表示深度输出层各参数权重,b表示对应的偏置。
5.根据权利要求4所述的基于图神经网络的投融资机构评估方法,其特征在于,所述步骤4包括以下步骤:
步骤4.1、获取步骤1中预处理后的的初创企业的共被投网络图Gc
步骤4.2、设定损失函数为交叉熵损失函数,并添加L2正则化项;
步骤4.3、设置优化器算法optimizer;
步骤4.4、设定对初创企业的共被投网络图训练迭代的次数为Nepoch,迭代更新模型;
步骤4.5、每轮更新采用小批量梯度下降法进行参数更新,其中每轮epoch迭代用于更新模型参数所使用的样本量为Nbatch
步骤4.6、循环执行步骤4.5,直至达到设定的Nepoch截止,此时即训练好所述发展趋势评估模型。
6.基于图神经网络的投融资机构评估系统,采用如权利要求1至5任一项的基于图神经网络的投融资机构评估方法,其特征在于,包括:
共被投网络图构建单元:用于截取给定时刻Tcurr之前的投资事件,构建初创企业的共被投网络图Gc
共被投网络图加工单元:用于设定NG个时间段的初创企业共被投网络图,以Tinte为固定时间间隔,构建上一时刻Tcurr-Tinte的初创企业共被投网络图Gc-1i,依次类推构建剩余NG-1个初创企业共被投网络图,获得NG个初创企业共被投网络图;
评估模型构建单元:用于构建基于图神经网络的投融资机构发展趋势评估模型;
评估模型训练单元:用于对所述评估模型进行训练学习,获得最终用于评估的投融资机构发展趋势模型;
投融资机构发展评估单元:用于对NG个所述初创企业共被投网络图训练对应时间段的NG个面向投融资机构发展趋势评估模型,并使用所述发展趋势评估模型评估出各节点的发展评估值,根据所述发展评估值的大小对NG个时间段的初创企业发展进行排序。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储用于基于图神经网络的投融资机构评估的程序代码,所述程序代码包括用于执行权利要求1至5中任一项所述的基于图神经网络的投融资机构评估方法的指令。
8.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器与存储介质耦合,当所述处理器执行存储介质中的指令时,使得所述电子设备执行权利要求1至5中任一项所述的基于图神经网络的投融资机构评估方法。
CN202011024535.4A 2020-09-25 2020-09-25 基于图神经网络的投融资机构评估方法、系统及设备 Pending CN112241920A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011024535.4A CN112241920A (zh) 2020-09-25 2020-09-25 基于图神经网络的投融资机构评估方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011024535.4A CN112241920A (zh) 2020-09-25 2020-09-25 基于图神经网络的投融资机构评估方法、系统及设备

Publications (1)

Publication Number Publication Date
CN112241920A true CN112241920A (zh) 2021-01-19

Family

ID=74171260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011024535.4A Pending CN112241920A (zh) 2020-09-25 2020-09-25 基于图神经网络的投融资机构评估方法、系统及设备

Country Status (1)

Country Link
CN (1) CN112241920A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113938310A (zh) * 2021-10-29 2022-01-14 水利部发展研究中心 一种水利固定资产投资统计数据质量控制管理系统
CN114186799A (zh) * 2021-11-21 2022-03-15 南京理工大学 基于异构图神经网络的企业估值方法及系统
CN114267191A (zh) * 2021-12-10 2022-04-01 北京理工大学 缓解交通拥堵驾驶员控制系统、方法、介质、设备及应用

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113938310A (zh) * 2021-10-29 2022-01-14 水利部发展研究中心 一种水利固定资产投资统计数据质量控制管理系统
CN113938310B (zh) * 2021-10-29 2023-11-28 水利部发展研究中心 一种水利固定资产投资统计数据质量控制管理系统
CN114186799A (zh) * 2021-11-21 2022-03-15 南京理工大学 基于异构图神经网络的企业估值方法及系统
CN114267191A (zh) * 2021-12-10 2022-04-01 北京理工大学 缓解交通拥堵驾驶员控制系统、方法、介质、设备及应用

Similar Documents

Publication Publication Date Title
TWI788529B (zh) 基於lstm模型的信用風險預測方法及裝置
CN109977151B (zh) 一种数据分析方法及系统
US20210303970A1 (en) Processing data using multiple neural networks
Miao et al. Context‐based dynamic pricing with online clustering
CN109766454A (zh) 一种投资者分类方法、装置、设备及介质
CN112241920A (zh) 基于图神经网络的投融资机构评估方法、系统及设备
Dittrich et al. Network autocorrelation modeling: A Bayes factor approach for testing (multiple) precise and interval hypotheses
CN111582538A (zh) 一种基于图神经网络的社群价值预测方法及系统
CN111177473A (zh) 人员关系分析方法、装置和可读存储介质
CN108564393A (zh) 潜在客户评分方法、装置和系统
CN112085615A (zh) 图神经网络的训练方法及装置
Mukunthu et al. Practical automated machine learning on Azure: using Azure machine learning to quickly build AI solutions
Eddy et al. Credit scoring models: Techniques and issues
CN114154557A (zh) 癌症组织分类方法、装置、电子设备及存储介质
CN115983900A (zh) 用户营销策略的构建方法、装置、设备、介质和程序产品
Zhang et al. A generative adversarial network–based method for generating negative financial samples
Wang et al. Who are the best adopters? User selection model for free trial item promotion
US20220374682A1 (en) Supporting Database Constraints in Synthetic Data Generation Based on Generative Adversarial Networks
Zhang et al. Efficient history matching with dimensionality reduction methods for reservoir simulations
WO2023185125A1 (zh) 产品资源的数据处理方法及装置、电子设备、存储介质
Dag et al. Diverse classifiers ensemble based on GMDH-type neural network algorithm for binary classification
CN116522232A (zh) 文档分类方法、装置、设备及存储介质
Kalaycı et al. Optimal model description of finance and human factor indices
CN112446777A (zh) 一种信用评估方法、装置、设备及存储介质
CN115344794A (zh) 一种基于知识图谱语义嵌入的旅游景点推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination