CN117236521A - 产业风险等级预测方法、装置、设备及存储介质 - Google Patents
产业风险等级预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117236521A CN117236521A CN202311492853.7A CN202311492853A CN117236521A CN 117236521 A CN117236521 A CN 117236521A CN 202311492853 A CN202311492853 A CN 202311492853A CN 117236521 A CN117236521 A CN 117236521A
- Authority
- CN
- China
- Prior art keywords
- industry
- risk
- predicted
- industrial
- risk prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000013058 risk prediction model Methods 0.000 claims abstract description 72
- 238000012544 monitoring process Methods 0.000 claims abstract description 66
- 238000010801 machine learning Methods 0.000 claims abstract description 24
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 15
- 235000018185 Betula X alpestris Nutrition 0.000 claims description 12
- 235000018212 Betula X uliginosa Nutrition 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 description 7
- 238000013461 design Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种产业风险等级预测方法、装置、设备及存储介质。该方法包括:根据产业知识图谱确定待预测产业的关联产业,以及待预测产业与关联产业的相关性指数,关联产业包括:至少一个上游产业和/或至少一个下游产业;获取待预测产业以及每一个关联产业的产业监控数据;将待预测产业以及每一个关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成待预测产业以及每一个关联产业的风险预测值;根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级。本申请的方法,提高了产业风险等级预测准确性。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种产业风险等级预测方法、装置、设备及存储介质。
背景技术
产业风险是指产业中某些因素的变化所产生的风险,例如,当某个行业的工人罢工,或者原材料的供应受到国内外同行业的竞争时,都会对这个行业的企业造成损害,从而给该行业股票的投资者带来风险。因此产业风险监控或产业风险等级预测等方法在产业运行过程中显得尤为重要。
现有技术中,产业风险主要通过人工的方式根据产业现状以及个人经验进行预测。
然而,人工的方式会导致产业风险等级预测准确性低的问题。
发明内容
本申请提供一种产业风险等级预测方法、装置、设备及存储介质,用以解决产业风险等级预测准确性低的问题。
第一方面,本申请提供一种产业风险等级预测方法,包括:
根据产业知识图谱确定待预测产业的关联产业,以及所述待预测产业与所述关联产业的相关性指数,所述关联产业包括:至少一个上游产业和/或至少一个下游产业;
获取所述待预测产业以及每一个所述关联产业的产业监控数据;
将所述待预测产业以及每一个所述关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成所述待预测产业以及每一个所述关联产业的风险预测值;
根据各产业的所述风险预测值,以及所述待预测产业与所述关联产业的相关性指数,生成待预测产业的风险等级。
在一种可能的设计中,所述方法还包括:获取历史产业数据;通过开放域关系抽取模型DSNF从所述历史产业数据中抽取关系三元组;通过三元组表示模型Transp生成所述关系三元组的嵌入向量;通过层次聚类模型Birch对所述关系三元组的嵌入向量进行归并,生成所述产业知识图谱。
在一种可能的设计中,所述方法还包括:获取包括风险标签的历史产业监控数据;构建基于机器学习的初始产业风险预测模型;采用所述包括风险标签的历史产业监控数据对所述初始产业风险预测模型进行训练,得到所述产业风险预测模型。
在一种可能的设计中,所述获取包括风险标签的历史产业监控数据,包括:获取历史产业监控数据;根据产业风险因素对所述历史产业监控数据进行标签标记处理,得到所述包括风险标签的历史产业监控数据。
在一种可能的设计中,所述采用所述包括风险标签的历史产业监控数据对所述初始产业风险预测模型进行训练,得到所述产业风险预测模型,包括:
将所述包括风险标签的历史产业监控数据输入所述初始产业风险预测模型,输出对应产业的风险预测值;根据所述对应产业的风险预测值,以及所述风险标签,对所述初始产业风险预测模型的参数进行调整,得到所述产业风险预测模型。
在一种可能的设计中,所述采用所述包括风险标签的历史产业监控数据对所述初始产业风险预测模型进行训练,得到所述产业风险预测模型,还包括:若经过参数调整后的模型达到预设的收敛条件,将得到的产业风险预测模型作为最终的产业风险预测模型,否则,重复将所述包括风险标签的历史产业监控数据输入所述产业风险预测模型,以及根据所述风险标签对所述初始产业风险预测模型的参数进行调整的过程。
在一种可能的设计中,所述根据所述风险预测值,以及所述待预测产业与所述关联产业的相关性指数,生成待预测产业的风险等级,包括:根据所述各产业的所述风险预测值,以及所述待预测产业与所述关联产业的相关性指数,生成所述各产业的风险预测值权重;根据所述各产业的风险预测值权重以及所述各产业的风险预测值,生成待预测产业的综合风险预测值;根据所述综合风险预测值以及预设的各风险等级的风险值范围,确定所述待预测产业的风险等级。
第二方面,本申请提供一种产业风险等级预测装置,包括:
确定模块,用于根据产业知识图谱确定待预测产业的关联产业,以及所述待预测产业与所述关联产业的相关性指数,所述关联产业包括:至少一个上游产业和/或至少一个下游产业;
获取模块,用于获取所述待预测产业以及每一个所述关联产业的产业监控数据;
生成模块,用于将所述待预测产业以及每一个所述关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成所述待预测产业以及每一个所述关联产业的风险预测值;
所述生成模块,还用于根据各产业的所述风险预测值,以及所述待预测产业与所述关联产业的相关性指数,生成待预测产业的风险等级。
第三方面,本申请提供一种产业风险等级预测设备,包括:
处理器,存储器,通信接口;
所述存储器用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行如上第一方面所述的产业风险等级预测方法。
第四方面,本申请提供一种可读存储介质,包括:其上存储有计算机程序,所述计算机程序被处理器执行时实现执行如上第一方面所述的产业风险等级预测方法。
本申请提供的 产业风险等级预测方法、装置、设备及存储介质,通过根据产业知识图谱确定待预测产业的关联产业,以及待预测产业与关联产业的相关性指数,关联产业包括:至少一个上游产业和/或至少一个下游产业,获取待预测产业以及每一个关联产业的产业监控数据,将待预测产业以及每一个关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成待预测产业以及每一个关联产业的风险预测值,根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级,其中,根据产业知识图谱可以准确地确定待预测产业的关联产业以及各关联产业与待预测产业的相关性指数,基于历史产业风险标签数据进行机器学习的产业风险预测模型可以准确地预测待预测产业以及各关联产业的风险值,进一步根据相关性指数以及预测的各产业的风险值可以准确地确定待预测产业地风险等级,提高了产业风险等级预测方法的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的产业风险等级预测方法的流程示意图;
图2为本申请实施例提供的构建产业知识图谱的流程示意图;
图3为本申请实施例提供的构建产业风险预测模型的流程示意图;
图4为本申请实施例提供的根据风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级的流程示意图;
图5为本申请实施例提供的一种产业风险等级预测装置的结构示意图;
图6为本申请实施例提供的一种产业风险等级预测设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
现有技术中,产业风险主要通过人工的方式根据产业现状以及个人经验进行预测。然而,人工的方式会导致产业风险等级预测准确性低的问题。
本申请通过根据产业知识图谱确定待预测产业的关联产业,以及待预测产业与关联产业的相关性指数,关联产业包括:至少一个上游产业和/或至少一个下游产业,获取待预测产业以及每一个关联产业的产业监控数据,将待预测产业以及每一个关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成待预测产业以及每一个关联产业的风险预测值,根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级,其中,根据产业知识图谱可以准确地确定待预测产业的关联产业以及各关联产业与待预测产业的相关性指数,基于历史产业风险标签数据进行机器学习的产业风险预测模型可以准确地预测待预测产业以及各关联产业的风险值,进一步根据相关性指数以及预测的各产业的风险值可以准确地确定待预测产业地风险等级,提高了产业风险等级预测方法的准确性。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1为本申请第一实施例提供的产业风险等级预测方法的流程示意图,执行主体为产业风险等级预测装置,一般而言可以通过软件实现,或者硬件实现,或者软件和硬件相结合的方式实现。
如图1所示,本实施例的产业风险等级预测方法可以包括以下步骤:
步骤S101、根据产业知识图谱确定待预测产业的关联产业,以及待预测产业与关联产业的相关性指数,关联产业包括:至少一个上游产业和/或至少一个下游产业。
具体地,可以根据产业知识图谱确定待预测产业的关联产业,以及待预测产业与关联产业的相关性指数,其中,关联产业包括:至少一个上游产业和/或至少一个下游产业。其中,知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,产业知识图谱是指以知识图谱的形式对产业实体结构进行构建而成的图谱,产业知识图谱不仅可以体现产业自身各构成之间的关系,还可以体现各关联产业,例如:上游产业和/活下游产业之间的关系。其中,本申请对根据产业知识图谱确定关联产业,以及与关联产业的相关性指数的方法不做限定。
步骤S102、获取待预测产业以及每一个关联产业的产业监控数据。
具体地,在步骤S101中描述的根据产业知识图谱确定待预测产业的关联产业之后,可以分别获取待预测产业以及每一个关联产业的产业监控数据。其中,产业监控数据是指任何可以监控产业风险因素的产业相关数据,例如:与行业发展相关联的政府信息数据、社会经济发展信息数据、行业中各企业运营数据等数据。其中,本申请对获取产业监控数据的方式不做限定,任何能够获取本申请所需的产业监控数据的方式都可以作为本申请的获取产业监控数据的方式,可选的,可以结合步骤S101中描述的知识产业图谱确定待预测产业以及每一个关联产业所需获取的产业监控数据的类型,进一步采用合适的方式分别对各类型的产业监控数据进行采集。
步骤S103、将待预测产业以及每一个关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成待预测产业以及每一个关联产业的风险预测值。
具体地,可以将步骤S102中获取的待预测产业以及每一个关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成待预测产业以及每一个关联产业的风险预测值。其中,产业风险预测模型是基于历史产业风险标签数据进行机器学习的得到的、用于根据输入的产业监控数据对产业的风险值进行预测的模型。
步骤S104、根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级。
其中,由于待预测产业的风险等级不仅与待预测产业自身的风险预测值相关,还与其关联产业的风险预测值相关。具体地,可以根据步骤S103中生成的待预测产业以及每一个关联产业的风险预测值,即待预测产业、至少一个上游产业以及至少一个下游产业的风险预测值,以及步骤S101中确定的待预测产业与关联产业的相关性指数,即各上游产业与下游产业与待预测产业之间的相关性指数,生成待预测产业的风险等级。其中,待预测产业的风险等级是用于表征待预测产业的风险高低的等级,风险等级越高,待预测产业的风险越高。
可选的,可以根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成各产业的风险预测值权重,并根据各产业的风险预测值权重生成待预测产业的综合风险预测值,进一步根据待预测产业的综合风险预测值确定待预测产业的风险等级。
本实施例提供的产业风险等级预测方法,通过根据产业知识图谱确定待预测产业的关联产业,以及待预测产业与关联产业的相关性指数,关联产业包括:至少一个上游产业和/或至少一个下游产业,获取待预测产业以及每一个关联产业的产业监控数据,将待预测产业以及每一个关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成待预测产业以及每一个关联产业的风险预测值,根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级,其中,根据产业知识图谱可以准确地确定待预测产业的关联产业以及各关联产业与待预测产业的相关性指数,基于历史产业风险标签数据进行机器学习的产业风险预测模型可以准确地预测待预测产业以及各关联产业的风险值,进一步根据相关性指数以及预测的各产业的风险值可以准确地确定待预测产业地风险等级,提高了产业风险等级预测方法的准确性。
图2为本申请第二实施例提供的构建产业知识图谱的流程示意图,在图1所示实施例的基础上,在根据产业知识图谱确定待预测产业的关联产业之前,还包括:构建产业知识图谱的过程,本实施例对构建产业知识图谱的过程进行了展开描述。
如图2所示,本实施例的构建产业知识图谱的过程可以包括以下步骤:
步骤S201、获取历史产业数据。
具体地,可以获取各产业的历史产业数据,其中产业数据是指产业的基础数据,其中,产业的基础数据包括但不限于步骤S102中描述的产业监控数据。其中,本实施例对获取产业数据的方式不做限定,可选的,可以通过数据采集引擎等方式获取。
步骤S202、通过开放域关系抽取模型DSNF从历史产业数据中抽取关系三元组。
具体地,在获取历史产业数据之后,可以开放域关系抽取模型DSNF(DependencySemantic Normal Forms)从历史产业数据中抽取关系三元组。其中,由于中文开放三元组抽取语料的缺乏以及中文语言学上的特点,基于中文句法分析提出了无监督开放域三元组抽取模型DSNF,与字面特征相比,依存关系能捕获文本的语义和句法层次的特征,因此更适用于关系抽取任务。在句法依存树中,实体对通常以名词短语的形式出现,其间的依存路径恰好包含了两者之间的关系。
步骤S203、通过三元组表示模型Transp生成关系三元组的嵌入向量。
具体地,可以通过三元组表示模型Transp,生成步骤S202中抽取的关系三元组的嵌入向量。其中,考虑到从产业政策文本中抽取到的实体和关系通常包含丰富的实际语义,且需要根据语义对三元组进行归并,本申请使用能够编码语义信息的表示模型TransP 为原始三元组生成嵌入向量。其中,基于TransP的三元组表示,可以参考如下表格,其中,h, t, v 分别表示三元组中的头实体、尾实体、动词短语。相应的加粗字母h, t, v 代表对应的向量。G 表示正例三元组集合,G' 表示负例三元组集合。
步骤S204、通过层次聚类模型Birch对关系三元组的嵌入向量进行归并,生成产业知识图谱。
具体地,由于DSNF 为开放域三元组抽取模型,抽取到的政策实体、关系所属类别数量较多,且难以事先确定,本申请基于所得嵌入向量v,利用层次聚类模型Birch对原始三元组进行归并分组。在层次聚类模型中,平衡迭代削减层次聚类模型(Balanced IterativeReducing and ClusteringUsing Hierarchies, BIRCH)有着较优的时间复杂度,O(N),其中N 为样本数量。
考虑到从产业政策文本中抽取到的原始三元组数量庞大,本申请选择BIRCH 作为层次聚类模型。其中,BIRCH 通过构建聚类特征树(ClusteringFeature Tree, CF Tree)实现只需要单次扫描数据集即可完成聚类,每棵CF Tree 则由若干聚类特征(ClusteringFeature, CF)组成。其中,在CF Tree 中,一个CF 是以三元组的形式定义的,记为(N,LS,SS)。其中N 代表了这个CF 中拥有的样本点的数量;LS 代表了这个CF 中拥有的样本点各特征维度的和向量;SS 代表了这个CF 中拥有的样本点各特征维度的平方和。在此定义下,CF 满足线性关系,即CF1+CF2=(N1+N2, LS1+LS2, SS1+SS2) 在此基础上,BIRCH 将该性质扩展到了CF Tree 中,即对于每个父节点中的CF 节点,它的三元组的值等于其所指向的所有子节点的三元组之和。
具体地,BIRCH 构造CF Tree 的过程可以包括以下步骤:
首先,从根节点向下寻找和新样本距离最近的叶子节点和叶子节点里最近的CF节点;
其次,如果新样本加入后,这个CF 节点对应的超球体半径仍然满足小于阈值T,则更新路径上所有的CF 三元组,插入结束。否则,如果当前叶子节点的CF 节点个数小于阈值L,则创建一个新的CF 节点,放入新样本,将新的CF 节点放入这个叶子节点,更新路径上所有的CF 三元组,插入结束。否则,将当前叶子节点划分为两个新叶子节点,选择旧叶子节点中所有CF 元组里超球体距离最远的两个CF 元组,分布作为两个新叶子节点的第一个CF节点。将其他元组和新样本元组按照距离远近原则放入对应的叶子节点。依次向上检查父节点是否也要分裂,如果需要按和叶子节点分裂方式相同。在将所有样本建立成为CF Tree后,BIRCH 对应的输出就是若干个CF 节点,并将每个节点里的样本点视作一个聚类的簇。
具体地,再对关系三元组的嵌入向量进行归并之后,可以将归并后的三元组导入图数据库例如:Neo4j中,以生成产业知识图谱。
本实施例提供的构建产业知识图谱的过程,通过获取历史产业数据,通过开放域关系抽取模型DSNF从历史产业数据中抽取关系三元组,通过三元组表示模型Transp生成关系三元组的嵌入向量,通过层次聚类模型Birch对关系三元组的嵌入向量进行归并,生成产业知识图谱,其中,开放域关系抽取模型DSNF,具有自动进行三元组抽取、通用性强、不需要针对个别领域进行训练,从而节省了数据标注和训练计算的成本,在大数据背景下具有较高的效率的特点,其中,采用三元组表示模型TransP 和层次聚类模型BIRCH 生成三元组的嵌入向量并对其进行归并,提高了准确性和效率,综合上述因素,提高了构建产业知识图谱的准确性。
图3为本申请第三实施例提供的构建产业风险预测模型的流程示意图,在图1或图2所示实施例的基础上,将待预测产业以及每一个关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型之前,还包括构建产业风险预测模型的过程,本实施例对构建产业风险预测模型进行了展开描述。
如图3所示,本实施例的构建产业风险预测模型的过程可以包括以下步骤:
步骤S301、获取包括风险标签的历史产业监控数据。
具体地,可以获取包括风险标签的历史产业监控数据,其中,风险标签是指用于标识产业监控数据的风险的标签。
具体地,首先可以获取历史产业监控数据。其中,对产业监控数据的描述可以参考步骤S102中的描述,本实施例不再赘述。其次,可以根据产业风险因素对历史产业监控数据进行标签标记处理,得到包括风险标签的历史产业监控数据。其中,产业风险因素是指产业监控数据中能体现产业风险的因素,例如:产业风险因素可以是某一产业监控数据中的异常数据,若历史产业监控数据中存在上述风险因素,对历史产业数据进行标签标记处理,即标记风险标签,得到包括风险标签的历史产业监控数据。
步骤S302、构建基于机器学习的初始产业风险预测模型。
具体地,可以构建基于机器学习的初始产业风险预测模型,其中,本申请对基于机器学习的初始产业风险预测模型的构建过程不做限定,任何能够完成本申请要求的初始产业风险预测模型的构建的过程,都可以作为本申请的基于机器学习的初始产业风险预测模型的构建过程。
步骤S303、采用包括风险标签的历史产业监控数据对初始产业风险预测模型进行训练,得到产业风险预测模型。
具体地,可以采用步骤S301中获取的包括风险标签的历史产业监控数据对步骤S302中构建得到的基于机器学习的初始产业风险预测模型进行训练,得到产业风险预测模型。
可选的,首先,可以将包括风险标签的历史产业监控数据输入初始产业风险预测模型,输出对应产业的风险预测值。可选的,风险标签的数量越多,对应的风险预测值越高。其次,可以根据对应产业的风险预测值,以及风险标签,对初始产业风险预测模型的参数进行调整,得到产业风险预测模型。可选的,若风险标签的数量与风险预测值成反比例变化,对初始产业风险预测模型的参数进行调整,以使风险标签的数量与风险预测值成正比例变化。其中,若经过参数调整后的模型达到预设的收敛条件,将得到的产业风险预测模型作为最终的产业风险预测模型,否则,重复将包括风险标签的历史产业监控数据输入产业风险预测模型,以及根据风险标签对初始产业风险预测模型的参数进行调整的过程。可选的,收敛条件包括但不限于:训练次数超过预设的训练次数阈值和/或模型的准确率等参数达到预设的参数阈值等条件。
本实施例提供的构建产业风险预测模型的过程,通过获取包括风险标签的历史产业监控数据,构建基于机器学习的初始产业风险预测模型,采用包括风险标签的历史产业监控数据对初始产业风险预测模型进行训练,得到产业风险预测模型,其中,风险标签是基于真实的历史风险因素标记的,采用包括风险标签的历史产业监控数据对初始产业风险预测模型进行训练,可以提高产业风险预测模型的准确性,进一步提高产业风险等级预测方法的准确性。
图4为本申请第四实施例提供的根据风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级的流程示意图,在图1或图2或图3所示实施例的基础上,本实施例对根据风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级的过程进行了展开描述。
如图4所示,本实施例的根据风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级可以包括以下步骤:
步骤S401、根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成各产业的风险预测值权重,并根据各产业的风险预测值权重以及各产业的风险预测值,生成待预测产业的综合风险预测值。
其中,由于待预测产业的风险等级不仅与待预测产业自身的风险预测值相关,还与其关联产业的风险预测值相关,与待预测产业关联性越强的企业,即关联性指数越高的企业,其风险预测值对待预测产业的风险等级的影响越大,具体地,可以根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业和各关联产业的预测值权重,其中,本申请对生成各产业的风险预测值权重的方法不做限定。
具体地,在生成各产业的风险预测值权重之后,可以根据生成的各产业的风险预测值权重以及各产业的风险预测值,生成待预测产业的综合风险预测值。
步骤S402、根据综合风险预测值以及预设的各风险等级的风险值范围,确定待预测产业的风险等级。
具体地,可以根据步骤S402中生成的待预测产业的综合风险预测值以及预设的各风险等级的风险值范围,确定待预测产业的风险等级。其中,对风险等级的描述可以参考步骤S1045中的描述,本实施例不再赘述。其中,风险等级的数量,以及各风险等级的风险值范围可以根据用户需求进行预设,本申请对风险等级的预设方法不做限定。
本实施例提供的待预测产业与关联产业的相关性指数,生成待预测产业的风险等级的过程,通过根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成各产业的风险预测值权重,并根据各产业的风险预测值权重以及各产业的风险预测值,生成待预测产业的综合风险预测值,根据综合风险预测值以及预设的各风险等级的风险值范围,确定待预测产业的风险等级,其中,通过关联产业的相关性指数生成各产业的风险预测值权重,并进一步生成待预测产业的综合风险预测值的方式,可以提高待预测产业的风险预测值的准确性,进一步提高了待预测产业的风险等级预测的准确性,提高了产业风险等级预测方法的准确性。
图5为本申请第五实施例提供的一种产业风险等级预测装置的结构示意图。
如图5所示,本实施例的产业风险等级预测装置50包括确定模块51、获取模块52以及生成模块53。
确定模块51,用于根据产业知识图谱确定待预测产业的关联产业,以及待预测产业与关联产业的相关性指数,关联产业包括:至少一个上游产业和/或至少一个下游产业。
获取模块52,用于获取待预测产业以及每一个关联产业的产业监控数据。
生成模块53,用于将待预测产业以及每一个关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成待预测产业以及每一个关联产业的风险预测值。
生成模块53,还用于根据各产业的风险预测值,以及待预测产业与关联产业的相关性指数,生成待预测产业的风险等级。
本实施例提供的装置,可用于执行上述方法实施例图1到图产业风险等级预测的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图6为本申请第六实施例提供的一种产业风险等级预测设备的结构示意图。
如图6所示,本实施例的产业风险等级预测设备60包括:处理器61,存储器62,通信接口63。
存储器62用于存储处理器的可执行指令;
其中,处理器61配置为经由执行可执行指令来执行上述方法实施例图1到图4任一项的产业风险等级预测方法。
在上述的图6所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速存储器(Random Access Memory,RAM),也可能还包括非易失性存储器(Non-volatile Memory,NVM),例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请实施例还提供一种可读存储介质,其上存储有计算机程序,其中计算机程序被处理器执行时实现执行上述方法实施例图1到图4任一项的产业风险等级预测方法。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
Claims (10)
1.一种产业风险等级预测方法,其特征在于,包括:
根据产业知识图谱确定待预测产业的关联产业,以及所述待预测产业与所述关联产业的相关性指数,所述关联产业包括:至少一个上游产业和/或至少一个下游产业;
获取所述待预测产业以及每一个所述关联产业的产业监控数据;
将所述待预测产业以及每一个所述关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成所述待预测产业以及每一个所述关联产业的风险预测值;
根据各产业的所述风险预测值,以及所述待预测产业与所述关联产业的相关性指数,生成待预测产业的风险等级。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取历史产业数据;
通过开放域关系抽取模型DSNF从所述历史产业数据中抽取关系三元组;
通过三元组表示模型Transp生成所述关系三元组的嵌入向量;
通过层次聚类模型Birch对所述关系三元组的嵌入向量进行归并,生成所述产业知识图谱。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取包括风险标签的历史产业监控数据;
构建基于机器学习的初始产业风险预测模型;
采用所述包括风险标签的历史产业监控数据对所述初始产业风险预测模型进行训练,得到所述产业风险预测模型。
4.根据权利要求3所述的方法,其特征在于,所述获取包括风险标签的历史产业监控数据,包括:
获取历史产业监控数据;
根据产业风险因素对所述历史产业监控数据进行标签标记处理,得到所述包括风险标签的历史产业监控数据。
5.根据权利要求4所述的方法,其特征在于,所述采用所述包括风险标签的历史产业监控数据对所述初始产业风险预测模型进行训练,得到所述产业风险预测模型,包括:
将所述包括风险标签的历史产业监控数据输入所述初始产业风险预测模型,输出对应产业的风险预测值;
根据所述对应产业的风险预测值,以及所述风险标签,对所述初始产业风险预测模型的参数进行调整,得到所述产业风险预测模型。
6.根据权利要求5所述的方法,其特征在于,所述采用所述包括风险标签的历史产业监控数据对所述初始产业风险预测模型进行训练,得到所述产业风险预测模型,还包括:
若经过参数调整后的模型达到预设的收敛条件,将得到的产业风险预测模型作为最终的产业风险预测模型,否则,重复将所述包括风险标签的历史产业监控数据输入所述产业风险预测模型,以及根据所述风险标签对所述初始产业风险预测模型的参数进行调整的过程。
7.根据权利要求6所述的方法,其特征在于,所述根据所述风险预测值,以及所述待预测产业与所述关联产业的相关性指数,生成待预测产业的风险等级,包括:
根据所述各产业的所述风险预测值,以及所述待预测产业与所述关联产业的相关性指数,生成所述各产业的风险预测值权重;
根据所述各产业的风险预测值权重以及所述各产业的风险预测值,生成待预测产业的综合风险预测值;
根据所述综合风险预测值以及预设的各风险等级的风险值范围,确定所述待预测产业的风险等级。
8.一种产业风险等级预测装置,其特征在于,包括:
确定模块,用于根据产业知识图谱确定待预测产业的关联产业,以及所述待预测产业与所述关联产业的相关性指数,所述关联产业包括:至少一个上游产业和/或至少一个下游产业;
获取模块,用于获取所述待预测产业以及每一个所述关联产业的产业监控数据;
生成模块,用于将所述待预测产业以及每一个所述关联产业的产业监控数据,分别输入基于历史产业风险标签数据进行机器学习的产业风险预测模型,生成所述待预测产业以及每一个所述关联产业的风险预测值;
所述生成模块,还用于根据各产业的所述风险预测值,以及所述待预测产业与所述关联产业的相关性指数,生成待预测产业的风险等级。
9.一种产业风险等级预测设备,其特征在于,包括:
处理器,存储器,通信接口;
所述存储器用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的产业风险等级预测方法。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现执行权利要求1至7任一项所述的产业风险等级预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311492853.7A CN117236521A (zh) | 2023-11-10 | 2023-11-10 | 产业风险等级预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311492853.7A CN117236521A (zh) | 2023-11-10 | 2023-11-10 | 产业风险等级预测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117236521A true CN117236521A (zh) | 2023-12-15 |
Family
ID=89088335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311492853.7A Pending CN117236521A (zh) | 2023-11-10 | 2023-11-10 | 产业风险等级预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117236521A (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760443A (zh) * | 2016-02-03 | 2016-07-13 | 广州市动景计算机科技有限公司 | 项目推荐系统、项目推荐装置以及项目推荐方法 |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
CN109255034A (zh) * | 2018-08-08 | 2019-01-22 | 数据地平线(广州)科技有限公司 | 一种基于产业链的行业知识图谱构建方法 |
CN110458324A (zh) * | 2019-07-04 | 2019-11-15 | 重庆金融资产交易所有限责任公司 | 风险概率的计算方法、装置和计算机设备 |
CN112015909A (zh) * | 2020-08-19 | 2020-12-01 | 普洛斯科技(重庆)有限公司 | 知识图谱的构建方法及装置、电子设备、存储介质 |
CN113177729A (zh) * | 2021-05-20 | 2021-07-27 | 北京龙盾数据有限公司 | 基于企业关联风险传导的风险预警方法、系统及设备 |
CN113392229A (zh) * | 2021-08-13 | 2021-09-14 | 四川新龟科技有限公司 | 供应链关系构建和预测方法、装置、设备、存储介质 |
CN114491063A (zh) * | 2021-12-31 | 2022-05-13 | 北京航天智造科技发展有限公司 | 一种基于行业与供应链关系的产业链可视化方法 |
CN115062006A (zh) * | 2022-06-16 | 2022-09-16 | 平安银行股份有限公司 | 一种基于关联企业的风险评估方法及系统 |
CN116307724A (zh) * | 2023-03-22 | 2023-06-23 | 江苏风云科技服务有限公司 | 一种基于复杂网络的产业链风险传播方法和系统 |
CN116384551A (zh) * | 2023-03-10 | 2023-07-04 | 青岛理工大学 | 一种基于知识图谱的上市企业违法风险预测方法 |
CN116383414A (zh) * | 2023-01-10 | 2023-07-04 | 国网上海市电力公司 | 一种基于碳核查知识图谱的智能文件评审系统及方法 |
CN116629606A (zh) * | 2023-05-15 | 2023-08-22 | 国网浙江省电力有限公司信息通信分公司 | 一种基于电力数据的产业链预警方法、装置、设备及介质 |
-
2023
- 2023-11-10 CN CN202311492853.7A patent/CN117236521A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760443A (zh) * | 2016-02-03 | 2016-07-13 | 广州市动景计算机科技有限公司 | 项目推荐系统、项目推荐装置以及项目推荐方法 |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
CN109255034A (zh) * | 2018-08-08 | 2019-01-22 | 数据地平线(广州)科技有限公司 | 一种基于产业链的行业知识图谱构建方法 |
CN110458324A (zh) * | 2019-07-04 | 2019-11-15 | 重庆金融资产交易所有限责任公司 | 风险概率的计算方法、装置和计算机设备 |
CN112015909A (zh) * | 2020-08-19 | 2020-12-01 | 普洛斯科技(重庆)有限公司 | 知识图谱的构建方法及装置、电子设备、存储介质 |
CN113177729A (zh) * | 2021-05-20 | 2021-07-27 | 北京龙盾数据有限公司 | 基于企业关联风险传导的风险预警方法、系统及设备 |
CN113392229A (zh) * | 2021-08-13 | 2021-09-14 | 四川新龟科技有限公司 | 供应链关系构建和预测方法、装置、设备、存储介质 |
CN114491063A (zh) * | 2021-12-31 | 2022-05-13 | 北京航天智造科技发展有限公司 | 一种基于行业与供应链关系的产业链可视化方法 |
CN115062006A (zh) * | 2022-06-16 | 2022-09-16 | 平安银行股份有限公司 | 一种基于关联企业的风险评估方法及系统 |
CN116383414A (zh) * | 2023-01-10 | 2023-07-04 | 国网上海市电力公司 | 一种基于碳核查知识图谱的智能文件评审系统及方法 |
CN116384551A (zh) * | 2023-03-10 | 2023-07-04 | 青岛理工大学 | 一种基于知识图谱的上市企业违法风险预测方法 |
CN116307724A (zh) * | 2023-03-22 | 2023-06-23 | 江苏风云科技服务有限公司 | 一种基于复杂网络的产业链风险传播方法和系统 |
CN116629606A (zh) * | 2023-05-15 | 2023-08-22 | 国网浙江省电力有限公司信息通信分公司 | 一种基于电力数据的产业链预警方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
揣子昂等: "产业知识政策知识图谱的自动化构建", 《情报工程》, vol. 8, no. 3, pages 34 - 40 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210165955A1 (en) | Methods and systems for modeling complex taxonomies with natural language understanding | |
CA3098802C (en) | Systems and methods for generating a contextually and conversationally correct response to a query | |
CN111444320B (zh) | 文本检索方法、装置、计算机设备和存储介质 | |
CN111222305B (zh) | 一种信息结构化方法和装置 | |
CN111125334B (zh) | 一种基于预训练的搜索问答系统 | |
CN109726298B (zh) | 适用于科技文献的知识图谱构建方法、系统、终端及介质 | |
CN112035599B (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN110597844B (zh) | 异构数据库数据统一访问方法及相关设备 | |
US20200364216A1 (en) | Method, apparatus and storage medium for updating model parameter | |
CN112613293B (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
CN110555205A (zh) | 否定语义识别方法及装置、电子设备、存储介质 | |
CN115827819A (zh) | 一种智能问答处理方法、装置、电子设备及存储介质 | |
CN115759119B (zh) | 一种金融文本情感分析方法、系统、介质和设备 | |
CN113360582A (zh) | 基于bert模型融合多元实体信息的关系分类方法及系统 | |
CN117251455A (zh) | 一种基于大模型的智能报表生成方法及其系统 | |
CN113157888A (zh) | 支持多知识来源的询问答复方法、装置和电子设备 | |
CN117271558A (zh) | 语言查询模型构建方法、查询语言获取方法及相关装置 | |
CN111104422A (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
US20200202074A1 (en) | Semsantic parsing | |
CN117236521A (zh) | 产业风险等级预测方法、装置、设备及存储介质 | |
CN114970531A (zh) | 基于即时通信消息的意图识别与命名实体提取方法及装置 | |
CN114528459A (zh) | 一种基于语义的网页信息抽取方法及系统 | |
RU2572367C1 (ru) | Способ поиска информации в предварительно преобразованном структурированном массиве данных | |
CN117573956B (zh) | 元数据管理方法、装置、设备及存储介质 | |
CN114925185B (zh) | 交互方法、模型的训练方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |