CN114064886A - 基于深度学习的矿山项目风险应对措施推荐方法及系统 - Google Patents
基于深度学习的矿山项目风险应对措施推荐方法及系统 Download PDFInfo
- Publication number
- CN114064886A CN114064886A CN202111414495.9A CN202111414495A CN114064886A CN 114064886 A CN114064886 A CN 114064886A CN 202111414495 A CN202111414495 A CN 202111414495A CN 114064886 A CN114064886 A CN 114064886A
- Authority
- CN
- China
- Prior art keywords
- data
- risk
- feature
- layer
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000013135 deep learning Methods 0.000 title claims abstract description 23
- 230000004044 response Effects 0.000 title claims abstract description 22
- 238000005516 engineering process Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 49
- 230000006870 function Effects 0.000 claims description 32
- 238000004364 calculation method Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 25
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 11
- 238000012502 risk assessment Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 9
- 238000007477 logistic regression Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 8
- 238000007726 management method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000012800 visualization Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000010485 coping Effects 0.000 abstract description 3
- 238000013136 deep learning model Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于信息管理的技术领域,具体涉及基于深度学习的矿山项目风险应对措施推荐方法,包括提取数据表格的特征,从数据表格中获取并处理连续型数据、离散型数据和风险应对措施本文数据,计算风险应对措施的推荐概率,可视化输出所需数据。本发明将深度学习技术引入矿山项目风险应对措施,能够智能推荐所需的风险应对措施。此外,本发明还提供了基于深度学习的矿山项目风险应对措施推荐系统。
Description
技术领域
本发明属于信息管理的技术领域,具体涉及基于深度学习的矿山项目风险应对措施推荐方法及系统。
背景技术
现有的矿产资源开采过程中,没有充分利用已知的数据知识,没有充分利用连续型数据知识,没有考虑文本的语义内容,使得对风险应对措施的推荐造成了巨大的误差。
并且,当某些风险指标与风险应对措施的交互行为较少时,推荐过程容易出现热门推荐的偏差,所以,现有技术难以解决矿山信息化时不能充分利用数据、多系统数据交互联动性差的问题,难以解决在矿山项目风险应对措施推荐中多源异构数据的利用不充分的问题。为此,亟需提出一种新型的技术方案以解决上述问题。
发明内容
本发明的目的之一在于:针对现有技术的不足,提供基于深度学习的矿山项目风险应对措施推荐方法,其能够学习和解释各个特征数据的内在联系,通过充分利用数据进而获得更高准确率的推荐效果。
为了实现上述目的,本发明采用如下技术方案:
基于深度学习的矿山项目风险应对措施推荐方法,包括以下步骤:
S1、数据输入:根据项目的标识,对数据库中的多张数据库表格进行联合查询,获取相关数据表格集合,分析各个数据表格的属性和相关性,提取所需的特征;
S2、特征工程:根据相关性直接从各个数据表格中获取连续型数据和离散型数据,针对风险应对措施查询获取风险应对措施文本数据集合,使用降维技术在风险应对措施文本数据集合中将文本内容用低维稠密的向量表示,将向量矩阵输入到文本卷积神经网络中实现文本的多分类,提取风险应对措施的文本数据特征,生成文本特征集合;
S3、特征计算:将连续型数据、离散型数据和文本特征集合输入到DeepFM模型,对连续型数据进行归一化处理,使离散型数据通过Embedding降维,将处理好的数据放入深度神经网络和因子分解机中进行特征交互,通过因子分解机完成二阶特征以内的交叉,通过深度神经网络完成高阶特征交叉,再使用逻辑回归函数将高阶特征交叉值与低阶特征交叉值连接起来;
S4、点击率预测:获取逻辑回归函数的值,使用函数实现二分类,计算风险应对措施的推荐概率,预测在预设条件下是否会点击所需的风险应对措施,根据计算的数据值,将被点击概率大的风险应对措施返回给风险评估业务模型,预测值与实际值进行反馈更新系统模型,通过可视化将列表展示从而获得所需的矿山项目风险应对措施。
进一步地,所述S1中包括:
S1-1、获取项目风险评估信息表、矿山资源数据表、项目内容信息表、项目经济数据表、项目技术数据表、风险指标信息表、风险应对措施库表、风险等级对照表、风险影响概率表、风险影响等级表的属性数据,构建表格E-R图;
S1-2、根据表格E-R图中的属性与相关性提取所需的特征。
进一步地,所述S2中的文本数据特征的提取过程包括以下步骤:
(1)从风险应对措施文本数据集合中获取一条文本数据,对该文本数据进行one-hot编码,形成稀疏高维向量矩阵,使用Word2Vec模型进行数据降维,形成一个n*k的低维稠密的词向量矩阵,其中,k表示词向量矩阵的维度,当句子的长度为n时,词语从X1到Xn的串联连接按照输入顺序表示为:
(2)将词向量矩阵作为特征向量输入到一维卷积层中,使用CNN模型处理文本,使用滤波器w∈Rh*k进行一维卷积,其中,R为系数矩阵,滤波器应用于单词的窗口产生的新特征,卷积时的滤波器长度h分别为3、4、5,使卷积核为h*k向量与n*k向量进行运算,特征ci从单词Xi:i+h-1窗口生成,使用ReLU函数作为激活函数输出所需的特征图c,激活函数的计算公式为:f(x)=f(w*Xi:i+h-1+b),其中,b表示一个偏置参数;
(3)对每个滤波器取得的特征图c的特征映射取最大值max{c}作为此滤波器的特征,将3个滤波器连接在一起得到新的一维向量组;
(4)所有的向量组经过最大池化层后全连接在一起,使用softmax分类器进行分类计算,生成类别特征si,每条文本得到的类别si组成文本特征集合。
进一步地,所述S3中包括:
S3-1、使用one-hot编码技术对离散型数据进行数据编码,将所有离散值进行全连接,并使用Embedding技术进行降维,对连续型数据进行归一化处理,归一化处理的公式为:其中,X*为归一化后的数据,X为原始数据集,Xmax为原始数据集的最大值,Xmin为原始数据集的最小值;
S3-2、将计算好的数据值进行全连接后输入到因子分解机完成低阶部分的计算得到yFM,计算公式为:其中,w为滤波器的参数,d表示向量的维度,V∈Rd*k,Vi表示的是系数矩阵V的第i维向量,Vj表示的是系数矩阵V的第j维向量,<Vi,Vj>表示的是向量Vi和向量Vj的点积,x、xj1、xj2分别为不同的特征分量;
S3-3、采用深度神经网络完成高阶部分计算,m个离散特征经过Embedding层后得到a(0)=[e1,e2,…,em],将a(0)输入到深度神经网络中进行计算,计算公式为:a(H+1)=σ(WH·aH+bH),其中,H为隐藏层的深度,σ为ReLU函数作为激活函数,aH为第H层的输出值,WH为第H层的权重,bH为第H层的偏置,从而生成一个密集的实特征向量yDNN;
S3-4、使用逻辑回归函数线性融合两部分的值,计算公式为:y=yFM+yDNN。
进一步地,所述S3中还包括:在数据输入模型前对数据进行预处理,将获取到的数据集合的空取值补全。
本发明的目的之二在于:提供基于深度学习的矿山项目风险应对措施推荐系统,包括:
逻辑层,设置有多个数据库,每个所述数据库用于提供多张数据库表格;
服务层,通讯连接于所述逻辑层,用于计算风险应对措施的推荐概率;
业务逻辑层,通讯连接于所述服务层,用于提供风险评估业务模型;
应用层,通讯连接于所述业务逻辑层,用于可视化展示列表。
进一步地,所述服务层采用Python、TensorFlow、Java或Spring boot进行搭建。
本发明的有益效果在于:1)本发明通过特征工程和特征计算等手段,可以充分利用大数据、人工智能和深度学习等技术结合先进管理方法解决矿山信息化时不能充分利用数据、多系统数据交互联动性差的问题,实现矿山系统智能服务、自动挖掘数据关联和可视化展示;2)本发明基于深度学习模型算法,计算离散型数据和数值连续型数据,通过深度神经网络模型学习和解释各个特征数据的内在联系,深度学习推进模型更加充分利用了数据,其具有准确率更高的推荐效果,能够融合多源异构的数据,使得深度学习模型应用在矿山项目风险应对措施推荐中的多源异构数据被充分利用;3)本发明的一种基于深度学习的矿山项目风险应对措施智能推荐方法及系统,会依据当时的场景结合矿山项目数据将风险应对措施库的数据进行排序,将排序好的风险应对措施列表展示给用户,其提供的系统使用界面简洁,协助专家高效工作,显著地减少了专家在完成项目风险评估报告时寻找风险应对措施的时间。
附图说明
图1为本发明推荐方法的步骤流程图。
图2为本发明推荐方法的步骤S1所获得的E-R图。
图3为本发明推荐方法的特征工程和特征计算的操作流程框图。
图4为本发明推荐方法的风险应对措施文本数据集合的特征提取流程图。
图5为本发明推荐方法的特征计算步骤的操作流程框图。
图6为本发明推荐系统的结构框图。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件,本领域技术人员应可理解,制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接受的误差范围内,本领域技术人员能够在一定误差范围内解决技术问题,基本达到技术效果。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、水平”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,发明人通过对国内外关于推荐系统的研究,与项目风险应对措施智能推荐相关的推荐方法可选方向:基于ItemCF方法,将风险内容作为物品研究其行为和与风险应对措施形成交互矩阵,预测风险指标选择风险应对措施的行为,该方法的缺点是没有充分利用已知的数据知识推荐效率较低、计算复杂;基于内容推荐方法,风险应对措施和风险指标都是文本内容,根据TF-IDF模型对每条风险应对措施文本词语统计,和风险指标计算余弦相似度,进行风险应对措施的推荐,该方法没有充分利用数值型数据知识、没有考虑文本的语义内容,会造成巨大的推荐误差。
同时,风险应对措施数据信息是包含大量专业术语的短文本,具有很强的语义顺序性,某些风险指标与风险应对措施的交互行为较少时,推荐出现热门推荐的偏差。而矿山项目风险应对措施推荐的特征结构容易引起了这种偏差,特征提供了更多的场景特征和风险指标特征,风险应对措施由于是文本数据,但DeepFM模型未涉及处理该数据类型的模型,导致深度学习模型应用在矿山项目风险应对措施推荐中多源异构数据的利用不充分。
为了解决上述问题,以下结合附图1~6和具体实施例对本发明作进一步详细说明,但不作为对本发明的限定。
实施例1
基于深度学习的矿山项目风险应对措施推荐方法,如图1~5所示,包括以下步骤:
S1、数据输入:根据项目的标识,对数据库中的多张数据库表格进行联合查询,获取相关数据表格集合,分析各个数据表格的属性和相关性,提取所需的特征;
S1-1、获取项目风险评估信息表、矿山资源数据表、项目内容信息表、项目经济数据表、项目技术数据表、风险指标信息表、风险应对措施库表、风险等级对照表、风险影响概率表、风险影响等级表的属性数据,构建表格E-R图;
S1-2、根据表格E-R图中的属性与相关性提取所需的特征。
其中,E-R图清晰地展示了各个表中的属性值的关联,有助于根据属性与相关性抽取所需的特征。
S2、特征工程:根据提取特征,特征提取分为两个部分,一个部分是根据相关性直接从各个数据表格中获取连续型数据和离散型数据,另一个部分是针对风险应对措施查询获取风险应对措施文本数据集合,使用降维技术在风险应对措施文本数据集合中将文本内容用低维稠密的向量表示,将向量矩阵输入到文本卷积神经网络中实现文本的多分类,提取风险应对措施的文本数据特征,生成文本特征集合;
其中,文本数据特征的提取过程包括以下步骤:
(1)从风险应对措施文本数据集合中获取一条文本数据,对该文本数据进行one-hot编码,形成稀疏高维向量矩阵,使用Word2Vec模型进行数据降维,形成一个n*k的低维稠密的词向量矩阵,其中,k表示词向量矩阵的维度,当句子的长度为n时,词语从X1到Xn的串联连接按照输入顺序表示为:
(2)将词向量矩阵作为特征向量输入到一维卷积层中,使用CNN模型处理文本,使用滤波器w∈Rh*k进行一维卷积,其中,R为系数矩阵,滤波器应用于单词的窗口产生的新特征,卷积时的滤波器长度h分别为3、4、5,使卷积核为h*k向量与n*k向量进行运算,特征ci从单词Xi:i+h-1窗口生成,使用ReLU函数作为激活函数输出所需的特征图c,激活函数的计算公式为:f(x)=f(w*Xi:i+h-1+b),其中,b表示一个偏置参数;
(3)对每个滤波器取得的特征图c的特征映射取最大值max{c}作为此滤波器的特征,将3个滤波器连接在一起得到新的一维向量组;
(4)所有的向量组经过最大池化层后全连接在一起,使用softmax分类器进行分类计算,生成类别特征si,每条文本得到的类别si组成文本特征集合。
S3、特征计算:在数据输入模型前对数据进行预处理,按照确定规则将获取到的数据集合的空取值补全,避免因为数据导致模型推荐效果差,将连续型数据、离散型数据和文本特征集合输入到DeepFM模型,对连续型数据进行归一化处理,使离散型数据通过Embedding降维,将处理好的数据放入深度神经网络和因子分解机中进行特征交互,通过因子分解机完成二阶特征以内的交叉,通过深度神经网络完成高阶特征交叉,再使用逻辑回归函数将高阶特征交叉值与低阶特征交叉值连接起来;
S3-1、使用one-hot编码技术对离散型数据进行数据编码,将所有离散值进行全连接,并使用Embedding技术进行降维,对连续型数据进行归一化处理,归一化处理的公式为:其中,X*为归一化后的数据,X为原始数据集,Xmax为原始数据集的最大值,Xmin为原始数据集的最小值;
S3-2、将计算好的数据值进行全连接后输入到因子分解机完成低阶部分的计算得到yFM,计算公式为:其中,w为滤波器的参数,d表示向量的维度,V∈Rd*k,Vi表示的是系数矩阵V的第i维向量,Vj表示的是系数矩阵V的第j维向量,<Vi,Vj>表示的是向量Vi和向量Vj的点积,x、xj1、xj2分别为不同的特征分量;
S3-3、采用深度神经网络完成高阶部分计算,m个离散特征经过Embedding层后得到a(0)=[e1,e2,…,em],将a(0)输入到深度神经网络中进行计算,计算公式为:a(H+1)=σ(WH·aH+bH),其中,H为隐藏层的深度,σ为ReLU函数作为激活函数,aH为第H层的输出值,WH为第H层的权重,bH为第H层的偏置,从而生成一个密集的实特征向量yDNN;
S3-4、使用逻辑回归函数线性融合两部分的值,计算公式为:y=yFM+yDNN。
S4、点击率预测:获取逻辑回归函数的值,使用sigmoid函数对y进行二分类,计算风险应对措施的推荐概率,预测在预设条件下是否会点击所需的风险应对措施或预测每个风险应对措施是否被点击,计算公式为:根据计算的数据值,将被点击概率大的风险应对措施返回给风险评估业务模型,预测值与实际值进行反馈更新系统模型,通过可视化将列表展示从而获得所需的矿山项目风险应对措施。
显然,本发明克服了现有技术中专家在完成矿山项目风险评估方案过程中,需要在已经存在的风险应对措施数据库里,根据当前场景搜索或者选择风险应对措施,系统收录大量不重复的风险应对措施数据,专家针对风险特征需要在下拉列表中进行搜索查找可能需要风险应对措施,耗费大量时间。
实施例2
基于深度学习的矿山项目风险应对措施推荐系统,如图6所示,包括:
逻辑层,设置有多个数据库,每个数据库用于提供多张数据库表格;
服务层,通讯连接于逻辑层,用于计算风险应对措施的推荐概率;
业务逻辑层,通讯连接于服务层,用于提供风险评估业务模型;
应用层,通讯连接于业务逻辑层,用于可视化展示列表。
优选地,服务层采用Python、TensorFlow、Java或Spring boot进行搭建。
因此,本发明通过计算风险应对措施的推荐概率,根据计算的数据值,将被点击概率大的风险应对措施返回给风险评估模型,再通过可视化将列表展示给专家进行选择,可以更好的辅助工作者进行作业,更多信息的收集能降低在资金投入和矿产资源开采过程中的错误判断,有利于规避风险减少损失,同时,应用深度学习的模型和推荐系统等相关知识,设计实现内嵌智能推荐风险应对措施的智能矿山决策系统,凝聚专家智慧提供优秀风险应对方案,节省了时间和显著地提高了工作效率。
根据上述说明书的揭示和教导,本发明所属领域的技术人员还能够对上述实施方式进行变更和修改。因此,本发明并不局限于上述的具体实施方式,凡是本领域技术人员在本发明的基础上所作出的任何显而易见的改进、替换或变型均属于本发明的保护范围。此外,尽管本说明书中使用了一些特定的术语,但这些术语只是为了方便说明,并不对本发明构成任何限制。
Claims (8)
1.基于深度学习的矿山项目风险应对措施推荐方法,其特征在于,包括以下步骤:
S1、数据输入:根据项目的标识,对数据库中的多张数据库表格进行联合查询,获取相关数据表格集合,分析各个数据表格的属性和相关性,提取所需的特征;
S2、特征工程:根据相关性直接从各个数据表格中获取连续型数据和离散型数据,针对风险应对措施查询获取风险应对措施文本数据集合,使用降维技术在风险应对措施文本数据集合中将文本内容用低维稠密的向量表示,将向量矩阵输入到文本卷积神经网络中实现文本的多分类,提取风险应对措施的文本数据特征,生成文本特征集合;
S3、特征计算:将连续型数据、离散型数据和文本特征集合输入到DeepFM模型,对连续型数据进行归一化处理,使离散型数据通过Embedding降维,将处理好的数据放入深度神经网络和因子分解机中进行特征交互,通过因子分解机完成二阶特征以内的交叉,通过深度神经网络完成高阶特征交叉,再使用逻辑回归函数将高阶特征交叉值与低阶特征交叉值连接起来;
S4、点击率预测:获取逻辑回归函数的值,使用函数实现二分类,计算风险应对措施的推荐概率,预测在预设条件下是否会点击所需的风险应对措施,根据计算的数据值,将被点击概率大的风险应对措施返回给风险评估业务模型,预测值与实际值进行反馈更新系统模型,通过可视化将列表展示从而获得所需的矿山项目风险应对措施。
2.如权利要求1所述的基于深度学习的矿山项目风险应对措施推荐方法,其特征在于,所述S1中包括:
S1-1、获取项目风险评估信息表、矿山资源数据表、项目内容信息表、项目经济数据表、项目技术数据表、风险指标信息表、风险应对措施库表、风险等级对照表、风险影响概率表、风险影响等级表的属性数据,构建表格E-R图;
S1-2、根据表格E-R图中的属性与相关性提取所需的特征。
3.如权利要求1所述的基于深度学习的矿山项目风险应对措施推荐方法,其特征在于,所述S2中的文本数据特征的提取过程包括以下步骤:
(1)从风险应对措施文本数据集合中获取一条文本数据,对该文本数据进行one-hot编码,形成稀疏高维向量矩阵,使用Word2Vec模型进行数据降维,形成一个n*k的低维稠密的词向量矩阵,其中,k表示词向量矩阵的维度,当句子的长度为n时,词语从X1到Xn的串联连接按照输入顺序表示为:
(2)将词向量矩阵作为特征向量输入到一维卷积层中,使用CNN模型处理文本,使用滤波器w∈Rh*k进行一维卷积,其中,R为系数矩阵,滤波器应用于单词的窗口产生的新特征,卷积时的滤波器长度h分别为3、4、5,使卷积核为h*k向量与n*k向量进行运算,特征ci从单词Xi:i+h-1窗口生成,使用ReLU函数作为激活函数输出所需的特征图c,激活函数的计算公式为:f(x)=f(w*Xi:i+h-1+b),其中,b表示一个偏置参数;
(3)对每个滤波器取得的特征图c的特征映射取最大值max{c}作为此滤波器的特征,将3个滤波器连接在一起得到新的一维向量组;
(4)所有的向量组经过最大池化层后全连接在一起,使用softmax分类器进行分类计算,生成类别特征si,每条文本得到的类别si组成文本特征集合。
4.如权利要求3所述的基于深度学习的矿山项目风险应对措施推荐方法,其特征在于,所述S3中包括:
S3-1、使用one-hot编码技术对离散型数据进行数据编码,将所有离散值进行全连接,并使用Embedding技术进行降维,对连续型数据进行归一化处理,归一化处理的公式为:其中,X*为归一化后的数据,X为原始数据集,Xmax为原始数据集的最大值,Xmin为原始数据集的最小值;
S3-2、将计算好的数据值进行全连接后输入到因子分解机完成低阶部分的计算得到yFM,计算公式为:其中,w为滤波器的参数,d表示向量的维度,V∈Rd*k,Vi表示的是系数矩阵V的第i维向量,Vj表示的是系数矩阵V的第j维向量,<Vi,Vj>表示的是向量Vi和向量Vj的点积,x、xj1、xj2分别为不同的特征分量;
S3-3、采用深度神经网络完成高阶部分计算,m个离散特征经过Embedding层后得到a(0)=[e1,e2,…,em],将a(0)输入到深度神经网络中进行计算,计算公式为:a(H+1)=σ(WH·aH+bH),其中,H为隐藏层的深度,σ为ReLU函数作为激活函数,aH为第H层的输出值,WH为第H层的权重,bH为第H层的偏置,从而生成一个密集的实特征向量yDNN;
S3-4、使用逻辑回归函数线性融合两部分的值,计算公式为:y=yFM+yDNN。
6.如权利要求1所述的基于深度学习的矿山项目风险应对措施推荐方法,其特征在于,所述S3中还包括:在数据输入模型前对数据进行预处理,将获取到的数据集合的空取值补全。
7.基于深度学习的矿山项目风险应对措施推荐系统,其特征在于,包括:
逻辑层,设置有多个数据库,每个所述数据库用于提供多张数据库表格;
服务层,通讯连接于所述逻辑层,用于计算风险应对措施的推荐概率;
业务逻辑层,通讯连接于所述服务层,用于提供风险评估业务模型;
应用层,通讯连接于所述业务逻辑层,用于可视化展示列表。
8.如权利要求7所述的基于深度学习的矿山项目风险应对措施推荐系统,其特征在于:所述服务层采用Python、TensorFlow、Java或Spring boot进行搭建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111414495.9A CN114064886B (zh) | 2021-11-25 | 2021-11-25 | 基于深度学习的矿山项目风险应对措施推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111414495.9A CN114064886B (zh) | 2021-11-25 | 2021-11-25 | 基于深度学习的矿山项目风险应对措施推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114064886A true CN114064886A (zh) | 2022-02-18 |
CN114064886B CN114064886B (zh) | 2024-08-02 |
Family
ID=80276319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111414495.9A Active CN114064886B (zh) | 2021-11-25 | 2021-11-25 | 基于深度学习的矿山项目风险应对措施推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114064886B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879777A (zh) * | 2023-03-03 | 2023-03-31 | 吉林大学 | 基于时空大数据的石油安全智能推演系统及其方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180349817A1 (en) * | 2017-06-01 | 2018-12-06 | Autodesk, Inc. | Architecture, engineering and construction (aec) risk analysis system and method |
CN109636055A (zh) * | 2018-12-21 | 2019-04-16 | 中国安全生产科学研究院 | 一种非煤矿山安全生产风险预测预警平台 |
CN110807154A (zh) * | 2019-11-08 | 2020-02-18 | 内蒙古工业大学 | 一种基于混合深度学习模型的推荐方法与系统 |
CN111209386A (zh) * | 2020-01-07 | 2020-05-29 | 重庆邮电大学 | 一种基于深度学习的个性化文本推荐方法 |
CN112883288A (zh) * | 2021-03-09 | 2021-06-01 | 东南大学 | 基于深度学习和多Agent优化的软件评审者混合推荐方法 |
CN113688169A (zh) * | 2021-08-11 | 2021-11-23 | 北京科技大学 | 基于大数据分析的矿山安全隐患辨识与预警系统 |
-
2021
- 2021-11-25 CN CN202111414495.9A patent/CN114064886B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180349817A1 (en) * | 2017-06-01 | 2018-12-06 | Autodesk, Inc. | Architecture, engineering and construction (aec) risk analysis system and method |
CN109636055A (zh) * | 2018-12-21 | 2019-04-16 | 中国安全生产科学研究院 | 一种非煤矿山安全生产风险预测预警平台 |
CN110807154A (zh) * | 2019-11-08 | 2020-02-18 | 内蒙古工业大学 | 一种基于混合深度学习模型的推荐方法与系统 |
CN111209386A (zh) * | 2020-01-07 | 2020-05-29 | 重庆邮电大学 | 一种基于深度学习的个性化文本推荐方法 |
CN112883288A (zh) * | 2021-03-09 | 2021-06-01 | 东南大学 | 基于深度学习和多Agent优化的软件评审者混合推荐方法 |
CN113688169A (zh) * | 2021-08-11 | 2021-11-23 | 北京科技大学 | 基于大数据分析的矿山安全隐患辨识与预警系统 |
Non-Patent Citations (1)
Title |
---|
郭欣;许林英;: "改进的关联规则算法在电子商务中的应用", 微处理机, no. 05, 15 October 2008 (2008-10-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879777A (zh) * | 2023-03-03 | 2023-03-31 | 吉林大学 | 基于时空大数据的石油安全智能推演系统及其方法 |
CN115879777B (zh) * | 2023-03-03 | 2023-05-12 | 吉林大学 | 基于时空大数据的石油安全智能推演系统及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114064886B (zh) | 2024-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang | GroRec: a group-centric intelligent recommender system integrating social, mobile and big data technologies | |
CN113723632A (zh) | 一种基于知识图谱的工业设备故障诊断方法 | |
CN110309195B (zh) | 一种基于fwdl模型的内容推荐方法 | |
CN109657947A (zh) | 一种面向企业行业分类的异常检测方法 | |
Bhardwaj et al. | Review of text mining techniques | |
CN115269899A (zh) | 基于遥感知识图谱的遥感影像统筹系统 | |
CN112529638A (zh) | 基于用户分类和深度学习的服务需求动态预测方法及系统 | |
CN104102730B (zh) | 一种基于已知标签的大数据常态模式提取方法及系统 | |
CN117668582A (zh) | 基于行为数据的用户聚类分析方法 | |
CN114064886A (zh) | 基于深度学习的矿山项目风险应对措施推荐方法及系统 | |
CN113837266B (zh) | 一种基于特征提取和Stacking集成学习的软件缺陷预测方法 | |
Shekhawat et al. | A classification technique using associative classification | |
CN117829643A (zh) | 多媒体液晶评价器的评价方法及系统 | |
CN112817442A (zh) | 基于ffm的多任务情况下态势信息分类推荐系统及方法 | |
CN117196716A (zh) | 基于Transformer网络模型的数字标牌广告主题推荐方法 | |
Smits et al. | Vocabulary elicitation for informative descriptions of classes | |
CN116955818A (zh) | 一种基于深度学习的推荐系统 | |
CN115797795A (zh) | 基于强化学习的遥感影像问答式检索系统及方法 | |
CN113468203B (zh) | 基于循环神经网络与注意力机制的金融用户画像方法 | |
CN115168634A (zh) | 一种基于多层级表征的面料跨模态图文检索方法 | |
Alhaj et al. | Predicting user entries by using data mining algorithms | |
Watson | Is CBR a Technology or a Methodology? | |
CN105975564A (zh) | 基于相对熵相似度的知识推荐方法 | |
Cheng et al. | A K-means algorithm for construction of enterprise innovation system based on data mining technology | |
CN113221513B (zh) | 一种跨模态数据融合的个性化产品描述生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |