CN112990567A - 建立煤层含气量预测模型的方法、装置、终端与存储介质 - Google Patents

建立煤层含气量预测模型的方法、装置、终端与存储介质 Download PDF

Info

Publication number
CN112990567A
CN112990567A CN202110260677.9A CN202110260677A CN112990567A CN 112990567 A CN112990567 A CN 112990567A CN 202110260677 A CN202110260677 A CN 202110260677A CN 112990567 A CN112990567 A CN 112990567A
Authority
CN
China
Prior art keywords
gas content
data
vector
training
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110260677.9A
Other languages
English (en)
Inventor
师素珍
齐佑朝
段培飞
韩琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology Beijing CUMTB
Original Assignee
China University of Mining and Technology Beijing CUMTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology Beijing CUMTB filed Critical China University of Mining and Technology Beijing CUMTB
Priority to CN202110260677.9A priority Critical patent/CN112990567A/zh
Publication of CN112990567A publication Critical patent/CN112990567A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Tourism & Hospitality (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了建立煤层含气量预测模型的方法、装置、终端与存储介质,方法包括以下步骤:步骤1、获取原始数据;步骤2、对原始数据进行数据预处理,得到样本数据;步骤3、对样本数据进行主成分分析,得到分析后的特征数据集;步骤4、通过对特征数据集进行划分,得到训练集与测试集;步骤5、基于训练集训练LSTM模型,得到训练后的LSTM模型;步骤6、采用测试集对训练后的LSTM模型进行测试;步骤7、若测试通过,则将训练后的LSTM模型设置为煤层含气量预测模型。通过本方案建立的煤层含气量预测模型,预测煤层气的速度快,效率高,可以实现大规模应用。

Description

建立煤层含气量预测模型的方法、装置、终端与存储介质
技术领域
本发明涉及煤层气的预测领域,尤其涉及建立煤层含气量预测模型的方法、装置、终端与存储介质。
背景技术
我国的能源资源中,煤炭占比很大,在总能源消耗中,煤炭也占有重要的地位,而随着社会经济的不断发展,清洁使用煤炭越来越成为主流,其中,使用煤层气是一种重要的煤炭清洁使用方式。在此情况下,煤层气的准确预测成为清洁使用煤炭资源中重要的一环。目前预测煤层气含量的方法很多,其中,有一种方法是对煤层进行采样取芯,后运送至实验室进行测定。这种方式的精度很高,但是这种方式的成本高昂,且时间长,对设备要求高,无法大规模应用。
发明内容
有鉴于此,本发明提出了建立煤层含气量预测模型的方法、装置、终端与存储介质,通过本方案建立的煤层含气量预测模型,可以预测煤层气,且预测速度快,效率高,可以实现大规模应用。
具体的,本发明提出了以下具体的实施例:
本发明实施例提出了一种建立煤层含气量预测模型的方法,包括以下步骤:
步骤1、获取原始数据;所述原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;所述特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;
步骤2、对所述原始数据进行数据预处理,得到样本数据;
步骤3、对所述样本数据进行主成分分析,得到分析后的特征数据集;
步骤4、通过对所述特征数据集进行划分,得到训练集与测试集;
步骤5、基于所述训练集训练LSTM模型,得到训练后的LSTM模型;所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:
yt=sigmoid(Wt ht);yt为输出值;Wt为sigmoid函数中自带权重向量;ht=zo tanh(ct);ht为本轮的状态量输出;zo为输出门向量;ct=zf c(t-1)+zi z;ct本轮的内部记忆单元;zf为遗忘门向量;c(t-1)为上一轮的内部记忆单元;zi为输入门向量;z为选择向量;
步骤6、采用所述测试集对所述训练后的LSTM模型进行测试;
步骤7、若测试通过,则将所述训练后的LSTM模型设置为煤层含气量预测模型。
在一个具体的实施例中,所述训练包括以下步骤:
步骤51、将所述训练集中的特征输入所述LSTM模型,得到所述LSTM模型的输出值;
步骤52、通过所述输出值与所述训练集中的所述标签值的比较;
步骤53、若比较结果为达到预期,则得到训练后的LSTM模型;若比较结果为未达到预期,则调整所述LSTM模型的参数后执行步骤51。
在一个具体的实施例中,该方法还包括:
步骤8、若测试不通过,则对所述训练后的LSTM模型进行参数调整后执行步骤5。
在一个具体的实施例中,所述步骤4包括:
将所述特征数据集划分为训练集、测试集与验证集;
该方法还包括:通过所述验证集对所述煤层含气量预测模型进行验证,以确定所述煤层含气量预测模型的预测性能。
在一个具体的实施例中,所述数据预处理包括:
基于箱线图分析所述原始数据中的异常值,并对分析出的所述异常值进行删除;
当检测所述原始数据存在缺失的值时进行差值补全处理;
对进行了删除和差值补全处理后的所述原始数据进行归一化处理。
在一个具体的实施例中,各所述特征是对所述测井的同一深度位置进行探测得到;
所述地层特征包括厚度、顶底板岩性特征;
所述地球物理测井特征包括电阻率、密度、自然伽马值、孔隙度;
所述地球物理地震特征包括振幅、波阻抗;
所述煤的工业组分特征包括固定碳含量、挥发分含量、灰分含量。
在一个具体的实施例中,
所述内部记忆单元包括遗忘门、输入门和输出门;其中,所述遗忘门通过以下公式表示:
zf=σ(Wf[h(t-1),xt]+bf);σ为函数运算、Wf为遗忘门权重向量、h(t-1)为上一轮的状态量输出;bf为遗忘门偏置向量;
所述输入门通过以下公式表示:
zi=σ(Wi[h(t-1),xt]+bi);Wi为输入门权重向量、xt为输入值、bi为输入门偏置向量;
z=tanh(W[h(t-1),xt]+b);W为选择权重向量、b为选择偏置向量。
本发明实施例还提出了一种建立煤层含气量预测模型的装置,包括:
获取模块,用于获取原始数据;所述原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;所述特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;
预处理模块,用于对所述原始数据进行数据预处理,得到样本数据;
分析模块,用于对所述样本数据进行主成分分析,得到分析后的特征数据集;
划分模块,用于通过对所述特征数据集进行划分,得到训练集与测试集;
训练模块,用于基于所述训练集训练LSTM模型,得到训练后的LSTM模型;所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:
yt=sigmoid(Wt ht);yt为输出值;Wt为sigmoid函数中自带权重向量;ht=zo tanh(ct);ht为本轮的状态量输出;zo为输出门向量;ct=zf c(t-1)+zi z;ct本轮的内部记忆单元;zf为遗忘门向量;c(t-1)为上一轮的内部记忆单元;zi为输入门向量;z为选择向量;
测试模块,用于采用所述测试集对所述训练后的LSTM模型进行测试;
设置模块,用于当测试通过时,将所述训练后的LSTM模型设置为煤层含气量预测模型。
本发明实施例还提出了一种终端,包括处理器与存储器,所述存储器中存储有应用程序,所述应用程序在所述处理器上运行时执行上项所述的建立煤层含气量预测模型的方法。
本发明实施例还提出了一种存储介质,所述存储介质中存储有应用程序,所述应用程序在处理器上运行时执行上述的建立煤层含气量预测模型的方法。
以此,本发明实施例提出了建立煤层含气量预测模型的方法、装置、终端与存储介质,该方法包括以下步骤:步骤1、获取原始数据;所述原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;步骤2、对所述原始数据进行数据预处理,得到样本数据;步骤3、对所述样本数据进行主成分分析,得到分析后的特征数据集;步骤4、通过对所述特征数据集进行划分,得到训练集与测试集;步骤5、基于所述训练集训练LSTM模型,得到训练后的LSTM模型;步骤6、采用所述测试集对所述训练后的LSTM模型进行测试;步骤7、若测试通过,则将所述训练后的LSTM模型设置为煤层含气量预测模型。通过本方案,通过主成分分析对数据进行处理,实现了对原始数据的降维,也保证了得到的数据保留原始数据的内在信息并彼此具有最大的不相关性,同时基于对LSTM模型进行训练建立的煤层含气量预测模型,可以预测煤层气,且预测速度快,效率高,可以实现大规模应用。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对本发明保护范围的限定。在各个附图中,类似的构成部分采用类似的编号。
图1示出了建立煤层含气量预测模型的方法的流程示意图;
图2示出了具体应用场景下的建立煤层含气量预测模型的方法的流程示意图;
图3示出了建立煤层含气量预测模型中LSTM的整体框架图;
图4示出了建立煤层含气量预测模型中单个LSTM单元的结构示意图;
图5示出了建立煤层含气量预测模型中PCA-3层LSMT神经网络模型结构示意图;
图6示出了一种建立煤层含气量预测模型的装置的结构示意图;
图7示出了一种更具体的建立煤层含气量预测模型的装置的结构示意图。
图示说明:
201-获取模块;202-预处理模块;203-分析模块;204-划分模块;
205-训练模块;206-测试模块;207-设置模块;208-验证模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在下文中,可在本发明的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本发明的各种实施例中被清楚地限定。
实施例1
本发明实施例1公开了一种建立煤层含气量预测模型的方法,如图1以及图2所示,包括以下步骤:
步骤S100、获取原始数据;原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;所述特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;
具体的,各特征是对测井的同一深度位置进行探测得到;特征包括:地层特征、地球物理测井特征、地球物理地震特征、煤的工业组分特征。
首先收集研究区煤层含气量数据作为标签值,收集不同位置的测井在相同深度的地层特征(厚度、顶底板岩性特征等)、地球物理测井特征(电阻率、密度、自然伽马值、孔隙度等)、地球物理地震特征(振幅、波阻抗等)、测井地震道、煤的工业组分特征(固定碳含量、挥发分含量、灰分含量等)作为原始数据。
步骤S200、对原始数据进行数据预处理,得到样本数据;
具体的,数据预处理包括:
基于箱线图分析所述原始数据中的异常值,并对分析出的所述异常值进行删除;当检测所述原始数据存在缺失的值时进行差值补全处理;对进行了删除和差值补全处理后的所述原始数据进行归一化处理。
在步骤S100获取了原始数据之后,对原始数据是否存在异常值和缺失值进行检查。具体的,通过对始数据制作箱线图分析删除异常值,对缺失值则用插值补全处理;此外,为了消除原始数据的特征之间的量纲影响,对原始数据进行归一化处理,使得不同指标之间具有可比性。具体的,可以对所有原始数据进行线性函数归一化,使结果映射到[0,1]的范围,实现对原始数据的等比缩放。归一化公式如下:
Figure BDA0002969836920000081
其中,X为原始数据;Xmax和Xmin分别为原始数据中的最大值和最小值;Xnorm为归一化后的数据。
步骤S300、对样本数据进行主成分分析,得到分析后的特征数据集;
具体的,主成分分析,也即PCA(principal component analysis,主成分分析)。其作用是优选低维特征,将输入的高维特征数据重新整理,使之适应LSTM网络的输入,并提高与标签数据的相关性;重构输入的数据使得到的低维向量具有最大的不相关性,并能够最大化保持数据的内在信息,以此作为下一个步骤的输入,进而预测煤层含气量。
具体的,通过正交变换将原始的高维数据集变换到一个新的被称为主成分的数据集中,即从现有的大量变量中提取一组新的变量。主成分是原始变量的线性组合,第一个主成分具有最大的方差值,第二主成分试图解释数据集中的剩余方差,并且与第一主成分不相关(正交),第三主成分试图解释前两个主成分没有解释的方差,依此类推。这样实现了对原始数据的降维,也保证了新的变量保留原始数据的内在信息并彼此具有最大的不相关性。
进行主成分分析转换后,构成特征数据集合X={xi,i=[1,…,n]},其中xi表示一组预测数据,xi是一个N维的向量,向量中的每一个分量是一个实数,代表了不同的主成分特征。
步骤S400、通过对特征数据集进行划分,得到训练集与测试集;
具体的,步骤S400包括:将特征数据集划分为训练集、测试集与验证集。具体的,步骤S300中,在进行主成分分析转换后,构成特征数据集合中,设定一共有n组预测数据,以此可以按照一定比例划分为训练集、测试集和验证集。
步骤S500、基于训练集训练LSTM(Long Short-Term Memory,长短期记忆人工神经网络)模型,得到训练后的LSTM模型;
在一个具体的实施例中,LSTM模型是由多个LSTM单元级联得到的。
具体的,所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:
yt=sigmoid(Wt ht);yt为输出值;Wt为sigmoid函数中自带权重向量;ht=zo tanh(ct);ht为本轮的状态量输出;zo为输出门向量;ct=zf c(t-1)+zi z;ct本轮的内部记忆单元;zf为遗忘门向量;c(t-1)为上一轮的内部记忆单元;zi为输入门向量;z为选择向量。
具体的,需要首先构建LSTM模型,先初始化网络参数,并根据实验确定网络层数,隐藏神经元个数等超参数。
具体的,如图3所示,LSTM模型有三个输入分别是xt、ht-1、ct-1;在煤层含气量预测模型中,这里的xt就是步骤S300中处理好的单组数据集,ht-1表示上一轮的状态量输出,ct-1表示上一轮的内部记忆单元,yt表示本轮的输出,ht表示本轮的状态量输出,ct表示本轮的记忆内部单元。
LSTM的内部构造比较复杂,存在着两种不同的激活函数。首先,将xt和ht-1合并成一个向量再乘以一个选择权重向量W,外面再包一层tanh函数,得到一个选择向量z:
同样的道理,将xt和ht-1合并成一个向量乘以不同的权重Wf(也即遗忘门权重向量)、Wi(也即输入门权重向量)和Wo(也即输出门权重向量),激活函数用的是sigmoid,得到向量遗忘门向量zf、输入门向量zi和输出门向量zo,还可以用这些向量来由ct-1求得ct,公式是:
ct=zf.ct-1+zi.z;
然后得到ct之后,可以得到ht,公式是:
ht=zo.tanh(ct);
最后可以得到本轮的输入yt,若进行至最后一轮,则输出煤层含气量,公式是:
yt=sigmoid(Wtht);Wt为sigmoid函数中自带权重向量。
综上所述,得到了一个完整的单个LSTM的内部结构如图4所示。
图4中,示意了本轮的输入xt(属性特征)和输出yt(煤层含气量);上一轮的状态量ht-1和本轮输出的状态量ht;上一轮的内部记忆单元ct-1和本轮输出的内部记忆单元ct。图4是单个LSTM单元;Z为用于选择参与训练的数据的选择向量。
LSTM深度学习网络的关键就是内部记忆单ct,贯穿于每个循环。它承载着每个输入的有用信息,即使剔除无关紧要的信息。这种自动选择属性是由特殊的“门”结构来实现的,LSTM拥有三种类型的门结构:遗忘门、输入门和输出门,首先就是遗忘门,在LSTM中的第一步是决定需要从神经元状态中遗忘哪些信息。两个输入通过一个sigmoid函数,所以输出的值在0-1之间,1表示信息完全保留,0表示信息完全遗忘。通过遗忘门,LSTM可以选择性遗忘一些无意义的信息。遗忘门对应的公式表示为:
zf=σ(Wf[h(t-1),xt]+bf);σ为函数运算(具体为tanh函数和3个sigmoid函数);Wf为sigmoid函数中自带遗忘门权重向量;xt为输入、bf为遗忘门偏置向量。
下一步需要确认什么样的新信息存放在神经元的状态中,这个部分有两输入,一个sigmoid层决定什么值LSTM需要更新,一个tanh层创建一个新的候选值向量,这个值会被加入到状态当中,然后需要将这两个信息来产生对状态的更新,叫做输入门。输入门对应的公式表示为:
zi=σ(Wi[h(t-1),xt]+bi);Wi是为sigmoid函数中自带输入门权重向量、xt为输入值、bi的含义是输入门偏置向量;
z=tanh(W[h(t-1),xt]+b);W为选择权重向量;b是选择偏置向量。
确定了需要更新的信息之后,就可以更新ct这个最关键的变量,用公式可以表示为:
ct=zfc(t-1)+ziz;
同时也要更新系统的神经元状态ht,这就是控制LSTM输出的输出门,系统需要确定输出什么值。这个输出也会基于当前神经元的状态,首先用一个sigmoid来确定神经元需要将哪些部分进行输出,接着,将LSTM系统的信息通过一个tanh函数进行处理,最后将它们进行相乘输出,就是LSTM新的状态量。这个部分加上一个sigmoid就是这一轮的输出yt。用公式可以表示为:
zo=σ(Wo.[h(t-1),xt]+bo);bo是输出门偏执向量;
ht=zo.tanh(ct);
yt=sigmoid(Wt ht);
至此便结束了单个LSTM的流程。可以将多个的LSTM单元级联起来就可以成为用于预测煤层含气量的LSTM深度学习网络,如图5所示。
步骤S600、采用测试集对训练后的LSTM模型进行测试;
具体的,步骤51、将训练集中的特征输入LSTM模型,得到LSTM模型的输出值;
步骤52、通过输出值与训练集中的标签值的比较;
步骤53、若比较结果为达到预期,则得到训练后的LSTM模型;若比较结果为未达到预期,则调整LSTM模型的参数后执行步骤51。
具体的,假设预测数据集合X={xi,i=[1,…,n]},其中xi表示一组预测数据,是一个N维的向量,向量中的每个分量是一个实数,一共有n组预测数据。每一个xi都将有一个yi与之对应,yi是数据xi的标签,即煤层含气量。利用划分出的训练集对已初始化且初步确定网络参数的LSTM神经网络模型进行迭代优化训练,采用学习率自适应的Adam算法进行网络优化调整,调整学习率(learning rate),批量大小(batch size),和时间步长(time step)等参数的值,并利用均方误差(MSE)损失函数作为LSTM模型的损失函数,在训练过程中不断优化网络结构,直至模型训练误差达到事先设定的目标,然后保存模型。均方误差损失函数公式如下:
Figure BDA0002969836920000121
其中n为训练数据集样本组数,yi
Figure BDA0002969836920000122
分别表示标签值和预测值。
具体的测试是利用划分出的测试集对已训练好的LSTM神经网络模型展开测试,将得到的模型预测值进行反标准化处理,得到与实际值相对应的物性参数预测值。对比分析预测值和实际值,开展误差分析,进一步改进模型。
步骤S700、若测试通过,则将训练后的LSTM模型设置为煤层含气量预测模型。
具体的,若是测试通过,也即预测值和实际值的差值在预设范围内,则将训练后的LSTM模型设置为煤层含气量预测模型。
若是预测值和实际值的差值在预设范围外,则测试未通过,则执行步骤S800;具体的,步骤S800为:若测试不通过,则对训练后的LSTM模型进行参数调整后执行步骤S500。具体的,如图5所示,若测试不通过,则将训练后的LSTM模型作为LSTM模型被训练数据继续进行训练。
进一步的,在得到煤层含气量预测模型后,该方法还包括:通过验证集对煤层含气量预测模型进行验证,以确定煤层含气量预测模型的预测性能。
具体的,与前述训练与测试的过程类型,将验证集中的特征输入煤层含气量预测模型,得到输出值,将输出值与验证集中的标签值进行比较,基于这两者的差值确定煤层含气量预测模型的预测性能,差值越小,代表预测性能越好。
在获取了煤层含气量预测模型后,可以基于煤层含气量预测模型后进行煤层含气量的预测工作。在煤层含气量预测中,测井曲线、地震属性等由浅到深反映了不同地质时期的地层特征,这些属性的历史序列中存在着潜在的内部联系,其变化趋势包含了预测物性参数的重要信息,LSTM神经网络具有长期记忆功能,能处理序列数据间的长期依赖关系,可有效降低此类关系的影响,其内部的门结构还可以自动的学习序列特征。本方案将多属性预测煤层含气量定义为一个回归问题,即利用多组与煤层含气量有相关性的多属性参数,预测出每组所对应的煤层含气量。利用划分出的验证数据集,输入至LSTM网络中,内部记忆单元Ct和门结构之间交互地进行信息的取舍,并随着历史序列线性自循环,由输出门基于遗忘门,输入门和内部记忆单元的输出确定输出的部分。再对输出做反标准化处理,进而得到不同位置的煤层含气量。
实施例2
本发明实施例2还公开了一种建立煤层含气量预测模型的装置,如图6所示,包括:
获取模块201,用于获取原始数据;原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;
预处理模块202,用于对原始数据进行数据预处理,得到样本数据;
分析模块203,用于对样本数据进行主成分分析,得到分析后的特征数据集;
划分模块204,用于通过对特征数据集进行划分,得到训练集与测试集;
训练模块205,用于基于训练集训练LSTM模型,得到训练后的LSTM模型;所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:
yt=sigmoid(Wt ht);yt为输出值;Wt为sigmoid函数中自带权重向量;ht=zo tanh(ct);ht为本轮的状态量输出;zo为输出门向量;ct=zf c(t-1)+zi z;ct本轮的内部记忆单元;zf为遗忘门向量;c(t-1)为上一轮的内部记忆单元;zi为输入门向量;z为选择向量;
测试模块206,用于采用测试集对训练后的LSTM模型进行测试;
设置模块207,用于当测试通过时,将训练后的LSTM模型设置为煤层含气量预测模型。
在一个具体的实施例中,训练模块205包括:
输入模块,用于将训练集中的特征输入LSTM模型,得到LSTM模型的输出值;
比较模块,用于通过输出值与训练集中的标签值的比较;
处理模块,用于若比较结果为达到预期,则得到训练后的LSTM模型;若比较结果为未达到预期,则调整LSTM模型的参数后执行输入模块。
在一个具体的实施例中,该方法还包括:调整模块,用于若测试不通过,则对训练后的LSTM模型进行参数调整后执行训练模块205。
在一个具体的实施例中,划分模块204,用于:
将特征数据集划分为训练集、测试集与验证集;
如图7所示,该装置还包括:验证模块208,用于通过验证集对煤层含气量预测模型进行验证,以确定煤层含气量预测模型的预测性能。
在一个具体的实施例中,数据预处理包括:
基于箱线图分析原始数据中的异常值,并对分析出的异常值进行删除;
当检测原始数据存在缺失的值时进行差值补全处理;
对进行了删除和差值补全处理后的原始数据进行归一化处理。
在一个具体的实施例中,各特征是对测井的同一深度位置进行探测得到;
所述地层特征包括厚度、顶底板岩性特征;所述地球物理测井特征包括电阻率、密度、自然伽马值、孔隙度;所述地球物理地震特征包括振幅、波阻抗;所述煤的工业组分特征包括固定碳含量、挥发分含量、灰分含量。
在一个具体的实施例中,LSTM模型是由多个LSTM单元级联得到的。
所述内部记忆单元包括遗忘门、输入门和输出门;其中,所述遗忘门通过以下公式表示:zf=σ(Wf[h(t-1),xt]+bf);σ为函数运算、Wf为遗忘门权重向量、h(t-1)为上一轮的状态量输出;bf为遗忘门偏置向量;
所述输入门通过以下公式表示:
zi=σ(Wi[h(t-1),xt]+bi);Wi为输入门权重向量、xt为输入值、bi为输入门偏置向量;
z=tanh(W[h(t-1),xt]+b);W为选择权重向量、b为选择偏置向量。
实施例3
本发明实施例3还公开了一种终端,包括处理器与存储器,存储器中存储有应用程序,应用程序在处理器上运行时执行实施例1中的建立煤层含气量预测模型的方法。
实施例4
本发明实施例4还公开了一种存储介质,存储介质中存储有应用程序,应用程序在处理器上运行时执行实施例1中任意一项的建立煤层含气量预测模型的方法。
以此,本发明实施例提出了建立煤层含气量预测模型的方法、装置、终端与存储介质,该方法包括以下步骤:步骤1、获取原始数据;原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;步骤2、对原始数据进行数据预处理,得到样本数据;步骤3、对样本数据进行主成分分析,得到分析后的特征数据集;步骤4、通过对特征数据集进行划分,得到训练集与测试集;步骤5、基于训练集训练LSTM模型,得到训练后的LSTM模型;步骤6、采用测试集对训练后的LSTM模型进行测试;步骤7、若测试通过,则将训练后的LSTM模型设置为煤层含气量预测模型。通过本方案,通过主成分分析对数据进行处理,实现了对原始数据的降维,也保证了得到的数据保留原始数据的内在信息并彼此具有最大的不相关性,同时基于对LSTM模型进行训练建立的煤层含气量预测模型,可以预测煤层气,且预测速度快,效率高,可以实现大规模应用。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和结构图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,结构图和/或流程图中的每个方框、以及结构图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或更多个模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是智能手机、个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种建立煤层含气量预测模型的方法,其特征在于,包括以下步骤:
步骤1、获取原始数据;所述原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;所述特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;
步骤2、对所述原始数据进行数据预处理,得到样本数据;
步骤3、对所述样本数据进行主成分分析,得到分析后的特征数据集;
步骤4、通过对所述特征数据集进行划分,得到训练集与测试集;
步骤5、基于所述训练集训练LSTM模型,得到训练后的LSTM模型;所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:
yt=sigmoid(Wtht);yt为输出值;Wt为sigmoid函数中自带权重向量;ht=zotanh(ct);ht为本轮的状态量输出;zo为输出门向量;ct=zfc(t-1)+ziz;ct本轮的内部记忆单元;zf为遗忘门向量;c(t-1)为上一轮的内部记忆单元;zi为输入门向量;z为选择向量;
步骤6、采用所述测试集对所述训练后的LSTM模型进行测试;
步骤7、若测试通过,则将所述训练后的LSTM模型设置为煤层含气量预测模型。
2.如权利要求1所述的方法,其特征在于,所述训练包括以下步骤:
步骤51、将所述训练集中的特征输入所述LSTM模型,得到所述LSTM模型的输出值;
步骤52、通过所述输出值与所述训练集中的所述标签值的比较;
步骤53、若比较结果达到预期,则得到训练后的LSTM模型;若比较结果未达到预期,则调整所述LSTM模型的参数后执行步骤51。
3.如权利要求1或2所述的方法,其特征在于,还包括:
步骤8、若测试不通过,则对所述训练后的LSTM模型进行参数调整后执行步骤5。
4.如权利要求1所述的方法,其特征在于,所述步骤4包括:
将所述特征数据集划分为训练集、测试集与验证集;
该方法还包括:通过所述验证集对所述煤层含气量预测模型进行验证,以确定所述煤层含气量预测模型的预测性能。
5.如权利要求1所述的方法,其特征在于,所述数据预处理包括:
基于箱线图分析所述原始数据中的异常值,并对分析出的所述异常值进行删除;
当检测所述原始数据存在缺失的值时进行差值补全处理;
对进行了删除和差值补全处理后的所述原始数据进行归一化处理。
6.如权利要求1所述的方法,其特征在于,各所述特征是对所述测井的同一深度位置进行探测得到;
所述地层特征包括厚度、顶底板岩性特征;
所述地球物理测井特征包括电阻率、密度、自然伽马值、孔隙度;
所述地球物理地震特征包括振幅、波阻抗;
所述煤的工业组分特征包括固定碳含量、挥发分含量、灰分含量。
7.如权利要求1所述的方法,其特征在于,所述内部记忆单元包括遗忘门、输入门和输出门;其中,所述遗忘门通过以下公式表示:
zf=σ(Wf[h(t-1),xt]+bf);σ为函数运算、Wf为遗忘门权重向量、h(t-1)为上一轮的状态量输出;bf为遗忘门偏置向量;
所述输入门通过以下公式表示:
zi=σ(Wi[h(t-1),xt]+bi);Wi为输入门权重向量、xt为输入值、bi为输入门偏置向量;
z=tanh(W[h(t-1),xt]+b);W为选择权重向量、b为选择偏置向量。
8.一种建立煤层含气量预测模型的装置,其特征在于,包括:
获取模块,用于获取原始数据;所述原始数据包括预设煤层测井的多个特征以及作为标签值的含气量数据;所述特征包括地层特征、地球物理测井特征、地球物理地震特征和煤的工业组分特征中的至少一种;
预处理模块,用于对所述原始数据进行数据预处理,得到样本数据;
分析模块,用于对所述样本数据进行主成分分析,得到分析后的特征数据集;
划分模块,用于通过对所述特征数据集进行划分,得到训练集与测试集;
训练模块,用于基于所述训练集训练LSTM模型,得到训练后的LSTM模型;所述LSTM模型是由多个LSTM单元级联得到的;每个所述LSTM单元通过以下公式训练得到:
yt=sigmoid(Wtht);yt为输出值;Wt为sigmoid函数中自带权重向量;ht=zotanh(ct);ht为本轮的状态量输出;zo为输出门向量;ct=zfc(t-1)+ziz;ct本轮的内部记忆单元;zf为遗忘门向量;c(t-1)为上一轮的内部记忆单元;zi为输入门向量;z为选择向量;
测试模块,用于采用所述测试集对所述训练后的LSTM模型进行测试;
设置模块,用于当测试通过时,将所述训练后的LSTM模型设置为煤层含气量预测模型。
9.一种终端,其特征在于,包括处理器与存储器,所述存储器中存储有应用程序,所述应用程序在所述处理器上运行时执行权利要求1-7中任意一项所述的建立煤层含气量预测模型的方法。
10.一种存储介质,其特征在于,所述存储介质中存储有应用程序,所述应用程序在处理器上运行时执行权利要求1-7中任意一项所述的建立煤层含气量预测模型的方法。
CN202110260677.9A 2021-03-10 2021-03-10 建立煤层含气量预测模型的方法、装置、终端与存储介质 Pending CN112990567A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110260677.9A CN112990567A (zh) 2021-03-10 2021-03-10 建立煤层含气量预测模型的方法、装置、终端与存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110260677.9A CN112990567A (zh) 2021-03-10 2021-03-10 建立煤层含气量预测模型的方法、装置、终端与存储介质

Publications (1)

Publication Number Publication Date
CN112990567A true CN112990567A (zh) 2021-06-18

Family

ID=76334822

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110260677.9A Pending CN112990567A (zh) 2021-03-10 2021-03-10 建立煤层含气量预测模型的方法、装置、终端与存储介质

Country Status (1)

Country Link
CN (1) CN112990567A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115372569A (zh) * 2022-08-19 2022-11-22 北京工商大学 基于长短期记忆神经网络的红酒质量评价方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729716A (zh) * 2017-11-27 2018-02-23 西安建筑科技大学 一种基于长短时记忆神经网络的煤矿突水预测方法
CN108418792A (zh) * 2018-01-29 2018-08-17 华北电力大学 基于深度循环神经网络的网络逃避行为检测算法
CN109508811A (zh) * 2018-09-30 2019-03-22 中冶华天工程技术有限公司 基于主成分分析和长短期记忆网络的污水处理出水参数预测方法
CN110580655A (zh) * 2019-09-17 2019-12-17 山东浪潮通软信息科技有限公司 一种基于lstm算法的煤矿涌水量预测的方法和系统
CN111507048A (zh) * 2020-04-23 2020-08-07 中国石油大学(北京) 一种致密砂岩储层含气性的预测方法、装置、设备及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729716A (zh) * 2017-11-27 2018-02-23 西安建筑科技大学 一种基于长短时记忆神经网络的煤矿突水预测方法
CN108418792A (zh) * 2018-01-29 2018-08-17 华北电力大学 基于深度循环神经网络的网络逃避行为检测算法
CN109508811A (zh) * 2018-09-30 2019-03-22 中冶华天工程技术有限公司 基于主成分分析和长短期记忆网络的污水处理出水参数预测方法
CN110580655A (zh) * 2019-09-17 2019-12-17 山东浪潮通软信息科技有限公司 一种基于lstm算法的煤矿涌水量预测的方法和系统
CN111507048A (zh) * 2020-04-23 2020-08-07 中国石油大学(北京) 一种致密砂岩储层含气性的预测方法、装置、设备及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
王书芹等: ""基于灰狼优化算法的长短期记忆网络"", 《中国科技论文》 *
谢中华等: "《新编MATLAB/Simulink自学一本通》", 31 January 2018, 北京航空航天大学出版社 *
黄孝平: "《当代机器深度学习方法与应用研究》", 30 November 2017, 电子科技大学出版社 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115372569A (zh) * 2022-08-19 2022-11-22 北京工商大学 基于长短期记忆神经网络的红酒质量评价方法及系统

Similar Documents

Publication Publication Date Title
US20200104688A1 (en) Methods and systems for neural architecture search
Lim et al. Reservoir porosity and permeability estimation from well logs using fuzzy logic and neural networks
CN112989708B (zh) 一种基于lstm神经网络的测井岩性识别方法及系统
Long et al. Pseudo density log generation using artificial neural network
CN110083125B (zh) 一种基于深度学习的机床热误差建模方法
CN110674841A (zh) 一种基于聚类算法的测井曲线识别方法
Schulze-Riegert et al. Combined global and local optimization techniques applied to history matching
CN114723095A (zh) 缺失测井曲线预测方法及装置
CN111814699A (zh) 一种面向swarm电磁卫星数据的深度学习地震预测方法
CN112990567A (zh) 建立煤层含气量预测模型的方法、装置、终端与存储介质
Shi et al. Optimization and data mining for fracture prediction in geosciences
CN114152977B (zh) 基于地质特征约束的储层参数预测方法、装置和存储介质
CN116927771A (zh) 一种预测页岩储层总有机碳数据的方法、装置、设备及介质
CN111832636A (zh) 基于特征组合的朴素贝叶斯岩相分类方法及装置
Çetiner et al. Analysis of different regression algorithms for the estimate of energy consumption
van der Herten et al. Multi-objective Bayesian optimization for engineering simulation
Koochak et al. A variability aware GAN for improving spatial representativeness of discrete geobodies
CN111580179A (zh) 一种有机碳含量确定方法、装置及系统
Sun et al. Optimization of models for rapid identification of oil and water layers during drilling-a win-win strategy based on machine learning
Al-Bazzaz et al. Permeability modeling using neural-network approach for complex Mauddud-Burgan carbonate reservoir
Chikhi et al. Probabilistic neural method combined with radial-bias functions applied to reservoir characterization in the Algerian Triassic province
Asoodeh et al. NMR parameters determination through ACE committee machine with genetic implanted fuzzy logic and genetic implanted neural network
Carratú et al. A novel IVS procedure for handling Big Data with Artificial Neural Networks
Ballester et al. Characterising the parameter space of a highly nonlinear inverse problem
Finol et al. An intelligent identification method of fuzzy models and its applications to inversion of NMR logging data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination