CN111859814A - 基于lstm深度学习的岩石时效变形预测方法及其系统 - Google Patents
基于lstm深度学习的岩石时效变形预测方法及其系统 Download PDFInfo
- Publication number
- CN111859814A CN111859814A CN202010754069.9A CN202010754069A CN111859814A CN 111859814 A CN111859814 A CN 111859814A CN 202010754069 A CN202010754069 A CN 202010754069A CN 111859814 A CN111859814 A CN 111859814A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- field
- missing
- rock
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011435 rock Substances 0.000 title claims abstract description 92
- 230000032683 aging Effects 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013135 deep learning Methods 0.000 title claims abstract description 29
- 238000012360 testing method Methods 0.000 claims abstract description 105
- 238000012549 training Methods 0.000 claims abstract description 85
- 238000012795 verification Methods 0.000 claims abstract description 51
- 238000005457 optimization Methods 0.000 claims abstract description 33
- 238000004140 cleaning Methods 0.000 claims description 57
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 9
- 238000011478 gradient descent method Methods 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 6
- 230000008094 contradictory effect Effects 0.000 claims description 3
- 238000011010 flushing procedure Methods 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims description 3
- 230000014759 maintenance of location Effects 0.000 claims 1
- 239000011159 matrix material Substances 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 7
- 230000007774 longterm Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010998 test method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000035882 stress Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000001550 time effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于LSTM深度学习的岩石时效变形预测方法及其系统,包括以下步骤:步骤S100:获取岩石时效变形的已有数据;步骤S200:清洗已有数据后,进行数据集划分,得到训练集、验证集、测试集;步骤S300:建立时序网络预测模型;步骤S400:在时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果,根据测试结果优化模型,提升优化模型的训练速度,并进行超参数调试,得到岩石时效变形预测模型;步骤S500:在岩石时效变形预测模型中输入实测参数,得到岩石时效变形预测结果。通过对室内岩石流变试验等已有数据进行处理,进而实现对岩石时效变形结果的有效、准确预测。
Description
技术领域
本申请涉及一种基于LSTM深度学习的岩石时效变形预测方法及其系统,属于岩土工程及地质灾害防治中的岩石时效变形预测方法领域。
背景技术
岩石的流变特征实质就是其应力应变的时间效应。概况来说,流变研究主要包含蠕变、应力松弛、长期强度、弹性后效和滞后效应(黏滞效应)。岩石蠕变是指应力保持不变,变形随着时间增加的过程,因而与工程最密切相关,受到学者们的特别关注。
岩石的流变特征与岩石工程的长期稳定性和安全性密切相关,例如边坡工程、隧洞工程、核废料存储、水电工程、矿山工程等。现有岩石流变力学试验方法包含:室内流变试验和现场实测。
与现场实测相比,室内试验具有耗资相对较少、试验条件相对易于控制、可多次重复试验、易于长期观察、便于减少次要因素干扰等优点,因而成为研究岩石流变力学特征的主要手段。
现有岩石流变力学试验方法所需的成本高,效率低,浪费人力,并未对试验数据进行深入分析研究,造成了数据的浪费,而且试验的持续时间有限。实际程施工后,项目需长期使用,无法获取长期使用后的数据,不能满足实际工程对施工后使用情况分析的需要。
发明内容
本申请提供了一种用于解决上述技术问题的基于LSTM深度学习的岩石时效变形预测方法及其系统,该方法用于解决现有岩石流变力学试验方法中存在的数据分析不深入,仅进行简单处理;实验数据不能反映长期使用后的情况;成本高的技术问题。
本申请提供了一种基于LSTM深度学习的岩石时效变形预测方法,包括以下步骤:
步骤S100:获取岩石时效变形的已有数据;
步骤S200:清洗已有数据后,进行数据集划分,得到训练集、验证集、测试集;
步骤S300:建立时序网络预测模型:采用sigmoid函数决定哪些特征信息需要被遗忘,构建LSTM单元的遗忘门,构建LSTM单元的输入门,构建LSTM单元的输出门,得到LSTM单元,通过LSTM单元构建神经网络层,采用随机梯度下降法反向计算神经网络层,得到时序网络预测训练模型;
步骤S400:在时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果,根据测试结果优化模型,提升优化模型的训练速度,并进行超参数调试,得到岩石时效变形预测模型;
步骤S500:在岩石时效变形预测模型中输入实测参数,得到岩石时效变形预测结果。
优选地,所述已有数据来源为:工程试验报告、现场监测、对实测流变曲线进行处理得到数据、自制试样进行室内流变试验获得数据中的至少一种。
优选地,所述步骤S200包括以下步骤:
步骤S210:逐一判断各已有数据是否存在缺失值,如果判断结果为是,则进行缺失值清洗;
所述缺失值清洗步骤包括以下步骤:
步骤S211:计算该已有数据每个字段的缺失值比例,判断该字段缺失值比例是否小于预设值,如果判断结果为否,则不去除该字段属性,得到缺失字段;如果判断结果为是,则继续判断该字段数据是否属于重要数据,如果属于则不去除该字段属性,得到第一保留字段,如果不属于,则去除该字段属性,得到第二保留字段;
步骤S212:填充第二保留字段中的缺失值,以同一指标的计算结果填充缺失值或以不同指标的计算结果填充缺失值;
步骤S213:判断各缺失字段是否属于重要数据,如果是,则重新获取缺失字段,得到第三保留字段,如果否,则去除该缺失字段;
步骤S220:对第一保留字段、第二保留字段和第三保留字段的格式及内容一致性进行分析,舍弃格式、内容不一致的数据,得到第一清洗数据;
步骤S230:对第一清洗数据进行逻辑错误清洗操作,得到第二清洗数据;
步骤S240:判断第二清洗数据中的数据是否属于需求数据,如果不是则删除,如果是则保留,得到总保留数据;
步骤S250:对总保留数据进行关联性验证,通过关联性验证的总保留数据为关联数据;
步骤S260:将关联字段划分为:训练集、验证集、测试集。
优选地,所述同一指标为第二保留字段中各数据的均值、中位数或众数中的任一种;
所述逻辑错误清洗操作包括:①去重;②去除不合理值;③修正矛盾内容。
优选地,所述构建的神经网络层数为2~4层。
优选地,所述步骤S400包括以下步骤:
步骤S410:在所述时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果;
步骤S420:根据测试结果准确率,优化时序网络预测训练模型,得到优化模型;
步骤S430:提升优化模型的训练速度;
步骤S440:对步骤S430所得模型训练一段时间后进行超参数调试,得到岩石时效变形预测模型。
优选地,所述步骤S420包括以下步骤:
步骤S421:判断测试结果偏差值是否过高,如果判断结果为是,则调整时序网络预测训练模型的网络结构;
步骤S422;如果判断结果为否,则判断测试结果的方差是否过高,如果判断结果为是,则对时序网络预测训练模型进行正规化操作或调整验证集和测试集中的数据,如果判断结果为否,则进行步骤S430。
工作原理:本申请基于LSTM大数据支持下的深度学习方法,提出了一种基于LSTM深度学习的岩石时效变形预测方法;通过对岩石流变历史数据进行处理获得不同的输入特征值,如围压、渗压、轴向应变、环向应变、体积应变,以及岩石是否流变破坏,并将以上输入特征值作为添加数据标签,对各数据进行标记;将试验数据划分为训练集、验证集、测试集;训练集在LSTM深度学习下进行梯度下降训练,获得训练模型;验证集、测试集在训练模型中运行获得准确率结果,通过对结果分析确定模型及数据集调整方向,经过不断调试获得准确率较高的监测模型,使得工程人员可以直接使用,并且获得很高的准确率以及便利性。
本申请的另一方面还提供了一种上述的基于LSTM深度学习的岩石时效变形预测系统,包括:
数据获取模块,用于获取岩石时效变形的已有数据;
清洗数据模块,用于清洗已有数据后,进行数据集划分,得到训练集、验证集、测试集;
建立模型模块,用于采用sigmoid函数决定哪些特征信息需要被遗忘,构建LSTM单元的遗忘门,构建LSTM单元的输入门,构建LSTM单元的输出门,得到LSTM单元,通过LSTM单元构建神经网络层,采用随机梯度下降法反向计算神经网络层,得到时序网络预测训练模型;
模型优化模块,用于在时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果,根据测试结果优化模型,提升优化模型的训练速度,并进行超参数调试,得到岩石时效变形预测模型;
结果输出模块,用于在岩石时效变形预测模型中输入实测参数,得到岩石时效变形预测结果。
优选地,所述清洗数据模块包括:
缺失值判断模块,用于逐一判断各已有数据是否存在缺失值,如果判断结果为是,则进行缺失值清洗;
缺失值判断模块包括:
缺失值计算模块,用于计算该已有数据每个字段的缺失值比例,判断该字段缺失值比例是否小于预设值,如果判断结果为否,则不去除该字段属性,得到缺失字段;如果判断结果为是,则继续判断该字段数据是否属于重要数据,如果属于则不去除该字段属性,得到第一保留字段,如果不属于,则去除该字段属性,得到第二保留字段;
缺失值填充模块,用于填充第二保留字段中的缺失值,以同一指标的计算结果填充缺失值或以不同指标的计算结果填充缺失值;
重要数据判断模块,用于判断各缺失字段是否属于重要数据,如果是,则重新获取缺失字段,得到第三保留字段,如果否,则去除该缺失字段;
一致性模块,用于对第一保留字段、第二保留字段和第三保留字段的格式及内容一致性进行分析,舍弃格式、内容不一致的数据,得到第一清洗数据;
逻辑清洗模块,用于对第一清洗数据进行逻辑错误清洗操作,得到第二清洗数据;
二次清洗模块,用于判断第二清洗数据中的数据是否属于需求数据,如果不是则删除,如果是则保留,得到总保留数据;
关联性模块,用于对总保留数据进行关联性验证,通过关联性验证的总保留数据为关联数据;
划分模块,用于将关联字段划分为:训练集、验证集、测试集。
优选地,所述模型优化模块包括:
验证测试模块,用于在所述时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果;
结果准确率优化模块,用于根据测试结果准确率,优化时序网络预测训练模型,得到优化模型;
训练速度优化模块,用于提升优化模型的训练速度;
超参调试模块,对训练速度优化模块所得模型训练一段时间后进行超参数调试,得到岩石时效变形预测模型。
本申请能产生的有益效果包括:
1)本申请所提供的基于LSTM深度学习的岩石时效变形预测方法,通过对室内岩石流变试验等已有数据进行处理,进而实现对岩石时效变形结果的有效、准确预测。
2)本申请所提供的基于LSTM深度学习的岩石时效变形预测方法,该预测方法通过使用迁移学习改变输出层,用以训练不同使用者的数据,从而实现对不同使用者的输入数据均能获得理想的效果。通过不断的向训练模型输入数据可以不断地改善模型的表现,采用该方法能保持不断的调整,使得模型一直保持最佳状态。
3)本申请所提供的基于LSTM深度学习的岩石时效变形预测方法,通过建立时序网络预测模型,极大的提高了对于岩石时效变形预测的准确性,降低了岩石流变试验的经济成本和时间成本,结合迁移学习后可以大范围推广到其他工程流变特性的预测。
4)本申请所提供的基于LSTM深度学习的岩石时效变形预测方法,有效的解决了现有岩石时效变形试验成本高,效率低,浪费人力,所得数据无法充分利用的问题,本申请所得模型可根据需要预测较长时间以后的结果,预测结果不受试验持续时间的影响,能更好地满足实际工程的需要。
附图说明
图1为本申请提供的基于LSTM深度学习的岩石时效变形预测方法流程示意图;
图2为本申请提供的具体实施例中基于LSTM深度学习的岩石时效变形预测方法流程示意图;
图3为分别采用本申请提供方法及实测方法对已有数据进行处理后所得预测曲线与实测曲线结果图;
图4为本申请提供的基于LSTM深度学习的岩石时效变形预测系统模块连接结构示意图;
具体实施方式
下面结合实施例详述本申请,但本申请并不局限于这些实施例。
参见图1,本申请提供的基于LSTM深度学习的岩石时效变形预测方法,包括以下步骤:
步骤S100:获取岩石时效变形的已有数据;
优选地,所述已有数据来源为:工程试验报告、现场监测、对实测流变曲线进行处理得到数据、自制试样进行室内流变试验获得数据中的至少一种。之后通过Python程序传输获取的所有已有流变实验数据进行分析。本申请中已有数据是指,通过现有实验手段获得的流变数据。
步骤S200:清洗已有数据后,进行数据集划分,得到训练集、验证集、测试集;
步骤S300:建立时序网络预测模型:采用sigmoid函数决定哪些特征信息需要被遗忘,构建LSTM单元的遗忘门,构建LSTM单元的输入门,构建LSTM单元的输出门,得到LSTM单元,通过LSTM单元构建神经网络层,采用随机梯度下降法反向计算神经网络层,得到时序网络预测训练模型;
步骤S400:在时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果,根据测试结果优化模型,提升优化模型的训练速度,并进行超参数调试,得到岩石时效变形预测模型;
步骤S500:在岩石时效变形预测模型中输入实测参数,得到岩石时效变形预测结果。
如图2所示,该方法具体过程包括以下步骤:
步骤S100:获取岩石时效变形的已有数据;
优选地,步骤S200包括以下步骤:
步骤S210:逐一判断各已有数据是否存在缺失值,如果判断结果为是,则进行缺失值清洗;
所述缺失值清洗步骤包括以下步骤:
步骤S211:计算该已有数据每个字段的缺失值比例,判断该字段缺失值比例是否小于预设值,如果判断结果为否,则不去除该字段属性,得到缺失字段;如果判断结果为是,则继续判断该字段数据是否属于重要数据,如果属于则不去除该字段属性,得到第一保留字段,如果不属于,则去除该字段属性,得到第二保留字段;此步骤中预设值可以为研究所需时间间隔的数值。
此处的重要数据可根据已有数据来源对应的项目,同时结合流变数据获取要求进行筛选。此处计算缺失值比例的数据为存在缺失值的已有数据。
字段数据缺失值少,且重要性不高,说明舍弃该字段数据对已有数据深入分析结果整体影响不大,则可以选择去除该字段属性。
步骤S212:填充第二保留字段中的缺失值,以同一指标的计算结果填充缺失值或以不同指标的计算结果填充缺失值;
具体填充方式例如对于身份证号码,存在年龄字段缺失时,根据屏蔽后六位后余下的身份证号,可以得到年龄数据,以此进行数据填充;同理可以进行流变数据的处理。
优选地,所述同一指标为第二保留字段中各数据的均值、中位数或众数中的任一种。
步骤S213:判断各缺失字段是否属于重要数据,如果是,则重新获取缺失字段,得到第三保留字段,如果否,则去除该缺失字段;
对于属于重要数据的缺失数据,可以通过与取数人员或专业人员沟通或通过其他渠道,再次获取该数据。
步骤S220:对第一保留字段、第二保留字段和第三保留字段的格式及内容一致性进行分析,舍弃格式、内容不一致的数据,得到第一清洗数据;
根据数据来源不同,其格式内容一致性情况也不同,如果数据来源于系统日志,格式和内容方面相互矛盾的情况较少,与原数据的描述一致性较高;如果数据来源于人工收集或用户填报,则容易在格式和内容方面存在问题,如内容中有不该存在的字符或内容与该字段应有内容不符等,就需要进行格式内容清洗;通过步骤S220的数据清洗,能将内容存在问题的部分数据清洗,以提高后续分析所用数据的可靠性。
步骤S230:对第一清洗数据进行逻辑错误清洗操作,得到第二清洗数据;
数据若存在逻辑错误,则需进行逻辑错误清洗,目的是去掉一些使用逻辑推理就可以直接发现问题的数据,防止分析结果走偏。
优选地,逻辑错误清洗操作包括:①去重;②去除不合理值;③修正矛盾内容。
步骤S240:判断第二清洗数据中的数据是否属于需求数据,如果不是则删除,如果是则保留得到总保留数据;
步骤S250:对总保留数据进行关联性验证,通过关联性验证的总保留数据为关联数据;
若数据有多个来源,就有必要进行关联性验证,多个来源的数据整合是非常复杂的工作,一定要注意数据之间的关联性,以避免在分析过程中出现互相矛盾的数据。
步骤S260:将关联字段划分为:训练集、验证集、测试集。
训练集、验证集、测试集的划分比例可等分也可根据需要确定。
步骤S300包括以下步骤:
步骤S310:构建LSTM单元遗忘门:采用如式(1)所示的sigmoid函数决定哪些特征信息需要被遗忘,sigmoid函数表示当开始接收新的对预测结果影响大的特征信息时,忘记对预测结果影响小的特征信息:
ft=σ(Wfxt+Ufht-1+bf) (1)
其中,ft为t时刻的遗忘门信息,σ为sigmoid函数,Wf、bf分别为输入层到隐藏层的参数矩阵和偏置参数矩阵,Uf为隐藏层自循环参数矩阵,ht-1为t-1时刻隐藏层的输出信息,xt为t时刻的输入信息;
步骤S320:构建LSTM单元的输入门:首先采用如式(2)所示的sigmoid函数决定哪些特征信息需要更新:
it=σ(Wixt+Uiht-1+bi) (2)
其中,it为输入门,σ为sigmoid函数,Wi、bi分别为参数矩阵和偏置参数矩阵,Ui为自循环参数矩阵,ht-1为t-1时刻隐藏层的输出信息,xt为t时刻的输入信息;
最后更新:
步骤S330:构建LSTM单元的输出门:
首先,通过如式(3)所示的sigmoid函数决定输出的特征信息部分:ot=σ(Woxt+Uoht-1+bo) (3);
其中,ot为输入门,σ为sigmoid函数,Wo、bo分别为参数矩阵和偏置参数矩阵,Uo为自循环参数矩阵,ht-1为t-1时刻隐藏层的输出信息,xt为t时刻的输入信息
其次,用如式(4)所示的tanh层处理Ct确定最终输出的特征信息部分:ht=ot⊙tanh(ct) (4);
其中,ht为t时刻的输出信息,h(ct)为t时刻ct的函数;
步骤S340:通过LSTM单元构建神经网络层;
步骤S350:将序列化输入特征信息分为不同Batch在步骤S340构建的神经网络中进行训练,得到序列输出。
步骤S360:定义损失函数,计算损失值;用以评估预测值和真实值的差距;
步骤S360:采用随机梯度下降法反向计算神经网络层,得到时序网络预测训练模型。采用反向传播计算,能使得损失函数最小。
优选地,步骤S340中构建的神经网络层数为2~4层。
优选地,所述步骤S400包括以下步骤:
步骤S410:在步骤S360中所得时序网络预测训练模型中输入步骤S260中得到的验证集和测试集,进行测试,得到测试结果;
步骤S420:根据测试结果准确率,优化时序网络预测训练模型,得到优化模型;
优选地,所述优化训练模型操作包括:调整网络大小或数据集大小及是否采用正则化等,以解决训练模型存在高偏差或高方差的问题。
步骤S430:提升优化模型的训练速度;
步骤S440:对步骤S430所得模型训练一段时间后进行超参数调试,得到岩石时效变形预测模型;进行超参数调试能保证模型预测精度。
步骤S500:在岩石时效变形预测模型中输入实测参数,得到岩石时效变形预测结果。
优选地,步骤S420包括以下步骤:
步骤S421:判断测试结果偏差值是否过高,如果判断结果为是,则调整时序网络预测训练模型的网络结构;
步骤S422;如果判断结果为否,则判断测试结果的方差是否过高,如果判断结果为是,则对时序网络预测训练模型进行正规化操作或调整验证集和测试集中的数据,如果判断结果为否,则进行步骤S430。
按此操作可根据训练结果及时对时序网络预测训练模型进行优化,提高模型对岩石时效变形的预测准确性。
参见图4,本申请的另一方面还提供了一种上述的基于LSTM深度学习的岩石时效变形预测系统,包括:
数据获取模块,用于获取岩石时效变形的已有数据;
清洗数据模块,用于清洗已有数据后,进行数据集划分,得到训练集、验证集、测试集;
建立模型模块,用于采用sigmoid函数决定哪些特征信息需要被遗忘,构建LSTM单元的遗忘门,构建LSTM单元的输入门,构建LSTM单元的输出门,得到LSTM单元,通过LSTM单元构建神经网络层,采用随机梯度下降法反向计算神经网络层,得到时序网络预测训练模型;
模型优化模块,用于在时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果,根据测试结果优化模型,提升优化模型的训练速度,并进行超参数调试,得到岩石时效变形预测模型;
结果输出模块,用于在岩石时效变形预测模型中输入实测参数,得到岩石时效变形预测结果。
优选地,所述清洗数据模块包括:
缺失值判断模块,用于逐一判断各已有数据是否存在缺失值,如果判断结果为是,则进行缺失值清洗;
缺失值判断模块包括:
缺失值计算模块,用于计算该已有数据每个字段的缺失值比例,判断该字段缺失值比例是否小于预设值,如果判断结果为否,则不去除该字段属性,得到缺失字段;如果判断结果为是,则继续判断该字段数据是否属于重要数据,如果属于则不去除该字段属性,得到第一保留字段,如果不属于,则去除该字段属性,得到第二保留字段;
缺失值填充模块,用于填充第二保留字段中的缺失值,以同一指标的计算结果填充缺失值或以不同指标的计算结果填充缺失值;
重要数据判断模块,用于判断各缺失字段是否属于重要数据,如果是,则重新获取缺失字段,得到第三保留字段,如果否,则去除该缺失字段;
一致性模块,用于对第一保留字段、第二保留字段和第三保留字段的格式及内容一致性进行分析,舍弃格式、内容不一致的数据,得到第一清洗数据;
逻辑清洗模块,用于对第一清洗数据进行逻辑错误清洗操作,得到第二清洗数据;
二次清洗模块,用于判断第二清洗数据中的数据是否属于需求数据,如果不是则删除,如果是则保留,得到总保留数据;
关联性模块,用于对总保留数据进行关联性验证,通过关联性验证的总保留数据为关联数据;
划分模块,用于将关联字段划分为:训练集、验证集、测试集。
优选地,所述模型优化模块包括:
验证测试模块,用于在所述时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果;
结果准确率优化模块,用于根据测试结果准确率,优化时序网络预测训练模型,得到优化模型;
训练速度优化模块,用于提升优化模型的训练速度;
超参调试模块,对训练速度优化模块所得模型训练一段时间后进行超参数调试,得到岩石时效变形预测模型。
按以上步骤优化得到的岩石时效变形预测模型可以对测得的岩石时效变形参数进行预测分析,无需进行室内或室外实验,即可对具体岩石时效变形情况进行分析预测,且预测准确性较好。本申请提供方法深入分析利用了已有数据,在此基础上构件了岩石时效变形预测模型,并通过该曲线进行预测,预测结果可根据需要调整预测时间长度,使得预测结果不受限于实体实验时间,适应于实际工程项目需要。
优选地,步骤S430中提升神经网络的训练速度的方法为Adam优化算法、RMSProp优化算法、SGD优化算法或学习率衰减法中的任一种;
下面通过一个实例对本申请提供的方法进行详细说明:
按照以上方法步骤,通过工程试验报告、现场监测等渠道获取已有数据(可以利用相关软件对流变曲线进行处理得到已有数据),或者通过自制试样进行室内流变试验获得数据,并通过Python程序将数据传入电脑;
对获取的已有数据进行清洗和数据集划分,数据清洗包括:缺失值清洗、格式内容清洗、逻辑错误清洗、非需求数据清洗和关联性验证,将数据按照一定的比例划分为训练集、验证集、测试集;构建LSTM单元的遗忘门、输入门、输出门和神经网络层,输入训练数据、计算损失值,得到训练模型;输入验证集和测试集进行比较分析,调整网络结构、数据集等;采用优化算法,每隔一定时间进行超参数调试;得到岩石时效变形预测模型。
按照上述步骤对所获取的已有数据进行处理,得到流变曲线如图3中三角形数据点曲线;根据岩石流变力学试验所得结果曲线如图3中*号曲线所示。
由图3可以看出,本申请提供方法得到的预测曲线与实测曲线高度重合,说明本申请提供方法得到的预测模型预测精度较高,预测值与实测值十分接近,本发明方法有效,可应用于实践,具有使用良好的使用价值。
本实例可以减少流变试验的经济人力、成本,通过流变试验的数据充分利用起来进行预测时效变形趋势,可以应用于各类岩石工程中岩石时效变形的预测,具有广泛的应用前景。
在本说明书中所谈到的“一个实施例”、“另一个实施例”、“实施例”、“优选实施例”等,指的是结合该实施例描述的具体特征、结构或者特点包括在本申请概括性描述的至少一个实施例中。在说明书中多个地方出现同种表述不是一定指的是同一个实施例。进一步来说,结合任一实施例描述一个具体特征、结构或者特点时,所要主张的是结合其他实施例来实现这种特征、结构或者特点也落在本申请的范围内。
尽管这里参照本申请的多个解释性实施例对本申请进行了描述,但是,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。更具体地说,在本申请公开说明书和权利要求的范围内,可以对主题组合布局的组成部件和/或布局进行多种变型和改进。除了对组成部件和/或布局进行的变形和改进外,对于本领域技术人员来说,其他的用途也将是明显的。
Claims (10)
1.一种基于LSTM深度学习的岩石时效变形预测方法,其特征在于,包括以下步骤:
步骤S100:获取岩石时效变形的已有数据;
步骤S200:清洗已有数据后,进行数据集划分,得到训练集、验证集、测试集;
步骤S300:建立时序网络预测模型:采用sigmoid函数决定哪些特征信息需要被遗忘,构建LSTM单元的遗忘门,构建LSTM单元的输入门,构建LSTM单元的输出门,得到LSTM单元,通过LSTM单元构建神经网络层,采用随机梯度下降法反向计算神经网络层,得到时序网络预测训练模型;
步骤S400:在时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果,根据测试结果优化模型,提升优化模型的训练速度,并进行超参数调试,得到岩石时效变形预测模型;
步骤S500:在岩石时效变形预测模型中输入实测参数,得到岩石时效变形预测结果。
2.根据权利要求1所述的基于LSTM深度学习的岩石时效变形预测方法,其特征在于,所述已有数据来源为:工程试验报告、现场监测、对实测流变曲线进行处理得到数据、自制试样进行室内流变试验获得数据中的至少一种。
3.根据权利要求1所述的基于LSTM深度学习的岩石时效变形预测方法,其特征在于,所述步骤S200包括以下步骤:
步骤S210:逐一判断各已有数据是否存在缺失值,如果判断结果为是,则进行缺失值清洗;
所述缺失值清洗步骤包括以下步骤:
步骤S211:计算该已有数据每个字段的缺失值比例,判断该字段缺失值比例是否小于预设值,如果判断结果为否,则不去除该字段属性,得到缺失字段;如果判断结果为是,则继续判断该字段数据是否属于重要数据,如果属于则不去除该字段属性,得到第一保留字段,如果不属于,则去除该字段属性,得到第二保留字段;
步骤S212:填充第二保留字段中的缺失值,以同一指标的计算结果填充缺失值或以不同指标的计算结果填充缺失值;
步骤S213:判断各缺失字段是否属于重要数据,如果是,则重新获取缺失字段,得到第三保留字段,如果否,则去除该缺失字段;
步骤S220:对第一保留字段、第二保留字段和第三保留字段的格式及内容一致性进行分析,舍弃格式、内容不一致的数据,得到第一清洗数据;
步骤S230:对第一清洗数据进行逻辑错误清洗操作,得到第二清洗数据;
步骤S240:判断第二清洗数据中的数据是否属于需求数据,如果不是则删除,如果是则保留,得到总保留数据;
步骤S250:对总保留数据进行关联性验证,通过关联性验证的总保留数据为关联数据;
步骤S260:将关联字段划分为:训练集、验证集、测试集。
4.根据权利要求3所述的基于LSTM深度学习的岩石时效变形预测方法,其特征在于,所述同一指标为第二保留字段中各数据的均值、中位数或众数中的任一种;
所述逻辑错误清洗操作包括:①去重;②去除不合理值;③修正矛盾内容。
5.根据权利要求1所述的基于LSTM深度学习的岩石时效变形预测方法,其特征在于,所述构建的神经网络层数为2~4层。
6.根据权利要求1所述的基于LSTM深度学习的岩石时效变形预测方法,其特征在于,所述步骤S400包括以下步骤:
步骤S410:在所述时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果;
步骤S420:根据测试结果准确率,优化时序网络预测训练模型,得到优化模型;
步骤S430:提升优化模型的训练速度;
步骤S440:对步骤S430所得模型训练一段时间后进行超参数调试,得到岩石时效变形预测模型。
7.根据权利要求6所述的基于LSTM深度学习的岩石时效变形预测方法,其特征在于,所述步骤S420包括以下步骤:
步骤S421:判断测试结果偏差值是否过高,如果判断结果为是,则调整时序网络预测训练模型的网络结构;
步骤S422;如果判断结果为否,则判断测试结果的方差是否过高,如果判断结果为是,则对时序网络预测训练模型进行正规化操作或调整验证集和测试集中的数据,如果判断结果为否,则进行步骤S430。
8.一种如权利要求1~7中任一项所述的基于LSTM深度学习的岩石时效变形预测系统,其特征在于,包括:
数据获取模块,用于获取岩石时效变形的已有数据;
清洗数据模块,用于清洗已有数据后,进行数据集划分,得到训练集、验证集、测试集;
建立模型模块,用于采用sigmoid函数决定哪些特征信息需要被遗忘,构建LSTM单元的遗忘门,构建LSTM单元的输入门,构建LSTM单元的输出门,得到LSTM单元,通过LSTM单元构建神经网络层,采用随机梯度下降法反向计算神经网络层,得到时序网络预测训练模型;
模型优化模块,用于在时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果,根据测试结果优化模型,提升优化模型的训练速度,并进行超参数调试,得到岩石时效变形预测模型;
结果输出模块,用于在岩石时效变形预测模型中输入实测参数,得到岩石时效变形预测结果。
9.根据权利要求8所述的基于LSTM深度学习的岩石时效变形预测系统,其特征在于,所述清洗数据模块包括:
缺失值判断模块,用于逐一判断各已有数据是否存在缺失值,如果判断结果为是,则进行缺失值清洗;
缺失值判断模块包括:
缺失值计算模块,用于计算该已有数据每个字段的缺失值比例,判断该字段缺失值比例是否小于预设值,如果判断结果为否,则不去除该字段属性,得到缺失字段;如果判断结果为是,则继续判断该字段数据是否属于重要数据,如果属于则不去除该字段属性,得到第一保留字段,如果不属于,则去除该字段属性,得到第二保留字段;
缺失值填充模块,用于填充第二保留字段中的缺失值,以同一指标的计算结果填充缺失值或以不同指标的计算结果填充缺失值;
重要数据判断模块,用于判断各缺失字段是否属于重要数据,如果是,则重新获取缺失字段,得到第三保留字段,如果否,则去除该缺失字段;
一致性模块,用于对第一保留字段、第二保留字段和第三保留字段的格式及内容一致性进行分析,舍弃格式、内容不一致的数据,得到第一清洗数据;
逻辑清洗模块,用于对第一清洗数据进行逻辑错误清洗操作,得到第二清洗数据;
二次清洗模块,用于判断第二清洗数据中的数据是否属于需求数据,如果不是则删除,如果是则保留,得到总保留数据;
关联性模块,用于对总保留数据进行关联性验证,通过关联性验证的总保留数据为关联数据;
划分模块,用于将关联字段划分为:训练集、验证集、测试集。
10.根据权利要求8所述的基于LSTM深度学习的岩石时效变形预测方法,其特征在于,所述模型优化模块包括:
验证测试模块,用于在所述时序网络预测训练模型中输入验证集和测试集,进行测试,得到测试结果;
结果准确率优化模块,用于根据测试结果准确率,优化时序网络预测训练模型,得到优化模型;
训练速度优化模块,用于提升优化模型的训练速度;
超参调试模块,对训练速度优化模块所得模型训练一段时间后进行超参数调试,得到岩石时效变形预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010754069.9A CN111859814B (zh) | 2020-07-30 | 2020-07-30 | 基于lstm深度学习的岩石时效变形预测方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010754069.9A CN111859814B (zh) | 2020-07-30 | 2020-07-30 | 基于lstm深度学习的岩石时效变形预测方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111859814A true CN111859814A (zh) | 2020-10-30 |
CN111859814B CN111859814B (zh) | 2023-07-28 |
Family
ID=72946319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010754069.9A Active CN111859814B (zh) | 2020-07-30 | 2020-07-30 | 基于lstm深度学习的岩石时效变形预测方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859814B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113033702A (zh) * | 2021-04-21 | 2021-06-25 | 上海勘察设计研究院(集团)有限公司 | 一种基于时空数据的结构安全预警方法 |
CN113138978A (zh) * | 2021-04-22 | 2021-07-20 | 深圳大学 | 面向城市差异性沉降监测的北斗数据填充与变形预测方法 |
CN116913416A (zh) * | 2023-09-12 | 2023-10-20 | 中国地质大学(北京) | 海蚀崖岩石风化程度定量评价及预测方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170091615A1 (en) * | 2015-09-28 | 2017-03-30 | Siemens Aktiengesellschaft | System and method for predicting power plant operational parameters utilizing artificial neural network deep learning methodologies |
CN109558971A (zh) * | 2018-11-09 | 2019-04-02 | 河海大学 | 基于lstm长短期记忆网络的智能滑坡监测装置与方法 |
CN109739922A (zh) * | 2019-01-10 | 2019-05-10 | 江苏徐工信息技术股份有限公司 | 一种工业数据智能分析系统 |
CN110084367A (zh) * | 2019-04-19 | 2019-08-02 | 安徽农业大学 | 一种基于lstm深度学习模型的土壤墒情预测方法 |
CN110162519A (zh) * | 2019-04-17 | 2019-08-23 | 苏宁易购集团股份有限公司 | 数据清理方法 |
-
2020
- 2020-07-30 CN CN202010754069.9A patent/CN111859814B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170091615A1 (en) * | 2015-09-28 | 2017-03-30 | Siemens Aktiengesellschaft | System and method for predicting power plant operational parameters utilizing artificial neural network deep learning methodologies |
CN109558971A (zh) * | 2018-11-09 | 2019-04-02 | 河海大学 | 基于lstm长短期记忆网络的智能滑坡监测装置与方法 |
CN109739922A (zh) * | 2019-01-10 | 2019-05-10 | 江苏徐工信息技术股份有限公司 | 一种工业数据智能分析系统 |
CN110162519A (zh) * | 2019-04-17 | 2019-08-23 | 苏宁易购集团股份有限公司 | 数据清理方法 |
CN110084367A (zh) * | 2019-04-19 | 2019-08-02 | 安徽农业大学 | 一种基于lstm深度学习模型的土壤墒情预测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113033702A (zh) * | 2021-04-21 | 2021-06-25 | 上海勘察设计研究院(集团)有限公司 | 一种基于时空数据的结构安全预警方法 |
CN113138978A (zh) * | 2021-04-22 | 2021-07-20 | 深圳大学 | 面向城市差异性沉降监测的北斗数据填充与变形预测方法 |
CN113138978B (zh) * | 2021-04-22 | 2023-07-04 | 深圳大学 | 面向城市差异性沉降监测的北斗数据填充与变形预测方法 |
CN116913416A (zh) * | 2023-09-12 | 2023-10-20 | 中国地质大学(北京) | 海蚀崖岩石风化程度定量评价及预测方法及装置 |
CN116913416B (zh) * | 2023-09-12 | 2023-12-26 | 中国地质大学(北京) | 海蚀崖岩石风化程度定量评价及预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111859814B (zh) | 2023-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111105332B (zh) | 一种基于人工神经网络的高速公路智能预养护方法及系统 | |
CN111859814A (zh) | 基于lstm深度学习的岩石时效变形预测方法及其系统 | |
Yang et al. | Improved PLS and PSO methods-based back analysis for elastic modulus of dam | |
Li et al. | Limit state Kriging modeling for reliability-based design optimization through classification uncertainty quantification | |
Leng et al. | A hybrid data mining method for tunnel engineering based on real-time monitoring data from tunnel boring machines | |
CN114969953B (zh) | 基于CatBoost-NSGA-Ⅲ的盾构下穿隧道优化设计方法及设备 | |
CN114707234B (zh) | 一种基于贝叶斯深度学习的航空发动机剩余寿命预测方法 | |
CN112182954B (zh) | 一种基于lstm的流体仿真数据预测模型 | |
CN112948932A (zh) | 一种基于TSP预报数据与XGBoost算法的围岩等级预测方法 | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
CN117078054B (zh) | 一种科技型企业创新能力量化评估方法及系统 | |
CN113236228A (zh) | 一种单井产量快速预测方法及系统 | |
CN115221793A (zh) | 一种隧道围岩变形预测方法及装置 | |
Liu et al. | Global reliability sensitivity analysis based on state dependent parameter method and efficient sampling techniques | |
CN116383722A (zh) | 一种基于门控循环单元神经网络的压裂措施过程监控方法 | |
Zhong et al. | Construction project risk prediction model based on EW-FAHP and one dimensional convolution neural network | |
Rodriguez et al. | Methodology for the prediction of fluid production in the waterflooding process based on multivariate long–short term memory neural networks | |
Ben-Yelun et al. | Self-learning locally-optimal hypertuning using maximum entropy, and comparison of machine learning approaches for estimating fatigue life in composite materials of the aerospace industry | |
Wang et al. | Spatial association-considered real-time risk rate assessment of high arch dams using observed displacement and combination prediction model | |
Shaohu et al. | Prediction of drilling plug operation parameters based on incremental learning and CNN-LSTM | |
Xu et al. | A deep learning method for predicting the displacement of concrete arch dams considering the effect of cracks | |
CN117892998A (zh) | 一种线性工程边坡运营安全风险评估方法 | |
CN116308579B (zh) | 基于粒子群-svm的工程造价确定方法、系统及产品 | |
CN116825328A (zh) | 一种综合血液特征风险评估构建患者预后模型的算法 | |
CN116628444A (zh) | 一种基于改进元学习的水质预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |