CN112784331A - 基于改进lstm深度学习方法的土体应力应变关系确定方法 - Google Patents

基于改进lstm深度学习方法的土体应力应变关系确定方法 Download PDF

Info

Publication number
CN112784331A
CN112784331A CN202011021562.6A CN202011021562A CN112784331A CN 112784331 A CN112784331 A CN 112784331A CN 202011021562 A CN202011021562 A CN 202011021562A CN 112784331 A CN112784331 A CN 112784331A
Authority
CN
China
Prior art keywords
stress
deep learning
data
strain
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011021562.6A
Other languages
English (en)
Other versions
CN112784331B (zh
Inventor
沈水龙
张宁
闫涛
郑钤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shantou University
Original Assignee
Shantou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shantou University filed Critical Shantou University
Priority to CN202011021562.6A priority Critical patent/CN112784331B/zh
Publication of CN112784331A publication Critical patent/CN112784331A/zh
Application granted granted Critical
Publication of CN112784331B publication Critical patent/CN112784331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/13Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/14Force analysis or force optimisation, e.g. static or dynamic forces

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Civil Engineering (AREA)
  • Architecture (AREA)
  • Structural Engineering (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Investigating Strength Of Materials By Application Of Mechanical Stress (AREA)
  • Investigation Of Foundation Soil And Reinforcement Of Foundation Soil By Compacting Or Drainage (AREA)
  • Consolidation Of Soil By Introduction Of Solidifying Substances Into Soil (AREA)

Abstract

本发明公开了一种基于改进LSTM深度学习方法的土体应力应变关系确定方法,包括步骤:制备不同物理力学参数的土体试样;建立应力应变的原始数据集;对所述原始数据集进行归一化处理;建立四层LSTM深度学习网络,确定隐藏层节点数量Nh、激活函数和代价函数J;确定LSTM深度学习网络的初始权值矩阵和向量,以及混合激活函数的初始参数;利用修正Adam动量梯度下降算法更新权值矩阵,确定代价函数下降幅度Jd,更新激活函数参数;重复迭代直至LSTM深度学习网络的代价函数J小于预设数值或达到预定迭代训练次数Iter。本发明从实验数据中提取并确定应力和应变的非线性关系,能够考虑土体应力应变行为的时间相关特性。本方法简单、实用,便于推广,具有很大的应用价值。

Description

基于改进LSTM深度学习方法的土体应力应变关系确定方法
技术领域
本发明涉及土体本构关系领域,尤其涉及一种基于改进LSTM深度学习方 法的土体应力应变关系确定方法。
背景技术
土体是岩土工基础设施的载体,确定土体在荷载条件下的非线性力学响应, 对基础设施的设计和施工具有重要意义。由于土体复杂内部结构和多样的组成 成分,土体在外部荷载作用下具有复杂的非线性变形特征。确定土体的非线性 力学行为对目前描述土体非线性力学行为的数学模型称为本构模型。根据研究 方法的不同,土体本构模型可以分为传统理论模型和神经网络本构模型。传统 本构模型通常将土体视为连续介质,基于多种理想化假设,近似描述土体非线 性的应力应变关系,或多或少地偏离了土体实际的应力应变行为;在特定条件 下,能够较好地描述某一种土体的特定应力应变行为,例如修正剑桥模型能够 描述砂土的剪胀,但无法描述黏土的蠕变特性;而为使模型描述更多土体非线 性特征,高级本构模型增加模型的特征参数,这些没有明确的物理意义,造成 参数标定的困难,引发参数优化问题,更好地解决岩土工程问题。而神经网络 方法为数据驱动方法,直接从土体的应力应变数据中提取土体的非线性应力应 变特性,方法简单,普适性强,易于推广。
经对现有技术文献检索发现,目前用于土体本构模型研究的神经网络方法 主要为前馈式神经网络、反馈式神经网络和嵌入式神经网络。曾静等于2004年 在《岩土力学》发表的《不同应力路径下砂土的神经网络弹塑性本构模型研究》 一文中,采用前馈式神网络方法学习了砂土的应力应变特性;李克钢等于2013 年在《岩土力学》发表的《干湿循环作用下砂岩力学特性及其本构模型的神经 网络模拟》一文中,采用前馈式神经网络描述了砂岩的应力应变关系;Hashash 等于2019年在《Geotechnical Testing Journal》发表的《A NewTriaxial Apparatus Imposing Nonuniform Shearing for Deep Learning of SoilBehavior》一文中,采用嵌 入式神经网络研究了剪切试验中土体的应力应变特性。但上述方法均未考虑土 体应力应变行为的时间相关特性,无法描述历史应力应变对当前应力应变的影 响,因而结果存在较大偏差。目前尚没有能够考虑应力应变长期时间特性的神 经网络应力应变确定方法。
发明内容
本发明所要解决的技术问题在于,提供一种基于改进LSTM深度学习方法 的土体应力应变关系确定方法。可克服理论模型采用多种假设、普适性较差及 高级模型参数标定困难的缺陷,也可克服传统神经网络方法未考虑土体应力应 变行为时间相关特性的缺陷。
为了解决上述技术问题,本发明提供了一种基于改进LSTM深度学习方法 的土体应力应变关系确定方法,所述方法通过下列步骤实现:
第一步、制备不同物理力学参数的土体试样;
优选地,所述物理力学参数是指:土体的压缩指数λ、回弹指数κ、孔隙率e、 强度参数M;
优选地,所述土体试样是指高度与直径之比为2~2.5的圆柱形土体试验样 本。
第二步、利用三轴压缩试验,获取不同土体试样在一系列指定应力加载步 下的应变数据,建立应力应变的原始数据集;
优选地,所述三轴压缩实验是指:采用三轴压缩仪器,对指定的土体试样, 在给定的三轴压力室周围压力作用下,不断加大轴向附加压力,直至试样发生 剪切破坏;
优选地,所述原始数据集是指:所有土体试样,在所有加载条件下的原始 应力应变数据样本的集合,分为训练集和测试集;
优选地,所述训练集是指:在应力应变数据集中选取一定比例的应力应变 数据样本;
优选地,所述测试集是指:在应力应变数据集中除训练集以外的应力应变 数据样本;
更优选地,所述应力应变数据样本是指:由t个连续应力加载步对应的土体 参数、应力和应变组成的,时间长度为t的序列数据,单个时间步长内的数据分 为输入数据和标签数据;
更优选地,所述输入数据是指:土体试样的物理力学参数和应力;
更优选地,所述标签数据是指:土体试样的应变。
第三步、对原始数据集进行归一化处理,得到归一化数据集;
优选地,所述归一化处理是指:对应力应变数据样本进行无量纲化处理, 对所有应力应变数据样本的物理力学参数、应力和应变,除以其各自绝对值最 大值与缩放因子A的乘积,把所有数据映射到(0,1)范围,归一化公式如式(1);
Figure BDA0002700776800000031
其中,x为物理力学参数、应力和应变,xnorm为归一化后的物理力学参数、 应力和应变;
优选地,所述归一化数据集是指:对原始数据集进行归一化处理后得到数 据集;
更优选地,所述缩放因子A取值在1~2之间。
第四步、基于Octave建立四层LSTM深度学习网络,确定隐藏层节点数量 Nh、激活函数和代价函数J;
优选地,所述Octave是指:一种开源的数据处理软件;
优选地,所述四层LSTM深度学习模型是指:由输入层、LSTM单元隐藏层、 全连接隐藏层和输出层组成的深度学习模型,利用LSTM单元在时间维度上学 习或遗忘历史信息的作用,相邻时间步的权值始终相同;
优选地,所述隐藏层节点数量Nh是指:LSTM单元隐藏层和全连接隐藏层 中的节点数量,Nh满足公式(2):
Nh=a×Nc+b×Nv (2)
其中,Nc为应力应变数据样本的输入数据中不会随时间变化的常变量个数, Nv为应力应变数据样本的输入数据中随时间变化的可变变量个数,a为常变量系 数,一般取值为2,b为可变变量系数,一般取值为5;
优选地,所述激活函数是指:LSTM深度学习网络节点中的非线性映射函数, 一般为sigmoid函数和双曲正切函数;
优选地,所述代价函数J是指:衡量LSTM深度学习网络的输出层的输出数 据与数据样本的标签数据之间差距的函数,一般为均方根误差代价函数,满足 公式(3):
Figure BDA0002700776800000032
其中,n为数据样本的数量,m为每个数据样本的应力应变数据对的数量, yo ki为第k个数据样本第i个时间步的LSTM模型输出数据,yki为第k个数据样 本第i个时间步的标签数据,λ为L2正则系数,wj为模型中第j个权重,Nw为LSTM 模型的权重个数。
更优选地,所述输入层是指:数据样本输入LSTM深度学习模型的数据层, 输入层的节点数量等于输入数据的变量数量,输入层的输入数据直接作为该层 的输出数据输入LSTM单元隐藏层;
更优选地,所述LSTM单元隐藏层是指:由LSTM单元节点组成的数据层, 隐藏层节点数量为Nh,其输入数据为输入层的输出数据,其输出数据输入至全 连接隐藏层;
更优选地,所述全连接隐藏层是指:由全连接节点单元组成的数据层,隐 藏层节点数量为Nh,其输入数据为LSTM单元隐藏层的输出数据,其输出数据 输入至输出层;
更优选地,所述输出层是指:有输出单元节点组成的数据层,输出层节点 数量为1,其输入为全连接隐藏层的输出数据,输出数据为LSTM模型的输出数 据。
更优选地,所述LSTM单元节点是指:由LSTM单元节点组成的数据层, 隐藏层节点数量为Nh,其输入数据为输入层的输出数据,其输出数据输入至全 连接隐藏层;
更优选地,所述全连接节点单元是指:符合全连接非线性映射关系的节点 单元;
更优选地,所述输出层节点是指:符合输出层非线性映射关系的节点单元, 输出层节点单元的输出数据;
第五步、确定LSTM深度学习网络的初始权值矩阵和向量,以及混合激活 函数的初始参数α、β、λ;
优选地,所述初始权值矩阵和向量是指:预先给定的LSTM模型的初始的 权值矩阵和向量,初始权值矩阵和向量的方法满足公式(4):
Figure BDA0002700776800000051
其中,U为均匀分布,Wl,Rl,bl为第l层的权值矩阵和偏置向量,Nl为LSTM 模型第l层数据层的节点数量,L为循环神经网络的层数。。
优选地,所述混合激活函数是指:由双曲正切函数和线性单元混合组成的 激活函数,满足公式(5):
Figure BDA0002700776800000052
其中,f(x)为混合激活函数,f'(x)为混合激活函数的导数,tanh(x)为双曲正切函数,α、β、λ为混合激活函数系数,满足公式(6):
Figure BDA0002700776800000053
第六步、将训练集输入LSTM深度学习网络,利用修正Adam动量梯度下降 算法更新权值矩阵,确定代价函数下降幅度Jd,更新激活函数参数α、β、λ;
优选地,所述修正Adam动量梯度下降算法计算过程如下:
a)指定优化参数:动量指数衰减参数β1和β2,默认为0.9和0.999,系数ε为 10-8,指定步长α,初始化一阶动量m0、二阶动量v0和时间步t为0,上一步迭代 的权值参数为θt-1
b)计算权值参数梯度gt,
Figure BDA0002700776800000054
c)计算一阶动量mt,mt=β1mt-1+(1-β1)gt
d)计算二阶动量vt,vt=β2vt-1+(1-β2)gt 2
e)计算一阶动量修正项
Figure RE-GDA0002948139460000055
Figure RE-GDA0002948139460000056
f)计算二阶动量修正项
Figure RE-GDA0002948139460000057
Figure RE-GDA0002948139460000058
g)计算更新后权值参数θt,
Figure BDA0002700776800000057
其中,所述θt-1指代LSTM模型上一步迭代的权值矩阵和向量,所述θt指代 更新后的权值矩阵和向量。
优选地,所述代价函数下降幅度是指Jd:在指定迭代过程中,代价函数的变 化比例,负值代表代价函数下降,正值代表代价函数在上升,满足公式(7):
Figure BDA0002700776800000061
其中,J0表示在指定迭代过程中,代价函数的初始值;Jk为在指定迭代过程 中第k次迭代的代价函数值;
优选地,所述更新激活函数参数满足公式(8):
Figure BDA0002700776800000062
其中,
Figure BDA0002700776800000063
为代价函数对α的偏导数,
Figure BDA0002700776800000064
为代价函数对β的偏导数,
Figure BDA0002700776800000065
为代价函数对λ的偏导数;
第七步、重复迭代第六步,直至改进的LSTM深度学习网络的代价函数J 小于预设数值χ或达到预定迭代训练次数Iter。
本发明具有如下有益效果,使用改进的长短期记忆LSTM深度学习技术, 从实验数据中提取并确定应力和应变的非线性关系,能够考虑土体应力应变行 为的时间相关特性。本方法简单、实用,便于推广,具有很大的应用价值。
附图说明
图1为本发明一实施例的基于改进LSTM深度学习方法的土体应力应变关 系确定流程图。
图2为本发明一实施例的基于改进LSTM深度学习方法确定的土体应力应 变关系。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明 作进一步地详细描述。
某土体在不同围压条件下的应力应变行为符合修正剑桥模型。
如图1-图2所示,本实施例提供一种基于长短期记忆深度学习的土体应力 应变关系确定方法,所述方法通过下列步骤实现:
步骤一、制备不同物理力学参数的土体试样;
本实施例中,采用数值试验方法,建立了29个数值土样,其物理力学参数 取值范围如下:土体的压缩指数λ分别为0.06、0.09、0.1、0.12、0.15;回弹指数κ 为0.1*λ、孔隙率e为0.5、0.55、0.6、0.65、0.7、0.75、0.8;强度参数M为1;
步骤二、利用三轴压缩试验,获取不同土体试样在一系列指定应力加载步 下的应变数据,建立应力应变的原始数据集;
本实施例中,利用三轴压缩试验,对29个土样,在压力范围为10~900kPa 的127个不同围压条件下,施加30至60个应变加载步,在不同轴应变εa下对应 的偏应力q,生成127个不同时间长度(30至60个时间步)的应力应变数据样本, 构成原始数据集,其中训练集含有100个应力应变数据样本,测试集含有27个 应力应变数据集,样本的输入数据为4个变量,分别为初始孔隙比e、压缩指数 λ、围压σ3和轴应变εa,标签数据为偏应力q;
步骤三、对原始数据集进行归一化处理,得到归一化数据集;
本实施例中,所处归一化处理满足公式(1),把所有数据映射到(0,1)范围, 得到归一化数据集;
Figure BDA0002700776800000071
步骤四、基于Octave建立四层LSTM深度学习网络,确定隐藏层节点数量 Nh、激活函数和代价函数J;
本实施例中,采用Octave开源软件构建四层LSTM深度学习网络,分别为 输入层、LSTM单元隐藏层、全连接隐藏层和输出层;隐藏层节点数量Nh按公 式(2)计算,为11个:
Nh=a×Nc+b×Nv=2×3+5×1=11 (2)
本实施例中,所述激活函数为sigmoid函数和双曲正切函数;
本实施例中,所述代价函数J是采用均方根误差代价函数,满足公式(3):
Figure BDA0002700776800000072
本实施例中,所述输入层的节点数量等于输入数据的变量数量,为4个节 点,输入层的输入数据直接作为该层的输出数据输入LSTM单元隐藏层;
本实施例中,所述LSTM单元隐藏层节点数量为11,其输入数据为输入层 的输出数据,其输出数据输入至全连接隐藏层;
本实施例中,所述全连接隐藏层节点数量为11,其输入数据为LSTM单元 隐藏层的输出数据,其输出数据输入至输出层;
本实施例中,所述输出层节点数量为1,其输入为全连接隐藏层的输出数据, 输出数据为LSTM模型的输出数据,即预测的偏应力。
步骤五、确定LSTM深度学习网络的初始权值矩阵和向量,以及混合激活 函数的初始参数α、β、λ;
本实施例中,所述初始权值矩阵和向量的满足公式(4):
Figure BDA0002700776800000081
本实施例中,所述混合激活函数是指:由双曲正切函数和线性单元混合组 成的激活函数,满足公式(5):
Figure BDA0002700776800000082
其中,混合激活函数系数α、β、λ满足公式(6):
Figure BDA0002700776800000083
步骤六、将训练集输入LSTM深度学习网络,利用修正Adam动量梯度下降 算法更新权值矩阵,确定代价函数下降幅度Jd,更新激活函数参数α、β、λ;
本实施例中,所述修正Adam动量梯度下降算法计算过程如下:
a)指定优化参数:动量指数衰减参数β1和β2,默认为0.9和0.999,系数ε为 10-8,指定步长α,初始化一阶动量m0、二阶动量v0和时间步t为0,上一步迭代 的权值参数为θt-1
b)计算权值参数梯度
Figure BDA0002700776800000091
c)计算一阶动量mt=β1*mt-1+(1-β1)*gt
d)计算二阶动量vt=β2*vt-1+(1-β2)*gt 2
e)计算一阶动量修正项
Figure RE-GDA0002948139460000091
f)计算二阶动量修正项
Figure RE-GDA0002948139460000092
g)计算更新后权值参数
Figure RE-GDA0002948139460000093
其中,所述θt-1指代LSTM模型上一步迭代的权值矩阵和向量,所述θt指代 更新后的权值矩阵和向量。
本实施例中,所述代价函数下降幅度是指Jd:在指定迭代过程中,代价函数 的变化比例,负值代表代价函数下降,正值代表代价函数在上升,满足公式(7):
Figure BDA0002700776800000095
本实施例中,所述更新激活函数参数满足公式(8):
Figure BDA0002700776800000096
步骤七、重复迭代第六步,直至改进的LSTM深度学习模型达到预定迭代 训练次数3000次;
本实施例中,应用训练后的LSTM深度学习网络确定了27组应力应变数据 样本,预测结果如图2所示。LSTM深度学习网络在训练集的均方误差仅为 0.0064,均方相对误差仅为0.074;在测试集的均方误差仅0.0045,均方相对误差 仅为0.058;改进的LSTM深度学习网络在训练集的均方误差为0.00147,均方相 对误差为0.0012;在测试集的均方误差0.0094,均方相对误差为0.0017,远低于 传统长短期记忆深度学习方法。
本发明中的改进的长短期记忆深度学习的土体应力应变关系确定方法,能 够快速准确地预测不同土体在不同围压条件下的应力应变关系,与传统长短期 记忆深度学习方法相比,精度更高,对指导实际工程具有重要意义。本方法简 单、实用,便于推广,具有很大的应用价值。以上所揭露的仅为本发明一种较 佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要 求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,包括以下步骤:
S1:制备不同物理力学参数的土体试样,所述物理力学参数包括土体的压缩指数λ、回弹指数κ、孔隙率e、强度参数M;
S2:使用三轴压缩试验,获取不同所述土体试样在指定应力加载步下的应变数据,建立应力应变的原始数据集;
S3:对所述原始数据集进行归一化处理,得到归一化数据集;
S4:使用Octave建立四层LSTM深度学习网络,确定隐藏层节点数量Nh、激活函数和代价函数J;所述四层LSTM深度学习网络由输入层、LSTM单元隐藏层、全连接隐藏层和输出层组成的深度学习模型,所述LSTM单元隐藏层由LSTM单元节点组成的数据层,所述LSTM单元节点由LSTM单元节点组成的数据层,隐藏层节点数量为Nh,其输入数据为输入层的输出数据,其输出数据输入至全连接隐藏层;
S5:确定LSTM深度学习网络的初始权值矩阵和向量,以及混合激活函数的初始参数α、β、λ;
S6:将训练集输入LSTM深度学习网络,利用修正Adam动量梯度下降算法更新权值矩阵,确定代价函数下降幅度Jd,更新激活函数参数α、β、λ;
S7:重复迭代S6,直至LSTM深度学习网络的代价函数J小于预设数值χ或达到预定迭代训练次数Iter。
2.根据权利要求1所述的基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,所述步骤S1中,物理力学参数包括土体的压缩指数λ、回弹指数κ、孔隙率e、强度参数M;所述土体试样是以高度与直径之比为2~2.5的圆柱形土体试验样本。
3.根据权利要求1所述的基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,所述步骤S2中,所述原始数据集为在所有加载条件下的原始应力应变数据样本的集合,分为训练集和测试集;所述原始应力应变数据样本由t个连续应力加载步对应的土体参数、应力和应变组成。
4.根据权利要求1所述的基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,所述隐藏层节点数量Nh为LSTM单元隐藏层和全连接隐藏层中的节点数量,Nh满足公式:
Nh=a×Nc+b×Nv
其中,Nc为应力应变数据样本的输入数据中不会随时间变化的常变量个数,Nv为应力应变数据样本的输入数据中随时间变化的可变变量个数,a为常变量系数,b为可变变量系数。
5.根据权利要求4所述的基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,所述激活函数为LSTM深度学习网络节点中的非线性映射函数。
6.根据权利要求4所述的基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,所述代价函数J为衡量LSTM深度学习网络的输出层的输出数据与数据样本的标签数据之间差距的函数,其中,
Figure RE-FDA0002948139450000021
其中,n为数据样本的数量,m为每个数据样本的应力应变数据对的数量,yo ki为第k个数据样本第i个时间步的LSTM模型输出数据,yki为第k个数据样本第i个时间步的标签数据,λ为L2正则系数,wj为模型中第j个权重,Nw为LSTM模型的权重个数。
7.根据权利要求1所述的基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,所述初始权值矩阵和向量为预先给定的LSTM模型的初始的权值矩阵和向量,初始权值矩阵和向量的方法满足公式
Figure RE-FDA0002948139450000022
Figure RE-FDA0002948139450000023
Figure RE-FDA0002948139450000024
其中,U为均匀分布,Wl,Rl,bl为第l层的权值矩阵和偏置向量,Nl为LSTM模型第l层数据层的节点数量,L为循环神经网络的层数。
8.根据权利要求7所述的基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,所述混合激活函数为双曲正切函数和线性单元混合组成的激活函数,满足公式
Figure RE-FDA0002948139450000031
f′(x)=β+αλ(1-tanh2(λx))
其中,f(x)为混合激活函数,f'(x)为混合激活函数的导数,tanh(x)为双曲正切函数,α、β、λ为混合激活函数系数,满足公式:
Figure RE-FDA0002948139450000032
9.根据权利要求1所述的基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,所述修正Adam动量梯度下降算法计算过程如下:
a)指定优化参数:动量指数衰减参数β1和β2,默认为0.9和0.999,系数ε为10-8,指定步长α,初始化一阶动量m0、二阶动量v0和时间步t为0,上一步迭代的权值参数为θt-1
b)计算权值参数梯度gt,gt=▽θftt-1);
c)计算一阶动量mt,mt=β1mt-1+(1-β1)gt
d)计算二阶动量vt,vt=β2vt-1+(1-β2)gt 2
e)计算一阶动量修正项
Figure RE-FDA0002948139450000033
Figure RE-FDA0002948139450000034
f)计算二阶动量修正项
Figure RE-FDA0002948139450000035
Figure RE-FDA0002948139450000036
g)计算更新后权值参数θt
Figure RE-FDA0002948139450000037
其中,所述θt-1指代LSTM模型上一步迭代的权值矩阵和向量,所述θt指代更新后的权值矩阵和向量。
10.根据权利要求9所述的基于改进LSTM深度学习方法的土体应力应变关系确定方法,其特征在于,所述代价函数下降幅度为在指定迭代过程中,代价函数的变化比例,负值代表代价函数下降,正值代表代价函数在上升,满足公式
Figure RE-FDA0002948139450000041
其中,J0表示在指定迭代过程中,代价函数的初始值;Jk为在指定迭代过程中第k次迭代的代价函数值;
所述更新激活函数参数满足公式
Figure RE-FDA0002948139450000042
CN202011021562.6A 2020-09-25 2020-09-25 基于改进lstm深度学习方法的土体应力应变关系确定方法 Active CN112784331B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011021562.6A CN112784331B (zh) 2020-09-25 2020-09-25 基于改进lstm深度学习方法的土体应力应变关系确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011021562.6A CN112784331B (zh) 2020-09-25 2020-09-25 基于改进lstm深度学习方法的土体应力应变关系确定方法

Publications (2)

Publication Number Publication Date
CN112784331A true CN112784331A (zh) 2021-05-11
CN112784331B CN112784331B (zh) 2022-09-13

Family

ID=75750383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011021562.6A Active CN112784331B (zh) 2020-09-25 2020-09-25 基于改进lstm深度学习方法的土体应力应变关系确定方法

Country Status (1)

Country Link
CN (1) CN112784331B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114021414A (zh) * 2022-01-05 2022-02-08 北京科技大学 一种基于深度学习的优化有限元迭代过程方法及装置
CN114112674A (zh) * 2021-11-26 2022-03-01 西南石油大学 一种基于组构特征的页岩应力-应变曲线预测方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100292966A1 (en) * 2009-05-12 2010-11-18 Gm Global Technology Oeprations, Inc. Methods of predicting residual stresses and distortion in quenched aluminum castings
CN104361211A (zh) * 2014-10-24 2015-02-18 中冶长天国际工程有限责任公司 岩石统计损伤本构模型的构建和应用方法
CN107145665A (zh) * 2017-05-04 2017-09-08 东北大学 一种巷道围岩应力建模与预测方法
CN107239852A (zh) * 2017-05-05 2017-10-10 南京邮电大学 一种基于深度学习的电量消耗预测方法
CN108153943A (zh) * 2017-12-08 2018-06-12 南京航空航天大学 基于时钟循环神经网络的功率放大器的行为建模方法
CN108549929A (zh) * 2018-03-29 2018-09-18 河海大学 一种基于深层卷积神经网络的光伏功率预测方法
CN108627137A (zh) * 2018-05-09 2018-10-09 中国石油天然气集团公司 一种滑坡变形预测计算方法
JP2018195200A (ja) * 2017-05-19 2018-12-06 日本電信電話株式会社 多層ニューラルネットの大局構造抽出装置、方法、及びプログラム
CN110084367A (zh) * 2019-04-19 2019-08-02 安徽农业大学 一种基于lstm深度学习模型的土壤墒情预测方法
CN111144052A (zh) * 2019-12-17 2020-05-12 中南大学 基于cnn-arx模型的直线一级倒立摆系统建模方法及模型
CN111209620A (zh) * 2019-12-30 2020-05-29 浙江大学 基于LSTM-cGAN的含裂纹结构剩余承载力及裂纹扩展路径的预测方法
US20200193074A1 (en) * 2017-09-07 2020-06-18 Southeast University Method of constructing dynamic shear constitutive model for fiber-reinforced composite material

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100292966A1 (en) * 2009-05-12 2010-11-18 Gm Global Technology Oeprations, Inc. Methods of predicting residual stresses and distortion in quenched aluminum castings
CN104361211A (zh) * 2014-10-24 2015-02-18 中冶长天国际工程有限责任公司 岩石统计损伤本构模型的构建和应用方法
CN107145665A (zh) * 2017-05-04 2017-09-08 东北大学 一种巷道围岩应力建模与预测方法
CN107239852A (zh) * 2017-05-05 2017-10-10 南京邮电大学 一种基于深度学习的电量消耗预测方法
JP2018195200A (ja) * 2017-05-19 2018-12-06 日本電信電話株式会社 多層ニューラルネットの大局構造抽出装置、方法、及びプログラム
US20200193074A1 (en) * 2017-09-07 2020-06-18 Southeast University Method of constructing dynamic shear constitutive model for fiber-reinforced composite material
CN108153943A (zh) * 2017-12-08 2018-06-12 南京航空航天大学 基于时钟循环神经网络的功率放大器的行为建模方法
CN108549929A (zh) * 2018-03-29 2018-09-18 河海大学 一种基于深层卷积神经网络的光伏功率预测方法
CN108627137A (zh) * 2018-05-09 2018-10-09 中国石油天然气集团公司 一种滑坡变形预测计算方法
CN110084367A (zh) * 2019-04-19 2019-08-02 安徽农业大学 一种基于lstm深度学习模型的土壤墒情预测方法
CN111144052A (zh) * 2019-12-17 2020-05-12 中南大学 基于cnn-arx模型的直线一级倒立摆系统建模方法及模型
CN111209620A (zh) * 2019-12-30 2020-05-29 浙江大学 基于LSTM-cGAN的含裂纹结构剩余承载力及裂纹扩展路径的预测方法

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
HOON BYUN ET AL: "Prediction of the Stress-Strain Curve of Materials under Uniaxial Compression by Using LSTM Recurrent Neural Network", 《TUNNEL & UNDERGROUND SPACE》 *
NING ZHANG ET AL: "Investigation on Performance of Neural Networks Using Quadratic Relative Error Cost Function", 《IEEE ACCESS》 *
PIERRE GUY ATANGANA NJOCK ET AL: "Evaluation of soil liquefaction using AI technology incorporating a coupled ENN/t-SNE model", 《SOIL DYNAMICS AND EARTHQUAKE ENGINEERING》 *
PIN ZHANG ET AL: "An AI-based model for describing cyclic characteristics of granular materials", 《INTERNATIONAL JOURNAL FOR NUMERICAL AND ANALYTICAL METHODS IN GEOMECHANICS》 *
XAVIER GLOROT ET AL: "Understanding the difficulty of training deep feedforward neural networks", 《JOURNAL OF MACHINE LEARNING RESEARCH》 *
YMA HASHASH ET AL: "Novel Approach to Integration of Numerical Modeling and Field Observations for Deep Excavations", 《JOURNAL OF GEOTECHNICAL & GEOENVIRONMENTAL ENGINEERING》 *
冷鹏飞: "基于深度学习的雷达辐射源识别技术", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
刘庆: "基于LSTM模型的汽车配件安全库存量预测研究", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 *
张浩鑫: "基于深度神经网络的图像语义分割", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
王宇峰: "文本情感分析及其应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
袁斌: "基于深度学习的音乐流派分类方法的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
袁泓磊 等: "基于深度学习模型的甘蔗转运车节点应力预测", 《装备制造技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114112674A (zh) * 2021-11-26 2022-03-01 西南石油大学 一种基于组构特征的页岩应力-应变曲线预测方法
CN114112674B (zh) * 2021-11-26 2023-07-25 西南石油大学 一种基于组构特征的页岩应力-应变曲线预测方法
CN114021414A (zh) * 2022-01-05 2022-02-08 北京科技大学 一种基于深度学习的优化有限元迭代过程方法及装置

Also Published As

Publication number Publication date
CN112784331B (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN112255095B (zh) 一种土体应力应变关系确定方法
Fang et al. Application of deep learning method in web crippling strength prediction of cold-formed stainless steel channel sections under end-two-flange loading
Li et al. An improved approach to nonlinear dynamical system identification using PID neural networks
CN109828304B (zh) 一种基于深度学习的利用地震数据预测岩性序列模型的方法
CN107742031B (zh) 基于实验和数学算法的驱替实验人造岩心分析制备方法
CN112784331B (zh) 基于改进lstm深度学习方法的土体应力应变关系确定方法
CN113722877A (zh) 一种对锂电池放电时温度场分布变化进行在线预测的方法
Furukawa et al. Accurate cyclic plastic analysis using a neural network material model
CN113378939B (zh) 基于物理驱动神经网络的结构数字孪生建模与参数识别法
CN109472057A (zh) 基于跨工步隐式参数记忆的产品加工质量预测装置及方法
CN111048163B (zh) 一种基于高阶神经网络的页岩油滞留烃量(s1)评价方法
Zhu et al. Modelling of shearing behaviour of a residual soil with recurrent neural network
CN111950180A (zh) 一种缆索承重桥梁结构体系可靠度分析方法及系统
CN111159863A (zh) 基于神经网络算法的材料变形及失效预测方法及系统
CN113722997A (zh) 一种基于静态油气田数据的新井动态产量预测方法
CN111832703A (zh) 一种基于采样间隔感知长短期记忆网络的流程制造工业不规则采样动态序列建模方法
CN114004346A (zh) 基于门控堆叠同构自编码器的软测量建模方法及存储介质
CN114239397A (zh) 基于动态特征提取与局部加权深度学习的软测量建模方法
CN114254416A (zh) 基于长短期记忆深度学习的土体应力应变关系确定方法
CN113343559B (zh) 迭代重加权最小二乘法极限学习机响应面可靠性分析方法
CN112347670B (zh) 一种基于神经网络响应面的堆石料蠕变参数预测方法
CN116894180B (zh) 一种基于异构图注意力网络的产品制造质量预测方法
Karadogan et al. Potential use of machine learning to determine yield locus parameters
CN114529040A (zh) 一种机电产品装配误差在线预测方法
CN115204040A (zh) 一种基于神经网络模型的数字加热炉仿真方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant