CN115796038B - 基于循环神经网络的实时混合试验方法 - Google Patents

基于循环神经网络的实时混合试验方法 Download PDF

Info

Publication number
CN115796038B
CN115796038B CN202211538727.6A CN202211538727A CN115796038B CN 115796038 B CN115796038 B CN 115796038B CN 202211538727 A CN202211538727 A CN 202211538727A CN 115796038 B CN115796038 B CN 115796038B
Authority
CN
China
Prior art keywords
model
substructure
test
numerical
displacement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211538727.6A
Other languages
English (en)
Other versions
CN115796038A (zh
Inventor
许国山
郝鹏鑫
姜禹彤
郑力畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202211538727.6A priority Critical patent/CN115796038B/zh
Publication of CN115796038A publication Critical patent/CN115796038A/zh
Application granted granted Critical
Publication of CN115796038B publication Critical patent/CN115796038B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于循环神经网络的实时混合试验方法,涉及一种混合试验方法。为了解决目前的实时混合试验方法存在数值子结构模型精度差和计算效率差的问题,本发明先利用本构模型以及边界条件建好的精细化有限元数值模型输出足够数据,然后利用获取的数据去训练得到初始的循环神经网络模型,再通过精密位移和外力传感器收集到的数据训练得到最终的循环神经网络模型,作为数值子结构的元模型可以提高模型的准确度;另外,利用试验子结构的试验数据去更新与试验子结构有相同本构模型的数值子结构,进而提高数值子结构本构模型的准确度。

Description

基于循环神经网络的实时混合试验方法
技术领域:
本发明属于混合试验技术领域,具体涉及一种混合试验方法。
背景技术:
进入新世纪以来,汶川地震、印度洋地震、东日本地震等巨震接连发生,造成重大人员伤亡和经济损失。保证建筑物的抗震能力是减少地震损失的最有效办法。最近三十年,性态设计和韧性设计等抗震设计理论日新月异,隔减震等结构控制技术层出不穷,为工程结构抗震安全性提供了丰富的理论基础和技术手段。这些新的理论和技术是否有效均需经过结构试验来检验。
混合试验方法结合了拟静力试验和振动台试验的优点,在结构试验中具有广泛的应用前景,尤其实时混合试验方法为复杂结构的复杂动力问题研究提供有效手段。虽然混合试验近年来在研究与应用方面取得了重要进展,但依旧有很多问题需要去解决。针对结构的非线性部分,现有技术计算精度不高以及计算效率较差;对于大型复杂试件的实时混合试验方法,时滞补偿、加载系统与试件相互作用等问题值得进一步研究;现有混合试验软件的通用性有待进一步拓展,以降低混合试验应用的技术门槛;混合试验方法的应用范围有待进一步拓展,通过在土木、车辆、航空航天工程中更多的实际工程应用推动混合试验技术的完善与发展。
发明内容:
本发明是为了解决目前的实时混合试验方法存在数值子结构模型精度差和计算效率差的问题,本发明提供了一种基于循环神经网络的实时混合试验方法。
一种基于循环神经网络的实时混合试验方法,包括以下步骤:
S1、建立试验整体结构的精细化有限元数值模型;
S2、将试验整体结构划分为试验子结构、第二数值子结构和第一数值子结构;
试验子结构在实验室展开加载试验;
第二数值子结构是指与试验子结构具有相同本构模型的数值结构,第二数值子结构利用GRU模型模拟;此部分的模型在进行实时混合试验的时候更新;
第一数值子结构是指除了第二数值子结构和试验子结构的剩余部分的数值结构,第一数值子结构利用DynLSTM模型模拟;此部分的模型在进行实时混合试验的时候不更新;
所述的DynLSTM模型即基于动力学的LSTM模型,其包括两个LSTM网络和一个张量微分器,第一个LSTM网络为从地震动建立ag到响应Z的非线性映射Z=LSTM1(ag;θ1),θ1表示LSTM1的权重和偏差;
张量微分器微分通过基于有限差分的滤波实现,产生Z的导数
Figure BDA0003978756150000021
第二个LSTM网络为响应Z到质量归一化恢复力g的映射g=LSTM2(Z(θ1);θ2),θ2表示LSTM2的权重和偏差;
S3、基于划分的两个数值子结构和试验子结构进行实时混合试验;
将第k步的外力输入到DynLSTM模型中,输出第k步整体结构的位移响应、试验子结构位移dk exp和第二数值子结构的位移dk num
所述外力包括第k步的地震加速度ag、第k-1步的试验子结构的恢复力Fk-1 exp和第二数值子结构的恢复力Fk-1 num
将试验子结构位移dk exp传给电液伺服作动器,得到试验子结构真实恢复力Fk exp,用第k步试验子结构dk exp和Fk exp去更新第二数值子结构的GRU模型,dk num通过更新后的GRU模型得到第k步试验子结构的恢复力Fk num
将k步的Fk num、Fk exp、和第k+1步的地震加速度ag传给DynLSTM模型,用于计算第k+1整体结构的位移响应、试验子结构位移dk+1 exp和数值子结构(更新)位移dk+1 num
S4、重复步骤S3,直至试验结束。
优选地,DynLSTM模型中的两个LSTM网络的架构相同。
优选地,DynLSTM模型中的LSTM网络包括两个LSTM层和两个全连接层。
进一步地,所述DynLSTM模型的开发过程中,考虑地震动力学由非线性运动方程控制:
Figure BDA0003978756150000022
其中M是质量矩阵;C是阻尼矩阵;K是刚度矩阵;u,
Figure BDA0003978756150000023
和/>
Figure BDA0003978756150000024
是到地面的相对位移、速度和加速度矢量;r是滞后位移;λ是屈服后刚度与屈服前刚度的比值;ag表示地震加速度;Γ是力分布矢量;h表示总非线性恢复力。
进一步地,所述DynLSTM模型的开发过程中,需要将将非线性运动方程进行质量归一化得到更一般的形式:
Figure BDA0003978756150000025
g(t)有两层含义:g(t)=M-1h(t)是质量归一化恢复力;
Figure BDA0003978756150000026
带着一个未知的潜在函数/>
Figure BDA0003978756150000031
Z表示状态空间SS变量,包括位移u、速度/>
Figure BDA0003978756150000032
和滞后位移r,即
Figure BDA0003978756150000033
进一步地,所述DynLSTM模型的训练过程包括以下步骤:
使用训练数据
Figure BDA0003978756150000034
得到LSTM1的损失函数:
Figure BDA0003978756150000035
其中,nm是测量样本的数量,参数的上角标(i)表示第i个样本;
微分通过基于有限差分的滤波实现,产生Z的导数
Figure BDA0003978756150000036
SS变量相等条件/>
Figure BDA0003978756150000037
得到“相等损失函数”:
Figure BDA0003978756150000038
其中,nc是配置样本的数量;
针对第二个LSTM网络,由
Figure BDA0003978756150000039
得到“控制损失函数”:
Figure BDA00039787561500000310
最后得到“全损失函数”:
Figure BDA00039787561500000311
这里的α,β和γ是用户定义的权重系数,用于收敛控制;
通过训练算法得到最优权重和偏差
Figure BDA00039787561500000312
进一步地,所述DynLSTM模型的输入和输出序列需要格式化为三维数组,其中这三维数组分别是第一维中的样本,第二维中的时间步长,以及第三维中的输入或输出特征,其中输入为地震加速度、试验子结构的恢复力、第二数值子结构的恢复力,输出为整体结构的位移、试验子结构的期望位移、第二数值子结构的位移。
进一步地,所述GRU模型的开发和测试过程包括以下步骤:
S121、生成人工数据:
选取五条地震动GM1、GM2、GM3、GM4和GM5;给定阻尼器位移,GRU模型预测对应自由度恢复力;位移/剪切时程的样本通过执行等效单自由度系统的非线性时程分析生成;
从GM1和GM2获得数据用于开发GRU,GM3、GM4和GM5相对应的数据用于测试;
S122、数据预处理:
首先,将产生训练数据集按最大绝对值缩放,使其在范围[-1,1]内;
然后,将数据格式化集塑造成三维向量:样本、时间步长和特征;
S123、调整网络架构:
利用GM1对模型进行训练,选择网络架构;通过计算归一化参考值和预测参考值之间的均方误差MSE来评估模型性能;
S124、调整学习行为:
给定相同的数据和网络架构,对超参数执行敏感性分析,然后通过训练周期对学习行为进行深入诊断,确定超参数,并在源自GM2的全长序列上训练最终GRU模型;
S125、在源自GM3、4和5的新的数据集上测试开发出来的GRU模型。
进一步地,在进行混合试验时需要对电液伺服作动器进行时滞补偿,采用多项式外插法进行补偿。
进一步地,建立试验整体结构的精细化有限元数值模型的过程直接根据已有资料建立整体结构精确化有限元数值模型,或者,建立整体结构的基于子结构的精细化多尺度有限元数值模型。
有益效果:
本发明解决了现有实时混合试验方法中存在计算效率差的问题。现有技术一旦整体结构涉及更大的自由度、更加复杂,或者进入强非线性行为,导致结构计算效率较差不能完成实时混合试验方法。本发明一种基于循环神经网络的实时混合试验方法,采用和训练基于Python的循环神经网络模型作为数值子结构的元模型,不仅能够完成实时传递,而且大大提高计算效率。
本发明解决了现有数值子结构模型精度差的问题。现有技术大多利用简化模型方式建模,这种建模精度较低,不能真实模拟数值子结构的真实受力状态,这就会造成数值子结构模型误差。本发明是一种基于循环神经网络的实时混合试验方法,鉴于有限元本身有误差,同时训练模型需要大量的数据。所以先利用选用恰当单元、本构模型以及边界条件建好的精细化有限元数值模型输出足够数据,利用获取的数据去训练得到初始的循环神经网络模型,再通过精密位移和外力传感器收集到的数据训练得到最终的循环神经网络模型,作为数值子结构(不更新)的元模型可以提高模型的准确度。另外,利用试验子结构的试验数据去更新与试验子结构有相同本构模型的数值子结构,进而提高数值子结构本构模型的准确度。最后,走完实验流程,将试验子结构GRU模型打包,便于别的含有相同构件的结构进行研究。
附图说明:
为了易于说明,本发明由下述的具体实施及附图作以详细描述。
图1为属于循环神经网络RNN的GRU的单元结构。
图2为开发和测试循环神经网络模型的框架图。
图3为属于循环神经网络RNN的LSTM的单元结构。
图4为基于动力学的LSTM模型的构架图。
图5为基于循环神经网络的实时混合试验方法的架构。
图6为基于循环神经网络的实时混合试验方法的原理图。
具体实施方式:
为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图中示出的具体实施例来描述本发明。但是应该理解,这些描述只是示例性的,而并非要限制本发明的范围。
一种基于循环神经网络的实时混合试验方法,所述方法包括以下步骤:
S1、建立试验整体结构的精细化有限元数值模型,输入选好的地震动得到整体结构对应的自由度位移响应以及恢复力,将数据整理训练循环神经网络模型,得到初始的基于动力学的LSTM模型(后面简称DynLSTM);通过传感器得到位移和加速度,利用收集到的数据去开发与预测最终的DynLSTM模型。
S2、将试验整体结构划分为试验子结构、第二数值子结构(与试验子结构具有相同本构模型的结构,此部分的模型在进行实时混合试验的时候更新)和第一数值子结构(是除了第二数值子结构和试验子结构的剩余部分的结构,此部分的模型在进行实时混合试验的时候不更新)。其中试验子结构为整体结构中较复杂部分,在实验室展开加载试验;而第一数值子结构为整体结构中力学性能相对简单,在计算机中利用DynLSTM模型模拟;与试验子结构具有相同本构模型的部分作为第二数值子结构,利用GRU模型模拟,随着试验数据进行实时更新。
S3、基于划分的两个数值子结构和试验子结构进行实时混合试验;
将第k步的外力输入到DynLSTM模型中,输出第k步整体结构的位移响应、试验子结构位移dk exp和第二数值子结构的位移dk num
所述外力包括第k步的地震加速度ag、第k-1步的试验子结构的恢复力Fk-1 exp和第二数值子结构的恢复力Fk-1 num
将试验子结构位移dk exp传给电液伺服作动器,得到试验子结构真实恢复力Fk exp,用第k步试验子结构dk exp和Fk exp去更新第二数值子结构的GRU模型,dk num通过更新后的GRU模型得到第k步试验子结构的恢复力Fk num
将k步的Fk num、Fk exp、和第k+1步的地震加速度ag传给DynLSTM模型,用于计算第k+1整体结构的位移响应、试验子结构位移dk+1 exp和数值子结构(更新)位移dk+1 num
S4、重复步骤S3,直至试验结束。
具体地,
步骤S1的过程包括以下步骤:
S11、建立整体结构精细化有限元数值模型;
若研究结构动力性能比较简单,直接根据已有资料建立整体结构精确化有限元数值模型。
若研究结构动力性能比较复杂,例如桥梁,建立整体结构的基于子结构的精细化多尺度有限元数值模型,下面分为子结构法基本理论和多尺度有限元数值模型说明。
(1)子结构法基本理论
基本有限元静力方程
Ku=P
式中,K为结构整体刚度矩阵;u为结构整体节点位移列阵;P为结构整体荷载列阵。
上述方程可以被分为两块,主自由度(以下标b表示)矩阵和从自由度(以下标i表示)矩阵。
Figure BDA0003978756150000061
其中,ub、ui分别表示主自由度结构整体节点位移列阵和从自由度结构整体节点位移列阵,Pb、Pi分别表示主自由度结构整体荷载列阵和从自由度结构整体荷载列阵;Kbb表示单位主自由度结构整体节点位移在主自由度结构整体节点引起的力,Kii表示单位从自由度结构整体节点位移在从自由度结构整体节点引起的力,Kbi、表示单位从自由度结构整体节点位移在主自由度结构整体节点引起的力,Kib表示单位主自由度结构整体节点位移在从自由度结构整体节点引起的力。
由上式得:
Kbbub+Kbiui=Pb
Kibub+Kiiui=Pi
将上式变换得:
Figure BDA0003978756150000062
求得:
Figure BDA0003978756150000071
Figure BDA0003978756150000072
式中,
Figure BDA0003978756150000073
和/>
Figure BDA0003978756150000074
称之为子结构(超单元)刚度矩阵和荷载列阵。
(2)多尺度有限元数值模型
当结构动力性能复杂,建立整体结构精细化多尺度有限元数值模型。因为ANSYS有限元软件中含有子结构求解器,故可以在此有限元软件中建立基于子结构精细化多尺度有限元数值模型。但子结构求解器并非在所有ANSYS模块中都能利用,目前ANSYS子结构求解器可以在ANSYS/Mutiphysics,ANSYS/Mechanical和ANSYS/Structural中使用。ANSYS子结构分析包括三个步骤:生成过程、使用过程和扩展过程。
在构建子结构时(生成过程),需要构造子结构超单元矩阵(质量、阻尼、刚度等)以及荷载列阵,包括位于子结构上的外力(面力、节点力等),体力(自重、温度等),从而构建
Figure BDA0003978756150000075
和/>
Figure BDA0003978756150000076
在超单元集成过程中(使用过程),整体模型由一系列超单元和非超单元共同集成,计算主自由度位移;在使用过程求解中,只计算超单元中的主自由度和非超单元,而不计算超单元的从自由度。在扩展子结构结果时(扩展过程),将主自由度位移结果ub,扩展到子结构的从自由度ui上。
S12、建立循环神经网络数值模型;
(一)开发和测试GRU模型。
GRU模型用于预测给定构件的位移响应的恢复力时程。GRU模型输入和输出是时间序列,考虑到通常用于准确和稳定的非线性时程分析(NTHA)的非常小的时间步长,其长度可能非常长。序列长度随地震的持续时间而变化。滞后行为可能取决于许多参数和现象;因此,数据中的模式可能难以描述。考虑到上述条件才使用RNN变体GRU,它旨在处理序列数据并自动推断数据中的模式。
GRU和LSTM的性能在很多任务上不分伯仲。GRU参数更少因此更容易收敛,但是数据集很大的情况下,LSTM表达性能更好。从结构上来说,GRU只有两个门(update和reset),LSTM有三个门(forget,input,output),GRU直接将隐状态ht-1传给下一个单元,而LSTM则用状态C把ht-1包装起来。GRU单元的结构如图1所示,分为输入输出结构和内部结构两个部分。
(1)GRU输入输出结构
GRU输入输出结构与普通RNN结构是相同的。有一个当前的输入xt,和上一个节点传递下来的隐状态ht-1,这个隐状态包含了之前节点的相关信息。结合xt和ht-1,GRU会得到当前隐藏节点的输出yt和传递给下一个节点的隐状态ht
(2)GRU内部结构
首先,通过上一个传输下来的状态ht-1和当前节点的输入xt来获取两个门控状态。其中rt控制重置的门控(reset gate),zt为控制更新的门控(update gate)。
rt=σ(Wr·[ht-1,xt])
zt=σ(Wz·[ht-1,xt])
得到门控信号之后,首先使用重置门控来得到“重置”之后的数据
Figure BDA0003978756150000085
再将ht-1与输入xt进行拼接,再通过一个tanh激活函数来将数据放缩到[-1,1]的范围内,即得到/>
Figure BDA0003978756150000082
Figure BDA0003978756150000081
这里的
Figure BDA0003978756150000083
主要是包含了当前输入的xt数据。有针对性地对ht-1添加到当前的隐藏状态,相当于“记忆了当前时刻的状态”,类似于LSTM的选择记忆阶段。
接着同时进行遗忘和记忆两个步骤。
Figure BDA0003978756150000084
门控信号zt的范围为[0,1]。门控信号越接近1,代表记忆下来的数据越多;而越接近0则代表遗忘的越多。
Figure BDA0003978756150000086
表示对原本隐藏状态的选择性遗忘。这里的(1-zt)可以
想象成遗忘门(forget gate),忘记ht-1维度中一些不重要的信息。
Figure BDA0003978756150000087
表示对包含当前节
点信息的
Figure BDA0003978756150000088
进行选择性记忆。与上面类似,这里的zt同理会忘记/>
Figure BDA0003978756150000089
维度中的一些不重要的
信息,或者是对
Figure BDA00039787561500000810
维度中的某些信息进行选择。结合上述,上式操作就是利用忘记传递下来的ht-1中的某些维度信息,并加入当前节点输入的某些维度信息。
本实施方式中,首次提出了GRU模型在混合试验方法中的创新应用,而不是对其算法的描述或改进,GRU模型的输入为试验子结构的位移时程,输出为试验子结构的恢复力时程。为了开发和测试GRU模型,共分为5个阶段,如图2所示,图2中的等效成自由度模型的等效就是把试验子结构这个实体在计算机上建立相应的有限元模型,进行仿真。
S121、生成人工数据
选取五条地震动GM1、2、3、4和5。给定阻尼器位移,GRU模型将预测对应自由度恢复力。位移/剪切时程的样本通过执行等效单自由度系统(只有阻尼器,此系统在力的作用下只有一个方向的位移)的非线性时程分析生成,该系统具有变形和速度依赖性的滞后行为。其中,自振周期和固有粘性阻尼随机选择。从GM1和2获得数据用于开发GRU(步骤S123和S124),与GM3、4和5相对应的数据用于测试(步骤S125)。
S122、数据预处理
训练深度学习模型需要尽可能多的干净数据。首先,将产生训练数据集按最大绝对值缩放,使其在范围[-1,1]内,以避免在训练中的反向传播过程期间出现任何梯度爆炸和梯度消失。然后,将数据格式化集塑造成三维向量:样本、时间步长和特征。
S123、调整网络架构
利用GM1对模型进行训练,选择网络架构。通过计算归一化参考值和预测参考值之间的均方误差(MSE)来评估模型性能。
S124、调整学习行为
给定相同的数据和网络架构。超参数可能会影响模型的学习行为,例如损失函数、优化器、batch size和训练周期数。因此,对超参数执行敏感性分析,然后通过训练周期对学习行为进行深入诊断。此阶段目标是在广泛使用的超参数中确定适当的超参数,并在源自GM2的全长序列上训练最终GRU模型。
S125、在源自GM3、4和5的新的数据集上测试开发出来的GRU模型。
(二)开发与测试DynLSTM模型。
(a)、传统的LSTM模型:
为了解决RNN误差项沿时间反向传播出现的梯度消失问题,采用LSTM网络,如图3为LSTM单元结构。
前向计算:
在前向计算的时候用到了门(gate)的概念。门是一层全连接层,它的输入是一个向量,输出是范围0到1的实数向量。假设W是门的权重向量,b是偏置项,那么门可以表示为:
g(x)=σ(Wx+b)
门的使用,就是用门的输出向量按元素乘以我们需要控制的那个向量。因为门的输出是0到1之间的实数向量,那么,当门输出为0时,任何向量与之相乘都会得到0向量,这就相当于啥都不能通过;输出为1时,任何向量与之相乘都不会有任何改变,这就相当于啥都可以通过。因为sigmoid函数的值域是(0,1),所以门的状态都是半开半闭的。
LSTM用两个门来控制单元状态c的内容,一个是遗忘门(forget gate),它决定了上一时刻的单元状态ct-1有多少保留到当前时刻;另一个是输入门(input gate),它决定了当前时刻网络的输入xt有多少保存到单元状态。LSTM用输出门(output gate)来控制单元状态ct有多少输出到LSTM的当前输出值ht
遗忘门:
ft=σ(Wf·[ht-1,xt]+bf)
上式中,Wf是遗忘门的权重矩阵,[ht-1,xt]表示把两个向量连接成一个更长的向量,bf是遗忘门的偏置项,σ是sigmoid函数。如果输入的维度是dx,隐藏层的维度是dh,单元状态的维度是dc(通常dc=dh),则遗忘门的权重矩阵维度是dc×(dh+dx)。事实上,权重矩阵Wf都是两个矩阵拼接而成的:一个是Wfh,它对应着输入项ht-1,其维度为dc×dh;一个是Wfx,它对应着输入项xt,其维度为dc×dx。Wf可以写为:
Figure BDA0003978756150000101
输入门:
it=σ(Wi·[ht-1,Xt]+bi)
Figure BDA0003978756150000102
上式中,是Wi输入门的权重矩阵,bi是输入门的偏置项。
接着计算当前时刻的单元状态。它是由上一次的单元状态按元素乘以遗忘门,再用当前输入的单元状态按元素乘以输入门,再将两个积加和:
Figure BDA0003978756150000103
符号
Figure BDA0003978756150000104
表示按元素乘。
这样就把LSTM关于当前的记忆和长期的记忆组合在一起,形成了新的单元状态。由于遗忘门的控制,它可以保存很久很久之前的信息,由于输入门的控制,它又可以避免当前无关紧要的内容进入记忆。接着是输出门,它控制了长期记忆对当前输出的影响:
ot=σ(Wo·[ht-1,Xt]+bo)
Figure BDA0003978756150000105
反向传播:
LSTM的训练算法是反向传播算法,主要有下面三个步骤:
前向计算每个神经元的输出值,对于LSTM来说,即ft、it、ct、ot和ht五个向量值。
反向计算每个神经元的误差项δ值。与循环神经网络一样,LSTM误差项的反向传播也是包括两个方向:一个是沿时间的反向传播,即从当前t时刻开始,计算每个时刻的误差项;另一个是将误差项向上一层传播。
根据相应的误差项,计算每个权重的梯度。
(b)、基于动力学的LSTM的网络架构(DynLSTM):
训练可靠的深度学习模型需要大量的数据,这些数据必须包含丰富的输入输出关系,这在大多数工程问题中通常无法满足。特别是,“黑盒”模型在很大程度上依赖于它输入的标记数据的代表性质量,导致可用数据(训练/验证数据集)之外的准确性和泛化性低。即使有丰富的数据,经过训练的深度学习模型也是无法解释的,也没有物理意义。此外,当可用数据高度不完整、稀缺或者噪声时,就会出现巨大的挑战,例如,由于“合成”:用于训练数据生成的有限元模型模拟数量有限,或“传感”:记录数量有限、传感器数量有限、信噪比低以及测量状态变量不完整。克服这一限制的潜在解决方案是将科学原理(例如,偏微分方程,边界条件)纳入深度神经网络,以减少违反嵌入式物理定律为了解决上述问题,以便于弱监督深度神经网络,这将限制和促进可行的解决方案空间内的学习。这种模型具有显著的优势,具有清晰的物理意义、具有很好的鲁棒性以及处理不太丰富的数据的出色能力。
本发明考虑地震动力学由一个非线性运动方程控制(地震动力学由非线性运动方程控制,每个结构都可以简化成非线性运动方程):
Figure BDA0003978756150000111
其中M是质量矩阵;C是阻尼矩阵;K是刚度矩阵;u,
Figure BDA0003978756150000112
和/>
Figure BDA0003978756150000113
是到地面的相对位移、速度和加速度矢量;r是滞后位移;λ是屈服后刚度与屈服前(弹性)刚度的比值;ag表示地震加速度;Γ是力分布矢量;h表示总非线性恢复力。
质量归一化得到更一般的形式,如:
Figure BDA0003978756150000114
这里的g(t)有两层含义:g(t)=M-1h(t)是质量归一化恢复力;
Figure BDA0003978756150000115
带着一个未知的潜在函数/>
Figure BDA0003978756150000116
这里Z表示状态空间(SS)变量,包括位移u、速度/>
Figure BDA0003978756150000117
和滞后位移r,即
Figure BDA0003978756150000118
第一个g(t)的含义:在某一时刻t,单位质量对应的恢复力;第二个g(t)的含义:知道某一时刻t的Z状态,就能得到g(t),因为M、C、K、λ都是常数,所以
Figure BDA0003978756150000119
潜在函数一定是可以得到的,但是不需要知道具体的潜在函数是什么样的,因为特别是当非线性是复杂的、隐式的和高阶时,得到潜在函数是很棘手的。
在地震激励作用下建筑类型结构非线性时程分析中,状态空间变量的快速预测Z是我们的主要兴趣所在。但是,要训练LSTM模型,必须具有给定的地震输入ag对应的Z变量的数据(例如,位移u、速度
Figure BDA0003978756150000121
和滞后位移r应该全部测量)。这尤其棘手且具有挑战性,因为滞回位移r通常是不可观察和潜在的,无法从大规模有限元模型仿真或传感器中获取。然而,预测这样的非线性参数非常重要,因为它反映了系统的宏观非线性,并且与内部滞回恢复力有关。为了应对这一基本挑战,在本发明中提出了基于动力学的LSTM模型,其原理如下:
将两个LSTM网络通过基于中心有限差分滤波器的数值微分器连接的序列因此多个连接的LSTM网络形成了一个“一个网络”架构,如图4所示。
基于动力学的LSTM模型由三个组件组成,包括两个LSTM网络和一个张量微分器,其中两个LSTM网络的架构相同,LSTM网络包括两个LSTM层和两个全连接层。
Figure BDA0003978756150000122
每个都有相同数量的n采样点范围从t1到tn,并使用一个LSTM网络从地震动建立ag到响应Z的非线性映射(见图4中的方框I),例如,Z=LSTM1(ag;θ1),θ1表示LSTM1的训练权重和偏差。
需要说明的是:从LSTM网络和图4上看:给个地震加速度,可以得到位移、速度和r,实际应用中只需要位移和速度,不需要r的输出结果,因为图4中的方框II、III没有用到r,方框II、III是对方框I起到一个约束的效果,方框I得到的位移、速度一定要符合方框II、III中的条件。
使用可用的训练数据
Figure BDA0003978756150000123
得到LSTM1的损失函数:
Figure BDA0003978756150000124
其中,nm是测量样本的数量,参数的上角标(i)表示第i个样本。
微分通过基于有限差分的滤波实现,产生Z的导数
Figure BDA0003978756150000125
默认情况下,SS变量相等条件/>
Figure BDA0003978756150000126
(见图4中的框III),得到“相等损失函数”:
Figure BDA0003978756150000127
其中,nc是配置样本的数量。
然后使用第二个LSTM网络来映射响应Z到质量归一化恢复力g(见图4中的方框Ⅱ),例如:g=LSTM2(Z(θ1);θ2),θ2表示LSTM2的训练权重和偏差。由
Figure BDA0003978756150000128
得到“控制损失函数”:
Figure BDA0003978756150000131
最后得到“全损失函数”:
Figure BDA0003978756150000132
这里的α,β和γ是用户定义的权重系数,用于收敛控制。通过训练算法(例如梯度下降法)得到最优权重和偏差:
Figure BDA0003978756150000133
(c)、时滞补偿
实时加载过程中,由于加载设备存在一定的响应时间,不可避免地在边界加载过程中引入时滞,时滞的存在极大地影响了混合实验的精度,因此需对电液伺服作动器进行时滞补偿。
多项式外插法是实时混合实验中最常用的补偿方法,以电液伺服作动器为定时滞的动力模型作为基本假定。电液伺服作动器通过得到的力、位移加载获得对应的位移、力。二阶、三阶多项式外插法的公式分别为
Figure BDA0003978756150000134
Figure BDA0003978756150000135
Figure BDA0003978756150000136
式中:τ—系统时滞;
Δt—时间步长或时间步长的正整数n倍;
yac,—第i时间步的向前采样一次的作动器期望位移;
yc,i—第i时间步的作动器命令位移。
在DynLSTM模型的输出层后,加入多项式外插法,将试验子结构对应的作动器期望位移通过多项式外插法得到作动器命令位移。
要实现具有多个数据集的DynLSTM架构,输入和输出序列都必须格式化为三维数组,其中这三维数组分别是第一维中的样本(例如,独立数据集)(记为m),第二维中的时间步长(表示为n),以及第三维中的输入或输出特征(分别记为p和q),其中输入为地震加速度、试验子结构的恢复力、第二数值子结构的恢复力,输出为整体结构的位移、试验子结构的期望位移、第二数值子结构的位移。
通过建立整体结构精细化有限元数值模型,输入选好的地震动,得到整体结构的地震响应。从得到的数据中选取DynLSTM模型的输入和输出。然后训练DynLSTM模型,详细步骤为:①生成人工数据;②数据处理,包括归一化、数据集格式化;③调整网络架构;④调整学习行为,选择合适的损失函数、优化器、batch size和训练周期;⑤测试模型。得到初始的DynLSTM模型之后,利用传感器收集到的数据对初始模型进行训练得到最终的模型。
最后将两个建好的模型接入混合试验(模型在混合试验中的通信)。
实施例
本实施例以本构模型为Bonc-Wen且带有阻尼器的框架结构为例,阐述本发明的方法的基本原理和关键技术。实时混合试验方法中的试验子结构是针对整体结构的某一部分,一般是试验者所关心的、较为重要的一部分,将这一部分直接用作动器加载,对于其他有成熟经验的部分则作为数值子结构建立数值模型通过计算机来模拟。由此,此框架结构实时混合试验可以进行大比例甚至足尺试验,不仅能够使试验结果重点突出,而且能节约大量的经费与时间。
以本构模型为Bonc-Wen且带有阻尼器的框架结构实时混合试验的关键难点之一,就是如何准确、可靠、实时得到结构在地震作用下的位移响应。从通过数值积分解运动方程的角度看,为了准确得到位移响应,需要采用非常小的计算步长,此时数值模拟部分无法在给定时间步长内完成计算并给加载系统传递目标,这使得试验加载系统停止加载,待新命令生成后继续加载导致实测试件反力严重失真,因此无法开展实时混合试验。
下面结合图5和图6对本实施例进行详细说明。如图6为框架结构实时混合试验方法原理示意图。主体结构为框架,上面安装有阻尼器。对于框架结构的数值模型已经较为成熟,并有大量试验及理论研究,故可以用有限元模型数值模拟。阻尼器作为试验子结构安放在作动器上。图5为框架结构实时混合试验流程图。具体流程如下:
步骤一、将底层阻尼器作为试验子结构,剩余阻尼器作为数值子结构(更新),其余部分作为数值子结构(不更新);
步骤二、通过建立精细化有限元数值模型去收集数据;
步骤三、训练两个数值子结构的循环神经网络模型;
步骤四、将第k步的外力输入到DynLSTM模型中,外力包括第k步的地震加速度ag、第k-1步的试验子结构的恢复力Fk-1 exp和数值子结构(更新)的恢复力Fk-1 num输入到DynLSTM模型中,得到第k步整体结构的位移响应、试验子结构的位移dk exp和数值子结构(更新)的位移dk num
步骤五、将dk exp传给作动器得到Fk exp,用dk exp和Fk exp去更新GRU模型,并将数值子结构(更新)的模型进行更新,dk num通过更新后的GRU模型得到Fk num
步骤六、将k步的Fk exp、Fk num和第k+1步的地震传给DynLSTM模型,重复上述步骤S3、S4,直到整个地震输入完,结束试验。最终得到整体结构的地震响应和试验子结构本构模型。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (10)

1.一种基于循环神经网络的实时混合试验方法,其特征在于,包括以下步骤:
S1、建立试验整体结构的精细化有限元数值模型;
S2、将试验整体结构划分为试验子结构、第二数值子结构和第一数值子结构;
试验子结构在实验室展开加载试验;
第二数值子结构是指与试验子结构具有相同本构模型的数值结构,第二数值子结构利用GRU模型模拟;此部分的模型在进行实时混合试验的时候更新;
第一数值子结构是指除了第二数值子结构和试验子结构的剩余部分的数值结构,第一数值子结构利用DynLSTM模型模拟;此部分的模型在进行实时混合试验的时候不更新;
所述的DynLSTM模型即基于动力学的LSTM模型,其包括两个LSTM网络和一个张量微分器,第一个LSTM网络为从地震动建立ag到响应Z的非线性映射Z=LSTM1(ag;θ1),θ1表示LSTM1的权重和偏差;
张量微分器微分通过基于有限差分的滤波实现,产生Z的导数
Figure QLYQS_1
第二个LSTM网络为响应Z到质量归一化恢复力g的映射g=LSTM2(Z(θ1);θ2),θ2表示LSTM2的权重和偏差;
S3、基于划分的两个数值子结构和试验子结构进行实时混合试验;
将第k步的外力输入到DynLSTM模型中,输出第k步整体结构的位移响应、试验子结构位移dk exp和第二数值子结构的位移dk num
所述外力包括第k步的地震加速度ag、第k-1步的试验子结构的恢复力Fk-1 exp和第二数值子结构的恢复力Fk-1 num
将试验子结构位移dk exp传给电液伺服作动器,得到试验子结构真实恢复力Fk exp,用第k步试验子结构dk exp和Fk exp去更新第二数值子结构的GRU模型,dk num通过更新后的GRU模型得到第k步第二数值子结构的恢复力Fk num
将第k步的Fk num、Fk exp、和第k+1步的地震加速度ag传给DynLSTM模型,用于计算第k+1步整体结构的位移响应、试验子结构位移dk+1 exp和第二数值子结构位移dk+1 num
S4、重复步骤S3,直至试验结束。
2.根据权利要求1所述的一种基于循环神经网络的实时混合试验方法,其特征在于,DynLSTM模型中的两个LSTM网络的架构相同。
3.根据权利要求2所述的一种基于循环神经网络的实时混合试验方法,其特征在于,DynLSTM模型中的LSTM网络包括两个LSTM层和两个全连接层。
4.根据权利要求3所述的一种基于循环神经网络的实时混合试验方法,其特征在于,所述DynLSTM模型的开发过程中,考虑地震动力学由非线性运动方程控制:
Figure QLYQS_2
其中M是质量矩阵;C是阻尼矩阵;K是刚度矩阵;u,
Figure QLYQS_3
和/>
Figure QLYQS_4
是到地面的相对位移、速度和加速度矢量;r是滞后位移;λ是屈服后刚度与屈服前刚度的比值;ag表示地震加速度;Γ是力分布矢量;h表示总非线性恢复力。
5.根据权利要求4所述的一种基于循环神经网络的实时混合试验方法,其特征在于,所述DynLSTM模型的开发过程中,需要将非线性运动方程进行质量归一化得到更一般的形式:
Figure QLYQS_5
g(t)有两层含义:g(t)=M-1h(t)是质量归一化恢复力;
Figure QLYQS_6
带着一个未知的潜在函数/>
Figure QLYQS_7
Z表示状态空间SS变量,包括位移u、速度/>
Figure QLYQS_8
和滞后位移r,即
Figure QLYQS_9
6.根据权利要求5所述的一种基于循环神经网络的实时混合试验方法,其特征在于,所述DynLSTM模型的训练过程包括以下步骤:
使用训练数据
Figure QLYQS_10
得到LSTM1的损失函数:
Figure QLYQS_11
其中,nm是测量样本的数量,参数的上角标(i)表示第i个样本;
微分通过基于有限差分的滤波实现,产生Z的导数
Figure QLYQS_12
SS变量相等条件/>
Figure QLYQS_13
得到“相等损失函数”:
Figure QLYQS_14
其中,nc是配置样本的数量;
针对第二个LSTM网络,由
Figure QLYQS_15
得到“控制损失函数”:
Figure QLYQS_16
最后得到“全损失函数”:
Figure QLYQS_17
这里的α,β和γ是用户定义的权重系数,用于收敛控制;
通过训练算法得到最优权重和偏差
Figure QLYQS_18
7.根据权利要求6所述的一种基于循环神经网络的实时混合试验方法,其特征在于,所述DynLSTM模型的输入和输出序列需要格式化为三维数组,其中这三维数组分别是第一维中的样本,第二维中的时间步长,以及第三维中的输入或输出特征,其中输入为地震加速度、试验子结构的恢复力、第二数值子结构的恢复力,输出为整体结构的位移、试验子结构的期望位移、第二数值子结构的位移。
8.根据权利要求7所述的一种基于循环神经网络的实时混合试验方法,其特征在于,所述GRU模型的开发和测试过程包括以下步骤:
S121、生成人工数据:
选取五条地震动GM1、GM2、GM3、GM4和GM5;给定阻尼器位移,GRU模型预测对应自由度恢复力;位移/剪切时程的样本通过执行等效单自由度系统的非线性时程分析生成;
从GM1和GM2获得数据用于开发GRU,GM3、GM4和GM5相对应的数据用于测试;
S122、数据预处理:
首先,将产生训练数据集按最大绝对值缩放,使其在范围[-1,1]内;
然后,将数据格式化集塑造成三维向量:样本、时间步长和特征;
S123、调整网络架构:
利用GM1对模型进行训练,选择网络架构;通过计算归一化参考值和预测参考值之间的均方误差MSE来评估模型性能;
S124、调整学习行为:
给定相同的数据和网络架构,对超参数执行敏感性分析,然后通过训练周期对学习行为进行深入诊断,确定超参数,并在源自GM2的全长序列上训练最终GRU模型;
S125、在源自GM3、GM4和GM5的新的数据集上测试开发出来的GRU模型。
9.根据权利要求1至8任意一项所述的一种基于循环神经网络的实时混合试验方法,其特征在于,在进行混合试验时需要对电液伺服作动器进行时滞补偿,采用多项式外插法进行补偿。
10.根据权利要求9所述的一种基于循环神经网络的实时混合试验方法,其特征在于,建立试验整体结构的精细化有限元数值模型的过程直接根据已有资料建立整体结构精确化有限元数值模型,或者,建立整体结构的基于子结构的精细化多尺度有限元数值模型。
CN202211538727.6A 2022-12-02 2022-12-02 基于循环神经网络的实时混合试验方法 Active CN115796038B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211538727.6A CN115796038B (zh) 2022-12-02 2022-12-02 基于循环神经网络的实时混合试验方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211538727.6A CN115796038B (zh) 2022-12-02 2022-12-02 基于循环神经网络的实时混合试验方法

Publications (2)

Publication Number Publication Date
CN115796038A CN115796038A (zh) 2023-03-14
CN115796038B true CN115796038B (zh) 2023-06-30

Family

ID=85444952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211538727.6A Active CN115796038B (zh) 2022-12-02 2022-12-02 基于循环神经网络的实时混合试验方法

Country Status (1)

Country Link
CN (1) CN115796038B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117990324B (zh) * 2024-04-03 2024-06-07 实链检测(浙江)有限公司 一种地震模拟台试验方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364440A (zh) * 2020-12-02 2021-02-12 黑龙江科技大学 一种非线性模型线性化力修正迭代混合试验方法
CN112487689A (zh) * 2020-12-14 2021-03-12 黑龙江科技大学 基于统计ckf模型更新混合试验方法
CN112883522A (zh) * 2021-01-14 2021-06-01 沈阳工业大学 一种基于gru循环神经网络的微电网动态等效建模方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885916B (zh) * 2019-02-02 2020-06-16 东南大学 一种基于lssvm的混合试验在线模型更新方法
CN109614580A (zh) * 2019-02-21 2019-04-12 东南大学 基于在线Xgboost算法的抗震混合试验模型更新方法
CN110631792B (zh) * 2019-10-11 2021-01-05 东南大学 基于卷积神经网络的抗震混合试验模型更新方法
CN111323185B (zh) * 2020-03-16 2021-11-12 西安建筑科技大学 一种空间框架模型自适应实时混合仿真试验加载方法
US11150159B2 (en) * 2020-03-16 2021-10-19 Xi'an University Of Architecture And Technology Adaptive loading method for real-time hybrid simulation testing of space frame model
CN111666671A (zh) * 2020-05-29 2020-09-15 中南大学 一种围岩体蠕变参数的实时反演方法
CN112362276B (zh) * 2020-10-27 2022-04-15 南京林业大学 一种子结构混合试验方法
CN112380631B (zh) * 2020-12-02 2023-02-14 黑龙江科技大学 一种基于神经网络的新型迭代混合试验方法
CN114707390B (zh) * 2022-05-05 2023-04-21 哈尔滨工业大学 基于分层壳材料本构参数更新混合试验方法及分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364440A (zh) * 2020-12-02 2021-02-12 黑龙江科技大学 一种非线性模型线性化力修正迭代混合试验方法
CN112487689A (zh) * 2020-12-14 2021-03-12 黑龙江科技大学 基于统计ckf模型更新混合试验方法
CN112883522A (zh) * 2021-01-14 2021-06-01 沈阳工业大学 一种基于gru循环神经网络的微电网动态等效建模方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
子结构混合试验方法研究与应用;王涛;潘鹏;;工程力学(02);1-12 *

Also Published As

Publication number Publication date
CN115796038A (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
Rogers Simulating structural analysis with neural network
Xu et al. Learning viscoelasticity models from indirect data using deep neural networks
CN110631792B (zh) 基于卷积神经网络的抗震混合试验模型更新方法
CN115796038B (zh) 基于循环神经网络的实时混合试验方法
Zhu et al. Model error correction in data assimilation by integrating neural networks
Pei et al. Analysis and modification of Volterra/Wiener neural networks for the adaptive identification of non-linear hysteretic dynamic systems
CN115577436B (zh) 一种求解不确定结构风致振动响应的组合深度学习方法
Gosea et al. Data-driven modeling and control of large-scale dynamical systems in the Loewner framework: Methodology and applications
Khudyakov On mathematical modeling of the measurement transducers
Tian et al. Model updating of nonlinear structures using substructuring method
Funes et al. An efficient dynamic formulation for solving rigid and flexible multibody systems based on semirecursive method and implicit integration
Joghataie et al. Designing high-precision fast nonlinear dam neuro-modelers and comparison with finite-element analysis
Tingli et al. Model updating for real time dynamic substructures based on UKF algorithm
Luong et al. Deep reduced-order least-square method—A parallel neural network structure for solving beam problems
Yaghoubi et al. A parallel solution method for structural dynamic response analysis
Drakoulas et al. Physics-based reduced order modeling for uncertainty quantification of guided wave propagation using bayesian optimization
CN112487689B (zh) 基于统计ckf模型更新混合试验方法
Jia Monolithic and partitioned Rosenbrock-based time integration methods for dynamic substructure tests
Law et al. Model updating of semirigid jointed structure using generic parameters
De Cock et al. Subspace system identification for mechanical engineering
Joghataie et al. Matrix analysis of nonlinear trusses using prandtl-2 neural networks
Malik et al. Physics Informed Recurrent Neural Networks for Seismic Response Evaluation of Nonlinear Systems
Hosseini et al. A framework for multi‐element hybrid simulation of steel braced frames using model updating
Paschke et al. Digital Prototyping–Modelling Concepts for a Generative Computer Based-Design of Complex Tensile Structures
Mokhtari Dizaji Data-driven Frameworks for Hybrid Analysis of Structures Under Seismic Loading

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant