CN115392360A - 基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法 - Google Patents

基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法 Download PDF

Info

Publication number
CN115392360A
CN115392360A CN202210960544.7A CN202210960544A CN115392360A CN 115392360 A CN115392360 A CN 115392360A CN 202210960544 A CN202210960544 A CN 202210960544A CN 115392360 A CN115392360 A CN 115392360A
Authority
CN
China
Prior art keywords
temperature
decoder
encoder
temperature action
bridge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210960544.7A
Other languages
English (en)
Other versions
CN115392360B (zh
Inventor
李惠
徐阳
田亚迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202210960544.7A priority Critical patent/CN115392360B/zh
Publication of CN115392360A publication Critical patent/CN115392360A/zh
Application granted granted Critical
Publication of CN115392360B publication Critical patent/CN115392360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/08Thermal analysis or thermal optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Geometry (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出基于Transformer的大型桥梁温度‑响应相关模式识别与健康诊断方法。所述方法具体包括:步骤一:建立温度作用编码器;步骤二:建立结构响应解码器;步骤三:对数据集进行掩码处理,避免模型过拟合;步骤四:训练由温度作用编码器和结构响应解码器组成的Transformer模型,根据结构响应重构误差进行桥梁结构健康诊断。本发明所述方法根据温度‑温致响应之间存在的时空相关性特点,建立了温度作用编码器和结构响应解码器模型,使其不仅能够表达温度与温致响应之间的相关性,也能够表达不同位置响应与响应之间的相关性,进一步提高了预测准确度。

Description

基于Transformer的大型桥梁温度-响应相关模式识别与健康 诊断方法
技术领域
本发明属于结构健康监测技术领域,特别是涉及基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法。
背景技术
桥梁是我国基础设施建设和国民经济发展的重要组成部分,目前我国的桥梁数量及规模均跃居世界前列。桥梁结构在长达上百年服役期内不可避免地遭受环境侵蚀、材料老化、疲劳荷载、灾害及突发事件等复杂因素的耦合作用,会形成混凝土剥落、混凝土裂缝、钢筋暴露、拉索腐蚀剥落、钢结构疲劳裂纹等多类型损伤,而桥梁结构损伤的出现和发展将导致桥梁结构发生内力重分布。在相同车辆荷载和结构参数的作用下,桥梁结构不同类型响应之间以及同类响应的不同测点之间必然存在力学相关性,如果结构发生损伤,在相同车辆荷载作用下的桥梁结构响应之间的相关性就会发生改变,利用这种相关性的变化即可以推断桥梁结构的健康状态。
然而,尽管上述方法在理论上确实可行,但要做到在实际复杂工况下保证车辆荷载精确一致是非常困难的。首先,目前车辆荷载的测量一般基于桥梁两侧的动态称重系统,车辆在大型桥梁上的行驶过程往往会变道,这就导致无法获得车辆荷载在桥梁上的准确空间分布。其次,虽然车辆荷载在一定周期内会显示出一定的规律(如每天、每周、每年的统计规律基本相似),但是这种相似是统计意义下的相似,无法做到时刻精准相同,因此会带来不同训练集和测试集的车辆荷载并不是严格相同的。正是由于以上两点原因,导致车辆荷载这一外因无法保证能够准确获得并保持一致,那么基于桥梁结构响应相关性进行状态评估和健康诊断的思路在实际应用过程中就会产生较大误差。
除车辆荷载外,桥梁结构的另一显著影响因素是环境温度。环境温度对桥梁结构会产生温度作用(热胀冷缩),特别是在长时间尺度下更加显著(比如以1年时间为例,冬季气温下降、结构收缩,夏季气温上升、结构膨胀,都会产生温度作用响应)。已有研究表明,桥梁结构温度变化会影响结构模态参数,并且这种影响可能掩盖由结构损伤引起的模态参数变化。因此,研究桥梁结构温度与温致响应之间的相关模式、并基于温度与响应之间的相关模型进行桥梁结构健康诊断,具有重要意义。
桥梁温度场分布受大气温度变化、太阳光辐射、风速、降水等自然因素影响,并与桥梁湿度、桥梁构造等因素有关。特别是对于斜拉桥悬索桥等大型桥梁结构,其升温与降温过程长达数小时,桥梁温度场变化历程的差异会产生温致响应,并且温致响应与温度之间存在时滞及非线性现象,这给直接进行桥梁结构温度与温致响应之间的相关性建模带来了困难。
以斜拉桥钢箱梁应变为例,相关研究表明,温度-应变的变化规律呈环状,即升温过程与降温过程中相同的温度会对应着不同的应变,表明响应与温度之间存在时滞现象;此外,不同时间段的温度-应变的时滞变化规律不尽相同,相同的温度对应着多种不同的应变,即应变与温度之间的关系呈现非线性特征。
考虑到桥梁结构响应与温度的变化规律存在着时滞和非线性特点,进行温度-温致响应的相关性建模需要考虑时序信息;此外,桥梁结构在温度场中是一个变形协调的整体,如果能考虑更多不同空间位置的温度,就更能准确地利用桥梁温度场的空间分布信息,就能提高温致响应的预测精度,即温度-温致响应的相关性建模需要考虑空间信息。因此,温度-温致响应的相关性模型应该具有表达温度-温致响应之间所存在的时空相关关系的能力。
目前,长短期记忆(LSTM)网络可以考虑时空相关性,但由于递归算法只能按顺序从左向右或从右到左依次计算,因此在时间步t的计算结果非常依赖在时间步t-1时刻的计算结果,这就限制了模型的并行能力,导致该类网络的计算效率偏低;另一方面,递归神经网络两步之间的计算量随着距离的增加而线性或对数地增加,在上述顺序计算过程中可能存在信息丢失现象。尽管门控单元在一定程度上缓解了长时间步计算引发的梯度爆炸或梯度消失问题,但是对于时间步特别长的情况(如长达1年),门控单元依旧无能为力。
发明内容
本发明目的是为了解决现有技术中的问题,提供了基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法。
本发明是通过以下技术方案实现的,本发明提出基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法,所述方法具体包括:
步骤一:建立温度作用编码器;
步骤二:建立结构响应解码器;
步骤三:对数据集进行掩码处理,避免模型过拟合;
步骤四:训练由温度作用编码器和结构响应解码器组成的Transformer模型,根据结构响应重构误差进行桥梁结构健康诊断。
进一步地,所述步骤一具体包括以下步骤:
步骤一一:将温度作用监测数据时程进行等长度采样,每段时程数据的长度均为L,作为温度作用的嵌入表示;考虑全桥共有N个温度传感器,作为输入数据的N个维度,则一个温度作用的样本大小为N×L;
步骤一二:考虑温度作用输入时程的位置信息,在原始时程的基础上叠加位置信息编码、保留位置信息,实现对一个序列中不同元素相对和绝对位置的感知,作为温度作用编码器的输入;
步骤一三:建立温度作用编码器,由M个相同的基本单元串接组成,每个基本单元依次由多头注意力机制、第一残差连接正则化、全连接前馈神经网络、第二残差连接正则化这四个模块构成。
进一步地,步骤一二中温度作用监测数据时程的位置编码方法具体为:
考虑到温度作用输入序列的长度为固定值L,因此采用沿序列长度进行等间距位置编码,即一个位置编码向量中共有L个编码元素,如此,温度作用输入序列的每一个时间步都匹配了独一无二的位置编码,并且对于任意两个距离相等的时间步,其位置编码的差值也保持一致;位置编码与温度作用时程的结合方式为按传感器通道方向进行拼接,即相当于给N个通道的温度作用时程又增加了一维位置信息,最终,编码器的输入信息由维度为N、长度为L的温度作用时程矩阵转化为维度为N+1、长度为L的温度作用时程及其位置编码综合矩阵。
进一步地,步骤一三中多头注意力机制的计算方法具体为:
MultiHead(Q,K,V)=Concat([headi])WO
headi=Attention(Qi,Ki,Vi)
Figure BDA0003792618520000031
Qi=XWi Q,Ki=XWi K,Vi=XWi V
式中,MultiHead代表多头注意力运算,Concat表示拼接运算,Attention表示注意力运算,WO表示输出权重矩阵;Q,K,V分别表示查询矩阵、键矩阵、值矩阵,均由温度作用输入矩阵X经过线性变换得到,线性变换矩阵分别为WQ,WK,WV,dk表示查询矩阵和键矩阵的维度值;i表示多头注意力运算的第i个头,即为多头注意力运算的下标索引。
进一步地,步骤一三中第一残差连接正则化和第二残差连接正则化相似,为在多头注意力机制模块或全连接前馈神经网络输出的基础上叠加原始输入,有助于避免梯度消失,具体计算方法为:
O←O+MultiHead(O),O←O+FeedForward(O)
Figure BDA0003792618520000041
Figure BDA0003792618520000042
式中,O表示经过残差连接正则化模块的原始输入,MultiHead和FeedForward分别对应多头注意力机制模块和全连接前馈神经网络模块,←表示在多头注意力机制模块或全连接前馈神经网络输出的基础上叠加原始输入O,即表示残差连接;
Figure BDA0003792618520000043
表示第l层第i个隐节点值,H表示第l层隐节点数量,μl为第l层均值,σl为第l层方差,
Figure BDA0003792618520000044
为第l层第i个隐节点值归一化后的值,ε为避免出现分母为零的超参数,hl为经过正则化运算后的结果,gl,bl为待优化参数。
进一步地,步骤一三中全连接前馈神经网络为具有多个隐藏层的神经网络,控制参数包括隐藏层的层数和每层隐藏层包含的神经元数。
进一步地,所述步骤二具体包括以下步骤:
步骤二一:将结构响应监测数据时程进行等长度采样,每段时程数据的长度和温度作用编码器的输入相同,取作L,作为结构响应的嵌入表示;然后考虑结构响应时程的位置信息,即时序信息,进行位置编码,实现对一个结构响应序列中不同元素相对和绝对位置的感知,考虑全桥共有R个结构响应传感器,则解码器输入的样本维度为R+1、长度为L;
步骤二二:建立结构响应解码器,对应温度作用编码器的架构方式,也由M个相同的基本单元串接组成,每个基本单元依次由第一多头注意力机制、第一残差连接正则化、第二多头注意力机制、第二残差连接正则化、全连接前馈神经网络、第三残差连接正则化这六个模块构成;其中,结构响应解码器基本单元中的第一多头注意力机制与编码器中对多头注意力机制的规定一致;结构响应解码器基本单元中的第一、第二、第三残差连接正则化均相同,与编码器中对残差连接正则化的规定一致;结构响应解码器基本单元中的全连接前馈神经网络与编码器中对全连接前馈神经网络的规定一致;
步骤二三:单独计算结构响应解码器基本单元中的第二多头注意力机制,对于第M个解码器基本单元,采用与之对应的第M个温度作用编码器基本单元的输出作为Q和K,第M个解码器基本单元中第一残差连接正则化的输出为V,按照多头注意力机制计算方法,计算它们之间的互注意力矩阵;
步骤二四:在经过了M个解码器基本单元后,增加由编码器输出到解码器输出的残差连接,进一步增强温度作用编码器对结构响应解码器输出的影响;然后依次经过线性转换层、softmax分类层,获得结构响应时程的预测结果,完成结构响应的解码过程;其中,新增残差连接与编码器中对残差连接的规定一致。
进一步地,所述步骤三具体包括以下步骤:
步骤三一:以某一段序列数据“ABCDE”为例,随机选取序列中一定比例的元素;
步骤三二:以元素“E”为例,如果“E”被选中,以P1的概率用一个确定元素“X”代替“E”,即“ABCDE”变为“ABCDX”;以P2的概率用一个随机元素R代替“E”,即“ABCDE”变为“ABCDR”;以P3的概率不做改变,即保留“ABCDE”;其中,三个概率的取值范围均为[0,1],并且P1+P2+P3=1。
进一步地,所述步骤四具体包括以下步骤:
步骤四一:采用桥梁处于健康状态下的温度作用和结构响应数据,训练由上述温度作用编码器和结构响应解码器组成的Transformer模型;
步骤四二:模型训练完毕后,采用未知健康状态的温度作用作为输入,重构桥梁结构的温致响应,如果模型的重构误差与健康状态相比增大,即说明桥梁出现了损伤;
步骤四三:通过分析桥梁结构温致响应的重构误差控制图进行桥梁健康诊断,计算健康状态下训练集误差的均值m和标准差σ,以m±3σ为上下阈值线;
步骤四四:如果桥梁处于健康状态,则重构误差有99.7%的概率落在上下阈值线范围内;如果重构误差超出阈值线,即可诊断出桥梁健康状态发生改变。
本发明的有益效果:
(1)根据温度-温致响应之间存在的时空相关性特点,建立了温度作用编码器和结构响应解码器模型,使其不仅能够表达温度与温致响应之间的相关性,也能够表达不同位置响应与响应之间的相关性,进一步提高了预测准确度;
(2)模型的非顺序结构带来了更好的并行性,更加符合现有基于GPU的并行计算框架,计算效率提高;
(3)模型是基于注意力机制建立的,除了可以考虑变量在不同时间步之间的相关性,还将序列中任意两个位置之间的距离缩小为常量,解决了长时间步计算引发的梯度爆炸或梯度消失问题,对于任意长的时间步依然适用;
(4)模型在任意两个时间步之间的计算量与距离无关、为定值,但是需要平均不同位置的注意力权重、由此可能会降低分辨率,为此特别设计了多头注意力模块来尽量抵消该负面作用,保证在实现任意长时间步相关性建模的同时也保证较高的准确率。
附图说明
图1是基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法流程图。
图2是温度作用编码器架构示意图。
图3是温度作用位置编码示意图。
图4是结构响应解码器架构示意图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所提模型考虑的是温度效应、不含车辆荷载作用引起的车致项,即所识别出的温度作用-温致结构响应的相关模式与外荷载无关、仅与结构参数有关。如果桥梁发生损伤,桥梁自身将发生内力重分布,导致温度作用-温致结构响应之间的相关模式发生改变。因此,通过识别桥梁温度作用与温致响应的相关模式,从而诊断桥梁结构的健康状态。本发明提出的基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法流程图如图1所示。
结合图1-图4,本发明提出基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法,所述方法具体包括:
步骤一:建立温度作用编码器;
步骤二:建立结构响应解码器;
步骤三:对数据集进行掩码处理,避免模型过拟合;
步骤四:训练由温度作用编码器和结构响应解码器组成的Transformer模型,根据结构响应重构误差进行桥梁结构健康诊断。
所述步骤一建立温度作用编码器,学习温度作用的深度表示,具体包括以下步骤:
步骤一一:将温度作用监测数据时程进行等长度采样,每段时程数据的长度均为L,作为温度作用的嵌入表示;考虑全桥共有N个温度传感器,作为输入数据的N个维度,则一个温度作用的样本大小为N×L;
步骤一二:考虑温度作用输入时程的位置信息(即时序信息),在原始时程的基础上叠加位置信息编码、保留位置信息,实现对一个序列中不同元素相对和绝对位置的感知,作为温度作用编码器的输入;
步骤一三:建立温度作用编码器,由M个相同的基本单元串接组成,每个基本单元依次由多头注意力机制、第一残差连接正则化、全连接前馈神经网络、第二残差连接正则化这四个模块构成。温度作用编码器架构的示意图如图2所示。
步骤一二中温度作用监测数据时程的位置编码方法具体为:
考虑到温度作用输入序列的长度为固定值L,因此采用沿序列长度进行等间距位置编码(1/L,2/L,…,L-1/L,L/L),即一个位置编码向量中共有L个编码元素,如此,温度作用输入序列的每一个时间步都匹配了独一无二的位置编码,并且对于任意两个距离相等的时间步,其位置编码的差值也保持一致;位置编码与温度作用时程的结合方式为按传感器通道方向进行拼接,即相当于给N个通道的温度作用时程又增加了一维位置信息,最终,编码器的输入信息由维度为N、长度为L的温度作用时程矩阵转化为维度为N+1、长度为L的温度作用时程及其位置编码综合矩阵。温度作用位置编码的示意图如图3所示。
步骤一三中多头注意力机制的计算方法具体为:
MultiHead(Q,K,V)=Concat([headi])WO
headi=Attention(Qi,Ki,Vi)
Figure BDA0003792618520000071
Qi=XWi Q,Ki=XWi K,Vi=XWi V
式中,MultiHead代表多头注意力运算,Concat表示拼接运算,Attention表示注意力运算,WO表示输出权重矩阵;Q,K,V分别表示查询矩阵、键矩阵、值矩阵,均由温度作用输入矩阵X经过线性变换得到,线性变换矩阵分别为WQ,WK,WV,dk表示查询矩阵和键矩阵的维度值;i表示多头注意力运算的第i个头,即为多头注意力运算的下标索引。
步骤一三中第一残差连接正则化和第二残差连接正则化相似,为在多头注意力机制模块或全连接前馈神经网络输出的基础上叠加原始输入,有助于避免梯度消失,具体计算方法为:
O←O+MultiHead(O),O←O+FeedForward(O)
Figure BDA0003792618520000081
Figure BDA0003792618520000082
式中,O表示经过残差连接正则化模块的原始输入,MultiHead和FeedForward分别对应多头注意力机制模块和全连接前馈神经网络模块,←表示在多头注意力机制模块或全连接前馈神经网络输出的基础上叠加原始输入O,即表示残差连接;
Figure BDA0003792618520000083
表示第l层第i个隐节点值,H表示第l层隐节点数量,μl为第l层均值,σl为第l层方差,
Figure BDA0003792618520000084
为第l层第i个隐节点值归一化后的值,ε为避免出现分母为零的超参数,hl为经过正则化运算后的结果,gl,bl为待优化参数。
步骤一三中全连接前馈神经网络为具有多个隐藏层的神经网络,控制参数包括隐藏层的层数和每层隐藏层包含的神经元数,和一般神经网络的运算方法相同,不再单独做特殊说明。
所述步骤二结合温度作用的深度表示,建立结构响应解码器,学习结构响应的深度表示,具体包括以下步骤:
步骤二一:将结构响应监测数据时程进行等长度采样,每段时程数据的长度和温度作用编码器的输入相同,取作L,作为结构响应的嵌入表示;然后考虑结构响应时程的位置信息,即时序信息,进行位置编码,实现对一个结构响应序列中不同元素相对和绝对位置的感知,考虑全桥共有R个结构响应传感器,则解码器输入的样本维度为R+1、长度为L;
步骤二二:建立结构响应解码器,对应温度作用编码器的架构方式,也由M个相同的基本单元串接组成,每个基本单元依次由第一多头注意力机制、第一残差连接正则化、第二多头注意力机制、第二残差连接正则化、全连接前馈神经网络、第三残差连接正则化这六个模块构成;其中,结构响应解码器基本单元中的第一多头注意力机制与编码器中对多头注意力机制的规定一致;结构响应解码器基本单元中的第一、第二、第三残差连接正则化均相同,与编码器中对残差连接正则化的规定一致;结构响应解码器基本单元中的全连接前馈神经网络与编码器中对全连接前馈神经网络的规定一致;
步骤二三:单独计算结构响应解码器基本单元中的第二多头注意力机制,对于第M个解码器基本单元,采用与之对应的第M个温度作用编码器基本单元的输出作为Q和K,第M个解码器基本单元中第一残差连接正则化的输出为V,按照多头注意力机制计算方法,计算它们之间的互注意力矩阵;
步骤二四:在经过了M个解码器基本单元后,增加由编码器输出到解码器输出的残差连接,进一步增强温度作用编码器对结构响应解码器输出的影响;然后依次经过线性转换层、softmax分类层,获得结构响应时程的预测结果,完成结构响应的解码过程;其中,新增残差连接与编码器中对残差连接的规定一致。结构响应解码器架构的示意图如图4所示。
所述步骤三具体包括以下步骤:
步骤三一:以某一段序列数据“ABCDE”为例,随机选取序列中一定比例的元素;
步骤三二:以元素“E”为例,如果“E”被选中,以P1的概率用一个确定元素“X”代替“E”,即“ABCDE”变为“ABCDX”;以P2的概率用一个随机元素R代替“E”,即“ABCDE”变为“ABCDR”;以P3的概率不做改变,即保留“ABCDE”;其中,三个概率的取值范围均为[0,1],并且P1+P2+P3=1。
所述步骤四具体包括以下步骤:
步骤四一:采用桥梁处于健康状态下的温度作用和结构响应数据,训练由上述温度作用编码器和结构响应解码器组成的Transformer模型;
步骤四二:模型训练完毕后,采用未知健康状态的温度作用作为输入,重构桥梁结构的温致响应,如果模型的重构误差与健康状态相比增大,即说明桥梁出现了损伤;
步骤四三:通过分析桥梁结构温致响应的重构误差控制图进行桥梁健康诊断,计算健康状态下训练集误差的均值m和标准差σ,以m±3σ为上下阈值线;
步骤四四:如果桥梁处于健康状态,则重构误差有99.7%的概率落在上下阈值线范围内;如果重构误差超出阈值线,即可诊断出桥梁健康状态发生改变。
以上对本发明所提出的基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法,其特征在于,所述方法具体包括:
步骤一:建立温度作用编码器;
步骤二:建立结构响应解码器;
步骤三:对数据集进行掩码处理,避免模型过拟合;
步骤四:训练由温度作用编码器和结构响应解码器组成的Transformer模型,根据结构响应重构误差进行桥梁结构健康诊断。
2.根据权利要求1所述的方法,其特征在于,所述步骤一具体包括以下步骤:
步骤一一:将温度作用监测数据时程进行等长度采样,每段时程数据的长度均为L,作为温度作用的嵌入表示;考虑全桥共有N个温度传感器,作为输入数据的N个维度,则一个温度作用的样本大小为N×L;
步骤一二:考虑温度作用输入时程的位置信息,在原始时程的基础上叠加位置信息编码、保留位置信息,实现对一个序列中不同元素相对和绝对位置的感知,作为温度作用编码器的输入;
步骤一三:建立温度作用编码器,由M个相同的基本单元串接组成,每个基本单元依次由多头注意力机制、第一残差连接正则化、全连接前馈神经网络、第二残差连接正则化这四个模块构成。
3.根据权利要求2所述的方法,其特征在于,步骤一二中温度作用监测数据时程的位置编码方法具体为:
考虑到温度作用输入序列的长度为固定值L,因此采用沿序列长度进行等间距位置编码,即一个位置编码向量中共有L个编码元素,如此,温度作用输入序列的每一个时间步都匹配了独一无二的位置编码,并且对于任意两个距离相等的时间步,其位置编码的差值也保持一致;位置编码与温度作用时程的结合方式为按传感器通道方向进行拼接,即相当于给N个通道的温度作用时程又增加了一维位置信息,最终,编码器的输入信息由维度为N、长度为L的温度作用时程矩阵转化为维度为N+1、长度为L的温度作用时程及其位置编码综合矩阵。
4.根据权利要求3所述的方法,其特征在于,步骤一三中多头注意力机制的计算方法具体为:
MultiHead(Q,K,V)=Concat([headi])WO
headi=Attention(Qi,Ki,Vi)
Figure FDA0003792618510000021
Qi=XWi Q,Ki=XWi K,Vi=XWi V
式中,MultiHead代表多头注意力运算,Concat表示拼接运算,Attention表示注意力运算,WO表示输出权重矩阵;Q,K,V分别表示查询矩阵、键矩阵、值矩阵,均由温度作用输入矩阵X经过线性变换得到,线性变换矩阵分别为WQ,WK,WV,dk表示查询矩阵和键矩阵的维度值;i表示多头注意力运算的第i个头,即为多头注意力运算的下标索引。
5.根据权利要求4所述的方法,其特征在于,步骤一三中第一残差连接正则化和第二残差连接正则化相似,为在多头注意力机制模块或全连接前馈神经网络输出的基础上叠加原始输入,有助于避免梯度消失,具体计算方法为:
O←O+MultiHead(O),O←O+FeedForward(O)
Figure FDA0003792618510000022
Figure FDA0003792618510000023
式中,O表示经过残差连接正则化模块的原始输入,MultiHead和FeedForward分别对应多头注意力机制模块和全连接前馈神经网络模块,←表示在多头注意力机制模块或全连接前馈神经网络输出的基础上叠加原始输入O,即表示残差连接;
Figure FDA0003792618510000024
表示第l层第i个隐节点值,H表示第l层隐节点数量,μl为第l层均值,σl为第l层方差,
Figure FDA0003792618510000025
为第l层第i个隐节点值归一化后的值,ε为避免出现分母为零的超参数,hl为经过正则化运算后的结果,gl,bl为待优化参数。
6.根据权利要求2所述的方法,其特征在于,步骤一三中全连接前馈神经网络为具有多个隐藏层的神经网络,控制参数包括隐藏层的层数和每层隐藏层包含的神经元数。
7.根据权利要求5所述的方法,其特征在于,所述步骤二具体包括以下步骤:
步骤二一:将结构响应监测数据时程进行等长度采样,每段时程数据的长度和温度作用编码器的输入相同,取作L,作为结构响应的嵌入表示;然后考虑结构响应时程的位置信息,即时序信息,进行位置编码,实现对一个结构响应序列中不同元素相对和绝对位置的感知,考虑全桥共有R个结构响应传感器,则解码器输入的样本维度为R+1、长度为L;
步骤二二:建立结构响应解码器,对应温度作用编码器的架构方式,也由M个相同的基本单元串接组成,每个基本单元依次由第一多头注意力机制、第一残差连接正则化、第二多头注意力机制、第二残差连接正则化、全连接前馈神经网络、第三残差连接正则化这六个模块构成;其中,结构响应解码器基本单元中的第一多头注意力机制与编码器中对多头注意力机制的规定一致;结构响应解码器基本单元中的第一、第二、第三残差连接正则化均相同,与编码器中对残差连接正则化的规定一致;结构响应解码器基本单元中的全连接前馈神经网络与编码器中对全连接前馈神经网络的规定一致;
步骤二三:单独计算结构响应解码器基本单元中的第二多头注意力机制,对于第M个解码器基本单元,采用与之对应的第M个温度作用编码器基本单元的输出作为Q和K,第M个解码器基本单元中第一残差连接正则化的输出为V,按照多头注意力机制计算方法,计算它们之间的互注意力矩阵;
步骤二四:在经过了M个解码器基本单元后,增加由编码器输出到解码器输出的残差连接,进一步增强温度作用编码器对结构响应解码器输出的影响;然后依次经过线性转换层、softmax分类层,获得结构响应时程的预测结果,完成结构响应的解码过程;其中,新增残差连接与编码器中对残差连接的规定一致。
8.根据权利要求7所述的方法,其特征在于,所述步骤三具体包括以下步骤:
步骤三一:以某一段序列数据“ABCDE”为例,随机选取序列中一定比例的元素;
步骤三二:以元素“E”为例,如果“E”被选中,以P1的概率用一个确定元素“X”代替“E”,即“ABCDE”变为“ABCDX”;以P2的概率用一个随机元素R代替“E”,即“ABCDE”变为“ABCDR”;以P3的概率不做改变,即保留“ABCDE”;其中,三个概率的取值范围均为[0,1],并且P1+P2+P3=1。
9.根据权利要求8所述的方法,其特征在于,所述步骤四具体包括以下步骤:
步骤四一:采用桥梁处于健康状态下的温度作用和结构响应数据,训练由上述温度作用编码器和结构响应解码器组成的Transformer模型;
步骤四二:模型训练完毕后,采用未知健康状态的温度作用作为输入,重构桥梁结构的温致响应,如果模型的重构误差与健康状态相比增大,即说明桥梁出现了损伤;
步骤四三:通过分析桥梁结构温致响应的重构误差控制图进行桥梁健康诊断,计算健康状态下训练集误差的均值m和标准差σ,以m±3σ为上下阈值线;
步骤四四:如果桥梁处于健康状态,则重构误差有99.7%的概率落在上下阈值线范围内;如果重构误差超出阈值线,即可诊断出桥梁健康状态发生改变。
CN202210960544.7A 2022-08-11 2022-08-11 基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法 Active CN115392360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210960544.7A CN115392360B (zh) 2022-08-11 2022-08-11 基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210960544.7A CN115392360B (zh) 2022-08-11 2022-08-11 基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法

Publications (2)

Publication Number Publication Date
CN115392360A true CN115392360A (zh) 2022-11-25
CN115392360B CN115392360B (zh) 2023-04-07

Family

ID=84119016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210960544.7A Active CN115392360B (zh) 2022-08-11 2022-08-11 基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法

Country Status (1)

Country Link
CN (1) CN115392360B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542146A (zh) * 2023-01-06 2023-08-04 中路高科交通检测检验认证有限公司 桥梁监测温度场-应变场时空相关模型及健康诊断方法
CN116738535A (zh) * 2023-05-31 2023-09-12 中建三局集团有限公司 一种基于Transformer模型的隧道结构变形预测方法
CN117910120A (zh) * 2024-03-20 2024-04-19 西华大学 基于轻量化Transformer的风-桥系统抖振响应预测方法
CN118153176A (zh) * 2024-05-09 2024-06-07 西华大学 基于Transformer模型与GWO算法的系杆张拉力优化方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190974A (zh) * 2021-04-09 2021-07-30 广东工业大学 基于深度学习的辊道窑温度场多点预测方法
CN113434970A (zh) * 2021-06-01 2021-09-24 北京交通大学 一种机械设备的健康指标曲线提取和寿命预测方法
CN114037002A (zh) * 2021-10-12 2022-02-11 东南大学 基于深度学习模型的斜拉桥主梁异常挠度监测方法
CN114492796A (zh) * 2022-02-09 2022-05-13 厦门大学 一种基于语法树的多任务学习手语翻译方法
CN114863111A (zh) * 2022-05-27 2022-08-05 深圳大学 交互融合Transformer的超声图像量化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190974A (zh) * 2021-04-09 2021-07-30 广东工业大学 基于深度学习的辊道窑温度场多点预测方法
CN113434970A (zh) * 2021-06-01 2021-09-24 北京交通大学 一种机械设备的健康指标曲线提取和寿命预测方法
CN114037002A (zh) * 2021-10-12 2022-02-11 东南大学 基于深度学习模型的斜拉桥主梁异常挠度监测方法
CN114492796A (zh) * 2022-02-09 2022-05-13 厦门大学 一种基于语法树的多任务学习手语翻译方法
CN114863111A (zh) * 2022-05-27 2022-08-05 深圳大学 交互融合Transformer的超声图像量化方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ASHISH VASWANI等: "Attention is all you need" *
吴军;陈伟民;: "人工免疫算法在桥梁健康监测中的应用" *
管军霖;智鑫;: "基于LSTM的超短期光伏发电功率预测" *
金耀;徐阳;韩飞杨;何少阳;王俊博: "基于深度学习语义分割的桥梁病害 图像像素级识别方法" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542146A (zh) * 2023-01-06 2023-08-04 中路高科交通检测检验认证有限公司 桥梁监测温度场-应变场时空相关模型及健康诊断方法
CN116738535A (zh) * 2023-05-31 2023-09-12 中建三局集团有限公司 一种基于Transformer模型的隧道结构变形预测方法
CN117910120A (zh) * 2024-03-20 2024-04-19 西华大学 基于轻量化Transformer的风-桥系统抖振响应预测方法
CN118153176A (zh) * 2024-05-09 2024-06-07 西华大学 基于Transformer模型与GWO算法的系杆张拉力优化方法

Also Published As

Publication number Publication date
CN115392360B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN115392360B (zh) 基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法
CN113723010B (zh) 一种基于lstm温度-位移相关模型的桥梁损伤预警方法
CN114548375B (zh) 基于双向长短期记忆神经网络的斜拉桥主梁动挠度监测方法
CN114169638B (zh) 一种水质预测方法及装置
CN110210993B (zh) 基于循环神经网络模型的城市短期燃气负荷预测方法
CN107505837A (zh) 一种半监督神经网络模型及基于该模型的软测量建模方法
CN108764601A (zh) 一种基于计算机视觉和深度学习技术的结构健康监测异常数据诊断方法
CN114548368B (zh) 一种基于多层核超限学习机的锂电池温度场预测模型的建模方法以及预测方法
CN117253112B (zh) 结构健康诊断大模型视觉语言跨模态学习方法
CN113326981A (zh) 基于动态时空注意力机制的大气环境污染物预测模型
CN113378967B (zh) 一种基于卷积神经网络与迁移学习的结构健康监测多元数据异常诊断方法
CN115841004B (zh) 基于多维数据的带钢热轧过程力学性能软测量方法及装置
CN114444187B (zh) 一种振动传递大数据与胶囊网络融合的桥梁损伤诊断方法
CN115048998B (zh) 一种基于监测数据的斜拉桥群索索力异常识别定位方法
CN115204032A (zh) 一种基于多通道智能模型的enso预测方法及装置
CN114896672B (zh) 一种基于CSO-BiLSTM网络的桥梁动态位移重构方法
CN111461413A (zh) 一种公路路面使用性能检测系统
CN114239397A (zh) 基于动态特征提取与局部加权深度学习的软测量建模方法
CN113408190A (zh) 基于Bayes-LSTM模型的公路隧道施工期围岩变形预测方法
CN117893362B (zh) 一种多时空尺度的海上风电特征筛选及增强的功率预测方法
CN116703644A (zh) 一种基于Attention-RNN的短期电力负荷预测方法
CN116029438A (zh) 水质参数预测模型建模方法及水质参数预测方法及装置
Xu et al. A Bayesian approach for site-specific extreme load prediction of large scale bridges
Wang et al. CNN-BiLSTM-attention model in forecasting wave height over South-East China Seas
CN114818826A (zh) 基于轻量级Vision Transformer模块的故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant