CN117010283B

CN117010283B - Pba车站钢管柱结构变形预测方法、系统

Info

Publication number: CN117010283B
Application number: CN202311278359.0A
Authority: CN
Inventors: 江华; 张珂; 张晋勋; 武福美; 殷明伦; 安冬; 孙晓鹏; 张雷
Original assignee: China University of Mining and Technology Beijing CUMTB; Beijing Urban Construction Group Co Ltd
Current assignee: China University of Mining and Technology Beijing CUMTB; Beijing Urban Construction Group Co Ltd
Priority date: 2023-10-07
Filing date: 2023-10-07
Publication date: 2023-12-29
Anticipated expiration: 2043-10-07
Also published as: CN117010283A

Abstract

本发明公开一种PBA车站钢管柱结构变形预测方法、系统，属于地下工程结构变形监测技术领域。预测方法包括：步骤一：收集历史PBA车站钢管柱应变监测数据，得到历史车站数据集；步骤二：对历史车站数据集进行向量化处理；步骤三：将向量化处理后的历史车站数据集进行数据预处理；步骤四：采用全连接神经网络对预处理后的历史车站数据集进行特征提取；步骤五：采用改进型随机森林预测算法进行模型训练，构建预测模型；步骤六：使用预测模型进行待预测PBA车站钢管柱结构变形预测。本发明能够准确、有效地对车站结构变形进行预测，预测结果可以为车站的建造提供重要的决策支持，有助于提前发现和解决潜在的结构问题，从而保证地铁运行的安全和稳定。

Description

PBA车站钢管柱结构变形预测方法、系统

技术领域

本发明涉及地下工程结构变形监测技术领域，尤其是PBA车站施工，具体为一种PBA车站钢管柱结构变形预测方法、系统。

背景技术

车站，尤其是地铁车站，作为城市公共交通系统的重要组成部分，承载着大量的乘客和交通流量。为满足使用要求，采用PBA工法修建的多跨结构大型车站渐渐成为主流。在车站开挖过程中，钢管柱的变形一直是安全监测的重点。因此，能够预测车站在不同施工阶段的结构变形情况，并根据实际监测数据作出预警十分重要。

相关的传统方法中，车站的结构变形预测主要依赖于工程师的经验和基于物理原理的数值模拟方法。然而，这些方法存在一些局限性。首先，工程师的经验往往是有限的，无法考虑到所有可能的因素和复杂的相互关系。其次，基于物理原理的数值模拟方法需要大量的计算和复杂的参数设置，不仅耗时耗力，还存在模型误差和不确定性。

随着机器学习技术的快速发展，以机器学习为代表的人工智能算法在预测和分类等领域取得了巨大的成功。机器学习能够从大量的数据中学习并发现隐藏的模式和规律，从而做出准确的预测。因此，将机器学习应用于车站结构变形预测成为一种有前景的方法。基于机器学习的车站钢管柱结构变形预测方法可以利用历史结构变形数据和实时监测数据，通过构建预测模型来分析车站结构的变形情况。通过对大量数据的学习，机器学习模型能够捕捉到车站结构变形的规律和趋势，从而提前预测潜在的问题并采取相应的措施。此外，基于机器学习的方法还可以根据实时监测数据进行实时预测和反馈，以便及时采取行动。因此，研究一种基于机器学习的PBA车站钢管柱变形预测方法对提高车站的安全性和可靠性具有重要的意义和应用价值。

在现有的技术中，存在一些问题需要进一步改进：

1、处理复杂数据的能力不足：现有的预测方法对于复杂数据的处理能力不足，特别是对于含有大量噪声和缺失值的数据，现有方法往往无法有效处理。

2、特征提取能力有限：现有的预测方法的特征提取能力有限，往往无法有效地提取出对预测有用的特征。

3、预测精度不高：现有的预测方法的预测精度往往不高，尤其是对于难以预测的样本，现有方法往往无法做出准确的预测。

4、鲁棒性不足：现有的预测方法的鲁棒性不足，对于数据的小幅度变动往往会导致预测结果的大幅度变动。

发明内容

本发明提供一种PBA车站钢管柱结构变形预测方法、系统，通过对车站数据进行清洗和纠正，提取出对车站结构变形预测有用的特征，构建预测模型，能够准确、有效地对车站结构变形进行预测，预测结果可以为车站的建造提供重要的决策支持，有助于提前发现和解决潜在的结构问题，从而保证地铁运行的安全和稳定。

为实现以上目的，本发明通过以下技术方案予以实现：

本发明首先提供一种PBA车站钢管柱结构变形预测方法，包括：步骤一：收集历史PBA车站钢管柱应变监测数据，得到历史车站数据集；步骤二：对所述历史车站数据集进行向量化处理，得到能够用于机器模型使用的特征；步骤三：将向量化处理后的历史车站数据集进行数据预处理；步骤四：采用全连接神经网络对预处理后的历史车站数据集进行特征提取，得到数据的特征向量；步骤五：基于特征提取后数据的特征向量，采用改进型随机森林预测算法进行模型训练，构建预测模型；步骤六：使用预测模型进行待预测PBA车站钢管柱结构变形预测。借助本发明的预测方法，对历史车站数据进行清洗和纠正，提取出对车站结构变形预测有用的特征，构建预测模型，再借助实测数据，能够准确、有效地对车站结构变形进行预测，预测结果可以为车站的建造提供重要的决策支持。

本发明还提供一种PBA车站钢管柱结构变形预测系统，该系统用于执行本发明的预测方法。该系统可以利用各种方式来实现，包括软件、硬件、固件或其任意组合，以确保本发明的预测方法能够容易地被执行，但本发明对此不作特别限制。

本发明提供一种PBA车站钢管柱结构变形预测方法、系统，能够准确、有效地对车站结构变形进行预测，预测结果可以为车站的建造提供重要的决策支持，有助于提前发现和解决潜在的结构问题，从而保证地铁运行的安全和稳定。具体而言，至少具有如下具体的优点：

（1）数据处理：收集到的历史车站数据集首先进行向量化处理，得到能够用于机器模型使用的特征；结构变形数据可能包含噪声、有缺失值、不一致等问题，现有对于复杂数据的处理能力不足，特别是对于含有大量噪声和缺失值的数据，现有的方法往往无法有效处理，本发明采用有效的数据处理策略进行清洗和纠正，满足模型训练需求。

（2）特征提取：现有的方法的特征提取能力有限，往往无法有效地提取出对预测有用的特征，设计一种创新性的特征提取算法（全连接神经网络），能够准确地从大量的、复杂的数据中提取出对车站结构变形预测有用的特征，进而提高预测的精度和可靠性。

（3）参数优化：在进行模型参数优化时，如何找到最优的模型参数是一个重要的问题，本发明设计出一种创新性的优化算法（增强自适应粒子群优化算法）对全连接神经网络进行优化，用于寻找神经网络模型的最优参数，能够提高预测的准确性，尤其是对于难以预测的样本。

（4）预测模型：现有的预测方法的预测精度往往不高，尤其是对于难以预测的样本，现有方法往往无法做出准确的预测。本发明设计出一种创新性的预测算法（改进型随机森林预测算法），能够准确、有效地对车站结构变形进行预测。这种预测模型考虑到数据的不均衡性、模型的鲁棒性等因素。

（5）借助本发明的预测方法，预测结果可以为车站的建造提供重要的决策支持，有助于提前发现和解决潜在的结构问题，从而保证地铁运行的安全和稳定。

应当理解，本发明任一实施方式的实现并不意味要同时具备或达到上述有益效果的多个或全部。

附图说明

为了更清楚地说明本发明的实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图引申获得其它的实施附图。

本说明书所绘示的结构、比例、大小等，均仅用以配合说明书所揭示的内容，以供熟悉此技术的人士了解与阅读，并非用以限定本发明可实施的限定条件，故不具技术上的实质意义，任何结构的修饰、比例关系的改变或大小的调整，在不影响本发明所能产生的功效及所能达成的目的下，均应仍落在本发明所揭示的技术内容涵盖的范围内。

图1为本发明实施例的整体流程示意图；

图2为本发明实施例的A类监测断面钢管柱监测点位置示意图；

图3为本发明实施例的A类监测断面钢管柱的横断面示意图，其中（a）为1-1断面，（b）为2-2断面；

图4为本发明实施例的B类监测断面钢管柱监测点位置示意图；

图5为本发明实施例的B类监测断面钢管柱的横断面示意图，其中（a）为1-1断面，（b）为2-2断面。

在各个附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明实施例作进一步详细说明。在此，本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。

在本发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

应当理解，术语“包括/包含”、“由……组成”或者任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的产品、设备、过程或方法不仅包括那些要素，而且需要时还可以包括没有明确列出的其他要素，或者是还包括为这种产品、设备、过程或方法所固有的要素。在没有更多限制的情况下，由语句“包括/包含……”、“由……组成”限定的要素，并不排除在包括所述要素的产品、设备、过程或方法中还存在另外的相同要素。

还需要理解，术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置、部件或结构必须具有特定的方位、以特定的方位构造或操作，不能理解为对本发明的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

本发明针对现有技术的不足，提出一种PBA车站钢管柱结构变形预测方法，尤其适用地铁车站，旨在主要解决如下技术问题中的一个或多个：

1、数据处理：收集到的车站结构变形数据可能包含噪声、有缺失值、不一致等问题，需要有效的数据处理策略进行清洗和纠正。

2、特征提取：需要设计出一种创新性的特征提取方法，能够准确地从大量的、复杂的数据中提取出对车站结构变形预测有用的特征。

3、参数优化及模型训练：在构建预测模型时，如何找到最优的模型参数是一个重要的问题，需要设计出一种创新性的优化算法，用于寻找神经网络模型的最优参数。

4、预测模型：需要设计出一种创新性的预测算法，能够准确、有效地对车站结构变形进行预测。这种预测模型需要考虑到数据的不均衡性、模型的鲁棒性等因素。

如图1所示的流程图，本发明提供一种PBA车站钢管柱结构变形预测方法，主要包括：步骤一：收集历史PBA车站钢管柱变形数据，得到历史车站数据集；步骤二：对历史车站数据集进行向量化处理，得到能够用于机器模型使用的特征；步骤三：将向量化处理后的历史车站数据集进行数据预处理；步骤四：将预处理后的历史车站数据集进行特征提取得到数据的特征向量；步骤五：基于特征提取后的特征向量进行模型训练，构建预测模型；步骤六：使用预测模型进行待预测PBA车站钢管柱结构变形预测。通过本发明的预测方法，对历史车站数据进行清洗和纠正，提取出对车站结构变形预测有用的特征，构建预测模型，再由PBA车站实测数据，能够准确、有效地对车站结构变形进行预测，预测结果可以为车站的建造提供重要的决策支持，有助于提前发现和解决潜在的结构问题，从而保证地铁运行的安全和稳定。

为了更好的理解上述技术方案，下面将结合附图以及具体的实施方式对上述技术方案进行详细的说明。

步骤一：收集历史PBA车站钢管柱的结构变形数据。

数据收集涉及到历史车站结构变形数据，可获取数据的来源包括：

（1）工程记录：工程记录：查阅车站建设和维护的相关工程记录，包括设计文件、施工报告、监测报告等，这些记录通常会包含车站结构的尺寸参数以及相关的变形和监测数据；

（2）监测系统：进行钢管柱应变监测，本实施例采集数据的监测点及监测内容如下：

在钢管柱顶纵梁底面下、中纵梁底面下、底纵梁顶面上约0.5m处和车站每层钢管柱中间位置处各设一组表面应变计，每组在钢管柱沿车站纵、横向四个方向均匀呈90度间隔布置。

监测断面上选取一根钢管柱内侧焊接表面应变计，其余三根柱子外侧焊接表面应变计，测点布置如图2~5所示，其中（a）均为对应的1-1断面，（b）均为对应的2-2断面，表面应变计以矩形表示。

两个监测断面有4根钢管柱，内侧需布置28个表面应变计，外侧需布置84个表面应变计，共需112个表面应变计。

可由钢管柱应变将收集到的开挖阶段顶拱应力及压力、纵梁应变、钢管柱应变等原始数据作为能够用于后续机器模型使用的非文本特征，而监测报告等工程记录中的文字部分为文本特征。

步骤二：对历史车站数据集进行向量化处理；

对收集到的历史车站数据集中的文本特征，本发明中使用TF-IDF向量化方法对文本特征进行向量化处理。TF-IDF是一种统计方法，用以评估一个字词对于一个历史车站数据集或一个语料库中的其中一个样本的重要程度。字词的重要性随着它在车站数据中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。TF即词频，表示词条在车站数据中出现的频率，这个数字通常会被归一化，以防止它偏向长语句的数据。TF用公式表示如下：

其中，n_i,j表示词条t_i在历史车站数据集d_j中出现的次数，n_k,j表示第k个词条在历史车站数据集d_j中出现的次数，k的取值范围为[1,Ku]，Ku为需要统计的词语的总数，TF_i,j表示词条t_i在历史车站数据集d_j中出现的频率。

在通常情况下，一些通用的词语对于后续模型的预测并没有太大的作用，反倒是一些出现频率较少的词才能够表达车站数据的特性，所以只考虑TF不合适。通过设计权重，如果一个词的分类能力越强，权重则越大，反之，权重则越小。IDF即逆文本频率指数(Inverse Document Frequency)，表示关键词的普遍程度。如果包含词条t_i的车站数据越少，IDF越大，则说明该词条具有很好的类别区分能力。对于某一特定词语的IDF_i，可以由样本的总数除以包含该词语的样本的数目的商取对数得到：

其中，IDF_i即词条t_i的逆文本频率指数，表示关键词的普遍程度，|n+m|表示所有样本的数量，|j:t_i∈d_j|表示包含词条t_i的样本数量。

某一特定样本内的高词语频率，以及该词语在整个历史车站数据集中的低样本频率，可以产生出高权重的TF-IDF。因此，TF-IDF倾向于过滤掉常见的词语，保留重要的词语，TF-IDF表达为：

其中，TF_IDF_i为用于评估一字词对于一个历史车站数据集或一个语料库中的其中一个样本的重要程度系数。

因此，词袋模型只考虑每种词汇在该训练文本中出现的频率，而TF-IDF除了考量某一词汇在当前训练文本中出现的频率之外，同时关注包含这个词汇的其他训练文本数目的倒数。相比之下，训练文本的数量越多，TF-IDF这种特征量化方式就更有优势。

通过计算TF-IDF系数，将文本特征转化为向量，公式如下：

其中，X_vec为向量化后的特征，X_all为所有数据，TI表示TF-IDF计算。

然后，将向量化后的特征与原始历史车站数据集中的非文本特征组合，得到能够用于后续机器模型使用的特征Xu。

步骤三：将向量化处理后的历史车站数据集进行数据预处理。

在实际应用中，钢管柱监测数据往往是残缺的、有噪声的、不一致的。针对这种情况，本发明设计了车站数据处理规则，对车站数据进行清洗和纠正。

（1）缺失值的处理，数据丢失是车站数据采集过程中最常见的问题。对于地铁站中需使用传感器采集的车站数据，会出现一些传感器测量点不能正常工作的情况，从而导致收集到的运行状态信息部分丢失。对历史车站数据集中丢失的车站数据根据数据的重要性采取不同的措施，如插值、删除等。

（2）异常数据的处理，对于地铁站中需使用传感器采集的车站数据，由于传感器故障或其他原因，上传数据中可能存在一些不合理的车站数据。对历史车站数据集中不合理的车站数据进行删除操作。

（3）数据的归一化，由于收集的车站数据有不同的数值范围和取值范围，因此需要进行归一化操作，以更好地反映车站数据和预测类型之间的关系，并减小不同的量级给预测结果带来的影响。因此，本发明采用极差标准化方法对数据进行归一化：

其中，x_min、x_max分别表示整体数据样本中的最小值和最大值，x_in表示输入的车站数据，x_out表示归一化后的车站数据。

步骤四，将预处理后的历史车站数据集进行特征提取。

本发明采用全连接神经网络作为车站结构变形预测的特征提取模型，对预处理后的车站数据进行特征提取。区别于传统的神经网络，本发明采用新型的网络参数搜索方法，替代传统的反向传播算法。

本发明全连接神经网络为多层前馈神经网络，该网络有d个输入神经元、q个隐层单元和L个输出单元，隐含层第h个神经元的阈值为γ_h，输出层第j个神经元的阈值为θ_j，输入层第i个神经元与隐含层第h个神经元的连接权重为v_ih，隐含层第h个神经元与输出层第j个神经元的连接权重为w_hj。

隐含层使用ReLU激活函数，表示如下：

输出层使用Softmax函数，表示如下：

其中v为d×q大小的权值矩阵，x为d×1大小的样本输入向量，γ为q×1大小的阈值向量；w是q×1大小的权值矩阵，B为f₁( )函数的输出，大小为q×1，θ为1×1大小的阈值向量。

网络前向传播输出表示如下：

其中y为样本对应的标签向量，大小为1×I，I表示维度；

采用交叉熵计算损失函数，公式如下：

其中，Y₁表示第1个样本的标签，正类为1，负类为0；同理，Y_i表示第i个样本的标签，Y_Nall表示第Nall个样本的标签，p₁表示第1个样本预测为正类的概率，p_i表示第i个样本预测为正类的概率，p_Nall表示第Nall个样本预测为正类的概率。

在搜索神经网络的参数时，本发明采用增强自适应粒子群优化算法进行神经网络的参数优化，用于寻找神经网络模型的最优参数。

设整个神经网络的权值矩阵为w_all，阈值矩阵为b_all，增强自适应粒子群优化算法中的每个个体（搜索粒子）都代表了神经网络的一种可能的权值矩阵和阈值矩阵的组合。

搜索算法将通过模拟搜索粒子的移动行为来搜索最优解。

设搜索粒子个体的位置为：

其中D是搜索空间的维度，对应于神经网络的参数个数，包括权值和阈值，假设搜索粒子群体的大小为n，i∈{1,2,...,n}。

根据神经网络的预测性能评价搜索粒子的适应度f(X_i)，采用损失函数Loss的倒数作为适应度函数，表示为：

其中，Loss|X_i为神经网络参数为X_i时的损失函数。

在许多优化算法中，梯度信息常被用来指导搜索方向。在增强自适应增强自适应粒子群优化算法中，引入梯度信息来指导搜索粒子的搜索方向。

设神经网络的误差为E，参数x_ij的梯度可以通过链式法则计算得到：

然后，在每一次迭代中，跟踪粒子将根据以下公式更新他们的位置：

其中，X_best是最佳解的位置，即具有最高适应度的位置，是一个介于[-1,1]之间的随机数，η是学习率，控制了参数更新的步长。

传统的优化算法通常设定固定的学习率，但是这种方法并不总是最优的。随着训练过程的进行，较大的学习率可能会导致震荡，而较小的学习率又可能使训练速度过慢。因此，一个动态调整的学习率可能会在训练过程中表现得更好。

本发明设定一个动态调整的学习率：首先设定一个初始的学习率η₀，并在每个训练周期结束后根据以下公式来调整学习率：

其中，t是训练周期的数量，λ是衰减系数，控制学习率降低的速度。

这种方法的优点在于可以在训练初期提供较大的学习率以快速逼近全局最优，然后随着训练的进行逐渐降低学习率，使得训练更加稳定，避免了过度震荡。

此外，继续对所述增强自适应粒子群优化算法引入一个自适应步长调整策略，使得搜索过程可以更快地收敛到最优解。具体的，如果在连续的P次迭代中，搜索粒子个体的适应度没有显著改善，则将减小其搜索步长：

其中，δ∈(0,1)是步长减小的比例。

步骤五：构建预测模型。

特征提取完成后，将特征提取后的特征输入到预测模型中。本发明提出一种改进型随机森林预测算法，将样本权重以及自适应优化策略引入到随机森林中，提高了预测准确性。

基本的随机森林模型训练过程如下：

1）对特征提取后样本集进行自助采样，生成训练集。

2）对训练集使用决策树算法进行训练，得到一棵树。每个节点分裂的特征从所有特征中随机选取。

3）重复步骤1、2，生成多棵树，构成森林。

4）对新样本进行预测时，每棵树进行预测，然后通过投票决定最后的预测结果。

改进的改进型随机森林算法则在此基础上进行改进。

对于采样权重的改进，引入样本权重。初始情况下，所有样本的权重均等。在每一轮迭代中，被正确预测的样本权重降低，错误预测的样本权重提高。这样可以让模型更加关注难以预测的样本。

对于自适应优化的改进，在训练过程中，不断调整每棵树的权重。对预测准确率高的树赋予较高的权重，预测准确率低的树赋予较低的权重。在预测阶段，每棵树的投票根据它们的权重进行加权，从而得到最终的预测结果。

具体地，对改进型随机森林的构建过程中的改进进行详细介绍。

对于样本权重的调整：设样本集D中第i个样本的权重为w_i，初始时，w_i=1/n，n为样本总数；

在每一轮迭代中，对于被正确预测的样本，其权重将乘以一个衰减因子0<β<1：

上式建立在样本被正确预测的情况下。对于被错误预测的样本，权重保持不变。

对于决策树权重的调整：设决策树T在训练集上的预测准确率为acc(T)，那么T的权重weight(T)为：

这是因为预测准确率更高的树应当在最终的投票中有更大的影响力。同时，为了避免过拟合，这里采用平方形式，有更强的惩罚作用。这意味着只有那些预测准确率非常高的树才能获得较大的权重。

最后，预测新样本的标签，对于给定样本x，计算其在每棵树上的预测结果T(x)，并以树的权重进行加权，取加权结果最大的类别作为最终预测结果：

其中，arg代表数学计算中复数的辅角，max代表数学计算中取最大值，Forest代表所有决策树的集和，Ra(⋅)为指示函数，当括号内条件成立时取值为1，否则为0。

改进型随机森林算法在处理车站结构变形预测问题时，通过自适应地调整样本权重，让模型更加关注难以预测的样本，从而提高预测精度。通过在预测阶段引入决策树的权重，增大了预测准确率高的决策树的影响力，降低了预测准确率低的决策树的影响力，进一步提高了预测准确性。

步骤六：使用预测模型进行待预测PBA车站钢管柱结构变形预测。

本步骤中，在获取待预测PBA车站钢管柱应变监测数据后，与构建预测模型一样，需先将数据预处理并特征提取转换为机器模型能够识别和调用的特征向量。

具体包括：

（1）获取待预测PBA车站钢管柱应变监测数据；

（2）对获取的应变监测数据进行向量化处理，得到能够用于机器模型使用的特征；

（3）将向量化处理后的应变监测数据进行数据预处理；

（4）采用全连接神经网络对预处理后的应变监测数据进行特征提取，得到数据的特征向量；

（5）将特征提取后数据的特征向量输入预测模型，进行待预测PBA车站钢管柱结构变形预测。

本发明还提供一种基于机器学习的PBA车站钢管柱结构变形预测系统，该系统用于执行前述的预测方法。该系统可以利用各种方式来实现，包括软件、硬件、固件或其任意组合。系统中的一个或多个单元可以使用软件和/或固件来实现，例如存储在存储介质上的机器可执行指令。除了机器可执行指令之外或者作为替代，部分或者全部单元可以至少部分地由一个或多个硬件逻辑组件来实现。本发明对此不作特别限制。

虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本发明的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种PBA车站钢管柱结构变形预测方法，其特征在于包括：

步骤一：收集历史PBA车站钢管柱应变监测数据，得到历史车站数据集；

步骤二：对所述历史车站数据集进行向量化处理，得到能够用于机器模型使用的特征；

步骤三：将向量化处理后的历史车站数据集进行数据预处理；

步骤四：采用全连接神经网络对预处理后的历史车站数据集进行特征提取，得到数据的特征向量；包括：

所述全连接神经网络为多层前馈神经网络，该网络有d个输入神经元、q个隐层单元和L个输出单元，隐含层第h个神经元的阈值为γ_h，输出层第j个神经元的阈值为θ_j，输入层第i个神经元与隐含层第h个神经元的连接权重为v_ih，隐含层第h个神经元与输出层第j个神经元的连接权重为w_hj；

隐含层使用ReLU激活函数，表示如下：

；

输出层使用Softmax函数，表示如下：

；

其中v为d×q大小的权值矩阵，x为d×1大小的样本输入向量，γ为q×1大小的阈值向量；w是q×1大小的权值矩阵，B为f₁( )函数的输出，大小为q×1，θ为1×1大小的阈值向量；

网络前向传播输出表示如下：

；

其中y为样本对应的标签向量，大小为1×I，I表示维度；

采用交叉熵计算损失函数，公式如下：

；

其中，Y₁表示第1个样本的标签，正类为1，负类为0；同理，Y_i表示第i个样本的标签，Y_Nall表示第Nall个样本的标签，p₁表示第1个样本预测为正类的概率，p_i表示第i个样本预测为正类的概率，p_Nall表示第Nall个样本预测为正类的概率；

步骤五：基于特征提取后数据的特征向量，采用改进型随机森林预测算法进行模型训练，构建预测模型；包括：

将样本权重以及自适应优化策略引入到随机森林中，具体的：

；

对于被错误预测的样本，权重保持不变；

；

其中，arg代表计算中复数的辅角，max代表计算中取最大值，Forest代表所有决策树的集和，Ra(⋅)为指示函数，当括号内条件成立时取值为1，否则为0；

2.根据权利要求1所述的预测方法，其特征在于，步骤二中，所述向量化处理包括：

将历史车站数据集中的文本特征进行向量化处理，并将向量化后的特征与其中的非文本特征组合。

3.根据权利要求2所述的预测方法，其特征在于，所述将历史车站数据集中的文本特征进行向量化处理包括：

对收集到的历史车站数据集中的文本特征，使用TF-IDF向量化方法进行向量化处理，其中：

TF公式表示如下：

；

其中，n_i,j表示词条t_i在历史车站数据集d_j中出现的次数，n_k,j表示第k个词条在历史车站数据集d_j中出现的次数，k的取值范围为[1,Ku]，Ku为需要统计的词语的总数，TF_i,j表示词条t_i在历史车站数据集d_j中出现的频率；

对于某一特定词语的IDF_i，由样本的总数除以包含该词语的样本的数目的商取对数得到：

；

其中，IDF_i即词条t_i的逆文本频率指数，表示关键词的普遍程度，|n+m|表示所有样本的数量，|j:t_i∈d_j|表示包含词条t_i的样本数量；

因此，TF-IDF表达为：

；

其中，TF_IDF_i为用于评估一字词对于一个历史车站数据集或一个语料库中的其中一个样本的重要程度系数；

通过计算TF-IDF系数，将文本特征转化为向量，公式如下：

；

4.根据权利要求1所述的预测方法，其特征在于，步骤三中，所述将向量化处理后的历史车站数据集进行数据预处理包括：

（1）缺失值的处理，对所述历史车站数据集中丢失的车站数据根据数据的重要性采取不同的措施，包括插值、删除；

（2）异常数据的处理，对所述历史车站数据集中不合理的车站数据进行删除操作；

（3）数据的归一化，对所述历史车站数据集中车站数据不同的数值范围和取值范围进行归一化操作，具体采用极差标准化方法对数据进行归一化：

；

5.根据权利要求1所述的预测方法，其特征在于，继续采用增强自适应粒子群优化算法进行神经网络的参数优化；

设搜索粒子个体的位置为：

；

其中D是搜索空间的维度，对应于神经网络的参数个数，包括权值和阈值，假设搜索粒子群体的大小为n，i∈{1,2,...,n}；

；

其中，Loss|X_i为神经网络参数为X_i时的损失函数；

引入梯度信息来指导搜索粒子的搜索方向；设神经网络的误差为E，参数x_ij的梯度通过链式法则计算得到：

；

其中，X_best是最佳解的位置，即具有最高适应度的位置，ϕ_ij是一个介于[-1,1]之间的随机数，η是学习率，控制了参数更新的步长；

设定一个动态调整的学习率：首先设定一个初始的学习率η₀，并在每个训练周期结束后根据以下公式来调整学习率：

；

6.根据权利要求5所述的预测方法，其特征在于，继续对所述增强自适应粒子群优化算法引入一个自适应步长调整策略：

如果在连续的P次迭代中，搜索粒子个体的适应度没有显著改善，则将减小其搜索步长ϕ_ij：

；

其中，δ∈(0,1)是步长减小的比例。

7.根据权利要求1所述的预测方法，其特征在于，步骤六中，所述使用预测模型进行待预测PBA车站钢管柱结构变形预测包括：

获取待预测PBA车站钢管柱应变监测数据；

对获取的应变监测数据进行向量化处理，得到能够用于机器模型使用的特征；

将向量化处理后的应变监测数据进行数据预处理；

采用全连接神经网络对预处理后的应变监测数据进行特征提取，得到数据的特征向量；

将特征提取后数据的特征向量输入预测模型，进行待预测PBA车站钢管柱结构变形预测。

8.一种PBA车站钢管柱结构变形预测系统，其特征在于，该系统用于执行如权利要求1至7任一项所述的预测方法。