CN117010283B - Pba车站钢管柱结构变形预测方法、系统 - Google Patents
Pba车站钢管柱结构变形预测方法、系统 Download PDFInfo
- Publication number
- CN117010283B CN117010283B CN202311278359.0A CN202311278359A CN117010283B CN 117010283 B CN117010283 B CN 117010283B CN 202311278359 A CN202311278359 A CN 202311278359A CN 117010283 B CN117010283 B CN 117010283B
- Authority
- CN
- China
- Prior art keywords
- station
- data
- historical
- sample
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 229910000831 Steel Inorganic materials 0.000 title claims abstract description 44
- 239000010959 steel Substances 0.000 title claims abstract description 44
- 238000012544 monitoring process Methods 0.000 claims abstract description 33
- 238000013528 artificial neural network Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 24
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 238000007637 random forest analysis Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 239000002245 particle Substances 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 21
- 238000005457 optimization Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 16
- 210000002569 neuron Anatomy 0.000 claims description 12
- 238000003066 decision tree Methods 0.000 claims description 10
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 230000007423 decrease Effects 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims description 2
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000005549 size reduction Methods 0.000 claims description 2
- 210000002364 input neuron Anatomy 0.000 claims 1
- 238000010276 construction Methods 0.000 abstract description 11
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 14
- 238000010801 machine learning Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000009514 concussion Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000003466 welding Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005240 physical vapour deposition Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/17—Mechanical parametric or variational design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/06—Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computer Hardware Design (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种PBA车站钢管柱结构变形预测方法、系统,属于地下工程结构变形监测技术领域。预测方法包括:步骤一:收集历史PBA车站钢管柱应变监测数据,得到历史车站数据集;步骤二:对历史车站数据集进行向量化处理;步骤三:将向量化处理后的历史车站数据集进行数据预处理;步骤四:采用全连接神经网络对预处理后的历史车站数据集进行特征提取;步骤五:采用改进型随机森林预测算法进行模型训练,构建预测模型;步骤六:使用预测模型进行待预测PBA车站钢管柱结构变形预测。本发明能够准确、有效地对车站结构变形进行预测,预测结果可以为车站的建造提供重要的决策支持,有助于提前发现和解决潜在的结构问题,从而保证地铁运行的安全和稳定。
Description
技术领域
本发明涉及地下工程结构变形监测技术领域,尤其是PBA车站施工,具体为一种PBA车站钢管柱结构变形预测方法、系统。
背景技术
车站,尤其是地铁车站,作为城市公共交通系统的重要组成部分,承载着大量的乘客和交通流量。为满足使用要求,采用PBA工法修建的多跨结构大型车站渐渐成为主流。在车站开挖过程中,钢管柱的变形一直是安全监测的重点。因此,能够预测车站在不同施工阶段的结构变形情况,并根据实际监测数据作出预警十分重要。
相关的传统方法中,车站的结构变形预测主要依赖于工程师的经验和基于物理原理的数值模拟方法。然而,这些方法存在一些局限性。首先,工程师的经验往往是有限的,无法考虑到所有可能的因素和复杂的相互关系。其次,基于物理原理的数值模拟方法需要大量的计算和复杂的参数设置,不仅耗时耗力,还存在模型误差和不确定性。
随着机器学习技术的快速发展,以机器学习为代表的人工智能算法在预测和分类等领域取得了巨大的成功。机器学习能够从大量的数据中学习并发现隐藏的模式和规律,从而做出准确的预测。因此,将机器学习应用于车站结构变形预测成为一种有前景的方法。基于机器学习的车站钢管柱结构变形预测方法可以利用历史结构变形数据和实时监测数据,通过构建预测模型来分析车站结构的变形情况。通过对大量数据的学习,机器学习模型能够捕捉到车站结构变形的规律和趋势,从而提前预测潜在的问题并采取相应的措施。此外,基于机器学习的方法还可以根据实时监测数据进行实时预测和反馈,以便及时采取行动。因此,研究一种基于机器学习的PBA车站钢管柱变形预测方法对提高车站的安全性和可靠性具有重要的意义和应用价值。
在现有的技术中,存在一些问题需要进一步改进:
1、处理复杂数据的能力不足:现有的预测方法对于复杂数据的处理能力不足,特别是对于含有大量噪声和缺失值的数据,现有方法往往无法有效处理。
2、特征提取能力有限:现有的预测方法的特征提取能力有限,往往无法有效地提取出对预测有用的特征。
3、预测精度不高:现有的预测方法的预测精度往往不高,尤其是对于难以预测的样本,现有方法往往无法做出准确的预测。
4、鲁棒性不足:现有的预测方法的鲁棒性不足,对于数据的小幅度变动往往会导致预测结果的大幅度变动。
发明内容
本发明提供一种PBA车站钢管柱结构变形预测方法、系统,通过对车站数据进行清洗和纠正,提取出对车站结构变形预测有用的特征,构建预测模型,能够准确、有效地对车站结构变形进行预测,预测结果可以为车站的建造提供重要的决策支持,有助于提前发现和解决潜在的结构问题,从而保证地铁运行的安全和稳定。
为实现以上目的,本发明通过以下技术方案予以实现:
本发明首先提供一种PBA车站钢管柱结构变形预测方法,包括:步骤一:收集历史PBA车站钢管柱应变监测数据,得到历史车站数据集;步骤二:对所述历史车站数据集进行向量化处理,得到能够用于机器模型使用的特征;步骤三:将向量化处理后的历史车站数据集进行数据预处理;步骤四:采用全连接神经网络对预处理后的历史车站数据集进行特征提取,得到数据的特征向量;步骤五:基于特征提取后数据的特征向量,采用改进型随机森林预测算法进行模型训练,构建预测模型;步骤六:使用预测模型进行待预测PBA车站钢管柱结构变形预测。借助本发明的预测方法,对历史车站数据进行清洗和纠正,提取出对车站结构变形预测有用的特征,构建预测模型,再借助实测数据,能够准确、有效地对车站结构变形进行预测,预测结果可以为车站的建造提供重要的决策支持。
本发明还提供一种PBA车站钢管柱结构变形预测系统,该系统用于执行本发明的预测方法。该系统可以利用各种方式来实现,包括软件、硬件、固件或其任意组合,以确保本发明的预测方法能够容易地被执行,但本发明对此不作特别限制。
本发明提供一种PBA车站钢管柱结构变形预测方法、系统,能够准确、有效地对车站结构变形进行预测,预测结果可以为车站的建造提供重要的决策支持,有助于提前发现和解决潜在的结构问题,从而保证地铁运行的安全和稳定。具体而言,至少具有如下具体的优点:
(1)数据处理:收集到的历史车站数据集首先进行向量化处理,得到能够用于机器模型使用的特征;结构变形数据可能包含噪声、有缺失值、不一致等问题,现有对于复杂数据的处理能力不足,特别是对于含有大量噪声和缺失值的数据,现有的方法往往无法有效处理,本发明采用有效的数据处理策略进行清洗和纠正,满足模型训练需求。
(2)特征提取:现有的方法的特征提取能力有限,往往无法有效地提取出对预测有用的特征,设计一种创新性的特征提取算法(全连接神经网络),能够准确地从大量的、复杂的数据中提取出对车站结构变形预测有用的特征,进而提高预测的精度和可靠性。
(3)参数优化:在进行模型参数优化时,如何找到最优的模型参数是一个重要的问题,本发明设计出一种创新性的优化算法(增强自适应粒子群优化算法)对全连接神经网络进行优化,用于寻找神经网络模型的最优参数,能够提高预测的准确性,尤其是对于难以预测的样本。
(4)预测模型:现有的预测方法的预测精度往往不高,尤其是对于难以预测的样本,现有方法往往无法做出准确的预测。本发明设计出一种创新性的预测算法(改进型随机森林预测算法),能够准确、有效地对车站结构变形进行预测。这种预测模型考虑到数据的不均衡性、模型的鲁棒性等因素。
(5)借助本发明的预测方法,预测结果可以为车站的建造提供重要的决策支持,有助于提前发现和解决潜在的结构问题,从而保证地铁运行的安全和稳定。
应当理解,本发明任一实施方式的实现并不意味要同时具备或达到上述有益效果的多个或全部。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容涵盖的范围内。
图1为本发明实施例的整体流程示意图;
图2为本发明实施例的A类监测断面钢管柱监测点位置示意图;
图3为本发明实施例的A类监测断面钢管柱的横断面示意图,其中(a)为1-1断面,(b)为2-2断面;
图4为本发明实施例的B类监测断面钢管柱监测点位置示意图;
图5为本发明实施例的B类监测断面钢管柱的横断面示意图,其中(a)为1-1断面,(b)为2-2断面。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明实施例作进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
应当理解,术语“包括/包含”、“由……组成”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的产品、设备、过程或方法不仅包括那些要素,而且需要时还可以包括没有明确列出的其他要素,或者是还包括为这种产品、设备、过程或方法所固有的要素。在没有更多限制的情况下,由语句“包括/包含……”、“由……组成”限定的要素,并不排除在包括所述要素的产品、设备、过程或方法中还存在另外的相同要素。
还需要理解,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置、部件或结构必须具有特定的方位、以特定的方位构造或操作,不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
本发明针对现有技术的不足,提出一种PBA车站钢管柱结构变形预测方法,尤其适用地铁车站,旨在主要解决如下技术问题中的一个或多个:
1、数据处理:收集到的车站结构变形数据可能包含噪声、有缺失值、不一致等问题,需要有效的数据处理策略进行清洗和纠正。
2、特征提取:需要设计出一种创新性的特征提取方法,能够准确地从大量的、复杂的数据中提取出对车站结构变形预测有用的特征。
3、参数优化及模型训练:在构建预测模型时,如何找到最优的模型参数是一个重要的问题,需要设计出一种创新性的优化算法,用于寻找神经网络模型的最优参数。
4、预测模型:需要设计出一种创新性的预测算法,能够准确、有效地对车站结构变形进行预测。这种预测模型需要考虑到数据的不均衡性、模型的鲁棒性等因素。
如图1所示的流程图,本发明提供一种PBA车站钢管柱结构变形预测方法,主要包括:步骤一:收集历史PBA车站钢管柱变形数据,得到历史车站数据集;步骤二:对历史车站数据集进行向量化处理,得到能够用于机器模型使用的特征;步骤三:将向量化处理后的历史车站数据集进行数据预处理;步骤四:将预处理后的历史车站数据集进行特征提取得到数据的特征向量;步骤五:基于特征提取后的特征向量进行模型训练,构建预测模型;步骤六:使用预测模型进行待预测PBA车站钢管柱结构变形预测。通过本发明的预测方法,对历史车站数据进行清洗和纠正,提取出对车站结构变形预测有用的特征,构建预测模型,再由PBA车站实测数据,能够准确、有效地对车站结构变形进行预测,预测结果可以为车站的建造提供重要的决策支持,有助于提前发现和解决潜在的结构问题,从而保证地铁运行的安全和稳定。
为了更好的理解上述技术方案,下面将结合附图以及具体的实施方式对上述技术方案进行详细的说明。
步骤一:收集历史PBA车站钢管柱的结构变形数据。
数据收集涉及到历史车站结构变形数据,可获取数据的来源包括:
(1)工程记录:工程记录:查阅车站建设和维护的相关工程记录,包括设计文件、施工报告、监测报告等,这些记录通常会包含车站结构的尺寸参数以及相关的变形和监测数据;
(2)监测系统:进行钢管柱应变监测,本实施例采集数据的监测点及监测内容如下:
在钢管柱顶纵梁底面下、中纵梁底面下、底纵梁顶面上约0.5m处和车站每层钢管柱中间位置处各设一组表面应变计,每组在钢管柱沿车站纵、横向四个方向均匀呈90度间隔布置。
监测断面上选取一根钢管柱内侧焊接表面应变计,其余三根柱子外侧焊接表面应变计,测点布置如图2~5所示,其中(a)均为对应的1-1断面,(b)均为对应的2-2断面,表面应变计以矩形表示。
两个监测断面有4根钢管柱,内侧需布置28个表面应变计,外侧需布置84个表面应变计,共需112个表面应变计。
可由钢管柱应变将收集到的开挖阶段顶拱应力及压力、纵梁应变、钢管柱应变等原始数据作为能够用于后续机器模型使用的非文本特征,而监测报告等工程记录中的文字部分为文本特征。
步骤二:对历史车站数据集进行向量化处理;
对收集到的历史车站数据集中的文本特征,本发明中使用TF-IDF向量化方法对文本特征进行向量化处理。TF-IDF是一种统计方法,用以评估一个字词对于一个历史车站数据集或一个语料库中的其中一个样本的重要程度。字词的重要性随着它在车站数据中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF即词频,表示词条在车站数据中出现的频率,这个数字通常会被归一化,以防止它偏向长语句的数据。TF用公式表示如下:
其中,ni,j表示词条ti在历史车站数据集dj中出现的次数,nk,j表示第k个词条在历史车站数据集dj中出现的次数,k的取值范围为[1,Ku],Ku为需要统计的词语的总数,TFi,j表示词条ti在历史车站数据集dj中出现的频率。
在通常情况下,一些通用的词语对于后续模型的预测并没有太大的作用,反倒是一些出现频率较少的词才能够表达车站数据的特性,所以只考虑TF不合适。通过设计权重,如果一个词的分类能力越强,权重则越大,反之,权重则越小。IDF即逆文本频率指数(Inverse Document Frequency),表示关键词的普遍程度。如果包含词条ti的车站数据越少,IDF越大,则说明该词条具有很好的类别区分能力。对于某一特定词语的IDFi,可以由样本的总数除以包含该词语的样本的数目的商取对数得到:
其中,IDFi即词条ti的逆文本频率指数,表示关键词的普遍程度,|n+m|表示所有样本的数量,|j:ti∈dj|表示包含词条ti的样本数量。
某一特定样本内的高词语频率,以及该词语在整个历史车站数据集中的低样本频率,可以产生出高权重的TF-IDF。因此,TF-IDF倾向于过滤掉常见的词语,保留重要的词语,TF-IDF表达为:
其中,TF_IDFi为用于评估一字词对于一个历史车站数据集或一个语料库中的其中一个样本的重要程度系数。
因此,词袋模型只考虑每种词汇在该训练文本中出现的频率,而TF-IDF除了考量某一词汇在当前训练文本中出现的频率之外,同时关注包含这个词汇的其他训练文本数目的倒数。相比之下,训练文本的数量越多,TF-IDF这种特征量化方式就更有优势。
通过计算TF-IDF系数,将文本特征转化为向量,公式如下:
其中,Xvec为向量化后的特征,Xall为所有数据,TI表示TF-IDF计算。
然后,将向量化后的特征与原始历史车站数据集中的非文本特征组合,得到能够用于后续机器模型使用的特征Xu。
步骤三:将向量化处理后的历史车站数据集进行数据预处理。
在实际应用中,钢管柱监测数据往往是残缺的、有噪声的、不一致的。针对这种情况,本发明设计了车站数据处理规则,对车站数据进行清洗和纠正。
(1)缺失值的处理,数据丢失是车站数据采集过程中最常见的问题。对于地铁站中需使用传感器采集的车站数据,会出现一些传感器测量点不能正常工作的情况,从而导致收集到的运行状态信息部分丢失。对历史车站数据集中丢失的车站数据根据数据的重要性采取不同的措施,如插值、删除等。
(2)异常数据的处理,对于地铁站中需使用传感器采集的车站数据,由于传感器故障或其他原因,上传数据中可能存在一些不合理的车站数据。对历史车站数据集中不合理的车站数据进行删除操作。
(3)数据的归一化,由于收集的车站数据有不同的数值范围和取值范围,因此需要进行归一化操作,以更好地反映车站数据和预测类型之间的关系,并减小不同的量级给预测结果带来的影响。因此,本发明采用极差标准化方法对数据进行归一化:
其中,xmin、xmax分别表示整体数据样本中的最小值和最大值,xin表示输入的车站数据,xout表示归一化后的车站数据。
步骤四,将预处理后的历史车站数据集进行特征提取。
本发明采用全连接神经网络作为车站结构变形预测的特征提取模型,对预处理后的车站数据进行特征提取。区别于传统的神经网络,本发明采用新型的网络参数搜索方法,替代传统的反向传播算法。
本发明全连接神经网络为多层前馈神经网络,该网络有d个输入神经元、q个隐层单元和L个输出单元,隐含层第h个神经元的阈值为γh,输出层第j个神经元的阈值为θj,输入层第i个神经元与隐含层第h个神经元的连接权重为vih,隐含层第h个神经元与输出层第j个神经元的连接权重为whj。
隐含层使用ReLU激活函数,表示如下:
输出层使用Softmax函数,表示如下:
其中v为d×q大小的权值矩阵,x为d×1大小的样本输入向量,γ为q×1大小的阈值向量;w是q×1大小的权值矩阵,B为f1( )函数的输出,大小为q×1,θ为1×1大小的阈值向量。
网络前向传播输出表示如下:
其中y为样本对应的标签向量,大小为1×I,I表示维度;
采用交叉熵计算损失函数,公式如下:
其中,Y1表示第1个样本的标签,正类为1,负类为0;同理,Yi表示第i个样本的标签,YNall表示第Nall个样本的标签,p1表示第1个样本预测为正类的概率,pi表示第i个样本预测为正类的概率,pNall表示第Nall个样本预测为正类的概率。
在搜索神经网络的参数时,本发明采用增强自适应粒子群优化算法进行神经网络的参数优化,用于寻找神经网络模型的最优参数。
设整个神经网络的权值矩阵为wall,阈值矩阵为ball,增强自适应粒子群优化算法中的每个个体(搜索粒子)都代表了神经网络的一种可能的权值矩阵和阈值矩阵的组合。
搜索算法将通过模拟搜索粒子的移动行为来搜索最优解。
设搜索粒子个体的位置为:
其中D是搜索空间的维度,对应于神经网络的参数个数,包括权值和阈值,假设搜索粒子群体的大小为n,i∈{1,2,...,n}。
根据神经网络的预测性能评价搜索粒子的适应度f(Xi),采用损失函数Loss的倒数作为适应度函数,表示为:
其中,Loss|Xi为神经网络参数为Xi时的损失函数。
在许多优化算法中,梯度信息常被用来指导搜索方向。在增强自适应增强自适应粒子群优化算法中,引入梯度信息来指导搜索粒子的搜索方向。
设神经网络的误差为E,参数xij的梯度可以通过链式法则计算得到:
然后,在每一次迭代中,跟踪粒子将根据以下公式更新他们的位置:
其中,Xbest是最佳解的位置,即具有最高适应度的位置,是一个介于[-1,1]之间的随机数,η是学习率,控制了参数更新的步长。
传统的优化算法通常设定固定的学习率,但是这种方法并不总是最优的。随着训练过程的进行,较大的学习率可能会导致震荡,而较小的学习率又可能使训练速度过慢。因此,一个动态调整的学习率可能会在训练过程中表现得更好。
本发明设定一个动态调整的学习率:首先设定一个初始的学习率η0,并在每个训练周期结束后根据以下公式来调整学习率:
其中,t是训练周期的数量,λ是衰减系数,控制学习率降低的速度。
这种方法的优点在于可以在训练初期提供较大的学习率以快速逼近全局最优,然后随着训练的进行逐渐降低学习率,使得训练更加稳定,避免了过度震荡。
此外,继续对所述增强自适应粒子群优化算法引入一个自适应步长调整策略,使得搜索过程可以更快地收敛到最优解。具体的,如果在连续的P次迭代中,搜索粒子个体的适应度没有显著改善,则将减小其搜索步长:
其中,δ∈(0,1)是步长减小的比例。
步骤五:构建预测模型。
特征提取完成后,将特征提取后的特征输入到预测模型中。本发明提出一种改进型随机森林预测算法,将样本权重以及自适应优化策略引入到随机森林中,提高了预测准确性。
基本的随机森林模型训练过程如下:
1)对特征提取后样本集进行自助采样,生成训练集。
2)对训练集使用决策树算法进行训练,得到一棵树。每个节点分裂的特征从所有特征中随机选取。
3)重复步骤1、2,生成多棵树,构成森林。
4)对新样本进行预测时,每棵树进行预测,然后通过投票决定最后的预测结果。
改进的改进型随机森林算法则在此基础上进行改进。
对于采样权重的改进,引入样本权重。初始情况下,所有样本的权重均等。在每一轮迭代中,被正确预测的样本权重降低,错误预测的样本权重提高。这样可以让模型更加关注难以预测的样本。
对于自适应优化的改进,在训练过程中,不断调整每棵树的权重。对预测准确率高的树赋予较高的权重,预测准确率低的树赋予较低的权重。在预测阶段,每棵树的投票根据它们的权重进行加权,从而得到最终的预测结果。
具体地,对改进型随机森林的构建过程中的改进进行详细介绍。
对于样本权重的调整:设样本集D中第i个样本的权重为wi,初始时,wi=1/n,n为样本总数;
在每一轮迭代中,对于被正确预测的样本,其权重将乘以一个衰减因子0<β<1:
上式建立在样本被正确预测的情况下。对于被错误预测的样本,权重保持不变。
对于决策树权重的调整:设决策树T在训练集上的预测准确率为acc(T),那么T的权重weight(T)为:
这是因为预测准确率更高的树应当在最终的投票中有更大的影响力。同时,为了避免过拟合,这里采用平方形式,有更强的惩罚作用。这意味着只有那些预测准确率非常高的树才能获得较大的权重。
最后,预测新样本的标签,对于给定样本x,计算其在每棵树上的预测结果T(x),并以树的权重进行加权,取加权结果最大的类别作为最终预测结果:
其中,arg代表数学计算中复数的辅角,max代表数学计算中取最大值,Forest代表所有决策树的集和,Ra(⋅)为指示函数,当括号内条件成立时取值为1,否则为0。
改进型随机森林算法在处理车站结构变形预测问题时,通过自适应地调整样本权重,让模型更加关注难以预测的样本,从而提高预测精度。通过在预测阶段引入决策树的权重,增大了预测准确率高的决策树的影响力,降低了预测准确率低的决策树的影响力,进一步提高了预测准确性。
步骤六:使用预测模型进行待预测PBA车站钢管柱结构变形预测。
本步骤中,在获取待预测PBA车站钢管柱应变监测数据后,与构建预测模型一样,需先将数据预处理并特征提取转换为机器模型能够识别和调用的特征向量。
具体包括:
(1)获取待预测PBA车站钢管柱应变监测数据;
(2)对获取的应变监测数据进行向量化处理,得到能够用于机器模型使用的特征;
(3)将向量化处理后的应变监测数据进行数据预处理;
(4)采用全连接神经网络对预处理后的应变监测数据进行特征提取,得到数据的特征向量;
(5)将特征提取后数据的特征向量输入预测模型,进行待预测PBA车站钢管柱结构变形预测。
本发明还提供一种基于机器学习的PBA车站钢管柱结构变形预测系统,该系统用于执行前述的预测方法。该系统可以利用各种方式来实现,包括软件、硬件、固件或其任意组合。系统中的一个或多个单元可以使用软件和/或固件来实现,例如存储在存储介质上的机器可执行指令。除了机器可执行指令之外或者作为替代,部分或者全部单元可以至少部分地由一个或多个硬件逻辑组件来实现。本发明对此不作特别限制。
虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本发明的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (8)
1.一种PBA车站钢管柱结构变形预测方法,其特征在于包括:
步骤一:收集历史PBA车站钢管柱应变监测数据,得到历史车站数据集;
步骤二:对所述历史车站数据集进行向量化处理,得到能够用于机器模型使用的特征;
步骤三:将向量化处理后的历史车站数据集进行数据预处理;
步骤四:采用全连接神经网络对预处理后的历史车站数据集进行特征提取,得到数据的特征向量;包括:
所述全连接神经网络为多层前馈神经网络,该网络有d个输入神经元、q个隐层单元和L个输出单元,隐含层第h个神经元的阈值为γh,输出层第j个神经元的阈值为θj,输入层第i个神经元与隐含层第h个神经元的连接权重为vih,隐含层第h个神经元与输出层第j个神经元的连接权重为whj;
隐含层使用ReLU激活函数,表示如下:
;
输出层使用Softmax函数,表示如下:
;
其中v为d×q大小的权值矩阵,x为d×1大小的样本输入向量,γ为q×1大小的阈值向量;w是q×1大小的权值矩阵,B为f1( )函数的输出,大小为q×1,θ为1×1大小的阈值向量;
网络前向传播输出表示如下:
;
其中y为样本对应的标签向量,大小为1×I,I表示维度;
采用交叉熵计算损失函数,公式如下:
;
其中,Y1表示第1个样本的标签,正类为1,负类为0;同理,Yi表示第i个样本的标签,YNall表示第Nall个样本的标签,p1表示第1个样本预测为正类的概率,pi表示第i个样本预测为正类的概率,pNall表示第Nall个样本预测为正类的概率;
步骤五:基于特征提取后数据的特征向量,采用改进型随机森林预测算法进行模型训练,构建预测模型;包括:
将样本权重以及自适应优化策略引入到随机森林中,具体的:
对于样本权重的调整:设样本集D中第i个样本的权重为wi,初始时,wi=1/n,n为样本总数;
在每一轮迭代中,对于被正确预测的样本,其权重将乘以一个衰减因子0<β<1:
;
对于被错误预测的样本,权重保持不变;
对于决策树权重的调整:设决策树T在训练集上的预测准确率为acc(T),那么T的权重weight(T)为:
;
最后,预测新样本的标签,对于给定样本x,计算其在每棵树上的预测结果T(x),并以树的权重进行加权,取加权结果最大的类别作为最终预测结果:
;
其中,arg代表计算中复数的辅角,max代表计算中取最大值,Forest代表所有决策树的集和,Ra(⋅)为指示函数,当括号内条件成立时取值为1,否则为0;
步骤六:使用预测模型进行待预测PBA车站钢管柱结构变形预测。
2.根据权利要求1所述的预测方法,其特征在于,步骤二中,所述向量化处理包括:
将历史车站数据集中的文本特征进行向量化处理,并将向量化后的特征与其中的非文本特征组合。
3.根据权利要求2所述的预测方法,其特征在于,所述将历史车站数据集中的文本特征进行向量化处理包括:
对收集到的历史车站数据集中的文本特征,使用TF-IDF向量化方法进行向量化处理,其中:
TF公式表示如下:
;
其中,ni,j表示词条ti在历史车站数据集dj中出现的次数,nk,j表示第k个词条在历史车站数据集dj中出现的次数,k的取值范围为[1,Ku],Ku为需要统计的词语的总数,TFi,j表示词条ti在历史车站数据集dj中出现的频率;
对于某一特定词语的IDFi,由样本的总数除以包含该词语的样本的数目的商取对数得到:
;
其中,IDFi即词条ti的逆文本频率指数,表示关键词的普遍程度,|n+m|表示所有样本的数量,|j:ti∈dj|表示包含词条ti的样本数量;
因此,TF-IDF表达为:
;
其中,TF_IDFi为用于评估一字词对于一个历史车站数据集或一个语料库中的其中一个样本的重要程度系数;
通过计算TF-IDF系数,将文本特征转化为向量,公式如下:
;
其中,Xvec为向量化后的特征,Xall为所有数据,TI表示TF-IDF计算。
4.根据权利要求1所述的预测方法,其特征在于,步骤三中,所述将向量化处理后的历史车站数据集进行数据预处理包括:
(1)缺失值的处理,对所述历史车站数据集中丢失的车站数据根据数据的重要性采取不同的措施,包括插值、删除;
(2)异常数据的处理,对所述历史车站数据集中不合理的车站数据进行删除操作;
(3)数据的归一化,对所述历史车站数据集中车站数据不同的数值范围和取值范围进行归一化操作,具体采用极差标准化方法对数据进行归一化:
;
其中,xmin、xmax分别表示整体数据样本中的最小值和最大值,xin表示输入的车站数据,xout表示归一化后的车站数据。
5.根据权利要求1所述的预测方法,其特征在于,继续采用增强自适应粒子群优化算法进行神经网络的参数优化;
设搜索粒子个体的位置为:
;
其中D是搜索空间的维度,对应于神经网络的参数个数,包括权值和阈值,假设搜索粒子群体的大小为n,i∈{1,2,...,n};
根据神经网络的预测性能评价搜索粒子的适应度f(Xi),采用损失函数Loss的倒数作为适应度函数,表示为:
;
其中,Loss|Xi为神经网络参数为Xi时的损失函数;
引入梯度信息来指导搜索粒子的搜索方向;设神经网络的误差为E,参数xij的梯度通过链式法则计算得到:
;
然后,在每一次迭代中,跟踪粒子将根据以下公式更新他们的位置:
;
其中,Xbest是最佳解的位置,即具有最高适应度的位置,ϕij是一个介于[-1,1]之间的随机数,η是学习率,控制了参数更新的步长;
设定一个动态调整的学习率:首先设定一个初始的学习率η0,并在每个训练周期结束后根据以下公式来调整学习率:
;
其中,t是训练周期的数量,λ是衰减系数,控制学习率降低的速度。
6.根据权利要求5所述的预测方法,其特征在于,继续对所述增强自适应粒子群优化算法引入一个自适应步长调整策略:
如果在连续的P次迭代中,搜索粒子个体的适应度没有显著改善,则将减小其搜索步长ϕij:
;
其中,δ∈(0,1)是步长减小的比例。
7.根据权利要求1所述的预测方法,其特征在于,步骤六中,所述使用预测模型进行待预测PBA车站钢管柱结构变形预测包括:
获取待预测PBA车站钢管柱应变监测数据;
对获取的应变监测数据进行向量化处理,得到能够用于机器模型使用的特征;
将向量化处理后的应变监测数据进行数据预处理;
采用全连接神经网络对预处理后的应变监测数据进行特征提取,得到数据的特征向量;
将特征提取后数据的特征向量输入预测模型,进行待预测PBA车站钢管柱结构变形预测。
8.一种PBA车站钢管柱结构变形预测系统,其特征在于,该系统用于执行如权利要求1至7任一项所述的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311278359.0A CN117010283B (zh) | 2023-10-07 | 2023-10-07 | Pba车站钢管柱结构变形预测方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311278359.0A CN117010283B (zh) | 2023-10-07 | 2023-10-07 | Pba车站钢管柱结构变形预测方法、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117010283A CN117010283A (zh) | 2023-11-07 |
CN117010283B true CN117010283B (zh) | 2023-12-29 |
Family
ID=88567549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311278359.0A Active CN117010283B (zh) | 2023-10-07 | 2023-10-07 | Pba车站钢管柱结构变形预测方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117010283B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000240152A (ja) * | 1999-02-18 | 2000-09-05 | Nkk Corp | 鋼管柱における柱梁接合部分の耐力を求める方法 |
JP2001041865A (ja) * | 1999-07-28 | 2001-02-16 | Takenaka Komuten Co Ltd | 鋼管柱梁接合部の耐力推定方法 |
CN111461457A (zh) * | 2020-04-17 | 2020-07-28 | 福州大学 | 一种基于粒子群优化bp神经网络的基坑位移预测方法 |
CN112070318A (zh) * | 2020-09-18 | 2020-12-11 | 辽宁省粮食科学研究所 | 基于改进粒子群算法的平房仓粮温bp神经网络预测方法 |
CN213274133U (zh) * | 2020-11-12 | 2021-05-25 | 中铁一局集团第二工程有限公司 | 一种地铁车站钢管桩光栅传感监测系统 |
CN113469426A (zh) * | 2021-06-23 | 2021-10-01 | 国网山东省电力公司东营供电公司 | 基于改进bp神经网络的光伏输出功率预测方法及系统 |
CN115130601A (zh) * | 2022-07-07 | 2022-09-30 | 上海交通大学 | 基于多维特征融合的二阶段学术数据网页分类方法及系统 |
CN116526473A (zh) * | 2023-05-24 | 2023-08-01 | 天津大学 | 基于粒子群优化lstm的电热负荷预测方法 |
CN116611576A (zh) * | 2023-06-06 | 2023-08-18 | 中国科学院空天信息创新研究院 | 碳排量预测方法及装置 |
-
2023
- 2023-10-07 CN CN202311278359.0A patent/CN117010283B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000240152A (ja) * | 1999-02-18 | 2000-09-05 | Nkk Corp | 鋼管柱における柱梁接合部分の耐力を求める方法 |
JP2001041865A (ja) * | 1999-07-28 | 2001-02-16 | Takenaka Komuten Co Ltd | 鋼管柱梁接合部の耐力推定方法 |
CN111461457A (zh) * | 2020-04-17 | 2020-07-28 | 福州大学 | 一种基于粒子群优化bp神经网络的基坑位移预测方法 |
CN112070318A (zh) * | 2020-09-18 | 2020-12-11 | 辽宁省粮食科学研究所 | 基于改进粒子群算法的平房仓粮温bp神经网络预测方法 |
CN213274133U (zh) * | 2020-11-12 | 2021-05-25 | 中铁一局集团第二工程有限公司 | 一种地铁车站钢管桩光栅传感监测系统 |
CN113469426A (zh) * | 2021-06-23 | 2021-10-01 | 国网山东省电力公司东营供电公司 | 基于改进bp神经网络的光伏输出功率预测方法及系统 |
CN115130601A (zh) * | 2022-07-07 | 2022-09-30 | 上海交通大学 | 基于多维特征融合的二阶段学术数据网页分类方法及系统 |
CN116526473A (zh) * | 2023-05-24 | 2023-08-01 | 天津大学 | 基于粒子群优化lstm的电热负荷预测方法 |
CN116611576A (zh) * | 2023-06-06 | 2023-08-18 | 中国科学院空天信息创新研究院 | 碳排量预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117010283A (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150134578A1 (en) | Discriminator, discrimination program, and discrimination method | |
CN108346293B (zh) | 一种实时交通流短时预测方法 | |
CN109101584B (zh) | 一种将深度学习与数学分析相结合的句子分类改进方法 | |
CN110458181A (zh) | 一种基于宽度随机森林的句法依存模型、训练方法和分析方法 | |
Otero et al. | Handling continuous attributes in ant colony classification algorithms | |
CN113378990B (zh) | 基于深度学习的流量数据异常检测方法 | |
CN103105246A (zh) | 一种基于遗传算法改进的bp神经网络的温室环境预测反馈方法 | |
CN102609612B (zh) | 一种用于多参数仪表检定的数据融合方法 | |
CN111625516A (zh) | 检测数据状态的方法、装置、计算机设备和存储介质 | |
CN113554148A (zh) | 一种基于贝叶斯优化的BiLSTM电压偏差预测方法 | |
CN107798426A (zh) | 基于原子分解和交互式模糊满意度的风功率区间预测方法 | |
CN109191276A (zh) | 一种基于强化学习的p2p网络借贷机构风险评估方法 | |
CN108961460B (zh) | 基于稀疏esgp与多目标优化的故障预测方法及装置 | |
CN114969953A (zh) | 基于CatBoost-NSGA-Ⅲ的盾构下穿隧道优化设计方法及设备 | |
CN115238850A (zh) | 一种基于mi-gra与改进pso-lstm的山区边坡位移预测方法 | |
CN104732067A (zh) | 一种面向流程对象的工业过程建模预测方法 | |
CN111507365A (zh) | 一种基于模糊聚类的置信规则自动生成方法 | |
Tembusai et al. | K-nearest neighbor with K-fold cross validation and analytic hierarchy process on data classification | |
CN115221793A (zh) | 一种隧道围岩变形预测方法及装置 | |
CN116933946A (zh) | 一种基于客流去向结构的轨道交通od客流预测方法及系统 | |
CN111932091A (zh) | 一种基于梯度生存提升树的生存分析风险函数预测方法 | |
CN116341621A (zh) | 面向焊缝缺陷超声检测的低成本自学习神经网络设计方法 | |
Illahi et al. | Neural network modeling for fuel consumption base on least computational cost parameters | |
CN113868765A (zh) | 基于近似模型的船舶主尺度参数优化方法 | |
CN117010283B (zh) | Pba车站钢管柱结构变形预测方法、系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |