CN116434893B - 混凝土抗压强度预测模型、构建方法、介质、电子设备 - Google Patents
混凝土抗压强度预测模型、构建方法、介质、电子设备 Download PDFInfo
- Publication number
- CN116434893B CN116434893B CN202310685402.9A CN202310685402A CN116434893B CN 116434893 B CN116434893 B CN 116434893B CN 202310685402 A CN202310685402 A CN 202310685402A CN 116434893 B CN116434893 B CN 116434893B
- Authority
- CN
- China
- Prior art keywords
- layer
- compressive strength
- concrete
- learner
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 9
- 230000003247 decreasing effect Effects 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 60
- 238000004422 calculation algorithm Methods 0.000 claims description 57
- 238000012360 testing method Methods 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 34
- 238000011156 evaluation Methods 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 9
- 238000002790 cross-validation Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 claims 1
- 238000007906 compression Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 description 11
- 238000003066 decision tree Methods 0.000 description 8
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/13—Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Medical Informatics (AREA)
- Mathematical Analysis (AREA)
- Civil Engineering (AREA)
- Structural Engineering (AREA)
- Architecture (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种混凝土抗压强度预测模型、构建方法、介质、电子设备,预测模型包括依次连接的混凝土原始特征数据输入层、多层基学习器层以及一层元学习器层;所述每一基学习器层均包括一特征输入层、多个并联的基学习器以及一输出层,每一基学习器一端与特征输入层连接,另一端与输出层连接;每一基学习器层的输出层均与混凝土原始特征数据输入层连接;依次连接的多层基学习器层中的基学习器数依次递减。本发明通过设置多层基学习器层,依次连接的多层基学习器层中的基学习器数依次递减,并且结合了特征重建方式,避免了两层式Stacking策略模型的泛化能力低,且容易出现过拟合的问题,从而实现对混凝土抗压强度更好的预测。
Description
技术领域
本发明属于混凝土抗压强度预测技术领域,具体涉及一种混凝土抗压强度预测模型、构建方法、介质、电子设备。
背景技术
混凝土抗压强度(Concrete Compressive Strength,CCS)对于建筑物的结构安全与耐久性至关重要,建筑物中的混凝土结构承受着来自风力、荷载等各种力的作用,而建筑物的使用年限通常为十几年甚至上百年,因此混凝土抗压强度决定着建筑物的结构安全与耐久性。在早期快速而准确地评估混凝土抗压强度具有重要的工程价值。由于混凝土成分的复杂性,若配置人员缺乏经验,存在数据可靠性差等缺陷。
近年来基于Stacking策略模型进行预测成为研究热点,例如申请号为CN202210798033.X的中国发明专利,其公开了一种基于Stacking的灌浆量集成代理预测模型,包括集成代理模型,该集成代理模型设有两层,第一层包括采用五折交叉验证方法进行训练和验证的三个基学习器,第二层包括一个元学习器;三个基学习器分别为SVR神经网络、BPNN神经网络和RF模型;元学习器为ANFIS神经网络;元学习器的训练集中的训练数据包括三个基学习器的预测结果数据。该发明还公开了一种基于Stacking的灌浆量集成代理预测模型的预测方法。该发明能够增加模型多样性、减少过拟合和预测不确定性,产生更准确、更稳健的预测结果。又例如申请号为CN202211294294.4的中国发明专利,公开了一种基于Stacking算法的碳排放预测模型的构建和预测方法及介质,步骤如下:获取电力数据以及对应的碳排放数据样本,形成数据集;预处理数据集,将数据集划分为训练集和测试集;使用XGBoost算法分析影响碳排放的特征,得到目标特征;构建碳排放预测模型,碳排放预测模型包括元模型和多个基模型;使用Stacking算法将元模型和多个基模型融合,基于训练集和目标特征对模型进行训练;根据各基模型输出的碳排放预测结果误差占比,调整各基模型输入到元模型的预测结果权重分配,得到优化的碳排放预测模型。该发明通过选用差异度最大的多个算法模型作为Stacking集成模型的基模型,同时根据预测的误差占比进行权重分配,充分利用不同算法的优点,提高预测的精确度。
可见,基于Stacking策略模型进行预测已被广泛应用,因此将Stacking策略模型应用于混凝土抗压强度预测也成为可能,但目前两层式的Stacking策略模型的泛化能力仍然较低,容易出现过拟合的问题。
发明内容
针对现有技术中存在的上述问题,本发明提供一种混凝土抗压强度预测模型、构建方法、介质、电子设备,通过设置多层基学习器层,依次连接的多层基学习器层中的基学习器数依次递减,并且结合了特征重建方式,避免了两层式Stacking策略模型的泛化能力低,且容易出现过拟合的问题。
本发明采用以下技术方案:
本发明实施例第一方面提供一种混凝土抗压强度预测模型,包括依次连接的混凝土原始特征数据输入层、多层基学习器层以及一层元学习器层;所述每一基学习器层均包括一特征输入层、多个并联的基学习器以及一输出层,每一基学习器一端与特征输入层连接,另一端与输出层连接;每一基学习器层的输出层均与混凝土原始特征数据输入层连接;依次连接的多层基学习器层中的基学习器数依次递减;
原始特征数据输入层,用于输入混凝土样本的原始特征数据集;
多层基学习器层,用于分别对输入其的特征数据集进行特征提取,以得到多次数据降维后的降维后特征数据集,且除第一层基学习器层输入的特征数据集为原始特征数据集以外,其余各层基学习器层输入的特征数据集均为上一基学习器层提取得到的特征数据集和原始特征数据集组合得到的重构特征数据集;
元学习器层,基于降维后特征数据集与原始特征数据集组合得到的最终特征数据集,预测输出混凝土抗压强度预测结果。
作为优选方案,每一基学习器层中,各基学习器采用的算法均不相同。
作为优选方案,元学习器采用GBDT算法、XGBoost算法、LightGBM算法、Catboost算法中的任一种。
本发明实施例第二方面提供一种混凝土抗压强度预测模型的构建方法,包括步骤:
S1、获取包括多个混凝土抗压强度数据样本的混凝土抗压强度数据集,并将其分成训练集和测试集;
S2、建立如实施例第一方面所述的混凝土抗压强度预测模型;
S3、基于训练集对预测模型进行训练,以得到训练后预测模型;
S4、基于测试集计算得到训练后预测模型的准确度评价指标;
S5、循环执行步骤S2~步骤S4,且依次增加每次循环过程中步骤S2中建立的混凝土抗压强度预测模型中的基学习器层层数,以得到多次循环过程中训练后预测模型对应的准确度评价指标;
S6、根据多次循环过程中训练后预测模型对应的准确度评价指标,确定最终构建的混凝土抗压强度预测模型。
作为优选方案,准确度评价指标包括平均绝对误差指标、均方根误差指标、平均绝对百分比误差指标、决定系数指标中的至少一种;
平均绝对误差指标的计算公式为:
,
均方根误差指标的计算公式为:
,
平均绝对百分比误差指标的计算公式为:
,
决定系数指标的计算公式为:
,
其中,表示测试集中混凝土抗压强度数据样本数,/>表示第/>个样本的混凝土抗压强度真实值,/>表示第/>个样本的混凝土抗压强度预测值,/>表示测试集中所有样本的混凝土平均抗压强度真实值。
作为优选方案,准确度评价指标包括贝叶斯信息准则指标,贝叶斯信息准则指标的计算公式为:
,
其中,表示预测模型针对第/>个样本的概率密度函数,/>表示预测模型中基学习器层层数,/>表示测试集中混凝土抗压强度数据样本数;
,
其中,表示预测模型的参数,/>表示在输入参数/>和第/>个样本/>的条件下预测输出/>的概率密度函数,/>表示第/>个样本的混凝土抗压强度真实值。
作为优选方案,步骤S3中,采用K折交叉验证法对预测模型进行训练,以得到训练后预测模型。
作为优选方案,混凝土抗压强度数据样本包括混凝土龄期、各混凝土成分含量以及混凝土真实抗压强度数据。
本发明实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本发明实施例第二方面及第二方面任一项所述的一种混凝土抗压强度预测模型的构建方法。
本发明实施例第四方面提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如本发明实施例第二方面及第二方面任一项所述的一种混凝土抗压强度预测模型的构建方法。
本发明的有益效果是:
本发明通过stacking模型对混凝土抗压强度数据集进行预测,由于混凝土预测问题是一个典型的多特征非线性的问题,其特征较为复杂,因此本发明所述预测模型进行多层次特征提取,采用较多层次基学习器层。又因为经过多层次提取之后原始数据特征很容易造成过拟合,因此本发明同时利用特征重构减少混凝土抗压强度数据集提取过程中的过拟合问题。而且为了避免对混凝土抗压强度数据特征提取趋于扩散,基学习器数量依次递减。从而实现对混凝土抗压强度更好的预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是传统Stacking模型的结构示意图。
图2是根据本发明实施例的一种混凝土抗压强度预测模型的结构示意图。
图3是根据本发明实施例的一种混凝土抗压强度预测模型的构建方法的流程图。
图4是未重构特征的2层次Stacking策略模型分别在训练集与测试集上进行预测的预测值和真实值的散点图。
图5是重构特征的2层次Stacking策略模型分别在训练集与测试集上进行预测的预测值和真实值的散点图。
图6是未重构特征的3层次Stacking策略模型分别在训练集与测试集上进行预测的预测值和真实值的散点图。
图7是重构特征的3层次Stacking策略模型分别在训练集与测试集上进行预测的预测值和真实值的散点图。
图8是未重构特征的4层次Stacking策略模型分别在训练集与测试集上进行预测的预测值和真实值的散点图。
图9是重构特征的4层次Stacking策略模型分别在训练集与测试集上进行预测的预测值和真实值的散点图。
图10是未重构特征的5层次Stacking策略模型分别在训练集与测试集上进行预测的预测值和真实值的散点图。
图11是重构特征的5层次Stacking策略模型分别在训练集与测试集上进行预测的预测值和真实值的散点图。
图12是不同层次重构特征的Stacking策略模型对比传统Stacking策略模型,其RMSE差值的变化趋势图。
图13是K折交叉验证训练中各数据集的分布图。
图14是根据本发明实施例提供的计算机可读存储介质的结构示意图。
图15是根据本发明实施例提供的电子设备的结构示意图。
具体实施方式
以下通过特定的具体实施例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
实施例一:
Stacking思想由David Wolpert提出,在1996年Breiman根据此思想提出了Stacking集成策略。Stacking是一种将多个基学习器(Base Learner)的预测结果作为新特征,然后使用另一个模型(Mata Learner)来对新特征进行训练和预测,以此获得更好的预测性能。传统Stacking模型的结构示意图,可参照图1所示。
其基本原理为:
假设数据集为,其中/>表示第/>个样本的特征,/>表示第/>个样本的标签值。设基学习器个数为/>,其中每个基学习器一般为不同模型或不同特征子集。设/>表示第/>个基学习器的预测值,/>为第/>个基学习器的预测函数,有公式:
对于每个样本,将/>个基学习器的预测结果组合,使得成为一个新特征向量/>,有公式:
用表示新的特征的集合,有公式:
使用新特征集合训练一个高层次的模型,即公式:
其中,为高层次模型,/>表示模型参数。
最后,用训练之后的模型对测试集进行预测。
本实施例提供一种混凝土抗压强度预测模型,参照图2所示,包括依次连接的混凝土原始特征数据输入层、多层基学习器层以及一层元学习器层;所述每一基学习器层均包括一特征输入层、多个并联的基学习器以及一输出层,每一基学习器一端与特征输入层连接,另一端与输出层连接;每一基学习器层的输出层均与混凝土原始特征数据输入层连接;依次连接的多层基学习器层中的基学习器数依次递减;
原始特征数据输入层,用于输入混凝土样本的原始特征数据集;
多层基学习器层,用于分别对输入其的特征数据集进行特征提取,以得到多次数据降维后的降维后特征数据集,且除第一层基学习器层输入的特征数据集为原始特征数据集以外,其余各层基学习器层输入的特征数据集均为上一基学习器层提取得到的特征数据集和原始特征数据集组合得到的重构特征数据集;
元学习器层,基于降维后特征数据集与原始特征数据集组合得到的最终特征数据集,预测输出混凝土抗压强度预测结果。
本发明通过stacking模型对混凝土抗压强度数据集进行预测,由于混凝土预测问题是一个典型的多特征非线性的问题,其特征较为复杂,因此本发明所述预测模型进行多层次特征提取,采用较多层次基学习器层。又因为经过多层次提取之后原始数据特征很容易造成过拟合,因此本发明同时利用特征重构减少混凝土抗压强度数据集提取过程中的过拟合问题。而且为了避免对混凝土抗压强度数据特征提取趋于扩散,基学习器数量依次递减。从而实现对混凝土抗压强度更好的预测。
具体地:
本实施例中,依次连接的多层基学习器层中的基学习器数依次递减一个。
本实施例中,每一基学习器层中,各基学习器采用的算法均不相同。
基学习器层所采用的算法可从DecisionTree(DT)、Random Forest(RF)、AdaBoost、GBDT 、catvoost、XGBoost、LightGBM、DeepForest、SVR等算法。因为元学习器需要整合基学习器层提取的特征,因此元学习器可选择GBDT、XGBoostLig htGBM、Catboost等整合性更高的算法。
本实施例中所述预测模型的预测效果在实施例二中进行详细说明。
实施例二:
参照图3所示,本实施例提供一种混凝土抗压强度预测模型的构建方法,包括步骤:
S1、获取包括多个混凝土抗压强度数据样本的混凝土抗压强度数据集,并将其分成训练集和测试集;
S2、建立如上述实施例一中所述的混凝土抗压强度预测模型;
S3、基于训练集对预测模型进行训练,以得到训练后预测模型;
S4、基于测试集计算得到训练后预测模型的准确度评价指标;
S5、循环执行步骤S2~步骤S4,且依次增加每次循环过程中步骤S2中建立的混凝土抗压强度预测模型中的基学习器层层数,以得到多次循环过程中训练后预测模型对应的准确度评价指标;
S6、根据多次循环过程中训练后预测模型对应的准确度评价指标,确定最终构建的混凝土抗压强度预测模型。
具体地:
准确度评价指标包括平均绝对误差指标、均方根误差指标、平均绝对百分比误差指标、决定系数指标中的至少一种;
平均绝对误差指标的计算公式为:
,
均方根误差指标的计算公式为:
,
平均绝对百分比误差指标的计算公式为:
,
决定系数指标的计算公式为:
,
其中,表示测试集中混凝土抗压强度数据样本数,/>表示第/>个样本的混凝土抗压强度真实值,/>表示第/>个样本的混凝土抗压强度预测值,/>表示测试集中所有样本的混凝土平均抗压强度真实值。
以下通过具体的实验数据,以说明本发明所述结构的预测模型的预测效果、以及说明不同基学习器层层数的预测模型的预测效果:
针对2层基学习器层的Stacking策略模型,其策略评价指标表如下表1所示:
表1 2层基学习器层的Stacking策略模型策略评价指标表
其中第一层基学习器层包括两个基学习器,分别采用SVR算法、GBDT算法,元学习器采用GBDT算法。
并将未重构特征与重构特征(即上述的特征重建)的2层次Stacking策略模型分别在各自训练集与测试集上进行预测,将抗压强度真实值作为横坐标,预测结果作为纵坐标,绘制真实值与预测值的散点图,结果如图4、图5所示。
针对3层基学习器层的Stacking策略模型,其策略评价指标表如下表2所示:
表2 3层基学习器层的Stacking策略模型策略评价指标表
其中第一层基学习器层包括三个基学习器,分别采用SVR算法、DT算法、GBDT算法,第二层基学习器层包括二个基学习器,分别采用SVR算法、GBDT算法,元学习器采用GBDT算法。
并将未重构特征与重构特征的3层次Stacking策略模型分别在各自训练集与测试集上进行预测,将抗压强度真实值作为横坐标,预测结果作为纵坐标,绘制真实值与预测值的散点图,结果如图6、图7所示。
针对4层基学习器层的Stacking策略模型,其策略评价指标表如下表3所示:
表3 4层基学习器层的Stacking策略模型策略评价指标表
其中第一层基学习器层包括四个基学习器,分别采用SVR算法、DT算法、GBDT算法、NN算法,第二层基学习器层包括三个基学习器,分别采用SVR算法、DT算法、GBDT算法,第二层基学习器层包括二个基学习器,分别采用SVR算法、GBDT算法,元学习器采用GBDT算法。
并将未重构特征与重构特征的4层次Stacking策略模型分别在各自训练集与测试集上进行预测,将抗压强度真实值作为横坐标,预测结果作为纵坐标,绘制真实值与预测值的散点图,结果如图8、图9所示。
针对5层基学习器层的Stacking策略模型,其策略评价指标表如下表4所示:
表4 5层基学习器层的Stacking策略模型策略评价指标表
其中第一层基学习器层包括五个基学习器,分别采用SVR算法、DT算法、GBDT算法、NN算法、GBDT算法,第二层基学习器层包括四个基学习器,分别采用SVR算法、DT算法、GBDT算法、NN算法,第三层基学习器层包括三个基学习器,分别采用SVR算法、DT算法、GBDT算法,第四层基学习器层包括二个基学习器,分别采用SVR算法、GBDT算法,元学习器采用GBDT算法。
并将未重构特征与重构特征的5层次Stacking策略模型分别在各自训练集与测试集上进行预测,将抗压强度真实值作为横坐标,预测结果作为纵坐标,绘制真实值与预测值的散点图,结果如图10、图11所示。
对比表1、表2、表3、表4可知,综合考虑所有评价指标,对于测试集两种Stacking策略模型均在第三层取得了较好效果,这说明层次的增加有利于模型对于特征的提取。
参照图12所示,图中示出了重构特征的Stacking策略模型对比传统Stacking策略模型,无论是在测试集还是训练集,其RMSE差值有随层次增加而增加的趋势,这说明层次越多,重构特征的Stacking策略模型对过拟合的改善越明显。
通过比对图4至图11,可知对于传统Stacking策略模型,随着层次的增加,在训练集上的表现有逐渐加强的趋势,而在测试集上的表现有逐渐减弱的趋势,反观重构特征的Stacking策略模型,随着模型层次的增加,在训练集上预测效果越发“发散”,这也验证了重构特征对于过拟合风险有减缓效果。
综上,在本混凝土抗压强度数据集上,效果较好的为重构特征的3层次Stacking策略模型,其中该模型对于测试集决定系数达到了0.9601,平均绝对百分比误差更是小于7.0210%,平均绝对误差与均方根误差分别为2.1413与3.1221,这表明多层次Stacking策略模型对于该数据集有较好拟合能力。同时也说明不同数据集,针对性的设计不同层次的Stacking策略模型能取得比传统Stacking更好的性能,在本文混凝土抗压强度数据集上的效果也证明了多层次Stacking模型的强大拓展能力。
需要说明的是,若混凝土数据集中考虑的参数不同,预测模型中基学习器层的最佳层数将改变,因此针对不同混凝土抗压强度数据集,均需要重新进行预测模型的构建,以构建针对相应混凝土抗压强度数据集预测效果最佳的预测模型。
本实施例中,混凝土抗压强度数据样本包括混凝土龄期、各混凝土成分含量以及混凝土真实抗压强度数据,参照下表5所示:
表5 混凝土参数表
更进一步的,准确度评价指标包括贝叶斯信息准则指标,BIC(贝叶斯信息准则)是一种模型选择方法,它通过平衡模型的复杂度和拟合数据的能力来选择最佳模型。因此在确定模型中基学习器层层数时,引入该指标可得到拟合效果更好的、预测准确度更高的预测模型。
贝叶斯信息准则指标的计算公式为:
其中,表示预测模型针对第/>个样本的概率密度函数,是描述模型与数据之间的关系的概率函数,它表示给定一组参数和一组数据的情况下,数据出现的概率。对于给定的数据集,我们希望找到一个参数设置,使得在该参数设置下,数据集出现的概率最大化。这个过程通常被称为最大似然估计。/>表示预测模型中基学习器层层数,/>表示测试集中混凝土抗压强度数据样本数。
,
其中,表示预测模型的参数,/>表示在输入参数/>和第/>个样本/>的条件下预测输出/>的概率密度函数,/>表示第/>个样本的混凝土抗压强度真实值。
本实施例中,基于重构特征的多层次Stacking策略模型的训练过程,伪代码如下所示:
输入:训练集,/>
一层基学习器算法;
二层基学习器算法;
……
N层基学习器算法;
元学习器层算法.
步骤1:对训练集进行K折划分,并训练n层基学习器,生成特征集/>
for
for
for
end for
for do
end for
end for
for
end for
end for
步骤2:训练元学习器层
输出:
其中,第N层基学习器层中基学习器个数为,第/>层中每个基学习器模型分别为,元学习器模型为/>,数据集为/>,并按照需求的比例划分为训练集/>与测试集/>,训练集样本数为/>,每个因变量维度为/>,并且/>为利用/>训练第/>个基学习器得到的输出特征,/>表示训练集除去第/>折之后的训练集样本,/>表示第/>个算法/>在/>上的训练算法模型,/>表示/>对/>中/>的预测值,/>为重构后的数据特征。
对于训练集,将其随机拆分为/>折数据集,每一折数据集中样本数量大致相同,并保证/>,且/>。在训练时,每次轮流取其中一折训练集作为验证集,其他训练集用于训练,则在训练集上的预测结果为每折训练集作为验证集的预测结果集合,而测试集的预测结果为/>次模型预测结果的平均,/>折交叉验证训练中各数据集分布,可参照图13所示。
由于Stacking模型数量较多,通过折交叉验证,每次训练集中每个部分轮流作为验证集,其余部分作为该次训练的训练集,不仅可以充分训练基学习器,更能较好地评估模型的泛化性能,从而减少过拟合的风险,提升整体预测能力。/>
实施例三:
参照图14所示,本发明实施例还提供一种存储介质,其上存储有计算机程序601,该指令被处理器执行时实现上述实施例中一种混凝土抗压强度预测模型的构建方法的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述实施例二的流程。
其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(FlashMemory)、硬盘(Hard DiskDrive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
实施例四:
参照图15所示,本发明实施例还提供了一种电子设备,该电子设备可以包括处理器51和存储器52,其中处理器51和存储器52可以通过总线或者其他方式连接,图15中以通过总线连接为例。
处理器51可以为中央处理器(Central Processing Unit,CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的对应的程序指令/模块。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述实施例二中的一种混凝土抗压强度预测模型的构建方法。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储处理器51所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器52中,当被所述处理器51执行时,执行实施例二中所述的一种混凝土抗压强度预测模型的构建方法。
上述电子设备具体细节可以对应参阅实施例二中对应的相关描述和效果进行理解,此处不再赘述。
以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的保护范围内。
Claims (9)
1.一种混凝土抗压强度预测模型的构建方法,其特征在于,包括步骤:
S1、获取包括多个混凝土抗压强度数据样本的混凝土抗压强度数据集,并将其分成训练集和测试集;
S2、建立混凝土抗压强度预测模型;
S3、基于训练集对预测模型进行训练,以得到训练后预测模型;
S4、基于测试集计算得到训练后预测模型的准确度评价指标;
S5、循环执行步骤S2~步骤S4,且依次增加每次循环过程中步骤S2中建立的混凝土抗压强度预测模型中的基学习器层层数,以得到多次循环过程中训练后预测模型对应的准确度评价指标;
S6、根据多次循环过程中训练后预测模型对应的准确度评价指标,确定最终构建的混凝土抗压强度预测模型;
所述混凝土抗压强度预测模型包括依次连接的混凝土原始特征数据输入层、多层基学习器层以及一层元学习器层;所述每一基学习器层均包括一特征输入层、多个并联的基学习器以及一输出层,每一基学习器一端与特征输入层连接,另一端与输出层连接;每一基学习器层的输出层均与混凝土原始特征数据输入层连接;依次连接的多层基学习器层中的基学习器数依次递减;
原始特征数据输入层,用于输入混凝土样本的原始特征数据集;
多层基学习器层,用于分别对输入其的特征数据集进行特征提取,以得到多次数据降维后的降维后特征数据集,且除第一层基学习器层输入的特征数据集为原始特征数据集以外,其余各层基学习器层输入的特征数据集均为上一基学习器层提取得到的特征数据集和原始特征数据集组合得到的重构特征数据集;
元学习器层,基于降维后特征数据集与原始特征数据集组合得到的最终特征数据集,预测输出混凝土抗压强度预测结果。
2.根据权利要求1所述的一种混凝土抗压强度预测模型的构建方法,其特征在于,每一基学习器层中,各基学习器采用的算法均不相同。
3.根据权利要求2所述的一种混凝土抗压强度预测模型的构建方法,其特征在于,元学习器采用GBDT算法、XGBoost算法、LightGBM算法、Catboost算法中的任一种。
4.根据权利要求1所述的一种混凝土抗压强度预测模型的构建方法,其特征在于,准确度评价指标包括平均绝对误差指标、均方根误差指标、平均绝对百分比误差指标、决定系数指标中的至少一种;
平均绝对误差指标的计算公式为:
,
均方根误差指标的计算公式为:
,
平均绝对百分比误差指标的计算公式为:
,
决定系数指标的计算公式为:
,
其中,表示测试集中混凝土抗压强度数据样本数,/>表示第/>个样本的混凝土抗压强度真实值,/>表示第/>个样本的混凝土抗压强度预测值,/>表示测试集中所有样本的混凝土平均抗压强度真实值。
5.根据权利要求1所述的一种混凝土抗压强度预测模型的构建方法,其特征在于,准确度评价指标包括贝叶斯信息准则指标,贝叶斯信息准则指标的计算公式为:
,
其中,表示预测模型针对第/>个样本的概率密度函数,/>表示预测模型中基学习器层层数,/>表示测试集中混凝土抗压强度数据样本数;
,
其中,表示预测模型的参数,/>表示在输入参数/>和第/>个样本的条件下预测输出/>的概率密度函数,/>表示第/>个样本的混凝土抗压强度真实值。
6.根据权利要求1所述的一种混凝土抗压强度预测模型的构建方法,其特征在于,步骤S3中,采用K折交叉验证法对预测模型进行训练,以得到训练后预测模型。
7.根据权利要求1所述的一种混凝土抗压强度预测模型的构建方法,其特征在于,混凝土抗压强度数据样本包括混凝土龄期、各混凝土成分含量以及混凝土真实抗压强度数据。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1-7任一项所述的一种混凝土抗压强度预测模型的构建方法。
9.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1-7任一项所述的一种混凝土抗压强度预测模型的构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310685402.9A CN116434893B (zh) | 2023-06-12 | 2023-06-12 | 混凝土抗压强度预测模型、构建方法、介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310685402.9A CN116434893B (zh) | 2023-06-12 | 2023-06-12 | 混凝土抗压强度预测模型、构建方法、介质、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116434893A CN116434893A (zh) | 2023-07-14 |
CN116434893B true CN116434893B (zh) | 2023-08-29 |
Family
ID=87080041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310685402.9A Active CN116434893B (zh) | 2023-06-12 | 2023-06-12 | 混凝土抗压强度预测模型、构建方法、介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116434893B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117420011B (zh) * | 2023-12-18 | 2024-03-15 | 南京建正建设工程质量检测有限责任公司 | 一种混凝土砖块多点式抗压强度检测系统 |
CN117472789B (zh) * | 2023-12-28 | 2024-03-12 | 成都工业学院 | 基于集成学习的软件缺陷预测模型构建方法和装置 |
CN117894397B (zh) * | 2024-03-15 | 2024-05-28 | 北京科技大学 | 一种基于机器学习的连铸保护渣粘度预报方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100774301B1 (ko) * | 2007-02-13 | 2007-11-08 | 군산대학교산학협력단 | 콘크리트 압축강도의 예측방법 |
CN110334275A (zh) * | 2019-05-31 | 2019-10-15 | 北京中科闻歌科技股份有限公司 | 一种信息流行度预测方法、设备和存储介质 |
WO2021259207A1 (zh) * | 2020-06-24 | 2021-12-30 | 广州大学 | 基于stacking集成的APT组织识别方法、系统及存储介质 |
CN114331221A (zh) * | 2022-03-02 | 2022-04-12 | 中核华纬工程设计研究有限公司 | 一种基于机器学习的混凝土工程量指标估算方法 |
WO2022083140A1 (zh) * | 2020-10-22 | 2022-04-28 | 杭州未名信科科技有限公司 | 患者住院时长的预测方法、装置、电子设备及存储介质 |
CN115147155A (zh) * | 2022-07-05 | 2022-10-04 | 西南交通大学 | 一种基于集成学习的铁路货运客户流失预测方法 |
-
2023
- 2023-06-12 CN CN202310685402.9A patent/CN116434893B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100774301B1 (ko) * | 2007-02-13 | 2007-11-08 | 군산대학교산학협력단 | 콘크리트 압축강도의 예측방법 |
CN110334275A (zh) * | 2019-05-31 | 2019-10-15 | 北京中科闻歌科技股份有限公司 | 一种信息流行度预测方法、设备和存储介质 |
WO2021259207A1 (zh) * | 2020-06-24 | 2021-12-30 | 广州大学 | 基于stacking集成的APT组织识别方法、系统及存储介质 |
WO2022083140A1 (zh) * | 2020-10-22 | 2022-04-28 | 杭州未名信科科技有限公司 | 患者住院时长的预测方法、装置、电子设备及存储介质 |
CN114331221A (zh) * | 2022-03-02 | 2022-04-12 | 中核华纬工程设计研究有限公司 | 一种基于机器学习的混凝土工程量指标估算方法 |
CN115147155A (zh) * | 2022-07-05 | 2022-10-04 | 西南交通大学 | 一种基于集成学习的铁路货运客户流失预测方法 |
Non-Patent Citations (1)
Title |
---|
杨荣新 ; 孙朝云 ; 徐磊 ; .基于Stacking模型融合的光伏发电功率预测.计算机系统应用.2020,(第05期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN116434893A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116434893B (zh) | 混凝土抗压强度预测模型、构建方法、介质、电子设备 | |
US11537898B2 (en) | Generative structure-property inverse computational co-design of materials | |
CN108985335B (zh) | 核反应堆包壳材料辐照肿胀的集成学习预测方法 | |
Shi et al. | Artificial bee colony Based Bayesian Regularization Artificial Neural Network approach to model transient flammable cloud dispersion in congested area | |
CN116316591A (zh) | 基于混合双向门控循环的短期光伏功率预测方法及系统 | |
CN112766496B (zh) | 基于强化学习的深度学习模型安全性保障压缩方法与装置 | |
CN116644970A (zh) | 一种基于vmd分解和叠层深度学习的光伏功率预测方法 | |
Huang et al. | Research on transformer fault diagnosis method based on GWO optimized hybrid kernel extreme learning machine | |
Liu et al. | Evolutionary quantization of neural networks with mixed-precision | |
CN112633482A (zh) | 一种高效宽度图卷积神经网络模型及其训练方法 | |
CN112988548A (zh) | 一种基于降噪算法的改进Elman神经网络的预测方法 | |
Bao et al. | Restricted Boltzmann Machine‐Assisted Estimation of Distribution Algorithm for Complex Problems | |
US11721413B2 (en) | Method and system for performing molecular design using machine learning algorithms | |
US20210216872A1 (en) | System and method of training a neural network | |
KR102559605B1 (ko) | 함수 최적화 방법 및 장치 | |
Yang et al. | Effective search for Pittsburgh learning classifier systems via estimation of distribution algorithms | |
Płoński et al. | Self-organising maps for classification with metropolis-hastings algorithm for supervision | |
McLeod et al. | Polynomial prediction of neurons in neural network classifier for breast cancer diagnosis | |
Kordmahalleh et al. | Hierarchical multi-label gene function prediction using adaptive mutation in crowding niching | |
Fu et al. | Lithium-ion battery SOH prediction based on VMD-PE and improved DBO optimized temporal convolutional network model | |
Khorashadizade et al. | A hybrid constructive algorithm incorporating teaching-learning based optimization for neural network training | |
CN116089317B (zh) | 基于路径相似表与个体迁移的多路径测试方法与系统 | |
Paradis et al. | Pay attention: Leveraging sequence models to predict the useful life of batteries | |
Fox et al. | Learning through limited self-supervision: Improving time-series classification without additional data via auxiliary tasks | |
Fang et al. | LoNAS: Low-Cost Neural Architecture Search Using a Three-Stage Evolutionary Algorithm [Research Frontier] |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |