CN117725488B - 基于机器学习的建筑工程项目安全性能预测方法及系统 - Google Patents

基于机器学习的建筑工程项目安全性能预测方法及系统 Download PDF

Info

Publication number
CN117725488B
CN117725488B CN202410169758.1A CN202410169758A CN117725488B CN 117725488 B CN117725488 B CN 117725488B CN 202410169758 A CN202410169758 A CN 202410169758A CN 117725488 B CN117725488 B CN 117725488B
Authority
CN
China
Prior art keywords
data
prediction
project
building
safety performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410169758.1A
Other languages
English (en)
Other versions
CN117725488A (zh
Inventor
崔强
张雪菲
刘青
白静
郭恩文
史晓剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Yuantai Jianzhong Project Management Co ltd
Original Assignee
Hebei Yuantai Jianzhong Project Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Yuantai Jianzhong Project Management Co ltd filed Critical Hebei Yuantai Jianzhong Project Management Co ltd
Priority to CN202410169758.1A priority Critical patent/CN117725488B/zh
Publication of CN117725488A publication Critical patent/CN117725488A/zh
Application granted granted Critical
Publication of CN117725488B publication Critical patent/CN117725488B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于机器学习的建筑工程项目安全性能预测方法及系统,方法包括数据采集、数据预处理、建筑项目事故结果预测、建筑项目安全系数预测和建筑工程项目安全性能预测。本发明涉及建筑工程项目安全性能预测技术领域,具体是指基于机器学习的建筑工程项目安全性能预测方法及系统,本发明收集建筑工程事故数据,并通过安全性调查采集安全系数数据;采用异常值处理、独热编码和数据重采样的数据预处理方法;采用极限梯度优化模型进行建筑项目事故结果预测,保证了预测的性能、灵活性和可扩展性;采用决策树算法进行建筑项目安全系数预测,得到更易理解和解释的安全系数预测数据参考。

Description

基于机器学习的建筑工程项目安全性能预测方法及系统
技术领域
本发明涉及建筑工程项目安全性能预测技术领域,具体是指基于机器学习的建筑工程项目安全性能预测方法及系统。
背景技术
基于机器学习的建筑工程项目安全性能预测方法是一种利用机器学习算法和技术,通过对历史和现实项目数据进行分析和建模,实现对建筑工程项目安全性能的预测和评估的方法,能够利用机器学习算法来分析建筑工程项目的安全性能,预测潜在的安全风险,并为项目管理者提供决策支持,帮助他们在项目实施过程中提高安全性能、减少事故发生概率,并改善整体的项目管理水平。
但是,在已有的建筑工程项目安全性能预测方法中,存在着缺少一种同时针对建筑工程事故和建筑工程安全系数进行协同安全相关数据采集的方法的技术问题;在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要两种不同数据结构的数据源,在预处理阶段需要对不同数据结构进行相应处理,同时要兼顾数据类别不平衡的技术问题;在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要适配具体问题选用不同的分类预测模型的技术问题;在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要适配具体问题选用不同的分类预测模型,而安全系数预测采用极限梯度优化模型会导致计算资源浪费的技术问题。
发明内容
针对上述情况,为克服现有技术的缺陷,本发明提供了基于机器学习的建筑工程项目安全性能预测方法及系统,针对在已有的建筑工程项目安全性能预测方法中,存在着缺少一种同时针对建筑工程事故和建筑工程安全系数进行协同安全相关数据采集的方法的技术问题,本方案创造性地收集建筑工程事故数据,并通过安全性调查采集安全系数数据,为后续的预测任务提供良好的数据支持;针对在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要两种不同数据结构的数据源,在预处理阶段需要对不同数据结构进行相应处理,同时要兼顾数据类别不平衡的技术问题,本方案创造性地采用异常值处理、独热编码和数据重采样的数据预处理方法,通过异常值处理对数值数据进行优化,通过独热编码对分类数据进行类别优化,并通过数据重采样解决数据类别不平衡的问题,为后续的预测任务提供更优质的数据基础;针对在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要适配具体问题选用不同的分类预测模型的技术问题,本方案创造性地采用极限梯度优化模型进行建筑项目事故结果预测,保证了预测的性能、灵活性和可扩展性,提高了后续对事故结果分析的准确性;针对在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要适配具体问题选用不同的分类预测模型,而安全系数预测采用极限梯度优化模型会导致计算资源浪费的技术问题,本方案进一步创造性地采用决策树算法进行建筑项目安全系数预测,通过决策树模型得到更易理解和解释的安全系数预测数据参考,提高了后续对安全性能整体评估的精确性
本发明采取的技术方案如下:本发明提供的基于机器学习的建筑工程项目安全性能预测方法,该方法包括以下步骤:
步骤S1:数据采集;
步骤S2:数据预处理;
步骤S3:建筑项目事故结果预测;
步骤S4:建筑项目安全系数预测;
步骤S5:建筑工程项目安全性能预测。
进一步地,在步骤S1中,所述数据采集,用于采集建筑工程项目安全性能预测所需的基本数据集,具体为从建筑工程事故数据集和建筑工程项目调查数据记录中,通过采集,得到建筑工程项目安全性能预测原始数据;
所述建筑工程项目安全性能预测原始数据的数据结构,具体包括数值型数据和分类标签型数据;
所述建筑工程项目安全性能预测原始数据的数据内容,具体包括事故结果预测原始数据和安全系数预测原始数据;
所述事故结果预测原始数据,具体指历史事故属性数据,所述历史事故属性数据,包括时间属性数据、涉事工人属性数据、涉事工程公司属性数据和事故属性数据;
所述时间属性数据,包括事故发生年份、月份、日期和持续时间数据;
所述涉事工人属性数据,包括性别、年龄、历经事故次数和工作内容数据;
所述涉事工程公司属性数据,包括以往事故发生次数记录数据和公司工人数量数据;
所述事故属性数据,包括危险事故类别数据和非危险事故类别数据;
所述安全系数预测原始数据,具体为进行建筑工程项目安全性调查,得到所述建筑工程项目调查数据记录,并从所述建筑工程项目调查数据记录中,通过采集,得到安全系数预测原始数据;
所述建筑工程项目安全性调查,具体为采用调查问卷进行安全性调查,包括项目负责人安全重视程度调查、安全设备使用情况调查和提供安全设备情况调查,所述安全性调查的数据类型,包括非常低、较低、中等、高和非常高。
进一步地,在步骤S2中,所述数据预处理,用于对原始数据进行数据预处理,具体为对所述建筑工程项目安全性能预测原始数据进行数据预处理,得到建筑工程项目安全性能预测优化数据,所述建筑工程项目安全性能预测优化数据,包括事故结果预测优化数据和安全系数预测优化数据;
所述数据预处理,具体包括以下步骤:
步骤S21:异常值过滤,具体为对所述数值型数据进行缺失值删除和数值归一化操作,得到异常值过滤数值数据;
步骤S22:独热编码转换,具体为对所述分类标签型数据进行再分类和独热编码转换操作,得到独热编码数据;
步骤S23:数据重采样,具体为采用随机欠采样方法、随机过采样方法和合成少数过采样方法进行数据重采样,得到重采样数据;
步骤S24:数据预处理,具体为通过所述异常值过滤、独热编码转换和数据重采样对所述建筑工程项目安全性能预测原始数据进行数据预处理,得到建筑工程项目安全性能预测优化数据。
进一步地,在步骤S3中,所述建筑项目事故结果预测,用于进行建筑项目事故结果预测,具体为基于所述事故结果预测优化数据,采用极限梯度优化模型进行建筑项目事故结果预测,得到建筑项目事故结果预测参考数据,包括以下步骤:
步骤S31:数据划分,具体为通过对所述事故结果预测优化进行数据划分,得到结果预测训练数据和结果预测测试数据;
步骤S32:极限梯度优化模型初始化,具体为构建K′个基础模型,并通过基础模型对所述结果预测训练数据中的所有数据样本,分配统一的初始权重,并配置初始参数;
步骤S33:计算迭代分类错误率,计算公式为:
式中,erm是第m次迭代分类的分类错误率,所述分类错误率erm,用于作为优化模型预测分类结果的评估参数,S是样本总数,i是样本索引,ωi是第i个样本的权重,I(yi≠Gmxi)是指示函数,其中yi≠Gmxi用于表示指示函数的取值条件,Gm是第m次迭代的基础模型输出,xi是第i个样本的特征向量,yi是第i个样本的真实分类,所述指示函数I(yi≠Gmxi)用于表示当第i个样本的真实分类不等于第m次迭代的基础模型输出的预测结果时,将指示函数取值为1,否则取值为0;
步骤S34:计算缩放错误分类率,计算公式为:
式中,am是第m次迭代分类的缩放错误分类率,所述缩放错误分类率,用于平衡计算分类错误率erm,erm是第m次迭代分类的分类错误率,log(·)是自然对数函数;
步骤S35:计算更新权重,计算公式为:
式中,ω‘i是分配给第i个样本的更新权重,ωi是第i个样本的权重,e是自然底数,am是第m次迭代分类的缩放错误分类率,I(yi≠Gmxi)是指示函数,其中yi≠Gmxi用于表示指示函数的取值条件,Gm是第m次迭代的基础模型输出,xi是第i个样本的特征向量,yi是第i个样本的真实分类;
步骤S36:构建事故结果预测模型目标函数,计算公式为:
式中,OBJ是事故结果预测模型目标函数标识符,S是样本总数,i是样本索引,L(·)是损失函数,y′i是第i个样本的预测分类,yi是第i个样本的真实分类,K′是基础模型总数,k是基础模型索引,Ω(fk)是正则化目标函数;
步骤S37:事故结果预测模型训练,具体为通过所述数据划分、所述极限梯度优化模型初始化、所述计算迭代分类错误率、所述计算缩放错误分类率、所述计算更新权重和所述构建事故结果预测模型目标函数,进行事故预测模型训练,得到事故预测模型ModelXGB,并通过所述结果预测测试数据进行模型性能验证;
步骤S38:建筑项目事故结果预测,具体为采用经过性能评估的事故预测模型ModelXGB,进行建筑项目事故结果预测,得到建筑项目事故结果预测参考数据。
进一步地,在步骤S4中,所述建筑项目安全系数预测,用于进行建筑项目安全系数预测,具体为基于所述安全系数预测优化数据,采用决策树算法进行建筑项目安全系数预测,得到建筑项目安全系数参考数据,包括以下步骤:
步骤S41:计算数据划分基尼指数,计算公式为:
式中,Gini(·)是数据划分基尼指数,用于评估节点的分类纯度,t是决策树节点索引,i′是分类标签索引,I′是类别总数,n(i′t)是对应t节点的分类为i′的样本数量,n(t)是对应t节点的样本总数;
步骤S42:计算特征划分加权平均基尼指数,计算公式为:
式中,Gini(·)split是特征划分加权平均基尼指数,用于评估节点分裂后的分类效果,n(tL)是对应t节点的左子树的样本数量,n(t)是对应t节点的样本总数,Gini(tL)是对应t节点的左子树的数据划分基尼指数,n(tR)是对应t节点的右子树的样本数量,Gini(tR)是对应t节点的右子树的数据划分基尼指数;
步骤S43:构建代价目标函数,计算公式为:
Ra(T)=R(T)+α|T|;
式中,Ra(·)是代价目标函数,用于评估决策树整体模型的分类效果和模型复杂度,所述代价目标函数Ra(·)的目标是求取最小化代价目标函数值,T是当前决策树模型标识符,R(·)是模型预测结果误差函数,α|T|是模型复杂度的惩罚值;
步骤S44:安全系数预测决策树模型构建,具体为通过所述计算数据划分基尼指数、所述计算特征划分加权平均基尼指数和所述构建代价目标函数,构建安全系数预测决策树模型ModelPT,并通过后剪枝优化所述安全系数预测决策树模型ModelPT
步骤S45:建筑项目安全系数预测,具体为采用所述安全系数预测决策树模型ModelPT,进行建筑项目安全系数预测,得到建筑项目安全系数参考数据。
进一步地,在步骤S5中,所述建筑工程项目安全性能预测,用于进行建筑工程项目安全性能的整体评估和预测,具体为通过得到所述建筑项目事故结果预测参考数据,进行建筑项目事故率整体评估,得到事故率分析数据,并通过得到所述建筑项目安全系数参考数据,进行建筑项目安全情况整体评估,得到安全情况整体数据,结合所述事故率分析数据和所述安全情况整体数据,得到建筑工程项目安全性能预测参考数据。
本发明提供的基于机器学习的建筑工程项目安全性能预测系统,包括数据采集模块、数据预处理模块、建筑项目事故结果预测模块、建筑项目安全系数预测模块和建筑工程项目安全性能预测模块;
所述数据采集模块,用于数据采集,通过数据采集,得到建筑工程项目安全性能预测原始数据,并将所述建筑工程项目安全性能预测原始数据发送至数据预处理模块;
所述数据预处理模块,用于数据预处理,通过数据预处理,得到建筑工程项目安全性能预测优化数据,并将所述建筑工程项目安全性能预测优化数据发送至建筑项目事故结果预测模块和建筑项目安全系数预测模块;
所述建筑项目事故结果预测模块,用于建筑项目事故结果预测,通过建筑项目事故结果预测,得到建筑项目事故结果预测参考数据,并将所述建筑项目事故结果预测参考数据发送至建筑工程项目安全性能预测模块;
所述建筑项目安全系数预测模块,用于建筑项目安全系数预测,通过建筑项目安全系数预测,得到建筑项目安全系数参考数据,并将所述建筑项目安全系数参考数据发送至建筑工程项目安全性能预测模块;
所述建筑工程项目安全性能预测模块,用于建筑工程项目安全性能预测,通过建筑工程项目安全性能预测,得到建筑工程项目安全性能预测参考数据。
采用上述方案本发明取得的有益效果如下:
(1)针对在已有的建筑工程项目安全性能预测方法中,存在着缺少一种同时针对建筑工程事故和建筑工程安全系数进行协同安全相关数据采集的方法的技术问题,本方案创造性地收集建筑工程事故数据,并通过安全性调查采集安全系数数据,为后续的预测任务提供良好的数据支持;
(2)针对在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要两种不同数据结构的数据源,在预处理阶段需要对不同数据结构进行相应处理,同时要兼顾数据类别不平衡的技术问题,本方案创造性地采用异常值处理、独热编码和数据重采样的数据预处理方法,通过异常值处理对数值数据进行优化,通过独热编码对分类数据进行类别优化,并通过数据重采样解决数据类别不平衡的问题,为后续的预测任务提供更优质的数据基础;
(3)针对在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要适配具体问题选用不同的分类预测模型的技术问题,本方案创造性地采用极限梯度优化模型进行建筑项目事故结果预测,保证了预测的性能、灵活性和可扩展性,提高了后续对事故结果分析的准确性;
(4)针对在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要适配具体问题选用不同的分类预测模型,而安全系数预测采用极限梯度优化模型会导致计算资源浪费的技术问题,本方案进一步创造性地采用决策树算法进行建筑项目安全系数预测,通过决策树模型得到更易理解和解释的安全系数预测数据参考,提高了后续对安全性能整体评估的精确性。
附图说明
图1为本发明提供的基于机器学习的建筑工程项目安全性能预测方法的流程示意图;
图2为本发明提供的基于机器学习的建筑工程项目安全性能预测系统的示意图;
图3为步骤S2数据预处理的流程示意图;
图4为步骤S3建筑项目事故结果预测的流程示意图;
图5为步骤S4建筑项目安全系数预测的流程示意图。
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例一,参阅图1,本发明提供的基于机器学习的建筑工程项目安全性能预测方法,该方法包括以下步骤:
步骤S1:数据采集;
步骤S2:数据预处理;
步骤S3:建筑项目事故结果预测;
步骤S4:建筑项目安全系数预测;
步骤S5:建筑工程项目安全性能预测。
实施例二,参阅图1和图2,在步骤S1中,所述数据采集,用于采集建筑工程项目安全性能预测所需的基本数据集,具体为从建筑工程事故数据集和建筑工程项目调查数据记录中,通过采集,得到建筑工程项目安全性能预测原始数据;
所述建筑工程项目安全性能预测原始数据的数据结构,具体包括数值型数据和分类标签型数据;
所述建筑工程项目安全性能预测原始数据的数据内容,具体包括事故结果预测原始数据和安全系数预测原始数据;
所述事故结果预测原始数据,具体指历史事故属性数据,所述历史事故属性数据,包括时间属性数据、涉事工人属性数据、涉事工程公司属性数据和事故属性数据;
所述时间属性数据,包括事故发生年份、月份、日期和持续时间数据;
所述涉事工人属性数据,包括性别、年龄、历经事故次数和工作内容数据;
所述涉事工程公司属性数据,包括以往事故发生次数记录数据和公司工人数量数据;
所述事故属性数据,包括危险事故类别数据和非危险事故类别数据;
所述安全系数预测原始数据,具体为进行建筑工程项目安全性调查,得到所述建筑工程项目调查数据记录,并从所述建筑工程项目调查数据记录中,通过采集,得到安全系数预测原始数据;
所述建筑工程项目安全性调查,具体为采用调查问卷进行安全性调查,包括项目负责人安全重视程度调查、安全设备使用情况调查和提供安全设备情况调查,所述安全性调查的数据类型,包括非常低、较低、中等、高和非常高。
通过执行上述操作,针对在已有的建筑工程项目安全性能预测方法中,存在着缺少一种同时针对建筑工程事故和建筑工程安全系数进行协同安全相关数据采集的方法的技术问题,本方案创造性地收集建筑工程事故数据,并通过安全性调查采集安全系数数据,为后续的预测任务提供良好的数据支持。
实施例三,参阅图1、图2和图3,该实施例基于上述实施例,在步骤S2中,所述数据预处理,用于对原始数据进行数据预处理,具体为对所述建筑工程项目安全性能预测原始数据进行数据预处理,得到建筑工程项目安全性能预测优化数据,所述建筑工程项目安全性能预测优化数据,包括事故结果预测优化数据和安全系数预测优化数据;
所述数据预处理,具体包括以下步骤:
步骤S21:异常值过滤,具体为对所述数值型数据进行缺失值删除和数值归一化操作,得到异常值过滤数值数据;
步骤S22:独热编码转换,具体为对所述分类标签型数据进行再分类和独热编码转换操作,得到独热编码数据;
所述再分类,具体指对所述分类标签型数据中的类别进行类别验证和重新分类;
所述独热编码转换操作,具体包括以下步骤:
步骤S221:建立全零矩阵,具体为建立一个大小为N的全零矩阵,其中,N为所述分类标签型数据中的类别总数;
步骤S222:分类数据遍历,具体为遍历每个分类数据样本并获取类别序号;
步骤S223:矩阵元素编码,具体为依据所述类别序号,将类别序号对应的矩阵元素位置置为1,用于表示矩阵元素代表的样本属于对应的类别;
步骤S224:迭代编码,具体为重复步骤S223和步骤S224所属操作,直到遍历完所有的分类数据样本;
步骤S225:获取独热编码矩阵数据,具体为通过所述迭代编码,得到独热编码矩阵,并进一步得到独热编码数据;
步骤S23:数据重采样,具体为采用随机欠采样方法、随机过采样方法和合成少数过采样方法进行数据重采样,得到重采样数据;
所述随机欠采样方法,用于随机从多数类别中删除一些数据样本;
所述随机过采样方法,用于随机复制少数类别的数据样本,并增多少数类别的数据数量;
所述合成少数过采样方法,用于随机生成少数类别的合成样本;
所述数据重采样,具体包括以下步骤:
步骤S231:随机欠采样,具体为通过随机从多数类别中删除一些数据样本,得到欠采样数据;
步骤S232:随机过采样,具体为通过随机复制少数类别的数据样本,并增多少数类别的数据数量,得到过采样数据;
步骤S233:K近邻计算,具体为选取待生成少数类别,并计算所有相对于所述待生成少数类别的数据样本的K个最近邻,其中,K取值为5;
步骤S234:随机样本选择,具体为从K个最近邻中,各随机选取近邻数据样本;
步骤S235:随机合成样本,具体为通过在所述待生成少数类别和所述近邻数据样本之间随机选择一个数据点,并生成合成数据样本;
步骤S236:合成样本入类,具体为将所述合成数据样本加入到所述待生成少数类别的数据样本中,得到合成补类数据;
步骤S237:合成少数过采样,具体为通过得到所述合成补类数据,进行合成少数过采样,得到合成少数类别数据;
步骤S238:数据重采样,具体为通过得到所述欠采样数据、所述过采样数据和所述合成少数类别数据,得到重采样数据;
步骤S24:数据预处理,具体为通过所述异常值过滤、独热编码转换和数据重采样对所述建筑工程项目安全性能预测原始数据进行数据预处理,得到建筑工程项目安全性能预测优化数据。
通过执行上述操作,针对在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要两种不同数据结构的数据源,在预处理阶段需要对不同数据结构进行相应处理,同时要兼顾数据类别不平衡的技术问题,本方案创造性地采用异常值处理、独热编码和数据重采样的数据预处理方法,通过异常值处理对数值数据进行优化,通过独热编码对分类数据进行类别优化,并通过数据重采样解决数据类别不平衡的问题,为后续的预测任务提供更优质的数据基础。
实施例四,参阅图1、图2和图4,该实施例基于上述实施例,在步骤S3中,所述建筑项目事故结果预测,用于进行建筑项目事故结果预测,具体为基于所述事故结果预测优化数据,采用极限梯度优化模型进行建筑项目事故结果预测,得到建筑项目事故结果预测参考数据,包括以下步骤:
步骤S31:数据划分,具体为通过对所述事故结果预测优化进行数据划分,得到结果预测训练数据和结果预测测试数据;
步骤S32:极限梯度优化模型初始化,具体为构建K′个基础模型,并通过基础模型对所述结果预测训练数据中的所有数据样本,分配统一的初始权重,并配置初始参数;
步骤S33:计算迭代分类错误率,计算公式为:
式中,erm是第m次迭代分类的分类错误率,所述分类错误率erm,用于作为优化模型预测分类结果的评估参数,S是样本总数,i是样本索引,ωi是第i个样本的权重,I(yi≠Gmxi)是指示函数,其中yi≠Gmxi用于表示指示函数的取值条件,Gm是第m次迭代的基础模型输出,xi是第i个样本的特征向量,yi是第i个样本的真实分类,所述指示函数I(yi≠Gmxi)用于表示当第i个样本的真实分类不等于第m次迭代的基础模型输出的预测结果时,将指示函数取值为1,否则取值为0;
步骤S34:计算缩放错误分类率,计算公式为:
式中,am是第m次迭代分类的缩放错误分类率,所述缩放错误分类率,用于平衡计算分类错误率erm,erm是第m次迭代分类的分类错误率,log(·)是自然对数函数;
步骤S35:计算更新权重,计算公式为:
式中,ω‘i是分配给第i个样本的更新权重,ωi是第i个样本的权重,e是自然底数,am是第m次迭代分类的缩放错误分类率,I(yi≠Gmxi)是指示函数,其中yi≠Gmxi用于表示指示函数的取值条件,Gm是第m次迭代的基础模型输出,xi是第i个样本的特征向量,yi是第i个样本的真实分类;
步骤S36:构建事故结果预测模型目标函数,计算公式为:
式中,OBJ是事故结果预测模型目标函数标识符,S是样本总数,i是样本索引,L(·)是损失函数,y′i是第i个样本的预测分类,yi是第i个样本的真实分类,K′是基础模型总数,k是基础模型索引,Ω(fk)是正则化目标函数;
其中,所述正则化目标函数Ω(fk)的计算公式为:
式中,Ω(fk)是正则化目标函数,M是基础模型对应的树结构中叶节点的总数,γ是损失函数下降下限控制阈值,λ是应用于权重的L2范数参数,j是节点索引,是对应第j个节点的权重的平方;
步骤S37:事故结果预测模型训练,具体为通过所述数据划分、所述极限梯度优化模型初始化、所述计算迭代分类错误率、所述计算缩放错误分类率、所述计算更新权重和所述构建事故结果预测模型目标函数,进行事故预测模型训练,得到事故预测模型ModelXGB,并通过所述结果预测测试数据进行模型性能验证;
步骤S38:建筑项目事故结果预测,具体为采用经过性能评估的事故预测模型ModelXGB,进行建筑项目事故结果预测,得到建筑项目事故结果预测参考数据。
通过执行上述操作,针对在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要适配具体问题选用不同的分类预测模型的技术问题,本方案创造性地采用极限梯度优化模型进行建筑项目事故结果预测,保证了预测的性能、灵活性和可扩展性,提高了后续对事故结果分析的准确性。
实施例五,参阅图1、图2和图5,该实施例基于上述实施例,在步骤S4中,所述建筑项目安全系数预测,用于进行建筑项目安全系数预测,具体为基于所述安全系数预测优化数据,采用决策树算法进行建筑项目安全系数预测,得到建筑项目安全系数参考数据,包括以下步骤:
步骤S41:计算数据划分基尼指数,计算公式为:
式中,Gini(·)是数据划分基尼指数,用于评估节点的分类纯度,t是决策树节点索引,i′是分类标签索引,I′是类别总数,n(i′t)是对应t节点的分类为i′的样本数量,n(t)是对应t节点的样本总数;
步骤S42:计算特征划分加权平均基尼指数,计算公式为:
式中,Gini(·)split是特征划分加权平均基尼指数,用于评估节点分裂后的分类效果,n(tL)是对应t节点的左子树的样本数量,n(t)是对应t节点的样本总数,Gini(tL)是对应t节点的左子树的数据划分基尼指数,n(tR)是对应t节点的右子树的样本数量,Gini(tR)是对应t节点的右子树的数据划分基尼指数;
步骤S43:构建代价目标函数,计算公式为:
Ra(T)=R(T)+α|T|;
式中,Ra(·)是代价目标函数,用于评估决策树整体模型的分类效果和模型复杂度,所述代价目标函数Ra(·)的目标是求取最小化代价目标函数值,T是当前决策树模型标识符,R(·)是模型预测结果误差函数,α|T|是模型复杂度的惩罚值;
步骤S44:安全系数预测决策树模型构建,具体为通过所述计算数据划分基尼指数、所述计算特征划分加权平均基尼指数和所述构建代价目标函数,构建安全系数预测决策树模型ModelPT,并通过后剪枝优化所述安全系数预测决策树模型ModelPT
步骤S45:建筑项目安全系数预测,具体为采用所述安全系数预测决策树模型ModelPT,进行建筑项目安全系数预测,得到建筑项目安全系数参考数据。
通过执行上述操作,针对在已有的建筑工程项目安全性能预测方法中,存在着建筑工程安全性能预测需要适配具体问题选用不同的分类预测模型,而安全系数预测采用极限梯度优化模型会导致计算资源浪费的技术问题,本方案进一步创造性地采用决策树算法进行建筑项目安全系数预测,通过决策树模型得到更易理解和解释的安全系数预测数据参考,提高了后续对安全性能整体评估的精确性。
实施例六,参阅图1和图2,该实施例基于上述实施例,在步骤S5中,所述建筑工程项目安全性能预测,用于进行建筑工程项目安全性能的整体评估和预测,具体为通过得到所述建筑项目事故结果预测参考数据,进行建筑项目事故率整体评估,得到事故率分析数据,并通过得到所述建筑项目安全系数参考数据,进行建筑项目安全情况整体评估,得到安全情况整体数据,结合所述事故率分析数据和所述安全情况整体数据,得到建筑工程项目安全性能预测参考数据。
实施例七,参阅图1和图2,该实施例基于上述实施例,本发明提供的基于机器学习的建筑工程项目安全性能预测系统,包括数据采集模块、数据预处理模块、建筑项目事故结果预测模块、建筑项目安全系数预测模块和建筑工程项目安全性能预测模块;
所述数据采集模块,用于数据采集,通过数据采集,得到建筑工程项目安全性能预测原始数据,并将所述建筑工程项目安全性能预测原始数据发送至数据预处理模块;
所述数据预处理模块,用于数据预处理,通过数据预处理,得到建筑工程项目安全性能预测优化数据,并将所述建筑工程项目安全性能预测优化数据发送至建筑项目事故结果预测模块和建筑项目安全系数预测模块;
所述建筑项目事故结果预测模块,用于建筑项目事故结果预测,通过建筑项目事故结果预测,得到建筑项目事故结果预测参考数据,并将所述建筑项目事故结果预测参考数据发送至建筑工程项目安全性能预测模块;
所述建筑项目安全系数预测模块,用于建筑项目安全系数预测,通过建筑项目安全系数预测,得到建筑项目安全系数参考数据,并将所述建筑项目安全系数参考数据发送至建筑工程项目安全性能预测模块;
所述建筑工程项目安全性能预测模块,用于建筑工程项目安全性能预测,通过建筑工程项目安全性能预测,得到建筑工程项目安全性能预测参考数据。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

Claims (8)

1.基于机器学习的建筑工程项目安全性能预测方法,其特征在于:该方法包括以下步骤:
步骤S1:数据采集;
步骤S2:数据预处理;
步骤S3:建筑项目事故结果预测;
步骤S4:建筑项目安全系数预测;
步骤S5:建筑工程项目安全性能预测;
在步骤S1中,所述数据采集,用于采集建筑工程项目安全性能预测所需的基本数据集,具体为从建筑工程事故数据集和建筑工程项目调查数据记录中,通过采集,得到建筑工程项目安全性能预测原始数据,所述建筑工程项目安全性能预测原始数据的数据结构,具体包括数值型数据和分类标签型数据,所述建筑工程项目安全性能预测原始数据的数据内容,具体包括事故结果预测原始数据和安全系数预测原始数据;
在步骤S2中,所述数据预处理,用于对原始数据进行数据预处理,具体为对所述建筑工程项目安全性能预测原始数据进行数据预处理,得到建筑工程项目安全性能预测优化数据,所述建筑工程项目安全性能预测优化数据,包括事故结果预测优化数据和安全系数预测优化数据;
在步骤S3中,所述建筑项目事故结果预测,用于进行建筑项目事故结果预测,具体为基于所述事故结果预测优化数据,采用极限梯度优化模型进行建筑项目事故结果预测,得到建筑项目事故结果预测参考数据;
在步骤S4中,所述建筑项目安全系数预测,用于进行建筑项目安全系数预测,具体为基于所述安全系数预测优化数据,采用决策树算法进行建筑项目安全系数预测,得到建筑项目安全系数参考数据;
在步骤S5中,所述建筑工程项目安全性能预测,用于进行建筑工程项目安全性能的整体评估和预测,具体为通过得到所述建筑项目事故结果预测参考数据,进行建筑项目事故率整体评估,得到事故率分析数据,并通过得到所述建筑项目安全系数参考数据,进行建筑项目安全情况整体评估,得到安全情况整体数据,结合所述事故率分析数据和所述安全情况整体数据,得到建筑工程项目安全性能预测参考数据。
2.根据权利要求1所述的基于机器学习的建筑工程项目安全性能预测方法,其特征在于:在步骤S2中,所述数据预处理,具体包括以下步骤:
步骤S21:异常值过滤,具体为对所述数值型数据进行缺失值删除和数值归一化操作,得到异常值过滤数值数据;
步骤S22:独热编码转换,具体为对所述分类标签型数据进行再分类和独热编码转换操作,得到独热编码数据;
步骤S23:数据重采样,具体为采用随机欠采样方法、随机过采样方法和合成少数过采样方法进行数据重采样,得到重采样数据;
步骤S24:数据预处理,具体为通过所述异常值过滤、独热编码转换和数据重采样对所述建筑工程项目安全性能预测原始数据进行数据预处理,得到建筑工程项目安全性能预测优化数据。
3.根据权利要求2所述的基于机器学习的建筑工程项目安全性能预测方法,其特征在于:在步骤S3中,所述建筑项目事故结果预测,包括以下步骤:
步骤S31:数据划分;
步骤S32:极限梯度优化模型初始化;
步骤S33:计算迭代分类错误率;
步骤S34:计算缩放错误分类率,计算公式为:
式中,am是第m次迭代分类的缩放错误分类率,所述缩放错误分类率,用于平衡计算分类错误率erm,erm是第m次迭代分类的分类错误率,log(·)是自然对数函数;
步骤S35:计算更新权重,计算公式为:
式中,ω‘i是分配给第i个样本的更新权重,ωi是第i个样本的权重,e是自然底数,am是第m次迭代分类的缩放错误分类率,I(yi≠Gmxi)是指示函数,其中yi≠Gmxi用于表示指示函数的取值条件,Gm是第m次迭代的基础模型输出,xi是第i个样本的特征向量,yi是第i个样本的真实分类;
步骤S36:构建事故结果预测模型目标函数;
步骤S37:事故结果预测模型训练;
步骤S38:建筑项目事故结果预测。
4.根据权利要求3所述的基于机器学习的建筑工程项目安全性能预测方法,其特征在于:在步骤S31中,所述数据划分,具体为通过对所述事故结果预测优化进行数据划分,得到结果预测训练数据和结果预测测试数据;
在步骤S32中,所述极限梯度优化模型初始化,具体为构建K′个基础模型,并通过基础模型对所述结果预测训练数据中的所有数据样本,分配统一的初始权重,并配置初始参数;
在步骤S33中,所述计算迭代分类错误率,计算公式为:
式中,erm是第m次迭代分类的分类错误率,所述分类错误率erm,用于作为优化模型预测分类结果的评估参数,S是样本总数,i是样本索引,ωi是第i个样本的权重,I(yi≠Gmxi)是指示函数,其中yi≠Gmxi用于表示指示函数的取值条件,Gm是第m次迭代的基础模型输出,xi是第i个样本的特征向量,yi是第i个样本的真实分类,所述指示函数I(yi≠Gmxi)用于表示当第i个样本的真实分类不等于第m次迭代的基础模型输出的预测结果时,将指示函数取值为1,否则取值为0;
在步骤S36中,所述构建事故结果预测模型目标函数,计算公式为:
式中,OBJ是事故结果预测模型目标函数标识符,S是样本总数,i是样本索引,L(·)是损失函数,y′i是第i个样本的预测分类,yi是第i个样本的真实分类,K′是基础模型总数,k是基础模型索引,Ω(fk)是正则化目标函数;
在步骤S37中,所述事故结果预测模型训练,具体为通过所述数据划分、所述极限梯度优化模型初始化、所述计算迭代分类错误率、所述计算缩放错误分类率、所述计算更新权重和所述构建事故结果预测模型目标函数,进行事故预测模型训练,得到事故预测模型ModelXGB,并通过所述结果预测测试数据进行模型性能验证;
在步骤S38中,所述建筑项目事故结果预测,具体为采用经过性能评估的事故预测模型ModelXGB,进行建筑项目事故结果预测,得到建筑项目事故结果预测参考数据。
5.根据权利要求4所述的基于机器学习的建筑工程项目安全性能预测方法,其特征在于:在步骤S4中,所述建筑项目安全系数预测,包括以下步骤:
步骤S41:计算数据划分基尼指数;
步骤S42:计算特征划分加权平均基尼指数;
步骤S43:构建代价目标函数;
步骤S44:安全系数预测决策树模型构建;
步骤S45:建筑项目安全系数预测。
6.根据权利要求5所述的基于机器学习的建筑工程项目安全性能预测方法,其特征在于:在步骤S41中,所述计算数据划分基尼指数,计算公式为:
式中,Gini(·)是数据划分基尼指数,用于评估节点的分类纯度,t是决策树节点索引,i′是分类标签索引,I′是类别总数,n(i′t)是对应t节点的分类为i′的样本数量,n(t)是对应t节点的样本总数;
在步骤S42中,所述计算特征划分加权平均基尼指数,计算公式为:
式中,Gini(·)split是特征划分加权平均基尼指数,用于评估节点分裂后的分类效果,n(tL)是对应t节点的左子树的样本数量,n(t)是对应t节点的样本总数,Gini(tL)是对应t节点的左子树的数据划分基尼指数,n(tR)是对应t节点的右子树的样本数量,Gini(tR)是对应t节点的右子树的数据划分基尼指数;
在步骤S43中,所述构建代价目标函数,计算公式为:
Ra(T)=R(T)+α|T|;
式中,Ra(·)是代价目标函数,用于评估决策树整体模型的分类效果和模型复杂度,所述代价目标函数Ra(·)的目标是求取最小化代价目标函数值,T是当前决策树模型标识符,R(·)是模型预测结果误差函数,α|T|是模型复杂度的惩罚值;
在步骤S44中,所述安全系数预测决策树模型构建,具体为通过所述计算数据划分基尼指数、所述计算特征划分加权平均基尼指数和所述构建代价目标函数,构建安全系数预测决策树模型ModelPT,并通过后剪枝优化所述安全系数预测决策树模型ModelPT
在步骤S45中,所述建筑项目安全系数预测,具体为采用所述安全系数预测决策树模型ModelPT,进行建筑项目安全系数预测,得到建筑项目安全系数参考数据。
7.基于机器学习的建筑工程项目安全性能预测系统,用于实现如权利要求1-6中任一项所述的基于机器学习的建筑工程项目安全性能预测方法,其特征在于:包括数据采集模块、数据预处理模块、建筑项目事故结果预测模块、建筑项目安全系数预测模块和建筑工程项目安全性能预测模块。
8.根据权利要求7所述的基于机器学习的建筑工程项目安全性能预测系统,其特征在于:所述数据采集模块,用于数据采集,通过数据采集,得到建筑工程项目安全性能预测原始数据,并将所述建筑工程项目安全性能预测原始数据发送至数据预处理模块;
所述数据预处理模块,用于数据预处理,通过数据预处理,得到建筑工程项目安全性能预测优化数据,并将所述建筑工程项目安全性能预测优化数据发送至建筑项目事故结果预测模块和建筑项目安全系数预测模块;
所述建筑项目事故结果预测模块,用于建筑项目事故结果预测,通过建筑项目事故结果预测,得到建筑项目事故结果预测参考数据,并将所述建筑项目事故结果预测参考数据发送至建筑工程项目安全性能预测模块;
所述建筑项目安全系数预测模块,用于建筑项目安全系数预测,通过建筑项目安全系数预测,得到建筑项目安全系数参考数据,并将所述建筑项目安全系数参考数据发送至建筑工程项目安全性能预测模块;
所述建筑工程项目安全性能预测模块,用于建筑工程项目安全性能预测,通过建筑工程项目安全性能预测,得到建筑工程项目安全性能预测参考数据。
CN202410169758.1A 2024-02-06 2024-02-06 基于机器学习的建筑工程项目安全性能预测方法及系统 Active CN117725488B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410169758.1A CN117725488B (zh) 2024-02-06 2024-02-06 基于机器学习的建筑工程项目安全性能预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410169758.1A CN117725488B (zh) 2024-02-06 2024-02-06 基于机器学习的建筑工程项目安全性能预测方法及系统

Publications (2)

Publication Number Publication Date
CN117725488A CN117725488A (zh) 2024-03-19
CN117725488B true CN117725488B (zh) 2024-04-30

Family

ID=90205629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410169758.1A Active CN117725488B (zh) 2024-02-06 2024-02-06 基于机器学习的建筑工程项目安全性能预测方法及系统

Country Status (1)

Country Link
CN (1) CN117725488B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111178828A (zh) * 2019-12-18 2020-05-19 北京明略软件系统有限公司 一种建筑消防安全预警的方法和系统
CN111365015A (zh) * 2020-03-05 2020-07-03 中建交通建设集团有限公司 一种基于XGBoost的盾构掘进参数特征提取与姿态偏差预测方法
CN111445106A (zh) * 2020-03-02 2020-07-24 国网辽宁省电力有限公司电力科学研究院 一种用电采集设备故障处理作业现场安全控制方法及系统
CN115859826A (zh) * 2022-12-15 2023-03-28 中铁工程服务有限公司 一种基于集成学习的盾构设备故障融合预测方法
CN116049668A (zh) * 2022-12-20 2023-05-02 东南大学 一种基于机器学习的自动驾驶事故严重程度预测方法
CN116629605A (zh) * 2023-05-16 2023-08-22 中国科学院空天信息创新研究院 一种面向木质古建筑的火灾风险预测方法
CN116823171A (zh) * 2023-07-06 2023-09-29 浙江智慧江能技术服务股份有限公司 一种基于大数据的建筑工程质量监督与管理方法
CN117150282A (zh) * 2023-09-16 2023-12-01 石家庄正和网络有限公司 一种基于预测模型的二手设备回收评估方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111178828A (zh) * 2019-12-18 2020-05-19 北京明略软件系统有限公司 一种建筑消防安全预警的方法和系统
CN111445106A (zh) * 2020-03-02 2020-07-24 国网辽宁省电力有限公司电力科学研究院 一种用电采集设备故障处理作业现场安全控制方法及系统
CN111365015A (zh) * 2020-03-05 2020-07-03 中建交通建设集团有限公司 一种基于XGBoost的盾构掘进参数特征提取与姿态偏差预测方法
CN115859826A (zh) * 2022-12-15 2023-03-28 中铁工程服务有限公司 一种基于集成学习的盾构设备故障融合预测方法
CN116049668A (zh) * 2022-12-20 2023-05-02 东南大学 一种基于机器学习的自动驾驶事故严重程度预测方法
CN116629605A (zh) * 2023-05-16 2023-08-22 中国科学院空天信息创新研究院 一种面向木质古建筑的火灾风险预测方法
CN116823171A (zh) * 2023-07-06 2023-09-29 浙江智慧江能技术服务股份有限公司 一种基于大数据的建筑工程质量监督与管理方法
CN117150282A (zh) * 2023-09-16 2023-12-01 石家庄正和网络有限公司 一种基于预测模型的二手设备回收评估方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XGBoost: A Scalable Tree Boosting System;Tianqi Chen et.al;《KDD 16》;20161231;785-794 *
基于平均特征重要性和集成学习的异常检测;庄锐 等;《计算机系统应用》;20230418;第32卷(第6期);61-69 *

Also Published As

Publication number Publication date
CN117725488A (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
CN111127246A (zh) 一种输电线路工程造价的智能预测方法
CN112308281A (zh) 一种温度信息预测方法及装置
CN115271181A (zh) 一种基于多模态数据融合的台风概率预报智能方法及装置
CN113255842B (zh) 车辆置换预测方法、装置、设备及存储介质
CN111178585A (zh) 基于多算法模型融合的故障接报量预测方法
CN116610816A (zh) 一种基于图卷积神经网络的人员画像知识图谱分析方法及系统
CN112668238B (zh) 一种降雨量处理方法、装置、设备和存储介质
CN116738192A (zh) 一种基于数字孪生的安全数据评估方法及系统
CN116539994A (zh) 基于多源时间序列数据的变电站主设备运行状态检测方法
CN114819344A (zh) 一种基于关键影响因子的全局时空气象农灾预测方法
CN114897264A (zh) 一种基于迁移学习的小样本场景下光伏出力区间预测方法
CN110260914A (zh) 一种基于测点时空特征的工程安全监测系统区域划分方法
CN117725488B (zh) 基于机器学习的建筑工程项目安全性能预测方法及系统
CN114741976B (zh) 一种位移预测方法、装置、设备及可读存储介质
KR20210042709A (ko) 기업 관계 데이터를 이용한 주가 예측 방법 및 서버
CN114757097B (zh) 一种线路故障诊断方法及装置
CN114648060A (zh) 基于机器学习的故障信号规范化处理及分类方法
CN116128082A (zh) 高速公路交通流量预测方法及电子设备
CN114282657A (zh) 一种市场数据长期预测模型训练方法、装置、设备及存储介质
CN114662009A (zh) 一种基于图卷积的工业互联网工厂协同推荐算法
CN114239934A (zh) 一种基于生成式对抗网络的电网负荷序列预测方法及系统
Azmi On using clustering for the optimization of hydrological simulations
CN118378150B (zh) 太阳辐射预测方法、装置、存储介质及电子设备
CN113537458B (zh) 一种有理式函数神经网络构建方法、系统及可读存储介质
Chaudhuri et al. Prediction of severe thunderstorms with minimal a priori information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant