CN115760486A

CN115760486A - 临建规模评估方法、装置、设备和可读存储介质

Info

Publication number: CN115760486A
Application number: CN202211496837.0A
Authority: CN
Inventors: 梁军博; 陈静
Original assignee: Glodon Co Ltd
Current assignee: Glodon Co Ltd
Priority date: 2022-11-24
Filing date: 2022-11-24
Publication date: 2023-03-07

Abstract

本发明公开了一种临建规模评估方法、装置、设备和可读存储介质，该方法包括：获取待预测项目信息，其中，待预测项目信息包括项目结构形式、施工面积、所处地区和工期；对待预测项目信息进行预处理，获得第一标准模型数据；将第一标准模型数据输入至训练完成的临建规模评估模型中，获得待预测项目信息的用工信息，其中，用工信息包括用工峰值和持续时间；根据用工峰值和持续时间确定临建规模。基于本申请，解决了人工预测确定临建建设规模导致临建规模准确率低，不符合实际要求的技术问题，通过临建规模评估模型提高了数据处理的准确性和效率。

Description

临建规模评估方法、装置、设备和可读存储介质

技术领域

本发明涉及建筑工程管理领域，具体涉及一种临建规模评估方法、装置、设备和可读存储介质。

背景技术

在建筑施工前，项目负责人会根据自身经验估计施工期间用工峰值以及持续时长来确定临建建设的规模，但往往由于项目负责人的项目经验不足，导致临建规模不符合现场实际要求。临建规模估计较大会导致过多占用工地面积，场地规划不合理等问题。临建规模估计较小会导致后期调整场地布置扩大临建面积，增加工程成本等问题。

针对现有技术人工预测确定临建建设规模导致临建规模准确率低，不符合实际要求的技术问题，目前未存在有效的解决办法。

发明内容

本发明的目的在于提供了一种临建规模评估方法、装置、设备和可读存储介质，能够解决现有技术人工预测确定临建建设规模导致临建规模准确率低，不符合实际要求的技术问题。

本发明的一个方面提供了一种临建规模评估方法，该方法包括：获取待预测项目信息，其中，待预测项目信息包括项目结构形式、施工面积、所处地区和工期；对待预测项目信息进行预处理，获得第一标准模型数据；将第一标准模型数据输入至训练完成的临建规模评估模型中，获得待预测项目信息的用工信息，其中，用工信息包括用工峰值和持续时间；根据用工峰值和持续时间确定临建规模。

可选地，临建规模评估模型是通过如下方式训练的：获取历史劳务数据，其中，历史劳务数据包括用工信息和项目信息；根据数据格式对历史劳务数据进行特征处理，生成第二标准模型数据；基于第二标准模型数据，对预构建的机器学习模型进行训练，得到临建规模评估模型。

可选地，预构建的机器学习模型为XGBoost模型。

可选地，基于第二标准模型数据，对预构建的机器学习模型进行训练，得到临建规模评估模型，包括：将第二标准模型数据划分为训练集和测试集；将训练集中的项目信息输入至预构建的初始XGBoost模型中，获得项目信息对应的用工信息预测结果；根据训练集中的用工信息和用工信息预测结果对初始XGBoost模型进行参数调整，生成初始的临建规模评估模型；基于测试集验证初始的临建规模评估模型，获得符合条件的临建规模评估模型。

可选地，根据数据格式对历史劳务数据进行特征处理，包括：确定历史劳务数据的数据格式；若数据格式为字符形式，则对历史劳务数据进行one-hot编码；若数据格式为标量特征，则对历史劳务数据进行min-max标准化处理。

可选地，获取历史劳务数据，包括：获取历史项目的工人登记进场出场时间和工人打卡记录数据；根据历史项目的工人登记进场出场时间和工人打卡记录数据确定用工信息；根据历史项目的所属类别确定项目信息。

本发明的另一个方面提供了一种临建规模评估装置，该装置包括：获取模块，用于获取待预测项目信息，其中，待预测项目信息包括为项目结构形式、施工面积、所处地区和工期；预处理模块，用于对待预测项目信息进行预处理，获得第一标准模型数据；预测模块，用于将第一标准模型数据输入至训练完成的临建规模评估模型中，获得待预测项目信息的用工信息，其中，用工信息包括用工峰值和持续时间；确定模块，用于根据用工峰值和持续时间确定临建规模。

本发明的再一个方面提供了一种计算机设备，所述计算机设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述任一实施例所述的临建规模评估方法。

本发明的又一个方面提供了一种计算机存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一实施例所述的临建规模评估方法。进一步地，所述计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

在本发明中，基于训练完成的临建规模预测模型对待预测项目信息进行数据处理，获得该待预测项目信息唯一指向的用工信息，并对用工信息进行公式计算，即可确定出所需的临建规模数值。临建规模评估模型的创建减少了人工经验的判断环节，通过较为完备的机器学习语言对建筑项目信息进行较为全面的分析判断，提高了临建规模预测结果的准确性以及效率。基于本申请，解决了人工预测确定临建建设规模导致临建规模准确率低，不符合实际要求的技术问题，通过临建规模评估模型提高了数据处理的准确性和效率。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例一提供的临建规模评估方法的一种可选的流程图；

图2示出了本发明实施例二提供的临建规模评估装置的结构框图；以及

图3示出了本发明实施例三提供的适于实现临建规模评估方法的计算机设备的框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

实施例一

本实施例提供了一种临建规模评估方法，图1示出了该临建规模评估方法的流程图，如图1所示，该临建规模评估方法可以包括步骤S1至步骤S4，其中：

步骤S1，获取待预测项目信息，其中，所述待预测项目信息包括项目结构形式、施工面积、所处地区和工期；

步骤S2，对所述待预测项目信息进行预处理，获得第一标准模型数据；

预处理可以为对待预测项目信息进行one-hot编码处理和min-max标准化处理。获取的待预测项目信息均为实际施工环境中使用的工作人员基于经验记载的数据，不便于计算机系统的直接识别，并导致项目信息预测结果的准确度降低，不利于临建规模的确定。在获取到待预测项目信息后，对待预测项目信息one-hot编码处理以及min-max标准化处理，能够获得可直接作为输入数据的第一标准模型数据，从而提供临近规模预测结果的准确度。

步骤S3，将所述第一标准模型数据输入至训练完成的临建规模评估模型中，获得所述待预测项目信息的用工信息，其中，所述用工信息包括用工峰值和持续时间；

在建筑施工过程中，临建规模的确定往往需要准确的用工信息。为了提高临建规模的准确率，通过训练完成的临建规模评估模型对第一标准模型数据进行分析预测，获得当前待预测项目信息唯一指向的用工信息，在此基础上，对用工信息进行后续的加工处理之后，即可获得所需的临建规模数值。

临建规模评估模型的创建减少了人工经验的判断环节，通过较为完备的机器学习语言对建筑项目信息进行较为全面的分析判断，提高了临建规模预测结果的准确性以及效率。

步骤S4，根据所述用工峰值和所述持续时间确定临建规模。

将模型预测结果(用工峰值及峰值持续时间)推送给用户，用户对上述数据进行乘法运算即可确定出最终的临建规模。特别地，针对用工峰值以及峰值持续时间确定临建规模的处理并不限于乘法运算，可以根据业务需求随机设置，在此不做任何限制。

优选地，所述临建规模评估模型是通过如下步骤A1至步骤A3训练的：

步骤A1，获取历史劳务数据，其中，所述历史劳务数据包括用工信息和项目信息；

步骤A2，根据数据格式对所述历史劳务数据进行特征处理，生成第二标准模型数据；

其中，第二标准模型数据是在第一标准模型数据的基础上，增加了用工信息这一类型施工数据。而用工信息是可以与机器学习模型直接对接的数据类型，无需进行额外的数据处理过程，也即，第二标准模型数据与第一标准模型数据采取的特征处理算法是相同的。

历史劳务数据的格式多种多样，并不完全相同，不能作统一的特征处理，否则会导致预测结果的误差率增加。对于历史劳务数据的针对性处理，在获得规范性的第二标准模型数据的同时，仍能够保持数据本身的差异性和特殊性，以提高临建规模预测结果的准确性。

具体地，步骤A2在根据数据格式对所述历史劳务数据进行特征处理，生成第二标准模型数据时，包括步骤A21至步骤A23，其中：

步骤A21，确定所述历史劳务数据的数据格式；

其中，数据格式可以包括字符形式和标量特征。不同格式的历史劳务数据具有对应的数据处理算法，确定出历史劳务数据的数据格式之后，才能对历史劳务数据进行针对性的特征处理。

步骤A22，若所述数据格式为字符形式，则对所述历史劳务数据进行one-hot编码；

在数据格式为字符形式时，对该类型的历史劳务数据进行one-hot编码。其中，在本实施例中，结构形式、所处地区为字符形式的数据，对这两种数据进行one-hot编码，在编码后，结构形式可以取值为房屋建筑、宿舍建筑、工业厂房等等，所在地区可以取值为华北地区、东北地区等等。

步骤A23，若所述数据格式为标量特征，则对所述历史劳务数据进行min-max标准化处理。

在数据格式为标量特征时，对该类型的历史劳务数据进行min-max标准化处理。其中，在本实施例中，建筑面积、工期为标量特征的数据，对这两种数据数据min-max标准化处理，在标准化处理完成后，建筑面积可以取值为100000平方米、300000平方米等等，工期可以取值为18个月、20个月等等。

步骤A3，基于所述第二标准模型数据，对预构建的机器学习模型进行训练，得到临建规模评估模型。

在获得规范的第二标准模型数据后，便可以对预构建的机器学习模型进行训练，以生成临建规模评估模型，便于临建规模的确定。

优选地，所述预构建的机器学习模型为XGBoost模型。

XGBoost是一个优化的分布式梯度增强库，旨在实现高效，灵活和便携。XGBoost提供了并行树提升(也称为GBDT，GBM)，可以快速准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop，SGE，MPI)上运行，并且可以解决超过数十亿个样例的问题。相比较人工经验对临建规模的预测，XGBoost模型采取并行和分布式计算模式使学习效率更加快速，从而实现更快的数据分析效率，同时，能够在近似树学习中合理处理实例权重，提升了预测结果的准确性。

优选地，所述基于所述第二标准模型数据，对预构建的机器学习模型进行训练，得到临建规模评估模型，包括步骤A31至步骤A34，其中：

步骤A31，将所述第二标准模型数据划分为训练集和测试集；

确定项目信息对应的第二标准模型数据为输入数据，确定用工信息对应的第二标准模型数据为输出数据；将所述第二标准模型数据划分为训练集和测试集。

步骤A32，将所述训练集中的项目信息输入至预构建的初始XGBoost模型中，获得所述项目信息对应的用工信息预测结果；

预构建的初始XGBoost模型由多个树模型构成，根据训练集的输入数据和输出数据训练第一个树模型，将训练集中的项目信息输入至预构建的初始XGBoost模型中，对第一个树模型中每个叶节点遍历所述项目信息的所有可用特征，并确定每个节点对应的各个可用特征的特征值；

根据特征值确定每个叶节点的分裂特征，并在对应叶节点上分裂出两个新的叶节点，基于分裂特征为新的叶节点关联对应的样本集；

在一个叶节点上，对同一类型可用特征的特征值进行排序，并记录该可用特征在该叶节点上的分裂收益；确定每个叶节点分裂收益最大的可用特征作为分裂特征，用该特征的最佳分裂点作为分裂位置，在该节点上分裂出左右两个新的叶节点，并为每个新节点关联对应的样本集。新节点关联的样本集是基于最佳分裂点的分裂特征划分的。即以该分裂特征作为分类条件对当前的训练集进行二分类，获得两个子训练集，将该子训练集分别作为新节点的样本集执行新的分裂特征的确定，此时，该叶节点项目信息对应的用工信息预测结果已经确定。

步骤A33，根据所述训练集中的用工信息和所述用工信息预测结果对所述初始XGBoost模型进行参数调整，生成初始的临建规模评估模型；

将训练集中的用工信息与此时获得的用工信息预测结果进行比较，确定二者的误差，并对该误差值进行调整，即基于该误差值对新的叶节点递归执行到满足特定条件为止，第一棵树模型训练完成；其中，特定条件为能够准确划分训练集劳务信息的标准特征值，由具体的施工环境决定，在此不做限制。

执行步骤A32和步骤A33更新初始XGboost模型中的第2、3…t棵树模型，将t棵树模型进行累加，生成初始的临建规模评估模型。

步骤A34，基于所述测试集验证所述初始的临建规模评估模型，获得符合条件的临建规模评估模型。

通过测试集对初始的临建规模评估模型进行测试，若初始的临建规模评估模型的误差率小于等于预设阈值，临建规模评估模型训练完成。其中，预设阈值通过业务需求确定，在此不做任何限制。

可选地，所述获取历史劳务数据，可以包括步骤A11至步骤A13，其中：

步骤A11，获取历史项目的工人登记进场出场时间和工人打卡记录数据；

进场出场时间是反映工人出勤的直观数据，以此确定出的用工信息能够贴合实际的施工条件，提高了临建规模预测结果的准确性。从数据中台Hive数据库获取劳务产品工人登记入场离场数据。

步骤A12，根据所述历史项目的工人登记进场出场时间和工人打卡记录数据确定用工信息；

根据业务专家提供的工种-是否工人表，确定每个工种是管理者还是工人，统计出每个项目登记的工人总数量。

判断每个项目登记的工人总数量是否符合施工人数标准，剔除不符合条件的数据。其中，施工人数标准可以为100人，若项目人数不足100人，则将该项目剔除。

统计每个项目工人入场时间异常、离场时间异常、没有离场时间等异常情况占比，判断异常情况占比是否符合到岗标准，对不符合到岗标准的数据进行清除。其中，异常情况占比可以为0.3，若项目工人异常数据占比超过0.3，则将该项目清除。

判断房建项目类型和施工结构类型是否明确，若否，则去除该项目。

统计每个项目最晚登记入场出场时间，根据最近三个月有工人登记入场出场的记录规则去除正在施工的项目。

统计出每个项目不同施工队伍中工人最晚离场时间以及每个项目不同队伍不同组不同工种工人最晚离场时间，通过统计出的结果对没有离场时间的工人数据进行填充，通过该工人所在的项目以及组找到该项目该组该工种工人最晚离场时间作为自身离场时间，如果找不到，就通过该项目该施工队伍中工人最晚离场时间作为自身离场时间。

统计出每个项目持续时间、每个项目工种数量。根据统计结果去掉项目持续时间不足6个月的项目以及项目工种数量不足四个的项目。

针对符合上述检测条件的项目，统计出每个项目用工峰值，以0.9倍的用工峰值作为阈值，查找每个月的用工值是否大于该阈值，以所有用工值大于该阈值的月份个数作为每个项目用工峰值持续时间。

步骤A13，根据所述历史项目的所属类别确定项目信息。

根据项目所属省份，确定项目的所在地区为华北、东北、华东、中南、西南、西北的一项。

使用requests库下载项目详情数据。通过正则表达式处理项目详情数据获取项目建筑面积数据。

并读取项目自身携带的结构形式以及工期。

在本实施例中，基于训练完成的临建规模预测模型对待预测项目信息进行数据处理，获得该待预测项目信息唯一指向的用工信息，并对用工信息进行公式计算，即可确定出所需的临建规模数值。临建规模评估模型的创建减少了人工经验的判断环节，通过较为完备的机器学习语言对建筑项目信息进行较为全面的分析判断，提高了临建规模预测结果的准确性以及效率。基于本申请，解决了人工预测确定临建建设规模导致临建规模准确率低，不符合实际要求的技术问题，通过临建规模评估模型提高了数据处理的准确性和效率。

实施例二

本发明的实施例二还提供了一种临建规模评估装置，该临建规模评估装置与上述实施例一提供的临建规模评估方法相对应，相应的技术特征和技术效果在本实施例中不再详述，相关之处可参考上述实施例一。具体地，图2示出了该临建规模评估装置的结构框图。如图2所示，该临建规模评估装置200包括获取模块201、预处理模块202、预测模块203和确定模块204，其中：

获取模块201，用于获取待预测项目信息，其中，待预测项目信息包括为项目结构形式、施工面积、所处地区和工期；

预处理模块202，与获取模块201连接，用于对待预测项目信息进行预处理，获得第一标准模型数据；

预测模块203，与预处理模块202连接，用于将第一标准模型数据输入至训练完成的临建规模评估模型中，获得待预测项目信息的用工信息，其中，用工信息包括用工峰值和持续时间；

确定模块204，与预测模块203连接，用于根据用工峰值和持续时间确定临建规模。

可选地，该装置还包括训练模块，其中：获取子模块，具体用于获取历史劳务数据，其中，历史劳务数据包括用工信息和项目信息；特征处理子模块，用于根据数据格式对历史劳务数据进行特征处理，生成第二标准模型数据；训练子模块，用于基于第二标准模型数据，对预构建的机器学习模型进行训练，得到临建规模评估模型。

可选地，训练模块中的预构建的机器学习模型为XGBoost模型。

可选地，训练子模块具体用于：将第二标准模型数据划分为训练集和测试集；将训练集中的项目信息输入至预构建的初始XGBoost模型中，获得项目信息对应的用工信息预测结果；根据训练集中的用工信息和用工信息预测结果对初始XGBoost模型进行参数调整，生成初始的临建规模评估模型；基于测试集验证初始的临建规模评估模型，获得符合条件的临建规模评估模型。

可选地，特征处理子模块具体用于：确定历史劳务数据的数据格式；若数据格式为字符形式，则对历史劳务数据进行one-hot编码；若数据格式为标量特征，则对历史劳务数据进行min-max标准化处理。

可选地，获取子模块具体用于：获取历史项目的工人登记进场出场时间和工人打卡记录数据；根据历史项目的工人登记进场出场时间和工人打卡记录数据确定用工信息；根据历史项目的所属类别确定项目信息。

实施例三

图3示出了本发明实施例三提供的适于实现临建规模评估方法的计算机设备的框图。本实施例中，计算机设备300可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图3所示，本实施例的计算机设备300至少包括但不限于：可通过系统总线相互通信连接的存储器301、处理器302、网络接口303。需要指出的是，图3仅示出了具有组件301-303的计算机设备300，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

本实施例中，存储器303至少包括一种类型的计算机可读存储介质，可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器301可以是计算机设备300的内部存储单元，例如该计算机设备300的硬盘或内存。在另一些实施例中，存储器301也可以是计算机设备300的外部存储设备，例如该计算机设备300上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器301还可以既包括计算机设备300的内部存储单元也包括其外部存储设备。在本实施例中，存储器301通常用于存储安装于计算机设备300的操作系统和各类应用软件，例如临建规模评估方法的程序代码等。

处理器302在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器302通常用于控制计算机设备300的总体操作。例如执行与计算机设备300进行数据交互或者通信相关的控制和处理等。本实施例中，处理器302用于运行存储器301中存储的临建规模评估方法的步骤的程序代码。

在本实施例中，存储于存储器301中的临建规模评估方法还可以被分割为一个或者多个程序模块，并由一个或多个处理器(本实施例为处理器302)所执行，以完成本发明。

网络接口303可包括无线网络接口或有线网络接口，该网络接口303通常用于在计算机设备300与其他计算机设备之间建立通信链接。例如，网络接口303用于通过网络将计算机设备300与外部终端相连，在计算机设备300与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，简称为GSM)、宽带码分多址(Wideband CodeDivision Multiple Access，简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

实施例四

本实施例还提供一种计算机可读存储介质，包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等，其上存储有计算机程序，所述计算机程序被处理器执行时实现临建规模评估方法的步骤。

显然，本领域的技术人员应该明白，上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明实施例不限制于任何特定的硬件和软件结合。

需要说明的是，本发明实施例序号仅仅为了描述，并不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种临建规模评估方法，其特征在于，所述方法包括：

获取待预测项目信息，其中，所述待预测项目信息包括项目结构形式、施工面积、所处地区和工期；

对所述待预测项目信息进行预处理，获得第一标准模型数据；

将所述第一标准模型数据输入至训练完成的临建规模评估模型中，获得所述待预测项目信息的用工信息，其中，所述用工信息包括用工峰值和持续时间；

根据所述用工峰值和所述持续时间确定临建规模。

2.根据权利要求1所述的方法，其特征在于，所述临建规模评估模型是通过如下方式训练的：

获取历史劳务数据，其中，所述历史劳务数据包括用工信息和项目信息；

根据数据格式对所述历史劳务数据进行特征处理，生成第二标准模型数据；

基于所述第二标准模型数据，对预构建的机器学习模型进行训练，得到临建规模评估模型。

3.根据权利要求2所述的方法，其特征在于，所述预构建的机器学习模型为XGBoost模型。

4.根据权利要求3所述的方法，其特征在于，所述基于所述第二标准模型数据，对预构建的机器学习模型进行训练，得到临建规模评估模型，包括：

将所述第二标准模型数据划分为训练集和测试集；

将所述训练集中的项目信息输入至预构建的初始XGBoost模型中，获得所述项目信息对应的用工信息预测结果；

根据所述训练集中的用工信息和所述用工信息预测结果对所述初始XGBoost模型进行参数调整，生成初始的临建规模评估模型；

基于所述测试集验证所述初始的临建规模评估模型，获得符合条件的临建规模评估模型。

5.根据权利要求2所述的方法，其特征在于，所述根据数据格式对所述历史劳务数据进行特征处理，包括：

确定所述历史劳务数据的数据格式；

若所述数据格式为字符形式，则对所述历史劳务数据进行one-hot编码；

若所述数据格式为标量特征，则对所述历史劳务数据进行min-max标准化处理。

6.根据权利要求2-5任一项所述的方法，其特征在于，所述获取历史劳务数据，包括：

获取历史项目的工人登记进场出场时间和工人打卡记录数据；

根据所述历史项目的工人登记进场出场时间和工人打卡记录数据确定用工信息；

根据所述历史项目的所属类别确定项目信息。

7.一种临建规模评估装置，其特征在于，所述装置包括：

获取模块，用于获取待预测项目信息，其中，所述待预测项目信息包括为项目结构形式、施工面积、所处地区和工期；

预处理模块，用于对所述待预测项目信息进行预处理，获得第一标准模型数据；

预测模块，用于将所述第一标准模型数据输入至训练完成的临建规模评估模型中，获得所述待预测项目信息的用工信息，其中，所述用工信息包括用工峰值和持续时间；

确定模块，用于根据所述用工峰值和所述持续时间确定临建规模。

8.根据权利要求7所述的装置，其中，所述装置还包括训练模块，用于：

9.一种计算机设备，所述计算机设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6任一项所述的方法。