CN116562454A

CN116562454A - 一种应用于bim的长短时注意力机制网络的造价预测方法

Info

Publication number: CN116562454A
Application number: CN202310556401.4A
Authority: CN
Inventors: 吕鑫; 汪卫东
Original assignee: Xiamen Yinjiang Smart City Technology Co ltd
Current assignee: Xiamen Yinjiang Smart City Technology Co ltd
Priority date: 2023-05-17
Filing date: 2023-05-17
Publication date: 2023-08-08

Abstract

本发明公开了一种应用于BIM的长短时注意力机制网络的造价预测方法，属于建筑信息模型技术和工程造价预测技术领域，包括如下步骤：从BIM模型中提取工程量信息，从历史数据或现场数据中获取物价变化因子，将提取的工程量信息和物价变化因子作为输入序列，送入一个由多层LSTM单元组成的编码器网络，将隐藏状态向量作为输入，送入一个由多层LSTM单元组成的解码器网络，将上下文向量与解码器网络输出的隐藏状态向量相连接，将预测值与真实值进行比较，并计算出损失函数，得到最终的造价预测模型；本发明中，能够利用BIM模型中丰富而精确的工程量信息，结合物价变化因子，提高造价预测的准确性和可靠性。

Description

一种应用于BIM的长短时注意力机制网络的造价预测方法

技术领域

本发明属于建筑信息模型技术和工程造价预测技术领域，尤其涉及一种应用于BIM的长短时注意力机制网络的造价预测方法。

背景技术

建筑信息模型(BIM)是一种基于三维数字模型的建筑设计、施工和运维管理技术，能够实现建筑项目全生命周期的信息化协同。BIM技术能够提高建筑项目的质量、效率和安全性，降低成本和风险，促进建筑业的数字化转型。

工程造价预测是指在建筑项目设计或施工阶段，根据已有的信息和数据，采用数学模型或统计方法，对未来工程所需费用进行估算或预测。工程造价预测对于合理控制工程投资、优化资源配置、提高经济效益等具有重要意义。

目前，常用的工程造价预测方法主要有两类：基于规则的方法和基于数据的方法。基于规则的方法是指根据已有的定额或清单计算规则，结合人工经验或专家知识，对工程量进行分析和计算，并乘以相应的单价得到总费用。这种方法依赖于人工判断和操作，易受主观因素影响，并且难以适应复杂多变的市场环境。基于数据的方法是指利用历史数据或现场数据，构建数学模型或机器学习算法，通过训练和拟合得到预测结果。这种方法可以充分利用大量数据信息，并且能够自动调整参数适应变化。

近年来，随着深度学习技术在各个领域取得突破性进展，在工程造价预测方面也出现了一些新颖有效的算法。其中一种是长短时记忆网络，它是一种特殊的循环神经网络，能够处理时序数据，并且解决了传统RNN存在梯度消失或爆炸等问题。LSTM能够捕捉时间序列中长期依赖关系，并且具有记忆单元、输入门、输出门和遗忘门等结构。另一种是注意力机制，它是一种能够增强神经网络表达能力和泛化能力的技术，在自然语言处理、计算机视觉等领域都有广泛应用。注意力机制能够让神经网络在处理输入序列时，自动关注不同位置上不同重要性的信息，并且生成一个加权平均向量作为输出。尽管BIM技术和工程造价预测方法都有了一定的发展和应用，但是目前还存在一些问题和挑战，例如：BIM模型的质量、精度和完整性不够高，导致提取的工程量信息不准确或不全面；工程造价预测方法缺乏对时序数据和物价变化因子的充分利用，导致预测结果不稳定或不准确；工程造价预测方法缺乏对不同类型、规模、地点等特征的工程项目的适应性，导致预测模型难以泛化或迁移；工程造价预测方法缺乏对深度学习技术和注意力机制技术的有效结合，导致预测网络结构复杂或效率低下。

因此，如何利用BIM技术提供更高质量、更全面信息的工程量数据，并结合深度学习技术和注意力机制技术提出更准确、更有效、更灵活的工程造价预测方法是本领域亟待解决的问题。

发明内容

本发明的目的在于：为了解决上述的问题，而提出的一种应用于BIM的长短时注意力机制网络的造价预测方法。

为了实现上述目的，本发明采用了如下技术方案：一种应用于BIM的长短时注意力机制网络的造价预测方法，包括如下步骤：

S1、从BIM模型中提取工程量信息；

S2、从历史数据或现场数据中获取物价变化因子；

S3、将提取的工程量信息和物价变化因子作为输入序列，送入一个由多层LSTM单元组成的编码器网络；

S4、将隐藏状态向量作为输入，送入一个由多层LSTM单元组成的解码器网络；

S5、将上下文向量与解码器网络输出的隐藏状态向量相连接；

S6、将预测值与真实值进行比较，并计算出损失函数；

S7、得到最终的造价预测模型。

作为上述技术方案的进一步描述：

所述S1中，从BIM模型中提取工程量信息，并根据工程特征进行分类和归一化处理。

作为上述技术方案的进一步描述：

所述S2中，从历史数据或现场数据中获取物价变化因子，并根据时间序列进行插值。

作为上述技术方案的进一步描述：

所述S3中，将提取的工程量信息和物价变化因子作为输入序列，送入一个由多层LSTM单元组成的编码器网络，得到一个隐藏状态向量。

作为上述技术方案的进一步描述：

所述S4中，将隐藏状态向量作为输入，送入一个由多层LSTM单元组成的解码器网络，并在每个时间步使用一个注意力机制层计算出一个上下文向量。

作为上述技术方案的进一步描述：

所述S4中，使用的注意力机制层为基于点积、加权点积、双线性或感知机方法中的一种或多种。

作为上述技术方案的进一步描述：

所述S5中，将上下文向量与解码器网络输出的隐藏状态向量相连接，并通过一个全连接层得到一个预测值。

作为上述技术方案的进一步描述：

所述S5中，使用的全连接层是具有激活函数和偏置项的线性变换层。

作为上述技术方案的进一步描述：

所述S6中，将预测值与真实值进行比较，并计算出损失函数，并通过反向传播算法更新网络参数，使用的损失函数是均方误差、均方根误差、平均绝对误差或平均绝对百分比误差中的一种或多种回归损失函数。

作为上述技术方案的进一步描述：

所述S7中，重复步骤S3-S6，直到损失函数收敛或达到预设条件，得到最终的造价预测模型，使用的反向传播算法是随机梯度下降、动量法、Nesterov加速梯度、Adagrad、RMSprop、Adam或Adamax中的一种或多种优化算法。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

本方法能够利用BIM模型中丰富而精确的工程量信息，结合物价变化因子，提高造价预测的准确性和可靠性；能够采用LSTM和注意力机制相结合的网络结构，有效地处理时序数据，并且关注不同时间步上不同重要性的信息，提高造价预测的效率和灵敏度；能够适应不同类型、规模、地点等特征的工程项目，并且具有良好的泛化能力和鲁棒性，降低造价预测的复杂度和难度。

附图说明

图1为一种应用于BIM的长短时注意力机制网络的造价预测方法的框架图。

图2为一种应用于BIM的长短时注意力机制网络的造价预测方法的网络结构示意图。

图3为一种应用于BIM的长短时注意力机制网络的造价预测方法中注意力机制层示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例1

请参阅图1-3，本发明提供一种技术方案：一种应用于BIM的长短时注意力机制网络的造价预测方法，包括如下步骤：

S1、从BIM模型中提取工程量信息，并根据工程特征进行分类和归一化处理；

S2、从历史数据或现场数据中获取物价变化因子，并根据时间序列进行插值；

S3、将提取的工程量信息和物价变化因子作为输入序列，送入一个由多层LSTM单元组成的编码器网络，得到一个隐藏状态向量；

S4、将隐藏状态向量作为输入，送入一个由多层LSTM单元组成的解码器网络，并在每个时间步使用一个注意力机制层计算出一个上下文向量，其中使用的注意力机制层为基于点积与加权点积方法；

S5、将上下文向量与解码器网络输出的隐藏状态向量相连接，并通过一个全连接层得到一个预测值，其中使用的全连接层是具有激活函数和偏置项的线性变换层；

S6、将预测值与真实值进行比较，并计算出损失函数，并通过反向传播算法更新网络参数，其中使用的损失函数是均方误差、均方根误差、平均绝对误差与平均绝对百分比误差回归损失函数；

S7、重复步骤S3-S6，直到损失函数收敛或达到预设条件，得到最终的造价预测模型，其中使用的反向传播算法是随机梯度下降、动量法、Nesterov加速梯度、Adagrad与RMSprop优化算法。

本实施例中，能够利用BIM模型中丰富而精确的工程量信息，结合物价变化因子，提高造价预测的准确性和可靠性；能够采用LSTM和注意力机制相结合的网络结构，有效地处理时序数据，并且关注不同时间步上不同重要性的信息，提高造价预测的效率和灵敏度；能够适应不同类型、规模、地点等特征的工程项目，并且具有良好的泛化能力和鲁棒性，降低造价预测的复杂度和难度。

实施例2

S4、将隐藏状态向量作为输入，送入一个由多层LSTM单元组成的解码器网络，并在每个时间步使用一个注意力机制层计算出一个上下文向量，其中使用的注意力机制层为基于点积、加权点积、双线性与感知机方法；

S7、重复步骤S3-S6，直到损失函数收敛或达到预设条件，得到最终的造价预测模型，其中使用的反向传播算法是随机梯度下降、动量法、Nesterov加速梯度、Adagrad、RMSprop、Adam与Adamax优化算法。

实施例3

S4、将隐藏状态向量作为输入，送入一个由多层LSTM单元组成的解码器网络，并在每个时间步使用一个注意力机制层计算出一个上下文向量，其中使用的注意力机制层为基于点积方法；

S6、将预测值与真实值进行比较，并计算出损失函数，并通过反向传播算法更新网络参数，其中使用的损失函数是均方误差回归损失函数；

S7、重复步骤S3-S6，直到损失函数收敛或达到预设条件，得到最终的造价预测模型，其中使用的反向传播算法是随机梯度下降优化算法。

实施例4,

如图1所示，本发明提供了一种应用于BIM的长短时注意力机制网络的造价预测方法，包括以下步骤：

S1、从BIM模型中提取工程量信息，并根据工程类型、工程规模、工程地点等特征对其进行分类和归一化处理。例如，对于一个住宅楼项目，从BIM模型中提取出建筑面积、层数、结构类型、材料种类等信息，并根据不同地区或不同年份的标准对其进行归一化处理，使其在0到1之间；

S2、从历史数据或现场数据中获取物价变化因子，并根据时间序列对其进行插值。例如，从国家统计局或其他权威机构获取各个地区或各个年份的建筑材料价格指数或建筑工程费用指数，并根据时间序列对其进行线性插值方法，得到一个连续且平滑的物价变化因子序列_。线性插值方法假设物价变化因子在相邻两个数据点之间是线性变化的，因此可以通过以下公式计算在任意时间点t上的物价变化因子：

其中i为最大的满足t_i≤t的下标。根据时间t找到最接近t的两个数据点，分别为(t_i，f_i)和(t_i+1，f_i+1)，然后通过线性插值计算出时间t对应的物价变化因子f(t)；物价变化因子的时间粒度需要根据具体情况进行选择。由于该专利需要对建筑工程费用进行较为精细的调整，选择较小的时间粒度，按月或按季度统计物价变化因子；

S3、将提取的工程量信息和物价变化因子作为输入序列，送入一个由多层LSTM单元组成的编码器网络，得到一个隐藏状态向量。例如，将输入序列按照时间顺序排列，并且每个时间步包含若干个特征值(如建筑面积、层数、结构类型、材料种类、物价变化因子等)，然后送入一个由三层LSTM单元组成的编码器网络，并且每层LSTM单元有128个神经元，最后得到一个128维度的隐藏状态向量，作为编码器网络的输出；

S4、将隐藏状态向量作为输入，送入一个由多层LSTM单元组成的解码器网络，并在每个时间步使用一个注意力机制层计算出一个上下文向量；

S5、将上下文向量与解码器网络输出的隐藏状态向量相连接，并通过一个全连接层得到一个预测值；

S6、将预测值与真实值进行比较，并计算出损失函数，并通过反向传播算法更新网络参数；

预测值与真实值进行比较的过程中，阈值设定为0.15，如果差异小于0.15，就认为预测结果准确。

在反向传播算法中，如果预测值与真实值之间的差异大于阈值，那么损失函数的值也会相应地增大，从而导致更新的梯度也会增大。

具体来说，反向传播算法通过计算损失函数对网络输出的梯度来开始，然后逐层向前计算每个层的梯度。最后，通过使用梯度下降等优化算法来更新网络参数，使得损失函数最小化。

假设w_i表示第i个权重参数，b_j表示第j个偏置参数，α表示学习率，则参数的更新公式为：

其中，L表示损失函数。反向传播算法通过计算损失函数对网络参数的偏导数来获得和/>然后，将它们带入更新公式中，更新网络参数。这个过程将不断迭代，直到损失函数收敛或达到预设条件。

S7、重复S3-S6，直到损失函数收敛或达到预设条件，得到最终的造价预测模型。

如图2所示，本发明的网络结构示意图如下：

输入层：接收输入序列，每个时间步包含若干个特征值；

编码器层：由多层LSTM单元组成，对输入序列进行编码，得到一个隐藏状态向量；

解码器层：由多层LSTM单元组成，对隐藏状态向量进行解码，并在每个时间步使用注意力机制层；

注意力机制层：根据解码器网络输出的当前隐藏状态和编码器网络输出的所有隐藏状态，计算出一个上下文向量；

输出层：将上下文向量与当前隐藏状态相连接，并通过全连接层得到一个预测值。

具体的训练步骤如下：

(1)从BIM模型中提取工程量信息，并根据工程类型、工程规模、工程地点等特征对其进行分类和归一化处理。例如，对于一个住宅楼项目，从BIM模型中提取出建筑面积、层数、结构类型、材料种类等信息，并根据不同地区或不同年份的标准对其进行归一化处理，使其在0到1之间；

(2)从历史数据或现场数据中获取物价变化因子，并根据时间序列对其进行插值。例如，从国家统计局或其他权威机构获取各个地区或各个年份的建筑材料价格指数或建筑工程费用指数，并根据时间序列对其进行线性插值方法，得到一个连续且平滑的物价变化因子序列；

(3)将提取的工程量信息和物价变化因子作为输入序列，送入一个由多层LSTM单元组成的编码器网络，得到一个隐藏状态向量。例如，将输入序列按照时间顺序排列，并且每个时间步包含若干个特征值(如建筑面积、层数、结构类型、材料种类、物价变化因子等)，然后送入一个由三层LSTM单元组成的编码器网络，并且每层LSTM单元有128个神经元，最后得到一个128维度的隐藏状态向量，作为编码器网络的输出；

(4)将隐藏状态向量作为输入，送入一个由多层LSTM单元组成的解码器网络，并在每个时间步使用一个注意力机制层计算出一个上下文向量；

(5)将上下文向量与解码器网络输出的隐藏状态向量相连接，并通过一个全连接层得到一个预测值；

(6)将预测值与真实值进行比较，并计算出损失函数，并通过反向传播算法更新网络参数；

如图3所示，本发明的注意力机制层示意图如下：

输入：解码器网络输出的当前隐藏状态ht和编码器网络输出的所有隐藏状态h1,h2,…,hn；

计算过程：

对于每个hi，计算其与ht的相似度score(ht,hi)，使用点积、加权点积、感知机方法；

对所有相似度进行归一化处理，得到一个注意力权重α；

将所有hi乘以相应的注意力权重α，并求和得到一个上下文向量ct；

输出：上下文向量ct。

本发明可以用于不同类型、规模、地点等特征的工程项目的造价预测，只需根据不同的项目特征对输入序列进行相应的处理，即可得到合适的预测模型。

实施例1-4中需要说明的是：

本发明解决的技术问题是如何利用BIM模型中的工程量信息，结合物价变化因子，提高工程项目的造价预测准确性、可靠性、效率和灵敏度。本发明与现有技术的区别在于：现有技术主要依赖于人工经验或统计方法进行造价预测，缺乏对BIM模型中丰富而精确的工程量信息的利用，造价预测结果往往存在较大的误差和不确定性；现有技术主要采用传统的机器学习或深度学习方法进行造价预测，忽略了物价变化因子对造价预测的影响，造价预测结果往往存在较大的滞后和不灵敏性；现有技术主要采用固定的网络结构进行造价预测，缺乏对时序数据中不同时间步上不同重要性信息的关注，造价预测结果往往存在较大的偏差和不稳定性；现有技术主要针对特定类型、规模、地点等特征的工程项目进行造价预测，缺乏对不同特征工程项目的适应性和泛化能力，造价预测结果往往存在较大的局限性和不鲁棒性。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于：包括如下步骤：

S1、从BIM模型中提取工程量信息；

S2、从历史数据或现场数据中获取物价变化因子；

S6、将预测值与真实值进行比较，并计算出损失函数；

S7、得到最终的造价预测模型。

2.根据权利要求1所述的一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于，所述S1中，从BIM模型中提取工程量信息，并根据工程特征进行分类和归一化处理。

3.根据权利要求1所述的一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于，所述S2中，从历史数据或现场数据中获取物价变化因子，并根据时间序列进行插值。

4.根据权利要求1所述的一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于，所述S3中，将提取的工程量信息和物价变化因子作为输入序列，送入一个由多层LSTM单元组成的编码器网络，得到一个隐藏状态向量。

5.根据权利要求1所述的一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于，所述S4中，将隐藏状态向量作为输入，送入一个由多层LSTM单元组成的解码器网络，并在每个时间步使用一个注意力机制层计算出一个上下文向量。

6.根据权利要求1所述的一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于，所述S4中，使用的注意力机制层为基于点积、加权点积、双线性或感知机方法中的一种或多种。

7.根据权利要求1所述的一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于，所述S5中，将上下文向量与解码器网络输出的隐藏状态向量相连接，并通过一个全连接层得到一个预测值。

8.根据权利要求1所述的一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于，所述S5中，使用的全连接层是具有激活函数和偏置项的线性变换层。

9.根据权利要求1所述的一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于，所述S6中，将预测值与真实值进行比较，并计算出损失函数，并通过反向传播算法更新网络参数，使用的损失函数是均方误差、均方根误差、平均绝对误差或平均绝对百分比误差中的一种或多种回归损失函数。

10.根据权利要求1所述的一种应用于BIM的长短时注意力机制网络的造价预测方法，其特征在于，所述S7中，重复步骤S3-S6，直到损失函数收敛或达到预设条件，得到最终的造价预测模型，使用的反向传播算法是随机梯度下降、动量法、Nesterov加速梯度、Adagrad、RMSprop、Adam或Adamax中的一种或多种优化算法。