CN117435918B

CN117435918B - 一种基于空间注意力网络与特征划分的电梯风险预警方法

Info

Publication number: CN117435918B
Application number: CN202311756483.3A
Authority: CN
Inventors: 王黎斌; 李伟忠; 周东; 崔天顺; 余浩翔; 费麒铭; 张宇; 许卫全; 吴琳琳; 邓晓峰; 马舜; 邵鹏
Original assignee: Hangzhou Special Equipment Testing And Research Institute Hangzhou Special Equipment Emergency Response Center
Current assignee: Hangzhou Special Equipment Testing And Research Institute Hangzhou Special Equipment Emergency Response Center
Priority date: 2023-12-20
Filing date: 2023-12-20
Publication date: 2024-03-15
Anticipated expiration: 2043-12-20
Also published as: CN117435918A

Abstract

本发明提供的一种基于空间注意力网络与特征划分的电梯风险预警方法，其通过获取物联网电梯的原始数据，对原始数据进行预处理和归一化处理，为精准预测物联网电梯故障概率提供了数据基础；通过构建由多个跨层连接的transformer编辑器组成的transformer模型，解决了现有技术中随着网络层数增加训练网络模型发生退化的问题，同时也能保证特征信息在逐层传播时不会丢失；通过对时序特征进行位置编码以及通过多头自注意力机制的transformer模型进行降维处理，增大了transformer模型的并行性，有效地提高了训练速度。

Description

一种基于空间注意力网络与特征划分的电梯风险预警方法

技术领域

本发明属于电梯故障预警技术，尤其涉及一种基于空间注意力网络与特征划分的电梯风险预警方法。

背景技术

随着我国的经济发展和城市化进程的加快，电梯的安装，部署数量迅速增大，目前保有量已达到保有量世界第一。随之而来的问题便是电梯故障、困人等安全事故时有发生，造成社会经济财产损失和人员伤亡。由于目前电梯的监管、维保技术规范等标准还尚未完全成熟，频繁对电梯进行维护会产生大量人力、物力以及时间成本，并且电梯故障受到工作环境、运行状况、电梯参数、人为破坏等诸多因素的影响。因此设计出一种适用性较好的电梯故障预测和维保方案具有一定的挑战性。

随着科技的飞速发展和社会的深度变革，物联网已经逐渐成为推动经济发展、改善人民生活的重要力量。在智智慧物流、智慧农业、智慧医疗、智能家居、智慧交通、智慧安防等方面取得了广泛的应用。Transformer的提出是深度学习史上具有里程碑意义的事件，其特殊的机制使得其在自然语言处理和计算机视觉领域均取得了巨大的成功。

传统时间序列模型常伴有一系列问题：1）传统时间序列模型依赖于其归纳偏置，当时序特征不明显时网络表现不佳；2）容易收敛于局部最小值，无法找到最优解；3）LSTM并行性较差，训练消耗时间较多。

发明内容

本发明为了克服现有技术的不足，提供了一种基于空间注意力网络与特征划分的电梯风险预警方法。

为了实现上述目的，本发明提供了一种基于空间注意力网络与特征划分的电梯风险预警方法，其包括以下步骤：

S1：采集物联网电梯的原始数据，对原始数据进行预处理，对预处理后的所有数据特征进行归一化处理，生成时序特征；

S2：通过Embedding层对时序特征进行位置编码，将位置编码与原时序特征相加获得第一特征；

S3：将编码后的第一特征与静态特征拼接获得模型的输入特征，将输入特征按照时间序列输入至多头自注意力机制的transformer模型中进行降维，将降维得到的结果与输入特征相加获得注意力特征；所述transformer模型包括至少两个堆叠的transformer编码器，各编码器之间跨层连接；

S4：将注意力特征与未经过自注意力层处理的特征相加，将相加结果输入至layernorm层获得第二特征；

S5：将第二特征输入至一全连接层，再将结果与第二特征相加得到第三特征；

S6：将第三特征输入至layernorm层获得第四特征；

S7：将第四特征与编码后的第一特征相加获得首个编码器的结果；

S8：重复步骤S3至步骤S7的过程至少一次，当重复最后一次过程时，将结果输入至一全连接层，将其结果通过分类模块激活，获得各时段预测的故障概率，生成预测结果；

S9：获取电梯实际故障结果，将预测结果和实际故障结果通过交叉熵损失函数计算对应的损失度，采用Adam优化器优化生成的transformer模型；

S10：重复步骤S3至步骤S9的过程，训练transformer模型，获得预警结果。

优选的，步骤S1中，物联网电梯的原始数据包括：电梯数据、故障数据、天气数据。

优选的，步骤S1中，所述原始数据进行预处理的步骤包括：

S1.1:将原始数据中空缺的数据采用径向基函数插值法进行插值，使用高斯函数作为径向基函数，其插值公式为：

其中x为原始数据，为原始数据的方差。

S1.2：对原始数据进行校正。

优选的，步骤S2中，所述时序特征进行位置编码的计算公式为：

其中，pos表示位置索引，d_model表示输入的嵌入维度，i表示嵌入向量中的第几维，PE表示计算获得的位置编码。

优选的，步骤S3具体步骤包括：

S31：将拼接后的特征按照时间序列分成多个方块并将其排成一列；

S32：将重新排列后的特征按照时间序列的方式输入transformer模型的线性层进行加权求和，以获得维度为的查询向量、维度为的键向量和维度为的值向量；

S3.3：计算注意力特征，其计算公式为：

，

其中，表示Softmax激活函数，表示时间序列，n表示时间序列长度，m表示序列中的元素。

优选的，步骤S3中，拼接后的输入特征可在transformer模型的不同位置之间进行注意力传递。

优选的，步骤S3中，各transformer编码器之间的结构表达式为：

其中，表示上一transformer编码器的输入特征，表示当前 transformer编码器输出。

优选的，步骤S5中的layernorm层内设有残差模块，所述残差模块与全连接层跳跃连接。

优选的，步骤S8中，步骤S3至步骤S7的重复次数为transformer编码器的堆叠个数。

优选的，步骤S8中，分类模块通过sigmoid激活函数对全连接层的结果进行激活，获得预测概率。

综上所述，本发明提供的一种基于空间注意力网络与特征划分的电梯风险预警方法，其有益效果在于，其通过获取物联网电梯的原始数据，对原始数据进行预处理和归一化处理，为精准预测物联网电梯故障概率提供了数据基础；通过构建由多个跨层连接的 transformer编辑器组成的transformer模型，解决了随着网络层数增加训练网络模型发生退化的问题，同时也能保证特征信息在逐层传播时不会丢失；通过对时序特征进行位置编码以及多头自注意力机制的transformer模型进行降维处理，增大了transformer 模型的并行性，有效地提高了训练速度。

附图说明

图1为本发明实施例提供的基于空间注意力网络与特征划分的电梯风险预警方法的流程图；

图2为本发明实施例提到的原始数据类别信息示意图；

图3为本发明实施例提供的一种基于transformer模型结构的电梯大数据风险预警方法中处理流程的示意图；

图4为本发明实施例提供的transformer模型中跨层连接的示意图

图5为Sigmoid激活函数的预测结果图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。另外，本发明中所描述的“第一特征、第二特征…”，仅用于区分特征，不对特征做任何限定。

如图1所示，本发明提供了一种基于空间注意力网络与特征划分的电梯风险预警方法，其包括以下步骤：

S3：将编码后的第一特征与静态特征拼接获得模型输入特征，将输入特征按照时间序列输入至多头自注意力机制的transformer模型中进行降维，将降维得到的结果与输入特征相加获得注意力特征；所述transformer模型包括至少两个堆叠的transformer编码器，各编码器之间跨层连接；

S6：将第三特征输入至layernorm层获得第四特征；

具体的，空间注意力网络为transformer模型。本实施例中的原始数据是历史物联网电梯数据，本发明采用基于特征划分与transformer模型对原始数据进行建模，实现电梯故障预测预警。从处理流程上，本发明可分为数据预处理流程和故障预处理流程。其中本发明中的步骤S1为数据预处理流程，于该步骤中，通过对原视数据预处理，可获得完整且合理的数据，进而提高数据的准确性，为故障预测处理流程提供了数据支持，提高了故障预测结果的准确性。此外，本发明提供的一种基于transformer的电梯大数据风险预警方法运用于电梯风险预警大数据模型系统中，电梯风险预警大数据模型系统包括预处理模块和预测模块，预处理模块用于将原始数据处理为可用于transformer模型训练的数据，预测模块用于对原始数据进行建模以及预测之后一段时间电梯故障事件的发生概率。本发明中收集到的电梯故障类型分为电梯困人、开门运行、电梯持续开关门、电梯超速和其他异常事件。

于步骤S1来说，为了确保故障预测的准确性，首先采集物联网电梯的历史数据进行故障预测。其中，本实施例多数的物联网电梯是指具有物联网功能的电梯，相较于传统的电梯，本发明的物联网电梯配置安装了网关、传感器、摄像头等终端设备，进而对电梯各种故障、运行等数据进行采集。

如图2所示，物联网电梯的原始数据包括：电梯数据（电梯基础数据）、故障数据（电梯故障、维保信息）和天气数据（时间天气信息）。

如表1所示，本发明实施例提供的电梯清单表的具体内容信息电梯的基础信息包括电梯所在的场所类型、注册代码、电梯类型、类型、使用状态、住户数、经纬度、电梯楼层数、制造单位、安装单位、使用年限、维保单位等。电梯的基础信息包含的子段较多，彼此之间的关系也相对多样。

表1

如表2所示，为本发明实施例提供的故障记录表的具体内容信息。电梯的维保/故障信息包括故障的具体日期、解救人数、救援到达时间、救援用时、施救单位、原因、故障发生时间、故障类别等。由于电梯的故障报警存在一段时间内连续多次的情况，因此只统计当天内是否发生故障报警，并将当天的报警次数作为一个新的特征输入到模型中。

表2

如表3所示，为本发明实施例提供的天气气温表的具体内容信息。电梯的时间天气信息包括电梯所在地的天气、气温信息、季节信息、节假日信息等。

表3

于步骤S1中，获得物联网电梯原始数据后，由于在数据采集时存在设备异常和人为失误等因素，采集到的数据中存在数据乱码、数据缺失、数据混杂等问题。因此，需要对原始数据进行预处理以得到完整、合理的数据。对于原始数据中明显存在错误的信息，采取人工核查、自动补正数据值异常和删除异常数据等方式进行清洗。对原始数据进行清洗的步骤包括：

S1.1：将原始数据中空缺的数据采用径向基函数插值法进行插值，使用高斯函数作为径向基函数，其插值公式为：

其中x为原始数据，为原始数据的方差。

S1.2：对原始数据进行校正。

原始数据经过预处理后，对多有数据的特征进行归一化。归一化处理是将每个数据特征都转化为均值为0、方差为1的数据，减少数据量级对数据的影响，原始数据经过归一化处理后，生成时序特征。

于步骤S2来说，原始数据转换成时序特征后，为了在时间序列中表示每个特征元素出现的位置和顺序，时序特征通过Embedding层映射至特征空间中，进行位置编码position encoding。位置编码后，将位置编码PE与原时序特征（即，步骤S1生成的时序特征）相加（PE+Sseries）获得第一特征。其中，时序特征进行位置编码的计算公式为：

本实施例中，与步骤S3来说，时序特征经过编码后的，将编码后的第一特征与静态特征经过拼接后生成输入特征s，将输入特征s按照时间序列输入至多头自注意力机制的transformer模型中进行降维，输入特征s经过transformer模型降维后将降维结果与输入特征s相加获得注意力结果。具体的，因此采用多头自注意力的transformer模型进行处理。在transformer模型中，拼接后的输入特征s可在 transformer模型的不同位置之间进行注意力传递，以便于获得不同时间序列特征的上下文交互信息，使得多头自注意力机制的transformer模型更能关注于拼接后的输入特征s中对电梯故障预警有帮助的特征，提高了transformer模型的训练速度。

于步骤S3中，为了提取不同时间序列的物联网电梯特征，将输入特征看作二维的图像特征，其具体提取过程为：

S31：将拼接后的特征按照时间序列分成多个方块并将其排成一列，所述方块优选为2*2的排列形式，该排列形式可根据需求设置；

S3.3：计算注意力特征，其计算公式为：

，

其中，表示Softmax激活函数，表示时间序列，n表示时间序列长度，m表示序列中的元素，表示查询向量，v表示值向量。

本实施例中，在步骤S4、S5、S6中，将注意力特征与未经过自注意力层处理的特征相加，其中，未经过自注意力层处理的特征是指步骤S2生成的第一特征，自注意力层是多头自注意力机制的transformer模型的一部分，并将结果输入至transformer模型中带有残差连接的layernorm层，获得第二特征，将第二特征再输入至一全连阶层进行卷积和池化操作，再将结果与第二特征相加获得第三特征。步骤S4中的layernorm层内设置了残差模块，残差模块与全连接层跳跃连接。获得第三特征后，将第三特征输入至layernorm层，得到第四特征。

于步骤S7中，为避免模型训练时深层梯度难以反向传播到浅层，将获得的第四特征与编码后的第一特征相加获得transformer模型中首个 transformer编码器的结果。

如图3所示，为本发明实施例提供的一种基于transformer模型结构的电梯大数据风险预警方法中处理流程示意图。首先把历史物联网电梯数据根据特征性质划分为静态特征和时序特征。然后将其进行归一化操作，减少数据量级对数据的影响。然后通过Embedding层将时序特征映射至特征空间，再将特征进行位置编码得到，并将其与静态特征进行拼接得到输入特征s。接着将拼接后的特征输入至基于空间多头自注意力机制的transformer模型中在模型的最后部分，通过基于 Sigmoid激活函数的分类模块输出预测结果。由于分类模块得到的预测结果的正样本和负样本可能存在差距过大的问题，通过交叉熵损失函数交叉熵计算得到损失度，Adam优化器根据损失度对分类模块进行优化，增加少量正样本的loss值，减小大量负样本的loss值，达到减少正负样本数量差距过大带来的影响。使用训练完成的分类模块对待预测的物联网电梯进行预测、评估。

于步骤S8中，该步骤为预测步骤，通过重复步骤S3至步骤S7的过程至少一次。本实施例中，如图4所示，transformer模型包括至少两个堆叠的transformer编码器，各编码器之间跨层连接，解决了随着网络层数增加训练网络模型发生退化的问题，同时也能保证特征信息在逐层传播时不会丢失。而步骤S3至步骤S7的重复次数与transformer编码器堆叠个数相同。各transformer编码器之间的结构表达式为：

如表4所示，为本发明实施例提供最终选择的transformer模型参数。Transformer编码器的个数选为9层，隐含神经元数量为512个，模型的学习率设置为1e-4。需要说明的是，transformer编码器的相关参数可以根据实际使用场景进行调整。当重复过程到达最后一次时不进行步骤9，而是将结果输入进一个输出为4的全连接层并将得到结果通过分类模块来预测各时段的故障概率。

表4

其中，分类模块处理特征时，将全连接结果使用sigmoid激活函数将输出值控制在0和1之间，以此来获得预测的故障概率，进而生成预测结果。Sigmoid激活函数的预测结果图，如图5所示。

于步骤S9来说，该步骤为优化步骤，先获取物联网电梯的实际故障结果，将其与预测结果通过交叉熵损失函数得到损失度，而后通过Adam优化器来优化生成的transformer模型。具体的，获取物联网电梯的实际故障概率可提高模型的准确性。而使用交叉熵损失函数计算得到的损失度可以衡量电梯故障事件的预测发生概率和实际发生概率之间的差异，Adam优化器根据损失度对分类模块进行优化，增加少量正样本的loss值，减小大量负样本的loss值，减少了transformer模型中正样本和负样本不均衡带来预测准确性较低的问题，有利于对transformer模型中的样本进行分类，同时也提高其权重。样本指的是在实际使用时物联网电梯数据根据样本方法处理得到的预测结果，若预测结果和实际结果一致，则称为正样本，若预测结果和实际结果不一致，则称为负样本。transformer模型优化完成后，重复步骤S3至步骤S9的过程，对transformer模型进行多次训练。使用训练完成的transformer模型对待预测的物联网电梯进行预测、评估。在实际测试中，本发明以召回率作为评价指标，通过实测得到的召回率获得了较好的预测结果，验证了该方法的准确性和有效性。

如表5（a）~表5（e）所示，为本发明实测过程的预测结果。本发明以位于杭州市的通力品牌的物联网电梯为实测对象，进行测试检验。其测试结果如下：对于开关门，在平均预测数量为2000个的情况下，2023年3月至2023年4月的召回率均达到35%以上；对于超速，在平均预测数量为500个的情况下，2023年3月至2023年4月的平均召回率达到约16%；对于其他类型的故障，在平均预测数量为750个的情况下，2023年3月至2023年4月的平均召回率达到约10%。基于上述测试结果，本发明的实用效果较好。

表5（a）

表5 (b)

表5 (c)

表5 (d)

表5 (e)

显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

Claims

1.一种基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，其包括以下步骤：

S4：将注意力特征与未经过自注意力层处理的特征相加，将相加结果输入至layernorm层获得第二特征，其中，未经过自注意力层处理的特征是指步骤 S2 生成的第一特征；

S6：将第三特征输入至layernorm层获得第四特征；

2.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，所述步骤S1中，物联网电梯的原始数据包括：电梯数据、故障数据、天气数据。

3.根据权利要求2所述的基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，所述步骤S1中，所述原始数据进行预处理的步骤包括：

，

其中x为原始数据，为原始数据的方差；

S1.2：对原始数据进行校正。

4.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，所述步骤S2中，所述时序特征进行位置编码的计算公式为：

，

5.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，所述步骤S3具体步骤包括：

S32：将重新排列后的特征按照时间序列的方式输入transformer模型的线性层进行加权求和，以获得维度为的查询向量/>、维度为/>的键向量/>和维度为/>的值向量/>；

S3.3：计算注意力特征，其计算公式为：

，

其中，表示Softmax激活函数，/>表示时间序列，n表示时间序列长度，m表示序列中的元素。

6.根据权利要求5所述的基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，所述步骤S3中，拼接后的输入特征可在transformer模型的不同位置之间进行注意力传递。

7.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，所述步骤S3中，各transformer编码器之间的结构表达式为：

，

其中，表示上一transformer编码器的输入特征，/>表示当前transformer编码器输出。

8.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，所述步骤S4中的layernorm层内设有残差模块，所述残差模块与全连接层跳跃连接。

9.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，所述步骤S8中，步骤S3至步骤S7的重复次数为transformer编码器的堆叠个数。

10.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法，其特征在于，所述步骤S8中，分类模块通过sigmoid激活函数对全连接层的结果进行激活，获得预测概率。