CN115795351A - 一种基于残差网络和2d特征表示的电梯大数据风险预警方法 - Google Patents

一种基于残差网络和2d特征表示的电梯大数据风险预警方法 Download PDF

Info

Publication number
CN115795351A
CN115795351A CN202310043509.3A CN202310043509A CN115795351A CN 115795351 A CN115795351 A CN 115795351A CN 202310043509 A CN202310043509 A CN 202310043509A CN 115795351 A CN115795351 A CN 115795351A
Authority
CN
China
Prior art keywords
elevator
features
residual error
data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310043509.3A
Other languages
English (en)
Other versions
CN115795351B (zh
Inventor
王黎斌
李伟忠
汪宏
王启洲
魏薇
许卫全
张宇
徐天宇
邓丽芬
王陆嘉
朱俊超
任玉标
马舜
周俊坚
周原冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Special Equipment Testing And Research Institute Hangzhou Special Equipment Emergency Response Center
Original Assignee
Hangzhou Special Equipment Testing And Research Institute Hangzhou Special Equipment Emergency Response Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Special Equipment Testing And Research Institute Hangzhou Special Equipment Emergency Response Center filed Critical Hangzhou Special Equipment Testing And Research Institute Hangzhou Special Equipment Emergency Response Center
Priority to CN202310043509.3A priority Critical patent/CN115795351B/zh
Publication of CN115795351A publication Critical patent/CN115795351A/zh
Application granted granted Critical
Publication of CN115795351B publication Critical patent/CN115795351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Indicating And Signalling Devices For Elevators (AREA)

Abstract

本发明公开了一种基于残差网络和2D特征表示的电梯大数据风险预警方法,旨在克服现有技术中数据量大、模型容易过拟合和易产生梯度消失/爆炸等问题,它包括对数据预处理流程和困人预测流程,在困人预测流程中,系统将时间序列特征
Figure ZY_1
输入至分类模块,分类模型中的平均池化下采样对时间序列特征
Figure ZY_2
进行降维处理,分类模型中的两层全连接神经网络模型将降维处理后的时间序列特征
Figure ZY_3
维度转换为2,系统将维度为2的时间序列特征
Figure ZY_4
代入分类模型的softmax函数得到预测结果。

Description

一种基于残差网络和2D特征表示的电梯大数据风险预警方法
技术领域
本发明属于电梯故障预警技术,特指一种基于残差网络和2D特征表示的电梯大数据风险预警方法。
背景技术
随着我国经济的不断发展,各地区城市化的不断推进,电梯的需求不断增多,截止2020年底,我国电梯保有量达786.55万台左右,保有量世界第一。。目前我国电梯还存在着诸多问题,技术规范标准还在完善,目前的数据采集处理方式、存储装置和信息服务平台设计具有差异;维护单位技术参差不齐;受到人为破坏等不确定事件;电梯运行状况易受季节气候影响。因此很难设计一种广泛适用的方法对电梯故障和安全维护进行预测。
自物联网被确立为国家重点发展战略技术以来,取得了长足的发展,在智能家居,智慧城市、工业生产、智能安防方面实现万物互联,成为了电梯故障预测及维护的重要媒介。残差网络的提出是计算机视觉史上具有里程碑意义的事件,ResNet分别在ILSVRC和COCO 2015等比赛获得了优异的成绩,刷新了CNN模型在ImageNet上的历史。同时,ResNet也是2016年CVPR的最佳论文的模型。
传统时间序列模型常伴有一系列问题:1)时间序列过长时计算资源消耗量大:当时间序列过大时,LSTM网络的层数会加深,从而导致退化(degradation)的现象,既随着网络层数和训练次数的增加,loss反而增大;2)模型容易出现过拟合的现象:既模型在训练集的效果表现优越,在测试集效果较差;3)容易产生梯度消失/爆炸的问题:梯度前向传播过程中,梯度值无限接近于0或无限大,导致模型无法找到最优解。
发明内容
为克服现有技术的不足及存在的问题,我们没有简单地聚合物联网历史数据以得到时间序列特征,而是将物联网电梯数据划分为密集特征和稀疏特征,并引入了一种时间自注意力机制去捕捉时间序列变换信息,以得到更具有帮助的特征表示,再通过残差神经网络方法将时间序列特征转换为二维图像特征,通过分类模块得到是否发生故障。
本发明提供了一种基于残差网络和2D特征表示的电梯大数据风险预警方法,该方法包括以下步骤:
步骤1:系统按照时间序列采集历史物联网电梯数据,按照时间序列顺序生成时间 序列特征及是否发生故障标签,将历史物联网电梯数据划分为密集特征
Figure SMS_1
和稀疏特征
Figure SMS_2
,对密集特征
Figure SMS_3
和稀疏特征
Figure SMS_4
进行归一化处理;
步骤2:系统将归一化处理后的密集特征
Figure SMS_5
和稀疏特征
Figure SMS_6
带入皮尔逊相 关系数公式计算得到特征与电梯故障事件之间的皮尔逊相关系数,判断特征与电梯故障事 件之间的皮尔逊相关系数是否低于阈值α,若是则筛除密集特征
Figure SMS_7
和稀疏特征
Figure SMS_8
中的相应特征;
步骤3:系统通过Embedding层对筛除后的稀疏特征
Figure SMS_9
进行映射处理,映射后 的稀疏特征
Figure SMS_10
与密集特征
Figure SMS_11
具有相同的维度,通过全连接神经网络模型对筛除后 的密集特征
Figure SMS_12
进行特征提取,将映射后的稀疏特征
Figure SMS_13
和特征提取后密集特征
Figure SMS_14
进行拼接;
步骤4:系统将拼接后的特征按照时间序列输入至多头自注意力机制模型获得注 意力结果
Figure SMS_15
步骤5:系统将注意力结果
Figure SMS_16
输入至残差神经网络模型得到时间序列特征
Figure SMS_17
步骤6:系统将时间序列特征
Figure SMS_18
输入至分类模块,分类模型中的平均池化下采 样对时间序列特征
Figure SMS_19
进行降维处理,分类模型中的两层全连接神经网络模型将降维处 理后的时间序列特征
Figure SMS_20
维度转换为2,系统将维度为2的时间序列特征
Figure SMS_21
代入分类 模型的softmax函数得到预测结果,其中,预测结果电梯故障事件的预测发生概率和预测不 发生概率;
步骤7:系统获取实际结果,将预测结果和实际结果代入Focal Loss损失函数得到损失度,通过Adam优化器优化残差神经网络模型,使得损失度得以降低,并对训练次数加1,其中,真实结果包括电梯故障事件的实际发生概率和实际不发生概率;
步骤8:系统判断训练次数是否小于100次,若是则迭代步骤3至步骤8。
作为优选,所述步骤1,具体包括如下步骤:
步骤11:系统获取原始数据,其中,原始数据包括电梯的位置信息、电梯的设备信息、电梯的困人/故障信息、电梯的时间天气信息;
步骤12:系统对原始数据进行数据清洗得到按时间序列排列的历史物联网电梯数据。
作为优选,所述步骤12,具体包括如下步骤:
步骤121:系统将原始数据代入分段三次埃尔米特插值方法进行缺失补全;
步骤122:系统对统一原始数据中的格式和内容错误的数据以及修改逻辑上错误的数据;
步骤123:系统对原始数据进行关联性验证、数据运算、分类和统计产生按时间序列排列的历史物联网电梯数据,并存储至数据库中。
作为优选,所述步骤4,具体包括:
步骤41:系统将拼接后的特征按照时间序列输入多头注意力机制模块中线性层得 到维度为
Figure SMS_22
的Query向量、维度为
Figure SMS_23
的Key向量以及维度为
Figure SMS_24
的Value向量,分别采用
Figure SMS_25
Figure SMS_26
Figure SMS_27
表示;
步骤42:系统计算
Figure SMS_28
和特征中其他序列片段Kay值的点积,其点积结果用
Figure SMS_29
表 示,其中,
Figure SMS_30
属于
Figure SMS_31
Figure SMS_32
步骤43:系统将
Figure SMS_33
除以
Figure SMS_34
,将
Figure SMS_35
除以
Figure SMS_36
的结果代入如下Softmax函数得到 注意力结果
Figure SMS_37
Figure SMS_38
其中,
Figure SMS_39
表示Softmax激活函数,
Figure SMS_40
表示时间序列,
Figure SMS_41
表示Key向量的维 度,用于防止乘积过大。
作为优选,所述分类模型基于Sigmoid激活函数。
作为优选,所述残差神经网络模型是一系列残差模块构成的网络,残差模块由直接映射和残差部分构成。
作为优选,所述残差神经网络模型包括如下公式所示的一种残差模块:
Figure SMS_42
其中,
Figure SMS_43
表示上一个残差模块的输出特征,
Figure SMS_44
表示残差部分,残差部分由两 个或三个卷积操作构成,每个卷积操作中间使用批标准化处理防止残差神经网络模型过拟 合,最后使用Relu激活函数引入非线性关系。
作为优选,所述残差神经网络模型还包括如下公式所示的bottleneck的残差模块:
Figure SMS_45
其中,
Figure SMS_46
表示1x1大小卷积操作。
作为优选,所述残差神经网络的层数为9层,隐含神经元数量为28个,模型的学习率设置为1e-4。
本发明相比现有技术突出且有益的技术效果是:
在本发明中,相比于现有技术,本方法能够提取时间序列上的物联网电梯数据并通过多头自注意力机制模型进行特征提取,增加与电梯故障时间成正相关的时间序列片段权重,减少与电梯故障时间成负相关的时间序列片段权重,以提升模型的召回率,进而保证了预警的准确性和有效性。此外,本发明将特征一维时间序列转变为二维图像序列,利用带有残差模块的神经网络模型用于特征提取,并通过平均池化下采样、全连接神经网络模型和softmax函数得到预测结果。
在本发明中,该发明可以在电梯风险预警中有效学习历史物联网电梯数据中的高级特征。此外,在实测过程中,该方法在杭州市的物联网电梯的故障预测上表现优异,及时降低了物联网电梯的停梯率,及时能够排除物联网电梯的故障。
在本发明中,针对背景技术中提到的第1个问题,由于传统的网络模型随着层数加深,特征的图像信息会逐渐减少,而本发明使用的残差神经网络模型可以通过short cut的方式保证了k+1层的网络一定比+k层包含更多的图像信息。针对背景技术中提到的第2个问题,本发明的残差神经网络模型使用平均池化下采样(Dropout)等正则化方法,有效减少了模型出现过拟合的问题。针对背景技术中提到的第3个问题,本发明使用的残差神经网络模型通过批标准化(Batch Normalization)处理来避免梯度消失或梯度爆炸的问题。
附图说明
图1为本发明实施例提供的一种基于残差网络和2D特征表示的电梯大数据风险预警流程图;
图2为本发明实施例提到的原始数据类别信息示意图;
图3为本发明的原始数据包括的主要异常类型信息示意图;
图4为本发明实施例提供的数据清洗流程示意图;
图5为本发明实施例提供的电梯清单表的具体内容信息示意图;
图6为本发明实施例提供的困人/故障记录表的具体内容信息示意图;
图7为本发明实施例提供的天气气温表的具体内容信息示意图;
图8为本发明实施例提供的电梯风险预警大数据模型系统结构图;
图9为本发明实施例提供的一种基于残差网络和2D特征表示的电梯大数据风险预警方法中处理流程示意图;
图10为本发明实施例提供的残差神经网络模型中的一种残差模块的示意图;
图11为本发明实施例提供的残差神经网络模型中的另一种残差模块的示意图;
图12为本发明实施例提供的自注意力机制模型的示意图;
图13为Sigmoid激活函数图;
图14为本发明实施例提供的本发明最终选择的残差神经网络模型参数示意图;
图15为本发明实施例提供的系统的实测过程的预测结果示意图。
具体实施方式
为了便于本领域技术人员的理解,下面结合附图和具体实施例对本发明作进一步描述。
如图1至图15所示,本实施例基于时间序列对历史物联网电梯数据进行特征提取及自注意力机制分析,进而用于物联网电梯故障困人预测评估。使用基于深度学习的时间序列预测算法来解决电梯风险预警问题,可以将方法分为数据预处理流程与困人预测流程。为了说明本发明所述的技术方案,下面结合附图和具体实施例作说明。
如图1所示,为本发明实施例提供的一种基于残差网络和2D特征表示的电梯大数据风险预警流程图,本方法包括如下步骤:
步骤1:系统按照时间序列采集历史物联网电梯数据,按照时间序列顺序生成时间 序列特征及是否发生故障标签,即把特征按时间顺序排序,将历史物联网电梯数据划分为 密集特征
Figure SMS_47
和稀疏特征
Figure SMS_48
,对密集特征
Figure SMS_49
和稀疏特征
Figure SMS_50
进行归一化处 理;
上述步骤中,物联网电梯指的是具有物联网功能的电梯,相较于传统的电梯,本发明的物联网电梯指的是在不改变电梯原有电气线路以及传感系统情况下,给电梯配置安装智能网关、智能传感器、智能摄像头等终端设备,通过上述的终端设备对电梯各种故障、运行和统计等数据(又称为历史物联网电梯数据)进行采集并传送至基于残差网络的电梯风险预测系统(简称为系统),从而实现系统按照时间序列采集物联网电梯数据。历史物联网电梯数据可用x表示。
物联网电梯数据由物联网设备采集的特征组成的集合包括温度,运行次数,安装 时间等。其中,一些特征能够用one-hot表示的称为稀疏特征
Figure SMS_51
,如允许次数。一些特征 能够用向量表示的称为密集特征
Figure SMS_52
,如温度。并且密集特征
Figure SMS_53
的特征是连续的,系 统根据两者区别将物联网电梯数据划分为密集特征
Figure SMS_54
和稀疏特征
Figure SMS_55
并进行归一 化处理,从而消除特征的量纲,以便于后续进行模型训练时找到最优解。稀疏特征
Figure SMS_56
为 由能够用one-hot表示的特征集,密集特征
Figure SMS_57
为由能够用向量表示的特征集。
步骤2:系统将归一化处理后的密集特征
Figure SMS_58
和稀疏特征
Figure SMS_59
带入皮尔逊相 关系数公式计算得到特征与电梯故障事件之间的皮尔逊相关系数,判断特征与电梯故障事 件之间的皮尔逊相关系数是否低于阈值α,若是则筛除密集特征
Figure SMS_60
和稀疏特征
Figure SMS_61
中的相应特征;
上述步骤中,系统将密集特征
Figure SMS_64
和稀疏特征
Figure SMS_67
代入皮尔逊相关系数公式 计算得到密集特征
Figure SMS_70
和稀疏特征
Figure SMS_63
之间的皮尔逊相关系数,判断皮尔逊相关系数 是否低于阈值α,若否,则保留密集特征
Figure SMS_65
和稀疏特征
Figure SMS_68
中的相应特征,若是,则筛 除密集特征
Figure SMS_71
和稀疏特征
Figure SMS_62
中的相应特征。通过皮尔逊相关系数对密集特征
Figure SMS_66
和稀疏特征
Figure SMS_69
进行特征筛选,排除了其中特征干扰的问题,减少了后续模型训 练时的计算量以及提高了模型训练时的拟合效率。
阈值α预先设置在系统中,若所得的皮尔逊相关系数低于阈值α时,则说明密集特 征
Figure SMS_72
和稀疏特征
Figure SMS_73
中对应特征与电梯故障事件的发生没有显著关系或者毫无关 系。若所得的皮尔逊相关系数不低于阈值α时,则说明密集特征
Figure SMS_74
和稀疏特征
Figure SMS_75
中 对应特征与电梯故障事件的发生具有密切关系或者直接关系。
步骤3:系统通过Embedding层对筛除后的稀疏特征
Figure SMS_76
进行映射处理, Embedding层即以onehot为输入、中间层节点为字向量维数的全连接层,能够对原始特征进 行编码,便于后续处理。映射后的稀疏特征
Figure SMS_77
与密集特征
Figure SMS_78
具有相同的维Í度,通 过全连接神经网络模型对筛除后的密集特征
Figure SMS_79
进行特征提取,将映射后的稀疏特征
Figure SMS_80
和特征提取后密集特征
Figure SMS_81
进行拼接;
上述步骤中,Embedding层实质上是一种用于对稀疏特征
Figure SMS_83
进行降维处理的 映射模型,致使映射后的稀疏特征
Figure SMS_87
与密集特征
Figure SMS_90
具有相同的维度,可以让映射 后的稀疏特征
Figure SMS_84
中的特征和密集特征
Figure SMS_88
中的特征位于同一特征空间,从而便于后 续对映射后的稀疏特征
Figure SMS_91
和密集特征
Figure SMS_93
进行统一处理,也提高了后续电梯预警的 表达能力。系统通过全连接神经网络模型对密集特征
Figure SMS_82
进行特征提取,全连接神经网 络模型指的是具有多层感知器的的网络,也就是多层神经元的网络。层与层之间需要包括 一个非线性激活函数,具有一个对输入和输出都隐藏的层。系统再按照时间序列的顺序将 映射后的系数特征
Figure SMS_86
和特征提取后密集特征
Figure SMS_89
进行拼接,拼接后的映射后的系数 特征
Figure SMS_92
和特征提取后密集特征
Figure SMS_85
称为拼接后的特征。和现有的特征拼接相比本专 利针对不同的特征类型分别进行上述处理,能够有效应用于不同的数据类型,实用性强。
步骤4:系统将拼接后的特征按照时间序列输入至多头自注意力机制模型获得特 征
Figure SMS_94
上述步骤中,由于拼接后的特征由组成映射后的系数特征
Figure SMS_95
和特征提取后密 集特征
Figure SMS_96
组成,因此采用多头自注意力模型进行处理,多头自注意力机制模型允许模 型对拼接后的特征在不同位置之间进行注意力传递,以便于获得不同时间序列特征的上下 文交互信息,如图11所示多头自注意力机制模型可以更好地理解拼接后的特征含义,多头 自注意力机制模型更加关注于拼接后的特征中对电梯故障预警有帮助的特征。
如图11为本发明实施例提供的多头自注意力机制模型的示意图。系统为了提取历 史物联网电梯数据中不同时间序列的物联网电梯特征,按照时间序列使用自注意力机制模 型对拼接后的特征进行特征提取,之后使用平均池化进行处理以达到特征聚合的目的。本 发明受到自然语言处理中seq2seq任务的启发,可以将此视为一个seq2seq的过程,使用序 列模型。本发明用到的自注意力机制模型以一组序列作为输入,利用自注意力机制模型的 线性层映射出的Query向量和Key向量做点积运算后再与Value向量做加权求和,输出具有 各个所有输入序列之间权重的一组向量序列。例如,系统将映射后的稀疏特征
Figure SMS_116
和特 征提取后密集特征
Figure SMS_98
进行拼接后得到按照时间序列排序的特征,将该特征输入给多头 注意力机制模块之后通过三个自注意力机制模型的线性层分别输出维度为
Figure SMS_110
的Query向 量、Key向量,分别用
Figure SMS_103
Figure SMS_112
表示,以及维度为
Figure SMS_115
的Value向量,用
Figure SMS_119
表示,Query向量用来匹 配Key向量,Value向量表示从输入特征
Figure SMS_113
中所提取的信息。接着,系统计算
Figure SMS_117
和特征中其他 序列片段Kay值的点积,其点积结果用
Figure SMS_97
表示,其中,
Figure SMS_105
属于
Figure SMS_99
Figure SMS_111
。特征中其他序列片段 指的是特征中除了
Figure SMS_104
Figure SMS_109
Figure SMS_101
对应序列片段。为防止数据过大导致后面使用Softmax激活函 数计算之后的结果恒取0或1的问题,系统将
Figure SMS_107
除以
Figure SMS_114
,之后使用Softmax函数对
Figure SMS_118
除 以
Figure SMS_102
的结果进行计算,Softmax激活函数可以引入非线性变换,以获得该特征中序列片段 Value值的权重,最后与特征中当前片段的Value值
Figure SMS_106
进行点积运算,得到不同时间序列的 注意力结果
Figure SMS_100
,注意力结果
Figure SMS_108
采用如下公式表示:
Figure SMS_120
其中,
Figure SMS_121
表示Softmax激活函数,
Figure SMS_122
表示时间序列。
步骤5:系统将特征
Figure SMS_123
输入至残差神经网络模型得到时间序列特征
Figure SMS_124
上述步骤中,经过多头自注意力机制模型处理的特征
Figure SMS_125
视为二维时间序列 图像,系统通过残差神经网络模型对特征
Figure SMS_126
进行特征提取得到时间序列特征
Figure SMS_127
。残差神经网络模型(ResNet)内部设置残差模块,残差模块利用跳跃连接实现特征
Figure SMS_128
跨层传播,解决了随着网络层数增加训练网络模型发生退化现象的问题。
图13为本发明实施例提供的本发明最终选择的残差神经网络模型参数示意图。经过多组超参数与预测模型参数的测试,最终选择的模型参数如图13所示,残差神经网络模型(ResNet)的层数选为9层,隐含神经元数量为28个,使用Soft Label以及One Hot系数特征转换,模型的学习率设置为1e-4。残差网络使得模型的深度提高,减少因为模型结构太深导致的性能降低的情况。
步骤6:系统将时间序列特征
Figure SMS_129
输入至分类模块,分类模型中的平均池化下采 样对时间序列特征
Figure SMS_130
进行降维处理,分类模型中的两层全连接神经网络模型将降维处 理后的时间序列特征
Figure SMS_131
维度转换为2,系统将维度为2的时间序列特征
Figure SMS_132
代入分类 模型的softmax函数得到预测结果,其中,预测结果包括电梯故障事件的预测发生概率和预 测不发生概率;
步骤7:系统获取实际结果,将预测结果和实际结果代入Focal Loss损失函数得到损失度,通过Adam优化器优化分类模型,使得损失度得以降低,并对训练次数加1,其中,真实结果包括电梯故障事件的实际发生概率和实际不发生概率;
上述步骤中,使用Focal Loss损失函数计算得到的损失度可以衡量电梯故障事件的预测发生概率和预测不发生概率与电梯故障事件的实际发生概率和实际不发生概率之间的差异,通过Adam优化器优化减少了分类模型中正样本和负样本不均衡带来预测准确性较低的问题,并有助于对分类模型中难分样本的分类并提高其权重。样本指的是在实际使用时物联网电梯数据根据本方法处理得到的预测结果,若预测结果和实际结果一致时,则称为正样本,若预测结果和实际结果不一致时,则称为负样本。
步骤8:系统判断训练次数是否小于100次,若是则迭代步骤3至步骤8。
上述步骤中,若训练次数不小于100次时,则系统可选用100次训练次数中损失度为最小值时的残差神经网络模型作为最终残差神经网络模型用于预测。在实际使用中,通过混淆矩阵计算得到该最终模型的召回率(rec),召回率也叫查全率,用于表示实际为正样本中有多少被预测为正样本。
所述步骤1,具体包括如下步骤:
步骤11:系统获取原始数据,其中,原始数据包括电梯的位置信息、电梯的设备信息、电梯的困人/故障信息、电梯的时间天气信息;
如图2所示,为本发明实施例提到的原始数据类别信息示意图。原始数据包括四种类型,分别为电梯的位置信息、电梯的设备信息、电梯的困人/故障信息、电梯的时间天气信息。对于不同的数据类型,可以采用的处理方式不同。电梯的位置信息包括电梯所在的区县、街道,以及电梯所在的场所类型等。电梯的位置信息之间存在一定的照应关系。若电梯的区县信息缺失,但记录有电梯的街道信息,则系统可以依照电梯街道信息补充对应的电梯区县信息,具体地,系统可以根据电梯的街道信息在预设的地址数据库中检索电梯的区县信息。但是电梯的位置信息的其他的缺失情况下,则系统不能补充电梯的位置信息。电梯的设备信息包括电梯的注册代码、设备型号、类型、使用状态、限速、限重、电梯楼层数、制造单位、制造日期、安装单位、安装日期、使用年限、维保单位、改造单位、改造日期和大修单位等。电梯的设备信息包含的子段较多,彼此之间的关系也相对多样。对于缺失电梯的安装日期,系统可以依据电梯的注册代码直接生成电梯的安装日期。系统可以从电梯的安装日期和当前日期推算得到电梯的使用年限。电梯的设备信息中单独缺损的其他信息,则系统不能相互推断得到相应单独缺损的其他信息。电梯的困人/故障信息包括困人/故障的具体日期、解救人数、救援到达时间、救援用时、施救单位、原因等。由于电梯的困人/故障信息在不同时期的记录标准可能存在不一致,所以导致不同时期的电梯的困人/故障信息不统一的问题,系统需要将不同记录标准下的电梯的困人/故障信息统一到一致的标准下。电梯的时间天气信息包括电梯所在地的天气代码、气温信息、季节信息、节假日信息等。电梯的时间天气信息可以依据互联网平台上的天气预报APP获取电梯所在地的历史天气、气温数据、季节信息。电梯的节假日信息则需要系统根据法定日历的数据具体生成。在本发明中,天气预报APP为“2345天气王”,电梯所在地为杭州。
步骤12:系统对原始数据进行数据清洗得到按时间序列排列的历史物联网电梯数据;
上述步骤中,数据清洗的作用是处理原始数据中的异常部分。图3为本发明的原始数据包括的主要异常类型信息。原始数据中主要的异常类型信息如图3所示,包括数据乱码、不同字段间的数据混杂、数据值异常和数据格式/标准不一致等。对于原始数据中不同的异常类型信息,采取的数据清洗方式不同。原始数据中的数据乱码表现为原始数据完全为乱码或者是乱码与正常数据交替出现,由于原始数据中的数据乱码难以被识别、读取。其中,乱码与正常数据交替出现的数据乱码仍可能包含正常部分,因此该原因的数据乱码可经由人工筛查后继续使用。完全为乱码的原始数据只能被系统舍弃,或留待至系统进行替换后更新为有效数据。乱码数据在各个字段均有分布。原始数据中不同字段间的数据混杂表现为当前字段出现其他字段的数据,一般来自于数据导出时的错误引起,此类原始数据中的异常部分可以经由人工核查并校正。原始数据中不同字段间的数据混杂在不同字段也均有分布。原始数据中数据值异常表现为文本、数值超出正常范围,一般来自于原始数据空缺引起,数据导出时系统自动补正数据值异常。系统将原始数据中的异常部分进行数据清洗完后,还可根据需要可以填补数据,或者将异常数据删除。
如图4所示,为本发明实施例提供的数据清洗流程示意图。所述步骤12,具体包括:系统首先获取原始数据;
步骤121:系统将原始数据代入分段三次埃尔米特插值公式进p行缺失补全,插值 函数
Figure SMS_133
满足:
Figure SMS_134
,把此类插值多项式称 为埃尔米特插值,该插值算法能够补充得到平滑的缺失值;
上述步骤为系统对原始数据中的缺失值进行数据清洗。缺失补全采用了分段三次埃尔米特插值公式来实现在缺失值位置进行插值,避免高次插值可能出现的大幅度波动现象,以及获得更好的近似效果。
步骤122:系统然后修改原始数据中的格式错误、内容错误和逻辑上错误的数据;
上述步骤中,操作员可通过系统完成上述修改操作。但是需要注意的是,修改的数据需要进行备份,以避免修改错误导致数据丢失的问题。
步骤123:系统接着对原始数据进行关联性验证、数据运算、分类和统计产生历史物联网电梯数据并存储至数据库;
上述步骤中,由于原始数据的来源有繁多复杂,系统对繁多复杂原始数据进行关 联性验证。例如,可采用皮尔逊相关系数法验证多个数据之间的关联性,以便于后续对原始 数据进行分类和统计。系统再对原始数据进行数据运算、分类和统计,例如,系统可以根据 数据疏密性将数据划分成密集特征
Figure SMS_135
和稀疏特征
Figure SMS_136
从而组成历史物联网电梯数 据。
图8为本发明实施例提供的电梯风险预警大数据模型系统结构图。系统总体可以划分为预处理模块和预测模块两个部分,预处理模块主要用于将原始数据清洗为有效、可用的物联网电梯数据,预测模块用于处理输入的物联网电梯数据,预测下一个周期的电梯故障事件的发生概率。电梯故障事件可以包括电梯困人事件、电梯停止运行事件、电梯门持续开关事件、电梯门不开事件、电梯异常事件中的至少一种。
图9为本发明实施例提供的一种基于残差网络和2D特征表示的电梯大数据风险预 警方法中处理流程示意图。如图9所示,该方法首先把历史物联网电梯数据根据特征性质划 分为密集特征
Figure SMS_140
和稀疏特征
Figure SMS_143
。然后将密集特征
Figure SMS_148
和稀疏特征
Figure SMS_138
进行 归一化操作,减少量纲对数据的影响。接着考虑到密集特征
Figure SMS_142
和稀疏特征
Figure SMS_146
中的 特征可能与物联网电梯的故障事件发生没有显著关系或者毫无关系,系统利用皮尔逊相关 系数公式寻找密集特征
Figure SMS_150
和稀疏特征
Figure SMS_137
中不同特征与发生电梯故障事件之间的 皮尔逊相关系数,进而通过阈值α对密集特征和稀疏特征进行特征筛除,在减少没有显著关 系或毫无关系的特征对预警结果影响的同时降低模型计算量。然后通过全连接神经网络模 型对密集特征
Figure SMS_141
进行特征提取,通过Embedding层将稀疏特征
Figure SMS_145
映射至特征空间, 使得密集特征
Figure SMS_149
和稀疏特征
Figure SMS_139
具有相同的维度,从而可将二者进行拼接。接着将 拼接后的特征输入至多头自注意力机制模型(Multi-Head Attention Mechanism)获取能 够关注不同时间序列和上下文关系的注意力特征
Figure SMS_144
。由于拼接后的特征可以视为2D 的图像特征,系统利用残差神经网络模型(ResNet)进行2D特征表示提取得到时间序列特征
Figure SMS_147
。最后,系统通过基于Sigmoid激活函数的分类模型输出预测结果,Sigmoid激活函数 如图12所示,可以引入非线性变换。由于分类模型得到的预测结果的正样本和负样本可能 存在差距过大的问题,通过Focal Loss损失函数计算得到损失度,Adam优化器根据损失度 对分类模型进行优化,增加少量正样本的loss值,减小大量负样本的loss值,达到减少正负 样本数量差距过大带来的影响。使用训练完成的分类模型对待预测的物联网电梯进行预 测、评估。在实际测试中,本发明以召回率作为评价指标,通过实测得到的召回率获得了较 好的预测结果,表明本基于残差网络和2D特征表示的电梯大数据风险预警方法的预警的准 确性和有效性。
图10和图11为本发明实施例提供的残差神经网络模型中的残差模块的示意图。残差神经网络模型是由一系列残差模块构成的网络,而每一个残差模块由直接映射和残差部分构成,其具体结构如图10所示。可以表示为如下公式:
Figure SMS_151
其中,
Figure SMS_152
表示上一个残差模块的输出特征,
Figure SMS_153
表示残差部分,残差部分由 两个或三个卷积操作构成,每个卷积操作中间使用批标准化(Batch Normalization)处理 防止残差神经网络模型过拟合,最后使用Relu激活函数引入非线性关系。
直接映射(short-cut)对应于图10的中的“+”,其将上一个残差模块的输出与当前 残差模块的残差部分特征进行单位加操作。除了两层的残差模块,残差神经网络模型还有 一种bottleneck的残差模块结构,其如图11所示。其残差部分的卷积核形状由1x1变为3x3, 在变为1x1,形状如同瓶颈结构。当
Figure SMS_154
Figure SMS_155
形状不相似时,使用一个1x1大小的卷积核进行 升维或降维,此外还可以通过zero-padding(零填充)增加维度。其计算过程可以通过如下 公式表示:
Figure SMS_156
其中,
Figure SMS_157
表示1x1大小卷积操作。
所述步骤4,具体包括:
步骤41:系统将拼接后的特征按照时间序列输入多头注意力机制模块中线性层得 到维度为
Figure SMS_158
的Query向量、维度为
Figure SMS_159
的Key向量以及维度为
Figure SMS_160
的Value向量,分别采用
Figure SMS_161
Figure SMS_162
Figure SMS_163
表示;
步骤42:系统计算
Figure SMS_164
和特征中其他序列片段Kay值的点积,其点积结果用
Figure SMS_165
表 示,其中,
Figure SMS_166
属于
Figure SMS_167
Figure SMS_168
步骤43:系统将
Figure SMS_169
除以
Figure SMS_170
,将
Figure SMS_171
除以
Figure SMS_172
的结果代入如下Softmax函数得到 注意力结果
Figure SMS_173
Figure SMS_174
其中,
Figure SMS_175
表示Softmax激活函数,
Figure SMS_176
表示时间序列。
图15为本发明实施例提供的系统的实测过程的预测结果示意图,实测对象为位于杭州市的物联网电梯。在平均预测数量维1500个的情况下,2022年1月至2022年4月的平均召回率为28.5%。考虑到没有用全量数据训练,而且原始数据有部分困人没有统计进去,因此对这部分数据进行修正,定义修正系数为1.5的情况下,2022年1月至2022年4月的平均修正有效率为42.7%。
上述实施例仅为本发明的较佳实施例,并非依此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。

Claims (9)

1. 一种基于残差网络和2D特征表示的电梯大数据风险预警方法,其特征在于,该方法包括以下步骤:步骤1:系统按照时间序列采集历史物联网电梯数据,将历史物联网电梯数据划分为密集特征
Figure QLYQS_12
和稀疏特征
Figure QLYQS_3
,对密集特征
Figure QLYQS_8
和稀疏特征
Figure QLYQS_16
进行归一化处理;步骤2:系统将归一化处理后的密集特征
Figure QLYQS_19
和稀疏特征
Figure QLYQS_18
带入皮尔逊相关系数公式计算得到特征与电梯故障事件之间的皮尔逊相关系数,判断特征与电梯故障事件之间的皮尔逊相关系数是否低于阈值α,若是则筛除密集特征
Figure QLYQS_20
和稀疏特征
Figure QLYQS_9
中的相应特征; 步骤3:系统通过Embedding层对筛除后的稀疏特征
Figure QLYQS_13
进行映射处理,映射后的稀疏特征
Figure QLYQS_1
与密集特征
Figure QLYQS_6
具有相同的维度,通过全连接神经网络模型对筛除后的密集特征
Figure QLYQS_2
进行特征提取,将映射后的稀疏特征
Figure QLYQS_5
和特征提取后密集特征
Figure QLYQS_10
进行拼接; 步骤4:系统将拼接后的特征按照时间序列输入至多头自注意力机制模型获得注意力结果
Figure QLYQS_14
;步骤5:系统将注意力结果
Figure QLYQS_11
输入至残差神经网络模型得到时间序列特征
Figure QLYQS_15
;步骤6:系统将时间序列特征
Figure QLYQS_17
输入至分类模块,分类模型中的平均池化下采样对时间序列特征
Figure QLYQS_21
进行降维处理,分类模型中的两层全连接神经网络模型将降维处理后的时间序列特征
Figure QLYQS_4
维度转换为二,系统将维度为二的时间序列特征
Figure QLYQS_7
代入分类模型的softmax函数得到预测结果,其中,预测结果电梯故障事件的预测发生概率和预测不发生概率;步骤7:系统获取实际结果,将预测结果和实际结果代入Focal Loss损失函数得到损失度,通过Adam优化器优化残差神经网络模型,使得损失度得以降低,并对训练次数加1,其中,真实结果包括电梯故障事件的实际发生概率和实际不发生概率;步骤8:系统判断训练次数是否小于100次,若是则迭代步骤3至步骤8。
2.根据权利要求1所述的一种基于残差网络和2D特征表示的电梯大数据风险预警方法,其特征在于,所述步骤1,具体包括如下步骤:步骤11:系统获取原始数据,其中,原始数据包括电梯的位置信息、电梯的设备信息、电梯的困人/故障信息、电梯的时间天气信息;步骤12:系统对原始数据进行数据清洗得到按时间序列排列的历史物联网电梯数据。
3.根据权利要求2所述的一种基于残差网络和2D特征表示的电梯大数据风险预警方法,其特征在于,所述步骤12,具体包括如下步骤:步骤121:系统将原始数据代入分段三次埃尔米特插值方法进行缺失补全;步骤122:系统对统一原始数据中的格式和内容错误的数据以及修改逻辑上错误的数据;步骤123:系统对原始数据进行关联性验证、数据运算、分类和统计产生按时间序列排列的历史物联网电梯数据,并存储至数据库中。
4.根据权利要求1所述的一种基于残差网络和2D特征表示的电梯大数据风险预警方法,其特征在于,所述步骤4,具体包括:步骤41:系统将拼接后的特征按照时间序列输入多头注意力机制模块中线性层得到维度为
Figure QLYQS_31
的Query向量、维度为
Figure QLYQS_24
的Key向量以及维度为
Figure QLYQS_28
的Value向量,分别采用
Figure QLYQS_29
Figure QLYQS_33
Figure QLYQS_35
表示;步骤42:系统计算
Figure QLYQS_39
和特征中其他序列片段Kay值的点积,其点积结果用
Figure QLYQS_32
表示,其中,
Figure QLYQS_37
属于
Figure QLYQS_22
Figure QLYQS_27
;步骤43:系统将
Figure QLYQS_36
除以
Figure QLYQS_40
,将
Figure QLYQS_38
除以
Figure QLYQS_41
的结果代入如下Softmax函数得到注意力结果
Figure QLYQS_25
Figure QLYQS_26
,其中,
Figure QLYQS_30
表示Softmax激活函数,
Figure QLYQS_34
表示时间序列,
Figure QLYQS_23
表示Key向量的维度。
5.根据权利要求1所述的一种基于残差网络和2D特征表示的电梯大数据风险预警方法,其特征在于,所述分类模型基于Sigmoid激活函数。
6.根据权利要求1所述的一种基于残差网络和2D特征表示的电梯大数据风险预警方法,其特征在于,所述残差神经网络模型是一系列残差模块构成的网络,残差模块由直接映射和残差部分构成。
7.根据权利要求1所述的一种基于残差网络和2D特征表示的电梯大数据风险预警方法,其特征在于,所述残差神经网络模型包括如下公式所示的一种残差模块:
Figure QLYQS_42
,其中,
Figure QLYQS_43
表示上一个残差模块的输出特征,
Figure QLYQS_44
表示残差部分,残差部分由两个或三个卷积操作构成,每个卷积操作中间使用批标准化处理防止残差神经网络模型过拟合,最后使用Relu激活函数引入非线性关系。
8.根据权利要求7所述的一种基于残差网络和2D特征表示的电梯大数据风险预警方法,其特征在于,所述残差神经网络模型还包括如下公式所示的bottleneck的残差模块:
Figure QLYQS_45
,其中,
Figure QLYQS_46
表示1x1大小卷积操作。
9.根据权利要求1所述的一种基于残差网络和2D特征表示的电梯大数据风险预警方法,其特征在于,所述残差神经网络的层数为9层,隐含神经元数量为28个,模型的学习率设置为1e-4。
CN202310043509.3A 2023-01-29 2023-01-29 一种基于残差网络和2d特征表示的电梯大数据风险预警方法 Active CN115795351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310043509.3A CN115795351B (zh) 2023-01-29 2023-01-29 一种基于残差网络和2d特征表示的电梯大数据风险预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310043509.3A CN115795351B (zh) 2023-01-29 2023-01-29 一种基于残差网络和2d特征表示的电梯大数据风险预警方法

Publications (2)

Publication Number Publication Date
CN115795351A true CN115795351A (zh) 2023-03-14
CN115795351B CN115795351B (zh) 2023-06-09

Family

ID=85429023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310043509.3A Active CN115795351B (zh) 2023-01-29 2023-01-29 一种基于残差网络和2d特征表示的电梯大数据风险预警方法

Country Status (1)

Country Link
CN (1) CN115795351B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821730A (zh) * 2023-08-30 2023-09-29 北京科锐特科技有限公司 风机故障检测方法、控制装置及存储介质
CN117435918A (zh) * 2023-12-20 2024-01-23 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于空间注意力网络与特征划分的电梯风险预警方法
CN117657912A (zh) * 2024-01-30 2024-03-08 安徽建工生态科技股份有限公司 一种工地施工升降机监测系统、方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112712169A (zh) * 2021-01-08 2021-04-27 中国科学院地理科学与资源研究所 基于图卷积的全残差深度网络的模型建立方法及应用
EP3847585A1 (en) * 2018-09-05 2021-07-14 Oracle International Corporation Context-aware feature embedding and anomaly detection of sequential log data using deep recurrent neural networks
CN114172688A (zh) * 2021-11-05 2022-03-11 四川大学 基于gcn-dl的加密流量网络威胁关键节点自动提取方法
CN114266201A (zh) * 2022-03-01 2022-04-01 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于深度学习的自注意力电梯困人预测方法
CN114444382A (zh) * 2021-12-09 2022-05-06 中广核(北京)新能源科技有限公司 基于机器学习算法的风电机组齿轮箱故障诊断分析方法
CN114648097A (zh) * 2022-03-17 2022-06-21 南京优湖科技有限公司 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法
CN115310674A (zh) * 2022-07-14 2022-11-08 西北师范大学 基于并行神经网络模型LDformer的长时间序列预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3847585A1 (en) * 2018-09-05 2021-07-14 Oracle International Corporation Context-aware feature embedding and anomaly detection of sequential log data using deep recurrent neural networks
CN112712169A (zh) * 2021-01-08 2021-04-27 中国科学院地理科学与资源研究所 基于图卷积的全残差深度网络的模型建立方法及应用
CN114172688A (zh) * 2021-11-05 2022-03-11 四川大学 基于gcn-dl的加密流量网络威胁关键节点自动提取方法
CN114444382A (zh) * 2021-12-09 2022-05-06 中广核(北京)新能源科技有限公司 基于机器学习算法的风电机组齿轮箱故障诊断分析方法
CN114266201A (zh) * 2022-03-01 2022-04-01 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于深度学习的自注意力电梯困人预测方法
CN114648097A (zh) * 2022-03-17 2022-06-21 南京优湖科技有限公司 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法
CN115310674A (zh) * 2022-07-14 2022-11-08 西北师范大学 基于并行神经网络模型LDformer的长时间序列预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAO LI, FEI QI, GUANGMING SHI, CHUNHUAN LIN: "A multiscale dilated dense convolutional network for saliency prediction with instance-level attention competition", JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION *
赵冰;李平;代明睿;马小宁;: "基于深度学习的铁路图像场景分类优化研究", 计算机系统应用 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116821730A (zh) * 2023-08-30 2023-09-29 北京科锐特科技有限公司 风机故障检测方法、控制装置及存储介质
CN116821730B (zh) * 2023-08-30 2024-02-06 北京科锐特科技有限公司 风机故障检测方法、控制装置及存储介质
CN117435918A (zh) * 2023-12-20 2024-01-23 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于空间注意力网络与特征划分的电梯风险预警方法
CN117435918B (zh) * 2023-12-20 2024-03-15 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) 一种基于空间注意力网络与特征划分的电梯风险预警方法
CN117657912A (zh) * 2024-01-30 2024-03-08 安徽建工生态科技股份有限公司 一种工地施工升降机监测系统、方法
CN117657912B (zh) * 2024-01-30 2024-04-19 安徽建工生态科技股份有限公司 一种工地施工升降机监测系统、方法

Also Published As

Publication number Publication date
CN115795351B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
CN115795351A (zh) 一种基于残差网络和2d特征表示的电梯大数据风险预警方法
CN110287180B (zh) 一种基于深度学习的风控建模方法
CN113242207B (zh) 一种迭代聚类的网络流量异常检测方法
CN112039903B (zh) 基于深度自编码神经网络模型的网络安全态势评估方法
CN114943694A (zh) 一种基于对抗生成网络与注意力的缺陷检测方法
CN110636066B (zh) 基于无监督生成推理的网络安全威胁态势评估方法
CN108388969A (zh) 基于个人行为时序特征的内部威胁人物风险预测方法
CN113095927A (zh) 一种反洗钱可疑交易识别方法及设备
CN116502175A (zh) 一种图神经网络故障诊断方法、装置和存储介质
CN114694178A (zh) 基于Faster-RCNN算法的电力作业中安全帽监测方法及系统
CN112491891B (zh) 物联网环境下基于混合深度学习的网络攻击检测方法
CN115296933B (zh) 一种工业生产数据风险等级评估方法及系统
CN113869721A (zh) 一种变电设备健康状态分类方法及装置
CN113159546A (zh) 无监督降维密度聚类的农作物供应链危害物风险判断方法及系统
CN115905959A (zh) 基于缺陷因子的电力断路器关联性故障分析方法及装置
Alfaz et al. Bridge crack detection using dense convolutional network (densenet)
CN115310999B (zh) 基于多层感知机和排序网络的企业用电行为分析方法及系统
CN115828161A (zh) 一种基于循环神经网络的汽车故障类型预测方法及装置
Alshawabkeh et al. Automated Pavement Crack Detection Using Deep Feature Selection and Whale Optimization Algorithm.
CN115408693A (zh) 一种基于自适应计算时间策略的恶意软件检测方法及系统
CN114049966A (zh) 一种基于链接预测的食源性疾病暴发识别方法和系统
CN114550460A (zh) 轨道交通异常检测方法、装置及存储介质
CN118041683B (zh) 一种基于结构嵌入双向重构图网络的恶意流量检测方法
CN118378178B (zh) 基于残差图卷积神经网络的变压器故障识别方法及系统
CN113723811B (zh) 基于机器学习的设备维保单位评估方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant