CN117435918B - 一种基于空间注意力网络与特征划分的电梯风险预警方法 - Google Patents
一种基于空间注意力网络与特征划分的电梯风险预警方法 Download PDFInfo
- Publication number
- CN117435918B CN117435918B CN202311756483.3A CN202311756483A CN117435918B CN 117435918 B CN117435918 B CN 117435918B CN 202311756483 A CN202311756483 A CN 202311756483A CN 117435918 B CN117435918 B CN 117435918B
- Authority
- CN
- China
- Prior art keywords
- feature
- elevator
- transducer
- layer
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 13
- 230000007246 mechanism Effects 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims description 15
- 238000007781 pre-processing Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 230000003068 static effect Effects 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 13
- 230000009467 reduction Effects 0.000 abstract description 7
- 230000000644 propagated effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 17
- 238000012423 maintenance Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B5/00—Applications of checking, fault-correcting, or safety devices in elevators
- B66B5/0006—Monitoring devices or performance analysers
- B66B5/0018—Devices monitoring the operating condition of the elevator system
- B66B5/0031—Devices monitoring the operating condition of the elevator system for safety reasons
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B5/00—Applications of checking, fault-correcting, or safety devices in elevators
- B66B5/02—Applications of checking, fault-correcting, or safety devices in elevators responsive to abnormal operating conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/2163—Partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Indicating And Signalling Devices For Elevators (AREA)
- Maintenance And Inspection Apparatuses For Elevators (AREA)
Abstract
本发明提供的一种基于空间注意力网络与特征划分的电梯风险预警方法,其通过获取物联网电梯的原始数据,对原始数据进行预处理和归一化处理,为精准预测物联网电梯故障概率提供了数据基础;通过构建由多个跨层连接的transformer编辑器组成的transformer模型,解决了现有技术中随着网络层数增加训练网络模型发生退化的问题,同时也能保证特征信息在逐层传播时不会丢失;通过对时序特征进行位置编码以及通过多头自注意力机制的transformer模型进行降维处理,增大了transformer模型的并行性,有效地提高了训练速度。
Description
技术领域
本发明属于电梯故障预警技术,尤其涉及一种基于空间注意力网络与特征划分的电梯风险预警方法。
背景技术
随着我国的经济发展和城市化进程的加快,电梯的安装,部署数量迅速增大,目前保有量已达到保有量世界第一。随之而来的问题便是电梯故障、困人等安全事故时有发生,造成社会经济财产损失和人员伤亡。由于目前电梯的监管、维保技术规范等标准还尚未完全成熟,频繁对电梯进行维护会产生大量人力、物力以及时间成本,并且电梯故障受到工作环境、运行状况、电梯参数、人为破坏等诸多因素的影响。因此设计出一种适用性较好的电梯故障预测和维保方案具有一定的挑战性。
随着科技的飞速发展和社会的深度变革,物联网已经逐渐成为推动经济发展、改善人民生活的重要力量。在智智慧物流、智慧农业、智慧医疗、智能家居、智慧交通、智慧安防等方面取得了广泛的应用。Transformer的提出是深度学习史上具有里程碑意义的事件,其特殊的机制使得其在自然语言处理和计算机视觉领域均取得了巨大的成功。
传统时间序列模型常伴有一系列问题:1)传统时间序列模型依赖于其归纳偏置,当时序特征不明显时网络表现不佳;2)容易收敛于局部最小值,无法找到最优解;3)LSTM并行性较差,训练消耗时间较多。
发明内容
本发明为了克服现有技术的不足,提供了一种基于空间注意力网络与特征划分的电梯风险预警方法。
为了实现上述目的,本发明提供了一种基于空间注意力网络与特征划分的电梯风险预警方法,其包括以下步骤:
S1:采集物联网电梯的原始数据,对原始数据进行预处理,对预处理后的所有数据特征进行归一化处理,生成时序特征;
S2:通过Embedding层对时序特征进行位置编码,将位置编码与原时序特征相加获得第一特征;
S3:将编码后的第一特征与静态特征拼接获得模型的输入特征,将输入特征按照时间序列输入至多头自注意力机制的transformer模型中进行降维,将降维得到的结果与输入特征相加获得注意力特征;所述transformer模型包括至少两个堆叠的transformer编码器,各编码器之间跨层连接;
S4:将注意力特征与未经过自注意力层处理的特征相加,将相加结果输入至layernorm层获得第二特征;
S5:将第二特征输入至一全连接层,再将结果与第二特征相加得到第三特征;
S6:将第三特征输入至layernorm层获得第四特征;
S7:将第四特征与编码后的第一特征相加获得首个编码器的结果;
S8:重复步骤S3至步骤S7的过程至少一次,当重复最后一次过程时,将结果输入至一全连接层,将其结果通过分类模块激活,获得各时段预测的故障概率,生成预测结果;
S9:获取电梯实际故障结果,将预测结果和实际故障结果通过交叉熵损失函数计算对应的损失度,采用Adam优化器优化生成的transformer模型;
S10:重复步骤S3至步骤S9的过程,训练transformer模型,获得预警结果。
优选的,步骤S1中,物联网电梯的原始数据包括:电梯数据、故障数据、天气数据。
优选的,步骤S1中,所述原始数据进行预处理的步骤包括:
S1.1:将原始数据中空缺的数据采用径向基函数插值法进行插值,使用高斯函数
作为径向基函数,其插值公式为:
其中x为原始数据,为原始数据的方差。
S1.2:对原始数据进行校正。
优选的,步骤S2中,所述时序特征进行位置编码的计算公式为:
其中,pos表示位置索引,dmodel表示输入的嵌入维度,i表示嵌入向量中的第几维,PE表示计算获得的位置编码。
优选的,步骤S3具体步骤包括:
S31:将拼接后的特征按照时间序列分成多个方块并将其排成一列;
S32:将重新排列后的特征按照时间序列的方式输入transformer模型的线性层进
行加权求和,以获得维度为的查询向量、维度为的键向量和维度为的值
向量;
S3.3:计算注意力特征,其计算公式为:
,
其中,表示Softmax激活函数,表示时间序列,n表示时间序列
长度,m表示序列中的元素。
优选的,步骤S3中,拼接后的输入特征可在transformer模型的不同位置之间进行注意力传递。
优选的,步骤S3中,各transformer编码器之间的结构表达式为:
其中,表示上一transformer编码器的输入特征,表示当前
transformer编码器输出。
优选的,步骤S5中的layernorm层内设有残差模块,所述残差模块与全连接层跳跃连接。
优选的,步骤S8中,步骤S3至步骤S7的重复次数为transformer编码器的堆叠个数。
优选的,步骤S8中,分类模块通过sigmoid激活函数对全连接层的结果进行激活,获得预测概率。
综上所述,本发明提供的一种基于空间注意力网络与特征划分的电梯风险预警方
法,其有益效果在于,其通过获取物联网电梯的原始数据,对原始数据进行预处理和归一化
处理,为精准预测物联网电梯故障概率提供了数据基础;通过构建由多个跨层连接的
transformer编辑器组成的transformer模型,解决了随着网络层数增加训练网络模型发生
退化的问题,同时也能保证特征信息在逐层传播时不会丢失;通过对时序特征进
行位置编码以及多头自注意力机制的transformer模型进行降维处理,增大了transformer
模型的并行性,有效地提高了训练速度。
附图说明
图1为本发明实施例提供的基于空间注意力网络与特征划分的电梯风险预警方法的流程图;
图2为本发明实施例提到的原始数据类别信息示意图;
图3为本发明实施例提供的一种基于transformer模型结构的电梯大数据风险预警方法中处理流程的示意图;
图4为本发明实施例提供的transformer模型中跨层连接的示意图
图5为Sigmoid激活函数的预测结果图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。另外,本发明中所描述的“第一特征、第二特征…”,仅用于区分特征,不对特征做任何限定。
如图1所示,本发明提供了一种基于空间注意力网络与特征划分的电梯风险预警方法,其包括以下步骤:
S1:采集物联网电梯的原始数据,对原始数据进行预处理,对预处理后的所有数据特征进行归一化处理,生成时序特征;
S2:通过Embedding层对时序特征进行位置编码,将位置编码与原时序特征相加获得第一特征;
S3:将编码后的第一特征与静态特征拼接获得模型输入特征,将输入特征按照时间序列输入至多头自注意力机制的transformer模型中进行降维,将降维得到的结果与输入特征相加获得注意力特征;所述transformer模型包括至少两个堆叠的transformer编码器,各编码器之间跨层连接;
S4:将注意力特征与未经过自注意力层处理的特征相加,将相加结果输入至layernorm层获得第二特征;
S5:将第二特征输入至一全连接层,再将结果与第二特征相加得到第三特征;
S6:将第三特征输入至layernorm层获得第四特征;
S7:将第四特征与编码后的第一特征相加获得首个编码器的结果;
S8:重复步骤S3至步骤S7的过程至少一次,当重复最后一次过程时,将结果输入至一全连接层,将其结果通过分类模块激活,获得各时段预测的故障概率,生成预测结果;
S9:获取电梯实际故障结果,将预测结果和实际故障结果通过交叉熵损失函数计算对应的损失度,采用Adam优化器优化生成的transformer模型;
S10:重复步骤S3至步骤S9的过程,训练transformer模型,获得预警结果。
具体的,空间注意力网络为transformer模型。本实施例中的原始数据是历史物联网电梯数据,本发明采用基于特征划分与transformer模型对原始数据进行建模,实现电梯故障预测预警。从处理流程上,本发明可分为数据预处理流程和故障预处理流程。其中本发明中的步骤S1为数据预处理流程,于该步骤中,通过对原视数据预处理,可获得完整且合理的数据,进而提高数据的准确性,为故障预测处理流程提供了数据支持,提高了故障预测结果的准确性。此外,本发明提供的一种基于transformer的电梯大数据风险预警方法运用于电梯风险预警大数据模型系统中,电梯风险预警大数据模型系统包括预处理模块和预测模块,预处理模块用于将原始数据处理为可用于transformer模型训练的数据,预测模块用于对原始数据进行建模以及预测之后一段时间电梯故障事件的发生概率。本发明中收集到的电梯故障类型分为电梯困人、开门运行、电梯持续开关门、电梯超速和其他异常事件。
于步骤S1来说,为了确保故障预测的准确性,首先采集物联网电梯的历史数据进行故障预测。其中,本实施例多数的物联网电梯是指具有物联网功能的电梯,相较于传统的电梯,本发明的物联网电梯配置安装了网关、传感器、摄像头等终端设备,进而对电梯各种故障、运行等数据进行采集。
如图2所示,物联网电梯的原始数据包括:电梯数据(电梯基础数据)、故障数据(电梯故障、维保信息)和天气数据(时间天气信息)。
如表1所示,本发明实施例提供的电梯清单表的具体内容信息电梯的基础信息包括电梯所在的场所类型、注册代码、电梯类型、类型、使用状态、住户数、经纬度、电梯楼层数、制造单位、安装单位、使用年限、维保单位等。电梯的基础信息包含的子段较多,彼此之间的关系也相对多样。
表1
如表2所示,为本发明实施例提供的故障记录表的具体内容信息。电梯的维保/故障信息包括故障的具体日期、解救人数、救援到达时间、救援用时、施救单位、原因、故障发生时间、故障类别等。由于电梯的故障报警存在一段时间内连续多次的情况,因此只统计当天内是否发生故障报警,并将当天的报警次数作为一个新的特征输入到模型中。
表2
如表3所示,为本发明实施例提供的天气气温表的具体内容信息。电梯的时间天气信息包括电梯所在地的天气、气温信息、季节信息、节假日信息等。
表3
于步骤S1中,获得物联网电梯原始数据后,由于在数据采集时存在设备异常和人为失误等因素,采集到的数据中存在数据乱码、数据缺失、数据混杂等问题。因此,需要对原始数据进行预处理以得到完整、合理的数据。对于原始数据中明显存在错误的信息,采取人工核查、自动补正数据值异常和删除异常数据等方式进行清洗。对原始数据进行清洗的步骤包括:
S1.1:将原始数据中空缺的数据采用径向基函数插值法进行插值,使用高斯函数作为径向基函数,其插值公式为:
其中x为原始数据,为原始数据的方差。
S1.2:对原始数据进行校正。
原始数据经过预处理后,对多有数据的特征进行归一化。归一化处理是将每个数
据特征都转化为均值为0、方差为1的数据,减少数据量级对数据的影响,原始数据经过归一
化处理后,生成时序特征。
于步骤S2来说,原始数据转换成时序特征后,为了在时间序列中表示每
个特征元素出现的位置和顺序,时序特征通过Embedding层映射至特征空间中,
进行位置编码position encoding。位置编码后,将位置编码PE与原时序特征
(即,步骤S1生成的时序特征)相加(PE+Sseries)获得第一特征。其
中,时序特征进行位置编码的计算公式为:
其中,pos表示位置索引,dmodel表示输入的嵌入维度,i表示嵌入向量中的第几维,PE表示计算获得的位置编码。
本实施例中,与步骤S3来说,时序特征经过编码后的,将编码后的第一特征与静态特征经过拼接后生成输入特征s,将输入特征s按照时间序列
输入至多头自注意力机制的transformer模型中进行降维,输入特征s经过transformer模
型降维后将降维结果与输入特征s相加获得注意力结果。具体的,因此采用多
头自注意力的transformer模型进行处理。在transformer模型中,拼接后的输入特征s可在
transformer模型的不同位置之间进行注意力传递,以便于获得不同时间序列特征的上下
文交互信息,使得多头自注意力机制的transformer模型更能关注于拼接后的输入特征s中
对电梯故障预警有帮助的特征,提高了transformer模型的训练速度。
于步骤S3中,为了提取不同时间序列的物联网电梯特征,将输入特征看作二维的图像特征,其具体提取过程为:
S31:将拼接后的特征按照时间序列分成多个方块并将其排成一列,所述方块优选为2*2的排列形式,该排列形式可根据需求设置;
S32:将重新排列后的特征按照时间序列的方式输入transformer模型的线性层进
行加权求和,以获得维度为的查询向量、维度为的键向量和维度为的值
向量;
S3.3:计算注意力特征,其计算公式为:
,
其中,表示Softmax激活函数,表示时间序列,n表示时间序列
长度,m表示序列中的元素,表示查询向量,v表示值向量。
本实施例中,在步骤S4、S5、S6中,将注意力特征与未经过自注意力
层处理的特征相加,其中,未经过自注意力层处理的特征是指步骤S2生成的第一特征,自注意力层是多头自注意力机制的transformer模型的一部分,并将结果输
入至transformer模型中带有残差连接的layernorm层,获得第二特征,将
第二特征再输入至一全连阶层进行卷积和池化操作,再将结果与第二特征相加获得第三特征。步骤S4中的layernorm层内设置了
残差模块,残差模块与全连接层跳跃连接。获得第三特征后,将第三特征输入至layernorm层,得到第四特征。
于步骤S7中,为避免模型训练时深层梯度难以反向传播到浅层,将获得的第四特
征与编码后的第一特征相加获得transformer模型中首个
transformer编码器的结果。
如图3所示,为本发明实施例提供的一种基于transformer模型结构的电梯大数据
风险预警方法中处理流程示意图。首先把历史物联网电梯数据根据特征性质划分为静态特
征和时序特征。然后将其进行归一化操作,减少数据量级对数据的影响。
然后通过Embedding层将时序特征映射至特征空间,再将特征进行位置编码得到,并将其与静态特征进行拼接得到输入特征s。接着将拼接后的特
征输入至基于空间多头自注意力机制的transformer模型中在模型的最后部分,通过基于
Sigmoid激活函数的分类模块输出预测结果。由于分类模块得到的预测结果的正样本和负
样本可能存在差距过大的问题,通过交叉熵损失函数交叉熵计算得到损失度,Adam优化器
根据损失度对分类模块进行优化,增加少量正样本的loss值,减小大量负样本的loss值,达
到减少正负样本数量差距过大带来的影响。使用训练完成的分类模块对待预测的物联网电
梯进行预测、评估。
于步骤S8中,该步骤为预测步骤,通过重复步骤S3至步骤S7的过程至少一次。本实施例中,如图4所示,transformer模型包括至少两个堆叠的transformer编码器,各编码器之间跨层连接,解决了随着网络层数增加训练网络模型发生退化的问题,同时也能保证特征信息在逐层传播时不会丢失。而步骤S3至步骤S7的重复次数与transformer编码器堆叠个数相同。各transformer编码器之间的结构表达式为:
其中,表示上一transformer编码器的输入特征,表示当前
transformer编码器输出。
如表4所示,为本发明实施例提供最终选择的transformer模型参数。Transformer编码器的个数选为9层,隐含神经元数量为512个,模型的学习率设置为1e-4。需要说明的是,transformer编码器的相关参数可以根据实际使用场景进行调整。当重复过程到达最后一次时不进行步骤9,而是将结果输入进一个输出为4的全连接层并将得到结果通过分类模块来预测各时段的故障概率。
表4
其中,分类模块处理特征时,将全连接结果使用sigmoid激活函数将输出值控制在0和1之间,以此来获得预测的故障概率,进而生成预测结果。Sigmoid激活函数的预测结果图,如图5所示。
于步骤S9来说,该步骤为优化步骤,先获取物联网电梯的实际故障结果,将其与预测结果通过交叉熵损失函数得到损失度,而后通过Adam优化器来优化生成的transformer模型。具体的,获取物联网电梯的实际故障概率可提高模型的准确性。而使用交叉熵损失函数计算得到的损失度可以衡量电梯故障事件的预测发生概率和实际发生概率之间的差异,Adam优化器根据损失度对分类模块进行优化,增加少量正样本的loss值,减小大量负样本的loss值,减少了transformer模型中正样本和负样本不均衡带来预测准确性较低的问题,有利于对transformer模型中的样本进行分类,同时也提高其权重。样本指的是在实际使用时物联网电梯数据根据样本方法处理得到的预测结果,若预测结果和实际结果一致,则称为正样本,若预测结果和实际结果不一致,则称为负样本。transformer模型优化完成后,重复步骤S3至步骤S9的过程,对transformer模型进行多次训练。使用训练完成的transformer模型对待预测的物联网电梯进行预测、评估。在实际测试中,本发明以召回率作为评价指标,通过实测得到的召回率获得了较好的预测结果,验证了该方法的准确性和有效性。
如表5(a)~表5(e)所示,为本发明实测过程的预测结果。本发明以位于杭州市的通力品牌的物联网电梯为实测对象,进行测试检验。其测试结果如下:对于开关门,在平均预测数量为2000个的情况下,2023年3月至2023年4月的召回率均达到35%以上;对于超速,在平均预测数量为500个的情况下,2023年3月至2023年4月的平均召回率达到约16%;对于其他类型的故障,在平均预测数量为750个的情况下,2023年3月至2023年4月的平均召回率达到约10%。基于上述测试结果,本发明的实用效果较好。
表5(a)
表5 (b)
表5 (c)
表5 (d)
表5 (e)
显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
Claims (10)
1.一种基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,其包括以下步骤:
S1:采集物联网电梯的原始数据,对原始数据进行预处理,对预处理后的所有数据特征进行归一化处理,生成时序特征;
S2:通过Embedding层对时序特征进行位置编码,将位置编码与原时序特征相加获得第一特征;
S3:将编码后的第一特征与静态特征拼接获得模型的输入特征,将输入特征按照时间序列输入至多头自注意力机制的transformer模型中进行降维,将降维得到的结果与输入特征相加获得注意力特征;所述transformer模型包括至少两个堆叠的transformer编码器,各编码器之间跨层连接;
S4:将注意力特征与未经过自注意力层处理的特征相加,将相加结果输入至layernorm层获得第二特征,其中,未经过自注意力层处理的特征是指步骤 S2 生成的第一特征;
S5:将第二特征输入至一全连接层,再将结果与第二特征相加得到第三特征;
S6:将第三特征输入至layernorm层获得第四特征;
S7:将第四特征与编码后的第一特征相加获得首个编码器的结果;
S8:重复步骤S3至步骤S7的过程至少一次,当重复最后一次过程时,将结果输入至一全连接层,将其结果通过分类模块激活,获得各时段预测的故障概率,生成预测结果;
S9:获取电梯实际故障结果,将预测结果和实际故障结果通过交叉熵损失函数计算对应的损失度,采用Adam优化器优化生成的transformer模型;
S10:重复步骤S3至步骤S9的过程,训练transformer模型,获得预警结果。
2.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,所述步骤S1中,物联网电梯的原始数据包括:电梯数据、故障数据、天气数据。
3.根据权利要求2所述的基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,所述步骤S1中,所述原始数据进行预处理的步骤包括:
S1.1:将原始数据中空缺的数据采用径向基函数插值法进行插值,使用高斯函数作为径向基函数,其插值公式为:
,
其中x为原始数据,为原始数据的方差;
S1.2:对原始数据进行校正。
4.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,所述步骤S2中,所述时序特征进行位置编码的计算公式为:
,
,
其中,pos表示位置索引,dmodel表示输入的嵌入维度,i表示嵌入向量中的第几维,PE表示计算获得的位置编码。
5.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,所述步骤S3具体步骤包括:
S31:将拼接后的特征按照时间序列分成多个方块并将其排成一列;
S32:将重新排列后的特征按照时间序列的方式输入transformer模型的线性层进行加权求和,以获得维度为的查询向量/>、维度为/>的键向量/>和维度为/>的值向量/>;
S3.3:计算注意力特征,其计算公式为:
,
其中,表示Softmax激活函数,/>表示时间序列,n表示时间序列长度,m表示序列中的元素。
6.根据权利要求5所述的基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,所述步骤S3中,拼接后的输入特征可在transformer模型的不同位置之间进行注意力传递。
7.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,所述步骤S3中,各transformer编码器之间的结构表达式为:
,
其中,表示上一transformer编码器的输入特征,/>表示当前transformer编码器输出。
8.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,所述步骤S4中的layernorm层内设有残差模块,所述残差模块与全连接层跳跃连接。
9.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,所述步骤S8中,步骤S3至步骤S7的重复次数为transformer编码器的堆叠个数。
10.根据权利要求1所述的基于空间注意力网络与特征划分的电梯风险预警方法,其特征在于,所述步骤S8中,分类模块通过sigmoid激活函数对全连接层的结果进行激活,获得预测概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311756483.3A CN117435918B (zh) | 2023-12-20 | 2023-12-20 | 一种基于空间注意力网络与特征划分的电梯风险预警方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311756483.3A CN117435918B (zh) | 2023-12-20 | 2023-12-20 | 一种基于空间注意力网络与特征划分的电梯风险预警方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117435918A CN117435918A (zh) | 2024-01-23 |
CN117435918B true CN117435918B (zh) | 2024-03-15 |
Family
ID=89553860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311756483.3A Active CN117435918B (zh) | 2023-12-20 | 2023-12-20 | 一种基于空间注意力网络与特征划分的电梯风险预警方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117435918B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114266201A (zh) * | 2022-03-01 | 2022-04-01 | 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) | 一种基于深度学习的自注意力电梯困人预测方法 |
CN114298417A (zh) * | 2021-12-29 | 2022-04-08 | 中国银联股份有限公司 | 反欺诈风险评估方法、训练方法、装置及可读存储介质 |
CN114648097A (zh) * | 2022-03-17 | 2022-06-21 | 南京优湖科技有限公司 | 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法 |
CN115622047A (zh) * | 2022-11-04 | 2023-01-17 | 中海储能科技(北京)有限公司 | 基于Transformer模型的电力变压器负荷预测方法 |
CN115795351A (zh) * | 2023-01-29 | 2023-03-14 | 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) | 一种基于残差网络和2d特征表示的电梯大数据风险预警方法 |
CN115831377A (zh) * | 2022-07-01 | 2023-03-21 | 中南大学 | 基于icu病历数据的院内死亡风险预测方法 |
CN115964467A (zh) * | 2023-01-02 | 2023-04-14 | 西北工业大学 | 一种融合视觉情境的富语义对话生成方法 |
CN116070799A (zh) * | 2023-03-30 | 2023-05-05 | 南京邮电大学 | 一种基于注意力及深度学习的光伏发电量预测系统及方法 |
CN116151459A (zh) * | 2023-02-28 | 2023-05-23 | 国网河南省电力公司电力科学研究院 | 基于改进Transformer的电网防汛风险概率预测方法和系统 |
CN116307103A (zh) * | 2023-02-15 | 2023-06-23 | 河南大学 | 一种基于硬参数共享多任务学习的交通事故预测方法 |
CN116842127A (zh) * | 2023-08-31 | 2023-10-03 | 中国人民解放军海军航空大学 | 一种基于多源动态数据的自适应辅助决策智能方法及系统 |
CN117173854A (zh) * | 2023-09-13 | 2023-12-05 | 西安博深安全科技股份有限公司 | 一种基于深度学习的煤矿明火预警方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393025A (zh) * | 2021-06-07 | 2021-09-14 | 浙江大学 | 一种基于Informer模型编码结构的非侵入式负荷分解方法 |
US20230402136A1 (en) * | 2022-06-08 | 2023-12-14 | Microsoft Technology Licensing, Llc | Transformer-based graph neural network trained with structural information encoding |
-
2023
- 2023-12-20 CN CN202311756483.3A patent/CN117435918B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114298417A (zh) * | 2021-12-29 | 2022-04-08 | 中国银联股份有限公司 | 反欺诈风险评估方法、训练方法、装置及可读存储介质 |
WO2023124204A1 (zh) * | 2021-12-29 | 2023-07-06 | 中国银联股份有限公司 | 反欺诈风险评估方法、训练方法、装置及可读存储介质 |
CN114266201A (zh) * | 2022-03-01 | 2022-04-01 | 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) | 一种基于深度学习的自注意力电梯困人预测方法 |
CN114648097A (zh) * | 2022-03-17 | 2022-06-21 | 南京优湖科技有限公司 | 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法 |
CN115831377A (zh) * | 2022-07-01 | 2023-03-21 | 中南大学 | 基于icu病历数据的院内死亡风险预测方法 |
CN115622047A (zh) * | 2022-11-04 | 2023-01-17 | 中海储能科技(北京)有限公司 | 基于Transformer模型的电力变压器负荷预测方法 |
CN115964467A (zh) * | 2023-01-02 | 2023-04-14 | 西北工业大学 | 一种融合视觉情境的富语义对话生成方法 |
CN115795351A (zh) * | 2023-01-29 | 2023-03-14 | 杭州市特种设备检测研究院(杭州市特种设备应急处置中心) | 一种基于残差网络和2d特征表示的电梯大数据风险预警方法 |
CN116307103A (zh) * | 2023-02-15 | 2023-06-23 | 河南大学 | 一种基于硬参数共享多任务学习的交通事故预测方法 |
CN116151459A (zh) * | 2023-02-28 | 2023-05-23 | 国网河南省电力公司电力科学研究院 | 基于改进Transformer的电网防汛风险概率预测方法和系统 |
CN116070799A (zh) * | 2023-03-30 | 2023-05-05 | 南京邮电大学 | 一种基于注意力及深度学习的光伏发电量预测系统及方法 |
CN116842127A (zh) * | 2023-08-31 | 2023-10-03 | 中国人民解放军海军航空大学 | 一种基于多源动态数据的自适应辅助决策智能方法及系统 |
CN117173854A (zh) * | 2023-09-13 | 2023-12-05 | 西安博深安全科技股份有限公司 | 一种基于深度学习的煤矿明火预警方法及系统 |
Non-Patent Citations (3)
Title |
---|
LabanFormer: Multi-scale graph attention network and transformer with gated recurrent positional encoding for labanotation generation;Min Li 等;《Neurocomputing》;20230628;第539卷;1-14 * |
基于时空大数据与卫星图像的城市火灾风险预测;王新迪 等;《计算机工程》;20230630;第49卷(第6期);242-249 * |
基于预训练模型的机器阅读理解研究综述;张超然 等;《计算机工程与应用》;20201231;第56卷(第11卷);17-25 * |
Also Published As
Publication number | Publication date |
---|---|
CN117435918A (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Critical review of data-driven decision-making in bridge operation and maintenance | |
CN111798051B (zh) | 基于长短期记忆神经网络的空气质量时空预测方法 | |
CN109492830B (zh) | 一种基于时空深度学习的移动污染源排放浓度预测方法 | |
CN113723010B (zh) | 一种基于lstm温度-位移相关模型的桥梁损伤预警方法 | |
CN110132603B (zh) | 基于并集置信规则库和蚁群算法的船舶柴油机故障定位方法 | |
CN108764601A (zh) | 一种基于计算机视觉和深度学习技术的结构健康监测异常数据诊断方法 | |
CN111339712A (zh) | 质子交换膜燃料电池剩余寿命预测方法 | |
CN113807432A (zh) | 一种基于深度学习的气温预报数据订正方法 | |
CN113743016B (zh) | 基于自编码器和回声状态网络的发动机剩余寿命预测方法 | |
Hosseini et al. | Use of deep learning to study modeling deterioration of pavements a case study in Iowa | |
CN110636066B (zh) | 基于无监督生成推理的网络安全威胁态势评估方法 | |
CN115392360B (zh) | 基于Transformer的大型桥梁温度-响应相关模式识别与健康诊断方法 | |
CN110989044B (zh) | 空气质量分指数级别概率预报方法、装置、设备及存储介质 | |
CN115795351B (zh) | 一种基于残差网络和2d特征表示的电梯大数据风险预警方法 | |
CN110533239A (zh) | 一种智慧城市空气品质高精度测量方法 | |
CN117435997B (zh) | 一种基于Transformer和时序压缩机制的电梯预警及按需维保方法 | |
Xia et al. | Artificial intelligence based structural assessment for regional short-and medium-span concrete beam bridges with inspection information | |
CN115526265A (zh) | 一种基于递进式学习结构的非侵入式负荷分解方法 | |
CN116502123A (zh) | 一种航空发动机剩余使用寿命无监督跨域预测方法 | |
CN114662389B (zh) | 面向空气污染物的自相关误差Informer模型长时序预测方法及系统 | |
CN116013426A (zh) | 一种高时空分辨率的站点臭氧浓度预测方法 | |
CN117094180B (zh) | 一种数字孪生模型量化制作系统 | |
CN117435918B (zh) | 一种基于空间注意力网络与特征划分的电梯风险预警方法 | |
CN111505706B (zh) | 基于深度T-Net网络的微地震P波初至拾取方法及装置 | |
CN115508765B (zh) | 一种电压互感器采集装置在线自诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |