CN114550460B - 轨道交通异常检测方法、装置及存储介质 - Google Patents

轨道交通异常检测方法、装置及存储介质 Download PDF

Info

Publication number
CN114550460B
CN114550460B CN202210436887.3A CN202210436887A CN114550460B CN 114550460 B CN114550460 B CN 114550460B CN 202210436887 A CN202210436887 A CN 202210436887A CN 114550460 B CN114550460 B CN 114550460B
Authority
CN
China
Prior art keywords
deformable
module
transformer
rail transit
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210436887.3A
Other languages
English (en)
Other versions
CN114550460A (zh
Inventor
刘伟
胡卫明
李兵
原春锋
高晋
王绍儒
杨力
林泽锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renmin Zhongke Beijing Intelligent Technology Co ltd
Institute of Automation of Chinese Academy of Science
Original Assignee
Renmin Zhongke Beijing Intelligent Technology Co ltd
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renmin Zhongke Beijing Intelligent Technology Co ltd, Institute of Automation of Chinese Academy of Science filed Critical Renmin Zhongke Beijing Intelligent Technology Co ltd
Priority to CN202210436887.3A priority Critical patent/CN114550460B/zh
Publication of CN114550460A publication Critical patent/CN114550460A/zh
Application granted granted Critical
Publication of CN114550460B publication Critical patent/CN114550460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本申请提供一种轨道交通异常检测方法、装置及存储介质,其中方法包括:获取轨道交通设备中被监测传感器的时间序列数据;将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块用于基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果。

Description

轨道交通异常检测方法、装置及存储介质
技术领域
本申请涉及城市轨道交通技术领域,尤其涉及一种轨道交通异常检测方法、装置及存储介质。
背景技术
在城市轨道交通运维的领域中,高速列车的振动数据、轴温数据等,都可以以时间序列的形式进行统计。轨道交通异常检测是指对反常的、与历史行为不同的模式进行识别。
目前基于时间跨度进行轨道交通异常检测的方法主要有:基于差分整合移动平均自回归模型(Autoregressive Integrated Moving Average model, ARIMA)、循环神经网络(Recurrent Neural Network, RNN)和长短期记忆网络(Long Short-Term Memory,LSTM)进行轨道交通异常检测。
ARIMA要求时间序列数据具有平稳性,然而城市轨道交通实际获取的数据不具有平稳性的特点,因此,引入了RNN和LSTM来针对非平稳数据建模。但是RNN存在信息传递距离长和效率低下的问题,LSTM只能在一定程度上环节传递间的梯度和遗忘问题。
机器翻译(Transformer)模型可以解决RNN和LSTM的效率问题和传递中的缺陷,但存在运算量高以及模型收敛慢的问题,当时间序列增加时,不利于轨道交通对异常检测的实时性要求。
发明内容
针对现有技术存在的上述问题,本申请提供一种轨道交通异常检测方法、装置及存储介质。
第一方面,本申请提供一种轨道交通异常检测方法,包括:
获取轨道交通设备中被监测传感器的时间序列数据;
将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;
所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块用于基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果。
可选地,所述将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果,包括:
将所述时间序列数据和位置编码相加作为所述可变形Transformer编码模块的输入,得到所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征;
将所述时间序列数据和位置编码相加作为所述全局特征提取模块的输入,得到所述全局特征提取模块输出的所述时间序列数据的全局特征;
将所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特征提取模块输出的所述时间序列数据的全局特征作为所述可变形Transformer解码模块的输入,得到所述可变形Transformer解码模块输出的所述轨道交通异常检测结果。
可选地,所述可变形Transformer编码模块是通过将多尺度可变形注意力模块替代Transformer中的注意力模块得到的,所述可变形Transformer编码模块的输入和输出是相同分辨率的多尺度特征。
可选地,所述全局特征提取模块采用卷积神经网络CNN结构。
可选地,所述可变形Transformer解码模块包括自注意力模块和交叉注意力模块。
可选地,所述可变形Transformer解码模块输出的所述轨道交通异常检测结果满足如下计算公式:
Figure 668728DEST_PATH_IMAGE001
其中,
Figure 442649DEST_PATH_IMAGE002
表示查询元素q的上下文特征,
Figure 370154DEST_PATH_IMAGE003
表示查询元素q的二维参考点,
Figure 305749DEST_PATH_IMAGE004
表 示所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特 征提取模块输出的所述时间序列数据的全局特征的融合,m表示注意力头的索引,
Figure 685915DEST_PATH_IMAGE005
Figure 992088DEST_PATH_IMAGE006
均表示参数矩阵,k表示采样键的索引,
Figure 774099DEST_PATH_IMAGE007
表示第m个注意力头中第k个采样键的注 意力权重,
Figure 880595DEST_PATH_IMAGE008
表示第m个注意力头中第k个采样键的采样偏移。
可选地,所述方法还包括:
将所述轨道交通异常检测结果与观测值进行比较得到差值绝对值;
当所述差值绝对值超出预设阈值时,进行轨道交通异常告警。
第二方面,本申请提供一种轨道交通异常检测装置,包括:
获取单元,用于获取轨道交通设备中被监测传感器的时间序列数据;
检测单元,用于将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;
所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果。
第三方面,本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述任一种轨道交通异常检测方法的步骤。
第四方面,本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述任一种轨道交通异常检测方法。
第五方面,本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述任一种轨道交通异常检测方法。
本申请提供的轨道交通异常检测方法、装置及存储介质,通过可变形Transformer编码模块聚合多尺度特征,同时通过全局特征提取模块提取时间序列的全局特征,同时关注时间序列数据的多尺度特征和全局特征,提高模型收敛速度,捕获序列中的长距离依赖关系,实现轨道交通异常的实时检测。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以基于这些附图获得其他的附图。
图1是本申请实施例提供的轨道交通异常检测方法的流程示意图之一;
图2是本申请实施例提供的轨道交通异常检测方法的流程示意图之二;
图3是本申请实施例提供的轨道交通异常检测装置的结构示意图;
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
为了更好地对本申请实施例中的技术方案进行描述,下面对相关知识进行介绍。
(1)时间序列
时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。在城市轨道交通运维过程中,时间序列是一种常见的数据形式。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。
(2)轨道交通异常检测
在城市轨道交通运维过程中,高速列车的振动数据、轴温数据等,都可以以时间序列的方式进行统计。列车的振动数据是指列车在运行过程中,其移动的轴荷载和由于轮轨接触表面不平顺而产生的轮轨动荷激发车辆和轨道结构振动。
轴温是指轴箱温度,列车在运行过程中,车轴与轴承相互摩擦产生热能,当车轴与轴承间出现故障时,摩擦力增加导致热能增加,轴箱的温度随之升高。
轨道交通异常检测是指针对反常的、和历史行为不同的模式进行识别,例如某列车的轴温值突然飙升、某系统在本应当业务繁忙的时间段请求数量降为0等。
(3)ARIMA
差分整合移动平均自回归模型是在平稳的时间序列基础上建立起来的,因此时间序列的平稳性是建模的重要前提。如果时间序列不稳定,也可以通过一些操作(例如取对数、差分等)去使得时间序列稳定,然后进行ARIMA模型预测。然而在轨道交通异常检测过程中,实际获取到的真实序列数据并不具有平稳性,ARIMA模型对于非平稳数据的表现性能较差。为了解决对数据苛刻的要求,引入了神经网络的形式对非平稳数据进行建模。
(4)RNN
RNN是一类以序列数据为输入,在序列的演进方向进行递归且所有节点按链式连接的递归神经网络。RNN在对时间序列数据预测建模过程中存在两个问题:一是效率问题,建模过程中需要逐个对输入数据进行处理,后一个数据要等到前一个数据的隐状态输出以后才能开始处理;二是若传递距离过长会产生梯度消失、梯度爆炸和遗忘问题。
(5)LSTM
LTSM是一种时间循环神经网络,是为了解决一般的RNN存在的长期依赖问题而专门设计出来的,适用于处理和预测时间序列中间隔和延迟非常长的重要事件。但是LTSM只能在一定程度上缓解传递间的梯度和遗忘问题。
(6)Transformer
Transformer结构可以有效地解决RNN和LSTM存在的效率问题和传递中的缺陷。但是,由于Transformer中的查询会关注所有的空间位置的信息作为采样键,特征图大且多,导致计算量增加,模型收敛慢。当时间序列增加时,无法满足轨道交通异常检测的实时性要求。
针对现有技术存在的上述问题,本申请实施例提供一种轨道交通异常检测方法、装置及存储介质,通过可变形Transformer编码模块提取参考点周围的时间序列特征,突出特征图像素的关键元素并降低模型参数的优化难度,同时通过CNN全局特征提取模块提取时间序列的全局特征,实现轨道交通异常的实时检测。
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1是本申请实施例提供的轨道交通异常检测方法的流程示意图之一,如图1所示,本申请实施例提供一种轨道交通异常检测方法,其执行主体为用于轨道交通异常检测的装置,该方法至少包括以下步骤:
步骤101、获取轨道交通设备中被监测传感器的时间序列数据。
步骤102、将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;
所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块用于基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果。
具体地,在进行轨道交通异常检测之前,获取轨道交通设备中被监测传感器的时间序列数据,例如高速列车振动数据、轴温数据等。在本申请实施例中,数据以一维时间序列的形式作为轨道交通异常检测模型的输入。
其中,可以根据需要设定对被监测传感器的时间序列数据进行采样时的数据长度,以降低模型的计算量,也可以使得模型关注到不同尺度的数据特征。
将时间序列数据输入至轨道交通异常检测模型,得到轨道交通异常检测模型输出的轨道交通异常检测模型输出的轨道交通异常检测结果;轨道交通异常检测模型是通过时间序列数据样本和预先设定的轨道交通异常检测结果标签训练得到的。
在本申请实施例中,轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块。其中,可变形Transformer编码模块用于提取时间序列数据的多尺度特征,全局特征提取模块用于提取时间序列数据的全局特征,可变形Transformer解码模块执行特征融合任务,基于时间序列数据的多尺度特征和全局特征生成轨道交通异常检测结果。
传统的Transformer模型中的查询会关注所有的空间位置的信息作为键,而可变形Transformer编码模块只关注网络认为更有意义的、只包含局部信息的位置,同时结合了可变形卷积的稀疏空间采样的优点和Transformer的关系建模能力,因此可以减少传统Transformer模型中特征图大导致的计算量大、模型收敛慢的问题。
同时,考虑到可变形Transformer编码模块缺少对全局特征的关注,本申请中设置全局提取模块提取时间序列数据的全局特征。
本申请实施例提供的轨道交通异常检测方法,通过可变形Transformer编码模块聚合多尺度特征,同时通过全局特征提取模块提取时间序列的全局特征,同时关注时间序列数据的多尺度特征和全局特征,提高模型收敛速度,捕获序列中的长距离依赖关系,实现轨道交通异常的实时检测。
可选地,所述将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果,包括:
将所述时间序列数据和位置编码相加作为所述可变形Transformer编码模块的输入,得到所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征;
将所述时间序列数据和位置编码相加作为所述全局特征提取模块的输入,得到所述全局特征提取模块输出的所述时间序列数据的全局特征;
将所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特征提取模块输出的所述时间序列数据的全局特征作为所述可变形Transformer解码模块的输入,得到所述可变形Transformer解码模块输出的所述轨道交通异常检测结果。
可选地,所述可变形Transformer编码模块是通过将多尺度可变形注意力模块替代Transformer中的注意力模块得到的,所述可变形Transformer编码模块的输入和输出是相同分辨率的多尺度特征。
具体地,本申请实施例中的可变形Transformer编码模块是通过将多尺度可变形注意力模块替代传统Transformer中的注意力模块得到的。Transformer中的注意力模块在处理图像特征图存在收敛速度慢和特征空间分辨率受限的问题。
多尺度可变形注意力模块将一个小的采样位置集合作为一个预过滤器突出所有特征图像素中的关键元素,可以自然地扩展到聚合多尺度特征。多尺度可变形注意力模块只关心参考点周围的一小组关键采样点,而无需考虑特征图的空间大小。
多尺度可变形注意力模块可以有效解决Transformer在包含大量关键元素时的高时间和内存复杂性,通过注意力机制自然地聚合多尺度特征图,有效地提高模型性能。可变形Transformer编码模块中每个查询都包含少量固定数量的键,键的选择由网络学习得到,可变形Transformer编码模块的输入和输出都是相同分辨率的多尺度特征,对于每个查询像素,参考点就是其本身。有效地加快模型的收敛速度和减轻特征空间分辨率的问题。
本申请实施例中的可变形Transformer编码模块结合了可变形卷积的稀疏空间采样的优点和Transformer的关系建模能力。可变形卷积的每个注意力头只关注一个采样点,而多尺度可变形注意力模块可以从多尺度输入中查看多个采样点。
此外,本申请实施例中在原始输入中嵌入带有维度的位置编码,以获得可变形Transformer编码模块的最终输入,以弥补传统Transformer结构的置换不变性导致的对位置信息的建模能力的缺失。
将时间序列数据和位置编码相加作为可变形Transformer编码模块的输入,最终得到可变形Transformer编码模块输出的时间序列数据的多尺度特征。通过设定时间序列数据的序列长度,可以使得模型关注到不同尺寸的特征。
可选地,所述全局特征提取模块采用卷积神经网络CNN结构。
具体地,为了弥补可变形Transformer编码模块对全局特征的关注的缺乏,本申请实施例中提供的轨道交通异常检测模型中设置了全局特征提取模块,全局特征提取模块可以使用卷积神经网络(Convolutional Neural Networks, CNN)结构。
以全局特征提取模块采用CNN结构为例,本申请借助CNN结构提取时间序列数据的全局特征,由于输入的是一维时间序列数据,提取到的时间序列数据的全局特征可以通过如下计算公式进行表示:
Figure 748057DEST_PATH_IMAGE009
其中,
Figure 598202DEST_PATH_IMAGE010
表示输入的时间序列数据,
Figure 500298DEST_PATH_IMAGE011
表示一维卷积核,输出特征
Figure 43275DEST_PATH_IMAGE012
经过多次 卷积和池化操作后得到最终的全局特征。
本申请实施例提供的轨道交通异常检测方法,通过CNN网络结构提取时间序列数据的全局特征,弥补了传统的Transformer结构缺少特征的全局监督的问题,同时关注到时间序列数据的多尺度特征和全局特征,提高了轨道交通异常检测的实时性和准确性。
可选地,所述可变形Transformer解码模块包括自注意力模块和交叉注意力模块。
具体地,融合可变形Transformer编码模块和全局特征提取模块的输出作为可变形Transformer解码模块的输入,在解码器中包含两种注意力模块,分别为交叉注意力模块和自注意力模块。自注意力模块可以使模型关注到解码器的查询元素(queries)之间的相关性,交叉注意力模块使模型关注到编码器输出和解码器的查询元素之间的相关性。
在交叉注意力模块中,目标查询提取来自特征图的特征,查询元素属于目标查询,而键元素来自于可变形Transformer编码模块和全局特征提取模块的输出。在自注意力模块中,目标查询相互交互,其中键元素是目标查询。
可选地,所述可变形Transformer解码模块输出的所述轨道交通异常检测结果满足如下计算公式:
Figure 132454DEST_PATH_IMAGE013
其中,
Figure 786289DEST_PATH_IMAGE002
表示查询元素q的上下文特征,
Figure 542893DEST_PATH_IMAGE003
表示查询元素q的二维参考点,
Figure 991192DEST_PATH_IMAGE004
表 示所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特 征提取模块输出的所述时间序列数据的全局特征的融合,m表示注意力头的索引,
Figure 833246DEST_PATH_IMAGE005
Figure 25192DEST_PATH_IMAGE006
均表示参数矩阵,k表示采样键的索引,
Figure 370723DEST_PATH_IMAGE007
表示第m个注意力头中第k个采样键的注 意力权重,
Figure 521082DEST_PATH_IMAGE008
表示第m个注意力头中第k个采样键的采样偏移。
其中,标量注意力权重
Figure 584853DEST_PATH_IMAGE007
的取值位于[0,1]的区间,由公式:
Figure 580491DEST_PATH_IMAGE014
完成注意力权重的归一化处理。
采样偏移
Figure 780528DEST_PATH_IMAGE008
是范围不受约束的二维实数。注意力权重
Figure 836208DEST_PATH_IMAGE007
和采样偏移
Figure 658714DEST_PATH_IMAGE008
都是通过对
Figure 192464DEST_PATH_IMAGE002
的线性投影获取的。
可选地,所述轨道交通异常检测模型是基于时间序列数据样本和预先确定的轨道交通异常检测结果标签训练后得到的。
可选地,将获取到的轨道交通设备中被监测传感器的时间序列数据通过并行输入的方式进行训练,可以使得轨道交通异常检测模型关注到历史数据特征。将训练好的轨道交通异常检测模型进行保存,在实际应用过程中只需要加载轨道交通异常检测模型,即可实现轨道交通异常检测。
可选地,所述方法还包括:
将所述轨道交通异常检测结果与观测值进行比较得到差值绝对值;
当所述差值绝对值超出预设阈值时,进行轨道交通异常告警。
具体地,将实时采集到的轨道交通设备中被监测传感器的时间序列数据输入到本申请中的轨道交通异常检测模型,得到输出的轨道交通异常检测结果,该结果为一个预测值,将得到的轨道交通异常检测结果与实际的观测值进行比较,判断预测值与观测值之间的差值,当差值绝对值超出了事先设定的预设阈值,则进行轨道交通异常告警。
轨道交通运维人员根据该告警对相关设备进行检查维修等处理。
图2是本申请实施例提供的轨道交通异常检测方法的流程示意图之二,如图2所示,本申请实施例提供的轨道交通异常检测模型是一个可变形Transformer编码器+CNN网络+可变形Transformer解码器的结构,依次完成时间序列数据的多尺度特征编码,全局特征提取和特征融合解码,可变形Transformer输出的多尺度特征和CNN网络输出的全局特征共同作为可变形Transformer解码器的输入,最终由可变形Transformer解码器输出轨道交通异常检测结果。
其中,CNN网络依次包括三层卷积(Conv)层,一层池化(Pooling)层和一层压平(Flatten)层。
将采集到的轨道交通设备中被监测传感器的历史时间序列数据中嵌入位置编码,作为可变形Transformer编码器和CNN网络的输入,将可变形Transformer编码器和CNN网络的输出特征融合后作为可变形Transformer解码器的输出,对轨道交通异常检测模型进行训练。
当轨道交通异常检测模型收敛后,计算100个模型预测值和实际观测值之间的差值绝对值,将该差值绝对值作为轨道交通异常检测过程中进行异常判断的预设阈值。
根据给定序列长度实时获取轨道交通设备中被监测传感器的时间序列数据,输入到训练好的轨道交通异常检测模型中,以模型输出的轨道交通异常结果作为预测值,与实际的观测值进行比较,当两者的差值超出前述的预设阈值时,进行异常告警。
下面对本申请提供的轨道交通异常检测装置进行描述,下文描述的轨道交通异常检测装置与上文描述的轨道交通异常检测方法可相互对应参照。
图3是本申请实施例提供的轨道交通异常检测装置的结构示意图,如图3所示,本申请实施例提供一种轨道交通异常检测装置,该装置包括:
获取单元301,用于获取轨道交通设备中被监测传感器的时间序列数据;
检测单元302,用于将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;
所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块用于基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果。
可选地,所述检测单元还用于:
将所述时间序列数据和位置编码相加作为所述可变形Transformer编码模块的输入,得到所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征;
将所述时间序列数据和位置编码相加作为所述全局特征提取模块的输入,得到所述全局特征提取模块输出的所述时间序列数据的全局特征;
将所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特征提取模块输出的所述时间序列数据的全局特征作为所述可变形Transformer解码模块的输入,得到所述可变形Transformer解码模块输出的所述轨道交通异常检测结果。
可选地,所述可变形Transformer编码模块是通过将多尺度可变形注意力模块替代Transformer中的注意力模块得到的,所述可变形Transformer编码模块的输入和输出是相同分辨率的多尺度特征。
可选地,所述全局特征提取模块采用卷积神经网络CNN结构。
可选地,所述可变形Transformer解码模块包括自注意力模块和交叉注意力模块。
可选地,所述可变形Transformer解码模块输出的所述轨道交通异常检测结果满足如下计算公式:
Figure 512587DEST_PATH_IMAGE015
其中,
Figure 739169DEST_PATH_IMAGE002
表示查询元素q的上下文特征,
Figure 777532DEST_PATH_IMAGE003
表示查询元素q的二维参考点,
Figure 114972DEST_PATH_IMAGE004
表 示所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特 征提取模块输出的所述时间序列数据的全局特征的融合,m表示注意力头的索引,
Figure 555181DEST_PATH_IMAGE005
Figure 687085DEST_PATH_IMAGE006
均表示参数矩阵,k表示采样键的索引,
Figure 212744DEST_PATH_IMAGE007
表示第m个注意力头中第k个采样键的注 意力权重,
Figure 353875DEST_PATH_IMAGE008
表示第m个注意力头中第k个采样键的采样偏移。
可选地,所述装置还包括:
确定单元,用于将所述轨道交通异常检测结果与观测值进行比较得到差值绝对值;
告警单元,用于当所述差值绝对值超出预设阈值时,进行轨道交通异常告警。
在此需要说明的是,本申请实施例提供的上述装置,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
图4是本申请实施例提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)401、通信接口(Communications Interface)402、存储器(memory)403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信。处理器401可以调用存储器403中的逻辑指令,以执行轨道交通异常检测方法,该方法包括:
获取轨道交通设备中被监测传感器的时间序列数据;
将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;
所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块用于基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果。
可选地,所述将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果,包括:
将所述时间序列数据和位置编码相加作为所述可变形Transformer编码模块的输入,得到所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征;
将所述时间序列数据和位置编码相加作为所述全局特征提取模块的输入,得到所述全局特征提取模块输出的所述时间序列数据的全局特征;
将所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特征提取模块输出的所述时间序列数据的全局特征作为所述可变形Transformer解码模块的输入,得到所述可变形Transformer解码模块输出的所述轨道交通异常检测结果。
可选地,所述可变形Transformer编码模块是通过将多尺度可变形注意力模块替代Transformer中的注意力模块得到的,所述可变形Transformer编码模块的输入和输出是相同分辨率的多尺度特征。
可选地,所述全局特征提取模块采用卷积神经网络CNN结构。
可选地,所述可变形Transformer解码模块包括自注意力模块和交叉注意力模块。
可选地,所述可变形Transformer解码模块输出的所述轨道交通异常检测结果满足如下计算公式:
Figure 648591DEST_PATH_IMAGE016
其中,
Figure 951396DEST_PATH_IMAGE002
表示查询元素q的上下文特征,
Figure 964351DEST_PATH_IMAGE003
表示查询元素q的二维参考点,
Figure 643594DEST_PATH_IMAGE004
表 示所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特 征提取模块输出的所述时间序列数据的全局特征的融合,m表示注意力头的索引,
Figure 58395DEST_PATH_IMAGE005
Figure 797681DEST_PATH_IMAGE006
均表示参数矩阵,k表示采样键的索引,
Figure 32353DEST_PATH_IMAGE007
表示第m个注意力头中第k个采样键的注 意力权重,
Figure 249708DEST_PATH_IMAGE008
表示第m个注意力头中第k个采样键的采样偏移。
可选地,所述方法还包括:
将所述轨道交通异常检测结果与观测值进行比较得到差值绝对值;
当所述差值绝对值超出预设阈值时,进行轨道交通异常告警。
此外,上述的存储器403中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的轨道交通异常检测方法,该方法包括:
获取轨道交通设备中被监测传感器的时间序列数据;
将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;
所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块用于基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果。
又一方面,本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的轨道交通异常检测方法,该方法包括:
获取轨道交通设备中被监测传感器的时间序列数据;
将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;
所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块用于基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以基于实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (8)

1.一种轨道交通异常检测方法,其特征在于,包括:
获取轨道交通设备中被监测传感器的时间序列数据;
将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;
所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块用于基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果;
所述将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果,包括:
将所述时间序列数据和位置编码相加作为所述可变形Transformer编码模块的输入,得到所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征;
将所述时间序列数据和位置编码相加作为所述全局特征提取模块的输入,得到所述全局特征提取模块输出的所述时间序列数据的全局特征;
将所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特征提取模块输出的所述时间序列数据的全局特征作为所述可变形Transformer解码模块的输入,得到所述可变形Transformer解码模块输出的所述轨道交通异常检测结果;
所述可变形Transformer编码模块是通过将多尺度可变形注意力模块替代Transformer中的注意力模块得到的,所述可变形Transformer编码模块的输入和输出是相同分辨率的多尺度特征。
2.根据权利要求1所述的轨道交通异常检测方法,其特征在于,
所述全局特征提取模块采用卷积神经网络CNN结构。
3.根据权利要求1所述的轨道交通异常检测方法,其特征在于,所述可变形Transformer解码模块包括自注意力模块和交叉注意力模块。
4.根据权利要求3所述的轨道交通异常检测方法,其特征在于,所述可变形Transformer解码模块输出的所述轨道交通异常检测结果满足如下计算公式:
Figure DEST_PATH_IMAGE001
其中,
Figure 430137DEST_PATH_IMAGE002
表示查询元素
Figure 881978DEST_PATH_IMAGE003
的上下文特征,
Figure 73925DEST_PATH_IMAGE004
表示查询元素
Figure 560401DEST_PATH_IMAGE003
的二维参考点,
Figure 54968DEST_PATH_IMAGE005
表 示所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特 征提取模块输出的所述时间序列数据的全局特征的融合,m表示注意力头的索引,
Figure 994105DEST_PATH_IMAGE006
Figure 989743DEST_PATH_IMAGE007
均表示参数矩阵,k表示采样键的索引,
Figure 596305DEST_PATH_IMAGE008
表示第m个注意力头中第k个采样键的 注意力权重,
Figure 261772DEST_PATH_IMAGE009
表示第m个注意力头中第k个采样键的采样偏移。
5.根据权利要求1所述的轨道交通异常检测方法,其特征在于,所述方法还包括:
将所述轨道交通异常检测结果与观测值进行比较得到差值绝对值;
当所述差值绝对值超出预设阈值时,进行轨道交通异常告警。
6.一种轨道交通异常检测装置,其特征在于,包括:
获取单元,用于获取轨道交通设备中被监测传感器的时间序列数据;
检测单元,用于将所述时间序列数据输入至轨道交通异常检测模型,得到所述轨道交通异常检测模型输出的轨道交通异常检测结果;
所述轨道交通异常检测模型包括可变形Transformer编码模块、全局特征提取模块和可变形Transformer解码模块,所述可变形Transformer编码模块用于提取所述时间序列数据的多尺度特征,所述全局特征提取模块用于提取所述时间序列数据的全局特征,所述可变形Transformer解码模块基于所述时间序列数据的多尺度特征和全局特征生成所述轨道交通异常检测结果;
所述检测单元还用于:
将所述时间序列数据和位置编码相加作为所述可变形Transformer编码模块的输入,得到所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征;
将所述时间序列数据和位置编码相加作为所述全局特征提取模块的输入,得到所述全局特征提取模块输出的所述时间序列数据的全局特征;
将所述可变形Transformer编码模块输出的所述时间序列数据的多尺度特征和所述全局特征提取模块输出的所述时间序列数据的全局特征作为所述可变形Transformer解码模块的输入,得到所述可变形Transformer解码模块输出的所述轨道交通异常检测结果;
所述可变形Transformer编码模块是通过将多尺度可变形注意力模块替代Transformer中的注意力模块得到的,所述可变形Transformer编码模块的输入和输出是相同分辨率的多尺度特征。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述轨道交通异常检测方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述轨道交通异常检测方法。
CN202210436887.3A 2022-04-25 2022-04-25 轨道交通异常检测方法、装置及存储介质 Active CN114550460B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210436887.3A CN114550460B (zh) 2022-04-25 2022-04-25 轨道交通异常检测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210436887.3A CN114550460B (zh) 2022-04-25 2022-04-25 轨道交通异常检测方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN114550460A CN114550460A (zh) 2022-05-27
CN114550460B true CN114550460B (zh) 2022-07-12

Family

ID=81667715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210436887.3A Active CN114550460B (zh) 2022-04-25 2022-04-25 轨道交通异常检测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN114550460B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115840875A (zh) * 2022-11-10 2023-03-24 北京擎天信安科技有限公司 一种基于Anomaly Transformer的毫米波雷达异常信号检测方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150044141A (ko) * 2013-10-16 2015-04-24 현대다이모스(주) 철도차량용 감속장치의 이상유무 감지장치 및 감지방법
CN106080655A (zh) * 2016-08-24 2016-11-09 中车株洲电力机车研究所有限公司 一种列车轴温异常的检测方法、装置以及列车
CN113283409A (zh) * 2021-07-23 2021-08-20 中国人民解放军国防科技大学 基于EfficientDet和Transformer的航空图像中的飞机检测方法
CN113570516A (zh) * 2021-07-09 2021-10-29 湖南大学 基于CNN-Transformer混合自编码器的图像盲运动去模糊方法
CN113887513A (zh) * 2021-10-28 2022-01-04 重庆邮电大学 一种基于并行CNN-Transformer神经网络的运动想象脑电信号分类方法
CN113936256A (zh) * 2021-10-15 2022-01-14 北京百度网讯科技有限公司 一种图像目标检测方法、装置、设备以及存储介质
CN114065862A (zh) * 2021-11-18 2022-02-18 南京航空航天大学 一种多维时序数据异常检测方法和系统
CN114118375A (zh) * 2021-11-29 2022-03-01 吉林大学 一种基于时序图Transformer的连续动态网络表征学习方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150044141A (ko) * 2013-10-16 2015-04-24 현대다이모스(주) 철도차량용 감속장치의 이상유무 감지장치 및 감지방법
CN106080655A (zh) * 2016-08-24 2016-11-09 中车株洲电力机车研究所有限公司 一种列车轴温异常的检测方法、装置以及列车
CN113570516A (zh) * 2021-07-09 2021-10-29 湖南大学 基于CNN-Transformer混合自编码器的图像盲运动去模糊方法
CN113283409A (zh) * 2021-07-23 2021-08-20 中国人民解放军国防科技大学 基于EfficientDet和Transformer的航空图像中的飞机检测方法
CN113936256A (zh) * 2021-10-15 2022-01-14 北京百度网讯科技有限公司 一种图像目标检测方法、装置、设备以及存储介质
CN113887513A (zh) * 2021-10-28 2022-01-04 重庆邮电大学 一种基于并行CNN-Transformer神经网络的运动想象脑电信号分类方法
CN114065862A (zh) * 2021-11-18 2022-02-18 南京航空航天大学 一种多维时序数据异常检测方法和系统
CN114118375A (zh) * 2021-11-29 2022-03-01 吉林大学 一种基于时序图Transformer的连续动态网络表征学习方法

Also Published As

Publication number Publication date
CN114550460A (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
Yun et al. Automated defect inspection system for metal surfaces based on deep learning and data augmentation
CN112967252B (zh) 一种轨道车辆机感吊架组装螺栓丢失检测方法
Hung et al. Surface classification of damaged concrete using deep convolutional neural network
CN110956278A (zh) 重新训练机器学习模型的方法和系统
CN114550460B (zh) 轨道交通异常检测方法、装置及存储介质
Zhang et al. Data anomaly detection for bridge SHM based on CNN combined with statistic features
Son et al. Deep learning-based anomaly detection to classify inaccurate data and damaged condition of a cable-stayed bridge
Mohammed et al. Exploring the detection accuracy of concrete cracks using various CNN models
Li et al. An end-to-end framework with multisource monitoring data for bridge health anomaly identification
KR20230021272A (ko) 인공지능을 이용한 교량 건전성 모니터링 시스템
CN115795351A (zh) 一种基于残差网络和2d特征表示的电梯大数据风险预警方法
Rosso et al. Review on deep learning in structural health monitoring
Shajihan et al. CNN based data anomaly detection using multi-channel imagery for structural health monitoring
Yessoufou et al. One-class convolutional neural network (OC-CNN) model for rapid bridge damage detection using bridge response data
Chamangard et al. Transfer learning for CNN-based damage detection in civil structures with insufficient data
Pang et al. Discrete Cosine Transformation and Temporal Adjacent Convolutional Neural Network‐Based Remaining Useful Life Estimation of Bearings
Giglioni et al. Deep autoencoders for unsupervised damage detection with application to the Z24 benchmark bridge
Nguyen et al. A computationally efficient crack detection approach based on deep learning assisted by stockwell transform and linear discriminant analysis
KR102366787B1 (ko) 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템
Techane et al. Rotating machinery prognostics and application of machine learning algorithms: Use of deep learning with similarity index measure for health status prediction
CN115296933A (zh) 一种工业生产数据风险等级评估方法及系统
CN117634006B (zh) 基于bim技术的套管预埋工程管理系统及方法
Dang Development of Structural Damage Detection Method Working with Contaminated Vibration Data via Autoencoder and Gradient Boosting
CN117274903B (zh) 基于智能ai芯片的电力巡检智能预警设备及其方法
Yazid et al. Automated system form concrete damage classification identification using pretrained deep learning model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant